这二十篇诗学是非常独立的文本,乍一看彼此之间有很大差异。单从长度上看,范围在约50页到约1,600页之间,这不可避免地导致内容上的差异。因此,学科参考领域发生了变化(从修辞学到语言哲学等),其中反映的术语清单一方面在单纯出现方面有所不同,但另一方面在术语的理解方面也有所不同,因为在近 200 年的调查期间内,单个术语的使用发生了变化。这些术语和理论是参考研究语料库内外的其他理论文本以及主要文献来讨论的。
这些语言和文学术语的数字注释、它们的解释和与其他术语的区别,以及它们的话语协商的参考结构,是ePoetics项目的核心任务,该项目由达姆施塔特工业大学和斯图加特大学实施,由联邦教育与研究部 (BMBF) 资助。为此目的而选定的文本首先被扫描为数字图像,使用双重键控方法转录并以 XML 进行编码 — — 符合文本编码倡议 (TEI) 的标准。后续的语义标记主要针对具有语言和文学基本特征的术语。其中之一就是隐喻。
作为项目当前重点的隐喻概念的研究也是下文的重点——以贝耶尔《诗学》摘 澳大利亚电报数据 录为例进行说明。该示例还展示了在科学文本中以数字方式记录和标记理论术语时出现的问题,以及它在创建注释方案、操作化或计算机辅助分析、可视化和机器学习方法的建模过程中所提供的获取知识的机会。因此,重点放在自动评估之前发生的认知过程,但受到预期的数字索引和算法进一步处理范式的刺激。最重要的是,它们导致了语言和文学理论范畴的分化和强化——例如隐喻和比较之间的区别。
2. 诗学注释问题举例
在康拉德·拜尔的《德国诗学》中,开篇所引的语录是这么使用的:“‘生命的金色树’(歌德)是一个比喻; ‘生命就像金树’或‘生命就像一棵金树’是一种比喻。