3. 从基础设施到语义网
这里不适合详细描述 AMIE 编辑基础设施底层的数据库。它是一个具有 APEX 接口的 Oracle 数据库。 APEX 功能多样,但同时也有局限性,可能每个应用程序都是如此。积极的方面是可以快速进入配置和演示。有一些积极的标准功能,例如良好的级联搜索、各种格式的轻松下载以及用户自己定制视图的众多选项。通过内部链接导航和从不同表格显示内容的功能有限。无法使用常规方法在字段内进行标记和链接,例如B.在解释字段中。然而,这一劣势现在通过利用关系在AMIE中已经转化为优势。这些可以很容易地输出为 RDF 三元组,这是语义网的基础。最终,使用哪种仪器并不那么重要。机遇和风险的衡量标准不同:
因此,在处理多个版本时,标题会出现一些新的质量问题:在 AMIE 中,使用德国常用的格式(根据 RAK [24] ,这是图书馆的规则)。不过,原标题有时是主要条目,有时是次要条目。模拟版本也存在 阿尔及利亚电报数据 这个问题,但综合数字版本的数量使这一问题更加严重。常见的形式也取决于时间:“罪与罚”还是凯斯勒所说的“拉斯柯尔尼科夫”?或者全新的《罪与罚》。当然,一个标题可以引用另一个标题,但必须将数据和解释附加在某处,从而赋予条目权重。随着时间的推移,一致性很难实现。如果你改变主意并从另一个时代的习惯开始,那么其他版本的更改可能会暗中发生。由于情况不可能如此,因此人们根据编辑时间来编制索引,即“录制时正在使用的内容”,这反过来很快就会导致不平衡,因为并非所有内容都是为某个版本新录制的,而是使用现有的句子,因此是编辑之前的条目。
数字世界没有国界,但是,如果你不会说所有的语言,并且因为没有各个地方的国家标准数据而无法绘制所有地方的地图,你怎么能走向国际化呢?[25]我们是否应该简单地相信未来?我们是否应该严格制作国家版本并依赖未来国家权威数据的一致性?这些问题仅在综合版本中出现,尚未被讨论。
第二组类似的问题涉及决定何时使用哪种形式的名称。 »哈登贝格« 还是 »诺瓦利斯«?常用Novalis,即日记版的主条目。然而,在信中,作者也被称为哈登贝格 (Hardenberg)。然而,在《AMIE》中,哈登伯格总是提到诺瓦利斯,因为之前有编辑过的日记版本,这在信件中似乎很奇怪。了解 Hardenberg 和 Novalis 在哪里使用也很有趣。但这又对数据库内的映射提出了很高的要求。
有了两种替代方案,这个问题也许就可以解决。但是凯斯勒的妹妹“威廉玛”或“威尔玛”又是怎么回事呢?凯斯勒直至去世都称呼她为“Gee”。小时候,他也被称为“蜜蜂”或“宝贝”。其中还包括“Be”或“Bie”等拼写错误。所有这些变体是否都需要包含在数据库中,并且必须能够直接引用?这可能会非常令人困惑,但对于用户来说这是一个很好的信息来源。标准化一直是模拟版本的目标之一,即使这意味着丢失数据。数字寄存器可以记录所有条目,但在合并显示程序时,必须能够依赖充分且正确的再现。哪位语言学家可以可靠地检查底层算法?