作品标题和引号中的文本

Learn, share, and connect around europe dataset solutions.
Post Reply
Bappy11
Posts: 450
Joined: Sun Dec 22, 2024 9:27 am

作品标题和引号中的文本

Post by Bappy11 »

需要指出的是,在这种情况下,“批评”被理解为“批判性解释的主观行为” [49],这与德语术语“文学批评”并不一致。拉姆齐认为意义的建构发生在接受者的主观阅读和理解过程中。他的方法接近接受美学,其中借鉴了拉姆齐所引用的汉斯-格奥尔格·伽达默尔的哲学解释学方法等。[50]在这种对意义构成的理解背景下,人们认为这种接受性或交互性产生的复杂意义结构不能用经验-客观的方法来直接识别。一种范畴错误被描述为,先前的定量文本分析中,待解释的意义结构被视为文本属性并被检验,尽管它们的建构实际上只在接收过程中发生,或至少在接收过程中才完成:“范畴错误之所以产生,是因为我们把关于对象属性的问题误认为是关于观察者的现象经验的问题。” [51]在拉姆齐看来,实证方法并不适合检验如此复杂的解释过程。他并没有将这种限制归咎于数字工具的当前和未来的可能性,而是由于计算机程序员无法在主观上和一致地确定解释过程的参数,而这些参数也依赖于先前知识和文化背景等动态发展的因素:

»想象一下可以裁决有关物体属性的问题的工具是合理的。能够判断人类阅读体验的解释学参数的工具——可以告诉你某种解释是否允许的工具——远远超出了人工智能最雄心勃勃的幻想。因为计算工具无法做到这一点而称其“有限”,这听起来好像它们有一天可能会发展出这种能力,但目前尚不清楚人类智能是否能够客观或一致地做出这一判断。“ [52]

文本分析中实现主体间一致性的问题也与数字注释相关。下一节将讨论注释者间一致性的问题。然而,拉姆齐指出,人文学科的研究——尤其是文学解读——主要不是从文本中所包含的客观数据的事实中得出结论,而是推进、发展和深化科学论述。 “但是在文学批评中——我这里指的是普通的‘基于论文的’文学批评——结论的评价不是根据数据所允许的命题,而是根据由此产生的讨论的性质和深度。” [53]

按照拉姆齐的说法,科学问题、解释和发现都是在研究人员之间以话语方式协商的:“验证”发生在学者的社会群体中,他们几乎从来不会毫无保留地表示同意或不同意。“ [54]定量方面肯定会转化为定性考虑(反之亦然),在这方面,使用计算机进行实证研究也可以成为问题研究的有用的中间步骤。拉姆齐将数字分析视为研究过程的“发明” [55]的一部分。这一修辞学术语最初描述的是作为演讲基础的论据集合。在“算法批评”中,计算机辅助程序被使用或迭代应用来启动数据收集或生成可能的研究观点。源文本的转换应该允许新的多视角接收可能性——例如通过选择某些组成部分、对其进行量化或将模式可视化。拉姆齐强调的一点是研究过程的透明度,至少部分是通过这种方式实现的。一方面,在转换后的文本中明确说明了各个步骤和注意事项,另一方面,在为转换而编写的算法中也明确说明了各个步骤和注意事项。

在ePoetics项目中,这种方法得到了应用,并且得到了扩展。如前所述,本研究项目的调查对象不是文学文本,而是讨论文学实例的诗歌著作。在这方面,ePoetics 的目的不是对文学进行解释性的文本分析,而是对语言和文学理论概念的识别和差异化探索。但在这过程中,还必须包括对相应文献中事例的讨论,这也使得了解文学文本的解读变得十分必要。在分析和分类歌德关于“金树”的引文时,该项目的注释者面临的挑战是,针对主要文献中的段落确定一个明确的“比较理论”,并针对此背景下的理论解释,决定贝耶尔对隐喻的理解应该属于比较理论还是替代理论。两者都需要解释步骤。

这些问题的共识和解决方案不仅通过项目会议的直接讨论达成,而且还通过使用注释工具直接在调查对象上进行协作交流而达成。其中,UAM 语料库工具 [56]的使用使得能够在相关文本段落中直接对疑问案例进行话语协商,通过在注释窗口中描述问题,并在另一个窗口中制定相应的注释指南建议(见图5)——两者对所有注释者都是可见的。

图 5:UAM 语料库工具中对疑难案例的协作讨论评论和注释指南的制定(自己的插图,2015 年)。
图 5:UAM 语料库工具中对疑难案例的协作话语评论和注释指南的制定(自己的插图,2015 年)。
然而,这些协商过程和相关的注释实践只有在选定并预先构建相关文本段落后才能进行。为此,我们使用算法,特别是计算语言学方法和可视化技术。下面简要介绍这些方法,但不详细讨论,因为本文的重点是注释、相关的认知过程以及与自动化程序的迭代交互。在这方面,文章主要关注算法方法对于注释的作用,反之亦然,但没有涉及更深层次的技术方面。

例如,为了进行选择和预先构造,使用自动识别名称、后者又可以进一步分类——例如分为亮点、标题和引语,可以放在引号内。变焦阅读器 (Varifocal Reader) 提供了对文本语料库的视觉交 澳大利亚电报数据 互访问,它是斯图加特大学可视化与交互系统研究所项目的一部分(见图6)。[57]该系统可以在数字化诗学的各个结构层次上导航——从传真到各个章节和章节级别,直至目录级别,还可以显示不同抽象级别的现有注释,以及从不同角度可视化搜索结果和词频表示。

图 6:埃米尔·施泰格 (Emil Staiger) 的《诗学基本概念》在 Varifocal Reader 中呈现(从左到右),以词云(最常用的词)的形式呈现各章节,以条形图和象形图的形式呈现各子章节、页面浏览量和传真(自己的插图,2015 年)。
图 6:埃米尔·施泰格 (Emil Staiger) 的《诗学基本概念》在变焦阅读器中呈现(从左到右),以词云(最常用的词)的形式呈现各章节,以条形图和象形图的形式呈现各子章节、页面浏览量和传真(自己的插图,2015 年)。
因此,注释层是在这些基于算法的技术的支持下创建的,但同时也为它们提供反馈。这是因为所描述的工具可以访问日益差异化的注释,从而进行训练(“机器学习”)。因此,注释是在迭代过程中开发的,并且位于要检查的文本和它们的算法转换(或相应的算法本身)之间,正如 Ramsay 所说的选择和可视化视角。[58]

这一额外的文本注释层包含前面章节中解释的方案、它们以标记相关文本段落和谈判过程记录的形式的具体应用以及例如注释指南中的分类决定的理由。因此,文本段落的解释学研究变得透明,包括它与算法程序的交互;各个步骤都以易于理解的方式进行解释和记录。它还指出了注释方案中的分类在多大程度上是可能的以及其局限性在哪里——例如,语料库中隐喻概念的理论方法的广泛、有时甚至
Post Reply