huozm32831 |
2021-09-23 15:28 |
考古学家变得越来越聪明了。人工智能现在成功地预测了古代文献中丢失的段落,这意味着有4500年历史的楔形文字版,有缺失的部分,现在可以阅读了。
一个深度学习人工智能(AI)引擎已经建成,它可以预测下一个“应该”是什么,在断行的文本中,就像当你在搜索引擎中输入一个单词时,自动预测功能开始发挥作用。
位于肥沃新月的美索不达米亚是世界上已知最古老的文明发源地之一。包括今天的伊拉克,以及伊朗、土耳其、叙利亚和科威特的部分地区,从美索不达米亚诞生了苏美尔、亚述和巴比伦帝国。
楔形文字出现在青铜时代早期,这种标志音节文字在古代近东的许多古代语言中使用,一直持续到普通时代的开始。这种语言的特点是形成其标志的楔形印痕,但古代世界的大多数例子都存在于严重受损的局部粘土石碑上。
来自耶路撒冷希伯来大学的一组科学家现在已经用一种新的人工智能模型取得了重大突破。作者在将于11月在自然语言处理经验方法会议上正式发表的一篇新论文中写道,来自“公元前2500年至公元100年的10000块楔形文字板”的脚本被输入到新的人工智能程序中。被称为“巴比伦引擎”的新人工智能模型成功地预测了一系列缺失的单词、短语和句子,准确率达到90%。
回顾过去,做出预测
包括巴比伦人和亚述人在内的几个美索不达米亚文明都讲阿卡迪亚语,这是已知最古老的闪米特语。楔形文字是该语言的书面形式,采用独特的楔形文字。这篇新论文的合著者、希伯来大学的计算机科学家加布里埃尔·斯坦诺夫斯基告诉《新科学家》说,泥版是美索不达米亚文化的主要记录,“包括宗教文本、官僚记录、王室法令等等。”这就是为什么它们是最重要的这位计算机科学家补充道:“大量转录和音译工作的目标。”
人工智能是人类智能的机器版本,神经元被计算机系统取代。人工智能最近已成为复杂语言处理系统的专家处理器。根据Dai的一份报告,在这种情况下,人工智能消耗了10000块楔形文字板的转录本,并被教授如何阅读104种语言电子邮件。
人工智能模型不是新一代数字考古学家
以色列阿里尔大学阿里尔数字人文实验室主任希亚·戈尔丁(Shia Gordin)在早些时候的一份报告中写道,传统上,考古学家和语言专家都在翻阅粘土石碑的照片,戈尔丁称这是一项非常“主观且耗时”的艰苦工作。Gordin写道,由于许多平板电脑的性能已经严重恶化,研究人员依靠“上下文提示来手动填充缺失的文本”,手动方法变得越来越困难。
戈尔丁教授解释说,研究小组使用的模型已经在闪米特语(包括希伯来语)方面接受过培训,这些语言都与阿卡迪亚语相似。然后,他们首先通过隐藏已解释的石碑的现有部分来测试该系统,该模型预测缺失的单词“准确率为89%”。因此,巴比伦引擎被用于填补公元前6世纪至公元前4世纪之间古波斯石碑上的空白。
Stanovsky告诉《新科学家》,新的人工智能程序“不是人类专家的替代品”,而是一种“辅助工具”。考虑到特定平板电脑被发现的地点和时间等变量,平板电脑的情境化始终需要人的触摸。戈尔丁在去年11月发表的一份声明中说,新系统非常准确,在阿卡德语方面接受过不太正规培训的历史学家可以输入阿卡德语文本,并获得“在他们的研究和出版物中可以证明的”结果。 |
|