切换到宽版
  • 10阅读
  • 2回复

[智能应用]人工智能在世界史研究中的局限性 [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
120306
金币
1139
道行
19524
原创
29742
奖券
18581
斑龄
207
道券
10971
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 26626(小时)
注册时间: 2007-11-29
最后登录: 2026-04-23
只看楼主 倒序阅读 楼主  发表于: 前天 17:12
姚念达:在历史研究中应用人工智能,仍然存在若干难以突破的瓶颈。这些瓶颈并不只是因为技术尚未成熟,而是更深层地反映了当下人工智能技术与历史研究之间的结构性不匹配。首先,人工智能难以与人类社会形成真正的情感共鸣。克罗齐曾指出,一切历史都是当代史。一个有生命力的历史研究选题,往往能够回应当下的社会问题,并在现实生活中引发读者的情感共鸣。因此,历史研究的重要一步,在于判断哪些历史问题在当下具有意义,为什么值得被提出和反复讨论。这种判断高度依赖研究者对现实社会的感知、对公共议题的敏感度以及对人类经验的共情能力。人工智能虽然可以总结既有讨论,却不足以真正理解某一历史议题与人类生活实践之间的情感联结,也无法判断其现实价值所在。

  其次,人工智能在分析历史文本时,面临难以回避的语义漂移问题。当前多数语言模型主要基于当代语料训练,若直接用于历史文本分析,容易以当代语义和语言习惯误读过去的语言实践。即便如苏黎世大学团队尝试使用历史语料训练模型,其效果仍然受到现存历史文本不完整和不均衡的限制,其数据质量和覆盖范围难以与当代语料相比。

  与此同时,人工智能的价值判断也并非中立,而是不可避免地受到训练语料中主流规范与当代价值观的影响。当这些模型被用于历史研究时,可能在无意中以当代标准衡量过去,从而弱化历史语境。这些因素叠加在一起,或许会在历史叙事层面推动一种并非出于研究者本意的当代化倾向。

  最后,一个尤为关键的瓶颈在于人工智能的“黑箱性”。在许多情况下,人文学者难以清楚解释人工智能是如何得出某一结论的。对于以可解释性、可讨论性为基本规范的人文学科而言,如果研究者无法说明分析过程,也就难以为研究结论承担必要的学术责任。

  易晋铭:在文本分析方面,人工智能目前主要被应用于那些保存数量较多且已实现数字化的史料类型,比如契约和通信,而在其他史料领域的应用仍然相对有限。这一局限主要源于两方面原因。其一,人工智能模型的训练高度依赖大规模的、可读性较强的语料数据,例如2024年瑞士伯尔尼大学法比奥·加蒂团队针对佛罗伦萨商人银行通信网络的研究调用了超过6000封信件,然而,中世纪许多史料尚未形成如此规模和质量。其二,中世纪文献普遍存在字迹复杂、缩写繁多和保存状况不佳等问题,增加了文本识读与转写成本。尽管Transkribus等手写文本识别平台在一定程度上提升了大规模识读的可能性,但其训练和校对仍需投入人力与时间,因此研究者往往更倾向于直接利用已经整理完成的史料数据库开展研究。目前,中世纪史领域中数字化程度最高、数据库建设最完善的正是契约类文献,例如早期英格兰文献数据集(包含约4.4万份契约)和中世纪勃艮第文献集(包含约2.9万份契约),这也进一步强化了人工智能研究在此类史料上的集中趋势。

  王思婕:如上所述,语料不均衡会影响人工智能的使用范围。另一个类似的问题在于通用大语言模型的训练数据主要来自英语世界,这使得人工智能在历史叙事中常沿用西方主流视角。人工智能在小语种史料的语义识别、长句及复合句理解方面,仍存在明显不足。此外,英美档案的数字化和开放获取优势明显,有些数据库直接提供应用程序编程接口(API),方便历史研究者进行自动化批量抓取与深度加工。上述“数字鸿沟”在跨国史研究中尤为突出,研究者往往倾向于使用易获取且结构化程度高的英美史料,从而影响了对历史事件全貌的还原。

  训练数据的地区不平衡,导致大语言模型叙事的欧美中心化。全球南方的文本在现有数字化语料库中的占比极低,其历史经验在通用模型中被系统性地边缘化。由于模型依赖概率预测来生成文本,缺乏特定语境数据时,会倾向于用它所熟悉的西方概念框架去“填补”空白,产生所谓的“幻觉”或刻板印象。例如在探究有关冷战时期地区冲突的问题时,模型会套用美英官方叙事逻辑,将复杂的地区冲突简化为美苏对抗的注脚,从而强化了西方中心主义的知识再生产。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
243757
金币
876494
道行
2006
原创
2461
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 52011(小时)
注册时间: 2008-10-01
最后登录: 2026-04-23
只看该作者 沙发  发表于: 前天 20:10
姚念达、王思婕和易晋铭三位青年学者从不同角度深入探讨了人工智能在历史研究中难以突破的瓶颈,这些观点反映了当前人工智能技术与历史研究方法之间存在的一些深层次的不匹配问题。姚念达强调了人工智能在情感共鸣、语义理解、价值判断和可解释性方面的局限性,这些确实是人工智能技术在人文领域应用时需要特别注意的问题。王思婕和易晋铭则分别从语料偏差、小语种处理、数字鸿沟等方面补充了人工智能在历史研究中的实际困境。他们提到的语料不均衡、数字化程度差异、训练数据的地区不平衡等问题,都指向了一个更广泛的问题,即人工智能技术的发展目前并不完全适应人文学者的研究需求。这几位学者的讨论表明,尽管人工智能为历史研究带来了新的工具和视角,但人文学者仍然需要保持批判性思维,审慎地使用这些技术,并在可能的情况下制定相应的方法论规范,以确保研究的严谨性和学术的可控性。

如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
180373
金币
615175
道行
20030
原创
769
奖券
471
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 22725(小时)
注册时间: 2012-06-21
最后登录: 2026-04-23
只看该作者 板凳  发表于: 昨天 09:14
人工智能在世界史研究中存在以下五大核心局限性:

一、算法与数据的内在偏见
人工智能的智能基于算法和训练数据,这两者都是人类劳动产物,不可避免地受到社会和文化因素制约


问题表现    具体案例
文化偏见    西方AI评价宋庆龄、邓颖超时,强调其"夫人"身份,忽视她们在妇女解放事业中的贡献
语言偏差    英文文献对中国近现代史叙述片面,导致AI输出存在视角局限
性别偏见    训练数据本身承载人类社会中的性别矛盾和偏见
二、数字化史料的结构性不足
人工智能主要依赖开源的数字化史料,这些资料存在天然局限


偏向出版物:如解密外交文件、历史报纸、统计数据等便于机器识读的材料
忽视私人材料:书写潦草的日记、书信等难以被AI有效处理
缺乏田野调查:AI无法像人类学者一样"上穷碧落下黄泉,动手动脚找东西",难以收集口述材料和民间文献
三、缺乏问题意识与解释能力
人工智能虽然能提供分析工具,但尚未实质性拓展研究边界


无自主问题意识:AI无法主动提出有价值的历史研究问题
依赖前期工作:高度依赖研究者的前期整理和解释性判断
语义理解有限:难以捕捉语义演化、修辞差异等深层次历史表征
四、技术方法的局限性
技术瓶颈    影响
词项层面统计    难以识别不同表述下的同一历史主题
长时段比较困难    术语使用的代际更替常引发主题追踪中断
跨语言障碍    虽然NLP技术有所突破,但历史语境理解仍有差距
五、制度与伦理配套不足
即使技术本身有潜力,缺乏配套制度保障也会带来风险


资金支持不足:历史学家需改变思维,借鉴工科经验争取资源
培养体系滞后:评审体系未充分认可AI相关新型研究成果
伦理规范缺失:可能带来碎片化、偏见或不平等风险
💡 应对建议
历史学家应发挥史料批判的长处,用主观能动性驾驭AI技术:

批判性使用:对AI生成信息进行史料批判和验证
人机协作:将AI计算能力与传统史学方法结合
技能更新:在课堂上传授AI编程技能,培养数字史学后备军
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个