美国达特茅斯学院的研究人员创建了一个AI模型,其用Reddit(类似豆瓣的网络论坛)上的对话检测精神障碍。
“人们不为精神疾病寻求帮助的原因有很多——污名、高成本和缺乏相关服务是一些常见的障碍”,该研究团队成员之一郭晓波说,“还有一种趋势是病人会尽量忽视精神障碍的迹象或将其与压力混为一谈。而他们可能会在一些提示下寻求帮助,而这正是数字筛选工具可以发挥作用的地方。”
3月1日,美国达特茅斯学院在官网上介绍了这篇研究《Emotion-based Modeling of Mental Disorders on Social Media》,论文已发表于第20届智能网络和智能体技术国际会议(International Conference on Web Intelligence and Intelligent Agent Technology)。
郭晓波认为,“社交媒体提供了一种了解人们行为的简便方法,这些数据是自愿和公开的,发布给其他人阅读的。”
他们所选择的Reddit是一个拥有庞大用户群的论坛网络,有近50亿活跃用户,讨论话题非常广泛。这些帖子和评论是公开的,研究人员可以收集可追溯到2011年的数据。
研究人员训练模型来标记用户帖子中表达的情绪并绘制不同帖子之间的情绪转换,将帖子标记为“快乐”、“愤怒”、“悲伤”、“恐惧”、“没有情绪”或这些的组合。然后建立一个矩阵地图,可以显示用户从任何一种状态到另一种状态的可能性有多大,例如从愤怒到没有情绪的中性状态。
不同的情绪障碍有自己的情绪转变特征模式。通过为用户创建情绪“指纹”并将其与情绪障碍的既定特征进行比较,该模型就可以检测到它们。
研究人员专注于重度抑郁症、焦虑症和双相情感障碍的不同情绪模式特征,查看自我报告患有其中一种疾病的用户和没有任何已知精神疾病的用户的数据。
为了验证他们的结果,他们在训练期间未使用的帖子上对其进行了测试,并表明该模型准确地预测了哪些用户可能患有或不患有这些疾病之一。
达特茅斯学院计算机科学助理教授、论文合著者Soroush Vosoughi表示,这种方法回避了典型筛选工具遇到的一个称为“信息泄漏”的重要问题。其他模型是围绕审查和依赖文本内容而建立的,虽然这些模型有很好效果,但它们也可能具有误导性。
“例如,如果一个模型学会将“COVID”与“悲伤”或“焦虑”联系起来”,Vosoughi 解释道,“它自然会假设一位相当冷静地研究和发布关于新冠病毒COVID-19的科学家患有抑郁症或焦虑症。另一方面,新模型只关注情绪,对帖子中描述的特定主题或事件一无所知。”