回看这一年,朝向前沿和实用两个方向,人工智能和它的从业者们正在拔足狂奔。
1
特斯拉撞车引关注
自动驾驶的安全问题被推上前台
3月17日,国内一辆特斯拉Model 3在自动驾驶辅助状态下无故转向,车辆撞停,车头几乎报废,但全车8个安全气囊无一打开,特斯拉技术主管回复,因为没有撞击到触发点,所以气囊没有弹出,车辆没有问题。
这不是特斯拉第一次发生类似事故。2019年,国外媒体曾报道过一次特斯拉事故,据受害者的律师说,当车主的Model 3撞上护栏时,安全气囊竟然没有打开,并且车主声称特斯拉不配合调查。
特斯拉的事故再次将自动驾驶的安全问题推上前台。事实上,2021年是国内自动驾驶的泉涌之年,华为入局造车,百度和小马智行成为首批获准开展商业化试点服务的企业,全国首个自动驾驶出行服务商业化试点在北京实施,国内自动驾驶从测试示范迈入商业化试点,自动驾驶正式进入“下半场”。
同时自动驾驶的基础设施基本搭建完成,各地积极推进计算中心、5G网络、边缘计算、车路协同、高精度地理数据等配套措施,各类L2—L4级自动驾驶车辆开始走出封闭路测试验场,走上了真实城市道路。而安全作为自动驾驶的头号问题,值得慎之又慎,也是影响行业企业前景的关键要素。
2
自主智能体与人类辩论
AI开始具备参与复杂人类活动的能力
人工智能在人类专长的领域再下一城,它可以和人类辩论了。
英国《自然》杂志3月18日发表了一项人工智能的最新进展:科学家报告了一种能与人类进行竞技辩论的自主智能体,这个“辩手项目”系统可以和人进行现场辩论,该系统能通过扫描储存4亿篇新闻报道和维基百科页面的档案库,然后自行组织开场白,并自行反驳论点。
这被认为与之前人工智能对人类的挑战有根本区别。虽然最终人类辩手被判定获胜,但这个演示表明了人工智能开始具备参与复杂人类活动的能力。这也不禁令人遐想,人工智能的下一步会走向哪里?
3
全球最快AI超级计算机开动
拼接有史以来最大宇宙3D地图
5月27日,被誉为全球最快的人工智能工作负载超级计算机——Perlmutter宣布开启。这台超级计算机拥有6144个英伟达A100张量核心图形处理器,将负责拼接有史以来最大的可见宇宙3D地图,并且它有望揭示暗能量的秘密。
在物理宇宙学中,暗能量是一种充溢空间的、增加宇宙膨胀速度的难以察觉的能量形式。暗能量假说是当今对宇宙加速膨胀观测结果的解释中最为流行的一种。
英伟达高级产品营销经理Dion Harris表示,在AI使用的16位和32位混合精度数学运算方面,Perlmutter超级计算机也是目前全球最快的系统。
人类穷尽努力,试图对宇宙未知的一面有更多了解,有了AI这个“非凡的工具”,这种努力或许可以更快见成效。
4
悟道2.0发布
中国万亿参数模型刷新多项纪录
在6月1日举行的2021北京智源大会开幕式上,悟道2.0发布。它在模型规模上呈爆发级增长,达到1.75万亿参数,创下全球最大预训练模型纪录。
中文作为世界上使用人数众多的语言,之前一直没有以其为核心的超大规模预训练模型。3月,中国首个超大规模预训练模型悟道诞生,中文预训练模型跻身“炼大模型”列队。而悟道2.0的发布,更标志着多项相关纪录被刷新。
当前语言模型的训练已经从“大炼模型”走向“炼大模型”的阶段,巨量模型成为业界关注的焦点。从1750亿参数量的GPT—3,到参数量万亿级别的Switch Transformer,参数量的纪录不断被刷新,语言模型规模越来越大,仿佛没有终点。大火的GPT—3,能作诗、聊天,能生成代码,参数规模达到千亿级别,直逼人类神经元的数量。
10月,微软和英伟达联手发布了Megatron—Turing自然语言生成模型(MT—NLG),它有5300亿参数,号称同时夺得单体Transformer语言模型界“最大”和“最强”两个称号。
对大模型进行探索是一个持续不断的过程,科学家希望越来越大的模型能通向AI的圣杯——通用人工智能。
5
Alphafold2预测蛋白质结构
为生命科学领域带来革命性影响
7月16日,英国《自然》杂志发表了一项结构生物学最新研究,人工智能公司DeepMind的神经网络Alphafold2预测的蛋白质结构能达到原子水平的准确度。
机器学习软件所预测的人类白细胞介素 -12蛋白结合受体的结构图。图片来源:Ian Haydon/UW Medicine Institute for Protein Design
蛋白质折叠问题被认为是人类在21世纪需要解决的重要科学前沿问题之一。研究蛋白质结构,有助于了解蛋白质的作用,理解蛋白质如何行使其生物功能,认识蛋白质与非蛋白质之间的相互作用,对于生物学、医学和药学等都非常重要。
在50多年的时间里,研究人员一直尝试根据蛋白质的氨基酸序列预测其折叠而成的三维结构。然而,当前使用的计算方法准确度有限,实验方法对人力和时间的要求也非常高。事实上,过去半个多世纪,人类一共解析了5万多个人源蛋白质的结构,人类蛋白质组里大约17%的氨基酸已有结构信息,而AlphaFold2预测的结构将这一数字从17%提高到58%,因为无固定结构的氨基酸比例很大,58%的结构预测已经接近极限了。
今年底我国自研深度学习蛋白质折叠预测平台TRFold传来好消息,其基于2020年第14届国际蛋白质结构预测竞赛蛋白质测试集的成绩仅次于AlphaFold2,排名全球第二,这是国内目前所有公开蛋白质结构预测模型中的最好成绩,我国计算生物学领域的表现跻身全球第一梯队。
生物物理学家、西湖大学校长施一公曾对Alphafold2的表现给予极高评价:这是人工智能对科学领域最大的一次贡献,也是人类在21世纪取得的最重要的科学突破之一。
毫无疑问,人工智能预测蛋白质结构的研究已经并且将持续在生命科学各分支领域引发革命性影响,并在今后几年到十几年中逐渐显现出来。
6
元宇宙引全球公司竞逐
人工智能技术或成元宇宙落地关键
2021年哪个科技概念最火?答案基本不存在争议:元宇宙。
这个来自20世纪90年代科幻小说中的名词,成为今年以来巨头竞相逐鹿、资本跑马圈地、街头巷尾热议的最强概念。目前,元宇宙还没有公认定义,这也给它创造了充分的延展性、包容性和可解释性。
8月11日,在浙江美术馆的《算法速成斑》特展上的“抱堡球”里,小观众通过VR眼镜观看不同算法下的AI世界。图片来源:视觉中国
元宇宙像是一个筐,把增强现实、云计算、数字孪生、人工智能、区块链等数字技术打包全收,其中人工智能和元宇宙有着千丝万缕的关系,深度学习、计算机视觉、自然语言处理等人工智能技术的成熟应用是元宇宙落地的关键。虽然还停留在概念阶段,但元宇宙可能存在的巨大商业潜力,已经引得各大公司纷纷投注。英伟达正式推出对标元宇宙的虚拟工作平台Omniverse,日本社交平台GREE开展元宇宙业务,微软努力打造“企业元宇宙”,华为从AR切入元宇宙赛道,腾讯、百度、字节跳动、网易等都从各自擅长的路径进军元宇宙,三大运营商也都悉数投入元宇宙布局。
7月,DeepMind为AI打造了一个元宇宙——XLand。经过5代训练,智能体能在XLand的4000个独立世界中玩大约70万个独立游戏,涉及340万个独立任务,最后一代智能体经历了2000亿次训练步骤。
7
合成神经信号让AI有“思维”
脑机连接AI设备或将迎来新进展
AI一旦拥有了“思维”,会反过来操控人类的行为吗?
现在思考这个问题已经不算杞人忧天了,因为AI“伪造思维”的事情已经发生了。
GAN是指生成式对抗网络,它是一种深度学习模型,是近年来人工智能在大数据学习过程中用到的一种无监督学习方法之一。11月18日,美国南加利福尼亚大学华人博士温士贤团队在自然子刊发表的论文显示,研究人员通过脑机连接设备,在两只作为试验对象的猴子身上进行了脑机接口训练。他们让试验中的两只猴子玩贪吃蛇游戏和玩跑步机,然后收集它们发出的运动控制神经信号,再通过GAN中的生成器和鉴别器合成出大量神经活动数据,用于下一步的试验。
通过接触或植入式的设备,GAN只需要收集少量试验中猴子所发出的运动控制神经信号,就可以自动生成类似的各种其他情形下可能操控行为的神经信号,然后再把这些教给AI,AI便是这样有了自己的“思维”。
研究人员发现,这一技术把训练脑机接口系统提取、分析大脑信号的时间缩短了整整20倍。他们在论文中同时提到,这次研究虽然只采集了猴子的神经信号,但这一模式应该也同样适用于人类神经信号的模拟生成。
研究者相信,这种“合成思维”的方式还能有更为广泛的用途,尤其是在脑机连接AI设备上。但如果AI可以“伪造思维”,这种脑机连接又会给未来的人类带来什么,目前显然还没有定论。
8
《人工智能伦理问题建议书》发布
首份全球性规范框架聚焦AI健康发展
人工智能治理是和人工智能发展相伴而行的问题。联合国教科文组织当地时间11月25日正式推出《人工智能伦理问题建议书》,该建议书由教科文组织会员国集体通过,是关于人工智能主题的首份全球性规范框架。
该建议书旨在促进人工智能为人类、社会、环境以及生态系统服务,并预防其潜在风险。建议书包含规范人工智能发展应遵循的原则以及在原则指导下人工智能应用的领域。
9月29日,在北京地铁4号线和16号线的国家图书馆站,3台地铁车站智能服务机器人正式“上岗”,为乘客提供出行查询、带路及运营提示等智能服务。图片来源:视觉中国
据联合国教科文组织介绍,建议书共29页,定义了指导人工智能建设的必要基础性项目,以确保人工智能健康发展的共同价值观和基本原则。
建议书呼吁,在科技公司和政府已采取的措施之外还需要更多行动,通过确保使用AI的透明度、行动力和保障个人数据使得民众得到更多保护。
建议书还推动确保人工智能成为应对气候变化和解决环境问题的更重要工具。建议书要求政府应评估人工智能系统对环境造成的直接和间接的影响,包括其碳足迹、能源消耗和原材料提取的环境影响等。
9
AI发现两个数学新猜想
人工智能拓展在前沿领域应用范围
人工智能攻城略地的领域越来越大了,这次是数学。英国《自然》杂志12月1日发表了由人工智能公司DeepMind开发的一个机器学习框架,该框架已经帮助发现了纯数学领域的两个新猜想。这项研究展示了机器学习可以支持数学研究,这也是计算机科学家和数学家首次使用人工智能来帮助证明或提出纽结理论和表示论等数学领域的复杂定理。
纯数学研究工作的关键目标之一是发现数学对象间的规律,并利用这些联系形成猜想。从20世纪60年代起,数学家开始使用计算机帮助发现规律和提出猜想,但人工智能系统尚未普遍应用于理论数学研究领域。
此次,DeepMind团队和数学家一起建立了一个机器学习框架,用于协助数学研究。团队还表示,他们的框架能鼓励未来数学和人工智能的进一步合作。
10
建立17个试验区
将引领带动中国人工智能创新发展
12月7日,科技部官网公布三份函件,支持哈尔滨、沈阳、郑州三地建设国家新一代人工智能创新发展试验区,三份函件分别对哈尔滨、沈阳、郑州提出相应的建设要求。
哈尔滨试验区建设要发挥人工智能在赋能哈尔滨高质量发展和东北老工业基地全面振兴全方位振兴中的重要作用。同时,充分发挥哈尔滨科教资源富集、产业特色鲜明、国际合作基础良好等优势,加强人工智能基础前沿理论和关键核心技术研发,在智慧农业、智能制造等领域和寒地场景打造创新应用标杆。
沈阳试验区建设要发挥人工智能对沈阳制造业转型升级和东北老工业基地全面振兴全方位振兴的辐射带动作用,强化技术研发和创新应用,壮大智能科技产业集群。
郑州则要发挥人工智能在郑州建设国家中心城市中的引领作用,有力支撑中部地区崛起、黄河流域生态保护和高质量发展。
自2019年北京市成为全国首个国家新一代人工智能创新发展试验区以来,上海市、天津市、深圳市、杭州市、合肥市、德清县、重庆市、成都市、西安市、济南市、广州市、武汉市、苏州市、长沙市、郑州市、沈阳市先后入选,目前我国已经有17个国家新一代人工智能创新发展试验区。