新药研发风险大、周期长、成本高,如何在海量的化学分子中快速找到适合成药的分子结构,是长期以来困扰科研人员的难题。西安交通大学第一附属医院刘冰教授团队在研发抗菌药“肉桂酰菌素”的过程中,不仅研发周期大幅缩短,研发成本也降低了70%左右。原来,通过引入华为云与中科院上海药物研究所共同训练的“盘古”药物分子大模型,刘冰团队实现了针对小分子药物全流程的人工智能辅助药物设计,不仅减少了小分子化合物筛选的计算量,还通过筛选后的小分子化合物进行定向优化,降低了新药可能产生的毒副作用。
当前,以大模型为代表的人工智能技术飞速发展,改变着许多领域的科研范式和模式。“预训练大模型在大量图像、文本等数据的基础上将数据中蕴含的知识‘提取’出来,存储在具有大量参数的神经网络模型中。遇到特定任务时,只需调用规范化的流程,就能释放预训练大模型的能力,并且与行业经验结合,解决实际业务问题。”华为云人工智能领域首席科学家田奇介绍。
“传统人工智能算法落地存在‘碎片化’问题,往往要针对不同场景独立完成模型选择、数据处理、模型优化、模型迭代等一系列开发环节。不同领域的数据差异巨大、微调技巧也有所不同,无法积累通用知识,开发效率也比较低。”田奇介绍,为解决这一难题,华为云“盘古”研发团队以预训练大模型为基础,通过结合行业知识,找到了一种“工业化开发”新模式,助力人工智能在多个行业落地应用。
据田奇介绍,“盘古”大模型有3层架构,在不同层面构建不同的能力。“最底层的是基础模型,要做好海量基础知识的学习,相当于‘读万卷书’;在此之上,针对不同的行业、不同的场景,进行专项知识和经验的训练,打造好用、易用的行业模型和场景模型,相当于‘行万里路’。”
“盘古”大模型的定位,是为各行各业赋能:各行各业的开发者只需在“云”上找到自己所需的模型,然后针对行业场景进行“小数据”微调,即可获得满足使用需求的模型。目前,华为云已在各行业落地人工智能创新项目超过1000个,陆续推出了矿山、药物分子、气象、制造等大模型,为产业提供先进的算法和解决方案。
以煤矿领域为例,“盘古”矿山大模型已覆盖采、掘、机、运、通、洗、选等环节的1000多个细分场景,有效提升了井下巡检效率。目前,这项技术已在山东能源集团的七大业务系统、21个业务场景落地应用。
如何让人工智能大模型真正赋能千行百业?华为轮值董事长胡厚崑认为,发展人工智能关键是要脚踏实地、做深向实,真正为行业和科技创新服务,助力产业升级。中国工程院院士邬贺铨表示,要深入思考大模型的应用方向,将大模型切实投入城市发展、生物医药、工业制造、科学研究等领域,为产业转型升级创造实实在在的价值。