切换到宽版
  • 178阅读
  • 2回复

[智能应用]几分钟扫完细菌全基因组,MIT用AI找出大量未知的抗病毒防御系统 [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
180995
金币
621227
道行
20030
原创
769
奖券
471
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 22821(小时)
注册时间: 2012-06-21
最后登录: 2026-04-28
只看楼主 正序阅读 楼主  发表于: 04-09
— 本帖被 兵马大元帅 执行加亮操作(2026-04-11) —
最近,MIT 的科学家开发了一套叫 DefensePredictor 的 AI 模型,可以从细菌的基因组里快速找出那些隐藏的防御系统。
研究人员先用约 1.7 万个细菌基因组训练这个模型。他们给模型看了两类蛋白质:一类是约 1.5 万个已知能抵抗病毒的防御蛋白,另一类是约 18.6 万个负责日常家务的普通蛋白。通过反复比较这两类蛋白的特征,比如基因长度、周围的邻居基因、DNA 序列里的特殊模式,AI 学会了快速区分谁是防御战士,谁是普通居民。日前,相关论文发表在《科学》杂志上。
论文作者只有三位,他们分别是 MIT 博士生 Peter DeWeirdt、前 MIT 高级研究支持助理&目前在美国约翰霍普金斯大学读博的 Emily Mahoney 以及 MIT 副教授 Michael Laub。其中,Peter DeWeirdt 还曾在辉瑞公司实习过。

(来源:Linkedin)
很多人都知道,细菌和病毒之间的战争,已经打了数十亿年。病毒是地球上数量最多的生物,每天能消灭 10% 到 25% 的细菌。为了活下来,细菌进化出了各种各样的防御武器。
有些武器已经被人类拿来用了,比如大名鼎鼎的 CRISPR 基因编辑工具,它最初就是从细菌的免疫系统里发现的。不过细菌的防御武器库还远没有被人类摸清楚。
传统方法找这些防御系统,就像大海捞针,要么盯着已知防御基因附近的区域猜,要么在实验室里手动测试成千上万个 DNA 片段,耗时又费力。

(来源:Science)
DefensePredictor 的秘密武器是一个叫 ESM2 的蛋白语言模型。它能把每个蛋白质转换成一组数字,就像给蛋白质拍了张 X 光片,抓住了它的关键特征。模型不仅看目标蛋白自己,还看它前后各两个邻居,因为防御基因经常喜欢扎堆住在一起。
利用这些信息,模型能在几分钟内扫描完一个细菌的全部基因组,找出最有可能的防御系统候选者。DefensePredictor 正是通过这种观察蛋白质的社交圈,来判断它是不是防御战士。而假如换成以前的做法,这可能需要好几个月。
为了检验这套系统到底准不准,研究团队做了一个实验。他们用 DefensePredictor 扫描了 69 株不同的大肠杆菌,找出了 624 个被预测为防御相关的蛋白簇,其中超过 100 个跟已知的细菌免疫系统没有任何关系。

(来源:Science)
研究人员从中挑选了 94 个进行实验室验证,把它们克隆进大肠杆菌细胞里,然后用 24 种不同的病毒去攻击。结果有 42 个系统成功保护了细菌,验证率达到了 45%。模型给出的预测分数跟实验验证率高度相关,分数越高,越有可能是真的防御系统。这也意味着 AI 的预测是可靠的,可以大大缩小科学家需要手动测试的范围。
此外,有些系统用的蛋白结构,以前从未在防御中被验证过。比如一个叫 DS-8 的系统,它携带的金属磷酸酶结构域跟人类免疫系统中的某个蛋白长得很像,人类用那个蛋白来调节自身的抗病毒信号通路。这说明细菌和人类的免疫系统在进化上可能有着共同的古老根源。

(来源:Science)
另一个叫 DS-11 的系统,用一种叫 CBS 的结构域来感应细胞内的能量分子,然后激活自身的杀伤功能。还有的系统把核酸酶拆成了两半,这种分体式设计有可能被开发成需要特定信号才能激活的基因编辑工具,故在生物技术领域有着巨大的潜力。
这套模型的潜力还远远没有挖尽。当研究人员把 DefensePredictor 应用到 1,000 种不同的微生物上时,它识别出了近 3,000 个与任何已知细菌免疫系统都不相似的蛋白簇。这些发现意味着大肠杆菌以及其他细菌所携带的抗病毒防御系统,比我们之前以为的要丰富得多。
在 3,000 株大肠杆菌和志贺氏菌的基因组分析中,平均每株细菌能预测出 32 个防御基因,而传统工具只能找到 6 个。目前,研究团队已经把 DefensePredictor 作为开源工具提供给全球的科学界,并且会随着新数据的到来持续优化它。

(来源:Science)
一直以来,基因编辑领域一直在寻找比 Cas9 更小巧、更精准的工具,这些新发现的防御系统里藏着大量未被开发的核酸酶和新型工作机制。Cas9 虽然强大,但它个头比较大,进入细胞不太方便。
如果能从这些新系统里找到更迷你的核酸酶,基因治疗就会变得更安全、更高效。研究人类免疫系统的科学家也可以从中追溯关键免疫元件的进化源头,比如人类体内用来感知病毒 DNA 的 cGAS 蛋白,它的祖先可能就藏在某种细菌的防御系统里。
制药领域有可能把这些新型系统改造成针对病原菌的精准抗菌药。现在很多细菌对抗生素产生了耐药性,如果能把细菌自己的防御武器改造成攻击它们的工具,就有望解决耐药菌的难题。
而 DefensePredictor 的出现,让原本需要数月甚至数年的筛选工作,缩短到了几分钟。未来,随着更多新数据的加入,这套模型还会变得更聪明,帮我们找到更多细菌的秘密武器。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线jjybzxw

UID: 551814


发帖
244668
金币
884707
道行
2006
原创
2464
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 52160(小时)
注册时间: 2008-10-01
最后登录: 2026-04-28
只看该作者 板凳  发表于: 04-09
科技突破型
MIT科学家开发的DefensePredictor AI模型堪称基因研究领域的重大突破。该模型借助约1.7万个细菌基因组训练,以ESM2蛋白语言模型为“秘密武器”,能将蛋白质转化为数字并观察其“社交圈”,在几分钟内扫描完细菌全部基因组,快速找出隐藏的防御系统。与传统方法耗时数月相比,效率大幅提升。经实验验证,其预测可靠,还发现了诸多未知防御系统,为基因编辑、免疫研究、制药等领域带来新希望。
成果亮点型
DefensePredictor AI模型成果亮点纷呈。研究团队用大量细菌基因组训练模型,使其学会区分防御蛋白和普通蛋白。该模型利用ESM2蛋白语言模型捕捉蛋白质关键特征,通过观察蛋白质“社交圈”快速定位防御系统。实验中,它扫描69株大肠杆菌找出众多未知防御相关蛋白簇,验证率达45%,且预测分数与验证率高度相关。此外,模型还发现了结构独特的防御系统,在多个领域潜力巨大,且已开源供全球科学界使用。
行业影响型
DefensePredictor AI模型的出现将对多个行业产生深远影响。在基因编辑领域,它为寻找比Cas9更小巧精准的工具提供了可能,有望让基因治疗更安全高效;对研究人类免疫系统的科学家而言,可追溯关键免疫元件进化源头;制药领域能借此开发精准抗菌药,解决细菌耐药性难题。同时,该模型将原本数月甚至数年的筛选工作缩短至几分钟,随着数据增加还会更智能,助力挖掘更多细菌秘密武器。
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
180995
金币
621227
道行
20030
原创
769
奖券
471
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 22821(小时)
注册时间: 2012-06-21
最后登录: 2026-04-28
只看该作者 沙发  发表于: 04-09
MIT用AI快速发现细菌未知抗病毒防御系统
麻省理工学院(MIT)团队开发了名为DefensePredictor的AI模型,可在几分钟内扫描细菌全基因组,快速识别隐藏的抗病毒防御系统,相关成果发表于《科学》杂志


核心突破
高效精准的识别能力

模型基于1.7万个细菌基因组训练,通过分析蛋白质序列、基因上下文等特征,区分防御蛋白与普通蛋白。在69株大肠杆菌中,预测出624个防御相关蛋白簇,其中100+为全新系统,实验室验证42个具备防御功能,验证率达45%


颠覆传统研究方式

传统方法依赖已知基因区域猜测或实验室逐一测试,耗时数月;DefensePredictor利用AI模型(如ESM2)将蛋白质转化为特征向量,实现快速扫描,效率提升数十倍


开源与广泛应用前景

模型已开源,应用于1000种微生物时识别出近3000个未知防御系统。未来可助力开发新型基因编辑工具、精准抗菌药物,甚至追溯人类免疫系统进化源头


代表性新发现
DS-8系统:携带金属磷酸酶结构域,与人类免疫蛋白结构相似,暗示细菌与人类免疫系统存在古老进化关联

DS-11系统:通过感应细胞内能量分子激活杀伤功能,机制新颖

分体式核酸酶:可设计为需特定信号激活的基因编辑工具,潜力巨大
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个