合成生物学通常涉及将跨物种的基因簇转移到底盘微生物中,然而外来基因簇却并不100%在底盘微生物中发挥作用,这是因为不同物种之间的基因调控机制并不全部相通。破译不同生物体中普遍存在的基因调控机制,实现跨物种的调控,对于合成生物学、生物医药中复杂基因线路的构建具有重要意义。近日,清华大学汪小我团队在nature communication上发表文章,其开发了一种生成人工智能框架DeepCROSS,可生成与天然跨物种5 调控序列(5‘RS)相似/更好功能的序列,准确率90%,这一进展代表着合成生物学界朝着构建复杂电路迈出了一步。构建“元表示”DeepCROSS 首先在来自 2621 种细菌基因组的 180 万个 5 RS 上进行训练,以有效捕获关键序列模式。这种广泛的训练有助于构建潜在功能序列空间的元表示。 然后建立了一个定量预测模型(“Dense-LSTM”模型),旨在根据 RS 的序列预测其转录活性,这使 DeepCROSS 能够探索序列空间并生成具有高准确度和序列多样性的跨物种 RS。 模型优化接下来,研究团队着重解决从广泛物种中随机选择天然 RS带来的数据质量低下的问题,主要是长尾分布。研究团队实施了一种主动探索策略,使用 DeepCROSS 指导体内 MPRA 实验以填充长尾分布的“序列活性”景观,。实验验证证实,最终的 DeepCROSS 模型在设计物种偏好和跨物种 RS 时分别达到了 90.0% 和 93.3% 的准确率。优化后的调控序列实现了与功能性天然调控序列相似或更好的性能,具有高成功率和与天然基因组的低序列相似性。
DeepCROSS 方法概述小结该研究提供了一种从头策略,可以有效地描绘广阔的 DNA 序列空间内的功能景观,biang实现了跨物种和物种偏好的 5 RS的逆向设计,这些合成序列可能会彻底改变用于工业和治疗目的的基因构建体的开发方式。
资料来源:
https://www.nature.com/articles/s41467-025-57031-1#Sec1https://evrimagaci.org/tpg/aipowered-deepcross-revolutionizes-regulatory-sequence-design-208850