DeepSEED 是清华大学研究团队开发的一种人工智能辅助工具,旨在高效设计合成启动子。启动子是调控基因表达的关键元件,通过设计具有特定特性的合成启动子,可以精确控制基因表达,这在生物合成工程和基因治疗中具有重要意义。citeturn0search9 传统的启动子设计主要关注转录因子结合位点(TFBS)的组合和排列。然而,最近的研究表明,TFBS 周围的侧翼序列也显著影响启动子的特性。DeepSEED 通过结合专家知识和深度学习技术,优化这些侧翼序列,以设计出具有所需特性的合成启动子。citeturn0search9 具体而言,DeepSEED 由两个深度学习模型组成: 1. **条件生成对抗网络(cGAN)**:基于预设的序列元素生成侧翼序列。 2. **DenseNet-LSTM 模型**:用于预测启动子的属性。 用户可以根据先验知识,在任意位置输入感兴趣的序列元件(如 TFBS)作为“种子”,然后 DeepSEED 根据这些“种子”生成适合的侧翼序列,以满足启动子的隐式模式。citeturn0search9 研究团队将 DeepSEED 应用于原核组成型启动子、原核 IPTG 诱导型启动子和真核强力霉素诱导型启动子的设计任务中。在所有这些情况下,DeepSEED 通过优化侧翼序列,显著提高了启动子的性能,并表现出高度的序列多样性。citeturn0search9 这项研究强调了侧翼序列在确定启动子特性中的重要性,并展示了将深度学习与专家知识相结合在合成生物学中的巨大潜力。citeturn0search9