OpenAI 宣布开发出一种名为 GPT-Rosalind 的大型语言模型,专门针对常见生物学工作流程进行了训练。该模型以生物学家罗莎琳德·富兰克林的名字命名,代表了一种专门的生物数据分析方法,将其与主要科技公司通常采用的更通用的模型区分开来。
OpenAI 生命科学产品负责人 Yunyun Wang 表示,GPT-Rosalind 解决了生物学研究中的重大障碍。第一个挑战来自数十年的基因组测序和蛋白质生物化学产生的大量数据集。第二个挑战涉及生物学许多子领域的专业化,每个子领域都有独特的技术和特定的术语。
例如,遗传学家在浏览与脑细胞中活跃的特定基因相关的大量神经生物学文献时可能会遇到困难。 Wang 指出,OpenAI 对 GPT-Rosalind 进行了 50 种最常见的生物工作流程以及访问主要生物信息公共数据库的培训。
该模型能够建议潜在的生物学途径并优先考虑药物靶标。 “我们通过已知的途径和调节机制将基因型与表型联系起来,推断蛋白质可能的结构或功能特性,并真正利用这种机制理解,”王说。
<小时/>








