通义实验室推出首个统一“科学语法”的多领域科学生成基础模型 LOGOS

📅 2026/6/18 18:00:51
通义实验室推出首个统一“科学语法”的多领域科学生成基础模型 LOGOS
【导语通义实验室宣布推出 LOGOS这是由 ATH - Token Foundry 联合中国人民大学高瓴人工智能学院开源的首个基于统一“科学语法”的多领域科学生成基础模型其构建了庞大预训练语料库还有三大创新点。】统一“科学语法”的多领域模型诞生通义实验室推出了 LOGOS它是首个基于统一“科学语法”的多领域科学生成基础模型。其核心洞察在于蛋白质、小分子、材料虽表面不同但底层遵循相似规则是同一种“科学语言”的不同方言统一语法让跨领域知识迁移等成为可能。44.87B tokens 庞大预训练语料库LOGOS 构建了涵盖 7 类模态、总计44.87B tokens的庞大预训练语料库。其中生物大分子层包括蛋白质28.9B tokens和抗体3.0B tokens化学实体与转化层有小分子2.1B tokens和化学反应与 MOF 材料0.47B tokens界面互作层包含蛋白质口袋5.8B tokens和蛋白口袋 - 配体复合物4.6B tokens。三大创新突破传统局限LOGOS 有三大创新点。一是统一“科学语法” 空间交互的离散化这是最具突破性的设计由两个相辅相成的部分构成。二是预训练和下游任务形式和目标完全一致这种 form - objective alignment 有效消除了预训练与下游应用之间的 gap无需复杂适配层或大量微调即可激活生成能力。三是跨领域知识正向迁移实验证实有效统一语法让科学对象“语言相通”且“知识共享”。编辑观点LOGOS 的推出为多领域科学研究带来新可能统一语法和创新设计有望推动跨领域知识融合与应用在科研领域或产生深远影响。