记者29日从中国农业大学获悉,该校生物学院教授王喜庆团队联合上海人工智能实验室、崖州湾种子实验室日前发布了我国首个种业大语言模型“丰登”(SeedLLM)。
“丰登集成了人工智能技术‘书生·浦语2.0’与大数据分析技术,通过深入学习我国迄今发布的科研文献、科技书籍、种企报告和历史推广数据,可准确解答有关作物品种选育推广、农艺性状、栽培技术、推广区域以及种业企业状况等相关问题。”王喜庆告诉记者。
相较于国内外其他大语言模型,“丰登”重点关注生物育种领域。
“该模型具有4大核心能力:可系统深度挖掘并结构化我国在育种领域积累的学术文献、书籍、田间日志等知识;利用多学科知识图谱,整合了生物学、遗传学、气象学、土壤学等相关领域的知识,并发掘这些领域之间的联系;通过自然语言对话接口降低了技术门槛,用户可以直接提出问题并迅速获得答案,确保信息的实时性和高效获取,提高工作效率;此外,不仅服务于育种专家和科研人员,也为全国的农业工作者提供必要的支持,加速了育种知识的传播和应用。”王喜庆说。
经评估测试,丰登在最佳答案个数和综合分数上的表现均超出预期,综合得分是本科生的4.87倍,在多个评估维度上超越了国际领先水平的大语言模型。
目前,“丰登1.0”大语言模型拥有超过200亿参数,并已开放针对水稻相关知识的测试接口申请。首批参与测试的单位包括隆平高科、正大集团、中国科学院、中国农业科学院、上海市农业科学院、广东省农业科学院、华中农业大学、华南农业大学、复旦大学等。