南京农业大学正式推出司农大语言模型(sinong)。该模型是我国首个聚焦通用农业场景的开源垂直大语言模型,也是由南京农业大学牵头研发的首套农业领域专属大语言模型。
据悉,“司农”之名源自中国古代主管财政与农政的重要官职,其专业实力根植于南京农业大学雄厚的农业学科积淀以及海量、高质的农业领域语料资源。研究团队充分发挥学校在农业学科群中的领先优势,系统整合涵盖动物科学、农业经济管理、农业资源与环境、园艺学、智慧农业、动物医学、植物保护、作物育种等方向的专业数据,累计构建超40亿token的农业领域高质量语料库,内容覆盖近9,000部专著、24万余篇学术论文、近2万份政策文件与行业标准,并融合大量权威网络农业知识,最终形成结构完备、质量可靠、覆盖全面的农业基础数据集。
| 数据类型 | 数据样例 |
|---|---|
| QA | "instruction": "在人多地少、耕地后备资源不足的背景下,如何借鉴中国古代‘精耕细作’传统提升单位面积粮食产量,且避免过度投入导致的生态退化?","output": "应采取‘三才’统筹的精耕细作模式:一是因地制宜优化耕作制度,..." |
| COT-QA | "instruction": "宋代南方水田农业中出现了哪些新型农具?这些农具如何促进了水稻种植效率的提升?",“output”: \n好的,我现在需要回答用户的问题:“宋代南方水田农业中出现了哪些新型农具?这些农具如何促进了水稻种植效率的提升?”……\n宋代南方水田农业中出现的新型农具包括:……" |
| Incontext-QA | "instruction": ""小麦纹枯病的发生与温湿度、栽培措施及品种抗性如何交互影响,导致其在不同生育阶段呈现动态发展规律?\n\n小麦和大麦种子萌发后……",“output”:小麦纹枯病的发生与温湿度、栽培措施及品种抗性三者交互影响,共同决定其在不同生育阶段的动态发展规律,具体表现为:\n\n1. 温湿度主导病害发展节律: \n 病菌侵染和扩展受温度显著调控。冬前(10℃以下)病害发展缓慢,仅零星发生;翌春气温回升至15℃以上时,病害加速扩展,20~25℃为最适发展温度,此时病株率与严重度急剧上升,尤其在拔节至孕穗期达高峰;30℃以上病害基本停滞。同时,春季低温多雨…… |
| Incontext-COT-QA | “instruction”: “中国百强
|
模型开源与获取方式
魔塔社区开源页面:https://www./link/352c158de620027ff0452ad48dd2c3b2
GitHub开源仓库:https://www./link/6a307655ba6a4f31e4f2da46d7516c84
源码下载地址:点击下载

