一、背景
某农业集团作为中国农业的国家队,肩负着提高农业生产效率,质量,实现农业的数字化和智慧化的使命。数字农艺师项目,将依托数字化技术,结合GIS、互联网、AI等赋能于数据驱动的土壤健康、种子选种销售、作物处方、农机具数据获取与融合应用等。 规划建设基于微服务架构的数字农艺师应用平台,数据底座给予OneData一体化农业大数据平台,以科技赋能产品研发、渠道拓展并具备对第三方生态开放服务的能力,包括农产品种植管理与服务,面向未来构建基于农业大数据的融合生物科技、基因技术与数字化技术相融合的高科技数据驱动农业种植服务,构建良好的开放的农艺师应用数字化生态。
数据采集:
数据采集来源的多样性,数据采集的方式包括但不限于:
1、 API数据服务接口
2、 关系型数据库
3、 Excel/CSV/Json等结构化或半结构化数据文件
4、 图片等非结构化数据文件
5、 物联网通过传感器收集的数据
大量数据形成数据湖:
数据量大,种子试验数据、天气数据、土壤数据等传感器多,采集时间长,数据量大,需要数据湖存储
1、 种子试验数据,包括研发SD阶段的试验数据和田间技术开发TD阶段的试验数据,主要数据结构为:试验品种,播种与收获时间、试验地点、试验玉米区、种植条件数据、产量数据与各种表型数据。
2、 天气数据,包括多种数据源,目前已经有的是来自NOAA的开源天气数据与购自中国气象局的历史天气数据
3、 土壤数据,主要包括土壤养分数据,土壤类型数据,土壤质地数据等。
4、 未来还会包括更加丰富的数据域,如:农户画像、地块数据、作物分布、病虫害、气候胁迫数据、农资产品(农药化肥等产品应用数据等)。
数据分析应用难:
采集数据多,需要进行分析应用,把离散数据,采集数据形成分析结果 ,找出数据规律,为决策分析提供支持服务。
1、 关联试验数据与环境数据,构建数据分析应用模型。
2、基于DSSAT模型的分析结果,构建作物模型的应用模型。DSSAT模型的架构如下图所示:
这是数字农艺师的应用框架:
最底层是源数据层:采集数据把各种数据采集清洗入数据仓库、数据湖,数据包括:试验与种植数据域(包括田间表型、种植管理等数据);天气数据域(包括位置信息、气候变量等数据);土壤数据域(包括位置信息、土壤变量等数据)
数据DSSAT模型层:经过模型算法,输出品种、位置/地块、播期、种植密度等数据集;
数据服务层:提供产品评优服务、GIS范围最优匹配服务、气象土壤数据分析等服务功能;
应用层:应用层提供Web端应用和移动端服务
用户层:用户包括:各事业部农艺师协同销售、第三方合作伙伴农艺师。
数字农艺师项目主要用于为客户选择最合适的种子,并提供数据驱动的农艺师科学选种服务,系统是依托OneData数据底座,汇聚天气、土壤、种子实验及管理等数据,结合DSSAT作物模型,微服务开发框架和GIS等技术,模拟玉米的生长,并预测最佳熟期与产量,从而实现数据驱动的智慧选种。
基于作物模型输出的数据集与地块相结合,为客户做出选种推荐,以数字化科技赋能各事业部的研发、市场渠道与农户,包括农产品种植管理与服务,面向未来构建基于农业大数据的可管、可控、可运营的数据服务与应用开放数字化生态。
1、环境、种子等数据入仓:
采集天气数据、土壤数据和种子试验数据并清洗入仓
能够实现文件采集和手工填报采集。
基于OneData数据仓库平台,设计与实现天气、土壤、种子试验数据域数据模型
2、模型应用
关联试验数据与环境数据,构建数据分析应用模型
基于DSSAT模型的分析结果,构建作物模型的应用模型,主要为GIS应用模型与产品评优算法模型
3、构建数字农艺师中台
依托于onedata,面向数字农艺师中台,提供数据支持
基于微服务的框架,实现服务的复用、解耦、快速的响应产品的需求
数据的API化,提供给合作伙伴相应的服务
GIS服务初步实现产量分布、地块展示等。未来通过确定关键干预区域和有效的目标控制干预措施来对抗害虫的传播等
建立算法模型的模块,包括AI和非AI的算法(包括数据挖掘)
4、面向数字农艺师的选种产品
通过选择地块、环境、种植管理等信息,实现数据驱动的科学选种能力。
PC端和移动端应用。
专业的的报告,指导各地块种植,包含建议的种子和购买的量(组合产品包)。
1、实现选种服务,包括依赖地块环境等信息进行选种,实现数据驱动的科学选种能力;
2、地块推荐种子的各种表型数据分析;
3、专业的的报告,指导各地块种植,包含建议的种子和购买的量。