打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
刘石:五千字长文高度解读“数字农业 · 大数据 · 农业大数据”

刘石 美来众联

农业大数据三讲

数字农业 · 大数据 · 农业大数据

刘石老师



第1讲

什么是数字农业


数字农业的发展还处于早期阶段,对于其核心的组成部分以及各个部分的理解还有不少歧义。

其中,数字农业的概念大概是在20年前首次被提出,但近几年开始渐渐被人们所熟悉,也已经成为公众的热门话题之一。美国的孟山都、杜邦、嘉吉等公司,欧洲的拜耳、先正达和巴斯夫等公司,以及形形色色的小公司都看好这一新兴领域的发展潜力,纷纷发力,造成数字农业一派热火朝天、欣欣向荣的景象。

数字农业是信息技术在农业领域的综合和全面的应用。具体来讲,数字农业是指将遥感、地理信息系统、全球定位系统、计算机技术、通讯和网络技术、自动化技术等高新技术与地理学、农学、生态学、植物生理学和土壤学等基础学科有机地结合起来,从而实现在农业生产的全过程中,对农作物从规划、投入、生产,到农产品收获、加工、营销等全过程模拟、监测、判断、预测和建议等,达到提高资源利用率,降低成本,提高生产效率和产品质量,改善生态环境的目的。

数字农业从概念的产生,到实践中的探索、发展和应用,一直在不断丰富和完善之中。对于数字农业的定义和理解也因人而异。综合世界主要农业国家的科研和企业的实践,笔者在这里给大家做一个阶段性的总结。


数字农业是一个集合概念,它主要包含以下4个主要部分:

01

农业物联网(Internet of Things)

农业物联网从本质上讲,是一套数控系统。在一个特定的封闭系统内,以探头、传感器、摄像头等设备为基础的物物相联。它根据已经确定的参数和模型,进行自动化调控和操作。由于需要以硬件设备的投资和联网为基础,因此投资额较大,主要用于设施农业生产过程的管理和操作,也用于农产品的加工、仓储和物流管理。

02

农业大数据 (Big Data)

农业大数据是与农业物联网相对应的概念,它是一个数据系统,在开放系统中收集、鉴别、标识数据,并建立数据库,通过参数、模型和算法来组合和优化多维和海量数据,为生产操作和经营决策提供依据,并实现部分自动化控制和操作。因为它是在完全开放的系统中运作,因此主要用于大田农业的生产和农业全产业链的操作和经营。

03

精准农业(Precision Farming )

精准农业是建立在农机硬件基础上的执行和操作系统。它主要是以农机的单机硬件为基础,配以探测设备和智能化的控制软件,以实现精准操作,变量控制(包括变量播种、变量施肥、变量喷药等),无人驾驶,以及最佳的工作环境和场景适配。精准农业强调的是(单体)设备和设施操作的精准和智能化控制,是硬件+软件。

04

智慧农业(Smart Agriculture)

智慧农业是建立在经验模型基础之上的专家决策系统,其核心是软件系统。智慧农业强调的是智能化的决策系统,配之以多种多样的硬件设施和设备,是系统+硬件。智慧农业的决策模型和系统可以在农业物联网和农业大数据领域得到广泛应用。

2016年,谷歌旗下Deep Mind的Alpha Go横空出世,把人工智能为(AI)的决策水平提高到一个前所未有的高度,让人们认识到人空智能发展的提速和广阔的前景,也为数字农业的发展注入了强心针。

由于数字农业的发展还处于早期阶段,对于其核心的组成部分以及各个部分的理解还有不少歧义,因此,概念被用错和被混为一谈的事情经常发生。

数字农业未来的发展前景虽然非常富有吸引力,但是由于农业的生产涉及的品类和品种繁多,生产过程漫长和复杂,不可控因素多,变量多,因此数字农业从单点突破到全面进步和应用还需要假以时日。

第2讲

什么是大数据


数字农业的发展还处于早期阶段,对于其核心的组成部分以及各个部分的理解还有不少歧义。大数据(Big Data)是一个比较新的概念,它也很容易让人望文生义。最简单和最直接的反应就是认为大数据就是“大量的数据”。

一位统计局的领导就自豪地跟我说:“我们有各行各业多年来的统计数据,有公开发表的,也有没有公开发表的。这些都是最好的大数据”。客观地说,这是一个非常典型的误读。

关于大数据,不同的研究机构给出的定义是不同的:

▶ 美国专门研究大数据公司Gartner的定义是:无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

▶ 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中给出的定义是:不用随机分析法(传统的抽样调查)的途径,而采用所有数据进行分析处理。

▶ IBM公司归纳了大数据的5V特点:Volume(大量),Velocity(高速),Variety(多样),Value(低价值密度),Veracity(真实性)。

笔者认为,这些国外的机构和专家的总结和归纳,都在一些侧面反映了大数据的特质和特性,但是还不够全面和准确。那么我们应该怎样理解和定义“大数据”呢?


01

大数据是动态数据

通过各种设备、设施、软件和系统实时获取的动态数据是大数据。比如生产过程中通过监控设备获取的数据、气象监测数据、作物生长数据和消费者的动态数据等等。但统计数据不是大数据,因为它是主要是通过行政管理机构或者市场调查机构,逐层调查和统计上来的静态数据,比如说农业、农村和农民数据等。这些数据的获得不仅耗时费力,还常常会出现人为的偏差和失误。而且一旦统计结果汇总之后即成为历史数据。动态的数据的收集、汇总和实时更新需要通过适当的设备、设施和技术手段来实现。所幸,社会活动的多样化,信息技术的发展,特别是移动终端的普及,使得无限这一任务可以轻松达成,而且大数据的触角也得到极大延展。

02

大数据是多维度的数据

我们以农业的产业大数据为例,影响生产过程的因素可以是投入的原材料的变化,技术的先进程度,生产的环境条件,人员的操作水平,市场的行情变化,物流的调控能力等等,总之是多维度的。这些维度的数据需要涵盖能够影响结果诸多原因,即必要的维度,否则就没有价值。数据量大不代表“充分”,也不表示能够包含必要的“维度”。只有一个或少量维度的数据,数量再大也不能够称之为大数据。

03

大数据是有逻辑关系的数据

现代社会生活丰富多彩,节奏快,每时每刻都产生大量的有价值和无价值的数据。我们根据需求,将这些大量、动态和碎片化的数据收集、标识和关联,并按照一定的逻辑关系组合起来以后,这些数据就开始变得有意义和有价值了。以消费大数据为例,收入水平与消费支出,年龄段与产品类型,地域分布与产品偏好,职业与品牌选择等等,都存在着极高和多重的逻辑关联,我们通过关联分析,可以产生大量和有价值的次生数据并从中得到结论。因此,没有逻辑关系关联的数据是没有价值的,也不能称之为大数据。

04

大数据之间可以形成多种函数关系

以产业大数据为例,从统计的角度可以统计工厂,产品,工人,原材料投入,消耗,生产效率等很多项目…,统计数据之间一般只有线性关系。从大数据的角度可以把整个生产分为不同的生产过程或生产单元,每个生产过程或单元的变量因素都可以有不同的原材料投入,生产条件,管理方式,控制节点等,其中任何一点或多点的变化及其变化的幅度,对生产结果会造成不同的和有规律可循的影响,这些数据之间具有非常清晰的数量关联,人们可以通过参数,算法等总结出其中的数量关系。而且这些多种变量数据之间通常是可以被描述为模型下的函数关系。发现、构建和不断完善各种数据之间逻辑和函数关系才是大数据的本质追求。

综合以上各点,大数据的正确定义应该是:大数据是通过应用软件或系统,自我产生和实时更新的,按一定逻辑关系关联的多维数据。

第3讲

什么是农业大数据


我们首先要区分农业大数据和农业大数据技术。不幸的是,把两样不同的东西混为一谈的人很多。

农业大数据技术核心在于技术,包括获取技术和处理数据的技术,相比工业大数据技术,大数据处理技术类似,但是农业大数据获取技术对于技术的多样性和复杂程度要求更高,根本原因在于工业大数据技术面对的是非生命物质,农业大数据面对的是开放环境生长的动植物生命,农业大数据技术更为复杂。

那什么是农业大数据?首先理解什么是大数据?它是真实世界的一种映射,通过数据化把真实世界映射在另外一个虚拟世界,通过对数据的建模、运算和处理,让我们对于真实世界的感知又深了一层,相比于传统利用经验的判断,农业大数据其实是我们解构生命属性的动植物全生命流程(产业链)的一种新的更接近真实的模式。

01

农业大数据技术

(1)农业大数据获取的技术

▶ 遥感技术,它包括卫星遥感,无人机遥感,有人机遥感、定点摄像头等;

▶ 气象技术,它包括气象卫星、气象雷达、气象基站、无人自动气象站等;

▶ 探测技术,包括照相机,摄像头,探测设备,传输设备;

▶ 定位技术,它包括GPS,北斗,伽利略,格罗纳斯,RTK等;

▶ 各种有线和无线传输技术

(2)农业大数据的处理技术

▶ 数据库

▶ 参数、算法、模型

▶ 小程序、APP、软件

▶ 功能、模块、系统、平台、SAAS

▶ 云计算、区块链

02

农业大数据

我们之前讲过,农业大数据之“大”主要是体现在“多维度”上。那么,农业大数据的多维度主要都体现在哪些方面呢?

(1)它首先体现“涉农”的广泛性和全面性,即它涵盖农业生产过程的全要素

▶ 宏观要素,社会因素、经济因素、政策因素、成本要素、价格要素、供求关系、国际贸易因素等;

▶ 投入要素:如种子、化肥、农药、农机、农膜等;

▶ 环境要素:气候因素、气象因素、地理环境、小区域气候、土壤因素等;

▶ 操作要素:如农事规划,农事操作,操作与农时/作物生长周期的配合,农机与农具的搭配,操作的时间、数量、质量、效果等;

▶ 管理要素:规模,效率、投入、产出、成本、效益、人均劳动生产率等。

(2)它体现“涉业”,即涉及产业链的全过程的各个方面的数据

▶ 金融大数据:融资、信贷、数量、比例、期限、利率、还款方式、保险、期货、收入、效益等;

▶ 产业大数据:作物、品种、投入、生产、产出、销售、加工、损耗、成本、效益、投入产出比,资金周转率、仓储、物流,库存,损耗,开工率等;

▶ 消费大数据:消费群体、消费水平,地域、渠道、年龄、偏好、品类、数量、频次、时段、价格敏感度、支付方式、重复购买率、品牌忠诚度等。

03

农业大数据的逻辑和架构

构建农业大数据系统有三大注意事项。


(1)业务逻辑优先技术逻辑

农业大数据因为涉及开放和多变环境,冗长的产业链,漫长的时间,多重的参与者,所以远远比一般产业的大数据来得复杂。正确理解产业链的基本构成和各自不同的内在逻辑,预见产业链的变化和发展的趋势,厘清整体和各个组件结构关系,模型的构成以及要素的优先次序和权重等尤为重要。

业务逻辑优先于技术逻辑是农业大数据能够得以正确实现的基本前提,万万不可由于“技术控”而被误导。技术再先进,结构做的再漂亮,如果模型没有能够正确理解和按照业务逻辑建立起来的,其结果也只能是好看而不实用。

(2)底层芯片设计很重要

构建农业大数据系统如同设计“芯片”,是一层层通过叠加而搭建起来的。在清晰的产业逻辑基础上建立的底层架构的合理性十分重要,它决定着“芯片”最后的成功与否以及是否具有实用价值。如果没有合理的底层设计,许多先前看起来很有价值的应用和数据最后都可能形同鸡肋。由于基础没有打好,后续的系统运行会低效率、高功耗,而且漏洞百出,最后不得不推倒重来。

(3)打通数据孤岛是关键

农业大数据系统的建立要实现开放性设计,能够与外源数据实现兼容和交换,以避免成为“数据孤岛”。因为只有实现完整产业链基础上的“数据链”的贯通,农业大数据才真正具有价值。



刘石:什么是农业大数据?

基因农业网 2019-01-28 11:25:36

基因农业网

传播科学,终结谣言

关注

数字农业的发展还处于早期阶段,对于其核心的组成部分以及各个部分的理解还有不少歧义。

其中,数字农业的概念大概是在20年前首次被提出,但近几年开始渐渐被人们所熟悉,也已经成为公众的热门话题之一。美国的孟山都、杜邦、嘉吉等公司,欧洲的拜耳、先正达和巴斯夫等公司,以及形形色色的小公司都看好这一新兴领域的发展潜力,纷纷发力,造成数字农业一派热火朝天、欣欣向荣的景象。

一、什么是数字农业?

数字农业是信息技术在农业领域的综合和全面的应用。具体来讲,数字农业是指将遥感、地理信息系统、全球定位系统、计算机技术、通讯和网络技术、自动化技术等高新技术与地理学、农学、生态学、植物生理学和土壤学等基础学科有机地结合起来,从而实现在农业生产的全过程中,对农作物从规划、投入、生产,到农产品收获、加工、营销等全过程模拟、监测、判断、预测和建议等,达到提高资源利用率,降低成本,提高生产效率和产品质量,改善生态环境的目的。

数字农业从概念的产生,到实践中的探索、发展和应用,一直在不断丰富和完善之中。对于数字农业的定义和理解也因人而异。综合世界主要农业国家的科研和企业的实践,笔者在这里给大家做一个阶段性的总结。

数字农业是一个集合概念,它主要包含以下4个主要部分:

01

农业物联网(Internet of Things)

农业物联网从本质上讲,是一套数控系统。在一个特定的封闭系统内,以探头、传感器、摄像头等设备为基础的物物相联。它根据已经确定的参数和模型,进行自动化调控和操作。由于需要以硬件设备的投资和联网为基础,因此投资额较大,主要用于设施农业生产过程的管理和操作,也用于农产品的加工、仓储和物流管理。

02

农业大数据 (Big Data)

农业大数据是与农业物联网相对应的概念,它是一个数据系统,在开放系统中收集、鉴别、标识数据,并建立数据库,通过参数、模型和算法来组合和优化多维和海量数据,为生产操作和经营决策提供依据,并实现部分自动化控制和操作。因为它是在完全开放的系统中运作,因此主要用于大田农业的生产和农业全产业链的操作和经营。

03

精准农业(Precision Farming )

精准农业是建立在农机硬件基础上的执行和操作系统。它主要是以农机的单机硬件为基础,配以探测设备和智能化的控制软件,以实现精准操作,变量控制(包括变量播种、变量施肥、变量喷药等),无人驾驶,以及最佳的工作环境和场景适配。精准农业强调的是(单体)设备和设施操作的精准和智能化控制,是硬件+软件。

04

智慧农业(Smart Agriculture)

智慧农业是建立在经验模型基础之上的专家决策系统,其核心是软件系统。智慧农业强调的是智能化的决策系统,配之以多种多样的硬件设施和设备,是系统+硬件。智慧农业的决策模型和系统可以在农业物联网和农业大数据领域得到广泛应用。

二、什么是农业大数据?

2016年,谷歌旗下Deep Mind的Alpha Go横空出世,把人工智能为(AI)的决策水平提高到一个前所未有的高度,让人们认识到人空智能发展的提速和广阔的前景,也为数字农业的发展注入了强心针。

由于数字农业的发展还处于早期阶段,对于其核心的组成部分以及各个部分的理解还有不少歧义,因此,概念被用错和被混为一谈的事情经常发生。

数字农业未来的发展前景虽然非常富有吸引力,但是由于农业的生产涉及的品类和品种繁多,生产过程漫长和复杂,不可控因素多,变量多,因此数字农业从单点突破到全面进步和应用还需要假以时日。

数字农业的发展还处于早期阶段,对于其核心的组成部分以及各个部分的理解还有不少歧义。大数据(Big Data)是一个比较新的概念,它也很容易让人望文生义。最简单和最直接的反应就是认为大数据就是“大量的数据”。

一位统计局的领导就自豪地跟我说:“我们有各行各业多年来的统计数据,有公开发表的,也有没有公开发表的。这些都是最好的大数据”。客观地说,这是一个非常典型的误读。

关于大数据,不同的研究机构给出的定义是不同的:

•美国专门研究大数据公司Gartner的定义是:无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

•在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中给出的定义是:不用随机分析法(传统的抽样调查)的途径,而采用所有数据进行分析处理。

•IBM公司归纳了大数据的5V特点:Volume(大量),Velocity(高速),Variety(多样),Value(低价值密度),Veracity(真实性)。

笔者认为,这些国外的机构和专家的总结和归纳,都在一些侧面反映了大数据的特质和特性,但是还不够全面和准确。那么我们应该怎样理解和定义“大数据”呢?

01

大数据是动态数据

通过各种设备、设施、软件和系统实时获取的动态数据是大数据。比如生产过程中通过监控设备获取的数据、气象监测数据、作物生长数据和消费者的动态数据等等。但统计数据不是大数据,因为它是主要是通过行政管理机构或者市场调查机构,逐层调查和统计上来的静态数据,比如说农业、农村和农民数据等。这些数据的获得不仅耗时费力,还常常会出现人为的偏差和失误。而且一旦统计结果汇总之后即成为历史数据。动态的数据的收集、汇总和实时更新需要通过适当的设备、设施和技术手段来实现。所幸,社会活动的多样化,信息技术的发展,特别是移动终端的普及,使得无限这一任务可以轻松达成,而且大数据的触角也得到极大延展。

02

大数据是多维度的数据

我们以农业的产业大数据为例,影响生产过程的因素可以是投入的原材料的变化,技术的先进程度,生产的环境条件,人员的操作水平,市场的行情变化,物流的调控能力等等,总之是多维度的。这些维度的数据需要涵盖能够影响结果诸多原因,即必要的维度,否则就没有价值。数据量大不代表“充分”,也不表示能够包含必要的“维度”。只有一个或少量维度的数据,数量再大也不能够称之为大数据。

03

大数据是有逻辑关系的数据

现代社会生活丰富多彩,节奏快,每时每刻都产生大量的有价值和无价值的数据。我们根据需求,将这些大量、动态和碎片化的数据收集、标识和关联,并按照一定的逻辑关系组合起来以后,这些数据就开始变得有意义和有价值了。以消费大数据为例,收入水平与消费支出,年龄段与产品类型,地域分布与产品偏好,职业与品牌选择等等,都存在着极高和多重的逻辑关联,我们通过关联分析,可以产生大量和有价值的次生数据并从中得到结论。因此,没有逻辑关系关联的数据是没有价值的,也不能称之为大数据。

04

大数据之间可以形成多种函数关系

以产业大数据为例,从统计的角度可以统计工厂,产品,工人,原材料投入,消耗,生产效率等很多项目…,统计数据之间一般只有线性关系。从大数据的角度可以把整个生产分为不同的生产过程或生产单元,每个生产过程或单元的变量因素都可以有不同的原材料投入,生产条件,管理方式,控制节点等,其中任何一点或多点的变化及其变化的幅度,对生产结果会造成不同的和有规律可循的影响,这些数据之间具有非常清晰的数量关联,人们可以通过参数,算法等总结出其中的数量关系。而且这些多种变量数据之间通常是可以被描述为模型下的函数关系。发现、构建和不断完善各种数据之间逻辑和函数关系才是大数据的本质追求。

综合以上各点,大数据的正确定义应该是:大数据是通过应用软件或系统,自我产生和实时更新的,按一定逻辑关系关联的多维数据。

三、农业大数据和农业大数据技术的区别

我们首先要区分农业大数据和农业大数据技术。不幸的是,把两样不同的东西混为一谈的人很多。

农业大数据技术核心在于技术,包括获取技术和处理数据的技术,相比工业大数据技术,大数据处理技术类似,但是农业大数据获取技术对于技术的多样性和复杂程度要求更高,根本原因在于工业大数据技术面对的是非生命物质,农业大数据面对的是开放环境生长的动植物生命,农业大数据技术更为复杂。

那什么是农业大数据?首先理解什么是大数据?它是真实世界的一种映射,通过数据化把真实世界映射在另外一个虚拟世界,通过对数据的建模、运算和处理,让我们对于真实世界的感知又深了一层,相比于传统利用经验的判断,农业大数据其实是我们解构生命属性的动植物全生命流程(产业链)的一种新的更接近真实的模式。

01

农业大数据技术

(1)农业大数据获取的技术

•遥感技术,它包括卫星遥感,无人机遥感,有人机遥感、定点摄像头等;

•气象技术,它包括气象卫星、气象雷达、气象基站、无人自动气象站等;

•探测技术,包括照相机,摄像头,探测设备,传输设备;

•定位技术,它包括GPS,北斗,伽利略,格罗纳斯,RTK等;

•各种有线和无线传输技术

(2)农业大数据的处理技术

•数据库

•参数、算法、模型

•小程序、APP、软件

•功能、模块、系统、平台、SAAS

•云计算、区块链

02

农业大数据

我们之前讲过,农业大数据之“大”主要是体现在“多维度”上。那么,农业大数据的多维度主要都体现在哪些方面呢?

(1)它首先体现“涉农”的广泛性和全面性,即它涵盖农业生产过程的全要素

•宏观要素,社会因素、经济因素、政策因素、成本要素、价格要素、供求关系、国际贸易因素等;

•投入要素:如种子、化肥、农药、农机、农膜等;

•环境要素:气候因素、气象因素、地理环境、小区域气候、土壤因素等;

•操作要素:如农事规划,农事操作,操作与农时/作物生长周期的配合,农机与农具的搭配,操作的时间、数量、质量、效果等;

•管理要素:规模,效率、投入、产出、成本、效益、人均劳动生产率等。

(2)它体现“涉业”,即涉及产业链的全过程的各个方面的数据

•金融大数据:融资、信贷、数量、比例、期限、利率、还款方式、保险、期货、收入、效益等;

•产业大数据:作物、品种、投入、生产、产出、销售、加工、损耗、成本、效益、投入产出比,资金周转率、仓储、物流,库存,损耗,开工率等;

•消费大数据:消费群体、消费水平,地域、渠道、年龄、偏好、品类、数量、频次、时段、价格敏感度、支付方式、重复购买率、品牌忠诚度等。

03

农业大数据的逻辑和架构

构建农业大数据系统有三大注意事项。

(1)业务逻辑优先技术逻辑

农业大数据因为涉及开放和多变环境,冗长的产业链,漫长的时间,多重的参与者,所以远远比一般产业的大数据来得复杂。正确理解产业链的基本构成和各自不同的内在逻辑,预见产业链的变化和发展的趋势,厘清整体和各个组件结构关系,模型的构成以及要素的优先次序和权重等尤为重要。

业务逻辑优先于技术逻辑是农业大数据能够得以正确实现的基本前提,万万不可由于“技术控”而被误导。技术再先进,结构做的再漂亮,如果模型没有能够正确理解和按照业务逻辑建立起来的,其结果也只能是好看而不实用。

(2)底层芯片设计很重要

构建农业大数据系统如同设计“芯片”,是一层层通过叠加而搭建起来的。在清晰的产业逻辑基础上建立的底层架构的合理性十分重要,它决定着“芯片”最后的成功与否以及是否具有实用价值。如果没有合理的底层设计,许多先前看起来很有价值的应用和数据最后都可能形同鸡肋。由于基础没有打好,后续的系统运行会低效率、高功耗,而且漏洞百出,最后不得不推倒重来。

(3)打通数据孤岛是关键

农业大数据系统的建立要实现开放性设计,能够与外源数据实现兼容和交换,以避免成为“数据孤岛”。因为只有实现完整产业链基础上的“数据链”的贯通,农业大数据才真正具有价值。

转载自: 数字农业周刊



刘石丨全面解读农业大数据

农财网种业宝典 2019-01-29 03:52:20

数字农业的概念大概是在20年前首次被提出,但近几年开始渐渐被人们做熟悉,也已经成为公众的热门话题之一。

美国的孟山都、杜邦、嘉吉等公司,欧洲的拜耳、先正达、巴斯夫等公司,以及形形色色的小公司都看好这一新兴领域的发展潜力,纷纷发力,造成的数字农业一派热火朝天、欣欣向荣的景象。

数字农业是信息技术支在农业领域的综合和全面的应用。具体来讲,数字农业是指将遥感、地理信息系统、全球定位系统、计算机技术、通讯和网络技术、自动化技术等高新技术与地理学、农学、生态学、植物生理学、土壤学等基础学科有机地结合起来,从而实现在农业生产的全过程中,对农作物从规划、投入、生产过程、到农产品收获、加工、营销等全过程模拟、监测、判断、预测和建议等,达到提高资源利用率,降低成本,提高生产效率和产品质量,改善生态环境的目的。

数字农业从概念的产生,到实践中的探索、发展和应用,一直在不断丰富和完善之中。对于数字农业的定义和理解也因人而异。综合世界主要农业国家的科研和企业的实践,笔者在这里给大家做一个阶段性的总结。

数字农业是集合概念

数字农业是一个集合概念,它主要包含以下4个主要部分:

1、农业物联网(Internet of Things)

农业物联网从本质上讲,是一套数控系统。在一个特定的封闭系统内,以探头、传感器、摄像头等设备为基础的物物相联。她根据已经确定的参数和模型,进行自动化调控和操作。

由于需要以硬件设备的投资和联网为基础,因此投资额较大,主要用于设施农业的生产过程的管理和操作,也用于农产品的加工、仓储和物流管理。

2、农业大数据 (Big Data)

农业大数据是与农业物联网相对应的概念,它是一个数据系统,在开放系统中收集、鉴别、标识数据,并建立数据库,通过参数、模型和算法来组合和优化多维和海量数据,为生产操作和经营决策提供依据,并实现部分自动化控制和操作。因为它是在完全开放的系统中运作,因此主要用于大田农业的生产和农业全产业链的操作和经营。

3、精准农业(Precision Farming )

精准农业是建立在农机硬件基础上的执行和操作系统。它主要是以农机的单机硬件为基础,配以探测设备和智能化的控制软件,以实现精准操作,变量控制(包括变量播种、变量施肥、变量喷药等),无人驾驶,以及最佳的工作环境和场景适配。精准农业强调的是(单体)设备和设施操作的精准和智能化控制,是硬件+软件。

4、智慧农业(Smart Agriculture)

智慧农业是建立在经验模型基础之上的专家决策系统,其核心是软件系统。智慧农业强调的是智能化的决策系统,配之以多种多样的硬件设施和设备,是系统+硬件。智慧农业的决策模型和系统可以在农业物联网和农业大数据领域得到广泛应用。

2016年,谷歌旗下Deep Mind的Alpha Go横空出世,把人工智能为(AI)的决策水平提高到一个前所未有的高度,让人们认识到人空智能发展的提速和广阔的前景,也为数字农业的发展注入了强心针。

由于数字农业的发展还处于早期阶段,对于其核心的组成部分以及各个部分的理解还有不少歧义,因此,概念被用错和被混为一谈的事情经常发生。

由于数字农业的发展还处于早期阶段,对于其核心的组成部分以及各个部分的理解还有不少歧义,因此,概念被用错和被混为一谈的事情经常发生。

数字农业未来的发展前景虽然非常富有吸引力,但是由于农业的生产涉及的品类和品种繁多,生产过程漫长和复杂,不可控因素多,变量多,因此数字农业从单点突破到全面进步和应用还需要假以时日。

农业大数据vs农业大数据技术

理清数据与技术间的内生构造

要如何区分农业大数据和农业大数据技术?大多数人把两样不同的东西混为一谈。

农业大数据技术核心在于技术,包括获取技术和处理数据的技术,相比工业大数据技术,大数据处理技术类似,但是农业大数据获取技术对于技术的多样性和复杂程度要求更高,根本原因在于工业大数据技术面对的是非生命物质,农业大数据面对的是开放环境生长的动植物生命,农业大数据技术更为复杂。

那什么是农业大数据?首先理解什么是大数据?它是真实世界的一种映射,通过数据化把真实世界映射在另外一个虚拟世界,通过对数据的建模、运算和处理,让我们对于真实世界的感知又深了一层,相比于传统利用经验的判断,农业大数据其实是我们解构生命属性的动植物全生命流程(产业链)的一种新的更接近真实的模式。

1、农业大数据技术?

(1)农业大数据获取的技术

  • 遥感技术,它包括卫星遥感,无人机遥感,有人机遥感、定点摄像头等;

  • 气象技术,它包括气象卫星、气象雷达、气象基站、无人自动气象站等;

  • 探测技术,包括照相机,摄像头,探测设备,传输设备;

  • 定位技术,它包括GPS,北斗,伽利略,格罗纳斯,RTK等;

  • 各种有线和无线传输技术。

(2)农业大数据的处理技术

  • 数据库

  • 参数、算法、模型

  • 小程序、APP、软件

  • 功能、模块、系统、平台、SAAS

  • 云计算、区块链

2、农业大数据?

我们之前讲过,农业大数据之“大”主要是体现在“多维度”上。那么,农业大数据的多维度主要都体现在哪些方面呢?

(1)它首先体现“涉农”的广泛性和全面性,即它涵盖农业生产过程的全要素

宏观要素,社会因素、经济因素、政策因素、成本要素、价格要素、供求关系、国际贸易因素等。

  • 投入要素:如种子、化肥、农药、农机、农膜等;

  • 环境要素:气候因素、气象因素、地理环境、小区域气候、土壤因素等;

  • 操作要素:如农事规划,农事操作,操作与农时/作物生长周期的配合,农机与农具的搭配,操作的时间、数量、质量、效果等;

  • 管理要素:规模,效率、投入、产出、成本、效益、人均劳动生产率等。

(2)它体现“涉业”,即涉及产业链的全过程的各个方面的数据

  • 金融大数据:融资、信贷、数量、比例、期限、利率、还款方式、保险、期货、收入、效益等;

  • 产业大数据:作物、品种、投入、生产、产出、销售、加工、损耗、成本、效益、投入产出比,资金周转率、仓储、物流,库存,损耗,开工率等;

  • 消费大数据:消费群体、消费水平,地域、渠道、年龄、偏好、品类、数量、频次、时段、价格敏感度、支付方式、重复购买率、品牌忠诚度等。

3、农业大数据的逻辑和架构?

构建农业大数据系统有三大注意事项。

(1)业务逻辑优先技术逻辑

农业大数据因为涉及开放和多变环境,冗长的产业链,漫长的时间,多重的参与者,所以远远比一般产业的大数据来得复杂。

正确理解产业链的基本构成和各自不同的内在逻辑,预见产业链的变化和发展的趋势,理清整体和各个组件结构关系,模型的构成以及要素的优先次序和权重等尤为重要。

业务逻辑优先于技术逻辑是农业大数据能够得以正确实现的基本前提,万万不可由于“技术控”而被误导。技术再先进,结构做的再漂亮,如果模型没有能够正确理解和按照业务逻辑建立起来的,其结果也只能是好看而不实用。

(2)底层芯片设计很重要

构建农业大数据系统如同设计“芯片”,是一层层通过叠加而搭建起来的。在清晰的产业逻辑基础上建立的底层架构的合理性十分重要,它决定着“芯片”最后的成功与否以及是否具有实用价值。

如果没有合理的底层设计,许多先前看起来很有价值的应用和数据最后都可能形同鸡肋。由于基础没有打好,后续的系统运行会低效率、高功耗,而且漏洞百出,最后不得不推倒重来。

(3)打通数据孤岛是关键

农业大数据系统的建立要实现开放性设计,能够与外源数据实现兼容和交换,以避免成为“数据孤岛”。因为只有实现完整产业链基础上的“数据链”的贯通,农业大数据才真正具有价值。

农业大数据是多维数据

一位统计局的领导就自豪地跟我说:“我们有各行各业多年来的统计数据,有公开发表的,也有没有公开发表的。这些都是最好的大数据”。客观地说,这是一个非常典型的误读。

关于大数据,不同的研究机构给出的定义是不同的:● 美国专门研究大数据公司Gartner的定义是:无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。● 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中给出的定义是:不用随机分析法(传统的抽样调查)的途径,而采用所有数据进行分析处理。● IBM公司归纳了大数据的5V特点:Volume(大量),Velocity(高速),Variety(多样),Value(低价值密度),Veracity(真实性)。

笔者认为,这些国外的机构和专家的总结和归纳,都在一些侧面反映了大数据的特质和特性,但是还不够全面和准确。那么我们应该怎样理解和定义“大数据”呢?

1、大数据是动态数据

通过各种设备、设施、软件和系统实时获取的动态数据是大数据。比如生产过程中通过监控设备获取的数据、气象监测数据、作物生长数据和消费者的动态数据等等。

但统计数据不是大数据,因为它是主要是通过行政管理机构或者市场调查机构,逐层调查和统计上来的静态数据,比如说农业、农村和农民数据等。这些数据的获得不仅耗时费力,还常常会出现人为的偏差和失误。

而且一旦统计结果汇总之后即成为历史数据。动态的数据的收集、汇总和实时更新需要通过适当的设备、设施和技术手段来实现。

所幸,社会活动的多样化,信息技术的发展,特别是移动终端的普及,使得无限这一任务可以轻松达成,而且大数据的触角也得到极大延展。

2、大数据是多维度的数据

我们以农业的产业大数据为例,影响生产过程的因素可以是投入的原材料的变化,技术的先进程度,生产的环境条件,人员的操作水平,市场的行情变化,物流的调控能力等等,总之是多维度的。

这些维度的数据需要涵盖能够影响结果诸多原因,即必要的维度,否则就没有价值。数据量大不代表“充分”,也不表示能够包含必要的“维度”。只有一个或少量维度的数据,数量再大也不能够称之为大数据。

3、大数据是有逻辑关系的数据

现代社会生活丰富多彩,节奏快,每时每刻都产生大量的有价值和无价值的数据。我们根据需求,将这些大量、动态和碎片化的数据收集、标识和关联,并按照一定的逻辑关系组合起来以后,这些数据就开始变得有意义和有价值了。

以消费大数据为例,收入水平与消费支出,年龄段与产品类型,地域分布与产品偏好,职业与品牌选择等等,都存在着极高和多重的逻辑关联,我们通过关联分析,可以产生大量和有价值的次生数据并从中得到结论。

因此,没有逻辑关系关联的数据是没有价值的,也不能称之为大数据。

4、大数据之间可以形成多种函数关系

以产业大数据为例,从统计的角度可以统计工厂、产品、工人、原材料投入、消耗、生产效率等很多项目,统计数据之间一般只有线性关系。

从大数据的角度可以把整个生产分为不同的生产过程或生产单元,每个生产过程或单元的变量因素都可以有不同的原材料投入、生产条件、管理方式、控制节点等,其中任何一点或多点的变化及其变化的幅度,对生产结果会造成不同的和有规律可循的影响,这些数据之间具有非常清晰的数量关联,人们可以通过参数,算法等总结出其中的数量关系。而且这些多种变量数据之间通常是可以被描述为模型下的函数关系。发现、构建和不断完善各种数据之间逻辑和函数关系才是大数据的本质追求。

综合以上各点,大数据的正确定义应该是:大数据是通过应用软件或系统,自我产生和实时更新的,按一定逻辑关系关联的多维数据。

- END -

作者丨刘石

来源丨刘石新浪博客



刘石:大数据加速农业产业化进程,土地托管助推农业产业化!

原创 经济学家时报 2018-07-03 22:30:03

刘石,美来生威董事长

个人数据观

数据有不同层次的含义,不同层次价值,如果说数据只是停留在静态数据、结构化数据、碎片数据的话,实际上它的价值非常有限,一定要去深度开掘。但深度挖掘不仅是数据本身的问题,而是我们的产业要按照市场化的逻辑进行重新整合,在这个基础上,自然会产生比较有价值的数据,整个产业也会越做越好。

我国去年粮食总产量达61791万吨,属历史第一高产。然而,在庞大生产总数背后,却隐藏着粮食生产效率低下、资源利用率低的缺陷。通过数据对比发现,在美国和德同一个农民大约可养活200多个城市人口。而在中国。一个农民只能养活2-3个城市人口,人均生产率差近百倍。在美来生威董事长刘石看来,中国土地碎片化严重和农业人口太多是导致农业生产效率低下的一大主要原因,阻碍了中国农业现代化和产业化进程。所以,通过大数据进行土地和产业链条的集约,是变革中国农业生产方式、提升农业生产效率的一大关键因素。

“土地托管”助推农业产业化

农业生产方式想要达到产业化阶段,必须先要经历规模化、标准化、现代化三个阶段。刘石介绍,规模化是碎片整合阶段,在规模化基础上,才能对每项工作流程进行规范化处理,进入标准化阶段。只有在标准化的基础上才能充分运用现代化的机械设备、生产技术和管理手段等,才会进入现代化。随着现代化农业发展,农民批量生产出符合市场需求和交易标准的农作物、在此基础上才能真正进人产业化阶段。

对于“农业产业化”的概念,刘石认为产业化一定是同时符合市场导向、产业链贯通、数据和金融有效融入这三个要素的。产业化是根据市场导向优化组合各种生产要素,从而进行全产业链的精准布局,在这过程中,全产业链的数据链条自然被打通,从而衍生出金融市场。不过刘石也指出,中国目前农业生产水平还处在规模化的初级阶段,相比于发达国家农业生产水平还有远的路要走。目前中国在农业上的差距不是粮食产量,而是劳动生产率和产品质量的差距,这也是未来中国农业应发展的两个方向。刘石直言道。

针对这个理念,刘石也带领团队推进“土地托管”模式,即在不改变农民土地承包权、所有权、经营权的情况下,以“土地托管”为切人点、整合当地农机手,实现集约化生产和经营,同时通过标准化产品对接下游用粮企业,实现“订单农业”,从而打通产业链,实现从农资投入到粮食贸易闭环。

对农民而言,将土地交由专业机构打理可以保证收成,同时还可以抽出时间外出打工挣取更多收入;对农机手而言,依托于专业机构进行种植工作,不仅不用承担粮食收成的风险,而且规模化耕作让种植变得更加轻松,在这种托管模式支持下,农业种植也逐步实现规模化操作,不仅有助于打通农业全产业链,缩短流通环节、降低成本,而且可以在标准化种植中实现农产品品质溢价。此外,在金融和大数据支持下,托管模式可以实现订单农业的市场准入,促使农业具备产业化条件。

从数据碎片到模型联通

之所以提出托管模式的理念,也是基于发达国家经验,比如虽最具争议,但成长确实迅猛的美国孟山都公司。这家公司在农业全产业链上基本已全面完成数字化布局。基于农业大数据做出来的操作系统,在农户将相关数据输入后,就会自动给出种植规划,包括整个生产过程的管理建议。这套操作系统的基本逻辑是农业种植不是根据经验,而是根据对市场需求预测来决定今年生产计划。整个操作系统是“静态+动态”数据整合,动态数据可以告诉农户种植时其体操作方法和节奏,包含农机耕种管收四大环节,以及农业灌溉。更重要的是,这个系统不单是生产操作,还是一个商业化操作系统,会根据市场、渠道、仓储、物流等数据链条反馈的数据,决定农户的商业操作,这些商业操作就包括金融贷款,农业保险,农机设备的融资租赁,以及粮食的期货交易。这种由种植模型和商业模型相结合的操作系统,不是由某一项产品,或某一项技术做支撑,而是由金融资本做支撑。

相比于国外来说,中国基于庞大人口的企业数量,虽然在体量上占有绝对优势,但在数据价值挖掘方面,还处在碎片化阶段。此外,大部分数据仍只是进行横向统计,记录如数量、规模、面积等静态事实,却找不到彼此间的关联,因而没有充分开发出数据价值。刘石对此认为,真正有价值的数据一定要有纵向关联、实时更新、能够识别隐形信息,并且存在于大系统中。对于纵向关联,也要求从产业角度出发,国绕某个产业链条找到有因果关系的数据,这其中每个数据也都是一个变融因素,会影响到上下间其他数据变动,也只有这样的数据,才具有指导性意义和可操作性。

刘石解释,当碎片化的孤立数据经过简单叠加后,会产生算数级别的叠加价值,但这个时候,仍然是数据碎片。当碎片化数据经过模型整合后,数据之间组合会再阐释数据,不同组合形式产生出不同价值,数据价值会呈现几何级别增长,但这些数据模型依然只是一个个数据孤岛。只有将这些数据模型统一在一个大的生态体系中,孤立的数据模型进行彼此联通后,数据才会产生出指数级别的价值。

结构设计要符合商业逻辑

“当我们认识到数据是为了产业服务,那么构建真正有价值的数据就一定要紧跟商业逻辑,”刘石表示,“另一方面,数据一定是产业达到标准化以后的结果,没有标准,数据就是噪音。”

刘石也对此指出,中国目前在数据产业发展上遇到的最核心问题,就是我们整个产业逻辑不清晰,这导致我国在各行各业、政府各部门的数据碎片化、静态化和孤立化的现象非常严重。而致使产业逻辑混乱的原因在于我们一直以来所遵循的部门化的产业路径,由于各个业务部门各司其职,彼此孤立,各自产生的数据都成了信息孤岛,数据不会相互传递,也就无法为其他部门所用,缺乏产业逻辑的引导就导致数据无法进行有效整合。

(刘石为中国农业开出的AOS药方)

刘石最后总结道,“只有当我们知道产业需要什么、消费者需要什么、产业未来发展方向是什么,整个业务逻辑设计才能符合未来发展大方向。根据整个产业链逻辑去安排生产、安排商业化过程,这样产生数据之间的逻辑关系才是清晰的,才具有指导性价值。否则,单纯的数据之间没有任何关系、或者是孤立的、逻辑关系不明确甚至是错误的,这种数据就没有价值。”

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
刘石:什么是农业大数据?
如何理解和定义“数字农业”?丨石时农业评论
数字农业的概念、内容及发展趋势,一文了解数字农业
精彩解析|玩转数字时代农资营销的逻辑机制
刘石:什么是农业大数据?(农业大数据三讲·下)
数字农业农村建设存在的问题及建设措施
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服