打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
学术| 温昱:大数据的法律属性及分类意义



大数据的法律属性及分类意义


作者:温昱,吉林大学法学院2016级博士研究生。

来源:《甘肃社会科学》2018年第6期。原刊责任编辑:杨文德,感谢编辑部供稿!



提 要:大数据法律属性及分类的界定是大数据法学研究的基础。大数据是资源、应用和方法的集合体,要充分理解大数据不同面相的法律属性需要对大数据有多层次的认识。波普尔“三个世界”理论提供了一种检视大数据的多元化整体视角。大数据具有“三位一体”的特点,既存在于物理世界(世界1)、意识经验世界(世界2),亦存在于客观知识世界(世界3)。大 数据具有客观性与自主性特征。大数据能够从人类世界的三个断面被解构并统合为世界1中的数据集合与世界3中的客观知识。以是否经过世界2加工为标准,大数据可归类为作为数据集合的个人数据与作为客观知识的派生数据。对于个人数据,基于其数据集合的客观实在性而产生的可识别性特征,应对其进行“人格一财产”双重性质的权利设置。个人数据人格性是其财产性的基础,对个人数据的法律保护需以对其人格性的保护为出发点。作为客观知识的派生数据,其为人的智慧活动结果,因其经过在世界2中的加工而带有主体相关性,对其法律保护的核心应当聚焦于不同主体世界2中独有的加工或发现。

关键词:大数据;个人数据;派生数据;数据集合;客观知识;三个世界”理论



一、问题的提出:大数据法学研究基础理论不足


大数据是指数据存储量超过具有收集、存储、管理和分析数据功能的传统数据库软件的数据集合。 一般认为,大数据具有4V特征:海量数据规模(Volume) ,快速的数据流转和动态数据体系(Velocity) , 多样数据类型(Variety )和巨大数据价值(Value )。 物联网、云计算技术的高速发展以及智能手机、智能可穿戴设备等无处不在的终端与传感器,从体量上不 断增长大数据的规模;不断发展并且功能越发强大的算法,从内涵上不断推进大数据技术的进步;各行各业均开始运用大数据进行分析与预测,从外延上不断扩大大数据的应用范围。大数据日益成为“人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法”。我 国巨大的人口基数以及经济规模,具有形成大数据产业的天然优势。根据相关调研测算,2016年我国大 数据核心产业的市场规模达到168亿元,2017—2018年维持40%左右的高速增长。2020年我国数据总量 预计达到8060EB,占全球数据总量的18%。

我国大数据及相关产业迅猛发展的态势催生了 对相关法律制度和顺应时代变革的具有创新性、前瞻性的法学理论的亟待需求。有学者指出“我国政府在全球率先开创了大数据交易的先河……而数据是什么?急需立法予以明确以确定数据权属和规范交易秩序。”特别是对“大数据是什么,即大数据的法律属性及分类”这个问题,我国目前还未形成统一的立法定论。《中华人民共和国民法总则(草案)》第 108条规定:“民事主体依法享有知识产权。知识产权是指权利人依法就下列客体所享有的权利:…… (八)数据信息;……”可知《草案》对“数据信息” 未加区分就笼统将之规定为知识产权的一种客体。 《中华人民共和国民法总则》第111条规定:自然人的个人信息受法律保护”第127条规定:“法律对数据和网络虚拟财产的保护有规定的,依照其规定”。 可见大数据法律属性问题复杂、理论分歧大,《民法总则》对此不得已做了开窗式授权规定,没有形成立法定论。

现实不会因为立法供给不足、理论不统一放缓发展脚步,大数据飞速发展同时孕育了巨大风险与不安全性。“徐玉玉案”就是大数据法律性质不清导致个人数据法律保护不力所引发的悲剧。大数据立法的前提是大数据法律属性及分类的明晰。在此基础上,方可论及数据权利类型、数据权利主体等学界热议的问题。目前国内法学界对大数据法律属性的研究,或只关注于大数据某一方面的特征,并未对大数据的法律性质有一个整体说明及分类;抑或是外部视角下对大数据的解构,未从大数据本体出发探讨大数据的法律性质问题。笔者认为,大数据不仅仅是巨大的数据集合,也是一种最新的科技手段,同时也表征一种全新的思维方式。认识大数据要把握“资源、技术、应用”三个层次……大数据是新资源、新工具和新应用的综合体。理解大数据的法律属性,需要一种多元论整体视角。

有鉴于此,本文引入波普尔的“三个世界”理论为研究模型,以三元论角度解析大数据的法律属性及其分类,以期获得些许有益启发。




二、大数据法律属性分析工具:波普尔“三个世 界”理论


(一)“三个世界”的划分与联系

“三个世界”理论认为,“对人而言,可以区分出 下列三个世界或宇宙:第一,物理客体或物理状态的 世界;第二,意识状态或精神状态的世界,或行为的动作意向的世界;第三,思想的客观内容的世界,尤其是科学思想、诗的思想和艺术作品”。波普尔指出 “我们可以称物理世界为‘世界1 '称我们的意识经验世界为‘世界2’,称书、图书馆、计算机存储器以及 诸如此类事物的逻辑内容为‘世界3 ’”。世界1以物理形式存在,是历史的、在先的;以客观知识形式存 在的世界3,则是逻辑的,是对世界1认识的上向演进成果。连接二者的则是以个人或群体的主观经验、心理状态为内涵的世界2。

“三个世界”理论突破了传统的心物对立二分 法,以三元论划分方法解构了人类生活的世界——在“心” “物”之外存在着一个独立的世界3,即客观知识 的世界——赋予世界3本体论地位,以强调客观知识与“心”“物”同等的重要性。波普尔在《客观知识》一书中阐释:“按照这种多元论哲学,世界至少包括三个在本体论上泾渭分明的次世界;或者如我所说,存在着三个世界。第一世界是物理世界或者物理状态的 世界;第二世界是心灵世界或心灵状态的世界;第三 世界是智性之物的世界,即客观意义上的观念的世 界——它是可能的思想客体的世界:自在的理论及其逻辑关系、自在的论证、自在的问题情境等的世界。”波普尔将我们生存的世界划分出三个相 互联系又彼此区别的子集,世界2在其中发挥着桥梁作用,“第一世界与第三世界之间以第二世界为中介”。三个世界之间因此形成了系统性有机循 环。以人的思维活动为例,人的思维活动本身发生于 世界2之中;但人的思维活动要以人脑为器官,其生物化学反应过程发生于世界1中的人脑内部;而思维 活动所得成果则属于世界3。所以人的思维活动是 三个世界合力作用结果。三个世界之间:世界1与世界2能相互作用,世界2与世界3能相互作用。“第二世界即主观经验或个人经验的世界跟其他两个世界中的任何一个发生相互作用。第一世界和第三世 界不能相互作用,除非通过第二世界即主观经验或个人经验世界的干预”。


(二)世界3的意义与特征

世界3概念提出客观知识世界独立于外部客观物理世界和内部主观精神世界而存在。“世界3是客观知识的世界,它是一种编码知识,人类将这种编码通过各种方式表达出来,世界3即是被表达出来的人 类精神内容的集合体,是独属于人类的世界。”世 界3是人类动物活动的自然产物、是突现进化的结果,同生物的进化十分类似。世界1中存在“量子阶梯”,从物质的最小单位夸克到原子、分子、生物大分子、细胞,一直到生态和社会。循自然界的“量子阶梯”继续向上就进入人类社会。世界1中物质间 上下向因果关系是世界3中知识之间上下流动的依据。下层的知识可以向上层流动,例如自然科学向人 文科学的渗透;下层知识是上层知识的基础,上层知识对下层知识进行选择和引导。“世界3中知识的松 散性是由世界1中涉及面的广泛、变化以及世界2主体研究视角的多方位所致。”

世界3的定位是人类活动的产物同时又是世界自我进化链条中最新的一环。世界3具有两个重要的属性:自主性与客观实在性。

自主性是世界3的核心。“世界3是人类的产 物,但它也像其他动物的产物一样,反过来又创造它自己的自主性领域。世界3自始就有一定程度的自主性:新的问题导致新的创造物或构造物……并且,每一个这样的步骤都将创造出新的预想不到的事实, 新的预想不到的问题。”世界3的自主性表现为客观知识自主进化的过程。客观知识不依赖于人是 否发现它,它总是客观地存在,并且自主地超越它的 创造者的初衷。客观知识无需借助人力即可实现自 我创生、自我组织、自我演化。例如自然数列是人类 的作品,但其也创造了自身自主的问题:奇数和偶数 之间的区分虽非人创,却为人类活动预期外不可避免的结果。“它们绝不是由我们创造的;宁可说它们是由我们发现的;而且在这个意义上,它们是被发现以 前就未被发现地存在着”。

世界3的另一个最显著特征是客观实在性。世 界3表现为抽象并且没有实体的客观知识,如文学、艺术、科学理论,经济交往中的商业模式等。但世界3并非虚构,而是“现实的”存在着。就像鸟笼即使没有鸟仍然是鸟笼,记载于书本或者电子存储介质的知识不会因为没有被读到就不存在。知识不会因为是否能够被读到、是否能够被真正掌握这样的或然性事件,就丧失其客观实在性。“要是一本书属于客观知识的第三世界,它就应该在原则上或者实际上能够 被某些人把握。”世界3中客观实在性标志着其中知识可以被掌握、被理解的可能性。




三、大数据多重面相的法律属性分析


波普尔“三个世界”理论,作为一种对于世界本体有较强解释力的哲学范式,为我们从整体的角度认识大数据的法律性质及其分类提供了非常理想的视域。


(一)大数据法律属性的厘定

以“三个世界”理论检视大数据本身,其脱胎于世界1中真实存在的人、事、物;不同认识主体接收到这些客观存在“信息”并以自己的意志和经验进行甄别、分类等信息化处理,则是发生在世界2中;作为最终产品成型的大数据,则是对物理世界的数据化表达成果,存在于世界3中。所以,大数据是在世界1中产生,在世界2中凝练,在世界3中形成的客观知识。可见,大数据存在于“三个世界”中,呈现出“三位一 体”的面相。就大数据最基本、最传统的定义——种超大规模的数据集合、一种重要性越发凸显的生产要素而言,其属于世界1。例如有学人量化了产生于2014年 1月1日到2015年12月15日之间的12435889份上 网裁判文书,统计出其数据量1.5TB,并认为就数量 级而言达到了进行大数据分析的一般规模。就“与其说大数据是一种海量的数据状态及其相应的数据处理技术,不如说它是一种思维方式”而言,它属于世界2。就大数据是一种全新的理论,是关乎研究范式、商业模式的客观知识而言,其又归属于世界 3。已故图灵奖得主吉姆·格雷将大数据从第三范式 (计算科学)中分离出来单独作为一种科研范式,称为“第四范式”。三个世界是一个闭合的循环系统, 彼此间相互联系、相互作用。世界1中个体的存在可以数据方式表征出来,世界3的大数据正是人类对数据化存在方式的知识成果。世界3的大数据是客观知识世界在本体论意义的扩充,是对物质世界的全新认识成果,体现了人类对整个世界认识能力的发展。对世界2来说,正如人通过世界2对世界3的型塑作用,世界3对人也有影响作用。这种双向建构的过程中,世界3里建构的本体论意义上的大数据,必然会有助于世界2内部形成大数据的思维方式。因而才会有学者慨叹:“人、机、物三元世界的高度融合引发了数据规模的爆炸式增长和数据模式的高度复杂化,世界已进入网络化的大数据(Big Data)时代。” 所以,对大数据法律属性的认识以及由此生发的 大数据法律保护相关理论,需持一种三分法的整体视角,而非仅管窥于大数据某个单一面相。三个世界的相互关系如下图所示:

 

图1

我国法学界传统的对大数据法律属性的表述仅 仅停留于该图的右半部分,局限于大数据世界1的面相。几无论及大数据的世界3面相,也未看到大数据 三重面相之间的关系以及作用机制。

“三个世界”理论、世界3理念在网络技术高速发 展的背景下获得了最恰当的现实注解。“自互联网开始普及以来,作为‘客观知识’的‘网络虚拟世界’,为波普尔的‘客观知识’世界理论提供了注脚。”大数据时代的到来,云计算、移动技术越发成熟,使得知识载体的虚拟性、动态性、即时性程度越来越高,网络世界也越发呈现出其归属于世界3的本来面貌。今天 的网络,作为一种技术设计出来的全球性的知识存储的容器与交互性的知识互动的平台,则以一种十分具象的方式敞亮了世界3的独立存在。大数据是世界3中客观知识发展进化的最新形式。因而,大数据亦体现着自主性与客观实在性。

大数据的自主性即虽是人造,但一经出现就在很大程度上是自主的。大数据本身蕴含着被人认识到的或者迄今没有人意识到的问题和推论。人们可以发现、但无法穷尽它们。这些问题和推论是随着大数据被人制造出后,大数据自主创造的、但在大数据产生时未曾被设想到的。最典型的例子是谷歌利用大数据技术找到了当季5000万条美国人最频繁检索的词条与美国疾控中心在203—2008年间季节性流感传播时期的数据之间的关联,并以此成功提前预测出了 2009年美国出现的新的流感病毒。大数据是 脱胎于世界1的人造物,其作为世界3的对象是物质化或具体化于世界1之中的,并作用于世界1。正如钱学森所言,(世界3)是人类实践累积的知识信息世界,这当然是当前人和他人实践的创造物。

依据波普尔的理论,大数据是世界1投射在世界 3中的一种全新的表现形式,亦具有客观实在特性。这种客观实在性最直观的体现就是新闻客户端以我们的阅读习惯而发送的特定新闻、购物网站基于我们的浏览记录而形成的“猜你喜欢”的购物推荐列表、 超市大数据显示啤酒和尿布摆放在一起时啤酒销量会大幅度提升。

因此,大数据“三位一体”的面相不仅表现为世界1中的数据集合,也是世界2中的数据化思维,也是世界3的客观知识。“三个世界”理论中,世界2主要起到的是连接世界1与世界3的中介作用,其强调了世界2的认识功能、而弱化了世界2在三个世界内 部循环中加工“最终产品”的作用。也就是说波普尔 将原来被我们误认为是“主观知识”而存放在世界2 中的一部分“客观知识”搬回了世界3中的合适位置。这么说并不等同于说世界2没有任何作用,恰恰相反,从世界1到世界3,再从世界3到世界1,世界2 是唯一的通路也是唯一的生产线,只不过通过世界2 加工的产品最终落在了世界3中。所以,我们在分析大数据的法律属性时,要注重大数据既是数据集合也是客观知识——在世界1与世界3中的不同面相及特点。


(二)作为数据集合的个人数据

个人数据表现为世界1中的数据集合。个人数据的利用可以直接产生经济效益,是一种重要性愈发凸显的生产资料。因而个人数据成为大数据行业的第一推动力。

1. 个人数据可识别性的客观实在性基础

Graham Greenleaf统计,截至2015年,全球共有 109个国家和地区制定了个人数据保护相关法律法规。各个国家、地区对个人数据的称谓不尽相同。欧盟称之为“个人数据(Personal Date )”是指任何指向一个已识别或可识别的自然人的信息。该可识别 的自然人能够被直接或者间接的识别。美国具有独特的个人数据保护模式,联邦政府层面的《个人身份信息保护指南》规定“个人信息(Personal Information)”包括任何可以识别个人或提供识别个人线索的信息。日本谓之“个人信息(Personal Information)”,规定个人信息是指能够识别特定个人的信息。 既包括姓名等公开确定的信息,也包括能够与其他信息相比照并能够通过比照确定特定个人的信息。我国香港特别行政区则用“个人资料(隐私)”,指任何可以直接或间接与一名在世人士(资料当事人)有关的资料、可确定该人士身份的资料以及能够被处理、查阅的切实可行的资料。各国各地区法律法 规对于个人数据称谓尽管有不同,但定义核心无一例外强调个人数据的可识别性,因而“个人数据”、“个人信息” 、“个人资料”无实质性区别,可做同一理解。

我国《网络安全法》界定个人信息为“以电子或 者其他方式记录的能够单独或者与其他信息结合识别自然人个人身份的各种信息”。工信部《电信和互联网用户个人信息保护规定》规定个人信息为“能够单独或者与其他信息结合识别用户的信息”。《个人信息保护法(专家意见稿)》亦做类似解释。可见我国大陆地区相关法律法规对个人数据的定义与其他国家、地区规定如出一辙,均强调可识别性,通过该数据能够直接或间接识别出特定自然人。

综上,个人数据最重要的特征为可识别性。可识别性是个人数据与某自然人之间存在的一种客观可能性——通过个人数据辨识出特定自然人的可能性。 个人数据是人社会活动或生理特征的记录,是有关个人真实存在的反映,不是凭主观智慧创造的。个人数据是世界1中自然人的行为、体征、社会关系被数据化处理后于世界3中形成的产品,是世界1中特定主体在世界3中的投影。大数据的客观实在性标志着被理解、被读取的可能性,其也是个人数据可被识别 的基础。个人数据具有大数据本身的客观实在性。所以,个人数据的可识别性本质上来说是根源于其客 观实在性的一种可能性。根据这种识别的可能性,可识别性分为直接识别的可能与间接识别的可能。为与相关条文用语保持一致,我们用直接的可识别性与间接的可识别性表示之。直接的可识别性是指通过某一单一个人数据就能直接确认出某人,例如身份证号码、DNA信息、一定情况下的姓名;间接的可识别性是指单个个人数据虽然不能辨认出某人,但同其他 数据结合就可以直接指向某个特定自然人,如地址、 性别、职业等。

需要重点说明的是,识别的可能性是直观的可能,即未被加工的可能。个人数据的可识别性根源于其客观实在性,之所以可以被识别是因为世界1中每一个自然人都是独特的个体,都具有不同特性。世界1中存在的不同特性是先验的、在先的,而不是世界2 中人为创造、主观加工出来的。个人数据仅仅是通过世界2转化为数据形式的个人的客观、真实的特征,是以一种电子化编码形式存在的对特定个人的数据 化表现形式。个人数据是对特定自然人忠实、真实记录。所以,通过数据关联、深度挖掘等需要投入较多时间、经济、技术成本的方法而指向某特定自然人的 数据并不是个人数据,经过世界2加工、处理而非仅仅经转化的数据本身附着有世界2的加工痕迹,并不能直观地表现出个人数据被识别的可能性。《欧盟数 据保护指令》对个人数据的界定,一是强调了数据可识别的可能性(Likelihood),二是强调了数据可识别的合理性(Reasonableness),一个需要付出不成比例的费用,或者需要克服很多困难才能识别的数据不能称其为个人数据。个人数据只有忠实于被记录的个人、准确反映出其存在于世界1的客观特征,才有价值。这也是对间接识别的个人数据范围进行严格限制的根本原因。

2. 个人数据的内在张力

个人数据本质为一种数据集合,根源于世界1 的客观实在性,其不仅可以识别出特定的自然人,甚至基于技术手段可以数据化的还原特定自然人。美国学者称其为“数字化人格(computer persona) ”理论:“数字行为在一段时间内积累到一定程度,就能够构成与实际人格相似的数字人格即以在交易中体现出来的数据为基础的个人的公共形象,被用来作 为该个人的代号。”技术进步以及移动智能设备普及,使得每个人的客观存在都可以在瞬间以数据的形式被记录、收集、整理与储存。这些个人数据组合而成的就是特定自然人的数据化人格拼图。个人数据的可识别性及由此形成的数据化人格拼图,使 得日常生活中个人的行为偏好或社会关系、生理特 征都可以被数据化处理以及商业化利用。并且随着数据挖掘技术的进步,数据之间关联性越来越强,大数据分析技术水平的提高进一步使个人数据的商业价值得到了充分放大,使其具备了财产属性。个人数据越来越成为热门商品,成为商家追逐的对象。这样一来,个人数据保护中蕴含的人格利益与信息自由流通和应用中蕴含的巨大经济利益之间就形成了巨大的张力。这种矛盾和利益冲突在大数据时代 被进一步激化。

譬如2018年初轰动全国的“支付宝年度账单”事件中,被网友热议的《芝麻服务协议》默认勾选同意的内容有:采集您的信息包括但不限于您的个人信息、行为信息、交易信息、资产信息、设备信息等。您已经认识到您(作为个人用户)的收入、存款、有价证券、商业保险、不动产的信息和纳税数额信息对于您而言是相当私密而重要的”。上述个人信息、行为信息、资产信息、信用信息等,均是世界1中个人产生的数据集合,均为个人数据。所以这些信息具有极强的识别性,通过上述各类信息,可以单独直接或者组合而间接锁定某特定自然人。因而这些数据具备人格性特征。对这些数据的控制和掌握,极大程度上等同于对个人的全面了解,无论体征、财产状况、行为习惯乃至性癖,都以数据形式暴露在数据控制者面前。 然而,由于个人数据中蕴含的巨大商业价值,正如此次事件中有网友评论,“芝麻信用用小字默认勾选并无法回头查看的方式,可能是想得到更多人的授权”,越多的个人数据,意味着掌握越大的商业价值和可变现机会。

3. 个人数据法律保护的逻辑理路

以“三个世界”理论省视个人数据保护中人格利益与经济利益的矛盾,有张力也有统一,矛盾非不可调和。个人数据兼具人格性与财产性的双重价值面向,一方面人格性在伦理学意义是对人本身价值的肯定,即人具有其尊严,人不能作为其他人达到目的的 手段。进而每个人都有权要求其他任何人尊重他的人格,不侵害他的私人领域。另一方面,如果一 种法律关系、一种权利能够以金钱价值来出让或者转变为金钱时,也属于财产。但是人格性与财产性并非个人数据的两种平行的法律特征,二者是递进关系,即人格性是财产性的基础。为方便说明其中逻辑关系,见下图。

 

图2

个人数据本质是来自世界1的数据集合,具有客 观实在性。“三个世界”理论视角下,客观实在性是一种可以被人理解、被人把握的可能。个人数据的识别性正是基于此种可能。世界2的中介作用只是使个人数据如实地再现了世界1中的独特个性,并未有任何对数据的加工、整理(图中虚线部分)。可以指向特定自然人的识别性使得个人数据具备了可以完成数据化人格拼图的可能性,因而个人数据具备人格属性。人格权商品化趋向使得个人数据的人格属性发展出了经济价值,孕育出了个人数据的财产性。所以按照内在逻辑顺序,个人数据的财产性是以人格性为基础形成的。因此,笔者认为对个人数据的法律保护,无论是将其纳入传统法律框架内作为人格权的特殊形式,或是为之确立一种新型的双重面向权利,都应以个人数据的人格价值面向为立基点。


(三)作为客观知识的派生数据

1.派生数据的主体相关性大数据除了在世界1中以数据集合面相存在之外,还有世界3中的客观知识面相。二者区分标准就在于是否经过世界2中的加工。“三个世界”理 论中,波普尔特别强调世界2的作用,“认为在人类 的水平上,可称为世界2的那些东西,越来越变成世 界1和世界3的中间环节:我们在世界1中的一切 活动都受到我们的世界2对世界3的了解程度的影响。这就说明,为什么如果不理解世界3就不可能 理解人类心灵和人类本身”。作为客观知识 的大数据,即派生数据,是在世界1中出现,在世界 2中加工,在世界3中形成。世界2中的工作过程,简言之就是把接收到的来自世界1的物质信息按照 特定主体的特定目标加工为特定的结构化数据。这些对于特定认识主体来说简约有序的结构化数据就以客观知识的面相产生并存放在世界3之中。如下图所示。

 

世界2的加工是大数据生成的必经过程,也是现作为客观知识的大数据的必由之路。世界2包括 个人智慧、主观经验、科学文化水平、意识状态等属于个人独有的内涵。所以不同的世界2必然对应着不同的世界3,经由不同世界2加工产生的数据也各有不同。“我们每个人都在为世界3的成长做贡献…… 我们大家都想掌握这个世界,我们没有一个人能脱离它而存在。”要掌握世界3必经由世界2。个人的世界2沉浸于他人的世界2之中,彼此间必然发生直接或由世界1、的相互影响,并由此形成为人类所有的世界2……既有个人的世界2,也有人类的世界 2。主体不同,世界2不同,导致世界3亦有区别。 所以不同主体创造或发现的大数据也千差万别。电 脑作为大脑的延伸,极大地扩展了世界2加工作用的广度、深度。技术手段使得不同主体之间世界2的差 别愈发巨大。世界2辅以先进的技术工具可以更大限度的发现、开发大数据,更深度的挖掘大数据中的 “金矿”,以及更好的控制和利用大数据。试想一般 个人与谷歌、阿里巴巴等数据巨头相比,二者不仅拥有的数据规模天壤之别,数据深度挖掘和数据间关联开发的能力也是泥云之判,所以一般个人的世界2与公司形式的人类集合体所拥有的世界2相比差异巨大。

一千个读者心里有一千个哈姆雷特,大数据带有很强的主体相关性,表现为对同一客观存在,因主体不同会导致不同世界2的加工结果往往南橘北枳。同一世界1,由于世界2的不同也可以发掘出不同组合形式的各种数据。大数据的主体相关性更直白讲来是世界2的相关性,这会导致世界1与世界2对应 关系分离,即大数据在世界1中的原生主体与大数据在世界2中的加工主体有很大可能并非同一。最典型的例子莫过于消费者登录购物网站所进行的浏览、对比、购买行为必然会留下数据痕迹,购物网站通过数据痕迹分析,得出消费者的购物喜好、时间偏好、购物习惯等,进而对每个消费者进行特定的相应商品推送等服务。消费者作为其消费相关大数据的原生主体,其仅仅是在客观上留下了种种消费事宜的数据信息,而购物网站则对这些消费者的数据痕迹进行了加工、整合、分析,从而得到了其网站消费者诸种情况的派生数据。

2.派生数据法律保护的核心

在我国“被遗忘权第一案”中,针对任某某提出将在百度搜索界面中输入其姓名得到的六个关键词予以屏蔽并要求百度对其名誉权的损害给予相应赔偿,一、二审法院均认为,搜索引擎的“相关搜索”功能,是为用户当前搜索的检索词提供特定相关性的检索词推荐,这些相关检索词是根据过去其他用户的搜索习惯和与当前检索词之间的关联度计算而产生的,是随着网民输入检索词的内容和频率变化而实时自动更新变化的,并非百度刻意为之。一审法院依法驳回原告全部诉讼请求,二审维持原判。任某提出的六个关键词,是广大网民的搜索记录与当前检索词之间关联经百度的世界2加工、计算得出的最终产品,其是在记录广大网民搜索习惯的原始数据上经由百度拥有的世界2加工形成的派生数据,本质是数据集合上向形成的客观知识。因而这六个关键词具有作 为客观知识的派生数据所具有的客观实在性与自主性,所以其只是如实地记录了广大网民的相关搜索状 况以及客观反映出关键词与网民搜索习惯之间的关 联程度。百度只是发现了二者之间的关联而非人为的创造了这些关键词。

经世界2加工而成的大数据,有学者称其为“衍生数据”并释义为原生数据被记录、存储后,经过算法加工、计算、聚合而成的数据。亦有学者将之称为“数据资产”,是指通过被初始数据的集合、利用、加工、交易形成的各类数据资产。说法不同,但无一例外强调了大数据被加工、整理的过程。加工、整理的工厂就是世界2。“衍生数据”或“数据资产”是在世界1中产生,在世界2中加工或发现,最终在世界3 中成型的客观知识。大数据与人类智慧活动息息相关,甚至可以说其是人类智慧活动的产物。因此,对作为客观知识的大数据的法律保护,根本上来说是对世界2中加工作用的保护,进一步讲是对人的智慧劳动成果的捍卫。因而这种保护便具有了知识产权保护色彩。

知识产权保护对象为蕴含人的创造力并具有一定价值的信息。有学者据此认为大数据的外在形式电子数据就是信息的表达或同型结构,是知识产权客体的形式。大数据的本质为信息,而信息是知识产权的客体。笔者对此并不赞同。知识产权所保护的是因为发明创作者对某些有价值的信息进行了科学的遴选、有序的组合,并首创性地提出了新的构思及其表达,即产生了结构性智力成果。简言之,知识产权的客体是创新性信息组合方案与结构,而非信息本身。若对作为客观知识的派生数据以知识产权保护,其保护对象应是不同主体世界2中独特的智慧劳动。

有学者认为派生数据建立在整理、加工基础上, 从性质上接近物权,但是其以一定的价值添附创造为基础,又与工业产权有相似性。亦有学者提出了所有权进入到认识层面的观点。诸种观点,在明晰了大数据的客观知识本质后有待于进一步的研究。



四、结语


大数据时代的突然而至,引发了整个人类世界的全方位变革,其所带来的影响甚至被人称为正在进行的一次新的启蒙运动。大数据产业冉冉升起,大数据经济占比越来越高,这些都使得各行各业对于大数据的研究俨然成为一门显学,法学无法免俗也不能免俗。大数据技术已经在愈发广泛的领域具备了极强的实用性,产生了颠覆性的影响,所以法律就应当严肃对待之。在喧嚣背景下,学者更应当注重对有关大数据法律问题的基础理论研究。工欲善其事必先利其器。波普尔“三个世界”理论在大数据的时代背景下重新焕发了其理论与实践光彩。借助“三个世界”理论框架,我们可以全面、立体地理解大数据三位一 体的面相以及不同的法律属性。数据集合意义上的个人数据与客观知识意义上的派生数据从产生、法律属性以及相应法律保护的立场均不相同。在理解大 数据不同面相以及各自的法律属性之后,才能决定实 践中对其采取怎样的法律保护手段、规制方式。这也是波普尔理论中三个世界之间相互作用、相互影响的循环在大数据中的体现。“三个世界”理论视角下认识看待大数据,其世界3的面相也启示我们重视大数 据科学技术发展对法律领域的影响,同时尊重科技是 第一生产力的铁律。世界2作为知识加工厂的中介作用,也启发我们在大数据的研究及运用中应当坚持“以人为本”,重视人的作用。



本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
什么是波普尔的"三个世界"的理论
十方世界也没有任何实在性,都是如幻如化
建议尽早启动个人信息保护法立法
政治知识:哲学里的易错知识点对比
科学不是真理
6月1号起,这19条法律知识,颠覆你的认知,没几个人全知道
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服