数据安全:基于数据产权的治理策略

  在构建数据产权这一新事物时,我们应该在财产权的大地图中对数据产权做定位,然后寻找与数据产权具备“相邻可能”的元素,在该元素的基础上构建数据产权这一新型财产权的基本架构。

  在对数据产权做定位时,首先按照两个要素——个体要素和社会要素的强度不同,对数据产权做类型化的定位。按个体要素与社会要素主导地位的不同,将财产权分为四种类型,即强财产权I型、弱财产权I型、强财产权II型及弱财产权II型,如图1所示。

  强财产权I型的特征是个体要素在四种财产权类型中处于绝对地位,社会要素在这种财产权类型中影响不大,其代表性的权利是所有权。

  弱财产权I型同强财产权I型一样,都是个体要素占主导地位,但不同的是弱财产权I型中社会要素的程度高于强财产权I型,其典型代表是知识产权。

  强财产权Ⅱ型则与强财产权I型相反。在强财产权II型中,社会要素的强度最强,决定了该类型财产权的根本性质;而个体要素很弱,作用小。城市出租车经营权是强财产权II型的代表性权利。

  在弱财产权Ⅱ型中,社会要素的作用要远强于个体要素,其典型代表是养老金财产权。

  不同的财产权,其类型、功能和法理依据各不相同。强财产权I型和弱财产权I型强调个体价值的凸显,发挥个体的积极性,开发和利用物质资源,增加社会财富总量。强财产权Ⅱ型和弱财产权Ⅱ型侧重协调社会与个人之间的关系,保障社会整体效益,简单地说就是让人有体面的生存空间。具体到数据产权,其应该定位于弱财产权I型,究其理由便要谈及数据产权的构建目的与宗旨。数据产权的构建目的也应具备个体要素与社会要素两个方面,因此保护私有数据财产的个体要素以及促进数据财产生产和应用的社会要素。其中对私有数据财产的保护为其直接的保护目标,在这一点上数据产权与物权类似。谈及促进数据应用,提升社会整体文明程度是数据产权的另一目标。数据财产来源于公众,任何数据集都不可避免地包含了一定的公共数据,因此对数据财产的保护就与对所有权上“物”的保护不同,数据产权要求个体要素居于主导地位,并且要顾及社会要素。

  至此,我们找到了“相邻可能”理论中两个与数据产权相邻的元素,即所有权与知识产权。因此,数据产权的基本框架应以所有权与知识产权的相关制度为基本依托,以数据产权构建特点及原则为构建方向。尝试采用粗线条的手法勾勒出数据权的基本架构,此举有助于明确数据产权在整个数据权体系中的定位,以便后期以此为骨架补充数据产权的骨血,起到提纲挈领的作用。

  总体上,数据产权的个体要素能通过构建类似物权权能的数据产权权能来实现,而社会要素则可以参考知识产权的限制制度来调节公利与私利之间的矛盾。因此,数据权利体系应包括三个维度。第一个维度是指个人数据权,即个人数据中所代表的人格利益及财产利益受法律保护,主要包括个人数据人格权与个人数据产权。具体而言,个人数据人格权包括数据修改权、知情同意权及数据被遗忘权。第二个维度是指企业数据产权,即企业数据中应受法律保护的财产利益。其具体应包括数据采集权、数据使用权、数据占有权、数据收益权以及数据处分权。第三个维度是政府数据产权,是指政府对其占有的政务数据应受法律保护的权利,具体包括数据归属权、数据使用权及数据管理权。数据权利体系如图2所示。

  然而,任何权利体系的搭建都并非一蹴而就,数据权利体系也不例外,它经过从利益到法益再到权利的过程。当然,目前提及的数据产权的权能也不是数据产权的全部权能。随着大数据对社会生活的逐渐深入,人们对数据权利的主张也会增加,更多的数据权利将会被考虑纳入数据权利体系。

  随着信息化的逐步加深,我国正在经历新一轮的产业化转型,未来数据财产将在社会生活及经济生活中占据越来越重要的位置。因此,当前对数据财产进行有针对性的立法势在必行。但是,要在现有法律体系内嵌入数据产权这种新型财产权并不能一蹴而就。下面针对未来我国在数据产权的立法方向和立法体系上提几点建议。

  数据产权立法需要打破封闭的传统财产权体系,构建一个具有开放性、包容性、发展性的体系。原因在于数据作为数据产权的客体,其本身具有虚拟性、可复制性、不确定性,而承载数据的技术手段又随着技术的进步在发生翻天覆地的变化。我们眼前的一个典型案例就是美国的《信息自由法》,它在短短6年内经历了两次修改来适应实践的发展。因此,我国在数据产权保护的过程中既要通过法律明确规定数据产权的权利属性,又要避免将法网织得过细,使立法难以适应日新月异的实践发展。也就是说,数据产权应当是一个开放的、发展的动态体系。

  数据产权的立法既要遵循财产权利创设、流转、救济的本质属性,也要找到共性并遵循共性,做好相邻法律如《物权法》和《知识产权法》的衔接,避免发生严重的排异反映。因此,我们应站在整个财产权体系的高度掌握数据产权的构建思路,让其逻辑合理顺畅,同时还应保持数据产权自身的独特性,以此来区别于其他权利。

  需要注意的是,对数据产权的立法除了要将数据权利加入保护范围,还要明确数据产权的权利边界。换句话说,就是要明确数据产权的权利红线。权利主体只有在该红线内才能享有有效的财产权,其权利的行使才能不受侵犯。当然,数据产权权利边界的设置也是需要精心设计的。如果立法过于宽松,则可能导致国家保密数据泄露,危害国家安全,企业过度侵占公共数据资源,形成数据“死水”,不利于数据资源的有效流通,这与数据产权权利设置的初衷相违背。

  针对我国数据产权的立法,应当对数据财产进行从《民法总则》到民事单行法的层级保护。首先,需要在《民法总则》中进一步明确数据产权的民事权利的定位及属性。其次,我国亟需建立一部有关数据产权的民事单行法来规定数据财产的取得、行使、救济规则。最后,在梳理我国现行数据利益所涉及的众多法律法规如《民法总则》《网络安全法》《反不正当竞争法》的基础上,逐步构建起数据权利的法律体系。

  这里我们讨论的数据所有权并非《物权法》意义上的所有权,而是数据权属的代称。本质上,这个问题是在探讨数据权利的归属。要将这个问题解释清楚,我们需要弄清数据主体因为什么享有数据权利?其理论基础是什么?

  从用户角度看,作为数据信息的初始主体,基于个人数据的敏感性、隐私性以及数字经济对个人数据的依附价值,用户个人数据体现出人格利益和财产利益的双重价值。因此,我们可以考虑构造一个兼具人格权及财产权的权利束,以保护个人数据权利。在数据产业链的初始阶段,无论是从法理上的私法正义,还是从法经济学的功利角度来看,用户都应该享有数据权利。此时,这种数据权利很明显地被划分为两种类型。其一是近似于隐私权的数据人格权,它保护的是用户个人尊严不受侵犯的法益。其二是一种近似于所有权的财产权益,它反映的是用户对个人信息的绝对控制。原则上,财产权益可以比照所有权权能结构来设置,但因为个人数据是数字经济的起点,为了使个人数据能顺利地流向企业,进而产生更大的经济价值,短期内如何运用用户个人原生数据取得收益还值得探讨。

  用户个人数据权利的重点体现在个人对其数据的控制,故构建的重点应放在知情同意权的设置上。借鉴国外数据财产保护的经验,美国、欧盟均采用用户知情同意作为企业数据收集的起点,在立法中给予用户个人数据修改权、访问权、限制处理权、拒绝权、可携带权及被遗忘权等,以保障用户对其数据的控制。我国司法裁判中也明确承认了企业以用户知情授权为前提,同时立法上许多学者也建议在数据人格权下设置知情同意权、数据修改权、数据被遗忘权。这种做法使企业在数据清洗前对收集的个人数据的控制权依赖于用户,只有用户才能根据自己的意志对数据财产加以管控。此时,个人享有原生数据的所有权。

  早在启蒙运动时期,洛克就提出了劳动赋权理论。简单地说,洛克的劳动赋权理论是强调个体的劳动是财产权赋权最本质的原因。洛克认为,在社会的早期,万物初始,没有私有概念,而劳动这种行为是人特有的,是在人的意志支配下利用物的体现。简单地说,人通过有意识的劳动和创造,使外在的物成了有个性的“物”,这就是我们谈的私产,财产的概念由此诞生。

  大数据时代,劳动赋权理论也在不断地发展和修正,以适应时代的需求。首先,在假定条件上,可控资源的范围随着农业革命、工业革命以及信息革命不断扩充,人类关于财产的认识也逐渐从洛克时期的有形资源扩展到无形资源。而数据资源作为一种相对稀缺的社会资源,可以被人类控制并利用,满足财产取得的前提。其次,从物的视角看,大数据时代数据价值生成的过程是人类投入无差别劳动的过程,也有学者将其称为数据价值的添附过程。再者,修正的劳动赋权理论部分阐明了现代社会法人财产权的正当性,实际劳动者不一定获得财产权,也可能获得与劳动相符的工资。这与大数据时代要求的企业法人的信息财产权不谋而合。总之,劳动赋权理论为大数据时代的数据利益上升为法益提供了一个正当性的理由,即劳动。

  与洛克的观点不同,康德认为初始社会自然界的状态无从考证,是否存在原始的私权意识不得而知。他认为纵使有这种意识也是不可靠的,所以要强化私权。这需要强力机关即文明社会中权威的立法机关予以公开承认,如此才能使外在的物变成自己的。

  康德的财产权理论是建立在“占有”之上的。在他看来,占有分为两种,一种是经验中的占有,另一种是理性的占有。前者是人的主观感知,是对外在世界的表层认知。后者则是一种抽象的、虚拟的占有,其本质是强调人对物的占有的意识,即把某物当成自己的物进行占领控制,类似于民法上的“自主占有”的概念。

  打个比方,我手中握着一个手机,此时我手中握着手机就是经验中的占有,因为“握”这个动作表明我对手机的占有和控制。但是,如果我把手机放在桌上,此时手机与我脱离,别人也可以拿走它。这样我对手机的占有就是暂时的、不牢靠的,别人也无从得知手机是“我”的,而非“他”的。因此,这种占有无法被称为是财产的基础和依据。而康德假设了另一个理想情况,那便是即使手机脱离了我,但别人同样也知道手机属于“我”,这种占有就是理性占有。之所以会达到理性占有的效果,用康德的话说就是源于人们都受一种普遍法则的约束。简单地说,这种普遍法则就是法律。

  因此,在大数据时代,我们不难看出数据占有者表现出的对数据收集、存储、管理、处理、挖掘、分析、展现、评价及交易的意思表示。可以说,这种对数据的占有是一种先验的占有、理性的占有。这种占有的意思包含了自己对数据的利用、处分等,同时也暗含了对他人占有的禁止以及对他人的约束。而且,在区块链技术、数据清洗技术、用户知情同意协议的共同作用下,这种占有将不会必然侵犯人们现有的权益,如隐私权等。因此,从康德占有理论看,数据利益上升为值得法律保护的财产法益是正当、合理的。而且,《民法总则》的出台也实际上完成了从数据财产利益上升为数据财产法益的转变。

  将政府数据所有权单独提出是考虑到政府数据所负载信息的特殊性。政府数据往往涉及社会公共利益,其权属就不能简单地套用私法理论,侧重个体要素配置,而是应该将权利配置的重点放在社会要素这一属性上。数据的价值体现在其所承载信息的价值,只有使数据充分流动、共享、交换,才能形成我们期望的信息集聚效应和规模效应。政府数据的作用体现在两个方面,一方面是服务于政府行政管理,另一方面是开发其市场价值以促进数字经济。因此,应将政府数据权属规定为国家归属权,由政府享有数据的管理权,同时通过政府履行数据公开义务以满足公众对政府数据的需求,做到个体要素与社会要素的平衡。

  当前,我国政府数据所有权分为政府数据归属权与管理权。归属权与管理权分开表述,主要是考虑到两点。第一,政府是国家的行政机关,其在行使国家权力时收集的数据理论上应该归国家所有,属于全体公民;而政府作为政府数据的收集者、控制者,赋予其管理权最为便捷。第二,要考虑语言是否会产生歧义,如只谈管理权,那么就会有很多不明确的地方。打个比方,A管理一部手机,我们会产生许多疑问。例如,这手机是A的吗?A怎么管理手机,他能用这部手机吗?他能将这部手机卖给B吗?他能和C交换手机吗?对于这些问题,A自己可能也不知道如何回答。这就是“管理”一词带来的模糊性。

  不将政府数据所有权配置给个人的原因有三点。第一,政府收集数据的目的并不是盈利,而是公共管理,这就不存在利益交换等问题。例如,我们到公安局登记、更改身份信息,公安局收集这部分数据当然不是为了卖出个人信息来挣钱,而是利用这部分数据维护社会安全,让违法者在大数据法网下无处可逃。第二,政府数据以国家强制力作保障,可以有效地维护个人隐私不受侵犯。我们将原生数据的所有权赋予个人,主要考虑就是为了维护个人隐私权。但是,就政府数据收集而言,政府用国家强制力来保护其收集的隐私不被泄露,这就没必要将数据权利赋予个人来保护用户隐私。第三,个人数据所有权中涉及的知情同意权、删除权、被遗忘权等因涉及公共利益,也不应配置给个人。所以,将政府数据的原生权利配置给个人并无实际意义和价值。

  不将政府数据归属权配置给收集和产生它的政府部门的原因,主要在于防止数据垄断,以及防止政府部门独占数据、独享收益。对于政府数据而言,无论收集者是谁,其代表的不是某个部门,而是政府。政府是国家行政机关,因此,国家才是合理合法的政府数据所有者。政府部门在履行职责过程中获得的各类数据资源属于公共数据,国务院文件和一些地方政府规章已对此予以明确。另外,由于政府部门的性质不同、职能不同,其所收集数据的类型也就不同。如果将政府数据所有权下放至各个收集部门,则不可避免会因为数据的经济价值参差不齐而导致政府信息资源部门化、利益化。随着数字经济的不断深化,政府数据的经济价值也需要得到激活。到那时,政府部门之间的利益纠纷将愈演愈烈,不利于社会公共管理及社会福利的最大化。

  在明确数据归谁所有后,如何使用数据这个问题就接踵而来。众所周知,数字经济能否发展好,数据权利能否落实,都在于具体的数据使用。

  首先,应当先明确数据产权的客体是“数据”,而不是个人信息权中的“信息”。从现行法来看,立法者就将数据与信息做了严格的区分。例如,《网络安全法》《民法总则》中均对数据与个人信息分开表述,因为其所代表的含义有着本质的区别。信息在于抽象地反映事物的客观存在及其发展变化,而数据则是具象地用0和1的组合来体现。例如,听到“苹果”一词,我们所体会到的是圆的、红的、甜的水果,这就是信息;数据则是“苹”“果”。数据是计算机网络信息传播的承载方式,但这种承载方式并不唯一。在传播同一信息时,人们可以选用不同的设备及代码来实现同一信息的有效传递。所以,数据产权的设立并不意味着数据所有者对信息的绝对垄断,事实上他人也可以从其他途径或媒介中读取相同或类似的信息。

  其次,具体而言,数据财产要想受到法律保护,就需要具备可利用性,即数据财产可以被现阶段的人类所利用,如此才有数据财产权赋权的起点。至于数据的可利用性标准,这里借鉴了《网络安全法》第76条对客体的界定,重点体现在“通过网络……的电子数据”,该关键点是可以界定可利用性的客观标准。第一,作为数据产权客体的数据需要以互联网为载体,其生成、收集、传播、加工等都需要依托网络。实质上,“数据”是“网络数据”的上位概念,在实际生活中数据无处不在,如报纸上的文字、广告信息等。但是,这些数据只有传输上网络才能被大量采集和分析,常见的方法是通过扫描识别或上传电子版形成“网络数据”。第二,作为数据财产权客体的数据依托于网络,其技术前提是该数据需要具备机器可读性。由于大数据时代的价值体现在数据集合分析后形成的信息价值,海量数据的分析、加工和处理也就成了数据财产形成的必要环节。因此,数据能否被人们读取,成为是否形成控制的前提。换言之,一个数据如果无法通过电子方式提取分析,那么企业就不能利用和控制该数据,同样也谈不上对该数据形成权利。

  最后,数据产权的第二大标准是合法性标准,并非所有的数据都能受到数据产权保护。从本质来看,数据本身0、1的属性是无法做价值判断的。那么,此时所谈及的合法性判断则是基于数据所承载的信息,即数据信息中不应包含违反法律规定、危害国家和公共安全、涉及国家秘密、损害社会公德和其他主体合法权利的信息内容。对此有以下几类数据值得进一步探讨。第一类是个人信息数据,《网络安全法》第42条规定网络运营者可以收集用户信息,但向他人提供用户信息需经用户同意,经过处理无法识别特定个人且不能复原的除外。根据《民法总则》第111条可知,经过匿名化处理的数据是合法的数据产权客体。而未经处理的信息,其合法性则取决于被收集者的同意。未经被收集者同意授权的信息不具备合法性数据的要求,从而无法获得数据产权。第二类是非法数据,该数据违反宪法和法律,损害社会公共利益,危害国家安全,涉及国家秘密。

  数据知情同意权是个人数据权利保护的重点,其意义在于让每个人都能明确了解自己的资料被收集、利用的情况,让个人在每个过程中都能有表达自己意志的自由,并且赋予其法律手段对抗侵犯其自由的第三人。这是个人数据使用中对人格尊严的尊重。具体而言,数据知情权同意的范围应包含个人数据的收集方式、收集内容、存储及处理方式等,同时也应包括收集的目的、可能对个人产生的后果、明确的同意方式及同意效力的覆盖阶段。特别值得一提的是在同意方式上应当赋予个人可选择性,如勾选允许收集的数据类型等。

  个人数据修改权在逻辑上是个人在知情同意数据被收集后赋予个人体现其自由意志的手段,其权利内容主要体现在数据主体有权要求数据控制者无不当延误地修改其不准确、不正当的个人数据。修改权旨在保证个人数据的真实与完整,以确保个人的人格尊严及人格利益不受片面、不真实的信息所侵害。

  个人数据的被遗忘权是指用删除数据信息的手段捍卫其人格利益。具体指按照有关个人信息保护规则,网络用户有权要求搜索引擎服务提供商在搜索结果页面中删除自己名字及相关个人信息的权利。

  将数据产权的构建放入真实的数据产业链中,我们可以看到数据利益在不同阶段呈现出不同的利益倾向。在“数据清洗”前的法律视角里,权利主体有用户与数据收集企业,利益诉求集中于用户的数据人格利益与企业的数据财产利益;在“数据清洗”后的法律视角里,权利主体只有数据收集企业,而利益诉求也只局限于数据财产利益。

  从不同阶段数据产权的效力来看,数据产权的控制效力也因阶段不同而有所区别。其区别在于数据产权人以自己的意志直接对特定数据财产进行采集、占有、使用、收益和处分能力的强弱。“数据清洗”后的企业对其占有的数据具有完全的控制力,而“数据清洗”前的企业对其占有的数据具有不完全的控制力。具体表现在数据清洗前,数据收集行为受用户知情同意权的限制,对于采集过的数据也会受《网络安全法》第43条赋予个人对其数据的删除权与修改权的影响。所以,此时数据产权的控制效力不完整。而从数据产权的权能上看,数据交易中不同数据持有者所享有的数据权利的排他性也有所区别。具体体现在目前大数据规则显示数据收集者交易的数据集可以多次买卖,但数据交易的买方不得将购买的数据再次上架销售。因此,我们可以发现数据买卖实质上是一种许可使用的行为,数据收集者对数据产权具有完全的占有、使用、收益、处分的权能,而数据购买者则不具备处分权能。

  数据产权是一个内容十分庞杂的权利体系。根据不同的标准,可以将数据产权分成不同的类型。例如,按主体的多少划分,可以分为单一主体数据产权与共同主体数据产权;按主体类型划分,可以分为国家数据产权、企业数据产权、个人数据产权;按是否有期限划分,可以分为有期限数据产权、无期限数据产权;按数据产权的权利人享有的利益划分,可以分为完全数据产权和定限数据产权。此时出现了数据产权的二元权利体系。所谓二元权利体系,是指以完全数据产权和定限数据产权为基本结构构建的数据产权体系。在大陆法系民法领域中,物权法体系采取自物权和他物权两分的二元体系,知识产权体系采取完全知识产权与定限知识产权的二元体系。吴汉东教授在知识产权领域提出,“知识产权的本权是知识产权所有人的权利,得以全面支配知识产权;而他权的主要代表是传播者、使用者的权利。”因此,我们可以借鉴物权与知识产权的二元结构体系构建数据产权。

  所谓完全数据产权,调整的是数据财产归属关系。吴汉东教授称其为“本权”,是数据创造者权利。完全数据产权的取得可以分为原始取得与继受取得。原始取得的主要方式为数据价值的添附,即上文提及的数据的关系化过程。继受取得的主要方式是转让。完全数据产权具备数据产权的全部权能,即数据采集权、占有权、使用权、收益权及处分权。

  当然,企业使用数据同样应当有其合理限制,在企业取得数据产权的源头就应当遵循合法采集标准。所谓合法采集的作用类似于“调节阀”,它是调节数据经营者财产利益与信息主体(用户)人格利益的利器。通过对新浪微博诉脉脉抓取使用微博数据信息案判决的分析,并结合实践中数据收集者的不同情况,需要分以下三类进行讨论。

  第一类,平台企业自行收集:采集前需取得用户同意和授权。事实上,法院在支持企业数据财产利益的同时也强调保障信息主体的人格利益,并且确立了一定的实践标准。判决中要求数据经营者在收集用户个人信息时,应遵循合法原则、正当原则(主要体现在企业获得个人用户的明确同意)、必要原则(体现在企业收集用户信息不能永无止境,应遵守最少够用的标准)。而且,判决中指出,企业在实践中为消费者默认授权或预先内设同意的做法都有侵害信息主体利益的嫌疑。

  第二类,平台企业许可他人收集:用户授权+平台授权+用户授权的三重许可原则。首先,将数据财产权赋予合法的数据采集者的构建方式并不会影响其他合法主体的数据权利,即不排斥其他权利主体以合法的方式取得原始数据使用权。当然,对于特殊的数据,如涉及国家秘密、国家安全、公共利益的数据,还可以做出特别规定来限制获取。实践中,上海数据交易中心的《流通数据处理准则》正印证了上述观点。其次,之所以是三重授权的设计,就是为了再次保障用户的个人数据权利。换句话说,就是A用户同意B企业使用其数据,C企业与B企业协商意图获得A用户的原生数据,此时C企业需要获得B企业以及A用户的同时授权才能完成数据交易。当然,实践中的做法会更加便利,例如,在用户首次授权时可以明确授权收集者将其数据分享给他人等。

  第三类,否定未经许可的收集行为的合法性。关于未经许可的收集网络数据的行为,往往指网络爬虫行为。许多学者认为,Robots协议是技术界为了解决爬取方和被爬取方之间的争议,通过计算机程序完成关于爬取的意愿沟通而产生的一种机制,是网络数据的界碑。根据中国互联网协会《互联网搜索引擎服务自律公约》第7条的定义,机器人协议(Robots协议)是指互联网站所有者使用robots.txt文件,向网络机器人(Web robots)给出网站指令的协议。具体而言,Robots协议是网站所有者通过位于设置在网站根目录下的文本文件robots.txt,提示网络机器人哪些网页不应被抓取,哪些网页可以抓取。至于Robots协议是否构成网站运营者与爬虫控制者之间有约束力的合同,目前尚未看到有关于此的司法解释。在新浪微博诉脉脉案中,法院确立了即使爬虫控制者可以利用技术达到获取网站数据的效果,但是如果未经权利人许可也不能运用该技术获取用户数据,因而确立了数据权利的法定保护。

  政府数据的使用应当以使用目的为出发点。政府数据的使用目的有两点:一是提升政府公共服务管理能力;二是激发政府数据的经济价值,促进数字经济发展。对于前者,行政机关因履行职责需要,使用自己或其他行政机关获取的政府数据,实现电子政务,打造“互联网+政务”,提升行政管理水平的行为,我们称之为政府数据的共享。对于后者,行政机关面向社会公众、企业法人或其他组织提供政府数据的行为,我们称之为数据开放。简而言之,数据共享与数据开放是政府使用数据的两大方面。

  数据开放共享层面主要体现了数据使用权与数据管理权。谈到数据使用权,有两个核心问题需要解决:一是谁可以使用政府数据,即政府数据的使用主体是谁;二是哪些数据可以共享给其他部门使用,即政府数据的使用范围为何。原则上,政府数据共享的使用主体是政府部门,即每个政府部门都有权使用政府数据。而政府数据开放的使用主体是个人、企业或其他组织,但是能共享的政府数据却存在范围。应当按政府数据资源的性质进行分类,简单地可以分成三类:第一类是无条件共享数据,即可以提供给所有政府部门或社会公众使用的数据;第二类是有条件共享的数据,即可以提供给相关政府部门或社会公众使用,或仅能够部分提供给所有政府部门或社会公众使用的数据;第三类是不予共享的数据,即不宜提供给其他政府部门或社会公众使用的数据。

  根据政府数据使用权主体与客体数据范围的限制,在政府数据使用权行使方式上就存在自动获取、申请获取的选择。对于无条件共享的数据,各政府部门或社会公众可以依需要自动获取政府数据。针对有条件共享的数据,政府部门或社会公众应根据需要提出共享申请,说明请求共享的数据内容、共享用途,数据主管部门应根据共享条件进行审核,在规定的期限内做出审核通过或不通过的决定并说明理由。

  另外,政府数据的使用还应注意与个人隐私之间的协调。在政府数据开放的场景下,个人数据将不只在政府内部流转,而是向社会公众进行开放,以求数据资源的最大利用。所以,如何确保对政府数据的个人信息进行匿名化清理,是政府数据开放中的关键性问题。从结果来看,政府数据开放的客体应是衍生数据,即经过清洗、加工后的数据。

  与此同时,政府还需做好数据使用的相应制度支持。例如,各政府部门“摸清家底”,做好数据共享开放前的整理工作;保障数据分类的科学合理,能够最终靠“负面清单”等方式厘清数据内容,做好数据分类;建立省级综合性的政府数据开放共享平台,为政府数据的使用提供有力的保障;加强政府数据资源的安全管理,建立安全运营、安全管理与安全监管的三方工作机制;做好监督维护工作,可以委托第三方对政府数据资源管理进行考核,并纳入政府绩效考核指标;加强立法,让政府数据开放共享有章可循。

  谈及数据收益权,从参与数据产业链的主体来看,我们应该赋予三类主体数据收益权。第一类主体就是大数据经济的主要参与者——企业,第二类主体是大家经常忽略的原始数据拥有者——个人,第三类是掌握大量政府数据的政府。

  企业的数据收益权主要体现在经济利益的获得,其理论建立在数据所有权及数据使用权之上。从收益权的权能来讲,数据产权与传统法学意义上的所有权具备同样的功能,均是权利人对数据产权的收益,属于事实行为。从收益权能的实现来讲,数据产权人对数据产权的经济利益实现方法是自己实施或授权他人实施,享受收益的方式主要有设定用益数据产权和担保数据产权,进行普通许可、转让、出资、融资等。

  从经济学上看,数据交易的关键问题在于如何定价。目前,我国数据交易处于初级发展阶段。纵观各大交易平台,数据交易的定价主要有四种类型。

  第一种类型为市场定价,如自动计价。这种计价方式类似于炒股,证券交易所会根据每家公司的业绩、市场行情及供需关系等多种因素设计自动定价公式,通过买卖双方自动磋商形成交易价格。大数据的市场定价大体上也是这个思路,由数据交易所设计自动计价公式,根据数据的样本量和相关指标,如数据品种、时间跨度、数据深度、数据完整性、数据样本覆盖及数据实时性等,形成数据价格,最终采取以下成交方式。一是自动成交,即大数据买方应约价等于或高于大数据卖方挂牌价时,成交价为买方应约价;二是大数据卖方选择成交,指对于不能自动成交的应约,卖方可选择能接受的应约价与买方成交;三是数据分拆成交,指当大数据买方仅需要部分数据样本时,平台将对数据设定拆分原则,由系统自动报价,然后自动撮合双方成交。

  第二种类型是平台预设定价。这种定价方式是数据买卖双方委托大数据交易平台对数据卖方所拥有的数据进行定价。此时,大数据交易平台的专业人员会根据平台自有的数据质量评价指标,如数据量、数据种类、数据完整性、数据时间跨度、数据实时性、数据深度、数据覆盖度及数据稀缺性等,给出评价结果,然后将该结果反馈给数据卖方,同时也会向卖方提供同类同级数据集的历史成交价,给卖方一个可供参考的数据定价区间。在此基础上,数据卖方可以根据自身情况在区间范围内二次报价。

  第三种类型是协商定价。这种定价方式是指已经形成初步交易意向的买卖双方自行洽谈沟通,具体的方式最重要的包含大数据买方自由定价、协议定价。自由定价是使用范围最广的大数据交易定价方式,定价自由度高、不透明性强,第三人难以知道具体的交易价格及交易方式,因此同类数据可能形成的价格千差万别。协议定价往往是交易双方均不接受大数据平台进行定价,或者对大数据平台价格无法达成一致,此时大数据交易平台扮演撮合方、联络者的角色,而大数据买卖双方通过反复报价议价,最后达成统一定价。

  第四种类型是混合定价,如拍卖式定价。采取这种定价方式的主要原因有两点:第一点是对于某些特定数据,如商业秘密等,因其自身性质而不宜被大范围地公开复制;第二点是企业买卖双方均希望通过独占或排他性的占有以获得更大的经济利益,在此基础上的数据价格则不仅体现了数据价值,还体现了保密、独占等性质,兼具市场与协商两种因素,因此称之为混合型。

  除了企业享有对数据的权益,还有一类应该享有数据收益权的主体,就是拥有原始数据权的用户。这一类是目前被严重忽视的主体。在数字经济环境中,不应只是企业单方面享受数据带来的红利。用户作为数据的源头,不应在数据产业链上只谈贡献却毫无收获,反而还时时受到诸如“大数据杀熟”“千人千价”“个人隐私泄露”等数据滥用带来的侵害。我们认为,一个健康的大数据产业,应当让所有对产业做出贡献的主体都能够享受到相应的收益和数据带来的价值。

  那么,用户是否也能像企业一样分享数据红利呢?答案是肯定的。理论上,数字经济建立在用户的原生数据信息之上,用户作为数据的源头,天然应该具有处置其数据的决定权以及获取收益的权利。但是,由于单个用户数据的价值量太低,光靠货币来体现这种价值,实践上的可操作性不强,同时也不利于数字经济的高速发展。例如,众所周知消费者在淘宝上的浏览记录具有很高的经济价值,阿里巴巴可以通过这些浏览记录有明确的目的性地推送商品,增加用户购买的概率,还可以分析不同年龄层的人在不同季节的消费意向,进而更改用户购物主页,实现精准推送。那么,单看一个人一天在淘宝上的购物记录可以卖多少钱呢?我们也无法衡量,因为大数据时代单个信息的价值量太小,“大”数据才有价值。所以,如果让个人以卖单个数据来赚取经济利益显然不可行,并且还会大量增加企业收集数据的成本,包括资金成本、时间成本及人力物力成本等,显然不利于大数据经济下数据流动的需求。

  但是,这并不应被视为对用户数据收益权的剥夺,我们可以用其他方式作为支付手段,实现个人的数据收益,让个人分享数据红利。企业可以对那些明确同意企业收集其信息的用户提供一些除货币之外的免费增值服务,例如,免费使用其网站,免费使用或优惠使用部分功能、平台产品,获得免费使用券、折扣券,免费参加企业活动,等等。总之,企业应该发挥自身的智慧,设计多种方式让用户共享数字化的经济的红利。

  政府数据的使用渠道在于数据开放与数据共享。数据在政府行政机构内部流转,不应涉及数据的经济利益。如果将该渠道比照企业数据交易平台,则会出现政府部门收益不均、数据垄断、独占数据收益等现象,因而不利于政府部门之间的协作。另外,如果实行各部门购买数据,其本质还是政府用自己的钱付给自己,毫无意义可言。而针对当前的政府数据开放,也不应涉及经济利益。因为政府数据本应取之于民,用之于民。前述将政府数据的权属归于国家,实质上是归全民所有,为公共利益而存在。因此,数据开放也不应向社会公众收费。

  但是,在数字化的经济的深化过程中,政府也可以通过对数据的深度挖掘和处理向公众提供更进一步的数据分析服务。例如,在基础数据开放平台中设置相应的付费服务内容,如数据可视化分析、数据的深度加工。此时,这些服务内容可以向社会公众适当收费,这样不仅可以激发政府深度挖掘数据的积极性,同时还可以为社会公众提供数据分析服务,打造服务型政府。因此而取得的收益,可以用于数据库的维护升级,以及数据平台的日常维护等方面。

   Copyright © 2017-2022 www.hblrwl.com All rights reserved 网站地图