大数据权属的类型化分析 ——大数据产业的逻辑起点

2016-07-05 22:58:54作者:陈筱贞

陈筱贞

(浙江广播电视大学,浙江  杭州  310030)

 
     [摘 要]资本市场对大数据产业的追逐升温迅速,在中央鼓励发展大数据产业的态度中,地方政府积极布局大数据园区和交易所。同时业内人士不断提出警示,大数据权属未有规范,在权属未定的前提下,对大数据进行分析、挖掘、交易,会使其生态系统进入侵权、失控,甚至犯罪的黑洞。随着产业生态系统的辐射和发展,这个源头性的危险会不断地被放大。文章试图剥离政策、国家利益、产业利益等诱发但非决定性因素,从法律角度,考察大数据的权属,厘清大数据应属于谁的应然。
 
    [关键词]数据红利;信息数据;法律属性;类型化
 
  作为大数据产业的逻辑起点,大数据权属一直在学界、商界及政府相关部门的探讨中,直至2015年4月贵阳大数据交易平台第一笔交易完成,接踵而来的上千笔交易陆续达成,大数据权属归属这个问题仍是未决问题。承载着交易价值的大数据被赋予了产权,而产权归谁还未知,带着逻辑起点问题还模糊不清的产权运作,会有什么样的后果?用一句通俗的话来说,会是“也许他们很晚才发现,他们侵了很多权、浪费了很多钱”。
  数据采集开发方和买受方都紧锣密鼓地吸取着权属未定的大数据红利,红利建立在大数据产权法律未醒之时,而这种“未醒”,不是未觉察,而是在民事立法体系的上位法框架未定、政策产业推进导向激进及国外立法各取所需的纷繁状况中还未厘清思路,还未达成共识并定格下来。
    2015年世界互联网大会上吴晓灵强调,“明晰产权是建立数据流通规则和秩序的前提条件。”大数据时代,数据的确权成为产业关注的核心问题。2016年1月15日《贵州省大数据发展应用促进条例(草案)》正式出炉,这是中国首部大数据地方法规,但对大数据权属仍未能明确。为突破大数据交易和商业化的瓶颈,使数据红利交易成本早日清晰化,也从而促使交易规则更严谨制衡,笔者立足于法律视角,兼顾当下国情及大数据产业发展趋势,对大数据权属力图作一梳理。
 
一、与无关因素的剥离
 
  (一)无关于产业政策、市场、交易
  尽管数据权属的讨论,因数据产业、数据交易而起,并日益成为不可绕开的核心问题,但对数据权属的确认,应无关于市场和交易。对数据权属归属的分析和认定,既不应受政府公共数据平台开发、数据开放共享政策的影响,也不应受互联网大型企业的社会影响力和市场占有力的利益遮蔽,从而失去其应有的内在机理。
  (二)无关于大数据收集、处理、运用等规则设计
  大数据权属是产业天然内生的,只是需要我们拨开复杂现象去找到它,而不是为了现有和未来一定时期的大数据收集、运用、交易而去定位大数据属于谁,也不能因为其中的利益博弈驱使我们去创设一个数据权属的特别安排。尽管数据抓取、收集、交易是数据价值实现的重要和生动环节,但都是数据权属起点问题的后续逻辑。
  (三)无关于数据的巨量与脱敏
  产业意义上的数据,本质上是信息,是关于社会特定主体的有价值的信息。当然这种特定,在海量大数据中显得不特定,同时这种价值在不同的开发商眼里,会有不同呈现,但作为有价值的产业数据,一定是针对有某类特征的群体,或是年龄上,或是性别上,或是职业上,或是履历、兴趣爱好或活动区域、行为习惯及模式等,在信息产生时其本身就天生附有特定主体的标签,与人格权相连。数据量再大,也无法否认信息最初采集环节是数据产业的第一环,无法否认最初被记录人的人格特性。通常说的数据清洗(Data cleansing)不能实现数据与人格的分离功能,数据清洗的任务是过滤那些不符合要求的数据,它是数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。那么,数据脱敏呢?对某些敏感信息通过脱敏规则进行数据的变形,这样就可以在开发、测试和其他非生产环境以及外包环境中安全地使用脱敏后的真实数据集。但是,在大数据的处理和分析阶段,企业一直致力于身份识别,匿名化技术与大数据身份识别技术在相互较量中不断发展。例如,美国在线曾公布了3个月间65.7万用户的2000万条搜索记录,整个数据库做过精心的匿名化处理,将用户名称和地址等个人信息代之以数字符号。但《纽约时报》还是在几天内通过几个关键词准确定位到了某个人。美国白宫大数据研究报告《大数据:抓住机遇、坚守价值》中也提出,“数据的模糊化处理作为保护个人隐私的一种手段,其作用也是有限的。事实上,收集数据并进行模糊化处理是基于相关公司不回复数据的承诺与相对应安保措施之上的解决方案。但有目的的模糊化处理可能使数据丧失其实用性并确保其出处及相应责任的能力,此外,也很难预测再识别技术将如何演变以应对看似匿名的数据。”笔者认为,大数据企业目前规避风险的底线,是“不触碰和销售底层数据”,但后期结果的风险规避不应对前期的侵权行为风险产生豁免效应。
  (四)与国家主权、公共安全无关
    大数据发展上升到国家战略资源高度,直至成为国家商贸、能源、环境、国防等领域的直接竞争力,我们对大数据主权的呼声日益强烈。但这是一个信息主权问题,而非国内法视野中的数据信息权。信息主权指一个国家对其政权管辖地域范围内任何信息的制造、传播和交易活动以及相关的组织和制度拥有的最高权力,是国家主权的一方面表现。大数据权属于国家主权的关联性主要体现在,个人、企业和相关组织拥有数据权利的前提下,当牵涉到国家利益、国家安全时,国家是否拥有保护和处理这些数据的权力?至于公共安全,也如同此理。当数据信息权涉及公共安全或秩序时,数据权利人的权利是否有必要让位于公共安全与公共利益,这是大数据权属行使中的延伸问题。我们不能以国际交易、国防安全中的国家利益保护意图移换所讨论的大数据权益归属焦点。至多属于压力下的倒逼机制而已,不能影响大数据权属原本应有的判认。个人数据权属的法律认定,应在权源上私法先行,在公共安全、公共利益等公法情境下考虑许可(主动或被动)使用,却不先前相关所有权。
更多>>图片库