行业动态

Industry Dynamic
News 行业新闻

大数据陷阱:谁有权享有大数据,谁有权分析大数据……

日期: 2017-10-13
浏览次数:

大数据陷阱:谁有权享有大数据,谁有权分析大数据……


大数据陷阱:谁有权享有大数据,谁有权分析大数据……


既要保持数据的自由流动性,又要维护每个主体在数据上的权益,这是个空前的法律难题。而创制和维护这样的数据利用秩序却是大数据应用的前提,是大数据战略得以实施的根本保证

中国信息通信研究院在第十六届中国互联网大会上发布的《中国数字经济发展白皮书(2017)》指出,2016年中国数字经济总量达到22.6万亿元,同比名义增长接近19%,占GDP的比重超过30%,同比提升2.8个百分点。数字经济已成为近年来带动经济增长的重要动力。

人类已经进入到了一个无商不利用数据,无领域(包括政府)不利用数据的时代。无论你利用数据赚钱也好,还是希望改善公共服务和社会治理也好,大家共同面临一个法律上难题:谁有权享有数据?享有什么内容和程度的数据权利?如何保护数据?数据的权益属性?类似的问题,还没有得到很好的智库研究,也未能提供很好的有效政策建议。本文提出五个智库观点,供决策依据考虑。



经过处理的大数据才有价值

大数据是来源于网络和各种传感器对特定对象的记录,它是关于人、组织和物(机器和自然界)在特定时间、地点的行为、过程、事件的事实数据。作为技术,大数据是抓取和分析世界和人们生活的一种数据技术,它使人类具有全过程、全方位记录各种事件和行为的能力,具有透析过去和预测未来的能力。

在大数据时代,任何数据均具有潜在的价值。在过去人们重复利用的数据资源主要是人类观察、思考、创作完成的成果,比如文章、文件、论文、著作等,而如今人类可以利用各种机器运行轨迹、人类活动记录、自然界变化观测等信息,过去需要大量观察访谈、调查统计、测量等完成的,现在可以借助计算机系统、各种数据采集器完成,并通过大数据分析工具实现全样本、自动化处理和分析。在过去,没有人在意我们自己的行为轨迹,也无法记录大量的事件和过程,可以说作为“垃圾”自觉或不自觉地扔掉了,而现在的数据技术使我们具有变废为宝的能力,因而大数据技术可以说是一种在浩瀚的数据海洋中发现“宝贝”的技术。

正因此,数据正在成为人类可拥有和控制的资源。我们已经进入到数据生存时代,大数据正在提供新的研究范式,重新认识宇宙、物质、生命和社会,并在此基础上带来科技技术、管理决策、社会发展的巨大变革。如今我们提到的智能制造、人工智能、机器学习、分享经济、个人性化定制或服务等技术和商业模式的创新无不建立在数据资源基础上。著名大数据公司Gartner认为,大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。可以毫不夸张地说,未来经济和社会发展是建立在大数据技术普遍应用基础上,数据不仅成为经济创新转型发展的引擎,而且是所有企业市场竞争的重要资源。因而,数据利用秩序成为未来社会的第一秩序。


传统的财产权不适合大数据

如果说所有权(排他支配权)是构筑物质资源利用秩序的法律工具的话,那么它是否可以移植到数据世界,建构数据的利用秩序呢?答案是否定的。这是因为数据的非物质性,很难实现排他使用。其一,数据使用的非排他性,一个占有使用并不妨害他人占有使用;其二,数据使用具有非消耗性,数据的使用不消耗本体,反而丰富数据,使数据具有新含义或增值。因而数据天然地不适合于所有权体系,通过数据上设置排他支配权不适用于大数据时代。

在《民法总则》制定过程中,数据信息曾被纳入知识产权的客体,试图设立类似知识产权的专有权,但最终出台的《民法总则》并没有将数据信息列为知识产权的客体。这是因为,大数据背景下的数据更多的是事实记录,其数据的收集(采集)和聚合本身并不能实质性改变数据的价值。数据具有价值或者能够实现价值需要一系列的筛选、分类、处理、合并,形成主体数据、专题数据,使数据变成可用的数据产品,通过数据产品交易或服务,实现数据的价值。那么,数据产品化或商品化的过程,是否可以被赋予类似于知识产权的专有权呢?

知识产权是保护创造性劳动成果的一种制度,而创新劳动成果多表现为思想、技术方法、标识等,而这些离不开信息或数据。不过,知识产权并没有建立对创新成果(思想或信息)本身的支配权,而是将思想或信息置于公共领域,仅赋予权利人一定期间的商业化使用创新成果的专有权。也就是说,在知识产权体系下,仍然坚持信息(思想)公开和自由原则,数据及其所承载的科学文化成果被认为是社会活动的公共要素,置于公共领域。

显然,在大数据时代,我们仍然应当坚持将数据产品或信息视为公共资源的原则,而不允许信息私权化或成为私权客体。因为这样会妨碍科学文化进步,妨碍社会正常交往和运行。数据赋权仍然应当坚持数据的公共资源属性,不应当赋予数据持有者对数据的所有权,我们也不应当突破知识产权制度理念和框架,赋予数据持有人对数据本身的某种支配权。

因此,无论以有形物为基础财产权,还是以无形物为基础财产权体系,均难以解决数据时代的数据利用秩序问题。


数据该如何赋权

数据从原生数据到有价值的数据产品需要投入,这不仅仅是劳动投入,而且还有资本投入,而只有当这些投入得到足够的回报时,才有人从事数据的收集、处理和加工,将数据转化为产品或服务。解决数据产品制作者激励是数据赋权要解决的核心问题。

根据前面的论述,即使是数据产品,也要保持社会公众对该产品的可接触或可学习的公共属性,仅仅赋予数据产品制作者以商业化使用数据产品的权利。数据产品的制作者权利应当包括自己使用和许可他人使用的权利,或者利用数据提供服务的权利,同时有权制止他人商业目的的使用该数据产品的权利。这种基于对于数据分析加工劳动而取得的数据使用,属于一种新类型财产权,不妨可以称为数据使用权。它区别于传统的物权之处,在于它不是对数据的支配权,而区别于传统知识产权之处在于,它并不要求独创性或创新性。这样,可以给数据产品制作者实现其收集和加工数据的激励,促进数据产品的生产和流通,满足社会对数据产品的需要。这里赋权的正当性在于保护数据上存在合法利益,使数据产品持有人可以收回劳动投入甚至获取利润,但并不能绝对地排除他人使用相同的数据。当然,如何确保数据产品制作者商业化使用权,又使数据保持一定的开放性,使公众可获取性,需要精细的法律制度设计。


数据主体利益的保护原则

在大数据环境下,一切数据皆有源。当数据来源于个人或者是对个人的描述时,就落入个人数据(又称个人信息)范畴。个人数据包含隐私信息(个人的私密信息),隐私保护成为个人数据保护的重要组成部分。在这方面,国际社会关于个人数据使用的总体原则是合法、正当和必要原则,以不侵犯个人尊严或自由等基本权益,尤其是隐私利益为基本限制,只有法律规定的敏感信息需要征得个人的同意,而一般的个人信息则并不需要个人同意。我国现行规则为,除遵循合法、正当和必要原则外,还必须征得个人的同意,似乎给了个人对个人信息的控制权。这与个人信息的多样化或多种法律属性(许多个人信息是可以公开的并为企业组织使用的)事实不吻合。其实,仅仅识别特定个人并不足以给个人以对该信息享有支配权,个人信息仍然是社会交往的工具。但是,个人信息的收集和使用必须尊重个人权利,必须确保个人知情和在必要时的干预(更正、删除等)。

除了来源于个人外,企业数据还需要获得其他企业和社会组织的数据。除非这些数据是置公开的可供他人自由获取的状态(成为公共数据),那么取得这些组织的数据也需要获得数据实际控制人的同意,而不能够随意抓取、窃取或采取其他非法手段获得。数据产品制作者权益的保护是建立在合法取得数据的基础上。这种合法取得实际上也意味着法律对数据来源者利益的保护。在此方面除了保护个人信息外,还有企业信息的保护问题。

大数据应用最关键的是取得尽可能大而全的数据,而为取得他人的数据就必须合法合规,其中最为重要的是尊重和保护个人信息权益。由此,数据利用秩序归根结底是要建立数据来源方(原材料提供者)到收集加工制作方(制作者)再到数据方(消费者)有关于数据权利和义务配置秩序,在保护各方权益的前提下,保持数据开放性和流通性,使数据得到社会化的利用,实现数据的价值。


数据利用秩序关系大数据战略

在过去,数据被作为公共资源,甚至许多数据被作为垃圾随意地丢弃了,没有讨论数据产权问题。但是,随着数据价值的重新发现,随着人们对数据掌控能力的提高,数据逐渐地成为可控制的对象了。在数据可控制的情形下,要让人们掌握的数据拿出来分享和利用就必须要有激励,就必须创制数据社会化利用的秩序。《国家信息化发展战略纲要》明确提出要“探索建立信息资产权益保护制度”。由于数据本身仍然需要保持一定公共性,赋予任何主体对数据和数据产品的绝对支配权,都背离人类社会发展的基本理念,因而数据赋权,仍然应当坚持信息自由原则。

数据总是处于不断地脱离原来主体而流动,而正因为这样的流动,才使数据产生价值,但脱离主体也意味着原主体丧失对数据的控制。既要保持数据的自由流动性,又要维护每个主体在数据上的权益,这是个空前的法律难题。而创制和维护这样的数据利用秩序却是大数据应用的前提,是大数据战略得以实施的根本保证。


相关新闻 / 推荐新闻 More
2017 - 12 - 08
为什么大家都不戳破深度学习的本质?!日期:2017年12月7日来源:36氪作者:Pope人类正在慢慢接近世界的本质——物质只是承载信息模式的载体。人脑之外的器官都只是保障这一使命的给养舰队。自从去年 AlphaGo 完虐李世乭,深度学习火了。但似乎没人说得清它的原理,只是把它当作一个黑箱来使。有人说,深度学习就是一个非线性分类器?有人说,深度学习是对人脑的模拟……但我觉得都没有捅透那层窗户纸。当读完 Jeff Hawkins 的《论智能》,「就是它了!」。而我惊奇地发现,原书竟是 2004 年出版的!我怕自己读了本假书,或是某个美国民科的著作,特意到豆瓣、知乎上查了下,发现几乎每个看过这本书的人都对其理论啧啧称赞。但奇怪的是,似乎没人肯替它站台,这套理论的影响止步于此,好像大家都在刻意掩饰自己看过这本秘笈。它明明已经完整解释了人脑智能的运作机制了啊!注意是 Real Intelligenc...
2017 - 12 - 08
《大数据、人工智能、区块链的行业落地——2017中国保险科技报告》日期:2017年12月来源:亿欧网中国保险业已经经历了六十多年的发展历程,2016年保费收入已经飙升至全球第二,中国也已经成为了保险大国。保险公司为了优化保险的选择、投保、赔偿等步骤,将包括大数据、人工智能、区块链在内的前沿技术运用于这一行业。大数据、人工智能、区块链三大核心科技,开始向保险业的方方面面辐射,广泛运用于产品创新、保险营销和保险公司内部管理等方面。同时,随着资本的不断涌入,一众保险行业内的公司正在以自己的方式重塑保险行业生态。亿欧智库根据当前大数据、人工智能、区块链三项技术在保险行业的落地情况撰写了这份《大数据、人工智能、区块链的行业落地——2017中国保险科技报告》,希望通过本次研究来探究保险行业的发展过往、业态特点,以及前沿科技中大数据、人工智能、区块链三项技术在保险行业的具体落地情况,并且对行业未来的发展...
2017 - 12 - 08
深度学习也解决不掉语音识别问题自从深度学习被引入语音识别后,误字率迅速下降。不过,虽然你可能读到过一些相关文章,但其实语言识别仍然还没有达到人类水准。语音识别已经有了很多失败的模式。而要将ASR(自动语音识别)从仅在大部分时间适用于一部分人发展到在任何时候适用于任何人,唯一的方法就是承认这些失败并采取措施解决它们。在交换台通话(Switchboard conversational)语音识别标准测试中误字率方面的进展。这个数据集采集于 2000 年,它由四十个电话通话组成,这些通话分别属于随机的两个以英语为母语的人。仅仅基于交换台通话的结果就声称已经达到人类水准的语音识别,就如同在某个天气晴朗、没有车流的小镇成功测试自动驾驶就声称已经达到人类驾驶水准一样。近期语音识别领域的发展确实非常震撼。但是,关于那些声称达到人类水准的说法就太宽泛了。下面是一些还有待提升的领域。口音和噪声语音识别中最明显...
2017 - 12 - 08
金融大数据「支招」,如何躲避现金贷「老赖日期: 2017年12月6日来源:36大数据作者:王柏匀日期: 2017年12月6日来源:36大数据作者:王柏匀不少现金贷后台的贷款逾期数据持续所上升,监管风暴引发的“老赖”现象不在少数。那么,金融大数据有效控制“老赖”行为呢?现金贷监管风暴终于“打板”。12月1日,互联网金融风险专项整治、P2P网贷风险专项整治工作领导小组办公室正式下发《关于规范整顿“现金贷”业务的通知》,明确统筹监管,开展对网络小额贷款清理整顿工作。这无疑为现金贷公司的焦躁又添了“一把心火”。此前,就有不少现金贷后台的贷款逾期数据持续所上升,监管风暴引发的“老赖”现象不在少数。据华夏时报网报道,正常在20%至30%左右的逾期率,目前最高可达60%。这迫使个别平台考虑暂停现金贷业务的新增贷款。这时候能否通过金融大数据有效控制“老赖”行为呢?宜信首席战略官陈欢认为,从“信息化”到“数...
关闭窗口】【打印