中国问题·大数据专题‖商业模式视角下的“信息/数据”产权

上海大学学报 2018-06-26 17:47:32

商业模式视角下的“信息/数据”产权

胡凌

(上海财经大学 法学院, 上海 200433)

收稿日期: 2017-06-10

基金项目: 国家社会科学基金项目(17BFX027) 

作者简介: 胡凌(1982-),男,辽宁沈阳人。上海财经大学法学院副教授、副院长。

摘要:  互联网的兴起带来了信息的爆炸式增长,一种被称为“新经济”的信息产业模式也随之发展。目前互联网的各个层面都围绕着信息的生产、聚合、搜集、加工、储存、处理、消费而展开。普通网民和信息消费者可以从网上获取大量免费的信息服务,而这些信息在前互联网时代往往需要付费才能得到。信息权属问题的产生以及适应新经济模式过程的实质是,传统的著作权和人格权都阻碍了海量信息自由流动,有必要重新对信息权属进行解释,使之不再是一种对抗性的权利,而是需要被内化为内生性的、便利信息使用的权利。

关键词: 新经济;产权;商业模式;公共资源池

中图分类号: DF52

文献标志码: A

文章编号: 1007-6522(2017)06-0001-14

一、引言

互联网的兴起带来了信息的爆炸式增长,一种被称为“新经济”的信息产业模式也随之得到发展。目前,互联网的各个层面都围绕着信息的生产、聚合、搜集、加工、储存、处理、消费而展开。普通网民和信息消费者可以从网上获取大量免费的信息服务,而这些信息在前互联网时代往往需要付费才能得到。这给用户造成了如下印象:互联网上信息服务基本上是免费的,这些信息形成了公共资源池(commons),人人都可以自由地获取。在这一过程中,用户行为也产生了大量和个人相关的信息/数据,但相关部门在保护这些信息的举措上似乎力不从心。个人信息泄露的事件屡屡发生,业界、学术界就此讨论不休,国家对个人信息的保护也越发重视。

在现实中,用户在信息安全方面的担心主要包括两方面:首先,互联网企业通过合同条款合法地获得个人信息的使用权,进而追踪和监视用户,这一授权本身的公平性、使用过程的透明性和对传统私人领域的入侵(“隐私”)值得关注;其次,未经许可或通过非法方式获得和使用个人信息(例如黑市买卖、黑客攻击导致信息泄露)可能对用户人身和财产安全造成威胁。两个问题相比,大众对前者的敏感程度要远远弱于后者,因为前者没有什么明显的损失(甚至还有服务改善的收益),而后者带来现实风险的概率更大。相应地,法律对前者的约束也并不明确,而对后者则有着较为完整的保护框架和要求。

从商业的角度看,信息/数据作为新经济的生产资料具有重要的价值,需要得到法律上的承认和保护。在数据尚未成为有价值资产的时候,学术界就展开了关于通过确立一种信息财产权来约束和管理网络信息的讨论,即承认信息的物权或准物权属性,并按照物权或知识产权的模式事先获得授权而使用,不得随意侵犯。[1]这种立场既可以应用至著作权人对数字作品、用户对个人数据主张权利的情形,也可以扩展至信息物品(虚拟物品),例如用户保存在网站服务器中的私人文档,或网络游戏中的道具与装备。换句话说,界定信息和信息物品的产权十分关键。

互联网企业欢迎这种声音,这使它们可以摆脱信息/数据中人格权与财产权之间纠缠不清的状态,避免运营风险。但对它们而言,个人信息权属的初始界定并不重要,重要的是个人信息/数据聚合汇总后的集体数据资源库的权属。无论法律是否承认,现有的信息财产权在事实上存在,即企业而非个人的信息财产,尽管在企业的资产负债表中还不包括这一块内容(难以定价,导致了平台企业往往通过收购获取数据而非交易)。[2]免费的商业模式客观上要求互联网内容和服务产业尽量获取大量免费信息,以吸引用户,增加流量并获得外部投资。这些信息既包括从各种渠道获取的合法信息,也包括非法使用的信息;既包括免费提供给用户的消费信息,也包括用户的个人数据信息。互联网企业并不要求用户让渡这些信息的所有权,而仅仅要求获得使用权。无论信息/数据的最终权属在哪里,新经济只关心能否最大限度地对其加以利用。因此,它需要法律机制对利用过程和未来基于数据的创新加以保护:一方面通过用户服务协议确保对各种信息/数据的永久免费使用权;另一方面则通过避风港规则规避使用未授权信息和侵犯隐私的风险,并阻止竞争者未经授权对其数据进行抓取和使用的不正当竞争行为。本文将探究信息产业的特性如何在形式法治上要求用户授权,但在实质上已经远远摆脱了形式上的束缚。如果超越一揽子授权的形式而约束企业的实质行动(例如每一次数据调取使用都需要单独授权、明示同意),会对数字经济产生破坏性的影响。

以往的研究多在规范意义上探讨信息权属的规则,[3]本文试图在历史背景下观察信息权属问题如何产生,如何被要求适应新经济模式的需要。这一过程的实质是,传统的著作权和人格权都阻碍了海量信息自由流动,有必要重新对信息权属进行解释,使之不再是一种对抗性的权利,而是需要被内化为内生性的、便利信息使用的权利。这就意味着承认如下事实:“信息/数据保护”的话语和行动本身是嵌套在行业发展和需求中的,不能孤立地看待:首先,信息/数据从零散到聚合是新经济商业模式的直接后果;其次,信息/数据的使用离不开互联网服务的技术架构,这使得数据的价值和企业产生了非常紧密的联系;最后,伴随着越来越多的商业创新,信息/数据源源不断地被再生产出来,我们无法脱离信息资本主义的生产过程来谈论真空中的信息保护。[4]作为一个历史范畴,这是一个将旧有产业渠道中的个人信息/数据重新打散、组合,成为互联网行业得以控制利用的新兴资源的过程,是互联网“非法兴起”的重要一环。[5]

由于个人信息/数据在内涵上难以精确界定,①只有大量信息汇总成数据池(data pool),即所谓的“大数据”,才能作为一个商业上有价值(但难以精确估值)的单位和集合进行挖掘和交易。单条或少量信息,除非内容重要,成为法律保护的某种作品、国家秘密、商业秘密或人格权,否则衡量和交易起来成本很高。通过用户协议获取的数据池使用权的出现,导致了私人控制的信息/数据池的出现,从而要求在法律与经济理论上承认从以个人为基础到以集体数据池为基础的信息产权的转变。法律上认定这类数据池的权属并不困难,重要的是理解数据池权属如何符合数据技术(DT)时代价值产生的需求,以及新经济将海量用户变成其免费劳力的逻辑和过程。

①法律上只能靠列举重要的个人信息,或者能够识别公民个人身份和涉及公民个人隐私的电子信息。

鉴于“信息”和“数据”在概念上的边界模糊,本文将交叉使用这两个词,并在不同场合按照使用惯例加以区分,主要考虑是:第一,我国现有的相关法律法规使用的术语基本上是“个人信息”,但数据正日益成为价值的来源,隐私保护研究也日益转向个人信息/数据保护。[6]第二,广义的信息范围涵盖了数据,既包括在线内容,也包括隐藏在后的元数据,有必要统一在新经济模式下进行理解。没有公开的信息(免费使用),就没有后者(作为在线行为副产品的元数据),两者的差别仅在于不同主体访问权限的不同,并取决于互联网企业的需要。②第三,对两个概念都加以使用,不仅是语词的简单转换,更具有深刻的社会历史意义,它反映了新旧经济模式对信息的不同理解,进而反映了立法者对两种不同形态事物的想象。互联网产生之前的信息隶属于某一个特定架构和范畴(如金融信息、医疗信息),由于搜集技术的有限性使得人们对信息的概念容易达成共识,但现在任何带有传感器的物品都可以搜集信息/数据,远远超出了既有的法律范畴。第四,根据以往的文献,信息权属至少在三层相互关联的意义上被讨论和使用:(1)用户生产的内容(UGC);(2)用户使用数据(元数据);(3)虚拟财产和架构。这三者的关系是:互联网企业通过UGC吸引更多的用户,积累元数据,同时在特定服务的架构中生产虚拟财产,最终塑造虚拟现实场景。前两者积累得越多,用户对架构和平台的依赖性越强。企业在使用过程中展露在外的信息和后台数据被统一调用分析实验,这也支持了本文将两者一并讨论的意图。

②例如,网络评分既是一种数据,也是展示在外的信息。

本文的结构如下:第二节通过描述免费的商业模式如何逐渐成为主导模式,论证这样的模式不关心信息所有权的确切归属。从商业和技术的角度看,新经济只关注如何使用这些信息,即所有权与使用权分离。第三节着重分析两项经常被忽视的法律机制——用户协议和避风港条款——如何在事实上保障了新经济的这一要求。为了符合传统上“选择加入”的形式法治要求,互联网公司不得不在用户使用协议中保留授权,以示尊重消费者的选择权和知情权,但所有权保留在用户手中对互联网企业并没有实质约束力。第四节结合传统约束信息流动的传统规范来分析大数据时代信息/数据无法遵循惯例进行保护(如著作权、隐私、数据库等),否则会损害企业的利益。第五节进一步讨论由此而来的公共数据池的使用规范,在比较由政府和私人控制的两类不同的公共数据池基础上,进一步证明新经济的法律策略不仅确保互联网可以自我维持、演进,还悄悄地重新塑造了用户和互联网的关系,这一关系深深嵌套在互联网信息生产模式之中。

二、“信息/数据”所有权与商业模式的关系

(一)以个人为基础的信息产权理论

信息所有权作为一个问题被提出,最早起源于资本主义商业对传统人格权的入侵。[7]在互联网时代,个人和组织的信息/数据被大量生产出来。互联网企业通过用户在网络上的各种行为加以分析,精确地预测其偏好,不断追踪和识别用户身份,以期推送更为精确的商品和服务信息。更重要的是,个人的人身性已经扩展到诸多和个人相关的稳定不变的面向,如身份证、家庭住址、手机号码、设备的MAC地址、生物信息等等。通过分析这些信息,仍然可以追踪和识别用户。人们普遍担心的是,通过信息追踪和还原,自己真实的身份被识别,甚至泄露,从而产生不想受打扰的内在隐私保护需求,哪怕进行自动追踪的是冷冰冰的机器而不是人类。故而匿名化和去身份化就成为呼声较高的保护措施之一。

用户在网络上留下的信息越来越多,信息本身也逐渐分化为两大类:用户创造的信息和关于用户的数据,后者往往被称为元数据。这一区分涵盖了传统的著作权和人身权,也涵盖了公开发布的劳动成果(作品或信息性的劳动成果)和非公开的信息(隐私、秘密等)。在新经济看来,两者的差别事实上不大,都可以被用来分析用户的行为,在财产意义上都可以被看成无差别的人类劳动。用户关心的身份泄露的问题,本质上属于技术和安全领域,对于此问题,用户和互联网公司达成的默契是:只要信息安全能够得以保证,不发生泄露事件,那么合理的追踪就可以容忍,因为个人信息/数据被想当然地看成免费互联网服务的对价。正是基于这一广泛共识,互联网企业才需要在法律上摆脱用户信息中的人身利益要素,只保留财产利益要素。这一需求在学术界得到了积极的回应。主流的学术观点主张网络信息应当被赋予某种程度的财产权,只有得到事先许可/知情同意才可以有限度地使用。[8]这一模式十分接近于“选择加入”(opt-in)模式,并按照某种财产规则进行交易和治理。例如,如果需要使用某位作者的作品,网站需要事先和该作者或集体著作权管理组织签订使用协议,未经许可即侵犯了其财产权利。这种思路更多地是工业社会对财产的一种拟制,是工业经济的产物。这一理论的深层次基础可以追溯到洛克以降的财产劳动理论,即认为作为一种劳动的信息生产赋予了劳动者天然的财产权利。[9]

这一视角也被扩展至用户隐私和个人数据的使用,以及某些虚拟物品是否可以交易和继承的争论。[10]在信息财产权的拥护者看来,明确地界定产权对维护消费者的合法权益十分重要。也有研究者提出,互联网的模式是“基础设施+增值”,用户对基础设施的使用是免费的,但有必要将其产生的增值收入与设施运营商进行利益分成。[11]这一思路将使用权从所有权中分离,但仅仅关注互联网生产工具的权属,并未将其分析延伸到作为新经济生产资料的信息上面。如果我们按照这一思路扩展就会发现,新经济同样要求分离信息的占有与使用。

以个人为基础的绝对信息产权理论符合传统著作权和人身权授权使用的规则和常识,新经济的解决方案是:通过用户点击同意授权,取得信息/数据的永久使用权,而用户仍然留有他们的所有权。这看上去十分合理,但目前的实践仍然不是以用户为中心的财产机制:首先,即使承认用户的信息所有权,其数据事实上保存在互联网企业的服务器上,自己并不能完全占有和支配。①其次,数据的使用依赖于特定服务的结构化的技术架构,用户并不能轻易转移自己的数据,例如虚拟物品和使用记录。这就意味着,一旦用户需要在不同企业拥有的服务间使用自己相同数据的时候,就必须做重复劳动(例如重复注册信息,将同一篇文章转发到不同平台)。一个服务上产生的数据很难直接用于另一个服务,除非是服务模式类似的结构化数据。最后,对数据的使用过程很难向用户清楚展示,并解释分析后的可能后果。另外,当数据的搜集、分析、存储、使用和流动相分离,成为不同主体参加的产业链的时候,也很难向用户说明数据如何流动。如果按照绝对信息产权理论,用户既可以授权使用,也可以自由地将自己的数据转到同类服务,这就需要打通不同企业的界限和平台接口,在同一标准下互联互通,这恰好是互联网企业抵制的,它们不希望用户离开自己的王国,更反对有人开发某种工具提供帮助。

①例如,对大部分互联网公司而言,用户都无法删除账户。即使删除,也不知道自己的信息是否真的被彻底删除。 

为解决这一问题,可以有几种思路:首先,继续在理论上支持用户所有权的观念,同时将焦点从所有权转向控制权,即允许用户一定程度上控制其在线信息和数据的生产和流通。②隐私理论也经历了从传统的空间隐私转为信息隐私的过程,强调用户在不同的关系中控制和自身有关的信息的能力。[12]其次,说服用户承认即使他们占有信息/数据,其使用也和某种特定服务结合在一起;离开了特定服务,某些信息就不会被生产出来,也就丧失了价值,使其不能稳定地为该企业生产。复次,网络服务商之间进行优化合作,允许使用不同的账号登录同一系统,或者一键搬家功能,这样企业之间就得以共享特定用户的使用记录;甚至直接开发功能齐全的各类服务,用户也没有必要转向其他服务。最后,继续采取一揽子授权协议,让用户几乎无法反驳格式合同。

②有些服务允许用户调整默认架构以保护自己的隐私,如禁用cookies,向不同的人开放不同的分享权限等。

控制信息流动的个人权利事实上也得不到保证。现代信息产业已经成为一个异常复杂的体系,用户无法得知自己的基础信息从何处泄露,在数据处理的如下每一个环节中都无法行使形式上的选择权和知情权:(1)搜集(很多类别的信息无法确切知悉);(2)储存(存在云端服务器的安全性,跨境流通);(3)分析(黑箱算法计算的后果可能对自己不利);(4)交易(即使是去除了用户个人身份,也还有财产权利);(5)合法/非法交易(无法追踪);(6)控制流动(彻底删除、数字遗产、被遗忘权得不到保证)。

上述争议说明以用户(个人)为基础的信息产权理论在实践中遇到了挑战。其根源在于用户不可能为每次使用和创新授权或接受告知,这不符合信息快速流动整合的需求,对用户而言也十分不便。同时,相对于大数据才能产生的价值,对少量信息/数据的确权成本过于高昂。因而,采用一揽子整体性授权协议,允许互联网企业使用海量信息/数据汇总而来的数据池等,在增进整体社会福利上是有效率的。为理解互联网企业这一需求,有必要通过新经济商业模式进一步说明。

(二)新经济的演进

在互联网产业成熟之前,互联网仅仅被看成是传统媒体、内容产业的互补品,在商业模式明朗之前,传统媒体并未意识到互联网的潜力,不仅积极要求打击盗版,还试图就网络内容进行收费。但是互联网产业的两方面实践逐渐催生出免费的商业模式:首先在几个主要基础服务领域,由于少数公司的推动,新经济开始广泛采用免费模式。例如,腾讯确立了即时通讯软件免费的规则,在安全领域由奇虎360推动,在网络游戏领域由盛大推动,在电子邮件领域由雅虎领衔,随着云计算的普及,还出现了免费的网盘。随后一些网络文学和视频服务等内容网站也纷纷探索免费模式,尽管早期的免费内容均来自盗版。

免费的信息和服务之所以成为可能,是因为互联网企业可以从其他市场获得交叉补贴,其收入主要来自互联网广告和增值收入。如果这种模式可以稳定地持续,互联网企业就必须获取稳定地提供或使用免费信息的能力。那些能力不佳的企业往往因丧失了新一轮外部投资而倒闭。但就整体而言,网上免费的信息可以通过购买版权内容或鼓励大众发布信息而获得,其生产的内容反过来又进一步成为吸引新用户的宝贵资产。

互联网平台的出现要求互联网向一切领域进军。在对传统行业进行“创造性毁灭”之后将它们重新纳入进来,其逻辑是更大范围内的交叉补贴,可以获得更多流量,吸引更多用户,同时交叉使用各类数据,扩大了广告发布的范围。[13]这都意味着,传统的单一行业的数据使用规则会逐渐被颠覆,用户数据将统一到更大的信息平台和生态系统中流转使用。

传统的作品和个人信息(隐私)都要求事先授权才能使用。这一规则的潜在预设是,用户有能力监控其信息的使用和流动。问题在于,互联网企业需要不断对用户生产的信息/数据进行动态使用,信息也只有在不断复制和流动中才能获得增值。在物理世界中,受传播成本和流通渠道的限制,著作权和人格权侵权基本上能够得到较好保护;但在虚拟世界中,“信息网络传播权”就变得十分关键,这一法律概念恰当地反映出信息时代重要的利益和资源。互联网不仅希望创设一个信息和服务自由流动的生态环境,还试图控制来自这些信息和服务的元数据,以便预测和匹配。拥有并控制元数据,就意味着可以在平台上调动更为广泛的生产资料(信息、资金、实物、人力),这是生产方式的全新变革。

另外,互联网形态的动态演进也不断地塑造着人们对网络信息法律属性的认知。[14]在互联网早期,人们容易将运行在台式机终端上的软件当成一种财产,因为这些软件是以光盘为载体购买而来,并安装在终端上。人们会将此类软件看成物品和私有财产,行使实际控制力。随着互联网的发展,软件可以直接从网上下载,并保持在线更新。这意味着软件开始成为一种源源不断的服务。在云计算时代,用户的一切文档和软件都可以储存在云端,终端只不过是一个使用设备,并不储存和处理大量信息。人们进一步丧失了对这些原来被视为财产的信息内容的控制。[15]更重要的是,通过一站式服务,新经济可以对用户的各种网络信息和文档进行分析,推荐广告,这在之前的架构中是不可想象的。在这个意义上,传统的信息财产和隐私均已宣告终结,新经济需要一种新型信息财产权。

(三)信息/数据的再生产

作为一种依靠信息和资本不断投入的经济形态,新经济通过“非法兴起”获得了生产资料的原始积累,但仍然需要不断获得更多更新的信息。通行的观念认为,法律应当首先保护个人的基础信息。但如果将此观念置于信息生产的背景下观察就会发现,数字时代的个人隐私会源源不断地伴随着创新被再生产出来。互联网企业通过不断创新,开发出用户意想不到的新应用和服务,从而在事实上界定了需要使用的个人信息/数据的内容。如果某项应用获得了成功,所涉及的信息/数据就变得更有价值,需要法律保护。①从这个意义上说,用户有理由保护与己相关的信息,而互联网企业则更加有经济动力要求一个安全的技术和法律环境,以便排他性地使用这些资产。

①如果放在更广阔的背景下,可以说现代科学不断加深针对个体身体的探究,从医学到神经科学、基因组,相关的信息(健康数据、基因数据,将来还有脑神经数据)都成为个体独一无二的需要受到保护的隐私。伴随这一套知识的是不可抗拒的权力,个体只能接受这一套科学话语,无从反抗。

 综合来看,互联网企业可以从如下渠道获得其免费资产:(1)平台架构、虚拟物品、账号、虚拟现实(本企业生产,通过合同控制所有权);(2)UGC(用户生产,通过合同获得使用权);(3)第三方服务商生产的内容服务(通过合同获得使用权);(4)从传统文化工业和其他网络服务商得到侵权内容(通过不正当竞争获得使用权);(5)物联网产生的数据(通过传感器自动生产);(6)元数据(通过分析上述内容获得)。从信息架构到信息内容再到元数据而形成的“三位一体”结构,确保了虚拟世界的生产资料可以被不断生产出来。这同时意味着,用户实际上被卷入信息生产的漩涡当中,无法自拔:一方面享受着新式免费的服务,一方面成为这类服务的持续供给者和活劳动。互联网(以法律的名义)告诉用户何为需要保护的隐私/个人信息,而这些原来不存在的问题现在可能变得急迫而重要。互联网还将这些问题包装成普遍且自发存在的问题呈现出来,引发人们的关注和恐慌。从这个意义上讲,个人信息/数据的保护和新经济是协同发展的,如果互联网和用户达成的共识是不能通过限制技术发展来保护数据(本质上是防止这类新知识的产生),那么就只有寻求其他方式以西西弗斯式的精神来处理这些无解的问题。

三、形式法治:两权分离如何发生

从上一节可以看出,互联网的免费模式包含两个层面:第一个层面指为用户提供的信息和服务是免费的,转而从其他相关市场收费补贴;第二个层面指从用户那里获得的信息内容和数据是免费的,这可以大大降低前者了解用户的成本,并获得更多无形资产。如前所述,信息财产论的支持者主张,无论是免费的内容还是免费的个人数据,都应当获得事先许可。但实际上互联网企业通过用户协议以及法律规定的避风港规则大大削弱了这一主张。②在它们看来,信息/数据的特性决定了其使用权更为重要。

②《信息网络传播权保护条例》14-17条。《侵权责任法》第36条并不是严格意义上的避风港规则,也可看出国家对人身权利的更高的保护。

(一)通过用户协议实现两权分离(财产规则)

几乎所有网站的用户协议均约定网站享有用户在其公开区域内产生的内容的永久免费使用权。一些网站甚至还将诸多著作权也约定为免费授予,内容相当宽泛。①一些用户协议还对如何使用个人数据进行了约定,尽管这些约定都强调保护用户的隐私,不会外泄,但对如何搜集和使用这些信息的规定却语焉不详。这就保证了互联网可以持续不断地使用这些内容,资源不会枯竭。互联网平台并未宣称对这些信息要求所有权,事实上,它们反而高调地承认用户可以非排他地再授权给他人使用。然而,这样的所有权对用户而言意义不大,用户无法轻易地将这些数据打包转移,甚至也不能永久退出或删除。是互联网企业而非用户能持续地从使用这些内容中获益。另外,这些条款还意味着某种“互联网例外论”,即著作权和隐私权仍然是用户拥有的重要权利,但是对互联网而言却是开放的,企业可在更大自由度上使用这些资产,掌握着信息的流动和变化。

①例如,《新浪微博服务使用协议》第1.3 规定:微博内容,是指用户在微博上发布的信息,包括但不限于文字、图片、视频、音频等。不论微博内容是否构成著作权法意义上的可保护客体,用户同意不可撤销地授权微博平台作为微博内容的独家发布平台,用户所发表的微博内容仅在微博平台上予以独家展示。未经微博平台事先书面许可,用户不得自行或授权任何第三方以任何形式直接或间接使用微博内容,包括但不限于自行或授权任何第三方发表、复制、转载、更改、引用、链接、下载、同步或以其他方式使用部分或全部微博内容等。第4.9规定用户知悉、理解并同意授权微博平台及其关联公司可在全球范围内、完全免费、独家、可转授权地使用用户通过微博发布的内容,前述内容包括但不限于文字、图片、视频等。 

用户协议成为数字世界的默认设置和事实标准。[16]逐一界定信息产权需要很高的费用,有时候即使是纸面上做了原则约定,现实中的权利行使仍然可能是不清楚的。新经济恰好越过了界定产权的复杂程序和高昂费用,事先将可资利用的信息加以利用,然后进行事后补偿或界定权责,对信息/数据的使用更加有效率。

如果将之放在信息爆炸的背景中看,所有权与使用权的分离是必然的。这主要是因为信息生产者的数量急剧增加,也即用户不仅仅是信息消费者,同时也是生产者。他们拥有随时可以生产信息的个人电脑和移动设备,随时可以访问存放在云端的在线内容。对新经济而言,信息生产的生产资料、工具和劳动力几乎都是免费的。用户与互联网的关系不仅仅是消费者与服务提供者的关系,还是工人与工厂的关系。[17]这样的关系通过用户协议微妙地确认下来,并在事实上约束双方,而用户因种种原因几乎不会阅读这些条款。

分享经济(sharing economy)的支持者也积极讨论两权分离问题。他们实际上在不同意义上使用这一术语:(1)流行观念指的是大众可以通过免费平台相互沟通,相互分享各自的信息产品和物理物品(例如P2P分享软件、Uber专车服务和Airbnb租房服务)。[18](2)两权分离还发生在平台拥有者和使用者之间,即平台拥有者将平台使用权授予第三方开发者,从而增加整个平台的价值。[11](3)上文提到的用户信息/数据的两权分离往往被忽视。就经济后果而言,像汽车这样的竞争性物品,购入成本较低,就会受到供求关系的更大影响(例如如果开放约租车,私人专车的数量就会增加);但像房屋这样的价格昂贵的竞争性物品,数量就很难增加。只有针对一次性巨大投入的非竞争性平台(经济学上称为“自然垄断”或“基础设施”),两权分离才会产生价值,即平台所有者把平台同时出租给多个使用者,并与其分享用户数据形成的数据池。从不动产(房屋、汽车)到动产(图书、音像),再到复制传播成本为零的信息/数据,两权分离经历了实质性变化,由此而带来的价值也是成指数级增长的。

(二)通过避风港规则规避风险(责任规则)

在互联网早期,许多网站因无法得到大量正版内容,从而对一些侵权违法信息采取了放任的态度。有限的国家能力也无法在整体上打击关闭侵权网站。其直接后果是一批依靠侵权内容起家的网站逐渐发展/漂白,成为有影响的互联网企业。助其获得这一地位的便是“通知删除”制度。如果著作权人无法有效证明网站明知侵权,网站只需要撤下侵权内容或断开链接即可免责。这大大鼓励了互联网使用侵权或违法信息,因为从中可以获得的广告收入与投资数额要大大超过可能面临的行政处罚与民事侵权赔偿。

避风港带来进一步的问题:与选择加入相比,互联网企业更青睐于选择退出(opt-out),这是一种责任规则的思路。如果出现在互联网上的全部信息都可以被任何人自由和免费地加以利用,那么互联网企业就将在代码层和应用层而不是内容层展开竞争。它们希望广泛地使用未经事先授权的作品和内容,并给予事后补偿,通知和退出的义务就被施加在传统权利人身上。随着互联网平台的出现和发展,事先使用用户信息将变得更为普遍,企业不再为搜集信息竞争,而是要充分挖掘信息。在这一过程中,个人隐私和数据的使用才成为一个问题,而平台的出现恰好实现了私人主导的公共数据池的设想。

不难看出,在信息的快速流动中,新经济一方面要求大量使用用户的信息,积攒人气;另一方面则通过技术保证用户无法占有真正的东西,并鼓励用户将信息上传至云端。在这个过程中,互联网进一步从中间人变成平台,将用户和应用服务进行匹配,而不是占有这些内容。尽管在形式上符合产权交易规则,允许用户选择加入,但实质上是以责任规则的选择退出为结果。

四、新经济如何要求对传统信息保护模式进行改造

本节将结合信息/数据的特性讨论新经济如何要求信息使用的规则发生改变。大数据时代的信息/数据具有如下几个特点,直接影响了法律规则的形成和运作。

首先,如前所述,信息/数据受制于架构的设计,不仅信息再生产依赖于不同的架构,而且其价值的挖掘也同样依赖于算法。数据价值的产生既依赖于结构或非结构化的原始信息/数据,也依赖于事后的分析挖掘。这意味着个体信息作为财产在价值上依赖于数据运行和处理的架构。其次,来源于个体的信息/数据是零散的、碎片化的,能够产生价值的是数据池,而非少量数据。尽管特定数据对个体而言很重要,但对互联网企业而言,规模化的使用才更有意义,这意味着个体信息作为财产基本单位和衡量尺度具有不完备性。某些“个人数据商店”的设想很难成为现实。[19]复次,信息/数据是非竞争性物品,同一批数据可以同时被多人挖掘和分析,而获得信息永久使用权实际上意味着完全的所有权。同时,信息/数据的流动性极大,只能采用一揽子授权的方式,这导致数据使用的边界十分模糊,基本上涵盖除了未经许可向第三方披露和买卖之外的全部使用方式。信息的这一属性同时也意味着授权他人使用数据池中的数据最有效率。最后,立法者和大众担心的是可以识别身份的个人基础信息和隐私信息(身份证号、家庭住址、犯罪记录、健康信息等)遭到泄露,因为这事关人身和财产安全。但新经济更加关心的是用户不同场合的社会身份信息(用于预测)、偏好、习惯和日常活动。我国已经在各个领域有较为完善的应对泄露个人重要信息的制度,但是对日常的普通信息却关注不够。这背后的思路是,只有稳定不变的重要信息才值得专门保护,这在前互联网时代是符合经济效益的;但是互联网时代的日常活动和需要保护的信息/数据被不断再生产出来,这引发的对数据池的财产权利的主张值得关注。

上述特点都指向一个和传统控制信息流动框架极为不同的新型框架。从传统来看,各类信息都零散地通过不同渠道生产和储存,不同场域拥有不同的信息规则,没有统一的制度框架。这主要是因为信息本身还没有真正为企业带来利润,企业追求的是规模化生产具有物理实体的商品(即使是图书和音响也具有物理实体,看的是销售数量,这就是为什么它们属于文化工业——完全采用工业化方式生产文化内容——而非信息产业)。在此背景下,将信息从一个渠道转换到其他渠道,成本很高而收益很低。除了非法内容外,传统的信息/数据流动主要受到知识产权和人格权的限制,主要的使用规则是选择加入,即只有获得授权才能使用他人的作品和肖像、隐私信息等。下面将对两类传统权利的保护方式展开论述,审视它们是否能够适用于互联网信息/数据。

其一是隐私。首先,传统隐私依赖于司法的事后救济,这对于保护信息流通缓慢背景下的人格权更为适用。但对于高速流动的互联网信息则无能为力,特别是涉及认定信息的财产价值的时候。同时,主要责任主体不得不转向聚合信息的第三方平台。其次,个人隐私在不同的行业和渠道中按照不同的规则使用和流动,规则较为明确。但现在互联网将这些渠道打破,建立了新渠道,使用方式也不同于传统方式。在将来,不同行业信息统一在一个平台上,要求交叉使用用户数据,届时现有的不同渠道规则将受到冲击并做出改变。复次,就数据的使用方式而言,按照原来搜集的目的进行使用的原则将不再适用,大量互联网创新并不需要事前明确授权,而是一揽子授权即可。同时将来自不同渠道的非结构化数据混杂打通,会产生意想不到的后果。最后,传统的隐私依赖于物理架构的保护,互联网改变了这一架构,使之成为默认的信息搜集系统而非保护系统。

其二是著作权。首先,和隐私类似,事后侵犯著作权责任由司法提供救济,但这种模式无法满足信息流动的巨大需求,而且网络内容服务商承担的避风港责任也为侵权行为提供了庇护所。其次,著作权保护的前提是依赖于物理实体,由此可以清楚界定产权,但信息/数据的界权成本太高。复次,越来越多的技术被用于保护著作权,例如开发出机器可识别的水印和加密技术,以快速发现未经授权的作品的传播。但这一技术目前很难针对个人信息,特别是抽象出来的元数据。用户无法通过技术手段追踪自己的信息被何人使用,从而控制信息流动。最后,集体著作权管理制度提供了一个为普通作者维权的平台,尽管很难想象更为精细的数据流可以成为这类产权管理的客体,但这一思路和数据库保护结合起来,为我们提供了一种解决数据池集体管理的可能性。这种可能性与著作权领域的开源思潮结合起来,将为如何看待处理“公共资源”提供借鉴。

总体而言,新经济要求信息高速流动,在流动过程中通过不同信息种类的使用来获得利润,原来较为静态的立法模式不太适合这一过程,只能采取形式上合法的事先授权,但其实质意义不大。很多研究主张应当借鉴欧盟较为完善的个人数据立法,这一主张有着民法体系上对接便利的现实基础。但在实际中,对用户信息/数据的大量使用都通过用户协议加以规避,使之成为规制层次较弱的消费者权利。

这一困境突出地反映在南京的一个案件中。①在该案中,原告起诉百度通过cookies追踪其网络行为,但法院仅仅坚持从人格权角度保护个人信息,并认为这种追踪并未公开和披露相关信息(侵犯人格权的要素),只是一种广告推荐(流行的商业模式)。原告不但同意了用户协议,事实上也可以手动改变默认架构防止追踪。这种做法不仅将人格权保护降低到可以妥协交换的消费者权利,而且没有触及通过cookies追踪用户行为的实质:搜集用户信息出售给广告商。

①《南京市中级人民法院民事判决书(2014)宁民终字第5028号》。

这一判决显然对互联网企业极为有利,它不仅坚持了形式法治(法律规定的人格权并未受到侵害,用户协议也确认有效),还轻易地回避了商业模式背后的信息产权问题。用户既无法主张人身权利,也无法主张财产权利。从这个意义上说,现有法律制度并不需要在隐私保护上做任何弥合人身权利和财产权利的努力,只要保持现状即可。保留人格权,而将可能的财产权争议隐藏至幕后,当财产权利受到质疑时就以人格权和消费者同意为庇护。这些机制都共同促成了不断增长的数据池的诞生。

五、两类数据资源池

(一)以数据池为基础的信息产权理论

综上所述,新经济需要在人格权庇护下聚合数据资源,要求法律承认一种以数据池而非个人为基础的信息产权。这不仅能在基础层面化解个人信息使用的障碍,也允许个人不断从信息生产中获益。互联网正努力将可能是对抗性的个人信息权属转变为非对抗性的集体性信息权属。这一理论得到了经济理论和法律实践的有力支持。

第一,数据只有聚合在一起才有效率和价值。对数据池使用最有效率的方式是允许第三方加入平台,通过授权进行发掘,从而得到指数级增长的创新。[20]个人信息/数据的价值并不是单纯通过挖掘个人信息本身得到的,而是通过挖掘相同或类似数据得到的,统计的基数越大,对用户的预测就越精确。②个人数据尽管对自己来说具有人身价值,但只有和其他人放在一起才具有财产价值。③

②这一过程本质上是通过(集体)数据将个人贴上标签,根据数据池状况不断重新定义该用户,塑造出一个数字档案。 

③例如,个人的基因信息可以用来预测潜在的疾病,但几乎不会有理性的商家单独为某个人提供基因检测和分析服务,除非是以大量同类基因信息做基础。

第二,集中的数据池管理对用户而言十分便利,人们往往放弃本地数据储存的安全性,追求云端储存和集中化处理的效率及便利。他们希望通过一次劳动就可以享用各类服务,而不是在不同的竞争性服务之间重复劳动。这说明数据和架构密不可分。公共数据池恰好能满足这类需求。用户无法控制他们的数据,只能概括授权。原因在于,如果他们想对个人的资产(包括数字遗产,特别是非公开区域中的信息)进行管理,需要委托给第三方,尽管用户协议中规定了非排他性质的授权,但这意味着后者只有入侵在先平台的系统才能做到,这显然不太可行。①

①新浪微博诉脉脉不正当竞争案就潜在地提出了这一点,见《北京知识产权法院民事判决书(2016)京73民终588号》。 

第三,如前所述,这一私人主导的数据池是以免费服务为对价而建立起来的,当互联网企业需要承担平台责任时,它们会强调众包带来的企业边界的消亡,不愿意承担传统企业的责任(如劳动保障义务)。一旦用户产生的信息成为资产时,它们又恢复了以产权为基础的企业边界。大量不正当竞争案件表明,互联网企业正朝向更加封闭的纵向一体化模式发展,防止竞争对手通过技术手段(如蜘蛛机器人)抓取和复制自身的资源,以保护其私有的数据池。原本是为防止不正当竞争(同时推动竞争)的法律判决无意间促成了更加封闭、竞争性更少的互联网市场,从而造成了互联网企业间的分化。

第四,法院在反垄断案件中也给予新经济以极大的支持。在3Q反垄断案中,法院以技术方式论证腾讯的即时通信软件不构成市场支配地位。②从信息/数据资产的角度看,企业的资产合并可以扩大数据资源库,对用户的需求有更多的了解和发掘,从而增加而非减少消费者福利。在经济学家看来,反垄断法不应当轻易介入平台竞争,其实质恰好是平台垄断、第三方应用竞争,控制着大数据池的平台数量的减少并不会减弱竞争。[21]中小开发者和广告商共同分享平台上用户数据,有针对性地开发商品。

②《最高法院民事判决书(2013)民三终字第4号》。 

第五,互联网公司采取的一系列措施也有助于防止经济学家担心的“公地悲剧”。[22]在互联网发展的初期阶段,有研究担心互联网上传和分享的内容会越来越少,[23]但互联网公司已经探索出一套鼓励用户生产分享的制度性和技术性机制(诸如“先上传再下载”、评分机制)。此外,用户协议强制授权不仅确保了这一公共资源池的不断增长,实际上还有效防止了“反公地悲剧”的发生,即因为少数用户拒绝授权而导致整个公共资源逐渐枯竭。另外,在针对第三方开发者的平台协议中,也往往要求第三方开发者向平台提供衍生数据,确保平台有源源不断的数据更新。

基于这一理论形成的实践模式可能有多种,例如:(1)大量数据由大型平台占有,由中小开发者在平台上获取数据进行开发,但需要将衍生数据补充至原来的平台;(2)用户数据由公共平台生产,可以任意获取使用,但需要将衍生数据补充至原来的公共数据池,增进公共服务;(3)在一个公共平台上开展交易;(4)直接收购拥有优质数据的公司/竞争对手。限于篇幅本文无法对上述模式展开分析,目前的实践证明第一类数据池更受青睐,第二类数据池实践的效果还有待观察。

(二)公共资源池的迷思

公共数据池形成的基础是越来越多的信息直接通过互联网创造产生,而不是从其他渠道转入,从而加强了信息架构对信息使用的制约能力。而信息脱离了架构和其他数据就无法产生意义和价值,因此只能由互联网企业排他性地使用。从表面来看这是一种平台、开发者和用户共有的关系,平台企业毫无疑问在这种关系中占据主导地位,而个人则几乎毫无选择。大数据的支持者清楚地看到,只要他们通过技术实现无法追溯到个人的匿名化机制,消除用户的疑虑,那么剥离了个人身份与人格的数据池就有利于自身财产权利的实现。有了这一财产权基础,互联网企业就可以通过像数据交易平台这样的机制来进行数据使用权的再授权。

这些由私人企业控制的数据池显然不是真正的公有领域,而是“公开化的私人资产”(publicized private asset),在形式上是一种圈起来的准公共领域,享有“数据主权”。[24]这一私人公共领域部分免费地向公众开放,允许公众个人使用,但不允许通过抓取复制手段形成不正当竞争(政府内容管制和基于安全的监控审查则不受限制)。在这个意义上,平台向公众和第三方开发者开放,都不是真正意义上的开源,即生产资料仍然控制在平台手中,需要获得许可才能挖掘。

在互联网企业相继从传统行业、第三方和个人手中获取信息/数据之后,政府又向它们开启了资源门户。借由“互联网+”的国家政策,国务院开始推动各级政府开放特定公共数据,允许第三方企业进行挖掘,提升公共服务质量。但基于对公共数据挖掘的私人实践并没有受到有效的约束,包括信息的安全性、对私人获利的分配、对私人使用公共数据进行授权性监管等等,尚待进一步观察讨论。这一数据开放运动的实质很可能是将传统公共资源再次引入私人控制的数据池,最终扩大的不是公共资源而是私有资源。

六、结语

在过去的20年间,新经济的商业模式需要更多配套的法律制度,并要求它们朝着有利于其利益的方向改进。它们还将进一步推进网络言论自由和媒介事件,从而最大限度增加数据和信息资产。这些都有待在未来的互联网发展过程中加以观察和确认。本文无法面面俱到地分析新经济在中国兴起的社会经济条件,而仅从法律制度的层面讨论了信息技术时代经济基础与上层建筑的关系。如果本文的观点成立,即互联网的模式深受商业利益的驱动,那么貌似公共领域的种种服务也可能会被任意终止,变成封闭的私有领地。这就需要进一步打破目前关于互联网的种种迷思,从基本的生产要素入手分析互联网的本质及其合法性,并探索真正意义上的公共资源池的可行性。

参考文献:

[1]齐爱民. 拯救信息社会中的人格:个人信息保护法总论[M]. 北京:北京大学出版社,2009.

[2]Jonathan Haskel, Stian Westlake. Capitalism without Capital: The Rise of the Intangible Economy[M]. New York: Princeton University Press, 2017.

[3]王融. 大数据时代:数据保护与流动规则 [M]. 北京:人民邮电出版社,2017. 

[4]李谦. 人格、隐私与数据:商业实践及其限度 [J].中国法律评论,2017(2):67-80.

[5]胡凌. 谁拥有互联网信息 [J]. 北大法律评论,2013(1):49-57.

[6]张新宝. 从隐私到个人信息:利益再衡量的理论与制度安排 [J].中国法学,2015(3):35-45. 

[7][澳]胡·贝弗利-史密斯. 人格的商业利用 [M]. 北京:北京大学出版社,2007.

[8]高富平. 信息财产:数字内容产业的法律基础 [M]. 北京:法律出版社,2009.

[9][美]斯蒂芬·芒泽. 财产理论[M]. 北京:北京大学出版社,2006. 

[10]江波. 虚拟财产司法保护研究[M]. 北京:北京大学出版社,2015. 

[11]姜奇平. 新文明论概略 [M]. 北京:商务印书馆,2012. 

[12]Daniel J Solove.Understanding Privacy [M].MA: Harvard University Press, 2009. 

[13]陈威如,余卓轩. 平台战略 [M]. 北京:中信出版社,2013.

[14]Christopher S Yoo. The Dynamic Internet: How Technology, Users, and Businesses are Transforming the Network[M]. New York:AEI Press, 2012.

[15]胡凌. 探寻网络法的政治经济起源[M]. 上海:上海财经大学出版社,2016.

[16]Jacob Silverman. Terms of Service: Social Media and the Price of Constant Connection[M]. New York:Harper Perennial, 2016.

[17]Trebor Scholz. Digital Labor: The Internet as Playground and Factory[M]. New York: Routledge, 2012. 

[18][印]阿鲁·萨丹拉彻. 分享经济的爆发 [M]. 上海:文汇出版社,2017. 

[19][美]阿莱克斯·彭特兰. 智慧社会[M]. 北京:中信出版社,2015.

[20][美]拉里·唐斯,保罗·纽恩斯.大爆炸式创新 [M]. 杭州:浙江人民出版社,2015.

[21]姜奇平. 经济:垄断竞争政治经济学[M]. 北京:清华大学出版社,2017.

[22]Michael Heller. The Tragedy of the Anticommons: Property in the Transition from Marx to Markets [J] Harvard Law Review, 1998(3): 111-30.

[23]Tim Wu. When Code Isn't Law [J].Virginia Law Review, 2003(4):679-751. 

[24]胡凌. 信息基础权力:中国对互联网主权的追寻[J].文化纵横,2015(6):24-31.

编辑/常赢

校对/辛明尚