深
柳
堂
编者按
“闲门向山路,深柳读书堂”,语出(唐)刘昚虚《阙题》。深柳掩映下的清净书堂,最是读书人向往的治学之所。由是,我们用“深柳堂”来命名《新闻与传播研究》论文推介栏目,以期让同好慢慢品读,细细体味。
本栏目期待能够成为学者们田野归来坐而论道的一方宝地,将理论与实践结合起来,切之,磋之;也欢迎各位读者向作者提出问题,琢之,磨之;我们会精选问题予以回应,奖之,励之。
平台V.S.用户:谁该向谁付费
——数字平台与用户之间基于数据的经济关系探讨
作者 | 徐偲骕 李欢
内容提要
学术界和实务界普遍认为,数据虽然可以成为新型民事权利客体,但单个自然人的个人数据并不具有价值,故而经过脱敏的、无法追溯到具体个人的数据归属于实际控制者,可用于商业开发和交易。这一思路虽然便于操作,甚至已成既定事实,实则架空了背后的经济意义,以保护人格权和隐私的名义遮蔽了数字平台与用户之间的一层原本应有的、基于数据权益的经济关系。当前,DaL模式主张将用户在线活动看作支撑人工智能开发的数据劳动,并以此主张平台支付用户数据收入;另一种激进观点认为用户应该向平台付费,将后者转变为依靠订阅费生存的公共媒介服务,彻底从经济上取消其依赖数据采集的商业模式,也就没有了确权和收益的问题。论文基本同意平台付费说,但建立企业-个人间的数据定价和买卖市场并非良策,也不宜简单移植西方的平台税,可考虑将目前国有控股大数据交易所的收益以集体转移支付的方式反哺社会。
关键词
数据权益 数字平台
用户 数据付费 数据交易
正文
2018年以来,数据安全问题成为全球热点。脸书数据泄漏事件震惊全球,8700万用户受害,欧盟《通用数据保护条例》(General Data Protection Regulation,GDPR)正式实施,在欧盟境内拥有业务的大型平台企业面临严格的监管与处罚。2019年12月,脸书再次发生数据泄露事件,波及2.67亿用户。同年,中国国家互联网信息办公室就《个人信息出境安全评估办法(征求意见稿)》向社会公开征求意见。2020年初,谷歌计划将存放在爱尔兰总部的英国公民数据转移到美国,因为一旦英国完成脱欧,其是否会遵守GDPR尚不明朗,建立在GDPR规则之上的《欧盟-美国隐私盾协议》将无法再用于英美间的数据传输。
网站信息与数据泄漏问题伴随着整个互联网发展史,为什么直到现在才成为焦点问题?监管在升级,但为什么类似事件的发生频率却一次紧似一次?为什么数字平台面对各国议员和民众的千夫所指,依然不放弃对于用户数据的控制,相反要在全球范围内选址,在水源丰富、气候宜人、税收低廉的地方大兴土木地建造各自庞大的数据中心?为什么跨境数据传输会成为国家间经贸甚至政治谈判协议的重要内容?主流传播研究的现有分析框架已经很难将这些问题容纳在内了。
长期以来,传播学一直在“隐私权”的范畴内处理用户数据这一问题,客观评价,这一视野相对滞后。数据固然包含用户的隐私,但更是平台经济最重要的无损耗生产资料和命脉所在,从不断爆出的平台企业间关于数据获取和共享的纠纷,到数据逐渐成为一种可交易对象,甚至催生出整个新的产业,不难看出,用户数据问题已经从单纯的“个体信息”和隐私保护的单一维度,扩展至“个体权益、企业竞争和生产关系”三个维度。如果仍然将视野局限在隐私保护的范围内,将这个问题处理为企业行为“是否经过用户同意与许可”的合规问题,并寻找改良主义的技术治理方案,容易脱离生产关系和物质基础,无法触及问题的核心。即便一家企业宣称自己严格保护了用户的隐私,采用了多种加密方式,并杜绝与第三方直接共享,它就可以继续无偿挖掘、采集、占有用户数据及其收益了吗?相反,这种方式可能更加加强了大型平台对数据的垄断专有权,不仅无法开放共享,反而成为其私有财产,形成一座座数据孤岛。
正因用户数据日渐演进为奇货可居的商品,进而成为平台手中重要的资本,学界才逐渐认识到,应从财产权角度来思考用户数据的确权问题,并以此加强保护。但细查这些论述,却存在疑窦,学界和实务界似乎已经达成了一种共识,即数据虽然可以成为新型民事权利客体,但单个自然人和个人数据并不具有价值,故而只要“原始数据”经过清洗和脱敏,无法追溯到具体个人的数据归属于实际控制者,成为“衍生数据”后,就可以被数据企业用于商业开发和交易。这一思路虽然有法可依,实际上和隐私权框架并无多大差别,用户的数据财产权只是空担了一个虚名,除了依附于人格权之上的身份信息受到保护之外,对数据的流向和用途并无多少实际控制权。关键在于,它实则架空了其背后的经济意义,遮蔽了数字平台与用户之间的一层原本应有的、基于数据权益的经济关系,掩盖了前者从后者处无偿获取底层数据的“圈地”过程,使企业对数据的财产权合法化。这种把隐私留给用户,将获利装进口袋的所谓数据财产权建构,造成了严重的“价值错位(mismatch)”,强化了原有的不对等关系。
论文首先从这种“残缺”的权益入手,将数字平台与用户之间的经济关系作为问题托出,而后分别讨论(1)“作为劳动的数据”模式(Data as Labor,DaL)与平台付费论,(2)基于订阅费改革的用户付费论,呈现其各自的依据和局限性,并在此基础上提出,(3)基于用户数据劳动的集体转移支付路径。有学者认为,新媒体时代的资本积累将“人”本身资本化,人成为一切数据的总和,其背后正是使用者的劳动付出,而新媒体的利润来源问题使得劳动价值论获得了新的展开。中国共产党十九届四中全会首次公开提出数据可作为生产要素按贡献参与分配。数据是新经济“能源”一说已不再是抽象比喻。这必将启动全新的经济转型和利益分配格局。因此,更有必要在学理层面探索这种分配机制与用户及其数据贡献之间的关系。
一、 “残缺”的数据权益
在肖申娜·祖博夫(Shoshana Zuboff)看来,“监视型资本主义”的奥义在于,消费者的“行为盈余”不再是无用的“数字排放”,而是珍贵的数据宝藏。随着数据挖掘、数据汇集、数据分析、数据画像等技术层出不穷地出现和更新,数据捕捉和处理成本的降低,数据采集装置的身体化、空间化和全时工作化,我们正处于一个“数据工业化革命”(The Industrial Revolution of Data)时代。尼克·库尔德里(Nick Couldry)等人称之为“数据殖民主义”(data colonalism),这个新的殖民主义过程已经被自然化了,甚至还会重新定义GDP为“国内数据总值”(gross data product),成为衡量国家财富和实力的新指标。
人们耳熟能详的IT(information technology)时代正逐渐让位于“DT(data technology)时代”,即数据技术引领经济社会发展的全新局面。大数据的采集和应用场景已经越出了被广为讨论的社交平台,也不再局限于人的在线互动与交互行为,亦不只是为了定向推送广告,这些只是互联网企业庞大数据库的冰山一角。在“连接一切”的意识形态指导下,它们开始全方位进入人们的日常生活和物理空间,以拓宽新的数据源和开发新的数据应用作为核心业务。大型互联网公司不断打破限制数据在世界范围内自由流动的制度、技术和物理障碍,将摄像头、传感器、人脸识别、指纹采集、二维码图案等设备安装在城市各处、家庭和人类的身体之上,“量化自我运动”和“智慧城市运动”就创造出诸多新的数据种类,大部分人并未意识到自己已经身处全方位的数据捕获环境之中。新冠疫情使得经济活动和社会生活全方位加速“云化”,“无接触经济”逆势而上迅速扩张,危机所促成的在家办公、学习、消费状态和全社会对潜在病患的高度戒备,反而成了各家互联网公司的巨大商机。企业手中的数据量暴涨,Zoom公司17个数据中心处理的流量相当于疫情之前的100倍。其后续商业价值如何,只消观察某些出品健康码的公司对于疫情之后是否删除数据的暧昧态度,就能明白一切。
此外,围绕大数据已经产生了一个庞大的产业和交易市场,据国际权威机构Statista在2019年8月发布的报告显示,到2020年,全球大数据市场的收入规模将达到560亿美元,较2018年的预期水平增长约33.33%,这个数字还只是由大数据硬件、软件和衍生服务三部分收入组成,没有统计涉及数据本身作为标的物的关联产业交易活动。自2015年4月贵阳大数据交易所成立以来,北京、上海、武汉等城市相继都有了大数据交易中心,如今数据不只是在大型平台和第三方开发者之间通过API实现流动和共享,它本身早已成为商品,形成了市场,以每年近千PB的规模流通和买卖。仅贵阳交易中心就有2000多家公司注册和交易,可交易数据品种达到33种之多,业内人士透露,这还只是在法律许可范围内的合法交易,交易额远远小于黑市的规模。
2011年,世界经济论坛公开承认个人信息是一种新的资产类别,应当予以处理。诚如萨比娜·莱昂内利(Sabina Leonelli)所言:“数据成为资产的这种明确转变,只有在制度、技术与经济发展相互交织的复杂网络下才能够实现。”法律常识告诉我们,物可以被交易的前提是所有权/产权明晰。十二届全国人大常委会委员、财经委副主任吴晓灵就曾公开表示:“明晰产权是建立数据流通规则和秩序的前提条件。”那么,数据既然可以被公开合法地交易,说明其确权问题应该已经在现有制度和法律框架下妥善解决了,不过,情况似乎没有这么简单。
2012年通过的《全国人大常委会关于加强网络信息保护的决定》规定:“任何组织和个人不得窃取或者以其他非法方式获取公民个人电子信息,不得出售或者非法向他人提供公民个人电子信息。”《中华人民共和国网络安全法》第四十二条又规定:“未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。”这一立法思路在《中华人民共和国民法总则》和2020年十三届全国人大三次会议表决通过的《中华人民共和国民法典》中得到了延续,核心思想为:对于没有经脱敏处理的、尚能够识别出信息主体的数据,参照有关个人信息的法律规则处理;经过脱敏处理,无法识别,或不能直接识别出信息主体的数据,才属法律意义上的数据。2015年8月,国务院常务会议通过《关于促进大数据发展的行动纲要》,明确提出:“大数据本身是一座金矿,但它必须经过清洗、分析、建模、可视化之后,才能进行交易,才有价值。”
上述决定、法律的颁布初衷是好的,目的在于最大限度保护建立在人格权之上的个人隐私和信息,其保护范围涵盖姓名、出生日期、身份证件号码、个人生物识别信息、住址、电话号码等信息,当这些信息被剔除以后,便可在数据市场上交易。全国各地数据交易市场中的合法交易便是在这个意义上顺利进行的。
但它并没有正面处理用户的数据权益以及由此带来的收益问题。这并不奇怪,早在2002年,戴维·洛辛(David Loshin)专门下过一个定义:数据所有权是指包括访问、创建、修改、打包、从数据中获利、出售或删除数据的能力,还包括将这些访问特权分配给其他人的权利,且所有权程度(the degree of ownership)以及由此产生的责任程度(the degree of responsibility)由各利益相关方从使用这些信息中获得的价值所驱动。他这个定义是指那些实际控制着数据,并且有能力,也知道怎么来用数据的机构主体的,尚未涉及到数据原始主体的利益问题。据此,个体很难作为“利益相关方”来使用这些数据而获益,因为没有使用,所以不产生价值,所以不能主张财产收益权,早期学者没有认识到数据依附于人身的这种天然从属性在先。吴晓灵的表述相比18年前明显进步,她认为大数据的应用和价值的挖掘不能以牺牲“个人数据财产权”为代价。这与现实中的分歧就比较明显了,即实践中的用户数据权益并没有设置用户从数据中获取经济利益的权利。这说明了两种可能,其一,国内目前并不认可数据是用户所有的财产,其二,即便承认用户拥有数据财产权,这种财产权并不完整,不包含收益权。
学界代表性观点认为,原始/底层的个人数据,归用户本人所有,而对经过充分匿名化获得的数据集,企业享有限制性的所有权。虽然这种观点承认数据具有财产性质,但首先,因为单个用户的数据并不具有使用价值、转让价值和稀缺性,无法获得市场认可和回报;其次,数字平台已经向用户提供了免费的服务,用免费服务换取免费数据,十分公平合理。因此,用户对于数据的权利应该被定义为建立在人格权意义上的精神权利,也就是隐私不受侵犯和个人信息安全的权利,所以用户对于数据主张权利的来源只能是个人信息保护法。从此,隐私和个人信息被剥离出来,与数据财产作为两种客体分道扬镳。从为大数据产业的发展保驾护航的角度来看,这种为数据确权松绑的思路非常符合企业利益,为数据的开发和交易铺平了道路。且企业完全可以比照知识产权制度规则来对衍生数据行使所有权,因为在清洗、脱敏、建模、开发并转化为智力成果的过程中,它们投入了大量资金、技术和劳动力成本。弦外之音是,如果过度强调产权在用户,则将增加不确定成本,挫伤数据实际控制者发展数据经济的积极性。
于是我们恍然大悟,原来匿名化是一种企业切断用户和数据之间的法律联系,独享数据池排他性专有权和经济利益的挡箭牌。所以,当下各方对数据权益的建构其实是人格权和隐私权归用户,所有权/产权归企业的光景,无怪乎收益权到用户这里戛然而止,平台和用户之间的基于数据的经济关系从未被当作一个问题,因为后者的数据权益说白了只是一种既非物权,也非知识产权的非物质精神权利和个人信息安全权,是一种“残缺”的权益。甩掉了这一个可能引起麻烦的包袱之后,有行业研究机构便开始建构属于数据实际控制者的财产权了,将“数据资产”定义为“由企业拥有或者控制的,能够为企业带来未来经济利益的,以一定方式记录的数据资源”,当然也就不奇怪了。
二、 如何理解用户数据收益权?
在用户数据权益被切割的背后,实际上是长期以来被默认和自然化的“所有权”与“使用权”的分离。企业依靠一纸复杂和别无选择的用户协议作为幌子,无偿取得了原始数据的使用权。且数字平台倾向于将自己定义为连接器和服务者,用户协议看起来只是一份提供服务的民事合同,不涉及任何财产的转移,亦非劳动合同。于是平台企业以极小的成本——在并无多少外部监督的情况之下声称过滤掉用户的可识别信息,就获得了开发、使用、商品化这些数据的权利。
但“使用权”并非“所有权”,法学界有个精彩的比喻,企业汲取数据,“就像拿了别人的珍珠项链,不会因为把珍珠拆下重新串过,项链变长变短,或者镶在几只胸针上,那些珍珠就变成自己的财产,就可以合法出售”。也就是说,清洗这一技术手段并不是财产权得以暗度陈仓的“魔法”,企业并不能因为自己是受委托的记录方、存储方、实际控制者,就能动摇委托方对原始数据的初始权益,把使用权变成只为自己生成价值的摇钱树,并通过交易所这样的既成事实,淡化和遮掩数据权益的瑕疵,来倒逼法律的认可。有学者一针见血地指出,这种数据集合财产权正是在先占、抗争乃至法律确认等博弈中确立起来的。
企业认为用户不应享有基于数据的财产收益权,很大程度上是因为单个用户数据并不具备市场价值,且自己已经用免费服务支付了对价。但是,用户个体的数据真的不具备价值吗?数字平台真的是免费的吗?
即使数据被剥离了人格信息,无法追溯到具体个人,但集合数据价值的最终实现,仍然还是要落脚在具体个人身上,是由每一位真切存在的用户完成的。这一点并不会因为精确定向广告是发给特定地区的、特定品味的某一群人而改变,数据驱动型商业预测和决策的最终结果还是要由个体消费者来买单,数据画像不过是对清洗和匿名化的逆向操作,先给你吃下定心丸,然后依然还是要识别你,尽管是以模糊群体的方式。即便是冰箱、汽车、谷歌眼镜这些本属于物联网范畴的数据,因为关联了作为人的物主的购物习惯、出行线路、浏览偏好等信息,也具有极大的商业价值。可以说,数据的全部价值就在于其依附于被记录主体人格的这种附身性,正因如此,再微小的数据也有价值,反之,将是一堆无用的数字。数据价值之环始于个体用户,也闭合于个体消费者,其负面后果,也是要由每一位真实存在的鲜活个体来承担的,是否脱敏并不能防止集体性损害。
因此,你的原始数据正如当年的收视率一样,在帮助识别你的过程中,自始至终都参与了最终价值的生产,当你在按照平台推送的广告来消费,过上受到操纵的“客制化”(customization)的生活时,并吞下数据和算法技术滥用的苦果时(比如遭遇杀熟),你就已经在为整个数据产业买单了。和电视一样,平台和数据产业同样是“高固定成本、低边际成本”的,用户增长并不必然带来成本上升,用相对固定的成本套取海量数据作为免费生产资料,再从商品、服务和数据交易中取得利润和租金,何来已经支付了对价一说?
这也说明,以“知情同意”为主要形式的“一次授权、无限制收集和使用”协议在保护效率上是极为低下的,一旦数据离开用户,进入企业的黑箱,用户便无从知晓其用途。它极大偏向于数据收集者,充满免责条款并尽力将自己描述为服务合同而非货物买卖合同。且因为用户协议的签署在程序上先于数据池的汇集,数据到达企业手中之时,仍然含有可识别信息,之后是否按照相关法律进行了匿名化处理,是一件依靠企业自律和“民不告、官不究”的事情。何况,即使数据进行了去识别化处理,现有的技术依然可以追溯到具体个人。事实也证明,过度收集、暗中窃取和无序买卖依然在泛滥。
正是认识到了现行模式的弊端,GDPR才引入了“数据迁移权”,赋予用户在不同平台间转移数据的权利,乐观者认为它很有可能撬动不同平台间竞争的格局,威胁企业对数据的排他性专有权,给数据产业带来新的空气。但其实际效果仍然有待观察,毕竟头部企业日渐固化和具有垄断地位,市场中几无可与之抗衡的其他公司,用户一旦选择退出,损失社会资本和生活机遇的将是自己,无法对企业构成任何实际制约。况且,GDPR赋予用户的各项权利其实只是部分数据控制权,有所进步但仍然不是完整的财产权益,或可说是在搁置权益争议的情况下寻求用户赋权和实践中的平衡,欧盟委员会的确还没有立法明确规定数据财产权的问题。
这种效率低下还体现在,数据经济所表现出来的宏观社会成本并不足以激活每个信息主体直接寻求维权的动力,个体隐私偏好在现实生活中并没有显得那么强烈。相反,在免费服务和各类优惠的诱惑面前,消费者争先恐后地陷入了“自我披露的军备竞赛”,在无数巧立名目采集数据的二维码图案之前自愿掏出手机,个人私利决策系统在“眼前的好处”和“看不见的后果”之间不假思索地选择了前者,成为“行走的数据包”。所以将数据保护的责任寄托在信息主体自主决策之上收效甚微,控制权有可能只是看起来很美好。
既然精神性的人格隐私权和用户自主控制权皆无法形成有效保护,回归经济学常识,任何增加企业成本的因素必然会改变其现有商业模式和经营策略。有学者开始主张处分权之外,个人对数据还享有收益权,彭诚信据此设计了数据处理的三层原则:(1)信息主体在最低程度上不受损害,(2)在中级程度上得到利益的分配与分享,(3)在终极意义上感受到对自由与尊严的尊重。2019年2月,美国加州州长加文·纽瑟姆(Gavin Newsom)公开提出,将推动立法,规定平台科技公司,也包括收集和货币化个人数据的非平台公司向消费者支付“数据红利”。如胡凌所言:“诉讼和法律很难解决盗版侵权的问题,真正解决问题的是新旧利益之间的合作。”为用户争取基于“初级生产资料”的收益,亦是一种在源头上制衡企业毫无节制进行数据圈地的有效经济手段。
三、 平台付费论:作为劳动的在线活动与数据收入
在DaL模式之前,数字劳动理论就将用户在线活动看作被剥削的劳动了,认为网络空间既是游乐场,亦是工厂。从蒂齐亚纳·泰拉诺瓦(Tiziana Terranova)到克里斯蒂安·福克斯(Christian Fuchs),“产消者商品”被发现并与“家务劳动化”(housewifization)关联,因为它没有工资,主要在业余时间进行,亦没有工会代表,很难被视为劳动,是数字资本“成本外部化”的策略。但这一流派将大量研究重点放在用户生成内容(user generated content,UGC)上,较少注意到在资本实现的过程中,UGC已为“用户生成数据”(user generated data,UGD)所取代。UGC的主要功能在于为资本省去一部分传统媒体内容生产的成本和购买正规成熟作品的版权成本,扮演“节流”的角色,真正开源的秘诀,在于数据。邱林川注意到了这个问题,但将UGC与UGD统称为数字资本主义的“白糖”,但前者其实可以取道知识产权予以解决,而后者参与资本循环的角色完全不同,亦无法通过现有法律框架得到妥善处理。
平台与传统内容提供商和普通用户之间关于内容的争议已经得到某种程度的缓解,“链接税”思路便是一例,以阻止平台免费从传统媒体那里直接把稿件转载到自己的页面上。而平台自身也在加大力度扶持原创作者,以获得优质内容。UGC模式虽然不具正式劳动关系,但实实在在地引入了“薪资制度与劳动控制”,实际上已经是劳动密集型行业了,不排除将来会成为正规职业,完全可以归入劳动法立法修法的讨论范畴中去。
因此,数字劳动理论“无酬”和“免费”的指控在很大程度上成了无的放矢,数字平台已经超越了当初“非法兴起”阶段对于互联网免费内容的袭夺和圈占,迈入了“非法兴起2.0”,也就是对用户数据的原始积累。不管是被收集,还是主动提供,着实都是无酬的,且根本就没有被纳入到劳资关系的讨论中去。值得注意的是,数字劳动理论渐为法学界所接受,有学者认为,用户不仅是被动的消费者,还是主动的数据生产者,与数据控制者之间超越了简单的消费者-商家的关系,同时表现为劳动力-工厂的关系,数据凝结了用户和平台双方共同的劳动投入。
以阿里埃塔·伊巴拉(Arrieta Ibarra)、贾伦·拉尼尔(Jaron Lanier)为代表的一批学者于是提出了从“数据作为资本”模式(data as capital,DaC)迈向“数据作为劳动”模式(DaL)的思路。主要依据是,人工智能和机器算法要想改进,新的自动生产模式想要趋于完善,就必须浸润在充足的高质量数据中学习与训练,包括用户仅仅表现出某些行为和消费者特征而无意识地辐射出来的数据。在没有任何讨价还价能力的情况下,用户缺乏一种有意义的谈判方式来迫使平台支付他们的数据,即使不上升到剥削层面,也相当于是在无偿“捐赠”,在此过程中还失掉了隐私,极不公平。不能继续将数据简单地视为休闲和消费的自然排放和监视型资本主义的原料,任由其作为资本为企业所掌握和积累。埃里克·波斯纳(Eric Posner)等人也认为当前的数据所有权模式(指的是DaC)在经济上是效率低下的,应该被重新设计。它缺乏对于用户的有效激励,破坏市场评估原则,扭曲了数据经济的正常发展,形成了单向的、封建的经济收益体系,阻碍用户发展成为“一流的数字公民”,从而也无法实现信息时代的“经济尊严”。
这种看法假设了“免费数据换免费服务”的模式致使高质量数据供给不足。消费者行为数据其实很大程度上并不是以生产为导向的,电商追踪用户的浏览痕迹仅是一类数据,收集成本也很低,但如果要开发工业机器人、同声翻译机器人、医用手术机器人、法律合同条款审阅机器人、证券分析和交易机器人,那么相关数据的收集就很困难。在机器学习中,免费行为数据只是很小的一部分,只能学习到人类的消费行为特征,却无法借此来模拟人类的生产性活动和创造性活动,这才是人工智能广泛应用的机遇所在。
DaL模式有利于扭转这种情况,既然将数据视为人工智能产业的生产资料,将用户产出数据视作基本的劳动环节,企业理应支付报酬。伊巴拉等人认为,将来许多传统职业不复存在,这可能是一种为人们提供收入和意义的新来源的方式。数据工人们会更努力工作,生产更高质量产品(数据),付钱给人们购买数据可以推动产业加速成长,使人工智能在经济和日常生活中发挥重要作用,甚至有必要设立“最低数据工资”。
相关实践已经有所进展,人工智能行业事实上一直以来都在对人工劳务支付报酬。相对于脸书和推特这样的社交媒体,苹果、微软甚至电商平台亚马逊为了获取更高质量的生产型数据,都在想办法将机器学习获利的一部分分享给为其提供相关数据的个体用户。再比如必应搜索,微软公司为了弥补其数据积累不足,在算法训练方面落后于谷歌等传统老牌搜索引擎的劣势,直接提供现金报酬以鼓励用户使用必应。
平台付费论者甚至认为诸如GDPR这样的赋予用户数据可迁移权的法律将会重启竞争,刺激数据市场的形成,形成新的数据经济,用户可以在竞争对手之间撤回和转移他们的数据。因而,科技公司可能会为了竞争用户的数据,从而竞相抬高价格,这样得利的便是用户了。而当获取个人数据的成本高了,隐私就是可以保证的了。除了GDPR,现有的劳动法也已经不能适应产消者(prosumer)这一双重身份了,立法者应将经济与技术的复杂性情况考虑进来,将数据劳动这一新的劳动类型予以纳入,创设灵活性“数据工作”这一新的合法的职业或是收入来源。
不只是平台与用户之间形成经济关系,在用户间,拉尼尔设想了一种个体对个体的双向链接系统(two-way linking system),指向任何信息的来源,以创造一种小额支付经济,补偿人们在网上发布的原始资料。比如一对在网上交友网站找到真爱的夫妻,他们后来的婚姻被证明是长久的,如果30年后,另一对年轻夫妇利用第一对夫妇的相容性统计数据来进行配对,那么第一对夫妇应该因为这些信息而获得少量版税。数字世界通过算法能够得出每个人提供有用数据的无数复杂方式,即使未来大规模失业,人类都可以因为数据产权和生物特征产权得到小额报酬的经济支持,累积起来,达到社会保障水平的基本收入是没有问题的。
四、 用户付费论:“去广告化”的订阅服务?
在激进的另一端,用户付费论认为用户应该向平台付费,这是彻底改革基于精确定向广告模式的社交平台的一种方式。皮尤的调查显示,约68%的美国人并不喜欢广告以他们为目标,并对企业对个人行为的追踪和分析表达了厌恶。除了外部批判之外,广告模式的有效性也遭到了来自内部的批评。定向广告在让用户购买更多商品方面的实际成功率是未知的。广告界相信广告只要被精确送达了消费者,就等于有了好的效果,这假定了消费者对环境会产生应激反应,从而很容易高估了广告促销力。但研究显示,不管标签多么精确,相关性多么高,那也只是增加了广告效果实现的可能性,精准广告并不能百分之百地促成购买行为的发生和转化。
既然如此,改革甚至取消广告模式就不是完全异想天开,将其转变为一种收费服务,甚至是类似于BBC这样的依靠订阅费来维持运营的公共媒介机构也不是不可能。要求新媒体公司提出新的商业模式和创收理念,取代传统广告成为一种呼声。由于HBO高质量的节目和没有广告,人们愿意支付溢价来订阅这个频道。社交媒体似乎也可以为此树立付费墙,来逐渐扭转目前依赖广告的生存模式,其好处是,大规模监控和收集数据就没有必要了。
脸书高层在接受采访时就声称,因为“我们的活动取决于您的数据”,如果用户不想被广告追踪,那就只能付费。在面临如潮般的批评和参议院的质询时,扎克伯格也不排除推出付费版脸书的可能性,以朝着无广告的方向改革,但他还是认为:“总的来说,我认为广告体验将是最好的体验。”
收费模式在理想状态下是完全可以维系公司运营和生存的,按照脸书提交给美国证券交易委员会的10-K文件显示,2018年公司从全球用户身上获得的每个用户平均收入(average revenue per user)为24.96美元,每个用户每月只要支付2美元多,就能达到这个水平。支持者们为了保护自己的信息免遭监视,完全愿意支付少数费用,因为他们认为广告的隐私成本实在是太大了。
当然,这只是理想状态,可能低估了人们浸润在免费服务中的惯性。如果今天被告知明天要收费,立刻就会有用户不再使用,或者干脆注销。这些工具还远没有达到像中国的微信那样渗入日常生活,导致人们须臾不能离开,否则寸步难行的地步。一旦付费墙建立,数百万个账户就可能消失,剩下的用户活跃度也会降低。对于社交平台来说,用户规模才是网络效应形成的基础,访问必须简单,最重要的就是免费。虽然精确广告不一定致效,但依赖广告支持模式而不是向单个用户收费,可能才是脸书走到今天的根本原因。
况且,收取费用也并不一定是以固定订阅费这种形式,平台还可以通过创造增值服务、解锁特定功能、区分VIP特权与普通账户等方式来收取费用,这些实践实际上一直作为许多没有海量用户和广告投放量的中小平台收入的来源,即便如腾讯这样的巨型企业,也同样有着大量增值服务和付费内容,正在朝收入来源多样化的方向发力。即使有增值服务和其他收入来源,腾讯就不收集你的数据了吗?恐非也,中国用户在使用爱奇艺、优酷等视频网站时,均会面临两种选择,观看广告V.S.充值会员,后者可享受免广告的特权,说明广告模式与收费模式是并存的,并不是一个取代另一个这么简单,既然广告依然存在,用户又如何保证平台不收集自己的数据呢?况且,腾讯的内容都是精细化运营的,以精准地分发至高日活跃用户(daily active user)的平台,比如腾讯视频、QQ看点等,既然要精准推送,如何能不收集数据?在依赖大数据提供定制化服务和衍生商品的最基本的商业环境中,去数据化的用户付费模式只能让这家平台难以了解和满足用户特定喜好,孤掌难鸣,难以为继。
因此,这个方案只是支持者的一厢情愿,他们对于平台的认知还停留在新闻或社交媒体的阶段,并以为参照BBC的模式就可以解决这个问题。但这是一个全新的产业,大量行业性数据企业并非社交媒体,或者根本不是媒体,他们不生产新闻,也不提供内容,更不依赖广告模式来生存,不可能通过收取订阅费来将其转变为公共媒介。这类公司的商业模式已经深深捆绑在数据采集、加工、开发与交易的完整的产业链中了,他们依靠手中的数据来研发新的智能应用场景,在经济上赋能百业,同时又深深嵌入政府的治理活动中,一旦切断这一途径,即刻就会被数据产业淘汰。
五、 第三条道路:集体转移支付?
如詹妮弗·斯科特(Jennifer Scot)所言,数据可以很容易地生成和收集,但却缺乏市场性和可销售性。因此DaL模式也并非完美,其证立依据是个人数据对人工智能和他人的使用价值可以被清晰界定,也即需要一个市场或模拟市场的机制来对数据质量进行有效定价。因为用户无从了解其数据参与人工智能的程度和意义,很容易陷入买方市场的垄断和信息不对称的陷阱,无法保证其数据不被平台低价收购。即便个体间有小额支付系统,但必须先有一个公认的定价机制和交易规则,如同以美元为结算单位的货物贸易结算系统那样,一对夫妇的婚姻配对数据值多少钱呢?这种数据与一位证券操盘手的数据孰贵孰贱呢?如何衡量某种具体数据的价值并计算价格,成为这类交易的难点。
况且,假如去识别化的数据真的无法追溯到个人,将要如何根据找不到的数据主体来分别付费?虽然有学者认为可以利用分布式区块链技术设计工作量证明机制,使用户的劳动贡献都可以通过共识算法进行测量和转化成一定量的代币,用来享受在同一网络社群中的各类服务,最典型的例子比如视频网站bilibili用户每天登录即可领取“硬币”。但大部分人并不只是单一网络社群和平台的用户,取得的虚拟代币也无法在现实生活中转化为购买力,只是一种“内循环”系统。脸书推出的数字货币Libra尚且受阻,其他小型网络的虚拟代币想要成为真实货币依然道阻且长。
平台愿意付费的前提是该国的数据隐私保护政策严格,无法合法地以极低的成本挖掘用户数据,用户不授权便无法获取数据,那么用户便可藉此获取排他性的定价权。但全球大部分国家均无如此严格的保护水平,当企业可以从别处免费获取同样的数据时,又为何要出高价来购买你的数据?而且,人们的定价动机并不一定都出于保护自己隐私的目的,有的用户可能将价格定得很高,以阻止被收集,但如果该数据有利于公共部门研发癌症药物,或帮助残障人士改善生活,那么价格定得过高显然不符合公共利益,阻碍了社会发展;反过来,如果有人为了生活所迫,行“薄利多销”之术,将自己的数据定价过低,导致企业能够以低成本获取大量数据,便如同扰乱和破坏市场秩序,使他人的数据失去同等竞争地位,拉尼尔也预见到了这种“数据荡妇”(data slut)的情况是存在问题的。即便超强的算法将来真的能够精确计算出每一种数据的具体价格及其与其他数据间的价格差,且其贵贱的合理性如汇率一样得到各方认可,那么,你生活的每一个念头、想法,甚至每一步决策过程都有可能因为触碰到“古人”的数据权益而要付钱,这样的社会是否正常?再比如,当这种数据经济模型中出现“斯达汉诺夫运动”,那青少年游戏成瘾者应该被付费吗?他们竞赛式的“玩乐劳动”每秒生产的数据都比旁人要多,对游戏产业的贡献也最大,他们将成为新富阶层,这样的机制公平性何在?
因此,用户对自己的数据自主定价,“单打独斗”地向平台索取数据收入,签订“数据劳动合同”,形成一个数据劳动力市场,实际上还是以市场的方式去解决市场的问题,或以工资劳动逻辑将用户卷入了另一种受剥削的雇佣而已。马克思很早就认识到:“任何雇佣劳动的形式,即使一种形式能够消除另一种形式的缺点,也不能消除雇佣劳动本身的缺点……每种杠杆都是以阻力始终存在这一点为依据的。”
中国某种程度上也已出现了碎片化的数据付费现象,各种形式的注册返现、点击领现金、邀请好友得优惠,盖楼、助力、砍一刀等层出不穷,其基本逻辑就是通过少量补贴以最大限度开发普通用户的人际网络流量和数据,其实这才是真的支付了用户信息的对价,只是当这些小公司崛起后,就可以搬出“免费数据换免费服务”的调子,开始割用户流量的“韭菜”了。当下,混乱的市场和无序的竞争令普通消费者陷在这类游戏之中,频繁骚扰亲朋好友,却并不能得到公平合理的数据收益。
福克斯于是诉诸集体的力量,认为用户应该通过成为集体财富的集体主人来克服自己的贫困。即便是具有较强议价能力的个体,比如名人大V,也只能威胁转会别家平台,对平台构不成整体性挑战,即便获取补偿,也无法惠及普通用户,通过集体组织进行沟通和协调往往会更为有效。荷兰的“数据工会”就是这种思路的代表性实践,其诉求包括通过谈判从平台处争取到合理的劳动报酬,公开更多数据处理信息,要求脸书提供付费的免广告版本,以及建立一个协商渠道。志愿者们还计划发起“数字罢工”,希望通过技术手段暂时阻断平台向广告商出售位置数据,等等。零工经济从业者比如外卖员群体或可从中借鉴到如何夺回自身工作数据的经验。
更为温和的看法主张这种数据反哺未必是利用者与提供者之间通过合同买卖来进行,也可通过宏观的分配制度间接实现,比如比照国家对全民所有的土地、森林、矿藏、水流等自然资源的利用与对国民反哺的路径,设立特定税收、基金、信托等方式。也可比照银行模式,以银行业业已成熟的一整套法律规范来治理平台,包括定期的算法审核,履行保护客户隐私并限制第三方访问其信息的信托义务,以及向储户提供利息。这样,算法伦理、数据隐私和用户收益三大问题迎刃而解。因此,如能在公平前提下实现畅通的多元分配机制,与用户分享红利,也不一定要在司法上一刀切地将在线活动认定为劳动关系。
沿着这个思路,本文认为,无需另起炉灶,可以充分利用各地大数据交易中心这种全新的特殊机制来打开局面。不仅是因为它们已经形成了非常成熟的数据交易全流程模式,包括会员机制、定价机制、成交机制、交付机制、合规机制,并发布了诸多行业标准,更重要的原因还有三:
1)贵阳大数据交易所、上海数据交易中心等机构都是国有控股混合所有制企业,简言之,即便不能建立B2C(business to customer)数据市场或厘清数据产权,亦无法直接实行数据公有制,但至少B2B(business to business)层面上的每一笔数据交易都是在国家的注视和控制之下的;
2)以贵阳所为例,其收益结构为;会员单位每年至少5万元会费+交易费的40%,全部由数据供应商承担,买方无需缴纳,相当于是和卖方4:6分成。可以看到,数据交易机构利润颇丰,其利润其实就是直接来自于数据经济的税收了。因此,完全无需再设立一个新的税种作为全民转移支付的资金来源,只要确定这部分利润上缴国库的固定比例即可。国企兑现向全民股东的分红,是国有资本的最主要的基本功能之一,也体现了公有制和社会主义制度的特色,中央政府历来强调国企应公开利润流向,提高利润上交比例,要用国企利润反哺社会,完善公共服务体系,提高民生福利,让人民分享国企的利润成果。
3)这40%的交易费用的收取依据之一,乃是因为交易所参与了对数据的清洗、挖掘等工作,以确保完全符合现行数据法律法规的标准,这就意味着,合法数据交易下个人隐私和数据安全是由代表国家的国有企业来参与保障的,其信誉也要大大高于企业自己报告的是否清洗和脱敏的情况。将来不排除还可以建立类似于银监会、证监会的国务院直属单位“数监会”(深圳市政府已经开始进行地方性试验),来进一步规范这些国有数据交易所的行为。同时,执法力度的加大和正规大数据交易的成熟,也将理顺供需关系,挤压数据黑市和地下交易的生存空间。这是在中国制度框架下创造性解决数据问题,促进新经济发展的可行道路。
余论
要理解中国数据议题,传播研究不应只是硬套西方学者关于“监控式资本主义”“全景式监狱”这些无法落到本土情境中的概念,还应丰富和超越“隐私”这一稍显狭窄的框架,从生产资料和经济资源的视角来看待中国的数据议题,将其与全球数字竞争格局、数据驱动型经济、国家大数据战略、产权制度创新等政治经济议题结合起来考察。一方面是数据平台企业从经济和政治两个方面都深刻嵌入转型中国社会的日常运作,提供重要的动能;另一方面又是全球数据治理环境日渐趋严和个人隐私保护呼声日益高涨,同时中国还要面临与技术强国进行大数据、人工智能、云计算、物联网等未来前沿科技布局方面的竞争,力争弯道超车,这些技术领域都极度需要数据的自由流动和交易。在这种两难的情况之下,中国在确保数据安全与促进充分流动之间艰难寻求平衡,通过大力打击非法数据采集,立法逐渐将个人信息、隐私与数据剥离,以不同方式分别提高这两类客体的保护水平,为数据产权问题松绑,将数据转化为可以合法买卖和交易的大宗商品,将大数据产业打造成一个新兴的正规经济部门,并历史性地推动数据要素化改革以最大限度地激励市场积极性,进而培育出全球领先的大数据产业,殊为不易。
不过,关于数据确权问题的法律规制和产业实践都偏向于数据既得利益方,相当不利于作为初级生产资料提供者的普通用户,后者仅拥有名义上免于被追溯的个人信息安全,并不具有对数据的完整权益,尤其是收益权,其与数字平台之间的经济关系被有意无意地忽略和淡化。实践证明,这种“隐私归用户,获利归企业”的二分法在保护个人信息免于被滥用方面是低效的,在推动数据产业和人工智能健康发展方面也未必是长久之计。应该正视用户数据生产的贡献,并在制定分配政策时予以考虑。古典共和主义的政治理论家詹姆斯·哈林顿(James Harrington)开创了从财产所有权角度来理解国家政权基础的视野,他认为应从经济关系的角度来解释政体的分类,当一国的财富相对平均地分配给全体人民的时候,共和制就会成为这个国家的政体。当然,他主要是从地产的角度来提出这一观点的。时至今日,当数据成为可参与分配的生产要素,其分配问题实际上事关社会主义方向,需要顶层设计的智慧。
载《新闻与传播研究》2021年第5期
囿于篇幅,公号舍去注释,完整版本请见刊物。
编辑 | 王心路 夏晓雨