本文以《个信法》的施行“事件”为开端,以“数据价值”为主线贯穿始终,分别阐述了相关“现状”、“趋势”、“制约”、“重生”、“实践”及“保障”几个主题,努力为读者清晰呈现现实中数据价值沉没的严重性,解决问题的必要性,数字经济趋势发展带来的迫切性,新旧技术架构的制约性及创新性,以及从法律政策及技术解决方案带来的保障和实践可行性, 最后我们充满“期待”,相信“区块链+隐私计算”,将开启“数据金矿”之门。
-----全文约1.6万字,建议收藏后阅读----
2.1个人:隐私保护的困境恰是无序商业的狂欢
2.2企业:从数据到价值,智慧业务之痛
2.3行业:数据价值延伸与业务协同问题
3.1互联网技术加速经济数字化进程
3.2数据成为基础资源和创新引擎
3.3新经济发展需要技术体系的重构
4.1“内生性弱点”反噬自身发展
4.2技术体系无力承载数据价值
5.1区块链的结构张力:为价值而生
5.1.1数字资产的价值表示与传递
5.1.2分布式账本技术呈现数据价值
5.2隐私计算让数据“可用不可见”
6.1“个人信息携带权”的可行路径:DDTP
6.2联盟链+隐私计算推动数据规模化应用
6.3Polkadot+phala构建WEB3.0价值世界
6.3.1Polkadot致力成为价值网络的基础设施
6.3.2 Phala致力成为全球隐私计算云平台
.1.
事件:数据隐私被推向聚光灯下
2021年11月1日,《中华人民共和国个人信息保护法》(以下简称《个信法》)正式施行。作为该法总则,第一条明确规定:“为了保护个人信息权益,规范个人信息处理活动,促进个人信息合理利用,根据宪法,制定本法。”所以《个信法》集中体现了以人民为中心的立法理念,并在国家层面建立健全个人信息保护和利用制度,预防和惩治侵害个人信息权益的行为。
从《个信法》立法目的来看,其实质是“规范个人信息处理活动”,其核心要点一个是保护,即“保护个人信息权益”,另一个是利用,即“促进个人信息合理利用”。
在如何做方面,《个信法》构建了以“告知-知情-同意”为核心的个人信息处理规则,并针对“大数据杀熟”、“用户画像”和“算法推荐”等涉及个人信息自动化决策的热点问题,做出了法律规范。
同时,《个信法》全面构建了个人在个人信息处理活动中的7项权利,包括知情权、决定权(限制、拒绝和撤回权)、查阅复制权、个人信息可可携带权、更正补充权、删除权、规则解释权。由此,改变过去个人作为信息主体,却没有信息自由处理权的弱势关系。
可以看出, 《个信法》是以人为本的法律 ,其中各种规定都是围绕个人信息的权属、权利、流转、保护、利用等各个方面建立法律规则,直击数据贩卖、广告推送、数据杀熟以及电话诈骗等数据隐私上的痛点。 我们认为,《个信法》的实施是重大的里程碑事件,以此为开端,推动数据主权回归用户个人,从而将数据隐私保护置于聚光灯下。
.2.
现状:从个人、企业到行业,价值沉没之痛
随着移动互联网的快速发展,我国互联网上网人数达到9.89亿人,互联网普及率为70.4%。人们已经习惯在互联网上聊天、交友、搜索、出行、购物、学习、工作等,每天在互联网上产生巨量的数据,其中个人数据在所有数据当中占比最大,达到68%。
虽然个人每天在互联网上产生大量的数据,但个人却并不拥有数据,相反以亿、十亿计的用户数据资源加速向服务器端几乎零成本地集中,形成事实上的数据寡头及“数字资本主义”,比如Fackbook、亚马逊、阿里巴巴、淘宝、百度等。业界有人说,互联网并不互联,而且有更加不互联的趋势。目前的互联网是“大互联网”,一个“大”字表达出互联网巨头们的傲慢与垄断。
在拥有绝对的数据资源优势情况下,这些数据服务商利用AI等先进的数据技术,进行数据清洗、标识、分类、建模等数据处理,一方面为消费者提供各类增值服务,提高了人们生活、工作的便利性,另一方面建立了数据和资本资源优势,加速占有和剥夺,扩大了商业版图,赚取了巨额利润。
同时,随着数据资源的集中,一些数据服务商以追逐“利润”为目标,违背商业道德,利用数据资源优势作恶的事件常有发生,比如数据贩卖、数据泄密、广告推送、数据杀熟以及电话诈骗等,严重侵犯个人隐私,给个人带来痛苦,甚至出现严重损失和灾难,形成严重的负面社会影响。
个人数据虽然由个人创建,但很多情况下却需要在企业之间流转,责任主体和利益主体不一致,这种现状导致:
所以比较个人数据贡献者获得的利益、损失以及数据呈现出来的垄断趋势来说,互联网目前的发展对数据价值呈现边际递减的效益,数据事实上难以发挥生产要素的功能。
由此考虑,对于个人数据开发需要注意三个方面的问题:
-
如何合理开发个人数据, 使其价值将得到极大释放,以提高民生服务的效率和质量,并成就商业价值。
-
如何打破巨头垄断, 让数据主权回归个人,清除个人数据流转障碍,提升数据利用效率?
-
如何进行数据隐私保护, 防止负面和不法行为,杜绝数据负面价值。数据之所以有价值,是因为其承载着着某些客观事实,这是数据的内在实质。不良行为可能损害数据完整性、真实性,造成数据价值沉没和价值流失。
每个企业的CEO都关注企业的用户价值,关注对用户价值的响应速度,这是判断企业优秀与否的基本条件之一,也是检验企业从业务数据输入、数据业务化到产品或服务输出全业务流程是否通畅、高效的试金石。
从业务数据,到数据业务化的过程,其实是数据价值形成的过程。 业务数据是元数据,是数据输入;数据业务化是为了满足用户需求,而构建产品或服务,形成业务规范的过程。这过程伴随着数据的一系列变化,比如数据采集、数据输入、数据分类、数据加工、数据存贮、数据调用等,同时数据也在企业不同业务部门流转,如市场、销售、财务、生产、检测、行政、运维等。这种变化和流转,让数据更加贴近业务,最终转变为企业输出价值,服务于客户需求。
显而易见,数据的完整性、一致性、真实性、可用性等将会影响到整个公司的运营和服务效率。
-
数据不一致。比如客户信息和财务数据不一样,这种不一致可能导致企业浪费大量时间,金钱和人力,却并不能增加企业的收入。
-
数据冗余。企业缺乏统一的数据管理平台,各个部门都有自己的数据信息,同一种信息重复记录,导致了数据冗余,占用大量资源。
-
数据不完整。比如数据散乱,信息不完整,导致采购的物料无法满足生产部门的需求,造成生产进度的不可控,无法按期交付商品给客户。这种情况将会致使业务低效,降低企业的市场竞争力。
-
不适应业务变化。当引入新的产品或服务,都会导致企业数据的变化,如果没有一套机制来管理这些变化,那么数据就会偏离业务,数据的价值也会产生偏离。
诸如此类的问题,使得企业数据不一致,不完整,不合规,不可信、不可用、不高效, 需要有一套机制和技术手段,让数据更加精益,智能驱动,适应场景,贴近业务,转换价值,形成更智慧的业务。
随着科技的进步,各个行业分工越来越细,而各个细分领域越来越专业。细分意味着割据,专业意味着壁垒, 而一条完整产业链的形成,又需要各个环节之间信息传递畅通、紧密协同。 就如一条生产流水线,虽然分出若干的工位,每个工位有严格的工序,但各道工序之间是相互关联、承上启下的,任何一个工序出现问题,都将影响到整个流水线的运转,最终影响成品的输出。这过程涉及数据价值延伸和各个环节的业务协同。
我们以供应链金融举例。传统供应链金融实践中存在一些难点,比如:
-
信息不通,协同难,风控难:不同企业ERP不互通,导致整个链条上的信息难以打通,协同效率低,而且面对不透明的信息银行难以做好风控。
-
企业信用建立及传递难:通常核心的信用只能传递到一级供应商,可信贸易场景扩展边界受到限制。
-
中小企业融资难:在整个供应链中,由于核心企业有强话语权,在给上游中小企业付款时往往带有账期,这使得中小企业频繁面临资金短缺的压力。而中小企业往往存在自身体量小、治理不成熟和财务不透明度等现状,导致信任数据不足,很难从金融机构获得资金支持和上下游的协作。
面对以上问题, 融合区块链和隐私计算的技术特征和能力,能够提供完美的解决方案,在确保数据真实、完整、可信的基础上,推动产业链上中下各个环节数据畅通流转,释放数据内在价值和信用价值,扩大各环节产能,提高整个行业协同效率和生产力。
.3.
趋势:正在到来的数字世界
信息技术以及互联网的发展,给人类带来了极大的便利,但同时也呈现出发展中的各类问题。虽然我们还来不及一一面对和解决,但历史的车轮总是滚滚向前,“数字世界”正迎面赶来。
1994年,中国实现了与国际互联网的全功能连接,进入互联网时代,开启了经济数字化进程。虽然2000年前后全球互联网泡沫破裂,行业经历了2-3年的低迷阶段,但走出低迷后互联网用户数量持续高速增长,截至2012年底,中国手机网民规模达到4.2亿,首次超过台式电脑成为上网第一终端,新业态不断涌现,这表明中国数字经济发展进入了新的阶段。
所谓数字经济是以数字化的知识和信息作为关键生产要素,以数字技术为核心驱动力量,以现代信息网络为重要载体,通过数字技术与实体经济深度融合,不断提高经济社会的数字化、网络化、智能化水平,加速重构经济发展与治理模式的新型经济形态。 从生产力和生产关系的角度来看,数字经济具有“四化”【1】特征,即数字产业化、产业数字化、数据价值化和数字化治理。如图3-1所示:
数字经济“四化”框架,表明了数字经济发展的基础是数据价值化, 核心是推动数字产业化和产业数字化,以数字化治理作为数字经济发展的保障。 随着“四化”的推进,产业内部各要素也在发生创新和变革:
首先,我们来认识什么是数据,这需要追根溯源,回到我们如何认识这个世界的方式上来。
在《佛学次第统编》里说:依于六根,接于六尘,所生之识有六,谓之六识。即六根染六尘生六识,意思是通过眼、耳、鼻、舌、身、意这些身理及心理的六根,接触到色(颜色、形状)、声(声音)、香(气味)、味(味道)、触(身体感触粗细冷热湿滑等)、法(思想)六尘,产生眼识、耳识、鼻识、身识、意识,即辨别各种事物的官能活动,统称为六识。
其实这就是人类感知和认识这个世界的方式。所谓的“色声香味触法”,其实就是现实中的感知对象,即通过文字、数字、图形、图像、声音、视频等形式表现出来的事实,形成我们感知的世界。将这些文字、数字、声音、图像等进行数字化处理,在计算机及互联网中进行存储和传播,就是所谓的数据。从这个意义上来说,数据是指所有能够输入计算机进行数字化处理,具有逻辑关联和意义,反应一定事实的符号介质的总称。事实上,“数据”这个概念也是随着计算机和互联网发展而逐渐普及开来的,同时数据的价值也是在此过程不断被挖掘、释放,并在数字经济的形成和发展中起到至关重要的作用。
所谓数字经济,在经济数字化的趋势中,实际上就是数据经济,甚至可以说“无数据,不经济”。所以数据就是数字经济的基础元素;而汇聚的数据成为数据资源,成为数字经济建设的基础资源,这体现出数据的自然属性。当数据资源被采集、标准化、标识、确权、定价等,用以生产、交换、流通、消费等经济活动中时,数据资源转变为生产要素和数据资本,释放出使用价值和资本价值,这是数据的经济和金融维度。在数据从资源变为生产要素和资本的价值化过程中,数据成为最底层的创新引擎和驱动因素,创造出新的经济模式和业态,推动数字经济纵深发展。
数字经济的核心要素就是数据, 而数据赋能经济发展的过程即是数据价值化的过程,这过程中数据经历了一系列的变化,其中包括数据采集、数据加工(数据标准、数据标注等)、数据存储、数据确权、数据定价、数据保护、数据流转、数据分析、数据应用等,如图3-2所示:
企业在经营过程中,针对不同的数据类型进行采集,并进行分析处理训练。 这是现阶段大数据、人工智能分析与训练的主要数据来源。这需要从上到下的整体设计,才能保证数据的真实性、一致性、可用性。涉及到的信息采集及处理方面的新兴技术包括大数据、人工智能、物联网、区块链等。
在进行数据存储过程中, 企业主要会从数据敏感度、数据时效性、企业硬件水平等维度考虑,选择不同的数据存储服务和技术手段,比如云存储或者去中心化的分布式存储等。涉及到数据存储及计算方面的 新兴技术包括云存储、分布式账本技术、云计算、边缘计算、隐私计算等。
数据加工主要包括数据清洗、数据标注、数据审核以及数据融合处理等方式。特别是企业在信息化建设过程中, 积累了大量多源、多模态异构数据,需要进行融合和挖掘,才能释放出数据内在和延伸的价值。这过程涉及到的新兴技术包括自然语言处理、计算机视觉、并行计算等。
数据流通是数据要素市场的重要环节,发挥着传递数据价值、扩展应用场景、提升决策效率等方面的显著作用。 根据实现技术方式不同,数据流通包括数据开放共享、数据交易、“数据可用不 可见”模式、“数据可算不可识”模式等。 其中“数据可用不可见”模式是指通过隐私计算技术,实现 数据在加密状态下被用户使用和分析,涉及到安全多方计算(MPC)、联邦学习(Federated Learning)、可信计算环境(TEE)等。这些技术在保证数据所有者权益、保护用户隐私和商业秘密的同时,充分挖掘发挥数据价值。
上面列举了数据价值化过程中需要的部分新兴技术, 这些技术正在改变数字经济实现和运行的逻辑,并不断催生新的经济形态,比如WEB3.0、元宇宙、链游、数字资产等。 但这里强调的不是某一个或者几个技术发挥重要作用,而是引导我们去思考,随着新经济形态不断加速发展,形成规模化的经济业态,这种趋势强烈需要来自底层整体技术体系的重构和支撑。无疑,这种趋势对现有基于TCP/IP、HTTP、SMTP、C/S等技术和模式实现的互联网基础架构的支撑能力和可持续的适用性提出了质疑和挑战。
.4.
制约:廉颇老矣尚能饭否?
随着计算机技术及互联网的发展,推动了经济数字化,走向数字经济;同时,数字经济的发展也越来越依赖于互联网络的支撑,互联网成为了数字经济的基础设施。
但是随着数字经济的规模体量越来越大,新经济业态日新月异,现有互联网络的支撑能力、健壮性、适用性受到了严重的挑战,其“内生性弱点”愈加凸显。
所谓内生性弱点,是从互联网诞生时就伴随而来的,是由其最初的设计理念、技术架构决定的,所谓如是结构决定如是功能,结构之外就显得捉襟见肘。 当初的技术结构实现互联网的WEB1.0、WEB2.0发展,但当走向WEB3.0时,原有的技术及架构似乎显得“廉颇老矣尚能饭否”。
如下图4-1所示,Web1.0实现了信息的自由发布,即信息流动是单向的,用户只能被动浏览信息,如早期的门户网站;Web2.0实现了自由交流,即信息是双向的,不仅可以浏览,还可以互动交流,实现了社交功能,如Facebook、微博。Web1.0和Web2.0这二者都称之为信息互联网,信息在全球范围内的传输变得异常高效和廉价。
图4-1 互联网从WEB1.0至WEB3.0的发展轨迹(来源:Capital IQ)
各类数据在互联网上大量产生,并基于一种C/S结构不断在服务器端集中,而拥有服务器的数据应用服务商(如Facebook、亚马逊、阿里、腾讯等)越来越拥有数据资源优势,形成了资源垄断。纵观WEB2.0发展的20年,其实是网络平台化(中介化),中介巨头化(不断干掉地方小中介)、垄断化的过程。这样的趋势发展下去,必然阻碍创新,互联网将因自身结构性“内生性弱点”带来的“野蛮生长”而反噬自身的发展。
同时,这种信息传输网络并没有对有价值的信息进行保护的内在机制,在网络上复制、传播乃至篡改一条信息的成本几乎为零,也无法点对点传递带有所有权的信息。但我们知道,信息(或者说数据)与价值是密不可分的。
现实世界以数字化的方式映射到计算机承载的数字世界,形成数字世界所谓的数据,所以数据成为表达事实的一种方式。 而通过电子设备采集来的无序数据是不能表达事实的,所以数据需要被清洗、标准化、标识,进行建模、分析等,我们把这个过程称之为数据价值化,其实是让数据呈现出意义,还原事实,能够更完整的表达事实。
数字世界的数据最初从表达事实,逐步发展到现在开始表达数字资产,以及创造新的事实,或者说新经济形态,如网络购物、游戏、元宇宙等。 这种创造的事实最初在数字世界,但因为人是现实中的人,所以很快映射到现实世界,呈现出现实世界与虚拟数字融合之势。
-
一是作为劳动对象,尽其所能地表达部分或者几乎全部的事实(数据表达出来的意义,即价值);除了表达现实中的事实,数据能更好地、完整地表达数字世界原生的事实,如元宇宙的人物、资产和事件。
-
二是作为劳动工具,或者生产要素,参与到新的价值创造中去,成为数字经济中新兴经济形态的基础要素和创新引擎。
-
三是作为一种数字资产,本身代表一种资产价值,并在流通、交易中的体现出流动价值。
这些数据价值如何承载和传递? 我们有了互联网这个全球范围的高效可靠的信息传输网络后,必然要求一个与之匹配的高效可靠的价值传输网络。然而从Web1.0到Web2.0,现有的技术架构并不能解决数据价值化所需要解决的一系列问题,如采集数据的真实性,数据的权属问题,数据存储的一致性、防篡改、可追溯问题,数据资源的去中心化问题以及数据流动和使用过程中的隐私问题。而一些新兴技术的出现,如区块链技术、隐私计算、人工智能等,将为数据的价值化提供可行的解决方案,极大地释放数据价值,从而开启数据金矿之门。
所以Web3.0不是简单的Web2.0的升级,它将集成一系列新兴技术,进行底层架构体系的变革与创新,实现数据价值的承载和传递,从而成为数字经济的价值基础网络。
.5.
重生:鸡蛋从内部打破
俗话说鸡蛋从外面打破,是摊鸡蛋,这是鸡蛋的利用价值;然而如果鸡蛋从内部打破,则是新生命的诞生,即将开启新生命朝气蓬勃的生长、发展,以及生生不息地繁衍之路。这将是一番不同的景象。
区块链的出现,就是从互联网这个“鸡蛋”内部打破,实现从底层技术的变革,重构了整个技术架构,而让新一代价值互联网迸发出崭新的生命力。
在信息传输时,互联网的TCP/IP的四个层次组合在一起实现数据的高效传输,如图5-1所示:
但要在数字世界中表示价值、转移价值,互联网在基础协议层次并没有提供支持,为此我们需要在网站、App中做大量工作。特别地,我们通常需要一个中心化机构来担任可信第三方的角色,帮我们管理记录价值的账本,协助我们进行价值转移。
而随着BTC的出现,区块链技术打破了这种“价值无能”的局面,在一个技术堆栈里成功实现价值的两个重要功能:价值表示和价值转移。 如图5-2所示:
现在,我们不再需要可信第三方来协助进行价值表示和价值转移,用户可以通过区块链来进行价值表示和点对点的价值传输和交易。区块链对数字世界中与价值相关的应用功能进行了抽象,从原应用层独立抽离出来,形成了网络通信的价值层,而BTC就是其中最成功的应用, 如下图5-3所示:
起初阶段,BTC与区块链在人们的语义中基本是同一回事,但随着区块链技术不断创新发展,区块链已经独立于BTC而呈现出焕然生机。如图5-4所示,通信协议模型的各个层面被彻底重构,如数据存储层的Filecoin、IPDB等,计算层的以太坊、EOS、NEO、波场等,网络互连层的Polkadot、Cosmos、IPFS等,价值层的BTC、Defi、NFT等, 这种“鸡蛋从内部打破”的内在结构改变,必然带来功能改变和应用创新,推动互联网从WEB2.0到WEB3.0的完美华变,成为价值表示、价值传递、价值自由交易为 典型特征 的价值互联网。
前面部分,我们已经论述,数据作为劳动对象,通过采集、清晰、标准化、标识等加工,然后进行数据分析、建模,输出一个结果,目的是表达某种意义或者说呈现某种事实,这就是数据价值化的过程。
在此过程中,分布式账本技术采用全网分布式存储,可以确保数据完整性、一致性,并且防丢失;采用多方共识记账,可以确保数据真实性,可验证、防篡改;数据以块的链式结构保存,具有可溯源、易追溯的特性。如图5-5所示:
-
一方面, 基于这些特性,分布式账本记录的这些全量数据,可以更好地表达事实,从而锁定数据的价值。
-
其次, 可以构建起新型的信任模式,从人与人、人与组织、组织与组织的信任方式,拓展到代码信任、算法信任、机器信任,从而稳固地建立起对链上数据的信任,这样的数据就会成为一种“数据资本”,一定会衍生出信用,从而产生数据衍生的信用价值。
-
再者, 区块链技术可以实现数据确权,支持数据所有者与数据价值紧密关联,有利于在商业运营中建立三权(所有权、使用权、分配权)平衡机制,最大化数据价值。首先,因为数据的采集可能与人和物相关,使用区块链身份体系DID(Digital Identity Document,数字身份),可以将数据采集者的个人身份在数字世界一一对应,并以Hash加密的形式存储在区块链上进行区块链确权;然后,在数据流转过程中,可以通过数字水印,将每一个流转步骤中加入操作者的DID信息,从而实现使用者个人信息及操作记录上链。最后,因为链上数据公开、透明、可验证、可查询,从数据输入到最终产品或服务输出整个过程中各环节价值贡献就可以被度量和确权,从而让各环节获得公平的利益分配。
区块链实现了价值的表示和传递,而且链上数据是透明的、可查询、可验证,这保证了公开、公平、共享,但同时也引发出另外一个问题,比如一旦链上钱包地址和某人对应上,那么这个人在链上的资产流动和交易就完全透明,毫无隐私可言,给个人带来困扰,而对于一些投资机构来说,甚至会直接影响到决策执行的效果。在这一点上,隐私计算“可用不可见”和“可算不可识”的特征,恰能弥补区块链这方面的弱点,保护数据安全,释放数据价值,相得益彰。
个人数据方面。 在这个移动互联网时代,个人生产了大量数据,比如消费数据、金融数据、休闲娱乐数据等,但产生即转移,个人并不拥有数据,更谈不上能支配个人数据;数据被采集、转移,成为数据服务商的数据资产而加以利用,获取丰厚利润。这种责任主体与利益主体不一致的现状,使数据生产者不能分享数据价值,反而因为个人数据被过渡利用而受到损害,从而阻碍数据的价值释放。而隐私计算与区块链的结合,一方面可以让个人数据上链,进行确权,将数据所有权还给个人,为“个人信息携带权”提供有效的技术解决方案,确保个人数据生产者参与到整个数据流转的利益链条中去;另一方面,可以将个人数据进行脱敏处理,从而大大提高个人贡献数据的能动性。
在数据作为生产要素方面, 聚合多维海量数据,充分挖掘和利用其内在价值,是各个产业机构的战略重点。而其关键环节在于能否打破数据孤岛,解决数据权属模糊问题,推动安全、可信的数据共享及价值流转,最大化挖掘数据的生产要素价值。隐私计算与区块链技术的结合,可为人们提供一种在数据本身不用交换的情况下实现数据价值共享的技术路径和解决思路,在数据共享中实现价值挖掘与隐私保护之间的平衡。
.6.
实践:价值世界的探索之旅
综上所有分析,我们处在信息爆炸的时代,数据繁多且无处不在,面对数据泄密、骚扰、垄断、价值流失,人们往往无所适从;同时,我们也正值“无数据,不经济”的时代,数据的价值毋庸置疑,面对这座巨大的数据金矿,人们充满渴求,趋之若鹜。如何在开发利用数据价值的同时能够趋利避害,这需要行业各界人士审慎考虑。我们惊喜的看到,在行业内已经涌现出一批解决方案,在个人、行业及通用层面,开启了数据价值世界的探索之旅。
与《个信法》落地相呼应,10月21日,金链盟等机构发布《DDTP—分布式数据传输协议白皮书》(DDTP全称:Distributed Data Transfer Protocol)【2】。
DDTP是一种新型的分布式数据传输协议,是基于区块链分布式账本技术进行设计,利用区块链去中心化、可信任、可追溯、防篡改等特性,叠加权威认证机构的参与,从而实现自主、可信、多方协作、安全高效的个人信息携带应用。这是中国首个推动数据主权回归个人用户的实践探索。
如图6-1所示, DDTP旨在让用户成为关键参与者,由用户主动发起个人信息数据传输并自行上传,从而实践个人数据可携带权。这过程分为两步来实现:
-
第一步: 基于《个信法》“个人信息可携带权”,用户根据个人意愿从“数据提供者”处下载个人信息数据,并存储在个人指定的位置。在数据存储过程中,为保证个人意愿的真实性,数据的真实性、一致性、完整性,可经用户授权后引入权威中立的第三方机构见证数据存储过程,并获取相关文件的哈希值(而非源文件)作为“数据指纹”存储于区块链上。
-
第二步: 用户将下载的个人信息数据传输给数据接收者,并对使用范围和使用目的等进行授权。数据接收者收到数据文件后,可以通过“数据指纹”的核验,完成验真过程。与此同时,个人所有授权记录、数据接收者的具体使用情况也皆可在链上进行记录,便于个人未来追溯相关文件的流转。
DDTP的运作模式中,以用户为核心, 围绕“个人信息可携带权”的实施,涉及到个人、数据提供者、数据存储机构、权威见证机构以及数据接受者多方行为主体,形成“数据请求-数据提供-数据存储-权威验证-数据指纹-数据接收”的完整流程,在这过程有几个显著特征:
-
个人自主权利: “个人”是数据传输的发起方,可自行选择数据存储位置,对数据授权范围和使用方式均有话语权。
-
高安全性: 数据携带过程中存储和验证分离的设计,可以避免数据的不必要复制,提高安全性。
-
可信传输: 基于对区块链不可篡改特性的充分利用,DDTP将个人信息存储、传输和验证分离,解决了验真、溯源、审计、信任机制传递等方面的问题,这便是“可信传输”的实现。
-
合规、合理: 由用户自主发起并结合 “数据指纹”上链验证的方式,既符合政策的合规要求,又能解决跨机构、跨行业、跨场景的数据协同生产问题,降低数据使用者处理数据的成本,产业各方的参与积极性也可以得到提升。
根据金链盟的介绍,DDTP并不是单一的项目,而是通用协议,是基于AI、云计算、大数据、加密算法、区块链等新技术构建的底层平台,能够将所有分散的细分领域应用平台链接起来,可广泛应用于跨行业和跨企业的数据合作场景,实现安全存储、可信传输、协同生产,让产权可界定,价值可存储,价值可评估、价值可流通,最终实现数据生产力的解放。
隐私计算和区块链的关系是紧密相连的共生关系。 这是源于隐私计算基于诸多密码学技术,而区块链则是密码学最好的落地载体。 一方面,区块链上的数据需要采用隐私算法来保护;另一方面,区块链也可以成为隐私计算协作里的底座和枢纽。隐私计算与区块链两者相互叠加才能发挥一加一大于二的效应。
隐私计算是一种技术范畴和集合,其技术路径包括多方安全计算、联邦学习、可信执行环境,如图6-2所示:
各种技术各有优势,适合不同的应用场景,而集合这些技术, 隐私计算可以在保护数据本身不对外泄露的前提下,多个参与方通过协同对自有数据进行处理、联合建模运算、分析输出结果,实现数据价值挖掘。 同时,隐私计算可与人工智能、云计算、区块链分布式网络等前言技术融合应用,为数据保护提供技术可行性。
在与隐私计算融合的诸多技术中,联盟链在支撑规模化商用方面具有优势,受到重视,正发挥着越来越重要的作用。 比较而言,公有链主要基于加密货币构建DApp应用,而联盟链重点在于将区块链技术应用在商业应用上,提升商业应用的数据可信能力、追踪溯源能力、应用协同能力,实现商业应用的规模化和产业化。这也符合我国区块链发展的战略导向。
目前我国隐私计算和区块链技术正在不断地发展迭代和快速应用中,特别是一些大厂,针对行业应用都在大力部署和应用推广,如图6-3所示【3】:
图6-3 隐私计算和区块链应用案例分析(数据来源:中国信通院)
6.3Polkadot+Phala构建Web3.0价值世界
-
6.3.1Polkadot致力成为价值网络的基础设施
2016年10月,Gavin Wood发布白皮书《Polkadot(波卡链):畅想一种异构的多链架构》。 波卡是继BTC、ETH、EOS之后的最具影响力的公链之一,旨在通过一个基础的、最小化的基础区块链来链接不同应用的、异构的区块链,实现完全去中心化、跨链互通、万链互联、价值自由传递,形成区块链的互联网。 同时,针对Web2.0日益中心化带来诸多数据泄露问题,Gavin Wood提出了去中心化的Web3.0的概念,意图打破信息被滥用的僵局, 希望通过构建Web3.0去中心化网络,让每个人都能够掌控自己的数字身份、资产和数据,从而掌握自己的命运。
随着WEB3.0概念被业界关注,引发共识,WEB3.0的内涵在不断地扩展。对于WEB3.0,虽然目前还没有完整的画像,但它应该具备这样一些特征:数据驱动、用户主权主导、去中心化、代码信任、隐私保护、价值网络、共享经济等。“Web3.0 将催生一个全新的全球数字经济, 创造新的商业模式和市场, 打破像 Google 和 Facebook 这样的平台垄断,并产生大量自下而上的创新。”这是Gavin Wood对Web3.0的畅想。 我们认为波卡正在致力于成为下一代互联网WEB3.0的最重要的基础设施。
为什么说波卡是WEB3.0最重要的基建?其他公链可以吗?我们认为其它公链能解决数据问题,但是波卡能跨链,只有跨链才能实现协同网络,而协同网络才是互联网最大的价值,也是去中心化得以实现的前提。波卡不仅具有区块链技术共有的公开透明、去中心化、一致性、可验证、防篡改、易追溯等特性,它最核心的创新是通过分离共识结构中一致性和有效性,实现“链”的扩展,从而从基层架构根本解决诸多公链存在的伸缩性、扩展性及跨链问题,成为基于共识的协同网络。
其中中继链是Polkadot的核心, 负责整个网络的安全性、共识和跨链互操作性;平行链是波卡上独立的主权链,实现各种功能及应用场景,如隐私计算、去中心化金融、浏览器、游戏等;转接桥允许 Polkadot 分片连接以太坊和比特币等外部异构网络并与之通信。所以波卡实现了“链”的扩展和连接。
从连接角度来看,WEB1.0将电脑连入网络,形成互联网,实现信息的自由传递;WEB2.0将人连入网络,实现移动和自由交互,如移动聊天、移动支付、滴滴打车及网络购物等;而WEB3.0将各类智能终端连入网络,实现万物互联。
万物互联将带来数据成万倍的增长,而目前单个的区块链无法承载庞大的网络数据,且多个区块链之间又存在信息孤岛的问题。尽管很多公有链、联盟链等都在不断发展、改进中,如基于以太坊的公链部署了最为丰富的生态项目,积累了大量资金、数据,但这些项目之间并不能很好的交互资产、数据等,这并不利于整个区块链世界的成长,也不符合Web3.0的发展需要。
而波卡异构分片、链接多链的架构特征恰恰符合人们对WEB3.0的定义和期待。波卡创造者与WEB3.0概念提出者都是Gavin Wood博士,所以波卡本就与Web3.0是一脉相承,而波卡所构建的万链互联的网络,既能契合当前众多公有链、联盟链百家争鸣的发展情况,又能满足Web3.0各种应用、数据、资产互联、互通、跨链、去中心化的需求。 所以波卡不仅仅是一条公有链,更是所有区块链的底层基础设施,在万链互联之上实现数据跨链、万物互联,必将将重塑互联网模型,成为Web3.0价值网络的基础设施。
-
6.3.2 Phala致力成为全球Web3.0云服务平台
在《Phala Network技术白皮书》中这样陈述: 公链一般通过基于共识算法的状态冗余来保障安全。 虽然这种方法保证了数据的不可篡改性,但同时也意味着区块链上的一切信息都是公开的,由此产生了一个问题,即:不具备保密性的区块链无法处理机密信息。这个问题在很大程度上限制了区块链在处理敏感业务数据和用户数据方面的应用。例如,股票交易人员通常不愿意披露其对股票走势的看法或其交易历史记录。
针对区块链公链的数据保密问题,业内已经提出了一些解决方案,如图6-5所示:
针对以上解决方案的优势和缺点,Phala network提出TEE-区块链融合架构(TEE-Blockchain Hybrid Architecture),并基于此架构,融合新型的智能合约产品(Fat Contract)和Polkadot中继链架构,构建具有去信任化、去中心化、隐私保护、跨链、高计算性能以及任意扩展等特征的“全球Web3.0云计算平台”。
Intel SGX硬件和远程认证协议是保密合约的基石,使得保密智能合约运行在CPU内的特殊安全区Enclave,合约的执行与外界完全隔离,保证了数据的保密性。其流程通过如图6-7进行说明:
上述流程有两个要点: 一是由于每个申明都与 Intel CPU 一一对应,伪造的声明一定无法通过远程认证服务的检查;二是已获得签名的认证结果可以证明已在 SGX 安全区中运行特定代码并生成了特定结果,进而可以证明执行进程未发生任何错误,且实现了保密性。
综上过程可概括为一句话: “数据及过程状态硬件隔离,流程可信,所以结果可信”,即可信硬件构建的可信环境=去信任化(Trustless)=流程执行的正确性+数据的保密与隐私性,这是是 Phala Network作为可靠的分布式计算网络的基石。
2、 “共享经济”模型:PSWM机制+Fat Contract实现Web3.0去中心化、高性能云服务
数据隐私只是Phala network的基础特征之一,另外一个基础特征即是去中心化计算云。 基于Web3.0的典型特征,我们相信Web3.0 需要一个更加通用、易用且基于共享经济的解决方案,以实现高可用性和超强的计算能力。这种能力在Phala Network的解决方案中,主要由PSWM(Phala Secure Worker Mining)【5】机制结合Fat Contract智能合约产品来实现。
● PSWM机制构建可持续扩展的超强算力网络
Phala network采用区块链协议以允许任何计算节点加入网络,实现去中心化,并为其提供可用的、稳定的计算服务。这也是PSWM 机制的诞生根源。
根据Phala network联合创始人Marvin Tong介绍,截止目前PSWM机制已在Phala先行网 Khala 网络上平稳运行了近3个月,有超过 2 万个计算节点在 Khala 注册,其中超过 1.5 万台服务器长期、稳定地在 Khala 运行,所提供的 12 万+ vCPU 计算资源规模在 Crypto 领域首屈一指,可为 Web3.0 世界提供大规模计算服务。 仅在 Khala网络 上,就拥有了将近 1% 的 AWS 计算规模。未来部署在 Phala Network 主网上可供 Web3.0 世界使用的可信计算节点的数量,有望突破 10 万个。
● Fat Contract实现去中心化、高可用性Web3.0云服务
基于 EVM 的智能合约的初级 Web3.0 云服务已经在 2019 年开始的 Defi 和 Gamefi 浪潮中体现出了巨大价值,但传统智能合约依然无法驱动高频交互、密集计算、大吞吐量、低延迟的服务,仍然有许多 Defi、元宇宙、Web3.0 游戏应用在使用传统智能合约的同时,还需要将前端和后端部署在AWS、Google Cloud 等中心化服务上,由此给整个系统带来中心化系统具有的脆弱性、数据安全性等问题。
Fat Contract是一个基于 Phala 隐私合约概念的智能合约产品,专注于提供Web3.0后端函数级服务,与基于EVM的传统智能合约比较,具备低延迟、异步互操作、高性能计算、无需信任以及数据保密性等特性,可在多种应用场景使用,如低延迟需求的场景,如:Orderbook交易所、多人在线游戏等;链下互联的场景,如:预言机、去中心化聊天或通讯服务(Telegram或Email);需要授权型数据的场景,如:API 接口、数据市场平台;大型实时计算程序,如:元宇宙、游戏、NFT渲染、人工智能(推荐引擎等)。
综上,我 们可以说Phala Network的核心是高性能云计算网络,结合可信硬件,可在不牺牲数据机密性的情况下实现大规模云计算处理,从而实现去中心化的、强大安全的、高计算性能的、可扩展的、无需信任的共享经济模型。
Phala Network使用了波卡开发者工具Substrate进行网络开发。Substrate 是波卡开发团队Parity自己研发的一套区块链开发工具,大大降低了从零开发区块链的难度,提升开发效率。
当Phala Network获得Polkadot平行链插槽后,将作为Polkadot的一条平行链,通过Polkadot中继链与其他平行链进行通信和互操作,从而为整个Polkadot生态网络提供隐私保护和算力服务。
根据Phala团队介绍,由于计算资源消耗大,没有可用的去中心化计算和后端协议,目前大多数元宇宙平台在被迫使用传统云服务。所以当前Phala Network将重点扶持元宇宙生态的建设,主要从两方面进行推进:
-
一是与元宇宙平台建立战略合作。 据悉今年6月Phala团队与新西兰区块链技术服务商Bit.Country达成战略合作:Bit.Country旨在帮助用户构建虚拟世界,比如当下火热的链游、元宇宙;Phala将为Bit.Country提供隐私基础设施服务,使得Bit. Country可以为用户提供私人虚拟世界、NFT 和加密信息。
-
二是 通过财政拨款的方 式,鼓励开发者基于Fat Contract开发元宇宙生态基础设施, 比如Web3.0 渲染农场、Web3 Game Server以及通用游戏引擎等。
需要特别强调的是, Phala团队基于Bit.Country元宇宙系统创建了Phalaworld,其中包括创新性NFT 角色协议,可为 Phala Network每一个地址自动生成具有成长性、互操作性的 NFT角色,并且这些角色可以接入主流元宇宙平台。 所以Phalaworld是 Phala Network的游戏化,玩家们在Phala Network当中所做出的贡献可以升级在Phalaworld的角色;相反,玩家在Phalaworld的活动也能在Phala Network获得额外收益。
不得不说,这是别具意义的创举,区块链系统与元宇宙相互投射,经济系统的角色在元宇宙获得新的生命力,打开了元宇宙无限空间;如此这样,元宇宙犹如大海,接纳每一个区块链系统“投怀送抱”,而呈现“海纳百川”。 而元宇宙角色反作用区块链经济系统,无疑也将强化区块链系统,增加其“经济价值”的健壮性。 这种创新模式无疑为区块链系统到元宇宙的转化建立了一个通用范式,在当下“元宇宙+链游+NFT”的热潮中,或许将加速区块链进入元宇宙的精彩世界,而Phala Network也将在Phalaworld的助推下,迎来浩瀚的星辰大海。
.7.
保障:法律体系及政策构建生态保障
2021年11月1日《个信法》正式施行,意味着我国对个人信息安全的保护进入了新的历史时期,我国公民的个人信息安全及隐私保护走上了新台阶。 同时,也标志着我国以《网络安全法》、《数据安全法》和《个信法》为基础构建的信息数据法律体系已经基本建设完毕。如此强力的全方位监管对各大金融机构、征信机构和数据驱动型企业来说,意味着针对数据野蛮掘金的时代正式结束。合法合规是唯一的出路,逐渐完善的法律体系将为数据的开发利用保驾护航。
在完善法律体系框架的同时,中国政府部门在不同阶段推出各项政策、指导意见以及条例规划等,进行顶层设计,提供政策土壤,探索适合我国大数据产业发展的路径。比如:2014年,“大数据”第一次写入政府工作报告,标志着我国对大数据产业顶层设计的开始;在“十三五”期间,大数据相关的政策文件密集出台,为数据作为生产要素在市场中进行配置,提供了政策土壤;2020 年 4 月,中共中央、国务院印发《关于构建更加完善的 要素市场化配置体制机制的意见》,将数据列为生产的要素,明确指出了市场化改革的内容和方向。2021年11月14日,国家网信办公布的《网络数据安全管理条例(征求意见稿)》提出,国家建立数据分类分级保护制度。国家对个人信息和重要数据进行重点保护,对核心数据实行严格保护。如图7-1所示:
.8.
期待:数据金矿,芝麻开门
根据国家工信安全中心测算数据,目前我国大数据市场规模已经达到1 万亿元,在数据采集、数据存储、数据加工、数据流通、数据分析以及数据应用各产业环节初具规模,数据作为生产要素的属性愈加凸显, 为后续的加速发展夯实了基础。
同时,随着云计算、大数据、人工智能、区块链等技术创新和融合应用的进一步发展,实体经济数字化转型将迎来新的发展时期。预计到2025年中国数字经济规模将达到60万亿元,数字经济将成为经济高质量发展的新动能, 必将迎来数字产业发展新机遇。
而如前所述,《网络安全法》、《数据安全法》和《个信法》形成了信息数据法律体系,结合持续推出的各项政策、条例、指导意见, 不断释放出数据隐私保护和价值开发的政策红利。
最后落实到产业发展上,无论是企业,还是组织,都在积极探索、实践各种技术、产品、服务的解决方案。我们相信对于数据要素的全生命周期各个环节,区块链结合隐私计算,提供真实性、完整性、一致性、隐私保护、高效计算的的解决方案,实现数据确权、定价、交易和高效流转, 必将加速数据价值的释放和利用,从而开启数据金矿之门。
备注:全文内容仅代表本号作者观点,不作为任何投资决策的依据,如有失偏颇感谢指正。文中涉及引用都在参考文献列出,若有遗漏,请与本号联系,我们会及时调整修改。
参考文献
【1】中国信息通信研究院,《中国数字经济报告》,2020年
【2】金链盟等,《DDTP——分布式数据传输协议白皮书》
【3】隐私计算联盟等,《隐私计算与区块链技术融合研究报告(2021年)》
【4】Phala团队,《Phala Network 技术白皮书》
【5】Marvin Tong ,《致社区|推进元宇宙走向 Web3.0 时代》