查看原文
其他

关瑞玲 栾晓曦:业务层的主要功能是实现数据资产交易|《产业转型研究》专刊报道

关瑞玲 栾晓曦 清华大学互联网产业研究院 2024-01-09




导 读

《产业转型研究》专刊前六期刊物在发行后收获了强烈反响,得到了产业界的一致好评。日前,《产业转型研究》专刊第七期刊物已正式刊发。本公众号会对《产业转型研究》专刊第七期中所收录文章进行持续报道,欢迎各位读者关注。

本文为清华大学互联网产业研究院关瑞玲、栾晓曦发表于《产业转型研究》专刊 2022 年第 12 期 总第 340 期的文章,特此分享,以飨读者。

△《产业转型研究》专刊第七期


业务层的主要功能是实现数据资产交易

文/关瑞玲  栾晓曦

关瑞玲、栾晓曦:清华大学互联网产业研究院



业务层是整个生态中的核心环节,主要的功能是实现数据资产交易,并为激励层衡量数据资产价值提供主要依据。

PART.A

运行逻辑

01|数据资产存储

在业务层中,数据资产是通过星际文件系统(InterPlanetary Filesystem,以下简称IPFS)实现分布式存储,以确保数据资产存储的安全性。IPFS 是一种点对点传输协议,通过分布式存储确保数据的安全性和隐私性。

使用自主可控知识产权的 IPFS 传输协议,既保证数据资产的存储安全,也可保证基础设施的技术安全,避免核心关键技术“卡脖子”问题。

02|数据资产确权

数据资产通过上传至 IPFS 网络,生产对应唯一标识的 CID 后,将在区块链上生成证明数据资产所有权、使用权等权属关系的智能合约,这便是数据资产的链上确权的过程。

区块链技术利用密码学、共识协议等技术实现网络传输与访问安全,通过多方维护、交叉验证等方式,以确保数据的全网一致和不易篡改。因此,区块链技术为数据资产交易生态构建信用体系提供基础保障,链上的数据资产权属证明可更好地保证数据资产权属人的相关权益。

根据分布式账本的公开程度,区块链可分为公有链、联盟链、私有链三类。联盟链的公开程度介于公有链与私有链之间,账本权限仅对联盟内成员开放,既能保证链上数据的隐私与安全,又可满足多方参与维护链上数据。联盟链上的交易数据将自动生成各分类目录的交易数据资产排名,该排名不仅能帮助数据资产交易买卖双方实时了解市场的数据资产交易状况,还可为激励层的数据资产法人主体提供估值依据。

03|数据资产交易流通

数据资产交易流通主要分为两块:数据资产交易池和其他权益的流通交易。

数据资产交易池为数据资产的交易流通提供业务场所,在数据资产交易池中,还包含撮合系统和智能合约计算系统等功能组件,以确保数据资产交易的流畅性和适用性。根据对数据的需求不同,可将数据资产交易分为数据的所有权交易和数据的使用权交易。而这两种不同的交易,在业务层通过技术架构将实现全程可追溯的交易活动。

数据资产通过在交易池中被交易流通,拥有了被市场认可的公允价值,该过程是通过市场行为对数据资产进行定价。因此,数据资产的所有权人可对被市场定价过的数据资产进行其他权益的处置,例如抵押权、质押权等。所有权人还可评价数据资产向商业银行申请抵押贷款,同时所有权人在交易所内的交易行为的履约记录,也可成为银行批贷审核的参考依据。

PART.B

技术架构

从技术架构看,业务层可划分为两大部分,即数据资产封装和数据资产交易流通。

01|数据资产封装

数据资产封装主要包括数据资产存储与确权。



数据资产存储


数据资产存储主要利用区块链技术整合并调度自主知识产权的 IPFS 文件系统,以此作为数据资产存储的基础设施。实现数据资产安全的加密传输,可靠的多点分布以及防篡改的内容标识(CID)。在进行数据检索的时候,可以根据 CID 直接在存储网络中寻址,更加安全可靠。

自主知识产权的加密IPFS存储

IPFS 文件系统是目前较为先进的点对点传输协议,但是由于其开放性,存储在 IPFS 上的文件是完全暴露的,任何人得到了文件的 CID 就能下载文件。加密 IPFS 传输协议具备自主可控知识产权,在处理文件时,会将文件进行二次封装加密,然后再进行传输和存储,以保证文件内容不被泄露。

区块链调度的分布式存储节点

IPFS 系统本身仅仅是一个通讯协议,需要通过区块链技术对 IPFS 的存储节点进行整合和调度,才能实现可控的分布式存储和 IPFS 存储节点的整合和调度。

TEE芯片级加密及验证

基于区块链的整合和调度,整个分布式数据存储是可以允许符合要求的存储设备接入并提供存储服务的,这样的架构有利于盘活社会的闲置存储资源,但由于其分布式的特性,链上需要对各节点存储的文件进行验证,以确认文件已经被正确地存储。为了在存储验证的时候不泄露文件内容,采用 TEE 技术,通过可信执行环境向链上报告其存储状态。

内容标识(CID)

IPFS 文件系统很重要的特点就是内容寻址,存储在 IPFS 分布式网络中的数据资产都会有一个唯一的内容标识(CID)。通过这个内容标识,可以在分布式存储网络中寻找到所有存储了这个文件的节点,并实现多点拉取。同时,这个唯一的内容标识可以用来判断文件的真实性,防止文件被伪造或篡改。



数据资产确权


数据资产确权由一条具有公信力的联盟链来完成。联盟链的公信力由维护联盟链节点的运营主体决定。在数据交易的场景中,联盟链的节点运营主体可以是相关管理部门、政府单位、数据运营单位和数据监管单位。联盟链需要建立一个身份认证系统,为参与数据资产交易的主体创建一个链上的唯一身份认证,同时将数据资产的内容标识(CID)和链上的身份进行挂钩,并将此对应关系记录在区块链上,以此来确定数据资产的归属权,为数据资产交易建立基础。数据资产标准是为了规范可交易的数据而设立的,规定了可交易的数据的相关属性、类别等信息的描述规范,以方便智能合约的识别和调用。

02|数据资产流通

数据资产流通主要分为两大模块:数据资产目录组织管理、数据资产交易及使用。



数据资产目录组织管理


在完成数据资产存储、内容标识、数据确权之后,数据资产交易的基本要素就构建完成了,但此时数据资产仅仅是存在分布式存储网络中,并不能很好地被检索,所以需要构建一个方便检索的数据资产目录。

数据资产目录组织管理分为文件管理和域名解析两个功能模块。首先需要建立一个将数据分门别类的目录管理文件,并将此文件存储在联盟链上,同时构造一个不依赖于 http 协议的域名解析模块(这样做的目的是反技术垄断),维护检索入口的安全。最终还需要一个前端界面,方便有检索和交易需求的用户对可交易的数据资产进行浏览。



数据资产交易及使用


数据资产交易按类别可分为所有权交易和使用权交易,使用权还可分为授权访问和授权计算。对应的交易及使用场景分别是数据资产所有权交易、数据资产使用权交易以及隐私计算调用。可以通过在联盟链上建立相应的智能合约来完成交易。

所有权交易合约

所有权交易合约是为资产型数据资产所有权交易而设计的,例如音乐、视频、图像等文化产品的版权。智能合约的执行实际上就是一个数据资产的转让过程,将用户 A 确权的某个数据资产转移到用户 B 上,当用户 B 完成支付行为时,生成用于证明用户 B 与某数据资产的所有权关系的智能合约,并将原始证明用户 A 与某数据资产的所有权关系的智能合约标记为失效。

授权访问合约

授权访问合约是为授权访问型数据资产交易而设计的。在某种情况下,需求方仅是希望使用数据资产,但并不需要其所有权,这个时候就需要使用授权访问合约,例如购买一个电影的播放权。授权访问合约不执行所有权转让,只是开放数据的读取接口,让需求方能获得数据。

授权计算型合约

在某种情况下,需求方希望获得的并不是数据本身,而是依据数据计算出来的结果,比如 AI 训练场景。同时,数据资产所有方也并不希望泄露数据本身的隐私信息,这个时候就需要使用授权计算型合约,合约实际上是调用了隐私计算模块,实现数据的“可用不可见”。在隐私计算的时候有两种思路,一种是先离线计算,然后将计算结果作为一个数据资产,在联盟链上进行确权后转入交易。另一种是将源数据作为一个数据资产在联盟链上进行确权,然后再通过授权计算型合约调用源数据进行隐私计算,并输出计算结果。例如在做 AI 计算的时候,单独某个企业很难提供计算所需要的全部样本,如果是在链下先通过多方计算,联邦计算等方法进行隐私计算的话,样本提供方的激励就只能在链下完成。后一种模式的好处是源数据的供应方能通过链上的被调用情况直接获得相应的收益,这个过程是可以被联盟链记录并追溯的,产生的激励更加的透明和直接。这两种模式可以并存,根据实际情况选择。

PART.C

交易模式

01|报价模式

报价模式是指由卖方或买方在一定时期内提出报价,由另一方选择是否成交的交易模式。根据卖方报价或买方报价,分为买方挂牌交易和卖方挂牌交易两种基本形式。

报价模式由于报价和交易过程相对公开透明,因此极大程度上避免了交易过程中的各种纠纷,使买卖双方能够更精准地买入(卖出)标的。

02|竞价模式

竞价模式是指在传统拍卖交易或竞价交易的基础上,通过计算机网络技术在网上实现快速、简洁的竞价交易的电子商务模式,由交易一方或双方报价后,经过另一方或两方的竞价过程,最终达成交易的模式。竞价模式根据邀约发出方的不同可分为竞买交易、竞卖交易、双边竞价三种。在竞价模式中,只要有一方或多方提出报价,其他方竞价即完成交易。竞价模式通常在较短时间内完成,没有过多中间环节,是比较高效的交易模式。

03|议价模式

议价模式是卖方的商品或服务满足买方需求的前提下,双方以达成交易为目标进行议价的交易模式。在议价模式中,交易平台仅为中间桥梁的作用,交易平台为交易双方提供在线交流的平台、交易场所、交易撮合系统、数据资产交易证明等功能服务,撮合双方达成交易,实现包括平台在内的“三方共赢”。议价模式是通过交易双方磋商最终达成交易价格,而非单方面决定。因此,在价格确定过程中,通常存在双方反复推翻对方报价提出新报价的过程。

PART.D

交易规则与流程

01|所有权交易

在业务层中,数据资产被上传并存储至 IPFS 网络后,将产生唯一的内容标识(CID)。在联盟链上,将生产证明数据资产内容标识 CID 与对应数据资产法人主体 UID 之前所有权关系的智能合约,该智能合约产生在联盟链上,具备不易篡改性,因此数据的所有权可被有效地证明和被保护。根据数据资产的行业属性或其他数据,智能合约在进入交易池时,将被分配到对应的数据资产目录中,以便在数据资产交易过程中,有效、快速地被调用。以上过程,是在业务层中,数据资产上链、确权的过程。

在数据资产所有权的交易中,买方通过下订单的方式发起交易需求,需求进入业务层的撮合系统后,确认需求并在交易池中匹配相应需求,匹配成功后,撮合系统将对数据资产对应的法人主体发送通知,卖方对交易同意后,该交易同意同时被同步至联盟链上。此后,撮合系统向买方发送通知,代表交易撮合成功。若卖方不同意交易,撮合系统将进行重新匹配,直至交易撮合成功。

买方向卖方支付费用,该支付流程也将被同步至联盟链上。支付成功后,联盟链将生产新的智能合约,用于证明被交易数据资产 CID 与买方 UID 的所有权关系,新的智能合约中也将标记前序智能合约的交易双方用于记录数据资产的流转痕迹,原始智能合约将被标记为终买方向卖方支付费用,该支付流程也将被同步至联盟链上。支付成功后,联盟链将生产新的智能合约,用于证明被交易数据资产 CID 与买方 UID 的所有权关系,新的智能合约中也将标记前序智能合约的交易双方用于记录数据资产的流转痕迹,原始智能合约将被标记为终止。以上过程中,卖方统一出售资产、买方支付费用以及新所有权关系的生产都发生在联盟链上,因此,业务层中的数据资产交易过程是可被追溯且不易被篡改的。

02|使用权交易

数据资产的使用权交易大致与所有权的交易相似,不同点在于使用权的需求多种多样难以用统一的智能合约进行,数据资产的使用权交易包括但不仅限于计算权交易和访问权交易。在使用权的交易过程中,当买方发送使用权交易需求时,首先要经过智能合约计算系统,执行后生成数据调用交易需求,该需求被发送至撮合系统进行交易撮合。

该交易在买方完成支付后,将在联盟链上生产证明被交易资产 CID 与买方 UID 使用权关系的新智能合约。由于所有权未发生转移,因此原始智能合约不会被标记为终止。

03|其他权益

在业务层,数据资产的所有人不仅可在交易池中交易数据资产的所有权、使用权,还可行使数据资产的担保物权,如抵押权、质权、留置权等。




订购须知


《产业转型研究》专刊现已发售第一期至第七期,各位读者如欲购买,可点击文末“阅读原文”自行订购,也可联系以下老师订购:

朱栩葶老师:联系电话:010-83021220

邮箱地址:zhuxt6@sem.tsinghua.edu.cn



 《产业转型研究》专刊第一期至第六期 

(点击下方图片可到达专刊专辑)

内容来源|《产业转型研究》2022年第12期 总第340期
编辑|段文秀
审核、责编|杨帆
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存