为何可信数据空间大多失败?只因我们只是在建系统而非建信任
“可信数据空间的价值,不在于“卖出多少数据”
“大夫,能不能把我在A医院的电子病历,直接同步到B医院?”
这个看似简单的患者诉求,背后隐藏的却是两家医院之间森严的数据壁垒——系统不互通、标准不一致、隐私难保障、责任难界定。同样的困境正在中国经济的各个领域上演:银行需要评估企业风险,却只能掌握流水信息,无法获取产业链上的订单与物流数据;制造企业想优化供应链,却难以协同上下游的生产与库存状况。
数据本应成为驱动增长的新能源,现实中却困在“数据恐惧症”里:提供方怕泄露,需求方怕低质,监管方怕追责。数据要么在库中“沉睡”,要么在灰色地带悄然流转,形成看不见的“数据黑市”。
正是在这种信任赤字的困局下,“可信数据空间”被寄予厚望。然而,这个概念正被巨大的误解所包围。
当人们谈论可信空间时
他们实际在期待什么?
第一种误解,把它当成一个“升级版的数据交易所”。很多地方简单粗暴,直接把“大数据交易所”的牌子换成“可信数据空间”,PPT里的核心KPI,依然是“引入数商XX家”、“挂牌数据产品XX个”、“达成交易额XX亿”。
这套逻辑的潜台词是:数据是一种类似石油的标准商品,核心问题是如何“卖”出去。所以要想方设法把数据“上架”、展示、撮合交易。
但现实狠狠打了脸。各地早期轰轰烈烈建起的数据交易所,很多陷入了“有场无市”的尴尬。大量数据产品挂了牌却从未成交,数商们赚了个“首批入驻”的名头,实际业务仍走熟悉的线下老路。
为什么?上奇科技创始人、董事长孙会峰在接受数据猿的采访中,分析认为,企业要的从来不是“数据”本身。就像顾客去餐厅,不是为了买“一斤牛肉、两棵西兰花”,而是要一盘烹制好的“黑椒牛柳”。银行需要的是“风险是否可控”的结论,而不是一堆未经处理的原始工商、司法、舆情数据字段。
第二种误解,把可信数据空间单纯看做技术问题。我们可以看到,可信数据空间就像一个筐,什么技术都可以往里面装:隐私计算、密态计算、联邦学习、多方安全计算……
这就像说,因为我给超市装了最先进的防盗门和监控,所以它一定能经营火爆一样。技术只是解决了“偷不走”(数据可用不可见)的问题,但解决不了供给方 “愿不愿来卖”、需求方“敢不敢来买”、“买了不好用谁负责”、“赚了钱怎么分”这一系列商业和治理问题。
剥开层层技术外壳,可信数据空间的本质,是一场从“技术安全”升维到“制度信任”的深刻转型。
在原始的数据交换状态,我们处于一种“霍布斯丛林”,遵循的是弱肉强食的丛林法则。谁的数据多、技术强、胆子大,谁就可能占便宜,但也时刻面临被攻击、被背叛的风险。这种环境下,大规模、高质量的数据协作根本无法发生。
可信数据空间要做的,就是在这片丛林上,建立起一个“数据文明社会”。它的核心产出不是多少节点、多少算力,而是一套公认的、数字化的“社会契约”。
这套契约要解决三个核心问题:
第一,可控可计量。数据使用必须像水电一样,可精确开关、计量。数据提供方可以设定清晰的授权策略:什么数据、能被谁(哪个角色)、在什么时间范围内、用于何种目的、调用多少次。每一次使用都留下不可篡改的存证。这就是“可用不可见”之上的“可用可计量”。
第二,流通可追溯。数据从供给方到最终使用,中间经历了哪些环节(比如被某个模型调用、与哪些数据做了融合),整个流通过程必须像快递轨迹一样清晰可查、全程留痕。一旦出现问题,可以快速定位环节、界定责任。这解决了“敢流通”的后顾之忧。
第三,价值可分配。这是激发活水的关键。数据被使用后产生的价值(比如促成了一笔贷款、优化了一个生产流程),其收益如何根据各方贡献(数据贡献、算法贡献、场景贡献)进行公平、自动化的分配?
必须让贡献者明确看到利益回报,数据分享才能从“公益”变成可持续的“商业”。
当这套契约通过技术手段(区块链、智能合约等)被固化、自动执行时,信任就不再依赖于某个中心机构的担保或某个人的承诺,而是由技术、公约和规则所共同塑造的确定性。
市场的先行者已在探索可行的路径。上奇科技创始人、董事长孙会峰指出,数据价值的释放始终围绕两个根本:数据质量与数据可信。
“早期我们通过‘产业通’等产品帮助客户实现数据可视与可查。但随着合作深入,客户——尤其是金融机构、大型集团与科技公司——提出了更本质的需求:‘能否将你的数据与我的数据结合,产生更精准的洞察?’”孙会峰表示,这意味着服务必须向底层延伸,从提供报表结果转向提供可融合、可计算的数据能力,且这种融合需建立在安全、合规、互信的线上协同机制之上。
面对市场上部分企业试图通过承接项目“占有”甲方数据的误区,上奇选择了截然不同的路径:坚持“一尺宽、十米深”的专注策略,深耕公开可得的产业数据领域,将自己定位为“数据厨师”。
“食材(数据原料)大多是市场可得的,但核心竞争力在于如何筛选、清洗、关联、建模,将分散的信息转化为高价值的洞察。我们不是占有数据,而是驾驭数据。”孙会峰强调。
经过五年积累,上奇已建成规模领先的产业数据集,并形成两种成熟模式:
1.数据赋能模式:将加工后的高价值数据或模型结果推送至客户侧,与其自有数据在本地联合建模,客户数据完全不出域。
2.模型托管模式:客户将定制化分析模型部署于可信空间中,在上奇提供的数据基础上运行,仅获取计算结果,原始数据无需共享。
这两种模式遵循同一原则:以客户数据安全为前提,用自身的数据能力赋能客户的数据需求。“我们不强求数据汇聚,而是让数据能力‘流动’起来,在不动客户数据的前提下,帮助其提升决策质量。”孙会峰说,“正因为始终坚持‘数据不归我,但价值可共创’,我们才突破了信任门槛。”
为何可信数据空间大多失败?
当前各类可信数据空间的建设,大多陷入“撮合难、交易难”的困境,像一个努力却总难促成姻缘的“红娘”。
痛点一:供需“鸡同鸭讲”。平台如同农贸市场,数商摆出各种数据“原材料”,但需求方需要的是可直接应用的“菜肴”。缺乏深加工与场景化封装能力,导致供需严重错配。
痛点二:平台“重建设、轻运营”。许多项目的驱动逻辑停留在“建平台”本身,驱动方关注立项、招标、建设、验收,项目款到手即视为完成。平台建成后是否有真实交易、能否自我造血,常被抛在脑后。
痛点三:核心能力“瘸腿”。平台往往缺乏“需求翻译”能力(将模糊业务愿望转化为具体数据需求)和“组织交付”能力(协调多家数商,交付完整解决方案)。没有这些能力,平台就只是“信息中介”,无法降低交易的综合成本。
面对这些挑战,产业界持续探索符合数据基本特征和数字经济发展规律的新范式。一种数据治理和流通的新范式——使用权和所有权分离正逐渐成形。这一形式,超越了数据私权化与数据公有化的传统路径,不再追问“数据到底属于谁”,转而聚焦“谁有权使用数据”,以数据资源的最大化利用为目标。
孙会峰认为,分离不是为了制度设计而设计,而是为了提升数据使用效率、实现商业价值。“数据要素化的关键,在于通过市场化机制,让数据在安全合规的前提下流动起来、用起来。”
他提出了一条务实的路径:在制度保障与安全底线之上,推动数据所有权与使用权的分离,通过面向场景的商业化探索,形成可持续的利益协同机制。
在此过程中,央国企及各地数据集团可扮演“底座”角色,承担类似土地一级开发的职能——负责数据资源的基础整合、治理与安全托管;大量中小企业则可在二级、三级开发中发挥创造力,将原始数据转化为面向场景的数据产品与服务。
“没有大型主体,政府与公共数据的开放通道难以建立;但若仅停留在‘卖原料’式的原始数据调用,每调一次收费几分钱,则无法真正释放数据价值。”孙会峰说。
回归本质
从“建平台”到“促交易”
当前,各类数据交易平台或可信数据空间纷纷涌现,但其核心使命往往被忽略:平台的核心使命不是技术搭建或数据上架,而是真正促进交易闭环、实现价值流通。
孙会峰指出,许多平台将重心放在引入数商与用户的数量上,认为规模即成功。“然而,如果平台仅扮演‘数据黄页’角色,交易实际仍发生在线下,与平台关联微弱。衡量平台价值的关键,不是上架了多少产品,而是实际促成了多少交易。”
对数商而言,核心诉求不是上架,而是持续订单与交易量提升。
对需求方而言,核心诉求不是获取原始数据,而是获得能够直接支持业务决策的场景化解决方案。
因此,可信数据空间的核心竞争力,首先在于运营能力——理解行业、洞察场景、组织供给、促成交易;其次才是底层技术能力。技术是实现手段,但若没有清晰的商业需求与运营模式,再先进的技术也难有用武之地。
未来的方向已然清晰:
•以运营为导向,建立专业化团队,深耕垂直行业;
•以场景为牵引,主动对接需求,组织数据产品与服务;
•以交易为核心,设计合理的利益分配与激励机制,让所有参与方都能从生态中获益。
信任,是数据文明社会的基石
当前,随着大模型越发深入产业,行业共识正在形成:模型的效能天花板,并不完全取决于算法本身,而更依赖于高质量、高知识密度的数据集与领域知识库。开放数据已被广泛挖掘,真正具有壁垒的闭环数据与行业知识,往往以私有化部署的形式存在。
在大模型时代下,如何让这些宝贵的私有数据在供需双方之间可信流通,将是一个重要命题。这为可信数据空间提出了更高也更急迫的诉求,可信数据空间必将经历一场从“建系统”到“建信任”的深刻转型。
唯有当数据在流动中创造价值,在共享中分配收益,在协同中建立信任,我们才能真正走出数据的“霍布斯丛林”,步入一个繁荣、有序、可持续的“数据文明社会”。


