在当前AI技术高速发展的背景下,数据已成为新时代的"石油"。如何突破数据壁垒,让用户真正从自己的数据中获益,成为了行业亟待解决的核心问题。
PANews近日特邀Vana团队进行了一场深度对话。作为一个去中心化的数据流动性网络,Vana正通过创新的DataDAO机制,致力于重构数据价值链条。值得注意的是,项目已获得包括Coinbase Ventures、Paradigm、Polychain在内的顶级机构2500万美元投资支持。随着主网即将上线,VANA代币的发行也将为整个生态带来革命性的改变。
本期嘉宾:
Art Abal: Managing Director at Vana Foundation
Victoria:Head of APAC
PANews:请嘉宾简单介绍一下自己。
Victoria:
大家好,我是Victoria,目前主要负责亚太区的运营市场推广、生态拓展以及BD等方面的工作。之前在交易所工作的经历让我对中文社区以及亚太市场的生态有较深的了解。
Art:
大家好,我是VANA的联合创始人。我进入Web3领域是因为看到了Web2中数据使用方式存在的问题,我坚信区块链技术可以解决这些问题。特别是在AI时代,我们更应该拥有自己的数据主权。
PANews:目前AI行业面临着什么样的数据困境?为什么说我们遇到了“数据墙“?传统的数据采集模式存在哪些问题?
Art:
数据是AI的基础,数据质量直接决定了AI模型的表现。目前的问题是,所有生成式AI模型都在使用公开数据,这些数据已经被大量抓取和使用。这就形成了"数据墙":如果想开发更好的AI模型,仅靠现有的公开数据是不够的,必须获取更多优质数据。这就是为什么社交媒体平台等"围墙花园"中的私有数据变得如此珍贵。
我之前在相关公司工作时亲身经历过这个过程。举个例子,当一家社交媒体公司想购买竞争对手的消息数据时,他们无法直接交易,必须通过第三方数据经纪人。这些经纪人从用户那里收集数据,却不告知具体用途,然后高价转售给买家,自己独占大部分利润。这导致了三个主要问题:
用户完全不知道自己的数据如何被使用
出售数据的往往是迫于无奈的用户,样本并不具代表性
最终产生有偏见的、低质量的数据集,影响AI模型的质量
PANews:Vana 如何在加速 AI 创新的同时保护用户拥有的数据隐私?
Art:
首先,在Web2时代,人们常常认为自己的数据是安全的,平台会负责任地使用它们。但实际上,由于中心化管理,数据经常被滥用、未经同意就被出售或发生泄露。
VANA通过以下方式提供了重大改进:
我们让用户能够自托管数据,确保每个人都能完全控制自己的数据,而不是依赖中心化平台
在VANA平台上的每一笔数据交易都通过智能合约实现可追踪和许可,用户始终知道谁在访问数据以及用于什么目的
用户可以通过加密钱包对数据使用进行精细化授权,确保数据只用于经过批准的用途
通过DataDAO机制,用户可以安全地汇集数据以释放集体价值,同时保持个人所有权和隐私
我们采用贡献证明(proof-of-contribution)技术来验证数据价值,同时保持数据加密,确保隐私安全
这个系统创造了一个用户可以放心聚合数据的无需信任环境,让我们能够为集体使用和AI模型训练解锁私有数据
简单来说,通过在VANA上保护用户隐私,我们实际上加速了AI创新,因为这让数据可以以当前无法实现的方式被使用。
PANews:Vana的技术架构是如何设计的?
Art:
建议大家可以查看官方详细的技术文档。在这里,我会从高层次为大家介绍VANA的三层核心架构:
1.数据流动层(Data Liquidity Layer)
这是数据进入系统并进行去中心化验证的层级
用户可以将数据贡献给DataDAO进行集中管理,同时保持数据的完全自托管和所有权
数据贡献者和保管者都会获得相应的治理权和奖励,替代了传统的数据中介角色
2.数据应用层(Data Application Layer)
让用户能够在生态系统内外自由转移数据
通过私钥进行精细化权限管理,用户可以完全控制数据的使用方式和场景
为基础模型的分布式训练和AI应用开发提供基础设施
3.VANA Layer 1区块链
作为所有数据交易的注册中心,确保数据安全和可追溯
每个数据交互(贡献、访问或变现)都会被不可篡改地记录在链上
提供无需信任的去中心化基础设施,支持DataDAO生态系统的扩展
这三层架构共同构建了一个完整的去中心化数据系统,类似于DeFi中的自托管原则,但应用在了数据领域。
PANews:什么是 DataDAO?DataDAO 如何运作?
ART:
Data DAO本质上是一个特殊的社区组织。想象一群人因为某个特定的数据集或主题而聚在一起,他们都认为这些数据对推进AI发展很重要。
当用户向Data DAO贡献自己的数据时,会收到一种叫做治理代币的回报。这个代币很特别,因为它代表了用户在DAO中的权益,让用户可以参与决定这些数据该如何使用。这个过程其实很有趣,它把原本不能随意交易的数据,通过代币的形式变得可以交易了。
Data DAO的运作其实和其他DAO类似,都是由成员自主参与。但最大的不同在于,Data DAO的核心资产是数据集。在当今这个AI驱动的世界里,优质数据的价值非常高。
治理不仅仅关注社区活动,更重要的是要决定如何使用这些聚合的数据。有些Data DAO甚至会进一步利用这些数据来训练AI模型或推动创新。
PANews:目前已有300多个DataDAO加入生态,能否分享一些典型案例?
ART:
让我先更正一下数据。实际上,我刚刚查看了最新数据,目前我们已经收到了599个DataDAO的申请,这个数字远超之前提到的300个,而且还在持续增长中。
目前一些具体的成功案例包括:
医疗数据领域
Asterisk DataDAO:这是一个非常有意义的项目,专注于女性健康数据。他们发现女性出现药物不良反应的概率是男性的两倍,这与缺乏针对性的医疗数据有直接关系。通过这个DAO,我们希望能够收集更多女性健康数据,改善这种状况。
Web2平台数据收回项目
Resume DAO:专门处理LinkedIn数据
Scroll DAO:负责Instagram数据
Volara DAO:管理Twitter数据的收集
金融交易数据
Finquarium和Datapig:这两个项目主要聚合用户的交易活动数据,帮助构建更好的交易代理和模型
如果大家想了解更多细节,欢迎访问官网了解活跃的DataDAO信息,包括如何创建自己的DataDAO。这些案例都很好地展示了DataDAO如何帮助社区解决关键数据问题,让用户收回数据主权,同时推动AI应用创新。
PANews:VANA代币在生态中扮演什么角色?
Art:
VANA作为生态系统的原生代币,主要有四个用途:
1.数据交易
用于生态系统中所有与数据相关的交易
包括数据验证、传输和AI功能操作
2.DataDAO质押
用户可以质押VANA代币支持他们看好的DataDAO
质押有助于维护数据安全
根据DataDAO的数据质量和数量获得相应奖励
3.生态治理
参与投票决策,如确定获得奖励的DataDAO数量
参与制定数据质量评估标准
4.数据访问支付
作为购买和访问数据的支付货币
是生态系统内访问数据的原生代币
PANews:请问VANA准备空投多少代币给用户?哪些用户有资格获得空投?
Art:
由于监管限制,我们目前无法具体评论空投计划或代币分发数量。但可以分享的是:
项目早期贡献者和积极支持社区的成员会得到认可
对社区最大的贡献包括参与DataDAO、贡献数据等
建议大家现在最好的定位就是积极参与DataDAO活动
PANews:对于想要参与VANA生态的普通用户,有哪些参与方式?
Art:
首先要强调的是,任何拥有数据的人都可以参与VANA生态。因为我们每个人在日常生活中都在产生和使用数据,所以可以说每个人都能参与其中。
让我具体介绍三种主要的参与方式:
1.贡献数据
访问 datahub.vana.org 进行预注册
在Data Hub浏览现有的Data DAO项目
选择感兴趣的数据集参与,比如Twitter领域的数据等
通过共享数据来参与这些项目
2.代币质押
等VANA代币上线后,可以质押代币支持喜欢的项目
通过质押不仅支持DAO发展,还能获得相应的质押奖励
选择认同的项目进行支持
3.开发者参与
可以创建自己的Data DAO或数据应用
访问 docs.vana.org 查看详细开发指南
已经有很多中文社区的开发者做出了不错的项目
总之,无论是普通用户还是开发者,都可以找到适合自己的参与方式。建议大家关注后续公告,了解更多具体细节。
PANews:VANA的主要收入来源有哪些?如何实现商业模式的可持续性?
Art:
VANA团队在数据领域有超过20年的经验,这是我们的一大优势。主要收入来源有两个方面:
数据交易
包括数据验证、销售和访问
例如我们的TensorSource项目,帮助DataDAO将数据销售给Web2买家
仅几个月就产生了1050万美元的数据需求
数据应用开发
DataDAO可以用聚合数据创建社区拥有的AI模型和代理
这些模型可以代币化并产生持续收入
同时保持社区所有权
商业模式的可持续性建立在:
打造全球最大的数据湖
通过交易、应用和创新形成良性循环
随着生态系统扩大,更多应用会选择在VANA上构建
所有交易都使用VANA代币,确保持续需求
PANews:在未来3-5年,VANA对数据市场的变革有什么预期?
Art:
我们希望从根本上改变数据市场,使其对数据提供者和创新者都更加公平。
目前的问题在于:
用户数据被无偿获取用于AI训练
AI使用决策由出价最高者或大平台决定
这导致很多人对AI持怀疑态度,因为他们感觉AI是强加给他们的,而不是为他们服务的
VANA的愿景是:
让用户真正拥有自己的数据
让个人能参与塑造AI技术的发展
建立一个以数据为基础的新经济体系
数据成为赋能个人而非平台的关键
用户可以完全控制自己的数据、AI代理和相关技术
我们相信AI的发展方向应该由社区共同决定,而不是由出价最高的人决定。这不仅是修复市场的问题,更是确保每个人都能在AI未来中发声。
内容来源:PANews
1998-2024深圳市财华智库信息技术有限公司 版权所有
经营许可证编号:粤B2-20190408
粤ICP备12006556号