DataFi:AI时代的新机遇 Web3如何引领数据赛道

从AI数据赛道看DataFi的发展潜力

当今世界正处于全球范围内竞相构建最佳基础模型的时代。虽然计算能力和模型架构很重要,但真正的护城河是训练数据。本文将从Scale AI谈起,探讨AI数据赛道的潜力。

Scale AI的成功之道

Scale AI目前估值290亿美元,其服务对象包括美国军方和多家有竞争关系的AI巨头。Scale AI的核心业务是提供大量准确的标注数据,它之所以能在众多独角兽中脱颖而出,是因为早早发现了数据在AI产业中的重要性。

算力、模型、数据是AI模型的三大支柱。在大语言模型快速发展的过程中,业界的发展重点经历了从模型到算力的转移。如今,大多数模型都已确立了transformer作为模型框架,各大巨头也通过自建超级计算集群或与云服务商签订长期协议解决了算力问题。在这种情况下,数据的重要性逐渐凸显。

Scale AI不仅致力于挖掘现有数据,还将目光投向更长远的数据生成业务。它通过组建由不同领域人工专家组成的AI训练团队,为AI模型的训练提供更加优质的训练数据。

AI模型训练的两个阶段

AI模型的训练分为预训练和微调两个部分。

预训练阶段类似于人类婴儿学习说话的过程。我们需要向AI模型输入大量从网上爬取的文本、代码等信息,让模型通过自我学习掌握基础的沟通能力。

微调阶段则类似于学校教育,有明确的对错、答案和方向。通过一些事先处理好的、有针对性的数据集,我们可以培养模型具备特定的能力。

因此,AI训练所需的数据也分为两类:

  1. 无需太多处理的大量数据,通常来自大型UGC平台的爬虫数据、公开文献数据库、企业私有数据库等。

  2. 需要精细设计和筛选的数据,类似专业课本,需要进行数据清洗、筛选、打标签、人工反馈等工作。

这两类数据集构成了AI数据赛道的主体。随着模型能力的进一步提升,各种更加精细、专业的训练数据将成为模型能力的关键影响因素。

Web3 DataFi:AI数据的理想沃土

相比传统的数据处理方式,Web3在AI数据领域具有天然优势,由此诞生了DataFi的新概念。Web3 DataFi的优势主要体现在以下几个方面:

  1. 智能合约保障的数据主权、安全和隐私
  2. 分布式架构带来的地理套利优势
  3. 区块链明确的激励和结算优势
  4. 有利于构建更加高效、开放的"一条龙"数据市场

对于普通用户而言,DataFi是最容易参与的去中心化AI项目。用户无需签订复杂合同或投入昂贵硬件,只需通过简单的任务就能参与其中,如提供数据、对模型进行评估、利用AI工具进行简单创作等。

数据即资产:DataFi 正在开启新蓝海

Web3 DataFi的潜力项目

目前,多个Web3 DataFi项目已获得大额融资,显示出这一领域的巨大潜力。以下是一些代表性项目:

  1. Sahara AI:致力于打造去中心化AI的超级基础设施和交易市场。

  2. Yupp:AI模型的反馈平台,收集用户对模型输出内容的反馈。

  3. Vana:将用户个人数据转化为可货币化的数字资产。

  4. Chainbase:聚焦链上数据,覆盖200多条区块链。

  5. Sapien:旨在将人类知识大规模转化为高质量的AI训练数据。

  6. Prisma X:致力于成为机器人的开放协调层,物理数据收集是其关键。

  7. Masa:Bittensor生态的头部子网项目,运营数据子网和Agent子网。

  8. Irys:专注于可编程数据存储和计算。

  9. ORO:赋能普通人参与AI贡献。

  10. Gata:定位为去中心化数据层,提供多种参与方式。

数据即资产:DataFi 正在开启新蓝海

对当前项目的思考

目前这些项目的壁垒普遍不高,但一旦积累了用户和生态粘性,平台优势会迅速累积。因此,早期项目应在激励措施和用户体验上着重发力。

同时,这些数据平台还需要考虑如何管理人工、保障数据产出的质量,避免出现劣币驱逐良币的现象。一些项目如Sahara和Sapien已开始在数据质量方面加强管理。

此外,提高透明度也是当前链上项目面临的一个重要问题。许多项目仍缺乏足够的公开、可追踪的数据,这对Web3 DataFi的长期健康发展是不利的。

最后,DataFi的大规模应用需要同时吸引足够多的个人参与者和获得主流企业的认可。一些项目如Sahara AI和Vana在这方面已取得不错的进展。

DataFi代表了人类智能与机器智能的长期共生关系。对于那些对AI时代充满期待又担忧的人来说,参与DataFi不失为一个顺势而为的好选择。

数据即资产:DataFi 正在开启新蓝海

SAHARA7.37%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 4
  • 分享
评论
0/400
反向指标君vip
· 3小时前
又开始吹DataFi了
回复0
币圈相声社vip
· 4小时前
啊哈,终于开始割AI韭菜了,上次元宇宙,这回又来新故事
回复0
偏执之王vip
· 4小时前
训练数据也能卷起来?
回复0
养老笑看大饼vip
· 4小时前
290亿,割韭菜呢吧...
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)