Human Protocol 尝试提炼人机验证的数据价值,将人工为机器数据分类的环节融入「人机验证」流程,实现多方共赢。

撰文:Zoe Zhang

相信正在读文章的你对于各种图形人机验证并不陌生,不过对于普通用户来说,这种验证会让产品使用变得较为繁琐,而对于产品自身来说,当前的验证除了「降低作恶概率」以外,同样不会产生额外价值。也就是说,供需双方仅仅是为了阻止小部分潜在恶意行为的发生均做出了牺牲和妥协,而本文即将介绍的项目,或将改变这一境况。

曾打造了全球最大的开源验证码服务 hCaptcha,在人机验证系统方面颇有建树的 Human Protocol 团队,尝试提炼人机验证这一操作的内在价值,并希望通过区块链技术在全球范围内建立一个透明、高效的数据处理市场,通过尽可能利用每一次人机验证的数据作为分析样本,来降低人工智能自我学习的数据获取成本。

image (6).png

将人机验证操作变成用户收益

Human Protocol 是基于区块链技术的动态数据+图形验证的开源协议,该协议通过区块链的激励和合理的任务分发来降低机器人对网络和产品造成的影响,并应用在全球各大企业及数据平台,让每一次数据相关的任务(标记,图形,文字识别归类等)都能产生价值,机器可以基于 Human Protocol 直接向人类索要其完善自身所需的数据。

众所周知,人工智能需要不断深度学习,这需要庞大的数据量支撑。

人机识别验证系统作为人工智能领域的一部分,每一个进行人机验证的用户,都贡献了动态数据+图形验证数据,这些庞大体量的数据是人工智能深化学习的高质量「 燃料」。然而,目前大多数情况下,用户创造的这一数据并没有发挥其价值。

看到这一现象的 Human protocol 利用区块链技术解决这一问题。

在 Human Protocol 生态体系中,用户登录网站进行人机验证时产生数据,网站将 Human Protocol 系统给予的代币奖励(HMT 代币)通过智能合约发放给登录网站的用户。

这一过程中,Human Protocol 将曾经无价值的人机验证行为变成了一种贡献性激励,用户不仅贡献了相应 AI 数据库数据,并获得了相应的系统奖励。

建立透明、公正的全球化数据处理市场

根据 2021 年年初 DataReportal 发布的《数字 2021:全球概览报告》显示:

截至 2021 年 1 月,互联网用户量 46.6 亿,社交媒体用户量 42 亿,全球网民平均上网时间约为 7 小时。

庞大的用户群体每天活跃在互联网中,产生庞杂的数据。长久以来,这些数据都由专门的数据标签分类公司(比如 Amazon Mechanical)进行加工处理,以供人工智能等数据需求领域发展使用。然而,用户-数据处理公司-数据需求者的三方协作,使得有价值的数据获取成本极高,这也是阻挠很多中小企业发展人工智能的重要原因之一。

通过人机验证创造数据收益推动人工智能发展的可行性,让 Human Protocol 看到了数据标签处理的更大市场。一个借助区块链技术确保赏金透明、执行公开、交易公平的点对点数据处理市场应运而生。

image (7).png

在 Human Protocol 协议中,用户可以创建数据处理任务并在交易市场中发布,也可以申请成为数据处理工作者。

在创建任务时,用户需要写清楚任务要求、任务完成时间以及任务赏金。赏金除了主流加密货币之外,还将附带一笔 HMT 代币用于奖励工作者和预言机,赏金一旦确定后便不可修改。

交易市场接收到任务需求后,首先会智能的将任务分解,例如:当任务为处理医疗文档数据时,交易市场会智能的将医疗文档内容分解为多个子任务,部分子任务为处理姓名、时间等无需医学知识的数据,部分子任务为病理判断、药理研究等需要专业医学知识的数据。

任务分解后,交易市场将任务分配到合适的数据处理工作者手中。例如,复杂的医学术语可能需要合格的医生处理,简单的任务无需特定要求。当一个任务完成时,任务赏金将通过智能合约释放给工作者。如果任务被拒绝或取消,奖励将返回给任务创建者。

Human Protocol 还引入了记录预言机和声誉预言机两种角色评估工作者的工作质量:

当工作者提交他们各自的处理结果时,交易市场将结果提交给记录预言机,记录预言机进行初始评估并将工作聚集到区块中,记录预言机可获得赏金中的 HMT 代币奖励。

声誉预言机监督整个工作,并负责对记录预言机聚集的区块进行评估,当一个任务中的任务成功完成时,声誉预言机更新区块链以触发 HMT 奖励的释放给准确参与完成这些任务的工作者。

若有工作者的工作质量不高或不按任务创建者规定完成任务,则会影响信誉,收不到数据处理工作。

整个过程中,Human Protocol 协议消除了数据处理的价格信息差,拒绝中间商赚差价,大大降低了数据处理成本,推动了类似于人工智能这样的强数据需求行业的发展。

整合多链,突破性能瓶颈

在性能方面,Human Protocol 业务范围触达全球 247 个国家和地区的数亿用户,通过自定义的批量 API 和一对多批量交易处理,将小额付款效率提升了 1000 倍以上。

但单一公链或多或少都存在着速度、延迟、成本、可拓展性以及较中心化等问题,为了避免被某个网络瓶颈牵制发展脚步,Human Protocol 立足于 ETH 的同时,积极部署多链发展。

2020 年 12 月, Human Protocol 宣布整合 Polkadot 平行链 Moonbeam。此举为在英特尔的开源计算机视觉注释工具 CVAT 上增加新的分布式工作市场做好了准备,该工具有助于机器学习数据标记。

2021 年 1 月,Human Protocol 宣布整合更快速度、更高效率的 Solana,以实现数百万人同时工作的数据处理能力。

image (8).png

在此之后,Human Protocol 还陆续宣布与 Algorand、Zilliqa 等优质公链建立合作。在博采众长、吸收多链网络优势的道路上,Human Protocol 仍未停止脚步。

Human Protocol 代币规则

HMT 是 Human Protocol 协议生态代币,总发行量为 10 亿,代币释放机制为锁仓 1 年,自 2021 年 8 月 10 日前后开始解锁,1 年内线性解锁完毕。

HMT 具有支付劳动赏金、奖励为网络提供服务的验证者等相关功能。任何个人或者实体都不得通过公开代币销售获得超过 1% 的网络份额。其具体分配规则如下:

  • 预售贡献者:23.4%
  • 经营托管:23%
  • 战略合作伙伴:20.5%
  • Coinlist:12%
  • 生态系统基金:8.2%
  • 团队:7%
  • 购买者:3.7%
  • 顾问:1.3%
  • 发行基金会:1%

就在 6 月中旬,Human Protocol 完成在 Coinlist 上的代币销售,共筹集到 5100 万美元资金。

Human Protocol 团队介绍

Human Protocol 团队曾打造过媲美谷歌验证码(reCAPTCHA)的反机器人系统 hCaptcha,其团队成员均是区块链、AI 以及数据技术领域的知名学者。

James Roy Poulter 是 Human Protocol 基金会董事,他不仅早在 2013 年就通过 Playfair Capital 开启了他的加密领域职业生涯,而且精通会计、税务和法律,是福布斯 30 位 30 岁以下特级会计师中的一员。

顾问团队方面,Human Protocol 不仅汇集了 JavaScript 语言(当下编程领域最流行的语言之一)创始人 Brendan Eich、麦克阿瑟天才奖获得者 Dwan Song,还吸引了 AI 领域公认的领头羊人物 Eli-Shaoul Khedouri 的加入。

Eli-Shaoul Khedouri 曾牵头创立了 Array Ventures、Intuition Machines 等四家科技公司,为世界巨头企业提供大规模 AI / ML 产品和服务

image (9).png

从模式上来看,Human Protocol 将无价值的人机验证操作变得有价值,并通过区块链智能合约建立公平透明的数据交易市场,让普通用户参与到数据处理贡献中,实现了多方共赢,这一点值得肯定。

AI 和区块链这两大高新技术自诞生以来便伴随争议,两个话题的结合+良好的技术实力一方面为 Human Protocol 积累了热度,另一方面也让大家对于未来 Human Protocol 如何同时驾驭这两个领先技术、实现丰富的落地应用场景抱有期待。