撰文:Gagra
编译:深潮 TechFlow
本文摘要 这不是又一篇对「AI + Web3」领域乐观的风投文章。我们对这两种技术的合并持乐观态度,但本文是一种呼吁。否则,这种乐观态度最终将失去理由。 为什么?因为开发和运行最佳 AI 模型需要在最尖端且通常难以获得的硬件上进行巨大的资本支出,以及特定领域的研发。就像大多数 Web3 人工智能项目所做的那样,通过加密激励来实现众包,并不足以抵消那些牢牢控制着人工智能开发的大公司投入的数百亿美元。鉴于硬件方面的限制,这可能是第一个大的软件范式,在现任组织之外的聪明和有创造力的工程师没有资源来颠覆它。 软件「蚕食世界」的速度越来越快,很快就会随着人工智能的加速而呈指数级增长。当前情况下,所有这些「蛋糕」都流向了科技巨头,而终端用户,包括政府和大企业,当然还有消费者,更加依赖于他们的力量。
激励错位
所有这些都不可能在更不合适的时间展开——在 90% 的去中心化网络参与者忙于追逐叙事驱动发展带来的容易获得的巨大收益。是的,开发者们在追随投资者进入我们的行业,而不是反过来的。它从公开承认到更微妙的潜意识动机各不相同,但是围绕它们形成的叙事和市场推动了很大一部分 Web3 的决策制定。参与者们太沉浸在反身性泡沫中,以至于无法注意到外面的世界,除了帮助推动这一周期进一步发展的叙事。而 AI 显然是最大的一个,因为它本身也在经历一场繁荣。
我们已经与 AI x Crypto 交叉领域的数十个团队进行了交流,并可以确认其中许多团队非常有能力,以使命为驱动,充满激情地构建项目。但人类的本性是,当面临诱惑时,我们往往会屈服于它们,然后事后合理化这些选择。
易于获得流动性一直是加密行业的历史诅咒,这种诅咒已经减缓了其发展并推迟了几年的有用采用。它甚至会让最忠实的加密信徒们转向「炒作代币」。合理化的解释是,持有代币的更多资本,这些建设者可能有更好的机会。
机构资本和零售资本的成熟度相对较低为建设者提供了机会,使他们能够提出脱离现实的主张,同时仍能从估值中获益,就好像这些主张已经实现了一样。这些过程的结果是实际上导致道德风险和资本破坏,其中很少有这样的策略长期有效。需求是是一切发明之母,当需求消失时,发明也就不复存在了。
这种情况发生的时机再糟糕不过了。当所有最聪明的科技企业家、国家领导和大小企业都在竞相确保自己从人工智能革命中获益时,加密创始人和投资者却选择了「快速增长」。在我们看来,这才是真正的机会成本。
Web3 AI 市场概述
考虑到上述激励,Web3 AI 项目的分类实际上归结为: 合法(也分为现实主义者和理想主义者) 半合法 伪造者
基本上,我们认为建设者清楚地知道与他们的 Web2 竞争对手保持同步所需的条件,以及在哪些垂直领域有可能参与竞争,而在哪些领域更像是痴人说梦,不过这些都是可以向风险投资人和不成熟的公众宣传的。
目标是能够在此时此刻参与竞争。否则,AI 发展的速度可能会把 Web3 甩在身后,而世界则向着西方企业 AI 与中国国家 AI 的反乌托邦 Web4 迈进。那些不能很快具备竞争力并依赖分布式技术在更长时间范围内追赶的人,他们过于乐观以至于难以被认真对待。
显然,这是一个非常粗略的概括,即使是伪造者群体中也包含至少几个严肃的团队(也许更多的是妄想者)。但这篇文章是一种呼吁,所以我们并不打算保持客观,而是呼吁读者感受到紧迫感。 合法
「将 AI 上链」的中间件。这些解决方案背后的创始人,虽然不多,但了解到目前为止去中心化训练或推理用户实际想要的模型是不可行的,甚至是不可能的。因此,为了让最佳的中心化模型与链上环境连接起来,从而使其受益于复杂的自动化,这对他们来说是足够好的第一步。目前看来,可提供 API 访问点的硬件隔离区(TEE,即「空隔离」处理器)、双向预言机(用于双向索引链上和链下数据)以及为代理提供可验证的链下计算环境似乎是最佳解决方案。还有一些使用零知识证明(ZKP)进行快照状态变化的协处理器体系结构,而不是验证完整计算的,我们也认为在中期是可行的。
对于同样的问题的更理想主义的方法试图验证链下推理,以使其与链上计算在信任假设方面保持一致。在我们看来,这样做的目标应该是允许 AI 在单一连贯的运行时环境中执行链上和链下的任务。然而,大多数推理可验证性的支持者谈论「信任模型权重」等头绪不清的目标,实际上这些目标在未来几年甚至永远不会变得重要。最近,这个阵营的创始人开始探索替代方法来验证推理,但最初都是基于 ZKP 的。尽管很多聪明的团队正在研究所谓的 ZKML,但他们在预期加密优化超过 AI 模型的复杂性和计算需求方面冒着太大的风险。因此,我们认为他们目前不适合竞争。然而,最近的一些进展是有趣的,不应该被忽视。 半合法
使用封闭和开源模型的封装器的消费者应用程序(例如,用于图像生成的 Stable Diffusion 或 Midjourney)。其中一些团队是市场上第一批并拥有实际用户的吸引力。因此,一概而论地称他们为虚假的是不公平的,但只有少数人在深入思考如何以去中心化的方式发展其基础模型,并在激励设计方面进行创新。在这方面有一些有趣的治理 / 所有权方面的变化。但这个类别中的大多数项目只是在 OpenAI API 等中心化封装器上添加了一个代币,以获取估值溢价或为团队提供更快的流动性。
以上两个阵营都没有解决的问题是在去中心化环境中进行大模型的训练和推理。目前,没有办法在合理的时间内训练基础模型,而不依赖于紧密连接的硬件集群。考虑到竞争水平,「合理的时间」是关键因素。
最近有一些有希望的研究成果出现,理论上,诸如差分数据流之类的方法可以扩展到分布式计算网络,以增加其未来的容量(随着网络能力与数据流要求的不断匹配)。但是,有竞争力的模型训练仍然需要本地化集群(而不是单一分布式设备)之间的通信,以及尖端的计算能力(零售 GPU 越来越缺乏竞争力)。
最近,关于通过缩小模型大小来本地化(去中心化的两种方式之一)推理的研究也有所进展,但是在 Web3 中没有利用它的现有协议。
去中心化训练和推理的问题逻辑上将我们带到了三个阵营中的最后一个,也是最重要的一个,因此对我们来说情绪上触发最强烈的一个。 伪造者
基础设施应用主要集中在去中心化服务器领域,提供裸硬件或去中心化模型训练 / 托管环境。还有一些软件基础设施项目,正在推动诸如联合学习(去中心化模型训练)的协议,或者将软件和硬件组件合并到一个单一平台中,人们基本上可以端到端地训练和部署他们的去中心化模型。它们中的大多数都缺乏实际解决所述问题所需的复杂性,"代币激励 + 市场风向 "的天真想法在这里占了上风。我们在公开市场和私人市场上看到的解决方案都无法在此时此刻达到有意义的竞争。有些方案可能会发展成为可行的(但小众的)产品,但我们现在需要的是新鲜的、有竞争力的方案。这只能通过创新设计来实现,解决分布式计算瓶颈。在训练中,不仅速度是问题,工作完成的可验证性和训练工作负载的协调也是问题,这增加了带宽瓶颈。
我们需要一组具有竞争力且真正去中心化的基础模型,它们需要去中心化的训练和推理才能发挥作用。如果计算机变得智能化,而 AI 又是中心化的,那么除了某种反乌托邦版本之外,就不会有世界计算机可以谈论了。
训练和推理是 AI 创新的核心。当 AI 世界的其他部分都朝着更加紧密的架构迈进时,Web3 需要一些正交的解决方案来与之竞争,因为正面竞争的可行性正变得越来越低。 问题的规模
这一切都关乎计算能力。无论是在训练还是推理过程中,你投入得越多,结果就越好。是的,这里有一些调整和优化,而计算本身也不是同质的,现在有各种新方法来克服传统冯·诺依曼架构处理单元的瓶颈,但最终,一切都归结于你能在多大的内存块上进行多少矩阵乘法运算以及运算的速度有多快。
这就是为什么我们看到所谓的「超大规模运营商」在数据中心方面进行了如此强大的建设,他们都在寻求创建一个以 AI 模型强大处理器为顶层、以支持它的硬件为底层的全栈:OpenAI( 模型 )+Microsoft( 计算 ),Anthropic( 模型 )+AWS( 计算 ),Google( 两者都有 ) 和 Meta( 通过加倍扩建数据中心,越来越多地涉足两者 )。有更多的细微差别、相互作用动态和参与方,但我们在此不展开讨论。总体情况是,超大规模运营商正在投入前所未有的数十亿美元进行数据中心的扩建,并在他们的计算和 AI 产品之间创造协同效应,预计随着 AI 在全球经济中的普及将产生巨大回报。
让我们仅看看今年这 4 家公司预期的扩建水平: Meta 预计 2024 年的资本开支在 300-370 亿美元之间,这很可能会严重偏向于数据中心。 微软在 2023 年的资本支出约为 115 亿美元,据传在 24-25 年还将投资 400-500 亿美元!仅从几个国家宣布的巨额数据中心投资就可以部分推断出这一点:英国 32 亿美元,澳大利亚 35 亿美元,西班牙 21 亿美元,德国 32 亿欧元,美国佐治亚州 10 亿美元,威斯康星州 100 亿美元。而这些仅仅是他们遍布 60 多个地区的 300 个数据中心网络中的一些区域性投资。还有传言称微软可能为 OpenAI 花费另外 1000 亿美元建造一台超级计算机! 亚马逊的领导层预计,他们的资本支出将在 2024 年大幅增长,而 2023 年的支出为 480 亿美元,主要是由于 AWS 基础设施为人工智能而扩建。 Google 仅在 2023 年第四季度就花费了 110 亿美元来扩展其服务器和数据中心。他们承认这些投资是为了满足预期的 AI 需求,并预计由于 AI 在 2024 年他们的基础设施支出的速度和总额将显著增加。
以下是 NVIDIA 在 2023 年 AI 硬件上已经花费的金额:
英伟达的首席执行官黄仁勋一直在宣传未来几年将投入 1 万亿美元用于人工智能加速。他最近将这个预测翻倍至 2 万亿美元,据称是由于他看到的主权参与者的兴趣。Altimeter 的分析师预计,2024 年和 2025 年全球人工智能相关数据中心的支出分别为 1600 亿美元和超过 2000 亿美元。
现在将这些数字与 Web 3 为独立数据中心运营商提供的数字进行比较,以激励他们在最新的 AI 硬件上扩大资本支出: 所有去中心化物理基础设施(DePIn)项目的总市值目前约为 400 亿美元,这些市值相对不流动并且主要是投机性的代币。从本质上讲,这些网络的市值等于其贡献者的总资本支出的上限估计,因为他们用代币激励这种建设。然而,目前的市值几乎没有用,因为它已经发行了。 那么,我们假设未来 3-5 年内还有另外 800 亿美元(现有价值的 2 倍)的私人和公开 DePIn 代币市值作为激励进入市场,并假设这完全用于 AI 用例。
即使我们将这个非常粗略的估计除以 3 年,并将其美元价值与仅在 2024 年超大规模运营商花费的现金进行比较,很明显,将代币激励措施应用于一系列「去中心化 GPU 网络」项目是不够的。
投资者还需要数十亿美元的需求来吸收这些代币,因为这些网络的运营商出售大量这样开采的币以支付资本支出这样的成本。还需要更多的数十亿美元来推高这些代币的价值,并激励建设的增长以超越超大规模运营商。
然而,对于大多数 Web3 服务器当前运行方式有着深入了解的人可能会期望「去中心化物理基础设施」的很大一部分实际上是在这些超大规模运营商的云服务上运行的。当然,对 GPU 和其他 AI 专业硬件的需求激增也正在推动更多的供应,这最终应该会使云租用或购买它们变得更便宜。至少这是人们的预期。
但同时也要考虑到:现在英伟达需要优先为客户提供最新一代的 GPU。同时,英伟达也开始在自己的地盘上与最大的云计算提供商展开竞争,为那些已经被锁定在超大规模服务器上的企业客户提供人工智能平台服务。这最终会促使它要么随着时间的推移建立自己的数据中心(实质上会侵蚀他们现在享受的丰厚利润,因此不太可能),要么将其人工智能硬件销售大幅限制在其合作网络云提供商的范围内。
此外,NVIDIA 的竞争对手推出了额外的 AI 专用硬件,大多使用与台积电生产的 NVIDIA 相同的芯片。因此,基本上所有的 AI 硬件公司目前都在争夺台积电的产能。台积电也需要优先考虑某些客户。三星和潜在的英特尔(该公司正试图很快回到最先进的芯片制造领域)可能能够吸收额外的需求,但台积电目前正在生产大部分与人工智能相关的芯片,并且扩展和校准尖端芯片制造(3 和 2 纳米)需要数年时间。
最重要的是,目前所有的尖端芯片制造都是由台湾的台积电和韩国的三星在台湾海峡附近完成的,在目前在美国建造的抵消这一点的设施(并且预计在未来几年内不会生产下一代芯片)可能启动之前,军事冲突的风险可能会成为现实。
最后,由于美国对英伟达和台积电的限制,中国基本上与最新一代人工智能硬件隔绝,中国正在争夺剩余的计算能力,就像 Web3 DePIn 网络一样。与 Web3 不同的是,中国企业实际上拥有自己的竞争模型,尤其是来自百度和阿里巴巴等公司的大型语言模型(LLM),这些模型需要大量的上一代设备才能运行。
因此,由于上述原因之一或多种因素的结合,存在一个非实质性的风险,即超大规模云服务提供商在人工智能主导战争加剧并优先于云业务的情况下,限制对其人工智能硬件的外部方访问。基本上,这是一个他们占用所有与人工智能相关的云计算容量以供自己使用,并且不再向任何其他人提供的情况,同时还将所有最新的硬件吞并的情景。这种情况发生后,剩余的计算供应将被其他大型参与者(包括主权国家)需求更高。而消费级 GPU 却越来越没有竞争力。
显然,这是一个极端的情况,但对于大型玩家来说,奖励太大了,以至于即使硬件瓶颈仍然存在,他们也不会退缩。这样一来,像二级数据中心和零售级硬件所有者这样的去中心化运营商(占 Web3 DePIn 提供商的大多数)就会被排除在竞争之外。
硬币的另一面
当加密货币创始人还没意识到时,人工智能巨头密切关注着加密货币。政府压力和竞争可能会迫使他们采用加密货币,以避免被关闭或受到严格监管。
Stability AI 创始人最近辞职,以开始「去中心化」他的公司,这是其中一个最早公开暗示的迹象。他之前曾在公开露面时毫不掩饰地表示计划在公司成功完成 IPO 之后推出代币,这在某种程度上透露出了预期动机的真实性。
同样,虽然萨姆·奥特曼(Sam Altman)并未在他共同创立的加密项目 Worldcoin 的运营中参与,但其代币确实像 OpenAI 的代理进行交易。关于是否有路径将自由互联网货币项目与人工智能研发项目连接起来,只有时间才能告诉我们,但 Worldcoin 团队似乎也意识到市场正在测试这一假设。
对我们来说,人工智能巨头可能会探索不同的去中心化路径是有道理的。我们在这里看到的问题是,Web3 尚未提出有意义的解决方案。「治理代币」在很大程度上是一个梗,而只有那些明确避免资产持有人与其网络开发和运营之间直接联系的代币,比如 $BTC 和 $ETH,目前才是真正的去中心化。
导致技术发展缓慢的(不)激励机制同样也会影响管理加密网络的不同设计的发展。初创团队只是在他们的产品上贴上一个「治理代币」的标签,希望找到解决方案,而最终只是陷入了「治理剧场」周围的资源分配。
结论
人工智能竞赛正在进行中,每个人都非常重视。我们找不到大型科技公司思维中的漏洞,更多的计算意味着更好的人工智能,更好的人工智能意味着降低成本、增加新的收入和扩大市场份额。对我们来说,这意味着泡沫是合理的,但所有骗子仍然会在不可避免的抖动中被清除出局。
集中式大型企业人工智能正在主导这一领域,而合法的初创公司发现很难跟上。Web3 空间加入的较晚,但也正在加入这场竞赛。市场对加密货币人工智能项目的奖励过于丰厚,相比之下,Web2 初创公司在这一领域的奖励就显得较少,这导致创始人的兴趣从交付产品转向在关键时刻推动代币的增值,而抓住赶上的机会的窗口正在迅速关闭。到目前为止,还没有任何正交创新在这里出现,可以绕过扩大计算规模以竞争。
现在围绕面向消费者的模型存在可信的开源运动,最初是由一些中心化的玩家推动前进,他们选择与更大的闭源竞争对手争夺市场份额(例如 Meta、Stability AI)。但现在社区正在迎头赶上,并向领先的人工智能公司施加压力。这些压力将继续影响人工智能产品的闭源开发,但在开源赶上的情况下并不具有实质性的影响。这对于 Web3 空间是另一个重大机会,但前提是它解决了去中心化模型训练和推理的问题。
因此,尽管在表面上为「经典」的颠覆者提供了机会,但现实情况与之相距甚远。人工智能主要与计算相关联,除非在未来 3-5 年内出现突破性创新,否则无法改变这一情况,这对于确定谁控制和引导人工智能发展至关重要。
即使需求推动了供应端的努力,计算市场本身也无法「百花齐放」,而制造商之间的竞争受到了芯片制造和规模经济等结构性因素的制约。
我们对人类的聪明才智持乐观态度,并确信有足够聪明和高尚的人来尝试解决人工智能问题领域,以有利于自由世界而不是自上而下的公司或政府控制。但胜算看起来非常渺茫,最多只能说是一个投机游戏,且 Web3 创始人们忙于金融利益而不是现实世界的影响。