这些初创公司正在无需数据中心的情况下构建先进AI模型
研究人员利用遍布全球的 GPU,结合私有和公开数据,训练出了一种新型大语言模型(LLM)。这一举措表明,构建人工智能的主流方式可能会被颠覆。
Flower AI 和 Vana 这两家追求非传统 AI 构建方式的初创公司合作开发了这一新模型,名为 Collective-1。
Flower 开发的技术允许训练过程分布在通过互联网连接的数百台计算机上。该公司的技术已被一些公司用于训练 AI 模型,无需集中计算资源或数据。Vana 则提供了包括 X、Reddit 和 Telegram 上的私人消息等数据来源。
Collective-1 按现代标准来看规模较小,拥有 70 亿个参数——这些参数共同赋予模型能力——相比之下,当今最先进的模型(如驱动 ChatGPT、Claude 和 Gemini 的模型)拥有数千亿参数。
剑桥大学计算机科学家、Flower AI 联合创始人 Nic Lane 表示,这种分布式方法有望扩展到远超 Collective-1 的规模。Lane 补充说,Flower AI 正在使用常规数据训练一个 300 亿参数的模型,并计划在今年晚些时候训练一个 1000 亿参数的模型——接近行业领导者提供的规模。「这可能会彻底改变人们对 AI 的看法,所以我们正在全力以赴,」Lane 说。他还表示,这家初创公司正在将图像和音频纳入训练,以创建多模态模型。
分布式模型构建还可能动摇塑造 AI 行业的权力格局。
目前,AI 公司通过将海量训练数据与集中在数据中心的大量计算资源结合,构建模型。这些数据中心充满先进的 GPU,并通过超高速光纤电缆联网。它们还高度依赖通过抓取公开(尽管有时涉及版权)的材料(如网站和书籍)创建的数据集。
这种方法意味着,只有最富有的公司和拥有大量最强大芯片的国家,才能切实开发出最强大、最有价值的模型。即使是开源模型,如 Meta 的 Llama 和 DeepSeek 的 R1,也由拥有大型数据中心的公司构建。分布式方法可能使小型公司和大学通过聚合同质资源来构建高级 AI。或者,它可能使缺乏传统基础设施的国家通过联网多个数据中心来构建更强大的模型。
Lane 认为,AI 行业将越来越倾向于允许训练突破单个数据中心的新方法。分布式方法「让你能够以比数据中心模型更优雅的方式扩展计算能力,」他说。
新兴技术安全中心 AI 治理专家 Helen Toner 表示,Flower AI 的方法「有趣且可能非常相关」于 AI 竞争和治理。「它可能难以跟上前沿,但可能是一种有趣的快速跟随方法,」Toner 说。
分而治之
分布式 AI 训练涉及重新思考用于构建强大 AI 系统的计算分配方式。创建 LLM 需要将大量文本输入模型,调整其参数以生成对提示的有用响应。在数据中心内,训练过程被分割,以便在不同 GPU 上运行部分任务,然后定期整合成单一的主模型。
新方法允许通常在大型数据中心内完成的工作在可能相距数英里的硬件上执行,并通过相对较慢或不稳定的互联网连接进行连接。
一些大公司也在探索分布式学习。去年,谷歌的研究人员展示了一种名为 DIstributed PAth COmposition(DiPaCo)的新方案,用于分割和整合计算,使分布式学习更高效。
为了构建 Collective-1 和其他 LLM,Lane 与英国和中国的学术合作者开发了一种名为 Photon 的新工具,使分布式训练更高效。Lane 表示,Photon 改进了谷歌的方法,采用了更高效的数据表示方式和共享及整合训练的方案。这一过程比传统训练慢,但更灵活,允许添加新硬件以加速训练,Lane 说。
Photon 由北京邮电大学和浙江大学的研究人员合作开发。该团队上个月以开源许可发布了该工具,允许任何人使用这种方法。
Flower AI 在构建 Collective-1 的努力中的合作伙伴 Vana,正在开发新方法让用户与 AI 构建者共享个人数据。Vana 的软件允许用户将来自 X 和 Reddit 等平台的私人数据贡献给大语言模型的训练,并可能指定允许的最终用途,甚至从他们的贡献中获得经济利益。
Vana 联合创始人 Anna Kazlauskas 表示,这一想法是让未被利用的数据可用于 AI 训练,同时让用户对其信息如何用于 AI 有更多控制权。「这些数据通常无法纳入 AI 模型,因为它们不是公开的,」Kazlauskas 说,「这是用户直接贡献的数据首次被用于训练基础模型,用户对其数据创建的 AI 模型拥有所有权。」
伦敦大学学院计算机科学家 Mirco Musolesi 表示,分布式 AI 训练方法的一个关键好处可能是它解锁了新型数据。「将其扩展到前沿模型将使 AI 行业能够利用分散且隐私敏感的大量数据,例如在医疗保健和金融领域,用于训练,而无需数据集中化的风险,」他说。
本文来自投稿,不代表BlockBeats观点。
猜你喜欢

Wintermute:2026年,加密逐渐成为互联网经济的清算层

加拿大监管机构制定更严格的加密资产托管指南以降低风险
关键要点:加拿大投资监管组织(CIRO)公布了其数字资产托管框架,以加强加密资产的保护……

全球资产大跌,「去美元化」的赌注失败时会发生什么?

利润下降四分之一,Tether为何放弃200亿美元融资计划

黄金与比特币:在2026年动荡的市场中,真正的避风港究竟是哪里?
2026年黄金与比特币之争:在市场动荡时期,究竟哪种资产能真正守护财富?危机时期的避风港:深度解析

2022年以来最强劲PMI遭遇Crypto最剧烈现货量下跌 — — 分析师看比特币上行
关键外卖 美国ISM制造业PMI达到52.6,标志着两年多来首次在…

二月3日卡尔达诺(ADA)价格分析
卡尔达诺的ADA代币在过去一天下跌1%,交易价格为0.2999美元,这发生在更广泛的市场下跌期间……

分析师指出,美国流动性状况引发2500亿美元市场暴跌
关键要点:加密货币市场近期2500亿美元的暴跌,更多是源于美国流动性问题而非……
WEEX交易所提醒:充值充错链或不支持币种,资产为何往往无法追回?
充值充错链或不支持币种为何难以追回?WEEX 解析区块链不可逆原理、平台技术边界,并给出充值前自检要点,助你避免资产损失。

XRP价格预测:因XRP面临1.70美元的挑战而强制平仓7000万美元 - 1.60美元是否在眼前?
要点:XRP目前面临着巨大的抛售压力,交易价格接近1.70美元,最近下跌了约...

以太坊基金会进入"紧缩阶段",Vitalik Buterin提现16,384 ETH——有何用意?
关键要点在以太坊基金会发生……期间,Vitalik Buterin已提取16,384枚ETH,数值约4450万美元。

驾驭加密货币交易的复杂性
加密货币交易量激增,吸引了各类投资者。理解市场策略与趋势对成功至关重要。风险管理……
左手到右手?剖析人工智能热潮背后的金融杠杆循环与华尔街终极高风险押注
对于一家以"安全"为核心品牌理念的公司而言,其历史上最大的风险敞口恰恰源于安全本身。

2026年人工智能交易黑客马拉松:用CoinGecko API(实盘市场数据)赢取188万美元奖池
一场黑客马拉松。两个机会。构建者现在可以在188万美元的主赛中,通过数据驱动的策略磨练他们的人工智能交易优势,同时赢得CoinGecko API赛道。

谷歌Gemini人工智能预测XRP、狗狗币和柴犬币在2026年底的价格走势
关键要点 双子座AI预测:谷歌Gemini人工智能预测XRP、狗狗币和柴犬币将出现显著涨价……

WEEX P2P 现在支持 IDR 和 MYR—商家招募现已开放
为了使加密货币存款更容易,WEEX 已正式推出其 P2P 交易平台,并继续扩展法币支持。我们很高兴地宣布 印尼卢比 (IDR) 和马来西亚林吉特 (MYR) 现在在 WEEX P2P 上可用!
加密货币交易所斥资数百万赞助足球队。WEEX押注西甲联赛的理由在此
探究加密货币交易所为何竞相投身足球赞助领域,以及WEEX与西甲联赛的合作如何体现出一种长远战略——这种战略由加密货币交易决策纪律和下行风险控制所塑造。

《透明度法案》陷入僵局:Coinbase如何反抗美国加密货币规则可能会冻结加密货币市场(2026年更新)
2026年一月:当Coinbase反对参议院的稳定币收益禁令时,CLARITY法案土崩瓦解。探索冻结加密货币监管并推动市场的3种“毒药丸”。
Wintermute:2026年,加密逐渐成为互联网经济的清算层
加拿大监管机构制定更严格的加密资产托管指南以降低风险
关键要点:加拿大投资监管组织(CIRO)公布了其数字资产托管框架,以加强加密资产的保护……
全球资产大跌,「去美元化」的赌注失败时会发生什么?
利润下降四分之一,Tether为何放弃200亿美元融资计划
黄金与比特币:在2026年动荡的市场中,真正的避风港究竟是哪里?
2026年黄金与比特币之争:在市场动荡时期,究竟哪种资产能真正守护财富?危机时期的避风港:深度解析
2022年以来最强劲PMI遭遇Crypto最剧烈现货量下跌 — — 分析师看比特币上行
关键外卖 美国ISM制造业PMI达到52.6,标志着两年多来首次在…