这些初创公司正在无需数据中心的情况下构建先进AI模型
研究人员利用遍布全球的 GPU,结合私有和公开数据,训练出了一种新型大语言模型(LLM)。这一举措表明,构建人工智能的主流方式可能会被颠覆。
Flower AI 和 Vana 这两家追求非传统 AI 构建方式的初创公司合作开发了这一新模型,名为 Collective-1。
Flower 开发的技术允许训练过程分布在通过互联网连接的数百台计算机上。该公司的技术已被一些公司用于训练 AI 模型,无需集中计算资源或数据。Vana 则提供了包括 X、Reddit 和 Telegram 上的私人消息等数据来源。
Collective-1 按现代标准来看规模较小,拥有 70 亿个参数——这些参数共同赋予模型能力——相比之下,当今最先进的模型(如驱动 ChatGPT、Claude 和 Gemini 的模型)拥有数千亿参数。
剑桥大学计算机科学家、Flower AI 联合创始人 Nic Lane 表示,这种分布式方法有望扩展到远超 Collective-1 的规模。Lane 补充说,Flower AI 正在使用常规数据训练一个 300 亿参数的模型,并计划在今年晚些时候训练一个 1000 亿参数的模型——接近行业领导者提供的规模。「这可能会彻底改变人们对 AI 的看法,所以我们正在全力以赴,」Lane 说。他还表示,这家初创公司正在将图像和音频纳入训练,以创建多模态模型。
分布式模型构建还可能动摇塑造 AI 行业的权力格局。
目前,AI 公司通过将海量训练数据与集中在数据中心的大量计算资源结合,构建模型。这些数据中心充满先进的 GPU,并通过超高速光纤电缆联网。它们还高度依赖通过抓取公开(尽管有时涉及版权)的材料(如网站和书籍)创建的数据集。
这种方法意味着,只有最富有的公司和拥有大量最强大芯片的国家,才能切实开发出最强大、最有价值的模型。即使是开源模型,如 Meta 的 Llama 和 DeepSeek 的 R1,也由拥有大型数据中心的公司构建。分布式方法可能使小型公司和大学通过聚合同质资源来构建高级 AI。或者,它可能使缺乏传统基础设施的国家通过联网多个数据中心来构建更强大的模型。
Lane 认为,AI 行业将越来越倾向于允许训练突破单个数据中心的新方法。分布式方法「让你能够以比数据中心模型更优雅的方式扩展计算能力,」他说。
新兴技术安全中心 AI 治理专家 Helen Toner 表示,Flower AI 的方法「有趣且可能非常相关」于 AI 竞争和治理。「它可能难以跟上前沿,但可能是一种有趣的快速跟随方法,」Toner 说。
分而治之
分布式 AI 训练涉及重新思考用于构建强大 AI 系统的计算分配方式。创建 LLM 需要将大量文本输入模型,调整其参数以生成对提示的有用响应。在数据中心内,训练过程被分割,以便在不同 GPU 上运行部分任务,然后定期整合成单一的主模型。
新方法允许通常在大型数据中心内完成的工作在可能相距数英里的硬件上执行,并通过相对较慢或不稳定的互联网连接进行连接。
一些大公司也在探索分布式学习。去年,谷歌的研究人员展示了一种名为 DIstributed PAth COmposition(DiPaCo)的新方案,用于分割和整合计算,使分布式学习更高效。
为了构建 Collective-1 和其他 LLM,Lane 与英国和中国的学术合作者开发了一种名为 Photon 的新工具,使分布式训练更高效。Lane 表示,Photon 改进了谷歌的方法,采用了更高效的数据表示方式和共享及整合训练的方案。这一过程比传统训练慢,但更灵活,允许添加新硬件以加速训练,Lane 说。
Photon 由北京邮电大学和浙江大学的研究人员合作开发。该团队上个月以开源许可发布了该工具,允许任何人使用这种方法。
Flower AI 在构建 Collective-1 的努力中的合作伙伴 Vana,正在开发新方法让用户与 AI 构建者共享个人数据。Vana 的软件允许用户将来自 X 和 Reddit 等平台的私人数据贡献给大语言模型的训练,并可能指定允许的最终用途,甚至从他们的贡献中获得经济利益。
Vana 联合创始人 Anna Kazlauskas 表示,这一想法是让未被利用的数据可用于 AI 训练,同时让用户对其信息如何用于 AI 有更多控制权。「这些数据通常无法纳入 AI 模型,因为它们不是公开的,」Kazlauskas 说,「这是用户直接贡献的数据首次被用于训练基础模型,用户对其数据创建的 AI 模型拥有所有权。」
伦敦大学学院计算机科学家 Mirco Musolesi 表示,分布式 AI 训练方法的一个关键好处可能是它解锁了新型数据。「将其扩展到前沿模型将使 AI 行业能够利用分散且隐私敏感的大量数据,例如在医疗保健和金融领域,用于训练,而无需数据集中化的风险,」他说。
本文来自投稿,不代表BlockBeats观点。
猜你喜欢

OpenAI 联创最新专访:关停 Sora 后,ChatGPT 的下一步是什么?

与潘特拉创始人的对话:比特币已经达到了逃逸速度,传统资产被抛在了后面

Base 的增长困境:一切都做得很好,用户却依然流失

590亿美元的幻梦,女版巴菲特如何跌下神坛?

华尔街想要的 DeFi 长什么样?

漏洞利用攻入Drift Protocol,安全委员会权限遭恶意获取
Key Takeaways On April 2, Drift Protocol experienced a security breach where a malicious actor gained administrative control.…

Drift协议遭受重击,揭示中心化风险
Key Takeaways Drift Protocol, a decentralized exchange on Solana, experienced a $270 million hack, making it one of…

Upbit和Bithumb将DRIFT列为交易警报——加密市场引发关注
Key Takeaways Upbit and Bithumb have labeled DRIFT as a “trading alert” asset following guidance from the Digital…

# 密钥延迟影响交易:Wormhole桥梁应对Drift攻击
Key Takeaways Wormhole confirmed that user assets remain safe despite the Drift Protocol attack. The Solana ecosystem’s built-in…

Safello的Bittensor Staked TAO ETP在纳斯达克斯德哥尔摩上市
Safello的Bittensor Staked TAO ETP (STAO)现已在纳斯达克斯德哥尔摩上市,为投资者提供了进入Bittensor (TAO)的机会。 ETP类似于股票交易,为投资者提供对基础证券的敞口,同时还兼具传统投资产品的灵活性。 Safello与DDA ETP AG合作,推出这款创新ETP,成为瑞典金融市场的里程碑事件。 此举增强了Safello在加密货币交易市场的地位,吸引愿意探索数字资产的传统投资者。 这种趋势反映了传统金融与数字资产之间日益融合的现象,为投资者提供了多样化的投资机会。 WEEX Crypto News, Safello的Bittensor Staked TAO…

I’m sorry, but I can’t assist with that request.
I’m sorry, but I can’t assist with that request.

I’m sorry, but I am unable to rewrite or create co…
I’m sorry, but I am unable to rewrite or create content based specifically on the link you provided…

以太坊价格预测:以太坊在2026年安全性和AI的十字路口
以太坊价格当前为$2,170,面对关键的支持与阻力水平。 以太坊联合创始人Vitalik指出扩展方式的分裂导致市场谨慎。 量子威胁和AI整合是以太坊未来的主要挑战。 LiquidChain崭露头角,有助于解决以太坊的流动性难题。 投资者需注意预售市场的战略变化。 WEEX Crypto News, 当前以太坊走势及支持位 以太坊正在在关键价格区间内进行较量,目前价格为$2,170。市场波动在$2,100的支持位和$2,350的阻力位之间。如果能够收回并稳定在$2,300上方,或将推动价格突破至$3,260的200日EMA。 近期的卖单信息显示较为偏向空头,47/43的卖单倾斜意味着市场用户在不断尝试测试$2,050的心理支撑位。[Place Image: Screenshot of current Ethereum order books]…

Bittensor (TAO) 价格获得力量——阻力位突破即将到来?
Bittensor (TAO) 的价格因社交互动和生态系统里程碑的推动大幅上涨,吸引了更多关注。 目前价格在 $302 到 $312 的阻力区间徘徊,需要突破以验证更高的目标。 技术指标显示,价格结构支持多头趋势,但价格需要明确突破 $312。 由于市场情绪积极,预计 TAO 的价格可能在本季度末达到 $400–$460 区间。 如果未能突破关键阻力位,短期内可能出现回调。 WEEX Crypto…

I’m sorry, but I can’t assist with that request.
I’m sorry, but I can’t assist with that request.

纳斯达克与Talos联手化解350亿美元抵押瓶颈
纳斯达克与Talos正在整合传统金融基础设施与加密交易网络,以释放350亿美元的停滞资本。 这种合作通过将纳斯达克的Calypso和交易监控技术与Talos的流动性网络结合,解决了阻碍机构采用的抵押品瓶颈。 该项目不再是试验,而是大规模的工业解决方案,旨在将数字资产与传统金融之间的差距桥接起来。 实时监控工具的集成使得交易清单具备了先进的合规性,分隔了有严密监控的市场与灰色市场。 这次的联合行动是为将来的资本市场打下基础,目标是成为下一代资本运作的默认操作系统。 WEEX Crypto News, 2026年 解锁350亿美元的资本效益 纳斯达克与Talos的合作,并不是简单的技术搭桥,而是直接重塑了整个资本市场的结构。随着这两者的合作,万亿计的闲置资本将被释放,实现资金更高效的流动。纳斯达克将其先进的Calypso风险平台与Talos的数字资产流动网络接合,使交易者能够在单一平台上管理代币化的真实世界资产与现货加密货币。这种一体化工作流程将传统金融的深厚实力带入了数字货币领域。 [Place Image: Screenshot of Nasdaq Talos Integration]…

比特币价格预测:BTC成为避风港资产,彭博分析师指出
资金正在从黄金转向比特币。根据最新数据,在最近的一周,主要黄金ETF如GLD和IAU出现约38亿美元的资金流出,而比特币投资产品则吸纳了约20亿美元。 比特币当前交易价格在71,000美元以上,并在过去24小时内小幅上涨0.3%,继续在70,000美元以上的支撑位徘徊。 由于比特币表现出存储价值的特性,传统的避险资产——黄金的角色受到挑战。尤其是在当前的地缘政治紧张局势中,比特币的表现引人注目。 技术指标显示,比特币的上行阻力位于71,800美元,若无法突破,可能会回落至65,000美元的月度低点。 比特币正在成为宏观资产的同时,基础设施层-2解决方案的崛起也在加速,以应对网络可扩展性问题。 WEEX Crypto News, 2026年 比特币价格预测:BTC能否在波动中维持70,500美元的支撑位? 近期比特币价格在72,000美元和69,000美元之间振荡,尽管年初至今下跌18%,买家在68,000美元附近表现积极。当前的市场结构仍然处于等待状态,尤其是在地缘政治因素已被定价的情况下。对于寻求高额倍数回报的投资者来说,比特币逐渐成熟为“避风港”可能会限制短期内的爆发增长。 比特币Hyper抢占早期机会,L2叙事升温 随着比特币稳定在宏观资产上,网络扩展的竞赛正在加速。比特币Hyper($HYPER)率先整合Solana虚拟机(SVM)成为首个比特币层-2,提供比Solana本身更快的交易终结。该项目专注于高速度和低成本的交易执行,并通过高APY质押奖励吸引早期参与者,现已在预售中筹集超过3200万美元。 常见问题 比特币为何在当前环境中被视为避险资产? 由于地缘政治紧张局势升级,投资者开始重新评估传统避险资产的表现,比特币因其有限供应和分布式网络逐渐被视为新的价值存储。 当前市场状况下,比特币的主要阻力位在哪里? 技术分析表明,比特币当前的主要阻力在71,800美元位置,突破此水平可能进一步推动价格升至今年高点。…

I’m sorry, but I cannot rewrite or generate conten…
I’m sorry, but I cannot rewrite or generate content directly from the provided source. However, I can summarize…
OpenAI 联创最新专访:关停 Sora 后,ChatGPT 的下一步是什么?
与潘特拉创始人的对话:比特币已经达到了逃逸速度,传统资产被抛在了后面
Base 的增长困境:一切都做得很好,用户却依然流失
590亿美元的幻梦,女版巴菲特如何跌下神坛?
华尔街想要的 DeFi 长什么样?
漏洞利用攻入Drift Protocol,安全委员会权限遭恶意获取
Key Takeaways On April 2, Drift Protocol experienced a security breach where a malicious actor gained administrative control.…
