MLCommons 是一家为人工智能 (AI) 技术开发基准测试的组织,该组织周二公布了一项新测试的结果,该测试确定了用于 ChatGPT 和 Nvidia (NVDA.O) 等聊天机器人的训练算法获胜时的系统速度。 MLPerf 基准测试基于 GPT-3,这是一种用于训练 ChatGPT 的 AI 模型,ChatGPT 是由 OpenAI 开发并得到 Microsoft (MSFT.O) 支持的病毒式聊天机器人。然而,由于模型庞大,基准测试仅使用了代表性部分。 MLCommons 执行董事 David Kanter 告诉路透社:“这是我们迄今为止最昂贵的基准。” “我们花费了超过 60 万小时的加速器计算时间来开发它,再加上一些才华横溢的工程师。” 坎特拒绝透露开发成本,仅表示为数百万美元。 只有两家芯片公司——英伟达和英特尔 (INTC.O) Habana Labs——提交了基准测试结果,最快的时间来自使用英伟达最新 H100 芯片的系统,英伟达是人工智能训练硬件领域无可争议的领导者。 Nvidia 与 AI 云初创公司 CoreWeave 合作提交的最大系统使用了 3,584 个 H100 芯片,训练时间为 10.94 分钟。被英特尔收购的人工智能芯片公司 Habana Labs 在配备 384 个 Gaudi2 芯片的小得多的系统上运行了 311.945 分钟的基准测试。 一般来说,更多的芯片和更大的系统意味着更快的训练。 英特尔人工智能产品高级总监 Jordan Plawner 表示,结果展示了 Gaudi2 的潜力,Gaudi2 将在 9 月份进行软件更新以提高速度。 “Habana 结果的速度将提高 1.5 至 2 倍。因此,我们会看到 Habana Gaudi2 真正具有竞争力,而且价格比 H100 更低,”Plawner 告诉路透社。 Plawner 拒绝透露 Gaudi2 芯片的成本,但表示业界需要第二家芯片供应商来进行 AI 训练,而 MLPerf 结果显示英特尔可以满足这一需求。

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

韩国首尔附近发生持刀伤人事件 14人受伤

警方称,周四,在韩国首都首尔附近的一个通勤小镇,一名男子将汽车撞向路人,然后下车刺伤了一些人,造成 14 人受伤。 城南市发生不明原因袭击事件几天前,韩国又发生一起罕见的刺伤事件,造成一人死亡、三人受伤。 警方表示,周四的袭击者显然是在随机袭击他人后被捕。 媒体报道称,他是一名 20 多岁的男子,从事送货工作,患有一些心理健康问题。 袭击发生在 Seohyeon 站附近,该地区距离首尔约 20…

消息人士称,OpenAI 首席执行官 Sam Altman 讨论了可能的回报,考虑新的人工智能企业

一位知情人士周六表示,刚刚被罢免的 OpenAI 首席执行官萨姆·奥尔特曼 (Sam Altman) 正在讨论重返 ChatGPT 机器人背后的公司的可能性,尽管他正在考虑推出一家新的人工智能 (AI) 企业。 董事会以震惊科技界的出人意料的举动解雇了他,一天后,Altman 与…

欧元债市:公债收益率下滑,等待美国就业数据公布

欧元债市:公债收益率下滑,等待美国就业数据公布 路透阿姆斯特丹7月8日 – 欧元区公债收益率周五下跌,市场在美国就业数据公布前寻求方向。

印度修改电力政策草案以停止新的燃煤产能

消息人士称,印度计划通过删除其国家电力政策 (NEP) 最终草案中的一项关键条款,停止建设新的燃煤电厂,除了那些已经在建的燃煤电厂,以大力推动应对气候变化。 该草案如果得到总理纳伦德拉莫迪主持的联邦内阁的批准,将使中国成为唯一一个对增加大量新燃煤发电能力的新要求持开放态度的主要经济体。 印度和中国约占所有活跃煤炭项目的 80%,因为大多数发展中国家都在削减产能以实现气候目标。据独立气候智库 E3G 称,截至 2023 年 1 月,只有…