新基准测试系统训练类似 ChatGPT 的聊天机器人的速度
MLCommons 是一家为人工智能 (AI) 技术开发基准测试的组织,该组织周二公布了一项新测试的结果,该测试确定了用于 ChatGPT 和 Nvidia (NVDA.O) 等聊天机器人的训练算法获胜时的系统速度。 MLPerf 基准测试基于 GPT-3,这是一种用于训练 ChatGPT 的 AI 模型,ChatGPT 是由 OpenAI 开发并得到 Microsoft (MSFT.O) 支持的病毒式聊天机器人。然而,由于模型庞大,基准测试仅使用了代表性部分。 MLCommons 执行董事 David Kanter 告诉路透社:“这是我们迄今为止最昂贵的基准。” “我们花费了超过 60 万小时的加速器计算时间来开发它,再加上一些才华横溢的工程师。” 坎特拒绝透露开发成本,仅表示为数百万美元。 只有两家芯片公司——英伟达和英特尔 (INTC.O) Habana Labs——提交了基准测试结果,最快的时间来自使用英伟达最新 H100 芯片的系统,英伟达是人工智能训练硬件领域无可争议的领导者。 Nvidia 与 AI 云初创公司 CoreWeave 合作提交的最大系统使用了 3,584 个 H100 芯片,训练时间为 10.94 分钟。被英特尔收购的人工智能芯片公司 Habana Labs 在配备 384 个 Gaudi2 芯片的小得多的系统上运行了 311.945 分钟的基准测试。 一般来说,更多的芯片和更大的系统意味着更快的训练。 英特尔人工智能产品高级总监 Jordan Plawner 表示,结果展示了 Gaudi2 的潜力,Gaudi2 将在 9 月份进行软件更新以提高速度。 “Habana 结果的速度将提高 1.5 至 2 倍。因此,我们会看到 Habana Gaudi2 真正具有竞争力,而且价格比 H100 更低,”Plawner 告诉路透社。 Plawner 拒绝透露 Gaudi2 芯片的成本,但表示业界需要第二家芯片供应商来进行 AI 训练,而 MLPerf 结果显示英特尔可以满足这一需求。
Leave a Reply