BaaghiTV Chinese

新基准测试系统训练类似 ChatGPT 的聊天机器人的速度

Written by

in

MLCommons 是一家为人工智能 (AI) 技术开发基准测试的组织，该组织周二公布了一项新测试的结果，该测试确定了用于 ChatGPT 和 Nvidia (NVDA.O) 等聊天机器人的训练算法获胜时的系统速度。 MLPerf 基准测试基于 GPT-3，这是一种用于训练 ChatGPT 的 AI 模型，ChatGPT 是由 OpenAI 开发并得到 Microsoft (MSFT.O) 支持的病毒式聊天机器人。然而，由于模型庞大，基准测试仅使用了代表性部分。 MLCommons 执行董事 David Kanter 告诉路透社：“这是我们迄今为止最昂贵的基准。” “我们花费了超过 60 万小时的加速器计算时间来开发它，再加上一些才华横溢的工程师。” 坎特拒绝透露开发成本，仅表示为数百万美元。只有两家芯片公司——英伟达和英特尔 (INTC.O) Habana Labs——提交了基准测试结果，最快的时间来自使用英伟达最新 H100 芯片的系统，英伟达是人工智能训练硬件领域无可争议的领导者。 Nvidia 与 AI 云初创公司 CoreWeave 合作提交的最大系统使用了 3,584 个 H100 芯片，训练时间为 10.94 分钟。被英特尔收购的人工智能芯片公司 Habana Labs 在配备 384 个 Gaudi2 芯片的小得多的系统上运行了 311.945 分钟的基准测试。一般来说，更多的芯片和更大的系统意味着更快的训练。英特尔人工智能产品高级总监 Jordan Plawner 表示，结果展示了 Gaudi2 的潜力，Gaudi2 将在 9 月份进行软件更新以提高速度。 “Habana 结果的速度将提高 1.5 至 2 倍。因此，我们会看到 Habana Gaudi2 真正具有竞争力，而且价格比 H100 更低，”Plawner 告诉路透社。 Plawner 拒绝透露 Gaudi2 芯片的成本，但表示业界需要第二家芯片供应商来进行 AI 训练，而 MLPerf 结果显示英特尔可以满足这一需求。

Comments

Leave a Reply Cancel reply

More posts