一群工程师、研究人员和一家硅谷芯片公司合作发布了先进的阿拉伯语言软件,可以为生成式人工智能应用程序提供支持。
名为 Jais 的新大型语言模型包含 130 亿个参数,这些参数由大量阿拉伯语和英语相结合的数据组成,其中一部分来自计算机代码。 该小组由学者和工程师组成,他们参与该项目的部分原因是他们表示很少有大型双语语言模型。
新的语言模型是在硅谷 Cerebras Systems 生产的超级计算机的帮助下创建的,该公司设计的餐盘大小的芯片可与 Nvidia 强大的人工智能硬件竞争。 英伟达的芯片供应短缺,这促使世界各地的公司寻求替代品。
Jais 以阿拉伯联合酋长国最高峰命名,是 Cerebras、穆罕默德·本·扎耶德人工智能大学和总部位于阿布扎比的科技集团 G42 旗下子公司 Inception(专注于人工智能)之间的合作项目。
穆罕默德·本·扎耶德人工智能大学教授蒂莫西·鲍德温表示,由于没有足够的阿拉伯语数据来训练 Jais 大小的模型,因此英语数据中的计算机代码有助于训练模型的推理能力。