阿联酋Falcon 40B雄踞排行榜榜首：在开源AI模型的最新Hugging Face独立验证中全球排名第一

发布时间：2023-06-02

分享到：

QQ空间新浪微博腾讯微博微信更多

阿布扎比，阿拉伯联合酋长国--(美国商业资讯)--阿布扎比技术创新研究所（TII）上周推出的阿联酋首个大规模开源、400亿参数人工智能模型 Falcon 40B飙升至Hugging Face最新开放大型语言模型（LLM）排行榜榜首。Hugging Face是一家寻求通过开源和开放科技实现人工智能民主化的美国公司，被公认为全球权威的AI模型独立验证者。

本新闻稿包含多媒体。此处查看新闻稿全文： https://www.businesswire.com/news/home/20230529005055/zh-CN/

在成功击败Meta的LLaMA（包括其65B模型）、Stability AI的StableLM和Together的 RedPajama等成熟模型后，Falcon 40B获得此梦寐以求的排名。该指数使用评估生成性语言模型的综合框架Eleuther AI Language Model Evaluation Harness的四个关键基准：AI2推理挑战（25-样本）、一组小学科学问题；对人类很容易、但对SOTA模型有难度的常识推理测试HellaSwag (10-样本)；衡量文本模型多任务准确性测试MMLU（5-样本）；以及衡量语言模型在生成问题答案时是否真实的测试TruthfulQA (0-样本)。

Hugging Face的Open LLM排行榜是向AI社区开放的客观评估工具，可在发布LLM和聊天机器人时对其进行跟踪、排名和评估。

Falcon 40B采用1万亿个令牌进行训练，标志着阿联酋迈向AI领导地位的重大转折点，使该模型的权重能够广泛用于研究和商业应用。新排名证实了该模型的超凡能力，让AI更透明、更包容，并且更易于访问，为人类带来更大福祉。

凭借这一最新进展，TII成功确保阿联酋在生成性AI模型领域占有一席之地，并让该国成为致力于推动AI创新和协作的少数国家之一。

TII已经着手开发下一版本Falcon：180B AI模型。要了解有关当前开源Falcon 40B AI模型的更多信息，请访问：FalconLLM.TII.ae。有关Falcon 40B的初始公告，请参阅以下链接：阿联酋技术创新研究所推出用于研究和商业应用的开源“Falcon 40B”大型语言模型。

有关更多信息，请访问www.tii.ae

*来源：AETOSWire

免责声明：本公告之原文版本乃官方授权版本。译文仅供方便了解之用，烦请参照原文，原文版本乃唯一具法律效力之版本。

在 businesswire.com 上查看源版本新闻稿: https://www.businesswire.com/news/home/20230529005055/zh-CN/

CONTACT:

Jennifer Dewan
沟通高级总监
jennifer.dewan@tii.ae

Falcon 40B雄踞Hugging Face Open LLM排行榜全球首位（图片来源：AETOSWire）

来源：

作者：

阿联酋Falcon 40B雄踞排行榜榜首：在开源AI模型的最新Hugging Face独立验证中全球排名第一

>相关文章