本新闻稿包含多媒体。此处查看新闻稿全文: https://www.businesswire.com/news/home/20230529005055/zh-CN/
在成功击败Meta的LLaMA(包括其65B模型)、Stability AI的StableLM和Together的 RedPajama等成熟模型后,Falcon 40B获得此梦寐以求的排名。该指数使用评估生成性语言模型的综合框架Eleuther AI Language Model Evaluation Harness的四个关键基准:AI2推理挑战(25-样本)、一组小学科学问题;对人类很容易、但对SOTA模型有难度的常识推理测试HellaSwag (10-样本);衡量文本模型多任务准确性测试MMLU(5-样本);以及衡量语言模型在生成问题答案时是否真实的测试TruthfulQA (0-样本)。
Hugging Face的Open LLM排行榜是向AI社区开放的客观评估工具,可在发布LLM和聊天机器人时对其进行跟踪、排名和评估。
Falcon 40B采用1万亿个令牌进行训练,标志着阿联酋迈向AI领导地位的重大转折点,使该模型的权重能够广泛用于研究和商业应用。新排名证实了该模型的超凡能力,让AI更透明、更包容,并且更易于访问,为人类带来更大福祉。
凭借这一最新进展,TII成功确保阿联酋在生成性AI模型领域占有一席之地,并让该国成为致力于推动AI创新和协作的少数国家之一。
TII已经着手开发下一版本Falcon:180B AI模型。要了解有关当前开源Falcon 40B AI模型的更多信息,请访问:FalconLLM.TII.ae。有关Falcon 40B的初始公告,请参阅以下链接:阿联酋技术创新研究所推出用于研究和商业应用的开源“Falcon 40B”大型语言模型。
有关更多信息,请访问www.tii.ae
*来源:AETOSWire
免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。
在 businesswire.com 上查看源版本新闻稿: https://www.businesswire.com/news/home/20230529005055/zh-CN/
CONTACT:
Jennifer Dewan
沟通高级总监
jennifer.dewan@tii.ae
Falcon 40B雄踞Hugging Face Open LLM排行榜全球首位(图片来源:AETOSWire)