这家美国创企“烧出”最强开源大模型 能力号称接近GPT-4
文章来源: 腾讯科技 于
- 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
腾讯科技讯
3月28日消息,据国外媒体报道,美国人工智能初创公司Databricks日前发布了开源大语言模型DBRX。该公司声称,在语言理解、编程和数学方面,DBRX的测试得分吊打GPT-3.5、Mixtral、Meta的Llama
2-70B以及埃隆·马斯克(Elon
Musk)旗下xAI的Grok-1等开源模型。作为混合专家模型,DBRX的输出Token速度高Llama 2一筹。
图注:Databricks员工庆祝开源大语言模型DBRX大获成功
本周一早晨,数据科学与人工智能公司Databricks的大约十多位工程师和高管聚集在公司会议室,通过Zoom视频会议等待他们开发的人工智能语言模型的测试结果。该团队花费了数月时间和大约1000万美元训练在设计上与OpenAI的ChatGPT相似的大语言模型DBRX。但在最终的测试结果出来之前,他们也不清楚自己开发的大模型究竟有多么强大。
“我们超越了所有的开源大模型,”Databricks首席神经网络架构师、开发DBRX的团队负责人乔纳森·弗兰克尔(Jonathan
Frankle)最终告诉该团队。消息一经公布,会场上立即响起雷鸣般的掌声和欢呼声。弗兰克尔通常会喝无因咖啡,但是在通宵达旦的撰写完测试结果报告之后,他也抿了几口冰拿铁。
Databricks计划在开源许可下发布DBRX,意味着允许其他人在其工作基础上开发大语言模型。弗兰克尔分享的数据显示,在衡量人工智能模型回答常规知识问题、阅读理解、解决令人烦恼的逻辑难题和生成高质量代码的十几个基准中,DBRX均优于其他所有可用的开源模型。
DBRX的性能吊打目前最受欢迎的两款开源人工智能模型--Llama
2和Mistral的Mixtral。当DBRX的得分呈现在会议室的屏幕上时,Databricks首席执行官阿里·古德西(Ali
Ghodsi)先是高呼“酷毙了!”,然后又突然发问:“等等,我们打败了马斯克的产品吗?”弗兰克尔对此答复称,DBRX的表现性能确实超越了马斯克旗下的xAI最近宣布开源的Grok
AI模型。他还补充说:“如果马斯克对此结果发表一条刻薄的贴子,我会认为这就是成功。”
令Databricks感到惊讶的是,DBRX在若干项基准测试中的得分非常接近闭源大模型GPT-4,后者被业界广泛认为是目前机器智能的巅峰。“我们为开源大语言模型设定了新标准,”弗兰克尔笑着说。
Databricks通过开源DBRX,为当前生成式人工智能热潮的开放运动注入了新动力,同时也向行业内顶尖公司的保密做法发起了挑战。尽管OpenAI和谷歌不愿公布GPT-4和Gemini等大语言模型的代码,但
Meta等竞争对手选择了开源模式,认为只有更多研究人员、企业家、初创公司和老牌企业都掌握了相应的技术,才能进行更好地推陈出新。
Databricks表示,它还想要公开其开源模型的创建过程,相比之下Llama
2的开发者Meta还没有公布创建该模型的一些关键细节。
Databricks计划发布一篇博客文章,详细介绍创建该模型所涉及的工作。届时,外界不仅能够了解到构建领先人工智能模型的复杂性和挑战性,而且也能明白开发人工智能模型的成本会大幅减少的原因。