外界期待已久的 Google 大语言模型 Gemini ,在美国时间 12 月 6 日正式对外发布,Google 首席执行官皮查伊表示,Gemini 1.0 是目前为止 Google 能力最强的通用人工智能模型。
根据腾讯新闻《潜望》今(7)日的报导,皮查伊表示,Gemini 是原生多模态打造,是 Google 通往Gemini 模型时代的第一步。足以显现 Google 对其抱持的信心。
Google 当日发布的 Gemini 1.0,共分为 Ultra、Pro 和 Nano 三个版本,其中 Ultra 能力最强,复杂度最高,能够处理最为困难的任务,Pro 能力稍弱,可以用来处理多任务,Nano 则更注重于端侧的处理能力。
从自然图像、音频和影像理解,到数学推理等任务,Gemini Ultra 在大型语言模型研发被广泛使用的 32 个学术基准测试集中,在其中 30 个测试集的性能超过当前 SOTA 结果。
另外,Gemini Ultra 在 MMLU(大规模多任务语言理解数据集)中的得分率高达 90%,首次超越了人类专家。MMLU 数据集包含数学、物理、历史、法律、医学和伦理等 57 个科目,用于测试大模型的知识储备和解决问题能力。
Google 还专门公布了 Gemini Ultra 与 GPT-4 的测试对比。Gemini Ultra 在文本处理方面,以 90% 得分超过 GPT-4 的 86.4%。而在推理、数学、代码等方面,Gemini Ultra 得分均高过 GPT-4。
Gemini Ultra 在文本处理方面,以 90%得分超过 GPT-4 的 86.4%。而在推理、数学、代码等方面,Gemini Ultra 得分均高过 GPT-
《腾讯新闻潜望》分析,Gemini 还有三大“杀手锏”与GPT-4 竞争,分别是原生多模态、优化人工智能的 Tensor Processing Units(TPUs)的 v4 和 v5e、与 Google 旗下生态的融合。
首先 Gemini 的原生多模态,可让 Gemini 从头开始无缝理解和推理各种输入,远远优于现有的多模态模型,而且它的功能在几乎每个领域都是最先进的。
接下来 Gemini 在 TPU 上运行,比过去模型的运行速度更快,这些定制的 AI 加速器,是Google AI 产品驱动面向数十亿用户的搜索、Youtube、Gmail 等服务的核心。Google 称,将其 TPU 设计为自己最稳定、可扩展以及最有效率的服务。
最后 Gemini 与 Google 旗下生态的融合,让 Google 可将 Gemini 推向数十亿用户。最早上线的便是与 ChatGPT 对标的 Google 人工智能语言助手 Bard。Google 宣布,目前 Bard 将由 Gemini Pro 微调版本驱动,Google 称,这是 Bard 自推出以来最大的升级。