Logo

谷歌推出新一代大模型 Gemini

作者

Jeff Dean 发布推特推出新一代谷歌大模型 Gemini: https://twitter.com/JeffDean/status/1732415515673727286

推文翻译:

今天我非常激动地与大家分享我们关于 Gemini 的工作!Gemini 是一系列多模态模型,在图像、音频、视频和文本领域展现出非常强大的能力。我们最强大的模型 Gemini Ultra 在 32 个基准测试中有 30 个达到了最新的技术成果,其中包括在 12 个常见的文本和推理基准测试中有 10 个达到了最新的技术成果,在 9 个图像理解基准测试中有 9 个达到了最新的技术成果,在 6 个视频理解基准测试中有 6 个达到了最新的技术成果,在 5 个语音识别和语音翻译基准测试中有 5 个达到了最新的技术成果。Gemini Ultra 是第一个在 MMLU 上达到了超过 90% 的分数,实现了与人类专家相当的性能,涵盖了 57 个学科。它还在新的 MMMU 多模态推理基准测试中取得了 62.4% 的最新技术成果,超过了之前最好的模型超过 5 个百分点。

Gemini 是由来自 @GoogleDeepMind、@GoogleResearch 和 @Google 的一支非常出色的团队共同构建的,并且是我们迄今为止进行的最大型的科学和工程项目之一。作为 Gemini 项目的两位总体技术负责人之一,与我的同事 @OriolVinyalsML 一起,我为整个团队感到非常自豪,并且我们非常高兴能够在今天与大家分享我们的工作!

关于 Gemini,有很多不同的资料可供参考,首先是:

主要博客文章:点击此处阅读

由 Gemini 团队撰写的 60 页技术报告:点击此处下载

分享内容