谷歌推出新一代大模型 Gemini

Jeff Dean 发布推特推出新一代谷歌大模型 Gemini： https://twitter.com/JeffDean/status/1732415515673727286

推文翻译：

今天我非常激动地与大家分享我们关于 Gemini 的工作！Gemini 是一系列多模态模型，在图像、音频、视频和文本领域展现出非常强大的能力。我们最强大的模型 Gemini Ultra 在 32 个基准测试中有 30 个达到了最新的技术成果，其中包括在 12 个常见的文本和推理基准测试中有 10 个达到了最新的技术成果，在 9 个图像理解基准测试中有 9 个达到了最新的技术成果，在 6 个视频理解基准测试中有 6 个达到了最新的技术成果，在 5 个语音识别和语音翻译基准测试中有 5 个达到了最新的技术成果。Gemini Ultra 是第一个在 MMLU 上达到了超过 90% 的分数，实现了与人类专家相当的性能，涵盖了 57 个学科。它还在新的 MMMU 多模态推理基准测试中取得了 62.4% 的最新技术成果，超过了之前最好的模型超过 5 个百分点。
Gemini 是由来自 @GoogleDeepMind、@GoogleResearch 和 @Google 的一支非常出色的团队共同构建的，并且是我们迄今为止进行的最大型的科学和工程项目之一。作为 Gemini 项目的两位总体技术负责人之一，与我的同事 @OriolVinyalsML 一起，我为整个团队感到非常自豪，并且我们非常高兴能够在今天与大家分享我们的工作！
关于 Gemini，有很多不同的资料可供参考，首先是：
主要博客文章：点击此处阅读
由 Gemini 团队撰写的 60 页技术报告：点击此处下载