科技之家

科技之家,汇聚专业声音 解析IT潮流

首页 > 滚动 >

谷歌发布新一代AI模型Gemini:强调多模式学习和应用

来源: 时间:2023-12-07 11:31:32

  2023年12月7日消息,美国当地时间周三,谷歌发布了其新一代人工智能模型Gemini。该模型反映了谷歌内部在首席执行官桑达尔·皮查伊(Sundar Pichai)的监督和推动下,多年来的努力成果。

  在科技界,皮查伊早已因其对产品的专注和热爱而闻名。2016年,当他成为谷歌的首席执行官后,他曾在一封年度创始人信函中预测:“我们将从移动优先转向人工智能优先的世界。”在之后的几年里,皮查伊带领谷歌将人工智能技术逐渐融入到所有产品中,从安卓设备一直到云计算。

  尽管谷歌近期因OpenAI的竞争而略显颓势,但Gemini的推出无疑为这场竞争注入了新的活力。OpenAI在去年推出的DALL-E和GPT-3.5,以及今年推出的GPT-4,主导了整个AI行业,并在初创公司和科技巨头之间引发了激烈的竞争。作为回应,谷歌推出了Gemini,一个由DeepMind领导的全新AI模型。DeepMind是由德米斯·哈萨比斯(Demis Hassabis)领导的一个新整合部门。现在,用户已经可以在谷歌聊天机器人Bard中体验Gemini,并将在2024年整合到谷歌的产品线中。

  在Gemini发布前夕,《麻省理工学院技术评论》杂志有幸在谷歌位于加州山景城的办公室采访了皮查伊,探讨了该模型对谷歌、其产品、人工智能和整个社会的意义。

  专访内容:

  问:为什么Gemini如此令人兴奋?您能分享一下对人工智能的总体看法吗?以及它在你们所有产品中的发展方向?

  皮查伊:Gemini令人兴奋的主要原因在于,它是一个原生的多模式模型。与以往仅通过文本学习的模型不同,Gemini可以通过视频、音频和代码学习。这使得该模型天生就具有更强的能力,我相信这将帮助我们开发出更多创新的功能,并推动该领域的进步。

  另一个让人兴奋的地方是,Gemini在32个主要基准测试中表现出色,其中30个都是表现最好的。特别是在多模式基准测试中,Gemini更是展现出强大的实力。我相信,这标志着多模式基准测试时代的到来。同时,我也认为MMLU基准是一个重要的里程碑。在这个基准测试中,Gemini的性能已经达到了一个相当高的水平。

  此外,我也很高兴看到Gemini最终进入了我们的产品。现在它将对开发者开放,这是一个新的平台。人工智能是一个比网络或移动更深刻的平台变革。从这一点来看,我们已经迈出了一大步。

  问:从这些基准测试来看,Gemini似乎在很多方面都领先于GPT-4,但并没有遥遥领先。而GPT-4却实现了很大的飞跃。这是否意味着在大语言模型的技术上,我们正在接近瓶颈期?或者您认为我们仍有巨大的增长空间?

  皮查伊:首先,我必须承认未来的确有巨大的增长空间。有些基准测试的得分已经相当高,但是当我们试图突破85%的门槛时,我们实际上已经处于曲线的边缘。尽管这个突破看似不大,但这仍然代表着我们在不断进步。为了更好的评估这些模型的能力,我们需要不断更新基准测试。这也是我们为何要研究MMLU多模式基准的原因之一。对于一些新的基准测试,当前的技术水平仍然较低,这意味着未来还有很大的进步空间。比例定律仍然有效:当我们把模型做大时,就会有更多的进展。从整体上看,我真的觉得我们才刚刚开始。

相关文章