谷歌发布Gemini,性能超越GPT4,AI霸主地位或将易位

数码 2023-12-09 18:29:01 知道百科

近日,谷歌发布了名为Gemini的新一代人工智能技术,据称其性能超越了GPT4,这一消息引起了广泛关注。Gemini的问世,似乎预示着人工智能领域的竞争格局或将发生重大变革,AI霸主的地位可能会易位。Gemini的横空出世,展示了谷歌在AI技术研发方面的强大实力,也为未来人工智能应用带来了更多激动人心的可能。

OpenAI在经历了狗血的内部权斗之后,来自最强对手的Google又给OpenAI来上了一记重拳。

昨夜凌晨,谷歌发布的Gemini新模型震撼面世。优越的多模态性能堪称卓越。

发布内容基本就是花式秀了一波多模态功能,比GPT4更快更准更强,最后还点了一下OpenAI的痛点“AI安全问题”。AI要是有表情的话,GPT可能现在脸是绿的。


三种不同规模版本

此次谷歌推出的Gemini大模型,作为原生多模态大模型,代表谷歌步入新时代。

它包含Ultra、Pro和Nano三种不同规模的优化版本:

Gemini Ultra :我们最大型号、能力最强的模型,适用于极其复杂的任务。

Gemini Pro :我们最佳模型,适合跨越广泛任务范围的扩展。

Gemini Nano :我们最高效的模型,专为设备上的任务而设计。

Google Pixel 8 Pro现在已经在运行Gemini Nano,提供了两个主要功能:

在Pixel 8 Pro的录音机应用中,Gemini Nano提供了一个“摘要”功能。这使用户能够获取其录制的对话、访谈、演讲等内容的摘要,即使在没有网络连接的情况下也能使用。

Gemini Nano还在Gboard中开始支持“智能回复”功能,作为开发者预览版。目前这个功能可在WhatsApp中使用,并计划明年扩展到更多应用。这个AI模型通过提供具有对话意识的高质量回复建议,节省用户的时间。

测试评分出色

谷歌进行了Gemini模型的严格性能评估,在多种任务中表现出色。

无论在自然图像、音频或视频理解,抑或是数学推理等方面,Gemini Ultra在32个公认的语言模型研究基准测试中,有30项超过最佳成绩。

此外,在MMLU(大规模多任务语言理解数据集)中,Gemini Ultra得分率高达90.0%,首次超越人类专家。该数据集涵盖57个学科,旨在测试大模型的知识储备和问题分析能力。

在最新版本的 MMMU 测试集中,Gemini Ultra 也取得了得分为 59.4% 的最佳成绩。增强版的测试集由需要慎重推理的多模态任务组成。

在图像基准方面的测试中,Gemini Ultra 不需要从图像中提取文本就能进行 OCR 处理,这凸显了 Gemin 内置的强大多模态能力,也初步显示了 Gemini 具有更复杂推理能力的先兆。

更多细节请参见我们的Gemini技术报告:

https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

AI界的多面手

想象一种全面智能化系统,可以自由处理包括文本、图像及音视频在内的各类信息,这样的理念是否令人振奋?

谷歌公司的Gemini 1.0便塑造了这样一位全能型AI英雄角色!区别于简单阅读文本,Gemini更能深度解析图像信息以及理解音频语音,展现出如拥有多重能力的超人英雄般的智慧!

了解更多关于Gemini功能的信息,并了解它的工作原理:

https://deepmind.google/technologies/gemini/#build-with-gemini

复杂推理能力

Gemini 1.0以卓越性能精选文本、图像、音频等各类数据类型,深度剖析并发现数据内含的精要,解答各类复杂主题的问题。尤其在高等数学和物理学领域,其推理优势更为显著。

例如下图所示实例,教师以滑雪运动为例,展示了一个需以物理学角度模拟下滑的问题,另一位学生尝试通过Gemini的多模式推理解决方案计算运动员抵达斜坡最底端的速度。

这一模型能识别和澄清问题叙述,转换成精准数学公式,还能发现并校正学生解答问题过程中的误导路径,最后精准提供问题答案。


高级编码

Gemini以其卓越的编程语言理解和优质代码生成能力,涵盖Python、Java、C++、Go等多语言。通过其出色的语言间交互和处理复杂数据的能力,助力Gemini跻身全球顶尖编码模型之列。

在多种严格的编码指标体系中,Gemini Ultra展现出优秀的表现,包括业界关注的HumanEval和谷歌专有的Natural2Code数据集。后者直接采用原始代码,并不依赖于网络数据。

Gemini亦可作为高级码系统的引擎。谷歌两年前推出AlphaCode,首次实现了在编程竞赛中的人工智能代码生成,媲美人类水平。

在此基础上,谷歌进一步打造了升级版AlphaCode 2,擅长解决编码以外的复杂问题,涉及深奥的数学及理论计算机科学领域。

通过同原版 AlphaCode 在同一平台进行比对分析,我们发现 AlphaCode 2Matthew Rusling 的表现大大优于其前任,主要表现在它能够处理的问题冗余量几乎提增至先前版本的两倍水平。

更多详细信息请参见我们的AlphaCode 2技术报告:

https://storage.googleapis.com/deepmindmedia/AlphaCode2/AlphaCode2_Tech_Report.pdf

更高的可靠性、可扩展性和效率

Gemini 是在Google的TPU AI加速器上训练的,似乎没有使用英伟达的GPU。

Google还推出了全新的Cloud TPU v5p和AI Hypercomputer超级计算机,将加速Gemini的开发,使AI模型的训练更快。

Cloud TPU v5p:

性能:Cloud TPU v5p是目前Google最强大、可扩展和灵活的AI加速器。它在TPU v4的基础上提供了超过2倍的FLOPS(浮点运算次数/秒)和3倍的高带宽内存(HBM)。

速度:TPU v5p可以比前一代TPU v4更快地训练大型语言模型(LLM),提供了2.8倍的速度提升。对于嵌入密集型模型,其训练速度比TPU v42快1.9倍。

可扩展性:TPU v5p的可扩展性是TPU v4的4倍,意味着它可以在单个pod中提供更多的FLOPS。


责任与安全

Google坚持创新且负责地推动AI发展,遵循Google AI原则及可靠安全策略,为Gemini多模式功能添加新的防护措施。

Gemini已完成Google历史上全面的AI安全评估,囊括偏见与毒性评价。Google进行了独特的网络攻击、说服式影响及自主决策等预警研究,此外,他们采用行业领先的对抗试验技术,识别出部署Gemini前需关注的重要安全问题。

为弥补内部评估方法的不足,谷歌还积极邀请外部专家和合作伙伴提供专业建议,对模型进行压力测试。

为防止在Gemini的培训过程中出现内容安全问题,确保其输出符合公司政策,谷歌采用了由艾伦人工智能研究机构专家开发的“真实毒性提示”基准测试,其中包含10万条网络毒性不同的提示。

此外,谷歌特别设计了安全分类器,以识别、标注和过滤涉及不良行为模式的内容。结合高效的过滤器,这一严谨的检测方法旨在使Gemini成为更具包容性的可信工具。同时,他们不断努力解决现有模型(如事实性、依据性、属性和验证性)所面临的问题。


#挑战30天在头条写日记# #人工智能# #实话实说# #AI技术# #让AI触手可及# #微头条激励计划#

以上就是谷歌发布Gemini,性能超越GPT4,AI霸主地位或将易位的相关介绍,希望能对你有帮助,如果您还没有找到满意的解决方式,可以往下看看相关文章,有很多谷歌发布Gemini,性能超越GPT4,AI霸主地位或将易位相关的拓展,希望能够找到您想要的答案。

相关推荐

猜你喜欢

大家正在看