人工智能世界,高度倾向。
如今,就像热血的动漫一样,每天都会出现“坚强的角色”。
2月5日,美国时间,Google DeepMind CTO -KORAY KAVUKCUOGLU正式发布了其官方网站上的报告-Gemini 2.0,这是其自己的“大魔鬼”级别的模型。
根据官方信息,这次推出的系列可以称为“全火力”,不仅是全面升级的性能,而且还带来了更加灵活,更聪明,更经济的新版本。
那么关于这浪的大新闻是什么?
Gemini 2.0:升级点在哪里?
Gemini 2.0是Google DeepMind的最新AI模型系列,继承了上一代版本1.5的优势,并全面增强了多模式功能和大规模的任务处理能力。
感觉就像我保持升级设备以获取完整卡的感觉相似,Google这次还安装了Gemini 2.0上的所有“各种武器”:
支持多模式输入:可以在将来引入文本,图像,音频甚至更多的多媒体表格。
大上下文窗口:Flash/Flash-Lite具有100万个令牌的上下文窗口,Pro版本已飙升至200万个令牌。只是想到它会让我感到令人惊叹的“记忆”。
本机工具调用能力:能够致电Google搜索,代码执行和其他工具,因此无需担心AI只能做一些单人游戏问题。
更强的推理和编码功能:数学,编程和处理复杂场景的飞跃,适合开发人员进行深入创建或“脑部思考”实验。
一句话的摘要:
Google打算使Gemini 2.0成为“全能球员”,同时使价格更加“友好”,以便大型制造商和个人开发商都可以负担和玩耍。
主要型号一一计数 - 所有模型都是Niu和Ma,Da Clever
这次,Google连续发布了多个Gemini 2.0版本。感觉就像是同一手机游戏的“普通版本,豪华版和终极收藏家版本”,每个手机都针对不同的应用程序方案。
双子座2.0闪光灯
定位:“有效的工作模型”是一只旧的牛,没有任何歧义。
主要功能:
超级计算效率,适用于处理高频和高频任务。
100万个令牌上下文窗口以及多模式输入可以快速“挽救”大量数据的信息。
计算功率优化:一般的例行问题和答案,文本创建和实时推理方案是没有问题的。
开放性:
现在,它已在Google AI Studio和Vertex AI中完全启动,开发人员可以将其直接用于通过Gemini API进行生产级别的应用程序。
您还可以在Gemini移动应用程序和桌面上体验它。
对于想要快速入门并获得一些原型或生产项目的开发人员来说,2.0 Flash绝对是一个很好的帮助者。
最强的双子座2.0 Pro实验
定位:Google自称为“最强”模型不仅是高性能,而且是“ Popeye”级别的推理王。
主要功能:
200万个令牌的“象限”上下文窗口可以读取超大的文本和大量数据“一次呼吸”。
最好的编码和复杂的任务处理功能,特别擅长编程,数学和逻辑推理。
您可以调用第三方工具,例如执行代码,并将Google搜索连接到搜索世界知识。
开放性:
目前,它是一个实验版本(实验),可以在Google AI Studio和Vertex AI中使用,Gemini高级用户也可以在应用程序端切换到此模型。
如果您想进行一些复杂的AI研究,或者编写一堆功能并考虑到全球逻辑,那么Pro版本是您的最佳选择。
当然,它仍处于实验阶段,可能具有一些“脾气”或“角色”,但也可以带给您新的灵感。
双子座2.0闪光灯
定位:像简单的时尚品牌一样,最具成本效益的“省钱”版本专注于高成本性能。
主要功能:
性能比1.5闪光灯要好,但仍然保持相同的速度和价格。
还有100万个令牌上下文窗口和多模式输入。
在大多数基准测试中,性能要好于1.5闪存。
价格:
根据其他媒体报道,Flash约为每百万个令牌10美分,而Flash-Lite的价格仅为0.75美分,这基本上是在一杯咖啡中找到硬币的区别。
开放性:
它是在Google AI Studio和Vertex AI中公开的Beta,开发人员可以直接尝试。
如果您的需求是“多重和频繁的”,预算紧张,但质量不佳,则可以在您的AI“ Arsenal”中考虑使用此精简版。
2.0 Flash思维实验
定位:新一代思维引擎可以自动将复杂的问题分为几个步骤,这有点像带来“大脑问题分解模块”。
主要功能:
更好地回答多步骤问题和进行链条推理。
该界面将内置在Gemini应用程序中,并与模型菜单下的2.0 Flash版本并排放置。
适用的方案:
需要集思广益的各种难题或长长的逻辑连锁店,例如编写论文概述,制定旅行行程,推导情节设置等。
据说这种“思考”模式仍然是基准的常规客户,他的得分很高。
强度比较:2.0中的“最强”在哪里?
参数规模和上下文窗口升级飙升:Flash和Flash-Lite具有数百万个令牌级别的上下文,并且Pro突然飙升至200万。
您可以一口气让它阅读价值数万个单词的文档。 Gemini 2.0可以冷静地分析,并且良好的记忆是其强大的基础。
多模式输入:文本,图像,音频(将来会有更多),它可以将碎片和多源数据混合在一起以分析。
独立批评和安全:Google正式表示,2.0系列采用了一种新的强化学习方法,使该模型可以自行“检查”其答案,提高准确性并减少对敏感主题的错误判断。也有自动安全测试,努力不越过红线。
丰富的情况:
开发人员:使用Google AI Studio,Vertex AI和Gemini API构建生产级别的应用程序更容易。
普通用户:创建小型创建,编写脚本,读取图片和说话或翻译Gemini应用程序中的语音是没有问题的。
“正面”:Google的通用AI蓝图
在AI世界中,高强度反演是常态。
OpenAI,meta和Anthropic都从事“可以独立执行多步骤任务的代理商”。
现在,Google希望使用Gemini 2.0家庭桶迈出“通用AI助手”的重大进展。
将成本效益与DeepSeek进行比较:DeepSeek创建了几个免费版本,这引起了人们的关注。这次,Google使用Flash-Lite抓住了市场,重点是“低成本和高性能”。
与OpenAI助手相比:OpenAI的“操作员”和“深入研究”功能也可以执行多步骤任务和复杂的研究。 Google还推出了自己的同名工具“ Deep Research”,该工具具有强烈的近距离战斗感。
实施了更多虚拟代理:无论是帮助您预订机票还是使用计算机执行多个步骤,Google,OpenAI,Anthropic和meta等巨头都在同一领域竞争。
“ AI帮助我的工作”将是下一个主要趋势。 DeepMind似乎已经准备好与Gemini 2.0家庭水库作战,以开始“通用AI辅助”之战。
“多行战斗”允许各种用户在DeepMind中找到“首先需要的版本”
Google首席执行官Sundar Pichai也发表了说法,2025年将成为他们努力的重点。
对于更一般和更聪明的AI时代,Gemini 2.0只是起点。在下一步中,Google可能会集成更高级的功能,例如图像生成(已经在途中),音频和视频分析,以及像人类一样单击屏幕的能力。全自动代理等
一般而言,Gemini 2.0的“家庭桶”主要允许AI开发人员和用户在其中选择自己的“风味”:以速度省钱?闪电版(闪光灯);全面可靠?主版本(Flash);主要推理? Pro版本。
此外,该官员仍在增加投资,据估计,将很快开放更多的功能。
如果您是AI开发人员或对AI感兴趣,建议您去Google AI Studio或Vertex AI在各种版本中播放Gemini 2.0,然后首先体验它。
特别是Pro实验,看看它是否可以解决您通常遇到的最困难的编码,数学或逻辑问题。
如果您只是该领域的新手并想玩,Gemini App还提供一些易于使用的门户网站,尝试查看多模式输入,让AI帮助您创建,或者让它为您提供一千个旅行照片家。 - 请参阅它是否可以激发新想法。
Google在通往一般AI的道路上越来越深入的Gemini 2.0标记的完整发布,不断升级模型性能并扩大功能界限。
这种“宠物小精灵”的演变仍在中间,闪光只是闪电,Pro只是野兽,等待我们的东西很可能是下一个更大的“超级进化”。
让我们拭目以待,AI助手一般助手的宏伟蓝图不再是科幻小说,而是在我们面前的现实。