作者|杜志强
编辑|钟毅
本文首发于钛媒体APP
今年上半年,大型车型陆续发布,企业间上演了一场“百款大战”。 下半年,大机型“退潮”,取而代之的是应用的落地,让更多用户对大机型有了深入的了解,同时也改变了终端硬件的发展方向。
其中,手机是感知能力最强的终端设备之一。 设备端和云端大模型的加持正在驱动其加速体验创新。 钛媒体App在此前文章中指出,“AI未来必将成为手机行业的关键竞争力,大机型与手机系统的深度融合,将让手机成为新物种”。
在整个消费电子下行周期中,大机型的整合不仅是手机厂商之间的AI博弈,更是整个产业链的主动变革和“自救”。
荣耀OV已经准备好尝试了
AI早在很多年前就已经应用到手机上。 Counterpoint高级分析师Ivan Lam告诉钛媒体App,人工智能的发展势不可挡,已经渗透到生活的方方面面,尤其是通过消费电子产品。 比如我们用智能手机拍照,当手机处理照片并产生照片时,大多数手机已经使用了AI算法。
8月4日,华为在开发者大会上发布了HarmonyOS 4系统。 在盘古大模型的支持下,智能助手小艺将具备AI大模型能力,带来更加智能的体验。 值得注意的是,与ChatGPT等第三方App的安装方式不同,小蚁与系统深度融合,是系统层面提供的大模型服务。
钛媒体App了解到,基于盘古自然语言大模型、视觉大模型、多模态大模型,华为智能助手“小艺”在交互、生产力提升、个性化服务三个方向进行了增强。
HarmonyOS4全新小蚁
其中,在语音交互的基础上,增加了文字、图片、文档等多种形式的交互。 当你看到图片时,除了识别文字外,还可以将图片中的时间等信息点添加到手机的会议提醒中。 读完一篇文章后,小艺还可以生成内容摘要,并对图片进行二次创作。
华为董事总经理、终端BG首席执行官、智能汽车解决方案BU首席执行官余承东表示,“AI大模型技术的发展将带来下一代智能终端操作系统的智能体验。”
就在华为发布HarmonyOS 4系统一周后,小米的大机型也浮出水面。 其开发的大规模预训练语言模型MiLM-6B出现在C-eval和CMMLU大型模型评估列表中。
信息显示,小米大模型参数规模为64亿,在C-Eva总榜中排名第10,在CMMLU中国大模型中排名第1。 小米相关负责人表示,小米一直在积极布局大机型,并取得了一些阶段性成果,近期将同步相关进展。
来源:雷军微博
对于大模型,雷军此前曾表达过自己的看法,“小米在AI领域深耕多年,有AI实验室、小爱同学、自动驾驶等团队。当然,大模型我们会全力以赴”。我们正在开发一些有趣的技术和产品,当我们打磨它们时,我们会向您展示它们。”
相关信息显示,今年4月,小米正式成立AI实验室大模型团队,目前拥有人工智能领域研发人员1200余人。
在今年一季度的财报电话会议上,小米总裁卢伟冰也表示,小米将积极拥抱大模型,但不会是像OpenAI那样的一般大模型,而是与业务协作深度融合,利用人工智能智能科技提升内部效率。
除了华为和小米之外,其他国内厂商也在大机型上做出了或多或少的动作。 在MWC 2023上海展会上,荣耀CEO赵明表示,未来将在设备端引入大型AI模型,为YOYO智能助手赋能,在设备上打造更加个性化、人性化、保护隐私的个人模型边。 我们也在和互联网公司进行大型网络模型的合作,并且已经与他们进行了接触。
8月12日,有数码博主发文称,OPPO和vivo也在研发大机型,但推出时间会稍晚一些。 至于是否会像华为、小米那样自行研发,还是与现有的大型机型厂商合作,目前还不得而知。
芯片厂商加速
“慢下来”的苹果也有新动作
一位手机品牌的软件开发人员告诉钛媒体App,AI已经在很多手机中得到应用,但生成式AI将为手机带来全新的体验,这更接近用户长期以来对AI的期待。 这不仅仅是“1+1=2”的互动。
为了达到1+1>2的效果,除了手机底层系统上的努力外,还需要在硬件方面进行改进。 而且,终端侧应用还可以进一步缓解用户的隐私担忧。 Canalys研究分析师钟小雷告诉钛媒体,“大模型在手机本地运行,比云端延迟更低。离线运行也能更好地保护用户隐私。”
在系统层面,除了华为鸿蒙之外小米抢号软件,谷歌也在不断前进。 在I/O大会上,Google发布了新一代大型语言模型PaLM 2,它有四个版本,从小到大:Gecko、Otter、Bison和Unicorn。 其中,“Gecko”可以在手机上运行,速度足够快,无需连接互联网即可正常工作。
同时,与以往的AI技术相比小米抢号软件,将大型模型“安装”到手机中,将对手机的计算能力、存储等性能提出更高的要求。 芯片方面,高通和联发科也透露了最新进展。
联发科表示,其下一代旗舰SoC天机9300将于下半年推出。 除了常规的性能提升外,还将集成最新的APU,为手机等终端设备带来更强的AI能力,类似于ChatGPT服务体验。
在今年的世界人工智能大会上,高通展示了在终端侧运行生成式AI模型Stable Diffusion的技术演示,以及终端侧语言视觉模型(LVM)ControlNet的运行演示,参数量为1十亿至十五亿。 能够在十秒内完成一系列推理。
高通产品管理高级副总裁兼AI负责人Ziad Asghar指出,今年将能够支持在手机上运行的具有多达100亿个参数的生成式AI模型。 而这也意味着计算基本上可以完全在终端上运行,无需调用云端的能力,从而更好地保护用户隐私。