2023年,一场大模型风暴席卷全球科技行业,百川智能、智谱AI、Minimax等一批明星创业公司和百度、阿里、腾讯等互联网大厂相继布局。到了2024年,风暴不减反而扩大化。智能硬件厂商如OPPO、荣耀等接连入局,大模型,被认为是智能终端的下一个制胜赛点。
“会不遗余力地投入。”OPPO首席产品官刘作虎近期在接受《财经》采访时表示,AI是OPPO未来科技的演进中最重要的方向。但他强调,这并非是OPPO的独门秘籍,任何一家手机厂商都是如此。
“今年不做大模型的手机厂商一定没戏。”刘作虎判断。
1月8日,OPPO发布了全球首款落地70亿参数端侧大模型的手机Find X7系列,应用OPPO自研的安第斯大模型AndesGPT,以端云结合的方式实现了AIGC图片消除、通话语音摘要,以及在语音助手“小布”上实现的如文生文、图生图、文章摘要等功能。
值得关注的是,手机首次搭载了大模型,售价却低于前一代产品,Find X7标准版3999元起,较Find X6起售价下降500元。手机行业的价格竞争愈发白热化。
据了解,OPPO接下来会在中端产品线Reno系列落地大模型。
手机行业等待一个划时代的革新已久。近三年来虽然手机厂商层出不穷地推出一代又一代新手机,但多是渐进式创新和改善式创新,距离苹果开创的由功能手机向智能手机迭代的划时代革命已经13年有余,目前尚未出现新革命。
大模型手机会是一场新革命吗?
大模型手机意味着手机有可能从智能机朝着“智慧机”的方向演进,逐渐形成的智慧体(AI Agent)甚至很有可能颠覆目前的手机软件操作逻辑,成为所有功能的集成化入口。用户不用点击一个个孤立的App获得服务,而是可以得到基于使用场景推荐的个性化服务。
据了解,多家主流手机公司均已有明确的大模型手机落地策略,市场看好这次技术迭代——第三方研究机构IDC预计,2024年中国内地智能手机市场出货量将达到2.87亿台,同比增长3.6%,实现2021年以来首次同比增长。
很难说市场复苏的因素中,有多少来自大模型的助力,用户的接纳与大模型能力的提升还需要时间。但大模型对手机厂商而言依然是一剂兴奋剂,图景中潜藏着无尽的商业可能。
大模型如何塞进小手机?
在Find X7系列发布会上,OPPO软件产品经理朱海舟演示了大模型在手机上的应用。他的妻子随手拍下的照片中常出现一些过路人或者一块广告牌,大模型的能力让她只需要简单圈出物体,就能消除杂物,并自动做符合场景的填充。
当他和母亲通话后,AI会将通话内容整理出要点和代办事项。
当他问“世界上最遥远的距离是什么”时,前一代小布(OPPO智能助手)的答案是“以下是我在网上找到的答案……”,现在,小布会从几何学、天文学、文学等不同角度回答这个问题。
这些能力被封包在OPPO大模型手机的小布智能助手功能里。
性感功能背后,是庞大复杂的计算能力和硬件参数。OPPO软件创新中心总经理张峻告诉《财经》,云时代,这些功能可以在云端实现,云端参数规模更大、算力更高,实现的精度、时延等体验更好。但端侧同样不可替代,原因在于当用户在弱网乃至离网环境下,依然可以实现这些功能。数据部署在端侧,更能保障用户的隐私安全。
进一步说,手机厂商重视将大模型能力封装在手机本身而不是借助云端大模型,最核心的原因是想让手机更懂你。云端大模型的“养料”是互联网上庞大的数据库,手机大模型则熟悉的是用户的偏好和习惯。相较之下,后者自然更适合手机的主人。二者的区别在于,云端大模型会推荐必吃榜上的餐厅,而手机大模型推荐的是离你不远、更符合你饮食习惯的餐厅。
但云端和本地不矛盾,二者相结合,效果更佳。OPPO自研的安第斯大模型AndesGPT既包括云端也包括终端,Find X7采用的也是端云协同的混合式架构。这套模型包括三个层次:1800亿参数的深度推理、处理高度复杂任务的Titan模型,700亿参数快速响应、多场景适配的Turbo模型,以及70亿参数轻量高效的Tiny模型。
参数体量越大,智慧程度越高,对算力、带宽、存储的要求也会越高。因此前两者部署在云端,在联网环境下涉及到开放问答、复杂逻辑推理和计算时,手机会调用这两类大模型;Tiny模型则部署在终端。用户可以自行选择调用云端或终端模型。
但即便已经是Tiny大模型,也无法直接用在手机上,其中牵涉到大量技术攻关难题,包括内存压缩、性能功耗优化等。70亿大模型的正常大小是28GB,直接在手机上运行是不可能的。
这个问题是必须解决的。OPPO的解决方案大致有两个。
其一,是对模型进行高精度4bit量化、蒸馏、剪枝的压缩处理,同时针对关键的应用场景做精调和预训练,以尽可能保留精度、减少损耗,最后实际占用存储和内存最小约3.9GB左右。
其二,OPPO自研了推理引擎AI Boost和Transformer加速库,优化内存管理,使功耗降低一半。同时与芯片厂商合作,通过并行计算的算子优化,降低时延。OPPO的70亿大模型能做到10-15分钟的通话内容,大约有2000字,摘要首字响应能做到2.9秒,“属于响应速度非常快的。”张峻说。
不过,一个前提是,手机厂商的大模型能力,一定程度上仍取决于与芯片厂商的配合程度。去年高通和联发科分别发布的骁龙8Gen3芯片和天玑9300芯片均首次强调了大模型在终端上的应用。
刘作虎说,虽然OPPO停止了自研芯片,但保留了核心架构师,这个团队和过往的经验仍有效力。“我们做过芯片,知道该怎么部署、模型与算法如何和GPU、NPU适配,不是简单往上面一丢就行了。”
技术爆发的关键节点
在外界看来,大模型的爆发是在一朝之间,但技术积累却需伏脉千里。手机厂商对AI研发已久,只是在上一个阶段,这些技术还是偏向于单个功能,如图像的背景虚化、美颜、夜景处理等层面。
OPPO对新一代的大模型技术的探索其实可以追溯到2020年,当年,OPPO自研的一亿、三亿和十亿参数量的预训练模型OBERT。两年后的OPPO INNO Day(未来科技大会)上,OPPO又演示过文生图技术。
2022年底ChatGPT横空出世,意味着大模型技术从水底下预研转为产业落地,整个科技产业受到极大震动。OPPO安第斯大模型首席架构师杨振宇向《财经》回忆,当时OPPO内部还在观望,分析这到底是一项属于实验室技术,还是能很快实现商业化的成熟技术。
到了2023年3月,大模型技术的研发在OPPO内部被提上重要日程。立项之初,刘作虎说,“AIGC专项团队就是战斗单元。”战斗单元的说法有两点内涵,一是坚定地投入,二是真正带来好的体验、提升产品竞争力。
到了今年1月5日,OPPO又将AIGC专项团队改组为独立的行政单元“AI中心”,将软件工程、数智、研究院等部门AI相关的人员集中于此,小布助手和ColorOS内AI相关的功能也都在AI中心完成。
如今各家手机厂商都将大模型技术视为下一代的重要节点,倾力投入,研究重点是更高的效率,更好的体验,比如,同样70亿参数部署终端大模型,看起来站在同一起跑线上,但究竟如何发挥大模型的价值,是比拼的关键。
杨振宇认为,技术层面上每家手机厂商都很难构建独特的壁垒,但如何将技术与场景做密切、深度的结合,高效运转,再在用户反馈的基础上迭代,这会是OPPO的优势。
刘作虎是产品经理出身,他认为,以用户洞察的方式做产品,本身就是一种差异化竞争。以产品驱动技术,进而确定大模型如何训练、用什么算力,这才是手机厂商的核心竞争力。
OPPO选择的三种大模型应用都是从用户使用场景出发。
通话摘要是个很小的功能,但如果你接到工作电话身边却没有笔记本时,这项功能就变得不可或缺。
图片消除更是一些人的刚需场景,传统的AI也能消除,但对背景的填充、物体边缘细节的处理都很粗糙,而大模型的优化效果明显。