大模型+影像:智能手机“上春山”

今年春节假期,一首《上春山》走红。吃瓜群众已经对“春山派”进行了一个假期的学习,学习了各种抢占C位的技巧。

节后,手机行业开始抢占今年的C位。那么问题来了,今年智能手机最大的机会在哪里?答案出来了,当然是AI大模型。去年下半年,手机厂商接连推出端到端大机型。春节刚过,OPPO发布了全新的AI战略,宣布进入AI时代。魅族宣布不再生产“传统智能手机”,全面拥抱AI时代。显然,大机型是手机行业的“春山”。

但根据“春山学”的相关知识,和大家一起上山是不够的,还需要更上一层楼才能稳稳地站在C位,在大模特+手机的众多结合点中,有一项能力是C位中的C位,这是妥妥的“无与伦比的春山”——大模特+手机影像。

铁路12306账号被盗用信息了怎么办

据说,在这个春节里,一线城市的照相馆改变了经营模式。本来大家要合影,店里负责拍摄和修图。现在他们都要去拍AIGC的照片,商店已经变成了一个人工智能提示工程师,使用各种AIGC平台来实现用户的惊人需求。

当我回来对比照片时,它并不比你的光线好。你的P更自然,但你在这张照片中使用了什么提示词。乍一看,你的模型更一般化…

简而言之,人工智能之风正通过照相馆、照相馆、小程序和应用程序强烈地吹向我们的影像生活。

但问题是,这些强烈的AIGC形象需求真的必须去线下商店才能完成吗?为什么不能在手机上一键完成?最近,新手机经常配备具有数十亿参数的大型端到端模型。他们闲着干什么?

事实上,手机中的大型号肯定很忙。目前手机拥抱AI大机型的基本情况是大机型是大机型,影像是影像,但这种割裂的局面很快必然会改变。

“大机型、动影像”的融合赛道,是2024年智能手机行业最清晰的风口,也是手机厂商渴望上车、不得不上车又无法下车的战略“春山”。

大模特+手机影像,如何登上这座春山?让我们找出“春山雪”的问题。

6年后,AI影像再次上山。

首先,我们需要明确一点,AI+图像并不是什么新鲜事,甚至很多人已经习惯了AI和图像的结合。

这一概念早在2018年就开始被业界重视。当年4月,华为发布了P20手机。利用麒麟芯片的NPU端到端计算能力,这款手机在拍照方面首次配备了AI功能,可以识别包括宠物、人像、风景和食物在内的19种场景,覆盖500多个识别目标。AI识别这些目标后,会自动调整摄影模式和参数设置。

随后,这种AI摄影模式一度爆发,成为当时最火热的手机技术升级,并逐渐被整个行业接受。随着几年的发展,AI图像变得越来越复杂,可识别的对象越来越多,并且添加了动态抓取和去除反射等AI功能。此后它还与流行的计算摄影概念相结合,成为手机成像系统中的基本功能之一。

但在这个层面上,AI摄影的能力仍有显著的局限性。它对画面的效果重在“美化”而不是“修饰”和“生成”。我们也访问了一些AI摄影相关赛道的开发者,他们渴望通过使用手机的AI功能来制作更具创意的应用程序,但端到端的计算能力和模型功能是主要的限制因素。字节跳动近况如何

随着AI模型的爆发,模型能力的壁垒被打破。在大模型的支持下,用户可以向图像系统提出复杂的指令,图像系统可以更完整地理解用户交互逻辑和意图方向。在能力方面,大型模型可以帮助完成高精度的图像元素替换,甚至添加由AI生成的图像。

或许可以说,当用户第一次听到AI图像的概念时,他们脑海中设想的图像能力实际上是一个只有在今天才能实现的大型模型图像。

随着大型模型在手机上的落地能力,AI图像终于可以完成关键的飞跃,并实现那些长期承诺的承诺。

大模型是AI图像必须攀登的山峰。

春山上的风景怎么样?

春节前,世界感受到了来自黑脸田鸡的视觉冲击。AI行业有句话叫语言模型是单子,视觉模型能赚钱。机器视觉能力是用户感受AI魅力的最快、最有效的解决方案。

一直以来,手机影像可以用一卷接着一卷来形容,而且没有卷,但用户能做的永远只是拍照。随着AI大模型能力的加入,用户可以无门槛地修改图片并将AIGC图像与手机图像相结合。AI大模型+手机AI算力+手机影像系统的组合大大拓展了手机影像的边界,既传承了手机厂商多年的技术和供应链布局,又获得了新的增长空。

现阶段,这一赛道已经快速铺开。例如,三星通过图片助手功能使用户能够实现移动图片的目标,自动填写空并生成新图片,从而使手机图像具有更大的构图自由度。

OPPO Find X7系列通过AI大模型实现了AIGC消除功能。正如我们最近在广告中看到的那样,用户可以从合影中删除他们不想在春节晚会上看到的人,同时依靠AIGC填充背景。目前,Find X7最多可支持6个实体单独提取。此外,OPPO还更新了AI超清合影功能,可以智能识别并增强合影中人脸的清晰度。

可以预见的是,我们会看到很多基于AI大模型的图像功能,比如AI抠图、AI替换、AI放大等等。整体来看,大机型+手机影像将呈现三大发展趋势:

1.AIGC内容与拍摄内容相结合。在过去的一年里,AIGC的图片读写平台迅速赢得了用户的青睐。将这种能力与手机本身的影像能力整合在一起,是AI手机赛道上最关键的战役。

2.AI能力从应用程序端上移,并与手机本身的图像系统相结合。目前AI大模型带来的视觉能力更多是一个单独的软件应用。接下来,手机厂商将把这些能力上移至系统端,成为产品本身的差异化卖点。

3.手机影像功能可以OTA。AI大模型的加入,在一定程度上使得手机自身的影像能力成为可扩展和迭代的软件。手机的系统级能力可以不断更新和操作,这是AI模型给手机带来的新变化。

总的来说,大模型和手机影像的结合有着非常丰富的创意玩法空,有着无穷无尽的可能性。抓住这个机会,客观上会带来手机厂商新一轮的技术竞争。

那座山是下一个战略高地。

目前还没有厂商旗帜鲜明地提出“大车型+影像”的概念,但用不了多久,这个概念就会以各种名目落地。

需要注意的是,在端侧部署大型模型和开发一些创造性的AI视频游戏很容易。但要真正将AI大机型+影像发展成长期赛道,形成品牌用户的心智支点,仍需要厂商投入巨大精力,展开一场全新的智能手机行业竞争。

原因是大模型+手机影像是名副其实的综合测试。它需要硬件方面的计算能力、影像系统的支持、模型方面的算法加持、应用开发创意和AIGC独特的视觉美学的配合。从实用主义到闭关锁国,从底层硬件到顶层应用,大机型+手机影像的竞争几乎涵盖了手机行业的各个层面。

另一方面,要抢占大机型+影像的战略高地,手机厂商需要在三个方面集结重兵:

1.AI基础设施更新。这个基础设施包括两部分:AI算力和AI算法。它涉及芯片能力、端云协同能力和基础算法能力。更新手机AI基础设施的需求也将带动产业链展开新一轮洗牌。

2.准确把握2。AI应用。AI模型能带来手机影像的可能性不是太少,而是太多。如何在算力有限的情况下,给予用户最精准、最具吸引力的AI影像应用,将成为手机厂商面临的首要问题。

3.3的建设。AI审美能力。最近,许多人注意到黑脸田鸡团队有特殊艺术人才的加入。在AIGC时代,艺术和审美能力非常重要。随着产业的发展,算法能力会趋同,审美能力的差异就会暴露出来。过去手机厂商更注重设计能力,这与艺术表达和审美判断不同。打造属于AI手机的全新审美能力,是一场全新的竞争。

最后,给出一个有点违反直觉的判断:大模特+手机影像的“春山”其实很容易上车。它的门槛远没有手机厂商宣传的那么夸张,但如果你最近用心学习过《春山学》这本教科书,你就会知道真正的困难不是上山,而是留在山上。麒麟9010

如何把大机型+手机影像从一年一度的噱头变成一个可以发展多年的长期赛道,甚至成为改写产业格局的锚点,那才是真正的考验。

不过,好消息是,春山至少证明了一件事:包裹着手机行业的坚冰正在技术的暖风下开裂和融化。是否离开冬天走向春天,取决于从业者的选择。

未经允许不得转载:科技让生活更美好 » 大模型+影像:智能手机“上春山”