TMT观察网

百度的阳谋,能成为AI原生应用的卖水人吗?快讯

大模型最大的机会不在于模型本身而是应用,正如移动互联网时代,微信、抖音、淘宝等应用带来的商业机会,远超ios或安卓等操作系统一样。

10月17日,百度世界大会2023在北京举行。百度创始人、董事长兼首席执行官李彦宏以《手把手教你做AI原生应用》为主题发表演讲,带来了打造AI原生应用的解法。

从数类原生应用的打造中,也显露出百度在大模型时代下想要通过生态建立壁垒的雏形,围绕大模型的抢滩应用之争就此拉开帷幕。

兼容性应用占大头

百度发布了两大核心内容,文心一言4.0AI原生应用;大模型的能力是打造AI原生应用的根基,4.0的大模型在此次发布会的篇幅更是让位于AI原生应用。

今年7月,据IDC《AI大模型技术能力评估报告2023》显示,文心大模型3.5共拿下12项指标的7个满分,综合评分位列国内主流大模型第一。

文心大模型4.0版本,整体效果又提升了近30%,训练算法效率提升了3.6倍,周均训练有效率98%,堪比GPT 4.0,但发布会上具体效果没有直观的对比。

在打造AI原生应用的过程中,百度始终遵循李彦宏提出的三个条件:

1、能用自然语言交互,这是最根本的变化;

2、能充分利用理解、生成、逻辑、记忆等;

3、每个应用的交互都不超过两级菜单。

AI原生应用是基于大模型的“理解、生成、逻辑、记忆”能力开发出来的应用,是上个互联网时代产品所不具备的。

1、理解:对前后乱序的表述,比较模糊的表达意图,话语中的潜台词进行较准确的理解;

2、生成:可以基于理解的内容生成文字、图片、视频等多模态内容;

3、逻辑:在内容信息的基础下,可以规划、控制和感知的能力;

4、记忆:对于生成的内容有记忆,且可以区分避免前后矛盾的问题。

百度通过赋予单个应用智能操作到打造平台联合应用智能唤起实现AI原生应用的迭代,主要有以下三种形式:

1、单一的展示搜索功能向综合性输出转变

百度搜索在AI重构下具备综合信息和发和多轮交互三个特点,当用户搜索问题时,新搜索将“不再是给你一堆链接”,通过对内容的理解,生成文字、图片、动态图表的多模态答案替代传统链接的方式,让用户一步获取答案。

在针对复杂需求时,“多轮交互”特点也可以通过提示、调整等方式,满足用户搜索需求。

在传统学习办公模式下,用户往往需要经历大量文档查找、格式转换、审校保存等繁琐步骤。在AI重构下百度文库基于10亿优质资料可以把这一文档和收藏的资料相结合,生成PPT框架,美化作图,最后生成一份完整的PPT,完成了从“内容工具”向“生产力工具”的进化。

百度网盘的AI重构是做好个人文件的智能服务。“重构后的网盘,不但实现了从图形界面交互到自然语言交互的转变,还增强了多模态信息理解。现在,只需要一句话,就能对自己网盘内的文件、图片、视频等进行操作。”李彦宏表示。

百度网盘搭配了智能助理云一朵,能理解视频内容、识别角色、形成上下文记忆。并且,还能定位到视频的某一帧,帮助用户快速了解视频内容。

百度搜索、百度文库和百度网盘在应用功能上均属于资料内容的展示与分类,在用户使用时需根据自身需求进行定向的从查找到目标结果的提炼,在大模型的作用下,此类应用从单一的展示搜索功能向综合性输出转变,通过以个人助理为主的媒介来实现需求和结果的承接。

2、短时间内有限信息的内容处理

百度GBI从三个方面颠覆了传统的数据分析,也就是支持自然语言交互、跨数据库分析和专业知识学习,是国内首个生成式商业智能(BI)。

传统场景下需要通过专业人士跨数据库、表格进行复杂操作来完成报告,李彦宏称,百度GBI能将商业分析师十几天才能完成的数据分析工作缩短到分钟级。

百度如流能对会议进行实时记录,一键生成会议纪要,为1000条信息1秒划重点;可以帮助用户解决琐碎的事情,完成出差行程等安排,包括行程结束后航班时间的预约等。

会议记录和行程安排等内容往往通过人力进行分布安排,特点是繁琐且需要考量每一环节的合理性,会耗费大量精力。

百度GBI和百度如流以即时的信息为主,在信息内容的处理上并不复杂,主要在于涉及的操作环节较多,多考验其在短时间内有限信息的处理上,往往以人力操作为主。

在上一代互联网时,该类需求难以得到实现,在大模型下的作用下,其理解、生成、逻辑和记忆特性恰恰满足了此类需求的要求,以处理短时间内有限信息为导向的需求将是AI原生应用的重要方向。

3、调动API接口实现用户决策闭环

百度地图积累了导航、打车、找代驾、订酒店等功能,过去这些操作很复杂,需要6、7步甚至20步才能完成,现在用户只要说出需求,地图就可以调动几千个API服务接口,快速直达响应。

百度地图可以实现通过某一个目标的规划,在众多能完成目标的应用进行选择,通过大模型的逻辑推理能力,判断在哪个应用中选择,通过API接口实现应用功能代替在应用终端打开前的判断过程。

如搜索附近评价高的餐厅,我们可以选择的目标是打开生活类应用(如大众点评,美团等)进行排名搜索,在地图上搜索餐厅进行筛选查看或是通过社交媒体(如小红书、微博等社交媒体)。

在我们决策前会通过个人偏好定向或依次打开相关的应用进行筛选对比,而大模型的能力则能在各应用间进行通用实现用户决策前的最后一公里。

百度此次大会上在文心一言的能力展示上并未作太多篇幅,实际能力有待考究;AI原生应用上基于信息的数据分析及生成的应用展示是在情理之中,具备可复制的风险,更具想象力的原生应用没有展示。

此次大会演讲结尾,李彦宏表示“我们即将进入一个AI原生的时代,进入一个人机通过Prompt来交互的时代”,百度则是以身试法为我们展现了AI原生应用的迭代进程,将大模型的原生能力以合理的方式应用到实际情况。

布局原生资源,调用能力还待考量

百度在地图上调用接口的方式正是打造AI原生应用的操作方式之一,在大模型的能力下,不再局限于单一应用的功能上,直接通过目标的下达,让大模型在应用间进行决策,正是AI  Agent人工智能代理通过独立思考、调用工具去逐步完成给定目标。

在阿里云组织的“西溪论剑”上,创新工场创始人李开复提出,AI时代的Killer App(杀手级应用)可能有这样的特征:完全的AI Native,放弃Compatibility(兼容性)。

做得最早的是MSN、QQ,但是胜出的是微信,因为张小龙做了一个决策,既然是移动互联网的时代,就不要 PC 了,微信在早期专注在移动互联网的特质上,百分百押注到新的技术平台上。

从这个视角看,AI native(AI 原生)的应用可能有这样的特征:如果大模型拿掉了,应用就崩溃了,它是一个完全依靠大模型能力的应用。但拿掉 Copilot,Office 软件还是 Office,AI 只是锦上添花。

AI Agent与具身智能被认为是诞生Killer App最好土壤。

与传统人工智能不同,AI Agent能够在没有人类干预的情况下独立运行。通过接入API,AI Agent甚至可以浏览网页、使用应用程序、读写文件、完成信用卡付款等操作。

AI Agent只需设定目标,就能模拟智能行为,自动创建任务、确定任务列表优先级、完成首要任务,并持续迭代,直至达成目标。简而言之,只需要给它一个目标,AI Agent就能完成剩下的全部工作。

基于此,百度智能云构建了大模型超级工厂,这一工厂目前已经服务了超过17000家客户,纳管了42个国内外主流大模型,企业可以快速调用包括文心大模型在内的各种大模型的API,获取大模型能力,千帆上直接调用大模型API的月活企业数近万家

在应用层面,此次百度智能云发布了“千帆AI原生应用开发工作台”,能够帮助企业敏捷、高效地进行AI原生应用开发的需求,降低AI原生应用开发门槛。

同时百度智能云发布了国内首个AI原生应用商店,帮助AI原生应用的供需双方建立起联接通路和交易平台,大幅提升客户应用选型与采购的效率。

百度通过大模型超级工厂链接了大模型商,在AI原生应用上提供开发门槛和商店,在此背景下百度成立平台性举措为其提供了API接口和AI原生应用资源。

为百度在实现基于AI Agent的目标,提供了潜在的调用接口,在百度这单一通道能实现应用的调用,调用能力也是考量AI Agent智能化的重要指标之一,为百度构建自家生态打造了壁垒。

百度在地图上的尝试,并未展示出在之后众多API接口上的能力,在调用方式是通过已自家应用或是新的平台型应用,对百度的调和能力是考验,而在新的AI原生应用下,如何去合理的调用和适配是AI Agent下的难点。

具身智能指一种智能系统或机器能够通过感知和交互与环境进行实时互动的能力,百度自然在该方向也有部署,首当其冲的是基于大模型下的自动驾驶应用,是视觉大模型在复杂场景下简单操作的典型应用。

萝卜快跑已经完成超过400万次载客服务,在武汉、重庆、北京、上海等城市落地,未来随着成本更低的自动化驾驶规模化部署等演进,其将越来越接近商业化。

百度智能驾驶事业群组(IDG)智能汽车业务部总经理苏坦表示,“大模型时代,基于重构的思路,我们有机会把汽车座舱中人和机器的关系变成人和虚拟人的关系。基于文心大模型作为基础模型,和百度Apollo在百万量级智能汽车和不同场景的大量数据积累,进一步增强出了Apollo智舱大模型和智舱开发工具链。”

在智能家居方面百度推出了四款AI原生新产品:小度添添家庭机器人、小度青禾学习一体机和Tiantian Casa的两款智能音箱,多以交互为主的固定式载体,主打情感陪伴、学习教导和辅助等功能。

在人形机器人上,百度自身没有下场参与,但与市场上的硬件公司有着密切合作,最具代表的是百度参股了稚晖君(彭志辉)的智元机器人,其也发布了第一代产品“远征AI”。

BV百度风投表示“我们看好智元通过融合大模型和机器人硬件技术,打造AGI通用人型机器人,以此来实现机器人的自主化和通用化。”

在AI原生应用的道路上,百度以自身优势的软件为切入口,逐渐打造其百度生态,通过平台化链接API接口等原生资源,实现AI Agent乃至下一代操作系统”的建立上,而百度野心的实现需要后续应用的接入,目前调和的能力有待考究

落地初现成效,商业化仍是谜团

百度开启了AI原生应用的钥匙,围绕大模型的商业化仍是谜团。

目前,大模型的B端应用已经出现四种商业模式,包括交易量收费、定制开发费用、服务费用和订阅收费。

1、交易量收费:根据客户每月使用的API调用或交易量收取费用。定价标准通常是按交易量计算,例如每千个API调用收取一定的费用;

2、定制开发费用:如果客户需要特定领域的AI模型,公司通常会收取定制开发费用。定价标准通常取决于开发的难度和时间成本;

3、服务费用:根据提供数据处理、标注和质量控制服务等来收取费用;

4、订阅费用:客户可以根据需要选择不同的订阅级别,如基本、标准或高级。订阅费用通常按月或按年收取,并根据所需服务的数量和类型进行定价。

在C端7月中旬出圈的秒鸭相机则是一款典型案例,妙鸭相机是一款基于AI人脸识别的相机应用,火爆的主要原因是妙鸭相机的AI写真质量被认为和海马体、天真蓝等专业摄影机构不相上下,但是价格却只要9.9元,通过较低的价格让用户拥有具有质量的体验。

在AIGC时代,用户免费、流量变现的商业模式,已经被大多数投资人和创业者抛弃,其先付费后使用逻辑的成功,也让大模型应用在落地变现上有了参考,面对需求用户的付费意愿是主动的,且具备潜在的市场空间。

百度在B端通过自身大模型和云业务的优势获得增长,在C端仍以传统广告业务为主,在全面转型大模型后,百度第二季度的营收和利润双双实现增长。

财报显示,第二季度,百度核心收入264亿元,同比增长14%。百度核心经营利润同比增长27%至65.1亿元,经营利润率为25%,相比2022年第二季度的22%和2023年第一季度的23%有所提升。

百度在线营销收入为196亿元,同比增长15%;非网络营销营收为68亿元,同比增长12%。

除了实现营收和利润大幅增长,百度智能云、智能驾驶、用户产品等基本盘业务也在二季度持续高速增长。

作为经过AI调优的云基础设施,百度智能云为大模型训练提供强大的算力,在第二季度,百度智能云签约客户数量持续增加,包括兴业银行、南网总调、汉得信息、金蝶、软通动力等外部企业。

百度通过不断迭代自身大模型的性能,保持位于前列的优势,通过切入AI原生应用,实现B端用户的积累,一方面为其带来收入方面的增加,另一方面打造其生态壁垒;在这过程中对百度云算力的要求也水涨船高,生态的建立需要依靠大量的前期资源投入,一旦无法跟上,将会流失客户,目前的生态建立在先发优势上,生态的优势还未形成。

在C端产品中,百度通过打造AI原生应用的策略,实现产品力的提升,保持用户的使用量,在大量的用户基础上通过传统广告等业务进行增收,在新推出的原生AI应用上,可采同样的策略,或根据C端产品在市场的付费意愿及时调整,在新一轮功能的体验上还未形成绝对性的优势,在边界效益递减的体验下,百度产品的增长将放缓,其商业化的进程还需市场的检验。