进入2024年以来,“百模大战”已然过气,AI行业不再将基础大模型的能力比拼作为头等大事,大家关注的重点也变成了具体的AI原生应用。那么AI原生应用到底应该以在怎样的面目落地呢?百度创始人兼首席执行官李彦宏日前在2024世界人工智能大会上给出的说法,是智能体是开发最简单的AI应用,“也是我们最看好的AI应用的发展方向”。
尽管AI智能体(AI Agent)确实是AI应用发展的最佳方向,但问题是以现在的技术水平,AI智能体或许只会让用户对AI大失所望。事实上,AI智能体过于“高大上”,它是自主感知、规划决策、执行复杂任务的智能产品,可通过独立思考和调用工具逐步完成给定的目标。比如屏幕前的你此时需要打车,就只用说出目的地,AI智能体所能实现的效果是直接打开滴滴、替你下订单并完成支付,整个过程无需人工的介入。
但是理想很丰满、现实很骨感,只要用“人话”把工作流说清楚、再配以专有知识库,确实就可以搭建一个AI智能体,但这并不代表这个AI智能体就可以代替你去完成种种任务。不同于ChatGPT主要输出文字、Stable Diffusion只能画图、可灵是生成视频的,AI智能体需要完成复合型的任务。由于幻觉的存在,据相关机构的测试结果显示,现阶段的AI智能体无论国内、还是海外出品,完成给定任务的成功率都还不到20%。
就好比大家能想象上美团点外卖,结果有80%的概率无法下单吗?故而,AI智能体可能会是AI原生应用的完美形态,但它似乎并不太适合当下。
那么,适合如今AI业界发展现状的AI产品形态是什么呢?作为国内AI独角兽的月之暗面,近日给出了这个问题的答案——浏览器插件。就在7月8日,月之暗面方面宣布上线Kimi浏览器插件。据悉,该插件支持轻量搜索功能,并拥有“点问笔”和“总结器”两项功能。
按照官方的说法,Kimi浏览器插件适用于浏览网页术语查询、外文报道摘要总结、文档数据查询、同类表达举例,并提供了全局浮窗、侧边栏两种展示方式,用户可自行切换。浏览器插件这个设计为什么优秀呢?当然是因为便捷,因为浏览器插件的存在让Kimi跳出了官网、变得无处不在。
以往用户想要使用Kimi,就必须先登陆Kimi.ai官网,一切的交互也必须在单独的网页内来完成。
有了浏览器插件之后,用户就只需打开浏览器,无论哪个网页都能召唤Kimi来为自己提供总结全文、提炼长文章重点内容、翻译和上下文理解等能力。从单一网页到整个浏览器,一个小小的插件就解决了Kimi触及更多场景的需要。更为重要的是,作为现代浏览器的Chrome、Edge、FireFox之所以“现代”,靠的就是丰富多彩的扩展插件,并且安装插件本身对于当下的网民来说也不存在太高难度。
一个浏览器插件在一定程度上就满足了月之暗面当下的首要目标,即获取更多得用户。
没错,当下AI行业的大咖们之所以不再鼓吹基础模型,反而更关注AI应用的落地,最核心的问题就是AI业界需要增量。进入2024年以来,AI泡沫论逐渐有了市场,一个重要的依据就是经过一年多时间的建设,AI基础设施虽然有了,但变现渠道却依然匮乏。
Sam Altman在一个月前透露的OpenAI最新业绩显示,其年化营收为34亿美元。要知道OpenAI已经是这个赛道的领头羊,结果一年还只能赚不到五十亿美元。
既然如此,英伟达千亿美元的预估年营收要靠什么来支撑呢。或者说微软、OpenAI、Meta、特斯拉等巨头,为什么要每年花费几百亿美元去找英伟达买“铲子”?当年淘金热的时候,淘金客发疯似地买铲子是因为阿拉斯加真的有金矿,可现在AI行业是否有“金子”还尚未可知。
无论是李彦宏看好的AI智能体,还是其他厂商押注AI原生应用,或是月之暗面上线得Kimi浏览器插件,其实都指向了同一个目的——探矿。无论如何先得把用户聚拢起来,有了成规模的用户,才有接下来谈论变现潜力的机会。而在一众为了获取更多用户的尝试里,最理想的当然是苹果的Apple Intelligence,但并不是哪个厂商都能手握一个成熟的移动操作系统。
反观月之暗面,在明知各大手机厂商也在做AI,不可能轻易放任其他AI厂商进场的情况下,选择在“无主”的web端拓荒确实就极富战略眼光了。
发布于:湖北省