春节前,大家都在“发”红包,这个砸了5亿,那个就砸10亿。阿里千问却别出心裁,不搞红包,而是拿出30亿请大家喝奶茶,让大家体验一次极致的AI购物。活动只用了9个小时就达到1000万单,千问APP成功登顶苹果App Store免费榜下载榜首。
乃悟看了看网上的照片,只能说一代人有一代人的鸡蛋要领:
和以往不同的是,这一次,阿里千问的方式很特别,他们用的是:
AI。
用户打开千问app后,都能白拿一张25元无门槛免单卡,不仅能免单喝奶茶,也能通过淘宝闪购买年货、点外卖。AI不仅帮你填好地址,推荐奶茶和要下单的店铺,最后还能通过支付宝AI付,在千问App内完成支付。
真正让人感到新奇的,是阿里这次展现出来的综合能力和对前沿技术的追求。
年初的时候乃悟看CES,备受瞩目的老黄家除了掏出一个DLSS4.5之外,重点全部放在了AI身上。皮衣刀客在演讲里提到了未来AI的发展趋势,就是ai要对现实物理世界产生影响和加以描述。他提出了物理AI的概念。用老黄的话说,如果说生成式AI让机器学会“表达”:
物理AI则赋予机器“指挥行动”的能力。
过去大家用的都是生成式大语言模型,从名字就能听出来,这就是个对话用的工具,重点是在文字上。然而大家卷来卷去,也无非谁速度更快,幻觉更少,上下文长度更长。但这都是在已有赛道上卷,而不是对AI本身的升级。
很显然,老黄的话,阿里的工程师们是真的听进去了,或者说他们早就在做了。9个小时1000万单,看起来只是一组数字,但这背后包含了阿里“通云哥”(通义实验室、阿里云、平头哥)硬核实力全链条覆盖和技术积累。
这个覆盖有多全呢?乃悟大致讲讲。和淘宝双十一那种大家自己拿着手机下单不一样,大家下单也好,计算优惠券也罢,只需要两根香蕉。但AI的计算需要消耗海量的Token。9个小时1000万单更是海量的token。当下的AI都是根据概率生成输出的,大模型吐出来一个字都是千亿级的浮点运算。
上百万人同时拿着千问运算买奶茶这种复杂的问题,是会形成算力海啸,一般普通企业会直接宕机。
然而阿里不仅做了,还能做成。
首先是因为他们家的token够便宜。千问大模型是自家通义实验室自家开发的,不需要接入API再给大模型企业付一笔费用。其次,云计算也是自家的。你的云服务器租赁成本也降下来了。最后,芯片也是自家的。真武PPU,比如810E的单卡性能已经达到H20的水平,还自带编译器,编译转码CUDA代码。自家的卡自家用,其成本肯定要比你直接买老黄家的A100要便宜。
说白了,在整个活动中,负责思考的大模型,负责计算的云平台和物理硬件的芯片,全是阿里自己研发的。全球目前具有这种能力的公司只有两家:
谷歌和阿里。
当然,便宜不便宜,对于阿里这种大厂来说倒是其次。关键是,因为云计算、芯片和大模型都是自家的,让阿里对其底层代码、技术栈都完全了解。遇到像活动里那样算力海啸的涌入,知道怎么调试,有bug能及时修复,查找问题,积累经验,这些经验还能反哺千问大模型来提升智能水平。今天已经有消息显示,阿里最新一代模型千问3.5在Hugging Face中曝光。
阿里还具备谷歌不具备的一项优势,那就是他们的应用场景足够多。说白了,谷歌再牛,也没有支付宝、淘宝、高德、飞猪、大麦等服务生态。就算Gemini想帮你下单一杯奶茶,外卖软件也不会给他开后门。
阿里不一样的是,他们旗下生态业务广泛,共享的是同一个SSO和内部的API协议。千问能调动高德去查找店铺的位置,通过淘宝闪购填写订单,调动支付宝来付款。这是OPEN AI等大多数AI应用无论如何也做不到的。
大家千万不要小看这种生态赋予AI的强大优势。AI可以在执行中得到反馈,比如某个高德上标注的奶茶店,实际上今天停业休息,会让AI检查自己的执行路径,下一次就会执行的更好。
无数用户,各种执行命令,不断试错和验证,这种循环对AI能力的提升是极为强大的。
从ChatGPT诞生到现在,只是让AI写写稿子,回答一些问题,写写代码,已经满足不了人类了。它需要更深度的参与到人类的生活中,就像老黄说的一样,去影响物理世界。
这事实上已经是AI从业者们的共识了。乃悟看到有AI从业者接受采访就说的很清楚:
企业级AI,要告别对话玩具。
老黄把AI分为四个阶段,即感知AI、生成AI、代理AI、物理AI。乃悟看来,阿里已经完成了第三阶段的验证并向着第四阶段迈进。
如果说咱们的征途是星辰大海,那么就先从送大家一杯奶茶开始吧。