Cortana小娜失传奇世界新服网败背后,微软的傲慢与偏见
欢迎关注“创事记”微信订阅号:sinachuangshiji
文/藏狐
来源:脑极体(ID:unity007)
“hi Siri,给我讲个笑话”“天猫精灵,今天天气怎样”“小度,为我导航最近的加油站”……
今天用语音唤醒智能助手,已经不再像以前那样是一件颇有耻感的事情了。
“音箱大战”的澎湃之力,已经让偏远至村镇的群体都AI了起来,智能语音早已下沉得不能再下沉了。语音交互的习惯逐渐培养起来,接下来就是做文章、讲故事的好日子了。
在这样的大好局面中,微软语音助手Cortana小娜却传出了要“脱团单飞”的消息,即将终止在IOS和安卓两大移动应用平台上提供服务,这无疑是自绝于人民群众的自杀式行为。
小娜的失败给语音交互领域留下了哪些“遗产”,而它的创造者在失去移动端制霸权后,又将告别智能语音助手这一关键入口,接下来的航线又指向何处?
Cortana小娜的“美强惨”人生
今天语音交互的主流人群,可能都没有来得及能跟小娜在手机端产生一次对话。而在PC端偶尔召唤出来,最大的可能也是因为操作失误。
但这并不代表这位以FPS 游戏 Halo 中的 AI 角色命名的Cortana ,水平真的如此泯然众人矣。
准确来说,在AI黑科技方面,微软并不输给谷歌、苹果这些高光实验室。而小娜背后的微软亚洲研究院(人工智能-语音识别方向)更是产业界的“黄埔军校”。有着如此背景的小娜,问世时可比答非所问的Siri聪明多了。
在一则视频中,用户通过搜索引擎向Google Now、小娜、Siri提问“埃菲尔铁塔有多高?小娜在数年前就将知识图谱与AI相结合的方式来呈现答案,跳过引擎抓取的大量无用信息,直接告诉对方答案——铁塔的高度。
更关键的是,小娜所依托的微软亚洲研究院有着大量的中文语音识别、语义分析成果积累,当时Siri还是一个中文听不懂、回答颠三倒四,最大的作用就是讲笑话的搞笑型选手。
除了历史沉淀,小娜之所以聪慧,也源于其在微软“云为先,移动为先”核心战略中的关键地位。
当时,小娜与Bing、Azure等产品正在逐步取代Office和Windows,成为微软在移动时代的新业务核心。为此,微软在对小娜的打磨上也十分用心。
小娜的定位是“智能助理”,当时已经可以处理复杂的口语指令,来帮用户打开第三方应用、查找文件、收发邮件等等。2016年,小娜的语音识别率就已经超越了人类。2018年早些时候,为了让小娜的表达听起来更人性化,微软还收购了一家名为“语义机器”的人工智能初创公司。可以说绝对是亲生的待遇了。
小娜所担负的理想,即使在今天看来,也极具前瞻意义。
在技术愿景上,小娜被设计为云端驱动(cloud-driven),许多智能计算都是在云端完成的,设备终端只做轻量级的整合。这使其跨平台统一服务成为了可能。
所以在应用场景上,微软工程师们提出了“Cortana Everywhere”(小娜无处不在)的想法。即让小娜在各种不同配置、不同版本、不同操作系统的终端设备上都能够被调用,并提供一致性的用户体验。只要智能终端具备一定的计算能力,可以运行小娜的客户端堆栈(Client Stack),就能够运行。
当时设想的足够运行小娜的最小设备是智能手环,在微软的Microsoft Band 上,小娜可以识别语音并以文字形式呈现出来。
当时的产品负责人在谈到小娜的理想化未来时,描绘了这样一个场景“一件衣服里内置了麦克风,它可以听到我说话,将信息传达给我口袋里的手机,然后手机和云端进行通讯。整个过程用户都不需要从口袋里掏出手机,佩戴耳机就可以听到小娜的回复。”
耳不耳熟?云+AI+泛终端,这个今天普遍出现在各种行业前沿技术峰会PPT上的智能交互画卷,几年前就被微软描画了出来。
(Microsoft Band 上的小娜效果)可惜,凡事总有但是。
小娜最终还是走上了“美强惨”的道路。最后那个令人意难平的“惨”字,源于不久前它的彻底失败。
微软正式宣布战略性收缩小娜业务,将在2020年1月31日退出iOS和Android平台,这是一封来自官方的死刑宣判书。
其实早在今年1月份的时候,微软CEO纳德拉就宣布不再将Cortana视为Alexa、Google Assistant的竞争对手。但走到彻底放弃移动端应用市场这一步,也不由令人唏嘘——小娜明明应该是主角的剧本,最终却沦落成了炮灰,一切究竟是怎么发生的?
三人行必有炮灰:
微软的语音交互“滑铁卢”
尽管有点马后炮的嫌疑,但今天我们回望微软在语音消费级市场的大溃败,或许能对当下还在场内的玩家有一个更为清晰的认识。
总体来说,小娜的“生不逢时”,主要体现在三个节点上:
1.生于智能,但困于终端。
智能语音助手的第一要义,除了在技术上要能实现足够高精准度的识别理解能力之外,最核心的一点是要有任务属性,即能够帮助人解决特定需求。也意味着,它必须能够获取其他设备和应用的控制权,才能够达到这样的要求。
但小娜除了在微软体系内拥有足够多的权限,比如调用和理解邮件、处理365office等等。而且大部分是发生在PC环境中,语音交互相比鼠标要位居其次。在更广大的移动场景中,受限于Windows Phone可怜的市场占有率,小娜很难做到像Siri、echo与google assistant那样,与自家硬件无缝整合。
比如在打开应用时,使用“Hey Cortana” 语音唤醒;亦或是始终保持语音待命,以低耗电状态运行等,这些必要的能力小娜都很难在竞争对手的设备上实现。
而缺少了来自终端用户行为的数据滋养,小娜在脑力进化、内容理解等能力上也逐步与对手们拉开了差距。微软在消费级移动终端上的失利,最终转化为小娜的败北。
2.生为语音,却难觅应用。