智能音箱走过青春期

从 2017 年开始,在中国的智能音箱市场的观察家眼中,几乎每一年都是以「爆发元年」的期寄开场,再以「即将真正到来」收尾。在这种起起伏伏的半推半就之中,我们经历了短暂的「百箱大战」,继而一个披沙拣金的新时代在不知不觉中到来。

倘若亚马逊 Lab126 实验室当初没有为 Echo 注入灵魂,过往两年的智能音箱大战也无从谈起。语音助手为蓝牙音箱提供了 AI 大脑,而互联网公司更在意万物互联和智能家居。无疑,智能音箱彻底搅动了产业链上下游。故事里,写尽了互联网巨擘间的激烈角逐,也插叙了创业公司的生不逢时,以及各家遭遇围剿时的羸弱、变通和逆转。

2017 年,中国智能音箱市场萌发,百余家公司轮番上阵;竞争在 2018 年刺刀见红。语音交互的早期,智能音箱被寄予了点石成金般的期许。两年过去,智能音箱的新时代因为一块屏幕的存留增减,变得比过往两年更加有趣又迷离。

尽管业界在智能音箱的证明与证伪之间的拉锯从未停止。「传统音箱+智能语音助手」的搭配,也曾让万千创业者以为风口降临,人人皆可分羹。可三年过去,市场上的金牌卖家仅剩巨头。过往参与者的存亡绝续,大多是一部血泪史。

当我们谈起智能音箱新时代,目前出现了三种断代理论:从无屏到带屏的物理区隔,从百箱大战到三足鼎立的格局锁定,以及从伪智能到真智能的华丽蜕变。这三种不同逻辑的划分,都能自圆其说。

而无论瞄向哪种视角,智能音箱 2.0 时代终究还是来了。

(搭载语音助手 Siri 的苹果智能音箱HomePod)

混战与鼎足后的各自归位

过去两年,巨头用补贴为代价,在智能音箱市场培育方面初显成效。根据全球知名市场分析公司 Canalys 在 2018 年 5 月发布的报告指出,中国已在 2018 年跃升为全球第二大智能音箱市场。尽管亚马逊和谷歌仍是这一领域的双雄,出货量分别为 2420 万台和 2340 万台,但起步较晚的阿里巴巴、小米和百度在去年迅速跻身市场前五,截至 2018 年年底的出货量年分别为 890 万、710 万、360 万。

2017 年,中国智能音箱的市场尚处于早期开垦阶段,全年出货量为 150 万台。其中前 10 个月的销量只有区区 10 万台,其余 140 万的增量几乎全部来自于小爱同学和天猫精灵。与此同时,「价格战」成为了关键词。以小米为首的持续性低价策略,为智能音箱在来年迎来井喷式增长,立了一等头功。

早在 2015 年 5 月,距离 Echo 正式发售的还差一个月,京东和科大讯飞联合成立的合资公司灵隆科技,率先在中国推出了叮咚智能音箱,开启了国内智能音箱的篇章。2016 年,「叮咚」小试牛刀,10 万台的全网销量在当时绝对具有里程碑意义。

彼时,普通消费者刚刚抢购到苹果公司的最新款智能手机 iPhone6。时代背景是,国内用户还不习惯开口与 Siri 你来我往,更没有察觉到电子产品和语音助手的暧昧关系。

京东押下了重注,在科大讯飞语音技术的加持下,叮咚智能音箱更新又换代,产品把控和市场反响不赖,可后来却退居二线,淡出消费者视野,令人不解。曾有消息传出,叮咚内部的动荡和调整反反复复,公司缺乏清晰的路线指引,是导致叮咚「落水」的主要原因。

「叮咚」之后,智能音箱的划时代事件发生于 2017 年 7 月 26 日——小米正式发布了首款智能音箱「小米 AI 音箱」。299 元的瞠目低价,击穿了这一品类当时的价格底线。小米智能硬件部总经理唐沐曾表示:「智能音箱作为公司的战略可以不赚钱,音箱的定价逻辑遵循售价不低于硬件堆料和工厂加工费的总成本价的原则,而研发成本完全由小米自行承担。」

先于小米 AI 音箱三周发布的天猫精灵 X1,出自阿里之手,其售价比小米高出 200 元。而在 2017 年的双十一购物狂欢夜,天猫精灵自编自导了一场「攻守道」。抹去百位数字,抢购价仅需 99 元,当天 8 时 53 分,阿里宣布天猫精灵总销量突破 100 万台。

( 智能音箱上演价格战 ,产业遭遇透支)

自此,智能音箱的价格补贴进入了常态化。当巨头掌控了智能音箱定价规则和话语权时,参与团战的小型玩家溃不成军。其中,中高端价位的智能音箱品牌受到的冲击最为明显。因为恪守产品调性而拒绝向低端妥协,这类音箱也未能博得消费者的广泛认可,一些第三方智能音箱品牌和创业团队因此折戟沉沙。

在技术启动期,随着关注度的提升,资本的涌入助长了智能音箱的市场泡沫。有关专家曾表示,那些没有从用户需求出发的产品,不久后必然会遭到淘汰,恐殃及九成以上的企业。

喜马拉雅副总裁兼硬件事业部总经理李海波在 2017 年的一次采访中,曾感慨智能音箱的虚火过旺。

低价让利消费者带来的负面效应很快出现。在一些消费者心目中,智能音箱似乎沦为低廉的代名词。百度、阿里、小米在 2018 年上半年等纷纷推出了 mini 版智能音箱,价格从 69 元到 169 元不等,靠低价尝鲜的策略打动那些「可买可不买」的消费者。

可如果没有低价作为支撑,智能音箱恐难创造出这样「加速度」。以补贴、低价为主导的互联网策略早已司空见惯,野蛮粗暴,屡试不爽。当然,这条增长通道只配巨头拥有。

(百度早期通过收购渡鸦团队布局智能音箱赛道,但以失败告终,图片为渡鸦Raven-H)

智能音箱自此进入了寡头时代,那些侥幸存活的企业不得不向 B 端市场转型。Rokid 和出门问问就是两家典型代表。

例如 Rokid 参与研发了 360 今年 3 月发布的智能音箱——MAX,提供了 Rokid 自研的 AI 芯片 KAMINO18 和 AI 开源操作系统 YodaOS。此外,研发团队为 MAX 定制了双唤醒词,并应用了声纹识别技术。这次的合作代表了 Rokid 作为技术型产品公司的实力。

2016 年 12 月,Rokid 首款智能音箱 Pebble(月石)亮相 CES。无论是双字唤醒「若琪」的技术攻关,还是在产品设计方面的苛求,Rokid 的硬件产品一直走中高端品牌的定位。Pebble 上市售价为 1399 人民币,对外数据显示,Pebble 的产品日活超过 50%,月活在 80% 左右,产品复购率达到了 80%。

Rokid 创始人兼 CEO 祝铭明在 2017 年 10 月的云栖大会上,宣布携手阿里云共同推出全栈语音开放平台,其 100% 的硬件技术和 70% 的代码免费开源,「(企业)只要拿回去自己包个壳,稍作修改,就是一个新产品,而且只要 200-300 元,成本非常低。」

在 Rokid 看来,共享自己的技术是一个「正确的决定」,因为在急需教育的早期市场里,技术和产品的权重不如渠道和市场来得高。

另一家典型的代表是出门问问。公司在进入智能音箱领域之前,一直专注智能手表,而「智能可穿戴之于语音交互,肯定不是最好的落地场景」,出门问问 AI 音频事业部总经理吴玉锦说道。基于车载后视镜——问问魔镜的成功,出门问问开始了家居场景的探索。2016 年,出门问问第一代智能音箱 Tic Home 立项。

吴玉锦坦言,最初接手音箱项目时,内心其实写满了问号:「毕竟行业整体的语音技术远未成熟,缺乏『support domain』,很多领域的问题,智能语音助手没法作答。」考虑到这一因素的掣肘,出门问问的首款智能音箱 Tic Home 向做工和音质侧重,投入了大量的研发精力和物料成本。

(在不断开辟新赛道的背后,出门问问寻找「下一代人机交互」的核心目标没有改变)

「第一代音箱取得了阶段性成功,在淘宝众筹平台上的众筹金额突破 400 万」,不幸的是,Tic Home 发售不久,巨头便纷至沓来。

出门问问做智能音箱的初衷,是希望构建「家庭、路途、可穿戴」的产品金三角,覆盖语音交互的所有领域。但在整个 2017 年,出门问问经历了智能音箱从百团大战到巨头割据的剧变,「没有人胆敢跟巨头产生正面冲突,况且价格补贴不是创业公司能够承担的。」团队后来尝试走垂直细分领域,做了很多调研后发现,儿童是智能音箱天然的用户族群,后来便有了第二代智能音箱——面向儿童的「TicKasa Fox」。

如今,出门问问的音箱业务已经转向 To B 市场,并找到了巨大的市场潜在机会。来自电信运营商和酒店品牌的订单占绝大多数,他们对智能音箱打开 IoT 的潜在机遇同样看重。

能够认清形势并抓住 To B 市场,创业公司可以过得「相当滋润」。毕竟,「BAT 不会为某一个行业或企业从头到尾的专门定制,他们看不上那个量,而轻量型的企业能做好智能音箱的所剩无几。有能力做的(企业),还要看它有没有端到端的能力,是不是还得整合进别家的技术才能完成交付」,吴玉锦告诉极客公园(ID:geekpark),经历了 C 端市场全链路的打通和尝试,出门问问已经具备 to B 能力输出的要求。

(截止 2019 年 3 月 31 日,小爱音箱累计销量突破了 1000 万大关)

巨头的生态博弈

在 2017 年的盛夏,小米 AI 音箱以 299 元的售价贯彻了小米「不靠硬件赚钱」的一贯作风。采访中,唐沐丝毫不避讳这一话题,首度承认小米是智能音箱价格战的「发起者」。

唐沐带领的 IoT 部门负责路由器和智能音箱两条业务线,被戏谑为集团「最不赚钱的部门」,没有之一。他背负的 kpi 不以盈利为目的,雷军对他的要求是,「广开销路,以量取胜」。

「虽然可以不赚钱,但是绝对不能亏钱。」在价格战时局最激烈的时候,有一次销售曾主动降价,把售价 169 元的小爱 mini 音箱向 99 元的天猫精灵逼平,幸亏唐沐及时发现并紧急叫停,没有造成更大的损失,但那一次的失误,让唐沐背负了 2 万台左右的亏损。虽然只是区区 140 万,但对于近乎零利润而言的小爱音箱来说,回血时间相当漫长。

尽管阿里、百度和小米布局智能音响的想法和切入点不尽相同,但巨头誓死捍卫智能音箱战场的本源殊途同归,唐沐指出:「比如 BAT 当年抓互联网入口,虽然各有各的切入点,但是他们只要抓到了这个入口,牢牢吸附在这些入口之上的时候,他们就会发展全领域的应用,然后构建闭环。」

2019 年 1 月,小米启动了「手机+AIoT」的双引擎战略。小米 2018 年财报数据显示,截至 2018 年 12 月 31 日,小爱同学月活用户超 3888 万,小米 IoT 平台已链接的 IoT 设备数(不包括智能手机和笔记本电脑)约 1.51 亿,已成为全世界规模最大的 AIoT 生态圈。

雷军表示,2018 年是小米 AIoT「崭露头角的一年」,AIoT 已被公认为下一个核心机遇,是新时代的超级互联网。

来自小米数据中心的统计数据,截止 2019 年 3 月 31 日,小爱音箱累计销量突破了 1000 万大关。相比于动辄拿出巨额补贴抢占市场份额的友商而言,小米始终都在赛道上奔跑。

在唐沐看来,巨头以补贴的方式进入音箱市场,看似野蛮,可选之路却唯有如此。毕竟每家公司在成长路径上的差异,导致用户对品牌形象的认知相对固化,很难相信「提供电商服务的公司和提供即时通讯的企业可以做好一款硬件产品」。同理,用户也很难相信「小米可以做一款很 NB 的互联网服务」。他直言:「企业想要打破这种偏见,就必须付出比别人更大的代价」。在智能硬件领域,低价仍是打破品牌刻板偏见的有效手段之一。

除了阿里,小米口中的友商,还有凭借小度带屏音箱杀出重围的百度。

作为国内无屏智能音箱的首发者。2018 年 3 月 26 日,百度联合小鱼在家发布了国内首款带屏智能音箱——小度在家,李彦宏亲临现场助阵。这家由百度战略投资的初创公司偏爱屏幕,是基于对智能音箱的审慎思考。

(百度通过发力带屏音箱成为市场翘楚,但价格补贴是不可忽视的增长因素之一)

而百度重视智能音箱的原因,自然与其战略密不可分。在集团看来,小度肩负着百度搜索和信息流的未来。幕后那双「看不见的手」,来自于百度副总裁、智能生活事业群组(SLG)的总经理景鲲。他曾负责度秘团队管理工作,主导了 DuerOS 的开发,将后者打造成为百度在人工智能时代最重要的开放平台之一。

今年 2 月份,百度在京发布了第二代「带屏视频音箱」小度在家 1S。从参数上看,它较第一代「小度在家」相比,性能得到了整体提升。景鲲当场表示,要把智能音箱业务在 2019 年第一季度冲刺到市场第一。

3 个月后,Canalys 与 Strategy Analytics 分别发布的 2019 一季度智能音箱市场报告显示,百度旗下小度智能音箱出货量达 330 万台,超越阿里巴巴与小米成为中国市场第一。同时,小度智能音箱出货量仅次于谷歌的 350 万台及亚马逊的 460 万台,位居全球市场第三。

有趣的一幕发生在中国移动 6 月份举办的「千兆引领,生态赋能」大会上,百度和阿里的演讲代表都在现场宣称自家智能音箱位居中国第一,唯独小米说小爱音箱是中国第二。结果会后,小米集团副总裁、红米 Redmi 品牌总经理卢伟冰收到同事发来的,来自奥维云网的 2019 年 Q1 季度中国智能音箱市场主要品牌月度销量份额报告。其中显示,小米以 34% 的销量份额领位列市场首位,天猫精灵和小度分别为 33% 和 24%。

口水战侧面反应了巨头在音箱赛道的紧咬力度。正如景鲲所说:「智能音箱这个赛道非常特殊,它是靠拼杀闯出来的一条全新赛道。」

在小米看来,虽然阿里和百度在这场「马拉松」通过持续性补贴,坐拥各自的一席之地,但唐沐坚信「天下没有赔本的买卖」,更何况企业的每一笔款项都是要有回报预期的。对于小米这种不靠硬件赚钱的企业来说,「放长线钓大鱼」的策略,风险性极高。

的确,当被问及何时开启商业化时,小度方面回应称,智能音箱仍处于投入期,集团目前没有商业化的目标。目前能想到的,只有会员一种变现形式,而重心更多地是放在产品体验和扩大用户规模方面。

而景鲲则代表了除李彦宏以外、百度对智能音箱的最高意志。在今年 2 月发布小度在家 1S 时,景鲲就公开表示,百度的价格补贴照旧持续,直到终有一日,「普通用户的家中都有一台可供人机交互的小度系设备」。

今年第二季度,百度在综艺节目《向往的生活》中对小度音箱的软植入,一方面是触达与小度高度契合的观众作为潜在消费者;另一方面有助于在受众心目中,树立智能音箱代表品牌的形象。

( 三大智能音箱的品牌溢价能力)

比起迫切希望成为国民产品的小度来说,小爱音箱只需要在小米 AIoT 的战略之下顺势而为即可。这两年来,唐沐对于小爱音箱的战略定位理解得再深一层。他认为,智能音箱既是 IoT 的「催化剂」,也是 IoT 的「收割者」。

(2018 年 10 月 25 日,北京故宫,小爱蓝牙音箱以 49 元的首发价,刷新智能音箱价格底线)

在语音交互出现之前,小米鼓励用户启动手机 APP 去控制智能硬件。智能音箱发售之后,小米发现,用户的使用习惯正在从对手机 APP 的控制迁移到音箱的语音交互。当 IoT 设备数量和用户规模越来越庞大,消费者考虑购买智能音箱,去操控这些设备的概率就会大大增强。一项统计调查显示,购买小爱智能音箱的用户,更倾向购买小米自家的 IoT 设备。因此,智能音箱又带动了 IoT 产品的销售,智能音箱的」催化剂「作用可见一斑。

而对于 IoT 的「收割者」一角。唐沐通过一个反面假设来说明了重要性:「假设小米跃居为全球最大的 IoT 平台,但没有推出自己的智能音箱。那么在智能音箱的战役内,友商便会获得绝大多数的市场份额。用户可以通过其他品牌的智能音箱,控制小米的 IoT 智能设备。」

IoT 设备的连接需要有开放协议的授权许可,一旦竞争者可以控制第三方的家居设备,而不支持小米的 IoT 产品时,消费者很可能再也不会把小米的任何产品添加到购物车里了。

继续往下推演,对手收割 IoT 只是第一步,毁灭是第二部。唐沐说:「一旦友商收割了小米的 IoT,难保有朝一日,语音助手会屏蔽掉小米的设备,造成其无法正常使用。更狠的是,当用户对家中的智能音箱发出指令后,不排除友商的智能音箱会推荐用户使用其他品牌的 IoT 设备。」

(截止 2018 年第四季度, Google Home Hub 出货量为 220 万台)

一块屏幕的改变

2018 年第四季度,Google Home Hub 带屏智能音箱成为新星,出货量高达 220 万台。根据 Canalys 的统计显示,2018 年全球带屏智能音箱的出货量为 640 万台,占智能音箱市场总出货量的 8.3%。

在智能音箱赛道上,亚马逊和 Google 作为先行者,一直是国内科技企业开道铺路的风向标。最善于捕捉国际巨头蛛丝马迹的中国互联网巨头们,也纷纷做起了带屏音箱的生意。

从时间顺序上,无屏到带屏的产品迭代属于一种进化。带屏音箱不仅同时满足音频收听和视频观看的需求,而且使得智能音箱从单一的语音交互向「语音+视觉」的多模态交互转变,摆脱了语音交互在功能和内容方面的展示局限,让智能设备具备了能听、能看的感官能力。

出门问问 AI 音频事业部总经理吴玉锦认为:「人机交互未来必定是一个多模态的交互。语音交互之后,视觉交互一定会首当其冲,成为家庭场景下人机交互的主流趋势。」

由于早期的人工智能不足以赋予机器足够的理解力,导致人机交互体验远未达到所谓「智能」状态。不难理解,为什么有人曾大放厥词,扬言「智能音箱就是智障」。

很多时候,用户交互过程中,至少需要三轮对话才能得到令人满意的结果。小鱼在家 CEO 宋晨枫提到,多轮交互中,一旦用户的表述相对复杂,机器很可能无法准确理解语义,导致交互被迫中断。这种效率低下的交互体验,通常会让用户在检索信息的过程中产生倦怠感。

百度 AI 交互设计院基于对大量的智能语音交互产品用户测试的经验发现,影响语音唤醒体验的因素包含两个维度——输入和输出。而产业内也正在形成一种共识,那就是 I/O(输入和输出)能力的提升,是智能设备在未来取得突破和发展的关键。

而智能音箱加上触摸屏,令 I/O 能力得到加强。从技术层面来看,带屏音箱本身虽不能解决多轮对话的能力,但有了屏幕的加持,触控操作代替多轮问答,多轮对话的瓶颈因此得到解决。从用户体验角度出发,带屏音箱的信息输出效率,比单纯靠语音播报的无屏音箱高得多。例如在屏幕上直观展示未来一周的天气,或推荐当天的热点新闻,而无屏音箱要花很久才能完成语音播报。这不符合人类以视觉为主、听觉为辅的信息获许习惯。

在商业化方面,带屏音箱比无屏音箱显得更加友好。假如在内容播放的过程中,无屏音箱插入了一些硬广告,打断了正在播放的内容,必然会给用户带来极其糟糕的体验,而习惯了视频广告的观众先天的容忍度会更高。

从上述探讨中不难看出,由于智能音箱尚未实现「真智能」,导致产品对于屏幕的依赖程度。但不可否认的是,屏幕让产品的边界和功能变得模糊和冗余的现象正在发生。所谓「带屏音箱」,或许正在朝着以看为主的方向进化。有观点认为,未来智能音箱的演变路径,大概率是融合进智能电视之中。带屏音箱获或将成为巨头提前抢占智能电视生态的工具,这是亚马逊在 Google Home Hub 之后,推出了带屏版 Echo 的大概率目的。

百度通过孵化小鱼在家,成为国内最早布局带屏音箱的企业。关于带屏音箱,李彦宏给出了百度版的标准答案。他认为,智能音箱无屏与带屏,正如收音机和电视机的区别:「有了这块可视屏幕,智能音箱的功能才能得以更大程度的延展。」

早在去年 8 月份,出门问问尝试做出了一款 5 英寸屏幕大小的带屏智能音箱。「当时做了很多用户调研的场景,很多人希望它具备提醒功能,支持闹钟,告诉你该吃饭了或天黑了,再或是播放唱一首歌,屏幕上面展示歌词,平常就是一个电子相册」,吴玉锦说。

在和客户沟通的过程中,出门问问团队意识到,小屏音箱的受众群体「实际非常有限」,企业级用户更青睐大屏,按照他们的需求,所以出门问问在 2019 年初的 CES 上,公开展示了一款 8 寸带屏音箱。

但是大屏意味着更高的成本。唐沐认为,产品的成本结构决定着消费场景。假如在冰箱装配一块大屏,其成本就占到 30% 到 40%,那么这款冰箱绝不可能成功,因为白色家电更应具备实用性,消费者不会因为冰箱多了一块屏幕,再去多掏 30% 到 40% 的钱。

同理,带屏音箱不是小电视,为了避免产品的成本结构沦为畸形,就必须要控制屏幕成本,「带屏音箱的屏幕就必须足够小」。唐沐透露,小米之所以选择了 5 英寸小屏,是因为这块屏幕在目前的供应链内非常成熟。

「多模态交互是带屏智能音箱的一次大胆尝试,视觉也的确需要屏幕支撑,但智能音箱的屏幕尺寸该多大,是以屏幕为主,还是仅仅作为一项辅助,产品体验是以语音为主,还是以屏幕操控为主」,业界对于这些疑问没有统一的答案。

思必驰 CMO 龙梦竹看过主流的带屏音箱后,没有在带屏音箱「大屏 or 小屏」的问题上纠结,而是对智能音箱成为「语音+视觉」的合理载体存在怀疑。

从历史长河来看,半导体的萧条是因为屏幕的出现,音频行业的萧条是因为视频行业的崛起,不过这种此消彼长并非绝对。龙梦竹表示:「过去几年我们看到了音频内容行业再度焕发活力。对于智能音箱来说,无屏音箱存在的合理性更高。」

她强调,思必驰最初拓展智能音箱的业务,一是笃定音箱是天然的音频载体;二是因为音箱不带屏幕,语音才会成为刚需。基于这两点,智能音箱对远场识别、降噪、麦克风阵列、声源定位等需求很明确,技术迭代的步伐也大步向前。

可如今,智能音箱与屏幕的捆绑,既像一台小电视,又有几分平板的影子。带屏音箱集视频通话、远程监控、拍照、视听播放、电子相册等于一体。「带屏音箱的消费人群是谁,他们都会在什么场景下使用」,龙梦竹表示看不懂。

纵使 AI 技术是制约智能音箱行业发展的最大瓶颈,「可如果加屏幕是为了绕过技术,缓解多轮交互的局限和语音的一些缺失,这个点是不成立的」,龙梦竹直言不讳。毕竟,智能音箱从一开始就不是近场语音交互的工具,也不是供用户把玩的掌机。「虽然屏幕的加持,有这样那样的好处,但把这些优势和特色作用于一台音箱上,似乎是不成立的。」

至于用户画像如何确立,这是摆在硬件厂商和产品经理的问题。在智能音箱市场,不乏「拍脑袋决定」的产品。虽然带屏是不可逆转的趋势,但无屏音箱未来仍会长期存在。

声智科技 CEO 陈孝良指出,带屏智能音箱在未来挤压智能平板市场的可能性更高。尽管目前带屏音箱朝着融合交互的方向发展,但屏幕自然会让用户默认为是可触摸的交互手段,弱化并逐渐遗忘语音交互。在市场培育期,品牌方应该先让用户养成语音交互的习惯,再慢慢推出带屏音箱。

( 2019年第二季度,智能音箱的全球出货量飙升至 3030万台。其中,百度、 阿里和小米分别 以470万台、430 万和 340万的出货量位居国内前三)

2.0

时代的轮廓

智能音箱的第一轮竞赛已到尾声。根据Canalys预测,2019年中国智能音响的出货量将达到2960万台。而景鲲则大胆预估,称智能音箱市场将达到四五千万的规模。

唐沐指出,智能音箱的市场空间不是凭空臆想,而是置换或替代了传统蓝牙音箱市场:「智能音箱发展的很快,它的市场蛋糕就摆在那,未来在中国一年可能是上亿的规模。」

他继而补充道:「以往大家无论用蓝牙音箱也好,还是所谓互联网音箱也好,其实都是需要用手机去做操控的,本质上没有语音操控这么方便,因为用户毕竟要拿出手机点开 APP,找到合适的内容点击它,然后音箱才能够播放,但是语音交互很简单。」

回顾智能音箱的 1.0 时代,主流玩家能做到比较好的语音识别、自然语言处理水平和大脑查询机制,而且各家的曲库和有声读物储备得比较丰富。因此,总结第一阶段的战役,大多是在对基础能力的夯实。

虽然景鲲坚信屏幕、视觉和语音相结合的交互,是未来必经的发展趋势。但如果以有屏和无屏作为 1.0 和 2.0 的界定,这样的划分或许带有太强的物理属性。

对于智能音箱的 2.0 时代,是否以带屏和无屏来区分,唐沐本人对此深表怀疑。他觉得智能音箱 2.0 的阶段性标志,不在于有屏或无屏,而是真智能和初级智能的差别,即第二阶段的竞争是基础智能升级为真智能。所谓真智能,应该是「千人千面的」。

2017 年 6 月 20 日,喜马拉雅发布了小雅智能音箱。一段时间后,李海波注意到后台数据,发现使用「小雅」的用户有 65% 是儿童。方得智能 CEO 彭黔平也曾对媒体表示:「国内销量排名前三的智能音箱中,购买者大多是年轻人,但使用者却以老年人与儿童为主。业内人士都应该反思,为什么这样一款科技含量看似颇高的产品,最终只能满足老年人与儿童的需求。」

无论是巨头间的撕扯,还是创业公司的赛道转换,背后反映的是智能音箱市场新阶段竞争的更加残酷。看似小众的市场,引得国内外互联网巨头及新兴创业公司争相布局。尤其在智能音箱对于消费者来说,不再是陌生概念的今天,这一品类依旧谈不上品质与追求。

有人曾设问:消费者买到的是一个仅供消遣的廉价玩具,还是真正富有科技结晶的良心之选?

回归到产品本身,如果说智能音箱 1.0 时代,产品更像是一台问答机,把传统音箱和初级的语音交互相结合,升级成为了所谓的叫智能音箱;那么智能音箱 2.0 时代,唐沐判断,音箱是该回归「智能」本质,围绕「真智能」拉开新一轮的巨头争战的时候了。

(2019百度 AI 开发者大会,李彦宏现场演示小度全双工免唤醒能力)

无论是智能音箱还是智能电视,抑或是其它智能设备,语音助手都应是千人千面的形态:「比如不同的用户发出『我要听歌』的指令,智能音箱的反应是不一样的,推荐给你的内容也是应该是不一样的」,唐沐表示,

不过,距离真智能的到来,还有赖于声纹识别、智能推荐、情绪识别等相关技术的就绪度。

可喜的是,消费者看到了智能音箱的迭代进化。在今年 7 月初举办的百度 AI 开发者大会上,李彦宏为现场观众演示了小度自研的全双工免唤醒技术。一次唤醒,多轮交互的使用体验,或将是音箱走向「真智能」的第一步。可以明确的是,语音助手和人类自如对话的日子指日可待了。

在上一轮的比拼中,一些专注 2B 语音技术的创业公司虽然生存了下来,有些玩家还成为了巨头的合作伙伴,但唐沐放言,当智能音箱 2.0 时代来临,这些 B 端公司可能会遭遇前所未有的生存挑战。因为 C 端的大玩家都会为「真智能」提高核心壁垒,很可能不再需要解决方案商作为合作伙伴了。

届时,巨头会把 ASR(Automatic Speech Recognition,自动语音识别)、NLP(Natural Language Processing,自然语言处理)、TTS(Text To Speech,从文本到语音)等技术变为自研的基础能力。

更重要的一点是,经过第一轮竞赛的角逐,巨头掌握了海量的数据,更多的数据意味着更精准的算法。不难推断,智能音箱的 2.0 时代将会是寡头之间的全方位竞争。

当然,未来 2B 企业肯定会有其他的机会和生存空间。「可能会向其它产品方向转型,但是面向消费者的服务,巨头一定会形成自我闭环」,唐沐表示。

ChinaIT.com 网站文章仅限于提供更多信息,不代表本网站立场观点。如需转载,请注明来源 。转载之文章来源于互联网,如有版权问题,请与我们联系。

下载 ChinaIT.com APP,随时掌握最新IT资讯