智能音箱:谁能抢占下一个流量入口

2017-09-22 08:50作者:张兴旺来源:南方都市报编辑:谢烨挺
从亚马逊发布Echo,到谷歌、苹果布局,再到京东、阿里、腾讯、联想、喜马拉雅、小米、科大讯飞等企业纷纷加入到了智能音箱争夺战,在互联网流量增长遇到瓶颈的情况下,这些企业都试图抢占下一个流量入口的先机。

●京东、阿里、腾讯、联想、小米等巨头布局智能音箱,南山一度有上百个此类项目

●深圳多名从业者分析,智能音箱是下一个流量入口,但是门槛高难度大

从亚马逊发布Echo,到谷歌、苹果布局,再到京东、阿里、腾讯、联想、喜马拉雅、小米、科大讯飞等企业纷纷加入到了智能音箱争夺战,在互联网流量增长遇到瓶颈的情况下,这些企业都试图抢占下一个流量入口的先机。

此前,喜马拉雅副总裁李海波说,“深圳市南山区一公里内有112家智能音箱方案提供商”。而小米发布新产品“小爱同学”智能音箱后,8 0%以上的方案商都转型了。

有专家认为,智能音箱只是交互的一种方式。冰箱屏幕、控制面板的屏幕、电视屏幕都是交互的方式。未来所有的家电都具备类似的功能。

由热趋冷?

深圳智能音箱项目一度有上百个

“几乎每个月要来两次深圳,考察供应链,谈芯片合作以及内容输出。”喜马拉雅副总裁、硬件事业部总经理李海波此前说,“深圳市南山区一公里内有112家智能音箱方案提供商”。不过,现在情况发生了变化,“从小米发布‘小爱同学’之后就是不同局面了,很多人选择了放弃这个赛道”。

此前,也有人说这个数据有水分,112家的数据如何得出?为什么有这个数据?李海波告诉南都记者:“做智能音箱重要的是有内容来播,我们在研发小雅音箱的这两年中,很多方案商找我来谈,他们要接入内容。我长期在见他们,住在南山哪里都不用去,一家家见,最多的时候一天能见4家。但从小米发布后,80%以上的方案商都转型了。”

深圳米糖科技CEO宋少鹏在音频领域有着十多年的经历,2014年创立米糖科技,2016年就把他们的解决方案对接了亚马逊的A lexa语音交互平台。宋少鹏告诉南都记者,任何一个新品类出来时,深圳都会有很多厂商跟进。从3D眼镜、平板电脑到无人机、V R,每一波都会有人做,但有一些真的要做,有一些有不同的商业目的。每个公司的出发点不同,它进入和退出的时间也就不一样。

深圳是智能硬件创业者的集聚地。正如李海波所言,在小米推出“小爱同学”之前,深圳不少创业者在做智能音箱领域的解决方案提供商。值得一提的是,据京东众筹提供给南都记者的数据显示,截至2017年8月初,在该平台上关于“智能硬件”的众筹项目为2178个。关于“智能音箱”的众筹项目的数量为121个,其中来自深圳的“智能音箱”项目为58个,占比超过一半。智能音箱在智能硬件中的占比为5%左右。京东众筹方面称,由于智能硬件覆盖面广,能占5%的比例也很高了。“京东众筹3年有121个智能音箱项目,相当于每年40个项目,几乎1周1个项目。”

但是,深圳华强北却鲜有智能音箱出售。8月初,南都记者在华强北赛格康乐通信市场和赛格通信市场走访了近20家音箱产品店铺,都没有卖智能音箱,有的店铺老板还不知道智能音箱。“现在比较少,没有做现货的。”一家店铺工作人员称。

深圳绿米联创CEO游延筠在智能硬件领域已经做了8年,他在接受南都记者采访时直言不讳地指出,智能音箱的门槛很高,投入很大,如果体验不好,就卖不出去,不是每个公司都可以做。以前他也准备做的,但是,后来在评估时停下来了。“有太多人做了,觉得这个市场有问题了。”

争夺入口

巨头追风布局智能音箱

今年7月,小米发布了A I音箱“小爱同学”,售价299元。在李海波看来,这个价格让深圳的不少方案商望而却步。“原来的方案商大家各种摸索拼斗,一个小音箱的综合成本都在400块钱以上,小米的‘小爱同学’零售价就299块钱,你让他们怎么玩?小米有自己的生态链做回馈和补贴,它是把智能音箱作为连接小米生态链的‘语音遥控器’,这个打法是完全不同的。”李海波说。

截至目前,京东、阿里、腾讯以及小米等知名企业纷纷布局智能音箱。然而,智能音箱这波浪潮又是如何兴起的?实际上,早在2014年11月6日,亚马逊发布了一款搭载智能助手A lexa的智能音箱———A m azonEcho.据研究机构C IR P的统计,截至2016年4月,A m azonEcho的销量已经突破300万台。此后,谷歌、苹果等也进入到智能音箱领域。值得一提的是,数据显示,E cho上市两年销售量超过1000万台。

在国内,京东是进入智能音箱较早的企业之一。2015年,京东和科大讯飞合资成立灵隆科技,推出了叮咚音箱。今年1月份,联想在美国消费电子展CES上发布了智能音箱。6月8日,京东推出了叮咚音箱新品。6月20日,喜马拉雅发布了小雅智能音箱。6月22日,腾讯发布了语音智能平台小微。7月5日,阿里发布天猫精灵X 1.

“智能音箱主要的功能就是语音识别,这个产品具有很强的垄断性。亚马逊为什么做?阿里为什么做?背后一定是和商业对接起来。抢一个用户的入口,就是这么一个目的。”深圳T CL智能家庭科技有限公司总经理邵怀荣告诉南都记者,关键不在硬件上,而在于语音、语义识别后,要和商业对接。

“智能家居是活跃度高的场景,小米的优势是智能家居,喜马拉雅的优势是内容,阿里的优势是商业,这些巨头都认为智能音箱是入口级的产品,所以才这么热衷去做。”绿米联创CEO游延筠说。

“这个市场目前还比较混乱,格局还没有出来。”中国智能家居产业联盟秘书长周军告诉南都记者,目前互联网的现状是PC端和移动端的流量都到瓶颈了,B A T以及其他互联网企业做智能音箱,也是希望通过智能硬件的入口争夺流量,而音箱是一个天然的入口。

“目前我们在手机这一端用户增长越来越困难时,技术的趋势也会在未来‘消灭手机’,喜马拉雅需要在手机之外的场景里再造一个喜马拉雅。”李海波称,喜马拉雅并不是跟风去做一个音箱,这一布局也远远早于目前很多智能音箱品牌,这一开发的思路是想从家庭的各种场景,包括老人的收听、孩子的收听,在浴室等不方便使用手机的场所下,尽可能延长喜马拉雅用户的使用时间,填补碎片时间的价值。

“20年前是视觉时代,出现了索尼、三星以及中国的一些电视企业;十年前是触觉时代,诞生了苹果手机;今天恰恰是声觉时代。声音是最自然、最方便、最轻松、最直接的交流方式。有一天不动手、不动眼,它就能为我服务,是不是最方便的?”三诺集团董事长刘志雄在接受南都记者采访时说,在互联网时代,互联网解决的是工具、链接、商业模式,把人连接起来。未来是物联网的时代,这种互联最需要的是人机交互。而最重要的是语音交互,语音交互的背景在于大数据和内容。

超高门槛

智能音箱项目技术难度大、内容匮乏

“智能音箱最终要有好的用户体验。在技术层面,包括麦克风的技术、喇叭的技术、信号处理的技术等;产品设计层面,包括产品的交互、灯效、灯光、提示音等;在服务层面,怎么按照用户实际的需求来解决用户的问题;在人工智能层面,有语义理解、大数据的知识图谱等等。”宋少鹏说,就像2007年做一个智能手机,面对的是一个系统性的问题,需要软件、硬件和服务,这是一个非常复杂的系统,细枝末节的事情很多。

对此,李海波深有感触。“我们几个团队接近300多人研发了两年,投入几千万元。”李海波坦言,难度太大了,智能音箱根本不是把几个模组拼一下就可以了,在数据和技术以及内容打磨层面都非常考验团队。人工智能主导的产品方向,一定是数据型的企业、技术型企业和“有钱有用户”的企业才能做得好,而不是华强北原来的手机和笔记本山寨模式能做的。

他举例说,小雅音箱仅全频和低音喇叭单元就选了20多种型号一一对比测试。“小雅音箱有一次改了外面包的一层装饰布料的厚度,从0 .2毫米改成1 .2毫米,外观更漂亮了,可是改完之后才发现,语音识别准确响应率从原来的95%下降到只有10%左右了!一层布料的改动对音箱高频和低频都有不同程度的抑制,回声消除之前的数据全部失效,需要把整套算法推翻,重新调整模拟数据才能把识别率提升上去,仅这一个微不足道的改动就耗费了团队40多天。如果小的公司或者对这些技术难题没有那么深理解的公司,根本不知道问题出在哪里了。”李海波介绍,小雅音箱选了220 0多种布料,每个布料打个样,外观设计220多种,好看的不一定能用,要确保声学、识别和布料三者关系的平衡,这是特别难的。

除了用户体验,在深圳绿米联创C E O游延筠看来,智能音箱还需要有丰富的内容。而据南都记者了解,当前智能音箱的内容相当匮乏。“各家音乐的收费非常高,成本把企业都挡在了门外。比方说你接Q Q音乐或者酷狗音乐,小品牌音响是接不起的,动辄一年百万元起的使用费,产品才卖多少钱呢?第二是版权和转售权的限制。为什么其他号称接入喜马拉雅音频的产品,却经常出现听不了喜马拉雅内容的现象?不是我们不愿意给他,而是我们这近亿条音频内容,大多数由于版权的限制,我们并不能转售给其他品牌产品使用。”李海波说,喜马拉雅做开放平台内容insi-de 1 .0的时候,大概也只有几十万条内容能够被拿出去用,这还是在无法打通账户体系的前提下。虽然小爱同学、叮咚音箱、天猫精灵都接入喜马拉雅的内容,但它们接入的也只是开放平台的内容。除了大部分节目听不了之外,没有用户的续播记录,听书听到哪里了,节目上次听到哪一秒,都无法续播,这样在音频端产品上用户体验就很差。

不过,李海波介绍:“在喜马拉雅A PP上怎么使用,在小雅音箱上就能怎么用。你可以把小雅音箱理解为喜马拉雅A PP的实体化存在,你这个节目听了两小时,那个节目听了几秒,只要能搜到,它就有云端的播放记录。我们有账户,有版权,有分发才可以做到这一点,这也是我们的核心竞争力。”他进一步解释,“针对人们可能提出的2 0 0 0多个问题,每个都有6 0到100种不同的问法。人的自然交互是什么样的就要做成什么样的,当你把语音翻译成文本很简单,不管是科大讯飞还是云知声、思必驰大家都做得非常好,基本能达到95%到98%的识别率。

“关键是接下来大家要着力打磨对应云端的语料库搜索内容,也就是N L P这块,语义理解。比如用户问吴晓波,作为智能A I音箱,它非常大的可能先去百度词条里搜谁是吴晓波,但是其实我的行为是想听吴晓波的音频节目。这就需要在理解层面和接下来的解析和对应数据的打磨上花大量的功夫,去做一一准确对应。”李海波说。

市场现状

供应链不足,用户认知也不够

据研究机构S tr a te g yA nalytics预测,2017年全球智能音箱销量可突破千万台级别,未来5年内,其产值能达到接近百亿美元的规模。

尽管如此,在国内,智能音箱的发展还处于早期阶段。“从销售的数量以及用户的认知上,智能音箱在中国远远没有到人人都知道以及人们都在很多品类中去选择的阶段。”李海波直言,“小雅音箱首批预售5万台已经到达用户手中,后续订单的生产和发货正在进行”。

“到目前为止在市场中能选择的也就三四种,大家都说在做,其实都没真正做出来。天猫、京东、喜马拉雅做出来了,联想和小米都没做出来,只是发布了样机。”一位业内人士告诉南都记者。

8月初,南都记者在深圳华强北小米之家走访时,当时该专卖店还没有小米A I音箱上市。据界面新闻报道,小米智能产品副总裁、小米探索实验室负责人唐沐称,预计9月底小米A I智能音箱正式发售。

“现在唯一担心的是生产能力不够,现在能做到最大生产量每天4000台左右。供应链预期不足,每天都在产能爬坡,想办法让它爬上去。我们早期对产品受欢迎的程度预判不足,备量有点少。”李海波坦言,国内的智能音箱开发基本都是在应用层面下功夫,相对缺少核心优势,基础的关键芯片和数字麦克风技术主要掌握在国外品牌手中,这就造成关键器件订货周期长,有些更是长达20周。其实很多其他智能产品也是遇到一样的难题,订单不愁,但是不敢接。他还补充道:“国内之前做智能音箱没有太多经验,一般知名大厂都要100万台订单才能生产,都不太相信这个领域在国内能做起来。”

在巨头涌入智能音箱的当下,这一领域是否存在“泡沫”?李海波并不担心,“泡沫是和技术曲线连接起来的,这个技术曲线是上下起伏的,某一段时间当都在进入这个行业时,显得有泡沫,其实这个行业远远没有起来,泡沫根本没有发生”。他认为,现在市场的用户认知和企业认知都还没有达到泛滥的程度,“机会还有的是,市场刚刚开始。当华强北到处都是时,那才是泡沫开始”。

不过,他也透露,单纯做小雅音箱产品、做智能硬件并不是喜马拉雅的目标,作为一家内容型互联网平台,他们最终的目标是通过小雅音箱来把用户的使用时长和场景体验做好。“我们平台有4亿用户,只要把平台的10%的用户做转化,就是巨大的用户量。”李海波指出,“我希望能把小雅的核心内容能力和空调、家居、教育等各个不同行业打通。”

声音

20年前是视觉时代,出现了索尼、三星以及中国的一些电视企业;十年前是触觉时代,诞生了苹果手机;今天是声觉时代。声音是最自然、最方便、最轻松、最直接的交流方式。有一天不动手、不动眼,它就能为我服务,是不是最方便的?

———三诺集团董事长刘志雄

很多人说这是智能家居的主要入口,我倒不这么认为。智能音箱只是交互的一种方式。冰箱屏幕、控制面板屏幕、电视屏幕,可能都是交互的方式。不管走到哪都可以交互,而不是非要走到智能音箱前面说话,未来所有的家电都具备类似的功能。

———深圳TCL智能家庭科技有限公司总经理邵怀荣

这个市场目前还比较混乱,格局还没有出来。目前,互联网的现状是PC端和移动端的流量都到瓶颈了,B A T以及其他互联网企业做智能音箱,也是希望通过智能硬件的入口争夺流量,而音箱是一个天然的入口。

———中国智能家居产业联盟秘书长周军

展望

前景:智能音箱只是交互的一种方式

对智能音箱能否成为智能家居的入口,业内也有不同意见。“很多人说这是智能家居的主要入口,我倒不这么认为。”深圳TCL智能家庭科技有限公司总经理邵怀荣直言,不可能每个家庭都摆个智能音箱。在他看来,智能音箱的应用有点夸大,“小规模应用可以,但现在和中国的商业还对接不起来”。

“它只是交互的一种方式,但是把它说成是智能家庭的一个中心,我是不赞成的。屏幕是交互的方式,手机也是交互的方式,一定是多种交互方式。冰箱屏幕、控制面板的屏幕、电视屏幕都是交互的方式。不管走到哪都可以交互,而不是非要走到智能音箱前面说话,未来所有的家电都具备类似的功能。”邵怀荣说。不要把它仅仅当作一个硬件,说白了它具备软件的功能,只是用音箱这种载体来实现。它这种功能在各种家电产品上都可以实现,只不过现在技术上的时间点还没有到而已,“我不是不看好智能音箱,只是有点夸大其词了。”

“如果放在一个智能互联的领域来看,确实市场不是很大,因为后端的产品互通互联还没有实现。这个路径还很长,至少还要两三年的时间。”李海波坦言。

“未来十年是声觉的时代,任何新事物的出现都有一个接受过程。现在声音的清晰,理解情绪更加重要,也就是语义理解技术空前重要。”三诺集团董事长刘志雄说。智能音箱是声音交互的中心,可以理解为音箱,也可以理解为语音管家,就是连接所有物品的机器人。外观形态不是唯一的,它可以是机器人、可以是花瓶,可以是音箱,也可以是一个装饰品。声音只是它的一个入口,形态上是音箱,但不只限于音箱。

“我估计需要两年。未来的产品不可能靠山寨,要有产品创新,有软硬件能力,有生态。它不是一个简单的工业品,这个产品是有感情的,有趣味的,有灵性的,拼的是生态能力。”刘志雄话锋一转,现在声觉时代已经到来,恰恰是人工智能时代到来了,“大家认可AI是未来的大方向,AI+是人工智能去改造其他物体。今天看到的物品只要没有与AI、大数据有关系的,都没有未来,把它变成你的伴侣、助手和管家,所有的大数据、所有的内容生态都为你服务。

采写:南都记者张兴旺

摄影:南都记者胡可

南都头条 Headline
排行 Top