按理说,国内智能音箱这个市场,不应该在最近这段时间成为一个话题,因为概念没有太多新鲜的,产品也实在乏善可陈,所谓与智能家居的“连接”,似乎又遥不可及。
当近一段时间,多家国内品牌不约而同推出智能音箱新品,似乎,智能家庭“入口”的温度又在回升中。
尤其是我们看到昨天在谷歌I/O大会上,发布的新版GoogleHome后,对于智能音箱这个话题,应该广泛地讨论一下了。
“别人家”的智能音箱在做什么?
谷歌I/O大会上,引起我们关注的,主要是GoogleHome 和GoogleAssistant,这两样产品,我们可以直接对标亚马逊的ECHO和Alexa,都是定位语音交互智能家居设备和背后的智能语音交互系统。
相信在看过昨天谷歌的产品发布后,ECHO团队成员也会一头黑线,因为谷歌对于ECHO的紧追不舍确实令人胆寒。
新版本的GoogleHome,外观没有变化,但是通过深度学习等技术升级后,现在只需要两只麦克风,就能实现准确定位周围说话的人。最重要的是,GoogleHome已经实现在同一台设备上支持6名用户,并且它能够听出每个人的声音,并且为每个人提供个性化的服务。
现场演示中,谷歌副总裁RishiChandra说出“给我妈打电话”后,GoogleHome准确判断出是谁在发出命令,并且准确找出了这个人的妈又是谁,然后拨出电话。这个功能的意义在于,当男女主人在家都说出“给我妈打个电话”,GoogleHome不会无法执行命令,也不会把妈闹混了。
除了拨电话,GoogleHome还升级了三项功能,分别是自动提醒(生活助理)、音乐/视频播放以及图像反馈。其中第三项功能也是重大突破,虽然没有视频能力,但是GoogleHome接受到你提出的图像需求时,它可以选择你的手机或者其他视频设备来“播放”给你反馈。例如你需要去某个餐厅,GoogleHome就会在你的手机上显示出相应的路线图来。
在谷歌发力GoogleHome的新功能时,GoogleAssistant,这个日益强大的智能语音助手,也变得愈发“可怕”。
它不仅已经在1亿台设备上安装使用,而且随着语音、语意技术的发展,这个语音助手已经可以完成看图说话的新功能(不仅仅是翻译),而且你如果用手机拍摄了一架飞机,它会提示是否帮你预定这家公司的航班;或是拍摄了一家影院,它会帮你在线订票。即便如此,GoogleAssistant依然加入了文字输入功能,让文字交流重新融入智能交互中。
同样,这样一个智能系统,也开始玩起了生态(但是不化反!)。GoogleAssistant已经联合了70多家智能家居厂商共同合作,你能想到的生活用品都可能涉及其中,包括洗衣机、冰箱、婴儿车、洗碗机等等。
或许,两周前亚马逊在发布新款EchoShow时,没有想到谷歌在智能音箱技术领域会如此步步紧逼。
EchoShow的亮点是具备了“眼睛”:摄像头;以及“嘴巴”:麦克风,以及触屏式显示屏。但EchoShow无疑也是在投石问路,通过语音与电脑交互以及屏幕化对智能家居市场进行试探。这两家创新企业,每一步迈出都令业界侧目,而且潜力无穷的创新DNA让人折服。
能不能先别把市场做烂? ??
回到本土市场,当GoogleHome和亚马逊ECHO因为各种原因只能徘徊门外的时候,多数智能音箱厂家推出了什么?
目前在市场中,多数智能音箱产品的背后,都隐现互联网和IT巨头身影。其中,包括叮咚智能音箱系列(京东和科大讯飞合作),漫步者系列智能云音箱(与阿里智能合作),Sonos家庭智能音箱(与腾讯电商合作),另外,本周联想也刚刚发布了智能音箱时尚版新品。另外一个阵营,则是以JBL、飞利浦和天龙等传统音响品牌为主推出的智能音箱系列。
对于这些系列智能音箱产品,再多的评价和描述都是多余的,因为“失望”两字足够概括。
或许有人会不认可这样的判断,但是我们冷静思考一下,除了内容资源、销售渠道等“商业模式”的创新外,我们的智能音箱厂家为智慧家居行业的发展还提供了什么?恐怕只有跟风和尾随。
借用前不久,前任锤子科技CTO钱晨对媒体说的一句话,“百家争鸣的背后,智能音箱这个概念会被做臭。”
钱晨不是第一个揭破皇帝新衣的,而且他是敢于直面行业陋习,大声说出真话的圈内大牛。钱晨指出,智能音箱做前端声音处理层面,国内没有高水平的。在前端声音处理技术领域,分为麦克风阵列(多个麦克风)以及两麦这两种技术流派,前者是亚马逊ECHO所创,后者是GoogleHome研发。
钱晨表示,“不管厂商怎么讲故事,都逃不出这两个。”而在设备端,噪声抵消是首要难题,国内部分品牌如科胜讯、云知声、思必驰,科大讯飞等,所提供的技术解决方案主要是集中噪声抵消和后面的云端处理。但是钱晨强调,目前语音设备技术可以分为三个阶段:噪声抵消、语音识别,和语义识别。
“但在语义识别这块,与国外差距很大。” 如果说,云知声、思必驰,科大讯飞等企业未来在语义识别领域还有逐步追赶微软、亚马逊的可能,那么目前最大的隐患就是:设备端都还没有做好。
钱晨指出,“如果降噪这一块没有处理好,科大讯飞算法再好也不行,识别率就会下降,语义识别就更别谈了。”
他在访谈中所提出的这些问题,业界并非没有共识,但是一窝风上马的新品,虽然“百家争鸣”但也暴露出技术和创新方面的短视。市场,真的能靠这些产品走向成熟?
浮躁,不仅仅体现在智能音箱厂家的心态方面,声智科技创始人陈孝良曾撰文表示,如果不把智能音箱产品作为战略产品来投入研发,估计做出的产品难免差强人意。虽然国内很多厂商都自认为投入巨大,但是相比亚马逊ECHO来说,这就有点小巫见大巫了。
“事实上,公司之间竞争,不在于投入20%实现的80%,而在于投入80%才换来的20%。大多时候,往往就是这20%决定了公司竞争的成败。”
或许,这已经不是国家有关部门成立专门的实验室,对这些智能音箱进行相关认证能够解决的。这里面的差距,真的不仅仅语音识别错误率的提升,也不仅仅是把麦克风从七八个改为两个或者一个,而是对一个新型的市场,浮躁的心态。
智能音箱行业会不会被做烂,钱晨的这一句忠言逆耳不一定全对,但却令人清醒