李根发来自西溪湿地
量子比特报告| 公众号QbitAI
△Rokid创始人兼CEO朱明明
“我们没有被收购。”
Rokid创始人兼CEO朱明明开门见山地解释道。
云栖大会议程公布后,从阿里巴巴走出来的Rokid再次与阿里巴巴联系在一起。 有文章斩钉截铁地表示,牵头收购的人是阿里巴巴集团董事局副主席蔡崇信——他此前牵头收购了朱明明,第一笔收购猛犸科技。
该消息不实,但一切也并非空穴来风,因为Rokid确实已经正式携手阿里巴巴。
今天,Rokid与阿里云联合推出“全栈语音开放平台”。
这一被称为“All in One”的一站式语音解决方案(Turn Key Solution)由Rokid技术主导,并获得阿里云认可。 它以开源且免费的方式联合发布。 这就是近三年来Rokid与阿里云之间的“端云”解决方案。 协作工作模式,现在他们希望快速向所有工程师、开发人员和合作伙伴开放。
这也是阿里巴巴参与的第一个以语音交互为核心的开放平台。 对于这场语音“Android”竞赛,阿里巴巴继百度DuerOS之后正式入局。
有什么?
除了隐形代码和云计算之外,这个全栈语音开放平台是这样的:
硬件方面包括:蓝牙、GPU、CPU、麦克风阵列、信号处理等,所有的开发需求都包含在内。 最后还留有3.5毫米音频输出接口和Micro HDMI显示输出,可以直接连接电视和显示器。 Type-C供电调试也可用于外接充电。
软件方面,内置了两个搭载Linux和Android操作系统的开发套件。 语音服务可以是Rokid或阿里云。 双方还开放了语音交互和语音技能相结合的技术。
可以做什么? 两个方面。
一方面,直接用于创建语音交互设备。 可以自己打造一个智能音箱,也可以利用开发套件让电视、冰箱、机顶盒、后视镜、玩具等生活工作设备“能听、能说、能懂”,例如,一些工程师使用此套件让他们的 Hi-Fi 扬声器变得智能。
另一方面,我们正在基于此开发语音技能,成为这个生态系统的开发者。 比如,有人做了“猜歌互动”游戏,有人做了机器来充当狼人杀评委,甚至还有无聊的开发者。 基于此,我做了一个“只是放屁”的无聊应用。
总而言之,这是一个号称“All in One”的一站式语音解决方案(Turn Key Solution),其目的再明确不过了:吸引更多极客、工程师和开发者打造智能语音开发平台。 “智能”产业准入门槛将大幅降低。
如此开放
但这并不全是好事。 毫无疑问,这也是一枚深水炸弹,在可预见的范围内,两大类公司都会受到影响。
第一类公司,如科大讯飞、思锐等,拥有自己完整的语音交互解决方案,并利用其进行B2B合作,围绕服务实现收入。 利润市场遭到轰炸,空间被缩小。
第二类公司集团范围更广,是语音交互领域的连锁公司。 他们此前围绕语音交互的某个方面进行研发,并成为具体技术方案的供应商。 现在他们也会面临压力,至少营收市场会受到轰炸。
“轰炸”的杀伤力关键在于开源的诚意和力度。
Rokid创始人朱明明对此充满信心。 他说,这是一种“真正的开放”和“对真实事物的开放”。
“真正的开放”,从端到云,全栈开发链的开放,涉及70%的操作系统和框架代码,以及所有EE和ME设计。 这也是Rokid成立三年来日夜打磨的核心,而且每一个环节都可以拆分独立使用,可以进行更独立的开发。
“开放真物”包含的内容较多,主要涉及三大方向:
第一个是一整套软硬件一体化的语音交互操作系统,其中语音和语义应用的难点——算法模型、前端降噪、5米以上远场交互、自定义唤醒词、声纹识别等……都一一涵盖了。 开放性,其中“声纹识别”、“定制唤醒词”等技术是目前语音交互的难点。 研发的成本和难度远远超出了金钱的简单投入。
二是内容和服务,包括音乐、有声读物、天气等语音内容,直接开放,没有版权问题。 需要购买版权的,可以享受Rokid达成的合作价格和方案。
三是智能家居接入。 经过三年打磨兼容协议和解决方案,智能家居接入对于包括小米米家、阿里物联、生活智能、博联、飞利浦等品牌来说都不是问题。 这也意味着开发人员可以实现更多技能。
当然,上述能力的开放也意味着Rokid正在“自断双臂”——拥有设计能力或硬件资源的企业可以快速生产出智能音箱产品或智能产品,分一杯羹市场蛋糕。
对此,朱明明有着明确的看法。 他表示,Rokid的野心并不局限于特定领域的产品。 只是因为AI的实现需要软硬件的端到端打磨,所以才会先在音箱品类试水。 他们也不会局限于语音交互的方向,“Rokid是一家AI公司,我们要做的事情比我们现在展示的要大得多。”
Rokid创始人还透露,一款视觉产品将在明年的CES上亮相,目前已经进入最后的打磨和迭代阶段。 朱明明相信,这将是“Rokid改变世界”的极好证明。
抱大腿?
事实上,这并不是量子位第一次听说Rokid的大梦想语音唤醒软件哪个好,甚至还有一些小八卦。
比如,三年前Rokid创立时,就有一个关于投资的故事。
当时,Rokid的两位合伙人都拥有令人印象深刻的履历和财务自由。 他们就是那种为了梦想而奋斗的人。 CEO朱明明,前阿里巴巴M工作室负责人,被誉为“米萨”,获得博士学位。 在加利福尼亚州伯克利。 在创办了被阿里巴巴旗下蔡崇信收购的猛犸科技后,他也将因缘实现财务自由。
CFO王顺德先是在阿里巴巴负责财务,后前往金山担任CFO。 艾瑞克又名艾瑞克,也实现了财务自由,随后与朱明明一起做起了大亨生意。
因此,首先投资于人是很自然的。
总部位于北京的一家知名VC机构的管理合伙人为此曾两次前往杭州,但最终他再三考虑后决定不投资。
三年后,中国智能音箱市场将迎来“百箱大战”。 Qubit听到的答案是:Rokid的梦想太大了,它要做的事情也太大了。 这可能不是一家初创公司能够坚持下去的——除非它是一件大事。
但这次与阿里云合作推出开放平台并不是什么大事。
量子位得到的消息是,他们之所以与阿里云联手,是因为双方都很熟悉,而且双方从第一天就开始了端云合作。 第二个原因是阿里云也希望借此输出自己的云计算能力。 培育生态。
不过语音唤醒软件哪个好,既然阿里云与Rokid联合推出了开放平台,我们也可以一窥阿里巴巴内部对于“天猫精灵”的思考。 短期来看,不会走开源技术之路,而是会是阿里巴巴更擅长的“赋能”,比如同样在云栖大会上,阿里巴巴AI实验室负责人千雪最关注的就是商家对接AliGenie开放平台和新进入的行业。
一位接近阿里巴巴的人士告诉量子位,如果“天猫精灵”有一个内部KPI,那也将是一个量化评估。 判断这个项目好坏的核心标准是出货量。
对于Rokid这样一家以2C产品自居的公司来说,之所以选择在此时开放,不仅是因为其技术方案已经成熟,还有一个重要原因是其内部对于AI领域产品的理解时代。
在云栖现场,朱明明表示:AI时代的产品无法像移动互联网那样通过手机等单一产品形态赢得整个战场。 因此,我们要重点把产品软件、硬件、端到端的用户体验打磨到最好; 也应该是开放的,让有想法的开发者可以用你打磨出来的技术,创造出更多品类的智能产品。
当然,没有公布的是技术基础平台的野心。 一旦占据最大的发展市场份额,未来将是语音交互时代的Android。
但这并不容易,前面的路将是漫长而艰难的。 只有用户和时间才能给出答案。
我们不妨拭目以待。
- 超过-
加入社区
Qubit AI社区第9组已开始招募。 欢迎对AI感兴趣的同学加小助手微信qbitbot3加群;
此外,量子比特专业细分组(自动驾驶、CV、NLP、机器学习等)正在招募,针对从事相关领域的工程师和研究人员。
进群请添加助手微信号qbitbot3,并务必记下对应群的关键词~审核通过后我们将邀请您入群。 (专业团体审核更严格,敬请谅解)
诚意招聘
Qubit正在招聘编辑/记者到北京中关村工作。 我们期待有才华、有热情的学子加入我们! 相关详情请在量子比特公众号(QbitAI)对话界面回复“招聘”。
量子比特QbitAI
̾'ᴗ' ̫ 追踪AI技术和产品新进展