小冰人工智能-红米note智能人工语音
丰富的色彩来自沃飞寺
公众号QbitAI|举报的量子比特
我们先听一首歌:
你能看出这其实是小冰和真人唱的吗?
蓝色是小冰,白色是真人小冰人工智能,是不是很难区分?
这背后是小冰今天发布的全新超自然语音技术。
这项技术首次将人工智能语音的自然性提高到与真实人声几乎无法区分的程度。
它也是世界上同类技术中的第一项全球技术。
也就是说,除了上述唱歌之外,与人交谈、交谈等场景都可以有高度的拟人化互动。
让我们再看两个演示。
下面是一段独白的音频。
其中只有一个来自人类,其余的都是小冰说的。你能分辨出真人说的是哪一个吗?
接下来,你会听到两个女孩在直播间里叽叽喳喳,而这一次,她们都不是人类。
这也是小冰网站上的一个实验,对话已经持续了88天,并将永远持续下去,永不停止。
小冰表示,该实验将在不久的将来逐步扩展到第三方直播平台。
目前,小冰团队的每位成员都已经拥有了人工智能替身,官方演示视频的主持人也是替身。
而且,框架中小冰上百个不同的AI原型主体,都完成了这种超自然语音技术的升级。
小冰框架
关于这种难以区分真假的超自然语音技术的细节尚未透露。
但最新的第八代小冰已经可以量产各种AI角色:去企鹅电竞当直播间助理,或者卖化妆品当推销员,甚至做公众号编辑......唱歌、跳舞、写文章,一手可娇。
小冰框架背后制作这些角色小冰人工智能,主要技术包括:
用于远程语音交互的全双工语音交互感应
一个
同情模型,提高小冰对对话内容、领域和节奏的控制
结合全双工语音交互、实时视觉和核心对话引擎的多模态交互感知
让小冰像真人一样唱歌,第四版AI歌曲DNN模型等
与同行相比,小冰框架最大的区别在于它是一个“面向会话”的人工智能框架,框架技术的各个部分共同服务于“全程交互”的目标,而不是关注和优化部分。
例如,在核心对话引擎中,开发和迭代技术是为了更有效地预测、维护和指导对话,而不仅仅是实现响应。
在语音方面,该框架侧重于语音交互的质量和体验,以支持长期混合通信,而不仅仅是将文本内容转换为语音。
完成A轮融资
同时,小冰今天也宣布:已完成估值10亿美元的A轮融资。
本轮融资由高瓴领投,其次是婺源、诺依曼、IDG、纪源源资本,以及上一轮投资方北极光和网易。
微软小冰于2014年推出,是全球最完整的交互AI框架之一,涵盖自然语言处理、计算机语音、计算机视觉和AI内容生成。
为了加速增长,小冰团队于 2020 年 7 月独立于微软。
并于去年11月完成Pre-A轮数亿元融资。
再加上这次A轮的完成,也就是说,短短一年时间,小冰的估值就达到了超级独角兽的规模。
最后,小冰说,更多的创新,九月年度新闻发布会上见。
那么,你对第九代小冰还有什么期待呢?
—
完—
本文为网易新闻•网易特色内容激励计划签名账号【Qubit】原创内容,未经账号授权,禁止任意转载。
英伟达 NLP 公开课 |免费注册
7.14 晚上 8 点,NVIDIA 专家将通过理论讲解和代码演示,分享如何使用 NeMo 快速实现 NLP 中的信息提取任务。快来扫码注册~
点击这里关注我,记得加星~
一键三次“分享”,“喜欢”和“观看”