基于语音识别、语音合成、自然语言理解等技术,实现“能听、会说、懂你”式的智能人机交互体验,适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景

智能语音交互

成为知脉会员,最高帮您节省30%,助您轻松上云!

产品优势


定制识别及发音
语音识别可提供所需场景的音频及标注文件,定制专属识别模型,进一步提升识别准确率。 语音合成支持定制各种类型的男/女/童声,或学习说话人声音,可用于客服、阅读、虚拟人等场景

易接入
管控台可视化进行项目、场景、功能配置及自学习
并提供API和多种SDK,接入成本极低

识别准
数年持续提升准确率,与淘宝、菜鸟、高德使用一套服务

处理快
低时延、秒级处理返回语音识别或合成结果


产品功能

语音识别


自研的SAN-M模型

多语种支持

多产品形态

摒弃传统模型模块多系统复杂的缺点,在客服、直播、会议、输入法、教育、交互识别等场景下,准确率较传统模型提升10%-30%




支持粤语、四川话等20余种方言的识别,支持英语、日语等10余种语种识别 


支持录音文件识别、实时语音识别、一句话识别,可供用户自行上传数据,对阿里的语音技术进行深度定制,从而提升特定业务领域的识别准确度



语音合成  


Knowledge-Aware Neural TTS

支持多语种方言及中英混合播报

支持字级别时间戳

可快速进行动态参数调整

语音合成技术将文本转化为语音,将神经网络与领域知识双重结合,兼具读音准确,韵律自然,声音还原度高,表现力强的特点




目前支持日语及多种东南亚语种,粤语、河南、东北等方言,多个声音模型支持中英混合播报


可用于视频配音中的音频与字幕时间对齐,虚拟形象口型对齐等


支持动态调整发音人、语速、音量、语调、采样率、多种音频编码格式等;支持SSML标签语言;支持流式合成,边合成边播放


【最新活动】

知脉基于AWS、阿里云、华为云、腾讯云、百度云
国内顶尖厂商为客户的各种应用场景提供最匹配的产品和方案
即刻开始

扫一扫与商务联系 
或者
186-1993-0511(赵经理)

  • 专业的售前技术支持,协助您选择最合适配置方案
    帮助企业高效实现异构数据源之间的数据同步,以及数据仓库、数据湖构建。 支持常见各类源端、目的端,可视化拖拽式,门槛低,并且提供不需要写代码的数据清洗、处理组件。
    可视化拖拽式批量开发Studio, 支持Spark、MR引擎。
    可视化拖拽实时流开发Studio, 支持SparkStreaming引擎、Flink 引擎(敬请期待)。
    批&流开发
    数据集成
  • 专业的售前技术支持,协助您选择最合适配置方案
    各类数据源、数仓、数据湖系统的管理,企业全域数据的元数据统一管理。
    主题、库、表等数据资产目录管理;库、表、列级数据权限管理;数据质量分析、数据血缘等(暂未上线)。
    数据的治理
    数据的统一管理
  • 专业的售前技术支持,协助您选择最合适配置方案
    基于统一元数据管理,SQL即席查询分析各类数据源系统。
    直连DB查询。
    基于统一元数据管理,SQL实现跨源数据的融合分析。
    跨源融合分析
    即席查询
  • 专业的售前技术支持,协助您选择最合适配置方案
    通过数据集成、数据开发处理,建设企业级数据仓库。
    一站式完成数据的集成、开发、分析,将分析挖掘结果写入目标数据源,接入百度智能云sugar 实现BI数据应用。
    数据开发应用
    数据仓库建设

应用场景

您可能感兴趣的产品

知脉基于AWS、阿里云、华为云、腾讯云、百度云等国内顶尖厂商,为客户的各种应用场景,提供最匹配的产品和方案
高性能FPGA加速实例
可弹性伸缩的高性能计算服务
易用、安全、高效的云上桌面服务
提供高效的稳定服务

成为知脉会员,最高帮您节省30%,助您轻松上云

/resources/upload/a18e3a3febaa5b1/1630567097367/style.css /resources/upload/a18e3a3febaa5b1/1630566937973/jquery.min.js /resources/upload/a18e3a3febaa5b1/1630567091482/script.js