分类"语音识别"产品

ELEVOC - 大象声科是语音信号处理引擎供应商，依托算法、软件、硬件三个维度的技术纵深，为语音增强和智能语音交互提供先进的解决方案。

大象声科是语音信号处理引擎供应商，依托算法、软件、硬件三个维度的技术纵深，为语音增强和智能语音交互提供先进的解决方案。公司凭借深度学习驱动的语音增强技术奠定了语音前端信号处理，目前公司已经完成了全球第一款芯片级单音轨实时语音提取方案，有效的实现了噪音与人声的分离。该技术已经开始在通讯行业开展广泛应用，开启人类无噪音通讯时代。

FreeNeb - 北京孚睿星辰智能科技有限责任公司是一家专注于语音AI核心技术的人工智能公司。

北京孚睿星辰智能科技有限责任公司，简称FreeNeb，2016年在北京成立，是一家专注于语音AI核心技术的人工智能公司。通过研究和提供先进的语音处理技术，满足客户自然、安全的语音应用需求，FreeNeb面向企业提供全球领先的声纹识别与语音识别解决方案和专业服务。 FreeNeb依托清华语音AI核心技术研究力量，目前在语音识别、声纹识别等语音相关领域上发表论文100多篇，拥有发明专利10多项，具有一批在语音相关算法与机器学习领域中享有盛名的高校专家和来自于BAT等知名互联网企业的产品研发团队，在科研探究和产品研发上具有极强的实力。

语音识别声纹识别

Notta - AI在线将语音转换成文字

Notta是一个基于人工智能的语音转文本转录工具，可以帮助你以98%的准确率将104种语言的任何音频转换为文本。Notta适用于任何现代设备，如PC、智能手机和平板电脑，无论你是想从麦克风转录在线会议、网页音频、音频文件还是现场录音，Notta都可以处理。如果你正在寻找一种可靠且专业的工具来将音频在线转录为文本，试试用Notta来制作会议记录和撰写采访文章吧，让你的工作更轻松。

北科瑞声-智能会务管理平台 - 一追求“智能、高效、安全”的智能会务管理平台

基于北科瑞声智能语音核心能力平台，以“智能、高效、安全”为出发点，满足语音转文字字幕上屏、离线语音转写、音频片段快速检索、说话人分离及说话人定位等需求，实现声音采集->语音识别->内容检索->信息管理及预警等现代化信息管理手段升级。产品功能： 1、语音转写：支持双多人交谈语音识别，支持实时和非实时转写，自动生成会议纪要。 2、数据存储：全流程数据（语音、文本）自动归档，文件查询检索。 3、超高识别准确率：支持普通话及带口音普通话，支持中英文混合识别，识别转写准确率达95%以上。 4、快速转写：200-300字/分钟，非实时转写1小时音频1分钟出稿。 5、深度定制：支持行业领域深度定制:众多行业文本资料数据处理，不同领域关键词个性化定制。 6、信息安全：端到端加密通信，端云融合和私有云内网部署,确保用户信息安全。 7、资质认证：产品获国家安全防范报警系统产品质量监督检验中心（北京）、公安部安全与警用电子产品质量检测中心权威认证。

灵云 - 为产业界提供语音合成、语音识别、麦克风阵列、手写识别等全方位人工智能能力。

<p>灵云平台面向产业全面开放，并以“云 + 端”方式，为产业界提供语音合成（TTS）、语音识别（ASR）、麦克风阵列（SMA）、手写识别（HWR）、光学字符识别（OCR）、人脸识别（AFR）、声纹识别（VPR）、指纹识别（FPR）、自然语言理解（NLU）、数据挖掘（DM）、机器翻译（MT）等全方位人工智能能力。</p><p>灵云平台通过服务百度导航、导航犬、嘀嘀打车、快的打车、汉字英雄、灵云输入法等“家喻户晓”移动应用服务，及服务京东商城、携程等大型互联网平台，使中国13亿社会大众群体充分感受并体验到智能语音等人工智能技术为现代生活所带来的轻松与便捷。</p>

声希科技 - 声希科技于2016年成立,专注于人工智能与教育领域的结合,全面提升教育、传媒、政务效率和体验。

深圳市声希科技有限公司 (SpeechX Ltd.) 于2016年先后成立于香港及深圳。创始人团队主要来自香港中文大学的人机交互实验室，同时具备清华大学、中国科学技术大学、浙江大学等多家知名高校教育背景，拥有国内外多项专利和丰富的业界实践经验。我们专注于人工智能与教育领域的结合，多维度提高语言教育与语言学习的效率和体验。声希科技是一家智能语言学习平台，利用智能语音技术实现辅助语言学习，提供语音评测、语音检错、语音纠错、语音识别、语音转换、声纹识别等服务，用户的老师和家长可通过微信或APP, 跟踪用户学习情况。

搜狗AI - 一体化AI人工智能开放平台

产品功能：AI合成主播、金融虚拟客服、会议同传、字幕制作、搜狗声咖、音色定制行业先进的AI能力特色技术：搜狗分身、搜狗同传、语音变声、多模态识另语音识别：—句话识别、实时语音识别、录音文件识别、电话语音识别、语音唤醒、离线语音识别、离线命令词识别、远场语音识别语音合成：通用语音合成、个性化语音合成语音分析：声纹识别、说话人归档自然语言：文本翻译、语音翻译、拍照翻译、语义对话图像识别：实时手写识别、唇语识别、通用文字识别、手写文字识别

慧言AI开放平台 - 使用行业先进的AI能力，让人机交互简单便捷

慧言科技成立于2018年04月03日，依托于天津大学天津市认知计算与应用重点实验室，是一家致力于细分领域语音产品研发的人工智能公司。主要技术产品有语音识别，语音合成，智能翻译，语音扩展。旗下热门产品有一句话识别、实时语音识别、在线语音合成和声纹识别。同时提供智能语音技术私有化部署方案，为用户提供多种语音服务。慧言AI旨在用一流的语音处理核心技术，提供适应各行各业的应用和解决方案，为用户带来“锦上添花”、“雪中送炭”的定制化体验，提高人们的生活质量，让生活更加美好。

AI文字转语音工具语音识别

希尔贝壳 - 希尔贝壳是一家人工智能数据服务提供商。

北京希尔贝壳科技有限公司成立于2017年，是一家专注人工智能大数据和技术服务的创新公司。针对家居、车载、机器人等语音智能产品做精准场景语音数据并输出方案。利用机器学习平台，在语音数据评测、辅助转写、数据分析、智能语音客服等场景业务建立了领先的核心技术体系。希尔贝壳在语音识别、语音合成、声纹识别领域有着多年的基础技术研究，在行业必须的训练数据集结构分析和建设上有着不断创新的能力。希尔贝壳的愿景：以开放数据、技术变革创新为理念，实现人工智能民主化。

AI训练数据服务语音识别

百度VR-语音识别 - 一站式VR方案解决机构，提供基于VR技术的教育，党建、营销、云展会、实训、产业园等解决方案，助力产业数字化升级。

百度VR作为国内领先的一站式VR方案解决机构，提供基于VR技术的教育，党建、营销、云展会、实训、产业园等解决方案，助力产业数字化升级。目前，百度VR全面布局VR教育、VR营销，为K12、高等院校、职业学校、企事业单位等客户提供VR教室、VR营销等一站式解决方案。

语音识别 VR可视化软件

思必驰 - 思必驰是一家智能语音技术解决方案提供商

思必驰是国内领先的对话式人工智能平台公司，拥有全链路的智能语音语言技术，自主研发了新一代的人机交互平台（DUI），和人工智能芯片（TH1520）；为车联网、IoT、以及众多行业场景合作伙伴提供自然语言交互解决方案。 “思必驰”是国际上极少数拥有自主产权和中英文综合语音技术的公司之一。其语音综合技术包括语音识别、语音合成、自然语言理解、智能交互决策、声纹识别、情绪识别等。 <p></p>

北科瑞声-智能语音HIS系统 - 为医疗行业提供HIS系统语音交互一站式服务。

以语音交互为核心，通过私有云+端结合的服务方式，针对不同科室的医疗专业行业定制化语言模型，提供HIS系统语音交互一站式服务，达到语音交互与医疗信息化的深度融合，在国内首次实现穿戴防护设备和多层口罩场景下特殊语音实时处理，实现全程非接触语音控制，减少医护人员用手操作系统的接触，提升医护人员的工作效率。产品功能： 1、移动互联：移动终端实时控制，可多组会诊同时进行，互不干扰。 2、多态融合：端会诊全程录音录像、实时语音转写，图文视听多态融合。 3、深度定制：支持医疗领域自定义热词（专用词典、科室定制/使用者）定制。 4、溯源有据：会诊记录自动存储至云端，随时调用，溯源有据。

医疗行业语音识别

百度AI开放平台-语音识别 - 提供高度拟人、流畅自然的语音合成服务，支持在线、离线多种调用方式，满足泛阅读、订单播报等场景的语音播报需求。

基于业内领先的深度学习技术，提供高度拟人、流畅自然的语音合成服务，支持在线、离线多种调用方式，满足泛阅读、订单播报、智能硬件等场景的语音播报需求支持中文、英文、中英文混读合成，提供基础音库和精品音库共14种音库供您选择，让您的产品拥有个性化的声音支持多种参数配置，可根据场景需求对发音人的语速、音调、音量进行灵活设置，满足个性化需求提供REST API接口、离线SDK、在线SDK，充分满足不同场景下的语音合成需求，提供流畅自然的合成体验

泛函科技 - 全球领先的AI训练集数据定制服务提供商。

泛函科技一直致力于为全球用户提供高品质的定制化训练集数据，方便用户将成品数据直接应用在模型训练中。覆盖多语种语音合成、语音识别、自然语言理解、机器翻译、图像识别、人脸识别、无人驾驶、专家系统、智能搜索、智能控制、机器人等人机交互技术领域。根据客户特定的场景需求和个性化参数要求，泛函科技可以为客户提供包括数据规划、数据采集、数据预处理、数据转写标注、测试评估等一系列服务在内的“一站式数据服务”，帮助客户在人工智能领域抢先取得技术进步，赢得市场先机！

AI训练数据服务语音识别图像识别

华宇语音识别云平台 - 华宇语音识别引擎提供将实时音频流或者录音文件转成文字的服务。

华宇语音识别引擎提供将实时音频流或者录音文件转成文字的服务，能够支持中文、21 种方言、7 种少数民族语言，普通话识别率达到98% 以上，支持噪音环境下和带背景音的语音识别，支持机器自动分离不同人声，支持快速定制识别中的热词以提升准确度。支持信创环境部署。目前已为50 多个业务场景提供了能力支撑，覆盖了全国23 个省、自治区、直辖市近万个法庭/ 讯问/ 会议室、几万个桌面客户端。

智核-语音识别 - 语音识别服务一款面向全行业的产品，提供语音转文字的服务，使用行业专用垂直引擎，实现任意场景下的所言即所得

该产品价值特点如下：丰富的自学习模式，系统提供不同种类的自学习模式，包括专有名词（人名、地名、公司名等）特定的文本（文书、卷宗、发言稿等）以及实操短句（实操修改后发生纠正的词语），以提高识别效果。行业专用引擎，针对不同的行业场景进行数据训练,使得业务数据与底层能力深度融合，已解决不同场景下的识别效果差异。完备的解决方案，能提供针对不同场景下的完整的语音识别（前端拾音-处理-后端输出）解决方案。标准化、规范化，严格按国家及相关地区的建设标准规范而建设，提供标准的接口规范，实现第三方系统快速对接。多样的辅助记录形式，根据不同的业务场景需求，提供不同的辅助记录形式，包括全文记录，摘要记录以及模板记录等模式。友好的系统交互感，基于Word/WPS研发前端应用，不改变用户日常记录惯，可复用Word/WPS全部功能，加入语音辅助记录。

捷通华声 - 专注于智能语音、智能语义、智能视觉、大数据分析等全方位人工智能技术研究与应用

在AI技术研发方面，捷通华声拥有语音识别、语音合成、语义理解、机器翻译、大数据分析、声纹识别、人脸识别、指纹识别、手写识别、键盘输入、麦克风阵列、OCR、视频分析等十余项自主研发的AI技术，并在灵云开放平台（AIcloud.com）上面向产业全面开放。 2013年，捷通华声与清华大学达成“灵云科技源自清华”战略合作，并共同创立“清华灵云人工智能研究中心”、“清华海峡研究院人工智能研究中心”，中国人工智能科学研究奠基人、清华大学人工智能研究院院长张钹院士出任研究中心首席科学家。通过与清华大学的产学研合作，灵云AI技术学术研究保持着全球领先，语音识别、语义理解、语音合成、机器翻译、OCR等多项技术达到国内顶尖水平。

语音识别自然语义分析NLP平台

京东人工智能开放平台-语音识别 - 通过在传统家电产品中植入京东的模块并连接京东云的方式，使用户能用一款APP控制所有接入的产品。

加大京东智能云平台的建设。京东智能云平台已经接入了100多个品牌的产品，已经涵盖了国家一线的主流品牌。通过在传统家电产品中植入京东的模块并连接京东云的方式，消费者可以用同一款APP控制所有接入的产品，实现不同品牌不同产品之间的互联互通。京东希望在2015年引入更多的品牌及产品，同时，京东的账户体系也将与这些品牌进行分享，力求提供更好的用户体验。

中科信利 - 专注于语音识别和音频信号处理相关技术和产品的研发，产品涵盖互联网、电信平台、广电网教育、音乐检索以及嵌入式终端等多个领域。

北京中科信利技术有限公司于2002年依托中国科学院声学研究所合作成立，是以开发语音技术为核心的高新技术公司。公司专注于语音识别和音频信号处理相关技术和产品的研发，具有国际一流水平的语音识别/处理引擎、语音云系统和语音分析应用产品，产品涵盖互联网、电信平台、广电网教育、音乐检索以及嵌入式终端等多个领域。中科信利目前总人数200余人，技术人员超过80%，其中70%以上具备硕士或博士学位。技术人员中研发骨干超过70%，包括海外归国人员、在外企具备十几年软件开发经历的高级研发人员、以及国内名牌高校及中科院的毕业生等。售前技术人员占10%，工程实施技术人员10%，售后服务人员10%，其他人员约占20%，包括数据处理以及行政、财务、销售和管理等。

分音塔科技 - 简称分音塔科技（BABEL Technology ）由清华大学团队、成功连续创业者成立专注于语音语言人工智能领域

北京分音塔科技有限公司(BABEL TECHNOLOGY)，简称分音塔科技，成立于2016年7月15日，由清华大学团队、成功连续创业者成立，致力于实现不同国家和民族之间跨语言同声传译，提供可穿戴智能设备、人工智能API综合解决方案和虚拟运营服务。基于普遍存在的跨语言沟通障碍和迫切的沟通需求，分音塔科技采用人工智能技术，开发出准儿翻译机等系列可穿戴智能硬件产品和准儿翻译APP，并与中国、美国、日本、韩国、俄罗斯等进的相关人工智能公司建立长期合作关系，构建沟通翻译平台。

语音识别智能硬件