数据采集
多语种录音
TransPerfect创博支持客户进行大规模、多语种的语音数据采集,助力简化应用程序本地化流程。
问题
人们对语音控制智能产品解决方案需求日益增长。 为满足最终用户的期望,语音识别需要做到准确无误,不受背景噪音以及语言和语音参数的干扰。
为了防止可能出现的偏差,需要收集大量目标语言母语人士的音频样本,这些样本应覆盖多样化的群体和环境。 我们的客户是远场言语和语音识别市场的行业领导者,缺乏执行此类复杂数据采集工作的必要内部资源。 因此,他们请求TransPerfect创博在韩国和中国市场提供支持。
• • • •解决方案• • • •
为了扩展机器学习解决方案在普通话和韩语领域的覆盖范围,TransPerfect创博为每种语言招募了超过500名来自不同目标群体的参与者。 这些参与者需要使用手机上的TransPerfect创博应用程序完成十次会话录音。 会话在不同的地点和一天中的不同时间段进行,以便捕捉多样化的背景噪音和语音参数。
TransPerfect创博在短短不到八周的时间内完成了该项目的交付。 参与者提供的录音中的音频数据集将有助于优化客户的音频/语音识别解决方案。
创博数据汇聚了全球逾 1,000,000 名成员,以及超过 250 种语言的语言专家。 创博数据既依托于自身构建的平台,也能够使用客户或第三方的工具。 这样一来,您的数据尽在掌控。