데이터 수집
다국어 음성 녹음
TransPerfect는 앱 현지화 과정을 간소화하기 위한 대규모의 다국어 음성 데이터 수집을 활용하여 고객사를 지원합니다.
당면 과제
음성 제어 기능을 갖춘 스마트 제품 솔루션에 대한 수요가 점점 증가하고 있습니다. 최종 사용자의 기대를 충족하기 위해 잡음이나 언어 및 음성 변수와 상관없는 정확한 음성 인식이 필요합니다.
편향을 방지하기 위해서는 다양한 인구 구성 및 환경적 요소를 아우르는 대상 언어 원어민들의 대규모 음성 수집이 필수입니다. 원거리 대화 및 음성 인식 시장 업계의 선두 주자인 이 고객사는 복잡한 데이터 수집을 실행하는 데 필요한 내부 리소스를 보유하고 있지 않았습니다. 따라서 이를 해결하기 위해 TransPerfect에 한국 및 중국 시장에 대한 지원을 요청하였습니다.
• • • •솔루션• • • •
TransPerfect는 중국어와 한국어의 머신러닝 솔루션 범위를 확대하기 위해 각 언어를 사용하는 다양한 인구 특성 집단으로 구성된 500여 명의 참가자들을 모집했습니다. 참가자들은 휴대폰에서 TransPerfect 앱을 사용하여 10개의 녹음 세션을 완료했습니다. 다양한 잡음과 음성 변수를 파악하기 위해 각 세션은 각기 다른 위치에서 다른 시간대에 수행되었습니다.
TransPerfect는 8주 이내에 프로젝트를 완료했습니다. 고객사는 참가자들의 녹음 자료에서 추출한 음성 데이터세트를 통해 오디오/음성 인식 솔루션을 크게 개선할 수 있었습니다.
DataForce는 전 세계적으로 1,000,000명 이상의 회원과 250개 이상의 언어를 지원하는 언어 전문가로 구성된 글로벌 커뮤니티를 보유하고 있습니다. DataForce는 자체 플랫폼이지만 고객 혹은 타사 도구도 활용할 수 있습니다. 이런 방식으로 고객 데이터를 빈틈없이 관리합니다.