주요 콘텐츠로 건너뛰기

데이터 수집

다국어 음성 코퍼스 구축

DataForce는 ASR 엔진의 미세조정을 위한 고품질 데이터를 통해 글로벌 오디오 하드웨어 분야의 선두주자를 지원하고 있습니다.

당면 과제

자동 음성 인식(ASR) 시스템은 사용자 명령어를 텍스트로 변환할 수 있으며, 이 텍스트는 그 후 자연어 처리 시스템을 통해 처리됩니다. 효과적인 ASR 구현을 하려면 성별, 연령 집단, 억양, 방언에 따른 사운드와 음성 변화, ASR 시스템이 사용될 환경과 관련된 배경 소음 등 여러 가지 측면을 고려해야 합니다. 이 사례의 경우, 고객은 여러 인구통계학적 집단으로부터 영어, 힌디어, 독일어, 프랑스어, 이탈리아어로 훈련 데이터와 테스트 데이터를 수집할 필요가 있었습니다.

• • • •솔루션• • • •

DataForce는 당사의 독점 모바일 앱인 DataForce Contribute를 사용하여 여러 가지 시나리오에서 음성 데이터와 배경 소음을 수집했습니다. 당사의 앱은 오디오 파일이 신호 대 잡음비, 샘플링 레이트 등 모든 기술적 요건을 반드시 준수하도록 했습니다. 주차, 주행, 창문 열림/닫힘 조건에서 음성 명령과 주변 소음을 수집한 후, 음파를 컨볼루션하여 실제 환경을 시뮬레이션하는 데이터세트를 생성했습니다. DataForce의 솔루션을 통해, 고객은 다양한 시나리오에서 여러 가지 언어의 음성 명령을 이해할 수 있는 효율적인 ASR 엔진을 개발 및 테스트했습니다.

오디오 웨이브

DataForce는 전 세계적으로 1,000,000명 이상의 회원과 250개 이상의 언어를 지원하는 언어 전문가로 구성된 글로벌 커뮤니티를 보유하고 있습니다. DataForce는 자체 플랫폼이지만 고객 혹은 타사 도구도 활용할 수 있습니다. 이런 방식으로 고객 데이터를 빈틈없이 관리합니다.

상담을 요청하세요.