전사
자동 음성 인식 소프트웨어용 다국어 오디오 어노테이션
당면 과제
글로벌 인터넷 기술 기업인 이 고객사는 대규모 프로젝트에 도움을 줄 수 있는 파트너를 찾고 있었습니다. 이 고객사는 자동 음성 인식(ASR) 소프트웨어에 20개 언어로 10,000시간 분량의 오디오를 어노테이션 해야 했습니다. 프로젝트 전체를 완료하기에 타임라인이 충분하지 않았지만 DataForce팀은 효율적인 시간 운용으로 매주 최소 2,000시간의 오디오 어노테이션을 실행하였습니다. 또한 이 프로젝트는 고객의 플랫폼을 사용하여 원격 환경에서 수행해야 하는, 강력한 커뮤니티 소싱 네트워크와 포괄적인 팀 관리 역량이 요구되는 업무였습니다.
• • • •솔루션• • • •
DataForce는 1.3백만 명 이상의 기여자로 구성된 글로벌 커뮤니티 데이터베이스를 활용하여 신속하게 팀을 편성하여 교육하였습니다. DataForce 소싱팀은 프로젝트 개시 직후부터 매주 1,000~2,000명의 지원자 중에서 선별하여 매일 100명 이상의 기여자를 팀에 합류시켰습니다. 그리고는 참가자 전원에게 자격을 부여하고 교육을 시켜 각 언어별 팀으로 배정하여, 언어별로 600~2,000명의 어노테이터를 준비시켰습니다. 30여 명의 프로젝트 관리자로 구성된 전담팀이 주어진 시간 내에 프로젝트를 완수하였습니다.
DataForce는 고객과 긴밀히 협력하고 업계에 대한 깊은 지식과 커뮤니티 자원을 활용하여 1년 동안 20개 언어에 주석을 달고 전사했습니다. 이는 10개 언어 오디오 1,000시간 분량, 4개 언어 오디오 10,000시간 분량, 그리고 6개 언어 오디오 100시간 분량이었습니다. 이 프로젝트를 완료하여 고객의 ASR 소프트웨어를 훈련하는 데 필요한 고품질의 녹취전사 훈련 데이터를 제공했습니다.
DataForce는 전 세계적으로 1,000,000명 이상의 회원과 250개 이상의 언어를 지원하는 언어 전문가로 구성된 글로벌 커뮤니티를 보유하고 있습니다. DataForce는 자체 플랫폼이지만 고객 혹은 타사 도구도 활용할 수 있습니다. 이런 방식으로 고객 데이터를 빈틈없이 관리합니다.