콘텐츠 모더레이션, 데이터 수집, 동영상 어노테이션
책임 있는 AI로 게임의 안전성 강화: 혐오 표현 탐지를 위한 오디오 수집 및 어노테이션
당면 과제
글로벌 테크 기업인 이 고객사는 게임 분야의 대화 표현 데이터를 대량 수집하는 프로젝트를 지원해 줄 파트너를 찾고 있었습니다. 혐오 표현, 온라인상의 괴롭힘, 기타 언어 폭력이 특히 어린이들이 사용하는 게시판을 중심으로 증가하면서, 혐오 표현에 대한 우려가 높아지고 있습니다. 목표는 100명의 게임 마니아를 소싱하여 최소 100시간 분량의 수위 높은 혐오 표현을 수집하는 것이었습니다.
• • • •솔루션• • • •
이 솔루션의 목표는 참여자 100여 명에게 경쟁이 치열한 다양한 멀티플레이어 게임 및 일대일 게임을 하게 한 다음 모더레이션된 데이터 수집을 실시하는 것이었습니다. 참가자 2~6인을 한 조로 하여 경쟁형 슈팅 게임이나 격투 게임과 같이 양방향성이 강하고 혐오 표현 발생 빈도가 높은 게임을 하게 한 다음 결과를 기록했습니다. 다양한 연령대, 성별, 교육 수준, 지역의 게임 마니아들을 모집하여 데이터의 완전성과 다양성을 확보했습니다.
참가자들과 긴밀히 협력하여 라이브 게임에서 100시간 분량의 혐오 표현을 수집할 수 있었습니다. 고객은 데이터 품질과 신빙성에 대해 대단히 만족스러워했습니다. DataForce는 다음 단계로 고객 가이드라인에 따라 70시간의 말 소리 내용을 어노테이션하여 훈련 데이터세트를 완성했습니다.
이번 사례 연구는 정확한 데이터 수집이 음성 탐지 기술에 있어 얼마나 중요한지를 입증합니다. 온라인상의 혐오 표현이 만연해지면서 유해한 표현의 뉘앙스를 파악하고 다양한 맥락에서 보다 효율적으로 혐오 표현을 탐지하기 위해서는 다양한 데이터세트를 확보하는 것이 매우 중요합니다.
혁신적인 솔루션을 통한 프로젝트 처리 능력은 DataForce의 자랑입니다. 이번 수집 및 어노테이션 프로젝트의 성공으로 DataForce는 고도로 특화된 참가자를 소싱하고, 전문성을 활용하여 뉘앙스가 포함된 데이터를 수집하고, 고품질 어노테이션을 제공하는 역량을 입증하였습니다. DataForce는 글로벌 파트너로서 이와 같은 프로젝트를 지원할 수 있었던 점에 자부심을 느끼며, 영향력 높고 책임 있는 AI 솔루션 작업에 참여할 기회를 얻게 된 점을 기쁘게 생각합니다.
DataForce는 전 세계적으로 1,000,000명 이상의 회원과 250개 이상의 언어를 지원하는 언어 전문가로 구성된 글로벌 커뮤니티를 보유하고 있습니다. DataForce는 자체 플랫폼이지만 고객 혹은 타사 도구도 활용할 수 있습니다. 이런 방식으로 고객 데이터를 빈틈없이 관리합니다.