メインコンテンツに移動

書き起こし

自動音声認識(ASR)ソフトウェア開発のための 多言語音声アノテーション

 

課題

世界各国に展開するインターネットテクノロジー企業は、大規模プロジェクトをサポートするパートナーを探していました。このプロジェクトでは、自動音声認識(ASR)ソフトウェア開発のため、20言語で1万時間分の音声データのアノテーション作業が必要でした。 厳しい納期の中ですべての作業が完了するよう、プロジェクトチームは効率的に時間を使い、週あたり最低2千時間分の音声アノテーション作業を進めました。 作業はお客様のプラットフォーム上でリモートにて行う必要がありました。そのため、プロジェクトパートナーには大規模なコミュニティネットワーク及び強力なチームマネジメント能力が求められました。

• • • •ソリューション• • • •

$1$30万人を超える協力者からなる弊社のグローバルコミュニティデータベースを活用して、迅速にチームの編成とトレーニングに着手しました。 プロジェクトの開始と同時に、ソーシングチームが、毎週1千~2千名の応募者の中から、毎日100名以上のペースで協力者の採用を進めました。 採用された協力者はトレーニングを経て、言語ごとにそれぞれ600~2千名からなるアノテーターチームに編成されました。 一方、弊社のチーム30名以上のプロジェクトマネージャーで構成され、すべての作業が所定の期日までに完了するよう、進行管理にあたりました。

お客様と緊密に協力しつつ、高度な業界知識やコミュニティのリソースを生かして、DataForceは20言語のアノテーションと書き起こしを1年で行いました。この間に処理された音声は、10言語で1千時間、4言語で1万時間、6言語で100時間以上に達しました。 プロジェクトの完了後、お客様に、自動音声認識(ASR)ソフトウェアの開発トレーニングに必要な質の高い教師データを提供することができました。

音声AI

DataForceは、全世界に100万人以上のメンバーと、250以上の言語を網羅する言語スペシャリストからなるグローバルコミュニティを擁しています。 DataForceは独自のプラットフォームですが、お客様やサードパーティのツールを使用することも可能です。 これにより、お客様のデータを常に管理下に置くことができます。

コンサルティングを申し込む