コンテンツモデレーション、データ収集、動画アノテーション
責任あるAIでゲームの安全性を強化:有害な表現の検出に向けた音声データの収集とアノテーション
課題
世界的なテクノロジー企業は、ゲーム分野における大規模な会話音声データ収集プロジェクトを支援するパートナーを求めていました。 現在、特に子どもたちが利用するフォーラムにおいて、ヘイトスピーチやインターネット上の誹謗中傷、嫌がらせなど、言葉による他人への傷害行為が増加しており、有害表現が社会問題となっています。 今回のプロジェクトの目標は、熱狂的なゲーマー100名を採用し、極めて有害な表現を少なくとも100時間分収集することでした。
• • • •ソリューション• • • •
弊社が提案したソリューションは、100名以上の参加者によるゲームプレイのデータをモデレーションして収集するというものでした。参加者は、バラエティに富んだ対戦ゲームをマルチプレイヤー形式および1対1形式でプレイします。 2~6人の参加者グループで、対戦型シューティングゲームや格闘ゲームなど、インタラクティブ性が高く、有害な表現の割合が高い傾向のあるゲームをプレイする様子を録画しました。 さまざまな年齢、性別、教育水準、地域の熱狂的なゲームファンの参加者を集めることで、データの完全性と多様性を確保しました。
参加者と緊密に協力し、ライブゲームにおける有害な表現を含む100時間分の音声データを収集することができました。 データの質と真正性について、お客様に非常にご満足いただいております。 その後、DataForceはお客様のガイドラインに従って70時間分の音声データにアノテーションを行い、お客様のモデルのトレーニングデータセットを完成させました。
この事例紹介が物語っているのは、音声認識テクノロジーの開発にとって、正確なデータの収集がきわめて重要であるということです。 インターネット上でヘイトスピーチが増加する中、ますます多様性に富んだデータセットが求められています。これにより、有害な言語表現のニュアンスを識別し、幅広い状況での有害表現を精度高く検出することが可能となるからです。
DataForceは、革新的なソリューションを提供し、困難なプロジェクトに対応できるサービスを提供します。 今回のデータ収集およびアノテーションプロジェクトの成功は、専門領域への対応力が高い参加者を募る、さまざまなニュアンスのデータを巧みに収集する、質の高いアノテーションを実施するといった、弊社の専門性の高さを示しています。 DataForceがこのような共同作業でグローバルパートナーとして活動できることは光栄であり、社会的に大きな影響を持つ責任あるAIソリューションに取り組むことは貴重な機会です。
DataForceは、全世界に100万人以上のメンバーと、250以上の言語を網羅する言語スペシャリストからなるグローバルコミュニティを擁しています。 DataForceは独自のプラットフォームですが、お客様やサードパーティのツールを使用することも可能です。 これにより、お客様のデータを常に管理下に置くことができます。