メインコンテンツに移動

テキストアノテーション

石油スーパーメジャーのSNSデータ分類

 

課題

「スーパーメジャー」である国際石油資本7社の1社である企業は、2千件近いツイートをレビュー、分類するため、さまざまな規模のプロジェクトに対応できるパートナーを探していました。自社に対する世間の認識を分析し、その分析データを活用して、社内外で適切なコミュニケーションを実現することを目的としていました。 プロジェクトでは、会社の社会的な評価に影響する7つの要素が調査対象となりました。製品とサービス、イノベーション、職場環境、公正性と透明性、社会的貢献、経営陣、業績の7つです。 人々の意見から見出された洞察に基づいて、お客様のアクションにつながる決定を導き出せるようにするために、極めて主観的なコンテンツから、調査結果を提示することが大きな課題となっていました。

• • • •ソリューション• • • •

DataForceは、130万人を超えるグローバルコミュニティによって構成されるデータベースから、わずか2週間で適切なスキルとバックグラウンドを持つ11名の人材を集め、チームのトレーニングを実施しました。 専任プロジェクトマネージャーとコーディネーターがアサインされ、スケジュールやトレーニング、予算への対応を行い、アノテーター7名とQAレビュー担当者2名がツイートの分類作業を担当しました。 ツイートごとに複数の解釈や洞察を得られるようにするため、独自のアノテーションプラットフォームを通して、個々のツイートが2名のアノテーターに割り振られました。 解釈に隔たりがある場合、結果はQAレビュー担当者に送られます。 QAレビュー担当者は、アノテーターの視点からツイートの洞察を理解した上で、カテゴリー分類を見直し、お客様ガイドラインに基づいて、カテゴリー分類を再度判断します。

主観的な要素の大きい作業であることを考慮し、お客様の品質要件を理解するため、チームはまず、データセットのごく一部を分類して納品しました。最初のデータセットにはツイート250件が含まれていました。 テストプロジェクトを納品し、結果についてお客様と検討した後、ガイドラインとトレーニング内容を更新し、作業内容を明確にしました。その後、残りのツイート1,926件の本格的な作業を進めました。 最初の250件のツイートの分類作業によって、お客様とプロジェクトチームは相互にガイドラインを細かく分析、理解し、評価カテゴリーの細部を再検討する機会を得ることができました。このことが、早い段階でプロジェクトの方向性を変えるきっかけとなり、最終的にお客様の目的に適った結果を得られたという点は重要です。

お客様はアノテーションが完了した最終データをプロジェクト開始から8週間で手に入れただけでなく、お客様の希望に合わせてカスタマイズされたダッシュボードを使用して、簡単に結果を確認できるようになりました。

最終納品後、当社はお客様から高い評価を得ています。ラベル付けされ、分類されたデータセットを使用することで、お客様の機械学習モデルのパフォーマンスが大きく向上したとのフィードバックを受けました。 当社は100%という承認スコアを獲得しています。データセットの品質に、お客様に十分にご満足いただけた証です。

ガスポンプ

DataForceは、全世界に100万人以上のメンバーと、250以上の言語を網羅する言語スペシャリストからなるグローバルコミュニティを擁しています。 DataForceは独自のプラットフォームですが、お客様やサードパーティのツールを使用することも可能です。 これにより、お客様のデータを常に管理下に置くことができます。

コンサルティングを申し込む