
画像・動画・LIDARのラベル付け
多くの自動車企業は、ドライバーからの入力なしに環境を感知し、安全に走行する機能を車両に組み込もうとしています。 この目的のために、組み込まれたインテリジェントコンポーネントはリアルタイムで画像をキャプチャします。その画像や動画を処理することで、現在の状況を把握し、適切な判断を下し、適切なアクションを取る必要があります。

バーチャルアシスタントとインフォテインメントシステムのローカライゼーション
ネイティブスピーカーの数において世界で最もよく話されている言語は英語だという通説がありますが、実はそうではありません。 1位は標準中国語、2位はスペイン語であり、以下西ゲルマン語、ヒンディー語、アラビア語、ポルトガル語、ベンガル語、ロシア語の順です。 このため、車載音声アシスタントシステムは英語以外のさまざまな言語にも対応しなければなりません。 ネイティブ言語を使うことができれば、ドライバーが自分の意図を脳内で翻訳する必要がなくなるため、ユーザーエクスペリエンスが改善され、安全性も向上します。 ただし、システムをあらゆる言語にローカライズすることは容易ではありません。自然言語理解(NLU)や自然言語生成(NLG)だけでなく、バーチャルアシスタントのコンポーネントまで全体を適応させる必要があります。

テキスト読み上げシステムのチューニング
音声合成テクノロジーは、ドライバーのエクスペリエンスや安全性を向上させるため、近年の自動車業界において必要不可欠です。 現在では、ドライバーが道路に目を向け注意して運転しながら、通知を読んだり、道順の案内を受けたり、車載機能とやり取りすることが可能です。 こうしたやり取りをできるだけ自然に行うには、完璧に調整された音声合成が必要です。

音声からのテキスト書き起こし
音声認識は、すでに標準的な車載機能とみなされています。 車載インフォテインメントシステム、ナビゲーション、音声デバイスに関連したさまざまな指示は、声によって100%実行できます。 自動車分野の中で、システムを適切に作動させるうえで最大の課題は、自動車特有の音響環境です。

自然言語理解の開発と最適化
自然言語理解(NLU)により、人間とコンピューターの対話(HCI)が可能になります。つまりコンピューターが、あなたの言うことを表面的に捉えるのではなく、実際の意図を推測できるようになります。 これにより会話がより自然になり、指示を出す方法もひとつに限定されなくなります。 日常的な言葉遣いで指示を出しても、バーチャルアシスタントは理解できるようになります。 ドライバーがどのようにサービスを求めるかという挙動をDataForceが特定し、音声検索の最適化戦略を定義します。

システム応答の書き起こし
車載音声アシスタントは、人との対話をシミュレーションしますが、それは固有の人格を構築することで初めて可能になります。 各言語に適用させる場合は、誤解や不自然な反応が発生することを避けるために、特有の語調や文化的な言い回し、その他の事項を慎重に処理する必要があります。 そのような言い回しや文化固有のコンテンツを適応させるプロセスは「トランスクリエイション」(クリエイティブ翻訳)と呼ばれ、音声アシスタントはそのような要素を考慮する必要があります。

ラボや車内で行うテスト
自動車業界において、相手先ブランド製造会社(OEM)とサプライヤーは、常に顧客に満足してもらえる車載機能の提供に挑戦しています。 これらのシステムのテストは容易ではありませんが、製品リリースの成功や失敗を検証するために非常に重要なタスクです。

ユーザー調査
ラボ内テストと機能テストが終了すると、大規模で多様なターゲット集団をテスターとして、実際の環境とユーザーによるユーザーエクスペリエンスの評価を行います。 さまざまな速度での走行時や停車時、窓が開いているときおよび閉まっているときといった各条件で、新バージョンや新製品の利用体験についての意見をドライバーや同乗者から収集します。