
이미지, 영상, LIDAR 라벨링
대부분의 자동차 제조사들은 주위 환경을 감지하여 운전자의 인풋이 거의 또는 전혀 없이도 안전하게 이동할 수 있는 기능을 탑재한 차량을 개발하고 있습니다. 이를 위해, 탑재되는 인텔리전스 요소는 차량 내외부로부터의 실시간 이미지를 수집하고, 현재 상태를 파악하기 위해 수집된 이미지/영상을 처리하며, 현재 상태에 대한 적절한 결정을 내리고, 해당 작업 항목을 실행해야 합니다.

가상 어시스턴트 및 인포테인먼트 시스템 현지화
세계적으로 가장 많은 사람이 모국어로 사용하는 언어가 영어일 것이라는 선입견이 있지만, 실제로는 그렇지 않습니다. 실제로는 가장 많은 사람이 모국어로 사용하는 언어는 북경어이며, 두번째가 스페인어, 그 뒤를 이어서 서게르만어와, 힌두어, 아랍어, 포르투갈어, 벵골어, 그리고 러시아어 순입니다. 이 때문에 차량 내 음성 상호작용 시스템을 영어 외의 다양한 언어로 이용할 수 있어야 합니다. 모국어를 사용할 수 있는 상황에서는 운전자가 하고 싶은 말을 필요한 언어로 번역하는 과정을 거칠 필요가 없으므로 사용자 경험이 향상되고 안전 면에서도 긍정적인 효과가 있습니다. 그러나 시스템을 다국어로 현지화하는 것은 쉬운 일이 아니며, 다른 가상 어시스턴트 구성요소는 물론 자연어 이해(NLU)와 자연어 생성(NLG) 전반의 각색도 필요합니다.

텍스트 음성 변환 튜닝
음성합성 기술은 운전자의 경험을 향상시키고 안전성을 높이기 때문에 최근에는 자동차 산업에서 필수적인 요소로 자리잡았습니다. 운전자들은 이제 시선을 도로에 고정한 채 알림을 읽고, 방향을 안내 받거나, 차량과 상호작용하여 기능을 제어할 수 있습니다. 이러한 상호작용이 최대한 자연스럽게 이루어질 수 있으려면, 음성합성기를 완벽하게 조정해야 합니다.

음성을 텍스트로 전사
음성 인식 기술은 차량 내에서 이미 필수 기능이 되었습니다. 차량 인포테인먼트 시스템, 내비게이션 및 오디오 기기에 관련된 다양한 명령은 100% 음성으로 가능합니다. 자동차 부문에서, 이러한 시스템이 적절히 동작하게 하는 데 있어 가장 큰 어려움은 차량 내의 음향 환경에 있습니다.

자연어 이해(NLU) 기술 개발 및 최적화
NLU는 인간과 컴퓨터의 상호작용(human-computer interaction, HCI)을 실현하여, 사용자가 어떤 명령을 내렸을 때 컴퓨터가 사용자의 말을 수집할 뿐만 아니라 그 의미를 추론하는 것이 가능해집니다. 이에 따라 사용자가 특정 명령을 내리는 것이 한 가지 방식으로만 제한되지 않으므로 보다 자연스러운 대화가 가능하게 됩니다. 가상 어시스턴트는 사용자가 일상적인 언어로 내리는 명령을 이해할 수 있어야 합니다. 사용자가 귀사의 비즈니스 라인에서 서비스를 요청하는 가장 일반적인 방법을 식별하고 음성 검색 최적화 전략을 정의해야 합니다.

시스템 응답 전사
차량 내 음성 어시스턴트는 인간의 상호작용을 시뮬레이션하는데, 이를 구현하는 단 한 가지 방법은 고유 페르소나를 개발하는 것입니다. 여러 언어를 적용할 때는 오해나 불편한 반응을 피하기 위해 특정 어조, 문화적 요소, 예의 등을 세심하게 고려하여 처리해야 합니다. 반응과 문화적 콘텐츠 모두를 적합하게 조정하는 절차를 ‘트랜스크리에이션’이라고 하는데, 음성 어시스턴트는 이런 요소들을 고려해야 합니다.

실험실 또는 차량 내 테스트
자동차 주문자 상표 부착 생산업체(original equipment manufacturer, OEM)들과 공급업체들은 항상 고객들이 환영할 만한 차량 내 기능을 제공해야 한다는 과제를 안고 있습니다. 이처럼 역동적인 시스템을 테스트하는 것은 까다로운 작업일 수 있지만, 성공적인 제품을 시장에 내놓느냐 아니면 완전한 실패로 귀착되느냐를 결정할 수 있는 필수불가결한 단계입니다.

사용자 연구
실험실 내 테스트 및 기능 테스트가 완료되면, 대규모의 다양한 타겟 테스터 그룹을 통해 실제 환경에서 실제 사용자들과 함께 사용자 경험을 평가합니다. 다양한 속도로 주행하거나 정지한 상태에서, 창문이 닫히거나 열린 상태에서, 귀사의 새로운 버전 또는 제품을 사용한 경험에 대해 운전자와 승객의 피드백은 어떤가요?