
图像、视频和LIDAR标注
大多数汽车公司正致力于嵌入新功能,使生产的车辆能够感知外界环境,并在驾驶员不进行或很少进行输入控制的情况下实现安全行驶。 为此,嵌入其中的智能组件必须捕捉实时图像,处理捕捉的图像/视频以识别当前状态,再根据当前状态做出正确决策,并执行相应的行动项目。

虚拟助手和信息娱乐系统的本地化
尽管人们普遍认为从母语者的总量上来看,英语是世界上使用人数最多的语言,但事实并非如此。 事实上,普通话位列第一,西班牙语位列第二,其后分别为西日耳曼语、印地语、阿拉伯语、葡萄牙语、孟加拉语和俄语。 这就是车载语音交互系统应支持多种语言版本,而非仅仅是英语的原因。 由于驾驶员无需为了将其意图转换为系统支持的语言而进行过多思考,因此使用母语版本的语音交互系统能够增强用户体验,提高安全性能。 但是,要将这些系统本地化为各种语言版本并非易事,需要对自然语言理解(NLU)、自然语言生成(NLG)以及其他虚拟助手组件进行整体调整。

文本转语音技术优化
近来,语音合成技术已成为汽车行业不可或缺的技术能力,能够有效改善驾驶员体验,提高安全性能。 如今驾驶员能够在关注路面状况的同时,阅读通知、接收指令或与车辆功能进行交互。 为使这种交互尽可能自然,必须对语音合成器进行优化调整。

语音到文本的转写
语音识别技术已被视为车辆内部的商品性特征。 与汽车信息娱乐系统、导航和音频设备相关的各种指令,100%可通过语音完成。 在汽车行业,要想使这些系统正常工作,我们所面临的最大挑战在于汽车内部的特定声音环境。

自然语言理解的开发和优化
NLU(自然语言理解)支持人机交互(HCI),使系统在您发出指令时能够推断出您的实际意图,而非仅是理解您的字面意思。 由于系统支持您以多种方式给出特定指令,您与设备之间的对话将变得更加自然。 您只需用日常语言给出指令,虚拟助手就可以理解。 用户最常使用哪些方式来寻求您业务范围内的服务,以及确定语音搜索优化策略。

系统响应转写
实现车载语音助手模拟人机交互的唯一方法是构建独特的人物角色。 在针对其他语言进行改写时,须谨慎处理特定语气、文化指涉、礼貌性及其他一些事项,以避免产生误解或不适反应。 对系统响应以及文化内涵进行改写的过程称为“创译(transcreation)”,语音助手需要将这些因素考虑在内。

验收测试或车载测试
汽车原始设备制造商(OEM)和供应商始终面临着挑战,他们需要提供对客户具有吸引力的车载功能。 测试这些动态系统可能是一项艰巨的任务,但同时也是至关重要的一步,能以此确定您的产品能否成功发布,还是会以失败告终。

用户研究
验收测试和功能测试结束后,是时候用真实环境下的真实用户来评估用户体验了,要让一大批具备多元化且有针对性的测试人员参与测试。对于在不同速度下行驶或保持静止状态,以及车窗打开或关闭状态下使用新版本或新产品时,驾驶员和乘客对使用体验有何看法?