对话式人工智能本地化、语言工程
虚拟助手提示词分类与语言对创建
挑战
我们的客户是全球通信和技术领域的巨头之一,继成功开发出虚拟助手之后,他们选择与创博数据合作,寻求高质量的提示词训练数据。 这款虚拟助手的目标是模拟人类交流,通过数字化方式在多个接触点与客户建立联系和对话。 然而,还需要对其进一步训练,以便整合公司内部的专业术语和分类体系、操作流程和合同信息。 为此,创博数据需要提供高质量的原创材料,并在训练及交付成果的过程中,兼顾合规与不合规的指南,包括《美国残疾人法案》(ADA)的合规要求。
• • • •解决方案• • • •
为训练虚拟助手,创博数据从助手的视角出发,生成了配对的输入提示词和输出回复。 输入部分是基于客户提出的问题,因而可能不合规,而输出部分则符合客户规范。
- 数据:我们总共生成了超过15,000对输入输出数据,内容覆盖两大渠道——网络聊天和移动社交。
- 指南:客户要求涵盖所有指南类型,包括问候、道歉、提问和陈述。
- 意图:我们根据客户的规范确定了主要的消费者群体意图类型,同时也采用并借鉴了客户的内部分类体系。 常见的意图类型共有九种,其中包括“添加信息”、“更改计划”和“更新”。
- 人员配置:这项工作需要配备一位专职项目经理、多名译员、创意写作员以及位于美国的英语文案创译员。
鉴于输入输出生成的规模与动态特性,创博数据分四个里程碑阶段交付项目,且最终交付提前完成:
- 里程碑1 = 10%的批次通过验收(POC)
- 里程碑2 = 30%的批次通过验收
- 里程碑3 = 30%的批次通过验收
- 里程碑4 = 30%的最终批次交付
为确保质量保证(QA)得到正确衡量,并且减少提示词生成的冗余,创博数据在开始每个后续里程碑之前,都会向客户的产品负责人请求反馈意见。
结果:客户对流程和对比进行了内部QA,发现在最终交付成果中,有98%的措辞被正确标记为合规/不合规,超出了最初设定的90%的目标。
创博数据汇聚了全球逾 1,000,000 名成员,以及超过 250 种语言的语言专家。 创博数据既依托于自身构建的平台,也能够使用客户或第三方的工具。 这样一来,您的数据尽在掌控。