跳转到主要内容

内容审核、数据采集、视频标注

负责任的人工智能助力改善游戏安全性:为有害言论检测进行音频采集与标注

 

挑战

我们的客户是一家国际科技公司,他们正在寻找项目合作伙伴,协作开展游戏领域大型对话语音的数据采集。 随着仇恨言论、网络骚扰及其他言语攻击愈演愈烈,尤其是在儿童使用的论坛上,有害言论在当今社会的关注度日益增加。 我们的目标是采集100名狂热玩家至少100小时的极端有害言论数据。

• • • •解决方案• • • •

我们的方案是采集一个适度规模的数据集,记录100多位参与者在竞争激烈的游戏中的对话,这些游戏包括多人游戏场景和一对一游戏两种模式。 我们以每组两至六名参与者为单位进行游戏记录,这些游戏交互性强,容易出现有害言论,例如竞技射击游戏和格斗游戏。 我们招募了不同年龄、性别、教育水平和地理位置的狂热玩家参与其中,以便确保数据采集的全面性和多样性。

通过与参与者密切合作,我们在这些实时游戏中成功采集了100小时的有害言论。 客户对我们提供的数据质量和真实性表示非常满意。 随后,创博数据根据客户的指南对70小时的语音进行标注,完成了针对客户模型的训练数据集。

这个案例证明,数据采集的准确性对于语音检测技术至关重要。 随着网络仇恨言论愈演愈烈,迫切需要建立多样化的数据集以识别有害语言的细微差别,从而优化针对各种语境下有害言论的检测水平。

在创博数据,我们自豪于能够提供创新的解决方案来应对挑战性项目。 该采集与标注项目的成功交付充分展现了我们在甄选专业性强的参与者、精准采集细微数据以及提供高质量标注方面的专业能力。 创博数据非常荣幸能作为全球合作伙伴参与此类项目。我们珍视这一机会,让我们能够参与开发具有深远影响和负责任的人工智能解决方案。

游戏行业的人工智能

创博数据汇聚了全球逾 1,000,000 名成员,以及超过 250 种语言的语言专家。 创博数据既依托于自身构建的平台,也能够使用客户或第三方的工具。 这样一来,您的数据尽在掌控。

申请咨询。