Moderación de contenido, recopilación de datos, anotación de videos
Ampliación de la seguridad con IA responsable en los videojuegos: recopilación y anotación de audio para la detección de discurso tóxico
El desafío
Nuestro cliente, una compañía tecnológica internacional, buscaba un socio para ayudar en un gran proyecto de recopilación de datos de habla conversacional en el ámbito de los videojuegos. El discurso tóxico es una preocupación creciente en la sociedad actual, ya que los discursos de odio, el acoso en línea y otros ataques verbales están en aumento, especialmente en foros utilizados por niños. El objetivo era recopilar un mínimo de 100 horas de discurso altamente tóxico con 100 jugadores apasionados
• • • •La solución• • • •
La solución que propusimos fue llevar a cabo una recopilación moderada de datos de más de 100 participantes en varios juegos de alta competencia tanto multijugador como uno contra uno. Grabamos a grupos de dos a seis participantes mientras jugaban juegos de alta interactividad que acostumbran a tener niveles más altos de discurso tóxico, como juegos competitivos de disparo y lucha. Como participantes, elegimos a jugadores asiduos de diversas edades, géneros, niveles de educación y ubicaciones geográficas, para asegurar que los datos fueran completos y diversos.
Trabajamos de cerca con los participantes y logramos recopilar 100 horas de discurso tóxico en estos juegos en tiempo real. El cliente expresó su gran satisfacción con la calidad y autenticidad de los datos. DataForce entonces completó el conjunto de datos para el entrenamiento del modelo del cliente con la anotación de 70 horas de discurso conforme a las directrices provistas.
Este caso práctico demuestra la importancia que tiene una recopilación de datos precisa para su uso en tecnologías de detección de discursos. Debido al aumento del discurso de odio en línea, es apremiante disponer de un conjunto de datos diverso que permita identificar los matices del lenguaje ofensivo para mejorar la detección del discurso tóxico en diversos contextos.
En DataForce, estamos orgullosos de nuestra capacidad para abordar proyectos desafiantes usando soluciones innovadoras. El éxito de este proyecto de recopilación y anotación de datos es un claro ejemplo de nuestra habilidad para reunir participantes altamente especializados, recopilar datos variados con destreza y ofrecer anotaciones de alta calidad. En DataForce, nos enorgullecemos de participar en colaboraciones como esta a nivel internacional y valoramos la oportunidad de trabajar en soluciones de IA responsables y que generen un impacto.
DataForce cuenta con una comunidad global de más de 1,000 000 de miembros en todo el mundo y lingüistas expertos en más de 250 idiomas. DataForce cuenta con su propia plataforma, pero también puede utilizar herramientas del cliente o de terceros. De esta forma, sus datos están siempre bajo control.