命名实体提取
不良事件检测
运用自然语言处理技术实现不良事件检测。
问题
我们的客户是一家在制药领域领先的公司,他们正在开发一种自然语言处理(NLP)算法,用于在社交媒体帖子中检测不良事件(AE)。 他们的目标是对预先定义的命名实体进行分类,以便系统性地整理和解决患者面临的具体问题和经历。 为了改善患者的就医体验和健康状况,并减少不良事件检测中的假阴性数量,需要对超过一万条社交媒体帖子进行深入分析。 鉴于该项目涉及敏感的医学信息,我们对所有分类和检测的准确率设定了100%的高标准。 这种人机协同模式将可扩展性提高了10倍,因为与现有做法不同,它只在机器学习模型无法提供可靠分类结果时才需要人工介入审核。
• • • •解决方案• • • •
项目启动之初,我们从创博数据的100万人社群中高效地筛选出了主题专家。 我们逐步从筛选出的候选人中组建团队,精心挑选了具有药物警戒背景的审核人员。 通过专家监督、盲标流程以及特定质量指标(如科恩卡帕系数)的实施,我们迅速提升了标注质量。 随着标注流程的持续推进,我们扩大了标注团队的规模,以缩短交付周期。 我们的团队在短短几天内就完成了数千条社交媒体帖子的审核工作。
为保证标注和分类的准确性,我们对每项任务都进行了双盲标注,并随后进行了严格的质量控制。 如有任何分歧,则由一名审核人员进行协调,并为每个条目确定最终分类。
随着更多数据集的涌入,我们及时与团队落实反馈意见,并更新了指南,以纳入社交媒体帖子中的边缘案例和意外情况。 我们的内部标注平台——创博数据——能够无缝更新,以适应项目的各种变化,同时使我们能够利用一个持续优化的可扩展模型来构建数据集。
客户反馈称,与传统的人工分类相比,这种人机协同模式被证明是一种更具可扩展性和效率的选择。

创博数据汇聚了全球逾 1,000,000 名成员,以及超过 250 种语言的语言专家。 创博数据既依托于自身构建的平台,也能够使用客户或第三方的工具。 这样一来,您的数据尽在掌控。