命名实体提取

不良事件检测

运用自然语言处理技术实现不良事件检测。

问题

我们的客户是一家在制药领域领先的公司，他们正在开发一种自然语言处理(NLP)算法，用于在社交媒体帖子中检测不良事件(AE)。他们的目标是对预先定义的命名实体进行分类，以便系统性地整理和解决患者面临的具体问题和经历。为了改善患者的就医体验和健康状况，并减少不良事件检测中的假阴性数量，需要对超过一万条社交媒体帖子进行深入分析。鉴于该项目涉及敏感的医学信息，我们对所有分类和检测的准确率设定了100%的高标准。这种人机协同模式将可扩展性提高了10倍，因为与现有做法不同，它只在机器学习模型无法提供可靠分类结果时才需要人工介入审核。

• • • •解决方案• • • •

项目启动之初，我们从创博数据的100万人社群中高效地筛选出了主题专家。我们逐步从筛选出的候选人中组建团队，精心挑选了具有药物警戒背景的审核人员。通过专家监督、盲标流程以及特定质量指标（如科恩卡帕系数）的实施，我们迅速提升了标注质量。随着标注流程的持续推进，我们扩大了标注团队的规模，以缩短交付周期。我们的团队在短短几天内就完成了数千条社交媒体帖子的审核工作。

为保证标注和分类的准确性，我们对每项任务都进行了双盲标注，并随后进行了严格的质量控制。如有任何分歧，则由一名审核人员进行协调，并为每个条目确定最终分类。

随着更多数据集的涌入，我们及时与团队落实反馈意见，并更新了指南，以纳入社交媒体帖子中的边缘案例和意外情况。我们的内部标注平台——创博数据——能够无缝更新，以适应项目的各种变化，同时使我们能够利用一个持续优化的可扩展模型来构建数据集。

客户反馈称，与传统的人工分类相比，这种人机协同模式被证明是一种更具可扩展性和效率的选择。

创博数据汇聚了全球逾 1,000,000 名成员，以及超过 250 种语言的语言专家。创博数据既依托于自身构建的平台，也能够使用客户或第三方的工具。这样一来，您的数据尽在掌控。

申请咨询。

我们能为您提供什么帮助？

名字

姓氏

电子邮件

电话

公司

请留言告知我们，您目前需要我们提供哪些帮助

您是通过何种渠道了解到我们的？

我同意本网站的隐私政策和条款

订阅我们的电子邮件

期待与您合作！

请填写以下表格，创博数据团队成员将很快与您联系。