Jove
Visualize
联系我们
JoVE
x logofacebook logolinkedin logoyoutube logo
关于 JoVE
概览领导团队博客JoVE 帮助中心
作者
出版流程编辑委员会范围与政策同行评审常见问题投稿
图书馆员
用户评价订阅访问资源图书馆顾问委员会常见问题
研究
JoVE JournalMethods CollectionsJoVE Encyclopedia of Experiments存档
教育
JoVE CoreJoVE BusinessJoVE Science EducationJoVE Lab Manual教师资源中心教师网站
使用条款与条件
隐私政策
政策

相关实验视频

基于变压器的多标签NER使用多种语言的维基百科体.

Yelyzaveta Ahapova1, Johann Frei1, Frank Kramer1

  • 1IT-Infrastructure for Translational Medical Research, University of Augsburg, Germany.

Studies in health technology and informatics
|May 17, 2025
PubMed
概括
此摘要是机器生成的。

本研究介绍了一种无监督的方法,以多种语言创建医疗文本数据集,用于命名实体识别 (NER). 这种方法提高了德国药物识别,特别是有限的数据.

关键词:
诊断 提取 诊断 提取医疗 NER 是一个医疗的 NER.药物提取 药物提取命名实体的认可 命名实体的认可自然语言处理自然语言处理.

相关实验视频

相关概念视频

您也可能阅读

相关文章

通过共同作者、期刊和引用图与本文相关的文章。

排序
Same author

Overcoming Domain Shift in Atypical Mitotic Figure Detection with Deep Ensemble Learning.

Studies in health technology and informatics·2026
Same author

Comparison of Loss Functions for Fibroglandular Tissue Segmentation in MRI.

Studies in health technology and informatics·2026
Same author

A Web Application for Structured Management and Reuse of Electronic Case Report Forms in REDCap.

Studies in health technology and informatics·2026
Same author

Context-Free Grammar-Guided Generation of FHIR Resources Using Large Language Models.

Studies in health technology and informatics·2026
Same author

Development and External Validation of a Deep Learning Model to Predict Mortality in Aneurysmal Subarachnoid Hemorrhage Using Admission Computed Tomography.

Neurosurgery·2026
Same author

Putting Theory into Practice by Developing a Novel Digital Health Technology-Derived Endpoint in Sleep Quality.

Digital biomarkers·2026
Same journal

The Essential Components and Critical Conditions for Success in a Learning Health System in Oncology.

Studies in health technology and informatics·2026
Same journal

Use of Artificial Intelligence in Screening for Adolescent Idiopathic Scoliosis: A Scoping Review.

Studies in health technology and informatics·2026
Same journal

Movement Related Biomechanics in Adolescent Idiopathic Scoliosis: A Review of Reviews.

Studies in health technology and informatics·2026
Same journal

The Impact of Surgical Correction of Adolescent Idiopathic Scoliosis Using Posterior Spinal Fusion on Selected Radiological Parameters and Respiratory Function.

Studies in health technology and informatics·2026
Same journal

Acute Effect of Physio-logic® Exercises on Muscle Tone and Stiffness in Adolescent Idiopathic Scoliosis Patients: A Preliminary Study.

Studies in health technology and informatics·2026
Same journal

Effects of Integrated Music and Occupational Therapy on Motor and Autonomic Function in Children with Neurogenic Scoliosis.

Studies in health technology and informatics·2026
查看所有相关文章

科学领域:

  • 自然语言处理自然语言处理.
  • 医疗信息学 医疗信息学
  • 计算语言学 计算语言学

背景情况:

  • 医疗文本的手动数据标签是昂贵的,并引发隐私问题,导致缺乏非英语医学注释.
  • 现有的方法通常需要大量的标记数据,这对于许多语言来说很少.
  • 基于本体学的语料库构建为数据稀缺提供了一个潜在的解决方案.

研究的目的:

  • 评估一种无监督的方法,用于从维基百科创建由本体学注释的corpora,用于医学命名实体识别 (NER).
  • 评估这种方法在英语,德语,西班牙语和法语的有效性.
  • 改善药物和诊断实体在低资源医疗文本场景的识别.

主要方法:

  • 一种无监督的方法被用来构建来自维基百科 (Wikidata) 的本体学注释的 corpora.
  • 该方法用于生成英语,德语,西班牙语和法语的多标签 corpora.
  • 生成的体被用来训练和评估用于药物和诊断实体识别的模型.

主要成果:

  • 无监督方法在德国药物实体检测方面取得了显著的改进,特别是在稀疏注释条件下.
  • 在实体识别任务中,在英语,德语,西班牙语和法语中观察到一致的性能.
  • 与基线方法相比,生成的多标签大体在提高NER性能方面表现出有效性.

结论:

  • 无监督的基于本体学的语料库构建是解决非英语语言医疗注释稀缺问题的可行策略.
  • 这种方法为医疗NER的手动数据标签提供了一个具有成本效益和隐私保护的替代方案.
  • 这种方法有望改善跨语言医学信息提取和分析.