Jove
Visualize
联系我们
JoVE
x logofacebook logolinkedin logoyoutube logo
关于 JoVE
概览领导团队博客JoVE 帮助中心
作者
出版流程编辑委员会范围与政策同行评审常见问题投稿
图书馆员
用户评价订阅访问资源图书馆顾问委员会常见问题
研究
JoVE JournalMethods CollectionsJoVE Encyclopedia of Experiments存档
教育
JoVE CoreJoVE BusinessJoVE Science EducationJoVE Lab Manual教师资源中心教师网站
使用条款与条件
隐私政策
政策

相关实验视频

Angelo D'Ambrosio1, Francesco Baglivo2, Luigi De Angelis2

  • 1European Centre for Disease Prevention and Control, Stockholm, Sweden.

Recenti progressi in medicina
|October 2, 2025
PubMed
概括
此摘要是机器生成的。

我们在旅行医学测试中评估了40个大型语言模型 (LLM). 像OpenAI o3这样的前沿模型显示出高准确度,证实了LLMs.

相关实验视频

相关概念视频

您也可能阅读

相关文章

通过共同作者、期刊和引用图与本文相关的文章。

排序
Same author

First steps in establishing surveillance of bloodstream infections from electronic health record derived data, EU/EEA countries, March 2023 to March 2025.

Euro surveillance : bulletin Europeen sur les maladies transmissibles = European communicable disease bulletin·2026
Same author

Mapping risk communication practices in public health emergencies: a scoping review and comparison with Italian regional pandemic plans.

BMC public health·2026
Same author

Impact of Respiratory Viral Codetections on RSV Disease Burden in Young Children in Primary Care.

Influenza and other respiratory viruses·2026
Same author

The Need for Regulatory Certainty on Medical AI: Lessons From the OpenEvidence Geoblocking in the EU and UK Over the EU AI Act.

The Lancet regional health. Europe·2026
Same author

Seasonality and effects of climatic exposures on community-acquired Legionnaires' disease incidence, Italy, 2005 to 2023.

Euro surveillance : bulletin Europeen sur les maladies transmissibles = European communicable disease bulletin·2026
Same author

"Navigating Healthy Waters": monitoring ship wastewater as a key defense against infectious diseases-a pilot study on a Mediterranean seaport.

Frontiers in public health·2026
Same journal

Recenti progressi in medicina·2026
Same journal

Recenti progressi in medicina·2026
Same journal

Recenti progressi in medicina·2026
Same journal

Recenti progressi in medicina·2026
Same journal

Recenti progressi in medicina·2026
Same journal

Recenti progressi in medicina·2026
查看所有相关文章

科学领域:

  • 公共卫生 公共卫生
  • 人工智能的人工智能
  • 医疗信息学 医疗信息学

背景情况:

  • 大型语言模型 (LLM) 越来越多地用于信息检索.
  • 在旅行医学等专业领域应用法学士学位需要严格的评估.

研究的目的:

  • 在旅行医学知识测试中对40个大型语言模型 (LLM) 的性能进行基准测试.
  • 根据准确性,一致性,可解析性和成本效益来评估LLM.

主要方法:

  • 对40名LLM进行了40项旅游医学测试.
  • 贝叶斯模型被用来分析性能指标.
  • 为了确定最佳系统,生成了成本精度曲线.

主要成果:

  • 士学位准确度差异很大,从27.9%到97.5%不等.
  • 包括OpenAI o3和困惑声纳推理在内的前沿模型表现出卓越的性能.
  • 与先进的边境模型相比,较小的,本地运行的模型通常表现不佳.
  • 确定了五个帕雷托最佳系统,其中OpenAI o3在成本准确性方面代表了当前最好的.

结论:

  • 目前的大型语言模型显示出作为公共卫生知识支持系统的巨大潜力.
  • 先进的,推理调整的LLM为专业医疗信息提供了高准确度.
  • 需要进一步发展,以提高医疗领域较小,本地LLM的表现.