HuggingFace开源医疗大模型排行榜

探索当前最先进的开源医疗大模型,了解它们的性能评估、应用场景和技术特点

医疗大模型性能概览

下图展示了HuggingFace平台上排名前10的医疗大模型在各项评测基准上的综合表现。数据实时从HuggingFace API获取,确保您获得最新的模型评测结果。

各模型评测指标对比

综合评分排名

参数量与性能关系

评测指标均值分布

数据最后更新时间: 加载中...

医疗大模型排行榜介绍

本排行榜汇集了HuggingFace平台上表现优异的开源医疗大模型,基于多项标准化医疗评测基准进行综合评分,包括MedQA、MedMCQA、PubMedQA和MMLU-Med等。我们致力于为医疗AI研究人员和开发者提供最新、最全面的医疗大模型性能参考。

评测基准说明

MedQA

评估模型在医学问答任务中的表现,包含各种医学专业领域的问题

MedMCQA

医学多选题测试集,模拟各类医学执照考试,评估模型的医学知识理解能力

PubMedQA

基于PubMed医学文献的问答数据集,评估模型对医学研究文献的理解能力

MMLU-Med

多任务语言理解医学子集,评估模型在专业医学知识方面的理解深度

筛选与搜索

排序方式:

没有找到匹配的模型,请尝试其他搜索条件

正在从HuggingFace获取最新模型数据...

医疗大模型排行榜

排名 模型名称 机构 评分 参数量 发布日期 许可证 语言 操作

评测方法说明

本排行榜采用综合评分方法,对每个模型在多个医疗专业评测基准上的表现进行加权平均。评测内容涵盖医学知识、临床推理、医学问答和医学文献理解等多个维度。

评分标准

总评分是各项评测基准的加权平均值,权重分配如下:

  • MedQA: 30%
  • MedMCQA: 25%
  • PubMedQA: 25%
  • MMLU-Med: 20%

数据来源

本排行榜数据主要来源于:

  • HuggingFace官方API实时获取的模型数据
  • 模型发布论文中的性能数据
  • 独立第三方评测机构的测试结果
  • 模型开发者提供的官方评测数据

更新周期

排行榜数据通过HuggingFace API自动更新,用户可以随时刷新页面获取最新数据。如果您是模型开发者,想要提交自己的模型加入排行榜,请联系我们或直接将您的模型提交至HuggingFace。