HuggingFace开源医疗大模型排行榜

医疗大模型性能概览

下图展示了HuggingFace平台上排名前10的医疗大模型在各项评测基准上的综合表现。数据实时从HuggingFace API获取，确保您获得最新的模型评测结果。

数据最后更新时间: 加载中...

本排行榜汇集了HuggingFace平台上表现优异的开源医疗大模型，基于多项标准化医疗评测基准进行综合评分，包括MedQA、MedMCQA、PubMedQA和MMLU-Med等。我们致力于为医疗AI研究人员和开发者提供最新、最全面的医疗大模型性能参考。

评估模型在医学问答任务中的表现，包含各种医学专业领域的问题

医学多选题测试集，模拟各类医学执照考试，评估模型的医学知识理解能力

基于PubMed医学文献的问答数据集，评估模型对医学研究文献的理解能力

多任务语言理解医学子集，评估模型在专业医学知识方面的理解深度

本排行榜采用综合评分方法，对每个模型在多个医疗专业评测基准上的表现进行加权平均。评测内容涵盖医学知识、临床推理、医学问答和医学文献理解等多个维度。

总评分是各项评测基准的加权平均值，权重分配如下：

本排行榜数据主要来源于：

排行榜数据通过HuggingFace API自动更新，用户可以随时刷新页面获取最新数据。如果您是模型开发者，想要提交自己的模型加入排行榜，请联系我们或直接将您的模型提交至HuggingFace。