下图展示了HuggingFace平台上排名前10的医疗大模型在各项评测基准上的综合表现。数据实时从HuggingFace API获取,确保您获得最新的模型评测结果。
本排行榜汇集了HuggingFace平台上表现优异的开源医疗大模型,基于多项标准化医疗评测基准进行综合评分,包括MedQA、MedMCQA、PubMedQA和MMLU-Med等。我们致力于为医疗AI研究人员和开发者提供最新、最全面的医疗大模型性能参考。
评估模型在医学问答任务中的表现,包含各种医学专业领域的问题
医学多选题测试集,模拟各类医学执照考试,评估模型的医学知识理解能力
基于PubMed医学文献的问答数据集,评估模型对医学研究文献的理解能力
多任务语言理解医学子集,评估模型在专业医学知识方面的理解深度
没有找到匹配的模型,请尝试其他搜索条件
正在从HuggingFace获取最新模型数据...
排名 | 模型名称 | 机构 | 评分 | 参数量 | 发布日期 | 许可证 | 语言 | 操作 |
---|
本排行榜采用综合评分方法,对每个模型在多个医疗专业评测基准上的表现进行加权平均。评测内容涵盖医学知识、临床推理、医学问答和医学文献理解等多个维度。
总评分是各项评测基准的加权平均值,权重分配如下:
本排行榜数据主要来源于:
排行榜数据通过HuggingFace API自动更新,用户可以随时刷新页面获取最新数据。如果您是模型开发者,想要提交自己的模型加入排行榜,请联系我们或直接将您的模型提交至HuggingFace。