新logo

精调多模态大语言模型用于X光图像判断

主要成果:

  1. 数据集构建:集成了OpenI胸部X光图像和RSNA乳腺癌图像数据集,生成了医学问答对。
  2. 模型开发与训练:使用QLora技术在Nvidia RTX 4090显卡上快速训练Qwen-VL 7B模型,模型在Rouge-1指标上达到了0.6147,损失率减少到约0.75。
  3. 性能对比:Qwen-VL 7B模型在所有评估的Rouge指标上均优于LLava和Blip模型,特别是在Rouge-1和Rouge-L指标上分别达到0.6544和0.6228。