精调多模态大语言模型用于X光图像判断

主要成果：

数据集构建：集成了OpenI胸部X光图像和RSNA乳腺癌图像数据集，生成了医学问答对。
模型开发与训练：使用QLora技术在Nvidia RTX 4090显卡上快速训练Qwen-VL 7B模型，模型在Rouge-1指标上达到了0.6147，损失率减少到约0.75。
性能对比：Qwen-VL 7B模型在所有评估的Rouge指标上均优于LLava和Blip模型，特别是在Rouge-1和Rouge-L指标上分别达到0.6544和0.6228。

关于我们