包含"CLIP"标签的文章

  • 超越CLIP 视觉大模型训练新范式

      ​​https,github.com,OpenGVLab,LCL​​视觉backbone的数据瓶颈CLIP是第一个连接图像和文本的基础模型,但在大模型时代,仅凭对比学习的监督,已经不足够让下游视觉,语言模型,VLM,取得足够好的性能,尤其是在OCR等细粒度、高分辨率视觉任务上,而且这类方法通常要求图...

    2024-11-15 435
  • 多专家CLIP实现细粒度多模态表征学习 多阶段对比学习

      今天给大家介绍一篇港中文、上海AILab等机构联合发表的CLIP优化工作,构建了基于多专家网络的MoE模型,实现更细粒度的视觉表征器训练,提升下游多模态大模型论文标题,CLIP,MOE,TOWARDSBUILDINGMIXTUREOFEXPERTSFORCLIPWITHDIVERSIFIEDMULT...

    2024-11-14 784

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息