CV视觉模型发展全景:从传统CNN到多模态大模型的85个经典架构

张开发
2026/6/7 21:15:26 15 分钟阅读
CV视觉模型发展全景:从传统CNN到多模态大模型的85个经典架构
CV视觉模型发展全景从传统CNN到多模态大模型的85个经典架构视觉研究者都有同感标注数据成本实在太高。为了不在这上面烧钱各路大神开始用无标注数据、网上爬的图文、多模态数据来预训练通过对比学习、掩码重建这些套路让模型先学会一些通用能力然后再微调到检测、分割这些具体任务。这波大模型的浪潮席卷而来CV领域也诞生了无数新模型。现在视觉基础模型已经相当多了对于我们做CV的人来说这些模型的研究价值极高。今天我分享一篇综述帮大家系统梳理一下。这篇综述把CV基础模型分成了13大类加起来85个变体从LeNet、ResNet这些元老级模型到SAM、GPT4这些新贵全部囊括。我还额外准备了120篇2021-2023年的CV必读论文很多都是顶会成果很多都开源了代码。说到底虽然现在的方法已经挺强了但视觉基础模型的进步空间还是很大。大家可以顺着这个方向找找灵感。论文listSurvey 12篇2021年11篇2022年14篇2023年83篇。别犹豫扫码加企业微信备注转行帮你规划学习路径大家好我是资深AI讲师与学习规划师。专注计算机视觉教学与算法研发过去三年我帮超过2500名有Python 基础的入门者从像素是什么到独立跑通CV项目。今天这篇长文完全按零基础实战体系撰写从图像本质到经典算法、再到OpenCV工具链和完整项目一条龙给你讲透可直接复现的CV专业指南。适合人群大学生、转行者、开发者只要会Python基础就能跟上。读完你就能掌握图像处理4大经典算法并拥有一个可直接写进简历的实战项目为方便大家学习 这里给大家整理了一份系统学习资料包 需要的同学 根据下图指示自取就可以

更多文章