多模态大模型Clip

一、经典分类模型的问题:

  1. 类别固定
  2. 当前的模型只能胜任一个任务,迁移到新任务上非常困难
  3. 类别互斥
  4. 当前的CV数据集标注劳动密集,成本较高,
  5. 当前模型泛化能力较差

负样本的组成(Batchsize有N个文本-图像对)

Batchsize太小,负样本太少,训练效果不佳

Batchsize太大,负样本不准

正负样本是在Batchsize内部构造出来

只有对角线为1,其余为0

二、Clip模型的缺点

  1. ·CLIP的zero-shot性能虽然总体上比supervised baseline ResNet-50要好但其实在很多任务上比不过SOTA methods,因此CLIP的transfer learning有待挖掘
  2. ·CLIP在这几种task上zero-shot性能不好: fine-grained分类 (花的分类、车的分类之类的)、抽象的任务 (如计算图中object的个数) 以及预训练时没见过的task (如分出相邻车辆的距离)。Zero-shot CLIP在真正意义上的out-of-distribution data上性能不好,比如在OCR中
  3. 生成新的概念(如:词),这是CLIP功能上的缺陷,CLIP终究不是生成模型
  4. ·CLIP的训练数据是从网上采集的,这些image-text pairs没有做data clear和de-bias这可能会使模型有一些social biases;
  5. ·很多视觉任务很难用text来表达,如何用更高效的few-shot learning方法优化CLIP也很重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/313330.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SQL-DML增删改

🎉欢迎您来到我的MySQL基础复习专栏 ☆* o(≧▽≦)o *☆哈喽~我是小小恶斯法克🍹 ✨博客主页:小小恶斯法克的博客 🎈该系列文章专栏:重拾MySQL 🍹文章作者技术和水平很有限,如果文中出现错误&am…

SpringBoot+thymeleaf实战遇到的问题

目录 一、控制台: 二、数据库查询异常: 三、前后端错误校验 四、在serviceImp中需要添加一个eq条件,表示和数据库中的哪个字段进行比较,否则会查出所有数据,导致500 五、使用流转换数据更简洁 六、重复报错&#…

高周期的伦敦金交易机会转到低周期做 不可以吗?

一般的市场观点认为,交易信号出现在越高的时间周期上就越准确,成功的概率就越高。而低时间周期的信号,要推动高时间周期行情的发展,那几乎是不可能。因此多数人认为从高周期转到低周期,然后去捕捉高周期行情机会&#…

微信小程序开发学习笔记《10》页面导航

微信小程序开发学习笔记《10》页面导航 博主正在学习微信小程序开发,希望记录自己学习过程同时与广大网友共同学习讨论。导航 官方文档 一、介绍 1. 什么是页面导航 页面导航指的是页面之间的相互跳转。例如,浏览器中实现页面导航的方式有如下两种: …

两周掌握Vue3(四):计算属性、监听属性、事件处理

文章目录 一、计算属性1.什么是计算属性2.代码示例 二、监听属性三、事件处理 代码仓库:跳转 当前分支:04 一、计算属性 1.什么是计算属性 Vue 中的计算属性具有以下作用: 数据处理:计算属性可以用于对数据进行处理和计算&…

【开源】类似创客贴图片编辑器的项目及前端组件

yft-design: 基于fabric.js的图片设计,使用 Vue3 TypeScript fabric.js pinia element-plus pwa,支持 文字、图片、形状、线条、二维码 、条形码几种最常用的元素类型,每一种元素都拥有高度可编辑能力,缩略图显示,…

《2024 年 Web3.0 数字资产趋势报告》(三)

撰文:方军、周芳鸽、李祺虹、张睿彬,Uweb 编辑:Nona,Techub News 点击关注公众号获取完整报告 接下来我们将继续和大家分享《2024 年 Web3.0 数字资产趋势报告》中其余部分。

计算机网络面试八股复习:常见的Http状态码

前言 面试被问到过一次。自己最近使用Gin框架,在Response的时候有时候也会用到一个自定义的状态码。因此归纳一下这方面,供自己日后面试复习以及开发时候参考。 HTTP 全名“超文本传输协议”(我也不懂为什么面试官问这个…) 属…

【Linux】常见指令解析下

目录 前言1. cp指令(重要)2. mv指令 (重要)3. cat指令4. more指令5. less指令 (重要)6. head指令7. tail指令8. 时间相关的指令8.1 data显示8.2 时间戳 9. cal指令10. find指令(非常重要&#x…

【天龙怀旧服】攻略day5

关键字: 天鉴扫荡、举贤、燕子水路 1】85天鉴任务可以扫荡 在流派选择npc那里,花费40交子即可扫荡100点,可以兑换10个灵武打造图; 此外打造图绑定不影响做出来的灵武绑定,只要对应的玉不绑灵武就不绑定 2】冠绝师门…

浅谈电能管理系统在智能轨道交通中的设计与应用——安科瑞 顾烊宇

摘要:城市轨道交通可以填补市民出行方式的空缺,它的运行需要有持续的电能提供支持。为了给轨道交通营造稳定的运行环境,迫切需要建立相应的电能管理系统,以此实现高质量的电能供给。在本文中,将对应的电能管理系统作为…

VUE+bpmn.js实现工作流

1、安装bpmn.js npm install bpmn-js7.3.1 // 我安装的版本是7.3.1npm install bpmn-js-properties-panel0.37.2npm install bpmn-moddle7.1.3 npm install --save camunda-bpmn-moddle 2、配置axios,在main.js中引入axios import axios from axiosVue.proto…

前端项目优化:减少webpack打包体积

前言 最近自己买个云服务器,把之前搭建的webpack-vue项目进行了部署,现在项目已经成功了。 项目地址:GitHub - wjt162286793/webpack----vue: 使用webpack配置一个脚手架,对照文档,纯手打 线上地址:IAM架构资产管理系统 不过是没有经过任何优化的,虽然项目体积和业务不是很复…

为什么要做性能测试?

什么是性能测试 性能测试是通过自动化的测试工具模拟多种正常、峰值以及异常负载条件来对系统的各项性能指标进行测试,负载测试和压力测试都属于性能测试,两者可以结合进行。通过负载测试,确定在各种工作负载下系统的性能,目标是…

磷酸铁锂电池生产污废水需要哪些工艺及设备

磷酸铁锂电池作为一种常见的锂离子电池,已广泛应用于电动汽车、储能系统等领域。然而,在磷酸铁锂电池的生产过程中,难免会产生一定量的污废水。为了有效处理和处理这些污废水,我们需要合适的工艺和设备。 首先,针对磷酸…

xtu oj 1520 方程组

题目描述 求 ,其中x≤y 的整数解。 输入格式 第一行是一个整数T (1≤T≤1000),表示样例的个数。 第二行是两个整数n, n∈[−109,109]和m, m∈[0,109]。 输出格式 依次输出一个样例的结果。 输出一行,为两个整数,之间用一个空格隔开;如果…

解决 微信公众号token一直莫名其妙出现token过期问题

1.问题描述 微信公众号获取 Access token 开发文档 在开发公众号的过程中,一直莫名其妙出现公众号 token 过期的情况,明明还在 token 的有效时间范围内,明明微信文档写的 access_token 有近2小时的有效时间。所以我缩短了 token 存到 redis…

定时任务框架-xxljob

spring传统的定时任务Scheduled,但是这样存在这一些问题 : 做集群任务的重复执行问题 cron表达式定义在代码之中,修改不方便 定时任务失败了,无法重试也没有统计 如果任务量过大,不能有效的分片执行 1.分布式任务调…

Adobe Photoshop AI正版来了,手把手教你注册

首先声明,官方正版Adobe Photoshop AI正版需要收费,一年180左右。 好了,下面开始提供完整的注册步骤 第一步:注册Adobe账号教程(免科学) 支持Adobe付款卡,点击获取 注册一个新的微软邮箱&am…

深入探索JavaScript中实用而高级的Rest参数和Spread语法

🧑‍🎓 个人主页:《爱蹦跶的大A阿》 🔥当前正在更新专栏:《VUE》 、《JavaScript保姆级教程》、《krpano》、《krpano中文文档》 ​ ​ ✨ 前言 函数是JavaScript这个语言的核心,而如何处理函数的参数是函数编程中非…
最新文章