论文:https://arxiv.org/abs/2309.17425
代码:Data Filtering Networks | Papers With Code
阿里最近又开源了视觉多模态模型 Qwen2-VL,视觉编码器升级了,所以抓紧补一下DFN
- Qwen1-VL视觉编码器:OpenClip 的 ViT-bigG-14
- Qwen2-VL视觉编码器:DFN 的 ViT
本文重点:
1:用来做filter的模型和最终的目标模型
论文:https://arxiv.org/abs/2309.17425
代码:Data Filtering Networks | Papers With Code
阿里最近又开源了视觉多模态模型 Qwen2-VL,视觉编码器升级了,所以抓紧补一下DFN
1:用来做filter的模型和最终的目标模型
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2158937.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!