VideoAgent: Long-form Video Understanding with Large Language Model as Agent
基本信息
博客贡献人
燕青
作者
Xiaohan Wang, Yuhui Zhang, et al.
标签
Large Language Model Agent, Long-form Video Understanding, Vision-Language Foundation Models
摘要
长视…
系列文章目录
HarmonyOS Next 系列之省市区弹窗选择器实现(一) HarmonyOS Next 系列之验证码输入组件实现(二) HarmonyOS Next 系列之底部标签栏TabBar实现(三) HarmonyOS Next 系列之HTTP请求封装和Token…