在10月17日的百度世界2023上,文心大模型4.0版本正式发布!百度直接放话:文心大模型4.0是目前最强大的文心大模型。会上百度董事长李彦宏为我们展示了文心大模型4.0在搜索、地图、商业智能、智能会议、智能视频、多轮对话方面的强悍。那文心大模型4.0真有这么好?我们在第一时间拿到测试资格,并进行了实际实测。
相比文心大模型3.5刚出来的时候,文心大模型4.0现在已经进化出了更多功能,光是插件就有8个,包括一镜流影(文字转视频)、说图解画(看图说话)、E言易图(可视化数据分析)等。
这些插件还可以自由组合,来完成更复杂的任务。
今天我们先从更基础的角度出发,中文理解能力、视频生成能力、中文方言能力等3个方面,来给大家介绍下文心大模型4.0以及插件一镜流影,在视频方面的能力。
理解能力,尤其是中文理解能力
先来看看文心大模型4.0的理解能力。这里主要考考它应对**“语言陷阱”的能力,以及技术专用语的“识别力”**。文心大模型4.0的回答很简洁,直接给出答案。
回答的Docker是计算机里的一个开源的应用容器引擎以及它的作用。
生成能力,尤其是生成视频的能力
那么接下来这波,我们测试一下文心一言4.0生成视频的能力,看看这种神奇的能力,它是否具备。这时候我们就得看看文心一言的插件了,一镜流影(文字转视频),也就是文心一言4.0生成视频的能力。
“一镜流影”是文心一言4.0里的插件,通过一种技术手段,将文字内容自动转换为视频形式,使得文字能够以更生动、形象的方式呈现出来。这种技术可以应用于各种文本内容,如新闻报道、小说、诗歌等,将其转化为具有视觉效果的动态影像,为观众带来更加丰富和直观的观看体验。一镜流影技术可以大大提高内容的表现力和吸引力,有助于更好地传达文本中所包含的信息和情感。
我们接下来尝试下,使用一镜流影(文字转视频)功能去生成视频。使用文心一言4.0的一镜流影,文案:什么是docker,生成一段30秒的视频详解。
我们看一下一镜流影插件生成视频,不仅仅是生成一段docker容器的剪辑,没想到连文案和字幕语音都配好了,完成度很高。看到这里不得不感慨技术的进步,视频剪辑已经不是专业运营人员的专用了,我们使用文心一言4.0插件一镜流影,也能快速产出输出一个高质量的宣传视频了。
普通话版docker讲解
方言能力
然后,是方言能力测试。文心大模型4.0说是重点升级了数学计算能力,我们就直接上方言测试,看它是否能支持各种方言:
以下是一个使用四川话播报的介绍Docker的视频脚本: [背景音乐起,轻松明快] 旁白(四川话):Docker是个啥?Docker就是一种开源的应用容器引擎,让我们可以打包应用和依赖包到一个可移植的镜像中,发布到任何流行的Linux或Windows操作系统上。 [镜头切换,展示Docker图标和官网] 旁白(四川话):Docker可以帮助我们更快地交付应用,将应用程序和基础设施层隔离,像管理程序一样管理基础设施。 [镜头切换,展示Docker容器运行的示例] 旁白(四川话):使用Docker,我们可以更快地打包、测试和部署应用程序,缩短从编写到部署运行代码的周期。 [镜头切换,展示Docker在开发流程中的应用] 旁白(四川话):总之,Docker就是一种让我们轻松搞定应用部署和管理的神器!
四川话版docker讲解
粤语版docker讲解
总结
测到这里,不妨做个小小的总结:整体来看,中文理解能力、视频生成能力、中文方言能力都很强悍。首先能够根据我们的对话,生成视频脚本;其次能够通过插件把视频脚本转成视频;最后还可以任意改变语言,能支持中文里的方言。
从3月份文心一言发布,到年中文心大模型3.5版本更新,再到现在4.0惊艳亮相,百度文心大模型的迭代速度不可谓不迅速。这一次的评测,在视频生成方面的惊艳表现,确实非常惊人,是对传统的视频剪辑的颠覆。再一次体现了百度在大模型领域深厚的技术积累。
展望AI原生的新时代,文心一言大模型基础能力的快速进步,以及AI原生应用开发的颠覆式操作和表现,都令人感慨,未来是科技的时代,也是智能的时代。