AI视频生成:小说文案智能分镜+智能识别角色和场景+批量Ai绘图+自动配音添加音乐+一键合成视频+百万播放量
全世界范围内的很多人,我也不例外,想象中的GPT5发布时间应该是24年中,但实际上OpenAI在这个时间点最强的模型是GPT4o,都不是GPT4.5,多了一个「o」其实也仅仅是多模态功能的进一步增强,而大模型本身的智力水平其实还停留在GPT4那个阶段。
因为GPT3.5发布那段时间内的影响太炸裂了,特别是半年后又发布了GPT4,基本上甩开整个世界一大截,就当所有人都觉得GPT5甚至AGI就要实现的时候,才发现OpenAI已经开始乏力了,不仅开始内斗,新的产品也就一个只发了demo,迟迟没有真正开放产品的使用,可以说现在现在2024年的这个时间节点,AI新王是否有可能易位真不好说。
再加上搞AI的国家其实并不多,因为这个东西要想做成,是有必要条件的,大概就是这三个:
第一,国内的市场足够大。
第二,足够的基础设施建设。
第三,人才储备。
中国在这三个方面都是数一数二的存在,所以你看OpenAI的Sora资料片都出来多久了,但是普通人都可以用的应用反而是国内先搞了出来,不仅有移动端版本,还有Web端,生成数量几乎没有限制。
其实这就是国内大模型的机会,趁着最开始的头部用户的技术停滞期,正是发力的时候,其实你如果你关注国内进展的话,你会发现已经有很多的AI大模型、产品已经出现并占据了很多领域的榜单前列。
比如在大模型领域,OpenCompass这个大模型榜单上面,前10个里面有6个是国产的大模型,甚至跟霸榜了很久的GPT4系列都相差不太大了。
再比如说AI视频生成领域,国外的贴吧redditj今天有一票人在问怎么访问快手可灵,这跟ChatGPT不让中国用户访问的时刻太像了,满世界找可以用可灵AI的方法。
大模型智能的发展:头部玩家如OpenAI、Microsoft这种外国玩家等在大模型研发方面的进展确实很可观,但也面临着成本高、复杂度大、应用场景落地难等问题。这为国内的大模型提供了一个契机,可以从大模型智能的研究中汲取经验,找到细分市场或专注领域,开发具有差异化竞争力的产品。
特别是在大模型的光环下,应用层面的创新常被忽视。实际上,很多工作流程和业务环节都可以通过AI实现效率提升。例如,智能客服系统、自动化数据分析、精准营销推荐、以及智能内容生成等,都是企业可以深耕的方向。
对于大多数的国内互联网用户来说,虽然ChatGPT已经发布了1年多,但实际上大多数人对它的认识还在于写作文和回答一些不着四六的问题,其实这个没有太多的AI噪音的时刻,对于没有接触AI的人也是一个极好的机会。
就单单从日常工作角度来看,有很多的工作都可以由AI来替代或者辅助,比如内容整理,说白了就是读各种资料,就是一项几乎所有工作中都会碰到的问题。你可能每天都需要去读很多的资料,并且这些资料的一个共同点就是不够精炼。
你可以想想,十几页的文件可能中心意思就几个点,但是可能得花几个小时,而这个时候最好的方法就是让AI来帮你粗读。
比如这个国产的大模型Kimi Chat,就是一个非常强的AI辅助阅读神器,它一次性可以读50个文档,没个文档的大小不超过100MB就行,可以说一次性可以读非常多的资料。
它的使用其实并不难,更重要的是知道该什么时候用这类型AI工具,因为每个工具都有自己的优缺点,比如刚刚提到的kimi,它是可以一次性读50份文档,但是它的阅读精准度会随着文档越来越多而有所下降,所以一次性读个5-10篇文档的结果是比较准确的,太多了很容易造成疏漏。
AI工具或多或少都会面临类似的问题,也就是实际使用过程中不能倚靠它的理想性能,更要考虑它的限制,比如你用AI做PPT,最主要的不是华丽,而是要反复确认它有没有遗漏的点,所以你在设计Prompt的时候就得针对性的让AI去给每个点编号,且让它利用「思维链」的特性自行自我反思以及修正。
还有一个好处就是如果你想通过AI发展一门自己的副业,其实AI的作用就是能让你变成一个多面手,在以前如果你要发展副业,你不可能既会写文案,又会剪视频,还会搞数据分析,就算你会,你也不可能有这么多的时间。
但是现在不一样了,你只需要熟练掌握AI工具,你要做的真正的创意,你的创意是独一无二的东西。
一旦有了创意,你就可以用你手下的「打工AI」,做各种需要专业技能的事情。
比如写文案,如果你能提供一个不错的标题,以及一个你想要实现的效果,这类型的AI工具你可以找到很多。
但是还是之前提到,AI是有缺点的,如果你不清楚就直接用,很容易产生两个结果:1 对AI生成的结果预期太高 2 没有注意到AI生成的内容中的问题。