先简单介绍一下阶跃星辰吧
公司的创始人兼CEO是姜大昕博士,他在微软担任过全球副总裁,同时也是微软亚洲互联网工程研究院的副院长和首席科学家。
2024年3月,阶跃星辰发布了Step-2万亿参数MoE语言大模型预览版,这是国内初创公司首次发布的万亿参数模型。
而Step-1X,是阶跃星辰在2024年世界人工智能大会上亮相的文生图模型。Step-1X在深度语义对齐和细节生成方面进行了重点打磨,采用了自研的DiT(Diffusion Models with Transformer)模型架构,能够准确理解复杂指令,并支持长达2000个字符的图片生成指令。
今天阶跃星辰就正式的在他的开放平台上发布了Step-1X
阶跃星辰开放平台 (stepfun.com)
Step-1X尤其在在处理中国元素和文化方面具有独特的优势,能更好地理解和传达文化精髓,适用于广告创意、游戏美术、影视制作等多种场景。
目前阶跃星辰的估值大约为20亿美元。
我在之前也写过一篇有关阶跃星辰Step Fun-1V的模型介绍,
感兴趣的小伙伴们可以去看一下。
国产最强多模态大模型Step Fun-1V,究竟有多好用?_国内多模态模型-CSDN博客
先来看几张用Step-1X生成的图片:
这几张图片的效果还是非常不错的,尤其国风的色彩非常浓厚,整体画面表现的美感和张力也是比较足的。
Step-1V应该是国内第一个在这方面具有较大优势的自研文生图模型。
那接下来,我们去他的开放平台进行一下实操,给大家看一下最真实的效果。
右侧可以选择模型,这里我选的就是step-1v
size就是指图片大小
step就是生成步数:生成影响模型生成的准确度和速度,取值范围是[1-100],通过改变步数,可以控制生成的效果和速度。值越大,生成的图片越准确,同时速度越慢。
cfg就是分类器引导强度:可用于控制扩散模型对于 Prompt 的遵循程度,取值范围在 (1-10]之间,支持 2 位小数。值越大,则模型对于 Prompt 的遵循程度越高。
先来试一下最近比较火的游戏,让他帮我画一个黑神话悟空出来,不做任何的提示。
呃,效果好像不太行。
接下来试一下用一个简单的prompt看看生成的效果。
这个提示词的中文是:
“我现在想画一个动漫风格的图片,一男一女穿着九十年代港风复古的服装,躺在绿色的草坪上,看着黑色的天空中布满了星星。”
效果还是非常可以的,服装确实是九十年代的港风。
再试一下国风的效果怎么样。
提示词比较复杂,但是能看出来整体的效果还是非常可以的,有点那个意思了。
接下来我们在试一下他的隐藏玩法,用Step-1v分析图片,再用Step-1X生成图片。
这是原来的图片
接下来直接把回答的内容给到Step-1X,看看效果。
效果非常不错哟~
又把刚才的港风草地,优化了一下prompt,生成出来的效果就更好咯
下面在欣赏几张生成的图片
嘶,突然奇想!有个idear不知当不当讲?
既然文生图试过了,不妨再试试用Step-1V-32K能不能直接生成出一个软件。就是不是生成代码的那种。
用通俗的话讲就是“文生软件”,用自然语言来生成应用程序。
我告诉跃问能不能帮我生成出一个智能聊天机器人的应用,结果显而易见好像是不太行。
于是我就去网上搜了一下有没有AI能直接生成出一个软件或者应用程序的。
嘿!您猜怎么着?结果还真的被我搜到了
而且我还测试了一下他的效果,真的好炸裂,我只能说这个炸裂的程序比Step-1X生成图片的效果还要爆!
待我整理一下思路,明天给大家演示一下,我是如何用这个究极炸裂的AI工具生成一个智能聊天机器人的。
不妨给我点个小关注,明天第一时间通知大家哦~