华策影视AIGC工程师招聘; 百度大模型创业松;主流大语言模型的技术原理细节;AIGC Prompt的七个缺陷 | ShowMeAI日报

news2024/12/30 2:03:14

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🎯 华策影视AIGC工程师招聘,AIGC在「文娱领域」的真正落地

逛即刻时发现关注的AI博主 @杨昌 发布了自己公司的招聘信息,而且附上了团队氛围和工作感受等分享。华策影视是影视行业龙头企业,成立了 AIGC 应用研究院,重视AI且不算卷。岗位 base 上海,感兴趣可以前往社交媒体主页查看详情~ ⋙ 即刻 @杨昌 | 了解更多

🏆 百度 AGI Foundathon 大模型创业松,LLM 时代的应用层创业

https://aistudio.baidu.com/competition/detail/1040/0/task-definition

百度飞桨、文心大模型联合百度风投,举办了「AGI Foundathon 大模型创业松」,邀请世界各地的AI开发者和创业团队,基于「文心大模型」构建具备商业价值的 Generative AI 应用。

第一期活动分为三个方向,需要在初赛截止 (2023年10月11日) 前提交商业策划书:

  1. 创新应用:根据实际需求,自由选定方向构建应用

  2. 场景落地:理解需求场景,一起来进行大模型技术和企业需求场景的合作共建

  3. 文心一言插件赛道:结合D端或B端开发者能力、数据或第三方服务能力,建设插件 plugins ⋙ 了解更多

🧰 Runway 发布自定义镜头控制,人人都是导演的时代到来了

https://twitter.com/runwayml/status/1701218011984654403

Runway 是人工智能生成视频方向的独角兽,并在上周发布了生成视频的4种不同的运镜功能,并且这些功能之间还可以相互叠加。

这篇文章用同一个视频片段演示了几种非常不错的运镜方式,非常值得收藏和模仿:

1. Custom camera control 自定义摄像头控制

  • Speed 速度控制 (1~10)

  • Horizontal 水平运镜 (向左/向右)

  • Vertical 垂直运镜 (向上/向下)

  • Zoom 推近推远 (放大/缩小)

  • Roll 旋转运镜 (顺时针/逆时针)

2. 运镜叠加玩法两种模式

  • Horizontal 水平运镜 + Vertical 垂直运镜

  • Horizontal 水平运镜 + Zoom 推近拉远

  • Vertical 垂直运镜 + Zoom 推近推远

  • Roll 旋转运镜 + Zoom 推近推远

3. 运镜叠加玩法三种模式

  • Horizontal 水平运镜 + Vertical 垂直运镜 + Zoom 推近推远 ⋙ 阅读原文

👀 生成式AI的未来是什么?可以从这15张图表中一窥究竟

ShowMeAI 知识星球资源编码:R185

这是麦肯锡在8月底发布的一篇博文,切入视角非常有意思!作者回顾了麦肯锡在生成式AI爆发早期 (今年4月左右) 的一些报告和结论。

作者截选了15张图片来进行更详细的阐述。ShowMeAI 将所有图片整理成了一份 PDF 文档,可以扫码前往知识星球下载保存。今天的日报只选择其中几张进行展示:

  • 生成式AI技术正在快速迭代发展,各种新模型和应用层出不穷

  • 生成式AI预计在本世纪内在许多技能上达到人类表现中等甚至较高水平,时间缩短了40年

  • 生成式AI最大影响是知识型工作的自动化,如教育、法律、技术等领域

  • 各行各业的特定应用正在不断涌现,专业化的应用更有价值

  • 不同行业获得的价值各有不同,但销售营销作用普遍重大

  • 评估业务,找出最高价值的具体使用案例非常关键

  • 虽然生成式AI应用广阔,但大多数组织还很少使用

  • 销售营销领导最看好提升主导权、营销优化和个性化外展等应用

  • 软件开发效率可能大幅提高,节省大量时间

  • 生成式AI让开发者更快乐,更易保留人才

  • 各行业员工已经开始广泛使用生成式AI工具

  • 组织需要培养更多生成式AI人才以满足需求

  • 应谨慎采用,注意风险,保持人工审查

  • 如果培训员工掌握新技能,生成式AI可大幅提升全球GDP ⋙ 阅读原文

🚀 AI Grant (AI版YC) 公布第二期 29 个项目,扒一扒所有项目底细

https://aigrant.com

AI Grant由Github前CEO / 知名投资人Nat Friedman和Daniel Gross共同设立,聚焦AI产品的投资孵化。入选项目将获得25万美金的投资和35万美金的Azure credits等创业激励

AI Grant 第一期于去年8月开始,一共入选26个项目,包括今年热度很高的AI创业公司Perplexity、Relicate、Dust等。第二期项目于今年6月底开始,竞争空前激烈,并于上周公布了入选名单,一起来看看:

自动化效率工具

  • Lindy:你的AI个人助理

  • Induced:AI-first browser RPA platform.

  • Zeta Labs:Automate routine online tasks.

  • Lightpaper:AI assembly lines for knowledge workers.

聚焦细分场景的写作助手

  • Jenni:服务于研究人员的写作助手

  • AutogenAI:AI标书助手

效果导向的内容生成

  • Coframe:基于UI元素自动生成变体,通过A/B测试确定最优解

  • Opus Clip:一键将长视频分割成多个爆款短视频

用户体验提升

  • Merlin:能主导对话且跟进询问的AI用户访谈工具

  • Speakshyft:实时口音翻译工具

非结构化内容处理

  • 5.1 Mathpix:服务于科研人员的文档效率工具

  • 5.2 Freed:医疗场景的AI抄写员

  • Kino AI:对原始录像素材进行管理和搜索的桌面应用

人类情感模型

  • Hume AI:专注于人类情绪的研究

AI风险

  • Reality Defender:Deepfake技术探测器

AI玩具

  • Curio:可以讲话的玩具

  • Portola:给小孩的电子玩具 ⋙ 查看所有项目的详细介绍 | AI Grant第三期目前已经允许创业者申请

📚 主流大语言模型的技术原理细节

这是一篇技术感十足的文章,比较了 LLaMA、ChatGLM、Falcon 等大语言模型的细节,详细介绍了大语言模型的分布式训练技术、以及大语言模型的参数高效微调技术。

上方是课程要点思维导图,可以清晰地看到文章重点。以下是原文大纲,如果有你感兴趣的内容,可以前往对应位置查看技术细节内容的介绍:

1. 大语言模型的细节

  • transformer 与 LLM

  • 模型结构

  • 训练目标

  • tokenizer

  • 位置编码

  • 层归一化

  • 激活函数

  • Multi-query Attention 与 Grouped-query Attention

  • 并行 transformer block

  • 总结-训练稳定性

2. LLM 的分布式预训练

  • 点对点通信与集体通信

  • 数据并行

  • 张量并行

  • 流水线并行

  • 3D 并行

  • 混合精度训练

  • 激活重计算

  • ZeRO,零冗余优化器

  • CPU-offload,ZeRO-offload

  • Flash Attention

  • vLLM: Paged Attention

3. LLM 的参数高效微调

  • 为什么进行参数高效微调?

  • prompt tuning

  • prefix tuning

  • adapter

  • LLaMA adapter

  • LoRA

  • 实验比较

4. 参考文献 ⋙ 阅读原文

📋 AIGC 图像生成,Prompt 的七个缺陷与解决方案汇总

这是一篇非常「妙」的学习笔记,作者根据自己的经验对 Prompt 的种种限制进行了总结,并给出了当下比较有效的解决方案。当我们摸到了工具的能力边界,使用它们的时就能更从容和高效。

  1. 写作技能:将三维的画面转化为一维的文字是有挑战性的 需要反复书写带来的经验累积或是专门的学习

  2. 文本特性:文本的多义性会使得模型的理解发生偏差,生成内容无法切中创作者的真实意图 基于错误反馈不断对导致歧义的内容进行替换和校正

  3. 字数限制:超过AI模型对字数理解的「上限」后,Prompt 中添加再多的细节描述也无法被正确理解 限制提示词的字数

  4. 规则格式:模板化的提示词更容易被模型理解而且更稳定 需要学习并熟练掌握基于技术逻辑反推出的指令公式,以及控制各类权重的命令参数

  5. 作用关系:同一条 Prompt 中出现冗余甚至相互对立的信息 通过删A留B、删B留A的方式反复比对来定位修改点

  6. 细节控制:需要对形式、位置、比例、层次、关系等要素进行专业严谨处理的场景,模型能否精准执行 依靠 Prompt 进行精细化控制并不现实

  7. 生成预期:生成前不能预测结果,生成过程又类似于黑箱 先生成几张看看什么效果,找到符合预期的那张再继续深入

为了降低 Prompt 的学习和使用门槛,平台从产品、工具和教程等进行了很多的努力,比如一键复制、智能补全、创作手册、撰写教程。

当然技术侧的进展更快,涂抹、叠加、扩展等二次编辑能力,以Lora为代表的微调模型,还有Controlnet技术,支持边缘检测、草图处理、姿势识别等前沿黑科技,都在试图融合更多其他模态的意图信息,与Prompt形成互补,让生成结果更加精准可控 ⋙ 阅读原文

📺 Hugging Face 的 Diffusion Models (扩散模型) 课程

这是由 Hugging Face 组织的一门关于扩散模型 (Diffusion Models) 的免费课程,可以帮助学生全面理解扩散模型,并通过多个实践项目掌握使用和训练扩散模型的技能。课程适合有一定深度学习和PyTorch基础的学生学习。

以下是对该课程的4个章节的关键内容总结,感兴趣可以前往 GitHub 阅读详细的教程:

第1章:Diffusion 模型入门

  • 介绍什么是 Diffusion 模型及其生成图像的迭代优化过程

  • 使用 Diffusers 库实际体验 Diffusion 模型的训练和采样过程

  • 从零开始实现一个Diffusion模型,了解各个组件的设计决策

第2章:微调与引导

  • 使用现有模型进行微调以生成新类型的数据

  • 使用引导技术在无条件模型中添加控制生成过程的能力

  • 条件模型:利用类标签进行条件图像生成

第3章:Stable Diffusion

  • Stable Diffusion 使用潜在扩散提高运算效率

  • 基于CLIP的文本编码进行条件图像生成

  • 无分类器引导增强文本梯度

  • 使用 DreamBooth 技术对 Stable Diffusion 进行微调

第4章:探索扩散模型的更多应用

  • 知识蒸馏获得更快的采样速度

  • 训练技巧提高模型性能

  • 更好地控制生成过程:img2img、掩码引导、交叉注意力控制等

  • 视频和音频生成

  • 新型模型架构:基于Transformer和标记化表示的迭代优化 ⋙ GitHub

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1009763.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Postgresql中检测内存越界或use after free的简便方法

1 使用场景 在Postgresql的内存管理模块中,最常用的aset.c提供的内存池实现,该实现提供了两个非常实用的开关来解决常见的内存越界问题: memdebug.c * About CLOBBER_FREED_MEMORY:** If this symbol is defined, all freed memory is over…

git之工作中实际应用篇(非常适合刚到公司上班但是git不太熟又不好意思问同事的友友)

目录 前言当你刚到一个公司写代码,交自己的分支提交并推送了代码,但是有所更改第二天拉取代码切换分支远程分支太多&&本地仓库太多checkout检出失败的情况未完待续 前言 此篇用于记录笔者在工作中用到git遇到的问题及大部分的操作。 区别于理论…

无涯教程-JavaScript - FALSE函数

描述 FALSE函数返回逻辑值FALSE。 语法 FALSE () 争论 FALSE函数没有参数。 Notes 您还可以在工作表或公式中直接键入FALSE单词,Microsoft Excel会将其解释为逻辑值FALSE。 提供FALSE功能主要是为了与其他电子表格程序兼容。 适用性 Excel 2007,Excel 2010,Excel 2013…

【用unity实现100个游戏之11】复刻经典mirror消消乐游戏

文章目录 前言开始项目开始一、方块网格生成二、方块交换三、添加交换的动画效果四、水平消除检测五、垂直消除检测六、完善删除功能七、效果优化(移动方块后再进行消除检测)八、方块下落十、方块填充十一、后续 源码参考完结 前言 欢迎来到经典消消乐游…

数据清洗:数据挖掘的前期准备工作

⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️ 🐴作者:秋无之地 🐴简介:CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作,主要擅长领域有:爬虫、后端、大数据…

释放潜能!RunnerGo:性能测试的全新视角

在数字化时代,性能测试已成为企业持续发展的关键一环。但面对繁杂的工具和流程,很多企业却陷入了无从选择的困境。现在,一款名为RunnerGo的全新性能测试工具正悄然崭露头角。 RunnerGo,一款由国内开发者自主研发的全栈式性能测试…

最新模块化设计小程序系统源码完整版:开源可二开,支持DIY

随着互联网的快速发展,小程序已成为各行各业开展业务的重要工具。而模块化设计小程序系统源码完整版则是一种高效、灵活、易维护的解决方案。 分享一个最新的模块化设计小程序系统源码完整版,源码开源可二开,支持自由DIY设计,含完…

华为云新用户:定义,优惠券及专享活动

在当今的数字化时代,云计算已成为企业与个人的必备服务。华为云,作为全球领先的云计算服务提供商,吸引了众多新用户的关注。本文将详细介绍华为云新用户的定义、优惠券及专享活动相关内容,帮助大家更好地了解华为云新用户优惠政策…

win10win11截图技巧——不用安装其他截图工具或者运行其他截图工具,就可以截图,win10和win11可用

快捷键shift wins可以调出来windows自带的截图工具。 测试了一下win10和win11都可以用。 可以截图的方式有: 1,全屏截图, 2,窗口截图, 3,任意截图, 4,画矩形截图 以下内容来自…

算法竞赛入门【码蹄集新手村600题】(MT1280-1300)C语言

算法竞赛入门【码蹄集新手村600题】(MT1280-1300)C语言 目录MT1281 N的M次方MT1282 Disarium数MT1283 区间Disarium数MT1284 快乐数MT1285 忠实数MT1286 忠实数序列MT1287 ASCII值MT1288 谁在说谎MT1289 调和级数不等式MT1290 级数MT1291 级数IIMT1292 某级数MT1293…

一百七十七、Hive——海豚调度执行Hive的.sql文件

一、目的 对于Hive数仓,每一层的建库建表SQL语句都各自放在一个.sql文件里,然后用海豚调度执行一下Hive的.sql文件 二、实施步骤 (一)第一步,上传.sql文件到海豚调度器上 (二)第二步&#xf…

分享一个java技术开发的springboot线上问卷调查可视化系统源码 lw 调试

💕💕作者:计算机源码社 💕💕个人简介:本人七年开发经验,擅长Java、Python、PHP、.NET、微信小程序、爬虫、大数据等,大家有这一块的问题可以一起交流! 💕&…

帝国CMS的Sitemap网站地图生成插件下载及教程

具体使用方法: 第一步:解压下载 stitemap 压缩包; 第二步:修改config.php里的网址为自己的网址。 1、如果网站站点是响应式的直接选择pc即可。 2、如果电脑站和手机站不一样则都需要修改。 第三步:将解压出的“sitema…

4.docker容器编排(docker compose 与 docker swarm)

本文目录 1.容器编排2.Docker Compose1.Docker Compose 安装2.Docker Compose 示例1.使用 docker-compose 启动 nginx2.docker compose 常用命令3.校验 docker-compose.yml 是否有错误4.创建服务&#xff0c;启动容器5.弹性伸缩<扩缩容> 3.Docker Swarm1.Swarm 架构图2.S…

华为云云耀云服务器实例管理域名

目录 域名概述 通过域名访问网站流程 域名注册、解析和备案的关系 域名解析 如何修改 域名概述 部署一个网站或Web应用后&#xff0c;若要使该网站能够在Internet上通过域名直接访问&#xff0c;需要为网站注册域名、备案以及配置解析。 通过域名访问网站流程 1、注册域…

虚拟电影 故事板创作 Frameforge Studio 4.0.6 Crack

虚拟电影工作室 故事板创作 Frameforge Storyboard Studio 4.0.6 是一个功能齐全的故事板程序&#xff0c;由著名导演及其要求共同创建。该软件将节省大量的时间&#xff0c;金钱和头痛&#xff0c;如果你是一个导演&#xff0c;在电影行业工作或VFX主管-这就是你要找的&#x…

小程序分销商城功能展示;

很多客户想要搭建自己的小程序商城&#xff0c;各家公司报价也是从几百到几千都不等&#xff0c;那么商城小程序开发到底需要多少钱呢&#xff1f;商城小程序一般要做哪些功能呢&#xff1f; 1、商品展示 一个商城型小程序&#xff0c;商品展示功能是必须要有的&#xff0c;这…

全球与中国BGO晶体市场:增长趋势、竞争格局与前景展望

BGO晶体&#xff0c;全名为Bismuth Germanate Scintillation Crystal&#xff08;铋锗酸盐闪烁晶体&#xff09;&#xff0c;是一种用于探测放射性粒子和射线的闪烁晶体材料。它的主要成分是铋氧化物&#xff08;Bi4Ge3O12&#xff09;&#xff0c;其中铋和锗的特性使得这种晶体…

用 Canvas 画简易手电筒

本文章适合人群: 具备 html、js 基础的人对于想入门 canvas 的人 本文章较为简单&#xff0c;大佬可略过 实验结果 一个跟随着鼠标移动的圆圈。 教学 要实现一个动态手电筒效果&#xff0c;我们可以使用Canvas来绘制一个黑色的遮罩层&#xff0c;并通过鼠标或触摸事件来控…

JLink更新固件成砖头的QA

问题&#xff1a;用了新版的keil&#xff0c;更新固件后不能用了&#xff0c;怎么办啊 插上Jlink之后&#xff0c;驱动提醒您更新最新的V11版本固件&#xff0c;然后点了更新&#xff0c;更新结束之后/重新上电之后&#xff0c;Jlink的灯会变成红色闪烁5次然后变绿色&#xff0…