👀日报合辑 | 🎡AI应用与工具大全 | 🔔公众号资料下载 | 🍩@韩信子
📢 用魔法打败魔法!基于面部、手势和声音识别名人 deepfake 视频
https://www.pnas.org/doi/pdf/10.1073/pnas.2216035119
Deepfake 是 AI 生成的“假”图像、音频和视频,使用自动编码器或生成对抗网络,将原始图像/音视频中的人替换为其他人的肖像,从而轻松欺骗普通观众。自几年前推出以来,Deepfake 被居心叵测者大规模用于欺诈、色情或诽谤活动而备受关注。随着 Deepfake 技术变得越来越复杂,确定视频的真实性也变得越来越困难。
约翰内斯-开普勒体育馆和加州大学伯克利分校的研究人员创建了一个 AI 应用程序,可以确定某段视频是真实的,还是由 Deepfake 伪造的,并将研究结果发表在《National Academy of Sciences(美国国家科学院院刊)》。研究人员使用了某位名人的几个小时的真实视频进行训练,提炼此人特定的视觉、手势和声音特征,用于将真假视频区分开来。研究人员使用训练后的 AI 程序对几个真假视频进行判别,实验结果是 100% 成功!
ShowMeAI 🎡AI应用与工具大全 页面,汇总了100+人工智能工具,包括个人、企业、行业、科研等4大应用场景,智能家居、增强现实AR、运动健康、聊天机器人、广告营销、教育、农业、无人机、自动驾驶、文本生成、图像生成等领域!是AI开发者和数字行业工作者的百宝箱!如有遗漏或推荐,欢迎联络留言!
GitHub Copilot、OpenAI Codex 编程助手已声名在外,借助 AI 完成许多繁琐重复的编程任务,大大提升了程序员的编程效率。不过一些相对
🎡 『Replit Ghostwriter』解释&生成代码的 AI 编程助手
https://replit.com/site/ghostwriter
Replit 11月推出了 AI 驱动的编程助手 Ghostwriter,可以运行于 Replit 在线开发环境中,为编程提供建议和辅助。Ghostwriter 包括四个主要组件:补全代码(分析编程内容并提供后续建议)、解释代码(分析现有代码并使用自然语言解释其功能)、转换代码(按照提出的要求重构代码)、生成代码(根据提示创建新代码)。
Replit 表示 Ghostwriter 支持16种语言(包括SQL、C、Java、Perl、Python 和 Ruby、HTML、CSS等),但在 JavaScript 和 Python 上表现最好。
🎡 『清华 CodeGeeX』多语言代码生成模型
https://keg.cs.tsinghua.edu.cn/codegeex/index_zh.html
CodeGeeX 是一个具有 130 亿参数的多编程语言代码生成预训练模型,在 20 多种编程语言的代码语料库(>8500亿Token)上预训练得到。CodeGeeX 支持 Python、C++、Java、JavaScript、Go等多种主流编程语言的高精度代码生成,并且可以在不同编程语言间进行自动翻译转换。
CodeGeeX 已经发布了免费的 VS Code插件 和 JetBrains IDEs 插件,感兴趣的小伙伴可以尝试一下!
🔥 『OpenAI · Point-E』OpenAI 最新开源 Point-E,高效生成3D点云模型
https://github.com/openai/point-e
本周 OpenAI 开源了一个新的机器学习系统 Point-E ,可以根据文本提示在一两分钟内创建 3D 点云模型。Point-E 由“文本-图像”和“图像-3D”两个模型组成:“文本-图像”模型类似于 DALL-E 2 和 Stable Diffusion,根据文本提示生成图像;“图像-3D”模型将图像与3D对象进行有效转换。
OpenAI 研究人员表示,Point-E 经过数百万3D对象及相关元数据的训练后,可以产生匹配文本提示的彩色点云。虽然“图像-3D”模型有时无法理解前序“文本-图像”模型产生的图像,导致最终的形状与文本提示不匹配,但仍然实现了几个数量级的效率跨越——将制作时间从几天、几小时压缩为几分钟!
AI 驱动的 3D 模型合成可能成为下一个行业颠覆者,对于3D打印、游戏开发、动画制作、室内设计、景观设计、建筑、制造等行业有着巨大的影响!OpenAI 也有望进入 3D 对象生成领域,于今年早些时间发布 DreamFusion 的Google 再次短兵相接。
🔥 『Google · CALM』谷歌提出CALM算法,加速语言模型的文本生成
https://ai.googleblog.com/2022/12/accelerating-text-generation-with.html
谷歌在 NeurIPS 2022 发表了 Confident Adaptive Language Modeling(CALM)模型,通过提高推理时效率来加速语言模型(LM)的文本生成,其原理是“直觉认为某些下一个单词的预测比其他单词更容易”。当前 LM 为所有预测投入相同数量的计算能力,而 CALM 将计算资源动态分布在生成的时间步长上,允许模型在足够自信时提前退出计算序列。
如下图所示,使用常规语言模型(上方)和 CALM(下方)生成文本。CALM试图做出早期预测。一旦足够自信(深蓝色调),它就会跳过并节省时间。通过选择性地将更多的计算资源分配给更难的预测,CALM 可以更快地生成文本,同时保持输出质量。
|
🚧 『Manim Slides』使用 manim 进行现场演示的工具
https://github.com/jeertmans/manim-slides
Manim 是一个创建数学动画的 Python 框架。Manim Slides 是一个使用 Manim 进行现场演示的工具。
🚧 『Bloxs』notebook 数据显示工具库
https://github.com/mljar/bloxs
Bloxs 在 notebook 中以方块形式显示可视化的数据与信息,支持 Jupyter Notebook、Google Colab、Deepnote、 Kaggle Notebook 和 Mercury。
|
🚧 『Robb Oat』自动读取 GitHub issues 并提交 pull requests
https://github.com/robb-oat/server
Robb Oat 是一名“新手软件工程师”,repo 安装这个程序后,可以每分钟自动读取 GitHub issues 并提交pull requests,试图修复它理解的每个 GitHub 问题。
|
🚧 『tyro』简单易用的 Python 命令行界面开发库
https://github.com/brentyi/tyro
tyro 是一个简单易用的 Python 命令行界面开发库,核心接口由函数 tyro.cli() 组成,用于构建 CLI 接口和配置对象。它具备强大的类型化、最小的开销、模块化和自动补全等特征。
🚧 『burn』深度学习框架(Rust)
https://github.com/burn-rs/burn
BURN 旨在成为一个完整的深度学习框架,让研究人员与从业者更轻松地试验、训练和部署模型。BURN 库使用 Rust 编写,具有灵活直观的自定义神经网络模块,全面支持metric
、logging
和checkpointing
。
◉ 点击 👀日报合辑,公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。
◉ 点击 🎡AI应用与工具大全,体验100+前沿AI产品带来的效率飞跃。
◉ 公众号 🔔ShowMeAI研究中心 回复关键字 日报,免费获取独家AI发展趋势报告、原创AI专题资料合辑,一览AI技术发展前沿,捕捉有价值的业务应用案例!