大家好,今天继续聊聊 AI 科技圈发生的那些事。分享几个最新好玩、实用的AI工具。更多最新技术,文末加入我们。
LivePortrait
LivePortrait:一款可以轻松让一幅肖像栩栩如生的工具
它可以精准操控眼睛和嘴唇动作:
-
让静态照片变为流畅动态视频,颠覆传统动画制作,处理多人物肖像无缝拼接,自然流畅。
-
解决传统动画制作难题,高质量高效率,精确控制眼睛和嘴唇动作,微表情逼真。
-
采用先进技术方法,生成速度快,支持多风格肖像,提供更多创意空间。
案例
使用方法
1、克隆代码并准备环境
git clone https://github.com/KwaiVGI/LivePortrait
cd LivePortrait
# create env using conda
conda create -n LivePortrait python==3.9.18
conda activate LivePortrait
# install dependencies with pip
pip install -r requirements.txt
2、下载预训练权重
pretrained_weights
├── insightface
│ └── models
│ └── buffalo_l
│ ├── 2d106det.onnx
│ └── det_10g.onnx
└── liveportrait
├── base_models
│ ├── appearance_feature_extractor.pth
│ ├── motion_extractor.pth
│ ├── spade_generator.pth
│ └── warping_module.pth
├── landmark.onnx
└── retargeting_models
└── stitching_retargeting_module.pth
3、推理
python inference.py
GraphRAG
微软最近开源 GraphRAG,构建知识图谱增强大模型的问答、推理等能力
-
GraphRAG 通过构建实体知识图谱来增强大模型的搜索、问答、摘要、推理等能力,特别擅长处理大规模数据集。
-
GraphRAG 的核心包括构建实体知识图谱和生成社区摘要两个步骤,通过社区摘要提取数据集中相关信息,生成更全面和准确的答案。
-
GraphRAG 对 tokens 的需求很低,能够帮助开发者节省成本。在综合测试中表现优异,是目前最佳的RAG方法之一。
基于 Python 的开源将在https://aka.ms/graphrag
上发布
Fish Speech
Fish Speech 完美支持中英日语言的开源TTS模型
-
语音处理接近人类水平
-
模型使用约十五万小时三语数据训练,对中文支持非常的完美。
-
该项目由 fishaudio 开发,作为一个仅有亿级参数的模型,Fish Speech 设计高效轻量,可以在个人设备上轻松运行和微调,成为您的私人语音助手。
使用方法
Github:https://github.com/fishaudio/fish-speech
资料获取和交流
技术要学会分享、交流,不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。
成立了大模型算法技术交流群,相关资料、技术交流&答疑,均可加我们的交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。
方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2040,备注:来自CSDN + 技术交流
通俗易懂讲解大模型系列
-
重磅消息!《大模型面试宝典》(2024版) 正式发布!
-
重磅消息!《大模型实战宝典》(2024版) 正式发布!
-
做大模型也有1年多了,聊聊这段时间的感悟!
-
用通俗易懂的方式讲解:大模型算法工程师最全面试题汇总
-
用通俗易懂的方式讲解:不要再苦苦寻觅了!AI 大模型面试指南(含答案)的最全总结来了!
-
用通俗易懂的方式讲解:我的大模型岗位面试总结:共24家,9个offer
-
用通俗易懂的方式讲解:大模型 RAG 在 LangChain 中的应用实战
-
用通俗易懂的方式讲解:ChatGPT 开放的多模态的DALL-E 3功能,好玩到停不下来!
-
用通俗易懂的方式讲解:基于扩散模型(Diffusion),文生图 AnyText 的效果太棒了
-
用通俗易懂的方式讲解:在 CPU 服务器上部署 ChatGLM3-6B 模型
-
用通俗易懂的方式讲解:ChatGLM3-6B 部署指南
-
用通俗易懂的方式讲解:使用 LangChain 封装自定义的 LLM,太棒了
-
用通俗易懂的方式讲解:基于 Langchain 和 ChatChat 部署本地知识库问答系统
-
用通俗易懂的方式讲解:Llama2 部署讲解及试用方式
-
用通俗易懂的方式讲解:一份保姆级的 Stable Diffusion 部署教程,开启你的炼丹之路
-
用通俗易懂的方式讲解:LlamaIndex 官方发布高清大图,纵览高级 RAG技术
-
用通俗易懂的方式讲解:为什么大模型 Advanced RAG 方法对于AI的未来至关重要?
-
用通俗易懂的方式讲解:基于 Langchain 框架,利用 MongoDB 矢量搜索实现大模型 RAG 高级检索方法