# | 2024年第14周 | 2024年8月16日 |
---|---|---|
1 | cursor | 一款功能强大的开源编程助手,利用大型语言模型(LLM)技术,通过交互帮助开发者完成代码补全、函数级代码生成等任务。Cursor不仅理解代码库,还能从中提取最匹配的代码,并引用特定文件或文档。开发者只需简单操作,即可在编辑过程中享受到智能推荐的便利。。它支持多种编程语言,如Python、Java、JavaScript等,并提供了丰富的插件生态系统,方便用户根据需要进行扩展。 |
2 | pyvideotrans | 将视频从一种语言翻译为另一种语言,并添加配音.这是一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。 语音识别支持 faster-whisper模型 openai-whisper模型 和 GoogleSpeech zh_recogn阿里中文语音识别模型. 文字翻译支持 微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT 文字合成语音支持 Microsoft Edge tts Google tts Azure AI TTS Openai TTS Elevenlabs TTS 自定义TTS服务器api GPT-SoVITS clone-voice ChatTTS-ui Fish TTS CosyVoice 允许保留背景伴奏音乐等(基于uvr5) 支持的语言:中文简繁、英语、韩语、日语、俄语、法语、德语、意大利语、西班牙语、葡萄牙语、越南语、泰国语、阿拉伯语、土耳其语、匈牙利语、印度语、乌克兰语、哈萨克语、印尼语、马来语、捷克语、波兰语 |
3 | Frigate | 一个为 Home Assistant 设计的完整的本地 NVR,具有 AI 物体检测功能。使用 OpenCV 和 Tensorflow 对 IP 摄像机进行本地实时物体检测,并根据用户定义的规则触发警报 |
4 | flux | 由Stable Diffusion原班人马打造的开源文生图模型,因逼近Midjourney的出色生成质量成为文生图领域的“开源王者”。模型来自于德国创业公司 Black Forest Labs,拳打MJ脚踩SD,图片质量做到了行业天花板,道德底线也压到了地板砖FLUX.1采用了Stable Diffusion 3类似架构,但新引入了DoubleStreamBlock结构,达到了超越Stable Diffusion 3 甚至挑战Midjourney V6的生成质量。在对指令的精准遵循、文字生成能力、手部细节生成等方面,FLUX.1表现尤为突出,展现出在文生图领域的革新潜力。12B的模型就有23.8G大,低于12G的显卡完全没戏了。实测,起码得有16G显存,才能比较顺畅在本地跑好这个FLUX。 |
5 | PayloadsAllTheThings | 网络应用安全和渗透测试的资源集合。该项目汇集了多种有用的有效载荷和绕过技术,旨在帮助安全研究人员和渗透测试人员提高他们的工作效率。 项目用途 “PayloadsAllTheThings”提供了一系列的有效载荷和技术,涵盖了多种网络安全漏洞的利用方法。项目的主要功能包括: 漏洞描述与利用:每个章节详细描述了特定漏洞的性质及其利用方式,提供了多种有效载荷供用户参考。 工具集成:项目中包含了与Burp Suite等渗透测试工具兼容的文件,便于用户直接使用。 资源丰富:除了有效载荷,项目还提供了关于多种攻击方法的文档,如Active Directory攻击、云环境渗透测试、Linux和Windows的特权提升等。“PayloadsAllTheThings”因其全面的资源和实用性,成为网络安全领域的重要工具,受到广泛的关注和使用。 |
6 | CogVideo | 将文本描述转换为视频,支持生成高帧率的视频。该项目的主要特点包括: 文本到视频生成:用户可以输入文本提示,模型会生成相应的视频内容。 高效的模型架构:CogVideo使用了先进的变换器技术,能够处理复杂的文本输入并生成高质量的视频输出。 开源社区支持:该项目鼓励社区贡献,提供了多种示例和工具,便于开发者快速上手。 |
7 | GPT-SoVITS | GPT-SoVITS 是一个基于 GPT-3 的开源项目,可以利用少量语音数据 (只需 1 分钟) 进行语音转换和文本到语音合成。它使用了一种新的训练方法,称为 SoVITS (Self-supervised Voice Identity Transformer),可以有效地学习语音特征并将其应用于新的语音合成。 主要特点: 零样本文本到语音(TTS): 输入 5 秒的声音样本,即刻体验文本到语音转换。 少样本 TTS: 仅需 1 分钟的训练数据即可微调模型,提升声音相似度和真实感。 跨语言支持: 支持与训练数据集不同语言的推理,目前支持英语、日语和中文。 WebUI 工具: 集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注,协助初学者创建训练数据集和 GPT/SoVITS 模型。 |
8 | learn_python3_spider | python爬虫教程系列、从0到1学习python爬虫,包括浏览器抓包,手机APP抓包,如 fiddler、mitmproxy,各种爬虫涉及的模块的使用,如:requests、beautifulSoup、selenium、appium、scrapy等,以及IP代理,验证码识别,Mysql,MongoDB数据库的python使用,多线程多进程爬虫的使用,css 爬虫加密逆向破解,JS爬虫逆向,分布式爬虫,爬虫项目实战实例等 |
9 | pymc | 一个功能强大的Python包,专注于先进的马尔可夫链蒙特卡洛(MCMC)和变分推断(VI)算法。“pymc”提供了一种直观的模型规范语法,使用户能够轻松构建复杂的贝叶斯模型。其主要功能包括: 强大的采样算法:如无U转采样器(No U-Turn Sampler),能够处理具有成千上万参数的复杂模型,且对拟合算法的专业知识要求较低。 变分推断:使用自适应变分推断(ADVI)进行快速近似后验估计,适用于大数据集。 灵活性和可扩展性:支持多种计算优化和动态编译,允许用户根据需要扩展功能。因其强大的功能和灵活性,已成为贝叶斯建模领域的重要工具 |
10 | buzz | 音频转录与翻译工具。该项目是基于 Whisper 的音频转录和翻译工具,它开箱即用且操作简单,支持语音转文字、音频翻译、多种语言和离线使用,适用于 macOS、Windows 和 Linux 平台。 |
分类: Python开源项目周排行标签: 音频 AIGC
注:当前文章会不定期进行更新。如果您对本文有更好的建议,有新资料推荐, 可以点击: 欢迎分享优秀网站 。