👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
🤖 太实用了!Stable Diffusion 的24个表情提示词
Pensive 沉思
Smiling 微笑
Disgusted 厌恶
Laughing 大笑
Shocked 震惊
Frowning 皱眉
Crying 哭泣
Biting lip 咬唇
Pouting 掀嘴
Rolling eyes 翻白眼
winking 眨眼
Blushing 脸红
Yawning 打哈欠
Nervous 紧张
Worried 担忧
Staring 凝视
🤖 Awesome Chinese LLM 思维导图,中文大语言模型关系图谱
🤖 Llama 2开源且可直接商用,大模型格局发生巨大变化
7月19日,Meta 发布大模型 Llama 2,宣布免费且可以商用,GitHub 项目的 Star 在几天时间里冲破 30K。一夜之间,大模型格局再次发生巨变。以下是 Llama 2 大模型的基本信息:
▢ 包含 70 亿、130 亿和 700 亿三种参数变体,此外还训练了 340 亿参数变体,但并没有发布,只在技术报告中提到了
▢ 在 2 万亿的 token 上进行训练,相比于 Llama 1 的训练数据多了 40%,精调 Chat 模型是在 100 万人类标记数据上训练的
▢ 支持的上下文 token 长度翻倍,由原来的 2048 升级到 4096
▢ 免费可商用,但日活大于 7 亿的产品需要单独申请商用权限
OpenAI 研究科学家 Andrej Karpathy 在推特上表示:对于人工智能和 LLM 来说,这确实是重要的一天。这是目前能够把权重提供给所有人使用的最为强大的 LLM。
对于开源社区来说,这个大模型就是「全村的希望」。它的出现将进一步缩小开源大模型与闭源大模型的差距,让所有人都有机会基于它构建自己的大模型应用 ⋙ Llama 2网站 | Llama 2性能测试
🤖 微软推出 Bing Chat 企业版,并公布 Microsoft 365 Copilot 定价
7月18日,微软公布了大模型产品的最新进展,包含推出 Bing Chat Enterprise (企业版) 预览版,以及公布 Microsoft 365 Copilot 定价。
Bing Chat Enterprise 将会为用户提供由 AI 支持的聊天功能,同时保护企业的商业数据—— Bing Chat Enterprise 不会保存聊天数据,微软也无法对其进行监视访问。Bing Chat 企业版已经推出预览版,未来将发布独立产品,采用付费订阅模型,价格是每位用户每月 5 美元。
Microsoft 365 Copilot 面向商业客户的价格正式出炉,Microsoft 365 E3、E5、Business Standard和Business Premium客户的价格将为每个用户每月30美元。
根据微软官方介绍,Microsoft 365 Copilot 以 Microsoft Graph 中的业务数据为基础,包括所有电子邮件、日历、聊天记录、文档等,可以帮助企业对所有业务数据进行推理,包括从会议/邮件中生成最新信息并发送给团队、帮助了解项目进展、从内部文件和网络数据中创建SWOT分析、提出问题并从网络上获得答案等 ⋙ Microsoft Blog
🤖 手把手教你使用 ChatGPT 生成 SQL 语句
这篇文章介绍了使用 ChatGPT 生成 SQL 语句的具体操作过程,非常酷炫且实用!
作者先定义了一组示例数据库表,然后让 ChatGPT 根据表的文本描述自动推断出表关系。结果!ChatGPT 居然把所有的表关系都推断出来了!
难度升级。作者使用简单的英语提示,让 ChatGPT 生成「查询客户订单数量」「查询时间范围内订单金额」SQL语句。ChatGPT 也通通做对了!写出来的 SQL 语句一个比一个靠谱!
继续升级。作者经过测试发现,ChatGPT 能够详细指出不同数据库的语法和函数差异所在,并且能够根据作者要求生成专门适用于 SQL Server 的 SQL 语句!
作者总结了使用 ChatGPT 生成 SQL 语句的注意事项:
首先定义表,注意提示词要尽可能简单
确认 ChatGPT 理解了表结构,如果没有则需要添加一个提示,解释所需的表关系
用简单、明确的提示词,描述想要的查询结果
明确告知 ChatGPT 正在使用的数据库
最后!一定一定要注意!ChatGPT自动生成的 SQL 语句并不能保证 100% 准确,需要经过验证 ⋙ 阅读原文
🤖 开源LLM微调训练指南:如何打造属于自己的LLM模型
LLM应该算是目前当之无愧的最有影响力的AI技术。而很多人在领略了 GPT 等大语言模型的魅力后,迫不及待地考虑能将模型能力集成到自己的产品中去。
这篇文章就聊到了这个话题——大语言模型 (LLM) 微调训练。这是一篇系统的 LLM 微调指南,对初学者掌握 LLM 微调技术非常有价值:
介绍:介绍了商用LLM模型存在的问题,包括使用成本高昂和数据隐私风险,因此建议微调开源LLM模型来实现自己的目标
什么是迁移学习:解释了什么是迁移学习,以及如何通过微调预训练语言模型来适应新的任务
选择合适的基础模型:提出了选择基础 LLM 模型的方法,包括参考模型排行榜、检查许可证、注意模型大小等,推荐使用 Hugging Face 的 falcon 系列
如何准备模型训练数据:详细解释了如何准备高质量的 LLM 训练数据集,包含数量、自动生成、遵循的格式等方面
如何选择模型训练环境:推荐了模型训练环境的选择,推荐了各种获取 GPU 资源的方式,建议初学者使用 Google Colab
开始训练你的 LLM 模型:指导了如何用 Hugging Face 的 Transformer 库加载模型,并使用 QLoRA 技术进行微调
模型推理:给出了模型推理的代码示例,展示了如何使用微调后的模型生成回复
总结:总结要点,微调开源LLM模型可以获得比较好的结果,适合各种实际应用场景 ⋙ @技术狂潮AI
🤖 小白秒变大神的 Python 速查表大全!这份抢手秘籍教你开挂
这是一份详细且全面的 Python 语言的速查表,可以帮助 Python 开发者快速查找和理解 Python 的各种语法和特性,可以作为非常好的语法参考手册。
速查表由7个主要部分组成,每部分都包含了基本操作、用法、示例代码:
集合类型:包含列表、字典、集合、元组、range、枚举、迭代器和生成器等的常用方法
数据类型:包含类型、字符串、正则表达式、格式化、数字、组合数学和日期时间等的用法
语法:包含参数、内联函数、导入、装饰器、类、鸭子类型、枚举、异常等的用法。
系统:包含退出、打印、输入、命令行参数、文件操作、路径、系统命令等用法
数据处理:包含 JSON、Pickle、CSV、SQLite、字节、结构化数据、数组、内存视图和双端队列等的使用
高级用法:包含线程、操作符、自省、元编程、求值和协程等的用法
常用库:包含进度条、绘图、表格、命令行界面、日志、网页抓取、网络请求、性能分析、数值计算、图像、音频、游戏、数据分析等方面的库的简单用例
附录:包含 Cython、PyInstaller、模板脚本等的相关内容 ⋙ Comprehensive Python Cheatsheet
🤖 LLM 开发必修课,6周教你用热门框架开发商业级 LLM 产品
ShowMeAI知识星球资源编码:R173
这是 Databricks 出品的「Large Language Models: Application through Production (大语言模型:产品中的应用)」在线课程,国内小伙伴们可以在 edX 网站免费观看。
这门课程面向开发人员、数据科学家和工程师,帮助使用最流行的框架 (如Hugging Face、LangChain) 来构建面向大语言模型的应用程序。通过这门课程的学习,你能够构建一个端到端的LLM工作流程,使其准备上线生产。
课程章节
▢ 模块1:用LLM应用
▢ 模块2:嵌入、向量数据库和搜索
▢ 模块3:多阶段推理
▢ 模块4:LLM的微调和评估
▢ 模块5:社会与LLM-偏见和安全
▢ 模块6:LLMOps
学习收获
▢ 如何使用流行的库 (如Hugging Face、LangChain) 将 LLM 应用到自然语言处理 (NLP) 的实际问题中
▢ 如何使用嵌入和向量数据库将域知识和记忆添加到 LLM 流程中
▢ 理解预训练、微调和提示工程的细微差别,并将这些知识应用到自定义聊天模型的微调中
▢ 如何使用不同的方法来评估 LLM 的效果和偏见
▢ 如何实现 LLMOps 和多阶段推理最佳实践的 LLM 工作流程
▢ 如何利用 LLMOps 最佳实践在规模上部署模型 ⋙ Edx
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!