👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
🤖 使用浏览器插件 immersive translate,将外语书翻译成双语对照版
immersive translate 是一款非常好用的浏览器翻译插件。今天的日报分享这个插件的新用法——将英语书逐段翻译成双语对照的版本,帮助更流畅地阅读。以下是操作步骤:
准备书籍的 EPUB 版本电子书 (可以前往 zlibrary-global.se 下载)
安装沉浸式翻译的浏览器插件,并启用
开始插件图标 → 点击「更多」→ 点击「制作双语 EPUB 电子书」,选择英文书籍的 EPUB 文件,等待几分钟的时间完成翻译
点击页面上「Export (导出)」按钮,就可以导出翻译好的电子书
使用任何支持 EPUB 文件的阅读工具来打开它 ⋙ immersive translate(沉浸式翻译) | z-library | 详细教程
🤖 腾讯文档正式推出「智能助手」,率先在「智能文档」中嵌入使用
申请:https://docs.qq.com/form/page/DZVNaekVFUmtWZEF3
8月18日,腾讯文档公众号正式宣布推出「智能助手」,在「智能文档」中嵌入AI工具,可以根据主题生成内容、归纳要点、润色输出,还可以文本内容优化处理、表格数据智能处理、PPT快速生成美化、收集结果自动分析、思维导图一键生成等,全方位提高生产力 ⋙ 腾讯文档
🤖 稚晖君「智元机器人」问世,创业6个月造出人形机器人
8月18日,华为前「天才工程师」稚晖君在B站举办线上发布会,宣布「智元机器人」在成立仅半年时间内就研制出了一款名为「远征A1」的人形智能机器人。
这款机器人高175厘米、重55千克,拥有49个自由度,采用了该公司自主研发的多项核心技术,包括 PowerFlow 核心关节电机、Skillhand 灵巧手、AgiROS 软件框架、WorkGPT 语言任务模型、E-Brain 智能框架等。机器人可以识别语音指令,进行自主感知和动作规划。
稚晖君表示,这款机器人旨在大规模商业化应用,可用于汽车制造、电子制造、家政服务、医疗护理等领域,计划将单机成本控制在20万元以内 ⋙ 发布会录屏
🤖 MetaGPT 作者深度解析,B站直播回放
MetaGPT 是一个多代理协作框架,可以让不同角色的GPT组成一个软件公司,协同完成从需求定义到代码实现的全流程软件开发任务,曾多日霸榜 GitHub 并狂收 22K Star ⋙ MetaGPT GitHub
最近逛 B 站的时候发现了 MetaGPT 开源项目作者本人的直播分享回放,视频全长 100 分钟左右,带你深入了解这个 Github Trending世界第一的多智能体框架。
分享内容包含解析代码、分享应用实践,帮你从理论到实践全面理解MetaGPT:
00:00 LLM发展历史
24:07 我们现在做什么事情?
47:00 为什么要做MetaGPT?
58:27 什么是MetaGPT?
62:26 让人类活得更久
64:30 让人类花更少时间工作
67:06 MetaGPT代码走读
94:50 为什么取名MetaGPT?
95:59 结尾 ⋙ B站 @深度赋智
🤖 AI创意字终极攻略!光影/隐藏/嵌入/海报4种创意字全拆解
最近各种AI创意字体特别火爆!每次在 ShowMeAI 社群分享让人眼前一亮的创意字,群里一片「求教程」的呼声~
推荐这篇 @吴东子AI 的完整版制作流程详解,包含了从制作底图、选大模型、写关键词和ControlNet参数四大步骤,让你跟着操作就能做出同款字体。
注意:文中需要用到的模型文件,作者给大家打包好放在网盘链接里了
关键词、模型链接:https://pan.baidu.com/s/11p8zSDRs5XLgQPSqkcqe-Q?pwd=wdz6
一、AI创意字有多牛逼?
海报文字
嵌入文字
隐藏文字
光影文字
二、四步做出同款AI创意字
制作底图
选大模型
三、海报文字
制作底图
选大模型
写关键词
controlnet设置
细节补充
四、嵌入文字
制作底图
选大模型
写关键词
controlnet设置
五、隐藏文字
制作底图
选大模型
写关键词
controlnet设置
六、光影文字
制作底图
选大模型
写关键词
controlnet设置
七、变现方式
八、结尾 ⋙ 阅读全文 | B站视频教程
🤖 大型科技公司最近忙什么?生成式AI最新动态一览
这篇文章写于8月8日,结合美国主要科技公司第二季度财报电话会议的信息,整理了Amazon、微软、Meta、Alphabet和Apple等公司关于生成式AI的进展。以下是主要内容,感兴趣可以阅读全文:
Amazon
计算基础设施:Amazon 通过自主研发的 Tranium 和 Inferentia 芯片以及与 NVIDIA 的合作,为生成式AI的训练和推理提供计算服务
语言模型即服务:Bedrock 为用户提供多个语言模型及服务,客户可以在不泄露数据的情况下进行模型定制
应用:Amazon 正在内部研发 CodeWhisperer 等应用,但认识到更多应用将由第三方在 AWS 上开发
微软
Azure 服务:Azure OpenAI 服务获得进展,吸引众多组织使用;Microsoft 还在投资 Azure OpenAI Studio
Github Copilot 和 Office Copilot:Github Copilot 商业版用户增长两倍,Office Copilot 用户预览反馈积极
Bing Chat 企业版:准备推出集成商业数据保护的 Bing 聊天企业版
Meta
推荐系统应用AI:利用更大模型提升推荐系统效果,增加时间花费和参与度
广告产品应用AI:使用AI优化广告投放,提升广告客户体验和投资回报率
消费类产品:暂未在核心 App 看到生成式AI应用,但将在创意工具和助手等方面推出
Alphabet
Google 搜索体验升级:搜索生成式体验beta版改进延迟和准确性,为广告商提供新格式
Google Duet 生产力工具:代码协作工具 Google Duet 覆盖用户达75万
云计算平台:云计算平台吸引客户,生态系统支持众多生成式创业公司
Apple
iOS 17 将推出集成语音助手和语音留言转文本等AI功能;Apple 表示一直在进行相关研究,并在产品成熟时公布 ⋙ 阅读原文
🤖 一文入门最热的LLM应用开发框架LangChain
在人工智能领域的不断发展中,语言模型扮演着重要的角色,特别是大语言模型 (LLM) 已经成为科技领域的热门话题,并受到广泛认可。
在这个背景下,LangChain 作为一个以 LLM 模型为核心的开发框架出现,为自然语言处理开启了一个充满可能性的世界。借助 LangChain,我们可以创建各种应用程序,包括聊天机器人和智能问答工具。
🔔 LangChain 简介
LangChain 发展史
LangChain 为什么这么火
LLM 应用架构
🔔 LangChain 组件
- Models (模型)
聊天模型
嵌入
大语言模型
- Prompts (提示词)
Prompt Templates
Few-shot example
Example Selector
- Indexes (索引)
Document Loaders
Text Splitters
VectorStores
Retrievers
- Chains (链)
LLMChain
SimpleSequentialChain
SequentialChain
TransformChain
- Memory (记忆)
ConversationBufferMemory
ConversationBufferWindowMemory
ConversationTokenBufferMemory
ConversationSummaryMemory
ConversationSummaryBufferMemory
VectorStoreRetrieverMemory
- Agents (代理)
Action agents
Plan-and-execute agents
🔔 LangChain 实战
完成一次问答
通过谷歌搜索并返回答案
对超长文本进行总结
构建本地知识库问答机器人
构建向量索引数据库
基于 LangChain 构建的开源应用 ⋙ 阅读全文 @腾讯技术工程
🤖 Llama 模型初学者指南
Llama 是 Meta (Facebook) 推出的首个开源大型语言模型,可以看作是对 ChatGPT 的开源化回应。这篇文章是一篇关于 Llama 模型的入门指南,覆盖了关于这个模型很多关键的信息,尤其适合想学习 Llama 的初学者阅读参考。
Llama 入门指南
Llama 代码、训练数据和训练方法完全开放。相比 ChatGPT 专有闭源,Llama 容易运行在个人计算机上,7亿和13亿参数的模型就可以正常使用。
Llama 工作原理
Llama 是一个预测下一个词的语言模型,可以看作是一个高级的自动完成功能。它通过大量互联网文本进行训练,理解上下文联系才能更准确预测下一个词。虽然只是预测下一个词,但通过大量文本训练,Llama 学会了一些人类思维模式。
Llama 与ChatGPT比较
相比ChatGPT,Llama 是开源的,可以本地运行,更保障隐私。也可以针对自己的需求进行模型定制和训练。而 ChatGPT 是封闭源代码,所有问题都保存在公司服务器上。
Llama 用途
可以问答、写代码、创意写作等,功能基本等同于 ChatGPT。具体来说,可以问问题获取信息,生成代码样本,总结文章要点,创作故事,修改语句风格等。
Llama 支持的语言
Llama 主要支持英语,训练集90%是英语。也支持德语、法语、中文等其他语言,但效果不佳,不太适合机器翻译。
运行Llama 需求的硬件
需要 GPU 卡运行 GPTQ 格式的模型,需要足够 RAM 运行 GGML 格式模型。具体来说,不同大小的模型需要不同显存和内存支持。
Llama 的8位和4位量化模型
8位和4位模型通过量化方法减小模型大小,降低运行内存需求,但可能会略微降低性能。这些模型每个参数只用8比特或4比特来表示,大幅降低内存占用。
Llama 的不同版本
Llama 1:Llama 1于2023年2月发布,是第一个开源的大型语言模型,只允许非商业使用。其发布引发了很多基于该模型的二次开发。
Llama 2:Llama 2于2023年7月发布,进行了迭代优化,修改了许可协议,允许商业使用。预计将引发新的开发潮流。
WizardLM:WizardLM 是在 Llama 基础上精调的模型系列,通过大量照着指令对话的训练数据增强了执行指令的能力。
Vicuna:Vicuna 同样基于 Llama 进行了精调,训练数据来自 ChatGPT 的对话。相比原始 Llama 能提供更人性化的对话。
Llama 模型比较方法
比较模型主要指标有 Chatbot Arena、MT-bench和MMLU。Chatbot Arena 通过让用户评价回答质量打分;MT-bench 用 GPT-4 评价回答;MMLU 测试57项不同任务的表现。
模型格式选择建议
如果有N卡,使用 GPTQ 格式性能更好;如果是 Mac 或无 GPU,使用 GGML 格式。
Llama 安装指南
提供了 Windows 和 Mac 系统下 Llama 模型的安装指南。
运行 Llama 的软件
推荐 text-generation-webui 图形界面和 llama.cpp 命令行界面两种软件。
Llama 的商业授权
Llama 1不可商用,Llama 2可以商业化使用 ⋙ 来源
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!