👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
🉑 国家数据局正式揭牌,今年计划在国考中招录12人
10月25日上午,国家数据局正式揭牌,由国家发展和改革委员会管理。
新组建的国家数据局负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等,部分原先由中央网络安全和信息化委员会办公室以及国家发展和改革委员会承担的职责被划入。
根据国家公务员局网站信息,国家数据局今年计划在国考中招录12人,要求基层最低工作年限为3年,专业涵盖电子科学与技术、信息与通信工程、计算机科学与技术等,岗位工作内容关键词包括数据治理和发展、数字经济国际合作、数据资源管理和开发利用、数字产业化和产业数字化等 ⋙ 新闻来源@长安街知事
👀 对标 ChatGPT,观察中国大模型公司的「C端」应用进展
https://zw73xyquvv.feishu.cn/wiki/VgFYwGN1kieB2Uka1tvcbYyCnpS
这是 @Will 整理的一份中国大模型公司的C端应用进展汇总,覆盖了百度、字节、阿里、腾讯、科大讯飞、昆仑万维、智谱、月之暗面、百川、MiniMax等9家国内头部大模型厂商。
从图片显示的信息来看,国内产品已经基本覆盖了「2C免费服务」「API」「2C网页版」这三项功能,多模态功能「图像输入」正在逐步增加中。基础编程、语音转文字、知识库、文生图等高频应用场景被更多地覆盖。
与 OpenAI (灰色背景) 相比,国内大模型厂商的空白块还有很多!仍旧有漫漫长路需要追赶呐~加油 (ง •_•)ง
🉑 基于大模型的「讯飞晓医」,意外好用的个人AI健康助手
10月24日,科大讯飞正式发布了「星火认知大模型V3.0」,并推出了很多基于大模型的AI应用。今天,跟群里的小伙伴一起测试了AI健康助手「讯飞晓医」,感觉还不错!对于专业咨询和科普内容的回答,都显示了其在医学领域的专业度。
目前推出了「讯飞晓医」App和小程序两个版本,二者布局功能相同:点击魔法棒可以看到症状自查、用药建议、中医辩证、报告解读、医院推荐、科室推荐、饮食建议等功能按钮,点击图片按钮可以上传药盒、报告等并进行问答对话。
根据官方信息可以了解到,「讯飞晓医」App和小程序将化身「健康AI百事通」,为居民提供精细化的健康咨询 ⋙ 了解更多
👀 外媒评选50家最有前途的创业公司,其中19家与AI有关
https://www.theinformation.com/projects/the-information-50
The Information 是一家美国科技新闻和分析网站,自2020年起,每年都会发布一份「50家最具潜力的初创公司 (The 50 Most Promising Startup)」名单,介绍50家在科技、创新、投资领域都颇有影响力的创业公司。
The Information 今年的报告将企业分成了8组 (如上图所示),其中「Data & AI领域」包括8家公司:Midjourney、Perplexity、Modal Labs、Pika Labs、ElevenLabs、Statsig、Together和Unstructured.io;其他7个领域中至少有11家公司的业务涉及到AI领域。
👀 大模型智能体 (LLM Agent) 全景介绍:崛起、应用和未来
这是 @鹤啸九天 的新文 (出手就是大长文啊我的天)!非常清晰完整地介绍了最近火热的 Agent (智能体) 到底是什么、结构是什么、在各领域的应用、以及典型的案例们。
全文两万多字,是对大模型智能体 (LLM Agent) 内容的全面梳理,可以带你俯瞰全貌的那种!日报梳理了长文大纲和要点,带你快速看清全文的逻辑:
1. LLM:介绍了大模型 (LLM)的概念,并说明 LLM 在处理连续、与环境捆绑的任务时存在局限性,因此需要借助AI Agent来实现更广泛的应用
智能体 vs LLM
Agent → AGI
2. AI Agent:是大模型与场景间价值传递的桥梁,它具有自主理解、规划决策和执行复杂任务的能力
AI Agent 定义
Agent 决策流程
Agent 爆发
AI Agent 是桥梁
3. 智能体组件:为构建智能体提供了基本框架
整体结构
Planning 规划
Tool Use 工具使用
Memory 记忆
Prompt 设计
4. LAM的应用:大模型智能体在各个领域的应用,展示了智能体的潜力和面临的挑战
AI 应用分析
科学发现
AI Agent 效果
智能体思考
5. 智能体案例:典型的智能体案例,展示了智能体在实际应用中的多样性和创新性
2024 BabyAGI
HuggingGPT
AutoGPT
AgentGPT – 改进
Adept
GPT4Free
MetaGPT
OlaGPT
SuperAGI
群体智能:Camel、Generative Agents、斯坦福小镇 ⋙ 作者写超长文的能力也是绝了
🉑 火爆全网的「霉霉说中文」视频,有3种实现方案
https://www.bilibili.com/video/BV1Yw411C7Mo
最近这个视频的热度一直很高,经过AI技术处理后,视频中的外国人「说」着地道的中文,至连嘴型都对上了!眼前一亮!视频作者解释到,制作此类视频需要完成三个步骤——地道的口语翻译、语音克隆、嘴型替换,不过没分享具体教程。
作者是为英语教学类博主,估计也没想到自己靠AI出圈了😊 ShowMeAI 整合了全网讨论出的三种方案,简介和来源列在下方,想尝试的伙伴可以开始了!
方案一:HeyGen
一个工具完成上述全部流程!口型完美,卡点准确,声音和情感充沛度方面有一点小瑕疵,整体效果非常好!不过免费试用时长只有1分钟,然后就需要付费了~
HeyGen 是中国团队的产品哦!这波预料之外的破天富贵砸到自家头上,高低要给 @johnhuu 和霉霉磕一个!
方案二 (需要大量的算力)
首先,进行 Whisper 语音识别
然后,做一部分的 voice clone,提取语音的音色等参数,再把数据给 tortoise-tts,合成带原始说话人音色的语音
之后,还要做一部分的 lipsync (使用 wav2lip 换嘴型)
https://twitter.com/mtrainier2020/status/1715191476051677274
方案三
语音转文字:whisper
文字翻译:GPT
声音克隆+生成音频:so-vits-svc(https://github.com/svc-develop-team/so-vits-svc)
生成符合音频的嘴型视频:GeneFace++(https://github.com/yerfor/GeneFace)
https://twitter.com/Gorden_Sun/status/1715245735363387426
🉑 当基座 LLM 公司开始做2C产品,应用层开发团队危危危危危
https://zhuanlan.zhihu.com/p/662164256
这篇文章的切入视角很新鲜!作者观察到了基座大模型公司开始转向 2C 产品赛道,而不是继续耕耘被认为更有可能的 API 和 2B 领域 (因为挣钱太难了)。
这就带来两个问题:基座大模型公司做2C产品,那本来2C的应用层公司肿么办!基座大模型公司一定能做成么?日报选取四个文中最有价值的结论,感兴趣可以看作者原文的详细论述:
基座LLM公司想抄一个应用层产品、并通过深度的模型定制来提升效果并不难,关键在于选哪个去抄
基座LLM公司进可攻退可守,它可以只提供更强能力的API,把最上层的渠道和用户触达仍然交给最靠近客户的人,因此它吃掉的是实际上是这些应用层公司中的技术团队
从应用层开发团队来说,只保留对领域的理解、业务流的设计、微调数据的准备能力,剩下的基础能力完全转到依赖于LLM微调云服务,是一种很难抵抗的大势
无论是基座LLM公司只提供功能强大的API,还是像moonshot一样直接做2C产品,它们都会有一个优势,就是变成一个数据公司
👀 Programiz 报告:62%的受访者使用ChatGPT学习编程
https://programiz.pro/report
https://www.ithome.com/0/725/820.htm(中文解读)
程序员开发网站 Programiz 发布一份调查报告「The Impact of ChatGPT on Programming Education」,调查收集了来自 50 多个国家的 10,000 多名受访者的反馈,探讨了 ChatGPT 在编程教育中的实际应用情况,以及对编程职业生涯的影响。
以下是报告的关键结论,感兴趣可以访问上方链接,前往阅读报告英文原版或中文解读版:
62% 的受访者每周多次使用 ChatGPT 来学习编程
75% 的受访者认为 ChatGPT 改善了他们的编程学习体验
30% 的受访者认为 ChatGPT 胜过大学课堂讲座
超过 36% 的人更青睐 ChatGPT 而非谷歌搜索引擎
84% 的受访者认为教育机构应该为 ChatGPT 调整他们的编程课程
接近 75% 的受访者声称「正提升自我技能」或「计划提升自我技能」,以应对 ChatGPT 对就业市场的影响
超过 33.3% 的受访者因 ChatGPT 而经历了工作上的「一些变化」
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!