写在前面
【WeThinkIn老实人报】旨在整理&挖掘AI行业的关键新闻和最新技术,同时Rocky会对这些关键信息进行解读,力求让读者们能从容跟随AI科技潮流。也欢迎大家提出宝贵的优化建议,一起交流学习💪
欢迎大家关注Rocky的公众号:WeThinkIn
欢迎大家关注Rocky的知乎:Rocky Ding
获取更多AI行业的前沿资讯与干货资源
大家好,我是Rocky。
阅读Rocky创办的《WeThinkIn老实人报》,大家能够获得:
- 掌握AIGC、传统深度学习以及智能汽车这三个AI行业核心方向的最新进展,能在评论区抒发观点,共同学习交流。
- 找到让自己灵光一现的关键新闻和最新技术,这对我们的职业生涯非常重要。
- 理顺国内AI行业头条新闻、全球AI行业头条新闻、AI产业链融资新闻以及AI技术进展头条新闻四大板块,降低我们对未来下一个核心价值(OpenAI式公司和AIGC式技术)的错判率。
本文是《WeThinkIn老实人报》的第二十三期,Rocky本次梳理的周期为2024年5月6号-2024年5月19号。在本期中,Rocky会毫无保留地分享自己的核心观点,希望能给大家更多思考。
So,enjoy(与本文的BGM一起食用更佳哦):
正文开始
目录先行
- 读前大局观
- 国内AI行业头条新闻
- 全球AI行业头条新闻
- AI产业链融资新闻
- AI技术进展头条新闻
读前大局观
Rocky将工业&科技分为三个维度:
- 尖端工业&科技:包括新能源、AI、航空航天、军事工业、半导体、新药研发以及细分高精尖行业等。
- 中端工业&科技:包括汽车、高铁、大飞机、大轮船以及已经突破的曾被宣称是“尖端工业”的产业。
- 基础工业&科技:包括房地产、基建以及轻工业等基础制造业和基本生活用品业等。
我们目前的发展阶段,首先要解决的是中端工业&科技的市场占有率问题,需要占据全球市场的80%左右,并留下识大体顾大局的20%的海外公司共同成长,共享发展果实。
在基础工业&科技,目前主要是处在降本增效,持续优化的状态。基础工业&科技包含了人们的衣食住行,是跨周期的、市场巨大的产业,依旧有很多机会。
在尖端工业&科技方面,拿AI行业为例,我们目前主要是跟紧世界最新趋势,问题不大的。从AI行业的政策、资本、产品、意识等都飞速迭代的当下,国内AI行业的产品落地与弯道超车能力依旧非常强。 此外像新能源、航空航天、军事工业等领域,已经进入与全球伙伴合作的阶段,市场上留下的更多是识大体顾大局的海外合作伙伴。
国内AI行业头条新闻
AIGC产业新闻:
1、国内首个多媒体大模型万兴“天幕”正式公测,将逐步向企业和开发者开放API接口。
2、上海AI实验室联合崖州湾国家实验室和中国农业大学发布首个种业大语言模型“丰登”,人工智能助力生物育种。
3、58同城提升AI预警拦截能力为求职者保驾护航,一季度日均拦截风险信息223万次。
4、百度搜索推出在线P图工具“百度AI图片助手”,百度一下就能修图。
5、商汤科技即将发布日日新大模型5.0粤语版本,旨在提升粤语语言处理能力。
6、零一万物官宣一站式AI工作平台“万知”,李开复出任“首席体验官”。
7、58同城CEO姚劲波数字人分身亮相58神奇日,加快探索AI应用落地。
8、阿里云正式发布通义千问2.5大模型,性能全面赶超GPT-4 Turbo。
9、中医药大模型“数智本草”正式发布,由天士力医药集团与华为云共同开发。
10、阿里云通义大模型品牌升级:“通义千问APP”更名为“通义APP”,集成通义大模型全栈能力,免费为所有用户提供服务。
11、值得买科技发布全新AI战略,“值得买消费大模型”首次发布。
12、小米旗下人工智能助手“小爱同学”与阿里云通义大模型展开合作,强化多模态AI生成能力。
13、阿里云:通义大模型通过阿里云服务企业超9万,通义开源模型累计下载量突破700万。
14、“2024北京直播电商购物节”发布AI数字代言人“京小美”,将在5月25日开幕式上首次亮相。
15、阿里国际旗下Pic Copilot推出“AI虚拟试衣”工具,超低成本实现专业影棚拍摄效果。
16、李开复旗下AI公司零一万物发布千亿参数闭源模型Yi-Large,对标GPT 4.0。
17、腾讯宣布旗下混元文生图大模型全面升级并对外开源,为业内首个中文原生的DiT架构文生图开源模型。
18、字节跳动正式发布自研大模型“豆包大模型”,日均处理1200亿Tokens文本。
Rocky观点:在进入2024年后,从大模型本身延伸到相应的细分领域,形成ToC和ToB两个非常大的机会点。和2023年不同的是,大模型的发布数量明显减少了,进入了大模型迭代优化与大模型之间厮杀的阶段。
新能源产业新闻:
1、高德地图推出升级版驾车ETA服务:实时解析当前路况,预估到达时间更精准。
2、顺丰同城发布2023年ESG报告:使用绿色交通工具带来碳排节约230万吨,共投入使用6.4万个可循环文件封。
3、比亚迪集团品牌及公关处总经理李云飞:推出电动摩托车、电动自行车等均为不实信息。
4、吉利旗下沃飞长空与中信海直签署战略合作,加速eVTOL商业化落地。
5、百度地图:五一期间推出十大车道级安全预警产品,日均提供3亿次车道级行车风险预警。
6、比亚迪旗下首款新能源皮卡BYD SHARK全球首秀定档5月14日,将于墨西哥首发。
7、利元亨智慧物流(自主移动机器人)与智能仓储项目交付已超20亿元。
8、蔚来宣布第50万台量产车下线,将于5月15日正式发布第二品牌“乐道”。
9、宁德时代与江西交投签署战略合作协议,将共建高速服务区充换电网络。
10、三峡能源单日发电量首次突破3亿千瓦时,进入崭新的“3.0”时代。
11、均普智能与智元机器人达成战略合作,共同推进人形机器人工业场景落地。
12、华宝新能旗舰产品“电小二光充户外电源”全球销量突破400万台,打造世界级绿色储能品牌。
13、远景能源与济源市、济源钢铁签署战略合作协议,共促风电产业链国产化战略实施落地。
14、特斯拉上海储能超级工厂获施工许可,为其在美国本土以外的首个储能超级工厂项目。
15、小米汽车:完成第10000辆小米SU7的交付,用时43天。
16、蔚来全新品牌“ONVO乐道汽车”正式发布:首款车型乐道L60定位家庭智能电动中型SUV,预售价21.99万元起。
17、深圳港集团与欣旺达签署战略合作框架协议,共创绿色港口新时代。
Rocky观点:新能源行业的发展所催生的电动车行业与新制造业,是跨周期的。加上互联网思维,相信可以和特斯拉一起形成合力,让最后存活下来的海外车企们更加识大体、顾大局。
传统深度学习&芯片产业新闻:
1、湖南钢铁集团与华为、海康威视签署战略合作协议,加快数智化转型升级。
2、达实智能签约小米深圳国际总部智能化项目,打造智慧空间服务标杆。
3、华为云正式发布数据库GaussDB基础版,相比企业版价格下降60%-70%。
4、58同城、安居客发布AI智能获客、AI智能提效两大新房AI产品系列,加速人工智能在房产营销场景应用落地。
5、Gartner:2023年亚太地区云计算laaS市场份额阿里云第一,亚马逊第二。
6、科大讯飞在新加坡设立区域总部,并建立云平台全球站。
7、华为:鸿蒙生态设备数量超8亿台,HarmonyOS 4.2升级用户已超2000万。
8、宝钢股份携手华为推进AI战略,三年计划打造上千个AI赋能应用场景。
互联网产业新闻:
1、美的集团再次向港交所提交上市申请,有望成为年内最大IPO。
2、曹操出行向港交所提交上市申请书,拥有最大规模定制车车队。
3、市场调研机构Measurable AI:美团香港业务KeeTa单量市占份额已达到44%,跃升为全港第一大外卖平台。
4、亚马逊云科技Marketplace(中国区)推出卖家自主经营和在线交易功能,支持灵活定价模式。
5、阿里巴巴杭州全球总部将于5月10日正式投入使用:总建筑规模达98.45万平方米,可容纳3万名员工办公。
6、SHEIN成为美国第三大在线时尚零售商,位列亚马逊、沃尔玛之后。
7、腾讯粤港澳大湾区算力中心项目落户韶关,总投资50亿元。
8、亚马逊全球开店在华中地区首个办公室落户郑州,助力跨境电商与当地产业带深度融合。
9、腾讯宣布微信、QQ双平台上线地震预警功能,率先实现四川全省范围覆盖。
商业基本面新闻:
1、香港飞上海,国产大飞机C919将于6月1日开启首次境外商业飞行。
2、中国船舶集团签署18艘全球最大27.1万立方米超大型LNG运输船项目订单,创全球最大单笔造船订单新纪录。
Rocky观点:“中级工业&科技非常有价值,大家不必拘泥于AI行业或者互联网行业,可以在更多势能行业找到自己的位置。”
3、2023年A股年度分红金额达2.24万亿元,刷新历史纪录。
4、国铁集团2023年业绩创历史最佳:总收入1.25万亿元、净利润33亿元,双双打破历史纪录。
5、新质企业家联合会在香港成立,商汤科技联合创始人徐立任创会会长。
6、长征六号丙运载火箭首飞成功,新一代长征火箭家族再添“生力军”。
7、嫦娥六号探测器成功实施近月制动,顺利进入环月轨道飞行。
8、首个代码大模型国际标准立项通过,由中国信通院牵头、联合华为云等产学研机构共同提出。
全球AI行业头条新闻
AIGC产业新闻:
1、英国《金融时报》与OpenAI达成协议,授权后者使用其资料库开发生成式AI技术。
2、印度最大家族办公室PremjiInvest宣布将加大对人工智能领域投资。
3、微软发布首份AI透明度报告:2023年共创建30个负责任的AI工具,扩大负责任的AI团队。
4、OpenAI与美国健康险科技公司Oscar Health达成合作,将人工智能引入健康保险。
5、微软据悉准备推出新款自研AI模型,与谷歌、OpenAI竞争。
6、程序员问答平台Stack Overflow与OpenAI宣布建立新的API合作伙伴关系。
Rocky观点:“从一开始的疯狂反对ChatGPT,到最后的加入。大家觉得Stack Overflow丢人吗”
7、OpenAI推出专用AI检测工具,识别DALL-E生成图像准确率达98%。
8、红帽发布RHEL AI,用于无缝开发、测试、运行开源生成式AI模型。
9、OpenAI计划于下周一宣布其AI搜索产品,将加大其与搜索巨头谷歌的竞争。
10、谷歌DeepMind推出新一代药物研发AI模型AlphaFold 3,AI革新助力生物医药研究。
11、三星宣布收购胎儿超声AI软件公司Sonio,巩固尖端医疗设备领域的领先地位。
12、在富岳超算上训练大模型,日本联合研究团队发布Fugaku-LLM大模型。
13、OpenAI发布全新旗舰生成式AI模型GPT-4o:语音对话更流畅,免费提供。
14、甲骨文推出Oracle Code Assist编程助理,旨在用 AI帮助用户开发Java程序。
15、微软将在法国投资40亿欧元,大部分集中在AI领域。
16、谷歌宣布推出文生视频模型Veo,对标OpenAI Sora。
17、谷歌正式推出“AI Overviews”搜索体验,为其搜索引擎25年来最大更新之一。
18、Meta宣布将于2026年6月1日关闭企业通讯软件Workplace,将开发重心放在元宇宙和AI领域。
19、OpenAI联合创始人兼首席科学家Ilya Sutskever宣布离职,将在未来分享新项目细节。
Rocky观点:全球的AIGC行业发展都非常迅速,我们需要紧跟AIGC行业的最新进展,将先进的技术工具化,同时思考关键产品的逻辑。
新能源产业新闻:
1、韩国新能源汽车迎来强劲增长,一季度韩产新能源汽车国内销量突破10万辆关口。
2、世界最大捕碳工厂二代上线:每年从空气中吸二氧化碳能力提升8倍。
3、马斯克:特斯拉今年将斥资超过5亿美元扩建超级充电站网络,新建数千个充电站。
4、现代汽车集团将向自动驾驶初创公司Motional投资近10亿美元,以推进自动驾驶技术研发。
传统深度学习&芯片产业新闻:
1、SK海力士考虑新建DRAM工厂,应对内存芯片需求增长。
2、英特尔将与14家日本公司合作开发技术,以实现封装等“后端”芯片制造流程的自动化。
3、亚马逊宣布计划斥资90亿美元扩建位于新加坡的云计算基础设施。
4、微软将斥资33亿美元在美国威斯康星州建设人工智能中心。
5、亚马逊与西班牙电信达成云服务协议,正式进入欧洲5G网络市场。
6、三星电机加快开发半导体玻璃基板,预计于9月提前完成中试线建设。
7、软银与日本电信公司KDDI商谈扩大合作范围,将在日本联合建设5G网络。
8、美光印度封测工厂将于2025上半年开始出货,产品主要面向国际市场。
9、全球前十大芯片设计厂商去年营收超过1600亿美元,英伟达首次登顶。
10、Linux基金会宣布成立HPSF高性能软件基金会,启动多款初始开源项目。
11、亚马逊AWS宣布将在德国投资78亿欧元,全面推动欧洲云计算基础设施建设。
12、SK海力士宣布最早2026年推出HBM4E内存,带宽为上代1.4倍。
互联网产业新闻:
1、三星一季度生产6450万部智能手机和平板电脑,比年初目标高出22%。
2、苹果公司举办春季新品发布特别活动:M4芯片如期而至,发布全新iPad Pro、iPad Air、Apple Pencil Pro三款主要硬件产品。
3、谷歌正式发布Pixel 8a手机:主打AI功能,售价499美元起。
4、索尼宣布将于5月15日举办Xperia新品发布会,预估将发布Xperia 1 VI、Xperia 10 VI手机。
5、三星宣布即将量产首款3nm Exynos芯片,或将用于Galaxy S25系列手机。
商业基本面新闻:
1、因缺乏盈利能力,沃尔玛计划关闭其在美国五个州全部51家医疗中心以及远程医疗业务。
2、西门子能源旗下风电部门歌美飒将裁员并启动全面重组,并更换CEO。
3、亚马逊将向法国业务投资超12亿欧元,创造逾3000个长期工作岗位。
4、招聘网站Indeed计划裁员1000人,约占其员工总数的8%,为其两年来第二次裁员。
5、梅琳达·盖茨宣布辞去盖茨基金会联席主席职务,将获得125亿美元资金以支持妇女和家庭领域。
AI产业链融资新闻
Rocky观点:《WeThinkIn老实人报》将从投资视角与长期主义出发,挖掘初创公司的势能与机会点。
1、重载无人机及特种航空物流解决方案提供商“驼航科技“完成数千万元A轮融资。
2、商业航天基础设施建设与运营服务商“航天驭星“完成近5亿元B轮及C轮融资。
3、L4自动驾驶卡车服务提供商“主线科技“获得数亿元新一轮融资。
4、人形机器人公司“加速进化“完成数千万元Pre-A轮融资。
5、边缘侧人工智能芯片提供商“超星未来“完成数亿元Pre-B轮融资。
6、存算一体AI大算力芯片企业“亿铸科技“获得逾亿元新一轮融资。
7、眼科影像人工智能分析诊断产品开发商“比格威医疗“完成3000万元新一轮融资。
8、手术机器人和智能诊疗装备研发制造商“智愈医疗“完成超6000万元Pre-A++轮融资。
9、道路检测机器人研发商“圭目机器人“获得数千万元A轮融资。
10、自动驾驶数据服务公司“柏川数据“完成千万元级天使+轮融资。
Rocky观点:等过了2年、3年、5年甚至10年,再回过头来打开本期文章,看看里面的初创公司是飞速成长,还是已经消亡,就能体会到时间的意义。
AI技术进展头条新闻
Rocky观点:《WeThinkIn老实人报》将从工业界出发,以投资、CEO以及CTO视角挖掘技术发展的落地可能性与明星技术的潜力。
1、InstantMesh:图片直接生成3D图像
只需要十秒的时间就能将图片变成360度全视角的3D图像,能够简化游戏、广告、家居、虚拟现实等开发流程。
开源地址:https://github.com/TencentARC/InstantMesh
在线demo地址:https://huggingface.co/spaces/TencentARC/InstantMesh
论文地址:https://arxiv.org/abs/2404.07191
2、英伟达开源大模型对齐框架—NeMo-Aligner
安全对齐框架NeMo-Aligner是一个包括人类反馈进行强化学习(RLHF)、直接偏好优化(DPO)、SteerLM和自我对弈微调等技术合集,可帮助开发人员极大提升模型的安全性能和稳定输出。
开源地址:https://github.com/nvidia/nemo-aligner
论文地址:https://arxiv.org/abs/2405.01481v1
3、OpenAI发布GPT-4o
新旗舰模型GPT-4o可跨视频、音频、文本进行实时推理,全球生成式AI领域再次迎来历史性时刻。
官方地址:https://openai.com/
4、谷歌发布Project Astra,对标GPT4o
Project Astra可以像OpenAI发布的GPT4o一样,实现跨文本、音频、视频多模态实时推理。
官方地址:https://deepmind.google/technologies/gemini/project-astra/
5、谷歌发布Veo:文生超1分钟、1080P视频,媲美Sora
申请试用地址:https://aitestkitchen.withgoogle.com/zh/tools/video-fx
6、谷歌发布文生图模型Imagen 3,写实效果超强!
Imagen3能够捕捉长文本提示中的很多细微细节,对图片的嵌入文字生成很准确、稳定。Imagen3可生成漫画、写实、赛博朋克、水墨、油画、素描等几十种风格,尤其是生成的写实风格图片质量很好,和真人拍摄的相片几乎差不多。
申请体验地址:https://docs.google.com/forms/d/e/1FAIpQLSeC6n1KQlaqRNUGNuNRt5Q7YeoyXsq828niw2ZvIoAtW1FtYQ/viewform?resourcekey=0-qDKZCeB4G9nS9dttXGdnHQ&pli=1
7、StoryDiffusion开源:让多图漫画和长视频更连贯
论文地址:https://arxiv.org/pdf/2405.01434v1
项目主页地址:https://storydiffusion.github.io/
GitHub地址:https://github.com/HVision-NKU/StoryDiffusion
8、Tunnel Try-on: 阿里最新视频试衣生成算法
项目主页地址:https://mengtingchen.github.io/tunnel-try-on-page/
论文地址:https://arxiv.org/abs/2404.17571
9、Stable Diffusion XL核心基础知识,从0到1搭建使用Stable Diffusion XL进行AI绘画,从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型,AI绘画领域的未来发展等全维度解析文章正式发布
码字不易,欢迎大家多多点赞:
Stable Diffusion XL文章地址:https://zhuanlan.zhihu.com/p/643420260
10、Stable DiffusionV1-V2核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用Stable Diffusion进行AI绘画,从0到1上手使用Stable Diffusion训练自己的AI绘画模型,Stable Diffusion性能优化等全维度解析文章正式发布
码字不易,欢迎大家多多点赞:
Stable Diffusion文章地址:https://zhuanlan.zhihu.com/p/632809634
11、ControlNet核心基础知识,核心网络结构,从0到1使用ControlNet进行AI绘画,从0到1上手构建ControlNet高级应用等全维度解析文章正式发布
码字不易,欢迎大家多多点赞:
ControlNet文章地址:https://zhuanlan.zhihu.com/p/660924126
12、LoRA系列模型核心基础知识,从0到1使用LoRA模型进行AI绘画,从0到1上手训练自己的LoRA模型,LoRA变体模型介绍,优质LoRA推荐等全维度解析文章正式发布
码字不易,欢迎大家多多点赞:
LoRA文章地址:https://zhuanlan.zhihu.com/p/639229126
13、最全面的AIGC面经《手把手教你成为AIGC算法工程师,斩获AIGC算法offer!(2024年版)》文章正式发布
码字不易,欢迎大家多多点赞:
AIGC面经文章地址:https://zhuanlan.zhihu.com/p/651076114
14、10万字大汇总《“三年面试五年模拟”之算法工程师的求职面试“独孤九剑”秘籍》文章正式发布
码字不易,欢迎大家多多点赞:
算法工程师三年面试五年模拟文章地址:https://zhuanlan.zhihu.com/p/545374303
《三年面试五年模拟》github项目地址(希望大家能给个star):https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer
15、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识,从0到1搭建AI绘画框架,从0到1使用AI绘画框架的保姆级教程,深入浅出介绍AI绘画框架的各模块功能,深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布
码字不易,欢迎大家多多点赞:
AI绘画框架文章地址:https://zhuanlan.zhihu.com/p/673439761
推荐阅读
1、加入AIGCmagic社区知识星球
AIGCmagic社区知识星球不同于市面上其他的AI知识星球,AIGCmagic社区知识星球是国内首个以AIGC全栈技术与商业变现为主线的学习交流平台,涉及AI绘画、AI视频、ChatGPT等大模型、AI多模态、数字人、全行业AIGC赋能等50+应用方向,内部包含海量学习资源、专业问答、前沿资讯、内推招聘、AIGC模型、AIGC数据集和源码等。
那该如何加入星球呢?很简单,我们只需要扫下方的二维码即可。知识星球原价:299元/年,前200名限量活动价,终身优惠只需199元/年。大家只需要扫描下面的星球优惠卷即可享受初始居民的最大优惠:
2、《三年面试五年模拟》面试秘籍
《三年面试五年模拟》面试秘籍旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试方法,力求让读者在获得心仪offer的同时,增强技术基本面。
Rocky已经将《三年面试五年模拟》面试秘籍的完整版构建在Github上:https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main,欢迎大家star!
想要一起进行项目共建的朋友,欢迎点击链接了解详情:《三年面试五年模拟》版本更新白皮书,迎接AIGC时代
3、其他
《WeThinkIn老实人报》的第二十三期就完整展现在大家面前了,未来引领AI科技浪潮和变革的要素可能就在其中,每个给本文一键三连的朋友,一定会挖掘到属于自己的机会点!
最后,希望在AIGC时代中,大家能和Rocky一起,飞速成长!