国风AI绘画平台Trik;「一个女孩的一生」走红;音视频转文字的精准处理指南;神经网络原理动画 | ShowMeAI日报

news2024/11/15 2:21:36

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🉑 智谱AI推出第三代基座大模型ChatGLM3,瞄向了 GPT-4V

https://github.com/THUDM/ChatGLM3

10月27日,智谱AI宣布推出全自研的第三代基座大模型 ChatGLM3 及相关系列产品。ChatGLM3 秉承开源精神,将开源模型发布在GitHub,其模型参数为最小的型号6B。

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型,在前两代模型的基础上进行了全方位技术升级。其中,多模态理解、代码增强模块、网络搜索增、语义能力与逻辑能力的技术提升,瞄向了 GPT-4V

https://chatglm.cn/main/code

在全新升级的 ChatGLM3 赋能下,生成式AI助手「智谱清言」已成为国内首个具备代码交互能力的大模型产品 (Code Interpreter)。在这一能力的加持下,ChatGLM3可支持图像处理数学计算数据分析等使用场景 ⋙ 官方发布


👀 AI成为微软的盈利新马达,GitHub Copilot 付费用户突破 100 万

https://www.fool.com/earnings/call-transcripts/2023/10/24/microsoft-msft-q1-2024-earnings-call-transcript

10月24日,微软举办了2024年第一季度财报电话会议。会议中,微软的CEO Satya Nadella 和 CFO Amy Hood 分别介绍了公司在各个业务领域的进展和业绩。

财报显示,微软的营收同比增长13%,达到565亿美元;净利润同比增长27%,达到222亿美元,数据非常亮眼。其中,AI战略为增长做出了显著贡献,特别是 **GitHub Copilot 的付费用户已经突破了 100 万,**成为历史上最广泛使用的 AI 开发工具。

Nadella 还表示,在即将到来的 Ignite 大会上,微软将发布超过100个AI驱动的新产品和服务。狠狠期待了!

👀 小红书AI绘画平台「Trik」,更适合中国宝宝的绝美国风

https://www.trikai.com/apps/trikwebapp/community/selected

Trik 是小红书推出的AI绘画平台,图片非常有「中国风」的意境!社区中的图片,题材、布局、配色都带着浓烈的国风元素,而且非常好看!只需要下拉页面,美图就会扑面而来~

目前网站功能逐步完善中,可以点击导航栏中的「创作」申请内测权限 (内测申请需要小红书主页链接),感兴趣的创作者们可以试试。

注:Trik 前段时间问世后,曾被站内原创画师指出「AI生成的图像与自己原创作品高度相似」,并引发了「停更潮」。国内应用也在陆续面对「AI生成内容与版权保护」的冲突了,希望可以有妥善的处理结果


👀 腾讯混元大模型全新升级,文生图、代码能力得到显著提升

10月26日,腾讯混元大模型正式开放「文生图」功能,针对语义理解、图片结构、画面细节等进行了升级。此外,经过对32种主流编程语言数据集的学习增训,腾讯混元代码处理水平提升超过20%

使用混元,可以边聊边画 (与 DALL·E 3 体验相似),也可以在「灵感」中选择绘画风格。目前官方内置了赛博朋克、日漫动画、梵高、扁平插画、像素插画、马赛克等6种风格,可以轻松地绘制水平还不错的图像,而且微信小程序画图特别方便!推荐~

讯混元目前仍是内测状态,需要前往网站(https://hunyuan.tencent.com)或者小程序「腾讯混元助手」进行权限申请

🉑 从无人问津到阅读量突破100万,AI重绘「一个女孩的一生」

上周,小红书上比较火热的AI作品是「一个上海女孩的一生」,用AI绘画展示了一位上海姑娘从出生、上学、工作、出游、逛街、年迈的生命历程。作品短时间内获得了将近100万的阅读、1万多点赞,这个数据对于粉丝量三四千的作者来说,是意外且惊喜的

这个作品火了之后,作者进行了同类型的其他创作,包括北京女孩、东北女孩、山东女孩、东京女孩、广东女孩、重庆女孩等,热度有所下降但效果也很不错。带有时代和地域特性的内容,可以唤起一代人的共鸣。挺有启发的~


🉑 Whisper+Memo:音视频转文字的精准处理指南

https://sspai.com/post/83644

如何把一份音频、视频文件转为文字,并借助AI工具进行翻译、总结和问答呢?

常用的工具,如飞书妙计、通义听悟、讯飞听见,可以满足会议、演讲等日常内容的处理。但是,一旦音视频包含大量专业术语、非中文、或者音源品质一般,这些工具的处理精度就比较一般了。

这篇文章的作者摸索到了一个由「Whisper+Memo」构建的工作流,可以非常精准地将音视频内容转写为文字,并进行快速地一键翻译、双语对照、点击定位跳转等操作

为了进一步提升处理效果,作者还建议对音源进行降噪、人声增强、去除大段空白等操作,并可以将撰写后散乱的短句合并为段落。整体上,如果你需要更准确的转录结果且电脑能开启 GPU 加速,那么这个方案真的很不错!!

Whisper:https://openai.com/research/whisper

Memo:https://memo.ac/zh

👀 一众大佬再发AI安全联名信,Yann LeCun 喷他们乱秀「优越感」

https://managing-ai-risks.com

最近几天,「AI安全」的消息出现得比较频繁,甚至像是在「吵架」??一起来盘点下各方动作和观点。

10月24日,Bengio、Hinton、姚期智 (Andrew Yao)、张亚勤等知名学者和专家签署联名信,讨论了在AI快速发展的时代,如何管理和应对高级AI系统所带来的风险。

联名信指出,未来10到20年,高级AI系统的许多关键能力就可以超越人类,并由此引发不公平、不稳定等诸多现实问题。因此,关注AI安全和伦理问题已经刻不容缓,并建议重新调整技术研发方向提高政府对AI发展的监管能力AI系统应具有红线能力并接收独立审查

https://openai.com/blog/frontier-model-forum-updates

10月25日,微软、OpenAI、谷歌、Anthropic发布联合声明,表示将设立 1000 万美元的 AI 安全基金,推动 AI 评估研究,帮助社会能够有效地测试和评估「最有能力的 AI 模型」。

10月26日,OpenAI 宣布成立名为「Preparedness (中文翻译:战备)」的新团队,以评估、检测并预防人工智能模型可能导致的「灾难性风险」。此外,OpenAI 发起「Preparedness Challenge」挑战赛来征集新颖的研究方案,并为 TOP 10 团队提供 25,000 美元的奖励和入职机会。

https://www-ft-com.ezproxy.depaul.edu/content/30fa44a1-7623-499f-93b0-81e26e22f2a6

但是!Yann LeCun 在接受金融时报采访时,输出的观点则明显不同。他认为,现在担心AI造成的风险「为时尚早」,AI永远不会威胁人类,而是会成为比人类更聪明的帮手。

他表示,过早地监管AI研发是非常反生产力进步的行为,只会加强大型科技公司的主导地位,扼杀竞争。更直白一点说,一些领先地科技公司提出监管AI研发的要求,是在当众秀优越感,认为只有他们才能安全地发展AI。

2018年,图灵奖颁发给LeCun、Geoffrey Hinton 和 Yoshua Bengio,以表彰他们给人工智能带来的重大突破。然而当下,Hinton 和 Bengio 对下一代AI模型打来的危险表示担忧,LeCun 却认为科幻小说中机器控制人类的场景不会出现。曾经的「深度学习三巨头」,在下一个选择面前,分裂成了两个阵营。


🉑 关于神经网络的原理,看完这些动画&视频你就懂了

https://animatedai.github.io

这是一个关于人工智能原理的动画展示网页,用动画清晰地展示了「卷积神经网络」的基本概念和算法原理,包括卷积 (Convolution)、填充 (Padding)、步长 (Stride)、组卷积 (Groups)、深度卷积 (Depthwise)、深度可分离卷积 (Depthwise-Separable)、像素重排 (Pixel Shuffle)、块大小(Block Size) 等。

每个概念都有一个原理展示动画,可以清晰地get到内在涵义。感兴趣可以前往原网页查看。

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1153137.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

EVM6678L 开发教程: 烧写 IBL(Intermediate Bootloader)

目录 EVM6678L 开发教程: 烧写 IBL烧写出厂IBL修改IBL引导格式 EVM6678L 开发教程: 烧写 IBL 参考: C:\ti\mcsdk_2_01_02_06\tools\boot_loader\ibl\doc\README.txtC:\ti\mcsdk_2_01_02_06\tools\boot_loader\ibl\doc\evmc6678-instructions.txtC:\ti\mcsdk_2_01_02_06\tools…

js 异常数组 [空白,Array(10),空白,Array(10),空白]

异常数组 [空白,Array(10),空白,Array(10),空白] 的解决方案

Elasticsearch(二)---搭建

搭建es 不允许root用于运行 创建esuser用户: useradd esuser 设置密码 passwd esuser 让esuser拥有sudo的权限,需要修改/etc/sudoers文件 需要先给/etc/sudoers添加写的权限 [rootnode1 ~]# vim /etc/sudoers 改完之后将写权限删除 三台服务器上操…

halcon canny 和opencv c++ canny 实现对比

Opencv和C实现canny边缘检测_opencv边缘增强-CSDN博客 一、canny实现步骤 1、图像必须是单通道的,也就是说必须是灰度图像 2、图像进行高斯滤波,去掉噪点 3、sobel 算子过程的实现,计算x y方向 、梯度(用不到,但是…

如何选购适合自己的内衣洗衣机?性价比高内衣洗衣机推荐

内衣洗衣机,在几年前或许是个新事物,但近两年却是成为了很普遍的家电产品,由于近几年内衣洗衣机需求量的增加,我们在商场的电子产品区都能见到它,就像普通的家庭洗衣机那样,直接摆在展台上销售,…

分布式:一文掌握分布式ID生成方案

目录 背景1、UUID2、数据库自增ID2.1、主键表2.2、ID自增步长设置 3、号段模式4、Redis INCR5、雪花算法6、美团(Leaf)7、百度(Uidgenerator)8、滴滴(TinyID)总结比较 背景 在复杂的分布式系统中,往往需要对大量的数据进行唯一标识,比如在对一个订单表进…

从零开始的目标检测和关键点检测(一):用labelme标注数据集

从零开始的目标检测和关键点检测(一):用labelme标注数据集 1、可视化标注结果2、划分数据集3、Lableme2COCO,将json文件转换为MS COCO格式 前言:前段时间用到了mmlab的mmdetction和mmpose,因此以一个小的数…

python练习(猜数字,99乘法表)

python练习(猜数字&#xff0c;99乘法表) 猜数字 import random num1random.choice(range(1,101))for i in range(11):num2input("plz input a number:")num2int(num2)if num1<num2:print("太大了&#xff0c;小一点")elif num1>num2:print("…

【每日一题】2003. 每棵子树内缺失的最小基因值-2023.10.31

题目&#xff1a; 2003. 每棵子树内缺失的最小基因值 有一棵根节点为 0 的 家族树 &#xff0c;总共包含 n 个节点&#xff0c;节点编号为 0 到 n - 1 。给你一个下标从 0 开始的整数数组 parents &#xff0c;其中 parents[i] 是节点 i 的父节点。由于节点 0 是 根 &#xf…

可视化 | 数据可视化降维算法梳理

文章目录 &#x1f4da;数据描述&#x1f407;iris&#x1f407;MNIST &#x1f4da;PCA&#x1f407;算法流程&#x1f407;图像描述 &#x1f4da;Kernel-PCA&#x1f407;算法流程&#x1f407;图像描述 &#x1f4da;MDS&#x1f407;算法流程&#x1f407;图像描述 &#…

从初级测试工程师到测试专家,你的晋升路线是什么?

最近&#xff0c;我们讨论了软件测试工程的的分级&#xff0c;大家都贡献了自己的想法。 对于大家来说&#xff0c;软件测试人的分级其实也代表了我们的进阶方向&#xff0c;职业发展。总体来说&#xff0c;测试工程师未来发展有三个方向&#xff1a; 技术精英 行业专家 管理…

【Proteus仿真】【Arduino单片机】SG90舵机控制

文章目录 一、功能简介二、软件设计三、实验现象联系作者 一、功能简介 本项目使用Proteus8仿真Arduino单片机控制器&#xff0c;使用SG90舵机等。 主要功能&#xff1a; 系统运行后&#xff0c;舵机开始运行。 二、软件设计 /* 作者&#xff1a;嗨小易&#xff08;QQ&#x…

pytorch复现3_GoogLenet

背景&#xff1a; GoogLeNeta是2014年提出的一种全新的深度学习结构&#xff0c;在这之前的AlexNet、VGG等结构都是通过增大网络的深度(层数)来获得更好的训练效果&#xff0c;但层数的增加会带来很多负作用&#xff0c;比如overfit、梯度消失、梯度爆炸等。GoogLeNet通过引入i…

代码精简10倍,责任链模式yyds

1 推荐看的文章1 责任链设计——责任链验证推翻 if-else 炼狱 2 推荐看的文章2 代码精简10倍&#xff0c;责任链模式yyds

引入了mybatis-spring-boot-starter,还需要引入mysql-connector-java吗?

spring boot集成mybatis&#xff0c;是需要引入mybatis-spring-boot-starter&#xff0c;有文章说不需要引入mysql-connector-java&#xff0c;但实际用下来并不行&#xff0c;我看了里面的pom文件&#xff0c;终于知道怎么一回事。 <!--引入mybatis的依赖--><depende…

HTTP协议说明

1.用于HTTP协议交互的信息被称为HTTP报文。请求端&#xff08;客户端&#xff09;的HTTP报文叫做请求报文&#xff0c;响应端&#xff08;服务器端&#xff09;的叫做响应报文。HTTP 报文本身是由多行&#xff08;用 CRLF 作换行符&#xff09;数据构成的字符串文本。 HTTP报文…

[Linux C] signal 的使用

前言&#xff1a; signal 是一种通信机制&#xff0c;可以跨进程发送&#xff0c;可以同进程跨线程发送&#xff0c;可以不同进程向指定线程发送。 信号的创建有两套api&#xff0c;一个是signal&#xff0c;一个是sigaction&#xff0c;signal缺陷很多&#xff0c;比如没有提…

亚马逊美国站衣物收纳商品合规标准是什么?如何办理?

随着秋季的来临&#xff0c;不少人翻箱倒柜地寻找换季用品。相信现在很多人都和小编一样&#xff0c;出门时打算找个外套穿上&#xff0c;但想到要去柜子里翻半天&#xff0c;就立刻打消了想要出门的念头。 但当翻箱倒柜地找到了换季用品&#xff0c;却又要一件一件地把翻出来…

Variations-of-SFANet-for-Crowd-Counting可视化代码

前文对Variations-of-SFANet-for-Crowd-Counting做了一点基础梳理&#xff0c;链接如下&#xff1a;Variations-of-SFANet-for-Crowd-Counting记录-CSDN博客 本次对其中两个可视化代码进行梳理 1.Visualization_ShanghaiTech.ipynb 不太习惯用jupyter notebook, 这里改成了p…

spring解决后端显示时区的问题

spring解决后端显示时区的问题 出现的问题&#xff1a; 数据库中的数据&#xff1a; 解决方法 spring:jackson:date-format: yyyy-MM-dd HH:mm:sstime-zone: Asia/Shanghai