PRCV 2023 - Day3

news2025/2/24 2:56:23

主会场——主旨报告
报告题目:变与不变:有关大模型的一些数理基础问题

讲者:徐宗本(中国科学院院士)

徐宗本院士的演讲首先通过一系列示例阐释了ChatGPT引领了人工智能研究的新浪潮,推动了人工智能从深度学习时代跃入大型模型时代。然后,徐院士指出,尽管大型模型为通用人工智能研究、开发和应用铺平了道路,颠覆了传统的人工智能研发范式和应用模式,但人们对大型模型的理解和应用仍处于“工程化”阶段,距离实现“科学化”还有一段距离。随后,徐院士在报告中辨识了大型模型浪潮下AI数理基础研究的五个关键问题,特别包括大型模型自身的若干数理基础问题,这五个问题分别如下:1.大型模型中相变的存在性:在大型模型中,是否存在与规模相关的定律?是否有可量化研究这些问题的数学工具?2.自监督学习的形式化与数学化方法:对于Transformer等大型模型,其学习能力是否存在极限?这一极限如何进行数学建模?3.大型模型的本质:大型模型的本质是模拟学习方法论,即实现从任务到方法的映射。问题是,任务是否能够通过Prompt序列完备地表示?如果能,如何构建这些Prompt序列?4.自导航(self-navigation)的最优传输 5.大型模型的可塑性与约化理论与方法

这些问题为大型模型和AI领域的未来研究提供了重要方向,有助于将大型模型从“工程化”推进到更为深刻的“科学化”阶段,推动人工智能的发展取得更大的进展。
在这里插入图片描述

图1 变与不变:有关大模型的一些数理基础问题
报告题目:Jittor框架的创新:从视觉任务到与大模型推理训练

讲者:胡事民(清华大学教授)

首先,胡事民教授介绍了清华大学开源的深度学习框架Jittor的背景,在人工智能算法的开发和应用中扮演着重要的软件基础角色。这一由高校研发的框架于2020年3月首度向公众开放。接着,胡教授提到Jittor框架引领了深度学习领域的创新,采用了元算子融合和动态编译技术,并基于"统一计算图"的理念,使其在多个任务领域,包括视觉处理、对抗神经网络、可微渲染、神经辐射场和大型模型等方面的性能都显著超越了国际主流框架如PyTorch等。胡教授重点介绍了清华大学Jittor框架的创新和最新进展,其中包括以下六个关键方面:1.全新的视觉骨干网络:Jittor框架引入了创新性的视觉骨干网络,为计算机视觉任务提供了更加高效的解决方案。2.快速视觉预训练方案:该框架实现了一种快速的视觉预训练方法,可在视觉任务中提供更强大的性能。3.大型模型分布式训练加速:Jittor支持大型模型的分布式训练,提供了更高效的训练过程。4.大型模型推理优化:为了实现更快速的推理,框架对大型模型进行了优化,提供更出色的性能。5.软硬件优化与国产芯片支持

在这里插入图片描述

图2 Jittor框架的创新:从视觉任务到与大模型推理训练
主会场——企业讲坛
报告题目:CV及多模态技术在蝉大师系列产品中的应用与创新

讲者:Blair Lee(蝉妈妈全国市场总负责人)

Blair Lee在此次分享中聚焦于CV(计算机视觉)和多模态技术在蝉大师系列产品中的应用与创新。她首先围绕着蝉大师的核心产品,包括商品直播视频切片和直播数字人,展示了直播换背景和AI换衣技术的卓越效果。这些技术的应用为用户提供了全新的交互和购物体验。接着,Blair Lee分享了她们在积极探索CV技术在电商领域的其他应用,如电商产品背景图生成。这种技术的引入可以提高电商平台的产品展示效果,吸引更多的消费者。进一步,Blair Lee提到蝉大师也在深入研究并积累在自然语言处理方向的能力,包括问答机器人、AI数据洞察和自研LLMs等。这些方向的研究表明了蝉大师对多模态技术的不断探索,以满足不断增长的市场需求。最后,Blair Lee指出,蝉大师将致力于将大数据和AI智能赋能于营销领域,以帮助品牌在内容电商时代实现内容营销与电商的数智化经营。这一举措旨在推动品牌的新增长,促进内容与电商领域的更深度整合。

在这里插入图片描述

图3 CV及多模态技术在蝉大师系列产品中的应用与创新
Poster展示
展示者:姜磊、陈纪龙

318实验室小伙伴本次进行了两场Poster展示,两个论文均与医学图像处理有关,展示期间318实验室CV组成员与多位学者进行了各自论文内容细节的探讨,并与这些学者分享了各自最近在开展的工作,例如有大连理工大学的学者在从事病理研究,有新疆大学的学者在从事伪装目标检测的研究,有厦门大学的学者在从事多模态融合的研究,有中南大学的学者在从事医学图像处理的研究等,最后互相添加了联系方式以实现在以后学术上的进一步交流和互相合作

在这里插入图片描述

图4 Poster展示交流
在这里插入图片描述

图5 Poster展示交流
分会场2——特邀报告
报告题目:跨模态对齐的视觉内容理解与生成

讲者:李冠彬(中山大学副教授)

首先,李冠彬教授指出多源异构多媒体数据的快速增长和单一模态内容理解技术的飞速进展,对跨模态学习技术提出了更高的要求。通过生动的实例,他深入探讨了这一领域的重要性。他指出,跨模态学习的两大核心基础问题是跨模态表征和跨模态生成。跨模态表征的关键目标是通过学习实现不同模态之间的语义对齐,从而增强特征的共享和表达。这有助于不同模态数据之间的有意义的比较和交互。而跨模态生成则涉及将不同模态的数据在形式上相互转换,以实现跨模态信息的互操作性,同时保持模态数据的语义一致性。最后,李冠彬教授介绍了他的研究组近年来在跨模态学习领域的尝试,重点关注了图网络信息传播、多模态大模型蒸馏、知识嵌入和结构一致性表征等方面的研究。他还分享了相关技术在跨模态视觉目标定位、跨模态医学信息处理以及数字人视频生成等领域的成功应用验证。他强调了跨模态学习技术在处理多源数据和实现跨模态信息交互方面的重要性,并展示了李冠彬教授及其研究团队在这一领域的杰出工作和成就。他们的研究对于推动多模态数据应用和人机智能交互有着重要意义。

在这里插入图片描述

图6 跨模态对齐的视觉内容理解与生成

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1108790.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

行业追踪,2023-10-18

自动复盘 2023-10-18 凡所有相,皆是虚妄。若见诸相非相,即见如来。 k 线图是最好的老师,每天持续发布板块的rps排名,追踪板块,板块来开仓,板块去清仓,丢弃自以为是的想法,板块去留让…

15.2 主机探测与路由追踪

Ping 使用 Internet 控制消息协议(ICMP)来测试主机之间的连接。当用户发送一个 ping 请求时,则对应的发送一个 ICMP Echo 请求消息到目标主机,并等待目标主机回复一个 ICMP Echo 回应消息。如果目标主机接收到请求并且网络连接正常…

Top 10 数据恢复工具,可从iPhone 和 iPad 恢复数据

您是否正在寻找最好的 iPad 恢复软件,但不知道哪个选项最好?没有什么可担心的。本文将为您提供有关根据文件类型、设备兼容性和数据丢失原因等因素选择合适的 iPad 恢复软件的提示。此外,前 10 名提到的恢复软件是安全可靠的。 第 1 部分、iP…

这可能是最全面的TCP面试八股文了

计算机网络基础,考验一个程序员的基本功,也能更快的筛选出更优秀的人才。 说说TCP的三次握手 假设发送端为客户端,接收端为服务端。开始时客户端和服务端的状态都是CLOSED。最全面的Java面试网站 第一次握手:客户端向服务端发起…

2023年【公路水运工程施工企业安全生产管理人员】新版试题及公路水运工程施工企业安全生产管理人员模拟试题

题库来源:安全生产模拟考试一点通公众号小程序 公路水运工程施工企业安全生产管理人员新版试题是安全生产模拟考试一点通生成的,公路水运工程施工企业安全生产管理人员证模拟考试题库是根据公路水运工程施工企业安全生产管理人员最新版教材汇编出公路水…

Freemarker快速入门(SpringBoot版)

文章目录 Freemarker快速入门1、Freemarker概述2、Freemarker初体验3、数据类型3.0 常见操作符3.1 数值类型3.2 字符串类型3.3 布尔类型3.4 日期类型3.5 序列类型3.6 哈希类型 4、运算符4.1 算术运算符4.2 逻辑运算符4.3 比较运算符4.4 空值运算符 5、常用指令5.1 assign 自定义…

python argparse解析参数

用法比较简单,直接看代码 import argparseargparser argparse.ArgumentParser(descriptionthis is a hello argparser program) argparser.add_argument(--arg1, -a, typestr, helparg1 has value) argparser.add_argument(--arg2, typestr, default"value2&q…

Web攻防02-MySQL注入概述MySQL架构注入获取数据

文章目录 SQL注入概述:sql注入的原理:sql注入攻击: MYSQL-Web组成架构MYSQL5.0以上版本:自带的数据库information_schema MYSQL注入流程MYSQL注入查询数据过程查询数据流程靶场案例 MYSQL-SQL跨库注入查询跨库注入:影响…

xray的使用

不需要扫描 点击 双击xray 1.打开 2.使用 主打扫描 3.被动扫描 网站 与 Burp 联动 - xray 安全评估工具文档 双击 xray cmd xray_windows_amd64.exe webscan --listen 127.0.0.1:7777 --html-output text.html 1.bp 2.这道这个 3.配置 xray 改为* 4.代理

Hadoop3教程(二十二):Yarn的基础架构与工作流程

文章目录 (126)基础架构(127)YARN的工作机制(128)作业全流程参考文献 (126)基础架构 之前基本介绍完了Hadoop的几个核心组件,接下来可以思考下,在MR程序运行…

计算未来:微软眼中的人工智能

计算未来 :人工智能及其社会角色(The Future Computed. Artificial Intelligence and its role in society )这本书于2018年09月由北京大学出版社出版。 书籍的作者是:沈向洋(微软全球执行副总裁),(美&…

C++标准模板(STL)- 类型支持 (数值极限,quiet_NaN,signaling_NaN,denorm_min)

数值极限 提供查询所有基础数值类型的性质的接口 定义于头文件 <limits> template< class T > class numeric_limits; numeric_limits 类模板提供查询各种算术类型属性的标准化方式&#xff08;例如 int 类型的最大可能值是 std::numeric_limits<int>::ma…

AST实战|比较大的混淆文件(超过10M)怎么还原

关注它&#xff0c;不迷路。 本文章中所有内容仅供学习交流&#xff0c;不可用于任何商业用途和非法用途&#xff0c;否则后果自负&#xff0c;如有侵权&#xff0c;请联系作者立即删除&#xff01; 1. 需求 目前&#xff0c;我接触到的混淆js文件大小刷新了新记录&…

在 Visual Studio Code (VS Code) 中设置

在 Visual Studio Code (VS Code) 中设置代理服务器的详细教程如下&#xff1a; 打开 Visual Studio Code。 在顶部菜单栏中&#xff0c;点击 "File"&#xff08;文件&#xff09; > "Preferences"&#xff08;首选项&#xff09; > "Settings…

成为吃鸡战场绝对王者,掌握顶级作战干货!

在绝地求生的战场上&#xff0c;只有强者才能生存&#xff01;作为吃鸡行家&#xff0c;吃鸡将在这里为您带来与众不同的游戏技巧和干货&#xff0c;助您成为绝对的战场王者&#xff01; 首先&#xff0c;让我们来介绍几个实用的吃鸡作图工具。我们推荐了几款实用的绘图软件和工…

springboot项目东方通TongWeb改造以及部署

SpringBoot东方通TongWeb改造以及部署 文章目录 SpringBoot东方通TongWeb改造以及部署1、替换springboot中的tomcat为 (东方通)tongweb&#xff0c;打包1.1 排除springboot中内置的tomcat依赖&#xff0c;设置打包方式为war包1.2 修改配置文件的配置1.2.1查看端口是否被占用1.2…

轮转数组[中等]

优质博文&#xff1a;IT-BLOG-CN 一、题目 给定一个整数数组nums&#xff0c;将数组中的元素向右轮转k个位置&#xff0c;其中k是非负数。 示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1,2,3,4,5,6] 向右轮转 2 步: [6,7,1,2,…

VMware安装银河麒麟高级服务器操作系统V10

目标 VMware安装银河麒麟高级服务器操作系统V10背景介绍环境准备安装步骤配置VM虚拟机系统安装 VMware安装银河麒麟高级服务器操作系统V10 背景介绍 近期&#xff0c;随着国产信创的持续发热和大众关注度的上升&#xff0c;我们公司决定与时俱进&#xff0c;针对国产技术趋势…

【使用OpenCV进行目标分割与计数的代码实例详解】

文章目录 概要实例一&#xff1a;硬币分割计数实例二&#xff1a;玉米粒分割计数 概要 在当今数字图像处理领域&#xff0c;图像分割技术是一项至关重要的任务。图像分割旨在将图像中的不同目标或区域准确地分开&#xff0c;为计算机视觉、图像识别和机器学习等领域提供了坚实…

javascript/python 笔记: folium feature group自动切换

1 python部分 python部分只能是静态的结果 1.1 导入库 import folium import math 1.2 数据 cell_lst表示基站位置&#xff0c;location_lst表示 用户实际位置&#xff08;均为伪数据&#xff09; cell_lst[[1.341505, 103.682498],[1.342751, 103.679604],[1.341505, 10…