大模型加速学科升级,飞桨赋能北邮“X+大模型”特色小学期

news2024/11/25 8:15:27

在人工智能时代,设计师与产品经理比以往更加需要关注一个事实:那就是如何利用人工智能和数据分析技术,打造让用户心动的信息交互产品和用户体验,释放人-机协同共创的巨大潜能,是决定设计产能和竞争力的关键。

图片

在产业的巨变之下,北京邮电大学侯文军教授联合百度飞桨团队,共同设计了《从情节到交互:UX+AI,打造多模态信息交互产品》特色工作坊,在这个为期一周的工作坊中,在飞桨Jungle老师团队的带领下,同学们通过学习多模态数据分析与大模型技术,以影视片为多模态信息源,逐步从图像、声音和文本中开展数据驱动的设计分析,最终将电影的多模态信息转化为引人入胜的多通道交互产品,产出真实项目。

课程培养目标

多模态人工智能技术理解与应用能力

了解多模态人工智能技术的原理、算法和应用,掌握如何利用这些AI技术来分析电影中的文本、图像和声音等多模态信息,并结合飞桨和大模型工具,转化为交互式应用的设计素材与流程。

数据分析与创新思维

学会使用多样化的数据分析工具和方法,从电影数据中提取有价值的信息和洞见。培养创新思维和以用户为中心的设计理念,发掘电影的被动式观赏与主动式交互应用之间的结合点,从电影情节中,策划产品的独特功能价值和交互流程。

交互设计能力

利用多模态的设计能力,在视觉、听觉和触觉等方面,设计直观且吸引人的多感官界面,将电影元素与界面设计相结合,创造出令人印象深刻的交互式应用设计,提供良好用户体验,有效和舒适地传达信息和故事。

团队协作与项目管理能力

与其他参与者组成团队,共同合作开发一个电影交互式APP原型。学会有效的团队协作,包括任务分配、沟通和协调。获得项目管理的实践经验,学会规划、执行和监控项目进展。

部分课程内容

  • 小学期主题及实践任务解析
  • 人工智能技术现状、多模态人工智能技术与设计的结合
  • 多模态与智能交互设计融合系列课程
  • 项目课题:基于电影多模态信息的多通道交互产品设计

部分项目成果

为期5天的工作坊,时间十分紧张。在这么短的时间内,要求同学们不仅要学习和消化全部的课程内容,还需要高质量完成课题项目——这对他们的学习力、创造力,特别是爆发力,都提出了巨大的考验。工作坊的57名大三同学,均来自享誉全国的北邮智能交互设计专业,该专业依托北京邮电大学的信息科技优势,立足“新工科”培养理念,培养“人工智能+交互设计”的复合型精英人才。57名同学,通过相互组队,最终产出了25个内容丰满的项目。

项目示例一

杨闪、孙沛然和车皓远同学,选取电影《爱乐之城》开展多模态信息挖掘与产品设计。他们通过 K-Means 聚类方法,分析和提取了象征不同季节和情感阶段的主题色,以及代表不同情绪风格的音效,将其作为交互产品的设计素材。

图片

图片

在影片中,男女主角载歌载舞,洋溢着活力与优雅,此时此刻,三位同学提出了一个问题:对不会跳舞的人,他们如何能享受歌舞所带来的快乐?借助 PP-TinyPose,产品可以将特定的用户照片,转化为电影中经典舞蹈的视频进行复刻,让用户也能像电影中的角色,载歌载舞!

图片

项目示例二

朱芃宇、范星兰和程力昊同学,探索的电影是《天使爱美丽》。他们基于故事情节、画面和声音等多模态信息,打造了全新的照片社交产品——Moment。

图片

该产品旨在驱动身在不同时空的用户,为彼此拍摄一张将实体明信片与周围环境进行合影的照片,使用户感到明信片与周围风景,都是专门为他们而拍摄的。以此通过强调该照片的独特性和定制性,让用户在收到照片时感受到被特别重视和关注,并从此与陌生人建立一种美妙的时空关联。

图片

借助文心跨模态大模型 ERNIE-ViLG 的参考图模式,用户照片可以被产品进行风格化,这样既避免了个人信息的泄露,又得到了更多的艺术可能性;在社交网络数据提取及用户匹配方面,团队选择 ERNIE-UIE 模型,能更精准地提取和匹配地理位置、机构、建筑等信息,辅助用户找到“远方的朋友”;在明信片内容辅助生产方面,产品则是利用飞桨版 SAM,从摄影照片得到语义内容,并作为 ERNIE-BOT 的文本提示词,从而帮助用户更快地产出明信片设计与文字稿。

图片

相关链接

  • “分割一切”大模型SAM、超轻量PP-MobileSeg、工业质检工具、全景分割方案,PaddleSeg全新版本等你来体验!
  • 通用信息抽取技术UIE发布!

项目示例三

侯家祺、徐瑞宁和秦一硕同学,选取的电影是《佛罗里达乐园》。通过图像与音频聚类,提取主题色和具有代表性的音效,而这些梦幻的色调和热闹的声音,准确反映了孩子们视听世界的特征。

图片

图片

三位同学的产品定位,则是通过 AR 交互式虚拟恶作剧,来帮助用户进入到《弗罗里达乐园》的世界,以第一视角体验各类恶作剧,获得解压。

图片

这款多模态 AR 实景交互 AR 游戏,具有极强的电影内容关联性,借助 PaddleSeg 的能力,许多现实元素能够被自动分离和提取,并融入到剧情,在用户与其交互过程中,产生更深层次的剧情体验。

图片

项目示例四

徐茗和陳珮雯同学,则是基于电影《浪矢解忧杂货店》多模态信息,打造了一款现实版 AI 浪矢爷爷。他们将电影海报中的“杂货店”,通过 ERINE-ViLG 进行了“翻新”;并提取了浪矢爷爷的回信文本,作为小样本数据集,在 AI Studio 大模型社区打造了相同“话风”、同样能够进行回信的“AI浪矢爷爷”。

图片

图片

项目示例五

杨若望、杜尧和刘先胜同学,从电影《阿凡达》中,提取了“冥想”的设计理念和独特的色彩模式。利用文心跨模态大模型 ERNIE-ViLG ,团队的三位男生,通过简单的 prompt,就能为自己生成特定主题且具有一定连续性的系列设计素材,成为自己产品中的关键元素加速了产品的创意表达。

图片

由于篇幅有限,还有很多同样优秀精彩的团队项目没有介绍,相信在未来,我们将有更多的机会和场合进行分享。

图片

北京邮电大学侯文军教授表示,大模型正在真真切切地驱动企业与产品的代际变革,并在实际落地的过程中,产生真实的价值。大模型+设计,将带来企业与产品变革的全新势能,这次校企融合的实践课程,让同学们开展前沿科技的应用探索,产生丰硕的成果,大家都获益匪浅。当前面向新一轮产业变革,更多的任何学科和产业,都将在大模型技术的推动下,迎来自己的“iPhone”时刻。

期待你的加入! 刚才的项目,和“创意”很相关。说起“创意”,这里,我们要明显地做一个广告了:欢迎创意无限的你,带着梦想与技术,参加中国高校计算机大赛人工智能创意赛!

报名链接
https://aistudio.baidu.com/aistudio/competition/detail/1026/0/introduction

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/718855.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

港科夜闻|叶玉如校长出席香港创科 砥砺前行主题论坛

关注并星标 每周阅读港科夜闻 建立新视野 开启新思维 1、香港科大校长叶玉如教授出席「香港创科 砥砺前行」主题论坛。该论坛为中华人民共和国香港特别行政区成立26周年庆祝活动之一,叶玉如校长在论坛上分享了她对香港创新科技及研究发展未来的见解。论坛亦包括国际…

Cmder最新版--打开慢 删除字符残留问题

标题Cmder最新版–打开慢 删除字符残留问题 1 打开慢 打开后左下角跳动显示findstr.exe cmd.exe git.exe,很久后才能正常输入。 解决方案: 关闭更新检查及运行dll注入(如下二图) 2 删除后有字符残留 像这样很烦 解决方案有…

wireshark学习

抓包原理 哪种网络情况可以抓到包?(1)本机环境(2)集线器环境(3)交换机环境 交换机环境目前较为常用,这也分为三种情况(1)端口镜像(2&#xff09…

vue项目使用自定义域名开启本地服务(ip地址和域名映射)

前言 有的时候,我们直接用script请求需要在同一个顶级(一级)域名下才可以拿到数据。 本地服务在开启时一般都是localhost,或者带ip。如果想要自定义域名访问本地服务,需要做以下配置。 ip地址和域名映射 在域名请求…

六轴机械臂搬运仿真(机器人工具箱)

1、建立机械臂模型 工作台、货物 clear close all clc L(1)Link(d, 0.33, a,0 , alpha, pi/2,offset,pi); L(2)Link(d, 0, a, 0.26, alpha,0,offset,pi/2); L(3)Link(d, 0, a, 0.02, alpha,pi/2,offset,0); L(4)Link(d, -0.29, a, 0, alpha,pi/2,offset,0); L(5)Link(d, 0, a,…

问诊住院医疗业务数仓建模实操案例

一、数仓建模实超案例 (一)前言 医疗业务系统比较复杂,有HIS:医院信息管理系统( Hospital Information System)、CIS:临床信息系统(Clinical Information System)、LIS&…

临床数据 1. 临床基因突变数据如何发高分?

桓峰基因公众号的粉丝中医学类科研偏多,因此对于临床数据的分析需求还是很多的,因此我们再次推出临床数据相关的一些文献以及对应的分析方法,那么临床数据大概哪几类呢? 临床信息 患者的个人信息包括性别、年龄、家族遗传史、吸烟…

微众区块链开源分布式数据协作管理解决方案,建数据要素高效流通桥梁

数据要素已成为数字经济时代最核心的生产要素,为助力全行业伙伴提升区块链数据协作管理效率、保障数据要素高效有序流通,微众区块链在多年技术研究和应用实践的基础上,积极分析总结行业需求,研发了分布式数据协作管理解决方案DDCM…

css文字图标(阿里图标)使用及引入方式

首先打开 iconfont图标 网页 选择素材库中的单色图标库 选择自己需要用的图标 这里简绍四种类型的引入方式,其中是网页上的三种引入方式: 1. Unicode 使用方式 复制代码 引入样式 (这里是线上引入 通过网址引入的) 引入样式注意路径完整性 标签中间放入…

如何在Forlinx OK3588-C EVK上安装OpenCV?

OpenCV(开源计算机视觉库)是一个开源计算机视觉和机器学习软件库。 OpenCV 广泛应用于计算机视觉、机器人、智能交通、医学成像、安全等领域。 Forlinx RK3588 EVK 是一款高性能嵌入式计算机,结合 OpenCV,可进行高效的图像和视频处…

七牛云面试复盘-实习后端Java开发 一面复盘 【已通过】

💪💪💪欢迎订阅本专栏,持续更新,本专栏内容为我参加的各个公司面试的复盘专栏。将完整记录面试细节问题。 七牛云面试 实习后端Java开发 一面 [视频面试] 首先自我介绍 我是XXX,来自XXX,XXXX。 面试官提问: 1.先问几个基础题,循序渐进的来哈,谈谈Java⾃动装箱…

IM6ull LCD 驱动

一 LCD 简介 LCD(Liquid Crystal Display),液晶显示器。LCD的构造是在两片平行的玻璃基板中放置液晶盒,下基板玻璃上设置TFT(薄膜晶体管),上基板玻璃上设置彩色滤光片,通过TFT上的…

IDEA 集成 GIT

文章目录 16.IDEA中使用GIT-基本操作-add与commit 掌握目标内容 17.IDEA中使用GIT-基本操作-差异化比较目标内容 18.IDEA中使用GIT-基本操作-版本回退及撤消目标内容 19.IDEA中使用GIT-远程仓库-创建与关联远程仓库学习目标: 20.GitLab使用介绍_项目、用户和组介绍(…

Spark环境搭建与使用

第4关:使用Maven对Java独立应用程序进行编译打包 目录 第4关:使用Maven对Java独立应用程序进行编译打包 任务描述 相关知识 Maven安装 编程要求 任务描述 本关任务:编写一个简单的应用程序simpleApp2(实现spark自带文件REA…

Git使用入门

文章目录 简介安装linux离线安装windows安装 用户配置简单使用设置用户名提交至暂存区提交delete变更git add . 与 git add * 向远程库pushpush -f 分支建空白分支分支合并分支冲突 从远程库pull当远程库版本跟本地仓库不一致直接pull尚未pull 暂存区文件移除gitignoregitignor…

DuDuTalk:人工智能时代,AI技术如何赋能销售?

在数字化时代,人工智能(AI)正悄然改变着我们的生活和工作方式。销售领域作为商业运营的核心,自然也不能幸免于AI技术的影响。通过应用人工智能,销售团队能够在客户关系管理、销售预测、个性化营销等方面获得巨大的优势…

保姆级AT32F437 配置RT-Thread 以太网(UDP/TCP Server)

好记性不如烂笔头,既然不够聪明,就乖乖的做笔记,温故而知新。 本文档用于本人对知识点的梳理和记录。 一、前言 ENV版本:v1.3.5 rt-thread版本:V5 开发板:雅特力AT32F437 AT-START-F437 二、ENV配置 E…

回顾 | Let's Learn .NET - Web 开发实战

点击蓝字 关注我们 编辑:Alan Wang 排版:Rani Sun Lets Learn .NET 系列 “Lets Learn .NET” 是面向全球的 .NET 初学者学习系列,旨在通过不同语言,帮助不同地区的开发者掌握最新的 .NET 开发知识与技能。 “Lets Learn .NET”系…

【云原生架构模式】库(Library ) vs 服务(Service ) vs Sidecar(边车)

所有软件应用程序都由可重用的元素组成。这些可重用元素的目标和功能从基础设施级别到安全级别到业务能力各不相同。本文的目的是比较用于构建和部署这些可重用元素的不同方法。 1. 库 这是重用代码的最广泛使用的方法。可重用代码作为库开发和发布。在这种方法中,客…

web前端开发工程师工作的岗位职责(合集)

web前端开发工程师工作的岗位职责1 职责: 1、根据设计图进行前端页面开发并设计编写业务交互脚本 2、优化前端页面,保证良好的用户体验以及不同浏览器的兼容性 3、web前沿技术研究和新技术调研,将主流的特效应用到业务场景中 4、配合后台…