对话教授丨中国石油大学(华东)理学院:课赛结合打造有学科特色的数据科学与大数据技术专业

news2025/1/12 3:06:09

2015 年,教育部公布新增“数据科学与大数据技术”专业,首批本科专业 2016 年入学;此后,32 所、250 所、196 所……迄今为止,全国各地已有 700 余所高校开设此专业。

中国石油大学(华东)(以下简称“中石大”)作为教育部直属全国重点大学,也是“双一流”首批建设高校,其理学院于 2019 年获批开设数据科学与大数据技术专业,秋季招收首批本科生。从时间上看,中石大开设得并不算早;但从专业与学生发展来看,中石大后起而勃发,结合校特色学科进行的专业建设与人才培养工作,取得了十分亮眼的成绩

  • 2023 软科中国大学专业排名 57/370,排位 A 档(上榜的 370 所学校本身即为专业排名前 50% 的高校);
  • 全国高校人工智能与大数据创新联盟发布的《2023 全国 743 所普通高校数据科学与大数据技术专业教育教学综合实力排行榜》排名 34/743,排位 A 类;
  • 2023 年 63 名首批毕业生,升学就业综合质量水平高;

还有雄厚的师资、强大的科研实力……均构成了中石大过硬的招生简章。

图1:2023年首批毕业生出口情况(图源微信公众号“中石大本科招生”招生推文)

中石大如何交出这份漂亮答卷?

和鲸与中石大从 2019 年开始合作至今,一路陪伴、见证了专业的成长。在迎来首批毕业生这样特殊的节点,我们邀请了中国石油大学(华东)理学院数据科学与统计系主任陈华老师,共同揭开背后的故事……

OBE 模式:厚基础、创特色、重实践

——和鲸协同打造建设大数据实践教学平台

数据科学本身即具有交叉属性,可认为是数学、统计学、计算机科学三者的结合。中石大的数据科学与大数据技术专业虽在理学院下开设,但专业建设的规范和标准是什么、课程如何设置、学生如何培养……陈华老师告诉我们,这些都是最初规划时困扰了老师们很久的问题。

“各个学校对于新专业的设计差异很大,因为都是在摸着石头过河。18 年我们几乎花了一整年时间到各个已经开设了(数据科学与大数据技术专业)的高校学习和沟通。”

而在经过广泛调研后,理学院最终决定基于 OBE 模式——从学生的出口倒推课程的设计,落实到具体的培养方案上,则形成了融合厚基础、创特色、重实践等的设计理念,这也为和鲸与中石大的友好合作奠定了基础。

课程教学体系:以学生的出口为导向

学生的出口主要针对就业与深造两个方向。

就业方面的能力对标的是“数据科学家(Data Scientist)”,它对应在企业的职能可能是数据分析师、算法工程师、人工智能工程师、大数据专家等等,与传统的统计学出口相比范围会更广泛。2020年人社部发布的《新职业——大数据工程技术人员就业景气现状分析报告》中指出,大数据行业的就业方向包括研发类、开发类和分析类,因而学生既要能精通计算机与统计学,打下厚实的数学基础,也要学习大数据、人工智能、算法、模型等,了解各类技术的基础原理。深造则更多从学生考研的角度出发,由于数据科学目前尚未设置一级学科,便还是以计算机与统计为两大主流方向

另外,理学院更进一步结合中石大的校特色——能源与海洋,打造有学科特色的数据科学与大数据技术专业,从行业角度加强对于学生在技术与领域结合方面能力的培养。正如陈华老师所言:“数据要依托于领域,没有领域的支撑数据便无法发挥作用。” 学科交叉的创新课程不在多而在精,从领域出发才能形成有效结合,正是在此基础上,中石大与和鲸共同探索出了课赛结合的创新实践课程(将在后文具体说明),这也是目前和鲸调研下来教学效果最好的学科交叉课程的授课模式。

基于 OBE 理念,结合科学(数学、统计学、数据科学)、技术(计算机技术、大数据技术)及能源与海洋应用三个层次,便构成了中石大独有的课程教学体系。

图2:培养方案展示(图源陈华老师提供的材料)

实践教学体系:大数据实践教学平台

实践对于数据科学与大数据技术教学的重要性不言而喻,在课堂教学体系的基础上,理学院同时构建起“五位一体”的实践教育体系,包含课内上机、暑期实训、学科竞赛、自主创新项目及企业实践,以培养高层次复合型数据科学应用人才。

然而,课堂实践普遍存在一些特质化的重难点问题:例如师生将面对繁复的环境准备、专业发展不成熟导致课程的数据资源与案例资源有限、算力资源用不起来等等……因此,为了实现更有效、更高效的实践教学,在中石大数据科学与大数据技术专业获批的同年,和鲸协助理学院基于 ModelWhale 数据科学教学-实训平台,建设学练一体的大数据实践教学平台,支持日常的课程教学

平台同时提供 Jupyter Notebook 交互式编程工具和拖拽式分析建模工具,并内置了数百种 Python、R 语言工具包和深度学习框架,师生网页登录即可进行使用。课上,学生可以跟着老师的节奏复现课件及案例,加深对知识的理解;课后,老师可以发布实践练习让学生在线提交并自动评分。

动图封面
图3:平台内置多种镜像环境且可自定义配置

对于《机器学习》、《神经网络》这类的核心专业课,理学院采取了创新的教学模式——先实践后理论。“和鲸的平台能很好地帮助学生快速上手,学生在实践课上调用过以后就会产生好奇心,比如当他想知道如何改进优化结果时,就会反过来激发他了解内部机理、学习理论课的热情。” 陈华老师说,“和鲸社区也提供了丰富的教学资源,我经常能看到学生提交上来的作品标注数据来源于和鲸社区。”

图4:和鲸社区数据集界面展示

实践氛围:竞赛赋能的第二课堂

——和鲸协同打造课赛结合的创新课程

除了课内实践外,学院还设置了特别的课外实践形式:数据科学竞赛。陈华老师表示:“竞赛可以培养学生的创新意识,让学生在解决真实行业问题的过程中锻炼实践能力。”

但与其他竞赛不同的是,数据科学竞赛涉及到数据、代码、环境、算力等多种要素,若缺乏合适的竞赛平台,其筹备与运营将十分繁复。在此背景下,理学院邀请和鲸共同办赛,和鲸从 2015 年就开展了数据科学竞赛业务,甚至可以说是国内数据竞赛的开拓者,丰富的办赛经验与体系化的赛事模块已获得高校的广泛认可。

2021年5月,在中石大“数学文化节”期间,由和鲸联合主办的中国石油大学(华东)疾病预测数据竞赛(校内赛)在和鲸社区正式上线。比赛同样基于 ModelWhale 数据科学教学-实训平台,通过“算法学习+算法竞赛”的形式,提升学生的数据科学基础知识和数据思维能力,在实战应用中重组所学知识,实现学以致用,达到以赛促教、以赛促学的目的

图5:校内赛比赛界面展示

先学后赛,巩固理论基础

考虑到参赛的学生不一定完全具备参赛所需的基础知识与技能,故而赛程设置三个阶段:

  • 前两个阶段为训练营,提供数据分析、机器学习的学习材料及练习作业,便于基础薄弱的学生集中学习。另外和鲸社区内有丰富的活动与学习资源,学生更可以从应用角度额外对其他薄弱的知识点重新巩固,打好基础。训练营的教案与社区的教学项目均可以通过 ModelWhale 平台 一键复现,在线运行。
  • 第三阶段是训练营+正赛,ModelWhale 平台完备的比赛模块及和鲸成熟的赛事运营经验,让无论是学生的作品开发与提交还是老师的运营与评审都更加便捷、顺畅。

图6:和鲸社区内丰富的学习活动

事实上,“以赛促教”最根本的目的还是在于验证学生对知识掌握的水平与实操能力,过程比结果更重要。因而平台除了提供高效的自动评估外,老师也可以通过主观评审直接查看并运行学生编写的代码,了解学生的算法思路,验证能否真正跑通,并进行打分、留下评语,指导学生改进

陈华老师告诉我们,通过先学后赛的形式,学生在下半年上《数据科学与大数据技术导论》时明显有了更深刻的理解与更扎实的基础。

课赛结合,营造实践氛围

与办赛同样重要的是激发学生的参赛积极性。其实早在数据科学专业开设之前,中石大就以举办数学竞赛形成了较为浓厚的竞赛氛围,后来又设置了“第二课堂”激励学生参与各类创新创业、社会实践与志愿服务等活动。

对于数据科学与大数据技术专业的同学,理学院将第一课堂与第二课堂进行了结合,形成创新的“课赛结合”模式——将竞赛融入课堂教学,竞赛的作品与成绩对应列入课程考核的一部分。2022 年的第二届数据竞赛以海洋为主题,赛题考核的范围浅至如何认识海洋大数据,深至海洋数据挖掘与深度学习模型。在和鲸的协助下,赛题设计既面向真实应用场景,又能与课程的知识点与教学进度高度挂钩,可以达到更有效的教学评估

更为重要的是,参与校内竞赛能帮助学生积累竞赛经验,以在更高级别的竞赛上取得好成绩。但陈华老师表示,理学院会给学生提供一份竞赛指南:“现在市面上竞赛很多,参赛又很耗时,我们希望学生能真正参与那些对他们有帮助的比赛,比如你们和鲸承办的 4C 大赛。还是那句话,要以出口为导向。”正是在这样的引导下,2023 年的首批毕业生均有着出众的竞赛经历与竞赛实力,在多个国家 A 类竞赛中取得的佳绩成为了他们就业时的“加分项”。

图7:学生获得的竞赛荣誉(部分)(图源微信公众号“中石大本科招生”招生推文)

另外,理学院举办的竞赛也不仅仅面向本专业学生,全校各个专业都可以参与。从 2021 年第一届的疾病预测,到 2022 年海洋数据,再到 2023 年的贷款预测,多样化的赛题已吸引了上千名学生。

“和鲸的平台很灵活,既能举办小规模的校内比赛,也能承接大规模的国家级赛事。希望咱们之后有机会举办一个覆盖整个青岛高校的挑战赛,扩大竞赛的覆盖面,让更多学生受益。”这是陈华老师的期待,也是和鲸的期待。

图8:近期和鲸承办的顶尖赛事

未来:携手和鲸,培养应用型数据科学人才

四年过去,中国石油大学(华东)理学院数据科学与大数据技术专业从开设到迎来了第一届优秀毕业生,和鲸也获得更多认可与信任,成长为高校搭建教学实训平台的首选。但正如陈华老师所说,专业的发展要跟上时代,技术的发展也在日新月异,未来双方仍将持续携手,共同进步、共同成长。

基于全国高等教育新愿景,和鲸长期助力推动高校教改、课改,依据 OBE 成果导向教育模式,集成功能强大的数据科学协同平台 ModelWhale,拥有丰富实战案例资源的和鲸社区,及和鲸科赛多年的办赛经验与比赛模块,构建出了最完备的产品 + 资源 + 服务体系,并已落地应用于众高校数据科学相关专业(课程)体系建设的工作中——协助中国人民大学信息学院搭建“交叉学科教研一体化新型数据分析平台”、协助四川大学公共管理学院搭建“大数据应用实训系统”、协助暨南大学经济管理实验教学中心搭建“商科大数据教学实训平台”…——获得从双一流到普通高校客户的广泛好评。

和鲸愿用已积累、沉淀的经验及方法论,与高校一起梳理需求、痛点,进行数据驱动相关专业(课程)体系的搭建与完善,为国家应用型人才培养带来实质性的帮助。任何相关需求,都欢迎您扫描下方二维码或搜索进入 ModelWhale 官网 注册体验、与我们展开交流。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/876011.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【日常积累】Linux之init系统学习

init系统简介: Linux 操作系统的启动首先从 BIOS 开始,接下来进入 boot loader,由 bootloader 载入内核,进行内核初始化。内核初始化的最后一步就是启动 pid 为 1 的 init 进程,这个进程是系统的第一个进程,它负责产生…

ROS相关技术(概念版)

重要说明:本文从网上资料整理而来,仅记录博主学习相关知识点的过程,侵删。 一、参考资料 ROS官网 二、相关介绍 ROS学习笔记3:ROS架构(了解) ROS介绍 1. ROS简介 ROS是一项由通信机制、开发工具、应…

(三)Unity开发Vision Pro——入门

3.入门 1.入门 本节涵盖了几个重要主题,可帮助您加快visionOS 平台开发速度。在这里,您将找到构建第一个 Unity PolySpatial XR 应用程序的分步指南的链接,以及 PolySpatial XR 开发时的一些开发最佳实践。 2.开发与迭代 有关先决条件、开…

打开远程桌面连接窗口

按键“windowsr”,调出“运行”,输入"mstsc",然后输入用户名和密码即可,用户名和密码是在被远程控制的服务器windows用户名和密码,即可远程桌面连接成功。

为什么所有的SiC肖特基二极管都不一样

在高功率应用中,碳化硅(SiC)的许多方面都优于硅,包括更高的工作温度以及更高效的高频开关性能。但是,与硅快速恢复二极管相比,纯 SiC 肖特基二极管的一些特性仍有待提高。本博客介绍Nexperia(安…

网络设备(防火墙、路由器、交换机)日志分析监控

外围网络设备(如防火墙、路由器、交换机等)是关键组件,因为它们控制进出公司网络的流量。因此,监视这些设备的活动有助于 IT 管理员解决操作问题,并保护网络免受攻击者的攻击。通过收集和分析这些设备的日志来监控这些…

【力扣每日一题】2023.8.14 合并二叉树

目录 题目: 示例: 分析: 代码: 题目: 示例: 分析: 给我们合并两棵二叉树,合并的方式就是把对应位置的节点的值相加,最后把合并后的二叉树的根节点返回出去。 这类二…

如何使用Spark/Flink等分布式计算引擎做网络入侵检测

如何使用Spark/Flink等分布式计算引擎做网络入侵检测 引言16 Distributed Abnormal Behavior Detection Approach Based on Deep Belief Network and Ensemble SVM Using Spark17 Spark configurations to optimize decision tree classification on UNSW-NB1518 A dynamic spa…

低成本搭建NAS,利用HFS进行内网穿透,实现公网访问

通过HFS低成本搭建NAS,并内网穿透实现公网访问 文章目录 通过HFS低成本搭建NAS,并内网穿透实现公网访问前言1.下载安装cpolar1.1 设置HFS访客1.2 虚拟文件系统 2. 使用cpolar建立一条内网穿透数据隧道2.1 保留隧道2.2 隧道名称2.3 成功使用cpolar创建二级…

Docker-compose部署Harbor实操(含故障处理)

操作环境 Harbor主机系统类型:Centos7 Harbor版本:v2.8.3 Docker-compose版本:1.29.2 Docker版本: 一.Docker及Docker-compose环境安装 官方对Docker及Docker-compose版本有要求,目前我这个主机的版本不适用&#x…

14k视觉大模型综述

目录 0.导读1.背景介绍1.1基础架构1.2目标函数1.2.1对比式学习1.2.2生成式学习 1.3预训练1.3.1预训练数据集1.3.2微调1.3.3提示工程 2.基于文本提示的基础模型2.1基于对比学习的方法2.1.1基于通用模型的对比方法2.1.2基于视觉定位基础模型的方法 2.2基于生成式的方法2.3基于对比…

springboot邮件任务

<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-mail</artifactId></dependency> 依赖 配置文件 spring.mail.username1393087444qq.com spring.mail.password************* spring.mail.hos…

代码详解 —— VGG Loss

文章目录 VGG Loss 的基础概念VGG 的网络结构VGG LOSS 的代码解析参考 VGG Loss 的基础概念 VGG Loss 是content Loss中的一种。 为了评价图像的perceptual quality&#xff0c;《Perceptual losses for real time style transfer and super-resolution》 和 《GeneratingImag…

【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 8 日论文合集)

文章目录 一、分割|语义相关(19篇)1.1 Mask Frozen-DETR: High Quality Instance Segmentation with One GPU1.2 AdaptiveSAM: Towards Efficient Tuning of SAM for Surgical Scene Segmentation1.3 SEM-GAT: Explainable Semantic Pose Estimation using Learned Graph Atten…

【Vue-Router】路由传参

1. query 传参 list.json {"data": [{"name": "面","price":300,"id": 1},{"name": "水","price":400,"id": 2},{"name": "菜","price":500,"…

eachars 自适应

目录 1. 案例&#xff1a; 2. 原因&#xff1a; 3. 解决&#xff1a; 1. 案例&#xff1a; 默认是正常宽度&#xff08;如图1&#xff09;&#xff0c;当再次跳转会该页面时&#xff0c;eachars图发生变化&#xff08;如图2&#xff09;。 图1 图2 2. 原因&#xff1a; 没有…

三维模型OSGB格式轻量化在三维展示效果上的重要性探讨

三维模型OSGB格式轻量化在三维展示效果上的重要性探讨 三维模型在展示中的效果是十分关键的&#xff0c;因为它直接影响用户对模型的理解和体验。而OSGB格式轻量化是实现优质三维展示效果的关键技术之一。下面将详细介绍轻量化OSGB格式的三维模型在三维展示效果上的重要性。 首…

“多测合一”生产软件-不动产测量(不动产权籍调查测绘软件RESS),房地一体化测量由请湖南来示范

湖南“多测合一”生产软件-不动产测量软件&#xff0c;提取码&#xff1a;RESShttps://pan.baidu.com/s/1OqakLJICIP6buNiZ6j9Npw?pwdRESS 2020年7 月&#xff0c;国务院办公厅印发《 国务院办公厅关于进一步优化营商环境 更好服务市场主体的实施意见》 &#xff08;国办发〔 …

Android之SQLite数据库的使用总结

一、SQLite数据库基本使用 1、特点 &#xff08;1&#xff09;嵌入式数据库&#xff0c;体积小 &#xff08;2&#xff09;数据库是由底层的sqlite.c执行程序的代码动态生成的&#xff0c;不用人为去创建数据库 &#xff08;3&#xff09;涉及抽象类SQLiteOpenHelper 2、继承…

【Java从0到1学习】08 String类

1. 概述 字符串是由多个字符组成的一串数据(字符序列)&#xff0c;字符串可以看成是字符数组。 在实际开发中&#xff0c;字符串的操作是最常见的操作&#xff0c;没有之一。而Java没有内置的字符串类型&#xff0c;所以&#xff0c;就在Java类库中提供了一个类String 供我们…