报名开源之夏,与 StarRocks 一起畅游代码的海洋!

news2024/12/26 0:19:14

开源之夏是由中科院软件所“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,旨在鼓励在校学生积极参与开源软件的开发维护,培养和发掘更多优秀的开发者,促进优秀开源软件社区的蓬勃发展,助力开源软件供应链建设。

2023 年,开源之夏与 133 家优秀开源社区紧密合作,成功为本届活动上线 594 个项目任务,项目涵盖了操作系统、编译器、人工智能、大数据、数据库、云原生、RISC-V 等众多热门领域,涉及技术标签 110 多个。

数据库作为现代软件系统的核心组成部分,扮演着存储、管理和处理数据的重要角色。了解数据库的原理和技术,掌握数据库管理和优化的方法,对于从事软件开发、数据分析和系统架构等领域的学生和专业人士来说,都具有极大的价值和必要性。

作为一款高性能分析型数据库,StarRocks 社区在本次活动中提供了 3 个项目供同学们认领,分别涵盖基础难度和进阶难度,适合不同阶段的同学进行实战练习!通过参与 StarRocks 社区的项目,你将深入了解最前沿的数据库技术发展动态,零距离体验顶级开源项目,并通过社区导师的耐心指导和实际项目参与经历,培养良好的编码习惯和能力,实质性提升自身的专业能力,为未来的职业生涯奠定坚实基础。

参与开源之夏的同学们将获得丰厚的回报。除了开源之夏的结项证书,你还有机会赢得最高 12000 元的结项奖金。作为 StarRocks 社区的一员,你还将收获专属的社区周边礼品。

加入我们,一起开启数据库技术的奇妙之旅吧!期待与你相约 StarRocks 社区!🚀🌟

编辑切换为居中

添加图片注释,不超过 140 字(可选)

报名时间:4 月 29 日 至 6 月 3 日 15:00 UTC+8

报名方式:扫描上方「海报左侧二维码」报名或复制链接到浏览器打开:https://summer-ospp.ac.cn/org/orgdetail/fbddcc44-29d8-407b-abc4-13dcaf02d662?lang=zh

报名指南及注意事项:开源之夏学生报名官方公告

报名要求:本活动面向年满 18 周岁在校学生

StarRocks 社区简介

 

StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP 架构、CBO、智能物化视图、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。StarRocks 既支持从各类实时和离线的数据源高效导入数据,也支持直接分析数据湖上各种格式的数据。

StarRocks 兼容 MySQL 协议,可使用 MySQL 客户端和常用 BI 工具对接。同时 StarRocks 具备水平扩展,高可用、高可靠、易运维等特性。广泛应用于实时数仓、OLAP 报表、数据湖分析等场景。

截至 2022 年底,StarRocks 已被全球超过 200 家市值 70 亿人民币以上的头部企业采用,开源社区聚集 200 多位贡献者,近万社群用户。目前 StarRocks 在 GitHub 星数已超 4400 个,是《2022 开源大数据热力报告》中热力值增速第一的项目。StarRocks 也是全球顶级基金会 Linux Foundation 旗下的开源项目。

开源协议:Apache License 2.0

社区邮箱:community@starrocks.com

官网地址:https://www.starrocks.io/

社区项目主仓库:https://github.com/StarRocks/starrocks

导师介绍

StarRocks 开源之夏 2023 任务详情

任务一(基础难度)

支持 StarRocks Kettle Connector

项目简介:Kettle 是一款开源的 ETL 工具,采用 Java 编写,可以在 Windows、Linux、Unix 上运行,支持低代码、拖拽方式开发 ETL 数据管道,可对接包括传统数据库、文件、大数据平台、接口、流数据等数据源。本项目为 StarRocks 支持 Kettle connector,支持通过 Kettle 将数据写入到 StarRocks。

项目产出要求:

  • 实现 StarRocks Kettle Connector,并贡献到开源社区

项目技术要求:

  • 熟悉 Java 语言,了解数据库基本操作

导师:李鹏飞 lipengfei@starrocks.com

任务二(基础难度)

在 StarRocks 中实现 ORC Chunk Writer

项目简述:

ORC 文件格式是 Hadoop 生态圈中的一种列式存储格式,用于降低 Hadoop 数据存储空间和加速 Hive 查询速度,也是当前 OLAP 系统中最常用的列存格式之一。和 Parquet 类似,ORC 并不是一个单纯的列式存储格式,而是根据行组分割整个表,在每一个行组内进行按列存储。StarRocks 当前已经实现对 ORC 文件的读取功能,能够正常访问其他数据源的 ORC 数据文件。本项目考虑在 StarRocks 中实现 ORC Chunk Writer,支持将 StarRocks 的 chunk 数据写入到 ORC 文件当中。

项目产出要求

  • 在 StarRocks 上实现 ORC Chunk Writer,并贡献到开源社区

项目技术要求

  • 熟悉C++语言,有一定的数据库基础

导师:杨关锁 yangguansuo@starrocks.com

任务三(进阶难度)

用 JIT 加速 StarRocks 表达式执行

项目简述:

Just-in-Time (JIT) compilation 技术广泛应用于现代的数据库系统中。它是将用户输入的表达式、查询、存储过程等现场编译成二进制代码再执行,相比解释执行的方式,运行效率要高得多。尤其是对于计算密集型查询、或频繁重复使用的计算过程,运用代码生成技术能达到数十倍的性能提升。StarRocks 的执行引擎主要是采用向量化技术加速,如何将向量化和 JIT 结合是一件值得研究的课题。本次实践主要是用 JIT 优化 StarRocks 向量化执行引擎的表达式计算。

项目产出要求

  • 用 LLVM 来完成表达式的 JIT 优化,并贡献到开源社区

项目技术要求

  • 有一定的 C++ 和 数据库执行引擎的基础

导师:方祝和 fangzhuhe@starrocks.com

欢迎各位同学报名参 StarRocks 项目 ,与广大的 StarRocks 社区伙伴们携手共建极速统一的湖仓分析新范式!

无论是技术上的疑问还是项目中的挑战,如果你遇到任何问题,别担心!点击下方链接加入“开源之夏 2023 x StarRocks 活动群”,我们将为你提供最大程度的帮助和指导。

https://842372.ma3you.cn/articles/OdX21k6/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/563649.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

YOLOV5使用(一)

yolov5的工程使用(以人员检测为案例) 使用ubuntu为案例 docker run --gpus all -it -p 6007:6006 -p 8889:8888 --name my_torch -v $(pwd):/app easonbob/my_torch1-pytorch:22.03-py3-yolov5-6.0使用端口映射功能也就是说打开jupyter lab的指令是 http://localhost:8889/l…

flutter系列之:做一个下载按钮的动画

文章目录 简介定义下载的状态定义DownloadButton的属性让DownloadButton的属性可以动态变化定义downloadController定义DownloadButton的细节总结 简介 我们在app的开发过程中经常会用到一些表示进度类的动画效果,比如一个下载按钮,我们希望按钮能够动态…

AI歌手:新晋挑战者还是未来主流的替代者?

AI歌手:新晋挑战者还是未来主流的替代者? 近日,一款名为“AI孙燕姿”的AI歌手火遍全网,其翻唱的林俊杰的《她说》、周杰伦的《爱在西元前》、赵雷的《成都》等歌曲让网友纷纷表示:“听了一晚上,出不去了。…

《信息技术时代》期刊简介及投稿要求

《信息技术时代》(半月刊)本刊是由国家新闻总署批准,深圳湾科技发展有限公司主管主办的信息类期刊,国内统一刊号CN:44-1536/TN,国际标准刊号ISSN:1671-153x。本刊旨在为全集团的信息工作者提供交…

Hadoop部署完全分布式

​ 在真实的企业环境中,服务器集群会使用到多台机器,共同配合,来构建一个完整的分布式文件系统。而在这样的分布式文件系统中,HDFS相关的守护进程也会分布在不同的机器上,例如: NameNode守护进程,尽可能的…

【OpenCv • c++】几何检测 —— 霍夫变换 | 霍夫直线检测 | 霍夫线变化

🚀 个人简介:CSDN「博客新星」TOP 10 , C/C 领域新星创作者💟 作 者:锡兰_CC ❣️📝 专 栏:【OpenCV • c】计算机视觉🌈 若有帮助,还请关注➕点赞➕收藏&#xff…

浅谈YUV444、YUV422、YUV420

本期将会给大家介绍YUV相关基础知识,同时也介绍威创网络分布式系统的卓越色彩处理技术。 1.什么是YUV色彩空间 2.YUV采样格式 3.YUV不同采样格式对图像画质的影响分析 一、什么是YUV色彩空间? YUV是视频、图片、相机等应用中常常使用的一类图像格式,是…

【python案例】获取IP代理数据,筛选出符合需求的IP

前言 嗨喽&#xff0c;大家好呀~这里是爱看美女的茜茜呐 我们为什么要IP代理呢&#xff1f; 当采集数据, 批量采集数据, 请求速度过快, 网站可能会把你IP封掉 <你的网络进不去这个网站> IP代理换一个IP, 再去采集请求数据 开发环境: 解释器版本: python 3.8 代码编辑…

Vicuna:斯坦福开源一个性能相当于90%ChatGPT的聊天机器人

自从Meta公司发布LLaMA以来&#xff0c;围绕它微调和开发的模型越来越多&#xff0c;这得益于它的性能和效果&#xff0c;2023年3月份发布的草泥马&#xff08;Alpaca&#xff09;是由Meta的LLaMA 7B微调而来的全新模型&#xff0c;仅用了52k数据&#xff0c;性能约等于GPT-3.5…

欧奈尔杯柄形态选股公式,突破杯柄高点发出信号

杯柄形态是由美国著名的成长股投资大师威廉欧奈尔提出的&#xff0c;在其经典著作《笑傲股市》中有详细介绍。 根据欧奈尔在书中的描述&#xff1a; 从侧面观察其轮廓时&#xff0c;最重要的价格形态之一看起来就像是一个带柄的茶杯。杯状形态可以持续7~56周不等&#xff0c;但…

数据结构选择题(难题题解) 第五章 树

5.2 14. 法1&#xff1a;少一个叶子再多一个叶子&#xff0c;欠考虑了 选B 法2&#xff1a; 法三&#xff1a; 5.3 23.选D A. 如果是根 直接找孩子就能找到后继&#xff1b;如果是左孩子&#xff0c;有孩子就找孩子&#xff0c;无孩子&#xff0c;指针是空&#xff0c…

ROS2 msg和srv CMake编写注意事项

ROS2使用msg和srv可以参考官网&#xff1a; 工程文件cpp所包含的头文件&#xff0c;其中 cpp_pubsub_self/msg/test.hpp 为msg消息消息生成的头文件&#xff0c;具体的可以参考官网 注意事项&#xff1a; 在 ROS2 当中&#xff0c;使用 msg 和 srv 消息文件格式的时候&#…

单点登录三:添加RBAC权限校验模型功能理解及实现demo

1、RBAC权限模型 RBAC&#xff08;Role-Based Access Control&#xff09;是一种基于角色的访问控制模型&#xff0c;用于管理系统中用户的权限和访问控制。它将用户、角色和权限之间的关系进行了明确的定义&#xff0c;以实现灵活的权限管理和控制。 1.1、RBAC模型主要包括以…

这才是CSDN最系统的网络安全学习路线(建议收藏)

01 什么是网络安全 网络安全可以基于攻击和防御视角来分类&#xff0c;我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术&#xff0c;而“蓝队”、“安全运营”、“安全运维”则研究防御技术。 无论网络、Web、移动、桌面、云等哪个领域&#xff0c;都有攻与防两面…

异步复位同步释放

(1条消息) 芯片设计全流程知识点总结_GGbao_的博客-CSDN博客 异步复位同步释放在always语句块里为&#xff1a; 当异步复位信号到来时&#xff0c;寄存器 reg_1 会被直接拉低&#xff0c;这是不会产生问题的&#xff0c;当rstn下降沿和clk上升沿同时到来时&#xff0c;如果rstn…

EduSoho 网校系统部署

目录 一、初始化环境二、安装 Nginx三、安装 MySQL四、安装 PHP五、上线 EduSoho六、验证FAQ 一、初始化环境 1、安装wget 如果系统已安装wget,请跳过此步骤 yum install wget2、关闭防火墙/Selinux systemctl stop firewalld.service systemctl disable firewalld.service…

Win32通用控件,加载进程(PE查看器)项目初步

在本专栏上一篇文章中带领大家学习了对话框的创建&#xff0c;并且在项目中创建出了对话框。在这一篇文章中&#xff0c;我将带领大家学习Win32通用控件&#xff0c;了解_WM_NOTIFY消息&#xff0c;并且带领大家初步写出课程中加载Windows所有进程的应用程序的雏形&#xff0c;…

因为懒,我用了“低代码”打下手

目录 一、前言 二、工具介绍 三、平台特点 四、如何使用JNPF&#xff1f; 五、低代码平台的选择参考 六、总结 一、前言 「一个优秀的开发者&#xff0c;一定是会利用各种工具来提升自己的开发效率。」 前段时间&#xff0c;体验了很多国内前沿的低代码平台&#xff0c;在…

Fiddler抓包工具之Fiddler界面主菜单功能介绍

Fiddler界面主菜单功能介绍 File菜单 File菜单中的命令主要支持完成通过Fiddler来启动和停止web流量的捕获&#xff08;capture&#xff09;,也可以加载或存储捕获的流量 &#xff08;1&#xff09;Capture Traffic&#xff1a;默认勾选&#xff0c;勾选此项才可抓包&#xff…

Linux ALSA音频工具

参考&#xff1a; ALSA 音频工具 amixer、aplay、arecord Linux Alsa ALSA的配置文件 音频录制——arecord 音频播放——aplay 音频配置——amixer alsamixer与amixer的区别 alsamixer是Linux音频框架ALSA工具之一&#xff0c;用于配置音频各个参数; alsamixer是基于文本图形…