我与Datawhale的故事之长篇

news2024/11/27 6:17:19

 Datawhale成员 

作者:Datawhale团队成员

前 言

上周五周年文章发出后大家反响比较热烈:

我们与Datawhale背后的故事!

本期给大家带来三篇长篇回忆

胡锐峰 我与Datawhale的故事 

题记:我和你的相遇就像春风拂面,就像夏雨微微,就像金秋硕果,就像冬裹银装。

春:朝起莺鸣

那时的我还是一个挑灯夜读的AI学习者,那时的我还是一个懵懂昭昭的小镇做题家,从2018年底开始学习李航老师的《统计学习方法》,接触组织成员威哥的机器学习数学基础课程,当时为了看懂这本书,我翻遍了全网,都没有找到本书的课后习题解答,于是立志写出每道题的完整解答,中途遇到过很多次的妥协与放弃,第一版出来的时候很糟。

在2019年底看到了Datawhale这个组织,非常喜欢组织的开源思想,和范大交流后,决定要按照开源规范放到组织仓库中,这就是后来第1版的校对和内部审核。

正是:初时学艺只为乐,雏鸟莺鸣绘春晖。

夏:午后荫荫

从2020年开始,我的工作就忙起来了,当时还在北京出差,每天都沉浸在昏天黑地的加班生活中,学习也就放松下来。在2020年7月正式加入Datawhale组织,成为第140号成员(特别感谢碧涵给我介绍组织的学习模式,让我能更快地融入)。

直到2020年12月接触Pandas的组队学习(很感谢二茶,带领我了解组队学习全流程)就停不下来了,这个新颖的学习模式,打卡的节奏和欢快的学习交流非常适合我,在这繁燥的工作中,带来了一丝心境的微荫。

Datawhale二周年的年会,我作为新人第一次参加这种大型活动,戏称为“大型网友见面会”。那时认识了很多组织成员,第一次深入了解组织的成长史,感受到大家的热情,那天和安东、鹏志他们聊得很投入,交流了工作、学习、成长各个方面的心得。正是:异乡如故始为襟,夏怡荫荫待相随。

秋:晚暮薇荧

随着逐步融入组织生活,我的学习也进入了正轨,连续参与了2021全年11期的组队学习,截至目前已经参与了21期的组队学习,也建立了自己的JustForFun学习小队(队名来源于Linus的自传《Just for Fun: The Story of an Accidental Revolutionary》),目前共有90多人,很感谢小队成员们在学习期间的鼓励与支持。

除了学习课程,自己负责的统计学习方法习题解答项目也在此期间进入了校对和内部评审阶段,常常和项目组成员熬夜翻阅一篇篇论文、解决一道道难题,最终形成了一整套编写、检查和内部评审的全流程项目版本迭代,截至目前已经完成了李航老师三本书的所有课后习题,该项目GitHub上的星标数量已获得1.4k+。一个个优先的项目从这个温馨的大家庭中产生,一个个优秀的成员也成为各行各业的精英。这个家带来了生活中的喜悦,带走了过往的阴霾,驱散了前路的迷雾,指明了归航的港湾。

正是:学行邀聚盛硕蕾,一缕薇荧入秋归。

冬:夜曦惟心

从彷徨到行知,从迷途到心明,从犹豫到坚定,从陪伴到成长。从2022年开始陆续参加了多个开源项目,包括大话设计模式、深入浅出PyTorch、Fun-Rec推荐系统入门教程、大数据处理导论教程、华为OD算法题解等。从学习者逐步成长为课程设计者,通过给小伙伴们分享创作开源课程项目经验,提升了自己在课程设计、项目管理和课程开设各个方面的能力。

从加入组织之后,明确了自己的目标“让未来的孩子们少走弯路”,更坚定地实践着,并已在社群分享了56本书的笔记,和一群小伙伴们共同学习、分享和成长。从一个人工智能的初学者,到已成熟转战AI的各个领域,感谢课程设计者们,是你们提供了优秀的学习资源;感谢共学的小伙伴们,是你们带来了支持和鼓励,感谢Datawhale大家庭,是大家用自己的心温暖了这个寒冬之夜,愿所期而遇,所盼为欣,所念归往,所愿皆成。

正是:鲸出冬海腾飞日,千鸟翱翔万物生。

胡锐锋写于Datawhale五周年庆

言蹊  致Datawhale五周年 

Datawhale,你好哇,时间飞快马上你都要五周岁了,认识你也马上要四年整了。这近四年的时间里我见证了你的成长,你也像一个不可缺少的朋友默默在背后目睹了我的精彩。干一杯吧,为我们这1000多个日子的各自蜕变。

说起蜕变和成长,真要谢谢你。与你相遇时我尚未毕业,在物质上可以说毫无积蓄,在专业上可以说刚从学徒起步。回忆一下那个时候算法的学习并不是很顺利,时常想放弃。也恰巧独自参加kaggle比赛拿了块银牌,然后又在后面算法学习的迫切中遇到了你,加入了你,后面逐渐从参加组队学习的优秀学习者变成课程设计者,算法学习赛的评委等。可以说那块银牌鼓励了我先不要放弃算法,而你又亦师亦友的陪我走了大半年。那段日子在你的公众号发了篇文章也是高兴的,还记得写的金融风控算法的文章后,做风控算法的朋友来私聊我是当时备受鼓励又开心的事情了。缘此种种,也就继续算法的学习和工作了。18年师大入学第一课,陈老师问我们每一个人教育的本质是什么?她希望我们毕业时能有答案,我想我再和你一起进步的日子中已经有了属于自己的答案。教育的本质应该是激发人的那颗学习的心。

Datawhale,现在的你早已不是几年前那个蹒跚起步的孩子,你的队伍越来越大,组织的结构和载体越来越完善,合作伙伴也越来越多,真心的替你高兴。我也要和你汇报下这近四年时间里我的变化,学业上我硕士毕业啦,小有遗憾的是没有继续深造。不过毕业后也加入了自己理想的公司,升职加薪也没耽误。生活上我也结婚啦,认识你的时候我还单身,现在我找到了我人生中最重要的一部分。韶华易逝,人生中关键的这几年你都在和我一起经历,谢谢你。

Datawhale,上次祝福你是拍了个视频,这次想写点东西。还是喜欢文字,文字更有感情,更能和你倾诉,要和你讲的其实还有很多,一两杯酒是说不完的。但也总有结束,很多回忆留在那段岁月中就十分美好了。过往闪现的一个个老朋友,也是真的佩服你们,经历永远那么充沛。怀揣理想的新成员们也祝福你们未来更好。一方面作为一个社交很少的人i人本就缺乏主动,另一方面毕业工作后每日工作的繁累,生活的琐碎也不像以前那么时间自由。和大家的聚会、联结少了很多,也很久没有参加Datawhale的学习活动了,这都不止一次驱使我产生想要退出的想法。着实是很久没有给大家带来价值了。仅仅偶尔给成员推推简历、理财群聊聊天就是日常了,俨然成了一个吊车尾。但确实也是真的不舍得,一起经历了这么多。 

Datawhale,放心,现在的我也不是几年前的那个羽翼单薄的孩子,不必担心。无论做什么行业,在什么阶段,不管是专业上的停滞,还是生活上的磨难现在的我都能应付得了。感谢、感恩、祝福你我都更好。

言蹊 2023-12-7于北京

管柯琴 我与Datawhale的故事

大家好,我是管柯琴,于2022年4月加入Datawhale开源社区,成为了第 239 号成员。不知不觉,已经与Datawhale相伴近20个月,感慨不已。深感荣幸能够在人工智能最火热的时候加入社区,成为组织的一分子。

与小鲸鱼相伴的故事也算是硕士期间个人的成长历程。我硕士期间的研究方向是AI与金融的交叉研究。最初由于科研需要,我开始通过参加比赛来进行人工智能技术的学习攻关之旅。在某次搜寻比赛信息的过程中,意外发现了Datawhale这个组织。于是,与Datawhale的故事就此拉开序幕。

记得当时是在做2021年的世界人工智能大赛。机缘巧合之下,看到水哥在Coggle在进行Baseline的讲解,深受启发的同时也心生敬佩。原来真有一群人会秉持着奉献的精神, 不参杂个人利益来指导其他人参与比赛。这种精神触动了我,为我后续立志加入Datawhale埋下了伏笔。

之后,我便开始参与到了组队学习,不断加深与组织的羁绊,努力从学习学者向贡献者蜕变。前前后后,我一共参与了七次组队学习,一共获得了5次优秀队长,3次优秀学习者,1次优秀助教。组队学习的过程对我来说是一段舒适的打怪升级之旅,在其中学到了很多的知识。不断丰富着自己的技能圈的同时,也认识了许多新的小伙伴,互相鼓励、互相成长。

组队学习让我印象很深。学习环节中的所有人似乎都能在其中为他人做出奉献。从教程贡献者到助教,甚至是小队长和学习者。对于学习者而言,唯一需要付出的是坚持和自律,完成学习产出的优秀笔记对于其他学习者也是一种激励。而教程奉献者们需要考虑如何将自己的学习心得,用接地气的方式进行呈现。这不仅可以对其所学成果进行验收,也可以看作是目标导向学习的正向激励。

传道授业解惑。一直以来,我对于传道授业解惑的“师者”都心存敬佩。而Datawhale这一群人,用自己所学的知识,驱散他人学习道路上的障碍的事迹,对我来说就属于平凡但很伟大的“师”者精神。由于自身背景是商科,一直认为自己很难在人工智能领域做出与他们一样的伟绩。但最终我还是能以商科生的身份,用自己的方式回馈组织,参与了四个项目的整理和编撰。算是回报组队学习在我学习历程中的指引吧。

有朋自远方来,不亦乐乎。今年二月份,有幸参与了Datawhale上海四周年的年会。虽然在此之前,大家都素未谋面,但在线下场地见面之后,大家还是如同多年未见的老朋友一般聊的忘乎所以。每一个加入Datawhale的成员都有一技之长,同时也有一颗愿意奉献、热爱开源的心。这让我在组织中与小伙伴交流的过程中很放松,也很愿意与小伙伴们一起合作为开源宇宙事业添砖加瓦。

以用促学,learner for learner。于我而言,Datawhale陪伴了我几乎整个硕士生生涯,很幸运能在硕士入学不久就接触到了这个组织。在此期间,我学习了数据分析、集成学习、自然语言处理的相关技术。组织的开源仓库降低了我搜寻资料的门槛,也提升了我学习的效率。借助这些学习经历中所掌握的技能,我参与了不少数据挖掘类的竞赛。然后将竞赛中积攒的能力和技术运用到了我的科研论文中。

最终,我顺利发表了数篇论文,荣获了不少奖学金和荣誉称号。同时,也多亏了组织开源的自然语言处理教程,助力我顺利完成了硕士论文的答辩,最终来到清华大学继续攻读数据科学和信息技术的博士学位,完成了从商科到数据科学专业的跨越。由于出身商科,对于人工智能技术的使用,我一直不太自信,但随着与组织中的小伙伴的深入交流,我开始意识到,每一个learner都可以有自己的价值,从learner的视角出发,将自己的学习心得用浅显易懂的方式让更多的记录下来,又何尝不是一种learner间的互助与共鸣呢?

桃李不言,下自成蹊。五年是一段不短的时光,弥足珍贵的是,即使经过了五年的时间冲刷,组织依旧守住了 for the learner 的初衷。祝愿Datawhale五周年快乐,感谢组织给我带来的成长,很幸运能陪伴Datawhale共度过去两载岁月,也希望能陪伴组织度过未来的漫长岁月。同时也勉励自己,在未来学好本领,多为组织的开源事业做出一份贡献!希望我们每一个组织成员,都能在这里找到自己的价值,携手陪伴小鲸鱼变得更好!

管柯琴 2023 12 07

bc587a2795616fb5114338688a6aa1e3.png

开源组织,三连

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1318756.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[原创][R语言]股票分析实战[2]:周级别涨幅趋势的相关性

[简介] 常用网名: 猪头三 出生日期: 1981.XX.XX QQ联系: 643439947 个人网站: 80x86汇编小站 https://www.x86asm.org 编程生涯: 2001年~至今[共22年] 职业生涯: 20年 开发语言: C/C、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python 开发工具: Visual Studio、D…

UE5 C++(三)— 基本用法(生命周期、日志、基础变量)

文章目录 生命周期日志打印Outlog打印屏幕打印 基础变量类型FString、FName 和 FText,三者之间的区别 基础数据类型打印 忘记说了每次在Vscode修改后C脚本后,需要编译一下脚本,为了方便我是点击这里编译脚本 生命周期 Actor 生命周期官方文档…

20--Set集合

1、Set集合 1.1 Set集合概述 java.util.Set接口和java.util.List接口一样,同样继承自Collection接口,它与Collection接口中的方法基本一致,并没有对Collection接口进行功能上的扩充,只是比Collection接口更加严格了。与List接口…

wordpress安装之正式开始安装wordpress

1、拉取wordpress镜像 docker pull wordpress 2、启动容器 启动容器,设置容器名为wordpress2并把80端口映射到宿主机的9988端口 docker run -it --name wordpress2 -p 9988:80 -d wordpress 3、查看容器状态 docker ps 4、安装wordpress博客程序 因为我们前面启…

SLAM算法与工程实践——相机篇:传统相机使用(3)

SLAM算法与工程实践系列文章 下面是SLAM算法与工程实践系列文章的总链接,本人发表这个系列的文章链接均收录于此 SLAM算法与工程实践系列文章链接 下面是专栏地址: SLAM算法与工程实践系列专栏 文章目录 SLAM算法与工程实践系列文章SLAM算法与工程实践…

关于找不到XINPUT1_3.dll,无法继续执行代码问题的5种不同解决方法

一、xinput1_3.dll的作用 xinput1_3.dll是Windows操作系统中的一款动态链接库文件,主要用于支持游戏手柄和游戏输入设备。这款文件属于Microsoft Xbox 360兼容性库,它包含了与游戏手柄和其他输入设备相关的功能。在游戏中,xinput1_3.dll负责…

计算机操作系统-第十八天

目录 进程调度时机 补充知识 进程调度的方式 非剥夺调度方式 剥夺调度方式 进程的切换与过程 本节思维导图 进程调度时机 进程调度(低级调度),即按照某种算法从就绪队列中选择一个进程为其分配处理机。 共有两种需要进行进程调度与…

CCNP课程实验-OSPF-CFG

目录 实验条件网络拓朴需求 配置实现基础配置1. 配置所有设备的IP地址 实现目标1. 要求按照下列标准配置一个OSPF网络。 路由协议采用OSPF,进程ID为89 ,RID为loopback0地址。3. R4/R5/R6相连的三个站点链路OSPF网络类型配置成广播型,其中R5路…

PMP项目管理 - 资源管理

系列文章目录 PMP项目管理 - 质量管理 PMP项目管理 - 采购管理 PMP项目管理 - 资源管理 PMP项目管理 - 风险管理 现在的一切都是为将来的梦想编织翅膀,让梦想在现实中展翅高飞。 Now everything is for the future of dream weaving wings, let the dream fly in…

DISC-MedLLM—中文医疗健康助手

文章目录 DISC-MedLLM 项目介绍数据集构建重构AI医患对话知识图谱生成问答对医学图谱构建图谱生成QA对 人类偏好引导的对话样例其他数据MedMCQA通用数据 模型微调评估评估方式评估结果 总结 DISC-MedLLM 项目介绍 DISC-MedLLM 是一个专门针对医疗健康对话式场景而设计的医疗领…

「斗破年番」小医仙黑皇城遭调戏,五品丹换药材,获取菩提涎消息

Hello,小伙伴们,我是拾荒君。 《斗破苍穹年番》的第75集已经更新了,喜欢这部国漫的小伙伴应该都去观看了吧,拾荒君也是看了看这一集。在这一集中,萧炎成功地帮助吴昊等人摆脱了鹰爪老人的围困,然后便前往了黑皇城。 黑…

openGauss学习笔记-163 openGauss 数据库运维-备份与恢复-导入数据-使用COPY FROM STDIN导入数据-简介

文章目录 openGauss学习笔记-163 openGauss 数据库运维-备份与恢复-导入数据-使用COPY FROM STDIN导入数据-简介163.1 关于COPY FROM STDIN导入数据163.2 CopyManager类简介163.2.1 CopyManager的继承关系163.2.2 构造方法163.2.3 常用方法 openGauss学习笔记-163 openGauss 数…

torch中张量与数据类型的介绍

PyTorch张量的定义介绍 PyTorch最基本的操作对象是张量,它表示一个多维数组,类似NumPy的数组,但是前者可以在GPU上加速计算 初始化张量 ttorch.tensor([1,2]) # 创建一个张量 print(t) t.dtype #打印t的数据类型为torch.int…

Vue 指定class区域增加水印显示(人员姓名+时间)

效果 代码,存放位置 /utils/waterMark.js //waterMark.js文件let waterMark {}let setWaterMark (str,str1) > {let id 1.23452384164.123412416;if (document.getElementById(id) ! null) {//ui-table是table上的一个样式,一般水印显示在这个tab…

visual stdio code运行js没有输出

visual code运行js没有输出 先Debug file 然后右键直接run code就会输出了 插件的安装 visual stdio code插件安装 c qt wordle游戏实现

RK3568平台(网络篇)添加网络交换芯片RTL8306M

一.硬件原理图 分析: 该交换芯片支持I2C、SPI、mdio通信,但是看ast1520的uboot代码采用的是mdio去通信phy芯片的,所以暂时也先采用mdio的方式,需要配置相应的引脚才可以配置成mdio通信模式,具体的配置硬件工程师解决。…

代码随想录算法训练营Day4 | 24.两两交换链表中的节点、19.删除链表的倒数第 N 个节点、面试题. 链表相交、142.环形链表II

LeetCode 24 两两交换链表中的节点 本题要注意的条件: 遍历终止条件改变引用指向的时候,需要保存一些节点记录 为了更好的操作链表,我定义了一个虚拟的头节点 dummyHead 指向链表。如下图所示 既然要交换链表中的节点,那么肯定…

Ribbon使用

Ribbon :处理客户端负载均衡和容错的解决方案 配置Ribbon的负载均衡 Rule接口: 定义客户端负载均衡的规则 RandomRule :随机选择RoundRobinRuleZoneAvoidanceRule 配置ribbon的负载均衡策略 在配置文件中配置 user-center:ribbon:NFLoadBalancerRul…

网络安全项目实战(六)--报文检测

11. NTP应用协议报文解析 目标 了解NTP协议了解NTP包基本捕获方式了解NTP协议探测(解析)方法(简单方法) 11.1. 使用ntpdate同步网络时间 安装 $ sudo apt-get install ntpdate对时服务 查看时间 $ date #date可以查看当前系…

Jupyter Notebook: 交互式数据科学和编程工具

Jupyter Notebook: 功能强大的交互式编程和数据科学工具 简介 Jupyter Notebook是一个开源的Web应用程序,广泛用于数据分析、科学计算、可视化以及机器学习等领域。它允许创建和共享包含实时代码、方程式、可视化和解释性文本的文档。总而言之,我认为它…