《Datawhale南瓜书》出第二版啦!

news2024/12/23 13:58:16

 Datawhale干货 

作者:Datawhale开源项目团队

作为机器学习的入门经典教材,周志华老师的《机器学习》,自2016年1月底出版以来,首印5000册一周售罄,并在8个月内重印9次。先后登上了亚马逊,京东,当当网等的计算机类畅销书榜首,身边学习机器学习的小伙伴基本上是人手一本。

当初在学习周志华《机器学习》教材的过程中,遇到了公式推导的难题,苦于没有人答疑解惑,于是发起了Datawhale南瓜书项目,希望再也没有难推的公式,深入理解机器学习。

2020年,Datawhale开源项目“南瓜书”发布,受到全网转发。3年后,“南瓜书”完整版第2版完结撒花,重磅出版。南瓜书是经典“西瓜书”《机器学习》公式完全解析指南,第1版受到了读者的一致好评,并得到了俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达6位人工智能领域大咖亲笔推荐,截止此时star 数已经突破2万!

相较于第1版,除了篇幅上从168页扩充到308页,《机器学习公式详解(第2版)》呈现出4大亮点:

1. 对“西瓜书”中除了公式以外的重难点内容加以解析;

2. 以过来人的视角给出学习建议;

3. 对比较难理解的公式和重点内容扩充具体的例子说明;

4. 对跳步过大的公式补充具体的推导细节。

ed8dcfa127d06851ea952762ebc43e9f.png

一、从开源到出版

从李沐开源的《动手学深度学习》,邱锡鹏的《神经网络与深度学习》,再到Datawhale开源的《南瓜书》出版,知识回归大众,让大众有机会和行业精英一样为社会做出贡献,是南瓜书项目的探索性意义。

南瓜书是Datawhale组织成员以及读者们一起相互支持的结果,从开源到出版,带来的收入其实不高,但让开源贡献者被大众认可是促使开源良性循环的重要一环,会促使国内的开源氛围变好,让更多人受益。

确切地说,这是一本“伴侣书”

类似于咖啡伴侣一样,《机器学习公式详解》系列是周志华教授的“西瓜书”——《机器学习》的伴侣书,它也有一个可爱的名字 ——“南瓜书”。“南瓜书”第1版对“西瓜书”中的公式进行了解析,并补充了必要的推导过程及先验知识。

“南瓜书”第2版是Datawhale成员的自学笔记,更是第1版的升级版。本书扩充了对“西瓜书”解读的覆盖面,对“西瓜书”中320个重难点公式做了详细解析和推导(重难点公式覆盖率达99%,第1版重难点公式数量为250),旨在全面解决机器学习中的数学难题。

这是一本通过开源方式多人协作写成的书

这种多人分工合作、互相校验、开放监督的方式,既保证了书的质量,也保证了写作的效率. 在我看来,这是一种站在读者角度且非常先进的生产方式,容易给读者带来很好的体验.

这是一本完全根据学习经历编著而成的书

也就是说,这本书完全从读者学习的角度出发,分享编著者在学习中遇到的“坑”以及跳过这个“坑”的方法,这对初学者来说是非常宝贵的经验,也特别能够引起他们的共鸣. 其实,每个人在学习一门新的课程时,都会有自己独特的经验和方法. 这种经验和方法的共享非常难能可贵. 在这里,理解公式便是编著者认为了解机器学习原理的最好方法,其实对于这一点我也深表赞同,因为在学习中我就是那种喜欢推导公式的典型代表,只有公式推导成功,才觉得对知识的原理理解得更深刻,否则总是觉得心里不踏实.

二、感谢老师们的鼓励和支持

感谢俞勇、李沐、程明明、爱可可、徐亦达、王斌 6位人工智能领域大咖的亲笔推荐。

这是一本与众不同的书。首先,这是一本“伴侣书”。类似于咖啡伴侣一样,这本书是周志华教授的“西瓜书”——《机器学习》的伴侣书,它也有一个可爱的名字——“南瓜书”。其次,这是一本通过开源方式多人协作写成的书。这种多人分工合作、互相校验、开放监督的方式,既保证了书的质量,也保证了写作的效率。最后,这是一本完全根据学习经历编著而成的书。它完全从读者学习的角度出发,分享编著者在学习中遇到的“坑”以及跳过这个“坑”的方法,这对初学者来说是非常宝贵的经验,也特别能够引起他们的共鸣。

——王斌 小米AI 实验室主任、NLP 首席科学家

面对一本有很多数学难题的教材,初学者最渴望的是有一位“全能助教”,能帮助详细解析,步进推导,以便更好地消化教材。由开源组织Datawhale 发起编写的“南瓜书”集众人的智慧、开源社区的力量,为广大机器学习初学者带来了福音,给周志华教授的畅销书“西瓜书”配了一个“全能助教”。愿这两本书为所有人工智能领域及行业内求学者、从业者启智增慧,创造未来。

——俞勇 上海交通大学特聘教授

上海交通大学ACM 班创始人,伯禹教育创始人

 推导一遍所有公式是非常好的学习方法,很高兴看到“南瓜书”能专注于此. 它是学习“西瓜书”不可缺少的辅助材料。

——李沐 AWS 资深首席科学家

《动手学深度学习》作者

“南瓜书”是Datawhale 开源团队产出优质内容的一种全新探索。这本书以开源项目的形式,帮助读者推导重要的公式,并对知识难点进行深入探讨。这种新的学习思路和撰写模式,自打开始那一刻,就紧紧抓住读者的需求和痛点,使得这本书成为非常值得推荐的好书。和这本书同样值得推荐的,还有Datawhale 的开源精神和实践精神。

——程明明 南开大学计算机系主任,开放共享科研记录行动倡议者

这本书是读透“西瓜书”的好“伴侣”。尽管这本书并不适合所有人,但真正需要它的人会觉得它特别有用。它就像一位学霸同桌,可以在你啃“西瓜书”一筹莫展的时候为你“雪中送炭”。对很多人来说,数学公式是一种很可怕的存在,但是学问之美往往就在“最险远处”,披荆斩棘之后方能品出其真滋味。如果想要理解机器学习,而不止步于了解和应用,这本书将是你的好“同桌”——伴你思考,同享“知其所以然”的乐趣。

——陈光 北京邮电大学副教授

知名博主@ 爱可可- 爱生活

对机器学习初学者来讲,“南瓜书”补充且拓展了数学方面的基本知识,是“西瓜书”的佐读良品。

——徐亦达 悉尼科技大学副教授,机器学习开源讲义作者

三、给读者的学习建议

首先,这本“南瓜书”要和“西瓜书”配套阅读

南瓜书的最佳使用方法是以西瓜书为主线,如果在阅读“西瓜书”时对公式疑惑或对概念理解不畅,可以通过“南瓜书”快速定位公式并进行推导,从而深入理解. 从这个意义来说,“南瓜书”可以看成是“西瓜书”的公式字典.超纲的数学知识以附录和参考文献的形式给出;

配套视频:https://b23.tv/jwwRtw6

其次,阅读时克服对公式的排斥或者畏惧心理

公式是通过符号对原理本质的高度概括,是一种精简而美丽的数学语言. 推几个公式之后,相信读者会从中感觉到没有体验过的乐趣.

最后,需要静下心来仔细研读

看上去也有点儿枯燥,阅读时读者还是要事先做好克服困难的准备. 有时,即使编著者给出了推导过程,读者也不一定一眼就能理解,这就需要自己静下心来仔细研读. 只有这样,才有可能成为具有机器学习思维而不只是会用机器学习工具的人.

目前是首批发行5 折优惠购买地址:

南瓜书(第2版)+西瓜书套装:https://item.jd.com/13750727.html

南瓜书(第2版) 单本:

https://item.jd.com/10027464721549.html

f6048b0921b78ea412574ecf7487e5c0.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/614428.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【运维知识进阶篇】iptables防火墙详解

这篇文章给大家介绍下iptables防火墙,防火墙大致分三种,分别是硬件、软件和云防火墙。硬件的话部署在企业网络的入口,有三层路由的H3C、华为、Cisco(思科),还有深信服等等;软件的话一般是开源软…

【服务器】iPad远程服务器进行开发

文章目录 前言1. 本地环境配置2. 内网穿透2.1 安装cpolar内网穿透(支持一键自动安装脚本)2.2 创建HTTP隧道 3. 测试远程访问4. 配置固定二级子域名4.1 保留二级子域名4.2 配置二级子域名 5. 测试使用固定二级子域名远程访问6. iPad通过软件远程vscode6.1 创建TCP隧道 7. ipad远…

人工智能 AI | ChatGPT 时代,程序员的生存之道

ChatGPT 近期炙手可热,仿佛没有什么问题是它不能解决的。出于对 ChatGPT 的好奇,我们决定探索下它对于前端开发人员来讲,是作为辅助工具多一些,还是主力工具更多一些? 2D 能力测试 我们就挑选一个著名的递归回溯问题—…

代码随想录算法训练营第三十九天|62.不同路径|63. 不同路径 II

LeetCode62.不同路径 动态规划五部曲: 1,确定dp数组(dp table)以及下标的含义:dp[i][j] :表示从(0 ,0)出发,到(i, j) 有dp[i][j]条不同的路径。 2&#xff0c…

cpu飚高的排查思路

cpu的衡量指标 使用率util:代表的是单位时间内CPU繁忙情况的统计。操作系统对cpu的管理就是利用周期的tick时钟中断,将cpu的使用划分时间片。每个时间片内去执行不同进程/线程里的代码。所以cpu的使用率统计其实也是以tick为单位的:统计周期…

开源代码分享(1)—考虑经济性的储能运行优化

参考文献: [1]Practical operation strategies for pumped hydroelectric energy storage (PHES) utilising electricity price arbitrage - ScienceDirect [2]Towards an objective method to compare energy storage technologies: development and validation of…

Python——Flask快速开发一个物资管理平台(源码+适合大作业)

目录 一、前言 二、项目展示 三、代码包 四、项目简介 五、运行步骤 一、前言 Flask 框架结合原生的 HTML 和 Bootstrap 可以快速开发 Web 应用程序。 Flask 框架是 Python 中一个轻量级的 Web 应用框架,它非常适合构建小型项目和原型化开发。Flask 框架具有可扩展的…

K8S利用nginx快速部署一个网站之基本概念(十)

在Kubernetes部署应用程序流程 使用Deployment控制器部署镜像: kubectl create deployment web --imagenginx --replicas3 kubectl get deploy,pods 使用Service将Pod暴露出去: kubectl expose deployment web --port80 --target-port80 --typeNodePor…

Pyside6-第六篇-各按钮的信号与槽

今天是Pyside6的第六篇内容。一起来看看各按钮的信号与槽。 from PySide6.QtCore import Qt from PySide6.QtGui import QAction from PySide6.QtWidgets import QApplication, QWidget, QRadioButton, \QPushButton, QCheckBox, QToolButton, QMenuclass Example(QWidget):def…

使用BERT进行文本分类

本范例我们微调transformers中的BERT来处理文本情感分类任务。 我们的数据集是美团外卖的用户评论数据集。 模型目标是把评论分成好评(标签为1)和差评(标签为0)。 #安装库 #!pip install datasets #!pip install transformers[torch] #!pip install torchkeras 公众号算法美食…

你知道ping命令是如何工作的吗?

你知道ping命令是如何工作的吗? 我们用来测试一台机器与另一台机器的网络连通性一般会使用ping命令,那么你知道ping命令是如何工作的吗?ping命令是基于ICMP协议工作的。 一、介绍ICMP协议 因特网控制报文协议ICMP(Internet Con…

安卓大作业 咖啡展示App

系列文章 安卓大作业 咖啡展示App 文章目录 系列文章1.背景2.所有截图3.总结4. 源代码获取 1.背景 为了便于用户对于咖啡信息的浏览,我设计了一个咖啡展示的app。可以在这个App中查看到一些咖啡的信息,点…

爬虫语言最好用的是那种?

目前最好用的爬虫语言有多种选择,具体的选择取决于你的需求和个人偏好。Python是较为流行的爬虫语言之一,其生态系统丰富,拥有大量优秀的爬虫框架和工具。另外,JavaScript、Go、Ruby等编程语言也可以用于爬虫开发。总之&#xff0…

设置ubuntu下SVN服务开机自启

目录 0.背景环境 1.开机自启步骤 0.背景环境 1)ubuntu下,已搭建好svn版本库,具体搭建方法参考文末的其他博客链接 2)在搭svn服务器的过程中,发现ubuntu重启后,svn服务就关闭了 svn正常开启时见下图 所以…

为什么大多数企业数字化转型失败率高达80%?

数字化转型失败率为什么这么高? 多年的转型研究表明,企业数字化转型的成功率还不到 30%。 麦肯锡2023年报告显示,只有 16% 的受访者表示他们组织的数字化转型成功地提高了绩效,并使他们能够长期维持变革。 即使是精通数字技术的行…

十五周算法训练营——回溯算法

今天是十五周算法训练营的第十周,主要讲回溯算法专题。(欢迎加入十五周算法训练营,与小伙伴一起卷算法) 解决一个回溯问题,实际上就是一个决策树的遍历过程,只需要思考三个问题: 路径&#xff1…

市值暴涨8000亿,马斯克告诉了美国同行,为啥需要中国市场?

马斯克访华仅仅40多个小时,却带动了股价连涨5天,涨幅最高达到20%,市值飙涨8000亿元人民币,马斯克也因此再度问鼎全球首富之位,凸显出中国之行给他带来的巨大好处。 一、中国市场带动了特斯拉的辉煌 2018年马斯克为产能…

依据换行符分割字符串numpy.char.splitlines()含换行符与回车符的区别

【小白从小学Python、C、Java】 【等级考试500强双证书考研】 【Python-数据分析】 依据换行符分割字符串 numpy.char.splitlines() 含换行符与回车符的区别 [太阳]选择题 以下说法错误的是: import numpy as np a "I\nLove\rChina\r\nforever" print(&q…

APACHE-ATLAS-2.1.0 - 安装HIVE HOOK(六)

写在前面 本博文以获取HIVE元数据为例,进行流程和源码的分析。 请提前安装好HADOOP和HIVE的环境,用于测试。 ATLAS官网:https://atlas.apache.org/#/HookHive ATLAS支持的元数据源 什么是Hive Hook(钩子) HOOK是一种…

可视化的三种图结构方案 (canvas、fabric、G6)

原生 canvas、fabric 以及 G6,三种方案各有优劣势 原生 canvasfabricG6优点灵活、自由、可定制化非常强封装了 canvas 的 api,使用简单灵活提供了复杂树、图等 api,只需要按照文档配置即可缺点开发复杂、耗时对于构建大型树、图等复杂、耗时…