【全新升级版】R语言实战(第3版),超过30万学习者入手的R语言教程

news2024/12/27 14:09:21
alt

在我刚入学那会儿初次接触R语言,看的第一本工具书就是《R语言实战》,收获良多,当时还只是第二版。最近和人民邮电出版社的好朋友交流发现,他告诉我上个月刚刚出版了《R语言实战 第三版》 ,豆瓣评分9.2,被称为最牛R语言实战书升级版。

alt 上面这本书的第 1 版于 2012 年出版,距今已经过去 11 年了,第 2 版于 2016 年出版,豆瓣评分 9.2,全系列累计销量已经突破 30 万 册,是一本口碑与品质兼具的佳作。

为什么要学习R语言?

目前 R 已经成为统计、预测分析和数据可视化的全球通用语言。它提供各种用于分析和理解数据的方法,从最基础的到最复杂、最前沿的,无所不包。

R 最为人所知的是能够创建漂亮优雅的图形,但实际上它也可以处理各种统计问题。R 的基本安装版本就提供了数以百计的数据管理、统计和图形函数等功能。不过,R 很多强大的功能都来自社区成员所开发的数以千计的扩展功能(包)。

这种扩展的广度也是有代价的。对于新手来说,经常遇到的两个基本难题就是:R 到底是什么? R 究竟能做什么?甚至是经验丰富的 R 用户也常常惊讶地发现一些他们之前闻所未闻的新功能。

怎么高效学习R语言?

学习的方法非常重要,一本有助于新手学习的工具指南书能发挥高效作用。熟悉 R 语言的人对这本领域内的经典著作《R语言实战》一定不陌生。这本书为 R 语言初学者铺就了平缓的学习之路,帮助了很多 R 语言学习者入门。

alt

这本书上个月上市出版以来,在各大平台收到广泛关注,收获了一致好评。

新版本有什么亮点?

这几年 R 发生了一些变革,大数据的增长、tidyverse 软件的广泛应用、新的预测性分析和机器学习方法的快速发展,以及更多崭新且强大的数据可视化技术的进步促使 R 也发生了变革。

而本书的原作者也一直关注着这些变化,他针对读者反馈的新需求,对书中的内容进行了全新升级,力求能够跟上 R 的新变化。

第 3 版有许多变化,尤其是新增了 tidyverse 系列包在数据管理和数据分析方面的各种功能。以下将列出一些重要变化:

alt

第 2 章(创建数据集)将介绍用于导入数据的 readr、readxl 和 haven 包。另外,新增的一节将专门介绍 tibble 数据结构。tibble 是对传统数据框的一种全新改进。

alt

第 3 章(基本数据管理)和第 5 章(高级数据管理)将介绍用于数据管理、转换和汇总的 dplyr 和 tidyr 包。

alt

第 4 章(图形初阶)、第 6 章(基本图形)、第 11 章(中级绘图)和第 19 章(高级绘图)是新增内容,将详细介绍 ggplot2 及其扩展包。

alt

第 16 章(聚类分析)将提供改进后的图形绘制方法。其中新增的一节将专门介绍如何计算数据聚类。

alt

第 17 章(分类)新增了一节,将介绍 Shapley 值图和细分图的用法,以便读者更好地理解黑箱模型。

alt

第 18 章(处理缺失数据的高级方法)新增了几节,将介绍用于缺失值插补的 k 近邻方法和随机森林方法。

alt

第 20 章(高级编程)新增的几节将介绍非标准计算和可视化调试。

alt

第 21 章(创建动态报告)新增了 R Markdown 的内容,以及有关参数化报告和常见编码错误的内容。

alt

第 22 章(创建包)被全面重写,以便涵盖使用新工具来简化包的创建步骤的内容。另外,这一章还新增了如何通过 CRAN、GitHub 和软件生成网站来分发和改进包的内容。

alt

根据图形用户界面的最新变化,作者对附录 A(图形用户界面)进行了更新。

还对附录 B(自定义启动环境)进行了修订,增加了新的自定义启动环境的方法,以及对可重复性研究的潜在副作用的更多提醒。

针对附录 F(处理大型数据集)还新增了一些包,用于处理超过内存大小的数据集,新增了用于解决 TB 级数据问题的分析方法,以及将 R 和云服务进行整合的新包。

alt

第 3 版更是新增了使用 RStudio 进行编程、调试、编写报告和创建包的内容。还第 3 版还对文字进行了大量的更新和修正。

这本书适合哪些人?

对于有数据处理需求的读者来说,这本书不需要你有任何统计编程或者 R 知识背景,就算是 R 新手也能够读懂。对于有经验的 R 老手,书中也有足够多的实用内容。

alt

作者尽可能地让每一章都能同时满足数据分析新手和数据分析专家的需求,让所有人都能发现有趣和实用的内容,并从中获益。 读者可以根据自身所处阶段和需求来阅读。

alt

作者和翻译者简介

alt

alt

大咖推荐与点评

第 3 版新增了 R 语言的最新数据分析包的用法,是提升数据分析能力的实战用书,可引导读者在编写 R 代码的同时熟练掌握数据分析方法。

——王小宁,中国传媒大学数据科学与智能媒体学院副教授、统计之都秘书长

作者在本已精良的前版基础上,又补充与更新了大量内容,实现了自我超越。

——Alain Lompo,IsO-Gruppe公司

多年来,《R语言实战》一直是我不离手的参考书。第 3 版对 tidyverse 系列包和其他工具包的增补实在及时。我当然会毫不犹豫地推荐此书。

——Daniel Kenney-Jung,美国杜克大学儿科医学部医学博士

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/663578.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux之生产者消费者模型(上)——单生产者单消费者

文章目录 前言一、生产者消费者模型1.生产消费2.生产消费关系321原则生产消费模型的特点 二、基于阻塞队列(blockqueue)的生产消费模型1.概念2.单生产单消费模型代码运行分析两种情况导致的现象生产者生产的慢,消费者消费的快生产者生产的快&…

精彩回顾 | “XR云新未来:弹性算力赋能可交互、沉浸式商业实践” 赋能云端虚拟世界

6月15日,由平行云联合首都在线共同主办,中关村软件园协办,以“XR云新未来|弹性算力赋能可交互、沉浸式商业实践”为主题的XR行业交流盛会在北京成功举办。 活动邀请多位XR行业大咖,共同见证首都在线联合平行云发布Cloud XR平台。…

MySQL数据库——索引

MySQL数据库——索引 一、索引基本常识1.索引的概念2.索引的作用3.创建索引的依据 二、索引的分类1.普通索引2.唯一索引3.主键索引4.组合索引5.全文索引 三、索引的查看与删除1.查看索引2.删除索引 一、索引基本常识 数据库索引是数据库管理系统中一个排序的数据结构&#xff0…

OpenGL 深度测试

1.简介 深度缓冲就像颜色缓冲(Color Buffer)(储存所有的片段颜色:视觉输出)一样,在每个片段中储存了信息,并且(通常)和颜色缓冲有着一样的宽度和高度。深度缓冲是由窗口系统自动创建的&#xf…

6 从0开始学PyTorch | 构建模型、损失函数、广播机制

前面都在学一些PyTorch的基本操作,从这一节开始,真正进入到模型训练的环节了。原作者很贴心的一步步教我们实现训练步骤,并且还从一个最简单的例子出发,讲了优化方案。 宏观上的训练过程 image.png 当然这里所说的训练还没有到深…

vue进阶-vue-cli

CLI是Command-Line Interface,翻译为命令行界面,但是俗称脚手架。 Vue-CLI是一个官方发布 vue.js 项目脚手架,使用 vue-cli 可以快速搭建 Vue 开发环境以及对应的 webpack 配置。 vue项目相关文件以 .vue 为后缀,需要事先安装 N…

【LeetCode热题100】打卡第25天:柱状图中最大的矩形

文章目录 柱状图中最大的矩形⛅前言🔒题目🔑题解 柱状图中最大的矩形 ⛅前言 大家好,我是知识汲取者,欢迎来到我的LeetCode热题100刷题专栏! 精选 100 道力扣(LeetCode)上最热门的题目&#xf…

GEE:绘制一个点的Landsat1985-2020年逐日NDVI时间序列折线图

作者:CSDN @ _养乐多_ 本文记录了在GoogleEarthEngine(GEE)平台上选择一个点,根据该点在时间段内所有有效像素值绘制折线图的代码。 结果如下图所示, 文章目录 一、代码二、代码链接一、代码 var roi = geometry Map.addLayer(roi, {color

6.15集合1 和 泛型

举例 1:中药店,每个抽屉外面贴着标签 举例 2:超市购物架上很多瓶子,每个瓶子装的是什么,有标签 举例 3:家庭厨房中 集合 我们接下来要学习的内容是Java基础中一个很重要的部分:集合 1 Coll…

【服务器数据恢复】AIX下raid故障导致pool无法加载的数据恢复案例

服务器数据恢复环境: IBM P740小型机AIX操作系统Sybase数据库V7000存储。V7000存储配置了12块SAS机械硬盘(其中一块为热备盘)组建一组raid5磁盘阵列。存储设备一共创建了2组Mdisk,加到一个pool中。 服务器故障: IBM V…

网络管理与维护(三)网络安全

网络安全 网络安全威胁 非授权访问 信息泄漏 破坏数据完整性 拒绝服务攻击 利用网络传播病毒 安全服务和安全机制 总结 1.通常可以把网络信息安全的问题划分为物理层、网络层、数据层和内容层四个层面。 2.网络存在的威胁主要表现: 非授权访问、信息泄漏、破坏数…

基于Django+Vue开发的社区疫情管理系统(附源码)

基于Django、Django Rest framework、Vue的前后端分离的社区疫情管理系统。 一、系统功能 用户管理(只有管理员有权限) 用户注册用户登录修改用户信息删除用户修改密码权限管理 首页数据展示 国内疫情数据展示国内疫情新闻近30日的感染人数(…

【论文阅读】Adap-t: Adaptively Modulating Embedding Magnitude for Recommendation

【论文阅读】Adap-𝜏: Adaptively Modulating Embedding Magnitude for Recommendation 文章目录 【论文阅读】Adap-𝜏: Adaptively Modulating Embedding Magnitude for Recommendation1. 来源2. 介绍3. 模型解读3.1 准备工作3.1.1 任务说明3.1.2 基于嵌…

Linux:http服务(Apache 2.4.57)源码编译——配置网站 || 入门到入土

目录 1.下载源码包 2.配置httpd运行环境 3.编译源码包安装apache软件 4.优化执行路径 5.添加httpd系统服务 正文 1.httpd服务器的基本配置 2.本章持续更新 我的服务器为centos7系统 1.下载源码包 访问官方网站↓↓↓ Welcome! - The Apache HTTP Server Project ↑↑…

ONLYOFFICE Docs 7.4 版本大大增强了图形编辑功能!

ONLYOFFICE Docs 7.4 版本大大增强了图形编辑功能! 书接上文: 北冰洋汽水我的最爱https://mp.weixin.qq.com/s?__bizMzI2MjUyNzkyNw&mid2247493734&idx1&sn416c4ee5756ea59883591d3c2c4a6ae4&chksmea4b66bedd3cefa89050e25b661e0be16…

malloc 背后的虚拟内存 和 malloc实现原理

面试的时候经常会被问到 malloc 的实现。从操作系统层面来说,malloc 确实是考察面试者对操作系统底层的存储管理理解的一个很好的方式,涉及到虚拟内存、分页/分段等。下面逐个细说。 1. 虚拟内存 首先需要知道的是程序运行起来的话需要被加载的物理内存…

spark 和 flink 的对比

一、设计理念 Spark 的数据模型是 弹性分布式数据集 RDD(Resilient Distributed Dattsets),这个内存数据结构使得spark可以通过固定内存做大批量计算。初期的 Spark Streaming 是通过将数据流转成批 (micro-batches),即收集一段时间(time-window)内到达的…

【计算机组成原理】——知识点复习(期末不挂科版)

课本: 考试题型: 题型一、计算题(30分) 1、定点数表示:用原码、反码、补码、移码表示十进制数(5分) 2、浮点数表示:十进制数↔单精度浮点数(5分) 3、加减运…

行业报告 | AI+制造业赋能,机器视觉开启掘金新大陆(上)

原创 | 文 BFT机器人 01 核心要点 Al制造业赋能,META 发布 SAM 助力机器视觉迎来 GPT 时刻。 机器视觉技术使得工业设备能够“看到”它正在进行的操作并进行快速决策,完整机器视觉系统由硬件软件组成,分别进行成像和图像处理工作。 目前,以“…

全网超全,接口自动化测试实战总结详全,这几个阶段你知道吗?

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 接口自动化根本目…