【R包开发:入门】 简介+ 包的结构

news2024/11/19 4:29:36

简介

本书的目的是教你如何开发包,以便你可以写出自己的包,而不只是使用别人的包。

为什么要写一个包?

一个令人信服的理由是,你想要与他人分享代码。把你的代码打成一个包,可以方便他人使用,因为他们像你一样也知道如何使用包。如果你的代码在包中,则任何 R 用户都可以轻松地下载、安装和学习如何使用它。

【在 R 中,可分享代码的基本单位是包】

即使你从不分享你的代码,包也很有用。它主要是节省你自己的时间。”把代码组织在一个包中会让你工作起来更容易,因为包有一些通用的约定。标准化的规范带来标准化的工具

1.1 开发理念

任何可以自动化的都应该自动化。把手动工作量降到最小。目标是让你将时间用于思考你想要包做什么,而不是包结构的各种细节。

这一理念主要是通过 devtools 包+RStudio 来实现的

1.2 入门

确保你有最新版本的 R(至少是 3.1.2),获得你将要用到的包

install.packages(c("devtools", "roxygen2", "testthat", "knitr"))

H还需要一个 C 编译器和几个命令行工具

  • Windows 下,下载并安装 Rtools(RTools: Toolchains for building R and R packages from source on Windows)。注意:这不是一个 R 包!

  • 在 Mac 下,确保你有 Xcode(可在 App Store 上免费获取)或 Xcode 命令行工具(Sign In - Apple)。

  • Linux 下,确保你不仅安装了 R,而且还安装了 R 开发工具。例如,在 Ubuntu 和 Debian 上,你需要安装 Ubuntu 的 r-base-dev 包。

1.3 约定

    在本书中,foo() 指函数,bar 指变量或函数参数,baz/ 指路径,#> 是输出注释,# 是常规的注释。

包的结构

2.1 给包命名

2.1.1 命名的要求

选择一个很容易被搜索到的独特的名字。这很容易让潜在的用户找到你的包,并且容易记住的包名。

2.1.2 命名的策略

找到一个和这个问题相关的词,修改它,如:plyr,lubridate,knitr,testdat  

使用缩略词:Rcpp,lvplot 

 增加一个额外的 r:stringr,tourr, gistr 

2.2 创建一个包

第一种方法:

(1) 单击 File | New Project(文件 | 新项目)。

(2) 选择 New Directory(新的目录)

(3) 下一步,选择 R Package(R 包)

(4) 最后,给出你的包名,然后单击 Create Project(创建项目)

 第二种方法:

 R 里面通过命令来创建

devtools::create("path/to/package/pkgname")

以上两种方法创建的包都属于最小的可用包,它有三个组成部分。

(1) 一个 R/ 目录,

(2) 一个描述文件 DESCRIPTION,

(3) 一个命名空间文件 NAMESPACE,

这个包还包括一个 RStudio 项目文件 pkgname.Rproj,这将使你的包易于在 RStudio 中使用。 

如果你的包中不包含.Rproj文件, 可以使用  devtools::user_rstudio("path/to/package")  来添加它。

.Rproj 文件只是一个文本文件。不需要手动来修改这个文件。通常,可以使用友好的 Project Options(项目选项)对话框,通过 RStudio 右上角的 Projects(项目)菜单来访问

2.3 RStudio 项目

使用Rstudio的好处

  • 每个项目都是独立的,在一个项目中运行的代码不会影响任何其他项目

  • 你可以获得方便的代码导航工具,如 F2 可以跳转到函数的定义,Ctrl+. 可通过名字来查找函数。

  • 有用的快捷键,用于通用的包开发任务

2.4 什么是包

2.4.1 源码包

源码包只是包含 R/ 子目录、DESCRIPTION 等组件的一个目录。

2.4.2 压缩包

压缩包是一个已经压缩为单个文件的包,R 中的压缩包使用 .tar.gz 扩展名。这意味着多个文件已经被打包成一个文件(.tar)并用 gzip(.gz)压缩过。

如果你解压一个压缩包,会看到它和你的源码包看起来几乎一样。解压的包和源码包的主要区别如下。

  • 使用指南被创建,你可以得到 HTML 和 PDF 输出而不是 Markdown 或者 LaTex 的输入。

  • 你的源码包中可能包含开发时产生的一些临时文件,比如 src/ 目录下编译生成的中间文件,它们在解压的包中是不存在的。

  • .Rbuildignore 文件中列出的任何文件都不会出现在解压的包中。

.Rbuildignore的介绍

.Rbuildignore 防止源码包中的文件出现在压缩包中。它允许你在源码包中包含比压缩包中更多的目录。这在你从其他文件生成包的内容(比如数据)时特别有用。这些文件应该包含在源码包中,但是只有结果需要发布。这对于 CRAN 包(顶层目录的个数是固定的)来说特别重要

一个典型的 .Rbuildignore 文件

2.4.3 二进制包

二进制包是一个单独的文件。如果将它解压缩,你会看到它的内部结构和源码包大不一样

二进制包是平台相关的:不能在 Mac 上安装一个 Windows 二进制包,也不能在Windows 上安装一个Mac 二进制包

Meta/ 目录包含大量 Rds 文件:这些文件缓存了包的一些元数据,比如帮助文件包含了什么主题,以及解析出的 DESCRIPTION 文件中的版本信息。

html/ 目录包含 HTML 的帮助文件

如果包中 src/ 目录下有代码,那么现在将有一个 libs/ 目录,其中包含了编译过的 32 位(i386/)和 64 位(x64/)代码。

inst/ 目录下的内容被移到了顶层目录

2.4.4 已安装的包

已安装的包只是解压到一个包库的二进制包。在理想的情况下,安装一个包包括一系列简单的步骤:源码包→压缩包,压缩包→二进制包,二进制包→已安装的包。

支持所有包安装的工具是 R 的命令行工具 R CMD INSTALL,它可以安装源码包、压缩包和二进制包。

  • devtools 的函数封装了这个工具,devtools::install() 有效地封装了 R CMD INSTALLdevtools::build() 封装了 R CMD BUILD,可以把源码包打包成压缩包。devtools::install_github() 从 GitHub 下载源码包,运行 build() 来生成使用指南,然后使用 R CMD INSTALL 安装包。
  • install.packages() 用于下载和安装 CRAN 编译的二进制包。他的工作方式是它载源码包,编译,然后安装。

2.4.5 内存中的包

library() 和 require() 会加载和附加一个已安装的包。在写脚本的时候,加载和附加包之间的区别并不重要;但是在写包的时候,这个区别是非常重要的。

2.5 什么是库

库是一个包含已安装包的目录

你的电脑中可以有多个库。事实上,几乎每个人都至少有两个库:一个用来放已经安装的包,另一个用来放 R 安装时自带的包(如 base、stats 等)。通常情况下,用户安装包的目录在不同的 R 版本下有所不同。这就是为什么你重新安装 R 以后,以前安装的包好像都丢了,实际上它们仍然在你的硬盘上,只是 R 找不到它们而已。

使用 .libPaths() 来查看当前正在使用的库是哪个

.libPaths()

参考文献

中文书籍 (ituring.com.cn)

R Packages (2e) (r-pkgs.org)

英文书籍Writing R Extensions (r-project.org) (官方 R 扩展开发手册)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1505772.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue中性能优化

目录 1. 编码优化 2. 源码优化 3. 打包优化 4. 利用 Vue Devtools 总结 Vue.js 作为一个强大的前端框架,提供了丰富的功能和工具来帮助开发者构建高效的 Web 应用。然而,在开发过程中,性能优化仍然是一个需要关注的问题。以下是对 Vue.j…

高级IO【select、poll、epoll】

高山仰止,景行行止 文章目录 五种IO模型阻塞I/O非阻塞I/OI/O复用信号驱动I/O异步I/O 同步通信与异步通信同步通信异步通信 非阻塞IO基于fcntl实现setNonblock函数注意事项 IO多路转接—select文件描述符集合timeval结构调用过程返回值缺点和局限性 IO多路转接—poll…

Java共享问题 、synchronized 线程安全分析、Monitor、wait/notify

文章目录 1.共享带来的问题1.1 临界区 Critical Section1.2 竞态条件 Race Condition 2. synchronized语法及理解2.1 方法上的 synchronized 3.变量的线程安全分析3.1.成员变量和静态变量是否线程安全?3.2.局部变量是否线程安全?3.2.1 局部变量线程安全分…

三阶导数在生活中应用

“鲍威尔还表示,美联储将在某个时候放慢(利率)加息步伐” 这是参考三阶导数(贷款义务基础,利率一阶导数,利率变化二阶导数,利率变化速度三阶导数)。 是否还有其他有趣的例子&#…

算法详解——leetcode150(逆波兰表达式)

欢迎来看博主的算法讲解 博主ID:代码小豪 文章目录 逆波兰表达式逆波兰表达式的作用代码将中缀表达式转换成后缀表达式文末代码 逆波兰表达式 先来看看leetcode当中的原题 大多数人初见逆波兰表达式的时候大都一脸懵逼,因为与平时常见的表达式不同&am…

华为配置DHCP Snooping防止DHCP Server仿冒者攻击示例

配置DHCP Snooping防止DHCP Server仿冒者攻击示例 组网图形 图1 配置DHCP Snooping防止DHCP Server仿冒者攻击组网图 DHCP Snooping简介配置注意事项组网需求配置思路操作步骤配置文件 DHCP Snooping简介 在一次DHCP客户端动态获取IP地址的过程中,DHCP Snoopi…

基于Vue的娱讯移动端APP前端设计与实现

目 录 摘 要 Abstract 引 言 1绪论 1.1课题背景及目的 1.1.1移动端APP发展简介 3 1.1.2移动端APP的优势 3 1.2前端开发相关技术 1.2.1前端开发工具介绍 3 1.2.2 前端开发相关技术介绍 4 1.3本章小结 2系统分析 2.1功能需求分析 2.2系统工作流程 2.3本章小结 3系统设…

Linux 之七:Linux 防火墙 和进程管理

防火墙 查看防火墙 查看 Centos7 的防火墙的状态 sudo systemctl status firewalld。 查看后,看到active(running)就意味着防火墙打开了。 关闭防火墙,命令为: sudo systemctl stop firewalld。 关闭后查看是否关闭成功,如果…

python的scripts文件夹作用

Windows系统: Scripts文件夹通常位于Python的安装目录下,如C:\Python\Scripts。该文件夹内包含了各种有用的工具,例如pip、virtualenv等,这些工具有助于管理和配置Python环境和依赖包。 Linux系统: 在Linux系统中&…

【大厂AI课学习笔记NO.69】使用开源管理仓库

了解了开源框架,开源项目,今天来学习开源管理仓库。 我们先说Git,开源的版本管理分布式系统。 GitHub,则是世界上最大的代码托管平台,面向开源和私有项目托管。 有的人总是分不清这两个,其实一个是版本管…

凌鲨微应用架构

微应用是静态网页加上凌鲨提供的扩展能力而形成的一种应用,主要特点是开发便捷,安全。 微应用架构 组件说明 名称 说明 微应用 webview窗口,显示web服务器上的页面 接口过滤器 根据权限配置,屏蔽非授权接口访问 接口提供者 tauri注入…

循序渐进丨MogDB 数据库特性之动态数据脱敏机制

数据脱敏是行之有效的数据库隐私保护方案之一,可以在一定程度上限制非授权用户对隐私数据的窥探。动态数据脱敏机制是一种通过定制化脱敏策略来实现对隐私数据保护的技术,可以在保留原始数据的前提下有效地解决非授权用户对敏感信息访问的问题。当管理员…

C#,蛇梯问题(Snake and Ladder Problem)的算法与源代码

1 蛇梯问题 Snake and Ladder Problem 给定一个蛇梯板,找出从源单元格或第一个单元格到达目标单元格或最后一个单元格所需的最小掷骰次数。基本上,玩家可以完全控制掷骰子的结果,并希望找出到达最后一个单元格所需的最小掷骰次数。 如果玩…

基于鳑鲏鱼优化算法(Bitterling Fish Optimization,BFO)的无人机三维路径规划

一、无人机路径规划模型介绍 无人机三维路径规划是指在三维空间中为无人机规划一条合理的飞行路径,使其能够安全、高效地完成任务。路径规划是无人机自主飞行的关键技术之一,它可以通过算法和模型来确定无人机的航迹,以避开障碍物、优化飞行…

gradle下载太慢者超时!国内镜像可以直接下载

# 解决Gradle下载过慢问题的有效方式:使用国内镜像站点 在开发过程中,我们经常会遇到Gradle下载速度缓慢或超时的问题。作为一个强大而流行的构建工具,Gradle是许多项目中必不可少的一部分。然而,由于官方下载地址可能受网络限制…

Windows10/11配置WSL(Ubuntu)环境

文章目录 WSL介绍WSL部署扩展:辅助工具Windosw Terminal安装下载 WSL介绍 传统方式获取Linux操作系统,是安装完整的虚拟机及镜像环境,例如虚拟机VMware 而使用WSL,可以以非常轻量化的方式,得到Linux系统环境 它无需单独虚拟一套硬…

React 19 Cheat Sheet

React 19让构建网站和应用程序变得更容易,更好。有了很酷的新东西,比如React编译器、Actions API和更好的Hooks,编写代码变得更快,管理应用程序的数据变得更简单 React 19让构建网站和应用程序变得更容易,更好。有了很…

vue组件之间通信方式汇总

方式1&#xff1a;props和$emit props和$emit仅仅限制在父子组件中使用 1.props&#xff1a;父组件向子组件传递数据 1.1 代码展示 <template><div><!-- 这是父组件 --><div>父组件中的基本数据类型age的值是:{{this.age}}</div><div>…

C++的一些基础语法

前言&#xff1a; 本篇将结束c的一些基础的语法&#xff0c;方便在以后的博客中出现&#xff0c;后续的一些语法将在涉及到其它的内容需要用到的时候具体展开介绍&#xff1b;其次&#xff0c;我们需要知道c是建立在c的基础上的&#xff0c;所以c的大部分语法都能用在c上。 1.…

【Docker】容器的概念

容器技术&#xff1a;容器技术是基于虚拟化技术的&#xff0c;它使应用程序从一个计算机环境快速可靠地转移到另一个计算机环境中&#xff0c;可以说是一个新型地虚拟化技术。 一、docker容器 Docker:是一个开源地容器引擎Docker 是一种轻量级的容器化技术&#xff0c;其主要原…