将 Python 与 RStudio IDE 配合使用(R与Python系列第一篇)

news2025/1/10 16:53:25

目录

前言:

1-安装reticulate包

2-安装Python

3-选择Python的默认版本(配置Python环境)

4-使用Python

4.1 运行一个简单的Python脚本

4.2 在RStudio上安装Python模块

4.3 在 R 中调用 Python 模块

4.4 在RStudio上调用Python脚本写的函数

4.5 Python 与 R 对象相互转换的方式

R → Python

Python → R

5-在 R Console 中交互式运行 R

6-在RStudio中安装Python包遇到问题时解决方案

参考:

前言:

RStudio 1.4为RStudio IDE带来了对Python编程语言的改进支持。本文将探讨如何将Python与R和RStudio一起使用。

RStudio使用 R包reticulate 与Python交互,因此RStudio的Python集成需要:

  1. 安装 Python (2.7 or newer; 3.5 or newer preferred), and
  2. 安装R包reticulate (1.20 or newer, as available from CRAN)

1-安装reticulate包

install.packages("reticulate")

2-安装Python

首先,需要在您的机器上安装Python。如果您还没有安装Python,可以通过几种方式安装它:

  1. (推荐)使用reticulate::install_miniconda(),使用reticulate包安装Python的Miniconda发行版;
  2. (Windows)通过https://www.python.org/downloads/windows/提供的官方Python二进制文件安装Python;
  3. (macOS)通过https://www.python.org/downloads/mac-osx/提供的官方Python二进制文件安装Python;
  4. (Linux)从源代码安装Python,或者通过操作系统的包管理器提供的Python版本安装Python。有关详细信息,请参阅https://docs.python.org/3/using/unix.html。如果您自己从源代码安装Python,最好将其安装到 /opt/python/<version>之类的位置,这样RStudio和reticullate可以更容易地发现它。

3-选择Python的默认版本(配置Python环境)

一定要配置Python环境,不然在RStudio不能成功Python包。

可以通过Tools->Global Options…->Python配置默认版本的Python以与RStudio一起使用:

Python解释器也就是Python,这一步是选择Python的默认版本。

“Python解释器(Python interpreters):”输入框显示要使用的默认Python解释器(如果有)。如果您已经知道要使用的Python解释器的位置,您可以在该输入框中键入解释器的位置。

否则,如果输入框中没有显示默认Python解释器,可以通过单击“选择…”按钮在系统上发现Python解释器:

RStudio将通过几种不同的方法搜索Python解释器:

  • On the PATH;
  • For virtual environments, located within the ~/.virtualenvs folder;
  • For Conda environments, as reported by conda --list,
  • For pyenv Python installations located in ~/.pyenv,
  • For Python installations located in /opt/python.

测试环境:

py_available() #检测Python是否安装成功,返回TRUE即表示安装成功

4-使用Python

4.1 运行一个简单的Python脚本

reticulate包可以在当前运行的R会话中加载和使用Python。安装reticulate包后,可以打开Python脚本(扩展名为. py),并执行其中的代码,类似于R。

注意到:在控制台(console)中,>表示运行R代码,>>>表示运行的Python代码。

请注意,RStudio使用reticulate Python REPL来执行代码,并根据正在执行的脚本在R和Python之间自动切换。

当reticulate REPL处于活动状态时,可以通过r辅助对象访问R会话中的对象。例如,r["mtcar"]可用于从R访问mtcar数据集,并将其转换为pandas DataFrame(如果可用),如果没有,则转换为Python dictionary。

4.2 在RStudio上安装Python模块

以pandas模块为例:

reticulate::py_install("pandas")

# 安装seaborn绘图库
# pip = T指定从pip安装,默认从conda安装
py_install("seaborn", pip = T)

# 查看seaborn模块是否已安装
py_module_available("seaborn")
> [1] TRUE

4.3 在 R 中调用 Python 模块

 例子1:

# 调用os模块的listdir()函数
os <- import("os")
os$listdir("./")
>  [1] ".Rproj.user"      "convert.R"        "reticulate.Rmd"   "Reticulate.Rproj"
>  [5] "Rscript.R"        "summary.html"     "summary.md"       "summary.nb.html" 
>  [9] "summary.Rmd"      "test_pyscript.py"

 例子2:

# 调用seaborn模块的load_dataset()函数
# 需要seaborn模块已安装
sns <- import("seaborn")
tips <- sns$load_dataset("tips")
print(head(tips))
>   total_bill  tip    sex smoker day   time size
> 1      16.99 1.01 Female     No Sun Dinner    2
> 2      10.34 1.66   Male     No Sun Dinner    3
> 3      21.01 3.50   Male     No Sun Dinner    3
> 4      23.68 3.31   Male     No Sun Dinner    2
> 5      24.59 3.61 Female     No Sun Dinner    4
> 6      25.29 4.71   Male     No Sun Dinner    4

4.4 在RStudio上调用Python脚本写的函数

想法与在RStudio中调用C++自定义函数一样。建议编写的Python自定义函数名与Python脚本名称一样,这样通过source_python()函数调用这个Python自定义函数,这意味着Python自定义函数可以在RStudio中不变函数名使用,使用的其实时同名的R函数。

例子1:

(1)在Python环境下,编写一个Python脚本,保存为flights.py。可以看到这个python函数名为read_flights().

import pandas
def read_flights(file):
  flights = pandas.read_csv(file)
  flights = flights[flights['dest'] == "ORD"]
  flights = flights[['carrier', 'dep_delay', 'arr_delay']]
  flights = flights.dropna()
  return flights

(2)在RStudio中使用source_python调用实现写好的flight.py文件。

source_python("flights.py")
flights <- read_flights("flights.csv") #使用flights.py脚本中的Python自定义函数

library(ggplot2)
ggplot(flights, aes(carrier, arr_delay)) + geom_point() + geom_jitter()

 例子2:

假设 Python 脚本为test_pyscript.py,内容如下:

# 打印一些数据
for i in range(10):
  print("hello world)

# 定义1个函数
def sum_two_value(a, b):
  return a + b

在 R 中执行 test_pyscript.py 

source_python("./test_pyscript.py")

> hello world
> hello world
> hello world
> hello world
> hello world
> hello world
> hello world
> hello world
> hello world
> hello world

sum_two_value(1, 2)
> [1] 3

4.5 Python 与 R 对象相互转换的方式

R → Python

设置一些R对象:

A <- 1

B <- c(1, 2, 3)

C <- c(a = 1, b = 2, c = 3)

D <- matrix(1:4, nrow = 2)

E <- data.frame(a = c(1, 2), b = c(3, 4))

G <- list(1, 2, 3)

H <- list(c(1, 2), c(3, 4))

I <- list(a = c(1, 2), b = c(3, 4))

J <- function(a, b) {
  return(a + b)
}

K1 <- NULL
K2 <- T
K3 <- F

上述 R 对象转为 Python 对象(Python Cell)

r.A
> 1.0
type(r.A)
> <class 'float'>
r.B
> [1.0, 2.0, 3.0]
type(r.B)
> <class 'list'>
r.C
> [1.0, 2.0, 3.0]
type(r.C)
> <class 'list'>
r.D
> array([[1, 3],
>        [2, 4]])
type(r.D)
> <class 'numpy.ndarray'>
r.E
>      a    b
> 0  1.0  3.0
> 1  2.0  4.0
type(r.E)
> <class 'pandas.core.frame.DataFrame'>
r.G
> [1.0, 2.0, 3.0]
type(r.G)
> <class 'list'>
r.H
> [[1.0, 2.0], [3.0, 4.0]]
type(r.H)
> <class 'list'>
r.I
> {'a': [1.0, 2.0], 'b': [3.0, 4.0]}
type(r.I)
> <class 'dict'>
r.J
> <function make_python_function.<locals>.python_function at 0x000001AE204ECE18>
type(r.J)
> <class 'function'>
r.J(2, 3)
> 5
r.K1
type(r.K1)
> <class 'NoneType'>
r.K2
> True
type(r.K2)
> <class 'bool'>
r.K3
> False
type(r.K3)
> <class 'bool'>

Python → R

设置一些 Python 对象(Python Cell)

A = 1

B = [1, 2, 3]

C = [[1, 2], [3, 4]]

D1 = [[1], 2, 3]
D2 = [[1, 2], 2, 3]

E = (1, 2, 3)

FF = ((1, 2), (3, 4))

G = ((1, 2), 3, 4)

H = {"a": [1, 2, 3], 
     "b": [2, 3, 4]
     }
     
I = {"a": 1, 
     "b": [2, 3, 4]
     }
     
def J(a, b):
  return a + b

 上述 Python 对象转为 R 对象(R Cell)

py$A
> [1] 1
class(py$A)
> [1] "integer"

py$B
> [1] 1 2 3
class(py$B)
> [1] "integer"

py$C
> [[1]]
> [1] 1 2
> 
> [[2]]
> [1] 3 4
class(py$C)
> [1] "list"

py$D1
> [[1]]
> [1] 1
> 
> [[2]]
> [1] 2
> 
> [[3]]
> [1] 3
class(py$D1)
> [1] "list"
py$D2
> [[1]]
> [1] 1 2
> 
> [[2]]
> [1] 2
> 
> [[3]]
> [1] 3
class(py$D2)
> [1] "list"

py$E
> [[1]]
> [1] 1
> 
> [[2]]
> [1] 2
> 
> [[3]]
> [1] 3
class(py$E)
> [1] "list"

py$FF
> [[1]]
> [[1]][[1]]
> [1] 1
> 
> [[1]][[2]]
> [1] 2
> 
> 
> [[2]]
> [[2]][[1]]
> [1] 3
> 
> [[2]][[2]]
> [1] 4
class(py$FF)
> [1] "list"

py$G
> [[1]]
> [[1]][[1]]
> [1] 1
> 
> [[1]][[2]]
> [1] 2
> 
> 
> [[2]]
> [1] 3
> 
> [[3]]
> [1] 4
class(py$G)
> [1] "list"

py$H
> $a
> [1] 1 2 3
> 
> $b
> [1] 2 3 4
class(py$H)
> [1] "list"

py$I
> $a
> [1] 1
> 
> $b
> [1] 2 3 4
class(py$I)
> [1] "list"

py$J
> <function J at 0x000001AE204ECE18>
class(py$J)
> [1] "python.builtin.function" "python.builtin.object"
py$J(2, 3)
> [1] 5

5-在 R Console 中交互式运行 R

  • repl_python () 进入 Python 环境
  • exit 退出 Python 环境

6-在RStudio中安装Python包遇到问题时解决方案

问题:No module named 'tensorflow_probability' 

通过在新的R会话中运行以下操作可以解决许多安装问题(您可以使用Ctrl+Shift+F10在Rdios中重新启动R):

# install the development version of packages, in case the
# issue is already fixed but not on CRAN yet.
install.packages("remotes")
remotes::install_github(sprintf("rstudio/%s", c("reticulate", "tensorflow", "keras")))
reticulate::miniconda_uninstall() # start with a blank slate
reticulate::install_miniconda()
tfprobability::install_tfprobability()

 注意:其中在miniconda_uninstall() 卸载之前安装的miniconda时,要将RStudio中Tools-->Global Options--->Python-->将Python interpreter(Python解释器)清除掉。(注:下图是已经清除掉的界面,如果没有执行清楚操作,Python interpreter输入框中是有内容的)。

参考:

https://support.posit.co/hc/en-us/articles/1500007929061 (给出了在RStudio中配置Python环境的最简单方法)

🤔 Reticulate | 如何在Rstudio中优雅地调用Python!? - 知乎 (zhihu.com) (给出了安装Python包的命令)

No module named 'tensorflow_probability' · Issue #155 · rstudio/tfprobability · GitHub (安装包遇到问题时的解决办法)

reticulate:在R中使用Python - 知乎 (zhihu.com)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/962129.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

1. 安装Zookeeper

​ 1.下载 点击下载Zookeeper 单机版安装 安装Zookeeper前需要先安装jdk上传安装包rz解压安装包:tar -zxvf apache-zookeeper-3.6.0-bin.tar.gz -C /opt/app/zookeeper zookeeper目录结构:a. bin: 放置运行脚本和工具脚本b. conf: zookeeper 默认读取配置的目录,里面会有…

截图工具 snipaste

一款十分好用小巧的截图工具 snipaste 一般F1、F3 就能满足大多数使用清情形

【ArcGIS Pro二次开发】(65):进出平衡SHP转TXT、TXT转SHP

最近一个小伙伴提了这么一个需求&#xff0c;需要把TXT和SHP进行互转。 这种TXT文件其实遇到了好几个版本&#xff0c;都有一点小差异。之前已经做过一个TXT转SHP的工具&#xff0c;但好像不适用。于是针对这个版本&#xff0c;做了互转的2个工具。 【SHP转TXT】 一、要实现的…

Nginx从入门到精通之Nginx应用场景和配置参数最佳实践

高级Nginx应用场景和配置技巧 文章目录 高级Nginx应用场景和配置技巧1. 配置参数最佳实践2. Nginx配置示例3. 常见场景1. 静态文件服务2. 动态内容代理3. SSL加密4. URL重写5. 访问控制6. 请求限制7. 日志记录8. 压缩9. 定向与错误页面10. 跨域配置11. 长连接处理12. 代理WebSo…

【文心一言大模型插件制作初体验】制作面试错题本大模型插件

文心一言插件开发初体验 效果图 注意&#xff1a;目前插件仅支持在本地运行&#xff0c;虽然只能自用&#xff0c;但仍然是一个不错的选择。&#xff08;什么&#xff1f;你说没有用&#xff1f;这不可能&#xff01;文心一言app可以支持语音&#xff0c;网页端结合手机端就可…

【算法与数据结构】654、LeetCode最大二叉树

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引&#xff0c;可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析&#xff1a;【算法与数据结构】106、LeetCode从中序与后序遍历序列构造二叉树这两道题有些类似&#xff0c;相关代…

Anaconda虚拟环境下导入opencv

文章目录 解决方法测试 解决方法 1、根据自己虚拟环境对于的python版本与电脑对应的位长选择具体的版本&#xff0c;例如python3.9选择cp39&#xff0c;64位电脑选择64 下载地址&#xff1a;资源地址 若是不确定自己虚拟环境对应的python版本&#xff0c;可以输入下列命令&…

【启扬方案】启扬多尺寸安卓屏一体机,助力仓储物料管理系统智能化管理

随着企业供应链管理的不断发展&#xff0c;对仓储物料管理的要求日益提高。企业需要实时追踪和管理物料的流动&#xff0c;提高物流效率、降低库存成本和减少库存的风险。因此&#xff0c;仓储物料管理系统的实现成为必要的手段。 仓储物料管理系统一体机作为一种新型的物料管理…

Java中网络的基本介绍。网络通信,网络,ip地址,域名,端口,网络通信协议,TCP/IP传输过程,网络通信协议模型,TCP协议,UDP协议

- 网络通信 概念&#xff1a;网络通信是指通过计算机网络进行信息传输的过程&#xff0c;包括数据传输、语音通话、视频会议等。在网络通信中&#xff0c;数据被分成一系列的数据包&#xff0c;并通过网络传输到目的地。在数据传输过程中&#xff0c;需要确保数据的完整性、准…

【STM32】SPI初步使用 读写FLASH W25Q64

硬件连接 (1) SS( Slave Select)&#xff1a;从设备选择信号线&#xff0c;常称为片选信号线&#xff0c;每个从设备都有独立的这一条 NSS 信号线&#xff0c;当主机要选择从设备时&#xff0c;把该从设备的 NSS 信号线设置为低电平&#xff0c;该从设备即被选中&#xff0c;即…

0.96寸IIC-OLED屏幕

文章目录 一、硬件介绍1.1 0.96寸IIC-OLED屏幕1.2 主控1.3 取模工具 二、软件程序2.1 oled.c2.2 oled.h2.3 font.c2.4 font.h 一、硬件介绍 1.1 0.96寸IIC-OLED屏幕 1.2 主控 使用stm32f103c8t6单片机进行控制, IIC驱动使用软件模拟的方式。 1.3 取模工具 文字取模工具&…

算法通关村第10关【青铜】| 快速排序各种写法

思路&#xff1a; 指定一个数字&#xff0c;将数组比他小的放到左边&#xff0c;比他大的放到右边&#xff0c;实现归位 然后再指定一个数字递归&#xff0c;一直遍历完数组 最好的情况每次指定的都是中间位置的数字&#xff0c;划分完后两边长度相等&#xff0c;2T(n/2) O…

解决crosstalk的方法及原理分析

我正在「拾陆楼」和朋友们讨论有趣的话题,你⼀起来吧? 拾陆楼知识星球入口 crosstalk是干扰线与受绕线之间由于信号跳变产生的耦合电容引起的。 解决crosstalk的方法从两方面入手,一方面降低耦合电容,一方面降低timing window的overlap。 静态时序分析: 串扰延迟分析 以…

Ubuntu入门05——磁盘管理与备份压缩

1.检查磁盘空间占用情况 2.统计目录或文件所占磁盘空间大小 3.压缩 3.1 zip、unzip和zipinfo 运行时发现上面命令不成功&#xff0c;换成&#xff1a; &#xff08;将文件lkw放入压缩文件lkw01.zip中&#xff09; sudo zip -m lkw01.zip lkw 解压文件&#xff1a; 实操&…

从RESP的角度理解事务和管道

1. RESP 是什么&#xff1f; 16 进制 0d 0a 就是 \r\n。 RESP 就是 Redis 服务端和客户端之间进行通信的协议&#xff0c;它是建立在 TCP 之上的一种简单的应用层协议。你可以把它理解成 HTTP 协议&#xff0c;不过它更加的简单。 它支持很多数据类型&#xff0c;这里列举几…

企业数字化转型的关键技术有哪些?_光点科技

随着科技的不断进步和信息技术的快速发展&#xff0c;企业数字化转型已经成为保持竞争力和适应市场变化的关键举措。在这个数字化时代&#xff0c;企业需要借助先进的技术来优化业务流程、提升效率&#xff0c;以及更好地满足客户需求。以下是企业数字化转型过程中的关键技术。…

4V-28V Vin,6A同步降压DCDC变换器,集成3.3V和150mA LDO——SCT2361FPBR

SCT2361是一种高效率的同步降压型DC-DC变换器&#xff0c;集成3.3V和150mA LDO。输入电压范围为4V-28V&#xff0c;输出电压可调为0.6V&#xff0c;具有3mmx3mm的小QFN封装&#xff0c;可提供连续6A的输出电流。该器件将高、低压侧功率mosfet集成&#xff0c;使导通损耗降到最低…

某次护网红队getshell的经历

信息收集 某企业提供信息&#xff1a;企业官网的真实外网ip&#xff0c;内网ip 企业官网比较硬&#xff0c;从控股超过51%的子公司入手 通过企查查找到一堆控股高的子公司&#xff0c;通过ICP/IP地址/域名信息备案管理系统查找子公司官网&#xff0c;收集二级域名。通过google…

Linux 调试技术 Kprobe

目录 用途&#xff1a;一、技术背景1.1 kprobes的特点与使用限制1.2 kprobe原理 二、 基于kprobe探测模块的探测方式2.1、struct kprobe结构体2.2 kprobe API函数2.3 示例代码参考资料&#xff1a; 用途&#xff1a; 判断内核函数是否被调用&#xff0c;获取调用上下文、入参以…

『SpringBoot 源码分析』run() 方法执行流程:(2)刷新应用上下文-准备阶段

『SpringBoot 源码分析』run() 方法执行流程&#xff1a;&#xff08;2&#xff09;刷新应用上下文-准备阶段 基于 2.2.9.RELEASE问题&#xff1a;当方法进行了注释标记之后&#xff0c;springboot 又是怎么注入到容器中并创建类呢&#xff1f; 首先创建测试主程序 package …