如何在Power BI中使用Python导入数据

news2024/11/15 20:08:09

在这篇文章中,我们将学习如何在Power BI中使用Python编程语言进行数据源化。

简介

Python可以说是业界最流行、最普遍的编程语言之一。一方面,Python可用于网络和应用程序开发,另一方面,它在数据世界中也非常流行,特别是在数据科学和数据工程方面。python的普遍性导致它被许多市场领先的工具、软件、框架和SDK采用。例如,在微软的技术栈中,像微软的Visual Studio、微软的Power BI、微软的SQL Server和其他这些流行的工具和技术都对Python有非常强大的集成支持。Python具有处理数据的独特能力,被用于编程,像skikitlearn这样的框架用于数据科学,以及用于渲染可视化的丰富库。Power BI是微软的主要工具和技术栈,用于在企业内部以及Azure云上进行报告和仪表盘制作。它支持使用Python渲染可视化,也支持使用Python导入数据。PowerBI配备了一百多个连接器,支持几乎所有的标准、成熟和新兴的数据源。数据专业人员将Python用于各种数据处理和数据消费相关的用例,并且有很大的潜力重复使用他们现有的代码库来获取和处理数据,并将其用于像PowerBI这样的工具。

Python的安装和设置

由于我们要在Microsoft Power BI中使用Python,我们将需要在本地机器上安装Python的设置。Python可以通过从Python.org下载到本地机器上直接安装。这是在本地机器上配置Python设置的最直接的方法之一。另一种安装python的方法是把它配置成Microsoft SQL Server的一部分,如果你碰巧在本地机器上有一个SQL Server设置的话。安装SQL Server来安装Python并不是一个有效的方法。但反过来说,也可以是设置Python的方法之一。使用SQL Server的Python服务器组件的局限性是,可能会有一些限制或约束,因为SQL Server可能会在其Python安装上安装一些包装器。另外,SQL Server安装的Python发行版是Anaconda发行版,人们可能想要一个特定的Python版本,在这种情况下,应该考虑下载所需的Python版本并在本地机器上独立安装。在本文中,我们假设本地机器上已经配置了Python的安装。

在我们进行实际操作之前,让我们看看Python设置的一些基本但重要的位置,我们可能需要使用这些位置来管理Python,特别是安装包,即库。一个Python安装的主目录如下所示。

托管二进制文件的目录是 Scripts 目录,该目录用于使用 pip 工具构建和安装软件包。使用命令提示符上的 pip 命令,我们可以很容易地在 python 安装中安装库。实际的库被安装在 Lib 目录中。人们可以使用pip命令来安装库,或者下载一个已经构建好的库并将其复制到Lib目录中。要在Power BI中使用python,必须安装三个库--OS、Pandas和matplotlib。一般来说,OS和Pandas(含Numpy)是大多数Python版本中预装的库。但是我们必须使用 "pip install matplotlib "命令来安装matplotlib库。一旦这个库被成功安装,那么可以认为Python设置已经准备好与Power BI一起使用。为了构建库,Python中的pip工具在微软Windows平台上使用Visual C++ 14.0或更高版本。确保你在本地机器上安装了相应的再分配软件。

假设所有需要的库都安装在本地机器上,并且最新版本的PowerBI也安装在本地机器上,打开PowerBI。导航到文件菜单 -> 选项和设置 -> 选项 -> Python 脚本菜单项。我们需要配置这一部分,将PowerBI指向Python的主目录,这样当我们使用Python脚本来获取带或不带预处理的数据集时,它将使用配置的Python设置来执行这些脚本。一般来说,如果系统变量PATH已经被设置,PowerBI会检测到Python安装的主目录。在任何情况下,如果它没有检测到Python的主目录,我们可以手动将PowerBI指向Python安装的主目录。

一旦Python设置完成,我们就可以导航回设计器窗口。点击获取数据菜单项,选择Python脚本连接器。它将打开一个新的窗口来提交Python脚本以供执行。只有数据框架会被解析为表格,并考虑在Power BI报告中进行采购。由于PowerBI已经支持各种各样的数据源,我们可以使用直接连接器来从这些数据源中获取数据。在数据科学中,从GitHub或其他类似来源的网络上刮取数据进行探索性数据分析是一种非常普遍的做法。这可能需要脚本来读取和格式化这些数据,然后再进行采购。因此,我们将考虑用Power BI中的Python连接器来使用一个类似的例子。

键入如下所示的Python脚本。在这个脚本中,第一行,我们正在导入pandas python库,该库通常用于读取数据并将其填充到称为数据框架的表格数据结构中。在脚本的第二行,我们创建了一个名为URL的变量,并将GitHub上的CSV文件的值赋给它。在python脚本的最后一行,我们使用pandas对象,执行read_csv文件,并将URL变量作为参数传给它。这将导致从该文件中读取数据,并将结果输出分配给变量 df。由于read_csv函数的输出是一个数据框,变量df的类型将是一个数据框,这正是我们所需要的,以便将输出检测为一个表格,导入我们的Power BI报告中。

点击 "OK "按钮,进入下一步。在下一步中,Power BI将使用我们之前配置的Python安装来执行这个脚本,然后显示输出的数据进行预览,如下图所示。在PowerBI报告中导入最终数据集之前,我们可以选择在脚本中对数据进行格式化,也可以在PowerBI中对超过这个阶段的数据进行转换。

点击加载按钮,将使用Python脚本获取的数据填充到PowerBI报告中。通过这种方式,我们可以在PowerBI的Python脚本连接器中使用Python脚本,使用Python安装来获取数据。

总结

在这篇文章中,我们学习了如何在本地机器上下载、安装和配置 Python。我们探索了Python中的工具和实用程序,它们允许我们安装通常用于处理数据的必要包。我们配置了PowerBI以指向Python的安装,然后使用Python连接器来执行脚本,使我们能够在Power BI报告中获得数据源。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/126279.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

生产制造业ERP管理系统能解决哪些仓库管理难题?

仓库管理够不够好,安不安全,直接关系到生产制造企业的发展。要知道制造型企业的大部分“身家”,都在仓库里了。来料是否及时,物料是否齐套,库存是否安全,配件品质是否合格,库容是否足够&#xf…

【蓝桥杯备赛系列 | 简单题】素数判断 字符串输入输出

🤵‍♂️ 个人主页: 计算机魔术师 👨‍💻 作者简介:CSDN内容合伙人,全栈领域优质创作者。 蓝桥杯竞赛专栏 | 简单题系列 (一) 作者: 计算机魔术师 版本: 1.0 &#xff08…

[leetcode.10]正则表达式匹配

(1)题目分析如下 题目要求完成一个正则表达式的匹配,其中s为目标串,p为正则串 .符号代表任何字符,*符号代表把前一个字符重复n次(可能为0次) (2)具体思路 一开始的时…

c++算法基础必刷题目——贪心

文章目录贪心1、拼数2、排座椅3、矩阵消除游戏4、华华听月月唱歌贪心 贪心算法(greedy algorithm ,又称贪婪算法)是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑&a…

《图解TCP/IP》阅读笔记(第八章 8.5)—— WWW知多少?

8.5 WWW 看到这章的名字,对于日常上网冲浪的我们而言,应该是再熟悉不过了。这不就是常见网址前的那三个字母,号称万维网(WWW,World Wide Web)的东西吗? 确实,我们本篇文章就要介绍与之相关的…

Dimitra 2022: 年度回顾

大家好, 我首先要感谢 Dimitra 社区和我们所有的投资者在 2022 年期间的支持。俗话说,“这些都会过去”,2022 年的宏观加密环境尤其具有挑战性,一些非常糟糕的行为者给广泛的加密行业带来很多痛苦。 2023 年可能是监管框架最终显…

公司来了个新测试开发,一副毛头小子的样儿,哪想到......

最近公司来了个新同事,学历并不高,而且大学也不是计算机专业的,今年刚满25岁。。 本以为也是来干点基础的活混混日子的,结果没想到这个人上来就把现有项目的性能优化了一遍,直接给公司节省了不少成本,这种…

Qt通过QProcess启动进程并传递命令行参数

目录QProcess启动外部程序的两种方式依赖式分离式:启动进程前的预处理设置启动路径设置启动命令参数启动的状态更多说明Public FunctionsSignals设计一个拉起进程的程序基本设计思路效果图核心代码控件对象header file(头文件)member variabl…

java比较器

一、说明: Java中的对象,正常情况下,只能进行比较: 或 ! 。不能使用 >或 如何实现? 使用两个接口中的任何一个: Comparable 或 Comparator 二、Comparable的使用(自然排序) 1.Comparable接口的使用举例: 1.像string、包装类等实现了Comparable接口…

智能优化算法:协作搜索算法-附代码

智能优化算法:协作搜索算法 摘要:协作搜索算法( Cooperation search algorithm ,CSA)是 Zhong-kai Feng等 于 2021 年提出的一种新型元启发式优化算法 。 该算法受现代企业团队协作行为的启发,具有寻优能力强,收敛速度…

Seata-AT模式数据源代理-JDBC中的关键知识点

背景 Seata 对业务无侵入是通过数据源代理实现的,从下图中可看出,数据源代理的实现涉及到 DataSource、Connection 以及 Statement,这几个关键知识属于 JDBC 的范畴,所以本篇从 JDBC 的视角对他们进行介绍。 一、JDBC 概述 JDBC…

【算法】面试题 - 回溯算法解题套路框架

回溯算法解题套路框架前言回溯算法的框架排列(元素无重不可复选)46. 全排列解析子集(元素无重不可复选)78. 子集解析组合(元素无重不可复选)77. 组合解析子集/组合(元素可重不可复选&#xff09…

免费PDF转Word?有这几个网站就够了

如果您想使用 Word 文档,您可能需要将PDF 转换为 Word,以便您可以随意使用该文档。将 PDF 转换为 Word 的过程需要一个好的 PDF 转换器。在本文中,您将探索可用的 5个免费转换器,其中包括 奇客PDF 和PDF2Go。 最好的 6 个 PDF 转 …

【unity笔记】图解Vector3.SignedAngle()方法的返回值

首先看一下官方文档的说明: public static float SignedAngle (Vector3 from, Vector3 to, Vector3 axis); from测量角度差的源向量。to测量角度差的目标向量。axis一个向量,其他向量将绕其旋转。返回 from 与 to 之间的有符号角度(以度为单…

CodeQL 源代码漏洞扫描

目录 1、下载配置 codeql 1.1 配置 codeql 1.2 配置 maven 2、测试 codeql 漏洞检测 2.1 构建 codeql 查询数据库 2.2 漏洞检测 测试环境:centos7 jdk11 maven 1、下载配置 codeql 1.1 配置 codeql 下载安装 codeql-cli: https://github.com/github/code…

大数据系列——什么是Flink?Flink有什么用途?

目录 一、基本概念 批与流 数据可以作为无界流或有界流处理 二、什么是Flink? 三、Flink有什么用途? 四、适用场景 五、flink事件驱动 六、flink拥有分层API flink sql 七、fllink企业级使用 一、基本概念 批与流 批处理的特点是有界、持久、大…

被误认为是外国人开发的4款软件,功能强大到离谱,且用且珍惜

国外的月亮不一定比国内圆,随着国内互联网飞速发展,国内研发出许多实用又良心的软件,由于偏见,功能强大的它们却被误认为是外国佬研发的。 1、Foxit PDF用系统自带的Adobe实在难用,Foxit这款PDF阅读器实在太强大&#…

unity使用RenderTexture可以渲染粒子特效

一,使用UIRawImage,创建材质球,把Shader给材质球,放到RawImage的Material上, // Upgrade NOTE: replaced mul(UNITY_MATRIX_MVP,*) with UnityObjectToClipPos(*)Shader "UI/Default No-Alpha" {Properties{[PerRende…

基于文本和图像的网络舆情分析方法研究

基于文本和图像的网络舆情分析方法研究 一、舆情分析技术 (1)舆情数据采集与提取技术; (2)自动文摘技术; (3)事件发现与追踪技术; (4)舆情情感分…

【虚幻引擎UE】UE5 模型描边的三个方法

一、后期处理法 1、创建描边材质,方法很多种,主要有设置深度、法线描边等 可以参考现有文章制作或直接下载材质资源使用。 参考文章: 1、【UE4】几种后处理描边的方法,效果及效率 2、UE4之物体描边 3、【UE4_001】后期处理轮廓…