Pandas + AI = PandasAI【Python】

news2025/1/16 14:54:13

Pandas AI 是一个 Python 库,它为流行的数据分析和操作工具 Pandas 添加了生成式AI能力。 PandasAI旨在与 Pandas 结合使用,而不是它的替代品。
在这里插入图片描述

推荐:用 NSDT场景设计器 快速搭建3D场景

1、安装PandasAI

使用如下命令安装pandas-ai:

pip install pandasai

2、快速上手PandasAI

PandasAI 旨在与 Pandas 结合使用。 它使 Pandas 具有对话性,允许你以 Pandas DataFrames 的形式提出有关数据的问题并获得答案。

例如,你可以要求 PandasAI 查找 DataFrame 中列值大于 5 的所有行,它将返回仅包含这些行的 DataFrame:

import pandas as pd
from pandasai import PandasAI

# Sample DataFrame
df = pd.DataFrame({
    "country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
    "gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],
    "happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]
})

# Instantiate a LLM
from pandasai.llm.openai import OpenAI
llm = OpenAI()

pandas_ai = PandasAI(llm)
pandas_ai.run(df, prompt='Which are the 5 happiest countries?')

上面的代码将返回以下内容:

6            Canada
7         Australia
1    United Kingdom
3           Germany
0     United States
Name: country, dtype: object

当然,你也可以让 PandasAI 进行更复杂的查询。 例如,你可以要求 PandasAI 求出 2 个最不幸福国家的 GDP 总和:

pandas_ai.run(df, prompt='What is the sum of the GDPs of the 2 unhappiest countries?')

上面的代码将返回以下内容:

19012600725504

也可以要求 PandasAI 画图:

pandas_ai.run(
    df,
    "Plot the histogram of countries showing for each the gpd, using different colors for each bar",
)

在这里插入图片描述

可以在examples目录中找到更多示例。

3、PandasAI环境变量

为了设置 LLM(Hugging Face Hub,OpenAI)的 API 密钥,你需要设置适当的环境变量。 可以通过将 .env.example 文件复制到 .env 来执行此操作:

cp .env.example .env

然后,编辑 .env 文件并设置适当的值。

或者,也可以将环境变量直接传递给 LLM 的构造函数:

# OpenAI
llm = OpenAI(api_token="YOUR_OPENAI_API_KEY")

# OpenAssistant
llm = OpenAssistant(api_token="YOUR_HF_API_KEY")

原文链接:PandasAI = Pandas + AI — BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/491301.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux中TF启动卡制作:磁盘分区文件同步

文章目录 前言:1. 连接TF卡2. 磁盘卸载载与分区2.1 磁盘卸载2.2 创建第一个分区2.3 创建第二个分区 3. 磁盘格式化4. 文件同步5. 检查与BOOT分区启动文件拷贝总结: 前言: TF卡在linux环境下配置好相关软件后,把配置好的系统以及软…

Neo4j图数据库的数据模型_包括节点_属性_数据_关系---Neo4j图数据库工作笔记0002

来看一下neo4j的特性 这个neo4j特点就是简单,这里用最快的速度学习 可以看到一个圈表示一个节点,然后两个节点直接可以有关系,关系可以是双向的

Python正则表达式详解,保姆式教学,0基础也能掌握正则

正则作为处理字符串的一个实用工具,在Python中经常会用到,比如爬虫爬取数据时常用正则来检索字符串等等。正则表达式已经内嵌在Python中,通过导入re模块就可以使用,作为刚学Python的新手大多数都听说”正则“这个术语。 今天来给…

学生成绩管理系统【纯控制台】(Java课设)

系统类型 纯控制台类型(没有用到数据库) 使用范围 适合作为Java课设!!! 部署环境 jdk1.8Idea或eclipse 运行效果 本系统源码地址:https://download.csdn.net/download/qq_50954361/87753365 更多系统…

Python每日一练(20230505) 课程表 Course Schedule III/IV

目录 3. 课程表 Course Schedule III 4. 课程表 Course Schedule IV 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java每日一练 专栏 3. 课程表 Course Schedule III 这里有 n 门不同的在线课程&#xff…

python并发编程:什么是并发编程?python对并发编程有哪些支持?

Python并发编程是指同时执行多个任务的编程模式。Python提供了多种实现并发编程的方式,包括多线程、多进程、协程、异步IO等。 为什么要引入并发编程 假设以下两个场景: 场景一: 一个网络爬虫,按顺序爬取花了一个小时,采用并发…

距新发牌制度生效不到1个月,我们和数位香港Web3er聊了聊

出品|欧科云链研究院 作者|Jason Jiang 4月20日,欧洲议会通过加密资产市场法规(MiCA),使欧盟成为全球首个引入全面加密法的主要司法管辖区。与此同时,东方世界的香港也正加速拥抱Web3变革。香港特区立法会…

【线程安全】内存可见性问题及解决方案

1. 关于内存可见性的一段代码 import java.util.Scanner; public class ThreadDemo {public static int count 0;public static void main(String[] args) throws InterruptedException {Thread t1 new Thread(() -> {while (count 0) {}System.out.println("t1 线程…

双向链表及双向链表的常见操作和用js封装一个双向链表

书接上回,上一篇文章讲了单向链表以及用 js 封装一个单向链表,所以这节将介绍双向链表以及用 js 封装一个双向链表。待会我也会继续在文章后面附上视频学习链接地址,大家想学习的可以去看看 一、认识双向链表 首先来认识一下什么是双向链表&…

广和通发布5G智能模组SC151系列,助力AIoT应用更智能高效

2023年5月,广和通发布5G R16智能模组SC151系列。SC151系列基于4nm制程工艺的高通QCM4490解决方案设计,采用8核高性能处理器,为工业与商业物联网终端提供高性能处理能力。面对与日俱增的终端智能化需求,SC151系列将助力打造高生产力…

【致敬未来的攻城狮计划】第2期定向赠书《RT-Thread设备驱动开发指南》+ 《GD32 MCU原理及固件库开发指南》

开启攻城狮的成长之旅!这是我参与的由 CSDN博客专家 架构师李肯(超链接:http://yyds.recan-li.cn)和 瑞萨MCU (超链接:瑞萨电子 (Renesas Electronics Corporation)) 联合发起的「 致敬未来的攻…

【LeetCode】每日一题:移除链表元素 [C语言实现]

👻内容专栏:《LeetCode刷题专栏》 🐨本文概括:203.移除链表元素 🐼本文作者:花 碟 🐸发布时间:2023.5.5 203. 移除链表元素 - 力扣(LeetCode) 题目&#xff…

微信小程序的生命周期

微信小程序的生命周期 1.什么是生命周期?2.生命周期的分类3.什么是生命周期函数?4.生命周期函数的分类5.应用生命周期函数6.页面周期函数 1.什么是生命周期? 生命周期(Life Cycle)是指一个对象从创建 -> 运行 ->…

Ant Design Pro---【02 UMI路由讲解】

在 Umi 中,应用都是单页应用,页面地址的跳转都是在浏览器端完成的,不会重新请求服务端获取 html,html 只在应用初始化时加载一次。所有页面由不同的组件构成,页面的切换其实就是不同组件的切换,你只需要在配…

设计模式——观察者模式(应用广,较难)

是什么? 又被称为发布-订阅模式,它定义了一种一对多的依赖关系,让多个观察者同时监听某一个主题对象,这个主题对象在状态变化时,会通知所有的观察者对象,使它们能够更新自己; 结构 抽象主题&…

复兴号列车司机室

复兴号上线有一段时间了,很多旅客都已经体验过,但是,司机室可能绝大多数人都没有机会一睹容颜,今天带你去司机室操纵台去探索一番。 按照上图的圈圈划分为操作台右侧(蓝色圈圈)、中部(红色圈圈…

从C到C++

目录 1、输入输出库与名字空间 2、输入输出流对象cin和cout 3、string字符串类 4、bool类型 5、自增自减--运算符&#xff08;必考&#xff09; 6、其他 1、输入输出库与名字空间 #include <iostream> using namespace std; 每次写代码先把这两个东西加上 <io…

共享内存实现进程间大数据的交换

引言   进程间的数据交换和共享是一种非常重要和实用的技术。大、中型软件的开发设计多是由众多程序设计人员的合作完成&#xff0c;通常一个程序设计人员只负责其中一个或几个模块的开发&#xff0c;这些模块可以是动态链接库也可以是应用程序或是其他形式的程序组件。这些独…

Java 面试必问的线程池原理总结

本文首发自「慕课网」&#xff0c;想了解更多IT干货内容&#xff0c;程序员圈内热闻&#xff0c;欢迎关注"慕课网"&#xff01; 作者&#xff1a;大能老师 | 慕课网讲师 Java 线程池原理总结 &#xff08;一&#xff09;什么是线程池 线程池做的工作主要是控制运行…

Arcgis进阶篇(4)——arcgis js api使用geoserver服务

1、geoserver安装方法 geoserver-2.19.x&#xff08;此版本支持jdk8.x&#xff09;的下载地址&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1PkmmjHWWzbUA9fYfa110Ew?pwd8tvf 提取码&#xff1a;8tvf 经测试&#xff0c;最新版本的geoserver需要jdk11&#xff…