通过PandasAI使用自然语言进行数据分析
介绍
PandasAI是一个Python库,可以很容易地用自然语言向数据提问。它可以帮助您使用生成人工智能来探索、清理和分析数据。
使用PandasAI
这里使用Anaconda和Jupyter使用PandasAI
进入一个文件目录 创建一个 Notebook
安装PandasAI库
- 使用清华的镜像源提升安装速度
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandasai
- 验证是否安装
pip list | grep pandasai
使用本地模型
官方对于使用本地模型的说明
LM Studio
LM Studio是一个跨平台桌面应用程序,用于实验本地和开源的大型语言模型,它还提供了简单易用的界面,让用户可以轻松地探索和使用这些语言模型
- 使用LM Studio加载一个本地模型之后,开启Start Server
使用PandasAI
- 代码整理
import pandas as pd
from pandasai import SmartDataframe
from pandasai.llm.local_llm import LocalLLM
llm = LocalLLM(api_base= "http://localhost:1234/v1")
df_llm = SmartDataframe(df, config={"llm": llm})
df = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],
"happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]
})
df_llm.chat('最幸福的5个国家有哪些?')
返回 'The 5 happiest countries are: United States, United Kingdom, France, Germany, Italy'
- 注意: 较小的模型通常性能不佳
使用streamlit生成一个chat ui页面