load_dataset() 是 Seaborn 库中提供的一个函数,用于加载一些原始数据集。这些数据集包含了许多经典的数据集,比如鸢尾花数据集、小费数据集等,这些数据集在数据可视化和机器学习中非常常见。
使用 load_dataset() 函数可以方便地获取这些数据集,并将它们转换为 Pandas DataFrame 格式。这样我们就可以直接对这些数据集进行数据处理、分析和可视化等操作。
但是在使用load_dataset()加载数据集时报错:
第一种:URLError: <urlopen error [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。>
第二种:RemoteDisconnected: Remote end closed connection without response
运行代码:
import seaborn as sns
import pandas as pd
tips = sns.load_dataset("tips")
tips.head()
但是运行报错如下:
原因:本地没有数据集。因为加载不出来数据集,可能时网络或者服务器资源问题。
解决方法:将Seaborn数据集下载到本地
下载地址:mirrors / mwaskom / seaborn-data · GitCode
下载到本地后并解压好。
接着在编辑器中,运行以下代码获取到load_dataset()在本地的地址:
import seaborn as sns
import pandas as pd
print(sns.utils.get_data_home())
最后,将刚下载下来的数据放到这个文件夹下即可。
这样再去运行加载数据的代码就不会报错啦!