在使用sklearn机器学习库使用fetch_20newsgroups调用数据集时候(如下方代码所示),报错403怎么办,本人亲测两种方法,分享大家:
data = fetch_20newsgroup(subset="train")
一、第一种方法
1.下载压缩包,且修改名字为20news-bydate.tar.gz,具体下载地址为:
下载地址
2.将压缩包放入C:\Users\(自己的电脑名)\scikit_learn_data\20news_home\的文件夹中
3.在电脑搜索框中直接搜索_twenty_newsgroups.py 文件并打开,以记事本形式或python格式都可以
4.进行修改,修改函数内容,大概第70-80行代码位置
5.调用代码看看能否运行
二、下载pkz文件
下载一个pkz文件到scikit_learn_data目录下,下载后并将文件放到scikit_learn_data文件下,重新运行代码。