read_csv()函数不仅是R语言中的一个读取csv文件的函数,也是pandas库中的一个函数。pandas是一个用于数据分析和处理的python库。它的read_csv函数可以读取csv文件里的数据,并将其转化为pandas里面的DataFrame对象。它由很多参数可以设置,例如分隔符、编码、列名、索引等。
文章目录
- read_csv函数的相关参数
- 路径问题
- 解决方案
- 第一种:
- 第二种:
read_csv函数的相关参数
pd.read_csv(
filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]],
sep=',',
delimiter=None,
header='infer',
names=None,
index_col=None,
usecols=None,
squeeze=False,
prefix=None,
mangle_dupe_cols=True,
dtype=None,
engine=None,
converters=None,
true_values=None,
false_values=None,
skipinitialspace=False,
skiprows=None,
skipfooter=0,
nrows=None,
na_values=None,
keep_default_na=True,
na_filter=True,
verbose=False,
skip_blank_lines=True,
parse_dates=False,
infer_datetime_format=False,
keep_date_col=False,
date_parser=None,
dayfirst=False,
cache_dates=True,
iterator=False,
chunksize=None,
compression='infer',
thousands=None,
decimal: str = '.',
lineterminator=None,
quotechar='"',
quoting=0,
doublequote=True,
escapechar=None,
comment=None,
encoding=None,
dialect=None,
error_bad_lines=True,
warn_bad_lines=True,
delim_whitespace=False,
low_memory=True,
memory_map=False,
float_precision=None,
)
虽然这个参数的数量着实让人头痛,不过我们实际需要用到的往往只有前几个,所以不需要全部记忆。
参考示例:
# 导入pandas库
import pandas as pd
# 读取CSV文件
df = pd.read_csv("data.csv")
# 打印DataFrame对象
print(df)
路径问题
我们有时候使用read_csv函数的时候,往往会遇到报错,报错位置直指路径,报错内容为ValueError: embedded null character
。遇到这种情况往往是因为我们的路径使用了'\'
而没有在前面加r
。具体情形如下图所示。
往往遇到这种情况,我们可以使用两种方法解决该问题。
解决方案
第一种:
方法:
在路径前面加r
原因:
因为在python字符串中,'\'
具有转义的含义,路径前面加r
是为了保持路径在读取时不被漏读,错读。如'\t'
可代表TAB,'\n'
可代表换行。加r
可以使得'\'
不背解读为转义字符。
加了r
以后我们可以发现read_csv函数可以找到数据集的位置被读取它。效果如下:
第二种:
方法:
将路径中的'\'
前面再加一个'\'
,也就是双斜杠。
原因:
这样就算在路径读取的时候,系统把'\'
当做转义字符处理,我们也还有一个'\'
可以用来是read_csv函数读取到数据集文件的位置。
操作结果如下: