1. 函数功能
将通用定界符文件读取到DataFrame中
2. 函数语法
pandas.read_table(filepath_or_buffer, *, sep=_NoDefault.no_default, delimiter=None, header='infer', names=_NoDefault.no_default,
index_col=None, usecols=None, dtype=None, engine=None, converters=None, true_values=None, false_values=None,
skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True,
verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=_NoDefault.no_default, keep_date_col=False,
date_parser=_NoDefault.no_default, date_format=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None,
compression='infer', thousands=None, decimal='.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None,
comment=None, encoding=None, encoding_errors='strict', dialect=None, on_bad_lines='error', delim_whitespace=False,
low_memory=True, memory_map=False, float_precision=None, storage_options=None, dtype_backend=_NoDefault.no_default)
3. 函数参数
参数 | 含义 |
---|---|
filepath_or_buffer | 文件路径 |
sep | 默认分隔符,默认为:\t |
delimiter | 分隔符,同sep参数 |
header | 用作列名的行。 整数,整活列表(多层索引)或者None(无列名),默认为infer:结合数据情况自主推断 |
names | 用作列名的列表,若要替换原有的列名,需要与header=0同时使用 |
index_col | 用作行索引的列,默认为None,index_col=False 可以强制pandas不将第一列作为索引 |
usecols | 要读入的数据列,传入列名或者列的位置组成的列表 |
dtype | 指定读入数据列的类型 |
engine | 解析引擎,默认python; |
true_values | 指定被视为True的值:如:true_values=[‘是’, ‘正确’, ‘1’]:文件中的任何值等于字符串"是"、“正确"或者"1”,它们将被视为True |
false_values | 指定被视为False的值:如:false_values=[‘否’, ‘错误’, ‘0’]:文件中的任何值等于字符串"否"、“错误"或者"0”,它们将被视为False |
skiprows | 读取文件跳过的行数:整数,或者指定的行:数字组成的列表 |
skipfooter | 整数,要跳过文件结尾的n行 |
nrows | 指定读取文件的行数 |
na_values | 除了默认识别为NA的值,用户指定的需要识别为NA的值。可以是标量、列表或者以字典的形式,指定不同列识别为NA的不同值 |
keep_default_na | 1. 当取值为True:na_values未指定时,只有默认的NAN值会被是被为NA;2. 当取值为True,且na_values指定时,指定的na_values和默认的NA值均会被识别为NA;3. 当取值为False,且na_values未指定时,所有值均不会被识别为NA;4. 当取值为False,且na_values指定时,仅有na_values中的值会被识别为NA;默认取值为True |
na_flilter | 默认True:自动识别缺失值 |
skip_blank_lines | 默认取值为True:跳过空行;取值为False:读取空行为NA |
thousands | 可选参数,字符串,指定千分位符 |
decimal | 指定小数点字符,默认为: “.” |
encoding | 读取文件的编码方式,默认为utf-8 |