文章目录
- 背景
- 实现
背景
如果某一列的种类特别多,想要通过映射来编码,这样非常麻烦,所以可以对一个列全部一次性进行编码。
例如我的数据如下:
我需要编码专业这个列,我们可以看到这一列很多:
实现
使用Categorical函数:
data['专业'] = pd.Categorical(data['专业']).codes
语法示例如下:
import pandas as pd
# 创建示例数据
df = pd.DataFrame({
'Fruit': ['apple', 'orange', 'banana', 'banana', 'apple', 'orange']
})
# 使用pd.Categorical()函数将Fruit列编码
df['Fruit_Encoded'] = pd.Categorical(df['Fruit']).codes
# 打印结果
print(df)