这段代码 df.replace({'b': '.'}, {'b': np.nan}) 在 Pandas 中的作用是进行值替换:
-
df.replace(): 这是 Pandas 中的replace()方法,用于替换 DataFrame 中的值。 -
第一个字典 (
{'b': '.'}): 这是一个映射,表示要替换的值:'b': 这是要被替换的列名。'.': 这是要替换的旧值。也就是说,在列'b'中,所有的.会被替换成新值。
-
第二个字典 (
{'b': np.nan}): 这是另一个映射,表示替换成的目标值:'b': 还是指列名'b'。np.nan: 这是替换成的值,表示缺失值(NaN)。
整体操作:
该代码表示:在 DataFrame 中,列 'b' 中所有值为 . 的元素会被替换成 np.nan(即缺失值)。
示例:
假设你有一个 DataFrame 如下:
import pandas as pd
import numpy as np
# 示例 DataFrame
df = pd.DataFrame({
'a': [1, 2, 3],
'b': ['.', 'x', '.']
})
# 使用 replace() 方法替换
df = df.replace({'b': '.'}, {'b': np.nan})
print(df)
输出:
a b
0 1 NaN
1 2 x
2 3 NaN
解释:
- 在列
'b'中,所有的.被替换成了np.nan,表示缺失值。 - 其他的值(如
x)保持不变。


















