# Pandas2.2 Series
## Computations descriptive stats
|方法|描述|
|-|:-------|
|Series.compare(other[, align_axis, ...])|用于比较两个 `Series`|
### pandas.Series.compare
`pandas.Series.compare` 方法用于比较两个 `Series`,并返回一个包含差异的 `DataFrame`。该方法可以显示两个 `Series` 中哪些值不同,并且可以选择是否保留相等的值以及如何对齐数据。
#### 参数说明
- **other**:另一个 `Series` 或标量值。与当前 `Series` 进行比较的对象。
- **align_axis**:{0 or 'index', 1 or 'columns'},默认为 1。指定对齐的轴:
- 0 或 'index':按索引对齐。
- 1 或 'columns':按列对齐(对于 `Series` 来说,通常不需要更改)。
- **keep_shape**:布尔值,默认为 False。如果为 True,则返回的 `DataFrame` 将保留原始形状,即使某些位置没有差异。
- **keep_equal**:布尔值,默认为 False。如果为 True,则返回的 `DataFrame` 将包含相等的值。
- **result_names**:元组,默认为 ('self', 'other')。指定返回的 `DataFrame` 中两列的名称。
#### 示例及结果
##### 示例 1:基本用法
```python
import pandas as pd
# 创建两个 Series
s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
s2 = pd.Series([1, 2, 5, 6], index=['a', 'b', 'c', 'd'])
print("第一个 Series (s1):")
print(s1)
print("\n第二个 Series (s2):")
print(s2)
# 使用 compare 方法比较两个 Series
comparison = s1.compare(s2)
print("\n比较结果:")
print(comparison)
```
##### 输出结果
```
第一个 Series (s1):
a 1
b 2
c 3
d 4
dtype: int64
第二个 Series (s2):
a 1
b 2
c 5
d 6
dtype: int64
比较结果:
self other
c 3.0 5.0
d 4.0 6.0
```
在这个例子中,`compare` 方法返回了一个 `DataFrame`,其中包含 `s1` 和 `s2` 中不同的值。索引 `c` 和 `d` 的值在两个 `Series` 中不同,因此它们被显示在结果中。
##### 示例 2:保留形状 (`keep_shape=True`)
```python
import pandas as pd
# 创建两个 Series
s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
s2 = pd.Series([1, 2, 5, 6], index=['a', 'b', 'c', 'd'])
# 使用 compare 方法比较两个 Series,并保留形状
comparison_keep_shape = s1.compare(s2, keep_shape=True)
print("\n比较结果 (保留形状):")
print(comparison_keep_shape)
```
##### 输出结果
```
比较结果 (保留形状):
self other
a NaN NaN
b NaN NaN
c 3.0 5.0
d 4.0 6.0
```
在这个例子中,`keep_shape=True` 参数使得返回的 `DataFrame` 保留了原始形状,即使某些位置没有差异。
##### 示例 3:保留相等的值 (`keep_equal=True`)
```python
import pandas as pd
# 创建两个 Series
s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
s2 = pd.Series([1, 2, 5, 6], index=['a', 'b', 'c', 'd'])
# 使用 compare 方法比较两个 Series,并保留相等的值
comparison_keep_equal = s1.compare(s2, keep_equal=True)
print("\n比较结果 (保留相等的值):")
print(comparison_keep_equal)
```
##### 输出结果
```
比较结果 (保留相等的值):
self other
c 3 5
d 4 6
```
在这个例子中,`keep_equal=True` 参数使得返回的 `DataFrame` 包含了相等的值。
#### 注意事项
- `compare` 方法主要用于比较两个 `Series` 的差异,并返回一个 `DataFrame`,其中包含不同的值。
- 如果需要比较更复杂的结构(如 `DataFrame`),可以使用 `DataFrame.compare` 方法。
- `keep_shape` 和 `keep_equal` 参数可以根据需求调整返回的结果形状和内容。
#### 总结
`pandas.Series.compare` 方法是一个强大的工具,用于比较两个 `Series` 并返回差异。通过调整参数,可以灵活地控制返回结果的形状和内容,适用于各种数据分析场景。