聚类案例——汽车是否值得购买

news2026/3/16 15:11:30

对汽车是否值得购买，进行聚类分析：

1、数据指标解释：

buying, 购买费用

maint, 维修费用

doors, 车门数量

person, 乘坐人数

lug_boot, 行李箱容量

safety, 安全性

2、对数据进行转换

将字符串转换映射量化为数字

数据加载：

import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
import matplotlib.pyplot as plt
data = pd.read_csv('./car_data.txt')
data

X = data.reset_index(drop = True)  #行索引重置
X

X.to_csv('./car_data_new.csv',index = False) #不要行索引
pd.read_csv('./car_data_new.csv')  #加载新保存数据

数据转化：

for col in X.columns:
    print(col,X[col].unique())

结果：

buying ['vhigh' 'high' 'med' 'low']
maint ['2' '3' '4' '5more']
doors ['2' '4' 'more']
person ['small' 'med' 'big']
lug_boot ['low' 'med' 'high']
safety ['unacc' 'acc' 'vgood' 'good']

字典映射：

X['buying'] = X['buying'].map({'vhigh':1,'high':2,'med':3,'low':4})
X['maint'] = X['maint'].map({'2':2,'3':3,'4':4,'5more':5})
X['doors'] = X['doors'].map({'2':2,'4':4,'more':5})
X['person'] = X['person'].map({'small':2,'med':5,'big':7})
X['lug_boot'] = X['lug_boot'].map({'low':1,'med':2,'high':3})
X['safety'] = X['safety'].map({'unacc':1,'acc':2,'vgood':3,'good':4})
X
#字典映射  只执行一次，再次执行字典的值为NULL，因为字典的键改变了

聚类建模：

kmeans = KMeans(n_clusters = 3)
kmeans.fit(X)
y_= kmeans.predict(X)
silhouette_score(X,y_)

分数：

0.28526565681580135

筛选最佳聚类条件：

scores = []
for k in range(2,8):
    kmeans = KMeans(n_clusters=k)
    kmeans.fit(X)
    y_ = kmeans.predict(X)
    score = silhouette_score(X,y_)
    scores.append(score)
print(scores)
plt.plot(range(2,8),scores)

scores数组：

[0.3486833182368877, 0.28526565681580135, 0.2607003011258018, 0.23938352073818228, 0.23148278681018836, 0.2285215746743637]

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2122227.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

聚类案例——汽车是否值得购买

数据加载：

数据转化：

结果：

字典映射：

聚类建模：

分数：

筛选最佳聚类条件：

scores数组：

相关文章

编程珠玑3-8

Mac视频vedio转成gif图

TDesign：腾讯的开源企业级前端框架，能和ant-design一战吗?

【开源大模型生态7】华为的盘古大模型

K8s中如何使用etcd进行集群信息的备份与恢复

MmAP(论文解读) : Multi-Modal Alignment Prompt for Cross-Domain Multi-Task Learning

根据NVeloDocx Word模板引擎生成Word（三）

区块链媒体：区块链媒体套餐倾心推广解析！

实例讲解电动汽车车速计算算法及Simulink建模方法

有什么免费好用的ai写作软件？2024帮助你快速进行写作的软件

echarts多组堆叠柱状图

strtok与strtok_r函数及线程安全问题

网络药理学：分子对接之二：PDB数据库的使用（已知PDB ID）、PubChem数据库如果没有3D结构

车载以太网

知识赋能：构建高效测试团队的关键

C# 路径操作

[开源]YOLOv8+Pyside6的交通红绿灯目标检测源码

一文精通Fourier Transform--傅里叶变换

党务政务服务|基于SprinBoot+vue的党务政务服务热线系统(源码+数据库+文档)

威胁建模STRIDE框架