【项目背景】
通过市场调研、文本分析、访谈和问卷调查等方法,探讨:
- 网民对无人驾驶汽车出行服务的态度。
- 无人驾驶安全员的行业背景。
- 不同人群在旅游时的交通选择偏好。
- 游客及当地居民对桂林市文旅路线的交通满意度。
- 乘客对无人驾驶汽车的满意度。
- 桂林市文旅路线推广无人驾驶汽车是否会优化桂林旅游交通体验及其影响因素。
【相关代码】
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.decomposition import LatentDirichletAllocation as LDA
import matplotlib.pyplot as plt
from scipy.stats import chi2_contingency
# 假设我们有一个包含问卷数据的CSV文件
data = pd.read_csv('survey_data.csv')
# 数据清洗:移除缺失值
data_clean = data.dropna()
# 文本分析:使用LDA模型提取主题
vectorizer = CountVectorizer(stop_words='english')
lda = LDA(n_components=3, random_state=0)
lda.fit_transform(vectorizer.fit_transform(data_clean['comments']))
# 可视化主题
pyLDAvis.enable_notebook()
vis = pyLDAvis.gensim_models.prepare(lda, vectorizer, data_clean)
pyLDAvis.display(vis)
# 交叉表和卡方检验:分析不同人群的交通选择偏好
contingency_table = pd.crosstab(data_clean['age_group'], data_clean['preferred_transport'])
chi2, p, dof, expected = chi2_contingency(contingency_table)
print(f"Chi-squared test results: chi2={chi2}, p={p}, dof={dof}")
# 满意度分析:计算不同交通方式的满意度
satisfaction_scores = data_clean[['waiting_time', 'vehicle_cleanliness', 'driver_attitude']].mean(axis=1)
print(f"Average satisfaction scores: {satisfaction_scores.mean()}")
【代码说明】
- 数据导入与清洗:
使用Pandas库读取名为"survey_data.csv"的CSV文件,加载问卷数据。
对数据进行清洗,通过dropna()方法移除包含缺失值的行,存储在data_clean中。
- 文本分析(LDA模型):
使用Scikit-learn库中的CountVectorizer进行文本向量化,将文本数据转换成词频矩阵。
使用Latent Dirichlet Allocation (LDA) 模型对文本数据进行主题提取。
通过LDA模型的fit_transform方法拟合并转换文本数据,将其应用到data_clean['comments']列中。
- 可视化主题(pyLDAvis):
调用pyLDAvis.gensim_models.prepare方法准备可视化数据,用于展示LDA模型的结果。
最终通过pyLDAvis.display方法展示生成的交互式可视化主题图。
- 交叉表和卡方检验:
使用Pandas的crosstab方法创建交叉表,分析不同人群(按照'age_group')的交通选择偏好('preferred_transport')。
通过chi2_contingency方法进行卡方检验,计算卡方值(chi2)、p值(p)、自由度(dof)和期望频数(expected)。
- 满意度分析:
计算各个满意度指标(等待时间、车辆清洁度、司机态度)的平均分数。
将三个满意度指标的平均分数进行均值计算,作为整体满意度得分。
需要注意的是,代码中使用的一些库和函数如pyLDAvis、gensim_models需要提前导入或安装。整体代码结构为数据处理、文本分析、可视化、统计分析和结果展示。
civilpy:Python数据分析及可视化实例目录940 赞同 · 36 评论文章编辑
civilpy:Python通过某上市企业经营业绩预测股价走势0 赞同 · 0 评论文章编辑
civilpy:Python实时追踪关键点组成人体模型0 赞同 · 0 评论文章编辑