【python】python知名品牌调查问卷数据分析可视化(源码+调查数据表)【独一无二】

news2024/10/6 20:30:40

请添加图片描述


👉博__主👈:米码收割机
👉技__能👈:C++/Python语言
👉公众号👈:测试开发自动化【获取源码+商业合作】
👉荣__誉👈:阿里云博客专家博主、51CTO技术博主
👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。


【python】python知名品牌调查问卷数据分析可视化(源码+调查数据表)【独一无二】


目录

  • 【python】python知名品牌调查问卷数据分析可视化(源码+调查数据表)【独一无二】
  • 一、设计要求
        • 描述性统计分析
        • 推论性统计分析
        • 数据可视化
  • 二、设计思路
      • 代码设计思路分析
        • 1. 文件导入与字体设置
        • 2. 读取数据
        • 3. 数据预处理
        • 4. 描述性统计分析
        • 5. 推论性统计分析
  • 三、可视化分析
        • 1. 年龄分布图
        • 2. 性别分布图
        • 3. 职业分布图


一、设计要求

描述性统计分析

对数据进行基本的描述性统计分析,包括以下内容:

  • 年龄分布:计算各年龄段的人数和百分比,并统计年龄的均值、中位数和标准差。
  • 性别分布:计算不同性别的人数和百分比。
  • 职业分布:计算不同职业的人数和百分比。
推论性统计分析

进行推论性统计分析,提供以下功能:

  • t检验:比较不同性别在问卷总分上的差异,输出t统计量和p值。
  • 卡方检验:比较不同年龄段在职业分布上的差异,输出卡方值和p值。
数据可视化

使用Matplotlib进行数据可视化,提供以下图表:

  • 年龄分布图:以柱状图形式展示各年龄段的频次。
  • 性别分布图:以柱状图形式展示不同性别的频次。
  • 职业分布图:以柱状图形式展示不同职业的频次。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈


二、设计思路

代码设计思路分析

1. 文件导入与字体设置
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from matplotlib import font_manager

# 设置中文字体
font_path = 'SimHei.ttf'  # 根据实际路径设置字体路径
font = font_manager.FontProperties(fname=font_path)
plt.rcParams['font.family'] = font.get_name()

导入所需的库,设置中文字体路径以确保在可视化过程中中文标签能够正确显示。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

2. 读取数据
file_path = '264356010_按文本_关于卡尔美运动品牌知名度的问卷调查_47_47.xlsx'
data = pd.read_excel(file_path, engine='openpyxl')

从指定的Excel文件中读取问卷调查数据,使用openpyxl引擎以兼容不同格式的Excel文件。

3. 数据预处理
age_mapping = {
    'A. 18岁及以下': 18,
    'B. 19-25岁': 22,
    'C. 26-35岁': 30,
    'D. 35岁及以上': 40
}
data['年龄数值'] = data['1、请问您的年龄是?'].map(age_mapping)

将年龄选项转换为数值形式,便于后续的统计分析。通过map方法将年龄区间映射为对应的数值。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

4. 描述性统计分析
# 年龄分布
# 略.....
# 略.....
# 略.....

# 性别分布
# 略.....

# 职业分布
# 略.....

# 打印描述性统计结果
print('年龄分布:')
print(pd.DataFrame({'Counts': age_counts, 'Percentage': age_percentage}))
print(f'年龄均值: {age_mean:.2f}')
print(f'年龄中位数: {age_median:.2f}')
print(f'年龄标准差: {age_std:.2f}')

print('\n性别分布:')
print(pd.DataFrame({'Counts': gender_counts, 'Percentage': gender_percentage}))

print('\n职业分布:')
print(pd.DataFrame({'Counts': occupation_counts, 'Percentage': occupation_percentage}))

在这里插入图片描述

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

在这里插入图片描述

在这里插入图片描述

进行描述性统计分析,计算各个类别(年龄、性别、职业)的频次和百分比,并计算年龄的均值、中位数和标准差。输出描述性统计结果,帮助了解数据的基本情况和分布特征。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

5. 推论性统计分析
# t检验 - 比较不同性别的总分
male_scores = data.loc[data['2、您的性别是?'] == 'A. 男', '总分']
# 略.....
# 略.....
print(f'\nt检验结果: t_stat = {t_stat:.4f}, p_val = {p_val:.4f}')


# 卡方检验 - 比较不同年龄段的职业分布
age_groups = pd.cut(data['年龄数值'], bins=[0, 18, 25, 35, 50, 100], labels=['0-18', '19-25', '26-35', '36-50', '50+'])
# 略.....
# 略.....
# 略.....
print(f'\n卡方检验结果: chi2 = {chi2:.4f}, p_val = {p:.4f}')

进行推论性统计分析,包括t检验和卡方检验。t检验用于比较不同性别在总分上的差异,卡方检验用于比较不同年龄段在职业分布上的差异,输出统计检验结果,包括t统计量、p值和卡方值。

在这里插入图片描述

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈


三、可视化分析

1. 年龄分布图

年龄分布图以柱状图的形式展示了调查问卷中各个年龄段的受访者人数。这一图表可以直观地反映出调查对象的年龄构成,从中我们可以看到不同年龄段受访者的比例。例如,如果18岁及以下和19-25岁年龄段的柱子明显高于其他年龄段,说明该调查问卷的主要受众是年轻人。这对于市场研究人员来说非常重要,因为了解目标人群的年龄分布可以帮助他们制定更有针对性的营销策略和产品定位。此外,通过观察柱状图中的峰值和低谷,我们还可以识别出调查对象的年龄集中区间和相对较少的年龄段,为后续的分析提供数据支持。

# 年龄分布
plt.figure(figsize=(10, 6))
age_counts.plot(kind='bar')
plt.title('年龄分布', fontproperties=font)
plt.xlabel('年龄', fontproperties=font)
plt.ylabel('人数', fontproperties=font)
plt.show()

在这里插入图片描述

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

2. 性别分布图

性别分布图也是以柱状图的形式展示,反映了调查问卷中男性和女性受访者的比例。通过这个图表,可以清晰地看到调查样本中不同性别的分布情况。例如,如果男性和女性受访者的柱子高度相近,说明该调查在性别上具有较好的平衡性;而如果某一性别的柱子显著高于另一性别,说明调查在性别分布上存在一定的偏向。性别分布对于市场研究和产品开发同样重要,因为不同性别的消费者可能有不同的需求和偏好。了解性别分布可以帮助企业在推广产品时进行性别细分,从而提高营销效果和用户满意度。

在这里插入图片描述

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

3. 职业分布图

职业分布图以柱状图的形式展示了受访者的职业构成。这一图表可以帮助我们了解不同职业背景的受访者在调查中的比例。例如,如果图表中显示学生、白领和自由职业者的柱子较高,说明这些职业群体是调查的主要对象。职业分布信息对于了解目标人群的职业背景和经济能力具有重要意义,可以帮助企业更好地理解消费者的购买力和消费习惯。例如,学生群体可能更关注性价比和品牌形象,而白领群体则可能对产品质量和售后服务有更高的要求。通过分析职业分布图,企业可以制定更有针对性的产品开发和市场推广策略,满足不同职业群体的需求。

在这里插入图片描述


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1879673.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

抓紧收藏!7 款令人惊艳的 AI 开源项目

🐼 关注我, 了解更多 AI 前沿资讯和玩法,AI 学习之旅上,我与您一同成长! 🎈 进入公众号,回复 AI, 可免费领取超多实用的 AI 资料 和内容丰富的 AI 知识库地址。 自从去年 AIGC 兴起以来,AI 开源…

gin 服务端无法使用sse流式nginx配置

我在本地使用 gin 可以流式的将大模型数据传递给前端。但是当我部署到服务器中时,会阻塞一段时间,然后显示一大段文本。 起初我怀疑是gin 没有及时将数据刷到管道中,但是经过测试,还是会阻塞。 c.Writer.(http.Flusher).Flush()最…

使用LabVIEW报告生成工具包时报错97

问题详情: 在运行使用Excel/Word调用节点的程序时,收到错误97:LabVIEW:(十六进制0x61)输入中传递了一个空引用句柄或先前已删除的引用句柄。 当运行报告生成工具包中的一个示例程序时,收到错误…

【python】python入门day2——数据类型与运算

python数据类型与运算 一、Python中变量的数据类型1、数据类型分类2、数值类型3、布尔类型4、字符串类型5、其他类型(了解) 二、Python数据类型转换1、使用Python实现超市的收银系统2、Python数据类型的转换方法3、总结 三、Python运算符1、算术运算符3、赋值运算符4、复合赋值…

计算机科学基础简单介绍(1—6)

计算机影响了我们生活的方方面面,在我们这个时代完全渗透了我们的生活。 最早是算盘、星盘、时钟、尺卡等古老的计算工具,后来出现了进步计算机,类似与汽车里程表的一种机械工具,但是他也是手工制品。经过历史的演变与发展&#x…

Prompting已死?DSPy:自动优化LLM流水线

在 LLM 应用中,如何优化一个 pipeline 的流程一直是一个比较头疼的问题。提示词作为一个预定义字符串,往往也没有很好地优化方向。本文中的 DSPy 框架或许能在实际应用中对效果优化起到一定帮助。 当前,在 LLM 的应用中,大家都在探…

LSTM时间序列基础学习

时间序列 时间序列可以是一维,二维,三维甚至更高维度的数据,在深度学习的世界中常见的是三维时间序列,这三个维度分别是(batch_size,time_step,input_dimensions)。 其中time_step是时间步,它…

GPU配置pytorch环境(links for torch)

一、创建一个新的虚拟环境 二、激活虚拟环境 三、打开或新建一个pycharm项目,把环境选成我们刚刚新建的虚拟环境 四、从links for torch网站下载与自己cuda版本和python版本对应的torch 五、在pycharm的终端pip install 安装torch 直到显示成功安装 六、验证pytorch…

六月,允许自己做自己,别人做别人

今天结束后,2024 就过去一半了。 年初的规划完成一半了吗?如果没有也没关系,做你自己继续前进。 家人来北京旅游,我累趴了 六月初,我搬家了,这次租了一整套房,是一个小俩居、还带一个小阁楼。…

新手练习项目 6:图书管理系统

名人说:莫听穿林打叶声,何妨吟啸且徐行。—— 苏轼《定风波莫听穿林打叶声》 Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder) 目录 一、项目描述二、项目结构三、项目步骤步骤1:定义Book类步骤2:实现主程序…

FHE全同态加密介绍——小白版

1. 何为FHE? FHE中的evluation key p k e v a l pk_{eval} pkeval​是public的,用于密文计算逻辑 f ( ⋅ ) f(\cdot) f(⋅)的evalute circuit中,但根据所处理数据加解密密钥的不同,可将FHE分为: 1)对称F…

Web后端开发概述环境搭建项目创建servlet生命周期

Web开发概述 web开发指的就是网页向后再让发送请求,与后端程序进行交互 web后端(javaEE)程序需要运行在服务器中 这样前端才可以对其进行进行访问 什么是服务器? 解释1: 服务器就是一款软件,可以向其发送请求,服务器会做出一个响应.可以在服务器中部署文件,让…

【ai】trition:tritonclient.utils.shared_memory 仅支持linux

Can’t find tritonclient.utils.shared_memory on WIN10 #4149yolov4的python客户端 导入以后,windows 的pycharm 就是看不到折腾了很久:SaviorEnv 环境下安装tritonclient[all]也会失败 (base) C:\Users\zhangbin>conda create -n SaviorEnv python=3.8 Collecting pack…

计算机体系结构和指令系统

1.计算机体系结构 - 五大部件 - 冯 诺依曼 计算机的特点 1.计算机有五大部件组成 2.指令和数据以同等地位存储于存储器,可按照地址访问 3.指令和数据用二进制表示 4.指令由操作码和地址码组成 5。存储程序 6.以计算器为中心(输入、输出设备与存储器…

成都市水资源公报(2000-2022年)

数据年限:2000-2022年,无2009年 数据格式:pdf、word、jpg 数据内容:降水量、地表水资源量、地下水资源量、水资源总量、蓄水状况、平原区浅层地下水动态、水资源情况分析、供水量、用水量、污水处理、洪涝干旱等

[XYCTF新生赛]-PWN:EZ1.0?(mips,mips的shellcode利用)

查看保护 查看ida 这里用的是retdec,没安装的可以看这个[CTF]-PWN:mips反汇编工具,ida插件retdec的安装-CSDN博客 这里直接看反汇编貌似看不出什么,所以直接从汇编找 完整exp: from pwn import* context(log_leveldebug,archmip…

【机器学习】在【Pycharm】中的应用:【线性回归模型】进行【房价预测】

专栏:机器学习笔记 pycharm专业版免费激活教程见资源,私信我给你发 python相关库的安装:pandas,numpy,matplotlib,statsmodels 1. 引言 线性回归(Linear Regression)是一种常见的统计方法和机器学习算法&a…

Nature Climate Change | 中国科学院地理资源所吴朝阳课题组发表生物多样性调控植被物候的研究成果!

本文首发于“生态学者”微信公众号! 植被春季物候对气候变化的响应通常是通过测量其温度敏感性(ST,温度每升高1度,植被提前展叶的天数)来量化。ST是植被在当地历史气候环境的选择压力下演化形成的最优策略,…

基于GRU自回归解码模拟人类股票交易实现高胜率

这里是基于encoder-decoder和注意力机制 模型代码,sigmoid对资产进行调仓。训练直接使用收益作为优化函数 import torch import torch.nn as nn from dataloader import create_dataloadersclass Attention(nn.Module):def __init__(self, hidden_dim):super(Attention, self…

C++集中营笔记(1)第一节课和第二节课

第一节课linux的使用 1.Linux 常用命令 [chenbogon ~]$ cd ~ [chenbogon ~]$ cd /home [chenbogon home]$ mkdir cpp-test mkdir: cannot create directory ‘cpp-test’: Permission denied [chenbogon home]$ sudo mkdir cpp-testWe trust you have received the usual lec…