Streamlit的第一个应用(二)

news2025/1/15 17:43:36

文章目录

  • 1 前言
  • 2 创建第一个应用 📝🚀
  • 3 获取数据 📦🔍
  • 4 函数缓存🚀🔍📊
  • 5 赏析原始数据 ✨🎉
  • 6 绘制直方图 📊✨
  • 7 所有乘车点的地图 🌍🚖
  • 8 完整代码

1 前言

📣 重要通知!在我之前的博客中,曾经介绍过Streamlit的安装方法和初步应用。如果你还没有参阅过,请先阅读这篇文章,它为我们接下来的探索铺垫了基础。🔍😊

(一) 初识Streamlit——安装以及初步应用 在这篇文章中,我向大家简要介绍了Streamlit的安装过程,并分享了一个简单应用的示例供大家参考。让我们回顾一下这篇文章:(一)初识streamlit——安装以及初步应用🚀🔗

感谢大家一直以来的支持与鼓励!接下来,我们将继续探索如何使用Streamlit创建第一个应用。请随我一同展开这个令人兴奋的旅程!💡✨

本文涉及到每章节的详细内容都会在之后的博文中讲解,这里是为了向读者展示利用streamlit搭建数据看板的完整流程

2 创建第一个应用 📝🚀

在本部分中,我们将一起探索如何使用Streamlit来创建第一个应用程序。Streamlit不仅仅是创建数据应用的一种方式,它还为我们提供了一个活跃的社区平台,让我们可以分享应用和创意,并相互帮助改进工作。赶快加入我们的社区论坛吧,我们非常乐于听取你的问题和想法,并帮助你解决困扰 —— 今天就开始吧!

首先,我们需要创建一个新的Python脚本,我们可以将其命名为 uber_pickups.py。

打开你最喜欢的集成开发环境(IDE)或文本编辑器,然后添加以下几行代码:

import streamlit as st
import pandas as pd
import numpy as np

每个优秀的应用程序都需要一个标题,因此让我们来添加一个:

st.title('Uber在纽约市的搭车数据')

现在,我们可以在命令行中运行Streamlit:

streamlit run uber_pickups.py

运行Streamlit应用与运行其他Python脚本没有任何区别。每当你需要查看应用程序时,只需使用这个命令即可。应用程序通常会在浏览器中自动开启一个新的选项卡。
在这里插入图片描述

3 获取数据 📦🔍

现在我们已经创建了一个应用程序,下一步需要做的是获取纽约市Uber的搭车和下车数据。

让我们首先编写一个功能来加载数据。我们将编写一个名为load_data的函数,该函数使用pandas库的read_csv函数从指定的URL下载数据,并将其存储在一个名为data的数据帧中。我们还将所有列名称转换为小写,并将日期/时间列转换为pandas的日期时间类型。

# 设置日期/时间列的名称
DATE_COLUMN = 'date/time'

# 定义数据集的URL地址
DATA_URL = ('https://s3-us-west-2.amazonaws.com/'
         'streamlit-demo-data/uber-raw-data-sep14.csv.gz')

# 定义加载数据的函数
def load_data(nrows):
    # 从指定URL下载数据,并将其加载到数据帧中
    data = pd.read_csv(DATA_URL, nrows=nrows)
    
    # 将列名称转换为小写
    lowercase = lambda x: str(x).lower()
    data.rename(lowercase, axis='columns', inplace=True)
    
    # 将日期/时间列转换为日期时间类型
    data[DATE_COLUMN] = pd.to_datetime(data[DATE_COLUMN])
    
    # 返回加载的数据帧
    return data

在上述代码中,我们使用DATA_URL变量来指定数据集的URL地址。然后,我们调用read_csv函数,并传入nrows参数来加载指定数量的行数据。

接下来,我们在应用程序中使用这个函数来加载实际的数据。我们创建一个文本元素data_load_state,用于在应用程序中显示加载数据的状态信息。然后,我们调用load_data函数,并传入10000作为要加载的行数。一旦数据加载完成,我们使用text方法来更新data_load_state文本元素的内容,提示数据加载已完成。

# 创建一个文本元素,告诉读者数据正在加载中。
data_load_state = st.text('正在加载数据...')

# 加载10,000行数据到数据帧中。
data = load_data(10000)

# 通知读者数据已成功加载。
data_load_state.text('加载数据...完成!')

最后,我们通过运行streamlit run命令来启动应用程序,并选择"Always Rerun"选项。这样,当对应用程序进行任何更改并保存后,它都会自动重新加载,并显示数据加载的状态信息。

在这里插入图片描述

4 函数缓存🚀🔍📊

缓存是一种性能优化技术,可以将函数计算的结果保存在内存中,以便在下次调用时快速获取。而Streamlit的缓存功能非常简单,只需要使用@st.cache装饰器即可激活。
在这里插入图片描述

使用@st.cache装饰器标记一个函数后,Streamlit会自动管理函数的缓存。在函数调用时,Streamlit会检查两个方面:

(1)使用的输入参数:如果提供的参数值与之前的一样,Streamlit会直接从缓存中获取结果,而不会重新计算。

(2)函数内部的代码:如果代码没有发生变化,Streamlit也会从缓存中获取结果,从而避免重复计算。

使用缓存功能有很多好处。特别是对于加载大型数据集或进行耗时计算的情况下,缓存可以显著提高应用程序的性能和响应速度。通过避免重复计算,我们可以使应用程序更加高效。

要使用缓存功能,只需在函数定义之前使用@st.cache装饰器标记函数即可。这一行简单的代码就可以为你的应用程序带来神奇的缓存效果。
在这里插入图片描述

5 赏析原始数据 ✨🎉

在开始处理数据之前,咱们得先瞄一眼要处理的原始数据,这是个非常不错的主意哦!那么咱们来为应用程序添加一个炫酷的副标题,并将原始数据打印出来:

import streamlit as st

# 添加子标题
st.subheader('原始数据')

# 打印原始数据
st.write(data)

在上面的代码中,我们使用st.subheader()函数添加了一个子标题,以强调原始数据的重要性。然后,使用st.write()函数将数据打印出来。有趣的是,st.write()函数可以渲染几乎任何你传递给它的内容。

st.write()函数会根据数据类型的不同尝试展示最合适的方式。如果它没有按照你的预期工作,你可以尝试使用专门的命令,如st.dataframe()来显示数据框。完整的命令列表可以查看 API 参考文档。

通过观察原始数据,你可以对数据的结构和特征有一个初步的了解。这对于理解数据和选择适当的分析方法非常重要。
在这里插入图片描述

6 绘制直方图 📊✨

现在,我们将进一步分析数据集,通过绘制直方图来了解Uber在纽约市最繁忙的小时段。
首先,在原始数据部分下面添加一个子标题:

st.subheader('每小时乘车次数')

接下来,使用NumPy生成一个直方图,按小时统计乘车时间:

# 使用NumPy生成一个直方图,按小时统计乘车时间
hist_values = np.histogram(
    data[DATE_COLUMN].dt.hour, bins=24, range=(0,24))[0]

这段代码使用NumPy库生成了直方图的值,将乘车时间按小时进行分类并统计出现的次数。

现在,让我们使用Streamlit的st.bar_chart()方法来绘制直方图:

# 通过Streamlit的st.bar_chart()方法绘制直方图
st.bar_chart(hist_values)

保存你的脚本。这个直方图应该会立即显示在你的应用程序中。经过快速查看,我们可以看到最繁忙的时间是下午17点(5点)。
在这里插入图片描述

7 所有乘车点的地图 🌍🚖

当我们使用直方图分析Uber数据集时,我们可以确定乘车最繁忙的时间段,但是如果我们想弄清楚城市中的乘车集中区域呢?虽然我们可以使用条形图来展示这些数据,但是这很难理解,除非你对城市的纬度和经度坐标非常熟悉。为了展示乘车集中情况,让我们使用Streamlit的st.map()函数将数据叠加在纽约市的地图上。
首先,在该部分下方添加一个子标题:

st.subheader('Map of all pickups')

接下来,使用st.map()函数来绘制地图:

st.map(data)

保存你的脚本。这个地图是完全交互式的。尝试使用平移和缩放功能来探索一下吧!

在绘制完直方图之后,你确定了最繁忙的乘车时间是下午17:00。让我们重新绘制地图,展示在17:00乘车点的集中情况。
在这里插入图片描述
在绘制完直方图之后,确定了最繁忙的乘车时间是下午17:00。让我们重新绘制地图,展示在17:00乘车点的集中情况。

hour_to_filter = 17
filtered_data = data[data[DATE_COLUMN].dt.hour == hour_to_filter]
st.subheader(f'{hour_to_filter}:00时的所有乘车点地图')
st.map(filtered_data)

在这里插入图片描述
当我们绘制地图时,用于过滤结果的时间是硬编码在代码中的,但是如果我们希望读者能够实时动态地过滤数据怎么办呢?使用Streamlit的小部件,你可以实现这个功能。让我们在应用程序中添加一个滑块,使用st.slider()方法。

首先,找到 hour_to_filter 的代码片段,并将其替换为:

hour_to_filter = st.slider('选择小时', 0, 23, 17)  # min: 0h, max: 23h, 默认为 17h

这段代码创建了一个滑块,它允许用户通过拖动滑块来选择小时数。滑块的范围是从0到23(表示0点到23点),默认值是17点。

保存你的代码,现在你可以使用滑块实时观察地图的更新了。
在这里插入图片描述
滑块只是动态更改应用程序组成部分的一种方式。让我们使用st.checkbox()函数向你的应用程序添加一个复选框。我们将使用这个复选框来在应用程序顶部显示/隐藏原始数据表格。

首先,找到下面的代码段:

st.subheader('Raw data')
st.write(data)

将其替换为以下代码:

if st.checkbox('显示原始数据'):
    st.subheader('原始数据')
    st.write(data)

这段代码创建了一个复选框,并且在复选框被选中时显示原始数据表格。如果复选框未被选中,则不显示原始数据表格。

保存你的脚本,现在你可以使用复选框来显示或隐藏原始数据表格了。
在这里插入图片描述

8 完整代码

import streamlit as st
import pandas as pd
import numpy as np

st.title('Uber在纽约市的搭车数据')

# 设置日期/时间列的名称
DATE_COLUMN = 'date/time'

# 定义数据集的URL地址
DATA_URL = ('https://s3-us-west-2.amazonaws.com/'
            'streamlit-demo-data/uber-raw-data-sep14.csv.gz')

@st.cache_data
# 定义加载数据的函数
def load_data(nrows):
    # 从指定URL下载数据,并将其加载到数据帧中
    data = pd.read_csv(DATA_URL, nrows=nrows)

    # 将列名称转换为小写
    lowercase = lambda x: str(x).lower()
    data.rename(lowercase, axis='columns', inplace=True)

    # 将日期/时间列转换为日期时间类型
    data[DATE_COLUMN] = pd.to_datetime(data[DATE_COLUMN])

    # 返回加载的数据帧
    return data
# 创建一个文本元素,告诉读者数据正在加载中。
data_load_state = st.text('正在加载数据...')
# 加载10,000行数据到数据帧中。
data = load_data(10000)
# 通知读者数据已成功加载。
data_load_state.text("Done! (using st.cache_data)")

if st.checkbox('显示原始数据'):
    st.subheader('原始数据')
    st.write(data)

st.subheader('每小时乘车次数')

# 使用NumPy生成一个直方图,按小时统计乘车时间
hist_values = np.histogram(
    data[DATE_COLUMN].dt.hour, bins=24, range=(0,24))[0]

# 通过Streamlit的st.bar_chart()方法绘制直方图
st.bar_chart(hist_values)

st.subheader('Map of all pickups')
st.map(data)

hour_to_filter = st.slider('选择小时', 0, 23, 17)  # min: 0h, max: 23h, 默认为 17h
filtered_data = data[data[DATE_COLUMN].dt.hour == hour_to_filter]
st.subheader(f'{hour_to_filter}:00时的所有乘车点地图')
st.map(filtered_data)

至此,创建streamlit的第一个应用的内容介绍完成,你还可以将项目上传至streamlit cloud,具体内容我会在后续的博文中讲解,还请大家三连呀~

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/838520.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux修改系统语言

sudo dpkg-reconfigure locales 按pagedown键,移动红色光标到 zh_CN.UTF-8 UTF-8,空格标记*号(没标记下一页没有这一项),回车。 下一页选择 zh_CN.UTF-8。 如果找不到 dpkg-reconfigure whereis dpkg-reconfigure …

手机变电脑2023之虚拟电脑droidvm

手机这么大的内存,装个app来模拟linux,还是没问题的。 app 装好后,手指点几下确定按钮,等几分钟就能把linux桌面环境安装好。 不需要敲指令, 不需要对手机刷机, 不需要特殊权限, 不需要找驱…

第二十二章 原理篇:UP-DETR

最近一直在忙各种各样的面试,顺便重新刷了一遍西瓜书。 感觉自己快八股成精了,但是一到写代码的环节就拉跨,人真是麻了。 许愿搬家前可以拿到offer! 参考教程: https://arxiv.org/pdf/2011.09094.pdf https://zhuanla…

第一百二十二天学习记录:C++提高:STL-vector容器(上)(黑马教学视频)

vector基本概念 功能: vector数据结构和数组非常相似,也称为单端数组 vector与普通数组区别: 不同之处在于数组是静态空间,而vector可以动态扩展 动态扩展: 并不是在原空间之后续接新的空间,而是找更大的内…

荐读 | 《揭秘云计算与大数据》

当我们回顾过去几十年的科技进步时,云计算和大数据在现代科技发展史上无疑具有里程碑式的意义,它们不仅改变了我们的生活方式,而且对各行各业产生了深远的影响。 在这个数字化时代,云计算和大数据技术已经成为推动全球发展的关键…

Java:如何破坏类加载器的双亲委派机制?

本文重点 我们前面分析过loadClass方法,我们可以发现,这个方法的逻辑就是双亲委派机制,也就是说只要不破坏这个方法,那么就不会破坏双亲委派机制。如果要想破坏双亲委派机制,我们需要在类中重写loadClass方法,只要这样,那么就不会走双亲委派机制了。 破坏还是不破坏双…

【GitOps系列】使用 ArgoCD ApplicationSet 来实现多环境管理

文章目录 前言自动多环境管理概述自动化管理多环境实战示例应用简介ApplicationSet 简介部署 ApplicationSet访问多环境 创建新环境实验结语 前言 聊起多环境,通常可能会立即想到下面几个常见的环境: 开发环境测试环境预发布环境生产环境 为了让不同职…

TikTok运营五个要点,这些你都知道吗?

TikTok也就是海外版抖音,和抖音一样同属于字节跳动,其整个发展模式也类似于抖音,但相比抖音现在成熟的商业模式而言,TikTok还处于明显的娱乐阶段,虽然它也在缓慢的测试一些电商。 即使如此,由于抖音的巨大…

group normalization

1、 Theory look for this link for more information, actually only this image can illustrate the group normalization.you can ignore the rest of this artical. 2、 Code check this link for detailed about the formulation and the theory of the group normalzi…

基于 yolov8 的人体姿态评估

写在前面 工作中遇到,简单整理博文内容为使用预训练模型的一个预测 Demo测试图片来源与网络,如有侵权请告知理解不足小伙伴帮忙指正 对每个人而言,真正的职责只有一个:找到自我。然后在心中坚守其一生,全心全意,永不停…

软考A计划-系统集成项目管理工程师-信息系统安全管理-上

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例点击跳转>软考全系列点击跳转>蓝桥系列 👉关于作者 专注于Android/Unity和各种游…

从excel中提取嵌入式图片的解决方法

1 发现问题 我的excel中有浮动图片和嵌入式图片,但是openpyxl的_image对象只提取到了浮动图片,通过阅读其源码发现,这是因为openpyxl只解析了drawing文件导致的,所以确定需要自己解析 2 解决思路 1、解析出media资源 2、解析…

阿里云“通义千问”开源,可免费商用

我是卢松松,点点上面的头像,欢迎关注我哦! 阿里云成为国内首个加入大模型开源行列的大型科技企业。就在昨天,阿里云公开表态,把自家的通义千问大模型开源。 阿里云把通用70亿参数模型,包括Qwen-7B和对话模…

python 变量赋值 修改之后 原值改变

ython 是一种动态语言,因此变量的类型和值 在运行时均可改变。当我们将一个变量赋值给另一个变量时,实际上是将变量的引用地址传递给新的变量,这意 味着新旧变量将指向同一个位置。因此,在更改其中一个变量的值时,另一…

第二十二篇:思路拓展:如何打造高性能的 React 应用?

React 应用也是前端应用,如果之前你知道一些前端项目普适的性能优化手段,比如资源加载过程中的优化、减少重绘与回流、服务端渲染、启用 CDN 等,那么这些手段对于 React 来说也是同样奏效的。 不过对于 React 项目来说,它有一个区…

linux 系统初始化基本yum命令

安装可能用到的系统工具 yum -y install vim telnet wget net-tools lrzsz unzip zip 安装常用工具和开发包 yum install -y which openssh-clients openssh-server less iproute bzip2 cmake gcc gcc-c gdb git libtool make man net-tools sysstat sudo psmisc nc net-t…

kvm+qemu+libvirt管理虚机

virt-manager 图形化创建虚拟机 #virt-manager纳管远程kvm虚拟机 # 可以指定kvm虚机的ssh端口和virt-manager所在主机的私钥 virt-manager -c qemussh://root10.197.115.17:5555/system?keyfileid_rsa --no-fork # 如果你生成的ssh-key 的名称是 test-key,在/home/ssh-key/ 目…

面向城乡公交的嵌入式系统远程升级设计方案

针对城乡公交站牌显示终端现场升级与维护困难的问题,提出了一种基于应用程序(IAP)技术的嵌入式系统远程升级设计方案。 通过IAP技术配合改良过的远程升级程序代替传统的现场烧写调试,节约了奔赴现场调试的时间和成本。 针对远程…

Django使用uwsgi+nginx部署,admin没有样式解决办法

Django使用uwsginginx部署,admin没有样式解决办法 如果使用了虚拟环境则修改nginx.conf文件中的/static/路径为你虚拟环境的路径,没有使用虚拟环境则改为你python安装路径下的static server {listen 8008;server_name location; #改为自己的域名,没域名…

嵌入式开发学习(STC51-8-IO扩展-串转并)

内容 通过74HC595模块控制LED点阵,以一行循环滚动显示 74HC595简介 51单片机IO口非常有限,如果想要连接更多外围设备,可以通过IO扩展来实现;其中一种IO口扩展方式-串转并,使用的芯片是74HC595; 1个74HC…