基于python的长津湖评论数据分析与可视化,使用是svm情感分析建模

news2024/11/25 8:41:14
  1. 引言

  2. 研究背景及意义

  3. 上世纪初开始,中国电影就以自己独有的姿态登上了世界电影史的舞台。中国电影作为国家文化和思想观念的反映与延伸,能够增强文化自信,在文化输出方面有着极其重要的作用1[1]。 改革开放以来,随着生产力的提高,物质生活质量也随之提高,人们对精神的追求也随之提高,越来越多的人选择了电影作为自己的休闲方式,电影产业得到了飞速发展,中国电影迎来了越来越受观众青睐的黄金机遇期。在影片质量上下足功夫的人越来越多。 近年来,随着互联网的普及与应用,我国已全面进入互联网时代。据中国互联网络信息中心(CNNIC)在北京发布的第50期《中国互联网络发展状况统计报告》显示,截至2021年6月,我国网民规模为10.51亿,与2021年12月相比增长1919万,网民普及率为74.4%。2[2]。随着信息化水平的提高,网络技术已经渗透了人们的日常生活中,各种电影社区网站APP平台产生并产出大量的电影评论数据,人机交互也日益频繁,用户不仅仅是简单的接收和浏览信息,而是越来越喜欢在媒体平台上发表自己的看法。本文通过Python爬取用户对《长津湖》电影观影后发表的评论看法,对用户的情感进行分析。

  4. 国内外研究和发展现状

  5. 情感分析研究现状 近几年,不少情感分析研究者都投入到这个领域,而在具体领域中,关于机器学习的傲人成果也越来越多地吸引着大众的目光,其中,在机器学习处理文本类情感分析的领域中,该领域的一大创举是将词典引入到与机器学习相结合的情感分析任务中,以特征选择预处理的数据文本, 对于文中所写内容的感情趋向,在词典中已经不是单纯的以词为主了, 词性的情感趋向在包含面上有了较大的拓展,各种词性的研究已经在的方案性研究中引入到词典中, 对一些表情包也采取了一系列体现文字情感趋向的处理手段。深度学习还引入了情感分析的问题研究,传统的机器学习方法解决方案经过一系列的工作经验总结,已经取得了相对成熟的发展成果。 根据处理文本信息的细粒度不同,目前研究领域中常见的文本情感分析方法采用的研究手段也不尽相同。对不同的数据采取不同的处理方式,在监督方法和非监督方法上联合发力,均取得了较好的效果。

  6. 机器学习研究现状

近年来,越多越多的研究者投入到机器学习这个领域当中,并且取得了不俗的成绩。相关研究者在基于情感词典的情感分析研究任务工作中,首要解决的问题是标注情感表达的趋向性,即根据语义规则的预设,根据情感辞典中的词性表达,对词的情感表达进行进一步的解释、情感的评分,从而得出一系列文本的整体情感倾向。使用机器学习算法,结合传统的词袋法,可以促进二分类任务中分类效果的提高,提升算法的性能和准确性。利用TF-IDF 算法可以挖掘出文本数据的深层信息,对于目标领域文本情感分类精准度有一定的提高,为传统的机器学习二分类任务提供了新的解决思路。通过将数据规则化和SVM相结合的方法,来处理评论文本中的表情以及多义词的情感分类,大大提升了在文本语义预测的准确率。

  1. 本文主要研究内容

  2. 随着经济的发展,中国文化领域不断发展,尤其是电影行业。各类平台层出不穷的不断涌现,获取电影评论数据唾手可得,然后大量无规则文本甚至带有表情的文本数据的出现,使得情感趋向产生一定的误差。 以《长津湖》为例,本文通过影评数据反映电影《长津湖》的口碑以及影响热度,结合SnowNLP库和算法训练出可以识别影评情绪倾向的模型,对没有评分数据的影评进行情绪倾向推测。

  3. 本文的组织结构

论文共有六个章节,结构安排如下。

第1章引言部分,介绍一下这篇文章的背景、目的以及考察的内容。

第2章对可能会用到的技术进行了概括性的描述,首先回顾了爬虫的基本理论,描述了网页的构成;其次对于情感分析和文本分词进行技术介绍。

第3章主要介绍了对数据集的爬取以及预处理相关工作。

第4章主要介绍前端框架,通过可视化分析初步处理的数据,并结合Echarts和Flask绘制相关图表,达到更直观地感受数据的目的。

第5章首先对数据的词向量方法做出介绍,再将数据集划分成训练集和测试集。其次,分别在CountVectorizer和TfidfVectorizer两种不同的词向量方式下,基于SVM构建出SVC模型进行模型训练,最后进行性能分析。

第6章分为两个部分,首先是总结篇,这个部分主要是总结归纳这个项目的工作,最后是展望,针对工作中的不足,指出可以改进的地方,以及下一步可以开展的研究方向。

  1. 相关方法理论介绍

本章将介绍本文的相关方法理论。共有两个方面,一个是爬虫原理,本部分包括对爬虫基本原理与相关页面爬取的分析方法的介绍;另一个是情感分析的介绍。

  1. 爬虫

爬虫,又名网络爬虫,就是能够自动访问互联网并将网络内容下载下来的程序,它也是搜索引擎的根基,最具代表性的就是两大搜索引擎Google和Baidu,都是将海量数据存储下载到云端,通过强大的网络爬虫提供给用户高质量的搜索服务。

  1. 爬虫基本原理

为了进一步了解爬虫基本原理,首先先介绍一下网页的基本结构。基本的网页是由HTML、CSS、JavaScript三部分构成的。HTML也叫超文本标记语言。通过HTML标签描述网页的文字、图片、声音等内容,用相应的HTML标签标记网页需要定义哪些内容。HTML语言发展至今,已然经历了6个版本,目前主流的版本是HTML5,只是由于人们的习惯,仍然称为HTML。CSS通常被称为CSS风格或样式表,主要是为了在HTML页面中设置文字内容(字体,尺寸,对齐方式等),图片的形状(宽度和高度,边框风格,边距等),以及提供丰富功能的外观显示风格,例如版面的布局。JavaScript是Web页面中的脚本语言,静态页面可以通过JavaScript转化为动态页面,支持用户交互,并对相应的事件做出反应3[3]。简单来说HTML就是人的骨架,CSS就是人穿在身上的衣服,而JavaScript就是人的行为。

爬虫可以概括为四个环节:分析网页结构,获取网页源码,提取数据,数据持久化。爬虫第一步是分析网页的结构,如果是静态网页,就直接将网页的源代码获取下来。Python中为用户提供了许多的库,如urllib、requests库等,利用此等功能的库,可向网站的服务器发送请求,得到相应的HTML代码。如果是动态网页,这个时候的HTML网页只是提供内容展示的一个框架,相应的数据是由JavaScript脚本加载出来的。这个时候我们可以通过抓包的方式,将动态加载的后台数据的网址找到,加以规律的查找并封装相应的参数请求页面将数据提取。当然Python也提供了Selenium 库,这是一个基于浏览器运行的库,对爬取JavaScript动态渲染的页面是非常有效的。爬虫第二步是获取网页源码,通过上述的网页分析之后我们可以获取到相应的网页源码。接下来进行第三步,提取数据。Python提供了re、Xpath、Beautiful Soup等数据解析库。提取数据的方法有多种,可以根据网页的结构挑选适合该网站的提取方式。爬虫的最后一步是数据持久化。持久化的形式多种多样,我们可以根据数据最终的使用方式存储成想应的格式,如json、txt、csv、xlsx等,也可以存储到数据库中,如Mysql、MongoDb、Redis等。

  1. 情感分析

  2. 情感分析介绍 情感分析也称为意见挖掘,它是利用计算机技术对文本的观点、情感倾向进行挖掘与分析,并利用人工智能的神经网络模型对文本情感倾向进行分类判定4[4]。情感分析主要有两类,一类是以字典为基础的感情分类法,如图2-1所示,另一类是以机器学习算法原理为基础的感情分类法,如图2-2所示。

添加图片注释,不超过 140 字(可选)

图2-1 基于情感词典的情感分析流程

添加图片注释,不超过 140 字(可选)

图2-2 基于机器学习的情感分析流程

  1. 中文分词

中文分词是指按照一定规范将连续的字序重新组合成词语序列的过程,分词是将一个汉字序列分割成一个单独的词语。其本质就是划分词的边界。由于中文不像英文一样存在空格边界,且汉语博大精深,不同的词组在一起便有不同的含义。当中文发生歧义就会产生不同的语义,也就会出现不同的切割方式5[5]。在一定程度上就会对分词造成影响。所以在进行机器学习之前,首先要最大限度的完成分词操作,确保词性标注的准确性,才能得到好的模型。

  1. 本章小结

该章节对爬取网页数据和情感分析可能会用到的技术进行了概括性介绍,首先是对爬虫技术的详细介绍,其次是对情感分词、中文分词和词向量化的介绍,以备后续章节使用。


  1. 数据采集及预处理

本章主要介绍了软硬件环境、数据采集及数据清洗的方法。首先是使用Python对网页数据进行爬取,再通过Pandas库对数据进行清洗。

  1. 软硬件环境 操作系统:Windows 11 家庭中文版22000.1098(MP276JKV)X64; 开发平台:PyCharm Community Edition 2022.2.1; 第三方库:jieba,wordcloud,requests; 额外补充:Echarts中国地图包,Echarts; 处理器:AMD Ryzen 5 5600U with Radeon Graphics 2.30 GHz 内存:16GB。

  2. 数据采集

图3-1 数据采集流程图

  1. 第一阶段爬取

  2. 由图3-2所示,网页数据是直接渲染在HTML页面上的,通过requests模块即可抓取页面数据,通过图3-3对比可以发现,起决定性因素的参数是start 和 limit ,因此可以根据规律进行多页爬取,如图3-4所示。

添加图片注释,不超过 140 字(可选)

图3-2 网页结构分析

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

图3-3 网页请求分析

添加图片注释,不超过 140 字(可选)

图3-4 网页请求构造

  1. 参数说明(username:用户名 score:评分 time:发表评论的时间 comment:评论内容),根据图3-5所示,构建页面采集数据代码,结果如图3-6所示,并将数据持久化存储,内容如图3-7所示。

添加图片注释,不超过 140 字(可选)

图3-5 数据采集

添加图片注释,不超过 140 字(可选)

图3-6 控制台输出

添加图片注释,不超过 140 字(可选)

图3-7 采集结果


  1. 第二阶段爬取

  2. 通过图3-8分析发现该网站数据存储在json格式的数据集里面,通过图3-9,图3-10,图3-11对比两次JavaScript请求发现前一个数据集的最后一个id 是作为下一个请求页的参数,因此我们可以根据此规律构建多页的数据爬取的链接,如图3-12所示。

添加图片注释,不超过 140 字(可选)

图3-8 数据存放格式

添加图片注释,不超过 140 字(可选)

图3-8 数据存放格式

添加图片注释,不超过 140 字(可选)

图3-10 请求头参数规律1

添加图片注释,不超过 140 字(可选)

图3-11 请求头参数规律2

添加图片注释,不超过 140 字(可选)

图3-12 请求页逻辑构建

  1. 参数说明(uname:用户名 location:地区 addTime:发表评论的时间 content:评论内容),如图3-13所示,构建具体数据的采集逻辑过程,结果如图3-14所示,将数据持久化存储,结果如图3-15所示。

添加图片注释,不超过 140 字(可选)

图3-13 采集页面逻辑构造

添加图片注释,不超过 140 字(可选)

图3-14 控制台结果

添加图片注释,不超过 140 字(可选)

图3-15 采集结果


  1. 数据清洗 在进入分析之前,我们对数据文本进行了数据预处理,对空值项进行删除,对重复项进行去重,对包含表情的数据项不做处理,由于包含表情的数据项在情感分析时情绪分始终只有0.5,对模型影响不大,由于数据只做了去重和去空值操作,故此处不再过多赘述,将处理完的数据重新写入文件,部分结果如图3-16所示。

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

图3-16部分数据展示

  1. 本章小结

该章节详细介绍了数据爬取的过程,在爬取过程中已经对数据做了初步预处理,并将时间戳的格式在爬取过程中转换为标准格式,便于日期排序。这便导致数据清洗只能做去重和去空的操作。


  1. 数据可视化

本章主要介绍数据可视化时使用到的框架Flask和组件Echarts的介绍,并展示相关生成的图表。

  1. Flask介绍 Flask是一个轻量级的Web应用框架,由Python编写,Flask框架非常灵活,Flask只是完成了WerkZeug和模板引擎Jinja2的基本核心功能,它可以很好地结合MVC模式进行开发,可以在短时间内完成功能丰富的中小型网站或Web服务的网站的实现,其他的功能都是由第三方插件完成6[6],Flask的工作流程图如图4-1所示。

添加图片注释,不超过 140 字(可选)

图4-1 Flask工作流程图

  1. Echarts介绍 Echarts,是一款能够在PC和移动设备上流畅运行、兼容绝大多数浏览器、底层依赖轻量级Canvas类库Zrender的纯JavaScript图表库,提供直观、生动、可交互、可高度个性化定制的数据可视化图表。能够支持折线图、柱状图、散点图、K线图、饼图、雷达图、和线图、力导向布局图、地图、仪表盘、漏斗图、事件河流图等12类图表,同时提供标题,详情气泡、图例、值域、数据区域、时间轴、工具箱等7个可交互组件,支持多图表、组件的联动和混搭展现。7[7]

  2. 数据图表展示

  3. 使用极坐标统计数据集中的评分分布区域数 由图4-2和图4-3可以看出用户对《长津湖》这部电影的喜爱程度是很高的,这反映出了《长津湖》这部电影质量还是不错的。

添加图片注释,不超过 140 字(可选)

图4-2 评论分区区域数

  1. 使用圆环图统计正负向评论条数 由图4-3可以看出正向评论数据占比居多,这也侧面衬托出《长津湖》电影质量是有迹可循的。

添加图片注释,不超过 140 字(可选)

图4-3 正负样本条数

  1. 使用柱形图统计当天评论总数 根据图4-4《长津湖》观众评论数量与日期的时间关系的分布,这也电影票房发展趋势吻合。

添加图片注释,不超过 140 字(可选)

图4-4 每日评论条数

  1. 使用中国地图统计各地区发表的评论数 由图4-5可看出线上观影用户绝大部分分布在沿海地区。基本上每个区域都为《长津湖》的票房贡献出力量。

添加图片注释,不超过 140 字(可选)

图4-5 地区评论条数

  1. 使用饼图对评论高频词展示 由图4-6可看出《长津湖》的评论趋向是正向的,“好看”,“中国加油”等词可以看出《长津湖》影片制作是很好的,能够让观众感同身受。

添加图片注释,不超过 140 字(可选)

图4-6 评论词频统计

  1. 使用词云组件将用户评论数据可视化

最后使用WordCloud绘制词云提取影评中的关键词。如图4-7所示,观众根据画面认为这是“向英雄致敬”、“中国加油”、大大的“好看”等“非常感人的历史战争片”,同时也充分为其票房提供了强有力的保障。

添加图片注释,不超过 140 字(可选)

图4-7 词云图

  1. 本章小结

该章节对Flask框架和Echarts组件做出详细介绍,并在Flask框架上搭建一个简易网站供可视化组件存放,由于Flask框架使用方便、简单,此处只对图表做出呈现,不详细描述网站的搭建过程。


  1. 数据建模

  2. 数据预处理

  3. 数据的质量影响着模型的正确率,所以本文保留评论内容大于4的评论内容。如图5-1所示。

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

图5-1 数据预处理图1

  1. 将原始数据中存在的空格,标点符号,数字等数据清除。如图5-2所示。

添加图片注释,不超过 140 字(可选)

图5-2 数据预处理图2

  1. 使用snownlp库中的SnowNLP方法对评论内容做情感倾向度评分。如图5-3所示。

添加图片注释,不超过 140 字(可选)

图5-3 数据预处理图3

  1. 根据SnowNLP生成的评分数据划分数据标签0和1。如图5-4所示。

添加图片注释,不超过 140 字(可选)

图5-4 数据预处理图4

  1. 特征选择

  2. 本文选用CountVectorizer 和 TfidfVectorizer 两种特征选择方法对文本特征进行提取。

  3. CountVectorizer的作用是统计每一段文本中的每个单词出现的频率,经过统计后形成一个矩阵,每一行代表一个词频统计结果,构成一个词汇表。TfidfVectorizer 这个函数把词转换为向量,TF是词频,idf是逆文本频率, idf即是一个词的重要程度体现,越高越重要8[8]。

  4. 随机抽取数据集。如图5-5所示。

添加图片注释,不超过 140 字(可选)

图5-5 定义数据随机抽取方法

  1. 将随机抽取的数据集划分成训练集和测试集。如图5-6所示。

添加图片注释,不超过 140 字(可选)

图5-6 划分数据集

  1. 使用TfidfVectorizer函数对文本进行向量化,如图5-7所示。

添加图片注释,不超过 140 字(可选)

图5-7 文本向量化1

  1. 使用jieba库进行中文分词。如图5-8所示。

添加图片注释,不超过 140 字(可选)

图5-8 jieba中文分词

  1. 将分词的结果向量化。如图5-9所示。

添加图片注释,不超过 140 字(可选)

图5-9 文本向量化2

  1. 划分训练集数据和测试集数据。如图5-10所示。

添加图片注释,不超过 140 字(可选)

图5-10 划分数据集2


  1. SVM模型

  2. 将TfidfVectorizer向量化的数据分为训练数据和测试数据加以训练,将模型结果绘制成ROC曲线和混淆矩阵,如图5-11、图5-12所示。

添加图片注释,不超过 140 字(可选)

图5-10 模型评分1

添加图片注释,不超过 140 字(可选)

图5-11 ROC曲线1

添加图片注释,不超过 140 字(可选)

图5-12 混淆矩阵1

  1. 将CountVectorizer向量化的数据分为训练数据和测试数据加以训练,将模型结果绘制成ROC曲线和混淆矩阵,如图5-14、图5-15所示。

添加图片注释,不超过 140 字(可选)

图5-13 模型评分2

添加图片注释,不超过 140 字(可选)

图5-14 ROC曲线2

添加图片注释,不超过 140 字(可选)

图5-15 混淆矩阵2

  1. 单条数据预测

添加图片注释,不超过 140 字(可选)

图5-16 差评数据预测

添加图片注释,不超过 140 字(可选)

图5-17 好评数据预测

  1. 实验结果分析

在此之前,我们有必要对SVM模型进行一番了解。支持向量机(SVM)模型是一个二分类模型。在文本分类、图像分类、生物序列分析和生物数据挖掘等领域都有广泛的应用,是被视为文本分类中效果较为优秀的一种算法9[9]。

两种词向量的数据在SVC模型的训练后,预测结果都在89以上,如图5-10、图5-13所示。TfidfVectorizer更为精准,CountVectorizer稍微差了一些,但两者都达到了预期目标。单条数据的预测值也符合预期,效果如图5-16、图5-17所示。

  1. 总结和展望

  2. 本文总结 随着我国经济的发展,文化领域不断发展,尤其是电影行业最为瞩目,中国电影不仅质量提升,种类繁多,观众对电影的选择也是多种多样,对于情感分析进行相关研究具有一定的现实意义。 《长津湖》作为一部投入了巨大资金的历史战争题材电影,在众多电影中脱颖而出,凭借着扣人心弦的内容打动了观众,在两个月的时间内取得了56亿的票房亮,成为中国爱国电影的新标杆。几大平台和推广方对其票房走势产生了重要的推动影响。本文以电影评论情感分析切入点分别用两种不同的词向量方法,在数据集方面将评论数据分为好评和差评,综合打乱之后划分训练集、测试集。之后基于SVM分别构建出两种不同词向量的方法对模型进行训练,两种方法在模型训练之后的准确率基本符合预期,最高准确率在96%左右,测试集也是在96%左右。

  3. 工作展望

本文在回顾了情感分析的相关技术后,在具体工作中,基本完成了数据采集、数据预处理、特征工程、数据可视化等处理工作,后续开展对SVM等模型建模以及试验工作,对于情感分析的工作流程、技术有了深刻的认知和理解。然而在性能上,仅凭现有的工作是远远不够的,只是提供了某种可行的方法,本文的相关工作仍有不足之处,希望在今后能进一步完善改进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2247175.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

阿里云oss转发上线-实现不出网钓鱼

本地实现阿里云oss转发上线,全部代码在文末,代码存在冗余 实战环境 被钓鱼机器不出网只可访问内部网络包含集团oss 实战思路 若将我们的shellcode文件上传到集团oss上仍无法上线,那么就利用oss做中转使用本地转发进行上线,先发送…

预测未来 | MATLAB实现Transformer时间序列预测未来

预测未来 | MATLAB实现Transformer时间序列预测未来 预测效果 基本介绍 1.Matlab实现Transformer时间序列预测未来; 2.运行环境Matlab2023b及以上,data为数据集,单变量时间序列预测; 3.递归预测未来数据,可以控制预…

局域网与广域网:探索网络的规模与奥秘(3/10)

一、局域网的特点 局域网覆盖有限的地理范围,通常在几公里以内,具有实现资源共享、服务共享、维护简单、组网开销低等特点,主要传输介质为双绞线,并使用少量的光纤。 局域网一般是方圆几千米以内的区域网络,其特点丰富…

可视化建模与UML《协作图实验报告》

有些鸟儿毕竟是关不住的。 一、实验目的: 1、熟悉协作图的构件事物。 2、掌握协作图的绘制方法。 二、实验环境: window7 | 10 | 11 EA15 三、实验内容: 下面列出了打印文件时的工作流: 用户通过计算机指定要打印的文件。(2)打…

docker搭建私有的仓库

docker搭建私有仓库 一、为什么要搭建私有的仓库? 因为在国内,访问:https://hub.docker.com/ 会出现无法访问页面。。。。(已经使用了魔法) 当然现在也有一些国内的镜像管理网站,比如网易云镜像服务、Dao…

微信小程序条件渲染与列表渲染的全面教程

微信小程序条件渲染与列表渲染的全面教程 引言 在微信小程序的开发中,条件渲染和列表渲染是构建动态用户界面的重要技术。通过条件渲染,我们可以根据不同的状态展示不同的内容,而列表渲染则使得我们能够高效地展示一组数据。本文将详细讲解这两种渲染方式的用法,结合实例…

订单日记为“惠采科技”提供全方位的进销存管理支持

感谢温州惠采科技有限责任公司选择使用订单日记! 温州惠采科技有限责任公司,成立于2024年,位于浙江省温州市,是一家以从事销售电气辅材为主的企业。 在业务不断壮大的过程中,想使用一种既能提升运营效率又能节省成本…

mysql-分析并解决可重复读隔离级别发生的删除幻读问题

在 MySQL 的 InnoDB 存储引擎中,快照读和当前读的行为会影响事务的一致性。让我们详细分析一下隔离级别味可重复读的情况下如何解决删除带来的幻读。 场景描述 假设有一个表 orders,其中包含以下数据: 事务 A 执行快照读 START TRANSACTION…

使用itextpdf进行pdf模版填充中文文本时部分字不显示问题

在网上找了很多种办法 都解决不了; 最后发现是文本域字体设置出了问题; 在这不展示其他的代码 只展示重要代码; 1 引入扩展包 <dependency><groupId>com.itextpdf</groupId><artifactId>itext-asian</artifactId><version>5.2.0</v…

链表刷题|判断回文结构

题目来自于牛客网&#xff0c;本文章仅记录学习过程的做题理解&#xff0c;便于梳理思路和复习 我做题喜欢先把时间复杂度和空间复杂度放一边&#xff0c;先得有大概的解决方案&#xff0c;最后如果时间或者空间超了再去优化即可。 思路一&#xff1a;要判断是否为回文结构则…

0基础跟德姆(dom)一起学AI NLP自然语言处理01-自然语言处理入门

1 什么是自然语言处理 自然语言处理&#xff08;Natural Language Processing, 简称NLP&#xff09;是计算机科学与语言学中关注于计算机与人类语言间转换的领域. 2 自然语言处理的发展简史 3 自然语言处理的应用场景 语音助手机器翻译搜索引擎智能问答...

Linux系统使用valgrind分析C++程序内存资源使用情况

内存占用是我们开发的时候需要重点关注的一个问题&#xff0c;我们可以人工根据代码推理出一个消耗内存较大的函数&#xff0c;也可以推理出大概会消耗多少内存&#xff0c;但是这种方法不仅麻烦&#xff0c;而且得到的只是推理的数据&#xff0c;而不是实际的数据。 我们可以…

跨平台开发_RTC程序设计:实时音视频权威指南 2

1.2.1 一切皆bit 将8 bit分为一组&#xff0c;我们定义了字节(Byte)。 1956年6月&#xff0c;使用了Byte这个术语&#xff0c;用来表示数字信息的基本单元。 最早的字节并非8 bit。《计算机程序设计的艺术》一书中的MIX机器采用6bit作为1Byte。8 bit的Byte约定&#xff0c;和I…

WIFI:长GI与短GI有什么区别和影响

1、GI的作用 Short GI(Guard Interval)是802.11n针对802.11a/g所做的改进。射频芯片在使用OFDM调制方式发送数据时&#xff0c;整个帧是被划分成不同的数据块进行发送的&#xff0c;为了数据传输的可靠性&#xff0c;数据块之间会有GI&#xff0c;用以保证接收侧能够正确的解析…

ssm实战项目──哈米音乐(二)

目录 1、流派搜索与分页 2、流派的添加 3、流派的修改 4、流派的删除 接上篇&#xff1a;ssm实战项目──哈米音乐&#xff08;一&#xff09;&#xff0c;我们完成了项目的整体搭建&#xff0c;接下来进行后台模块的开发。 首先是流派模块&#xff1a; 在该模块中采用分…

C++使用minio-cpp(minio官方C++ SDK)与minio服务器交互简介

目录 minio简介minio-cpp简介minio-cpp使用 minio简介 minio是一个开源的高性能对象存储解决方案&#xff0c;完全兼容Amazon S3 API&#xff0c;支持分布式存储&#xff0c;适用于大规模数据架构&#xff0c;容易集成&#xff0c;而且可以方便的部署在集群中。 如果你已经部…

细说敏捷:敏捷四会之standup meeting

上一篇文章中&#xff0c;我们讨论了 敏捷四会 中 冲刺计划会 的实施要点&#xff0c;本篇我们继续分享敏捷四会中实施最频繁&#xff0c;团队最容易实施但往往也最容易走形的第二个会议&#xff1a;每日站会 关于每日站会的误区 站会是一个比较有标志性的仪式活动&#xff0…

二分法(折半法)查找【有动图】

二分法&#xff0c;也叫做折半法&#xff0c;就是一种通过有序表的中间元素与目标元素进行对比&#xff0c;根据大小关系排除一半元素&#xff0c;然后继续在剩余的一半中进行查找&#xff0c;重复这个过程直至找到目标值或者确定目标值不存在。 我们从结论往回推&#xff0c;…

FreeRTOS——低功耗管理

目录 一、概念及其应用 1.1应用 1.2STM32电源管理系统 2.3STM32低功耗模式 2.3.1睡眠模式 2.3.2停止模式 2.3.3待机模式 三、Tickless低功耗模式 3.1低功耗模式配置 3.2低功耗模式应用 3.3低功耗电路分析 3.4低功耗处理相关接口 四、实现原理 4.1任务等待删除的检查…

【STM32】MPU6050初始化常用寄存器说明及示例代码

一、MPU6050常用配置寄存器 1、电源管理寄存器1&#xff08; PWR_MGMT_1 &#xff09; 此寄存器允许用户配置电源模式和时钟源。 DEVICE_RESET &#xff1a;用于控制复位的比特位。设置为1时复位 MPU6050&#xff0c;内部寄存器恢复为默认值&#xff0c;复位结束…