python刷题-关于分词词频、数组排序,数组插数的题

news2025/1/12 1:38:20

目录标题

      • 1、对多种日期格式进行标准化
      • 2、实现英文分词计算词频-re.split、value_counts()
      • 3、中文文章分词
      • 4、统计《鹿鼎记》小说中的人名
      • 5、用1234能组成多少个互不相同且无重复数字的三位数
      • 6、两个矩阵相加
      • 7、用逗号分隔列表-join
      • 8、在升序的序列中插入一个数---重要
      • 9、对任意给的10个数字进行排序--重要
      • 10、将数组逆序输出-实现reverse

1、对多种日期格式进行标准化

#目标:2021-05-28
content = """
白日2021/05/26依山尽,黄河2021.05.27入海流。
欲穷千05-28-2020里目,更5/29/2020上一层楼。
"""
import re
#只能一样一样的替换
content = re.sub(r"(\d{4})/(\d{2})/(\d{2})",r"\1-\2-\3",content) #正则中括号,\1
print(content)
content = re.sub(r"(\d{4})\.(\d{2})\.(\d{2})",r"\1-\2-\3",content)
print(content)
content = re.sub(r"(\d{2})-(\d{2})-(\d{4})",r"\3-\1-\2",content)
print(content)
content = re.sub(r"(\d{1})/(\d{2})/(\d{4})",r"\3-0\1-\2",content)
print(content)

2、实现英文分词计算词频-re.split、value_counts()

分词:把每个单词提取出来-re.split
分隔符:空格,逗号,问号,换行号,斜线
计算词频:value_counts()

import re
with open("./wendang.txt") as fin:
	content = fin.read()

#print(content.split()) #直接split()试试,有些单词没分出来
words = re.split(r"[\s.()-?]+",content)#将分隔符都写入其中,\s空格,+一个或多个
print(words) #都拆分出来了
#下面计算词频
import pandas as pd
print(pd.Series(words).value_counts()[:20])

3、中文文章分词

中文分词库-jieba
思路:先把特殊符号替换为空,然后jieba.cut进行分词

content = """
春姑娘悄悄的来到了我们校园!
绿油油的小草争着抢着从地下探出头来,微分轻轻一吹,柳树就晃动着自己的秀发。
花园里各种各样的花儿都开了
"""
import jieba
import re
content = re.sub(r"[\s。...,!、]","",content) #中文中对特殊符号的处理是先替换掉
word_list = jieba.cut(content)
print(list(word_list))

4、统计《鹿鼎记》小说中的人名

思路:
1,读取文本
2,判断词性:posseg.cut(content)
3,是人名nr则加载进列表words中
4,统计词频,pd.Series(words).value_counts()

content = "李明喜欢韩梅梅,他俩早恋了"
import jieba.posseg as posseg
for word,flag in posseg.cut(content): 
	print(word,flag)#输出分词和其对应词性,nr对应人名

在这里插入图片描述

import jieba.posseg as posseg
with open("./鹿鼎记.txt") as fin:
	content = fin.read()
words = []
for word,flag in posseg.cut(content): 
	if flag == "nr":
		words.append(word)

import pandas as pd
print(pd.Series(words).value_counts()[:20])

5、用1234能组成多少个互不相同且无重复数字的三位数

l = [1,2,3,4]
for i in l:
	for j in l:
		for z in l:
			if i != j and j!=z and i!=z:
				print(a,b,c,sep="")

6、两个矩阵相加

x = [
[12,3,4],
[2,3,4],
[3,6,7]]
y = [
[7,8,9],
[4,8,4],
[9,1,7]]
y = [
[0,0,0],
[0,0,0],
[0,0,0]]

for i in range(3):
	for j in range(3):
		z[i][j] = x[i][j]+y[i][j]

for i in z:
	print(z)

7、用逗号分隔列表-join

strs = “python”
想输出: p,y,t,h,o,n

strs = "python"
result = ",".join(strs)
print(result)

8、在升序的序列中插入一个数—重要

思路:
先完整输出,找该插入的位置,挪位置,输出

a = [1,4,6,9,13,16,19,28,40,100,0]
print("before:")
for i in range(0,len(a)-1):print(a[i],end=" ")
print()
num = int(input("请输入数字:"))

local = 0
for i in range(len(a)-2,-1,-1):
	if number>a[i]:
		local = i+1
		break
print(local)
#i in range(a,b)是取不到b的
for i in range(len(a)-1,local-1,-1): #先移后面的再移动前面的,所以-1
	a[i]=a[i-1]
print(a)

在这里插入图片描述

9、对任意给的10个数字进行排序–重要

一个乱序的数组–要进行排序
前面有序区,后面无序区
在无序区中找出最小的值,放进有序区中去

a = [3,5,2,7,4,1]
for i in range(len(a)):
	min = i
	for j in range(i+1,len(a)):
		if a[j]< a[min]:
			min=j
	a[i],a[min] = a[min],a[i]
print(a)

10、将数组逆序输出-实现reverse

a = [1,2,3,4,5,6]
for i in a[::-1]:
	print(i,end=" ")

对应位置的数进行交换

a = [1,2,3,4,5,6]
for i in range(0,(len(a)-1)//2):
    temp = a[i]
    a[i] =a[len(a)-i-1]
    a[len(a)-i-1] = temp
print(a)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/180547.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

带滤波器的PID控制仿真-3(Simulink仿真)

在带滤波器的PID控制仿真-2的基础上对算例进行Simulink仿真。控制器采用积分分离PI控制&#xff0c;即当误差的绝对值小于等于0.80时&#xff0c;加入积分控制&#xff0c;仿真结果如图1和2所示。图1 加入滤波器时PID控制阶跃响应图2 无滤波器时PID控制阶跃响应初始化程序&…

03-你能不能自己写一个叫做java.lang.Object的类?

前言&#xff1a; 接着上一次02-为什么dex文件比class文件更适合移动端&#xff1f;的继续往下&#xff0c;距离上一篇已经过去快半年了&#xff0c;从我的博文记录中就可以清楚地看到&#xff1a; 转眼2023年新春假期接近尾声了&#xff0c;在这近半年的时间里&#xff0c;其…

2023英伟达显卡排名天梯图(已更新)

2023英伟达显卡排名天梯图 注意 这里没有更新4070Ti, 它的性能应该在3090和3090ti之间 Kelvin Kelvin 于 2001 年发布&#xff0c;是 Nvidia 千年以来第一个新的 GPU 微架构。最初的 Xbox 游戏机使用带有 Kelvin 微架构的 NV2A GPU。 GeForce 3 和 GeForce 4 系列 GPU 是采用…

nginx启动命令和停止命令

进入nginx的sbin目录下 cd /usr/local/nginx/sbin/ 1、启动nginx ./nginx 2、停止nginx两种方式 #待nginx进程处理任务完毕进行停止。 ./nginx -s quit #先查出nginx进程id再使用kill命令强制杀掉进程。 ./nginx -s stop 3、查看nginx端口 ps aux|grep nginx 4、查看ng…

机器学习——正则化线性回归和偏差/方差(Matlab代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f389;3 参考文献 &#x1f468;‍&#x1f4bb;4 Matlab代码 &#x1f4a5;1 概述 本文使用水库水位的变化来实现正则化线性回归&#xff0c;以预测大坝流出的水量。后续本文将对调试学习算法进行一些诊断&#…

2023需要重点关注的四大AI方向

2023需要重点关注的四大AI方向 过去10年&#xff0c;人工智能从实验室走向各行各业&#xff0c;成为一种普遍技术应用于众多领域。根据IDC的数据&#xff0c;2022年全球AI市场规模达到4328亿美元&#xff0c;增长近20%。而Precedence Research预计&#xff0c;到2030年&#xf…

商业模式画布的介绍例子

选自《软件开发权威指南》商业模式画布是指一种能够帮助创业者催生创意&#xff0c;降低猜测&#xff0c;确保他们找对目标用户&#xff0c;合理解决问题的工具。商业模式画布不仅能够提供更多灵活多变的计划&#xff0c;而且更容易满足用户的需求。更重要的是&#xff0c;它可…

家居建材商城|基于Springboot+Vue实现家居建材商城

作者主页&#xff1a;编程指南针 作者简介&#xff1a;Java领域优质创作者、CSDN博客专家 、掘金特邀作者、多年架构师设计经验、腾讯课堂常驻讲师 主要内容&#xff1a;Java项目、毕业设计、简历模板、学习资料、面试题库、技术互助 收藏点赞不迷路 关注作者有好处 文末获取源…

R|使用ggrepel添加文字标签

最近在用ggrepel&#xff0c;这里记录一些官网教程中的概要。与其去搜答案&#xff0c;不如过一遍软件的示例&#xff0c;大部分的问题都能迎刃而解。更详细的内容可参照官网教程&#xff1a;https://ggrepel.slowkow.com/articles/examples.html>基本用法<相比于geom_te…

python+django健身房课程预约评分系统

启动一个新项目 执行下面的命令来创建一个新的 Django 项目&#xff1a; django-admin startproject myproject 命令行工具django-admin会在安装Django的时候一起自动安装好。 执行了上面的命令以后&#xff0c;系统会为Django项目生成基础文件夹结构。 现在&#xff0c;我…

DFS(深度优先搜索)详解(概念讲解,图片辅助,例题解释,剪枝技巧)

目录 那年深夏 引入 1.什么是深度优先搜索&#xff08;DFS&#xff09;&#xff1f; 2.什么是栈&#xff1f; 3.什么是递归&#xff1f; 图解过程 问题示例 1、全排列问题 2、迷宫问题 3、棋盘问题&#xff08;N皇后&#xff09; 4、加法分解 模板 剪枝 1.简介 2.剪枝…

ASCII表

背景 ASCII&#xff08;American Standard Code for Information Interchange&#xff0c;美国信息互换标准代码&#xff09;是一套基于拉丁字母的字符编码&#xff0c;共收录了 128 个字符&#xff0c;用一个字节就可以存储&#xff0c;它等同于国际标准 ISO/IEC 646。 ASCII…

【R语言数据科学】:多项式回归

【R语言数据科学】:多项式回归 🌸个人主页:JOJO数据科学📝个人介绍:统计学top3高校统计学硕士在读💌如果文章对你有帮助,欢迎✌关注、👍点赞、✌收藏、👍订阅专栏✨本文收录于【R语言数据科学】本系列主要介绍R语言在数据科学领域的应用包括: R语言编程基础、R语…

软件测试该怎么测?10个测试方法,带你初步了解

软件测试该怎么测&#xff1f;10个测试方法&#xff0c;带你初步了解1.需求测试2.界面测试3.功能测试4.安全性测试5.可靠性测试6.可移植性测试7.兼容性8.易用性9.压力测试10.异常场景测试当然还有很多测试方法&#xff0c;这些要根据实际不同应用场景而变化&#xff0c;这里就以…

蓝桥杯算法训练合集五 1.简单字符变换2.字母转换3.输出一个倒等腰三角形4.寻找数组中最大值5.斐波拉契数列6.高低位变换

目录 1.简单字符变换 2.字母转换 3.输出一个倒等腰三角形 4.寻找数组中最大值 5.斐波拉契数列 6.高低位变换 1.简单字符变换 问题描述 输出任意一个小写字母&#xff0c;要求输出其ASCII码&#xff0c;并输出对应的大写字母。 输入格式 从键盘输入小写字母。 输出格式 输…

【c语言进阶】动态内存管理知识大全(上)

&#x1f680;write in front&#x1f680; &#x1f4dc;所属专栏&#xff1a;c语言学习 &#x1f6f0;️博客主页&#xff1a;睿睿的博客主页 &#x1f6f0;️代码仓库&#xff1a;&#x1f389;VS2022_C语言仓库 &#x1f3a1;您的点赞、关注、收藏、评论&#xff0c;是对我…

敢问路在何方?拒绝【内卷】到【进化】的底层逻辑

不知道什么时候&#xff0c; “内卷”这个词频繁出现在各行各业&#xff0c;人们也喜欢把各种问题归结于“内卷”。网络段子都说&#xff0c;以前打招呼是 “你吃了吗”&#xff1f;现在是“你卷赢了吗”&#xff1f; 从【你吃了吗&#xff1f;】到【你卷赢了没&#xff1f;】 …

C++基础(1) - 前导知识

文章目录程序编译流程常用的C编译器各种编译命令程序编译流程 常用的C编译器 最初的 cfront&#xff1b;Unix、Linux 系统中的 GNU g 编译器&#xff1b;Windows 系统中的 Cygwin、MinGW(Minimalist GNU for Windows)、MinGW-w64 等&#xff0c;它们都包含 GNU g 编译器&#…

了解JUnit测试框架

作者&#xff1a;~小明学编程 文章专栏&#xff1a;测试开发 格言&#xff1a;热爱编程的&#xff0c;终将被编程所厚爱。 目录 注解 Test注释 BeforeEach BeforeAll AfterEach AfterAll 断言 assertEquals / assertNotEquals assertTrue / assertFalse 测试的执行…

linux基本功系列之yum实战

文章目录一. yum命令介绍1.1 yum的介绍1.2 yum的优劣势1.3 使用yum的注意事项1.3.1 配置本地yum源1.3.2 配置网络yum源二. 语法格式及常用选项2.1 yum的全部参数2.2 影响yum的配置文件2.3 最常用的yum参数三. 参考案例实战3.1 使用yum进行安装3.2 使用yum升级和更新软件包3.3 软…