文本编辑器与正则表达式

news2024/12/20 0:09:27

1. VIM 编辑器

1.1 VIM 基本概念

VIM 是一个高度可定制的文本编辑器,广泛用于程序员的日常开发中。与传统的文本编辑器不同,VIM 基于模式操作,具有以下几个主要特点:

  • 普通模式:用于浏览和修改文本。
  • 插入模式:用于输入文本。
  • 命令模式:用于执行命令。

1.2 常用 VIM 快捷键

切换模式
  • 插入模式:按 i 进入插入模式,按 Esc 返回普通模式。
  • 命令模式:按 : 进入命令模式。
编辑操作
  • 删除d + 操作(如 dd 删除一行,d$ 删除光标后所有字符)
  • 复制y + 操作(如 yy 复制一行,y$ 复制光标后的字符)
  • 粘贴pPp 粘贴到光标后,P 粘贴到光标前)
  • 撤销u 撤销,Ctrl + r 重做
移动光标
  • 上下左右移动k 上,j 下,h 左,l
  • 跳到行首/行尾0 跳到行首,$ 跳到行尾
  • 跳到文件顶部/底部gg 跳到文件开头,G 跳到文件结尾

1.3 配置与自定义

VIM 配置文件为 .vimrc,可以通过修改该文件来定制 VIM 的行为,例如:

  • 设置自动缩进:set smartindent
  • 设置行号显示:set number

常用插件:

  • NERDTree:文件浏览器
  • ctrlp.vim:快速文件搜索

2. 文本处理工具

2.1 grep 命令

grep 是一个强大的文本搜索工具,用于从文件中查找符合条件的文本。

基本用法
grep 'pattern' filename
  • -i:忽略大小写
  • -r:递归查找目录中的文件
  • -v:反转匹配,即显示不包含指定模式的行
示例:
grep -r 'error' /var/log/

查找 /var/log/ 目录下包含 error 的日志文件。

2.2 cut 命令

cut 用于按列提取文本。

基本用法
cut -d ' ' -f 1 filename
  • -d:指定字段分隔符
  • -f:指定要提取的字段
示例:
cut -d ',' -f 1,3 filename.csv

提取 CSV 文件中第 1 列和第 3 列的数据。

2.3 sort 命令

sort 用于对文本行进行排序。

基本用法
sort filename

常用选项:

  • -n:按数字大小排序
  • -r:倒序排列
  • -u:去除重复行
示例:
sort -n data.txt

按数字大小排序 data.txt 文件中的内容。

3. 正则表达式

3.1 基本正则表达式(BRE)与扩展正则表达式(ERE)

  • 基本正则表达式(BRE):采用标准字符匹配。
  • 扩展正则表达式(ERE):包含更多的元字符和扩展功能,如 +? 等。

3.2 常用正则表达式模式

匹配任意字符
  • .:匹配任意字符(除换行符外)
字符类
  • [a-z]:匹配小写字母
  • \d:匹配数字
  • \w:匹配字母、数字或下划线
量词
  • *:匹配 0 次或多次
  • +:匹配 1 次或多次
  • ?:匹配 0 次或 1 次
  • {n,m}:匹配 n 到 m 次
示例:

匹配以 log 开头并且后面跟随任意字符的字符串:

^log.*

3.3 常见场景与技巧

查找以特定字符结尾的行
grep 'pattern$' filename
查找以特定字符开头的行
grep '^pattern' filename

4. 文件查看与操作工具

4.1 cat 命令

cat 用于查看文件内容,合并多个文件,或者将内容输出到标准输出。

示例:
cat file.txt

输出 file.txt 的内容。

4.2 nl 命令

nl 命令会在输出的文本中为每一行添加行号。

示例:
nl file.txt

4.3 diff 命令

diff 用于比较两个文件的差异。

示例:
diff file1.txt file2.txt

输出 file1.txtfile2.txt 之间的不同之处。

5. 常见命令组合使用案例

5.1 分析日志文件

假设你需要从大量的日志文件中提取特定时间段内的错误信息,并统计每种错误的出现频率。

例子:提取过去 24 小时的错误信息,并统计错误类型出现频率
grep 'ERROR' /var/log/syslog | grep "$(date --date='24 hours ago' '+%b %d')" | awk '{print $5}' | sort | uniq -c | sort -nr

步骤解析:

  1. grep 'ERROR' /var/log/syslog:从 /var/log/syslog 日志文件中提取所有包含 “ERROR” 的行。
  2. grep "$(date --date='24 hours ago' '+%b %d')":通过 date 命令获取过去 24 小时的日期,过滤出这些日期的日志行。
  3. awk '{print $5}':使用 awk 提取日志中的错误类型(假设错误类型在第 5 列)。
  4. sort:对提取的错误类型按字母排序。
  5. uniq -c:对排序后的错误类型进行去重并统计出现频率。
  6. sort -nr:按频率倒序排列错误类型,显示最常见的错误类型。

5.2 批量重命名文件

在生产环境中,尤其是文件管理系统中,常常需要对一批文件进行批量重命名。假设你有一组文件,文件名包含了日期(如 report_20230101.txt),你需要将它们的日期部分统一修改。

例子:批量修改文件名中的日期格式
for file in report_*.txt; do mv "$file" "$(echo $file | sed 's/2023/2024/')"; done

步骤解析:

  1. for file in report_*.txt:遍历当前目录下所有以 report_ 开头、.txt 结尾的文件。
  2. mv "$file" "$(echo $file | sed 's/2023/2024/')":使用 sed 替换文件名中的 20232024,然后执行 mv 命令重命名文件。

5.3 备份与压缩文件

假设你需要定期备份一个目录中的文件,并压缩成 .tar.gz 格式,保留一个完整备份和多个增量备份。

例子:备份并压缩文件
tar -czf /backup/full_backup_$(date +\%F).tar.gz /data

步骤解析:

  1. tar -czf /backup/full_backup_$(date +\%F).tar.gz:使用 tar 命令创建 .tar.gz 格式的压缩包,并通过 $(date +\%F) 生成以当前日期为文件名的压缩文件。
  2. /data:指定需要备份的目录。

如果是增量备份,可以使用 --listed-incremental 选项来创建增量备份。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2262422.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

面向预测性维护的TinyML技术栈全面综述

论文标题:A Holistic Review of the TinyML Stack for Predictive Maintenance(面向预测性维护的TinyML技术栈全面综述) 作者信息:Emil Njor, Mohammad Amin Hasanpour, Jan Madsen, Xenofon Fafoutis,均来自丹麦技术…

【MySQL】InnoDB引擎中的Compact行格式

目录 1、背景2、数据示例3、Compact解释【1】组成【2】头部信息【3】隐藏列【4】数据列 4、总结 1、背景 mysql中数据存储是存储引擎干的事,InnoDB存储引擎以页为单位存储数据,每个页的大小为16KB,平时我们操作数据库都是以行为单位进行增删…

【SpringAOP】深入浅出SpringAOP从原理到源码

AOP对象是如何创建的 对于熟悉Spring IOC流程源码的同学来说,一定了解bean的整个生命周期,也就是从实例化、属性填充、初始化三个过程。那么对于Bean 工厂来说,是如何保证需要创建代理的对象创建代理的呢。 从图中可以看到,本质…

VMware虚拟机Ubuntu 18.04版本 磁盘扩容

一、版本配置 虚拟机版本:VMware WORKSTATION 16 PRO Ubuntu版本:Ubuntu 18.04 二、磁盘大小介绍 目的:磁盘扩容(20G----->100G),从20G扩到100G 查看磁盘大小命令:df -h 扩容前的磁盘大小 …

QT多线程(二):基于互斥锁与读写锁的线程同步

此处需要说明的是,这里的线程同步概念与操作系统中的线程同步并无区别,都是避免多个线程同时访问临界区数据可能产生的读写错误问题。在 Qt 中,有多个类可以实现线程同步的功能,这些类包括 QMutex、QMutexLocker、 QReadWriteLock…

【ChatGPT】解锁AI思维链:如何让机器像人类一样思考?

在人工智能领域,我们一直在追求让机器像人类一样思考。然而,即使是最先进的AI,也常常被诟病缺乏“常识”,难以理解复杂问题,更不用说像人类一样进行逻辑推理和解决问题了。最经常的表现就是遇到不会的地方,…

重新定义页签!Choerodon UI Tabs让管理更高效

01 引言 Tabs 组件通过提供平级区域,将大块内容进行有效的收纳和展现,从而保持界面整洁。但在企业应用的快速发展中,这样传统的页签组件已无法满足我们对界面布局和个性化展示的追求。Choerodon UI Tabs 组件通过支持多级分组、个性化配置、…

机器学习之偏差

机器学习中的偏差(Bias)是指模型的预测值与真实值之间的系统性误差,或者说模型无法准确捕捉数据中复杂模式的能力。偏差通常与模型的假设或学习能力有关,过高的偏差会导致模型的性能不佳,表现为欠拟合。 偏差的来源 模…

SSH连接监控以及新用户创建和系统资源访问限制

目录 监控连接数SSH连接数的限制和影响理论限制可能的影响 创建SSH新用户为每个ssh用户配置系统资源限制1. 使用 /etc/security/limits.conf 限制资源2. 使用 cgroups 控制资源3. 磁盘配额限制4. 限制 SSH 访问5. 使用 PAM 限制6. 监控脚本示例7. 设置定期任务清理8. 检查配置是…

测试工程师八股文04|计算机网络 和 其他

一、计算机网络 1、http和https的区别 HTTP和HTTPS是用于在互联网上传输数据的协议。它们都是应用层协议,建立在TCP/IP协议栈之上,用于客户端(如浏览器)和服务器之间的通信。 ①http和https的主要区别在于安全性。http是一种明…

单片机学习笔记——入门51单片机

一、单片机基础介绍 1.何为单片机 单片机,英文Micro Controller Unit,简称MCU 。内部集成了中央处理器CPU、随机存储器ROM、只读存储器RAM、定时器/计算器、中断系统和IO口等一系列电脑的常用硬件功能 单片机的任务是信息采集(依靠传感器&a…

【青牛科技】D8563是低功耗的CMOS实时时钟/日历电路,它提供一个可编程时钟输出,一个中断输出和掉电检测器,所有的地址和数据通过IC总线接口串行传递。

概述: D8563是低功耗的CMOS实时时钟/日历电路,它提供一个可编程时钟输出,一个中断输出和掉电检测器,所有的地址和数据通过IC总线接口串行传递。最大总线速度为400Kbitss每次读写数据后,内嵌的字地址寄存器会自动产生增量。 主要特…

安卓获取所有可用摄像头并指定预览

在Android设备中,做预览拍照的需求的时候,我们会指定 CameraSelector DEFAULT_FRONT_CAMERA前置 或者后置CameraSelector DEFAULT_BACK_CAMERA 如果你使用的是平板或者工业平板,那么就会遇到多摄像头以及外置摄像头问题,简单的指…

R语言学习笔记-1

1. 基础操作和函数 清空环境:rm(list ls()) 用于清空当前的R环境。 打印输出:print("Hello, world") 用于输出文本到控制台。 查看已安装包和加载包: search():查看当前加载的包。install.packages("package_na…

Windows如何安装go环境,离线安装beego

一、安装go 1、下载go All releases - The Go Programming Language 通过网盘分享的文件:分享的文件 链接: https://pan.baidu.com/s/1MCbo3k3otSoVdmIR4mpPiQ 提取码: hxgf 下载amd64.zip文件,然后解压到指定的路径 2、配置环境变量 需要新建两个环境…

Mac上使用ln指令创建软链接、硬链接

在Mac、Linux和Unix系统中,软连接(Symbolic Link)和硬连接(Hard Link)是两种不同的文件链接方式。它们的主要区别如下: 区别: 硬连接: 不能跨文件系统。不能链接目录(为…

Unity A*算法实现+演示

注意: 本文是对基于下方文章链接的理论,并最终代码实现,感谢作者大大的描述,非常详细,流程稍微做了些改动,文末有工程网盘链接,感兴趣的可以下载。 A*算法详解(个人认为最详细,最通俗易懂的一…

博弈论3:图游戏SG函数(Graph Games)

目录 一、图游戏是什么 1.游戏特征 2.游戏实例 二、图游戏的必胜策略 1.SG 函数(Sprague-Grundy Function) 2.必胜策略(利用SG函数) 3.拿走游戏转化成图游戏(Take-away Game -> Graph Game) 一、图…

0101多级nginx代理websocket配置-nginx-web服务器

1. 前言 项目一些信息需要通过站内信主动推动给用户,使用websocket。web服务器选用nginx,但是域名是以前通过阿里云申请的,解析ip也是阿里云的服务器,甲方不希望更换域名。新的系统需要部署在内网服务器,简单拓扑图如…

qt-C++笔记之自定义类继承自 `QObject` 与 `QWidget` 及开发方式详解

qt-C笔记之自定义类继承自 QObject 与 QWidget 及开发方式详解 code review! 参考笔记 1.qt-C笔记之父类窗口、父类控件、对象树的关系 2.qt-C笔记之继承自 QWidget和继承自QObject 并通过 getWidget() 显示窗口或控件时的区别和原理 3.qt-C笔记之自定义类继承自 QObject 与 QW…