文本三剑客之——Awk

news2025/1/8 6:00:12

Awk

  • Awk简介
    • Awk语法格式
    • Awk常见内置变量
    • Awk实例演示
      • 按行输出文本
      • BEGIN模式和END模式
      • 按字段输出文本
      • 通过管道,双引号调用shell命令
      • date 的用法
      • getline的用法
      • awk数组==

Awk简介

  • Awk是一个功能强大的编辑工具,用于在Linux/UNIX 下对文本和数据进行处理。
  • 数据可以来自一个或多个文件,也可以为其他命令的输出,常作为脚本来使用。
  • 在执行操作时,Awk逐行读取文本,默认以空格为分隔符进行分隔,将分隔所得的各个字段保存到内建变量中,对比该行是否与给定的模式相匹配,并按模式或者条件执行编辑命令,也可从脚本中调用编辑指令过滤输出相应内容。
  • sed命令常用于一整行的处理,而awk比较倾向于将一行分成多个“字段”然后再进行处理。awk信息的读入也是逐行读取的,执行结果可以通过print的功能将字段数据打印显示。在使用awk命令的过程中,可以使用逻辑操作符“&&”表示“与”、“||”表示“或”、“!”表示“非”;还可以进行简单的数学运算,如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方。

Awk语法格式

  • 第一种:awk 【选项】 ‘模式或条件 {编辑指令}’ 文件1 文件2

  • 第二种:awk -f 脚本文件 文件1 文件2

  • awk -F"分隔符" ‘条件 {print $0, 2 , 2, 2,NF}’ 文件。。。

  • 条件:按行号 NR==xx,(>,>=,<,<=,) 也可以使用 (&& 与 , || 或, !非。)

  • 按内容 /字符串/ 或 /正则表达式/ 或$n==”字符串“,

    • !=:不等于
    • ~:包括
    • !~:不包括
    • <,<=,>,>=,!=,分别为小于,小于等于,大于,大于等于,不等于。

在Awk语句中,模式部分决定何时对数据进行操作,若省略则后续动作时刻保持执行状态,模式可以为条件语句、复合语句或正则表达式等。每条编辑指令可以包含多条语句,多条语句之间要使用分号或者空格分隔的的多个{}区域。常用选项 -F 定义字段分隔符,默认以空格或者制表符作为分隔符。

Awk常见内置变量

Awk提供了很多内置变量,经常用于从处理文本。

变量描述
FS指定每行文本的字段分隔符
NF当前处理的行的字段个数
NR当前处理的行的行号(序数)
$0当前处理的行的整行内容
$n当前处理行的第n个字段(第n列)
FILENAME被处理的文件名
RS行分隔符。awk从文件上读取资料时,将根据RS的定义把资料切割成许多条记录,而awk一次仅读入一条记录,以进行处理。预设值是’\n’

Awk实例演示

按行输出文本

awk ’{print $0}‘ 或 awk ‘{print}’ ##全行输出
在这里插入图片描述
awk ‘NR==a{print}’##输出指定行a
awk 'NR=='a,NR==b{print} ##指定输出行a到行b之间的所有行
awk ‘NR==a || NR==b{print}’ ##指定输出行a和行b
在这里插入图片描述
awk ‘(NR%2)==1{print}’ ##输出所有奇数行的内容
awk ‘(NR%2)==0{print}’ ##输出所有偶数行的内容
在这里插入图片描述
awk ‘/字符串/{print}’ ##输出所有包含字符串的行
awk ‘/正则表达式/{print}’ ##输出所有正则匹配到的行
在这里插入图片描述

BEGIN模式和END模式

BEGIN模式:在处理指定文本之前,需要先执行BEGIN模式中指定的动作;awk在处理指定的文本,之后再执行END模式中指定的动作,END{}语句块中,往往会放入打印结果等语句。
例:
利用awk统计passwd文件中以/bin/bash结尾的行数。
awk ‘BEGIN {a=0};//bin/bash$/ {a++};END {print a}’ /etc/passwd
在这里插入图片描述

按字段输出文本

awk -F: ‘{print $1}’ ##-F设置分割符为:然后输出第一列内容
在这里插入图片描述
awk -F: ‘{print $1,$3}’ ##-F设置分割符为:然后输出第一列和第三列内容

在这里插入图片描述

awk -F “:” ‘$3<5{print $1,$3}’ /etc/passwd #输出第3个字段的值小于5的第1、3个字段内容
在这里插入图片描述

awk -F “:” ‘!($3>8){print}’ /etc/passwd #输出第3个字段的值不大于8的行
在这里插入图片描述
分隔符的另一种设置方式:BEGIN {FS=字符},用 if 语句进行条件判断时需要再外边在加一个大括号{}
在这里插入图片描述

awk ‘{三元运算符表达式;{操作}}’ ##awk也可以使用三元表达式

三元运算符表达式:条件表达式?值1:值2;##满足条件表达式取值1不满足则取值2
在这里插入图片描述

awk -F “:” ‘{print NR,$0}’ ##输出每行内容和行号,每处理完一条记录,NR值加1
在这里插入图片描述

awk -F: ‘$7~“bash” {print}’ ##输出第七列包含bash字符串的行
在这里插入图片描述

NF表示本行长度,再第一列中包含root字符&&同时NF==7表示长度为7,满足要求的行输出
在这里插入图片描述

通过管道,双引号调用shell命令

RS可以修改行分隔符
在这里插入图片描述
{print | “wc -l”} ##管道命令可以加到大括号里面,要加双引号
在这里插入图片描述
在这里插入图片描述

计算当前内存使用百分比
在这里插入图片描述

查看当前Cpu空闲率
在这里插入图片描述

date 的用法

date -d 指计算日期
month 控制月 1就是加一月 -1就是减一月
day 控制天 同month
在这里插入图片描述

getline的用法

当getline左右有重定向符“<”或“|”时,getline表示将传过来的内容进行分行,可以让awk每一行的去读取操作。

在这里插入图片描述
在这里插入图片描述
当getline左右无重定向符“<”或“|”时,awk首先读取到了第一行,就是1,然后getline,就得到了1下面的第二行,就是2,因为getline之后,awk会改变对应的NF,NR,FNR和$0等内部变量,所以此时的$0的值就不再是1,而是2了,然后将它打印出来。

在这里插入图片描述

NR与FNR的区别
在这里插入图片描述
OFS
$1=$1 是用来激活$0的重新赋值,也就是说 字段$1…和字段数NF的改变会促使awk重新计算$0的值,通常是在改变OFS后而需要输出$0时这样做
在没重新赋值前$0没有变化

在这里插入图片描述

awk数组==

PS1:BEGIN中的命令只执行一次
PS2:awk数组的下标除了可以使用数字,也可以使用字符串,字符串需要使用双引号

在这里插入图片描述

用awk数组去重
在这里插入图片描述
每一行字符串都定义为一个下标每次执行到相同字符串的行下标的值就会+1这样就可以知道有多少重行了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/530275.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

代码随想录算法训练营第六天|242.有效的字母异位词 、349. 两个数组的交集 、202. 快乐数、1. 两数之和

哈希表的表示方式&#xff1a;数组、set、map 数组&#xff1a;范围可控的情况下&#xff0c;可以用数组 set&#xff1a;哈希值较大的情况下&#xff0c;或数值分布很分散的情况 map&#xff1a;key 和 value对应的情况下 能用数组尽量用数组&#xff0c;因为数组会比较快&…

Netty内存管理

关键概念 PoolArena——内存管理的统筹者 PoolArena是内存管理的统筹者。它内部有一个PoolChunkList组成的链表 PoolChunkList——对PoolChunk的管理 PoolChunkList内部有一个PoolChunk组成的链表。通常一个PoolChunkList中的所有PoolChunk使用率(已分配内存/ChunkSize)都在…

机器学习算法分类

机器学习常用算法的分类&#xff1a; 根据数据集组成不同&#xff0c;可以把机器学习算法分为&#xff1a; 监督学习无监督学习半监督学习强化学习 1、监督学习 - 定义&#xff1a; - 输入数据是由输入特征值和目标值所组成 - 函数的输出可以是一个连续的值&#xff08;称为回…

【文本三剑客】AWK

AWK 一、AWK的工作原理1.1命令格式1.2awk常见的内建变量 二、awk实验2.1按行输入文本2.2按字段输出文本2.3通过管道符、双引号调用shell命令 一、AWK的工作原理 逐行读取文本&#xff0c;默认以空格或tab键为分隔符进行分隔&#xff0c;将分隔所得的各个字段保存到内建变量中&…

银行数字化转型导师坚鹏:银行数字化转型面临的5大机遇与4大挑战

在机遇方面&#xff0c;主要面临以下5大机遇&#xff1a; 国家战略及政策机遇&#xff1a;乡村振兴战略、制造强国战略、绿色金融战略等战略的落实将会给银行数字化转型带来新的业务机遇&#xff0c;《中国银保监会关于推动银行业和保险业高质量发展的指导意见》、《关于银行业…

第五章 面向对象-4abstract抽象

1.4 abstract class抽象类 声明抽象类&#xff0c;使用关键字abstract //内部匿名类 Db db new Db(){ };3.了解抽象类 抽象方法 AbstractClassMain.java /** Copyright (c) 2017, 2023, zxy.cn All rights reserved.**/ package cn.practice2;/*** <p>Description:&…

Chatgpt中文版无需代理,ChatGPT镜像

Chatgpt中文版无需代理 网站ChatGPT中文版 ChatGPT中文版是一个基于人工智能技术的聊天机器人&#xff0c;它可以模拟人类的自然语言交互&#xff0c;回答用户的各种问题和提供各种服务。它的核心技术是GPT&#xff08;Generative Pre-trained Transformer&#xff09;模型&am…

基础:Android相关基础知识

目录 1.Android 四大组件 2.Activity生命周期 3.Service的生命周期 4.Service的启动方式 5.Activity的启动模式 6.广播的分类 7.ANR是什么&#xff0c;怎么避免&#xff1f; 8.Handler消息处理机制 9.事件分发机制 10.View绘制流程 11.Binder机制 12.进程间通信 1…

2023最新一键开通主机免费源码

更新了ui 自助开通主机&#xff0c;自己修改服务器 不带接口&#xff0c;不带接口&#xff0c;不带接口 打开api.php文件&#xff0c;把8.8.8.8改服务器ip&#xff0c;123456改成你的密钥 前往我的技术博客查看更多https://202271.xyz/?zhuji 蓝奏云链接 https://wwp.lanz…

如何在Linux中显示网络连接、路由表、接口统计等信息?Netstat了解一下!

Netstat 是一个用于显示网络连接、路由表、接口统计等信息的命令行工具。它在 Linux 和其他类 Unix 系统中都有提供&#xff0c;可以帮助我们分析和诊断网络问题。本文将介绍 Netstat 命令的基本用法和常见选项。 Netstat 命令的语法 Netstat 命令的基本语法如下&#xff1a; …

rtl仿真器-ghdl安装和测试

安装 sudo add-apt-repository ppa:pgavin/ghdl sudo apt-get update sudo apt-get install ghdl gtkwave仿真 rtl add.v library ieee; use ieee.std_logic_1164.all; entity ADD is port (A,B:in bit; SUM,CARRY:out bit); end entity ADD; architecture behave of ADD i…

前端部署vue项目到腾讯云服务器

先把dist包上传服务器 可以使用宝塔、FileZilla、手动上传等等方式 已有腾讯云服务器之后进入面板界面 然后安装Nginx 请一步一步&#xff0c;紧跟步骤 第一步 安装gcc-c 编译器。nginx依赖的 pcre 和 zlib 包 yum -y install gcc zlib zlib-devel pcre-devel openssl openss…

嵌入式通信协议【Modbus】Modbus功能码的详细描述

一、读功能码 1、 01 (0x01)读线圈 在一个远程设备中&#xff0c;使用该功能码读取线圈的 1 至 2000 连续状态。请求 PDU 详细说明了起始地址&#xff0c;即指定的第一个线圈地址和线圈编号。从零开始寻址线圈。因此寻址线圈 1-16 为 0-15。 根据数据域的每个比特将响应报文…

vs 推送代码 之 gitee

我们常常想将自己的代码放入到代码管理工具中&#xff0c;接下来我们将讲解如何去将vs中的代码放入到代码管理工具中 目的&#xff1a;将vs中的项目代码放入到gitee中 首先&#xff1a; 我们需要注册一下gitee的账号&#xff0c;官网&#xff1a;gitee官网 辅助工具&#xff…

做网络那么多年,连以太网接口和串口都分不清?本文值得一看!

路由器是一种网络设备&#xff0c;它的主要功能是在不同的网络之间转发数据包&#xff0c;实现网络互联。路由器根据数据包的目的地址&#xff0c;选择最佳的路径&#xff0c;将数据包发送到下一跳。路由器可以连接不同的网络类型&#xff0c;如以太网、帧中继、PPP等。 路由器…

JavaWeb_Mysql_多表设计与查询

JavaWeb_Mysql_多表设计与查询 多表设计外键约束物理外键 -- 不推荐逻辑外键 多表关系实现 多表查询数据准备内连接外连接子查询标量子查询列子查询行子查询表子查询 案例数据准备案例需求 来源 多表设计 外键约束 物理外键 – 不推荐 概念: 使用foreign key定义外键关联另外…

关于网络命令 ping 你了解多少

1、介绍 Ping(Packet Internet Groper)是 Windows、Unix 和 Linux系统下的一个命令。ping 也属于一个通信协议&#xff0c;是 TCP/IP 协议的一部分。   Ping的运作原理是向目标主机传出一个 ICMP&#xff08;Internet Control Messages Protocol&#xff09;即因特网信报控制…

Linux内核的源码目录结构和配置体系

1.linux内核源码目录结构1 1.1、源码从哪里来 (1)我们使用2.6.35.7版本的内核。这个版本的内核有三种&#xff1a;第一种是kernel.org上的官方版本&#xff0c;第二种是三星移植过的&#xff0c;第三种是九鼎X210的移植版本。这里使用第三个。 (2)进入源码目录下&#xff0c…

《QT+PCL》点云配准进阶——GROR配准

《QT+PCL》点云配准进阶——GROR配准 一、展示效果二、ui设计三、代码3.1添加代码一、展示效果 根据之前的文章GROR复现,今天将其集成到QT软件中 二、ui设计 三、代码 3.1添加代码 qt的头文件、源文件依旧添加相关代码 其中,如果有函数冲突,改成内联函数,添加inline<…

【系统移植】开发板的启动过程

目录 1、开发板启动相关部件 2、开发板启动过程&#xff08;以 EMMC 启动为例&#xff09; (1) 运行 BL0&#xff08;初始化&#xff09; (2) 加载 uboot 引导程序 (3) 加载 linux 镜像、设备树、根文件系统 3、SD卡的存储结构 1、开发板启动相关部件 下面是一个简单的开…