字节终面,一道Linux题难住我了

news2024/9/21 19:01:41

以下是一道难道系数中高并且高频出现的linux面试题,题目具体要求如下:

linux面试题:

某文件有多列数据,空格隔开,统计第n列单词,打印出现频率最高的5个单词。

解答这道面试题需要用到3个linux命令,分别是awksortuniq

命令1:awk

接下来我们一起复习awk命令的基本语法

awk命令:awk是对文本进行格式化处理的工具,适合做比较复杂的格式话处理

awk命令格式

 命令格式说明:

  • options需要替换成相应的参数;

  • Pattern[Action] 模式以及相应的动作

  • file1,file2,......待格式化处理的文件

命令的必填项如下:

awk '{Action}' file1,file2,......

也就是说,命令中一定要含有Action和file

awk可以将1个或多个文件按照一定的模式匹配出目标结果信息,然后再做动作Action,做什么动作呢?比较常见的就是打印。

1、Action

最常用的是print,默认以空白字符分隔

$0代表整行;$1代表第1段;$2代表第2段;依次类推;$NF代表最后一个字段,多个段落间用逗号分隔符分隔。

2、options参数

默认以空格作为分隔符展示结果信息,可以通过-F选项来指定分隔符

3、awk变量

FS 表示输入字段分隔符,默认是空格字符,一般需要加-v

OFS 表示输出字段分隔符,默认是空格字符,一般需要加-v

NF 表示分隔后的字段数量

NR 表示当前行的行号

awk变量如何用呢?用在awk语法的模式Pattern这部分。

Pattern模式

模式就是条件,也就是说,符合过滤条件的行,awk才会进行格式化处理。

Pattern模式可选性

如果要做高级过滤处理,需要使用Pattern模式

 

 命令2:sort

sort是linux的排序命令

sort将文件的每一行作为一个单位,互相比较,比较原则是从首个字符向后,依次按ASCII码值进行比较,最后将它们按升序输出

  • -r   reverse 反向排序
  • -n   number 按照数字进行排序,默认数字会被当做字符串进行比较

 

 

 

命令3:uniq

接下来我们一起复习uniq命令的基本语法。

uniq是linux的去重命令

uniq用于去除有序文件中的重复(相邻、连续的)行并将结果进行标准输出。

uniq经常和sort结合,为了使uniq起作用,所有的重复行必须是相邻的

  • -c 显示行出现的次数   

 

 

 

         

说明:不连续内容先排序然后再去重

 

 

 

 面试题解析   

linux面试题:

某文件有多列数据,空格隔开,统计第n列单词,打印出现频率最高的5个单词。

假设,某文件名为a.log

假设,第n列为第3列

解题思路如下:

1,格式化输出文件第3列

2,对格式化后文件进行排序,然后去重

 

3,对排序去重后文件进行倒序排序,并统计出现频率最高的5个单词

 

其他类似的词频统计题 就可以套用咱们这个linux命令。 

软件测试面试题合集

我们进阶学习自动化测试必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有字节大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

这份文档,对于想从事【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴我走过了最艰难的路程,希望也能帮助到你!点击下方小卡片均可以分享。 

 

 

 

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/359576.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring @Asyn使用不当引起OOM

问题 生产环境偶尔出现pod重启,排查后发现是因为发生了OOM,才导致pod重启的。 查看日志,有如下错误 报错信息中描述为无法创建新的本地线程,根据堆栈的上线文,发现是因为异步接口使用了SimpleAsyncTaskExecutor执行器…

x79主板M.2无法识别固态硬盘

问题描述: 这几天在装电脑,买了块M.2接口固态硬盘。装上去始终无法读取到硬盘,一开始以为是寨板Bios问题不支持M.2的设备。更新了最新的BIOS然后还是没有识别出来,然而将日常用的电脑PM510硬盘装上发现可以识别,而且日常用电脑也…

KeePass敏感信息明文传输漏洞复现 (CVE-2023-24055)

一、漏洞描述 漏洞简述 KeePass 是一款免费的开源密码管理器,可帮助您以安全的方式管理您的密码。您可以将所有密码存储在一个数据库中,该数据库由一把万能钥匙锁定。因此,您只需记住一个主密钥即可解锁整个数据库。数据库文件使用目前已知…

python元类编程

1.1.propety动态属性 在面向对象编程中,我们一般把名词性的东西映射成属性,动词性的东西映射成方法。在python中他们对应的分别是属性self.xxx和类方法。但有时我们需要的属性需要根据其他属性动态的计算,此时如果直接使用属性方法处理&…

复习C语言过程中的总结与思考(万字长文 + 思维导图,强烈建议收藏)

内容长文,多图预警!!!一、C语言的数据类型和读取标准1. C语言中整数型**常量**的数据类型为int类型,例子如下:2. C语言中浮点数型常量的数据类型为double类型二、C语言中的输入输出及位运算符1、scanf函数缓…

关于微服务架构的思考

引言 众所周知微服务已经经过了炒作周期的兴奋阶段,但并不是说它现在过时了。微服务架构算是笔者过往印象比较深的项目之一。并且,即使作为行业的最佳实践,但也能看到各种各样失败的案例。所以今天想跟大家分享一下关于微服务相关深度思考的…

【服务器数据恢复】多块磁盘离线导致RAIDZ崩溃的数据恢复案例

服务器数据恢复环境: SUN ZFS系列某型号存储阵列; 40块磁盘组建的存储池(其中4块磁盘用作全局热备盘),池内划分出若干空间映射到服务器使用; 服务器使用Windows操作系统。 服务器故障: 服务器在…

一文讲解thop库计算FLOPs问题

问题 计算模型的FLOPs及参数大小 FLOPS是处理器性能的衡量指标,是“每秒所执行的浮点运算次数”的缩写。 FLOPs是算法复杂度的衡量指标,是“浮点运算次数”的缩写,s代表的是复数。 一般使用thop库来计算,GitHub: h…

c++ 那些事 笔记

GitHub - Light-City/CPlusPlusThings: C那些事 1. ① extern extern关键字,C语言extern关键字用法详解 如果全局变量不在文件的开头定义,其有效的作用范围只限于其定义处到文件结束。如果在定义点之前的函数想引用该全局变量,则应该在…

45个写规范代码的小技巧

目录 1、规范命名 2、规范代码格式 3、写好代码注释 4、try catch 内部代码抽成一个方法 5、方法别太长 6、抽取重复代码 7、多用return 8、if条件表达式不要太复杂 9、优雅地参数校验 10、统一返回值 11、统一异常处理 12、尽量不传递null值 13、尽量不返回null值…

BN、SyncBN、IN、LN、GN学习记录

1 BatchNormBN的原理BN是计算机视觉最常用的标准化方法,它沿着N、H、W维度对输入特征图求均值和方差,随后再利用均值和方差来归一化特征图。计算过程如下图所示,1)沿着通道维度计算其他维度的均值;2)沿着通…

numpy入门

目录: numpy数据类型numpy维度numpy常用操作 numpy数据类型 numpy的数据类型是numpy.ndarray,它不同于python的array.array,ndarray可以处理多维数据。ndarray的常见属性有dtype,shape,size等,在进行一些…

接口自动化测试框架-Python+Requests+Yaml

零代码极限封装的【接口自动化测试框架】,目前已经完全能够实现真正的零代码落地并在企业中推广。其中用到的最核心的封装技术如下:核心技术1.热加载封装,是全网最早应用于自动化测试框架的封装技术。2.Requests统一请求封装3.接口关联封装以及接口关联封…

微服务03 分布式搜索引擎 elasticsearch ELK kibana RestAPI RestClient

分布式搜索引擎01-- elasticsearch基础0.学习目标1.初识elasticsearch1.1.了解ES1.1.1.elasticsearch的作用elasticsearch是一款非常强大的开源搜索引擎,具备非常多强大功能,可以帮助我们从海量数据中快速找到需要的内容例如:在GitHub搜索代码…

【Python】带你进入字典的世界

如约而至,紧接着上一期文章,小编将会陆续把全套的Python笔记将依次发放给大家,便于大家学习Python、期末备考、巩固基础等(这几期是公众号小插曲,后期发放编程技术的话主要还是会围绕Java来展开~感谢大家支持)字典字典是Python内置…

鸿翼企业网盘 激活企业协作办公

信息化的发展,使企业网盘成为了许多企业必备的“数字基础设施”。鸿翼企业网盘,让网盘不仅是数据存储的“仓库”,更是数据利用的“中枢”,以网盘为载体,激活企业“协作力”。 企业网盘起初是为了解决企业内数据统一存储…

基于SpringBoot+MyBaits_Vue+ElementUi构建项目

基于SpringBootMyBaits_VueElementUi构建项目 1.Spring Boot 后台搭建 1.1.项目初始化 前期准备:maven,jdk(1.8),idea 1.1.1.下载地址 Spring官方提供了Springboot自定义配置地址,可依照相关选项搭建所…

6.4 实战:实现 Web API 版本控制

第6章 构建 RESTful 服务 6.1 RESTful 简介 6.2 构建 RESTful 应用接口 6.3 使用 Swagger 生成 Web API 文档 6.4 实战:实现 Web API 版本控制 6.4 实战:实现 Web API 版本控制 如果业务需求变更,Web API 功能发生变化时应该如何处理呢&…

易错:List中的add方法添加对象时出现重复的问题

错误&#xff1a; 用list存储User对象信息&#xff0c;当存储多个对象时&#xff0c;发现存储的数据都是一样的 之前代码&#xff1a; User user new User();List<User> list new ArrayList<>();for (int i 0; i < 5; i) {user.setName("Tom"i);…

drf-yasg —— Django REST Framework 文档生成

drf-yasg —— Django REST Framework 文档生成 drf-yasg 安装及全局配置 安装以及这个官方文档非常详细的描述了&#xff0c;我就不多说了。 配置好并运行 Django 项目以后&#xff0c;就可以使用浏览器访问 /swagger/ 和 /redoc/ &#xff08;链接取决于你的 urls 的配置&am…