3. Linux下实现统计文件单词个数和出现次数

news2025/1/18 11:08:24

本文介绍的是在Linux下实现统计文件单词个数和出现次数,以及实践过程中遇到的gcc编译器不匹配问题

一、实现文件单词个数统计

#include <stdio.h>

#define IN_Word 1
#define OUT_Word 0
#define INIT OUT_Word

int splite(char c){
    if  ((c==' ') || (c=='\n') || (c=='\t') || (c == '\"') || (c == '\'') || (c == '+')|| (c == '-')|| (c == ',')
        || (c == ';'))
        return 1;
    else
        return 0; 
}

int countWord(char* fileName){
    //定义初始状态
    int status=INIT;
    int count=0;

    //以只读方式打开文本
    FILE *file=fopen(fileName,"r");
    if (file == NULL) return -1;

    char c;
    //读取文本,判断处于何种状态
    while ((c = fgetc(file)) != EOF){
        if ( splite(c)){
            status=OUT_Word;  //处于单词之外,更新状态为OUT_Word
        }
        else if (OUT_Word==status){  
            //处于单词之内,更新状态为IN_Word。记录每次状态更新的次数(OUT -> IN),也就是单词个数
            status=IN_Word;
            count++;
        }
    }
    return count;
}

int main(int argc,char*argv[]){
    if (argc<2) return -1;
    printf("word:%d\n",countWord(argv[1]));
}

// int main(){
//     printf("word:%d\n",countWord("b.txt"));
// }

执行编译执行命令

gcc -o countWord countWord.c
./countWord b.txt

二、实现文件单词出现次数统计

#include<stdio.h>
#include<string.h>
#include<stdlib.h>

typedef struct{
	char str[50]; //单词最大长度设为50
	int cnt;//单词出现次数
}Str;

void countWordNum(char* fileName){
    char tmp[50]; 
	Str words[200]; //单词数量上限 
	int num=0;//实际单词数量 
	int i,j,neww=1;//neww标志位,判断是否为新单词 

	FILE *fp = fopen(fileName, "r");
	//fscanf从文件中获取单个字符串 
	while ( fscanf(fp,"%s",tmp)!=EOF ) {
		neww=1;
		for (i=0; i<num; i++) {
			//重复的单词 
			if ( strcmp(tmp, words[i].str)==0 ) {
				neww=0;
				words[i].cnt++;
			}
		}
		if (neww){
			// 复制字符串
			for (j=0; tmp[j]!='\0'; j++) {
				words[num].str[j] = tmp[j];
			}
			//单词末尾添加结束符 
			words[num].str[j] = '\0';
			// 新单词数量+1 
			words[num++].cnt = 1;
		}
	}
    printf("一共%d个不同的单词,每个单词出现次数如下:\n",num);
	for (int i=num-1; i>=0; i--) {
		printf("%-10s %2d\n", words[i].str, words[i].cnt);
	}
	fclose(fp);
}

int main(int argc,char*argv[]){
    if (argc<2) return -1;
    countWordNum(argv[1]);
}

// int main() {
//     countWordNum("b.txt");
// 	return 0;
// }

三、出现的问题

在linxu系统中,编写c语言程序我们需要使用到GCC编译器。但是当编译程序,出现如下错误
在这里插入图片描述
主要原因可能是因为修改软件下载源地址的时候没有考虑系统版本。选择了错误的系统版本,导致下载的gcc编译器不匹配。
解决办法如下:
1、查看系统代号
打开终端,输入下列命令:lsb_release -a,然后结果如下图
在这里插入图片描述
Codename的值 focal 即为系统代号。我们先暂时记录该系统代号。
2、检查源地址系统代号是否正确
在终端中输入:sudo vim /etc/apt/sources.list
在弹出的文本编辑器中,检查源地址中的系统代号是否与第一步中的代号一致。
一般出现上述错误都是这里出了问题。只要把它修改为自己的系统代号问题就可以解决了。
我这边都修改为了 xenial
在这里插入图片描述
3,在终端执行sudo apt-get update进行更新

4、配置完成后,卸载原来已经安装的gcc,然后重新安装就可以使用了。
sudo apt-get remove gcc
5、重新安装gcc
sudo apt-get install gcc

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/554754.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ChatGPT ?、AI 和机器人,是为人类打工还是将取代人类?

随着ChatGPT引起全球热潮&#xff0c;我们看到这类AI大模型技术比较热门的落地领域聚焦在办公平台、家庭、电商营销、社交文娱等多个方向&#xff0c;又进一步向下渗透到生产和生活的各个环节。这些场景大多数聚焦于线上&#xff0c;涉及内容创作和交互方式变革两个方向&#x…

【全网首发】华秋CAM:免费Gerber查看器,离线版!

自华秋DFM可制造性和组装性分析软件上线以来&#xff0c;已为众多硬件工程师、PCB工程师、CAM工程师、电子爱好者、PCBA采购、SMT工厂等众多行业用户&#xff0c;解决了各种PCB设计隐患和规避各类生产风险等问题&#xff0c;并获得了30万用户的一致好评&#xff01; 现在&…

双非渣本测试,3个月逆袭字节,入职那天“泪目”了

个人背景情况 2017 年毕业于一所不知名双非本科大学&#xff0c;毕业时就有着一颗想进大厂的心&#xff0c;但又想留在成都&#xff0c;不愿意去北上广&#xff0c;现在其实相当后悔。当年在成都的大厂少之又少&#xff0c;再加上校招时非常努力地玩耍&#xff0c;导致投的几个…

全网独一份微服务架构深度解析,连京东师哥都熬夜也要看完

什么是微服务&#xff0c;为什么需要用微服务&#xff1f; 一、微服务是什么&#xff1f; 定义&#xff1a;微服务是一些协同工作的小而自治的服务&#xff0c;这个服务是高凝聚力和松散耦合的。 微服务有以下特征&#xff1a; 1.一组小的服务&#xff08;大写没有特别的标…

Linux之firewalld防火墙基础

目录 一、firewalld的简介 二、iptables与firewalld的联系与区别 1&#xff09;iptables与firewalld的联系 netfilter Firewalld/iptables 2&#xff09;iptables与firewalld的区别 区别一&#xff1a; 区别二&#xff1a; 区别三&#xff1a; 三、firewalld区域 1…

meta标签 http-equiv常用配置记录

meta标签 元素可提供有关页面的元信息&#xff08;meta-information&#xff09;&#xff0c;比如针对搜索引擎和更新频度的描述和关键词。 标签位于文档的头部&#xff0c;不包含任何内容。 标签的属性定义了与文档相关联的名称/值对。 属性 使用实例 禁止浏览器从本地机的缓…

涨姿势了,分享一个简单好用的源码调试方法

之前发了一篇文章&#xff0c;文章中有这样的一段描述&#xff1a; 然后有个读者来问我&#xff1a; 是怎么把 JDK 源码中的一行代码给注释掉的&#xff1f; 这个问题确实不错&#xff0c;属于一个偶尔用一下能起到奇效的源码调试技巧。所以我决定写个文章来说明一下这个问题。…

Mysql-存储过程简单入门

定义&#xff1a; 存储过程的英文是 Stored Procedure 。它的思想很简单&#xff0c;就是一组经过 预先编译 的 SQL 语句 的封装。 执行过程&#xff1a;存储过程预先存储在 MySQL 服务器上&#xff0c;需要执行的时候&#xff0c;客户端只需要向服务器端发出调用 存储过程的命…

管中窥豹!从冠德石油看数字化对加油站的影响力

从上个世纪90年代起&#xff0c;至2010年前后&#xff0c;是国内信息化建设的高速发展期。这段时间无论是应用软件、企业网站还是商业咨询&#xff0c;无不呈现井喷式发展。大多数企业和政府机关均完成了或多或少的信息化建设。IT带来了标准化、科学化的管理和运作模式&#xf…

keil5 #include“头文件”前面有红叉X,但编译不报错

问题 如图 编译不报错 解决办法 keil软件界面&#xff0c;第一行图标栏的最后有个扳手&#x1f527;符号&#xff0c;点开&#xff0c;点击“text completion ”标签页&#xff0c; 右侧“text template”栏选中#define&#xff0c;左边“dynamic syntax checking”栏里取…

软件测试面试题自动化面经分享——这才是高薪的秘诀!

Hello&#xff0c;你们的好朋友来了&#xff01;今天猜猜我给大家带来点啥干货呢&#xff1f;最近很多小伙伴出去面试的时候经常会被问到跟自动化测试相关的面试题。所以&#xff0c;今天特意给大家整理了一些经常被公司问到的自动化测试相关的面试题。停&#xff0c;咱先收藏起…

css之学好rem

1、先说说几个前端常用的几个单位的概论&#xff1a; 1、px (pixel&#xff0c;像素)&#xff1a;是一个虚拟长度单位&#xff0c;是计算机系统的数字化图像长度单位&#xff0c;如果px要换算成物理长度&#xff0c;需要指定精度DPI(Dots Per Inch&#xff0c;每英寸像素数)&am…

Qt软件打包后报错“无法定位程序输入点于动态链接库.exe上。”解决办法(超详细,看完不会怪我)

目录 前言 一、出现类似如下界面&#xff1a; 二、通过尝试分析&#xff0c;这个界面出现的原因是因为自己没有设置环境变量 三、其次右击打开主菜单&#xff0c;选择系统选项 四、选择右边的高级系统设置 五、点击环境变量 六、再系统变量里面找到Path路径 七、点击编辑添…

HOOPS全新文档系统上线!三维模型文件转换更便捷!

HOOPS 2023 U1版本已经正式发布&#xff0c;伴随新版本上线的还有全新的文档系统&#xff0c;新的文档系统亮点包括&#xff1a; 改进了样式和布局&#xff0c;使导航更加简单快捷&#xff1b;修订了导航结构&#xff0c;提高了产品相关信息的清晰度&#xff1b;SDK API参考章…

人员与叉车防撞预警方案

叉车是仓库重吨位运输设备&#xff0c;在工厂、港口、码头、物流企业等有着广泛的使用。然而&#xff0c;叉车事故频繁发生已经引起人们的广泛关注。多数叉车因为前方货物遮挡的视线盲区多&#xff0c;极容易发生事故&#xff0c;例如撞伤人或货架导致货物倒塌伤人&#xff0c;…

nodejs+vue高校教室自习室预约租赁系统

本次设计的主要任务是完成一个教室预约租赁管理系统网站&#xff0c;本系统主要分为普通用户与管理员两个角色, 能够实现登录注册&#xff0c;教室预约,教室租赁,用户管理&#xff0c;教室管理&#xff0c;教室预约等功能。主要分为前端页面设计和后端逻辑功能设计以及数据库设…

循环队列讲解,以及Java实现代码

目录 一.循环队列概念 二.队满和队空的情况 三.代码的实现 总结 &#x1f63d;个人主页&#xff1a; tq02的博客_CSDN博客-C语言,Java,Java数据结构领域博主 &#x1f308;梦的目标&#xff1a;努力学习&#xff0c;向Java进发&#xff0c;拼搏一切&#xff0c;让自己的未来…

SonarQube7.8 安装及使用

文章目录 SonarQube 使用手册一、简介1.1、概述1.2、实例组件 二、安装2.1、版本选型2.2、硬件要求2.3、安装2.3.1、解压SonarQube&汉化2.3.2、创建SonarQube数据库2.3.3、修改数据库连接2.3.4、创建SonarQube启动用户2.3.5、赋予启动用户执行权限2.3.6、相关报错解决2.3.7…

Python 框架学习 Django篇 (二) 视图

前面我们实现了一些基本的页面与后台交互的逻辑&#xff0c;但可能还是很迷糊&#xff0c;突然甩出来一些前端的程序是欺负我忘完了吗(某人自述)&#xff0c;还有request.POST 都是干啥的也没说清楚&#xff0c;这里就来详细了解一下 1、什么是视图 我们定义的任何同时包含如下…

网络安全盲目自学只会成为脚本小子?

一、网络安全学习的误区 1.不要试图以编程为基础去学习网络安全 不要以编程为基础再开始学习网络安全&#xff0c;一般来说&#xff0c;学习编程不但学习周期长&#xff0c;且过渡到网络安全用到编程的用到的编程的关键点不多。一般人如果想要把编程学好再开始学习网络安全往…