本文介绍的是在Linux下实现统计文件单词个数和出现次数,以及实践过程中遇到的gcc编译器不匹配问题
一、实现文件单词个数统计
#include <stdio.h>
#define IN_Word 1
#define OUT_Word 0
#define INIT OUT_Word
int splite(char c){
if ((c==' ') || (c=='\n') || (c=='\t') || (c == '\"') || (c == '\'') || (c == '+')|| (c == '-')|| (c == ',')
|| (c == ';'))
return 1;
else
return 0;
}
int countWord(char* fileName){
//定义初始状态
int status=INIT;
int count=0;
//以只读方式打开文本
FILE *file=fopen(fileName,"r");
if (file == NULL) return -1;
char c;
//读取文本,判断处于何种状态
while ((c = fgetc(file)) != EOF){
if ( splite(c)){
status=OUT_Word; //处于单词之外,更新状态为OUT_Word
}
else if (OUT_Word==status){
//处于单词之内,更新状态为IN_Word。记录每次状态更新的次数(OUT -> IN),也就是单词个数
status=IN_Word;
count++;
}
}
return count;
}
int main(int argc,char*argv[]){
if (argc<2) return -1;
printf("word:%d\n",countWord(argv[1]));
}
// int main(){
// printf("word:%d\n",countWord("b.txt"));
// }
执行编译执行命令
gcc -o countWord countWord.c
./countWord b.txt
二、实现文件单词出现次数统计
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
typedef struct{
char str[50]; //单词最大长度设为50
int cnt;//单词出现次数
}Str;
void countWordNum(char* fileName){
char tmp[50];
Str words[200]; //单词数量上限
int num=0;//实际单词数量
int i,j,neww=1;//neww标志位,判断是否为新单词
FILE *fp = fopen(fileName, "r");
//fscanf从文件中获取单个字符串
while ( fscanf(fp,"%s",tmp)!=EOF ) {
neww=1;
for (i=0; i<num; i++) {
//重复的单词
if ( strcmp(tmp, words[i].str)==0 ) {
neww=0;
words[i].cnt++;
}
}
if (neww){
// 复制字符串
for (j=0; tmp[j]!='\0'; j++) {
words[num].str[j] = tmp[j];
}
//单词末尾添加结束符
words[num].str[j] = '\0';
// 新单词数量+1
words[num++].cnt = 1;
}
}
printf("一共%d个不同的单词,每个单词出现次数如下:\n",num);
for (int i=num-1; i>=0; i--) {
printf("%-10s %2d\n", words[i].str, words[i].cnt);
}
fclose(fp);
}
int main(int argc,char*argv[]){
if (argc<2) return -1;
countWordNum(argv[1]);
}
// int main() {
// countWordNum("b.txt");
// return 0;
// }
三、出现的问题
在linxu系统中,编写c语言程序我们需要使用到GCC编译器。但是当编译程序,出现如下错误
主要原因可能是因为修改软件下载源地址的时候没有考虑系统版本。选择了错误的系统版本,导致下载的gcc编译器不匹配。
解决办法如下:
1、查看系统代号
打开终端,输入下列命令:lsb_release -a
,然后结果如下图
Codename的值 focal 即为系统代号。我们先暂时记录该系统代号。
2、检查源地址系统代号是否正确
在终端中输入:sudo vim /etc/apt/sources.list
在弹出的文本编辑器中,检查源地址中的系统代号是否与第一步中的代号一致。
一般出现上述错误都是这里出了问题。只要把它修改为自己的系统代号问题就可以解决了。
我这边都修改为了 xenial
3,在终端执行sudo apt-get update
进行更新
4、配置完成后,卸载原来已经安装的gcc,然后重新安装就可以使用了。
sudo apt-get remove gcc
5、重新安装gcc
sudo apt-get install gcc