掘根宝典之C语言字符串输入函数(gets(),fgets(),get_s())

news2024/11/16 19:31:03

字符串输入前的注意事项

如果想把一个字符串读入程序,首先必须预留该字符串的空间,然后用输入函数获取该字符串

 这意味着必须要为字符串分配足够的空间

不要指望计算机在读取字符串时顺便计算它的长度,然后再分配空间(计算机不会这样做,除非你编写一个处理这些任务的函数)。

假设编写了如下代码:

char *name;
scanf("%s",name);

虽然可能会通过编译(编译器很可能给出警告),但是在读入name时,name可能会擦写掉程序中的数据或代码,从而导致程序异常中止。

因为scanf()要把信息拷贝至参数指定的地址上,而此时该参数是个未初始化的指针,name可能会指向任何地方。大多数程序员都认为出现这种情况很搞笑,但仅限于评价别人的程序时。
 

最简单的方法是,在声明时显式指明数组的大小:
 

char name[81];
scanf("%s",name);


现在name是一个已分配块(81字节)的地址。还有一种方法是使用C库函数来分配内存

为字符串分配内存后,便可读入字符串。C语言提供了许多读取字符串的函数:gets(),fgets(),gets_s()函数

gets()

特点

在读取字符串时,scanf()和转换说明%s只能读取一个单词。可是在程序中经常要读取一整行输入,而不仅仅是一个单词。许多年前,gets()函数就用于处理这种情况。

gets()函数简单易用,它读取整行的输入,直至遇到换行符,然后丢弃换行符,储存其余字符,并在这些字符的末尾添加一个空字符使其成为一个C字符串。

使用示例:

#include <stdio.h>
int main()
{
char words[81];

gets(words) ; // 典型用法

printf("s\n", words);
}

结果

//输入abcd
abcd

但是我们拿着上面这段代码去运行的时候,就会发现编译器报错或者发出警告,这是为什么呢?

缺点

问题就出现在gets唯一的参数是words,它无法检查数组是否装得下输入行。

因此gets()函数只知道数组的开始处(通过传入的数组名),但是并不知道数组中有多少个元素。

如果输入的字符串过长,会导致缓冲区溢出(buffer overflow),即多余的字符超出了指定的目标空间。

如果这些多余的字符只是占用了尚未使用的内存,就不会立即出现问题;

如果它们擦写掉程序中的其他数据,会导致程序异常中止:或者还有其他情况。

为了让输入的字符串容易溢出,把程序中的STLEN设置为5,程序的输出如下:

//输入abcd
abcd
Segmentation fault:11


“Segmentation fault”(分段错误)似乎不是个好提示,的确如此。在UNIX系统中,这条消息说明该程序试图访问未分配的内存。

C 提供解决某些编程问题的方法可能会导致陷入另一个尴尬棘手的困境。

但是,为什么要特别提到gets()函数?

因为该函数的不安全行为造成了安全隐患。

过去,有些人通过系统编程,利用gets()插入和运行一些破坏系统安全的代码。
不久,C编程社区的许多人都建议在编程时摒弃gets()。制定C99标准的委员会把这些建议放入了标准,承认了gets()的问题并建议不要再使用它。尽管如此,在标准中保留gets()也合情合理,因为现有程序中含有大量使用该函数的代码。而且,只要使用得当,它的确是一个很方便的函数。
好景不长,C11标准委员会采取了更强硬的态度,直接从标准中废除了gets()函数。然而在实际应用中,编译器为了能兼容以前的代码,大部分都继续支持gets()函数。不过,VS2022就不支持了

fgets()

过去通常用fgets()来代替gets(),fgets()函数稍微复杂些,在处理输入方面与gets()略有不同。

原型

在C语言中,fgets()函数用于从指定的输入流中读取一行字符串。它接受三个参数:输入缓冲区指针,缓冲区大小和要读取的输入流。

使用fgets()函数的语法如下:

char *fgets(char *str, int size, FILE *stream);

fgets()函数的第2个参数指明了读入字符的最大数量。

如果该参数的值是n,那么fgets()函数从输入流中读取至多n - 1个字符(因为会自动加\0),或者遇到换行符('\n')为止。

fgets()函数的第3个参数指明要读入的文件。如果读入从键盘输入的数据,则以stdin(标准输入)作为参数,该标识符定义在stdio.h中。

fgets()函数返回指向char的指针。如果一切进行顺利,该函数返回的地址与传入的第1个参数相同但是,如果函数读到文件结尾,它将返回一个特殊的指针:空指针(null pointer)。该指针保证不会指向有效的数据,所以可用于标识这种特殊情况。在代码中,可以用数字0来代替,不过在C语言中用宏NULL来代替更常见(如果在读入数据时出现某些错误,该函数也返回NULL)。

读取规则

它将读取到的字符逐个存储在字符数组中,直到达到指定的大小或者遇到换行符为止。

如果没有遇到换行符,或者输入流中没有更多字符可读,fgets()函数会在最后一个字符后面添加一个空字符('\0')(如果数组没存满,系统会自动添加\0直到装满),表示字符串的结束。

看个例子

#include<stdio.h>
int main()
{
	char a[10];
	fgets(a, 10, stdin);
	printf("%s", a);
	
}

输入1234567890(超出指定大小),结果是

123456789

 输入1234,按enter(遇到换行符),结果是

1234

我们可以再看个例子啊

#include <stdio.h>
int main(void)
{
	char words[10];
	puts("Enter strings (empty line to quit):");
	while (fgets(words, 14, stdin) != NULL && (words[0] != '\n'))
		fputs(words, stdout);
	puts("Done.");
}

输入By the way,the gets() function, 结果是

有人就会有疑问了啊,这输入的东西不是超除了words的大小吗?那为什么还能正常打印?

实际上它确实超过了,但是这是循环!

程序中的fgets()一次读入 10 -1个字符(该例中为9个字符)。所以,一开始它只读入了“By the wa”,并储存为By the wa\0:接着fputs()打印该字符串,而且并未换行然后while循环进入下一轮迭代,fgets()继续从剩余的输入中读入数据,即读入“y,the ge”并储存为y,the ge\0接着fputs()在刚才打印字符串的这一行接着打印第2次读入的字符串。然后while 进入下一轮迭代,fgets()继续读取输入、fputs()打印字符串,这一过程循环进行,直到读入最后的“tion\n”fgets()将其储存为tion\n\0,fputs()打印该字符串,由于字符串中的\n,光标被移至下一行开始处。

保留换行符

需要注意的是,fgets()函数会保留输入流中的换行符,所以读取到的字符串可能包含换行符。如果你希望去除换行符,可以使用strtok()或者手动处理字符串

系统采用缓冲的IO,这意味着用户在按下enter键之前,输入都会被存在临时存储区(缓冲区)。

这点与gets()不同,gets()会丢弃换行符。

我们可以先借用puts()函数的特性:自动在字符串末尾加换行符

我们可以验证一下

#include <stdio.h>
int main(void)
{
	char words[14];
	puts("请输入:");
	fgets(words, 14, stdin);
	printf("见证奇迹的时刻:\n");
     puts(words);
	printf("sjajj");

}

结果是: 

apple pie,比fgets()读入的整行输入短,因此,apple pie\n\0被储存在数组中(因为fgets()会自动存储换行符)。当puts()显示该字符串时又在末尾添加了换行符,调用puts()apple pie\n\0里的换行符起作用将光标移动到下一行,但是puts自动在字符串末尾添加换行符,所以光标再次移动到下一行。因此apple pie下面有一行空行。

系统使用缓冲的I/O。这意味着用户在按下Return键之前,输入都被储存在临时存储区(即,缓冲区)中。按下Enter键就在输入中增加了一个换行符,并把整行输入发送给fgets()。对于输出,fputs()把字符发送给另一个缓冲区,当发送换行符时,缓冲区中的内容被发送至屏幕上。

fgets()储存换行符有好处也有坏处。

坏处是你可能并不想把换行符储存在字符串中,这样的换行符会带来一些麻烦。

好处是对于储存的字符串而言,检查末尾是否有换行符可以判断是否读取了一整行。如果不是一整行,要妥善处理一行中剩下的字符。

处理掉换行符


首先,如何处理掉换行符?

一个方法是在已储存的字符串中查找换行符,并将其替换成空字符:

while (words[i] !='\n')// 假设\n在words中
i++;
words[i]='\0';


其次,如果仍有字符串留在输入行怎么办?

一个可行的办法是,如果目标数组装不下一整行输入,就丢弃那些多出的字符

while(getchar()!='\n')
contine;

gets_s()函数

C11标准新增的gets_s()函数也可代替gets()。该函数与gets()函数更接近,而且可以替换现有代码中的 gets()。但是,它是stdio.h.输入/输出函数系列中的可选扩展,所以支持C11的编译器也不一定支持它。

C11新增的gets_s()函数(可选)和fgets()类似,用一个参数限制读入的字符数。


特性

  1. gets_s()只从标准输入中读取数据,所以不需要第3个参数。
  2. 如果gets_s()读到换行符,会丢弃它而不是储存它。
  3. 如果gets_s()读到最大字符数都没有读到换行符,会执行以下几步。首先把目标数组中的首字符设置为空字符,读取并丢弃随后的输入直至读到换行符或文件结尾,然后返回空指针。接着,调用依赖实现的“处理函数”(或你选择的其他函数),可能会中止或退出程序。

第2个特性说明,只要输入行未超过最大字符数,gets_s()和gets()几乎一样,完全可以用gets_s()换gets()。第3个特性说明,要使用这个函数还需要进一步学习。

三种输入方式的选择

我们来比较一下gets()、fgets()和gets_s()的适用性。

如果目标存储区装得下输入行,3个函数都没问题。但是fgets()会保留输入末尾的换行符作为字符串的一部分,要编写额外的代码将其替换成字符。

如果输入行太长会怎样?

使用gets()不安全,它会擦写现有数据,存在安全隐患。gets_s()函数很全,但是,如果并不希望程序中止或退出,就要知道如何编写特殊的“处理函数”。另外,如果打算让程继续运行,gets_s(会丢弃该输入行的其余字符,无论你是否需要。由此可见,当输入太长,超过数组容纳的字符数时,fgets()函数最容易使用,而且可以选择不同的处理方式。如果要让程序继续使用输中超出的字符,可以参考程序清单11.8中的处理方法。
所以,当输入与预期不符时,gets_s()完全没有fgets()函数方便、灵活。也许这也是gets s二民的因之一。鉴于此,fgets()通常是处理类似情况的最佳选择。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1480725.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

DDR5内存相比DDR4内存的优势和区别?选择哪一个服务器内存配置能避免丢包和延迟高?

根据幻兽帕鲁服务器的实际案例分析&#xff0c;选择合适的DDR4与DDR5内存大小以避免丢包和延迟高&#xff0c;需要考虑以下几个方面&#xff1a; 性能与延迟&#xff1a;DDR5内存相比DDR4在传输速率、带宽、工作电压等方面都有显著提升&#xff0c;但同时也伴随着更高的延迟。D…

js截取图片地址后面的参数和在路径中截取文件名或后缀名

文章目录 前言截取地址 &#xff1f;后面的参数在路径中截取文件名或后缀名总结 前言 在处理网页上的图片资源或者其他类型的文件资源时&#xff0c;你可能会遇到需要使用这些技巧的情况。以下是一些具体的使用场景&#xff1a; 动态修改图片参数&#xff1a;如果你有一个图片U…

深入理解Linux线程(LWP):概念、结构与实现机制(2)

&#x1f3ac;慕斯主页&#xff1a;修仙—别有洞天 ♈️今日夜电波&#xff1a;会いたい—Naomile 1:12━━━━━━️&#x1f49f;──────── 4:59 &#x1f504; ◀️ ⏸ ▶️ ☰ &a…

详解Java中的protected修饰的访问权限

前言&#xff1a;在Java中&#xff0c;类成员访问权限修饰词有四类&#xff1a;private&#xff0c;缺省&#xff08;说白了就是空)着)protected 和 public&#xff0c;private&#xff0c;缺省&#xff0c;和 public的访问权限都很好理解&#xff0c;但是protected的访问权限却…

文献速递:帕金森的疾病分享--多模态机器学习预测帕金森病

文献速递&#xff1a;帕金森的疾病分享–多模态机器学习预测帕金森病 Title 题目 Multi-modality machine learning predicting Parkinson’s disease 多模态机器学习预测帕金森病 01 文献速递介绍 对于渐进性神经退行性疾病&#xff0c;早期和准确的诊断是有效开发和使…

Stable Diffusion 模型分享:GalaxyTimeMachines GTM ForYou-Fantasy(幻想)

本文收录于《AI绘画从入门到精通》专栏&#xff0c;专栏总目录&#xff1a;点这里。 文章目录 模型介绍生成案例案例一案例二案例三案例四案例五案例六案例七案例八 下载地址 模型介绍 作者述&#xff1a;这个“幻想”模型比这个系列的照片模型有更多的风格和颜色。如果推动的…

云渲染的使用:效果图渲染要多久!

随着技术的不断进步&#xff0c;云渲染服务已经成为效果图制作过程中划时代的解决方案。通过该服务&#xff0c;3D艺术家和渲染师现在可以在云端完成资源密集型的渲染任务&#xff0c;这大大节省了本地计算资源。但许多人可能会好奇&#xff0c;使用云渲染服务渲染一张效果图究…

RTE 开源|小红书 REDPlayer 正式发布!快来 get 同款播放器~

本项目由 RTE 开发者社区 x 小红书 联合运营 播放器最初出现在 19 世纪&#xff0c;当时主要用于播放音频&#xff0c;例如通过留声机播放唱片。 随着技术的进步&#xff0c;音频播放器不断改进&#xff0c;品质越来越好&#xff0c;体积也越来越小。到了今天&#xff0c;通过…

投标中excel表格常用功能梳理

投标中excel表格常用功能梳理&#xff1a; 1.投标报价调整报价的办法&#xff1a; 目的调整报价&#xff0c;把“红框”的报价增加30%&#xff0c;50% 增加30%的步骤&#xff1a; 步骤1&#xff1a;选择1.3 复制&#xff08;ctrlc&#xff09; 步骤2&#xff1a;选择性黏贴 …

React之数据绑定以及表单处理

一、表单元素 像<input>、<textarea>、<option>这样的表单元素不同于其他元素&#xff0c;因为他们可以通过用户交互发生变化。这些元素提供的界面使响应用户交互的表单数据处理更加容易 交互属性&#xff0c;用户对一下元素交互时通过onChange回调函数来监听…

SpringBoot底层原理

SpringBoot底层原理 一 配置优先级 1.配置方式 Springboot中支持三种配置方式&#xff0c;分别为&#xff1a; application.propertiesapplication.ymlapplication.yaml 2.配置优先级 当存在多份配置文件时&#xff0c;配置文件会按照它们的优先级生效。 优先级从高到底…

一文带你了解MySQL之B+树索引的原理

前言 学完前面我们讲解了InnoDB数据页的7个组成部分&#xff0c;知道了各个数据页可以组成一个双向链表&#xff0c;而每个数据页中的记录会按照主键值从小到大的顺序组成一个单向链表&#xff0c;每个数据页都会为存储在它里边儿的记录生成一个页目录&#xff0c;在通过主键查…

docker mysql主从复制

新建主服务器容器实例3301 mysql 主 3301 docker run -p 3301:3306 --name mysql-master \ -v /mydata/mysql-master/log:/var/log/mysql \ -v /mydata/mysql-master/data:/var/lib/mysql \ -v /mydata/mysql-master/conf:/etc/mysql \ -v /home/mysql/mysql-files:/var/lib/…

什么是前端框架中的数据绑定(data binding)?有哪些类型的数据绑定?

聚沙成塔每天进步一点点 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 欢迎来到前端入门之旅&#xff01;感兴趣的可以订阅本专栏哦&#xff01;这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发…

鸿蒙Harmony应用开发—ArkTS声明式开发(通用属性:边框设置)

设置组件边框样式。 说明&#xff1a; 从API Version 7开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版本。 border border(value: BorderOptions) 设置边框样式。 卡片能力&#xff1a; 从API version 9开始&#xff0c;该接口支持在ArkTS卡…

怎样选择一家可靠的代理IP服务?

在数字化时代&#xff0c;随着网络安全和数据隐私的日益重要&#xff0c;代理IP服务已经成为个人用户和企业保护网络身份、实现数据加密和访问地理限制内容的重要工具。然而&#xff0c;面对市场上众多的代理IP服务提供商&#xff0c;如何选择一家可靠的代理IP服务提供商也成为…

【JavaScript 漫游】【026】进度事件简记

文章简介 本篇文章为【JavaScript 漫游】专栏第 025 篇文章&#xff0c;简单记录了进度事件的知识点。 进度事件的种类 进度事件用来描述资源加载的进度&#xff0c;主要由 AJAX 请求、<img>、<audio>、<video>、<style>、<link> 等外部资源的…

如何知道当前ubuntu的版本

查看版本&#xff1a; cat /etc/lsb-release 查看内核&#xff1a; uname -a

[AutoSar]BSW_Com07 CAN报文接收流程的函数调用

目录 关键词平台说明一、背景二、顺序总览三、函数说明3.1 Com_RxIndication&#xff08;&#xff09; 关键词 嵌入式、C语言、autosar、OS、BSW 平台说明 项目ValueOSautosar OSautosar厂商vector &#xff0c;芯片厂商TI 英飞凌编程语言C&#xff0c;C编译器HighTec (GCC)…

鸿蒙Harmony应用开发—ArkTS声明式开发(通用属性:布局约束)

通过组件的宽高比和显示优先级约束组件显示效果。 说明&#xff1a; 从API Version 7开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版本。 aspectRatio aspectRatio(value: number) 指定当前组件的宽高比。 卡片能力&#xff1a; 从API vers…