Linux C编程一站式学习笔记 chap1程序的基本概念
打算重学计算机,重学C语言
这本书的前言写的真好
实在是惭愧…
文章目录
- Linux C编程一站式学习笔记 chap1程序的基本概念
- 一.程序和编程语言
- 1.什么是程序
- 2.程序由指令组成
- 3.编程语言
- 编译执行过程
- 解释执行过程
- 本节总结
- 二.自然语言和形式语言
- 三.程序的调试
- 四.第一个程序
- 相关资源、参考资料
一.程序和编程语言
1.什么是程序
- 什么是程序
- 程序(Program)是一个精确说明如何进行计算的指令序列。
- 这里的计算可以是一些数学上的计算,比如解方程或者求多项式的根,也可以是符号运算,一个简单的例子是查找和替换文档中的词,一个复杂的例子是搜索引擎。
- 从根本上说,计算机是由数字电路组成的运算机器,只能 对数字做运算,程序之所以能做符号运算是因为符号在计算机内部也是用数字来表示的。
- 程序还可以处理声音和图像,同样因为声音和图像在计算机内部是用数字来表示的,这些数字再通过专门的硬件设备转换成人可以听到、看到的声音和图像。
- 程序(Program)是一个精确说明如何进行计算的指令序列。
2.程序由指令组成
-
程序由一系列指令(Instruction)组成,指令是指示计算机做某种运算的命令,通常包括以下几类:
- 输入 (Input)
- 从键盘、文件或者其它设备获取数据
- 输出 (Output)
- 把数据显示到屏幕,或者存入一个文件,或者发送到其它设备
- 基本运算
- 执行最基本的数学运算(加减乘除)和数据存取,其实输入和输出也属于数据存取
- 测试和分支(Branch)
- 测试某个条件,然后根据不同的测试结果执行不同的后续指令
- 循环 (Loop)
- 重复执行一系列操作
- 输入 (Input)
-
编写程序其实就是把复杂的任务分解成子任务,把子任务再分解成更简单的任务,层层分解,直到最后简单得可以用以上指令来完成
仔细想想,确实是酱紫
3.编程语言
-
编程语言(Programming Language)分为
- 低级语言(Low-level Language)
- 机器语言(Machine Language)和汇编语言(Assembly Language)属于低级语言,直接用计算机指令编写程序。
- 高级语言(High-level Language)。
- C、C++、Java、Python等属于高级语言,用语句(Statement)编写程序,语句是计算机指令的抽象表示。
- 低级语言(Low-level Language)
-
举个例子,同样一个语句用C语言、汇编语言和机器语言分别表示如下:
-
计算机只能对数字做运算,符号、声音、图像在计算机内部都要用数字表示,指令也不例外,上表中的机器语言完全由十六进制数字组成。最早的程序员都是直接用机器语言编程,但是很麻烦,需要查大量的表格来确定每个数字表示什么意思,编写出来的程序很不直观,而且容易出错,于是有了汇编语言,把机器语言中一组一组的数字用助记符(Mnemonic)表示,直接用这些助记符写出汇编程序,然后让**汇编器(Assembler)**去查表把助记符替换成数字,也就把汇编语言翻译成了机器语言。从上面的例子可以看出,汇编语言和机器语言的指令是一一对应的,汇编语言有三条指令,机器语言也有三条指令,汇编器就是做一个简单的替换工作,例如在第一条指令中,把
movl ?,%eax
这种格式的指令替换成机器码a1 ?
,?表示一个地址,在汇编指令中是0x804a01c
,转换成机器码之后是1c a0 04 08
(这是指令中的十六进制数的小端表示,小端表示将在第 5.1 节 “目标文件”介绍)。 -
从上面的例子还可以看出,C语言的语句和低级语言的指令之间不是简单的一一对应关系,一条
a=b+1;
语句要翻译成三条汇编或机器指令,这个过程称为编译(Compile),由**编译器(Compiler)**来完成,显然编译器的功能比汇编器要复杂得多。 -
用C语言编写的程序必须经过编译转成机器指令才能被计算机执行,编译需要花一些时间,这是用高级语言编程的一个缺点,然而更多的是优点。首先,用C语言编程更容易,写出来的代码更紧凑,可读性更强,出了错也更容易改正。其次,C语言是可移植的(Portable)或者称为平台无关的(Platform Independent)。
- 平台这个词有很多种解释,可以指计算机体系结构(Architecture),也可以指操作系统(Operating System),也可以指开发平台(编译器、链接器等)。不同的计算机体系结构有不同的指令集(Instruction Set),可以识别的机器指令格式是不同的,直接用某种体系结构的汇编或机器指令写出来的程序只能在这种体系结构的计算机上运行,然而各种体系结构的计算机都有各自的C编译器,可以把C程序编译成各种不同体系结构的机器指令,这意味着用C语言写的程序只需稍加修改甚至不用修改就可以在各种不同的计算机上编译运行。各种高级语言都具有C语言的这些优点,所以绝大部分程序是用高级语言编写的,只有和硬件关系密切的少数程序(例如驱动程序)才会用到低级语言。
- 还要注意,即使在相同的体系结构和操作系统下,用不同的C编译器(或者同一个C编译器的不同版本)编译同一个程序得到的结果也有可能不同,C语言有些语法特性在C标准中并没有明确规定,各编译器有不同的实现,编译出来的指令的行为特性也会不同,应该尽量避免使用不可移植的语法特性。
编译执行过程
- 首先用文本编辑器写一个C程序,然后保存成一个文件
- 例如
program.c
(通常C程序的文件名后缀是.c
),这称为源代码(Source Code)或源文件
- 例如
- 然后运行编译器对它进行编译
- 编译的过程并不执行程序,而是把源代码全部翻译成机器指令,再加上一些描述信息,生成一个新的文件,例如
a.out
,这称为可执行文件 - 可执行文件可以被操作系统加载运行,计算机执行该文件中由编译器生成的指令,如下图所示:
- 编译的过程并不执行程序,而是把源代码全部翻译成机器指令,再加上一些描述信息,生成一个新的文件,例如
解释执行过程
有些高级语言以解释(Interpret)的方式执行,解释执行过程和C语言的编译执行过程很不一样。
例如编写一个Shell脚本script.sh
,内容如下:
#! /bin/sh
VAR=1
VAR=$(($VAR+1))
echo $VAR
定义Shell变量VAR
的初始值是1,然后自增1,然后打印VAR
的值。用Shell程序/bin/sh
解释执行这个脚本,结果如下:
$ /bin/sh script.sh
2
这里的/bin/sh
称为解释器(Interpreter),它把脚本中的每一行当作一条命令解释执行,而不需要先生成包含机器指令的可执行文件再执行。如果把脚本中的这三行当作三条命令直接敲到Shell提示符下,也能得到同样的结果:
解释的过程有点像同声传译
$ VAR=1
$ VAR=$(($VAR+1))
$ echo $VAR
2
本节总结
程序由语句或指令组成,计算机只能执行低级语言中的指令(汇编语言的指令要先转成机器码才能执行),高级语言要执行就必须先翻译成低级语言,翻译的方法有两种--编译和解释,虽然有这样的不便,但高级语言有一个好处是平台无关性。
什么是平台?一种平台,就是一种体系结构,就是一种指令集,就是一种机器语言,这些都可看作是一一对应的,上文并没有用“一一对应”这个词,但读者应该能推理出这个结论,而高级语言和它们不是一一对应的,因此高级语言是平台无关的。
二.自然语言和形式语言
-
自然语言(Natural Language)就是人类讲的语言,比如汉语、英语和法语。这类语言是自然进化的。
-
形式语言(Formal Language)是为了特定应用而人为设计的语言。例如数学家用的数字和运算符号、化学家用的分子式等。编程语言也是一种形式语言,是专门设计用来表达计算过程的形式语言。
-
形式语言有严格的语法(Syntax)规则,语法规则是由符号(Token)和结构(Structure)的规则所组成的。
- Token的概念相当于自然语言中的单词和标点、数学式中的数和运算符、化学分子式中的元素名和数字,
- 结构是指Token的排列方式
- 关于Token的规则称为词法(Lexical)规则,而关于结构的规则称为语法(Grammar)规则[1]。
-
当阅读一个自然语言的句子或者一种形式语言的语句时,不仅要搞清楚每个词(Token)的意思,而且必须搞清楚整个句子的结构是什么样的,这个分析句子结构的过程称为解析(Parse)
- 一旦解析完成,你就搞懂了句子的意思,这句话是在什么上下文(Context)中说的,你还能理解这个句子主要暗示的内容,这些都属于语义(Semantic)的范畴。
-
虽然形式语言和自然语言有很多共同之处,包括Token、结构和语义,但是也有很多不一样的地方。
- 歧义性(Ambiguity)
- 自然语言充满歧义,人们通过上下文的线索和自己的常识来解决这个问题。形式语言的设计要求是清晰的、毫无歧义的,这意味着每个语句都必须有确切的含义而不管上下文如何。
- 冗余性(Redundancy)
- 为了消除歧义减少误解,自然语言引入了相当多的冗余。而形式语言则更加紧凑,少有冗余。
- 与字面意思的一致性
- 自然语言充斥着成语和隐喻(Metaphor),而形式语言中字面(Literal)意思基本上就是真实意思,也会有一些例外,例如下一章要讲的C语言转义序列,但即使有例外也会明确规定哪些字面意思不是真实意思,它们所表示的真实意思又是什么。
- 歧义性(Ambiguity)
-
说自然语言长大的人(实际上没有人例外),往往有一个适应形式语言的困难过程。某种意义上,形式语言和自然语言之间的不同正像诗歌和说明文的区别,当然,前者之间的区别比后者更明显:
作者的这个说法不错诶!
- 诗歌
- 词语的发音和意思一样重要,全诗作为一个整体创造出一种效果或者表达一种感情。歧义和非字面意思不仅是常见的而且是刻意使用的。
- 说明文
- 词语的字面意思显得更重要,并且结构能传达更多的信息。诗歌只能看一个整体,而说明文更适合逐字句分析,但仍然充满歧义。
- 程序
- 计算机程序是无歧义的,字面和本意高度一致,能够完全通过对Token和结构的分析加以理解。
- 诗歌
三.程序的调试
-
据说有这样一个典故:早期的计算机体积都很大,有一次一台计算机不能正常工作,工程师们找了半天原因最后发现是一只臭虫钻进计算机中造成的。从此以后,程序中的错误被叫做臭虫(Bug),而找到这些Bug并加以纠正的过程就叫做调试(Debug)。我们要知道程序中的Bug分为哪几类
哈哈哈关于这个有好多种说法,还有说是纸袋编程,小黑点像小虫子(bug)的
-
编译时错误
编译器只能翻译语法正确的程序,否则将导致编译失败,无法生成可执行文件。
对于自然语言来说,一点语法错误不是很严重的问题,因为我们仍然可以读懂句子。但哪怕一个很小的语法错误,编译器就会输出一条错误提示信息然后罢工。
虽然大部分情况下编译器给出的错误提示信息就是你出错的代码行,但也有个别时候编译器给出的错误提示信息帮助不大,甚至会误导你。
相比下面两种错误,语法错误解决起来要容易得多。
-
运行时错误
编译器检查不出这类错误,仍然可以生成可执行文件,但在运行时会出错而导致程序崩溃。
要时刻注意区分编译时和运行时(Run-time)这两个概念,有些事情在编译时做,有些事情则在运行时做。
-
逻辑错误和语义错误
程序里有逻辑错误,编译和运行都顺利,看上去也不产生任何错误信息,但是程序没有干它该干的事情,而是干了别的事情。
Anyway,计算机只会按你写的程序去做,问题在于你写的程序不是你真正想要的,这意味着程序的意思(即语义)是错的。
-
-
通过本书你将掌握的最重要的技巧之一就是调试。从某种角度看调试就像侦探工作,根据掌握的线索来推断是什么原因和过程导致了你所看到的结果。调试也像是一门实验科学,每次想到哪里可能有错,就修改程序然后再试一次。如果假设是对的,就能得到预期的正确结果,就可以接着调试下一个Bug,一步一步逼近正确的程序;如果假设错误,只好另外再找思路再做假设。
-
也有一种观点认为,编程和调试是一回事,编程的过程就是逐步调试直到获得期望的结果为止。你应该总是从一个能正确运行的小规模程序开始,每做一步小的改动就立刻进行调试,这样的好处是总有一个正确的程序做参考:如果正确就继续编程,如果不正确,那么一定是刚才的小改动出了问题。
四.第一个程序
-
当然是hello world!
-
来Linux玩玩,用vim写入,保存为
first.c
-
编译执行
-
gcc
是Linux平台的C编译器,编译后在当前目录下生成可执行文件a.out
,直接在命令行输入这个可执行文件的路径就可以执行它。 -
如果不想把文件名叫
a.out
,可以用gcc
的-o
参数自己指定文件名:
-
gcc -Wall: 让
gcc
提示所有的警告信息,不管是严重的还是不严重的这本书写的真细致!把好多初学者的bug如stdio写成stdoi,printf少加引号等等,还翻译报错信息进行解释👇 ! 相见恨晚!
相关资源、参考资料
-
豆瓣评价
-
开源电子书
-
《Linux C编程一站式学习》这书写得很不错,为什么都买不到了呢? - echo1937的回答 - 知乎 https://www.zhihu.com/question/34069391/answer/544825938
-
[大佬们的学习笔记]
- 习题答案整理
- https://blog.csdn.net/weixin_44576779/article/details/87443584
- CSDN上的