return 语句
增量式开发
递归
return 语句
之前我们一直在main函数中使用return语句,现在是时候全面深入地学习一下。在有返回值地函数中,return语句的作用是提供整个函数的返回值,并结束当前函数返回到调用它的地方。在没有返回值的函数中也可以使用return语句,例如当检查到一个错误时提前结束当前函数的执行并返回:
#include <math.h>
void print_logarithm(double x)
{
if (x <= 0.0) {
printf("Positive numbers only, please.\n");
return;
}
printf("The log of x is %f", log(x));
}
这个函数首先检查参数x是否大于0,如果x不大于0就打印错误提示,然后提前结束函数的执行返回到调用者,只有当x大于0时才能求对数,在打印了对数结果之后到达函数体的末尾,自然地结束执行并返回。注意,使用数学函数log需要包含头文件math.h,由于x是浮点数,应该与同类型的数做比较,所以写成0.0.
在前面if/else语句中我们定义了一个检查奇偶性的函数,如果是奇数就打印x is odd,如果是偶数就打印x is even.事实上这个函数并不十分好用,我们定义一个检查奇偶性的函数往往不是为了打印两个字符串就完了,而是为了根据奇偶性的不同分别执行不同的后续动作,我们可以把它改成一个返回布尔值的函数:
int is_even(int x)
{
if (x % 2 == 0)
return 1;
else
return 0;
}
有些人喜欢写成return (1),这种形式也可以,表达式外面套括号表示改变运算符优先级,在这里不起任何作用。我们可以这样调用这个函数:
int i = 19;
if (is_even(i)) {
/* do something */
} else {
/* do some other thing */
}
返回布尔值的函数是一类非常有用的函数,在程序中通常当控制表达式,函数名通常带有is或if等表示判断的词,这类函数也叫做谓词。is_even这个函数写的有点啰嗦,x%2这个表达式本来就有0值或非0值,直接把这个值当作布尔值返回就可以了:
int is_even(int x)
{
return !(x % 2);
}
函数的返回值应该这样理解:函数返回一个值相当于定义一个和返回值类型相同的临时变量并用return后面的表达式来初始化。例如上面的函数调用相当于这样的过程:
int 临时变量 = !(x % 2);
函数退出,局部变量x的存储空间释放;
if (临时变量) { /* 临时变量用完就释放 */
/* do something */
} else {
/* do some other thing */
}
当if语句对函数的返回值做判断时,函数已经退出,局部变量x已经释放,所以不可能在这时候才计算表达式!(x%2)的值,表达式的值必然是事先计算好了存在一个临时变量里的,然后函数退出,局部变量释放,if语句对这个临时变量的值做判断,注意,虽然函数的返回值可以看作是一个临时变量,但我们只是读一下它的值,读完值就释放它,而不能往它里面存新的值,换句话说,函数的返回值不能是左值,或者说函数调用表达式不能做左值,因此下面的赋值语句是非法的:
is_even(20) = 1;
在形参和实参那里讲过了,C语言的传参规则是Call by Value,按值传递,现在我们知道返回值也是按值传递的,即便返回语句写成了return x;返回的也是变量x的值,而非变量x本身,因为变量x马上就要被释放了。
在写带有return语句的函数时要小心检查所有的代码路径。有些代码路径在任何条件下都执行不到,这称为Dead Code,例如把&&和||运算符记混了,写出如下代码:
void foo(int x, int y)
{
if (x >= 0 || y >= 0) {
printf("both x and y are positive.\n");
return;
} else if (x < 0 || y < 0) {
printf("both x and y are negetive.\n");
return;
}
printf("x has a different sign from y.\n");
}
最后一行printf永远都没机会被执行到,是一行Dead Code.有Dead Code就一定有Bug,你写的每一行代码都是想让程序在某种情况下去执行的,你不可能故意写成一行永远不会被执行的代码,如果程序在任何情况下都不会去执行它,说明跟你预想的不一样,要么是你对所有可能的情况分析不正确,也就是逻辑错误,要么就是像上例这样的笔误,语义错误。还有一些时候,对程序中所有可能的情况分析得不够全面将导致漏掉一些代码路径,例如:
int absolute_value(int x)
{
if (x < 0) {
return -x;
} else if (x > 0) {
return x;
}
}
这个函数被定义为返回int,就应该在任何情况下都返回int,但是上面这个程序在x==0时安静地推出了程序,什么也不返回,C语言对于这种情况会返回什么结果是未定义地,通常返回不确定地值,等学到函数调用你就知道为什么了,另外注意这个例子中把-号当负号用而不是当减号用,事实上+号也可以这么用。正负号是单目运算符,而加减号是双目运算符,正负号地优先级和逻辑非运算符相同,比加减的优先级要高。
以上两段代码都不会产生编译错误,编译器只做语法检查和最简单的语义检查,而不检查程序的逻辑错误,虽然到现在为止你见到了各种各样的编译器错误提示,也许你已经非常讨厌编译器报错了,但很快你就会认识到,如果程序中有错误编译器还不报错,那一定比报错更糟糕。比如上面的绝对值函数,在你测试的时候运行的很好,也许是你没有测到x==0的情况,也许刚好在你的环境中x==0时返回的不确定值就是0,然后你放心地把它集成到一个数万行地程序中。然后你把这个程序交给用户,起初的几天相安无事,之后每过几个星期就有用户报告说程序出错,但每次出错的现象不一样,而且这个错误很难复现,你想让它出现时他就不出现,在你毫无防备时它又突然冒出来。然后你花了大量的时间在数万行的程序中排查哪里错了,几天之后终于幸运的找到了这个函数的bug,这时候你就会想,如果当初编译器能报个错多好啊!所以,如果编译器报错了,它能帮我们节省大量的调试时间,另外,在math.h中有一个fabs函数就是求绝对值的,我们通常不必自己写绝对值函数。
增量式开发
目前为止你看到了很多示例代码,也在它们的基础上做了很多改动并在这个过程中巩固所学的知识。但是如果你从头开始编写一个程序解决某个问题,应该按什么步骤来写?本节提出一种增量式开发的思路。
现在问题来了:我们要编一个程序求圆的面积,圆的半径以两个端点的坐标(x1,y1)和(x2,y2)给出。首先分析和分解问题,把大问题分解成小问题,再对小问题分别求解。这个问题可分为两步:
- 由两个端点坐标求半径的长度,我们知道平面上两点间距离的公式是:
括号里的部分都可以用我们学过的C语言表达式来表示,求平方根可以用math.h中的sqrt函数,因此这个小问题全部都可以用我们学过的知识来解决。这个公式可以实现成一个函数,参数是两点的坐标,返回值是distance.
- 上一步算出的距离是圆的半径,已知圆的半径之后求面积的公式是:
也可以用我们学过的C语言表达式来解决,这个公式也可以实现成一个函数,参数是radius,返回值是area.
首先编写distance这个函数,我们已经明确了它的参数是两点的坐标,返回值是两点间距离,可以先写成一个简单的函数定义:
double distance(double x1, double y1, double x2, double y2)
{
return 0.0;
}
初学者写到这里已经不自信了:这个函数定义写的对吗?虽然我是按照我理解的语法规则写的,但书上没有和这个一模一样的例子,万一不小心遗漏了什么?既然不自信就不要再往下写了,没有一个平稳的心态来写程序很可能会引入Bug.所以在函数定义中插一个return 0.0立刻结束掉它,然后立刻测试这个函数定义的有没有错:
int main(void)
{
printf("distance is %f\n", distance(1.0, 2.0, 4.0, 6.0));
return 0;
}
编译,运行,一切正常。这时你就会建立信心了:既然没问题,就不用管他了,继续往下写。在测试时给这个函数的参数是(1.0,2.0)和(4.0,6.0),两点的x坐标距离是3.0,y坐标的距离是4.0,因此两点间距离应该是5.0,你必须事先知道正确答案是5.0,这样你才能测试程序计算的结果对不对。当然,现在函数还没实现,计算结果肯定是不对的。现在我们再往函数里添一点代码:
double distance(double x1, double y1, double x2, double y2)
{
double dx = x2 - x1;
double dy = y2 - y1;
printf("dx is %f\ndy is %f\n", dx, dy);
return 0.0;
}
如果你不确定dx和dy这样初始化行不行,那么就此打住,在函数里查一条打印语句把dx,dy的值打印出来看看。把它和上面的main函数一起编译运行,由于我们事先知道结果应该是3.0和4.0,因此能够验证程序算的对不对。一旦验证无误,函数里的这句打印就可以撤掉了,像这种打印语句,以及我们用来测试的main函数,都起到了类似脚手架的作用:在该房子时时很有用的,但它不是房子的一部分,房子盖好了以后就可以拆掉了,房子盖好之后可能还需要维修,加盖,翻新,又要再加上脚手架,这很麻烦,要是当初不拆不就好了,可是不拆不行,不拆多难看啊。写代码却可以由一个更高明的解决方法:把代码注释掉。
double distance(double x1, double y1, double x2, double y2)
{
double dx = x2 - x1;
double dy = y2 - y1;
/* printf("dx is %f\ndy is %f\n", dx, dy); */
return 0.0;
}
这样如果以后出现了新的Bug有需要跟踪调试时,还可以把这句重新加进代码中使用。两点的x坐标距离和y坐标距离都没问题了,下面求它们的平方和:
double distance(double x1, double y1, double x2, double y2)
{
double dx = x2 - x1;
double dy = y2 - y1;
double dsquared = dx * dx + dy * dy;
printf("dsquared is %f\n", dsquared);
return 0.0;
}
然后再编译,运行,看看是不是25.0.这样的增量式开发非常适合初学者,每写一行代码都编译运行,确保没问题再写下一行,一方面在写代码时候更有信心,另一方面也方便调试:总是有一个先前的正确版本做参照,改动之后如果出了问题,几乎可以肯定就是刚才改的那行代码出的问题,这样就避免了必须从很多代码中查找分析到底是哪一行出的问题,在这个过程中printf功不可没,你怀疑哪一行代码出问题,就插一个printf进去看看中间的计算结果,任何错误都可以通过这个办法找出来。以后我们会介绍程序调试工具gdb,printf这个最原始的办法仍然是最直接,有效的。最后一步,我们完成这个函数:
#include <math.h>
#include <stdio.h>
double distance(double x1, double y1, double x2, double
y2)
{
double dx = x2 - x1;
double dy = y2 - y1;
double dsquared = dx * dx + dy * dy;
double result = sqrt(dsquared);
return result;
}
int main(void)
{
printf("distance is %f\n", distance(1.0, 2.0,
4.0, 6.0));
return 0;
}
然后编译运行,看看是不是5.0。随着编程经验越来越丰富,你可能每次写若干行代码再一次测试,而不是像现在这样写一行测试一行,但不管怎么样,增量式开发的思路还是很有用的,它可以帮你节省大量调试的时间,不管你有多强,都不应该一口气写完整个程序再编译运行,那几乎是一定会有Bug的,到那时候再找Bug就难了。
这个程序中引入了很多临时变量:dx,dy,dsquared,result.如果你有信心把整个表达式一次性写好,也可以不用临时变量:
double distance(double x1, double y1, double x2, double y2)
{
return sqrt((x2-x1) * (x2-x1) + (y2-y1) * (y2-y1));
}
这样写就简洁很多,但是如果写错了?只知道是这一长串表达式有错,根本不知道错在哪,而且整个函数就一个语句,插printf都没地方插。所以用临时变量有它的好处,使程序更加清晰,调试更加方便,而且有时候可以避免不必要的计算,例如上面这一行表达式要把(x2-x1)计算两遍,如果算完(x2-x1)把结果存在一个临时变量dx里,就不需要再算第二遍了。
接下来编写area这个函数:
double area(double radius)
{
return 3.1416 * radius * radius;
}
给出两点的坐标求距离,给出半径求圆的面积,这两个子问题都解决了,如何把它们组合起来解决整个问题?给出半径的两端点坐标(1.0,2.0)和(4.0,6.0)求圆的面积,先用distance函数求出半径的长度,再把这个长度传给area函数。
double radius = distance(1.0, 2.0, 4.0, 6.0);
double result = area(radius);
也可以:
double result = area(distance(1.0, 2.0, 4.0, 6.0));
我们一直把"给出半径的两端点坐标求圆的面积"这个问题当作整个问题来看,如果它也是一个更大的程序当中的子问题?我们可以把先前的两个函数组合起来做成一个新的函数以便日后使用:
double area_point(double x1, double y1, double x2, double y2)
{
return area(distance(x1, y1, x2, y2));
}
还有另一种组合的思路,不是把distance和area两个函数调用组合起来,而是把那两个函数中得到语句组合到一起:
double area_point(double x1, double y1, double x2, double y2)
{
double dx = x2 - x1;
double dy = y2 - y1;
double radius = sqrt(dx * dx + dy * dy);
return 3.1416 * radius * radius;
}
这样组合是不合理的。这样组合以后,原来写的distance和area两个函数还要不要了?如果不要了删掉,那么如果有些情况只需要求两点间的角距离,或者只需要给定半径长度求圆的面积?area_point把所有语句都写在一起,不太灵活,满足不了这样的需要。如果保留了distance和area同时也保留了area_point怎么样?area_point和distance有相同的代码,一旦在distance函数中发现了Bug,或者要升级distance这个函数采用更高的计算精度,那么不仅要修改distance,还要记着修改area_point,同理要修改area也要记着修改area_point,维护重复的代码是非常容易出错的,在任何时候都要尽量避免。因此,尽可能复用以前写的代码,避免写重复的代码。封装就是为了复用,把解决各种小问题的代码封装成函数,在解决第一个大问题时可以用这些函数,在解决第二个大问题时可以复用这些函数。
解决问题的过程就是把大的问题分成小的问题,小的问题再分成更小的问题,这个过程在代码中的体现就是函数的分层设计。distance和area是两个底层函数,解决一些很小的问题,而area_point是一个上层函数,上层函数通过调用底层函数来解决更大的问题,底层和上层函数都可以被更上一层的函数调用,最终所有的函数都直接或间接地被main函数调用。如下图:
递归
如果定义一个概念需要用到这个概念地本身,我们称它的定义是递归。例如:
int factorial(int n)
{
if (n == 0)
return 1;
}
如果参数n不是0应该return什么?根据定义,应该return n*factorial(n-1);为了下面地分析方便,我们引入了几个临时变量把这个语句拆分一下:
int factorial(int n)
{
if (n == 0)
return 1;
else {
int recurse = factorial(n-1);
int result = n * recurse;
return result;
}
}
factorial这个函数居然可以自己调用自己?是的,自己直接或间接调用自己的函数称为递归函数,这里的factorial是直接调用自己,有些时候函数A调用函数B,函数B又调用函数A,也就是函数A间接调用自己,这也就是递归函数,如果你觉得迷惑,可以把factorial(n-1)这一步看成是在调用另一个函数--另一个有些相同函数名和相同代码的函数,调用它就是跳到它的代码里执行,然后再返回factorial(n-1)这个调用的下一步继续执行。我们以factorial(3)为例分析整个调用过程,如下图:
图中用实线箭头表示调用,用虚线箭头表示返回,右侧的框表示在调用和返回过程中各层函数调用的存储空间变化情况。
- main()有一个局部变量result,用一个框表示。
- 调用factorial(3)时要分配此参数和局部变量的存储空间,于是在main()的下面又多了一个框表示factorial(3)的参数和局部变量,其中n已初始化为3.
- factorial(3)又调用factorial(2),又要分配factorial(2)的参数和局部变量,于是在main()和factorial(3)下面又多了一个框。在全局变量,局部变量和作用域讲过,每次调用函数时分配参数和局部变量的存储空间,退出函数时释放它们的存储空间。factorial(3)和factorial(2)是两次不同调用,factorial(3)的参数n和factorial(2)的参数n各有各的存储单元,虽然我们写代码时只写了一次参数n,但运行时却是两个不同的参数n。并且由于调用factorial(2)时factorial(3)还没退出,所以两个函数调用的参数n同时存在,所以在原来的基础上多画了一个框。
- 依此类推,请读者对照着图自己分析整个调用过程,读者会发现这个过程和前面用数学公式计算3!的过程时一样的,都是先一步步展开然后再一步步收回去。
return area(distance(x1, y1, x2, y2));
...
int recurse = factorial(n-1);
int result = n * recurse;
...
int factorial(int n)
{
int recurse = factorial(n-1);
int result = n * recurse;
return result;
}