1.算法效率
如何衡量算法的好坏?
这里需要引入算法的复杂度
1.2算法的复杂度
算法在编写成可执行程序后,运行时需要耗费时间资源和空间 ( 内存 ) 资源。因此 衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的 , 即时间复杂度和空间复杂度 。时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间 。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
2.时间复杂度
2.1时间复杂度的概念
时间复杂度的定义:在计算机科学中, 算法的时间复杂度是一个函数 ,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知 道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例, 算法中的基本操作的执行次数,为算法的时间复杂度 。
即: 找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
例如:
// 请计算一下Func1中++count语句总共执行了多少次?
voidFunc1(intN)
{
int count=0;
for (int i=0; i<N ; ++i)
{
for (int j=0; j<N ; ++j)
{
++count;
}
}
for (int k=0; k<2*N ; ++k)
{
++count;
}
int M=10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
F(N)=N^2+2*N+10
大 O 符号( Big O notation ):是用于描述函数渐进行为的数学符号。推导大 O 阶方法:1 、 用常数1取代运行时间中的所有加法常数 。2 、在修改后的运行次数函数中, 只保留最高阶项。(决定结果项)3 、如果最高阶项存在且不是 1 ,则去除与这个项目相乘的系数(常数)。得到的结果就是大 O 阶。使用大 O 的渐进表示法以后, Func1 的时间复杂度为: O(N^2)
我们容易看出最高阶项N^2起决定性作用,因此保留它。
// 计算Func2的时间复杂度?
void Func2(int N)
{
int count = 0;
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
结果为 0(2N)去掉系数—O(N),因为系数对值的影响也是微乎其微的。
// 计算Func3的时间复杂度?
void Func3(int N, int M)
{
int count = 0;
for (int k = 0; k < M; ++ k)
{
++count;
}
for (int k = 0; k < N ; ++ k)
{
++count;
}
printf("%d\n", count);
}
结果为O(M+N),因为我们不知道M和N的大小关系(重要程度),因此不能去掉任意一方。
如果知道,那么
// 计算Func4的时间复杂度?
void Func4(int N)
{
int count = 0;
for (int k = 0; k < 100; ++ k)
{
++count;
}
printf("%d\n", count);
}
结果为O(1),常数次结果都写成O(1),即使常数为1万亿。(CPU运行速度足够快;数据类型的值有上限)
// 计算strchr的时间复杂度?(str字符数组中查找一个字符)
const char * strchr ( const char * str, int character );
while(*str)
{
}
有些算法的时间复杂度例如此例存在最好、平均和最坏情况:最坏情况:任意输入规模的最大运行次数 ( 上界 )平均情况:任意输入规模的期望运行次数最好情况:任意输入规模的最小运行次数 ( 下界 )例如:在一个长度为 N 数组中搜索一个数据 x最好情况: 1 次找到最坏情况: N 次找到平均情况: N/2 次找到时间复杂度是一个稳健保守的预期, 在实际中一般情况关注的是算法的 最坏 运行情况,所以数组中搜索数据时间复杂度为O(N)
// 计算冒泡排序BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
直接从冒泡排序的原理看:
第一次将最大的数移动到最右边需要比较n-1次,第二次n-2,第三次... ...,这是一个等差数列,用公式求n项和,为(N-1)*N/2,因此时间复杂度为O(N^2)。
// 计算二分(折半)查找BinarySearch的时间复杂度?
int BinarySearch(int* a, int n, int x)
{
assert(a);
int begin = 0;
int end = n-1;
// [begin, end]:begin和end是左闭右闭区间,因此有=号
while (begin <= end)
{
int mid = begin + ((end-begin)>>1);
if (a[mid] < x)
begin = mid+1;
else if (a[mid] > x)
end = mid-1;
else
return mid;
}
return -1;
}
二分查找的原理:
该数列是有序的,从中间位置开始查找,如果要找的值更大或更小,就缩小一半查找范围,缩小一次,下一次查找的数量就除2,那么除了多少次2就查找了多少次。
查找区域只剩一个值为最坏情况,假设查找x次,2^x=N,x=log2N。
只有以2为底求n的对数可以写成logN。
二分查找和暴力查找之间的效率差距是巨大的,二分查找的效率非常高,但限制在于每次插入删除都需要重新排序。
// 计算阶乘递归Fac的时间复杂度?
long long Fac(size_t N)
{
if(0 == N)
return 1;
return Fac(N-1)*N;
}
总结:递归调用是多次调用的次数的累加
从Fac(N)到Fac(0)进行了N-1次调用,为常数次,因此结果为O(N)。
// 计算斐波那契递归Fib的时间复杂度?
long long Fib(size_t N)
{
if(N < 3)
return 1;
return Fib(N-1) + Fib(N-2);
}
F(N)=2^0+2^1+2^2+2^3+... ...+2^(N-1)
=2^N-1
2^N
面试题
消失的数字
思路1:排序+遍历(下一个数不等于这一个数+1,这个数就是消失的数字)
时间复杂度:O(logN*N) (不符合)
思路2:0-N等差数列公式计算N项和-数组中值的和,就是消失的数字
时间复杂度:O(N)(符合)
思路3:单身狗(异或)
时间复杂度:O(N)(符合)
相同为0,相异为1,相同的数只要放在一块进行了异或,就为0,与顺序无关
那么将原数组和有缺失的数组放在一起异或,结果就为消失的数。
思路2实现:
//参数为数组指针和成员数量
int MissingNumber(int* nums, int numSize)
{
int N = numSize;
//求和公式求出N项和
int ret = N*(1 + N) / 2;
int i = 0;
for (i = 0; i < N; i++)
{
//减去数组中的成员
ret -= nums[i];
}
return ret;
}
思路3实现:
int MissingNumber(int* nums, int numSize)
{
int N = numSize;
//用来存放异或结果的容器
int x = 0;
//将原数组放进容器
for (int i = 0; i <= N; i++)
{
x ^= i;
}
//将有缺失的数组放进去一起异或
for (int i = 0; i < N; i++)
{
//得到缺失值
x ^= nums[i];
}
return x;
}
int main()
{
int arr[5] = { 0,1,2,4,5 };
int sz = sizeof(arr) / sizeof(arr[0]);
printf("%d\n", MissingNumber(arr, sz));
return 0;
}