C++之 lambda表达式

lambda表达式

lambda表达式概念
lambda表达式语法
lambda表达式底层原理

lambda表达式概念

我们在以往需要对某些数据进行排序时，比如一个数组，我们就需要用到sort()函数：

int main()
{
	int arr[] = { 3,1,2,4,8,7,5,9 };

	//升序
	sort(arr, arr + sizeof(arr) / sizeof(arr[0]));

	//降序
	sort(arr, arr + sizeof(arr) / sizeof(arr[0]), greater<int>());

	return 0;
}

再比如某些我们自定义的类型，我们就需要用到仿函数：

struct Goods
{
	string _name;  // 名字
	double _price; // 价格
	int _evaluate; // 评价
	Goods(const char* str, double price, int evaluate)
		:_name(str)
		, _price(price)
		, _evaluate(evaluate)
	{}
};

struct ComparePriceLess
{
	bool operator()(const Goods& gl, const Goods& gr)
	{
		return gl._price < gr._price;
	}
};

struct ComparePriceGreater
{
	bool operator()(const Goods& gl, const Goods& gr)
	{
		return gl._price > gr._price;
	}
};
int main()
{
	vector<Goods> v = { { "苹果", 2.1, 5 }, { "香蕉", 3, 4 }, { "橙子", 2.2,
   3 }, { "菠萝", 1.5, 4 } };
	sort(v.begin(), v.end(), ComparePriceLess());
	sort(v.begin(), v.end(), ComparePriceGreater());
}

我们会发现，如果我们需要分别以价格，名字，评价来排序，就需要实现不同的仿函数，这样就显得比较麻烦，因此我们的lambda表达式就登场了。

lambda表达式语法

lambda表达式书写格式：[capture-list] (parameters) mutable -> return-type { statement }

lambda表达式各部分说明：

[capture-list] :
捕捉列表，该列表总是出现在lambda函数的开始位置，编译器根据[]来判断接下来的代码是否为lambda函数，捕捉列表能够捕捉上下文中的变量供lambda函数使用。
(parameters)：参数列表。与普通函数的参数列表一致，如果不需要参数传递，则可以连同()一起省略。
mutable：默认情况下，lambda函数总是一个const函数，mutable可以取消其常量性。使用该修饰符时，参数列表不可省略(即使参数为空)。
->returntype：返回值类型。用追踪返回类型形式声明函数的返回值类型，没有返回值时此部分可省略。返回值类型明确情况下，也可省略，由编译器对返回类型进行推导。
{statement}：函数体。在该函数体内，除了可以使用其参数外，还可以使用所有捕获到的变量。

注意：
在lambda函数定义中，参数列表和返回值类型都是可选部分，而捕捉列表和函数体可以为空。因此C++11中最简单的lambda函数为：[]{}；该lambda函数不能做任何事情。

捕获列表说明：

捕捉列表描述了上下文中那些数据可以被lambda使用，以及使用的方式传值还是传引用。

[var]：表示值传递方式捕捉变量var；
[=]：表示值传递方式捕获所有父作用域中的变量(包括this)；
[&var]：表示引用传递捕捉变量var；
[&]：表示引用传递捕捉所有父作用域中的变量(包括this)；
[this]：表示值传递方式捕捉当前的this指针。

注意：

父作用域指包含lambda函数的语句块；
语法上捕捉列表可由多个捕捉项组成，并以逗号分割。比如：[=, &a, &b]：以引用传递的方式捕捉变量a和b，值传递方式捕捉其他所有变量[&，a, this]：值传递方式捕捉变量a和this，引用方式捕捉其他变量；
捕捉列表不允许变量重复传递，否则就会导致编译错误。比如：[=, a]：=已经以值传递方式捕捉了所有变量，捕捉a重复；
在块作用域以外的lambda函数捕捉列表必须为空；
在块作用域中的lambda函数仅能捕捉父作用域中局部变量，捕捉任何非此作用域或者非局部变量都会导致编译报错。

我们以交换两个数为例：

标准写法

参数列表中包含两个形参，表示需要交换的两个数，注意需要以引用的方式传递：

int main()
{
	int a = 0, b = 1;
	auto swap = [](int& x, int& y)->void
	{
		int tmp = x;
		x = y;
		y = tmp;
	};
	swap(a, b);
	return 0;
}

ambda表达式是一个匿名函数，该函数无法直接调用，如果想要直接调用，可借助auto将其赋值给一个变量，此时这个变量就可以像普通函数一样使用。
lambda表达式的函数体在格式上并不是必须写成一行，如果函数体太长可以进行换行，但换行后不要忘了函数体最后还有一个分号。

利用捕捉列表进行捕捉

以引用的方式捕捉所有父作用域中的变量，省略参数列表和返回值类型：

int main()
{
	int a = 0, b = 1;
	auto swap = [&]
	{
		int tmp = a;
		a = b;
		b = tmp;
	};
	swap();
	return 0;
}

这样一来，调用lambda表达式时就不用传入参数了，但实际我们只需要用到变量a和变量b，没有必要把父作用域中的所有变量都进行捕捉，因此也可以只对父作用域中的a、b变量进行捕捉：

int main()
{
	int a = 0, b = 1;
	auto swap = [&a, &b]
	{
		int tmp = a;
		a = b;
		b = tmp;
	};
	swap();
	return 0;
}

实际当我们以[&]或[=]的方式捕获变量时，编译器也不一定会把父作用域中所有的变量捕获进来，编译器可能只会对lambda表达式中用到的变量进行捕获，没有必要把用不到的变量也捕获进来，这个主要看编译器的具体实现。

传值方式捕捉？

如果以传值方式进行捕捉，那么首先编译不会通过，因为传值捕获到的变量默认是不可修改的，如果要取消其常量性，就需要在lambda表达式中加上mutable，并且此时参数列表不可省略:

int main()
{
	int a = 0, b = 1;
	auto swap = [a, b]() mutable
	{
		int tmp = a;
		a = b;
		b = tmp;
	};
	swap();

	cout << a << " " << b << endl;
	return 0;
}

但由于这里是传值捕捉，lambda函数中对a和b的修改不会影响外面的a、b变量，与函数的传值传参是一个道理，因此这种方法无法完成两个数的交换。

lambda表达式底层原理

实际编译器在底层对于lambda表达式的处理方式，完全就是按照函数对象的方式处理的。函数对象就是我们平常所说的仿函数，就是在类中对()运算符进行了重载的类对象。

下面编写了一个Add类，该类对()运算符进行了重载，因此Add类实例化出的add1对象就叫做函数对象，add1可以像函数一样使用。然后我们编写了一个lambda表达式，并借助auto将其赋值给add2对象，这时add1和add2都可以像普通函数一样使用。

class Add
{
public:
	Add(int base)
		:_base(base)
	{}
	int operator()(int num)
	{
		return _base + num;
	}
private:
	int _base;
};
int main()
{
	int base = 1;

	//函数对象
	Add add1(base);
	add1(1000);

	//lambda表达式
	auto add2 = [base](int num)->int
	{
		return base + num;
	};
	add2(1000);
	return 0;
}

调试代码并转到反汇编，可以看到：

在创建函数对象add1时，会调用Add类的构造函数。
在使用函数对象add1时，会调用Add类的()运算符重载函数。

在这里插入图片描述

观察lambda表达式时，也能看到类似的代码：

借助auto将lambda表达式赋值给add2对象时，会调用<lambda_uuid>类的构造函数。
在使用add2对象时，会调用<lambda_uuid>类的()运算符重载函数。

在这里插入图片描述
本质就是因为lambda表达式在底层被转换成了仿函数。

当我们定义一个lambda表达式后，编译器会自动生成一个类，在该类中对()运算符进行重载，实际lambda函数体的实现就是这个仿函数的operator()的实现。
在调用lambda表达式时，参数列表和捕获列表的参数，最终都传递给了仿函数的operator()。

这一点lambda表达式和范围for就非常的相似。

lambda表达式之间不能相互赋值

lambda表达式之间不能相互赋值，就算是两个一模一样的lambda表达式。

因为lambda表达式底层的处理方式和仿函数是一样的，在VS下，lambda表达式在底层会被处理为函数对象，该函数对象对应的类名叫做<lambda_uuid>。
类名中的uuid叫做通用唯一识别码（Universally UniqueIdentifier），简单来说，uuid就是通过算法生成一串字符串，保证在当前程序当中每次生成的uuid都不会重复。
lambda表达式底层的类名包含uuid，这样就能保证每个lambda表达式底层类名都是唯一的。

因此每个lambda表达式的类型都是不同的，这也就是lambda表达式之间不能相互赋值的原因，我们可以通过typeid(变量名).name()的方式来获取lambda表达式的类型：

void (*PF)();
int main()
{
	auto f1 = [] {cout << "hello world" << endl; };
	auto f2 = [] {cout << "hello world" << endl; };

	cout << typeid(f1).name() << endl;//class <lambda_20740c549fba450778a01b853146eb42>
	cout << typeid(f2).name() << endl;//class <lambda_2623c54985c32853f9c0563c34f84745>
	
    // f1 = f2;  // 编译失败--->提示找不到operator=()
	// 允许使用一个lambda表达式拷贝构造一个新的副本
	auto f3(f2);
	f3();

	// 可以将lambda表达式赋值给相同类型的函数指针
	PF = f2;
	PF();
	return 0;
}