- 基本概念
- 左值和右值
- 左值引用和右值引用
- 右值引用使用场景和意义
- 左值引用的使用场景
- 左值引用的短板
- 右值引用和移动语义
- 编译器优化
- 移动赋值
- move右值引用引用左值
- 右值引用的其他使用场景
- 完美转发
- 万能引用
- forward 模板函数
基本概念
左值和右值
左值
左值(lvalue)是指能够标识一个存储位置的表达式,其值可以被读取和修改。通常,左值对应于具名的变量、被引用的对象以及某些表达式的结果。
- 左值是可以别取地址的,也是可以被修改的(const修饰的左值除外)。
- 左值既可以出现在等号的左右,也可以出现等号的右边。
int main()
{
//以下 a,*p,c都为左值
int a = 3;
int* p = new int[3]{1,2,3};
const int c = 4;
return 0;
}
右值
右值(rvalue)是指不能标识存储位置的表达式,其值只能被读取,不能被修改。右值可以是字面量、临时对象、返回右值引用的函数调用的结果等。
- 右值不能被读取地址,也不能被修改
- 右值可以出现在等号的右边,不可以出现在等号的左边。
int main()
{
double x = 1.1, y = 2.2;
//以下几个都是常见的右值
10;
x + y;
fmin(x, y);//求浮点数的最小值
//错误示例(右值不能出现在赋值符号的左边)
//10 = 1;
//x + y = 1;
//fmin(x, y) = 1;
return 0;
}
- 右值本质就是一个临时变量或常量值,比如代码中的10就是常量值,表达式x+y和函数fmin的返回值就是临时变量,这些都叫做右值。
- 这些临时变量和常量值并没有被实际存储起来,这也就是为什么右值不能被取地址的原因,因为只有被存储起来后才有地址。
- 但需要注意的是,这里说函数的返回值是右值,指的是传值返回的函数,因为传值返回的函数在返回对象时返回的是对象的拷贝,这个拷贝出来的对象就是一个临时变量。
而对于左值引用返回的函数来说,这些函数返回的是左值。比如string类实现的[]运算符重载函数:
namespace cl
{
//模拟实现string类
class string
{
public:
//[]运算符重载(可读可写)
char& operator[](size_t i)
{
assert(i < _size); //检测下标的合法性
return _str[i]; //返回对应字符
}
//...
private:
char* _str; //存储字符串
size_t _size; //记录字符串当前的有效长度
//...
};
}
int main()
{
cl::string s("hello");
s[3] = 'x'; //引用返回,支持外部修改
return 0;
}
这里的[]运算符重载函数返回的是一个字符的引用,因为它需要支持外部对该位置的字符进行修改,所以必须采用左值引用返回。之所以说这里返回的是一个左值,是因为这个返回的字符是被存储起来了的,是存储在string对象的_str对象当中的,因此这个字符是可以被取到地址的。
左值引用和右值引用
传统的C++语法中就有引用的语法,而C++11中新增了右值引用的语法特性,为了进行区分,于是将C++11之前的引用就叫做左值引用。但是无论左值引用还是右值引用,本质都是给对象取别名。
左值引用
左值引用就是对左值的引用,给左值取别名,通过“&”来声明。比如:
int main()
{
//以下 a,*p,c都为左值
int a = 3;
int* p = new int[3]{1,2,3};
const int c = 4;
//以下变量均为左值引用
int*& rp = p;
int& ra = a;
const int& rc = c;
int& pp = *p;
return 0;
}
右值引用
右值引用就是对右值的引用,给右值取别名,通过“&&”来声明。比如:
int main()
{
double x = 1.1, y = 2.2;
//以下几个都是常见的右值
10;
x + y;
fmin(x, y);//求浮点数的最小值
//以下几个都是对右值的右值引用
int&& rr1 = 10;
double&& rr2 = x + y;
double&& rr3 = fmin(x, y);
return 0;
}
需要注意的是,右值是不能取地址的,但是给右值取别名后,会导致右值被存储到特定位置,这时这个右值可以被取到地址,并且可以被修改,如果不想让被引用的右值被修改,可以用const修饰右值引用。例如:
int main()
{
double x = 1.1, y = 2.2;
int&& rr1 = 10;
const double&& rr2 = x + y;
rr1 = 20;
rr2 = 5.5; //报错
return 0;
}
左值可以引用右值吗?
- 左值引用在加const修饰后是可以引用右值的,因为const左值引用能够保证被引用的数据不会被修改。
- 但是除const外,其它条件下是不可以引用右值的,因为这涉及权限放大的问题,右值是不能被修改的,而左值引用是可以修改的。
const左值引用既可以引用左值,也可以引用右值。比如:
template<class T>
void func(const T& val)
{
cout << val << endl;
}
int main()
{
string s("hello");
func(s); //s为左值
func("world"); //"world"为右值
return 0;
}
右值引用可以引用左值吗?
- 右值引用只能引用右值,不能引用左值
- 但是可以通过函数move来将左值转为右值,来进行引用
move函数是C++11标准提供的一个函数,被move后的左值能够赋值给右值引用。比如:
int main()
{
int a = 10;
//int&& r1 = a; //右值引用不能引用左值
int&& r2 = move(a); //右值引用可以引用move以后的左值
return 0;
}
右值引用使用场景和意义
虽然const左值引用既能接收左值,又能接收右值,但左值引用终究存在短板,而C++11提出的右值引用就是用来解决左值引用的短板的。
为了更好的说明问题,这里需要借助一个深拷贝的类,下面模拟实现了一个简化版的string类。类当中实现了一些基本的成员函数,并在string的拷贝构造函数和赋值运算符重载函数当中打印了一条提示语句,这样当调用这两个函数时我们就能够知道。
代码如下:
namespace test
{
class string
{
public:
typedef char* iterator;
iterator begin()
{
return _str; //返回字符串中第一个字符的地址
}
iterator end()
{
return _str + _size; //返回字符串中最后一个字符的后一个字符的地址
}
//构造函数
string(const char* str = "")
{
_size = strlen(str); //初始时,字符串大小设置为字符串长度
_capacity = _size; //初始时,字符串容量设置为字符串长度
_str = new char[_capacity + 1]; //为存储字符串开辟空间(多开一个用于存放'\0')
strcpy(_str, str); //将C字符串拷贝到已开好的空间
}
//交换两个对象的数据
void swap(string& s)
{
//调用库里的swap
::swap(_str, s._str); //交换两个对象的C字符串
::swap(_size, s._size); //交换两个对象的大小
::swap(_capacity, s._capacity); //交换两个对象的容量
}
//拷贝构造函数(现代写法)
string(const string& s)
:_str(nullptr)
, _size(0)
, _capacity(0)
{
cout << "string(const string& s) -- 深拷贝" << endl;
string tmp(s._str); //调用构造函数,构造出一个C字符串为s._str的对象
swap(tmp); //交换这两个对象
}
//赋值运算符重载(现代写法)
string& operator=(const string& s)
{
cout << "string& operator=(const string& s) -- 深拷贝" << endl;
string tmp(s); //用s拷贝构造出对象tmp
swap(tmp); //交换这两个对象
return *this; //返回左值(支持连续赋值)
}
//析构函数
~string()
{
delete[] _str; //释放_str指向的空间
_str = nullptr; //及时置空,防止非法访问
_size = 0; //大小置0
_capacity = 0; //容量置0
}
//[]运算符重载
char& operator[](size_t i)
{
assert(i < _size); //检测下标的合法性
return _str[i]; //返回对应字符
}
//改变容量,大小不变
void reserve(size_t n)
{
if (n > _capacity) //当n大于对象当前容量时才需执行操作
{
char* tmp = new char[n + 1]; //多开一个空间用于存放'\0'
strncpy(tmp, _str, _size + 1); //将对象原本的C字符串拷贝过来(包括'\0')
delete[] _str; //释放对象原本的空间
_str = tmp; //将新开辟的空间交给_str
_capacity = n; //容量跟着改变
}
}
//尾插字符
void push_back(char ch)
{
if (_size == _capacity) //判断是否需要增容
{
reserve(_capacity == 0 ? 4 : _capacity * 2); //将容量扩大为原来的两倍
}
_str[_size] = ch; //将字符尾插到字符串
_str[_size + 1] = '\0'; //字符串后面放上'\0'
_size++; //字符串的大小加一
}
//+=运算符重载
string& operator+=(char ch)
{
push_back(ch); //尾插字符串
return *this; //返回左值(支持连续+=)
}
//返回C类型的字符串
const char* c_str()const
{
return _str;
}
private:
char* _str;
size_t _size;
size_t _capacity;
};
}
左值引用的使用场景
在说明左值引用的短板之前,我们先来看看左值引用的使用场景:
- 左值引用做参数,防止传参时进行拷贝操作。
- 左值引用做返回值,防止返回时对返回对象进行拷贝操作。
void func1(cl::string s)
{}
void func2(const cl::string& s)
{}
int main()
{
cl::string s("hello world");
func1(s); //值传参
func2(s); //左值引用传参
s += 'X'; //左值引用返回
return 0;
}
因为我们模拟实现是string类的拷贝构造函数当中打印了提示语句,因此运行代码后通过程序运行结果就知道,值传参时调用了string的拷贝构造函数。
此外,因为string的+=运算符重载函数是左值引用返回的,因此在返回+=后的对象时不会调用拷贝构造函数,但如果将+=运算符重载函数改为传值返回,那么重新运行代码后你就会发现多了一次拷贝构造函数的调用。
我们都知道string的拷贝是深拷贝,深拷贝的代价是比较高的,我们应该尽量避免不必要的深拷贝操作,因此这里左值引用起到的作用还是很明显的。
左值引用的短板
左值引用虽然能避免不必要的拷贝操作,但左值引用并不能完全避免。
- 左值引用做参数,能够完全避免传参时不必要的拷贝操作。
- 左值引用做返回值,并不能完全避免函数返回对象时不必要的拷贝操作。
如果函数返回的对象是一个局部变量,该变量出了函数作用域就被销毁了,这种情况下不能用左值引用作为返回值,只能以传值的方式返回,这就是左值引用的短板。
比如下面我们模拟实现一个int版本的to_string函数,这个to_string函数就不能使用左值引用返回,因为to_string函数返回的是一个局部变量。
代码如下:
namespace test
{
test::string to_string(int value)
{
bool flag = true;
if (value < 0)
{
flag = false;
value = 0 - value;
}
test::string str;
while (value > 0)
{
int x = value % 10;
value /= 10;
str += (x + '0');
}
if (flag == false)
{
str += '-';
}
std::reverse(str.begin(), str.end());
return str;
}
}
此时调用to_string函数返回时,就一定会调用string的拷贝构造函数。比如:
int main()
{
test::string s = cl::to_string(1234);
return 0;
}
C++11提出右值引用就是为了解决左值引用的这个短板的,但解决方式并不是简单的将右值引用作为函数的返回值。
右值引用和移动语义
右值引用和移动语句解决上述问题的方式就是,给当前模拟实现的string类增加移动构造和移动赋值方法。
namespace cl
{
class string
{
public:
//移动构造
string(string&& s)
:_str(nullptr)
, _size(0)
, _capacity(0)
{
cout << "string(string&& s) -- 移动构造" << endl;
swap(s);
}
private:
char* _str;
size_t _size;
size_t _capacity;
};
}
移动构造和拷贝构造的区别:
- 在没有增加移动构造之前,由于拷贝构造采用的是const左值引用接收参数,因此无论拷贝构造对象时传入的是左值还是右值,都会调用拷贝构造函数。
- 增加移动构造之后,由于移动构造采用的是右值引用接收参数,因此如果拷贝构造对象时传入的是右值,那么就会调用移动构造函数(最匹配原则)。
- string的拷贝构造函数做的是深拷贝,而移动构造函数中只需要调用swap函数进行资源的转移,因此调用移动构造的代价比调用拷贝构造的代价小。
给string类增加移动构造后,对于返回局部string对象的这类函数,在返回string对象时就会调用移动构造进行资源的移动,而不会再调用拷贝构造函数进行深拷贝了。比如:
namespace test
{
class string
{
public:
//拷贝构造函数(现代写法)
string(const string& s)
:_str(nullptr)
, _size(0)
, _capacity(0)
{
cout << "string(const string& s) -- 深拷贝" << endl;
string tmp(s._str); //调用构造函数,构造出一个C字符串为s._str的对象
swap(tmp); //交换这两个对象
}
string(string&& s)
:_str(nullptr)
, _size(0)
, _capacity(0)
{
cout << "string(string&& s) -- 移动构造" << endl;
swap(s);
}
string to_string(int value)
{
bool flag = true;
if (value < 0)
{
flag = false;
value = 0 - value;
}
string str;
while (value > 0)
{
int x = value % 10;
value /= 10;
str += (x + '0');
}
if (flag == false)
{
str += '-';
}
std::reverse(str.begin(), str.end());
return str;
}
private:
char* _str;
size_t _size;
size_t _capacity;
};
}
int main()
{
test::string s;
test::string to = s.to_string(1234);
return 0;
}
说明一下:
虽然to_string当中返回的局部string对象是一个左值,但由于该string对象在当前函数调用结束后就会立即被销毁,我可以把这种即将被消耗的值叫做将亡值,比如匿名对象也可以叫做“将亡值”。
既然“将亡值”马上就要被销毁了,那还不如把它的资源转移给别人用,因此编译器在识别这种“将亡值”时会将其识别为右值,这样就可以匹配到参数类型为右值引用的移动构造函数。
编译器优化
实际当一个函数在返回局部对象时,会先用这个局部对象拷贝构造出一个临时对象,然后再用这个临时对象来拷贝构造我们接收返回值的对象。如下:
因此在C++11标准出来之前,对于深拷贝的类来说这里就会进行两次深拷贝,所以大部分编译器为了提高效率都对这种情况进行了优化,这种连续调用构造函数的场景通常会被优化成一次。比如:
因此按道理来说,在C++11标准出来之前这里应该调用两次string的拷贝构造函数,但最终被编译器优化成了一次,减少了一次无意义的深拷贝。(并不是所有的编译器都做了这个优化)
在C++11出来之后,编译器的这个优化仍然起到了作用。
-
如果编译器不优化这里应该调用两次移动构造,第一次调用移动构造用返回的局部string对象构造出一个临时对象,第二次调用移动构造用这个临时对象构造接收返回值的对象。
-
而经过编译器优化后,最终这两次移动构造就被优化成了一次,也就是直接将返回的局部string对象的资源移动给了接收返回值的对象。
-
此外,C++11之后就算编译器没有进行这个优化问题也不大,因为不优化也就是调用两次移动构造进行两次资源的转移而已。
但如果我们不是用函数的返回值来构造一个对象,而是用一个之前已经定义出来的对象来接收函数的返回值,这时编译器就无法进行优化了。比如:
这时当函数返回局部对象时,会先用这个局部对象拷贝构造出一个临时对象,然后再调用赋值运算符重载函数将这个临时对象赋值给接收函数返回值的对象。
- 编译器并没有对这种情况进行优化,因此在C++11标准出来之前,对于深拷贝的类来说这里就会存在两次深拷贝,因为深拷贝的类的赋值运算符重载函数也需要以深拷贝的方式实现。
- 但在深拷贝的类中引入C++11的移动构造后,这里仍然需要再调用一次赋值运算符重载函数进行深拷贝,因此深拷贝的类不仅需要实现移动构造,还需要实现移动赋值。
这里需要说明的是,对于返回局部对象的函数,就算只是调用函数而不接收该函数的返回值,也会存在一次拷贝构造或移动构造,因为函数的返回值不管你接不接收都必须要有,而当函数结束后该函数内的局部对象都会被销毁,所以就算不接收函数的返回值也会调用一次拷贝构造或移动构造生成临时对象。
移动赋值
移动赋值是一个赋值运算符重载函数,该函数的参数是右值引用类型的,移动赋值也是将传入右值的资源窃取过来,占为己有,这样就避免了深拷贝,所以它叫移动赋值,就是窃取别人的资源来赋值给自己的意思。
在当前的string类中增加一个移动赋值函数,该函数要做的就是调用swap函数将传入右值的资源窃取过来,为了能够更好的得知移动赋值函数是否被调用,可以在该函数中打印一条提示语句。
namespace cl
{
class string
{
public:
//移动赋值
string& operator=(string&& s)
{
cout << "string& operator=(string&& s) -- 移动赋值" << endl;
swap(s);
return *this;
}
private:
char* _str;
size_t _size;
size_t _capacity;
};
}
移动赋值和原有operator=函数的区别:
- 在没有增加移动赋值之前,由于原有operator=函数采用的是const左值引用接收参数,因此无论赋值时传入的是左值还是右值,都会调用原有的operator=函数。
- 增加移动赋值之后,由于移动赋值采用的是右值引用接收参数,因此如果赋值时传入的是右值,那么就会调用移动赋值函数(最匹配原则)。
- string原有的operator=函数做的是深拷贝,而移动赋值函数中只需要调用swap函数进行资源的转移,因此调用移动赋值的代价比调用原有operator=的代价小。
现在给string增加移动构造和移动赋值以后,就算是用一个已经定义过的string对象去接收to_string函数的返回值,此时也不会存在深拷贝。比如:
int main()
{
test::string s;
s = test::to_string(123);
return 0;
}
此时当to_string函数返回局部的string对象时,会先调用移动构造生成一个临时对象,然后再调用移动赋值将临时对象的资源转移给我们接收返回值的对象,这个过程虽然调用了两个函数,但这两个函数要做的只是资源的移动,而不需要进行深拷贝,大大提高了效率。
move右值引用引用左值
右值引用虽然不能引用左值,但也不是完全不可以,当需要用右值引用引用一个左值时,可以通过move函数将左值转化为右值。
move函数的名字具有迷惑性,move函数实际并不能搬移任何东西,该函数唯一的功能就是将一个左值强制转化为右值引用,然后实现移动语义。
move函数的定义如下:
template<class _Ty>
inline typename remove_reference<_Ty>::type&& move(_Ty&& _Arg) _NOEXCEPT
{
//forward _Arg as movable
return ((typename remove_reference<_Ty>::type&&)_Arg);
}
说明一下:
- move函数中_Arg参数的类型不是右值引用,而是万能引用。万能引用跟右值引用的形式一样,但是右值引用需要是确定的类型。
- 一个左值被move以后,它的资源可能就被转移给别人了,因此要慎用一个被move后的左值。
int main()
{
test::string s1("abc");
test::string s2(move(s1));
return 0;
}
右值引用的其他使用场景
右值引用版本的插入函数
C++11标准出来之后,STL中的容器除了增加移动构造和移动赋值之外,STL容器插入接口函数也增加了右值引用版本。
以list容器的push_back接口为例:
右值引用版本插入函数的意义
如果list容器当中存储的是string对象,那么在调用push_back向list容器中插入元素时,可能会有如下几种插入方式:
int main()
{
list<cl::string> lt;
cl::string s("1111");
lt.push_back(s); //调用string的拷贝构造
lt.push_back("2222"); //调用string的移动构造
lt.push_back(cl::string("3333")); //调用string的移动构造
lt.push_back(std::move(s)); //调用string的移动构造
return 0;
}
list容器的push_back函数需要先构造一个结点,然后将该结点插入到底层的双链表当中。
- 在C++11之前list容器的push_back接口只有一个左值引用版本,因此在push_back函数中构造结点时,这个左值只能匹配到string的拷贝构造函数进行深拷贝。
- 而在C++11出来之后,string类提供了移动构造函数,并且list容器的push_back接口提供了右值引用版本,此时如果传入push_back函数的string对象是一个右值,那么在push_back函数中构造结点时,这个右值就可以匹配到string的移动构造函数进行资源的转移,这样就避免了深拷贝,提高了效率。
- 上述代码中的插入第一个元素时就会匹配到push_back的左值引用版本,在push_back函数内部就会调用string的拷贝构造函数进行深拷贝,而插入后面三个元素时由于传入的是右值,因此会匹配到push_back的右值引用版本,此时在push_back函数内部就会调用string的移动构造函数进行资源的转移。
完美转发
完美转发的出现是为了让右值和右值引用一直延续下去
因为当右值进行下传或者换作用域的时候,就会变为左值,所以如果想要一直保持右值引用就需要用到完美转发
万能引用
模板中的&&不代表右值引用,而是万能引用,其既能接收左值又能接收右值。比如:
template<class T>
void PerfectForward(T&& t)
{
//...
}
右值引用和万能引用的区别
右值引用需要是确定的类型,而万能引用是根据传入实参的类型进行推导,如果传入的实参是一个左值,那么这里的形参t就是左值引用,如果传入的实参是一个右值,那么这里的形参t就是右值引用。
认识万能引用第一个坑,右值自动变左值,例子:
void func(int& x)
{
cout << "左值引用" << endl;
}
void func(const int& x)
{
cout << "const 左值引用" << endl;
}
void func(int&& x)
{
cout << "右值引用" << endl;
}
void func(const int&& x)
{
cout << "const 右值引用" << endl;
}
template<class T>
void PerfectForward(T&& t)
{
func(t);
}
int main()
{
int a = 10;
PerfectForward(a);//左值
PerfectForward(move(a));//右值
const int b = 20;
PerfectForward(b);//const左值
PerfectForward(move(b));//const右值
return 0;
}
这时我们发现,不管传入的为左值还是右值,到调用的时候都变为了左值调用,这个的原因是右值被引用后会导致右值被存储到特定位置,这时这个右值可以被取到地址,并且可以被修改,所以在PerfectForward函数中调用Func函数时会将t识别成左值。
总的来时,右值经过一次传递后都会变为左值,如果想要一直延续右值的话,我们需要用到forward<T>(t)
这么一个模板参数来搞定这件事。
forward 模板函数
void PerfectForward(T&& t)
{
func(forward<T>(t));
}
这时,我们的右值就得到了延续,并且forward
模板函数不会影响左值。
还有很多例子来说,这里我们提供一个图来快速的了解一下