C++STL的string模拟实现

news2025/1/6 17:24:12

文章目录

  • 前言
  • string的成员变量
  • 成员函数
    • 构造函数
    • 拷贝构造
    • 赋值重载
  • 模拟实现string各种接口
    • print
    • 迭代器
      • 普通迭代器
      • const迭代器
    • string比较大小
    • push_back
    • insert 和 erase
      • insert
      • erase
    • reserve和resize
      • reserve
      • resize
    • swap
    • find
    • cout和cin
      • cout
      • cin

前言

今天要讲string的底层实现,通过自己来实现string,我们对string的理解才能更加的深刻。
我们对string其实既熟悉又陌生,熟悉sting其实就是字符串,陌生是在于管理字符串这样一个类。

string的成员变量

namespace but
{
	class string
	{
	private:
		char* _str;
		size_t _capaicty;
		size_t _size;
	};
}

我们为了避免自己定义的string于库里面的傻傻分不清,这里我们自己用了一个命名空间把自己写的string封装起来。

成员函数

构造函数

namespace but
{
	class string
	{
	public:
		string()
			:_str(nullptr),
			_capaicty(0),
			_size(0)
		{}
		string(const char* str)
			:_str(str),
			_capaicty(strlen(str)),
			_size(strlen(str))//容量不包括'\0'
		{}
	private:
		const char* _str;//加上const,防止写构造函数时,权限放大编译不通过
		size_t _capaicty;
		size_t _size;
	};
}

简简单单写了上面的构造函数,其实这里面存在两个问题,下面我们通过一些使用来看一下。
第一个问题。

写个c_str,思考一下为什么程序会崩?

const char* c_str()
{
	return _str;
}
string s1;
string s2("hello world");
cout << s1.c_str() << endl;//上述代码都是写在类里面
cout << s2.c_str() << endl;

流插入是自动识别类型,它识别出const char*, 然后去解引用,然后遇到‘\0’结束,这样空指针的问题就暴露出来了。

继续看第二个问题

const char& operator[](size_t pos)//按照之前写的构造函数,必须加上const
{
	assert(pos < _size);
	return _str[pos];
}

这里面有个很坑的问题,我们是呆会是要修改pos位置的字符,并且如果空间不够还需要扩容,比如+=;那这里就变得非常矛盾。

这是什么原因呢?

string s2("hello world")

s2在常量区无法修改,扩容也无法扩。

如何解决这两个问题呢?
其实根源还是在于初始化列表,我们大多数情况下都是推荐把所有成员变量直接放到初始化列表初始化,这里比较特殊。
其次,我们要想修改pos位置的字符,还想扩容,在初始化的时候空间就不能直接赋值过去,最好new出来。

那经过修改之后,我们的代码

namespace but
{
	class string
	{
	public:
		string()
			:_str(new char[1]),//要解决第一个问题,这里就不能是空
			_capacity(0),
			_size(0)
		{
			_str[0] = '\0';
		}
		string(const char* str)
			:_capacity(strlen(str))
		{
			_size = _capacity;//没有必要重复用strlen,strlen是o(N)的接口
			_str = new char[_capacity + 1];//扩容的时候应该+1,包括\0
			strcpy(_str, str);
		}
		~string()
		{
			delete[] _str;
			_str = nullptr;
			_capacity =_size= 0;
		}
		const char* c_str()
		{
			return _str;
		}

		char& operator[](size_t pos)
		{
			assert(pos < _size);
			return _str[pos];
		}
	private:
	    char* _str;//加上const,防止写构造函数时,权限放大编译不通过
		size_t _capacity;
		size_t _size;
	};
	void test_string1()
	{
		string s1;
		string s2("hello world");
		cout << s1.c_str() << endl;
		cout << s2.c_str() << endl;
		s2[0]++;
		cout << s2.c_str() << endl;
	}
}

至此,把上面的问题都解决了。
在这里插入图片描述

拷贝构造还可以继续优化一下,优化成只有一个全缺省的构造函数。

//string(const char* str = nullptr)  //不可以,等下strlen解引用会崩
//string(const char* str = '\0')//不可以,类型不匹配
//string(const char* str = "\0")//可以
string(const char* str = "")//可以
	:_size(strlen(str))
{
	_capaicty = _size == 0 ? 3 : _size;
	_str = new char[_capaicty + 1];
	strcpy(_str, str);
}

拷贝构造

void test_string2()
{
	string s2("hello world");

	string s3(s2);
	cout << s2.c_str() << endl;
	cout << s3.c_str() << endl;
}

我们之前说过拷贝构造是默认成员函数,我们不写,编译器会自动生成一个,对自定义类型不做处理,对内置类型做值拷贝或浅拷贝。那我们看一下自动生成的拷贝构造。
在这里插入图片描述
这个是经典的值拷贝或浅拷贝问题,我们之前也讲过,接下来既然有一个具体的场景,就用调试带大家看一下。
在这里插入图片描述
看两个地址完全一摸一样。

这样会带来两个问题。
1.一个修改影响另外一个。
2.同一块空间会析构两次。

那我们需要自己写一个深拷贝的拷贝构造,怎么写呢?

//拷贝构造也有初始化列表
string(const string& s)
			:_size(s._size)
			, _capaicty(s._capaicty)
		{
			_str = new char[s._capaicty + 1];
			strcpy(_str, s._str);
		}

赋值重载

赋值重载和拷贝构造也一摸一样,我们不写的话,编译器自动生成的会出问题。
写成这样,那就考虑的太不全面了

string& operator=(const string& s)
{
	_size = s._size;
	_capacity = s._capacity;
	_str = new char[s._capacity + 1];
	strcpy(_str, s._str);
	return *this;
}

我们知道拷贝构造是一块已经存在的空间给另一块还没存在的空间。
而赋值重载是两块都已经存在的空间,所以赋值重载还需要从空间的角度去分析问题。

从空间大小考虑,总共有三种情况
在这里插入图片描述

但是存在一个问题,如果s3空间特别大,s1又非常小,把s1直接赋值过去,s3就会浪费很多空间,所以比较好的方式就是再开一块空间。
我们库里面的string实现不会这么麻烦,直接把旧的空间释放掉,开一块一样大的空间。

还要处理自己给自己赋值,以免造成不必要的麻烦。

string& operator=(const string& s)
		{
			if (this != &s)
			{
				//这种写法稍微不好一点
				//抛异常的时候会把s1给破坏掉
				/*delete[] _str;
				_str = new char[s._capaicty + 1];
				strcpy(_str, s._str);
				_size = s._size;
				_capaicty = s._capaicty;*/

				char* tmp = new char[s._capaicty + 1];
				strcpy(tmp, s._str);
				delete[] _str;
				_str = tmp;

				_size = s._size;
				_capaicty = s._capaicty;
			}

模拟实现string各种接口

print

这里为什么报错?
在这里插入图片描述

这也涉及到我们之前讲过的。** cosnt成员变量不能调用非const成员函数,这样会权限放大。**

在这里插入图片描述
紧接着这里报错又怎么解决?
这说明我们需要两个【】,一个是给const对象调用的,不允许修改。
一个是给普通对象调用的,可以修改。它们构成函数重载,因为它们函数名相同参数不一样。
虽然普通对象也可以调用const成员函数,但是编译器非常聪明,他会调用最匹配的哪个。

迭代器

遍历的方式我们还可以用迭代器,这里我们再写一个迭代器

普通迭代器

在这里插入图片描述
要实现一个迭代器其实不难。

我们支持了迭代器,其实也就支持了范围for

for (auto ch : s1)
{
	cout << ch << " ";
}

const迭代器

const迭代器能不能修改?
可以修改,只是指向的内容不能修改。

string::const_iterator it = s1.begin();
while (it != s1.end())
{
	//*it = 'x';//不能修改,只能读不能改
	++it;
}
cout << endl;

反向迭代器这里先不讲,后面再讲,要用一个适配器来实现。

string比较大小

怎样比较大小?
比较ascll值,一个一个比。

// 不修改成员变量数据的函数,最好都加上const
		bool operator>(const string& s) const
		{
			return strcmp(_str, s._str) > 0;
		}

		bool operator==(const string& s) const
		{
			return strcmp(_str, s._str) == 0;
		}

		bool operator>=(const string& s) const
		{
			//return *this > s || *this == s;
			return *this > s || s == *this;
		}

		bool operator<(const string& s) const
		{
			return !(*this >= s);
		}

		bool operator<=(const string& s) const
		{
			return !(*this > s);
		}

		bool operator!=(const string& s) const
		{
			return !(*this == s);
		}

push_back

空间不够扩容的时候不能用realloc,那就和c++交叉了,容易出问题。

void push_back(char ch)
{
	if (_size + 1 > _capaicty)
	{
		reserve(_capaicty * 2);
	}
	_str[_size] = ch;
	++_size;

	_str[_size] = '\0';
}

void append(const char* str)
{
	size_t len = strlen(str);
	if (_size+len > _capaicty)
	{
		reserve(_size + len);
	}

	strcpy(_str + _size, str);
	//strcat(_str, str);//为什么不用strcat?strcat很挫自己要去找\0,\0就在size位置,能不用就不用
	_size += len;
}

在这里插入图片描述

我们喜欢使用的还是+=,直接复用push_back;

string& operator+=(char ch)
{
	push_back(ch);
	return *this;
}

string& operator+=(const char* str)
{
	append(str);
	return *this;
}

凡是你的扩容,析构上代码崩了,一般都是内存问题。

insert 和 erase

问个小小的问题,静态成员变量能不能给缺省值?
不能,因为缺省值是给初始化列表用的。静态列表不是在初始列表初始化的。
它属于整个类,不是属于某个对象。

insert

插入字符
insert有个巨坑给大家看一下下面的代码?
在这里插入图片描述

在这里插入图片描述
程序运行结果。

调试的时候发现这样,扯淡了。
在这里插入图片描述
因为end的类型是size_t;

void insert(size_t pos, char ch)
{
	assert(pos <= _size);
	if (_size + 1 > _capacity)
	{
		reserve(2 * _capacity);
	}
	//int end=_size;//这样也不行,会发生类型转换,一般有符号转化为无符号。
	//改pos也不好,pos的类型一般规定都是size_t
	size_t end = _size;
	//while(end>=pos(int))//强转也不推荐
	//while (end >= pos)
	//{
	//	_str[end + 1] = _str[end];
	//	--end;
	//}
	size_t end = _size + 1;
	while (end > pos)
	{
		_str[end] = _str[end-1];
		--end;
	}

	_str[pos] = ch;
	++_size;
}

我们最好的解决思路,巧妙的避开了小于0;
在这里插入图片描述
在这里插入图片描述

插入字符串

一定要画图,不然很容易出错。

string& insert(size_t pos, const char* str)
{
	assert(pos <= _size);

	size_t len = strlen(str);

	if (_size + len > _capacity)
	{
		reserve(_size + len);
	}

	// 挪动数据
	size_t end = _size + len;
	while (end > pos + len - 1)//强烈不建议用大于等于
	{
		_str[end] = _str[end - len];
		--end;
	}
	
	//这个比较简单,完美避开了循环结束条件的难题
	/*size_t end = _size;
	for (size_t i = 0; i < _size + 1; ++i)
	{
		_str[end + len] = _str[end];
		--end;
	}*/

	// 拷贝插入
	strncpy(_str + pos, str, len);
	_size += len;

	return *this;

}

erase

erase比较简单,从pos位置删除数据就可以了。

我们浅浅分析一下所有的情况
在这里插入图片描述

erase也是不考虑缩容的。

string& erase(size_t pos, size_t len = npos)
{
	assert(pos < _size);

	if (len == npos || pos + len >= _size)
	{
		_str[pos] = '\0';
		_size = pos;
	}
	else
	{
		strcpy(_str + pos, _str + pos + len);//不需要考虑覆盖的问题,所以可以直接用strcpy
		_size -= len;
	}
	return *this;
	}

白盒测试,把三种情况都验证一遍
在这里插入图片描述

reserve和resize

reserve

看一下我们之前写的扩容有什么问题?
在这里插入图片描述

它是没有考虑缩容的。继续看这样子就报错了。
在这里插入图片描述
为什么报错呢?
strcp的时候越界了。

简单修改一下代码就变成这样了。

void reserve(size_t n)
{
	if (n > _capacity)
	{
		char* tmp = new char[n + 1];
		strcpy(tmp, _str);
		delete[] _str;
		_str = tmp;

		_capacity = n;
	}
}

resize

resize缩容吗?
不缩容。缩荣的代价还是很大的,首先是异地缩,先开另一块空间,然后把数据拷贝过去,接着把之前的空间释放掉。
待会插入数据空间不够又要扩容,这样就很麻烦。

接下来实现resize,我们得分情况讨论,以及明白resize功能上的一些细节。
在这里插入图片描述

void resize(size_t n, char ch = '\0')
{
	if (n < _size)
	{
		// 删除数据--保留前n个
		_size = n;
		_str[_size] = '\0';
	}
	else if (n > _size)
	{
		if (n > _capacity)
		{
			reserve(n);
		}
		//如果调用系统的接口,我们可以用memset
		size_t i = _size;
		while (i < n)
		{
			_str[i] = ch;
			++i;
		}

		_size = n;
		_str[_size] = '\0';
	}
}

swap

我们实现 一下swap,其实就知道库里面的swap和类里面的效率差距有多大

//swap(s1, s2);
//s1.swap(s2);
void swap(string & s)
{
	std::swap(_str, s._str);
	std::swap(_capacity, s._capacity);
	std::swap(_size, s._size);
}

find

size_t find(char ch, size_t pos = 0)
		{
			assert(pos < _size);

			for (size_t i = pos; i < _size; ++i)
			{
				if (_str[i] == ch)
				{
					return i;
				}
			}
			return npos;
		}

		size_t find(const char* str, size_t pos = 0)
		{
			assert(pos < _size);
			char* p = strstr(_str + pos, str);
			if (p == nullptr)
			{
				return npos;
			}
			else
			{
				return p - _str;
			}
		}

cout和cin

现在我有一个问题,cout和cin必须实现成友元函数?这句话对不对
不对,我们可以写一些函数来访问私有成员变量。

cout

首先,我们实现cout, 它不是成员函数。

能不能直接这样搞?
在这里插入图片描述
我们之前说过c_str()和cout是有区别的,它们最大的区别就是c_str()打印时是遇到\0终止,cout是根据size来打印的。

ostream& operator<<(ostream& out, const string& s)
{
	for (auto ch : s)
	{
		out << ch;
	}
	return out;
}

cin

在这里插入图片描述
这样为什么不行?
调试一下就知道了,空格和换行不会进入缓冲区。为什么?
它会认为你输入的时候多个字符之间的间隔。

我们可以改成这样
在这里插入图片描述
仔细看一下上面的代码,功能是完善了但还有什么弊端。
在这里插入图片描述

在这里插入图片描述
这是没有把之前的数据清理掉。

还有一个问题有个流插入的数据比较长,那它会影响效率,那有没有什么方法能解决这个问题?
开小了不够,开多了浪费。这里有一个参考方式。
相当于换成字符串,可以这样理解。

istream& operator>>(istream& in, string& s)
{
	s.clear();

	char ch = in.get();
	char buff[128];
	size_t i = 0;
	while (ch != ' ' && ch != '\n')
	{
		buff[i++] = ch;
		if (i == 127)
		{
			buff[127] = '\0';
			s += buff;
			i = 0;
		}

		ch = in.get();
	}
	//防止还有数据没有+=进去
	if (i != 0)
	{
		buff[i] = '\0';
		s += buff;
	}

	return in;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1295504.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

c语言实例:计算并输出一个整数数组的平均值

大家好&#xff0c;今天给大家介绍一个c语言实例&#xff1a;计算并输出一个整数数组的平均值&#xff0c;文章末尾附有分享大家一个资料包&#xff0c;差不多150多G。里面学习内容、面经、项目都比较新也比较全&#xff01;可进群免费领取。 以下是一个使用C语言实现的实例&am…

SMART PLC系统时间功能块

有时需要进行和系统时间相关的一些控制应用,所以PLC的系统时间对于此时的工程应用显得尤为重要。下面我们介绍系统时间功能块,这里的功能块我们可以对系统时间进行读取,还可以对系统时间进行修改。 1、系统时间 2、修改系统时间 功能块利用指针和指针运算完成系统时间读取和…

探索鸿蒙 TextInput组件

TextInput 根据组件名字&#xff0c;可以得知他是一个文本输出框。 声明代码&#x1f447; TextInput({placeholder?:ResourceStr,text?:ResourceStr}); placeholder: 就是提示文本&#xff0c;跟网页开发中的placeholder一样的 text&#xff1a;输入框当前的文本内容 特殊属…

人工智能从 DeepMind 到 ChatGPT ,从 2012 - 2024

本心、输入输出、结果 文章目录 人工智能从 DeepMind 到 ChatGPT &#xff0c;从 2012 - 2024前言2010年&#xff1a;DeepMind诞生2012&#xff5e;2013年&#xff1a;谷歌重视AI发展&#xff0c;“拿下”Hinton2013&#xff5e;2014年&#xff1a;谷歌收购DeepMind2013年&…

Linux常用命令——arpwatch命令

在线Linux命令查询工具 arpwatch 监听网络上ARP的记录 补充说明 arpwatch命令用来监听网络上arp的记录。 语法 arpwatch(选项)选项 -d&#xff1a;启动排错模式&#xff1b; -f<记录文件>&#xff1a;设置存储ARP记录的文件&#xff0c;预设为/var/arpwatch/arp.d…

IOday6作业

1>使用有名管道&#xff0c;完成两个进程的相互通信 //create.c #include<myhead.h>int main(int argc, const char *argv[]) {if((mkfifo("myfifo1",0664)) -1){perror("mkfifo");return -1;}if((mkfifo("myfifo2",0664)) -1){perror…

MySQL 教程 2.1

MySQL 插入数据 MySQL 表中使用 INSERT INTO 语句来插入数据。 你可以通过 mysql> 命令提示窗口中向数据表中插入数据&#xff0c;或者通过PHP脚本来插入数据。 语法 以下为向MySQL数据表插入数据通用的 INSERT INTO SQL语法&#xff1a; INSERT INTO table_name (colu…

Vue 核心 数据监听 computed | watch

Vue 核心 数据监听 computed | watch 一、今日学习目标 1.指令补充 指令修饰符v-bind对样式增强的操作v-model应用于其他表单元素 2.computed计算属性 基础语法计算属性vs方法计算属性的完整写法成绩案例 3.watch侦听器 基础写法完整写法 4.综合案例 &#xff08;演示&…

【ArcGIS Pro微课1000例】0053:基于SQL Server创建与启用地理数据库

之前的文章有讲述基于SQL Server创建企业级地理数据库,本文讲述在SQL Server中创建常规的关心数据库,然后在ArcGIS Pro中将其启用,转换为企业级地理数据库。 1. 在SQL Server中创建数据库** 打开SQL Server 2019,连接到数据库服务器。 展开数据库连接,在数据库上右键→新…

一个不错的文章伪原创系统程序源码

一款文章伪原创系统程序源码免费分享&#xff0c;程序是站长原创的。 一共花了站长几天时间写的这个文章伪原创平台&#xff0c;程序无需数据库。 程序前端采用BootStrap框架搭建&#xff0c;后端采用PHP原生书写。 前端伪原创采用Ajax无刷新提交&#xff0c;Ajax转换到词库…

时域频域(学习记录1)

1 小伙伴们&#xff0c;今天让我们一起来聊聊Something about DATA 系列。我们先回顾一下本系列对NVH测试中的数据采集做的整体介绍&#xff1a; A 数据采集过程&#xff1b; B 硬件设备&#xff1b; C 数采软件&#xff1b; D ATOM中的数据采集&#xff1b; 接下来的几篇文章…

zotero关闭翻译自动创建标签

zotero中文社区&#xff1a;https://plugins.zotero-chinese.com/#/

代码去除注释Remove Comments、合并行Join Lines、代码压缩Minify等vscode功能

1. 去除注释 通过vscode商店扩展 Remove Comments 移除注释。 Just copy-pasted some code from somewhere and it’s obscenely documented with unnecessary comments everywhere? Remove Comments will help you undocument the code and remove all the comments present…

AUTOSAR CP Int-Watchdog简介

Int Watchdog 1 简介2 EB 中配置 TC39X3 Wdg 在代码中使用1 简介 内部看门狗驱动[sws_Wdg_00161]要访问内部看门狗硬件,对应的 Wdg 模块实例应该直接访问看门狗服务的硬件。提示:内部看门狗驱动程序是微控制器抽象层的一部分,它允许直接的硬件访问。注意:内部看门狗的日常服…

unity3d摄像机和观察对象坐标轴修正

让摄像机与观察对象在场景层级并列&#xff0c;以世界坐标看齐 &#xff0c;在local模式&#xff0c;只调整模型或者摄像机方向

超越GPT4.0,5分钟介绍谷歌Gemini最新功能,以及登录体验

上段时间还在吃OpenAI后宫争斗戏的瓜&#xff0c;今天又迎来了AI圈子地震的大事件&#xff0c;因为号称GPT4.0强劲对手的Google-Gemini正式发布啦&#xff01;作为新一代多模态AI模型&#xff0c;以强大的性能和广泛的应用前景吸引了全球AI圈友们的关注。 AI进化速度真的太快了…

计算机方向的一些重要缩写和简介

参考&#xff1a; 深度学习四大类网络模型 干货|机器学习超全综述&#xff01; 机器学习ML、卷积神经网络CNN、循环神经网络RNN、马尔可夫蒙特卡罗MCMC、生成对抗网络GAN、图神经网络GNN——人工智能经典算法 MLP&#xff08;Multi Layer Perseption&#xff09;用在神经网络中…

Hibernate 框架 (2023年架构师下半年案例分析题)

Hibernate 是一种对象和关系之间映射的框架&#xff0c;是 Java 应用和关系数据库之间的桥梁。它可以将数据库资源映射为一个或者多个 POJO。将面向数据库资源的各种业务操作以 POLO 的属性和方法的形式实现&#xff0c;使人们摆脱烦琐的 JDBC 代码&#xff0c;将精力更多地集中…

一个 postman实现参数化让我丢掉了一份20k的offer

什么时候会用到参数化 比如&#xff1a;一个模块要用多组不同数据进行测试 验证业务的正确性 Login模块&#xff1a;正确的用户名&#xff0c;密码 成功&#xff1b;错误的用户名&#xff0c;正确的密码 失败 postman实现参数化 在实际的接口测试中&#xff0c;部分参数…

探究注塑行业MES系统的价值与应用:实现生产优化与成本控制

工业自动化程度的提高&#xff0c;要求注塑行业去寻求提升生产效率和降低成本的方式。目前注塑行业的大部分公司可能都面临着相同的问题&#xff0c;比如生产计划制定不科学&#xff0c;也无法协调各生产车间的生产管理&#xff1b;对车间现场信息无法实时共享&#xff0c;工艺…