C++——string模拟实现

news2025/2/26 23:22:18

前言:上篇文章我们对string类及其常用的接口方法的使用进行了分享,这篇文章将着重进行对这些常用的接口方法的内部细节进行分享和模拟实现。


目录

一.基础框架

二.遍历字符串

1.[]运算符重载

2.迭代器

3.范围for

三.常用方法

1.增加

2.删除

3.调整

4.交换

5.查找

6.截取

7.比较

四.流操作

总结


一.基础框架

首先我们要清楚,string类定义的是字符串对象,所以就类似于线性表,有长度,容量等成员变量:

	class string
	{
	public:
		//构造函数
		string(const char* str = "")
			:_size(strlen(str))
		{
			_capacity = _size;
			_str = new char[_capacity + 1];
			strcpy(_str, str);
		}
		//析构函数
		~string()
		{
			delete[] _str;
			_str = nullptr;
			_size = 0;
			_capacity = 0;
		}
		//转换C语言格式
		const char* c_str() const
		{
			return _str;
		}
		//清除
		void clear()
		{
			_size = 0;
			_str[_size] = '\0';
		}
        //深拷贝s2(s1)
		string(const string& s)
		{
			_str = new char[_capacity + 1];
			strcpy(_str, s._str);
			_size = s._size;
			_capacity = s._capacity;
		}
		//s1 = s2
		string& operator=(const string& s)
		{
			char* tmp = new char[s._capacity + 1];
			strcpy(tmp, s._str);
			delete[] _str;
			_str = tmp;
			_size = s._size;
			_capacity = s._capacity;
		}
	private:

		char* _str;
		size_t _size;
		size_t _capacity;
	};

其中不能缺少的就是构造函数、析构函数和拷贝构造函数,这里我们直接用缺省函数将无参构造和带参构造结合为一体

但是由于如果我们不自己写一个深拷贝函数,就会默认执行浅拷贝成员函数,这样会导致两个字符串同源,所以需要给出深拷贝函数。

值得注意的是真正的strlen不会统计字符串中的‘\0’,所以我们给_str开空间时应+1。


二.遍历字符串

1.[]运算符重载

上篇文章中我们知道遍历字符串有三种方式:[]运算符重载,迭代器,以及范围for。下面我们就来一一实现。

首先我们需要将字符串的长度方法size和容量方法capacity定义出来:

		//长度
		size_t size() const
		{
			return _size;
		}
		//容量
		size_t capacity() const
		{
			return _capacity;
		}

一般情况下当方法里调用的成员无需发生改变时,都会将这些方法用const修饰。 

[]运算符重载自然是通过运算符重载函数来实现:

		//遍历
		char& operator[](size_t pos)
		{
			assert(pos < _size);
			return _str[pos];
		}

这里我们添加assert函数来断言,防止越界访问

返回值使用引用格式,能够实现可读可写

 但此时会产生一个问题,如果我想让一个const修饰的对象来调用该方法,就会导致权限放大而出错

如果给这个方法加上const,那我们就无法修改其内容了

所以我们使用函数重载为其单独创造一个只读的const修饰的函数方法

		const char& operator[](size_t pos) const
		{
			assert(pos < _size);
			return _str[pos];
		}

2.迭代器

我们已经了解迭代器的本质和指针类似,我们这里我们就先用指针的实现迭代器的功能

		//迭代器
		typedef char* iterator;
		iterator begin()
		{
			return _str;
		}
		iterator end()
		{
			return _str + _size;
		}

用typedef将char*指针重命名为iterator再定义出begin和end两个方法,便能实现迭代器功能:

值得注意的是,const修饰的对象想要调用迭代器,也必须调用对应const修饰的迭代器,所以迭代器我们也需要进行重载

		typedef const char* const_iterator;
		const_iterator begin() const
		{
			return _str;
		}
		const_iterator end() const
		{
			return _str + _size;
		}

迭代器这样的模拟实现方法也能帮助我们更深入的了解其内部构造。


3.范围for

范围for实际上并没有那么复杂,其本质也是迭代器

所以只要有迭代器的存在,保证iterator、begin。end这些单词不变,不管是我们自己实现的还是C++库内的,都可以使用范围for:

但是如果iterator、begin。end这些单词发生变化,就无法在使用范围for。 


三.常用方法

1.增加

增加无非有四种方式:尾插单个字符push_back、尾插字符串append和+=运算符重载,以及任意位置的插入insert,增加字符就意味着要考虑扩容问题,这就要实现reserve方法来配合使用。

尾插单个字符可以通过每次扩容两倍容量,但是如果尾插一个长度为len的字符串,每次扩容两倍或是更多倍都并不一定就能满足容量, 所以这里直接扩容size+len个空间

		//扩容
		void reserve(size_t len)
		{
			if (len > _capacity)
			{
				char* tmp = new char[len + 1];
				strcpy(tmp, _str);
				delete[] _str;
				_str = tmp;
				_capacity = len;
			}
		}
		//尾插单字符
		void push_back(char ch)
		{
			if (_size == _capacity)
			{
				reserve(_capacity == 0 ? 4 : _capacity * 2);
			}
			_str[_size] = ch;
			_size++;
			_str[_size] = '\0';
		}
		//尾插字符串
		void append(const char* str)
		{
			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				reserve(_size + len);
			}
			strcpy(_str + _size, str);
			_size += len;
		}

因为字符串的末尾都要有'\0'的存在,所以扩容时,要始终保持实际容量比字符串容量多1

当尾插单个字符时,因为该字符是直接覆盖了'\0',所以尾插之后要再字符串末尾再补上'\0'

而尾插字符串时,因为strcpy在进行拷贝时也会直接将'\0'拷贝,所以无需再补。 

+=运算符的重载,就是以上述两个方法为基层的扩展

		//+=运算符重载
		string& operator+=(char ch)
		{
			push_back(ch);
			return *this;
		}
		string& operator+=(const char* str)
		{
			append(str);
			return *this;
		}

测试如下:


任意位置的插入, 则需要进行字符串的挪动

		//任意位置插入
		//单字符
		void insert(char ch, size_t pos)
		{
			assert(pos <= _size);
			if (_size == _capacity)
			{
				reserve(_capacity == 0 ? 4 : _capacity * 2);
			}
			size_t end = _size + 1;
			while (end > pos)
			{
				_str[end] = _str[end - 1];
				end--;
			}
			_str[pos] = ch;
			_size++;

		}
		//字符串
		void insert(const char* str, size_t pos)
		{
			assert(pos <= _size);
			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				reserve(_size + len);
			}
			size_t end = _size + len;
			while (end >= pos + len)
			{
				_str[end] = _str[end - len];
				end--;
			}
			for (size_t i = 0; i < len; i++)
			{
				_str[pos++] = str[i];
			}
			_size += len;
		}

在进行字符串插入时,要注意的是我们要从pos位置将后边的字符向后空出len个位置

同时我们不能使用strcpy进行插入,因为它会将要插入的字符串的'\0'一并插入,导致一个位置的字符被覆盖,所以这里我们采用循环插入。

 测试如下:


2.删除

string类中只有一个常用的删除方法:erase,它的功能是在指定位置后删除若干个字符,如果没有指定要删除的字符数量,则默认将后边的字符全删除

		//删除
		void erase(size_t pos, size_t len = npos)
		{
			assert(pos < _size);
			if (len == npos || len >= _size - pos)
			{
				_str[pos] = '\0';
				_size = pos;
			}
			strcpy(_str + pos, _str + pos + len);
			_size -= len;
		}

采用缺省函数的方式,如果我们没有传入len,他就会等于npos,npos在C++中表示一个常数,表示不存在的位置

如果len无传入或是len的长度不小于要删除的字符串长度,这都可以认为是要将pos位置后的字符串全部删除,此时便可直接在pos位置用'\0'

使用npos需要在类中定义public成员变量:

    public:
        static const int npos;

以及在类外赋值:

    const int string::npos = -1;

 测试如下:


3.调整

在string中有一个方法可以兼备增加和删除两种简单功能,名为resize,它的作用是调整字符串

传入一个参数n,和一个字符ch如果当前字符串长度小于n,则扩容字符串长度至n个,并将多出的位置用字符ch填充,如果不传字符ch,则默认填充'\0'

如果当前字符串长度大于n,则将字符串长度缩减到n

		//调整
		void resize(size_t n, char ch = '\0')
		{
			if (n <= _size)
			{
				_str[n] = '\0';
				_size = n;
			}
			else
			{
				reserve(n);
				for (size_t i = _size; i < n; i++)
				{
					_str[i] = ch;
				}
				_str[n] = '\0';
				_size = n;
			}
		}

测试如下:


4.交换

自己实现string类中的swap交换函数,有一个很好用的方法,那就是借用std库中的swap函数

		//交换
		void swap(string& s)
		{
			std::swap(_str, s._str);
			std::swap(_size, s._size);
			std::swap(_capacity, s._capacity);
		}

 因为std库中的swap函数是模版函数,可以进行任意类型的交换,所以我们直接投机取巧,将两者的成员变量依次进行交换,测试如下:

 但是这样的写法并不是我们所熟悉的swap(s1,s2),所以我们可以通过函数重载扩展一下

		void swap(string& x, string& y)
		{
			x.swap(y);
		}

值得注意的是这个函数要写在string类的外边,按照就近原则去调用它,否则会默认先调用库里的模版swap函数。 

测试如下:


5.查找

string类中的查找也分为查找单个字符、查找字符串以及在指定的pos位置向后去查找找到返回下标,找不到返回npos,所以依然要使用缺省函数

		//查找
		//单字符
		size_t find(char ch, size_t pos = 0) const
		{
			assert(pos < _size);
			for (size_t i = pos; i < _size; i++)
			{
				if (_str[i] == ch)
					return i;
			}
			return npos;
		}
		//字符串
		size_t find(const char* str, size_t pos = 0) const
		{
			assert(pos < _size);
			const char* p = strstr(_str + pos, str);
			if (p)
				return p - _str;
			else
				return npos;
		}

在查找字符串时我们使用到了strstr函数其返回值为所找到的字符串的首字符指针

测试如下:


6.截取

截取字符串方法substr,其作用是从字符串的pos位置开始向后截取len长度的字符,当然无论是pos位置还是长度len都可以没有,依然是缺省函数

		//截取
		string substr(size_t pos = 0, size_t len = npos)
		{
			string sub;
			if (len >= _size - pos)
			{
				for (size_t i = pos; i < _size; i++)
				{
					sub += _str[i];
				}
			}
			else
			{
				for (size_t i = pos; i < pos + len; i++)
				{
					sub += _str[i];
				}
			}
			return sub;
		}

测试如下:


7.比较

字符串直接的比较需要我们实现运算符重载

	bool operator==(const string& s1, const string& s2)
	{
		int ret = strcmp(s1.c_str(), s2.c_str());
		return ret == 0;
	}
	bool operator<(const string& s1, const string& s2)
	{
		int ret = strcmp(s1.c_str(), s2.c_str());
		return ret < 0;
	}
	bool operator<=(const string& s1, const string& s2)
	{
		return s1 < s2 || s1 == s2;
	}
	bool operator>(const string& s1, const string& s2)
	{
		return !(s1 <= s2);
	}
	bool operator>=(const string& s1, const string& s2)
	{
		return !(s1 < s2);
	}
	bool operator!=(const string& s1, const string& s2)
	{
		return !(s1 == s2);
	}

这一块的方法,我们建议实现在类外,定义两个参数,这样能够允许一个字符串和一个string对象进行比较

因为在类内定义因为默认类内的成员函数的第一个参数都是隐藏的非静态string对象,所以静态的普通字符串传入就会使权限放大而出错

测试如下:

 


四.流操作

直接上代码:

	//流输出
	ostream& operator<<(ostream& out, const string& s)
	{
		for (auto ch : s)
		{
			out << ch;
		}
		return out;
	}
	//流提取
	istream& operator>>(istream& in, string& s)
	{
		s.clear();
		char ch;
		ch = in.get();
		while (ch != ' ' && ch != '\n')
		{
			s += ch;
			ch = in.get();
		}
		return in;
	}

输出较为简单,直接使用范围for循环输出

而对于提取到的字符会直接覆盖s中原有的字符串,所以要先进行清除;此外,因为in默认会跳过空格和回车而不提取它们,这会导致死循环,所以我们使用in.get()函数来提取

测试如下:


总结

关于string类及其内部常用方法的模拟实现就分享到这里啦。

最后希望能得到您的一键三连支持,我们下期再见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1504753.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux系统——JVM调优

目录 一、GC如何调优 1.JVM调优的时机 2.JVM调优目标 3.JVM调优步骤 4.选择合适的垃圾回收器 5.调整内存大小 6.设置符合预期的停顿时间 7.调整内存区域大小比率 8.调整对象升老年代的年龄 9.调整大对象的标准 10.调整GC的触发时机 11.调整 JVM本地内存大小 二、JV…

推荐算法中经典排序算法GBDT+LR

文章目录 逻辑回归模型逻辑回归对于特征处理的优势逻辑回归处理特征的步骤 GBDT算法GBDTLR算法GBDT LR简单代码实现 逻辑回归模型 逻辑回归&#xff08;LR,Logistic Regression&#xff09;是一种传统机器学习分类模型&#xff0c;也是一种比较重要的非线性回归模型&#xff0…

指针篇章-(冒泡排序详解)

冒泡排序 图解 tmp图解 内容图解 每次循环的次数减少 for循环详解 冒泡排序是一种简单的排序算法&#xff0c;它重复地遍历要排序的数列&#xff0c; 一次比较两个元素&#xff0c;如果它们的顺序错误就把它们交换过来。 遍历数列的工作是重复地进行直到没有再需要交换&…

读算法的陷阱:超级平台、算法垄断与场景欺骗笔记05_共谋(中)

1. 默许共谋 1.1. 又称寡头价格协调&#xff08;Oligopolistic Price Coordination&#xff09;或有意识的平行行为&#xff08;Conscious Parallelism&#xff09; 1.1.1. 在条件允许的情况下&#xff0c;它会发生在市场集中度较高的行业当中 1.1.…

运维随录实战(13)之docker搭建mysql集群(pxc)

了解 MySQL 集群之前,先看看单节点数据库的弊病 大型互联网程序用户群体庞大,所以架构需要特殊设计。单节点数据库无法满足大并发时性能上的要求。单节点的数据库没有冗余设计,无法满足高可用。单节点 MySQL无法承载巨大的业务量,数据库负载巨大常见 MySQL 集群方案 Re…

STM32_3-1点亮LED灯与蜂鸣器发声

STM32之GPIO GPIO在输出模式时可以控制端口输出高低电平&#xff0c;用以驱动Led蜂鸣器等外设&#xff0c;以及模拟通信协议输出时序等。 输入模式时可以读取端口的高低电平或电压&#xff0c;用于读取按键输入&#xff0c;外接模块电平信号输入&#xff0c;ADC电压采集灯 GP…

【C语言】linux内核ip_generic_getfrag函数

一、讲解 这个函数ip_generic_getfrag是传输层用于处理分段和校验和的一个辅助函数&#xff0c;它通常用在IP层当需要从用户空间拷贝数据构建成网络数据包时。这个函数的实现提供了拷贝数据和进行校验和计算&#xff08;如果需要的话&#xff09;的功能。函数的参数解释如下&a…

JVM知识整体学习

前言&#xff1a;本篇没有任何建设性的想法&#xff0c;只是我很早之前在学JVM时记录的笔记&#xff0c;只是想从个人网站迁移过来。文章其实就是对《深入理解JVM虚拟机》的提炼&#xff0c;纯基础知识&#xff0c;网上一搜一大堆。 一、知识点脑图 本文只谈论HotSpots虚拟机。…

利用华为CodeArts持续交付项目演示流程

软件开发生产线&#xff08;CodeArts&#xff09;是面向开发者提供的一站式云端平台&#xff0c;即开即用&#xff0c;随时随地在云端交付软件全生命周期&#xff0c;覆盖需求下发、代码提交、代码检查、代码编译、验证、部署、发布&#xff0c;打通软件交付的完整路径&#xf…

前端实现跨域的六种解决方法

本专栏是汇集了一些HTML常常被遗忘的知识&#xff0c;这里算是温故而知新&#xff0c;往往这些零碎的知识点&#xff0c;在你开发中能起到炸惊效果。我们每个人都没有过目不忘&#xff0c;过久不忘的本事&#xff0c;就让这一点点知识慢慢渗透你的脑海。 本专栏的风格是力求简洁…

高吞吐SFTP连接池设计方案

背景 在现代的数据驱动环境中&#xff0c;安全文件传输协议&#xff08;SFTP&#xff09;扮演着至关重要的角色&#xff0c;它提供了一种安全、可靠的文件传输方式。我们目前项目是一个大型数据集成平台&#xff0c;跟上下游有很多文件对接是通过SFTP协议&#xff0c;当需要处…

Speech Processing (LASC11158)

大纲 PHON – phonetics and phonology 1. Phonetics and Representations of Speech2. Acoustics of Consonants and VowelsSIGNALS – signal processing, with a focus on speech signals 3. Digital Speech Signals4. the Source-Filter ModelTTS – text-to-speech synth…

基本计算器II

文章目录 题目解析算法解析算法模拟第一步 第二步第三步第四步第五步第六步最后一步 代码 题目解析 题目链接 我们先来看一下题目这个题目的意思很明确就是给你一个算数式让你计算结果并返回并且给了很多辅助条件来帮助你。 算法解析 那么我们来看看这个题目有哪些做法&…

基于机器学习的工业用电量预测完整代码数据

视频讲解: 毕业设计:算法+系统基于机器学习的工业用电量预测完整代码数据_哔哩哔哩_bilibili 界面展示: 结果分析与展示: 代码: from sklearn import preprocessing import random from sklearn.model_selection import train_test_split from sklearn.preprocessing…

【LGR-176-Div.2】[yLCPC2024] 洛谷 3 月月赛 I(A~C and G<oeis>)

[yLCPC2024] A. dx 分计算 前缀和提前处理一下区间和&#xff0c;做到O&#xff08;1&#xff09;访问就可以过。 #include <bits/stdc.h> //#define int long long #define per(i,j,k) for(int (i)(j);(i)<(k);(i)) #define rep(i,j,k) for(int (i)(j);(i)>(k);…

【数学】【组合数学】1830. 使字符串有序的最少操作次数

作者推荐 视频算法专题 本博文涉及知识点 数学 组合数学 LeetCode1830. 使字符串有序的最少操作次数 给你一个字符串 s &#xff08;下标从 0 开始&#xff09;。你需要对 s 执行以下操作直到它变为一个有序字符串&#xff1a; 找到 最大下标 i &#xff0c;使得 1 < i…

深入理解 Webpack 热更新原理:提升开发效率的关键

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…

基于php的用户登录实现(v2版)(持续迭代)

目录 版本说明 数据库连接 登录页面&#xff1a;login.html 登录处理实现&#xff1a;login.php 用户欢迎页面&#xff1a;welcome.php 密码修改页面&#xff1a;change_password.html 修改执行&#xff1a;change_password.php 用户注册页面&#xff1a;register.html …

报错Importing ArkTS files to JS and TS files is not allowed. <etsLint>

ts文件并不支持导入ets文件&#xff0c;为了方便开发应用卡片&#xff0c;entryformAbility创建的时候默认是ts文件&#xff0c;这里只需要把ts文件改成ets便可以轻松的导入所需要的ets即可 我创建了一个鸿蒙开发的交流群&#xff0c;喜欢的鸿蒙朋友可以扫码或者写群号&#xf…

指针详解(从基础到入门)

一、什么是指针 在计算机科学中&#xff0c;指针是编程语言中的一个对象&#xff0c;利用地址&#xff0c;它直接指向存在电脑储存器中另一个地方的值。由于通过地址能找到所需的变量单元&#xff0c;可以说&#xff0c;指针指向该变量单元。因此&#xff0c;将地址形象化地称…