[ C++ ] STL---string类的模拟实现
目录
string类的成员变量
构造函数
有参构造函数
无参构造函数
析构函数
拷贝构造函数
赋值运算符重载
string类对象的容量操作
string类对象的遍历与访问
[ ] +下标遍历
迭代器遍历
string类对象的增删查改
string类的成员变量
- string类底层为动态开辟的字符数组,因此第一个成员变量为字符指针char* _str;
- 需要记录字符数组有效数据的个数,因此第二个成员变量为size_t _size;
- 需要记录字符数组的容量,因此第三个成员变量为size_t _capacity;
namespace str
{class string{public:private:char* _str;size_t _size;size_t _capacity;};
}
构造函数
有参构造函数
string(const char* str):_size(strlen(str)),_capacity(_size)
{//当str为空字符串,空字符串包含'\0',此时_capacity=0,需要多开辟一个字节存储字符'\0'_str = new char[_capacity + 1];strcpy(_str, str);
}
无参构造函数
初始化时未给定初始值,默认给'\0',_size=_capacity=0;
string():_size(0), _capacity(0)
{_str = new char[1];_str[0] = '\0';
}
使用缺省参数将有参构造函数与无参构造函数合二为一;
string(const char* str = "")
{_size = strlen(str);_capacity = _size;_str = new char[_capacity + 1];strcpy(_str, str);
}
析构函数
对于内置类型成员,析构函数不做任何处理,但是_str涉及到资源申请,会导致内存泄漏;
~string()
{delete[] _str;_str = nullptr;_size = _capacity = 0;
}
拷贝构造函数
为解决浅拷贝析构两次的问题,string类的拷贝构造函数需要实现深拷贝即开辟同样大小的空间,存储相同的内容,使得每个string类的对象都有一份独立的空间;
//拷贝构造函数传统写法
string(const string& s):_str(nullptr), _size(0), _capacity(0)
{_str = new char[s._capacity + 1];strcpy(_str, s._str);_size = s._size;_capacity = s._capacity;
}
//拷贝构造函数的现代写法思路:
//s2(s1)
//首先采用string类对象s1中_str所指向的字符串构造临时string类对象tmp;
//其次将临时对象tmp与this指针指向的对象进行交换,而原先的地址空间当临时对象tmp出作用域时便可销毁;
void swap(string& s)
{std::swap(_str,s._str);std::swap(_size,s._size);std::swap(_capacity,s._capacity);
}
注意:拷贝构造函数的现代写法依赖于编译器对数据的初始化,若没有对数据进行初始化操作,指针_str的指向的空间是不确定的,交换过程中tmp的_str可能为随机值,最后对临时对象tmp析构可能导致程序崩溃;
//拷贝构造函数的现代写法
string(const string& s):_str(nullptr), _size(0), _capacity(0)
{string tmp(s._str);swap(tmp);
}
赋值运算符重载
赋值重载时两个对象已存在且两个对象已调用构造函数完成初始化,赋值重载本质也是一种拷贝,将一个对象,赋值拷贝给另一个对象,这里同样涉及浅拷贝析构两次的问题,所以需要实现深拷贝;
//赋值运算符重载传统写法
string& operator=(const string& s)
{if (this != &s){//不能使用原空间指针开辟空间,会导致内存泄漏char* tmp = new char[s._capacity + 1];strcpy(tmp, s._str);delete[] _str;_str = tmp;_size = s._size;_capacity = s._capacity;}return *this;
}
//赋值运算符重载现代写法
//s2=s1
//s2即*this,由于传值传参,调用拷贝构造函数,s是s1的拷贝
//将s产生的新空间与当前对象s2交换,旧空间当s出作用域时销毁
string& operator=(string s)
{swap(s);return *this;
}
string类对象的容量操作
size_t size() const
{return _size;
}size_t capacity() const
{return _capacity;
}bool empty() const
{return _size==0;
}void clear()
{_str[0]='\0';_size=0;
}
reserve()只考虑扩容至n,不考虑缩容,扩容逻辑如下:
注:拷贝数据时使用strncpy(),由于strcpy是以'\0'作为拷贝结束的标志,若原字符串_str后面有多个'\0',且只有最后一个'\0'作为标识符,其他的'\0'都是有效字符,而strcpy()只会将第一个'\0'拷贝过来,所以使用strncpy(),避免出错;
void reserve(size_t n)
{if (n > _capacity){char* tmp = new char[n + 1];strncpy(tmp, _str, _size+1);delete[] _str;_str = tmp;_capacity = n;}
}
resize()
- n>capacity()时,扩容+尾插(指明字符c,尾插字符c,不指明字符,插入'\0')
- size()<n<capacity()时,有效数据的个数size()改变为n,容量capacity()不变;
- n<size()时,容量capacity()不变,有效数据的个数size()改变为n,删除数据,保留前n个;
void resize(size_t n, char ch = '\0')
{if (n < _size){_str[n] = '\0';_size = n;}else{if(n>_capacity){reserve(n);}for (size_t i = _size; i < n; i++){_str[i] = ch;}_size = n;_str[_size] = '\0';}
}
string类对象的遍历与访问
[ ] +下标遍历
const char& operator[](size_t pos) const
{assert(pos <= _size);return _str[pos];
}char& operator[](size_t pos)
{assert(pos <= _size);return _str[pos];
}
迭代器遍历
//普通迭代器--迭代器指向的内容可以被修改
typedef char* iterator;iterator begin()
{return _str;
}
iterator end()
{return _str + _size;
}
//const迭代器--迭代器指向的内容不可被修改
typedef const char* const_iterator;const_iterator begin()const
{return _str;
}const_iterator end()const
{return _str + _size;
}
string类对象的增删查改
//尾插单个字符
void push_back(char ch)
{//判断容量if (_capacity == _size){//string s1-->_capacity=0;size_t NewCapacity = _capacity == 0 ? 4 : 2 * _capacity;reserve(NewCapacity);}//尾插_str[_size] = ch;_size++;//处理字符'\0'_str[_size] = '\0';
}
//尾插字符串str
void append(const char* str)
{size_t len = strlen(str);//判断容量if (_size + len > _capacity){reserve(_size + len);}//将需要插入的字符串str拷贝至原字符数组_str的尾部;strcpy(_str + _size, str);_size += len;
}
// operator +=
string& operator+=(char ch)
{push_back(ch);return *this;
}
string& operator+=(const char* s)
{append(s);return *this;
}
//pos位置插入单个字符void insert(size_t pos, char ch){assert(pos < _size);//检查容量if (_capacity == _size){size_t NewCapacity = _capacity == 0 ? 4 : 2 * _capacity;reserve(NewCapacity);}//从后向前向后移动数据int end = _size;while (end >= (int)pos){_str[end + 1] = _str[end];end--;}//插入字符ch_str[pos] = ch;_size++;}//pos位置插入字符串void insert(size_t pos, const char* str){assert(pos < _size);//检查容量size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}//移动数据,步长为lenint end = _size;while (end >= (int)pos){_str[end + len] = _str[end];--end;}//插入字符串(注意待插入字符串的'\0')strncpy(_str + pos, str, len);_size += len;}
erase()删除数据时,若不传缺省参数,删除pos位置的所有字符;
若传递缺省参数len,当len小于右边剩余的字符,即剩余的长度足够删,则删除指定的pos位置向后的len个数据;
若传递缺省参数len,当len大于等于右边剩余的字符,即剩余的长度不够删除,则删除pos位置之后的所有字符;
static修饰的成员变量为所有类对象所共享,属于整个类,而不属于某个具体对象;
静态成员变量只能在类中声明,类外定义;类中声明时不得给定缺省值,因为缺省值会传递给初始化列表,而初始化列表是成员变量定义的位置并且初始化列表只能初始化某一具体对象的成员变量,所以静态成员变量在类外定义,类中声明;
特殊语法:当静态成员变量被const修饰,便可在类中定义,并且这个常静态成员变量只有整型家族才可以类中如此定义;
需要一个值用于表示不存在的位置,属于整个类,因此定义第四个成员变量npos;
namespace str
{class string{public:private:char* _str;size_t _size;size_t _capacity;const static size_t npos = -1;//常静态成员变量};
}
void erase(size_t pos, size_t len=npos)
{//pos+len>_size 删除pos位置之后的所有字符//len未指定 删除pos位置之后的所有字符assert(pos < _size);if (len == npos || pos + len>_size){_str[pos] = '\0';_size = pos;}else{strcpy(_str + pos, _str + pos + len);_size -= len;}
}
//返回字符ch在string类对象中第一次出现的位置
size_t find(char ch, size_t pos=0) const
{for (size_t i = pos; i < _size; i++){if (_str[i] == ch){return i;}}return npos;
}//返回子串str在string类对象中首次匹配的第一个字符的位置
size_t find(const char* str, size_t pos=0) const
{const char* ptr = strstr(_str + pos, str);if (ptr == nullptr){return npos;}else{return ptr - _str;}
}
string substr(size_t pos, size_t len)
{assert(pos < _size);size_t end = pos + len;if (len == npos || pos + len >= _size){end = _size;}string str;str.reserve(end - pos);for (size_t i = pos; i < end; i++){str += _str[i];}return str;
}
string类的常用接口已经模拟实现,欢迎大家批评指正,谢谢!!!