C++ 字符串
C++ 提供了以下两种类型的字符串表示形式:
- C 风格字符串
- C++ 引入的 string 类类型
C 风格字符串
C 风格的字符串起源于 C 语言,并在 C++ 中继续得到支持。字符串实际上是使用 null 字符 \0 终止的一维字符数组。因此,一个以 null 结尾的字符串,包含了组成字符串的字符。
下面的声明和初始化创建了一个 RUNOOB 字符串。由于在数组的末尾存储了空字符,所以字符数组的大小比单词 RUNOOB 的字符数多一个。
char site[7] = {'R', 'U', 'N', 'O', 'O', 'B', '\0'};
char site[] = "RUNOOB";
C/C++ 中定义的字符串的内存表示:
其实,不需要把 null 字符放在字符串常量的末尾。C++ 编译器会在初始化数组时,自动把 \0 放在字符串的末尾。
常量字符串
在代码里直接出现的”abcdef”这种字符串,在程序执行的时候,系统会将它们放在常量区,并且一个字符串只会有一份。
char* p1 = “agcd” ;
char* p2 = “agcd” ;
p1与p2指向同一块内存,常量字符不能修改
String
C++ 中提供了专门的头文件 string支持 string 类型。string 类定义隐藏了字符串的数组性质,让我们可以像处理普通变量那样处理字符串。string 对象和字符数组之间的主要区别是:可以将 string 对象声明为简单变量,而不是数组。
初始化
1)string(const char *s) :将 string 对象初始化为 s 指向的字符串
string str("Hello!");
2)string(size_type n,char c) :创建一个包含 n 个元素的 string 对象,其中每个元素都被初始化为字符 c
string str(10,'a');
3)string(const string &str) :将一个 string 对象初始化为 string 对象 str(复制构造函数)
string str1("hello!");
string str2(str1);
4)string() :创建一个默认的 string 对象,长度为 0(默认构造函数)
string str; // 创建一个空的 string 对象
string 类的设计允许程序自动处理 string 的大小,因此,上述代码创建了一个长度为 0 的string 对象,但是向 str 中写入数据时,程序会自动调整 str 的长度。因此,与使用数组相比,使用 string 对象更方便,也更安全。
C++ 允许使用 C 语言风格来初始化 string 对象:
string str = "hello!";
常用操作
获取长度size()/length()
在 C 语言中,使用 strlen 函数获取字符串的长度。在 C++ 中,可以使用 string.size() 函数或 string.length() 函数来获得 string 对象的长度。这两个方法是完全一样的,并没有区别。length() 方法是 C 语言习惯保留的,size() 方法则是为了兼容 STL 容器而引入的。
string str("Hello,World!");
int strLen1 = str.length();
int strLen2 = str.size();
复制string
在 C 语言中,使用 strcpy、strncpy 函数来实现字符串的复制。在 C++ 中则方便很多,可以直接将一个 string 对象赋值给另一个 string 对象,即:
string str1("Hello,World!");
string str2;
str2 = str1;
由于 string 类会自动调整对象的大小,因此不需要担心目标数组不够大的问题。
string拼接append()/push_back()
在 C 语言中,使用 strcat、strncat 函数来进行字符串拼接操作。在 C++ 中也有多种方法来实现字符串拼接和附加操作:
1. 使用 + 操作符拼接两个字符串
string str1("hello ");
string str2("world!");
string str3 = str1 + str2;
使用 += 操作符在字符串后面附加内容
可以使用 += 来在一个 string 对象后面附加一个 string 对象、字符以及 C 风格的字符串:
string str1("hello ");
string str2("world!\n");
str1 += str2;
str1 += "nice job\n";
str1 += 'a';
2. 使用 string.append() 函数
可以使用 string.append() 函数来在一个 string 对象后面附加一个 string 对象或 C 风格的字符串:
string str1 = "hello,world!";
string str2 = "HELLO,WORLD!";
str1.append(str2);
str1.append("C string");
3. 使用 string.push_back() 函数
可以使用 string.push_back() 函数来在一个 string 对象后面附加一个字符:
string str("Hello");
str.push_back('a');
string 对象的比较
在 C 语言中,使用 strcmp、strncmp 函数来进行字符串的比较。在 C++ 中,由于将 string 对象声明为了简单变量,故而对字符串的比较操作十分简单了,直接使用关系运算符(==、!=、<、<=、>、>=)即可:
#include <string>
#include <iostream>
using namespace std;
int main()
{
string str1("hello");
string str2("hello");
if (str1 == str2)
cout << "str1 = str2" << endl;
else if (str1 < str2)
cout << "str1 < str2" << endl;
else
cout << "str1 > str2" << endl;
return 0;
}
当然,也可以使用类似 strcmp 的函数来进行 string 对象的比较,string 类提供的是 string.compare() 方法,函数原型如下:
int compare(const string&str) const;
int compare(size_t pos,size_t len,const string&str)const; // 参数 pos 为比较字符串中第一个字符的位置,len 为比较字符串的长度
int compare(size_t pos,size_t len,const string&str, size_t subpos,size_t sublen)const;
int compare(const char * s)const;
int compare(size_t pos,size_t len,const char * s)const;
int compare(size_t pos,size_t len,const char * s,size_t n)const;
compare 方法的返回值如下:
-
返回 0,表示相等;
-
返回结果小于 0,表示比较字符串中第一个不匹配的字符比源字符串小,或者所有字符都匹配但是比较字符串比源字符串短;
-
返回结果大于 0,表示比较字符串中第一个不匹配的字符比源字符串大,或者所有字符都匹配但是比较字符串比源字符串长。
获取子串substr()
可以使用 string.substr() 函数来获取子串,string.substr() 函数的定义如下:
string substr(size_t pos = 0,size_t len = npos)const;
其中,pos 是子字符串的起始位置(索引,第一个字符的索引为 0),len 是子串的长度。这个函数的功能是:复制一个 string 对象中从 pos 处开始的 len 个字符到 string 对象 substr 中去,并返回 substr。
string str("Hello,World!");
string subStr = str.substr(3,5);
cout << subStr << endl;
//"lo,Wo"
访问 string 元素
可以像 C 语言中一样,将 string 对象当做一个数组,然后使用数组下标的方式来访问字符串中的元素;也可以使用 string.at(index) 的方式来访问元素(索引号从 0 开始):
string str("Hello,World!");
cout << str[1] << endl; // 使用数组下标的方式访问 string 字符串的元素
cout << str.at(1) << endl; // 使用 at 索引访问 string 字符串的元素
查找find()/rfind()
find()
find 方法的函数原型如下:
1)从字符串的 pos 位置开始(若不指定 pos 的值,则默认从索引 0 处开始),查找子字符串 str。如果找到,则返回该子字符串首次出现时其首字符的索引;否则,返回 string::npos:
size_type find (const string& str, size_type pos = 0) const;
2)从字符串的 pos 位置开始(若不指定 pos 的值,则默认从索引 0 处开始),查找子字符串 s。如果找到,则返回该子字符串首次出现时其首字符的索引;否则,返回 string::npos:
size_type find (const char *s, size_type pos = 0) const;
3)从字符串的 pos 位置开始(若不指定 pos 的值,则默认从索引 0 处开始),查找 s 的前 n 个字符组成的子字符串。如果找到,则返回该子字符串首次出现时其首字符的索引;否则,返回 string::npos:
size_type find (const char *s, size_type pos, size_type n);
4)从字符串的 pos 位置开始(若不指定 pos 的值,则默认从索引 0 处开始),查找字符 ch 。如果找到,则返回该字符首次出现的位置;否则,返回 string::npos:
size_type find (char ch, size_type pos = 0) const;
举个查找子字符串的例子(查找字符的代码与这一样,只需要将 find 函数的参数换成字符即可):
#include <string>
#include <iostream>
using namespace std;
int main()
{
string str("cat,dog,cat,pig,little cat,hotdog,little pig,angry dog");
size_t catPos = str.find("cat",0);
if (catPos == string::npos) {
printf("没有找到字符串\n");
return 0;
}
while (catPos != string::npos) {
cout << "在索引 " << catPos << " 处找到字符串" << endl;
catPos = str.find("cat", catPos + 1);
}
return 0;
}
rfind()
string.rfind() 与 string.find() 方法类似,只是查找顺序不一样, string.rfind() 是从指定位置 pos (默认为字符串末尾)开始向前查找,直到字符串的首部,并返回第一次查找到匹配项时匹配项首字符的索引。换句话说,就是查找子字符串或字符最后一次出现的位置。还是以上面的程序为例,稍作修改:
#include <string>
#include <iostream>
using namespace std;
int main()
{
string str("cat,dog,cat,pig,little cat,hotdog,little pig,angry dog");
size_t catPos = str.rfind("cat",str.length()-1);
if (catPos == string::npos) {
printf("没有找到字符串\n");
return 0;
}
while (catPos != string::npos) {
cout << "在索引 " << catPos << " 处找到字符串" << endl;
catPos = str.rfind("cat", catPos - 1);
if (catPos == 0) {
cout << "在索引 " << catPos << " 处找到字符串" << endl;
break;
}
}
return 0;
}
rfind 方法是从字符串末开始查找的。
首次出现find_first_of()
string.find_first_of() 方法在字符串中从指定位置开始向后(默认为索引 0 处)查找参数中任何一个字符首次出现的位置。举个例子说明:
#include <string>
#include <iostream>
using namespace std;
int main()
{
string str("cat,dog,cat,pig,little cat,hotdog,little pig,angry dog");
size_t pos = str.find_first_of("zywfgat");
if (pos == string::npos) {
printf("没有匹配到\n");
return 0;
}
else
cout << "在索引 " << pos << " 处匹配到" << endl;
return 0;
}
程序输出结果是:在索引 1 处匹配到。所查找的字符串 zywfgat 中,第一次出现在字符串 str 中的字符是 'a',该字符在 str 中的索引是 1.
最后出现find_last_of()
string.find_last_of() 方法在字符串中查找参数中任何一个字符最后一次出现的位置(也就是从指定位置开始往前查找,第一个出现的位置)。
ind_first_not_of()
string.find_first_not_of() 方法在字符串中查找第一个不包含在参数中的字符。
find_last_not_of()
string.find_last_not_of() 方法在字符串中查找最后一个不包含在参数中的字符(从指定位置开始往前查找,第一个不包含在参数中的字符)。
插入insert()
函数原型如下:
string&insert(size_t pos,const string&str); // 在位置 pos 处插入字符串 str
string&insert(size_t pos,const string&str,size_t subpos,size_t sublen); // 在位置 pos 处插入字符串 str 的从位置 subpos 处开始的 sublen 个字符
string&insert(size_t pos,const char * s); // 在位置 pos 处插入字符串 s
string&insert(size_t pos,const char * s,size_t n); // 在位置 pos 处插入字符串 s 的前 n 个字符
string&insert(size_t pos,size_t n,char c); // 在位置 pos 处插入 n 个字符 c
iterator insert (const_iterator p, size_t n, char c); // 在 p 处插入 n 个字符 c,并返回插入后迭代器的位置
iterator insert (const_iterator p, char c); // 在 p 处插入字符 c,并返回插入后迭代器的位置
删除erase()
函数原型如下:
string& erase (size_t pos = 0, size_t len = npos); // 删除从 pos 处开始的 n 个字符
iterator erase (const_iterator p); // 删除 p 处的一个字符,并返回删除后迭代器的位置
iterator erase (const_iterator first, const_iterator last); // 删除从 first 到 last 之间的字符,并返回删除后迭代器的位置
举个例子:
#include <string>
#include <iostream>
using namespace std;
int main()
{
string str("Hello,World!");
str.erase(5,6); // 删除从索引位置 5 开始的 6 个字符
cout << "str 为:" << str << endl;
return 0;
}
string与数字转换
int → string
C++11引入,头文件#include<string>
-
std::to_string(int)
-
std::to_string(long)
-
std::to_string(long long)
-
std::to_string(float)
-
std::to_string(double)
-
std::to_string(long double)
还支持各类unsigned,基本上主流数值类型都能无脑转换
转换时保留负号
string→int
头文件#include<cstdlib>
//标准库函数,但是使用时一般会配合<string>
- std::stoi
- std::stol
- std::stoll
//看名字就知道对应为int,long,long long
int stoi (const string& str, size_t* idx = 0, int base = 10)
//idx是一个指针,该指针指向一个size_t类型的对象
//传入指针地址后,该对象的值会被修改为string中数值后的第一个字符所在位置
//例如stoi("123abcd",&p),返回的p指向a所在,也可以把p的位置理解为数值部分的结束位置
//int base是进制基数,默认10进制
//需要注意的是stoi实质上是调用stol的
其他常用API
判空empty()
使用 empty() 函数判断字符串是否为空
string str;
if(str.empty()){
cout << "字符串为空" << endl;
}
交换swap()
使用swap()函数交换两个字符串
#include <string>
#include <iostream>
using namespace std;
int main()
{
string str1 = "hello,world!";
string str2 = "HELLO,WORLD!";
str1.swap(str2);
cout << str1 << endl;
cout << str2 << endl;
return 0;
}
string常用成员函数
-
str.assign(“ABC”)——清空字符串,并设置为 “ABC”
-
str.assign(“ABC”,2)——清空字符串,并设置为"AB",保留两个字符
-
str.assign(“ABC”,1,1)——清空字符串,设置为 “ABC” 中的从 位置1 开始,保留 1个 字符
-
str.assign(5,‘A’)——清空字符串,然后字符串设置为 5个 ‘A’
-
str.length()——求字符串长度
-
str.size()——和 length() 一样
-
str.capacity()——获取容量,包含了不用增加内存就能使用的字符数
-
str.reasize(10)——设置当前 str 的大小为10,若大小大与当前串的长度,\0 来填充
-
str.reasize(10,char c)——设置当前 str 的大小为10,若大小大与当前串的长度,字0符c 来填充
-
str.reserve(10)——设置str的容量 10,不会填充数据
-
str.swap(str1)——交换 str1 和 str 的字符串
-
str.push_back(‘A’)——在str末尾添加一个字符 ‘A’ ,参数必须是字符形式
-
str.append(“ABC”)——在str末尾添加一个字符串 “ABC”,参数必须是字符串形式
-
str.insert(2,3,‘A’)——在str下标为2的位置添加 3个 字符’A’
-
str.insert(2,“ABC”)——在str下标为2的位置添加 字符串 “ABC”
-
str.insert(2,“ABC”,1)——在str下标为2的位置添加 字符串 “ABC” 中 1个 字符
-
str.insert(2,“ABC”,1,1)——在str下标为2的位置添加 字符串 “ABC” 中从位置 1 开始的 1 个字符 注:上个函数参数中加粗的 1 ,可以是 string::npos,这时候最大值,从 位置1 开始后面的全部字符
-
str.insert( iterator pos, size_type count, CharT ch )——在 str 中,迭代器指向的 pos位置 插入 count个 字符 ch
-
s4.insert(++str1.begin(),2,‘a’); 结果:s4:ABCD -> AaaBCD
-
str.insert( iterator pos, InputIt first, InputIt last )——在 str 中,pos位置 插入 str1 的 开始位置 到 结束为止 s4.insert(s4.begin(),str1.begin(),str1.end()); 结果:s4:ABCD str1:abc -> abcABCD
-
str.erase(2)——删除 下标2 的位置开始,之后的全删除
-
str.erase(2,1)——删除 下标2 的位置开始,之后的 1个 删除
-
str.clear()——删除 str 所有
-
str.replace(2,4,“abcd”)——从 下标2 的位置,替换 4个字节 ,为"abcd"
-
str.empty()——判空(空返回1,非空返回0)
string.h常用函数
memset()
memset()的函数, 它可以一字节一字节地把整个数组设置为一个指定的值。它把数组的起始地址作为其第一个参数,第二个参数是设置数组每个字节的值,第三个参数是数组的长度(字节数,不是元素个数)。memcpy用来做内存拷贝,你可以拿它拷贝任何数据类型的对象,可以指定拷贝的数据长度。
将s中的前n个字节用ch替换并且返回s
void *memset(void *s,int ch,size_t n)
这里s可以是数组名,也可以是指向某一空间的指针;
- v为要填充的值;
- n为要填充的字节数;
- 清空数组和初始化
memset(buffer, 0, sizeof(buffer)) // 这个函数在socket很常用。
char a[100];
memset(a, '/0', sizeof(a)); // 初始化数组。
清空一个结构体
// 在一段内存块中填充某一个给定的值,常用于较大的对结构体和数组的清零操作。
struct sample_struct
{
char csName[16];
int iSeq;
int iType;
};
memset(&stTest, 0, sizeof(struct sample_struct));
// 如果是数组:
struct sample_struct TEST[10];
memset(TEST, 0, sizeof(struct sample_struct)*10);
bzero()
#include <string.h>
// bzero() 会将内存块(字符串)的前n个字节清零;
// s为内存(字符串)指针,n 为需要清零的字节数。
// 在网络编程中会经常用到。
void bzero(void *s, int n);