C++ String基础

1,387 阅读7分钟

C++ 字符串

C++ 提供了以下两种类型的字符串表示形式:

  • C 风格字符串
  • C++ 引入的 string 类类型

C 风格字符串

C 风格的字符串起源于 C 语言,并在 C++ 中继续得到支持。字符串实际上是使用 null 字符 \0 终止的一维字符数组。因此,一个以 null 结尾的字符串,包含了组成字符串的字符。

下面的声明和初始化创建了一个 RUNOOB 字符串。由于在数组的末尾存储了空字符,所以字符数组的大小比单词 RUNOOB 的字符数多一个。

char site[7] = {'R', 'U', 'N', 'O', 'O', 'B', '\0'};
char site[] = "RUNOOB";

C/C++ 中定义的字符串的内存表示:

C/C++ 中的字符串表示

其实,不需要把 null 字符放在字符串常量的末尾。C++ 编译器会在初始化数组时,自动把 \0 放在字符串的末尾。

常量字符串

在代码里直接出现的”abcdef”这种字符串,在程序执行的时候,系统会将它们放在常量区,并且一个字符串只会有一份。

char* p1 = “agcd” ;
char* p2 = “agcd” ;

p1与p2指向同一块内存,常量字符不能修改

String

  C++ 中提供了专门的头文件 string支持 string 类型。string 类定义隐藏了字符串的数组性质,让我们可以像处理普通变量那样处理字符串。string 对象和字符数组之间的主要区别是:可以将 string 对象声明为简单变量,而不是数组

初始化

1)string(const char *s) :将 string 对象初始化为 s 指向的字符串

string str("Hello!");

2)string(size_type n,char c) :创建一个包含 n 个元素的 string 对象,其中每个元素都被初始化为字符 c

string str(10,'a');

3)string(const string &str) :将一个 string 对象初始化为 string 对象 str(复制构造函数)

string str1("hello!");
string str2(str1);

4)string() :创建一个默认的 string 对象,长度为 0(默认构造函数)

string str;     // 创建一个空的 string 对象

  string 类的设计允许程序自动处理 string 的大小,因此,上述代码创建了一个长度为 0 的string 对象,但是向 str 中写入数据时,程序会自动调整 str 的长度。因此,与使用数组相比,使用 string 对象更方便,也更安全。

C++ 允许使用 C 语言风格来初始化 string 对象

string str = "hello!";

常用操作

获取长度size()/length()

  在 C 语言中,使用 strlen 函数获取字符串的长度。在 C++ 中,可以使用 string.size() 函数或 string.length() 函数来获得 string 对象的长度。这两个方法是完全一样的,并没有区别。length() 方法是 C 语言习惯保留的,size() 方法则是为了兼容 STL 容器而引入的。

string str("Hello,World!");
int strLen1 = str.length();
int strLen2 = str.size();

复制string

  在 C 语言中,使用 strcpy、strncpy 函数来实现字符串的复制。在 C++ 中则方便很多,可以直接将一个 string 对象赋值给另一个 string 对象,即:

string str1("Hello,World!");
string str2;
str2 = str1;

  由于 string 类会自动调整对象的大小,因此不需要担心目标数组不够大的问题。

string拼接append()/push_back()

  在 C 语言中,使用 strcat、strncat 函数来进行字符串拼接操作。在 C++ 中也有多种方法来实现字符串拼接和附加操作:

1. 使用 + 操作符拼接两个字符串

string str1("hello ");
string str2("world!");
string str3 = str1 + str2;

使用 += 操作符在字符串后面附加内容

  可以使用 += 来在一个 string 对象后面附加一个 string 对象、字符以及 C 风格的字符串:

string str1("hello ");
string str2("world!\n");
str1 += str2;
str1 += "nice job\n";
str1 += 'a';

2. 使用 string.append() 函数

  可以使用 string.append() 函数来在一个 string 对象后面附加一个 string 对象或 C 风格的字符串:

string str1 = "hello,world!";
string str2 = "HELLO,WORLD!";
    
str1.append(str2);
str1.append("C string");

3. 使用 string.push_back() 函数

  可以使用 string.push_back() 函数来在一个 string 对象后面附加一个字符:

string str("Hello");
str.push_back('a');

string 对象的比较

  在 C 语言中,使用 strcmp、strncmp 函数来进行字符串的比较。在 C++ 中,由于将 string 对象声明为了简单变量,故而对字符串的比较操作十分简单了,直接使用关系运算符(==、!=、<、<=、>、>=)即可:

#include <string>
#include <iostream>
using namespace std;
int main() 
{
    string str1("hello");
    string str2("hello");

    if (str1 == str2)
        cout << "str1 = str2" << endl;
    else if (str1 < str2)
        cout << "str1 < str2" << endl;
    else
        cout << "str1 > str2" << endl;

    return 0;
}

  当然,也可以使用类似 strcmp 的函数来进行 string 对象的比较,string 类提供的是 string.compare() 方法,函数原型如下:

int compare(const string&str) const;

int compare(size_t pos,size_t len,const string&str)const;    // 参数 pos 为比较字符串中第一个字符的位置,len 为比较字符串的长度

int compare(size_t pos,size_t len,const string&str, size_t subpos,size_t sublen)const;

int compare(const char * s)const;

int compare(size_t pos,size_t len,const char * s)const;

int compare(size_t pos,size_t len,const char * s,size_t n)const;

 compare 方法的返回值如下:

  • 返回 0,表示相等;

  • 返回结果小于 0,表示比较字符串中第一个不匹配的字符比源字符串小,或者所有字符都匹配但是比较字符串比源字符串短;

  • 返回结果大于 0,表示比较字符串中第一个不匹配的字符比源字符串大,或者所有字符都匹配但是比较字符串比源字符串长。

获取子串substr()

可以使用 string.substr() 函数来获取子串,string.substr() 函数的定义如下:

string substr(size_t pos = 0size_t len = npos)const;

其中,pos 是子字符串的起始位置(索引,第一个字符的索引为 0),len 是子串的长度。这个函数的功能是:复制一个 string 对象中从 pos 处开始的 len 个字符到 string 对象 substr 中去,并返回 substr。

string str("Hello,World!");
string subStr = str.substr(3,5);
cout << subStr << endl;
//"lo,Wo"

访问 string 元素

可以像 C 语言中一样,将 string 对象当做一个数组,然后使用数组下标的方式来访问字符串中的元素;也可以使用 string.at(index) 的方式来访问元素(索引号从 0 开始):

string str("Hello,World!");
cout << str[1] << endl;      // 使用数组下标的方式访问 string 字符串的元素
cout << str.at(1) << endl;     // 使用 at 索引访问 string 字符串的元素

查找find()/rfind()

find()

  find 方法的函数原型如下:

1)从字符串的 pos 位置开始(若不指定 pos 的值,则默认从索引 0 处开始),查找子字符串 str。如果找到,则返回该子字符串首次出现时其首字符的索引;否则,返回 string::npos:

size_type find (const string& str, size_type pos = 0) const;

2)从字符串的 pos 位置开始(若不指定 pos 的值,则默认从索引 0 处开始),查找子字符串 s。如果找到,则返回该子字符串首次出现时其首字符的索引;否则,返回 string::npos:  

size_type find (const char *s, size_type pos = 0) const;

3)从字符串的 pos 位置开始(若不指定 pos 的值,则默认从索引 0 处开始),查找 s 的前 n 个字符组成的子字符串。如果找到,则返回该子字符串首次出现时其首字符的索引;否则,返回 string::npos:

size_type find (const char *s, size_type pos, size_type n);

4)从字符串的 pos 位置开始(若不指定 pos 的值,则默认从索引 0 处开始),查找字符 ch 。如果找到,则返回该字符首次出现的位置;否则,返回 string::npos:

size_type find (char ch, size_type pos = 0) const;

 举个查找子字符串的例子(查找字符的代码与这一样,只需要将 find 函数的参数换成字符即可):

#include <string>
#include <iostream>

using namespace std;

int main() 
{
    string str("cat,dog,cat,pig,little cat,hotdog,little pig,angry dog");
    size_t catPos = str.find("cat",0);

    if (catPos == string::npos) {
        printf("没有找到字符串\n");
        return 0;
    }

    while (catPos != string::npos) {
        cout << "在索引 " << catPos << " 处找到字符串" << endl;
        catPos = str.find("cat", catPos + 1);
    }
    return 0;
}

rfind()

  string.rfind()string.find() 方法类似,只是查找顺序不一样, string.rfind() 是从指定位置 pos (默认为字符串末尾)开始向前查找,直到字符串的首部,并返回第一次查找到匹配项时匹配项首字符的索引。换句话说,就是查找子字符串或字符最后一次出现的位置。还是以上面的程序为例,稍作修改:

#include <string>
#include <iostream>

using namespace std;

int main() 
{
    string str("cat,dog,cat,pig,little cat,hotdog,little pig,angry dog");
    size_t catPos = str.rfind("cat",str.length()-1);

    if (catPos == string::npos) {
        printf("没有找到字符串\n");
        return 0;
    }

    while (catPos != string::npos) {
        cout << "在索引 " << catPos << " 处找到字符串" << endl;
        catPos = str.rfind("cat", catPos - 1);
        if (catPos == 0) {
            cout << "在索引 " << catPos << " 处找到字符串" << endl;
            break;
        }
    }
    return 0;
}

rfind 方法是从字符串末开始查找的。

首次出现find_first_of()

 string.find_first_of() 方法在字符串中从指定位置开始向后(默认为索引 0 处)查找参数中任何一个字符首次出现的位置。举个例子说明:

#include <string>
#include <iostream>

using namespace std;

int main() 
{
    string str("cat,dog,cat,pig,little cat,hotdog,little pig,angry dog");
    size_t pos = str.find_first_of("zywfgat");

    if (pos == string::npos) {
        printf("没有匹配到\n");
        return 0;
    }
    else
        cout << "在索引 " << pos << " 处匹配到" << endl;

    return 0;
}

 程序输出结果是:在索引 1 处匹配到。所查找的字符串 zywfgat 中,第一次出现在字符串 str 中的字符是 'a',该字符在 str 中的索引是 1.

最后出现find_last_of()

 string.find_last_of() 方法在字符串中查找参数中任何一个字符最后一次出现的位置(也就是从指定位置开始往前查找,第一个出现的位置)。

ind_first_not_of()

  string.find_first_not_of() 方法在字符串中查找第一个不包含在参数中的字符。

find_last_not_of()

  string.find_last_not_of() 方法在字符串中查找最后一个不包含在参数中的字符(从指定位置开始往前查找,第一个不包含在参数中的字符)。

插入insert()

 函数原型如下:

string&insert(size_t pos,const string&str);   // 在位置 pos 处插入字符串 str

string&insert(size_t pos,const string&str,size_t subpos,size_t sublen); // 在位置 pos 处插入字符串 str 的从位置 subpos 处开始的 sublen 个字符

string&insert(size_t pos,const char * s);    // 在位置 pos 处插入字符串 s

string&insert(size_t pos,const char * s,size_t n); // 在位置 pos 处插入字符串 s 的前 n 个字符

string&insert(size_t pos,size_t n,char c);      // 在位置 pos 处插入 n 个字符 c

iterator insert (const_iterator p, size_t n, char c); // 在 p 处插入 n 个字符 c,并返回插入后迭代器的位置

iterator insert (const_iterator p, char c);       // 在 p 处插入字符 c,并返回插入后迭代器的位置

删除erase()

  函数原型如下:

string& erase (size_t pos = 0, size_t len = npos);   // 删除从 pos 处开始的 n 个字符

iterator erase (const_iterator p);            // 删除 p 处的一个字符,并返回删除后迭代器的位置

iterator erase (const_iterator first, const_iterator last); // 删除从 first 到 last 之间的字符,并返回删除后迭代器的位置

 举个例子:

#include <string>
#include <iostream>

using namespace std;

int main() 
{
    string str("Hello,World!");
    str.erase(5,6);                    // 删除从索引位置 5 开始的 6 个字符
    cout << "str 为:" << str << endl;

    return 0;
}

string与数字转换

int → string

C++11引入,头文件#include<string>

  • std::to_string(int)

  • std::to_string(long)

  • std::to_string(long long)

  • std::to_string(float)

  • std::to_string(double)

  • std::to_string(long double)

还支持各类unsigned,基本上主流数值类型都能无脑转换

转换时保留负号

string→int

头文件#include<cstdlib>

//标准库函数,但是使用时一般会配合<string>

  • std::stoi
  • std::stol
  • std::stoll

//看名字就知道对应为int,long,long long

int stoi (const string&  str, size_t* idx = 0, int base = 10)
//idx是一个指针,该指针指向一个size_t类型的对象
//传入指针地址后,该对象的值会被修改为string中数值后的第一个字符所在位置
//例如stoi("123abcd",&p),返回的p指向a所在,也可以把p的位置理解为数值部分的结束位置
//int base是进制基数,默认10进制
//需要注意的是stoi实质上是调用stol的

其他常用API

判空empty()

使用 empty() 函数判断字符串是否为空

string str;

if(str.empty()){
    cout << "字符串为空" << endl;  
}

交换swap()

使用swap()函数交换两个字符串

#include <string>
#include <iostream>

using namespace std;

int main() 
{
    string str1 = "hello,world!";
    string str2 = "HELLO,WORLD!";

    str1.swap(str2);

    cout << str1 << endl;
    cout << str2 << endl;

    return 0;
}

string常用成员函数

  • str.assign(“ABC”)——清空字符串,并设置为 “ABC”

  • str.assign(“ABC”,2)——清空字符串,并设置为"AB",保留两个字符

  • str.assign(“ABC”,1,1)——清空字符串,设置为 “ABC” 中的从 位置1 开始,保留 1个 字符

  • str.assign(5,‘A’)——清空字符串,然后字符串设置为 5个 ‘A’

  • str.length()——求字符串长度

  • str.size()——和 length() 一样

  • str.capacity()——获取容量,包含了不用增加内存就能使用的字符数

  • str.reasize(10)——设置当前 str 的大小为10,若大小大与当前串的长度,\0 来填充

  • str.reasize(10,char c)——设置当前 str 的大小为10,若大小大与当前串的长度,字0符c 来填充

  • str.reserve(10)——设置str的容量 10,不会填充数据

  • str.swap(str1)——交换 str1 和 str 的字符串

  • str.push_back(‘A’)——在str末尾添加一个字符 ‘A’ ,参数必须是字符形式

  • str.append(“ABC”)——在str末尾添加一个字符串 “ABC”,参数必须是字符串形式

  • str.insert(2,3,‘A’)——在str下标为2的位置添加 3个 字符’A’

  • str.insert(2,“ABC”)——在str下标为2的位置添加 字符串 “ABC”

  • str.insert(2,“ABC”,1)——在str下标为2的位置添加 字符串 “ABC” 中 1个 字符

  • str.insert(2,“ABC”,1,1)——在str下标为2的位置添加 字符串 “ABC” 中从位置 1 开始的 1 个字符 注:上个函数参数中加粗的 1 ,可以是 string::npos,这时候最大值,从 位置1 开始后面的全部字符

  • str.insert( iterator pos, size_type count, CharT ch )——在 str 中,迭代器指向的 pos位置 插入 count个 字符 ch

  • s4.insert(++str1.begin(),2,‘a’); 结果:s4:ABCD -> AaaBCD

  • str.insert( iterator pos, InputIt first, InputIt last )——在 str 中,pos位置 插入 str1 的 开始位置 到 结束为止 s4.insert(s4.begin(),str1.begin(),str1.end()); 结果:s4:ABCD str1:abc -> abcABCD

  • str.erase(2)——删除 下标2 的位置开始,之后的全删除

  • str.erase(2,1)——删除 下标2 的位置开始,之后的 1个 删除

  • str.clear()——删除 str 所有

  • str.replace(2,4,“abcd”)——从 下标2 的位置,替换 4个字节 ,为"abcd"

  • str.empty()——判空(空返回1,非空返回0)

string.h常用函数

memset()

memset()的函数, 它可以一字节一字节地把整个数组设置为一个指定的值。它把数组的起始地址作为其第一个参数,第二个参数是设置数组每个字节的值,第三个参数是数组的长度(字节数,不是元素个数)。memcpy用来做内存拷贝,你可以拿它拷贝任何数据类型的对象,可以指定拷贝的数据长度。

将s中的前n个字节用ch替换并且返回s

void *memset(void *s,int ch,size_t n)

这里s可以是数组名,也可以是指向某一空间的指针;

  • v为要填充的值;
  • n为要填充的字节数;
  • 清空数组和初始化
memset(buffer, 0, sizeof(buffer)) // 这个函数在socket很常用。
char a[100];
memset(a, '/0', sizeof(a));  // 初始化数组。

清空一个结构体

// 在一段内存块中填充某一个给定的值,常用于较大的对结构体和数组的清零操作。
struct sample_struct
{
	char csName[16];
	int iSeq;
	int iType;
};
memset(&stTest, 0, sizeof(struct sample_struct));

// 如果是数组:
struct sample_struct TEST[10];
memset(TEST, 0, sizeof(struct sample_struct)*10);

bzero()

#include <string.h>
// bzero() 会将内存块(字符串)的前n个字节清零;
// s为内存(字符串)指针,n 为需要清零的字节数。
// 在网络编程中会经常用到。
void bzero(void *s, int n);