一、基本概念
字符串分割是指将一个完整的字符串按照指定的符号或者字符串进行拆分,得到若干个小的字符串。例如,将“apple,banana,orange”按照逗号进行分割,可以得到三个小的字符串“apple”、“banana”和“orange”。
二、基本方法
实现字符串分割的方法有多种,包括使用C++的STL库函数,使用C语言中的strtok()函数以及使用正则表达式等等。以下我们分别介绍。
1.使用STL库函数
#include <iostream> #include <string> #include <sstream> #include <vector> using namespace std; int main() { string str = "apple,banana,orange"; vector<string> vec; stringstream ss(str); string item; while (getline(ss, item, ',')) { vec.push_back(item); } for (int i = 0; i < vec.size(); i++) { cout << vec[i] << endl; } return 0; }
此方法利用了C++的STL库函数中的stringstream,将字符串转换成输入流,再遍历输入流中的每一个字符串,并按照指定的符号进行分割。这种方法实现起来比较简单,代码可读性也比较好,但是速度稍慢。
2.使用C语言中的strtok()函数
#include <iostream> #include <cstring> using namespace std; int main() { char str[] = "apple,banana,orange"; char *token = strtok(str, ","); while (token) { cout << token << endl; token = strtok(NULL, ","); } return 0; }
此方法利用了C语言中的strtok()函数,该函数可以按照指定的分隔符对字符串进行分割,并返回每个小字符串的指针。这种方法实现比较简单,但是由于strtok()函数是使用静态变量进行实现的,所以在多线程环境下会有线程不安全的问题。
3.使用正则表达式
#include <iostream> #include <regex> #include <string> using namespace std; int main() { string str = "apple,banana,orange"; regex pattern(","); sregex_token_iterator it(str.begin(), str.end(), pattern, -1); sregex_token_iterator end; while (it != end) { cout << *it << endl; it++; } return 0; }
此方法利用C++11中引入的正则表达式库,通过编译正则表达式来实现字符串分割,灵活性比较好。但是正则表达式的学习成本比较高,实现起来需要编写比较复杂的正则模式。
三、常见问题
1.分割符号不唯一怎么办?
对于分割符号不唯一的情况,可以使用多个符号进行分割,并将得到的小字符串取交集。
2.分割出来的字符串中包含空格怎么办?
在使用STL库函数或者正则表达式进行分割时,可以使用std::trim()函数去掉小字符串前后的空格。
3.分割出来的字符串中有换行符怎么办?
在使用C语言中的strtok()函数进行分割时,需要将换行符添加到分割符号中去,例如strtok(str, ",\n")。