在 C++ 中标记字符串

Tokenize a String in C++

本文关键字:字符串 C++      更新时间:2023-10-16

我有一个字符串 currentLine="12 23 45"

我需要从这个字符串中提取 12、23、45,而不使用 Boost 库。由于我正在使用字符串,因此 strtok 对我来说失败了。我尝试了很多事情仍然没有成功。

这是我的最后一次尝试

while(!inputFile.eof())
    while(getline(inputFile,currentLine))
        {
            int countVar=0;
            int inputArray[10];
            char* tokStr;
            tokStr=(char*)strtok(currentLine.c_str()," ");
            while(tokstr!=NULL)
            {
            inputArray[countVar]=(int)tokstr;
            countVar++;
            tokstr=strtok(NULL," ");
            }
        }
}

没有斯特托克的那个

string currentLine;
while(!inputFile.eof())
    while(getline(inputFile,currentLine))
        {
            cout<<atoi(currentLine.c_str())<<" "<<endl;
            int b=0,c=0;
            for(int i=1;i<currentLine.length();i++)
                {
                    bool lockOpen=false;
                    if((currentLine[i]==' ') && (lockOpen==false))
                        {
                        b=i;
                        lockOpen=true;
                        continue;
                        }
                    if((currentLine[i]==' ') && (lockOpen==true))
                        {
                        c=i;
                        break;
                        }
                }
            cout<<b<<"b is"<<" "<<c;    
        }

试试这个:

#include <sstream>
std::string str = "12 34 56";
int a,b,c;
std::istringstream stream(str);
stream >> a >> b >> c;

在此处阅读有关 C++ 流的大量信息:http://www.cplusplus.com/reference/iostream/

std::istringstream istr(your_string);
std::vector<int> numbers;
int number;
while (istr >> number)
    numbers.push_back(number);

或者,更简单(虽然不是更短):

std::vector<int> numbers;
std::copy(
    std::istream_iterator<int>(istr),
    std::istream_iterator<int>(),
    std::back_inserter(numbers));

(需要标准标头 <sstream><algorithm><iterator>

您也可以选择增强分词器......

#include <iostream>
#include <string>
#include <boost/foreach.hpp>
#include <boost/tokenizer.hpp>
using namespace std;
using namespace boost;
int main(int argc, char** argv)
{
    string str= "India, gold   was dear";
    char_separator<char> sep(", ");
    tokenizer< char_separator<char> > tokens(str, sep);
    BOOST_FOREACH(string t, tokens)
    {
        cout << t << "." << endl;
    }
}

stringstreamboost::tokenizer是两种可能性。这是一个更明确的解决方案 使用 string::findstring::substr .

std::list<std::string>
tokenize(
  std::string const& str,
  char const token[])
{
  std::list<std::string> results;
  std::string::size_type j = 0;
  while (j < str.length())
  {
    std::string::size_type k = str.find(token, j);
    if (k == std::string::npos)
      k = str.length();
    results.push_back(str.substr(j, k-j));
    j = k + 1;
  }
  return results;
}

希望这有帮助。您可以轻松地将其转换为将令牌写入任意容器或采用处理令牌的函数句柄的算法。