C++字符串解析器问题

C++ string parser issues

本文关键字:问题 字符串 C++      更新时间:2023-10-16

好的,所以我正在C++做一个家庭作业项目,遇到了一个问题,似乎找不到解决方法。该函数应该在用户定义的分隔符处中断输入字符串,并将子字符串存储在向量中以供以后访问。我想我已经弄清楚了基本的解析器,但它不想拆分输入的最后一部分。

int main() {
    string input =  "comma-delim-delim&delim-delim";
    vector<string> result;
    vector<char> delims;
    delims.push_back('-');
    delims.push_back('&');
    int begin = 0;
    for (int i = begin; i < input.length(); i++ ){
       for(int j = 0; j < delims.size(); j++){
          if(input.at(i) == delims.at(j)){
           //Compares chars in delim vector to current char in string, and 
           //creates a substring from the beginning to the current position 
           //minus 1, to account for the current char being a delimiter.
              string subString = input.substr(begin, (i - begin));
              result.push_back(subString);
              begin = i + 1;
           }

上面的代码适用于将输入代码拆分到最后一个破折号。之后的任何内容,因为它不会遇到另一个分隔符,所以它不会保存为子字符串并推送到结果向量中。因此,为了纠正此事,我整理了以下内容:

else if(input.at(i) == input.at(input.length())){
   string subString = input.substr(begin, (input.length() - begin));
   result.push_back(subString);
}

但是,我在上述部分不断出现越界错误。拆分子字符串的边界似乎存在问题,我不知道如何解决它。有什么帮助吗?

在你的代码中,你必须记住.size()将比你的最后一个索引多1,因为它从0开始。 因此,大小为 1 的数组在 [0] 处编制索引。 所以如果你这样做 input.at(input.length()) 将始终溢出 1 位。 input.at(input.length()-1) 是最后一个元素。 这是一个对我有用的例子。循环结束后,只需抓住最后一根弦。

if(begin != input.length()){
    string subString = input.substr(begin,(input.length()-begin));
    result.push_back(subString);
}

根据问题中的代码,我替换了迭代器,以便我们可以检查输入的end()

int main() {
    string input = "comma-delim-delim&delim-delim";
    vector<string> result;
    vector<char> delims;
    delims.push_back('-');
    delims.push_back('&');
    auto begin = input.begin(); // use iterator
    for(auto ii = input.begin(); ii <= input.end(); ii++){
        for(auto j : delims) {
            if(ii == input.end() || *ii == j){
                string subString(begin,ii); // can construct string from iterators, of if ii is at end
                result.push_back(subString);
                if(ii != input.end())
                    begin = ii + 1;
                else
                    goto done;
            }
        }
    }
done:
    return 0;
}
<</div> div class="answers">

此程序使用 std::find_first_of 来解析多个分隔符:

int main() {
    string input = "comma-delim-delim&delim-delim";
    vector<string> result;
    vector<char> delims;
    delims.push_back('-');
    delims.push_back('&');
    auto begin = input.begin(); // use iterator
    for(;;) {
        auto next = find_first_of(begin, input.end(), delims.begin(), delims.end());
        string subString(begin, next); // can construct string from iterators
        result.push_back(subString);
        if(next == input.end())
            break;
        begin = next + 1;
    }
}