确定单词后跟的是空格还是换行符

Figuring out if a word is followed by a space or newline

本文关键字:空格 换行符 单词      更新时间:2023-10-16

当前代码:

void LinkedList::readFunct( string file ) {
string word;
string trailing_char;
stringstream ss;
ifstream infile ( file.c_str() );
while ( getline( infile, word)) {
    cout << "The line is " << word << endl;
    ss << word;
    while ( getline ( ss, word, ' ' )) {
        trailing_char = "space";
        cout << "Word: " << word << endl << "Trail: "<< trailing_char << endl;
    }
    ss.str( string() );
    ss.clear();
}
}

代码尝试从文本文件(其名称传递给它)中提取,通读它,找到单词(用空格或换行符分隔),然后找出尾随字符(提到的空格或换行符)

所以像这样的文本文件:

abc def ghi
jkl mno pqr

应该有 abc 后跟一个空格,ghi 和 pqr 后跟一个新行(我知道实际上不会,但我将所有内容都分配给一个链表以供以后使用,我需要知道这是行的末尾)。

我已经试图弄清楚这个难题几个小时了,我处于智慧的尽头。帮助?

您首先使用 std::getline(in, word) 读取字符串,这将占用所有换行符。当你使用std::getline(in, word, ' ')最后一个单词后面可能紧跟着什么都没有,即,它在行边界处。检查换行符和空格之间区别的方法是检查内部std::getline()是否因为空格而停止,或者因为它到达了字符串的末尾,在这种情况下,它实际上停止了,因为以下字符是换行符:

while (std::getline( infile, word)) {
    std::cout << "The line is '" << word << "'n";
    ss.clear();
    ss.str(word);
    while (std::getline (ss, word, ' ' )) {
        trailing_char = ss.eof()? "newline": "space";
        cout << "Word: " << word << endl << "Trail: "<< trailing_char << 'n';
    }
}

一种更简单的方法是一次只读一个单词的文件,然后打印单词后面的字符是否存在、空格还是换行符(或其他空格字符之一):

for (std::string word; infile >> word; ) {
    switch (infile.peek()) {
    case 'n': trail = "newline"; break;
    case 'r': trail = "carriage-return"; break;
    case ' ': trail = "space"; break;
    case 'f: trail = "form-feed"; break;
    // ...?
    default: trail = "end-of-file"; break;
    }
    std::cout << "word='" << word << "' trail=" << trail << 'n';
}

好吧,默认情况下getline用换行符分隔,所以这应该是你所需要的。例:

std::ifstream infile("text.txt");
for (std::string line; std::getline(infile, line); )
{
    std::istringstream iss(line);
    bool firstword = true;
    for (std::string word; iss >> word; )
    {
        if (!firstword) { std::cout << "SPACEn"; }
        std::cout << word;
        firstword = false;
    }
    std::cout << "NEWLINEn";
}

布尔标志的复杂性在于,你的空格比你的单词少一个。

我编辑了你的代码:

void LinkedList::readFunct( string file ) {
string word;
string trailing_char;
stringstream ss;
ifstream infile ( file.c_str() );
while ( getline( infile, word)) {
    cout << "The line is " << word << endl;
    ss << word;
    bool firsttime = true;
    while ( ss >> word ) {
        if (!firsttime)
             cout << "Trail: space" << endl;
        cout << "Word: " << word << endl;
        firsttime = false;
    }
    if (!firsttime)
         cout << "Trail: NEWLINE" << endl;
    else
         cout << "empty line." << endl;
    ss.str( string() );
    ss.clear();
}
}