迭代向量以更新word_counter

Iterate over a vector to update a word_counter

本文关键字:counter word 更新 向量 迭代      更新时间:2023-10-16

我有一个结果结构向量,每个向量都包含一个作为"单词"的合约字符串

struct Result
    {
        string contract;
        int score;
    };

我想找到向量中不同单词的出现频率。

我可以使用分隔符将它们全部连接成一段文本,并从中提取频率

text_tokenizer tok(text, separator);
for (text_tokenizer::iterator it = tok.begin(), it_end = tok.end();
    it != it_end; ++it)
{
    ++total_occurrences;
    word_counter::iterator wit = wc.insert(*it).first;
    wc.modify_key(wit, ++bl::_1);
}

使用multi_index_container

typedef multi_index_container
<
    word_counter_entry,
    indexed_by
    <
    ordered_non_unique
    <
    BOOST_MULTI_INDEX_MEMBER(
        word_counter_entry, unsigned int, occurrences),
    std::greater<unsigned int>
    >,
    hashed_unique
    <
    BOOST_MULTI_INDEX_MEMBER(word_counter_entry, std::string, word)
    >
    >
> word_counter;

但是迭代原始向量似乎更干净

for (std::vector<Result>::iterator it = begin(v); it != end(v); ++it)
    {
        //Magically update word counter 
    }

任何适当的魔法都非常感谢。

您可以创建一个地图,以单词为键,频率(计数)作为值。

std::map<std::string, int> frequency;
for (auto& result : v) {
    frequency[result.contract]++;
}