如何检查 std::vector<std::string> 的元素是否以某个子字符串开头?

How to check if elements of std::vector<std::string> start with certain sub-string?

本文关键字:std 是否 元素 开头 字符串 gt vector 何检查 string lt 检查      更新时间:2023-10-16

>我有一个非常大的std::vectorv类型std::vector<std::string> v。现在我想比较向量中的哪些元素以某个子字符串开头str.最快的方法是什么?

我在想一个 for 循环,它迭代地将v的每个元素的开头与子字符串str进行比较。我第一次尝试

std::string substring = "bla";
for (long unsigned int i = 0; i < v.size(); i++)
{
if (!strncmp(v[i].c_str(), substring.c_str(), substring.size())) 
{
std::cout << "Item found: " << v[i] << std::endl;
}
}

这是c与c ++混合的,我对此不满意。

还有什么更好的选择?

你可以完全编写一个 c++ 代码。

如果要找到满足条件的所有元素,则无法避免遍历整个向量。 但是您可以使用更好的基于范围的for-loop而不是基于索引的循环来遍历向量,并检查是否str.find(substring) == 0(信用@PiotrSkotnicki)。

下面是示例代码:(见在线)

#include <iostream>
#include <string>
#include <vector>
int main()
{
const std::string substring{ "bla" };
std::vector<std::string> vecString{ {"bllll"}, {"bllll"}, {"blasomething"} };
// iterate through the vector by range based for-loop
// here `auto` deduded to `std::string` as you have vector of strings(i.e. `vecString`)
for (const auto& str : vecString)
{
if (str.find(substring) == 0) {
std::cout << str << " is a matchn";
// do something more with str
}
}
return 0;
}

或者使用std::for_each,以及 lambda 函数,您可以编写以下内容。在此处阅读有关 lambda 的更多信息:C++11 中的 lambda 表达式是什么?(见在线)

#include <algorithm> // std::for_each
std::for_each(std::cbegin(vecString), std::cend(vecString), [&substring](const auto& str)
{
if (str.find(substring) == 0)
{
std::cout << str << " is a matchn";
// do something more with str
}
});

如果您只对字符串 s 向量中的第一个匹配项感兴趣,请使用标准算法std::find_if如下所示

#include <algorithm> // std::find_if
const auto iter = std::find_if(std::cbegin(vecString), std::cend(vecString),
[&substring](const auto& str) {
return str.find(substring) == 0;
}
);
if (iter != std::cend(vecString))
{
// do something
}

如果你有一个未排序的容器,你不可能在时间复杂度上比O(n) 更好,这意味着以线性方式(即 for 循环)迭代整个容器。如果您的容器已分类(例如std::set而不是std::vector),你会得到O(log n),这要好得多(二叉搜索)。

在 C++17 之前,我想不出比你更好的解决方案(因为通过std::string::substr创建子字符串意味着不必要地复制子字符串)。但是C++17引入了不进行任何复制的std::string_view。启用编译器优化后,应该没有明显的性能差异。

std::vector<std::string> v { "abcd", "abcdefg", "aaaabbbb", "abc", "ab"};
std::string_view query = "abc";
for (auto const& str : v) 
{
if (str.size() < query.size())
continue;
auto probe = std::string_view(str).substr(0, query.size());
if (query == probe)
std::cout << "Item found: " << str << "n";        
}

现场示例

这是用于更快搜索的std::set版本:

std::set<std::string> v { "abcd", "abcdefg", "aaaabbbb", "abc", "ab"};
std::string query = "abc";
for (auto it = v.lower_bound(query); it != v.end(); ++it)
{
auto probe = std::string_view(*it).substr(0, query.size());
if (query == probe)
std::cout << "Item found: " << *it << "n";     
else
break;
}

现场示例

您可以使用c++20std::string_view::start_with

std::vector<std::string> v = {...};
std::string_view prefix = "bla";
for (std::string_view sv : v)
if (sv.starts_with(prefix))
std::cout << "Item found: " << sv << std::endl;
相关文章: