删除两个向量中的重复项
Removing duplicates in two vectors
我将尝试用以下示例解释我的问题:
vector<pair<string, string>> a = { { "A","1" }, {"B","2" },{ "C","3" },{ "D","3" },{ "E","5" } };
vector<pair<string, string>> b = { { "A","1" },{ "B","3" },{ "D","3" },{ "E","4" },{ "Z","5" } };
擦除重复项并将输出放入相同矢量的最有效方法是什么?对的数量非常大,假设大约 100 000。
两个向量都按第一个元素排序。
vector<pair<string, string>> a = { { "B","2" },{ "C","3" },{ "E","5" } };
vector<pair<string, string>> b = { { "B","3" },{ "E","4" },{ "Z","5" } };
问题是,我需要在删除重复项后比较此向量。 该对中的第一个元素是文件路径,第二个是它的校验和。 因此,例如,如果我在第一个容器中有"B","2"
,而"B","3"
是第二个容器,我可以将此文件列为"已修改"。如果这会使这个问题更容易,我愿意使用std::set
。
使用运行索引将为您提供 O(len(a( + len(b(( 时间复杂度和 O(1( 额外空间(给定a
和b
已经排序(
void removeDuplicate(vector<pair<string, string>>& a, vector<pair<string, string>>& b) {
//Add these two lines if there can be duplicates in a or b themselves.
//a.erase(std::unique(a.begin(), a.end()), a.end());
//b.erase(std::unique(b.begin(), b.end()), b.end());
size_t i = 0;
size_t j = 0;
size_t p1 = 0;
size_t p2 = 0;
while(i < a.size() && j < b.size()) {
if(a[i] == b[j]) {
i++;
j++;
} else if (a[i] > b[j]) {
b[p2++] = b[j++];
} else if (b[j] > a[i]) {
a[p1++] = a[i++];
}
}
while(i < a.size()) {
a[p1++] = a[i++];
}
while(j < b.size()) {
b[p2++] = b[j++];
}
a.erase(a.begin()+p1, a.end());
b.erase(b.begin()+p2, b.end());
}
我认为任何标准库算法在这里都不会直接有用。
我们首先检查是否应该删除(从两者中删除(,否则我们将迭代器指向较小的值并继续。
for (auto ait = a.begin(), bit = b.begin(); ait != a.end() && bit != b.end();)
{
if (*ait == *bit)
{
// Potenitally multiple duplicate values
ait = a.erase(std::remove(ait, a.end(), *ait), a.end());
bit = b.erase(std::remove(bit, b.end(), *bit), b.end());
}
else if (*ait < *bit) ++ait;
else ++bit;
}
您可以使用 STL 库中的一些算法来帮助解决此任务。首先找到相同的元素并将它们放在临时向量中,然后从每个向量中删除这些元素,请参见代码示例:
vector<pair<string, string>> a = { { "A","1" }, {"B","2" },{ "C","3" },{ "D","3" },{ "E","5" } };
vector<pair<string, string>> b = { { "A","1" },{ "B","3" },{ "D","3" },{ "E","4" },{ "Z","5" } };
//Vector to hold same elements
vector<pair<string, string>> same_elements {};
//Fill same_elements vector
std::for_each(a.begin(), a.end(), [&same_elements, b]( pair<string, string>& el )
{
if( find(b.begin(), b.end(), el) != b.end() )
{
same_elements.push_back(el);
}
});
//Remove same elements from a and b
std::for_each(same_elements.begin(), same_elements.end(), [&a, &b]( pair<string, string>& el_to_delete )
{
auto It_a = find(a.begin(), a.end(), el_to_delete);
if( It_a != a.end() )
{
a.erase(It_a);
}
auto It_b = find(b.begin(), b.end(), el_to_delete);
if( It_b != b.end() )
{
b.erase(It_b);
}
});
我使用std::for_each
遍历矢量的每个元素,std::find
在向量中找到所需的元素,erase
矢量方法通过迭代器从矢量中删除相同的元素。
相关文章:
- 如何检查两个 std::向量在小于 O(n) 的时间复杂度内是否相等
- 查找两个排序向量中共有的元素
- 如何从文件中读取两个字符串和数字数组,并将它们存储在对象向量中
- 将向量之间的数字放在另一个向量之间<vector>>如果两个数字的差值为 1
- 在类 A 中创建类型为 B 类的向量 - 访问数据 [C++] [成员在两个类中都是私有的]
- 如何根据两个因素组织向量:id 和数量?(C++)
- 在C++中查找两个向量之间最相似的值
- 如何在C++中从两个向量生成所有可能的对?
- 返回两个向量 – 使用引用还是元组?
- 使用 std::vector::swap 方法在C++中交换两个不同的向量是否安全?
- 检查两个向量是否并行的最有效方法
- 有没有办法将两个或多个不同的类链接到一个类中(稍后在向量上使用)?
- 我有一个返回字符串向量的函数.它需要两个字符串,并且返回一个字符串中缺少的字符串
- 如何获得比较两个向量对的子集
- C++将两个不同类型的向量的属性连接到新的向量中
- 如何组合两个整数向量
- 在两个类实例之间共享向量
- 如何在 c++ 中对两个向量进行线性搜索?
- 如何在 c++ 中从两个向量创建 JSON 对象?
- 为什么具有两个元素的发起器语法将一个元素而不是两个元素放入字符串向量中?