返回字符串的散点回文计数

return count of scatter palindrome of a string

本文关键字:回文 字符串 返回      更新时间:2023-10-16

我们必须在给定字符串内找到分散回文字符串,并返回字符串中散点回文的编号。例如,给定字符串"aabb",散点回文是a,aa,aab,aabb,a,abb,b,bb和b。这里有 9 个子字符串是分散回文。

我想到了蛮力方法,即生成所有子字符串并检查它们,但我想找到更好的方法。

首先,让我们考虑如何找到字符串是否可以是散点回文。

让我们考虑一下我们的字符串仅由小写字符组成的情况。

在以下情况下,字符串可以被视为分散回文:

  1. 当字符串长度为偶数时:字符串中出现的所有字符必须出现偶数次。
  2. 当字符串长度为奇数时:字符串中只有一个字符出现奇数次,其他字符出现偶数次。

因此,要检查字符串是否可以是散点回文,我们只需要检查字符串中每个字符的出现次数。这可以在 O(n) 中完成,其中 n 是字符串的长度。

对于您的解决方案: 生成所有子字符串的时间复杂度为 O(n2)。为了检查子串是否是散射回文,我们需要另一个 O(n)。因此,总时间复杂度为 O(n3)。

我们可以在检查时降低 O(n) 因子,这可以将总时间复杂度降低到 O(n2)。

为此,您可以采用大小为 n*26 的二维数组,其中 n 是字符串的长度。设该数组为 A[n][26]。因此,A[i][j] 存储0 到 i 的第 j 个字符* 的出现总数。

所以对于字符串"abca",你的数组看起来像

1

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 11 1

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 11 1 1

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 02 1 1 1

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0现在,对于从索引 l 到 r 的任何子字符串,A[r]-A[l-1] 为您提供子字符串中每个字符的出现次数。要检查这是否可以是散射回文,我们需要 26 个操作。 因此,解的时间复杂度变为 O(n 2* 26),其渐近性与 O(n2) 相同。

这里我们使用 n*26 的额外空间。这可以通过更好的方法避免。

我们将每个字符的出现日期存储在数组中,而不是将其存储为整数。如果第 i 个位是 lsb 中的"1",例如第 j 个索引,则表示i 个字符从 0 到 j索引出现了奇数次。如果为"0",则表示第 i 个字符* 已出现偶数次。

考虑此示例,其中输入字符串为"abca">

所以我们的辅助阵列将是

1 3 7 6

1 -> (0001) ["a"发生过一次]

3 -> (0011) ["a"和"b"出现过一次]

7 -> (0111) ["a"、"b"和"c"各出现一次]

6 -> (0110) ["a"发生两次,而"b"和"c"发生一次]

所以现在对于从索引 l 到 r 的任何子字符串 A[r] xor A[l-1] 给出整数,如果它是 0 或 2 的幂,它将包含在最终答案中。(它有所有 0 位或只有一个"1"位)

伪代码给出如下:

input string = s
ans = 0
n = s.length
for i=1:n
A[i]=A[i-1]^(1<<(s[i-1]-97))
for i=1:n
for j=i;n
x=A[j]^A[i-1]
if (x&(x-1)) == 0    //if x is a power of 2 or not 
ans++;
endif
endfor
endfor

散射回文的总数存储在ans中。

此方法的空间复杂度为 O(n)。此外,它的运行时间将比前面解释的方法更好。

  • 这里的第 i个字符是指认为"a"是第 0 个字符,"b"是第一个字符的字符,依此类推。

类似的任务是在NEERC 2012-2013(问题H. Hyperdrome,在这里声明)。解释解决方案的幻灯片在这里。如有必要,我可以更详细地解释(我在比赛中解决了它)。

小写字母字符串的解决方案:

#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
long long answer = 0;
string s;
cin >> s;
map<int, int> m;
m[0] = 1;
int x = 0;
for (auto& c : s) {
int d = c - '0';
x ^= 1 << d;
answer += m[x];
for (int i = 0; i < 26; ++i) {
answer += m[x ^ (1 << i)];
}
m[x] += 1;
}
cout << answer << endl;
return 0;
}

复杂度是O(|A| * n * log(n))其中|A|是字母大小(|A| = 26),n是字符串s的长度。log(n)是访问map的难度(可以用具有复杂性O(1)的哈希代替)。

任何单个字符都是散文回文。任何一对相同的字符都是散射回文。如果 P 是散射回文,则 C + P + C 也是散点回文,其中 C 是字符,+ 是字符串连接运算符。这导致了以下算法,我们从给定字符串中选取字符来递归构建所有可能的回文。下面是伪代码。注意|S|S中的字符数。

S是给定字符串中的字符集。调用countScatterPalindrome()count后将是S中的散射回文数。

count = 0;  // The number of scatter palindome in S.
countScatterPalindrome(S)
{
if |S| == 1 then
count++;
return true;
if |S| == 0
return true; 
remove 2 characters that are equal from S
if countScatterPalindrome(S) == true
count++
return true;
return false;
}