길이가 n인 문자열 S가 있습니다.
이 문자열의 부분 문자열 중 팰린드롬인 것을 모두 알고 싶다면, 어떻게 하면 될까요?
나이브하게 O(n3) 또는 O(n2)로도 해결할 수 있겠지만,
이를 O(n)에 해결할 수 있는 Manacher 알고리즘에 대해 알아봅시다.
S의 각 i번째 문자를 중심으로 하는 팰린드롬의 최대 반지름을 Ai라고 정의합시다.
또, j<i인 모든 j에 대해, j+Aj의 최대값을 m라고 하고, 그 때의 j를 k라고 합시다.
이제 각 인덱스 i에 대해 Ai의 값을 계산해 채워봅시다.
다음과 같이 케이스를 나눌 수 있습니다.
1. i>m
현재 얻을 수 있는 정보가 없으므로, Ai를 직접 1씩 증가시키면서 답을 계산합니다.
m=i+Ai가 됩니다.
2. i≤m
현재 인덱스 i는 k번 인덱스를 중심으로 하는 팰린드롬의 내부에 속합니다.
이 팰린드롬에서 i번 인덱스와 대칭되는 인덱스를 i′이라고 한다면,
i번 인덱스에서 팰린드롬의 크기 Ai는 최소 min(m−i,Ai′)임을 알 수 있습니다.
i′는 k를 이용해 구할 수 있습니다.
2.1 m−i≥Ai′
Ai=Ai′ 입니다. m의 값은 변하지 않습니다.
2.2 m−i<Ai′
Ai의 값이 더 커질 가능성이 있으므로, Ai의 값을 Ai′부터 시작해 직접 1씩 증가시면서 답을 계산합니다.
m=i+Ai가 됩니다.
반복문을 도는동안 m는 총 n번 증가하므로, 총 시간복잡도 역시 O(n)입니다.
짝수 팰린드롬의 경우, 문자 사이사이에 문자열에 존재하지 않는 임의의 문자를 넣어 계산함으로써 해결할 수 있습니다.
ex) abba -> $a$b$b$a$ 로 치환후 Manacher 알고리즘 사용
16163번: #15164번_제보
www.acmicpc.net
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
|
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
typedef pair<int, int> pii;
typedef pair<ll, ll> pll;
ll gcd(ll a, ll b) { for (; b; a %= b, swap(a, b)); return a; }
const int N = 4000005;
string s = "$";
int A[N];
int main()
{
ios::sync_with_stdio(0);
cin.tie(0), cout.tie(0);
string tmp; cin >> tmp;
for (char c : tmp)
{
s.push_back(c);
s.push_back('$');
}
int m = -1, k = -1;
ll ans = 0;
for (int i = 0; i < s.size(); i++)
{
if (i <= m) A[i] = min(m - i, A[2 * k - i]);
while (0 <= i - A[i] - 1 && i + A[i] + 1 < s.size()
&& s[i - A[i] - 1] == s[i + A[i] + 1])
{
if (i + ++A[i] > m) m = i + A[i], k = i;
}
ans += (A[i] + 1) / 2;
}
cout << ans;
}
|
제 그룹의 문제집에서 연습 문제들을 관리하고 있습니다.
문제집의 문제들을 보고 싶으시다면, 가입 신청을 해 주세요.
ANZ1217
무슨 내용을 넣어야 좋을까요?
www.acmicpc.net
'알고리즘 > 문자열' 카테고리의 다른 글
Aho–Corasick (1) | 2021.02.17 |
---|---|
Suffix Array와 LCP배열 (0) | 2021.02.16 |
Z (0) | 2020.08.11 |
해싱 (0) | 2020.08.05 |
트라이 (0) | 2020.07.23 |