PS/Backtracking

백준 1062번: 가르침 (JAVA)

닻과매 2022. 5. 16. 22:31

https://www.acmicpc.net/problem/1062

 

1062번: 가르침

첫째 줄에 단어의 개수 N과 K가 주어진다. N은 50보다 작거나 같은 자연수이고, K는 26보다 작거나 같은 자연수 또는 0이다. 둘째 줄부터 N개의 줄에 남극 언어의 단어가 주어진다. 단어는 영어 소문

www.acmicpc.net

 

문제

남극에 사는 김지민 선생님은 학생들이 되도록이면 많은 단어를 읽을 수 있도록 하려고 한다. 그러나 지구온난화로 인해 얼음이 녹아서 곧 학교가 무너지기 때문에, 김지민은 K개의 글자를 가르칠 시간 밖에 없다. 김지민이 가르치고 난 후에는, 학생들은 그 K개의 글자로만 이루어진 단어만을 읽을 수 있다. 김지민은 어떤 K개의 글자를 가르쳐야 학생들이 읽을 수 있는 단어의 개수가 최대가 되는지 고민에 빠졌다.

남극언어의 모든 단어는 "anta"로 시작되고, "tica"로 끝난다. 남극언어에 단어는 N개 밖에 없다고 가정한다. 학생들이 읽을 수 있는 단어의 최댓값을 구하는 프로그램을 작성하시오.

입력

첫째 줄에 단어의 개수 N과 K가 주어진다. N은 50보다 작거나 같은 자연수이고, K는 26보다 작거나 같은 자연수 또는 0이다. 둘째 줄부터 N개의 줄에 남극 언어의 단어가 주어진다. 단어는 영어 소문자로만 이루어져 있고, 길이가 8보다 크거나 같고, 15보다 작거나 같다. 모든 단어는 중복되지 않는다.

출력

첫째 줄에 김지민이 K개의 글자를 가르칠 때, 학생들이 읽을 수 있는 단어 개수의 최댓값을 출력한다.

 


 

풀이

시간을 조금 두고 생각해봐도, 26개의 알파벳 중 K개의 알파벳을 선택하여, 각각의 경우마다 몇 개의 단어를 읽을 수 있는지 확인하는 브루트포스 풀이밖에 생각나지 않는다(실제로 모든 경우를 따지는게 정해이기도 하다). 그래서 조합을 이용하여 풀도록 한다.

 

1. 최적화를 전혀 하지 않은 풀이

26개의 알파벳 중 K개의 알파벳을 가르친 후, 각각의 경우에 대해 N개 단어마다 해당 글자가 있는지 비교한다.

연산 횟수는 최대 26C13 * 50 * 15 = 대략 78억이 나온다. 시간초과가 뜰 것이다.

 

2. 살짝 최적화

일단, 모든 단어에 anta와 tica가 들어가므로, a, c, i, n, t는 무조건 가르쳐야함을 알 수 있다. 따라서, K가 5 미만이면 아무 단어도 배울 수 없다. K가 5 이상인 경우, 글자의 처음 4글자와 뒤 4글자는 a, c, i, n, t이므로 굳이 비교를 안 해도 된다.

연산 횟수는 최대 21C10 * 50 * (15-8) = 123_450_600이 나온다. 숫자 모양이 예쁜거와 별개로, 1초 내에 될 지 살짝 의문이 든다. 더욱 최적화를 시키자.

(실제로는 대략 300ms 내로 풀린다)

 

3. 비스마스킹

i번째 알파벳이랑 2진수의 i번째 자리를 대응시킨다.

배워야하는 단어도 비트마스킹을 이용해 숫자로 전환하여 저장하며, 가르칠 알파벳의 집합도 비트마스킹을 이용해 숫자로 저장한다. 이후, (가르칠 알파벳의 집합) & (배워야할 단어) == (배워야할 단어)이면 배워야할 단어에 있는 모든 알파벳은 가르칠 알파벳의 집합에 존재한다: 즉, 배울 수 있는 단어이다.

연산 횟수는 최대 21C10 * 50 = 17_638_500이다.

 

2와 3을 비교했을 때, 3이 단위 연산이 더 무겁기 떄문에 연산 속도가 진짜로 1/7이 되진 않을 것이다. 하지만 확실히 시간을 단축시킬 수 있을 것이다.

 

 

코드

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.List;
import java.util.StringTokenizer;

public class Main {
	
    static List<Integer> alphabets = new ArrayList<>();
    static int teach, ans, N, K;
    static int[] letters;

    public static void main(String[] args) throws IOException {
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        StringTokenizer st = new StringTokenizer(br.readLine());
        N = Integer.parseInt(st.nextToken());
        K = Integer.parseInt(st.nextToken());

        for (int i = 0; i < 26; i++) {
            if (i == 0 || i == 2 || i == 8 || i == 13 || i == 19) continue;
            alphabets.add(i);
        }

        letters = new int[N];
        for (int i = 0; i < N; i++) {
            String letter = br.readLine();
            for (int j = 0; j < letter.length(); j++) {
                letters[i] |= (1<<(letter.charAt(j) - 'a'));
            }
        }

        if (K < 5) {
            System.out.println(0);
            return;
        }

        teach += ((1<<0) + (1<<2) + (1<<8) + (1<<13) + (1<<19));
        comb(teach, 0, 0);
        System.out.println(ans);
    }

    static void comb(int teach, int start, int cnt) {
        if (cnt == K-5) {
            int temp = 0;
            for (int i = 0; i < N; i++) {
                if ((teach & letters[i]) == letters[i]) temp++;
            }
            ans = Math.max(ans, temp);
            return;
        }

        for (int i = start; i < alphabets.size(); i++) {
            teach ^= (1<<alphabets.get(i));
            comb(teach, i+1, cnt+1);
            teach ^= (1<<alphabets.get(i));
        }
    }

}

 대략 130ms 정도 나온다.