PS/Sorting

백준 1181번: 단어 정렬 (Python)

닻과매 2021. 10. 7. 20:20

문제

알파벳 소문자로 이루어진 N개의 단어가 들어오면 아래와 같은 조건에 따라 정렬하는 프로그램을 작성하시오.

  1. 길이가 짧은 것부터
  2. 길이가 같으면 사전 순으로입력
  3. 첫째 줄에 단어의 개수 N이 주어진다. (1 ≤ N ≤ 20,000) 둘째 줄부터 N개의 줄에 걸쳐 알파벳 소문자로 이루어진 단어가 한 줄에 하나씩 주어진다. 주어지는 문자열의 길이는 50을 넘지 않는다.

입력

첫째 줄에 단어의 개수 N이 주어진다. (1 ≤ N ≤ 20,000) 둘째 줄부터 N개의 줄에 걸쳐 알파벳 소문자로 이루어진 단어가 한 줄에 하나씩 주어진다. 주어지는 문자열의 길이는 50을 넘지 않는다.

출력

조건에 따라 정렬하여 단어들을 출력한다. 단, 같은 단어가 여러 번 입력된 경우에는 한 번씩만 출력한다.

 

 


 

내 풀이(안 좋음)

a.sort(key=lambda, x: x[1]) 배운게 생각나서, 이를 이용하기 위해 리스트의 각 원소를 [len(word), word] 로 만든 후 word를 기준으로 정렬 후 len(word)을 기준으로 정렬 후 word를 출력했음

 

코드

import sys

N = int(sys.stdin.readline())
word_list = []

for i in range(N):
    word = sys.stdin.readline().strip()
    if word in word_list:
        continue
    else:
        word_list.append(word)

for i in range(len(word_list)):
    word_list[i] = [len(word_list[i]), word_list[i]]
word_list.sort(key=lambda x:x[1])
word_list.sort(key=lambda x:x[0])

for i in range(len(word_list)):
    print(word_list[i][1])

 

개선한 풀이

  • 단어를 넣을 때, 중복해서 넣지 않기 위해 list 내 원소가 있는지 확인하는 과정이 있는데, 정렬되지 않은 리스트에서 특정 원소를 찾는 것은 O(N) 시간 복잡도를 가지며, for문마다 한 번씩 하므로 위 알고리즘은 O(N**2)의 시간 복잡도를 가진다. 실제로, 위 코드를 돌리면 수행 시간이 3792ms가 나온다(시간 초과 나올까봐 걱정함). 그래서, 단어를 보관할 words를 set으로 설정 후 원소들을 담고, 리스트로 바꿔준 후 정렬을 하면 결과가 108ms으로 훨씬 나아진다. Hashing이 이래서 중요하다.
    • 순서를 바꿔서, list에 원소를 append 하고 list를 set으로 바꾸고, set을 다시 list로 바꿔도 큰 차이는 없다.
  • word = [len(word), word]와 같이 어거지로 원소 바꾼 후 key=lambda 쓸 필요 없이, 그냥 words.sort(key=len)을 하면 길이 순서대로 배열이 된다. 그래서, 먼저 알파벳 순으로 배열하고 길이 순으로 배열하면 원하는 결과를 얻을 수 있다.

 

코드

import sys

N = int(sys.stdin.readline())
words = set()

for i in range(N):
    words.add(sys.stdin.readline().strip())

words = list(words)
words.sort()
words.sort(key=len)
for word in words:
    print(word)

 

'PS > Sorting' 카테고리의 다른 글

백준 5648번: 역원소 정렬 (JAVA)  (0) 2022.04.06
정렬 개념 정리 (with JAVA)  (0) 2022.02.18
백준 18870번: 좌표 압축 (Python)  (0) 2021.10.21
백준 10814번: 나이순 정렬 (Python)  (0) 2021.10.20
10989번: 수 정렬하기  (0) 2021.10.20