백준 온라인 저널, 그리디 알고리즘/1543번 :문서 검색(파이썬)

2021. 7. 6. 02:05알고리즘/그리디

728x90
반응형

문제

https://www.acmicpc.net/problem/1543

 

문제 정의

세준이는 영어로만 이루어진 어떤 문서를 검색하는 함수를 만들려고 한다. 이 함수는 어떤 단어가 총 몇 번 등장하는지 세려고 한다. 그러나, 세준이의 함수는 중복되어 세는 것은 빼고 세야 한다. 예를 들어, 문서가 abababa이고, 그리고 찾으려는 단어가 ababa라면, 세준이의 이 함수는 이 단어를 0번부터 찾을 수 있고, 2번부터도 찾을 수 있다. 그러나 동시에 셀 수는 없다.

 

세준이는 문서와 검색하려는 단어가 주어졌을 때, 그 단어가 최대 몇 번 중복되지 않게 등장하는지 구하는 프로그램을 작성하시오.

 

입력

첫째 줄에 문서가 주어진다. 문서의 길이는 최대 2500이다. 둘째 줄에 검색하고 싶은 단어가 주어진다. 이 길이는 최대 50이다. 문서와 단어는 알파벳 소문자와 공백으로 이루어져 있다.

 

 

 

출력

첫째 줄에 중복되지 않게 최대 몇 번 등장하는지 출력한다.

 

 

 

예제 입력 1

ababababa
aba

 

예제 출력 1

2

 

예제 입력 2

a a a a a
a a

 

예제 출력 2

2

 

 

접근 방법 1

1. 문자열의 길이가 2500까지이므로 현재 탐색하고자하는 문서의 길이만큼 매번 탐색을 진행한다.

 

 

코드

document = [x for x in input()] # 인덱싱을 통한 반복을 위해 리스트 형태로 문서 입력
voca = input() # 검색하고 싶은 단어 입력

start_index = 0
end_index = len(voca)
count = 0

while end_index <= len(document):
    if voca == ''.join(document[start_index:end_index]):
        count += 1
        start_index += len(voca)
        end_index += len(voca)
    else:
        start_index += 1
        end_index += 1

print(count)

 

접근 방법 2

1. count함수를 사용한다.

 

 

코드

document = input()
voca = input() # 검색하고 싶은 단어 입력
print(document.count(voca))

 

 

처음 구상했던 접근 방법

- 전체 문서의 문자를 하나씩 탐색하며 만약 검색하고 싶은 단어의 첫글자와 같다면 검색하고 싶은 단어의 인덱스도 하나씩 증가시키며 비교한다.
- 이때 검색하고 싶은 단어를 모두 탐색했는데 검색하고 싶은 단어와 동일하다면 이를 하나씩 카운트한다.

 

처음 구상한 접근 방법의 문제점

- 찾고자 하는 문자와 현재 문서에서 탐색 중인 문자가 중간에 틀린 경우, 이전에 같은 문자가 있었는 지를 확인하지 않고 문서의 다음 문자부터 탐색한다. 이에따라 오차가 발생한다.

- 이후 문자열의 길이가 길지 않아 모두 탐색하는 방식으로 진행한 뒤, 성공했는데 다른 사람들의 풀이를 보니까 파이썬 내장 함수 중 count를 사용해 푼 방법이 있었다. 역시 아는만큼 보인다던데 이렇게 하나 더 배운다.

 

728x90
반응형