n-gram을 테스트 하다가 튜플 안 문자들을 합치는 게 필요했다.

 

방법은 다음과 같다.

word = ' '.join(('오늘', '날씨'))
print(word)

>> 오늘 날씨

 

 

여러 n-gram을 테스트하기 위해 word1과 word2를 나누고 등장 횟수를 구하는 함수에 사용할 예정이다.

test = '안녕하세요 오늘은 십이월 이십칠일 화요일 오후 두시 십일분 날씨는 영상 이도입니다'
text = test.split()

def ngram(num):
    for c in list(zip(*[text[i:] for i in range(num)])):
        word1 = c[0]
        word2 = ' '.join(c[1:])

        print('1 : ', word1)
        print('2 : ',word2)

print('3gram')
ngram(3)