반응형
Notice
Recent Posts
Recent Comments
Link
관리 메뉴

bro's coding

NLP.한국어 문장 토큰화.KSS(Korean Sentence Splitter) 본문

[AI]/NLP

NLP.한국어 문장 토큰화.KSS(Korean Sentence Splitter)

givemebro 2021. 2. 3. 14:50
반응형
!pip install kss

'''
Collecting kss
  Downloading kss-2.4.0.1-py3-none-any.whl (66 kB)
     |████████████████████████████████| 66 kB 665 kB/s
Installing collected packages: kss
Successfully installed kss-2.4.0.1
'''

 

import kss

text='엎친데 덮친 격이다. 영국발 코로나바이러스감염증(COVID-19) 변이 바이러스가 또 한번 변이해 남아프리카공화국발 변이 바이러스를 모방하고 있다고 워싱턴포스트(WP)와 CNN이 3일 보도했다. 해당 사례는 미국에서도 확인됐다. 백신에 좀 더 강해졌다는 얘기인데, 전문가들은 빠른 백신 접종의 중요성을 강조한다'
print(kss.split_sentences(text))


'''
['엎친데 덮친 격이다.', '영국발 코로나바이러스감염증(COVID-19) 변이 바이러스가 또 한번 변이해 남아프리카공화국발 변이 바이러스를 모방하고 있다고 워싱턴포스트(WP)와 CNN이 3일 보도했다.', '해당 사례는 미국에서도 확인됐다.', '백신에 좀 더 강해졌다는 얘기인데, 전문가들은 빠른 백신 접종의 중요성을 강조한다']
'''

 

반응형

'[AI] > NLP' 카테고리의 다른 글

ChatBot.DialogFlow  (0) 2021.03.02
NLP.Sentence Tokenization  (0) 2021.02.03
NLP.Word Tokenization  (0) 2021.02.03
Comments