파이썬/라이브러리(API)

파이썬 한글 형태소 분석, 태깅 라이브러리 KoNLPy 설치하기

코데방 2024. 3. 25.
728x90

KoNLPy

 

한국어 텍스트를 분석할 수 있는  kkma(꼬꼬마), Okt 등의 라이브러리를 모아둔 패키지입니다. 업데이트된지 오래되긴 했지만 아무래도 ""nltk"와 같이 외국어 위주의 라이브러리보다는 활용성이 좋은 듯 합니다.

 

 

 

 

KoNLPy 설치하기

 

파이썬에서 KoNLPy를 설치하기 위해서는 보통 두 가지가 필요합니다.

 

1. JDK 16 버전 이상

2. 아나콘다

 

물론 아나콘다 대신 직접 파일을 받아 설치하는 방법도 있습니다만, 아무래도 파이썬으로 데이터 분석 및 머신러닝을 진행하기 위해서는 아나콘다가 가장 효율적이지 않을까 합니다.

 

 

 

 

KoNLPy 사용을 위한 JDK 설치 및 환경변수 설정하기

 

JDK는 자바가 돌아갈 수 있도록 해주는 개발자 툴이라고 보면 됩니다. "Java Development Kit"의 약자입니다. 자세한건 아래 포스팅을 참조하시면 됩니다.

 

https://codevang.tistory.com/86

 

 

간단히 구글에서 검색해서 JDK 16이상 버전 설치 및 환경변수를 지정해주면 됩니다.

 

 

1. 구글에서 "JDK 설치" 검색

 

 

 

2. OS에 맞는 "Installer" 다운로드 및 설치

 

 

 

 

 

3. 환경변수 설정

 

설치가 완료됐다면 환경변수에 등록해줘야 파이썬에서 해당 경로를 찾아 JDK를 사용할 수 있게 됩니다.

 

먼저 시작 버튼을 누른 뒤 "시스템 환경 변수 편집"을 찾아 실행합니다.

 

 

 

 

우측 하단 "환경 변수" 를 클릭합니다.

 

 

 

 

 

"시스템 변수"의 "새로 만들기"를 클릭합니다. 

 

 

 

 

변수명은 "JAVA_HOME", 변수 값에는 "jvm.dll" 파일이 있는 경로를 지정해줍니다.

 

저와 다른 버전이라면 아래 주소 그대로 넣으면 안되고 파일이 있는 경로를 찾아서 복사한 뒤 붙여줍니다. 보통 아래와 경로는 같고 버전에 따라 "jdk-22" 폴더 이름이 다릅니다. 

 

 

 

 

KoNLPy 테스트 해보기

 

아나콘다는 그냥 구글에서 검색해서 다운받아 설치만 하면 되니 지나가겠습니다.

아나콘다를 실행해 "VS Code"등의 개발툴을 "Launch" 해서 실행하시면 됩니다. 

 

 

 

 

 

개발툴에 들어가 터미널에서 "pip install konlpy"를 입력해 설치해줍니다. 

 

 

 

이제 import 한 뒤 테스트를 해봅니다. KoNLPy에는 꼬꼬마(Kkma)를 비롯해 다섯개 정도의 형태소 분석 라이브러리가 있는데 각각 성능과 속도가 많이 다릅니다. 여러 가지를 다 써보고 비교를 해보는 것이 좋습니다. 

 

 

KoNLPy 라이브러리는 다음 포스팅에서 추가적으로 정리해보도록 하겠습니다. 

from konlpy.tag import Kkma

str = "아이고 코엔엘파이 설치하기 겁나 어렵네!!"
kkma = Kkma()

test = kkma.morphs(str)
print(test)

 

 

 

from konlpy.tag import Okt

str = "아이고 코엔엘파이 설치하기 겁나 어렵네!!"
okt = Okt()

test = okt.morphs(str)
print(test)

 

 

728x90

댓글

💲 추천 글