본문 바로가기

Python19

[Python] - 워드 클라우드 사용하기 워드 클라우드 설명 및 사용 예제워드 클라우드란?워드클라우드는 분석에서 기본적으로 제공하는 텍스트 분석 방식입니다. 전체 응답을 키워드 단위로 분리한 뒤 많이 응답한 순서대로 크기와 컬러로 시각화합니다.워드 클라우드 사용 전필요한 패키지import matplotlib.pyplot as plt from wordcloud import WordCloud from PIL import Image import numpy as np사용해보기저는 전에 해봤던 가장 많이 나온 단어 찾기 예제를 이용해서 워드 클라우드를 사용해 보겠습니다.기본 세팅워드 클라우드 모듈을 이용하여 폰트 디자인, 배경 색상, 이미지 모양, 가져온 문장들을 설정해줍니다.wc = WordCloud( font_path="C:/WorkSpace/Pyt.. 2024. 9. 25.
[Python] - 가장 많이 나온 단어 10개 추출 가장 많이 나온 단어 10개 추출 예제저는 예시로 운수좋은날 중에서 일부분 중에서 가장 많이 나온 단어 10개를 추출해보려고 합니다.1. 형태소 분리형태소 분리 자세한 내용더보기https://namji9507.tistory.com/entry/Python-%ED%8C%8C%EC%9D%B4%EC%8D%AC-%ED%98%95%ED%83%9C%EC%86%8C-%EB%B6%84%EC%84%9D%EA%B8%B0위 링크를 통해 원하는 형태소 분리 라이브러리를 선택합니다.저는 Okt 라이브러리를 사용하여 형태소를 분리하고 re모듈을 이용하여 특수문자를 제거했습니다.형태소 분리 코드 더보기import refrom konlpy.tag import Oktfrom collections import Counterprint('한.. 2024. 9. 24.
[Python] - 불용어 제거 (자연어 처리) 한국어 / 영어 불용어 제거 (자연어 처리)갖고 있는 데이터에서 유의미한 단어 토큰만을 선별하기 위해서는 큰 의미가 없는 단어 토큰을 제거하는 작업이 필요합니다.여기서 큰 의미가 없다라는 것은 자주 등장하지만 분석을 하는 것에 있어서는 큰 도움이 되지 않는 단어들을 말합니다.예를 들면, I, my, me, over, 조사, 접미사 같은 단어들은 문장에서는 자주 등장하지만 실제 의미 분석을 하는데는 거의 기여하는 바가 없는 경우가 있습니다.이러한 단어들을 불용어(stopword)라고 하며, NLTK에서는 위와 같은 100여개 이상의 영어 단어들을 불용어로 패키지 내에서 미리 정의하고 있습니다.물론 불용어는 개발자가 직접 정의할 수도 있습니다. 이번에는 영어 문장에서 NLTK가 정의한 영어 불용어를 제거하는.. 2024. 9. 22.
[Python] - 파이썬 형태소 분석기 파이썬 형태소 분석기 라이브러리 사용해보기사용 전 간단한 설명더보기1. 형태소란?형태소(形態素)는 뜻을 가진 가장 작은 말의 단위로 더 이상 나누게 되면 그 의마가 없어지는 것들을 말합니다. 예를 들어, '책가방'은 '책','가방'이 두 가지가 형태소라고 말할 수 있습니다.2. 어간이란?어간(語幹)은 활용할 때에 변하지 않는 부분을 말합니다.예를 들어, 동사 '보다'의 경우 '보았다(과거), 보니, 보고' 등으로 활용될 수 있는데 이들의 어간은 '보-'가 된다고 볼 수 있습니다.3. 어절이란?어절(語節)은 문장을 구성하고 있는 각각의 마디를 말하며 문장 성분의 최소 단위로서 띄어쓰기의 단위가 됩니다.'나는 자연어 처리 공부를 한다'의 문장을 보면 '나는/자연어/처리/공부를/한다.' 이렇게 5개로 나눌 수.. 2024. 9. 21.
[Python] - 파이참 인터프리터(Interpreter) 설정 파이참 인터프리터 (PyCharm Interpreter) 설정PyCharm을 사용하여 Python 프로젝트를 진행할 떄, 프로젝트에서 사용하는 가상환경을 바라보도록 하는 설정이 필요합니다.파이참 인터프리터1. PyCharm SettingsCtrl + Alt + S 또는 오른쪽 상단 File -> Settings 클릭2. Python InterpreterProjectL python basic -> Python Interpreter 선택선택 후 오른쪽 Add Interpreter -> Add Local Interpreter 선택참고로, 여기서 PyCharm이 이미 해당 프로젝트의 가상환경 경로의 Interpreter를 자동으로 설정해주었을 수도 있습니다. 4. Python Interpreter 선택이곳에서 .. 2024. 9. 20.