본문 바로가기
Python

[Python] - 가장 많이 나온 단어 10개 추출

by nam_ji 2024. 9. 24.

가장 많이 나온 단어 10개 추출 예제

  • 저는 예시로 운수좋은날 중에서 일부분 중에서 가장 많이 나온 단어 10개를 추출해보려고 합니다.

1. 형태소 분리

  • 형태소 분리 자세한 내용
  • 위 링크를 통해 원하는 형태소 분리 라이브러리를 선택합니다.
  • 저는 Okt 라이브러리를 사용하여 형태소를 분리하고 re모듈을 이용하여 특수문자를 제거했습니다.
  • 형태소 분리 코드 
    더보기
    import re
    from konlpy.tag import Okt
    from collections import Counter
    
    print('한국 소설 현진건의 운수 좋은 날에서 가장 많이 나온 단어 20개 추출')
    print('불용어 제거하는 전처리 작업도 수행')
    
    class TextCounter:
        def __init__(self, file_path):
            self.okt = Okt()
            self.file_path = file_path
            self.sentences_tag = [] # 형태소 분석 결과
    
        # okt 기준 형태소 분리
        def morpheme_separation_space(self):
            text = open(self.file_path, 'r', encoding='UTF-8').read()
            text = re.sub(r'[^\w\s]', '', text)
    
            # okt 함수를 통해 읽어 들인 내용의 형태소를 분석
            # 단어만 저장할 수 있도록 설정
            # self.sentences_tag = [word for word in self.okt.morphs(text) if word.strip() != '']
            for word in self.okt.morphs(text):
                if word.strip() != '':
                    self.sentences_tag.append(word)
    
            print(self.sentences_tag)
    
    if __name__ == '__main__':
        text_class = TextCounter(r"C:\WorkSpace\Python\python-basic\blog\운수좋은날.txt")
        text_class.morpheme_separation_space()
    
    '''
    출력
    ['운수', '좋은', '날', '현진건', '새침하게', '흐린', '품', '이', '눈', '이', '올', '듯', '하더니', '눈', '은', '아니', '오고', '얼다가', '만', '비', '가', '추', '적', '추적', '내리는', '날이었다', '이', '날', '이야말로', '동소문', '안', '에서', '인력거', '꾼', '노릇', '을', '하는', '김', '첨', '지에게는', '오래간만', '에도', '닥친', '운수', '좋은', '날이었다', '문안', '에', '거기', '도', '문밖', '은', '아니지만', '들어간답', '시', '는', '앞집', '마마', '님', '을', '전', '찻길', '까지', '모셔다', '드린', '것', '을', '비롯', '으로', '행여', '나', '손님', '이', '있을까', '하고', '정류장', '에서', '어정어정', '하며', '내리는', '사람', '하나', '하나', '에게', '거의', '비는', '듯', '한', '눈결', '을', '보내고', '있다가', '마침내', '교원', '인', '듯', '한', '양복', '쟁이', '를', '동광', '학교', '東光', '學校', '까지', '태워다', '주기', '로', '되었다', '첫', '번', '에', '삼십', '전', '둘째', '번', '에', '오십전', '아침', '댓', '바람', '에', '그리', '흉치', '않은', '일이', '었다', '그야말로', '재수', '가', '옴', '붙어서', '근', '열흘', '동안', '돈', '구경', '도', '못', '한', '김첨', '지는', '십', '전', '짜리', '백', '동화', '서', '푼', '또는', '다섯', '푼', '이', '찰깍', '하고', '손바닥', '에', '떨어질', '제', '거의', '눈물', '을', '흘릴', '만큼', '기뻤었다', '더구나', '이', '날', '이', '때', '에', '이', '팔십', '전이', '라는', '돈', '이', '그', '에게', '얼마나', '유용한지', '몰랐다', '컬컬', '한', '목', '에', '모주', '한', '잔', '도', '적실', '수', '있거니와', '그', '보다도', '앓는', '아내', '에게', '설렁탕', '한', '그릇', '도', '사다', '줄', '수', '있', '음', '이다', '그', '의', '아내', '가', '기침', '으로', '쿨룩', '거리', '기는', '벌써', '달포', '가', '넘었다', '조', '밥', '도', '굶기를', '먹다시피', '하는', '형편', '이니', '물론', '약', '한', '첩', '써', '본', '일이', '없다', '구태여', '쓰려면', '못', '쓸', '바', '도', '아니로되', '그', '는', '병', '이란', '놈', '에게', '약', '을', '주어', '보내면', '재미', '를', '붙여서', '자', '꾸', '온다는', '자기', '의', '신조', '信條', '에', '어디', '까지', '충실하였다', '따라서', '의사', '에게', '보', '인', '적', '이', '없으니', '무슨', '병인', '지는', '알', '수', '없으되', '반듯이', '누워', '가지', '고', '일어나기', '는', '새로', '모로', '도', '못', '눕는', '걸', '보면', '중증', '은', '중', '증인', '듯', '병', '이', '이대', '도록', '심해지', '기는', '열흘', '전', '에', '조', '밥', '을', '먹고', '체', '한', '때문', '이다', '그때', '도', '김', '첨', '지가', '오래간만', '에', '돈', '을', '얻어서', '좁쌀', '한', '되와', '십', '전', '짜리', '나무', '한', '단', '을', '사다', '주었더니', '김', '첨', '지의', '말', '에', '의지', '하면', '그', '오라질', '년', '이', '천방지축', '으로', '냄비', '에', '대고', '끓였다', '마음', '은', '급하고', '불길', '은', '달', '지', '않아', '채', '익지도', '않은', '것', '을', '그', '오라질', '년', '이', '숟가락', '은', '고', '만두', '고', '손', '으로', '움켜서', '두', '뺨', '에', '주먹', '덩이', '같은', '혹', '이', '불거지도록', '누가', '빼앗을', '듯이', '처', '박질하더니만', '그날', '저녁', '부터', '가슴', '이', '땡긴다', '배', '가', '켕긴다', '고', '눈', '을', '흡', '뜨고', '지랄병', '을', '하였다', '그때', '김첨', '지는', '열', '화', '와', '같이', '성', '을', '내며', '에이', '오라질', '년', '조랑', '복은', '할', '수가', '없어', '못', '먹어', '병', '먹어서', '병', '어쩌', '란', '말', '이야', '왜', '눈', '을', '바루', '뜨지', '못', '해', '하고', '앓는', '이의', '뺨', '을', '한', '번', '후려', '갈', '겼다', '흡', '뜬', '눈', '은', '조금', '바루', '어', '졌건만', '이슬', '이', '맺히었다', '김', '첨', '지의', '눈시울', '도', '뜨', '끈', '뜨끈하였다', '이', '환자', '가', '그러고도', '먹는', '데', '는', '물리', '지', '않았다', '사흘', '전', '부터', '설렁탕', '국물', '이', '마시고', '싶다고', '남편', '을', '졸랐다', '이런', '오라질', '년', '조', '밥', '도', '못', '먹는', '년', '이', '설렁탕', '은', '또', '처', '먹고', '지랄병', '을', '하', '게', '라고', '야단', '을', '쳐', '보았건만', '못', '사주는', '마음', '이', '시원', '치는', '않았다', '인제', '설렁탕', '을', '사줄', '수도', '있다', '앓는', '어미', '곁', '에서', '배고파', '보채는', '개똥이', '세', '살', '먹이', '에게', '죽', '을', '사줄', '수도', '있다', '팔십', '전', '을', '손', '에', '쥔', '김', '첨', '지의', '마음', '은', '푼', '푼하였다', '그러나', '그', '의', '행운', '은', '그', '걸', '로', '그치지', '않았다', '땀', '과', '빗물', '이', '섞여', '흐르는', '목덜', '미를', '기름', '주머니', '가', '다', '된', '왜목', '수건', '으로', '닦으며', '그', '학교', '문', '을', '돌아', '나올', '때', '였다', '뒤', '에서', '인력거', '하고', '부르는', '소리', '가', '난다', '자기', '를', '불러', '멈춘', '사', '람', '이', '그', '학교', '학생', '인', '줄', '김첨', '지는', '한번', '보고', '짐작', '할', '수', '있었다', '그', '학생', '은', '다짜고짜로', '남대문', '정거장', '까지', '얼마', '요', '라고', '물었다', '아마도', '그', '학교', '기숙사', '에', '있는', '이로', '동', '기', '방학', '을', '이용', '하여', '귀', '향', '하려', '함이리라', '오늘', '가기', '로', '작정', '은', '하였건만', '비는', '오고', '짐', '은', '있고', '해서', '어찌', '할', '줄', '모르다가', '마침', '김', '첨', '지를', '보고', '뛰어나왔음', '이', '리라', '그렇지', '않으면', '왜', '구두', '를', '채', '신지', '못', '해서', '질질', '끌', '고', '비록', '고구', '라', '양', '복일', '망정', '노', '박이로', '비', '를', '맞으며', '김', '첨', '지를', '뒤', '쫓아', '나왔으랴', '남대문', '정거장', '까지', '말씀', '입', '니까', '하고', '김첨', '지는', '잠깐', '주저', '하였다', '그', '는', '이', '우중', '에', '우장', '도', '없이', '그', '먼', '곳', '을', '철벅', '거리', '고', '가기', '가', '싫었음', '일까', '처음', '것', '둘째', '것', '으로', '고만', '만족하였음', '일까', '아니다', '결코', '아니다', '이상하게도', '꼬리', '를', '맞', '물', '고', '덤비는', '이', '행운', '앞', '에', '조금', '겁', '이', '났', '음', '이다', '그리고', '집', '을', '나올', '제', '아내', '의', '부탁', '이', '마음', '이', '켕', '기었다', '앞', '집', '마마', '님', '한테', '서', '부르러', '왔을', '제', '병인', '은', '뼈', '만', '남은', '얼굴', '에', '유일', '의', '샘물', '같', '은', '유', '달리', '크고', '움푹한', '눈', '에', '애걸', '하는', '빛', '을', '띄우며', '오늘', '은', '나가지', '말아요', '제발', '덕분', '에', '집', '에', '붙어', '있어요', '내', '가', '이렇게', '아', '픈데', '라고', '모기', '소리', '같이', '중얼거리고', '숨', '을', '걸그렁걸그렁', '하였다', '그때', '에', '김첨', '지', '는', '대수롭지', '않은듯이', '아따', '젠장맞을', '년', '별', '빌어먹을', '소리', '를', '다', '하네', '맞붙', '들고', '앉았으면', '누', '가', '먹여', '살릴', '줄', '알', '아', '하고', '훌쩍', '뛰어나오려니까', '환자', '는', '붙잡을', '듯이', '팔', '을', '내', '저', '으', '며', '나가지', '말', '라도', '그래', '그러면', '일찍이', '들어와요', '하고', '목', '메인', '소리', '가', '뒤', '를', '따랐다', '정거장', '까지', '가잔', '말', '을', '들은', '순간', '에', '경련', '적', '으로', '떠는', '손', '유', '달리', '큼직한', '눈', '울', '듯', '한', '아내', '의', '얼굴', '이', '김', '첨', '지의', '눈앞', '에', '어른어른', '하였다', '그래', '남대문', '정거장', '까지', '얼마', '란', '말', '이', '요', '하고', '학생', '은', '초조한', '듯이', '인력거', '꾼', '의', '얼굴', '을', '바라보며', '혼자', '말', '같이', '인천', '차가', '열한', '점', '에', '있고', '그', '다음', '에는', '새로', '두', '점', '이든', '가', '라고', '중얼거린다', '일', '원', '오십', '전만', '줍시요', '이', '말', '이', '저', '도', '모를', '사이', '에', '불쑥', '김', '첨', '지의', '입', '에서', '떨어졌다', '제', '입', '으로', '부', '르고', '도', '스스로', '그', '엄청난', '돈', '액수', '에', '놀랐다', '한꺼', '번', '에', '이런', '금액', '을', '불러라', '도', '본', '지가', '그', '얼마', '만인', '가', '그러자', '그', '돈벌', '용기', '가', '병자', '에', '대한', '염려', '를', '사', '르', '고', '말았다', '설마', '오늘', '내', '로', '어떠랴', '싶었다', '무슨', '일이', '있더라도', '제일', '제', '이의', '행운', '을', '곱친', '것', '보다', '고', '오히려', '갑절', '이', '많은', '이', '행운', '을', '놓칠', '수', '없다', '하', '였다', '일', '원', '오십', '전', '은', '너무', '과', '한', '데', '이런', '말', '을', '하며', '학생', '은', '고개', '를', '기웃하였다', '아니올시다', '잇수로', '치면', '여기', '서', '거기', '가', '시오', '리가', '넘는답니다', '또', '이런', '진날', '은', '좀', '더', '주셔야지요', '하고', '빙글빙글', '웃는', '차', '부의', '얼굴', '에는', '숨길', '수', '없는', '기쁨', '이', '넘쳐', '흘렀다', '그러면', '달라', '는', '대로', '줄', '터', '이니', '빨리', '가요', '관대한', '어린', '손님', '은', '이런', '말', '을', '남기고', '총총히', '옷', '도', '입고', '짐', '도', '챙기러', '갈', '데', '로', '갔다', '그', '학생', '을', '태우고', '나선', '김', '첨', '지의', '다리는', '이상하게', '거뿐하였다', '달', '음질', '을', '한다느니', '보다', '거의', '나', '는', '듯', '하였다', '바퀴', '도', '어떻게', '속히', '도', '는', '지', '구른다느니', '보다', '마치', '얼음', '을', '지쳐', '나가는', '스케이트', '모양', '으로', '미끄러져', '가는', '듯', '하였다', '언', '땅', '에', '비', '가', '내려', '미끄럽', '기도', '하였지만', '이윽고', '끄는', '이의', '다리는', '무거워졌다', '자기', '집', '가까이', '다다른', '까닭', '이다', '새삼스러운', '염려', '가', '그', '의', '가슴', '을', '눌렀다', '오늘', '은', '나가지', '말아요', '내', '가', '이', '렇', '게', '아픈데', '이런', '말', '이', '잉잉', '그', '의', '귀', '에', '울렸다', '그리고', '병자', '의', '움쑥', '들어', '간', '눈', '이', '원망하는', '듯이', '자기', '를', '노리는', '듯', '하였다', '그러자', '엉엉', '하고', '우는', '개', '똥', '이의', '곡성', '을', '들은', '듯', '싶다', '딸국딸국', '하고', '숨', '모으는', '소리', '도', '나', '는', '듯', '싶다', '왜', '이', '리우', '기차', '놓치겠구먼', '하고', '탄', '이의', '초조한', '부르짖음', '이', '간신히', '그', '의', '귀', '에', '들어왔다', '언뜻', '깨', '달으', '니', '김첨', '지는', '인력거', '를', '쥔', '채', '길', '한', '복판', '에', '엉거주춤', '멈춰', '있지', '않은가', '예', '예', '하고', '김첨', '지는', '또다시', '달', '음질', '하였다', '집', '이', '차차', '멀어', '갈수록', '김', '첨', '지의', '걸', '음', '에는', '다시금', '신', '이', '나기', '시작', '하였다', '다리', '를', '재게', '놀려야만', '쉴', '새', '없이', '자기', '의', '머리', '에', '떠오르는', '모든', '근심', '과', '걱정', '을', '잊을', '듯이', '정거장', '까지', '끌어다', '주고', '그', '깜짝', '놀란', '일', '원', '오십', '전', '을', '정말', '제', '손', '에', '쥠에', '제', '말', '마따나', '십리', '나', '되는', '길', '을', '비', '를', '맞아', '가며', '질퍽', '거리', '고', '온', '생각', '은', '아니', '하고', '거저', '나', '얻은', '듯이', '고마웠다', '졸부', '나', '된', '듯이', '기뻤다', '제', '자식뻘', '밖에', '안', '되는', '어린', '손님', '에게', '몇', '번', '허리', '를', '굽히며', '안녕히', '다녀옵시요', '라고', '깍', '듯이', '재우', '쳤다', '그러나', '빈', '인력거', '를', '털털', '거리', '며', '이', '우중', '에', '돌아갈', '일이', '꿈밖', '이었다', '노동', '으로', '하여', '흐른', '땀', '이', '식어지자', '굶주린', '창자', '에서', '물', '흐르는', '옷', '에서', '어슬어', '슬', '한기', '가', '솟아나기', '비롯', '하', '매', '일', '원', '오십', '전', '이란', '돈', '이', '얼마나', '괜찮고', '괴로', '운', '것', '인', '줄', '절절', '히', '느끼었다', '정거장', '을', '떠나는', '그', '의', '발길', '은', '힘', '하나', '없었', '다', '온몸', '이', '옹송', '그려지며', '당장', '그', '자리', '에', '엎어져', '못', '일어날', '것', '같았다', '젠장맞을', '것', '이', '비', '를', '맞으며', '빈', '인력거', '를', '털털', '거리', '고', '돌아를', '간담', '이', '런', '빌어먹을', '제', '할미', '를', '붙을', '비', '가', '왜', '남', '의', '상판', '을', '딱', '딱', '때려', '그', '는', '몹시', '화증', '을', '내며', '누구', '에게', '반항', '이나', '하는', '듯이', '게걸', '거', '렸다', '그럴', '즈', '음', '에', '그', '의', '머리', '엔', '또', '새로운', '광명', '이', '비쳤나니', '그것', '은', '이러구', '갈', '게', '아니', '라', '이', '근처', '를', '빙빙', '돌', '며', '차', '오기', '를', '기다리면', '또', '손님', '을', '태우게', '될는지도', '몰', '라', '란', '생각', '이었다', '오늘', '운수', '가', '괴상하게도', '좋으니까', '그런', '요행', '이', '또', '한번', '없으', '리라', '고', '누가', '보증', '하', '랴', '꼬리', '를', '굴리', '는', '행운', '이', '꼭', '자기', '를', '기다리고', '있다', '고', '내기', '를', '해도', '좋을', '만', '한', '믿음', '을', '얻게', '되었다', '그렇다고', '정거장', '인력거', '꾼', '의', '등쌀', '이', '무서우니', '정거장', '앞', '에', '섰을', '수', '는', '없었다', '그래', '그', '는', '이전', '에도', '여', '러', '번', '해본', '일이', '라', '바로', '정거장', '앞', '전차', '정류장', '에서', '조금', '떨어지게', '사람', '다', '니', '는', '길', '과', '전', '찻길', '틈', '에', '인력거', '를', '세워', '놓고', '자기', '는', '그', '근처', '를', '빙빙', '돌', '며', '형', '세', '를', '관망', '하기로', '하였다', '얼마', '만에', '기차', '는', '왔고', '수십', '명', '이나', '되는', '손', '이', '정', '류', '장', '으로', '쏟아져', '나왔다', '그', '중', '에서', '손님', '을', '물색', '하', '는', '김', '첨', '지의', '눈', '엔', '양', '머리', '에', '뒤축', '높은', '구두', '를', '신고', '망토', '까지', '두른', '기생', '퇴물', '인', '듯', '난봉', '여학생', '인', '듯', '한', '여편네', '의', '모양', '이', '띄었다', '그', '는', '슬근슬근', '그', '여자', '의', '곁', '으로', '다가들었다', '아씨', '인력거', '아니', '타', '시', '랍시', '요', '그', '여학생', '인지', '만지가', '한참', '은', '매우', '때깔', '을', '빼며', '입술', '을', '꼭', '다문', '채', '김첨', '지', '를', '거들', '떠보지도', '않았다', '김첨', '지는', '구걸', '하는', '거지', '나', '무엇', '같이', '연해', '연방', '그', '의', '기색', '을', '살피', '며', '아씨', '정거장', '애', '들', '보담', '아주', '싸게', '모셔다', '드리겠습니다', '댁', '이', '어디', '신가', '요', '하고', '추근추근', '하게도', '그', '여자', '의', '들고', '있는', '일본', '식', '버들', '고리짝', '에', '제', '손', '을', '대', '었다', '왜', '이래', '남', '귀', '치', '않게', '소리', '를', '벽력', '같이', '지르고는', '돌아선다', '김첨', '지는', '어랍시', '요', '하고', '물러섰다', '전차', '는', '왔다', '김첨', '지는', '원망', '스럽게', '전차', '타는', '이를', '노리', '고', '있었다', '그러나', '그', '의', '예감', '豫感', '은', '틀리지', '않았다', '전차', '가', '빡빡', '하게', '사람', '을', '싣고', '움직이기', '시작', '하였을', '제', '타고', '남은', '손', '하나', '가', '있었다', '굉장하게', '큰', '가방', '을', '들고', '있는', '걸', '보면', '아마', '붐비는', '차', '안', '에', '짐', '이', '크다', '하여', '차장', '에게', '밀려', '내려온', '눈치', '였', '다', '김첨', '지는', '대어', '섰다', '인력거', '를', '타', '시', '랍시', '요', '한동안', '값', '으로', '승강이', '를', '하다가', '육십', '전', '에', '인사동', '까지', '태워다', '주기', '로', '하였', '다', '인력거', '가', '무거워지매', '그', '의', '몸', '은', '이상하게도', '가벼워졌고', '그리고', '또', '인력', '거가', '가벼워지니', '몸', '은', '다시금', '무거워졌건만', '이번', '에는', '마음', '조차', '초조해', '온', '다', '집의', '광경', '이', '자꾸', '눈앞', '에', '어른거리어', '인제', '요행', '을', '바랄', '여유도', '없었다', '나무', '등', '걸이', '나', '무엇', '같고', '제', '것', '같지도', '않은', '다리', '를', '연해', '꾸짖으며', '질', '팡', '갈', '팡', '뛰는', '수', '밖에', '없었다', '저', '놈', '의', '인력거', '꾼', '이', '저렇게', '술', '이', '취해', '가지', '고', '이', '진', '땅', '에', '어찌', '가노', '라고', '길', '가는', '사람', '이', '걱정', '을', '하리', '만큼', '그', '의', '걸음', '은', '황급', '하', '였다', '흐리고', '비', '오는', '하늘', '은', '어둠침침하게', '벌써', '황혼', '에', '가까운', '듯', '하다', '창', '경원', '앞', '까지', '다다라', '서야', '그', '는', '턱', '에', '닿은', '숨', '을', '돌리고', '걸음', '도', '늦추', '잡았다', '한', '걸음', '두', '걸음', '집', '이', '가까워', '갈수록', '그', '의', '마음', '조차', '괴상하게', '누그러웠다', '그런데', '이', '누', '그러', '움', '은', '안심', '에서', '오는', '게', '아니요', '자기', '를', '덮', '친', '무서운', '불행', '을', '빈틈', '없이', '알', '게', '될', '때', '가', '박두', '한', '것', '을', '두리', '는', '마음', '에서', '오는', '것', '이다', '그', '는', '불', '행', '에', '다', '닥치기', '전', '시간', '을', '얼마', '쯤', '이라도', '늘이려고', '버르적거렸다', '기적', '奇蹟', '에', '가까운', '벌이', '를', '하였다는', '기쁨', '을', '할', '수', '있으면', '오래', '지니', '고', '싶었다', '그', '는', '두리', '번', '두리', '번', '사면', '을', '살피었다', '그', '모양', '은', '마치', '자기', '집', '곧', '불행', '을', '향', '하', '고', '달아가는', '제', '다리', '를', '제', '힘', '으로는', '도저히', '어찌', '할', '수', '없으니', '누구', '든지', '나', '를', '좀', '잡아', '다고', '구해', '다고', '하는', '듯', '하였다', '그럴', '즈음', '에', '마침', '길가', '선술집', '에서', '그', '의', '친구', '치', '삼이', '가', '나온다', '그', '의', '우', '글', '우', '글', '살찐', '얼굴', '에', '주홍', '이', '덧', '는', '듯', '온', '턱', '과', '뺨', '을', '시커멓게', '구레나룻', '이', '덮였', '거늘', '노르', '탱탱한', '얼굴', '이', '바짝', '말', '라서', '여기저기', '고랑', '이', '패', '고', '수염', '도', '있', '대야', '턱밑', '에만', '마치', '솔잎', '송이', '를', '거꾸로', '붙여', '놓은', '듯', '한', '김', '첨', '지의', '풍채', '하고는', '기', '이', '한', '대상', '을', '짓고', '있었다', '여보', '게', '김첨', '지', '자네', '문안', '들어갔다', '오는', '모', '양', '일', '세', '그', '려', '돈', '많이', '벌었을', '테', '니', '한잔', '빨리', '게', '뚱뚱보', '는', '말라', '깽', '이를', '보던', '맡에', '부르짖었다', '그', '목소리', '는', '몸집', '과', '딴판', '으로', '연하고', '싹싹하였다', '김첨', '지는', '이', '친구', '를', '만난', '게', '어떻게', '반가운지', '몰랐다', '자기', '를', '살려', '준', '은인', '이나', '무엇', '같이', '고맙', '기도', '하였다', '자네', '는', '벌써', '한잔', '한', '모', '양', '일', '세', '그', '려', '자네도', '오늘', '재미', '가', '좋아', '보이', '하고', '김첨', '지는', '얼굴', '을', '펴서', '웃었다', '아따', '재미', '안', '좋다고', '술', '못', '먹을', '낸가', '그런데', '여보', '게', '자네', '왼', '몸', '이', '어', '째', '물독', '에', '빠진', '새앙쥐', '같은가', '어서', '이리', '들어와', '말리', '게', '선술집', '은', '훈훈하고', '뜨뜻하였다', '추어탕', '을', '끓이는', '솥', '뚜껑', '을', '열', '적', '마다', '뭉', '게', '뭉', '게', '떠오르는', '흰', '김', '석쇠', '에서', '뻐지짓뻐지짓', '구워지는', '너비아니', '구이', '며', '제육', '이며', '간이', '며', '콩팥', '이며', '북어', '며', '빈대떡', '이', '너저분하게', '늘어놓인', '안주', '탁자', '에', '김첨', '지는', '갑자기', '속이', '쓰려서', '견딜', '수', '없었다', '마음대로', '할', '양', '이면', '거기', '있는', '모든', '먹음', '먹이', '를', '모조리', '깡그리', '집어', '삼켜도', '시원', '치', '않았다', '하', '되', '배고', '픈', '이는', '위선', '분량', '많은', '빈대떡', '두', '개', '를', '쪼', '이기도', '하고', '추어탕', '을', '한', '그릇', '청', '하였다', '주린', '창자', '는', '음식', '맛', '을', '보더', '니', '더욱', '더욱', '비어지며', '자꾸자꾸', '들이', '라', '들이라', '하였다', '순식간', '에', '두부', '와', '미꾸리', '든', '국', '한', '그릇', '을', '그냥', '물', '같이', '들이켜고', '말았다', '셋째', '그릇', '을', '받아', '들었을', '제', '데우던', '막걸리', '곱', '배기', '두', '잔', '이', '더웠다', '치', '삼이', '와', '같이', '마시자', '원', '원', '이', '비었던', '속', '이라', '찌르를', '하고', '창자', '에', '퍼지며', '얼굴', '이', '화끈하였다', '눌러', '곱', '배기', '한', '잔', '을', '또', '마셨다', '김', '첨', '지의', '눈', '은', '벌써', '개개', '풀리기', '시작', '하였다', '석쇠', '에', '얹힌', '떡', '두', '개', '를', '숭', '덩숭덩', '썰어서', '볼', '을', '불', '룩', '거리', '며', '또', '곱', '배기', '두', '잔', '을', '부어', '라', '하였다', '치', '삼은', '의아', '한', '듯이', '김', '첨', '지를', '보며', '여보', '게', '또', '붓다', '니', '벌써', '우리', '가', '넉', '잔', '씩', '먹었네', '돈', '이', '사십', '전', '일', '세', '라고', '주의', '시켰다', '아따', '이', '놈', '아', '사십', '전이', '그리', '끔찍하냐', '오늘', '내', '가', '돈', '을', '막', '벌었어', '참', '오늘', '운수', '가', '좋았느니', '그래', '얼마', '를', '벌었단', '말', '인가', '삼십', '원', '을', '벌었어', '삼십', '원', '을', '이런', '젠장맞을', '술', '을', '왜', '안', '부어', '괜찮', '다', '괜찮다', '막', '먹어도', '상관', '이', '없어', '오늘', '돈', '산더미', '같이', '벌었는데', '어', '이', '사람', '취했군', '그만두세', '이', '놈', '아', '그걸', '먹고', '취할', '내냐', '어서', '더', '먹어', '하고는', '치삼', '의', '귀', '를', '잡아', '치', '며', '취한', '이는', '부르짖었다', '그리고', '술', '을', '붓는', '열', '다섯', '살', '됨', '직한', '중대가리', '에게로', '달려들며', '이', '놈', '오라질', '놈', '왜', '술', '을', '붓지', '않어', '라고', '야단', '을', '쳤다', '중대가리', '는', '희', '희', '웃고', '치삼', '을', '보며', '문의', '하는', '듯이', '눈짓', '을', '하였다', '주정', '꾼', '이', '이', '눈치', '를', '알아보고', '화', '를', '버럭', '내며', '에미', '를', '붙을', '이', '오라질', '놈', '들', '같으니', '이', '놈', '내', '가', '돈', '이', '없을', '줄', '알', '고', '하자', '마자', '허리춤', '을', '훔칫훔칫', '하더니', '일', '원', '짜리', '한', '장', '을', '꺼내어', '중대가리', '앞', '에', '펄쩍', '집어던졌다', '그', '사', '품', '에', '몇', '푼', '은', '전이', '잘', '그', '랑', '하며', '떨어진다', '여보', '게', '돈', '떨어졌네', '왜', '돈', '을', '막', '끼', '얹나', '이런', '말', '을', '하며', '일변', '돈', '을', '줍는다', '김첨', '지는', '취한', '중', '에도', '돈', '의', '거처', '를', '살', '피는', '듯이', '눈', '을', '크게', '떠서', '땅', '을', '내려다보다가', '불시', '에', '제', '하는', '짓', '이', '너무', '더', '럽다', '는', '듯이', '고개', '를', '소스', '라', '치자', '더욱', '성', '을', '내며', '봐라', '봐', '이', '더러운', '놈', '들', '아', '내', '가', '돈', '이', '없나', '다리', '뼉', '다', '구를', '꺾어', '놓을', '놈', '들', '같으니', '하고', '치삼', '의', '주워', '주는', '돈', '을', '받아', '이', '원', '수', '엣돈', '이', '육시', '를', '할', '돈', '하면서', '풀', '매질', '을', '친다', '벽', '에', '맞아', '떨어진', '돈', '은', '다시', '술', '끓이는', '양푼', '에', '떨어', '지며', '정당한', '매', '를', '맞는다는', '듯이', '쨍', '하고', '울었다', '곱', '배기', '두', '잔', '은', '또', '부어질', '겨를', '도', '없이', '말려', '가고', '말았다', '김첨', '지는', '입술', '과', '수염', '에', '붙은', '술', '을', '빨아들이고', '나서', '매우', '만족한', '듯이', '그', '솔잎', '송이', '수염', '을', '쓰다듬으며', '또', '부어', '또', '부어', '라고', '외쳤다', '또', '한', '잔', '먹고', '나서', '김첨', '지는', '치삼', '의', '어깨', '를', '치', '며', '문득', '껄껄', '웃는다', '그', '웃음', '소리', '가', '어떻게', '컸던지', '술집', '에', '있는', '이의', '눈', '은', '모두', '김', '첨', '지에게로', '몰리', '었다', '웃는', '이는', '더욱', '웃으며', '여보', '게', '치', '삼이', '내', '우스운', '이야기', '하나', '할까', '오늘', '손', '을', '태고', '정거장', '에', '가지', '않았겠나', '그래서', '갔다가', '그저', '오기', '가', '안', '됐데', '그려', '그래', '전차', '정류장', '에서', '어름어름', '하며', '손', '님', '하나', '를', '태울', '궁리', '를', '하지', '않았나', '거기', '마침', '마마', '님', '이', '신지', '여학생', '이', '신지', '요새', '야', '어디', '논다니', '와', '아가씨', '를', '구별', '할', '수가', '있던가', '망토', '를', '잡수시고', '비', '를', '맞고', '서', '있겠지', '슬근슬근', '가까이', '가서', '인력거', '타', '시', '랍시', '요', '하고', '손가방', '을', '받으랴', '니까', '내', '손', '을', '탁', '뿌리', '치고', '홱', '돌아서더니만', '왜', '남', '을', '이렇게', '귀', '찮', '게', '굴어', '그', '소리', '야말로', '꾀꼬리', '소리', '지', '허허', '김첨', '지는', '교묘하게도', '정말', '꾀꼬리', '같은', '소리', '를', '내었다', '모든', '사람', '은', '일시', '에', '웃었다', '빌어먹을', '깍쟁이', '같은', '년', '누가', '저', '를', '어쩌나', '왜', '남', '을', '귀찮게', '굴어', '어이구', '소리', '가', '처신', '도', '없지', '허허', '웃음', '소리', '들', '은', '높아졌다', '그러나', '그', '웃음', '소리', '들', '이', '사라', '도', '지기', '전', '에', '김', '첨', '지는', '훌쩍', '훌쩍', '울기', '시작', '하였다', '치', '삼은', '어이없이', '주정뱅이', '를', '바라보며', '금방', '웃고', '지랄', '을', '하더니', '우는', '건', '또', '무슨', '일인', '가', '김첨', '지는', '연해', '코', '를', '들이마시며', '우리', '마누라', '가', '죽었다네', '뭐', '마누라', '가', '죽다니', '언제', '이', '놈', '아', '언제', '는', '오늘이', '지', '엣기', '미친', '놈', '거짓말', '말', '아', '거짓말', '은', '왜', '참말', '로', '죽었어', '참말', '로', '마누라', '시체', '를', '집', '에', '뻐들쳐', '놓', '고', '내', '가', '술', '을', '먹다니', '내', '가', '죽일', '놈', '이야', '죽일', '놈', '이야', '하고', '김첨', '지는', '엉엉', '소리', '를', '내어', '운다', '치', '삼은', '흥이', '조금', '깨어지는', '얼굴', '로', '원', '이', '사람', '이', '참말', '을', '하나', '거짓말', '을', '하나', '그러면', '집', '으로', '가세', '가', '하고', '우는', '이의', '팔', '을', '잡아당기었다', '치삼', '의', '끄는', '손', '을', '뿌리치더니', '김첨', '지는', '눈물', '이', '글썽', '글썽', '한', '눈', '으로', '싱그레', '웃는다', '죽기는', '누가', '죽어', '하고', '득의', '가', '양양', '죽기는', '왜', '죽어', '생때', '같이', '살아만', '있단다', '그', '오라질', '년', '이', '밥', '을', '죽', '이지', '인제', '나', '한테', '속', '았', '다', '하고', '어린', '애', '모양', '으로', '손뼉', '을', '치', '며', '웃는다', '이', '사람', '이', '정말', '미쳤단', '말', '인가', '나도', '아주', '먼', '네', '가', '앓는단', '말', '은', '들었는', '데', '하고', '치', '삼이', '도', '어느', '불안', '을', '느끼는', '듯이', '김', '첨', '지에게', '또', '돌아가라고', '권하였', '다', '안', '죽었어', '안', '죽었', '대도', '그래', '김첨', '지는', '화증', '을', '내며', '확신', '있게', '소리', '를', '질렀으되', '그', '소리', '엔', '안', '죽은', '것', '을', '믿으려고', '애쓰는', '가락', '이', '있었다', '기어이', '일', '원', '어치', '를', '채워서', '곱', '배기', '한', '잔', '씩', '더', '먹고', '나왔다', '궂은비', '는', '의연히', '추적추적', '내', '린다', '김첨', '지는', '취중', '에도', '설렁탕', '을', '사가지고', '집', '에', '다다랐다', '집', '이라', '해도', '물론', '셋집', '이', '요', '또', '집', '전체', '를', '세든', '게', '아니라', '안과', '뚝', '떨어진', '행', '랑방', '한', '간', '을', '빌', '려', '든', '것', '인데', '물', '을', '길어', '대고', '한', '달', '에', '일', '원', '씩', '내는', '터', '이다', '만일', '김', '첨', '지가', '주기', '를', '띠', '지', '않았던들', '한', '발', '을', '대문', '에', '들여놓았을', '제', '그', '곳', '을', '지배', '하는', '무시', '무시', '한', '정적', '靜寂', '폭풍우', '가', '지나간', '뒤', '의', '바다', '같은', '정적', '이', '다리', '가', '떨렸', '으리라', '쿨룩', '거리', '는', '기침', '소리', '도', '들을', '수', '없다', '그르렁', '거리', '는', '숨소리', '조차', '들을', '수', '없다', '다만', '이', '무덤', '같은', '침묵', '을', '깨뜨리는', '깨뜨린다느니', '보다', '한', '층', '더', '침묵', '을', '깊게', '하고', '불길하게', '하는', '빡빡', '하는', '그윽', '한', '소리', '어린', '애', '의', '젖', '빠는', '소리', '가', '날', '뿐', '이다', '만일', '청각', '聽覺', '이', '예민한', '이', '같으면', '그', '빡빡', '소리', '는', '빨', '따름', '이', '요', '꿀떡', '꿀떡', '하고', '젖', '넘어가는', '소리', '가', '없으니', '빈', '젖', '을', '빤', '다는', '것', '도', '짐작', '할는지', '모르리라', '혹은', '김', '첨', '지도', '이', '불길한', '침묵', '을', '짐작', '했는지도', '모른다', '그렇지', '않으면', '대', '문', '에', '들어서자마자', '전', '에', '없이', '이', '난장', '맞을', '년', '남편', '이', '들어오는데', '나와', '보지', '도', '않아', '이', '오라질', '년', '이라고', '고함', '을', '친', '게', '수상하다', '이', '고함', '이야말로', '제', '몸', '을', '엄습해', '오는', '무시', '무시', '한', '증', '을', '쫓아', '버리려는', '허', '장성', '세인', '까닭', '이다', '하여간', '김첨', '지는', '방문', '을', '왈칵', '열었다', '구역', '을', '나게', '하는', '추기', '떨어진', '삿', '자리', '밑', '에서', '나온', '먼지', '내', '빨', '지', '않은', '기저귀', '에서', '나', '는', '똥내', '와', '오줌', '내', '가지', '각색', '때', '가', '켜', '켜이', '앉은', '옷내', '병인', '의', '땀', '썩은', '내', '가', '섞인', '추기', '가', '무딘', '김첨', '지', '의', '코', '를', '찔렀다', '방', '안', '에', '들어서며', '설렁탕', '을', '한구석', '에', '놓을', '사이', '도', '없이', '주정', '꾼', '은', '목청', '을', '있는', '대로', '다', '내어', '호통', '을', '쳤다', '이런', '오라질', '년', '주야장천', '누워만', '있으면', '제일', '이야', '남편', '이', '와도', '일어나', '지를', '못', '해', '라는', '소리', '와', '함께', '발길', '로', '누운', '이의', '다리', '를', '몹시', '찼다', '그러나', '발길', '에', '채이', '는', '건', '사람', '의', '살이', '아니고', '나무', '등걸', '과', '같은', '느낌', '이', '있었다', '이', '때', '에', '빽빽', '소', '리가', '응', '아', '소리', '로', '변하였다', '개똥이', '가', '물었던', '젖', '을', '빼어', '놓고', '운다', '운', '대도', '온', '얼굴', '을', '찡그려', '붙여서', '운다는', '표정', '을', '할', '뿐', '이다', '응', '아', '소리', '도', '입', '에서', '나', '는', '게', '아니고', '마치', '뱃속', '에서', '나', '는', '듯', '하였다', '울', '다가', '울', '다가', '목도', '잠겼고', '또', '울', '기운', '조차', '시진', '한', '것', '같다', '발', '로', '차도', '그', '보람', '이', '없는', '걸', '보자', '남편', '은', '아내', '의', '머리', '맡으로', '달려들어', '그', '야말로', '까치', '집', '같은', '환자', '의', '머리', '를', '꺼', '들어', '흔들며', '이', '년', '아', '말', '을', '해', '말', '을', '입', '이', '붙었어', '이', '오라질', '년', '으응', '이', '것', '봐', '아무', '말', '이', '없네', '이', '년', '아', '죽었단', '말', '이냐', '왜', '말', '이', '없어', '으응', '또', '대답', '이', '없네', '정말', '죽었나', '버이', '이러다가', '누운', '이의', '흰', '창', '을', '덮은', '위로', '치뜬', '눈', '을', '알아보자마자', '이', '눈', '깔', '이', '눈', '깔', '왜', '나를', '바라보지', '못', '하고', '천장', '만', '보느냐', '응', '하는', '말', '끝', '엔', '목', '이', '메였다', '그러자', '산', '사람', '의', '눈', '에서', '떨어진', '닭', '의', '똥', '같은', '눈물', '이', '죽은', '이의', '뻣뻣한', '얼굴', '을', '어룽어룽', '적시었다', '문득', '김첨', '지는', '미친', '듯이', '제', '얼굴', '을', '죽은', '이의', '얼굴', '에', '한데', '비비', '대', '며', '중얼거렸다', '설렁탕', '을', '사다', '놓았는데', '왜', '먹지를', '못', '하니', '왜', '먹지를', '못', '하니', '괴상', '하게도', '오늘', '은', '운수', '가', '좋더니만']
    '''

 

 

[Python] - 파이썬 형태소 분석기

파이썬 형태소 분석기 라이브러리 사용해보기사용 전 간단한 설명더보기1. 형태소란?형태소(形態素)는 뜻을 가진 가장 작은 말의 단위로 더 이상 나누게 되면 그 의마가 없어지는 것들을 말합니

namji9507.tistory.com

 


2. 불용어 파일 불러오기

  • nltk라는 불용어가 정리되어 있는 라이브러리가 있지만 여기에는 한국어 불용어가 정의되어 있지 않습니다.
  • 한국어는 아직 지정된 불용어가 없어 따로 지정해 줘야 된다고 알고 있습니다.
  • 그래서 찾아본 결과 불용어 100개 정도 정리된 것을 보고 그것을 기준으로 불용어 제거 코드를 추가했습니다.
  • 불용어 파일 불러오기 코드
    더보기
    import re
    from konlpy.tag import Okt
    from collections import Counter
    
    print('한국 소설 현진건의 운수 좋은 날에서 가장 많이 나온 단어 20개 추출')
    print('불용어 제거하는 전처리 작업도 수행')
    
    class TextCounter:
        def __init__(self, file_path):
            self.okt = Okt()
            self.file_path = file_path
            self.sentences_tag = [] # 형태소 분석 결과
            self.stop_word_list = [] # 불용어 리스트
    
        # okt 기준 형태소 분리
        def morpheme_separation_space(self):
            text = open(self.file_path, 'r', encoding='UTF-8').read()
            text = re.sub(r'[^\w\s]', '', text)
    
            # okt 함수를 통해 읽어 들인 내용의 형태소를 분석
            # 단어만 저장할 수 있도록 설정
            # self.sentences_tag = [word for word in self.okt.morphs(text) if word.strip() != '']
            for word in self.okt.morphs(text):
                if word.strip() != '':
                    self.sentences_tag.append(word)
    
        # 따로 지정한 불용어 리스트 불러오기
        def stop_words_space(self):
            stop_words_list = open("C:/WorkSpace/Python/python-basic/blog/한국어_불용어.txt", 'r', encoding='UTF-8')
    
            # 텍스트 파일에 저장해둔 불용어 배열로 저장
            # 단어만 저장되도록 설정
            # self.stop_word_list = [word.strip() for word in stop_words_list]
            for word in stop_words_list:
                self.stop_word_list.append(word.strip())
    
            print(self.stop_word_list)
    
    if __name__ == '__main__':
        text_class = TextCounter(r"C:\WorkSpace\Python\python-basic\blog\운수좋은날.txt")
        text_class.morpheme_separation_space()
        text_class.stop_words_space()
    
    '''
    출력
    ['이', '나오', '있', '가지', '씨', '하', '것', '들', '그', '되', '수', '이', '보', '않', '없', '나', '사람', '주', '아니', '등', '같', '우리', '때', '년', '가', '한', '지', '대하', '오', '말', '일', '그렇', '위하', '때문', '그것', '두', '말하', '알', '그러나', '받', '못하', '일', '그런', '또', '문제', '더', '사회', '많', '그리고', '좋', '크', '따르', '중', '지금', '생각하', '그러', '속', '하나', '집', '살', '모르', '적', '월', '데', '자신', '안', '어떤', '내', '내', '경우', '명', '생각', '시간', '그녀', '다시', '이런', '앞', '보이', '번', '다른', '어떻', '여자', '개', '전', '들', '사실', '이렇', '점', '싶', '말', '정도', '좀', '원', '잘', '통하', '소리', '놓']
    '''

3. 불용어 제거

  • 불용어 자세한 내용
  • 불러온 파일을 for문과 if문을 이용하여 불용어 리스트에 해당되는 단어를 제외하고 저장하도록 했습니다.
  • 출력 부분을 보면 처음 형태소 분리의 출력과 비교해보면 불용어가 제거된 상태로 출력되는 것을 확인할 수 있습니다.
  • 불용어 제거 코드
    더보기
    import re
    from konlpy.tag import Okt
    from collections import Counter
    
    print('한국 소설 현진건의 운수 좋은 날에서 가장 많이 나온 단어 20개 추출')
    print('불용어 제거하는 전처리 작업도 수행')
    
    class TextCounter:
        def __init__(self, file_path):
            self.okt = Okt()
            self.file_path = file_path
            self.sentences_tag = [] # 형태소 분석 결과
            self.stop_word_list = [] # 불용어 리스트
            self.after_stop_word = [] # 불용어 제거된 결과
    
        # okt 기준 형태소 분리
        def morpheme_separation_space(self):
            text = open(self.file_path, 'r', encoding='UTF-8').read()
            text = re.sub(r'[^\w\s]', '', text)
    
            # okt 함수를 통해 읽어 들인 내용의 형태소를 분석
            # 단어만 저장할 수 있도록 설정
            # self.sentences_tag = [word for word in self.okt.morphs(text) if word.strip() != '']
            for word in self.okt.morphs(text):
                if word.strip() != '':
                    self.sentences_tag.append(word)
    
        # 따로 지정한 불용어 리스트 불러오기
        def stop_words_space(self):
            stop_words_list = open("C:/WorkSpace/Python/python-basic/blog/한국어_불용어.txt", 'r', encoding='UTF-8')
    
            # 텍스트 파일에 저장해둔 불용어 배열로 저장
            # 단어만 저장되도록 설정
            # self.stop_word_list = [word.strip() for word in stop_words_list]
            for word in stop_words_list:
                self.stop_word_list.append(word.strip())
    
        # 운수좋은날에서 불용어 제거
        def remove_stop_words(self):
            # 형태소 분리된 운수좋은날과 정리된 불용어를 사용하여
            # 운수좋은날에서 불용어 제거
            # self.after_stop_word = [word.strip() for word in self.sentences_tag if word not in self.stop_word_list]
            for word in self.sentences_tag:
                if word not in self.stop_word_list:
                    self.after_stop_word.append(word.strip())
    
            print(self.after_stop_word)
    
    if __name__ == '__main__':
        text_class = TextCounter(r"C:\WorkSpace\Python\python-basic\blog\운수좋은날.txt")
        text_class.morpheme_separation_space()
        text_class.stop_words_space()
        text_class.remove_stop_words()
        # text_class.top_count()
    
    '''
    출력
    ['운수', '좋은', '날', '현진건', '새침하게', '흐린', '품', '눈', '올', '듯', '하더니', '눈', '은', '오고', '얼다가', '만', '비', '추', '추적', '내리는', '날이었다', '날', '이야말로', '동소문', '에서', '인력거', '꾼', '노릇', '을', '하는', '김', '첨', '지에게는', '오래간만', '에도', '닥친', '운수', '좋은', '날이었다', '문안', '에', '거기', '도', '문밖', '은', '아니지만', '들어간답', '시', '는', '앞집', '마마', '님', '을', '찻길', '까지', '모셔다', '드린', '을', '비롯', '으로', '행여', '손님', '있을까', '하고', '정류장', '에서', '어정어정', '하며', '내리는', '에게', '거의', '비는', '듯', '눈결', '을', '보내고', '있다가', '마침내', '교원', '인', '듯', '양복', '쟁이', '를', '동광', '학교', '東光', '學校', '까지', '태워다', '주기', '로', '되었다', '첫', '에', '삼십', '둘째', '에', '오십전', '아침', '댓', '바람', '에', '그리', '흉치', '않은', '일이', '었다', '그야말로', '재수', '옴', '붙어서', '근', '열흘', '동안', '돈', '구경', '도', '못', '김첨', '지는', '십', '짜리', '백', '동화', '서', '푼', '또는', '다섯', '푼', '찰깍', '하고', '손바닥', '에', '떨어질', '제', '거의', '눈물', '을', '흘릴', '만큼', '기뻤었다', '더구나', '날', '에', '팔십', '전이', '라는', '돈', '에게', '얼마나', '유용한지', '몰랐다', '컬컬', '목', '에', '모주', '잔', '도', '적실', '있거니와', '보다도', '앓는', '아내', '에게', '설렁탕', '그릇', '도', '사다', '줄', '음', '이다', '의', '아내', '기침', '으로', '쿨룩', '거리', '기는', '벌써', '달포', '넘었다', '조', '밥', '도', '굶기를', '먹다시피', '하는', '형편', '이니', '물론', '약', '첩', '써', '본', '일이', '없다', '구태여', '쓰려면', '못', '쓸', '바', '도', '아니로되', '는', '병', '이란', '놈', '에게', '약', '을', '주어', '보내면', '재미', '를', '붙여서', '자', '꾸', '온다는', '자기', '의', '신조', '信條', '에', '어디', '까지', '충실하였다', '따라서', '의사', '에게', '인', '없으니', '무슨', '병인', '지는', '없으되', '반듯이', '누워', '고', '일어나기', '는', '새로', '모로', '도', '못', '눕는', '걸', '보면', '중증', '은', '증인', '듯', '병', '이대', '도록', '심해지', '기는', '열흘', '에', '조', '밥', '을', '먹고', '체', '이다', '그때', '도', '김', '첨', '지가', '오래간만', '에', '돈', '을', '얻어서', '좁쌀', '되와', '십', '짜리', '나무', '단', '을', '사다', '주었더니', '김', '첨', '지의', '에', '의지', '하면', '오라질', '천방지축', '으로', '냄비', '에', '대고', '끓였다', '마음', '은', '급하고', '불길', '은', '달', '않아', '채', '익지도', '않은', '을', '오라질', '숟가락', '은', '고', '만두', '고', '손', '으로', '움켜서', '뺨', '에', '주먹', '덩이', '같은', '혹', '불거지도록', '누가', '빼앗을', '듯이', '처', '박질하더니만', '그날', '저녁', '부터', '가슴', '땡긴다', '배', '켕긴다', '고', '눈', '을', '흡', '뜨고', '지랄병', '을', '하였다', '그때', '김첨', '지는', '열', '화', '와', '같이', '성', '을', '내며', '에이', '오라질', '조랑', '복은', '할', '수가', '없어', '못', '먹어', '병', '먹어서', '병', '어쩌', '란', '이야', '왜', '눈', '을', '바루', '뜨지', '못', '해', '하고', '앓는', '이의', '뺨', '을', '후려', '갈', '겼다', '흡', '뜬', '눈', '은', '조금', '바루', '어', '졌건만', '이슬', '맺히었다', '김', '첨', '지의', '눈시울', '도', '뜨', '끈', '뜨끈하였다', '환자', '그러고도', '먹는', '는', '물리', '않았다', '사흘', '부터', '설렁탕', '국물', '마시고', '싶다고', '남편', '을', '졸랐다', '오라질', '조', '밥', '도', '못', '먹는', '설렁탕', '은', '처', '먹고', '지랄병', '을', '게', '라고', '야단', '을', '쳐', '보았건만', '못', '사주는', '마음', '시원', '치는', '않았다', '인제', '설렁탕', '을', '사줄', '수도', '있다', '앓는', '어미', '곁', '에서', '배고파', '보채는', '개똥이', '세', '먹이', '에게', '죽', '을', '사줄', '수도', '있다', '팔십', '을', '손', '에', '쥔', '김', '첨', '지의', '마음', '은', '푼', '푼하였다', '의', '행운', '은', '걸', '로', '그치지', '않았다', '땀', '과', '빗물', '섞여', '흐르는', '목덜', '미를', '기름', '주머니', '다', '된', '왜목', '수건', '으로', '닦으며', '학교', '문', '을', '돌아', '나올', '였다', '뒤', '에서', '인력거', '하고', '부르는', '난다', '자기', '를', '불러', '멈춘', '사', '람', '학교', '학생', '인', '줄', '김첨', '지는', '한번', '보고', '짐작', '할', '있었다', '학생', '은', '다짜고짜로', '남대문', '정거장', '까지', '얼마', '요', '라고', '물었다', '아마도', '학교', '기숙사', '에', '있는', '이로', '동', '기', '방학', '을', '이용', '하여', '귀', '향', '하려', '함이리라', '오늘', '가기', '로', '작정', '은', '하였건만', '비는', '오고', '짐', '은', '있고', '해서', '어찌', '할', '줄', '모르다가', '마침', '김', '첨', '지를', '보고', '뛰어나왔음', '리라', '그렇지', '않으면', '왜', '구두', '를', '채', '신지', '못', '해서', '질질', '끌', '고', '비록', '고구', '라', '양', '복일', '망정', '노', '박이로', '비', '를', '맞으며', '김', '첨', '지를', '뒤', '쫓아', '나왔으랴', '남대문', '정거장', '까지', '말씀', '입', '니까', '하고', '김첨', '지는', '잠깐', '주저', '하였다', '는', '우중', '에', '우장', '도', '없이', '먼', '곳', '을', '철벅', '거리', '고', '가기', '싫었음', '일까', '처음', '둘째', '으로', '고만', '만족하였음', '일까', '아니다', '결코', '아니다', '이상하게도', '꼬리', '를', '맞', '물', '고', '덤비는', '행운', '에', '조금', '겁', '났', '음', '이다', '을', '나올', '제', '아내', '의', '부탁', '마음', '켕', '기었다', '마마', '님', '한테', '서', '부르러', '왔을', '제', '병인', '은', '뼈', '만', '남은', '얼굴', '에', '유일', '의', '샘물', '은', '유', '달리', '크고', '움푹한', '눈', '에', '애걸', '하는', '빛', '을', '띄우며', '오늘', '은', '나가지', '말아요', '제발', '덕분', '에', '에', '붙어', '있어요', '이렇게', '아', '픈데', '라고', '모기', '같이', '중얼거리고', '숨', '을', '걸그렁걸그렁', '하였다', '그때', '에', '김첨', '는', '대수롭지', '않은듯이', '아따', '젠장맞을', '별', '빌어먹을', '를', '다', '하네', '맞붙', '들고', '앉았으면', '누', '먹여', '살릴', '줄', '아', '하고', '훌쩍', '뛰어나오려니까', '환자', '는', '붙잡을', '듯이', '팔', '을', '저', '으', '며', '나가지', '라도', '그래', '그러면', '일찍이', '들어와요', '하고', '목', '메인', '뒤', '를', '따랐다', '정거장', '까지', '가잔', '을', '들은', '순간', '에', '경련', '으로', '떠는', '손', '유', '달리', '큼직한', '눈', '울', '듯', '아내', '의', '얼굴', '김', '첨', '지의', '눈앞', '에', '어른어른', '하였다', '그래', '남대문', '정거장', '까지', '얼마', '란', '요', '하고', '학생', '은', '초조한', '듯이', '인력거', '꾼', '의', '얼굴', '을', '바라보며', '혼자', '같이', '인천', '차가', '열한', '에', '있고', '다음', '에는', '새로', '이든', '라고', '중얼거린다', '오십', '전만', '줍시요', '저', '도', '모를', '사이', '에', '불쑥', '김', '첨', '지의', '입', '에서', '떨어졌다', '제', '입', '으로', '부', '르고', '도', '스스로', '엄청난', '돈', '액수', '에', '놀랐다', '한꺼', '에', '금액', '을', '불러라', '도', '본', '지가', '얼마', '만인', '그러자', '돈벌', '용기', '병자', '에', '대한', '염려', '를', '사', '르', '고', '말았다', '설마', '오늘', '로', '어떠랴', '싶었다', '무슨', '일이', '있더라도', '제일', '제', '이의', '행운', '을', '곱친', '보다', '고', '오히려', '갑절', '많은', '행운', '을', '놓칠', '없다', '였다', '오십', '은', '너무', '과', '을', '하며', '학생', '은', '고개', '를', '기웃하였다', '아니올시다', '잇수로', '치면', '여기', '서', '거기', '시오', '리가', '넘는답니다', '진날', '은', '주셔야지요', '하고', '빙글빙글', '웃는', '차', '부의', '얼굴', '에는', '숨길', '없는', '기쁨', '넘쳐', '흘렀다', '그러면', '달라', '는', '대로', '줄', '터', '이니', '빨리', '가요', '관대한', '어린', '손님', '은', '을', '남기고', '총총히', '옷', '도', '입고', '짐', '도', '챙기러', '갈', '로', '갔다', '학생', '을', '태우고', '나선', '김', '첨', '지의', '다리는', '이상하게', '거뿐하였다', '달', '음질', '을', '한다느니', '보다', '거의', '는', '듯', '하였다', '바퀴', '도', '어떻게', '속히', '도', '는', '구른다느니', '보다', '마치', '얼음', '을', '지쳐', '나가는', '스케이트', '모양', '으로', '미끄러져', '가는', '듯', '하였다', '언', '땅', '에', '비', '내려', '미끄럽', '기도', '하였지만', '이윽고', '끄는', '이의', '다리는', '무거워졌다', '자기', '가까이', '다다른', '까닭', '이다', '새삼스러운', '염려', '의', '가슴', '을', '눌렀다', '오늘', '은', '나가지', '말아요', '렇', '게', '아픈데', '잉잉', '의', '귀', '에', '울렸다', '병자', '의', '움쑥', '들어', '간', '눈', '원망하는', '듯이', '자기', '를', '노리는', '듯', '하였다', '그러자', '엉엉', '하고', '우는', '똥', '이의', '곡성', '을', '들은', '듯', '싶다', '딸국딸국', '하고', '숨', '모으는', '도', '는', '듯', '싶다', '왜', '리우', '기차', '놓치겠구먼', '하고', '탄', '이의', '초조한', '부르짖음', '간신히', '의', '귀', '에', '들어왔다', '언뜻', '깨', '달으', '니', '김첨', '지는', '인력거', '를', '쥔', '채', '길', '복판', '에', '엉거주춤', '멈춰', '있지', '않은가', '예', '예', '하고', '김첨', '지는', '또다시', '달', '음질', '하였다', '차차', '멀어', '갈수록', '김', '첨', '지의', '걸', '음', '에는', '다시금', '신', '나기', '시작', '하였다', '다리', '를', '재게', '놀려야만', '쉴', '새', '없이', '자기', '의', '머리', '에', '떠오르는', '모든', '근심', '과', '걱정', '을', '잊을', '듯이', '정거장', '까지', '끌어다', '주고', '깜짝', '놀란', '오십', '을', '정말', '제', '손', '에', '쥠에', '제', '마따나', '십리', '되는', '길', '을', '비', '를', '맞아', '가며', '질퍽', '거리', '고', '온', '은', '하고', '거저', '얻은', '듯이', '고마웠다', '졸부', '된', '듯이', '기뻤다', '제', '자식뻘', '밖에', '되는', '어린', '손님', '에게', '몇', '허리', '를', '굽히며', '안녕히', '다녀옵시요', '라고', '깍', '듯이', '재우', '쳤다', '빈', '인력거', '를', '털털', '거리', '며', '우중', '에', '돌아갈', '일이', '꿈밖', '이었다', '노동', '으로', '하여', '흐른', '땀', '식어지자', '굶주린', '창자', '에서', '물', '흐르는', '옷', '에서', '어슬어', '슬', '한기', '솟아나기', '비롯', '매', '오십', '이란', '돈', '얼마나', '괜찮고', '괴로', '운', '인', '줄', '절절', '히', '느끼었다', '정거장', '을', '떠나는', '의', '발길', '은', '힘', '없었', '다', '온몸', '옹송', '그려지며', '당장', '자리', '에', '엎어져', '못', '일어날', '같았다', '젠장맞을', '비', '를', '맞으며', '빈', '인력거', '를', '털털', '거리', '고', '돌아를', '간담', '런', '빌어먹을', '제', '할미', '를', '붙을', '비', '왜', '남', '의', '상판', '을', '딱', '딱', '때려', '는', '몹시', '화증', '을', '내며', '누구', '에게', '반항', '이나', '하는', '듯이', '게걸', '거', '렸다', '그럴', '즈', '음', '에', '의', '머리', '엔', '새로운', '광명', '비쳤나니', '은', '이러구', '갈', '게', '라', '근처', '를', '빙빙', '돌', '며', '차', '오기', '를', '기다리면', '손님', '을', '태우게', '될는지도', '몰', '라', '란', '이었다', '오늘', '운수', '괴상하게도', '좋으니까', '요행', '한번', '없으', '리라', '고', '누가', '보증', '랴', '꼬리', '를', '굴리', '는', '행운', '꼭', '자기', '를', '기다리고', '있다', '고', '내기', '를', '해도', '좋을', '만', '믿음', '을', '얻게', '되었다', '그렇다고', '정거장', '인력거', '꾼', '의', '등쌀', '무서우니', '정거장', '에', '섰을', '는', '없었다', '그래', '는', '이전', '에도', '여', '러', '해본', '일이', '라', '바로', '정거장', '전차', '정류장', '에서', '조금', '떨어지게', '다', '니', '는', '길', '과', '찻길', '틈', '에', '인력거', '를', '세워', '놓고', '자기', '는', '근처', '를', '빙빙', '돌', '며', '형', '세', '를', '관망', '하기로', '하였다', '얼마', '만에', '기차', '는', '왔고', '수십', '이나', '되는', '손', '정', '류', '장', '으로', '쏟아져', '나왔다', '에서', '손님', '을', '물색', '는', '김', '첨', '지의', '눈', '엔', '양', '머리', '에', '뒤축', '높은', '구두', '를', '신고', '망토', '까지', '두른', '기생', '퇴물', '인', '듯', '난봉', '여학생', '인', '듯', '여편네', '의', '모양', '띄었다', '는', '슬근슬근', '의', '곁', '으로', '다가들었다', '아씨', '인력거', '타', '시', '랍시', '요', '여학생', '인지', '만지가', '한참', '은', '매우', '때깔', '을', '빼며', '입술', '을', '꼭', '다문', '채', '김첨', '를', '거들', '떠보지도', '않았다', '김첨', '지는', '구걸', '하는', '거지', '무엇', '같이', '연해', '연방', '의', '기색', '을', '살피', '며', '아씨', '정거장', '애', '보담', '아주', '싸게', '모셔다', '드리겠습니다', '댁', '어디', '신가', '요', '하고', '추근추근', '하게도', '의', '들고', '있는', '일본', '식', '버들', '고리짝', '에', '제', '손', '을', '대', '었다', '왜', '이래', '남', '귀', '치', '않게', '를', '벽력', '같이', '지르고는', '돌아선다', '김첨', '지는', '어랍시', '요', '하고', '물러섰다', '전차', '는', '왔다', '김첨', '지는', '원망', '스럽게', '전차', '타는', '이를', '노리', '고', '있었다', '의', '예감', '豫感', '은', '틀리지', '않았다', '전차', '빡빡', '하게', '을', '싣고', '움직이기', '시작', '하였을', '제', '타고', '남은', '손', '있었다', '굉장하게', '큰', '가방', '을', '들고', '있는', '걸', '보면', '아마', '붐비는', '차', '에', '짐', '크다', '하여', '차장', '에게', '밀려', '내려온', '눈치', '였', '다', '김첨', '지는', '대어', '섰다', '인력거', '를', '타', '시', '랍시', '요', '한동안', '값', '으로', '승강이', '를', '하다가', '육십', '에', '인사동', '까지', '태워다', '주기', '로', '하였', '다', '인력거', '무거워지매', '의', '몸', '은', '이상하게도', '가벼워졌고', '인력', '거가', '가벼워지니', '몸', '은', '다시금', '무거워졌건만', '이번', '에는', '마음', '조차', '초조해', '온', '다', '집의', '광경', '자꾸', '눈앞', '에', '어른거리어', '인제', '요행', '을', '바랄', '여유도', '없었다', '나무', '걸이', '무엇', '같고', '제', '같지도', '않은', '다리', '를', '연해', '꾸짖으며', '질', '팡', '갈', '팡', '뛰는', '밖에', '없었다', '저', '놈', '의', '인력거', '꾼', '저렇게', '술', '취해', '고', '진', '땅', '에', '어찌', '가노', '라고', '길', '가는', '걱정', '을', '하리', '만큼', '의', '걸음', '은', '황급', '였다', '흐리고', '비', '오는', '하늘', '은', '어둠침침하게', '벌써', '황혼', '에', '가까운', '듯', '하다', '창', '경원', '까지', '다다라', '서야', '는', '턱', '에', '닿은', '숨', '을', '돌리고', '걸음', '도', '늦추', '잡았다', '걸음', '걸음', '가까워', '갈수록', '의', '마음', '조차', '괴상하게', '누그러웠다', '그런데', '누', '움', '은', '안심', '에서', '오는', '게', '아니요', '자기', '를', '덮', '친', '무서운', '불행', '을', '빈틈', '없이', '게', '될', '박두', '을', '두리', '는', '마음', '에서', '오는', '이다', '는', '불', '행', '에', '다', '닥치기', '을', '얼마', '쯤', '이라도', '늘이려고', '버르적거렸다', '기적', '奇蹟', '에', '가까운', '벌이', '를', '하였다는', '기쁨', '을', '할', '있으면', '오래', '지니', '고', '싶었다', '는', '두리', '두리', '사면', '을', '살피었다', '모양', '은', '마치', '자기', '곧', '불행', '을', '향', '고', '달아가는', '제', '다리', '를', '제', '힘', '으로는', '도저히', '어찌', '할', '없으니', '누구', '든지', '를', '잡아', '다고', '구해', '다고', '하는', '듯', '하였다', '그럴', '즈음', '에', '마침', '길가', '선술집', '에서', '의', '친구', '치', '삼이', '나온다', '의', '우', '글', '우', '글', '살찐', '얼굴', '에', '주홍', '덧', '는', '듯', '온', '턱', '과', '뺨', '을', '시커멓게', '구레나룻', '덮였', '거늘', '노르', '탱탱한', '얼굴', '바짝', '라서', '여기저기', '고랑', '패', '고', '수염', '도', '대야', '턱밑', '에만', '마치', '솔잎', '송이', '를', '거꾸로', '붙여', '놓은', '듯', '김', '첨', '지의', '풍채', '하고는', '기', '대상', '을', '짓고', '있었다', '여보', '게', '김첨', '자네', '문안', '들어갔다', '오는', '모', '양', '세', '려', '돈', '많이', '벌었을', '테', '니', '한잔', '빨리', '게', '뚱뚱보', '는', '말라', '깽', '이를', '보던', '맡에', '부르짖었다', '목소리', '는', '몸집', '과', '딴판', '으로', '연하고', '싹싹하였다', '김첨', '지는', '친구', '를', '만난', '게', '어떻게', '반가운지', '몰랐다', '자기', '를', '살려', '준', '은인', '이나', '무엇', '같이', '고맙', '기도', '하였다', '자네', '는', '벌써', '한잔', '모', '양', '세', '려', '자네도', '오늘', '재미', '좋아', '하고', '김첨', '지는', '얼굴', '을', '펴서', '웃었다', '아따', '재미', '좋다고', '술', '못', '먹을', '낸가', '그런데', '여보', '게', '자네', '왼', '몸', '어', '째', '물독', '에', '빠진', '새앙쥐', '같은가', '어서', '이리', '들어와', '말리', '게', '선술집', '은', '훈훈하고', '뜨뜻하였다', '추어탕', '을', '끓이는', '솥', '뚜껑', '을', '열', '마다', '뭉', '게', '뭉', '게', '떠오르는', '흰', '김', '석쇠', '에서', '뻐지짓뻐지짓', '구워지는', '너비아니', '구이', '며', '제육', '이며', '간이', '며', '콩팥', '이며', '북어', '며', '빈대떡', '너저분하게', '늘어놓인', '안주', '탁자', '에', '김첨', '지는', '갑자기', '속이', '쓰려서', '견딜', '없었다', '마음대로', '할', '양', '이면', '거기', '있는', '모든', '먹음', '먹이', '를', '모조리', '깡그리', '집어', '삼켜도', '시원', '치', '않았다', '배고', '픈', '이는', '위선', '분량', '많은', '빈대떡', '를', '쪼', '이기도', '하고', '추어탕', '을', '그릇', '청', '하였다', '주린', '창자', '는', '음식', '맛', '을', '보더', '니', '더욱', '더욱', '비어지며', '자꾸자꾸', '들이', '라', '들이라', '하였다', '순식간', '에', '두부', '와', '미꾸리', '든', '국', '그릇', '을', '그냥', '물', '같이', '들이켜고', '말았다', '셋째', '그릇', '을', '받아', '들었을', '제', '데우던', '막걸리', '곱', '배기', '잔', '더웠다', '치', '삼이', '와', '같이', '마시자', '비었던', '이라', '찌르를', '하고', '창자', '에', '퍼지며', '얼굴', '화끈하였다', '눌러', '곱', '배기', '잔', '을', '마셨다', '김', '첨', '지의', '눈', '은', '벌써', '개개', '풀리기', '시작', '하였다', '석쇠', '에', '얹힌', '떡', '를', '숭', '덩숭덩', '썰어서', '볼', '을', '불', '룩', '거리', '며', '곱', '배기', '잔', '을', '부어', '라', '하였다', '치', '삼은', '의아', '듯이', '김', '첨', '지를', '보며', '여보', '게', '붓다', '니', '벌써', '넉', '잔', '씩', '먹었네', '돈', '사십', '세', '라고', '주의', '시켰다', '아따', '놈', '아', '사십', '전이', '그리', '끔찍하냐', '오늘', '돈', '을', '막', '벌었어', '참', '오늘', '운수', '좋았느니', '그래', '얼마', '를', '벌었단', '인가', '삼십', '을', '벌었어', '삼십', '을', '젠장맞을', '술', '을', '왜', '부어', '괜찮', '다', '괜찮다', '막', '먹어도', '상관', '없어', '오늘', '돈', '산더미', '같이', '벌었는데', '어', '취했군', '그만두세', '놈', '아', '그걸', '먹고', '취할', '내냐', '어서', '먹어', '하고는', '치삼', '의', '귀', '를', '잡아', '치', '며', '취한', '이는', '부르짖었다', '술', '을', '붓는', '열', '다섯', '됨', '직한', '중대가리', '에게로', '달려들며', '놈', '오라질', '놈', '왜', '술', '을', '붓지', '않어', '라고', '야단', '을', '쳤다', '중대가리', '는', '희', '희', '웃고', '치삼', '을', '보며', '문의', '하는', '듯이', '눈짓', '을', '하였다', '주정', '꾼', '눈치', '를', '알아보고', '화', '를', '버럭', '내며', '에미', '를', '붙을', '오라질', '놈', '같으니', '놈', '돈', '없을', '줄', '고', '하자', '마자', '허리춤', '을', '훔칫훔칫', '하더니', '짜리', '장', '을', '꺼내어', '중대가리', '에', '펄쩍', '집어던졌다', '사', '품', '에', '몇', '푼', '은', '전이', '랑', '하며', '떨어진다', '여보', '게', '돈', '떨어졌네', '왜', '돈', '을', '막', '끼', '얹나', '을', '하며', '일변', '돈', '을', '줍는다', '김첨', '지는', '취한', '에도', '돈', '의', '거처', '를', '피는', '듯이', '눈', '을', '크게', '떠서', '땅', '을', '내려다보다가', '불시', '에', '제', '하는', '짓', '너무', '럽다', '는', '듯이', '고개', '를', '소스', '라', '치자', '더욱', '성', '을', '내며', '봐라', '봐', '더러운', '놈', '아', '돈', '없나', '다리', '뼉', '다', '구를', '꺾어', '놓을', '놈', '같으니', '하고', '치삼', '의', '주워', '주는', '돈', '을', '받아', '엣돈', '육시', '를', '할', '돈', '하면서', '풀', '매질', '을', '친다', '벽', '에', '맞아', '떨어진', '돈', '은', '술', '끓이는', '양푼', '에', '떨어', '지며', '정당한', '매', '를', '맞는다는', '듯이', '쨍', '하고', '울었다', '곱', '배기', '잔', '은', '부어질', '겨를', '도', '없이', '말려', '가고', '말았다', '김첨', '지는', '입술', '과', '수염', '에', '붙은', '술', '을', '빨아들이고', '나서', '매우', '만족한', '듯이', '솔잎', '송이', '수염', '을', '쓰다듬으며', '부어', '부어', '라고', '외쳤다', '잔', '먹고', '나서', '김첨', '지는', '치삼', '의', '어깨', '를', '치', '며', '문득', '껄껄', '웃는다', '웃음', '어떻게', '컸던지', '술집', '에', '있는', '이의', '눈', '은', '모두', '김', '첨', '지에게로', '몰리', '었다', '웃는', '이는', '더욱', '웃으며', '여보', '게', '치', '삼이', '우스운', '이야기', '할까', '오늘', '손', '을', '태고', '정거장', '에', '않았겠나', '그래서', '갔다가', '그저', '오기', '됐데', '그려', '그래', '전차', '정류장', '에서', '어름어름', '하며', '손', '님', '를', '태울', '궁리', '를', '하지', '않았나', '거기', '마침', '마마', '님', '신지', '여학생', '신지', '요새', '야', '어디', '논다니', '와', '아가씨', '를', '구별', '할', '수가', '있던가', '망토', '를', '잡수시고', '비', '를', '맞고', '서', '있겠지', '슬근슬근', '가까이', '가서', '인력거', '타', '시', '랍시', '요', '하고', '손가방', '을', '받으랴', '니까', '손', '을', '탁', '뿌리', '치고', '홱', '돌아서더니만', '왜', '남', '을', '이렇게', '귀', '찮', '게', '굴어', '야말로', '꾀꼬리', '허허', '김첨', '지는', '교묘하게도', '정말', '꾀꼬리', '같은', '를', '내었다', '모든', '은', '일시', '에', '웃었다', '빌어먹을', '깍쟁이', '같은', '누가', '저', '를', '어쩌나', '왜', '남', '을', '귀찮게', '굴어', '어이구', '처신', '도', '없지', '허허', '웃음', '은', '높아졌다', '웃음', '사라', '도', '지기', '에', '김', '첨', '지는', '훌쩍', '훌쩍', '울기', '시작', '하였다', '치', '삼은', '어이없이', '주정뱅이', '를', '바라보며', '금방', '웃고', '지랄', '을', '하더니', '우는', '건', '무슨', '일인', '김첨', '지는', '연해', '코', '를', '들이마시며', '마누라', '죽었다네', '뭐', '마누라', '죽다니', '언제', '놈', '아', '언제', '는', '오늘이', '엣기', '미친', '놈', '거짓말', '아', '거짓말', '은', '왜', '참말', '로', '죽었어', '참말', '로', '마누라', '시체', '를', '에', '뻐들쳐', '고', '술', '을', '먹다니', '죽일', '놈', '이야', '죽일', '놈', '이야', '하고', '김첨', '지는', '엉엉', '를', '내어', '운다', '치', '삼은', '흥이', '조금', '깨어지는', '얼굴', '로', '참말', '을', '거짓말', '을', '그러면', '으로', '가세', '하고', '우는', '이의', '팔', '을', '잡아당기었다', '치삼', '의', '끄는', '손', '을', '뿌리치더니', '김첨', '지는', '눈물', '글썽', '글썽', '눈', '으로', '싱그레', '웃는다', '죽기는', '누가', '죽어', '하고', '득의', '양양', '죽기는', '왜', '죽어', '생때', '같이', '살아만', '있단다', '오라질', '밥', '을', '죽', '이지', '인제', '한테', '았', '다', '하고', '어린', '애', '모양', '으로', '손뼉', '을', '치', '며', '웃는다', '정말', '미쳤단', '인가', '나도', '아주', '먼', '네', '앓는단', '은', '들었는', '하고', '치', '삼이', '도', '어느', '불안', '을', '느끼는', '듯이', '김', '첨', '지에게', '돌아가라고', '권하였', '다', '죽었어', '죽었', '대도', '그래', '김첨', '지는', '화증', '을', '내며', '확신', '있게', '를', '질렀으되', '엔', '죽은', '을', '믿으려고', '애쓰는', '가락', '있었다', '기어이', '어치', '를', '채워서', '곱', '배기', '잔', '씩', '먹고', '나왔다', '궂은비', '는', '의연히', '추적추적', '린다', '김첨', '지는', '취중', '에도', '설렁탕', '을', '사가지고', '에', '다다랐다', '이라', '해도', '물론', '셋집', '요', '전체', '를', '세든', '게', '아니라', '안과', '뚝', '떨어진', '행', '랑방', '간', '을', '빌', '려', '든', '인데', '물', '을', '길어', '대고', '달', '에', '씩', '내는', '터', '이다', '만일', '김', '첨', '지가', '주기', '를', '띠', '않았던들', '발', '을', '대문', '에', '들여놓았을', '제', '곳', '을', '지배', '하는', '무시', '무시', '정적', '靜寂', '폭풍우', '지나간', '뒤', '의', '바다', '같은', '정적', '다리', '떨렸', '으리라', '쿨룩', '거리', '는', '기침', '도', '들을', '없다', '그르렁', '거리', '는', '숨소리', '조차', '들을', '없다', '다만', '무덤', '같은', '침묵', '을', '깨뜨리는', '깨뜨린다느니', '보다', '층', '침묵', '을', '깊게', '하고', '불길하게', '하는', '빡빡', '하는', '그윽', '어린', '애', '의', '젖', '빠는', '날', '뿐', '이다', '만일', '청각', '聽覺', '예민한', '같으면', '빡빡', '는', '빨', '따름', '요', '꿀떡', '꿀떡', '하고', '젖', '넘어가는', '없으니', '빈', '젖', '을', '빤', '다는', '도', '짐작', '할는지', '모르리라', '혹은', '김', '첨', '지도', '불길한', '침묵', '을', '짐작', '했는지도', '모른다', '그렇지', '않으면', '대', '문', '에', '들어서자마자', '에', '없이', '난장', '맞을', '남편', '들어오는데', '나와', '보지', '도', '않아', '오라질', '이라고', '고함', '을', '친', '게', '수상하다', '고함', '이야말로', '제', '몸', '을', '엄습해', '오는', '무시', '무시', '증', '을', '쫓아', '버리려는', '허', '장성', '세인', '까닭', '이다', '하여간', '김첨', '지는', '방문', '을', '왈칵', '열었다', '구역', '을', '나게', '하는', '추기', '떨어진', '삿', '자리', '밑', '에서', '나온', '먼지', '빨', '않은', '기저귀', '에서', '는', '똥내', '와', '오줌', '각색', '켜', '켜이', '앉은', '옷내', '병인', '의', '땀', '썩은', '섞인', '추기', '무딘', '김첨', '의', '코', '를', '찔렀다', '방', '에', '들어서며', '설렁탕', '을', '한구석', '에', '놓을', '사이', '도', '없이', '주정', '꾼', '은', '목청', '을', '있는', '대로', '다', '내어', '호통', '을', '쳤다', '오라질', '주야장천', '누워만', '있으면', '제일', '이야', '남편', '와도', '일어나', '지를', '못', '해', '라는', '와', '함께', '발길', '로', '누운', '이의', '다리', '를', '몹시', '찼다', '발길', '에', '채이', '는', '건', '의', '살이', '아니고', '나무', '등걸', '과', '같은', '느낌', '있었다', '에', '빽빽', '소', '리가', '응', '아', '로', '변하였다', '개똥이', '물었던', '젖', '을', '빼어', '놓고', '운다', '운', '대도', '온', '얼굴', '을', '찡그려', '붙여서', '운다는', '표정', '을', '할', '뿐', '이다', '응', '아', '도', '입', '에서', '는', '게', '아니고', '마치', '뱃속', '에서', '는', '듯', '하였다', '울', '다가', '울', '다가', '목도', '잠겼고', '울', '기운', '조차', '시진', '같다', '발', '로', '차도', '보람', '없는', '걸', '보자', '남편', '은', '아내', '의', '머리', '맡으로', '달려들어', '야말로', '까치', '같은', '환자', '의', '머리', '를', '꺼', '들어', '흔들며', '아', '을', '해', '을', '입', '붙었어', '오라질', '으응', '봐', '아무', '없네', '아', '죽었단', '이냐', '왜', '없어', '으응', '대답', '없네', '정말', '죽었나', '버이', '이러다가', '누운', '이의', '흰', '창', '을', '덮은', '위로', '치뜬', '눈', '을', '알아보자마자', '눈', '깔', '눈', '깔', '왜', '나를', '바라보지', '못', '하고', '천장', '만', '보느냐', '응', '하는', '끝', '엔', '목', '메였다', '그러자', '산', '의', '눈', '에서', '떨어진', '닭', '의', '똥', '같은', '눈물', '죽은', '이의', '뻣뻣한', '얼굴', '을', '어룽어룽', '적시었다', '문득', '김첨', '지는', '미친', '듯이', '제', '얼굴', '을', '죽은', '이의', '얼굴', '에', '한데', '비비', '대', '며', '중얼거렸다', '설렁탕', '을', '사다', '놓았는데', '왜', '먹지를', '못', '하니', '왜', '먹지를', '못', '하니', '괴상', '하게도', '오늘', '은', '운수', '좋더니만']
    '''

4. 카운트

  • 마지막 과정인 형태소 분리 이후 불용어가 제거된 상태에서 단어의 개수들을 얻어낸 후 그 중에서 가장 많이 나온 단어 10개를 추출해 보겠습니다.
  • 여기서는 Counter 모듈을 사용합니다.
  • 가장 많이 나온 단어 10개 추출 코드
    더보기
    import re
    from konlpy.tag import Okt
    from collections import Counter
    
    print('한국 소설 현진건의 운수 좋은 날에서 가장 많이 나온 단어 20개 추출')
    print('불용어 제거하는 전처리 작업도 수행')
    
    class TextCounter:
        def __init__(self, file_path):
            self.okt = Okt()
            self.file_path = file_path
            self.sentences_tag = [] # 형태소 분석 결과
            self.stop_word_list = [] # 불용어 리스트
            self.after_stop_word = [] # 불용어 제거된 결과
            self.result = [] # 가장 많이 나온 단어 10개 저장
    
        # okt 기준 형태소 분리
        def morpheme_separation_space(self):
            text = open(self.file_path, 'r', encoding='UTF-8').read()
            text = re.sub(r'[^\w\s]', '', text)
    
            # okt 함수를 통해 읽어 들인 내용의 형태소를 분석
            # 단어만 저장할 수 있도록 설정
            # self.sentences_tag = [word for word in self.okt.morphs(text) if word.strip() != '']
            for word in self.okt.morphs(text):
                if word.strip() != '':
                    self.sentences_tag.append(word)
    
        # 따로 지정한 불용어 리스트 불러오기
        def stop_words_space(self):
            stop_words_list = open("C:/WorkSpace/Python/python-basic/blog/한국어_불용어.txt", 'r', encoding='UTF-8')
    
            # 텍스트 파일에 저장해둔 불용어 배열로 저장
            # 단어만 저장되도록 설정
            # self.stop_word_list = [word.strip() for word in stop_words_list]
            for word in stop_words_list:
                self.stop_word_list.append(word.strip())
    
        # 운수좋은날에서 불용어 제거
        def remove_stop_words(self):
            # 형태소 분리된 운수좋은날과 정리된 불용어를 사용하여
            # 운수좋은날에서 불용어 제거
            # self.after_stop_word = [word.strip() for word in self.sentences_tag if word not in self.stop_word_list]
            for word in self.sentences_tag:
                if word not in self.stop_word_list:
                    self.after_stop_word.append(word.strip())
    
        def top_count(self):
            #가장 많이 나온 단어 10개 저장
            counts = Counter(self.after_stop_word)
            self.result.extend(counts.most_common(10))
    
            return self.result
    
    if __name__ == '__main__':
        text_class = TextCounter(r"C:\WorkSpace\Python\python-basic\blog\운수좋은날.txt")
        text_class.morpheme_separation_space()
        text_class.stop_words_space()
        text_class.remove_stop_words()
        result = text_class.top_count()
        print(result)
    
    '''
    출력
    [('을', 140), ('에', 78), ('를', 71), ('은', 46), ('는', 41), ('의', 41), ('도', 30), ('하고', 30), ('김첨', 28), ('지는', 26)]
    '''