ElasticStack 한글 형태소 분석

2 분 소요

DELETE my_index2

my_index2에 데이터 저장

PUT my_index2/_doc/1 { “message” : “”” 별 헤는 밤

                    윤동주 /시인
                    
계절이 지나가는 하늘에는 
가을로 가득 차 있습니다. 

나는 아무 걱정도 없이 
가을 속의 별들을 다 헤일 듯합니다.

가슴속에 하나 둘 새겨지는 별을 
이제 다 못 헤는 것은 
쉬이 아침이 오는 까닭이요,
내일 밤이 남은 까닭이요,
아직 나의 청춘이 다하지 않은 까닭입니다.

별 하나에 추억과 
별 하나에 사랑과 
별 하나에 쓸쓸함과 
별 하나에 동경(憧憬)과 
별 하나에 시(詩)와 
별 하나에 어머니, 어머니 

어머님, 나는 별 하나에 아름다운 말 한마디씩
불러봅니다. 
소학교 때 책상을 같이 했던 아이들의 이름과 패(佩), 경(鏡)
,옥(玉) 이런 이국소녀(異國少女)들의 이름과, 벌써 아기 어머니
된 계집애들의 이름과, 가난한 이웃사람들의 이름과, 비둘기
,강아지, 토끼, 노새, 노루, 프랑시스 잼, 라이너 마리아 릴케,
이런 시인의 이름을 불러 봅니다.

이네들은 너무나 멀리 있습니다 
별이 아스라이 멀듯이.

어머님,
그리고 당신은 멀리 북간도(北間島)에 계십니다.

나는 무엇인지 그리워서 
이 많은 별빛이 내린 언덕 위에 
내 이름자를 써 보고, 
흙으로 덮어 버리었습니다.

딴은 밤을 새워 우는 벌레는 
부끄러운 이름을 슬퍼하는 까닭입니다.

그러나 겨울이 지나고 나의 별에도 봄이 오면,
무덤 위에 파란 잔디가 피어나듯이 
내 이름자 묻힌 언덕 위에도 
자랑처럼 풀이 무성할 게외다.""" }

GET my_index2/_doc/1

사용자 정의 analyzer 사용

GET my_index2/_analyze { “analyzer”: “my_a”, “text”: “[]” }

1) 한자를 한글로 변경

PUT nori_readingform { “settings”: { “index”:{ “analysis”:{ “analyzer” : { “nori_readingform_analyzer” : { “tokenizer” : “nori_tokenizer”, “filter” : [“nori_readingform”] } } } } } }

1) 한자를 한글로 변경

GET nori_readingform/_analyze { “analyzer”: “nori_readingform_analyzer”, “text”: “"”별 헤는 밤

                     윤동주 /시인

계절이 지나가는 하늘에는 가을로 가득 차 있습니다.

나는 아무 걱정도 없이 가을 속의 별들을 다 헤일 듯합니다.

가슴속에 하나 둘 새겨지는 별을 이제 다 못 헤는 것은 쉬이 아침이 오는 까닭이요, 내일 밤이 남은 까닭이요, 아직 나의 청춘이 다하지 않은 까닭입니다.

별 하나에 추억과 별 하나에 사랑과 별 하나에 쓸쓸함과 별 하나에 憧憬과 별 하나에 詩와 별 하나에 어머니, 어머니

어머님, 나는 별 하나에 아름다운 말 한마디씩 불러봅니다. 소학교 때 책상을 같이 했던 아이들의 이름과 佩, 鏡, 玉 이런 異國少女들의 이름과, 벌써 아기 어머니 된 계집애들의 이름과, 가난한 이웃사람들의 이름과, 비둘기, 강아지, 토끼, 노새, 노루, 프랑시스 잼, 라이너 마리아 릴케, 이런 시인의 이름을 불러 봅니다.

이네들은 너무나 멀리 있습니다 별이 아스라이 멀듯이.

어머님, 그리고 당신은 멀리 北間島에 계십니다.

나는 무엇인지 그리워서 이 많은 별빛이 내린 언덕 위에 내 이름자를 써 보고, 흙으로 덮어 버리었습니다.

딴은 밤을 새워 우는 벌레는 부끄러운 이름을 슬퍼하는 까닭입니다.

그러나 겨울이 지나고 나의 별에도 봄이 오면, 무덤 위에 파란 잔디가 피어나듯이 내 이름자 묻힌 언덕 위에도 자랑처럼 풀이 무성할 게외다. “”” }

2) (지나가) + (는) 을 하나의 토큰으로 정의

DELETE nori_sample2

PUT nori_sample2 { “settings”: { “index”: { “analysis”: { “tokenizer”: { “nori_user_dict”: { “type”: “nori_tokenizer”, “decompound_mode”: “none”, “user_dictionary_rules”: [“지나가는”,”않아서”,”좋다”,”좋을”, “있는가”,”계절이”,”스터디룸”, “공부하는게”,”졸리지”,”하늘에”] } }, “analyzer”: { “my_analyzer”: { “type”: “custom”, “tokenizer”: “nori_user_dict” } } } } } }

GET nori_sample2/_analyze { “analyzer”: “my_analyzer”, “text”: “"”계절이 지나가는 하늘에는 가을로 가득 차 있습니다.”””
}

4) 추가미션 - 현 시점의 내 감정으로 한 문장 만들어서 data(시)로 활용하기

DELETE nori_sample2/_analyze

GET nori_sample2/_analyze { “analyzer”: “my_analyzer”, “text” : “"”스터디룸에서 공부하는게 졸리지 않아서

          너무 좋다
          이렇게 좋을 수 있는가""" }

카테고리:

업데이트:

댓글남기기