2-1. 자연어 처리란
자연어(Natural language) : 우리가 평소에 쓰는 말 > 살아있는 언어. 프로그래밍 언어와는 다르게 부드러운 언어
자연어 처리(Natural lanuage processing) : 우리의 말을 컴퓨터에게 이해시키기 위한 기술
목표 : 사람의 말을 컴퓨터가 이해하도록 만들어, 컴퓨터가 우리에게 도움이 되는 일을 수행하도록 함.
단어 : 의미의 최소단위
말 : 문자로 구성 & 말의 의미 : 단어로 구성
*** 단어의 의미를 컴퓨터에게 잘 파악하도록 하는 방법**
시소러스를 활용한 기법
통계기반 기법
추론 기반 기법(Word2Vec)
2-2. 시소러스
시소러스 : 사람이 직접 단어의 의미를 정의한 유의어 사전. 뜻이 같은 단어(동의어), 뜻이 비슷한 단어(유의어)가 한 그룹 으로 분류되어 있다.
단어의 상위와 하위 / 전체와 부분 등 세세한 관계까지 정의
모든 단어에 대한 유의어 집합을 만들고, 단어 간 관계를 그래프로 표현해 단어 사이 연결을 정의
WordNet : 자연어 처리 분야에서 가장 유명한 시소러스