recommendation system.word2vec
2003년 : Bengio -> 2013년 : Mikolov(google)
정확도 향상 / 성능 향상(Skip-gram) : acc가 약 2배 좋아짐
빠른 훈련(최적화 기술) : train 7일 -> 2일
recommendation system.word2vec.NNLM(neural net language model)
Neural net language model - 주어진 문서에서 단어 w가 Context(c)의 단어 결합확률이 최대가 되도록 단어 w의 vector값을 학습 ex) "아주대학교는 기업이 요구하는 질 좋은 아주대생을 배출한다" "아주대학교
broscoding.tistory.com
- 장점
사용이 심플하다.
라벨링 되지 않은 데이터로 이용 가능하다.
사용의 편리성에 비해 엄청난 정확도를 보여준다.
- 단점
왜 이렇게 결과가 나오는지 명확한 해석이 어렵다.(머신러닝 대표 특징)
의도적인 성능 향상을 위해서는 많은 삽질이 필요하다.
Word2vec - Wikipedia
Word2vec is a technique for natural language processing. The word2vec algorithm uses a neural network model to learn word associations from a large corpus of text. Once trained, such a model can detect synonymous words or suggest additional words for a par
en.wikipedia.org