[INTURNSHIP]/HuminTec

recommendation system.word2vec

givemebro 2021. 1. 6. 10:44
반응형

2003년 : Bengio -> 2013년 : Mikolov(google)

정확도 향상 / 성능 향상(Skip-gram) : acc가 약 2배 좋아짐

빠른 훈련(최적화 기술) : train 7일 -> 2일

 

 

recommendation system.word2vec.NNLM(neural net language model)

Neural net language model - 주어진 문서에서 단어 w가 Context(c)의 단어 결합확률이 최대가 되도록 단어 w의 vector값을 학습 ex) "아주대학교는 기업이 요구하는 질 좋은 아주대생을 배출한다" "아주대학교

broscoding.tistory.com

 

 

- 장점

사용이 심플하다.
라벨링 되지 않은 데이터로 이용 가능하다.
사용의 편리성에 비해 엄청난 정확도를 보여준다.

- 단점

왜 이렇게 결과가 나오는지 명확한 해석이 어렵다.(머신러닝 대표 특징)
의도적인 성능 향상을 위해서는 많은 삽질이 필요하다.

 

 

 

Word2vec - Wikipedia

Word2vec is a technique for natural language processing. The word2vec algorithm uses a neural network model to learn word associations from a large corpus of text. Once trained, such a model can detect synonymous words or suggest additional words for a par

en.wikipedia.org

 

반응형