반응형
Notice
Recent Posts
Recent Comments
Link
관리 메뉴

bro's coding

GloVe 본문

[INTURNSHIP]/HuminTec

GloVe

givemebro 2021. 1. 25. 13:14
반응형

Gloveco-occurrence가 있다면 그 정보를 알 수 있습니다.

Gloveglobal matrix factorization (전역 행렬)분해와 local(국소, 국지)문맥 window를 이용합니다.

Global matrix factorization(전역 행렬 분해)NLP(자연어 처리)분야에서 거대한 단어-빈도 행렬에서 rank(계수) reduction하기 위해 선형대수의 행렬 분해법을 이용하는 방법입니다.

행렬들은 일반적으로 단어-문서 빈도를 표현하고, 행은 단어 / 열은 문서(혹은 단락)를 나타냅니다.

단어-문서 빈도 행렬에 적용되는 global matrix factorization은 흔히 latent semantic analysis(LSA)라고 합니다.

LSA는 고차원 행렬을 singular value decomposition(SVD / 특이값 분해) 통해 차원을 줄여갑니다.

그리고 matrix 단어-단어 빈도를 나타낼 때, co-occurrence를 측정 할 수 있습니다.

정리하자면, Word2Vecwindow 크기 만큼의 주변 단어 정보만을 이용할 수 있는데 GloVe는 문장 전체의 정보를 이용 할 수 있다는 것입니다.

하지만 GloVe는 단어 내부정보를 사용할 수 없다는 단점이 있습니다.

반응형

'[INTURNSHIP] > HuminTec' 카테고리의 다른 글

fastText  (0) 2021.01.25
word2Vec  (0) 2021.01.25
NMP  (0) 2021.01.25
pyQt5.reference  (0) 2021.01.21
Nvivo  (0) 2021.01.11
recommendation system.word2vec.NNLM(neural net language model)  (0) 2021.01.06
recommendation system.word2vec  (0) 2021.01.06
recommendation system.reference  (0) 2021.01.05
Comments