3. Embedding

2022. 4. 8. 18:03카테고리 없음

Embedding 에 대하여



Vector 의 이해


Vector의 종류

 

1. Sparse Vector

  • 벡터의 값이 대부분 0으로 표현되는 것
  • 대표적인게 One-hot vector
  • 강아지 = [ 0 0 0 0 1 0 0 ]
  • 단어간의 유사도를 알 수 없음

2. Dense Vector

  • 벡터의 값이 대부분이 0이아니라 실수값을 가지는 것
  • 강아지 = [ 0.1 0.5 -2 1 1.2 0.7 0.3 ]
  • 단어간의 유사도를 알 수 있음

 


Embedding


Embedding 은 데이터를 벡터로 바꾸는 작업

 

Embedding 종류

  • CountVectorizer
  • TfidfVectorizer
  • Word2Vec
  • Keras.Embedding layer
  • Dense layer