3. Embedding
2022. 4. 8. 18:03ㆍ카테고리 없음
Embedding 에 대하여
Vector 의 이해
Vector의 종류
1. Sparse Vector
- 벡터의 값이 대부분 0으로 표현되는 것
- 대표적인게 One-hot vector
- 강아지 = [ 0 0 0 0 1 0 0 ]
- 단어간의 유사도를 알 수 없음
2. Dense Vector
- 벡터의 값이 대부분이 0이아니라 실수값을 가지는 것
- 강아지 = [ 0.1 0.5 -2 1 1.2 0.7 0.3 ]
- 단어간의 유사도를 알 수 있음
Embedding
Embedding 은 데이터를 벡터로 바꾸는 작업
Embedding 종류
- CountVectorizer
- TfidfVectorizer
- Word2Vec
- Keras.Embedding layer
- Dense layer