Word Embedding

Untitled

Untitled

Untitled

  1. 주어진 학습 데이터를 tokenization
  2. 이후 unique한 단어를 가지고 사전을 만듬
  3. 임베딩 차원의 크기는 사전의 크기로 정해짐
  4. Sliding window를 적용하여, 앞뒤로 나타난 각각의 단어와, 입*출력 쌍을 구성하게됨 예를 들어 window size =3, 단어가 study인 경우에 [(study, I), (study, math)]
  5. 히든레이어의 노드 수는 하이퍼 파라미터로 설정

Untitled

Untitled

Untitled