Word2Vec

Description

Mind map - presentation about W2V
Elisa Antolli
Mind Map by Elisa Antolli, updated more than 1 year ago
Elisa Antolli
Created by Elisa Antolli about 7 years ago
35
0

Resource summary

Word2Vec
  1. RNN
    1. semplice -> not DNN
      1. utile per una DNN
      2. 3 layers: input, hidden, output
        1. spazio vettoriale: similitudine matemat.
          1. rappresentazione distribuita
            1. rappresentazioni solo 1-to-N sono poche informative
              1. tante dimensioni che rappresentano "features"
                1. similitudine tra le "feature"
                  1. con le operazioni giuste posso trovare similitudine SEMANTICHE E SINTATICHE
                    1. es.: [vector(“King”) - vector(“man”) + vector(“woman”)]
                      1. cosine distance
              2. Word Embedding
                1. diverso dai modelli classici come "n-gram" poichè questi sono discreti
                  1. modello simile ad un "autoencoder"
                    1. codifica le parole in vettori: non si usano string (of course)
                      1. si cerca di ricostruire ciò che è dato come input
                        1. funzione per la codifica e per la decodifca: noi abbiamo solo encoding
                        2. 2 approcci

                          Attachments:

                          1. Continuous Bag of Words
                            1. corpus; vocabolario; frasi; parola target; contesto.
                              1. Modello - 3 layers: Input, Hidden, Output
                                1. INPUT: contesto
                                  1. OUTPUT: parola focus
                                    1. Obiettivo: Massimizzare la probabilità condizionata
                                      1. HIDDEN: media
                                        1. "C" input, somma delle linne "1" e divisione per C
                                          1. funzione di attivazione lineare
                                      2. Skip-gram
                                        1. Modello - 3 layers: Input, Hidden, Output
                                          1. INPUT: parola focus
                                            1. OUTPUT: contesto
                                              1. Obiettivo: massimizzare l'average log probability - contesti >> parola
                                                1. T = lunghezza sentenza (w1,w2,...,wT)
                                                  1. c = lunghezza max. contesto
                                                    1. j = indice spostamento
                                                      1. wt = parola centrale
                                                        1. Calcolo della probabilità p( wt+j | wt )
                                                          1. softmax
                                                            1. Pro: semplice
                                                              1. Contro: Costo comp. proporzionale alla dim. vocabolario (C)
                                                              2. hierarchical softmax
                                                                1. limita n° vettori output che sono aggiornati
                                                                  1. rappresentazione in albero binario
                                                                    1. Pro: invece di valutare "v" parole per vettore (C*v), valuto log(v)
                                                                    2. negative sampling
                                                            Show full summary Hide full summary

                                                            Similar

                                                            Computing Hardware - CPU and Memory
                                                            ollietablet123
                                                            SFDC App Builder 2
                                                            Parker Webb-Mitchell
                                                            Data Types
                                                            Jacob Sedore
                                                            Intake7 BIM L1
                                                            Stanley Chia
                                                            Software Processes
                                                            Nurul Aiman Abdu
                                                            Design Patterns
                                                            Erica Solum
                                                            CCNA Answers – CCNA Exam
                                                            Abdul Demir
                                                            Abstraction
                                                            Shannon Anderson-Rush
                                                            Spyware
                                                            Sam2
                                                            HTTPS explained with Carrier Pigeons
                                                            Shannon Anderson-Rush
                                                            Data Analytics
                                                            anelvr