Python >> Tutoriel Python >  >> Python Tag >> Gensim

Erreur lors du chargement du modèle Word2Vec dans gensim

Correction du problème avec :

from gensim import models
w = models.Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)
print w["queen"]

Afin de partager le code d'interrogation des vecteurs de mots entre différents algos de formation (Word2Vec, Fastext, WordRank, VarEmbed), les auteurs ont séparé le stockage et l'interrogation des vecteurs de mots dans une classe distincte KeyedVectors.

Deux méthodes et plusieurs attributs de la classe word2vec sont obsolètes.

Méthodes

  • load_word2vec_format
  • save_word2vec_format

Attributs

  • syn0norm
  • syn0
  • vocabulaire
  • index2word

Ceux-ci ont été déplacés vers la classe KeyedVectors.

Après la mise à niveau vers cette version, vous pouvez obtenir des exceptions concernant des méthodes obsolètes ou des attributs manquants.

Pour supprimer les exceptions, vous devez utiliser

KeyedVectors.load_word2vec_format (instead ofWord2Vec.load_word2vec_format)
word2vec_model.wv.save_word2vec_format (instead of  word2vec_model.save_word2vec_format)
model.wv.syn0norm instead of  (model.syn0norm)
model.wv.syn0 instead of  (model.syn0)
model.wv.vocab instead of (model.vocab)
model.wv.index2word instead of (model.index2word)