Innan kunde man tydligen använda den smidiga notationen
pos_vectors = embeddings.loc[pos_words].dropna()
för att skapa en df pos_vectors genom att "slå upp" pos_words i dataframen embeddings, och så togs helt enkelt inte vissa rader med om det inte fanns nån motsvarighet till ett av orden.
Det går inte längre. Men man kan göra så här:
def add_embeddings (word_list): df = pd.DataFrame(columns = range(300)) for item in word_list: try: df.loc[item] = embeddings.loc[item] # print (item) except: KeyError; print ('error', item) return df
Comments
You can follow this conversation by subscribing to the comment feed for this post.