Ubuntu に word2vec を入れる

Share on Facebook
Pocket
LINEで送る
Bookmark this on Google Bookmarks

自然言語処理を勉強中のため、word2vecを触っていく。

subversion と build-essential をインストール

sudo apt-get install subversion  build-essential

subversionでword2vecをダウンロード

cd
svn checkout http://word2vec.googlecode.com/svn/trunk

word2vecでdemoをしてみる

cd trunk

word2vecのdemoは、入力したワードの関連度の高い順に40個表示されるが見づらいため、20個表示するように変更する。

vi distance.c
const long long N = 20;

変更を有効にする

make

サンプルデータのダウンロードと学習を実行

./demo-word.sh

ダウンロードと学習が終わるまで、しばらく待つ。

Enter word or sentence (EXIT to break):
が表示されたら、英単語を入れると、関連度の高いワード順に表示される

Enter word or sentence (EXIT to break): cat
    meow		0.602817
    cats		0.568666
    feline		0.561879
    bobcat		0.533922
    purebred		0.533411
    caracal		0.522878
    kitten		0.513501
    dog		0.510227
    rabbits		0.509389
    tabby		0.502431
    stuffed		0.487774
    eared		0.474368
    felis		0.473093
    leopardus		0.466681
    longhair		0.464093
    ox		0.460524
    squirrel		0.459999
    marten		0.457460
    bitten		0.454296
    dogs		0.449612
    

meowが一番。鳴き声。

次回から、twitterやwikipediaのデータをcsvに落としてきて解析して見る予定。

Follow me!

Ubuntu に word2vec を入れる” に対して 2 件のコメントがあります

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です