使用維基百科提供的中文資料, 先進行繁簡轉換, 再使用jieba分詞, 最後生成詞向量模型
https://dumps.wikimedia.org/zhwiki/latest/
使用OpenCC進行轉換
安裝:
pip install opencc-python-reimplemented
https://drive.google.com/open?id=19Qrws4tLaQR3rTv6xnN3ytU9U56v7M57
使用gensim裡的word2vec
pip install gensim
用most_similar()找到關聯詞
model.wv.most_similar('橄欖油', topn=10)