Google ColaboratoryでGiNZAを使ってみる
/ 2 min read
Table of Contents
はじめに
Google ColaboratoryでGiNZAを使ってみようと思います。
方法
# GiNZAインストール!pip install -U ginza ja-ginza
import pkg_resources, impimp.reload(pkg_resources)
# 形態素解析import spacy
nlp = spacy.load('ja\_ginza')doc = nlp('今年の干支は庚子です。東京オリンピックたのしみだなあ。')
for sent in doc.sents: # 文を区切る for token in sent: # 単語を区切る print(token.i, token.orth_, token.lemma_, token.pos_, token.tag_, token.dep_, token.head.i)
'''Output0 今年 今年 NOUN 名詞-普通名詞-副詞可能 nmod 21 の の ADP 助詞-格助詞 case 02 干支 干支 NOUN 名詞-普通名詞-一般 nsubj 43 は は ADP 助詞-係助詞 case 24 庚子 庚子 PROPN 名詞-普通名詞-一般 ROOT 45 です です AUX 助動詞 cop 46 。 。 PUNCT 補助記号-句点 punct 47 東京 東京 PROPN 名詞-固有名詞-地名-一般 compound 88 オリンピック オリンピック NOUN 名詞-普通名詞-一般 obl 99 たのしみ たのしみ PROPN 名詞-普通名詞-一般 ROOT 910 だ だ AUX 助動詞 cop 911 なあ なあ PART 助詞-終助詞 mark 912 。 。 PUNCT 補助記号-句点 punct 9'''