skip to content
barorin&?

DataFrameのテキストから英単語の出現頻度を出す

/ 1 min read

Table of Contents

はじめに

DataFrameのテキストから英単語の出現頻度を出す方法です。

方法

words = {}
for w1 in df['text列'].str.split():
for w2 in w1:
words[w2] = words.get(w2, 0) +1
d = [(v, k) for k, v in words.items()]
d.sort()
d.reverse() # 降順