skip to content
barorin&?

DataFrameのテキストから英単語の出現頻度を出す

/ 1 min read

はじめに

DataFrameのテキストから英単語の出現頻度を出す方法です。

方法

words = {}

for w1 in df['text列'].str.split():
  for w2 in w1:
    words[w2] = words.get(w2, 0) +1

d = [(v, k) for k, v in words.items()]
d.sort()
d.reverse() # 降順