Questa è una vecchia versione del documento!
Il codice seguente crea il grafico della frequenza delle parole grafiche di una determinata lunghezza in Pinocchio.
import codecs import re import matplotlib.pyplot as plt file=codecs.open('Testi/collodi_pinocchio.txt', encoding='iso-8859-1', mode='r') testo=file.read() testo=testo[1758:] testo=re.sub("'","' ", testo) testo=re.sub('[\.,;:\-?!]{1}','',testo) testo=testo.lower() testo=testo.split() l=[len(i) for i in testo] set_l=list(set(l)) set_l.sort() freq_l=[l.count(i) for i in set_l] plt.bar(set_l,freq_l) plt.xticks([i+.5 for i in set_l], set_l, size='small') plt.show()
Dovrebbe prodursi un grafico di questo tipo: