import re import matplotlib.pyplot as plt f = open('testi/collodi_pinocchio.txt', mode='r', encoding='iso-8859-1') testo = f.read() testo=testo[1704:] # istruzioni per l'affinamento della tokenizzazione testo=re.sub("'","' ", testo) testo=re.sub('[\.,;:\-?!]{1}','',testo)#elimina gli interpunti testo=testo.lower() # fine istruzioni per l'affinamento della tokenizzazione testo=testo.split() occ_forma=[(testo.count(i),i) for i in set(testo)] occ_forma.sort(reverse=True) fd=[i[0] for i in occ_forma] forme=[i[1] for i in occ_forma] n=50 plt.plot(range(n),fd[0:n], '.') plt.xticks(range(n),forme[0:n], rotation='vertical') plt.show()