Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.
| Prossima revisione | Revisione precedente | ||
|
entropia_degli_n-grammi [2021/05/20 07:21] 127.0.0.1 external edit |
entropia_degli_n-grammi [2024/07/08 09:09] (versione attuale) admin |
||
|---|---|---|---|
| Linea 1: | Linea 1: | ||
| ====== Entropia degli n-grammi ====== | ====== Entropia degli n-grammi ====== | ||
| ===== Funzioni della teoria dell' | ===== Funzioni della teoria dell' | ||
| - | <code python | + | <code python |
| - | from __future__ import division | + | from numpy import log2 |
| - | from scipy import log2 | + | |
| import pickle | import pickle | ||
| import matplotlib.pyplot as plt | import matplotlib.pyplot as plt | ||
| + | |||
| + | #Funzioni della teoria dell' | ||
| I = lambda p: -log2(p) # | I = lambda p: -log2(p) # | ||
| - | H = lambda x : sum(p*I(p) for p in x if p>0) #entropia | + | H = lambda x: sum(p*I(p) for p in x if p>0) #entropia |
| def DP(x): # | def DP(x): # | ||
| l=len(x) | l=len(x) | ||
| s=set(x) | s=set(x) | ||
| return [x.count(i)/ | return [x.count(i)/ | ||
| - | # | + | |
| - | </ | + | #Funzioni relative agli NGRAMMI |
| - | ===== N-grammi ===== | + | |
| - | <code python 1> | + | |
| - | #...continua | + | |
| def NGRAMMI(n, | def NGRAMMI(n, | ||
| l=len(testo) | l=len(testo) | ||
| Linea 25: | Linea 23: | ||
| testo=pickle.load(f) | testo=pickle.load(f) | ||
| H1= H(DP(testo)) | H1= H(DP(testo)) | ||
| - | print H1 | + | print(H1) |
| H2= H(DP(NGRAMMI(2, | H2= H(DP(NGRAMMI(2, | ||
| - | print H2 | + | print(H2) |
| H3= H(DP(NGRAMMI(3, | H3= H(DP(NGRAMMI(3, | ||
| - | print H3 | + | print(H3) |
| H4= H(DP(NGRAMMI(4, | H4= H(DP(NGRAMMI(4, | ||
| - | print H4 | + | print(H4) |
| plt.bar(range(1, | plt.bar(range(1, | ||
| plt.show() | plt.show() | ||
| </ | </ | ||
| - | {{ :h-bar.png?nolink | + | Dovrebbero comparire i seguenti risultati: |
| + | < | ||
| + | 9.702194889011581 | ||
| + | 14.065274797090632 | ||
| + | 15.063007803309242 | ||
| + | 15.24336330939696 | ||
| + | </ | ||
| + | {{::n_grammi.png?877|}} | ||