Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.
| Entrambe le parti precedenti la revisione Revisione precedente Prossima revisione | Revisione precedente | ||
|
esplorare_un_documento_xml_con_python_xml.etree.elementtree [2021/06/02 22:35] 31.156.199.251 |
esplorare_un_documento_xml_con_python_xml.etree.elementtree [2021/10/29 21:18] (versione attuale) deleteme versione precedente ripristinata (2021/06/03 07:29) |
||
|---|---|---|---|
| Linea 1: | Linea 1: | ||
| ====== Esplorare un documento xml con xml.etree.ElementTree ====== | ====== Esplorare un documento xml con xml.etree.ElementTree ====== | ||
| Alcune istruzioni esemplificative (cf. [[http:// | Alcune istruzioni esemplificative (cf. [[http:// | ||
| - | <code python | + | <code python |
| import xml.etree.ElementTree as ET | import xml.etree.ElementTree as ET | ||
| tree=ET.parse(' | tree=ET.parse(' | ||
| root=tree.getroot() | root=tree.getroot() | ||
| - | print root | + | print(root) |
| parole=root.findall(' | parole=root.findall(' | ||
| - | print len(parole) | + | print(len(parole)) |
| forme_di_populor=root.findall(" | forme_di_populor=root.findall(" | ||
| for i in forme_di_populor: | for i in forme_di_populor: | ||
| - | print i.tag | + | print(i.tag) |
| for i in forme_di_populor: | for i in forme_di_populor: | ||
| - | print i.attrib | + | print(i.attrib) |
| for i in forme_di_populor: | for i in forme_di_populor: | ||
| - | print i.text | + | print(i.text) |
| for i in forme_di_populor: | for i in forme_di_populor: | ||
| - | print i.attrib[' | + | print(i.attrib[' |
| </ | </ | ||
| ---- | ---- | ||
| - | Come ricostruire il testo in forma di lista (r. 6) e tracciare il grafico delle frequenze: | + | Come ricostruire il testo in forma di lista: |
| - | <code python | + | <code python |
| - | import nltk | + | |
| import xml.etree.ElementTree as ET | import xml.etree.ElementTree as ET | ||
| - | tree=ET.parse(' | + | tree=ET.parse(' |
| root=tree.getroot() | root=tree.getroot() | ||
| parole=root.findall(' | parole=root.findall(' | ||
| testo=[i.attrib[' | testo=[i.attrib[' | ||
| - | fd=nltk.FreqDist(testo) | + | print(testo[:500]) #mostra le prime 500 parole unita' |
| - | print fd.B(), fd.N() | + | |
| - | fd.plot(50) | + | |
| </ | </ | ||