Strumenti Utente

Strumenti Sito


esplorare_un_documento_xml_con_python_xml.etree.elementtree

Differenze

Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.

Link a questa pagina di confronto

Entrambe le parti precedenti la revisione Revisione precedente
Prossima revisione
Revisione precedente
esplorare_un_documento_xml_con_python_xml.etree.elementtree [2021/06/02 22:37]
31.156.199.251
esplorare_un_documento_xml_con_python_xml.etree.elementtree [2021/10/29 21:18] (versione attuale)
deleteme versione precedente ripristinata (2021/06/03 07:29)
Linea 5: Linea 5:
 tree=ET.parse('testi/ldt-1.5.xml') tree=ET.parse('testi/ldt-1.5.xml')
 root=tree.getroot() root=tree.getroot()
-print root+print(root)
 parole=root.findall('.//word') parole=root.findall('.//word')
-print len(parole)+print(len(parole))
 forme_di_populor=root.findall(".//word[@lemma='populor1']") forme_di_populor=root.findall(".//word[@lemma='populor1']")
 for i in forme_di_populor: for i in forme_di_populor:
-    print i.tag+    print(i.tag)
 for i in forme_di_populor: for i in forme_di_populor:
-    print i.attrib+    print(i.attrib)
 for i in forme_di_populor: for i in forme_di_populor:
-    print i.text+    print(i.text)
 for i in forme_di_populor: for i in forme_di_populor:
-    print i.attrib['form']+    print(i.attrib['form'])
 </code> </code>
 ---- ----
-Come ricostruire il testo in forma di lista (r. 6):+Come ricostruire il testo in forma di lista:
 <code python xml_testo.py> <code python xml_testo.py>
 import xml.etree.ElementTree as ET import xml.etree.ElementTree as ET
-tree=ET.parse('Testi/ldt-1.5.xml')+tree=ET.parse('testi/ldt-1.5.xml')
 root=tree.getroot() root=tree.getroot()
 parole=root.findall('.//word') parole=root.findall('.//word')
 testo=[i.attrib['form'].lower() for i in parole] testo=[i.attrib['form'].lower() for i in parole]
-fd=nltk.FreqDist(testo) +print(testo[:500]#mostra le prime 500 parole unita'
-print fd.B(), fd.N() +
-fd.plot(50)+
 </code> </code>
esplorare_un_documento_xml_con_python_xml.etree.elementtree.1622673429.txt.gz · Ultima modifica: 2021/06/02 22:37 da 31.156.199.251