Differenze

Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.

--- esplorare_un_documento_xml_con_python_xml.etree.elementtree [2021/06/02 22:35]
31.156.199.251
+++ esplorare_un_documento_xml_con_python_xml.etree.elementtree [2021/10/29 21:18] (versione attuale)
deleteme versione precedente ripristinata (2021/06/03 07:29)
@@ Linea 1: / Linea 1: @@
 ====== Esplorare un documento xml con xml.etree.ElementTree ======
 Alcune istruzioni esemplificative (cf. [[http://docs.python.org/2/library/xml.etree.elementtree.html]]):
-<code python 1>
+<code python xml_varie.py>
 import xml.etree.ElementTree as ET
 tree=ET.parse('testi/ldt-1.5.xml')
 root=tree.getroot()
-print root
+print(root)
 parole=root.findall('.//word')
-print len(parole)
+print(len(parole))
 forme_di_populor=root.findall(".//word[@lemma='populor1']")
 for i in forme_di_populor:
-    print i.tag
+    print(i.tag)
 for i in forme_di_populor:
-    print i.attrib
+    print(i.attrib)
 for i in forme_di_populor:
-    print i.text
+    print(i.text)
 for i in forme_di_populor:
-    print i.attrib['form']
+    print(i.attrib['form'])
 </code>
 ----
-Come ricostruire il testo in forma di lista (r. 6) e tracciare il grafico delle frequenze:
+Come ricostruire il testo in forma di lista:
-<code python 1>
+<code python xml_testo.py>
-import nltk
 import xml.etree.ElementTree as ET
-tree=ET.parse('Testi/ldt-1.5.xml')
+tree=ET.parse('testi/ldt-1.5.xml')
 root=tree.getroot()
 parole=root.findall('.//word')
 testo=[i.attrib['form'].lower() for i in parole]
-fd=nltk.FreqDist(testo)
+print(testo[:500]) #mostra le prime 500 parole unita'
-print fd.B(), fd.N()
-fd.plot(50)
 </code>

Linguistica computazionale

Strumenti Utente

Strumenti Sito

Differenze

Strumenti Pagina