“Constituency Treebank”
Esempio:
ICON: A Large-Scale Benchmark Constituency Treebank for the Indonesian Language https://github.com/aisingapore/seacorenlp-data/tree/main/id/constituency
Glosse disponibili qui https://seacorenlp.aisingapore.net/docs/docs/resources/tagsets.html
Esempio: rigo 16 in dev.txt:
(S (NP (NNP Abdurrahman) (NNP Wahid)) (VP (VBI siap) (VP (VBT membentuk) (NP (NNO kepengurusan) (NNO tandingan)))) (PUN .))
Abdurrahman Wahid siap membentuk kepengurusan tandingan.
Abdurrahman Wahid è pronto a costituire una dirigenza alternativa.
https://ironcreek.net/syntaxtree/
per cambiare le parentesi nella shell di python:
'(S (NP (NNP Abdurrahman) (NNP Wahid)) (VP (VBI siap) (VP (VBT membentuk) (NP (NNO kepengurusan) (NNO tandingan)))) (PUN .))'.replace(“(”,“[”).replace(“)”,“]”)