Extensiones de WordNet: EuroWordNet y AsiaWordNet V F. El corpus de textos SemCor es un subconjunto del Brown Corpus anotado con informacion sintactica V F. El proyecto Gutenberg se trata de un conjunto semantico de palabras disponibles en Internet V F. Gutenberg tiene 16000 libros mayoritariamente en español aunque tambien incluye libros en inglés V F. Arquitectura básica de los sistemas PLN: Reconocimiento del idioma, segmentacion de palabras, oraciones, pasajes, analisis morfologico y sintactico V F. Analisis morfologico o tagging: la mayor parte de las herramientas asignan y desambiguan etiquetas a la vez y todas incluyen lematizacion V F. Ejemplos de herramientas libres: Standford POS tagger, TreeTagger DE PAGO: Brill's Transf. based learning, SVM tool, LOB Tagger V F. Dos tipos de análisis sintactico: Superficial y profundo (chunking y parsers) V F.
|