Tema 3 PLN UJA - Recursos Lingüísticos
|
|
Título del Test:
![]() Tema 3 PLN UJA - Recursos Lingüísticos Descripción: Tipo Test hecho por Claude en base al temario |



| Comentarios |
|---|
NO HAY REGISTROS |
|
¿Qué son los recursos lingüísticos?. Un conjunto de datos y sus descripciones en formato electrónico para construir, mejorar y evaluar las aplicaciones del lenguaje natural. Programas informáticos que traducen automáticamente entre idiomas. Algoritmos de aprendizaje automático aplicados a textos. Bases de datos exclusivamente orales utilizadas en reconocimiento de voz. ¿Cuáles son los cuatro tipos principales de recursos lingüísticos según el tema?. Lexicones, Diccionarios, Ontologías y Corpus. Gramáticas, Diccionarios, Traductores y Analizadores. Tesauros, Enciclopedias, Gazetteers y Corpus. Synsets, Ontologías, WordNets y Lexicones. ¿Qué contienen principalmente los lexicones generales?. Únicamente listas de nombres propios y topónimos. Repositorios de palabras y conocimiento sobre las palabras (fonología, morfología, sintaxis, semántica, pragmática). Reglas de inferencia lógica para razonamiento automático. Textos representativos de una lengua para análisis lingüístico. ¿Qué son los MRD (Machine Readable Dictionary)?. Diccionarios en formato electrónico legibles por máquina, que pueden ser generales, normativos, monolingües o multilingües. Diccionarios exclusivamente orales para sistemas de reconocimiento de voz. Bases de datos terminológicas de instituciones europeas. Repositorios de palabras sin información adicional. Según la definición de Gruber (1993), una ontología es: Una colección de textos representativos de una lengua. Una especificación formal, explícita de una conceptualización compartida. Un conjunto de sinónimos y antónimos entre palabras. Una base de datos terminológica multilingüe. En la definición de ontología, ¿qué significa el término "formal"?. Comprensible para una máquina. Consensuada por un grupo o compartida por varias partes. Descrita en un lenguaje natural. Una forma de entender o describir un dominio. ¿Cuáles son los usos fundamentales de las ontologías?. Traducir automáticamente entre idiomas y corregir errores ortográficos. Almacenar grandes volúmenes de texto sin procesar. Compartir conocimiento, representar lo que "existe" y facilitar el razonamiento automático. Generar sinónimos y antónimos automáticamente. ¿Cuál de las siguientes NO es un tipo de ontología según su clasificación?. Genéricas. De Dominio. De Tareas. De Sinonimia. ¿Cuál es la diferencia principal entre una ontología y un lexicón?. La ontología trabaja con información que puede ser inferida o de sentido común, mientras el lexicón trabaja con información más lingüística (clases de palabras, etc.). La ontología es siempre multilingüe y el lexicón es siempre monolingüe. El lexicón se usa en Web Semántica y la ontología en traducción automática. No existe ninguna diferencia entre ambos conceptos. ¿Cómo se define un corpus?. Un conjunto de reglas gramaticales formales de una lengua. Una colección de textos representativos de una lengua, un dialecto o un subconjunto de un lenguaje, utilizados para el análisis lingüístico. Una base de datos de conceptos y sus relaciones semánticas. Un diccionario monolingüe con información morfológica. ¿Cuáles son los cuatro criterios principales de clasificación de los corpus?. Según el material, el propósito, el número de idiomas y la información lingüística que incorporan. Según el tamaño, el formato, el coste y la disponibilidad. Según la antigüedad, el autor, el idioma y el dialecto. Según el dominio, la tarea, la aplicación y el género. ¿Qué diferencia hay entre un corpus paralelo y un corpus comparable?. El corpus paralelo contiene textos que son traducciones exactas entre lenguas, mientras que el corpus comparable contiene textos en varios idiomas sobre un tema común sin ser traducciones exactas. El corpus paralelo es siempre oral y el comparable siempre textual. El corpus paralelo está anotado y el comparable no. No existe diferencia, son sinónimos. ¿Qué caracteriza a un corpus anotado (etiquetado)?. Que contiene únicamente textos en un solo idioma. Que proporciona información adicional al texto en forma de marcas o anotaciones (morfológicas, sintácticas, semánticas, etc.). Que ha sido revisado manualmente por un lingüista experto. Que está disponible gratuitamente en Internet. ¿Qué es un synset en WordNet?. Un conjunto de sinónimos que representa un concepto e identifica cada significado. Un conjunto de antónimos relacionados entre sí. Una regla de inferencia para razonamiento automático. Una etiqueta morfológica asignada a una palabra. ¿Cuáles son las principales relaciones definidas entre synsets en WordNet?. Traducción, transliteración, transcripción y anotación. Hiponimia, hiperonimia, meronimia, holonimia y antonimia. Sufijación, prefijación, derivación y composición. Coordinación, subordinación, yuxtaposición y elipsis. ¿Qué es EuroWordNet?. Una extensión multilingüe de WordNet que incluye varios idiomas europeos conectados mediante un Índice InterLingual (ILI). Una base de datos exclusivamente del idioma inglés europeo. Un corpus paralelo de textos del parlamento europeo. Una ontología desarrollada por las Naciones Unidas para el comercio electrónico. ¿En qué se diferencia SentiWordNet de WordNet?. SentiWordNet incluye traducciones a varios idiomas europeos. SentiWordNet añade, por cada synset, una tupla con 3 valores (objetividad, positividad y negatividad). SentiWordNet solo contiene verbos y adjetivos, no nombres. SentiWordNet es un corpus oral en lugar de una base de datos léxica. ¿Qué es SemCor?. Un diccionario multilingüe de instituciones europeas. Una ontología general desarrollada por las Naciones Unidas. Un subconjunto del Brown Corpus anotado con información semántica usando WordNet como lexicón. Una herramienta para reconocimiento automático de voz. ¿Cuál es una ventaja fundamental del uso de corpus como fuente de información?. Proporcionan un gran volumen de información con muestras "reales" de la lengua y permiten métodos estadísticos combinados con conocimiento gramatical. Eliminan la necesidad de cualquier conocimiento gramatical previo. Son siempre gratuitos y de libre distribución. Garantizan resultados perfectos sin necesidad de evaluación. |





