option
Cuestiones
ayuda
daypo
buscar.php
TEST BORRADO, QUIZÁS LE INTERESE: PLN TEMA 2
COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
PLN TEMA 2

Descripción:
PLN TEMA 2 UJA

Autor:
AVATAR
Fatema
OTROS TESTS DEL AUTOR

Fecha de Creación: 20/05/2024

Categoría: Informática

Número Preguntas: 114
COMPARTE EL TEST
COMENTARNuevo Comentario
No hay ningún comentario sobre este test.
Temario:
Los recursos lingüísticos son Conjunto de datos y sus descripciones en formato electrónico para construir, mejorar y evaluar las aplicaciones del lenguaje natural Conjunto de reglas gramaticales utilizadas para estructurar frases en un idioma específico Técnicas de traducción automática basadas en algoritmos estadísticos Manuales de gramática y diccionarios utilizados por estudiantes para aprender un nuevo idioma.
Los recursos lingüísticos tienen como objetivo Incluir la mayor información posible procedente de recursos lingüísticos o mediante técnicas propias de PLN con el fin de obtener sistemas con mayor efectividad Simplificar la estructura gramatical de un idioma para facilitar su aprendizaje Desarrollar nuevos lenguajes artificiales para la programación de sistemas informáticos Preservar las lenguas en peligro de extinción a través de la documentación y grabación de hablantes nativos.
Respecto a los recursos lingüísticos Hay grandes esfuerzos para generar recursos y para integrarlos en tareas de PLN La mayoría de los recursos no tienen una definición clara (se mezcla la definición de unos recursos con otros) No tienen importancia en el desarrollo de tecnologías de voz Todos son correctos 1 y 2 son correctos.
Los tipos de recursos lingüisticos son Lexicones Diccionarios Ontologías Corpus Todos son correctos Todos son incorrectos.
¿Cuál de los siguientes NO es un tipo de recurso lingüístico? Lexicones Diccionarios Ontologías Manuales de gramática.
Los lexicones generales son: Repositorios de palabras Conocimiento sobre las palabras Gazetteers Diccionarios de locuciones Siglas, jergas Todas son correctas La 1 y 2 son correctas.
Respecto a los lexicones generales Los repositorios de palabras tratan la fonología, morfología, sintaxis, semántica etc. Los conocimiento sobre las palabras tratan la fonología, morfología, sintaxis, semántica etc. Los conocimiento sobre las palabras son lemarios, listas de palabras... Los repositorios de palabras son lemarios, listas de palabras... La 1 y la 3 son correctas La 2 y la 4 son correctas.
¿Cuál de las siguientes no es una característica incluida en el conocimiento sobre las palabras en un lexicón general? Sintaxis Morfología Semántica Traducción automática.
¿Cuál de los siguientes es un tipo de lexicón especializado? Fonología Sintaxis Gazetteers Morfología.
¿Cuál de los siguientes es un tipo de lexicón especializado? Nombres propios Bases de datos terminológicas Gazetteers Diccionarios de locuciones Bases de datos léxicas Siglas, jergas Detectores de fechas, números, fórmulas … Todos son correctos Ninguno es correcto Todos estos son lexicones generales.
¿Qué significa MRD en el contexto de los diccionarios? Manual de Recursos de Diccionarios Machine Readable Dictionary Manual de Referencia de Datos Machine Resource Directory.
Los diccionarios se pueden clasificar por sus tipos de esta forma: Generales, normativos, de uso, de aprendizaje Enciclopédicos y normativos Monolingües, bilingües, multilingües De aprendizaje y tesauros.
¿Cómo se pueden clasificar los diccionarios según el número de lenguas utilizadas? Enciclopédicos y normativos Monolingües, bilingües, multilingües Generales y de uso De aprendizaje y tesauros.
¿En el contexto de los diccionarios, qué es una enciclopedia? Un recurso que lista palabras agrupadas según su significado, proporcionando sinónimos y, a veces, antónimos. Un recurso de referencia que proporciona información detallada sobre una amplia gama de temas, organizados alfabéticamente, y cubre múltiples áreas del conocimiento. Un recurso que organiza las palabras en una red de relaciones semánticas y proporciona una lista de términos relacionados. Un recurso que contiene solo definiciones breves de palabras y sus usos gramaticales.
¿En el contexto de los diccionarios, qué es un tesauro? Un recurso de referencia que proporciona información detallada sobre una amplia gama de temas, organizados alfabéticamente, y cubre múltiples áreas del conocimiento. Un recurso que organiza las palabras en una red de relaciones semánticas y proporciona una lista de términos relacionados. Un recurso que contiene solo definiciones breves de palabras y sus usos gramaticales. Un recurso que lista palabras agrupadas según su significado, proporcionando sinónimos y, a veces, antónimos.
¿Por qué el término "ontología" genera controversia en el campo de la Inteligencia Artificial? Porque no hay claridad entre este término y el lexicón Porque es un concepto completamente nuevo Porque se utiliza solo en tareas de minería de datos Porque es exclusivo de la web semántica.
¿Qué otro término se utiliza para referirse a una ontología? Base de datos Diccionario Base de conocimiento Corpus.
La ontología trabaja con: Información que puede ser inferida o de sentido común Información más lingüística, clases de palabras, por ejemplo Ambas Ninguna de las dos.
El lexicón trabaja con: Información que puede ser inferida o de sentido común Información más lingüística, clases de palabras, por ejemplo Ambas Ninguna de las dos.
¿Qué significa que una ontología sea "shared"? Que es comprensible para una máquina Que es consensuada por un grupo, compartida por varias partes Que es una forma de entender/describir un dominio Que está descrita en un lenguaje natural.
¿Qué significa que una ontología sea "explicit"? Que es comprensible para una máquina Que es consensuada por un grupo, compartida por varias partes Que es una forma de entender/describir un dominio Que está descrita en un lenguaje natural.
¿Qué se entiende por formal en una ontología? Que es comprensible para una máquina Que es consensuada por un grupo, compartida por varias partes Que es una forma de entender/describir un dominio Que está descrita en un lenguaje natural.
¿Qué es una "conceptualización" en el contexto de una ontología? Que es comprensible para una máquina Que es consensuada por un grupo, compartida por varias partes Que es una forma de entender/describir un dominio Que está descrita en un lenguaje natural.
Según Gruber (1993), ¿qué es una ontología o base de conocimiento? Una lista de palabras sin significado Un conjunto de datos estructurados sin relación Una especificación explícita de una conceptualización Un sistema de procesamiento de lenguaje natural.
¿Cuáles de los siguientes son objetivos de las ontologías? Simplificar el acceso a los datos Estandarizar tipos de datos Gestión de datos Definir-unificar un "espacio global" de la información Todas son correctas.
¿Cuál de los siguientes NO es un objetivo de las ontologías? Simplificar el acceso a los datos Estandarizar tipos de datos Gestión de datos Definir-dividir un "espacio concreto" de la información.
Las ontologías tienen entre sus características: El estudio de lo que existe en el mundo La especificación explícita de una conceptualización Definición de conceptos y sus relaciones básicas para la comprensión de un área Todas son correctas.
Las ontologías se usan para: Compartir conocimiento Representar lo que “existe” (entidades-conocimiento) Facilitar el razonamiento automático Todas son correctas Todas son incorrectas.
¿Qué es una ontología según la definición proporcionada por Weigand (1997)? Un conjunto de reglas gramaticales para un idioma Una base de datos que describe los conceptos en el mundo o en algún dominio, sin tener en cuenta sus propiedades ni como se relacionan entre sí Es una descripción de los conceptos (en un dominio) y de las relaciones conceptuales que pueden existir para un agente o una comunidad de agentes Un algoritmo de aprendizaje automático.
¿Cómo favorecen las ontologías la comunicación entre personas, organizaciones y aplicaciones? Porque proporcionan una comprensión común de un dominio, de modo que se eliminan confusiones conceptuales y terminológicas Porque permiten la integración de diferentes sistemas y plataformas mediante un lenguaje común Porque facilitan la interoperabilidad entre distintos sistemas de información al estandarizar conceptos Porque ayudan a la coordinación de tareas y procesos al definir términos y relaciones de manera uniforme.
¿Qué puede hacer un motor de razonamiento partiendo de unas reglas de inferencia y los datos de las ontologías? Generar nuevos datos sin necesidad de reglas predefinidas Inferir conclusiones de ellos Modificar las ontologías automáticamente Eliminar las reglas de inferencia una vez usadas.
¿Qué papel juegan las reglas de inferencia en el uso de ontologías? Eliminar datos obsoletos de las ontologías Facilitar la inferencia de conclusiones a partir de los datos Crear nuevas ontologías automáticamente Proveer de datos adicionales a las ontologías.
Entre los usos de las ontologías nos encontramos: Compartir conocimiento Representar lo que "existe" Facilitar el razonamiento automático Todas son correctas La 1 y la 3 son correctas.
Las ontologías genéricas son aquellas que: Describen conceptos generales (espacio, tiempo, objeto...) Expresan conceptos de dominios particulares (Medicina, Bioquímica, Turismo ...) Expresan conceptos sobre la resolución de problemas (diagnóstico, ventas ...) Describen conceptos que dependen tanto de un dominio específico como de una tarea específica (procesos de producción, cardiología…).
Las ontologías de dominio son aquellas que: Describen conceptos generales (espacio, tiempo, objeto...) Expresan conceptos de dominios particulares (Medicina, Bioquímica, Turismo ...) Expresan conceptos sobre la resolución de problemas (diagnóstico, ventas ...) Describen conceptos que dependen tanto de un dominio específico como de una tarea específica (procesos de producción, cardiología…).
Las ontologías de tareas son aquellas que: Describen conceptos generales (espacio, tiempo, objeto...) Expresan conceptos de dominios particulares (Medicina, Bioquímica, Turismo ...) Expresan conceptos sobre la resolución de problemas (diagnóstico, ventas ...) Describen conceptos que dependen tanto de un dominio específico como de una tarea específica (procesos de producción, cardiología…).
Las ontologías de aplicación son aquellas que: Describen conceptos generales (espacio, tiempo, objeto...) Expresan conceptos de dominios particulares (Medicina, Bioquímica, Turismo ...) Expresan conceptos sobre la resolución de problemas (diagnóstico, ventas ...) Describen conceptos que dependen tanto de un dominio específico como de una tarea específica (procesos de producción, cardiología…).
La definición de corpus es: Colección de textos representativos de una lengua, de un dialecto o un subconjunto de un lenguaje, que son utilizados para el análisis lingüístico La especificación explícita de una conceptualización Conjunto de datos y sus descripciones en formato electrónico para construir, mejorar y evaluar las aplicaciones del lenguaje natural.
Uno de los recursos lingüisticos más utilizados es: Corpus Ontología Diccionario Tu prima la coja Lexicones.
Une correctamente los corpus con su clasificación Según el material que incorporan Según el propósito Según el número de idiomas utilizado Según la información lingüística que incorporan.
Que clasificación de corpus cumple que son recopilaciones de materiales cuyo objetivo principal es caracterizar desde un punto de vista lingüístico la lengua hablada Corpus textuales Corpus orales Corpus generales Corpus anotados.
Que corpus cumple que el objetivo principal es el de constituir una fuente de información textual de una lengua para fines y aplicaciones diversas Corpus con fines generales Corpus con fines específicos Corpus anotado Corpus no anotado Corpus textuales Corpus orales.
Que corpus cumple que son creados en respuesta a un propósito particular, como el estudio de aspectos concretos de la gramática o del léxico de la lengua, un dominio concreto, orientado a aplicaciones concretas Corpus con fines generales Corpus con fines específicos Corpus anotado Corpus no anotado Corpus textuales Corpus orales.
Une correctamente estos corpus generales y específicos Con fines generales Con fines específicos.
Une correctamente los corpus con su definición Brown Corpus CREA Reuters-21578 ARTHUS.
Los corpus paralelos son: Corpus monolingües que son conjunto de textos, donde cada uno de éstos es la traducción del original a otras lenguas Corpus multiingües que son conjunto de textos, donde cada uno de éstos es la traducción del original a otras lenguas Corpus monolingües que no requiere una traducción exacta entre las lenguas sino simplemente se trata de textos en varios idiomas que contienen información sobre un tema común Corpus multilingües que no requiere una traducción exacta entre las lenguas sino simplemente se trata de textos en varios idiomas que contienen información sobre un tema común.
Los corpus comparables son: Corpus monolingües que son conjunto de textos, donde cada uno de éstos es la traducción del original a otras lenguas Corpus multiingües que son conjunto de textos, donde cada uno de éstos es la traducción del original a otras lenguas Corpus monolingües que no requiere una traducción exacta entre las lenguas sino simplemente se trata de textos en varios idiomas que contienen información sobre un tema común Corpus multilingües que no requiere una traducción exacta entre las lenguas sino simplemente se trata de textos en varios idiomas que contienen información sobre un tema común.
Une correctamente estos corpus paralelos y comparables Canadian Hansard (corpus bilingüe) Biblia Políglota (13 idiomas) Proyecto Gutenberg Actas de las sesiones del parlamento europeo MultiText-East.
¿Qué es el Multitext-East? Un conjunto de textos literarios en varios idiomas de Europa del Este. Un software de traducción automática para idiomas de Europa del Este Un corpus que incluye artículos de varios periódicos en 6 idiomas distintos de la Europa del Este Un diccionario multilingüe especializado en terminología técnica.
Los corpus anotados (etiquetados): Son conjuntos de datos sin procesar utilizados para el entrenamiento de modelos de IA Textos traducidos automáticamente a varios idiomas para su análisis Colecciones de textos con información adicional en forma de marcas o anotaciones incluidas en cada secuencia de caracteres Bases de datos que contienen exclusivamente texto sin ningún tipo de formato o anotación.
Une correctamente estos corpus etiquetados o no etiquetados 3LB SemCor (Semantic Concordance) CRATER Brown Corpus Textos del Proyecto Gutenberg Biblia Políglota.
Une correctamente estos corpus etiquetados 3LB SemCor (Semantic Concordance) CRATER.
¿Para qué puede utilizarse un corpus como banco de pruebas? Para el desarrollo de hardware específico Para el desarrollo de algoritmos Para el refrendo de teorías o intuiciones Para la gestión de redes neuronales.
¿Qué métodos se pueden utilizar para tratar un corpus? Métodos estadísticos de tratamiento Métodos basados en conocimiento gramatical Ninguno de los dos Ambos por separado Ambos, incluso en conjunto.
Los corpus utilizan muestras "reales" de la lengua para obtener un gran volumen de información V F.
El corpus anotado proporciona una información lingüística excepcional V F.
¿Qué es WordNet? Una base de datos léxica Un procesador de textos Un motor de búsqueda Una red de palabras.
¿En qué se basa WordNet para organizar los significados? Diccionario de sinónimos Synset (conjunto de sinónimos) Tabla de frecuencias Lista de antónimos.
WordNet es fácilmente definida ya que se considera una red semántica V F.
WordNet es uno de los principales recursos lingüisticos V F.
¿Cuál de las siguientes es una relación definida entre synsets en WordNet? Metonimia Sinécdoque Hiponimia Onomatopeya.
WordNet es una base de datos léxica que organiza los significados en synsets V F.
¿Cómo están conectados los WordNets en EuroWordNet? A través de un Índice Multilingüe (IM) Mediante el Índice InterLingual (ILI) Por medio de un Diccionario InterLingual (DIL) A través de un Traductor Universal (TU).
¿Qué característica no está incluida en la tupla de valores para cada synset en SentiWordNet? Objetividad Positividad Neutralidad Negatividad.
¿Qué valores incluye la tupla para cada synset en SentiWordNet? Objetividad, subjetividad, negatividad Objetividad, positividad, neutralidad Objetividad, positividad, negatividad Subjetividad, positividad, negatividad.
EuroWordNet incluye una tupla con 3 valores (objetividad, positividad, negatividad) por cada synset V F.
¿De qué corpus más grande es subconjunto el SemCor? British National Corpus Brown Corpus American National Corpus Corpus of Contemporary American English.
¿Qué tipo de información está anotada en el corpus SemCor? Información gramatical Información semántica Información fonética Información ortográfica.
¿Qué lexicón se utiliza en el corpus SemCor para la anotación semántica? Oxford English Dictionary Collins English Dictionary Merriam-Webster Dictionary WordNet.
¿Qué es el proyecto Gutenberg? Una enciclopedia en línea de acceso libre Una biblioteca de libros electrónicos gratuitos disponibles a través de Internet Un diccionario multilingüe en línea Un motor de búsqueda académico.
El proyecto Gutenberg proporciona únicamente libros en formato texto V F.
El proyecto Gutenberg se considera un excelente corpus paralelo puesto que un mismo libro está en varios idiomas V F.
¿Cuál es el primer paso en la arquitectura básica de los sistemas PLN? Análisis sintáctico Análisis morfológico Reconocimiento del idioma Análisis semántico.
La arquitectura básica de los sistemas PLN es Reconocimiento del idioma, segmentación de palabras, oraciones, pasajes, secciones, análisis fonético, análisis pragmático Reconocimiento del idioma, segmentación de palabras, oraciones, pasajes, secciones, análisis morfológico, análisis sintáctico y análisis semántico Identificación del contexto, segmentación de frases, análisis sintáctico, análisis semántico, análisis fonético Análisis del texto, reconocimiento de patrones, segmentación de palabras, oraciones, análisis morfológico, análisis sintáctico.
¿Qué herramientas se mencionan para el reconocimiento del idioma y segmentación en sistemas PLN? Algoritmos de machine learning, modelos estadísticos, redes neuronales Lista de palabras vacías, diccionarios, ontologías Análisis sintáctico, análisis semántico, análisis fonético Corpus de entrenamiento, bases de datos, modelos de lenguaje.
En PLN el reconocimiento del idioma y segmentación es una tarea relativamente sencilla V F.
En PLN en segmentación se utilizan tokenizadores para segmentar el texto V F.
En el análisis morfológico: Se realiza detección de palabras especiales, asignación de etiquetas y desambiguación de las mismas Nos encontramos con constituyentes básicos o chunks, determinamos la estructura de la oración y están las funciones gramaticales y roles temáticos Puede ser léxico o proposicional.
En el análisis sintáctico: Se realiza detección de palabras especiales, asignación de etiquetas y desambiguación de las mismas Nos encontramos con constituyentes básicos o chunks, determinamos la estructura de la oración y están las funciones gramaticales y roles temáticos Puede ser léxico o proposicional.
En el análisis semántico: Se realiza detección de palabras especiales, asignación de etiquetas y desambiguación de las mismas Nos encontramos con constituyentes básicos o chunks, determinamos la estructura de la oración y están las funciones gramaticales y roles temáticos Puede ser léxico o proposicional.
¿Cuál de las siguientes tareas no es parte del preprocesamiento en sistemas PLN? Identificación de lengua Análisis de sentimientos Segmentación de palabras (tokenization), oraciones, párrafos, secciones Identificación de entidades con nombre (Named Entity Recognition) Lematización o stemming Identificación de palabras especiales.
¿Qué técnica se utiliza en el preprocesamiento para reducir las palabras a su forma base? Tokenization Lematización (o stemming) Análisis sintáctico Identificación de entidades con nombre.
¿Qué tarea de preprocesamiento implica la identificación de fechas y distancias en el texto? Lematización Identificación de palabras especiales Análisis semántico Identificación de entidades con nombre.
¿Cuál es el objetivo principal del conocimiento léxico en sistemas de PLN? Crear gráficos de datos Analizar las palabras del texto Producir resúmenes de texto Segmentar las palabras, oraciones...
¿Qué tipo de información llevan asociadas las palabras en el conocimiento léxico? Solo información semántica Información morfológica, sintáctica y semántica Información fonética y pragmática Información gramatical y retórica.
¿Dónde se almacena toda la información asociada a las palabras en sistemas PLN según el análisis léxico? En el corpus En el léxico o diccionario En la base de datos En la memoria de trabajo.
Algunos de los problemas que surgen en el análisis léxico son: La aparición de contracciones La adjunción de pronombres a verbos Unidades que se representan ortográficamente con más de una palabra Todas son correctas.
En el análisis léxico un token es: Aparición concreta de una palabra en un texto dentro de un contexto determinado Unidad abstracta que engloba a todas las apariciones de una misma palabra en un texto.
En el análisis léxico un type es: Aparición concreta de una palabra en un texto dentro de un contexto determinado Unidad abstracta que engloba a todas las apariciones de una misma palabra en un texto.
En el análisis léxico, la tokenización es la separación de un texto en secuencias de un unidades lingüísticas elementales (palabras) una forma de determinar una forma única común a todas las posibles formas de una misma palabra.
En el análisis léxico la tokenización ayuda a resolver problemas que no puede la normalización como puede ser: - Homógrafos - Contracciones - Flexión y derivación léxica - Formas verbales complejas - Unidades multipalabra complejas V F.
En el análisis léxico, la normalización es la separación de un texto en secuencias de un unidades lingüísticas elementales (palabras) una forma de determinar una forma única común a todas las posibles formas de una misma palabra.
La normalización en el análisis léxico permite obtener los lemas mediante stemmer y las raíces o temas mediante lematización V F.
¿Qué término describe la forma única con la que se nombra un lexema? Flexión Derivación Lema Morfema.
¿Cuál de las siguientes formas no marcada corresponde a nombres y adjetivos en el lema? Femenino singular Masculino singular Neutro plural Forma aumentativa.
¿En qué forma se presenta el lema para los verbos? Participio Gerundio Infinitivo Subjuntivo.
Muchas palabras pueden variar en su forma mediante flexión y derivación pero todas responden a una misma palabra: lexema V F.
En un lema su forma canónica es un ítem del diccionario V F.
La lematización es El proceso de asociar los tokens de un texto a su lema correspondiente La identificación de entidades con nombre en un texto La segmentación de un texto en oraciones y párrafos El análisis de la estructura gramatical de las oraciones.
Una raíz o tema es: significado léxico significado gramatical.
Una morfema es: significado léxico significado gramatical.
Un stemmer es Un algoritmo que analiza la sintaxis de las oraciones Un proceso de extracción de la raíz o tema de las palabras de un texto Una herramienta para traducir textos automáticamente Un método para segmentar textos en oraciones y párrafos.
Una de las características del stemmer es que se pierden los rasgos morfológicos V F.
El tratamiento morfológico se basa en Las estrategias de formación de las palabras, ya que éstas pueden formarse por composición de otras formas más simples o por adjunción La identificación de entidades con nombre en un texto El análisis sintáctico de las oraciones Las estrategias de división de palabras y como estas varían en su significado.
La adjunción supone que a una raíz se le adjuntan uno o varios sufijos V F.
Los objetivos fundamentales del análisis morfológico son: Descomponer la palabra en una cadena de morfemas Obtener el lema asociado a la forma léxica para poder acceder a la información semántica Identificar la estructura sintáctica de las oraciones Identificar las relaciones entre las diferentes palabras del texto Todas son correctas La 1 y la 2 son correctas.
En el análisis morfológico la composición es: unión o concatenación de dos palabras distintas para formar una única adjunción de morfemas a una raíz para formar una palabra diferente.
En el análisis morfológico la derivación es: unión o concatenación de dos palabras distintas para formar una única adjunción de morfemas a una raíz para formar una palabra diferente.
En el análisis morfológico la mayor parte de las herramientas asignan y desambiguan etiquetas a la vez y todas incluyen lematización V F.
En el análisis sintáctico el análisis superficial se denomina parsers y el profundo chunking V F.
En el análisis semántico las herramientas que existen se suelen desarrollar ad-hoc V F.
En el análisis semántico hay que asociar a cada palabra un sentido, para ello se puede usar ontologías o diccionarios V F.
¿Qué recursos se utilizan comúnmente para el análisis semántico? Corpus de entrenamiento y redes neuronales Ontologías y diccionarios como WordNet y EuroWordNet Algoritmos de clustering y clasificación Bases de datos y modelos de lenguaje.
¿Cuál es el objetivo principal del WSD en análisis semántico? Generar traducciones automáticas Desambiguar el sentido de las palabras en un contexto específico Analizar las relaciones entre todos los tokens del texto Analizar como evoluciona el sentido de las palabras a lo largo del contexto.
Denunciar Test