PLN TEMA 2
![]() |
![]() |
![]() |
Título del Test:![]() PLN TEMA 2 Descripción: PLN TEMA 2 UJA |




Comentarios |
---|
NO HAY REGISTROS |
Los recursos lingüísticos son. Conjunto de datos y sus descripciones en formato electrónico para construir, mejorar y evaluar las aplicaciones del lenguaje natural. Conjunto de reglas gramaticales utilizadas para estructurar frases en un idioma específico. Técnicas de traducción automática basadas en algoritmos estadísticos. Manuales de gramática y diccionarios utilizados por estudiantes para aprender un nuevo idioma. Los recursos lingüísticos tienen como objetivo. Incluir la mayor información posible procedente de recursos lingüísticos o mediante técnicas propias de PLN con el fin de obtener sistemas con mayor efectividad. Simplificar la estructura gramatical de un idioma para facilitar su aprendizaje. Desarrollar nuevos lenguajes artificiales para la programación de sistemas informáticos. Preservar las lenguas en peligro de extinción a través de la documentación y grabación de hablantes nativos. Respecto a los recursos lingüísticos. Hay grandes esfuerzos para generar recursos y para integrarlos en tareas de PLN. La mayoría de los recursos no tienen una definición clara (se mezcla la definición de unos recursos con otros). No tienen importancia en el desarrollo de tecnologías de voz. Todos son correctos. 1 y 2 son correctos. Los tipos de recursos lingüisticos son. Lexicones. Diccionarios. Ontologías. Corpus. Todos son correctos. Todos son incorrectos. ¿Cuál de los siguientes NO es un tipo de recurso lingüístico?. Lexicones. Diccionarios. Ontologías. Manuales de gramática. Los lexicones generales son: Repositorios de palabras. Conocimiento sobre las palabras. Gazetteers. Diccionarios de locuciones. Siglas, jergas. Todas son correctas. La 1 y 2 son correctas. Respecto a los lexicones generales. Los repositorios de palabras tratan la fonología, morfología, sintaxis, semántica etc. Los conocimiento sobre las palabras tratan la fonología, morfología, sintaxis, semántica etc. Los conocimiento sobre las palabras son lemarios, listas de palabras... Los repositorios de palabras son lemarios, listas de palabras... La 1 y la 3 son correctas. La 2 y la 4 son correctas. ¿Cuál de las siguientes no es una característica incluida en el conocimiento sobre las palabras en un lexicón general?. Sintaxis. Morfología. Semántica. Traducción automática. ¿Cuál de los siguientes es un tipo de lexicón especializado?. Fonología. Sintaxis. Gazetteers. Morfología. ¿Cuál de los siguientes es un tipo de lexicón especializado?. Nombres propios. Bases de datos terminológicas. Gazetteers. Diccionarios de locuciones. Bases de datos léxicas. Siglas, jergas. Detectores de fechas, números, fórmulas …. Todos son correctos. Ninguno es correcto. Todos estos son lexicones generales. ¿Qué significa MRD en el contexto de los diccionarios?. Manual de Recursos de Diccionarios. Machine Readable Dictionary. Manual de Referencia de Datos. Machine Resource Directory. Los diccionarios se pueden clasificar por sus tipos de esta forma: Generales, normativos, de uso, de aprendizaje. Enciclopédicos y normativos. Monolingües, bilingües, multilingües. De aprendizaje y tesauros. ¿Cómo se pueden clasificar los diccionarios según el número de lenguas utilizadas?. Enciclopédicos y normativos. Monolingües, bilingües, multilingües. Generales y de uso. De aprendizaje y tesauros. ¿En el contexto de los diccionarios, qué es una enciclopedia?. Un recurso que lista palabras agrupadas según su significado, proporcionando sinónimos y, a veces, antónimos. Un recurso de referencia que proporciona información detallada sobre una amplia gama de temas, organizados alfabéticamente, y cubre múltiples áreas del conocimiento. Un recurso que organiza las palabras en una red de relaciones semánticas y proporciona una lista de términos relacionados. Un recurso que contiene solo definiciones breves de palabras y sus usos gramaticales. ¿En el contexto de los diccionarios, qué es un tesauro?. Un recurso de referencia que proporciona información detallada sobre una amplia gama de temas, organizados alfabéticamente, y cubre múltiples áreas del conocimiento. Un recurso que organiza las palabras en una red de relaciones semánticas y proporciona una lista de términos relacionados. Un recurso que contiene solo definiciones breves de palabras y sus usos gramaticales. Un recurso que lista palabras agrupadas según su significado, proporcionando sinónimos y, a veces, antónimos. ¿Por qué el término "ontología" genera controversia en el campo de la Inteligencia Artificial?. Porque no hay claridad entre este término y el lexicón. Porque es un concepto completamente nuevo. Porque se utiliza solo en tareas de minería de datos. Porque es exclusivo de la web semántica. ¿Qué otro término se utiliza para referirse a una ontología?. Base de datos. Diccionario. Base de conocimiento. Corpus. La ontología trabaja con: Información que puede ser inferida o de sentido común. Información más lingüística, clases de palabras, por ejemplo. Ambas. Ninguna de las dos. El lexicón trabaja con: Información que puede ser inferida o de sentido común. Información más lingüística, clases de palabras, por ejemplo. Ambas. Ninguna de las dos. ¿Qué significa que una ontología sea "shared"?. Que es comprensible para una máquina. Que es consensuada por un grupo, compartida por varias partes. Que es una forma de entender/describir un dominio. Que está descrita en un lenguaje natural. ¿Qué significa que una ontología sea "explicit"?. Que es comprensible para una máquina. Que es consensuada por un grupo, compartida por varias partes. Que es una forma de entender/describir un dominio. Que está descrita en un lenguaje natural. ¿Qué se entiende por formal en una ontología?. Que es comprensible para una máquina. Que es consensuada por un grupo, compartida por varias partes. Que es una forma de entender/describir un dominio. Que está descrita en un lenguaje natural. ¿Qué es una "conceptualización" en el contexto de una ontología?. Que es comprensible para una máquina. Que es consensuada por un grupo, compartida por varias partes. Que es una forma de entender/describir un dominio. Que está descrita en un lenguaje natural. Según Gruber (1993), ¿qué es una ontología o base de conocimiento?. Una lista de palabras sin significado. Un conjunto de datos estructurados sin relación. Una especificación explícita de una conceptualización. Un sistema de procesamiento de lenguaje natural. ¿Cuáles de los siguientes son objetivos de las ontologías?. Simplificar el acceso a los datos. Estandarizar tipos de datos. Gestión de datos. Definir-unificar un "espacio global" de la información. Todas son correctas. ¿Cuál de los siguientes NO es un objetivo de las ontologías?. Simplificar el acceso a los datos. Estandarizar tipos de datos. Gestión de datos. Definir-dividir un "espacio concreto" de la información. Las ontologías tienen entre sus características: El estudio de lo que existe en el mundo. La especificación explícita de una conceptualización. Definición de conceptos y sus relaciones básicas para la comprensión de un área. Todas son correctas. Las ontologías se usan para: Compartir conocimiento. Representar lo que “existe” (entidades-conocimiento). Facilitar el razonamiento automático. Todas son correctas. Todas son incorrectas. ¿Qué es una ontología según la definición proporcionada por Weigand (1997)?. Un conjunto de reglas gramaticales para un idioma. Una base de datos que describe los conceptos en el mundo o en algún dominio, sin tener en cuenta sus propiedades ni como se relacionan entre sí. Es una descripción de los conceptos (en un dominio) y de las relaciones conceptuales que pueden existir para un agente o una comunidad de agentes. Un algoritmo de aprendizaje automático. ¿Cómo favorecen las ontologías la comunicación entre personas, organizaciones y aplicaciones?. Porque proporcionan una comprensión común de un dominio, de modo que se eliminan confusiones conceptuales y terminológicas. Porque permiten la integración de diferentes sistemas y plataformas mediante un lenguaje común. Porque facilitan la interoperabilidad entre distintos sistemas de información al estandarizar conceptos. Porque ayudan a la coordinación de tareas y procesos al definir términos y relaciones de manera uniforme. ¿Qué puede hacer un motor de razonamiento partiendo de unas reglas de inferencia y los datos de las ontologías?. Generar nuevos datos sin necesidad de reglas predefinidas. Inferir conclusiones de ellos. Modificar las ontologías automáticamente. Eliminar las reglas de inferencia una vez usadas. ¿Qué papel juegan las reglas de inferencia en el uso de ontologías?. Eliminar datos obsoletos de las ontologías. Facilitar la inferencia de conclusiones a partir de los datos. Crear nuevas ontologías automáticamente. Proveer de datos adicionales a las ontologías. Entre los usos de las ontologías nos encontramos: Compartir conocimiento. Representar lo que "existe". Facilitar el razonamiento automático. Todas son correctas. La 1 y la 3 son correctas. Las ontologías genéricas son aquellas que: Describen conceptos generales (espacio, tiempo, objeto...). Expresan conceptos de dominios particulares (Medicina, Bioquímica, Turismo ...). Expresan conceptos sobre la resolución de problemas (diagnóstico, ventas ...). Describen conceptos que dependen tanto de un dominio específico como de una tarea específica (procesos de producción, cardiología…). Las ontologías de dominio son aquellas que: Describen conceptos generales (espacio, tiempo, objeto...). Expresan conceptos de dominios particulares (Medicina, Bioquímica, Turismo ...). Expresan conceptos sobre la resolución de problemas (diagnóstico, ventas ...). Describen conceptos que dependen tanto de un dominio específico como de una tarea específica (procesos de producción, cardiología…). Las ontologías de tareas son aquellas que: Describen conceptos generales (espacio, tiempo, objeto...). Expresan conceptos de dominios particulares (Medicina, Bioquímica, Turismo ...). Expresan conceptos sobre la resolución de problemas (diagnóstico, ventas ...). Describen conceptos que dependen tanto de un dominio específico como de una tarea específica (procesos de producción, cardiología…). Las ontologías de aplicación son aquellas que: Describen conceptos generales (espacio, tiempo, objeto...). Expresan conceptos de dominios particulares (Medicina, Bioquímica, Turismo ...). Expresan conceptos sobre la resolución de problemas (diagnóstico, ventas ...). Describen conceptos que dependen tanto de un dominio específico como de una tarea específica (procesos de producción, cardiología…). La definición de corpus es: Colección de textos representativos de una lengua, de un dialecto o un subconjunto de un lenguaje, que son utilizados para el análisis lingüístico. La especificación explícita de una conceptualización. Conjunto de datos y sus descripciones en formato electrónico para construir, mejorar y evaluar las aplicaciones del lenguaje natural. Uno de los recursos lingüisticos más utilizados es: Corpus. Ontología. Diccionario. Tu prima la coja. Lexicones. Une correctamente los corpus con su clasificación. Según el material que incorporan. Según el propósito. Según el número de idiomas utilizado. Según la información lingüística que incorporan. Que clasificación de corpus cumple que son recopilaciones de materiales cuyo objetivo principal es caracterizar desde un punto de vista lingüístico la lengua hablada. Corpus textuales. Corpus orales. Corpus generales. Corpus anotados. Que corpus cumple que el objetivo principal es el de constituir una fuente de información textual de una lengua para fines y aplicaciones diversas. Corpus con fines generales. Corpus con fines específicos. Corpus anotado. Corpus no anotado. Corpus textuales. Corpus orales. Que corpus cumple que son creados en respuesta a un propósito particular, como el estudio de aspectos concretos de la gramática o del léxico de la lengua, un dominio concreto, orientado a aplicaciones concretas. Corpus con fines generales. Corpus con fines específicos. Corpus anotado. Corpus no anotado. Corpus textuales. Corpus orales. Une correctamente estos corpus generales y específicos. Con fines generales. Con fines específicos. Une correctamente los corpus con su definición. Brown Corpus. CREA. Reuters-21578. ARTHUS. Los corpus paralelos son: Corpus monolingües que son conjunto de textos, donde cada uno de éstos es la traducción del original a otras lenguas. Corpus multiingües que son conjunto de textos, donde cada uno de éstos es la traducción del original a otras lenguas. Corpus monolingües que no requiere una traducción exacta entre las lenguas sino simplemente se trata de textos en varios idiomas que contienen información sobre un tema común. Corpus multilingües que no requiere una traducción exacta entre las lenguas sino simplemente se trata de textos en varios idiomas que contienen información sobre un tema común. Los corpus comparables son: Corpus monolingües que son conjunto de textos, donde cada uno de éstos es la traducción del original a otras lenguas. Corpus multiingües que son conjunto de textos, donde cada uno de éstos es la traducción del original a otras lenguas. Corpus monolingües que no requiere una traducción exacta entre las lenguas sino simplemente se trata de textos en varios idiomas que contienen información sobre un tema común. Corpus multilingües que no requiere una traducción exacta entre las lenguas sino simplemente se trata de textos en varios idiomas que contienen información sobre un tema común. Une correctamente estos corpus paralelos y comparables. Canadian Hansard (corpus bilingüe). Biblia Políglota (13 idiomas). Proyecto Gutenberg. Actas de las sesiones del parlamento europeo. MultiText-East. ¿Qué es el Multitext-East?. Un conjunto de textos literarios en varios idiomas de Europa del Este. Un software de traducción automática para idiomas de Europa del Este. Un corpus que incluye artículos de varios periódicos en 6 idiomas distintos de la Europa del Este. Un diccionario multilingüe especializado en terminología técnica. Los corpus anotados (etiquetados): Son conjuntos de datos sin procesar utilizados para el entrenamiento de modelos de IA. Textos traducidos automáticamente a varios idiomas para su análisis. Colecciones de textos con información adicional en forma de marcas o anotaciones incluidas en cada secuencia de caracteres. Bases de datos que contienen exclusivamente texto sin ningún tipo de formato o anotación. Une correctamente estos corpus etiquetados o no etiquetados. 3LB. SemCor (Semantic Concordance). CRATER. Brown Corpus. Textos del Proyecto Gutenberg. Biblia Políglota. Une correctamente estos corpus etiquetados. 3LB. SemCor (Semantic Concordance). CRATER. ¿Para qué puede utilizarse un corpus como banco de pruebas?. Para el desarrollo de hardware específico. Para el desarrollo de algoritmos. Para el refrendo de teorías o intuiciones. Para la gestión de redes neuronales. ¿Qué métodos se pueden utilizar para tratar un corpus?. Métodos estadísticos de tratamiento. Métodos basados en conocimiento gramatical. Ninguno de los dos. Ambos por separado. Ambos, incluso en conjunto. Los corpus utilizan muestras "reales" de la lengua para obtener un gran volumen de información. V. F. El corpus anotado proporciona una información lingüística excepcional. V. F. ¿Qué es WordNet?. Una base de datos léxica. Un procesador de textos. Un motor de búsqueda. Una red de palabras. ¿En qué se basa WordNet para organizar los significados?. Diccionario de sinónimos. Synset (conjunto de sinónimos). Tabla de frecuencias. Lista de antónimos. WordNet es fácilmente definida ya que se considera una red semántica. V. F. WordNet es uno de los principales recursos lingüisticos. V. F. ¿Cuál de las siguientes es una relación definida entre synsets en WordNet?. Metonimia. Sinécdoque. Hiponimia. Onomatopeya. WordNet es una base de datos léxica que organiza los significados en synsets. V. F. ¿Cómo están conectados los WordNets en EuroWordNet?. A través de un Índice Multilingüe (IM). Mediante el Índice InterLingual (ILI). Por medio de un Diccionario InterLingual (DIL). A través de un Traductor Universal (TU). ¿Qué característica no está incluida en la tupla de valores para cada synset en SentiWordNet?. Objetividad. Positividad. Neutralidad. Negatividad. ¿Qué valores incluye la tupla para cada synset en SentiWordNet?. Objetividad, subjetividad, negatividad. Objetividad, positividad, neutralidad. Objetividad, positividad, negatividad. Subjetividad, positividad, negatividad. EuroWordNet incluye una tupla con 3 valores (objetividad, positividad, negatividad) por cada synset. V. F. ¿De qué corpus más grande es subconjunto el SemCor?. British National Corpus. Brown Corpus. American National Corpus. Corpus of Contemporary American English. ¿Qué tipo de información está anotada en el corpus SemCor?. Información gramatical. Información semántica. Información fonética. Información ortográfica. ¿Qué lexicón se utiliza en el corpus SemCor para la anotación semántica?. Oxford English Dictionary. Collins English Dictionary. Merriam-Webster Dictionary. WordNet. ¿Qué es el proyecto Gutenberg?. Una enciclopedia en línea de acceso libre. Una biblioteca de libros electrónicos gratuitos disponibles a través de Internet. Un diccionario multilingüe en línea. Un motor de búsqueda académico. El proyecto Gutenberg proporciona únicamente libros en formato texto. V. F. El proyecto Gutenberg se considera un excelente corpus paralelo puesto que un mismo libro está en varios idiomas. V. F. ¿Cuál es el primer paso en la arquitectura básica de los sistemas PLN?. Análisis sintáctico. Análisis morfológico. Reconocimiento del idioma. Análisis semántico. La arquitectura básica de los sistemas PLN es. Reconocimiento del idioma, segmentación de palabras, oraciones, pasajes, secciones, análisis fonético, análisis pragmático. Reconocimiento del idioma, segmentación de palabras, oraciones, pasajes, secciones, análisis morfológico, análisis sintáctico y análisis semántico. Identificación del contexto, segmentación de frases, análisis sintáctico, análisis semántico, análisis fonético. Análisis del texto, reconocimiento de patrones, segmentación de palabras, oraciones, análisis morfológico, análisis sintáctico. ¿Qué herramientas se mencionan para el reconocimiento del idioma y segmentación en sistemas PLN?. Algoritmos de machine learning, modelos estadísticos, redes neuronales. Lista de palabras vacías, diccionarios, ontologías. Análisis sintáctico, análisis semántico, análisis fonético. Corpus de entrenamiento, bases de datos, modelos de lenguaje. En PLN el reconocimiento del idioma y segmentación es una tarea relativamente sencilla. V. F. En PLN en segmentación se utilizan tokenizadores para segmentar el texto. V. F. En el análisis morfológico: Se realiza detección de palabras especiales, asignación de etiquetas y desambiguación de las mismas. Nos encontramos con constituyentes básicos o chunks, determinamos la estructura de la oración y están las funciones gramaticales y roles temáticos. Puede ser léxico o proposicional. En el análisis sintáctico: Se realiza detección de palabras especiales, asignación de etiquetas y desambiguación de las mismas. Nos encontramos con constituyentes básicos o chunks, determinamos la estructura de la oración y están las funciones gramaticales y roles temáticos. Puede ser léxico o proposicional. En el análisis semántico: Se realiza detección de palabras especiales, asignación de etiquetas y desambiguación de las mismas. Nos encontramos con constituyentes básicos o chunks, determinamos la estructura de la oración y están las funciones gramaticales y roles temáticos. Puede ser léxico o proposicional. ¿Cuál de las siguientes tareas no es parte del preprocesamiento en sistemas PLN?. Identificación de lengua. Análisis de sentimientos. Segmentación de palabras (tokenization), oraciones, párrafos, secciones. Identificación de entidades con nombre (Named Entity Recognition). Lematización o stemming. Identificación de palabras especiales. ¿Qué técnica se utiliza en el preprocesamiento para reducir las palabras a su forma base?. Tokenization. Lematización (o stemming). Análisis sintáctico. Identificación de entidades con nombre. ¿Qué tarea de preprocesamiento implica la identificación de fechas y distancias en el texto?. Lematización. Identificación de palabras especiales. Análisis semántico. Identificación de entidades con nombre. ¿Cuál es el objetivo principal del conocimiento léxico en sistemas de PLN?. Crear gráficos de datos. Analizar las palabras del texto. Producir resúmenes de texto. Segmentar las palabras, oraciones... ¿Qué tipo de información llevan asociadas las palabras en el conocimiento léxico?. Solo información semántica. Información morfológica, sintáctica y semántica. Información fonética y pragmática. Información gramatical y retórica. ¿Dónde se almacena toda la información asociada a las palabras en sistemas PLN según el análisis léxico?. En el corpus. En el léxico o diccionario. En la base de datos. En la memoria de trabajo. Algunos de los problemas que surgen en el análisis léxico son: La aparición de contracciones. La adjunción de pronombres a verbos. Unidades que se representan ortográficamente con más de una palabra. Todas son correctas. En el análisis léxico un token es: Aparición concreta de una palabra en un texto dentro de un contexto determinado. Unidad abstracta que engloba a todas las apariciones de una misma palabra en un texto. En el análisis léxico un type es: Aparición concreta de una palabra en un texto dentro de un contexto determinado. Unidad abstracta que engloba a todas las apariciones de una misma palabra en un texto. En el análisis léxico, la tokenización es. la separación de un texto en secuencias de un unidades lingüísticas elementales (palabras). una forma de determinar una forma única común a todas las posibles formas de una misma palabra. En el análisis léxico la tokenización ayuda a resolver problemas que no puede la normalización como puede ser: - Homógrafos - Contracciones - Flexión y derivación léxica - Formas verbales complejas - Unidades multipalabra complejas. V. F. En el análisis léxico, la normalización es. la separación de un texto en secuencias de un unidades lingüísticas elementales (palabras). una forma de determinar una forma única común a todas las posibles formas de una misma palabra. La normalización en el análisis léxico permite obtener los lemas mediante stemmer y las raíces o temas mediante lematización. V. F. ¿Qué término describe la forma única con la que se nombra un lexema?. Flexión. Derivación. Lema. Morfema. ¿Cuál de las siguientes formas no marcada corresponde a nombres y adjetivos en el lema?. Femenino singular. Masculino singular. Neutro plural. Forma aumentativa. ¿En qué forma se presenta el lema para los verbos?. Participio. Gerundio. Infinitivo. Subjuntivo. Muchas palabras pueden variar en su forma mediante flexión y derivación pero todas responden a una misma palabra: lexema. V. F. En un lema su forma canónica es un ítem del diccionario. V. F. La lematización es. El proceso de asociar los tokens de un texto a su lema correspondiente. La identificación de entidades con nombre en un texto. La segmentación de un texto en oraciones y párrafos. El análisis de la estructura gramatical de las oraciones. Una raíz o tema es: significado léxico. significado gramatical. Una morfema es: significado léxico. significado gramatical. Un stemmer es. Un algoritmo que analiza la sintaxis de las oraciones. Un proceso de extracción de la raíz o tema de las palabras de un texto. Una herramienta para traducir textos automáticamente. Un método para segmentar textos en oraciones y párrafos. Una de las características del stemmer es que se pierden los rasgos morfológicos. V. F. El tratamiento morfológico se basa en. Las estrategias de formación de las palabras, ya que éstas pueden formarse por composición de otras formas más simples o por adjunción. La identificación de entidades con nombre en un texto. El análisis sintáctico de las oraciones. Las estrategias de división de palabras y como estas varían en su significado. La adjunción supone que a una raíz se le adjuntan uno o varios sufijos. V. F. Los objetivos fundamentales del análisis morfológico son: Descomponer la palabra en una cadena de morfemas. Obtener el lema asociado a la forma léxica para poder acceder a la información semántica. Identificar la estructura sintáctica de las oraciones. Identificar las relaciones entre las diferentes palabras del texto. Todas son correctas. La 1 y la 2 son correctas. En el análisis morfológico la composición es: unión o concatenación de dos palabras distintas para formar una única. adjunción de morfemas a una raíz para formar una palabra diferente. En el análisis morfológico la derivación es: unión o concatenación de dos palabras distintas para formar una única. adjunción de morfemas a una raíz para formar una palabra diferente. En el análisis morfológico la mayor parte de las herramientas asignan y desambiguan etiquetas a la vez y todas incluyen lematización. V. F. En el análisis sintáctico el análisis superficial se denomina parsers y el profundo chunking. V. F. En el análisis semántico las herramientas que existen se suelen desarrollar ad-hoc. V. F. En el análisis semántico hay que asociar a cada palabra un sentido, para ello se puede usar ontologías o diccionarios. V. F. ¿Qué recursos se utilizan comúnmente para el análisis semántico?. Corpus de entrenamiento y redes neuronales. Ontologías y diccionarios como WordNet y EuroWordNet. Algoritmos de clustering y clasificación. Bases de datos y modelos de lenguaje. ¿Cuál es el objetivo principal del WSD en análisis semántico?. Generar traducciones automáticas. Desambiguar el sentido de las palabras en un contexto específico. Analizar las relaciones entre todos los tokens del texto. Analizar como evoluciona el sentido de las palabras a lo largo del contexto. |