MIA04 - Modelos de Inteligencia Artificial 2026
|
|
Título del Test:
![]() MIA04 - Modelos de Inteligencia Artificial 2026 Descripción: Test de la unidad 4 de Modelos de Inteligencia Artificial 2026 |



| Comentarios |
|---|
NO HAY REGISTROS |
|
¿Cuál es una consecuencia negativa de un mal preprocesamiento?. Modelos con bajo rendimiento o sesgados. Una tokenización más precisa. Predicciones más rápidas. Menor necesidad de datos de entrenamiento. ¿Qué se entiende por “stop words”?. Palabras muy frecuentes y poco informativas que a menudo se eliminan. Errores ortográficos comunes. Palabras clave utilizadas en consultas de búsqueda. Palabras técnicas propias del dominio médico. ¿Qué significa PLN en el contexto de la informática?. Procesamiento del Lenguaje Natural. Programación de Lenguajes Numéricos. Protocolo de Lenguaje Neuronal. Planificación Lógica de Nombres. ¿Qué significa "alucinación" en un modelo de lenguaje?. Generar información falsa o incorrecta pero presentada como verídica. Fallo al compilar el modelo. Respuesta extremadamente precisa. Uso excesivo de emojis en las respuestas. ¿Cuál es una ventaja clave del fine-tuning frente al entrenamiento desde cero?. Requiere menos datos y menos tiempo de cómputo. Produce modelos más grandes. Evita el uso de GPUs. Elimina completamente los sesgos del modelo. ¿Cuál de las siguientes tareas se puede abordar eficazmente con un modelo Transformer?. Clasificación de imágenes. Análisis de series temporales. Reconocimiento de entidades nombradas (NER). Control de dispositivos electrónicos. ¿Qué técnica permite adaptar un modelo Transformer general a una tarea específica con pocos datos?. Fine-tuning (ajuste fino). Stemming. Parsing sintáctico. Tokenización. ¿Cuál de los siguientes riesgos éticos está asociado con los modelos de lenguaje?. Generación de contenido sesgado o discriminatorio. Consumo excesivo de energía renovable. Falta de usabilidad en dispositivos móviles. Incompatibilidad con navegadores modernos. ¿Cuál de las siguientes NO es una técnica común de preprocesamiento?. Traducción automática. Eliminación de signos de puntuación. Tokenización. Stemming. ¿Qué es la tokenización?. Dividir un texto en unidades más pequeñas como palabras o frases. Corregir errores gramaticales en el texto. Eliminar los signos de puntuación. Agrupar palabras similares por su raíz. ¿Qué modelo clásico se usaba frecuentemente para tareas de clasificación de texto antes de los modelos de deep learning?. Naive Bayes. Transformer. BERT. LLaMA. ¿Qué significa que un modelo Transformer sea “preentrenado”?. Que ha sido entrenado previamente en grandes corpus de texto no etiquetado. Que solo puede funcionar con datos anotados manualmente. Que está basado en reglas lingüísticas fijas. Que requiere GPUs para su entrenamiento. ¿Para qué se suele aplicar la eliminación de signos de puntuación?. Evitar que interfieran en el análisis textual. Reducir el tamaño del vocabulario. Mejorar la ortografía del texto. Detectar palabras clave en preguntas. ¿Qué característica principal distingue al modelo TF-IDF?. Pondera la frecuencia de una palabra según su rareza en el corpus. Solo cuenta la frecuencia absoluta de las palabras. Utiliza atención para contextualizar las palabras. Requiere redes neuronales profundas para funcionar. ¿Qué tipo de texto puede requerir pasos especiales de preprocesamiento, como la expansión de abreviaturas o la corrección de errores?. Textos informales como los de redes sociales. Artículos científicos publicados. Libros de texto revisados por pares. Diccionarios estructurados. ¿Cuál es una característica del análisis de sentimientos basado en diccionario?. Asocia palabras con puntuaciones emocionales predefinidas. Utiliza embeddings para representar sentimientos. Requiere entrenamiento supervisado. Se basa exclusivamente en aprendizaje profundo. Qué se entiende por overfitting durante el fine-tuning?. Cuando el modelo se ajusta demasiado al conjunto de entrenamiento y generaliza mal. Cuando el modelo necesita más capas. Cuando los datos están balanceados. Cuando el modelo es demasiado pequeño. ¿Cuál de los siguientes principios es clave para un desarrollo ético de modelos de PLN?. Transparencia. Compresión de datos. Optimización de red. Privatización. ¿Qué parte del Transformer permite capturar distintos tipos de relaciones semánticas y sintácticas en paralelo?. La atención multicabezal. La normalización por capas. La capa de embedding. La capa softmax. ¿Cuál de las siguientes librerías es más antigua y conocida por sus capacidades básicas de PLN en Python?. NLTK (Natural Language Toolkit). Transformers. spaCy. OpenNLP. ¿Qué papel tiene la intervención humana en sistemas de IA responsables?. Revisar y supervisar decisiones críticas del modelo. Eliminar el uso de modelos automatizados. Crear todos los datos de entrenamiento a mano. Sustituir por completo al modelo de lenguaje. ¿Cuál de los siguientes NO es un reto del PLN?. Reconocimiento de patrones de ADN. Ambigüedad léxica. Lenguaje figurado. Errores ortográficos y gramaticales. ¿Cuál es el objetivo principal del preprocesamiento del texto en PLN?. Mejorar la calidad y consistencia de los datos antes de usarlos en modelos. Reducir el tamaño del texto original para ahorrar memoria. Traducir el texto a otro idioma automáticamente. Encriptar los datos para proteger su contenido. ¿Cuál es una desventaja del modelo TF-IDF frente a los embeddings modernos?. No capta relaciones semánticas entre palabras. Es computacionalmente más costoso. Requiere redes neuronales profundas. Solo funciona con texto en inglés. ¿Cuál de las siguientes tareas pertenece al campo del PLN?. Análisis de sentimientos. Compilación de código fuente. Edición de imágenes. Envío de paquetes de red. ¿Qué representa la métrica F1-score en la evaluación de modelos avanzados de PLN?. El equilibrio entre precisión y exhaustividad (recall). La proporción de errores cometidos por el modelo. El número total de etiquetas correctas. El tiempo de entrenamiento medio del modelo. ¿Qué limitación tiene el modelo Bag of Words?. Ignora el orden y contexto de las palabras. No puede ser implementado en Python. Es muy lento para textos cortos. No se puede aplicar a idiomas con morfología compleja. ¿Cuál es la diferencia entre stemming y lematización?. La lematización utiliza un análisis lingüístico más preciso que el stemming. El stemming siempre produce palabras reales. La lematización elimina las palabras menos frecuentes. Ambos procesos generan sinónimos. ¿Qué herramienta en Python permite aplicar fácilmente tokenización, lematización y eliminación de stop words?. spaCy. Pandas. NumPy. Matplotlib. ¿Cuál es el componente fundamental que permite a los modelos Transformer capturar relaciones entre todas las palabras de una secuencia?. El mecanismo de atención. Las redes convolucionales. Los árboles sintácticos. El stemming. ¿Cuál de las siguientes tareas del Procesamiento del Lenguaje Natural es la más adecuada para identificar si una opinión de un cliente expresa satisfacción o insatisfacción?. Clasificación de texto. Generación de lenguaje natural. Análisis de sentimiento. Estás trabajando en un proyecto donde necesitas que una máquina lea miles de artículos de noticias y automáticamente identifique los nombres de las personas, organizaciones y lugares mencionados en cada uno. ¿Qué tarea específica del PLN es fundamental para lograr esto?. Tokenización. Reconocimiento de Entidades Nombradas (NER). Análisis de Sentimiento. Generación de Lenguaje Natural (NLG). ¿Cuál de las siguientes afirmaciones es correcta en relación con la tokenización, la lematización y el stemming?. La tokenización elimina afijos y transforma palabras en su raíz. La lematización y el stemming siempre devuelven resultados idénticos. El stemming puede producir raíces no reconocibles como palabras reales. La lematización se utiliza para dividir un texto en palabras individuales. ¿Cuál de las siguientes afirmaciones sobre los embeddings es correcta?. Los embeddings permiten capturar relaciones semánticas y contextuales entre palabras. Los embeddings representan palabras únicamente por su frecuencia en un texto. Los embeddings asignan vectores numéricos aleatorios a las palabras sin relación semántica. Los embeddings devuelven siempre el mismo vector para una palabra, sin importar el contexto. Estás trabajando en un proyecto de clasificación de correos electrónicos en "spam" o "no spam" para la bandeja de entrada de Cristóbal. Tienes un dataset con 10,000 correos electrónicos etiquetados y, al vectorizarlos con TF-IDF, obtienes un espacio de características de 20,000 dimensiones (es decir, 20,000 palabras únicas). Considerando los dos modelos de clasificación clásicos estudiados, Naive Bayes (MultinomialNB) y Máquinas de Vectores de Soporte (SVM) con un kernel lineal, ¿cuál de las siguientes afirmaciones es la más precisa y completa sobre su idoneidad y comportamiento en este escenario?. SVM con kernel lineal es preferible porque maneja mejor la alta dimensionalidad y su enfoque de margen máximo tiende a ser más robusto para la generalización, aunque podría ser más lento que Naive Bayes. Naive Bayes sería la mejor opción porque es más interpretable, y su suposición de independencia de características siempre se cumple en textos largos como los correos. Ambos modelos son igualmente adecuados, ya que su rendimiento es prácticamente idéntico en tareas de clasificación de texto con alta dimensionalidad. Naive Bayes sería más lento de entrenar debido a la gran cantidad de características, mientras que SVM sería más rápido por su truco del kernel. Estás en una conferencia de PLN y un colega te pregunta por qué los modelos clásicos (como Naive Bayes o SVM con TF-IDF) ya no son la opción predeterminada para tareas complejas como la traducción automática o la generación de texto, y por qué el deep learning se ha vuelto dominante. ¿Cuál de las siguientes afirmaciones resume más adecuadamente la principal limitación de los enfoques tradicionales que los modelos de deep learning (especialmente los Transformers) han superado decisivamente?. Los modelos clásicos eran demasiado lentos para procesar grandes volúmenes de texto, a diferencia de los modelos de deep learning que son inherentemente más rápidos. La principal limitación era su incapacidad para integrarse con librerías modernas de Python como scikit-learn o spaCy, que no existían en ese momento. No podían realizar tareas de clasificación en absoluto, solo eran útiles para el análisis de sentimientos básico con léxicos fijos. Su mayor debilidad radicaba en la dependencia de una ingeniería de características manual y su limitada comprensión contextual, lo que los hacía rígidos e incapaces de capturar relaciones semánticas complejas y el orden de las palabras. ¿Cuál de las siguientes afirmaciones sobre la arquitectura de los Transformers es correcta?. Los Transformers procesan los tokens uno a uno, de forma secuencial, como las redes neuronales recurrentes. La capa de autoatención se aplica después de la capa feed-forward. Cada cabeza de atención aprende las mismas relaciones para reforzar el aprendizaje. La autoatención multicabezal permite al modelo capturar distintos tipos de relaciones entre palabras de forma paralela. ¿Cuál de las siguientes afirmaciones es correcta sobre el uso de modelos preentrenados para tareas de resumen automático en español con Hugging Face?. Puedes usar cualquier modelo con pipeline("summarization") sin preocuparte por el idioma, ya que todos los modelos son multilingües por defecto. El modelo mrm8488/bert2bert_shared-spanish-finetuned-summarization es ideal para entornos con poca RAM o sin GPU. Si obtienes una salida incorrecta o extraña (como tokens ), puede deberse a que el modelo no está afinado correctamente o no entiende el idioma. Usar pipeline("summarization") requiere que escribas explícitamente la tokenización y decodificación. Has entrenado un modelo de clasificación binaria para detectar opiniones positivas en reseñas de productos. Al evaluar su rendimiento, obtienes los siguientes resultados: - Precisión: 0.90 - Recall: 0.60 ¿Qué indica esta combinación de métricas?. El modelo clasifica muy pocas reseñas como positivas, pero casi siempre acierta cuando lo hace. El modelo clasifica muchas reseñas como positivas, pero muchas de esas predicciones son incorrectas. El modelo detecta bien casi todas las opiniones positivas, aunque se equivoca mucho al hacerlo. El modelo no es útil porque precisión y recall deberían ser siempre iguales. ¿Cuál de las siguientes afirmaciones describe mejor un ejemplo real de uso discriminatorio en modelos de procesamiento del lenguaje natural (PLN)?. Un modelo de PLN que comete errores ortográficos al traducir textos técnicos. Un chatbot que responde de forma ofensiva o sexista cuando se le pregunta por ciertos colectivos. Un sistema de recomendación que tarda más en procesar textos largos. Un modelo que necesita muchos recursos computacionales para funcionar correctamente. |




