option
Cuestiones
ayuda
daypo
buscar.php

Test Laboratorio IA

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
Test Laboratorio IA

Descripción:
test todos los temas

Fecha de Creación: 2025/01/07

Categoría: Otros

Número Preguntas: 177

Valoración:(0)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

¿Qué define un conjunto clásico en matemáticas?. Permite pertenencias parciales. Los elementos pertenecen o no al conjunto. Requiere parámetros a, b y c. Su núcleo siempre es 1.

¿Cuál de las siguientes es una característica única de los conjuntos difusos?. Son siempre normales. Permiten grados parciales de pertenencia. Utilizan funciones únicamente trapezoidales. Son equivalentes a los conjuntos clásicos.

¿Qué tipo de función requiere exactamente 2 parámetros, m y d?. Función trapezoidal. Función triangular. Función gaussiana. Función π.

¿Qué indica la altura de un conjunto difuso?. Su núcleo. Su soporte. Su grado de pertenencia máximo. La suma de sus parámetros.

¿Cómo se denomina la operación que genera un único conjunto difuso a partir de varias reglas?. Intersección. Agregación. Unión. Defuzzificación.

¿Qué propiedad tienen los conjuntos difusos normalizados?. Altura igual a 1. Núcleo vacío. Cobertura parcial del universo. No permiten continuidad.

¿Cuál es el método más común para la defuzzificación?. Bisector. Centro de masas. Promedio de máximos. Último de los máximos.

¿Qué significa cuando dos conjuntos difusos tienen "distinguibilidad"?. Tienen el mismo núcleo. Cubren el mismo rango del universo. Sus significados son claramente diferentes. Ambos son normales.

¿Qué describe una regla difusa?. Siempre tiene consecuentes binarios. Conecta un antecedente y un consecuente. Depende de operadores trapezoidales. Solo utiliza variables numéricas.

¿Qué representa el núcleo de un conjunto difuso?. Los valores con pertenencia máxima. El rango donde la pertenencia es mayor que cero. Su función gaussiana. Los valores no permitidos.

¿Qué valor caracteriza a un conjunto trapezoidal?. Tiene cuatro parámetros. Requiere m y d. Siempre es triangular. Tiene altura cero.

¿Qué operador NO es aplicable a conjuntos nítidos?. Unión. Intersección. Complemento. Modificadores lingüísticos.

¿Qué garantiza la continuidad en un sistema difuso?. Que todas las reglas sean independientes. Que los valores sean discretos. Que las reglas vecinas tengan intersección no vacía. Que no existan extremos.

¿Qué operación transforma un conjunto difuso en un número concreto?. Unión. Defuzzificación. Agregación. Intersección.

¿Qué modificador lingüístico intensifica la pertenencia de un conjunto?. Muy. O. NO. Bajo.

¿Qué método de defuzzificación divide un conjunto en áreas iguales?. Bisector. Centro de masas. Promedio de máximos. Primero de los máximos.

¿Qué representa el soporte de un conjunto difuso?. Elementos con pertenencia máxima. Elementos cuyo grado de pertenencia es mayor que cero. Elementos que forman su núcleo. Elementos fuera del rango.

¿Qué propiedad garantiza que todo el universo esté cubierto por conjuntos difusos?. Normalidad. Cobertura. Granularidad. Distinguibilidad.

¿Qué sucede si un sistema difuso tiene reglas inconsistentes?. No genera salida. Dos reglas tienen el mismo antecedente pero distinto consecuente. El soporte desaparece. La altura del conjunto aumenta.

¿Qué define la granularidad en un sistema difuso?. El número de conjuntos difusos utilizados. La altura del conjunto difuso. La función trapezoidal. La intersección entre conjuntos.

¿Qué significa que un conjunto difuso sea normal?. Su altura es igual a 0. Su altura es igual a 1. Todos sus elementos tienen pertenencia parcial. Tiene un núcleo vacío.

¿Qué función de pertenencia alcanza el grado máximo en un solo punto?. Función trapezoidal. Función triangular. Función gaussiana. Función PI (π).

¿Qué se utiliza para combinar los conjuntos difusos generados por varias reglas?. Operador de implicación. Operador de intersección. Agregación. Defuzzificación.

¿Qué describe mejor el método del Centro de Masas?. Divide un conjunto en dos áreas iguales. Encuentra el valor promedio de los máximos. Calcula un punto único basado en las áreas ponderadas del conjunto. Siempre produce valores permitidos en el rango del conjunto.

¿Qué tipo de función de pertenencia es derivable y suave?. Función triangular. Función trapezoidal. Función gaussiana. Función PI (π).

¿Qué es una T-Norma en lógica difusa?. Un operador de agregación para conjuntos difusos. Un operador que mide el grado de pertenencia al núcleo. Un método para calcular intersecciones de conjuntos. Una función que suaviza las fronteras del conjunto.

¿Qué propiedad garantiza que los extremos del universo de discurso tengan 𝜇 = 1 μ=1?. Normalidad. Cobertura. Distinguibilidad. Extremos.

¿Qué tipo de proposición difusa usa conectivos como "AND" y "OR"?. Proposición atómica. Proposición compuesta. Proposición de núcleo. Proposición de soporte.

¿Qué indica la propiedad de consistencia en una base de reglas difusas?. Todas las reglas tienen consecuentes idénticos. No hay reglas con el mismo antecedente y diferentes consecuentes. Las reglas cubren todo el universo de discurso. Cada regla tiene una intersección vacía con sus vecinas.

¿Qué operador NO forma parte de un sistema basado en reglas difusas?. Operador de Conjunción. Operador de Agregación. Operador de Núcleo. Operador de Defuzzificación.

¿Qué representa 𝑆 S en una formulación de optimización?. Una solución particular. El espacio de soluciones. Todas las soluciones factibles. La función objetivo.

¿Qué ocurre en un espacio de búsqueda con muchas variables y dominios grandes?. Convergencia prematura. Explosión combinatoria. Optimización local. Cobertura incompleta.

¿Qué enfoque se utiliza para abordar espacios de búsqueda extensos?. Métodos exactos. Heurísticas. Codificación binaria. Eliminación de soluciones infactibles.

¿Qué NO es una característica de los algoritmos bioinspirados?. Adaptatividad. Determinismo. Uso de analogías naturales. Métodos heurísticos.

¿Qué es necesario para que ocurra evolución natural?. Uso de operadores genéticos. Diferencias entre individuos. Generaciones uniformes. Dominio finito del espacio de búsqueda.

¿Qué tipo de modelo utiliza poblaciones para resolver problemas de optimización?. Algoritmos heurísticos. Evolución artificial. Métodos discretos. Análisis combinatorio.

¿Qué elemento representa una solución en un algoritmo genético?. Alelo. Gen. Cromosoma. Función de fitness.

¿Qué función tiene la "fitness" en los algoritmos genéticos?. Evaluar la aptitud de las soluciones. Generar cromosomas aleatorios. Reducir la población inicial. Garantizar convergencia prematura..

¿Cuál es un operador genético utilizado para combinar soluciones?. Selección. Mutación. Cruce. Agregación.

¿Qué operador genético introduce diversidad en la población?. Selección de torneo. Mutación. Cruce aritmético. Ruleta.

¿Qué representa un alelo?. Una población completa. Un valor que puede tomar un gen. Un operador de selección. Un individuo en la población.

¿Qué modelo reemplaza toda la población en cada iteración?. Modelo estacionario. Modelo generacional. Modelo evolutivo. Modelo heurístico.

¿Qué tipo de codificación es útil en problemas de selección?. Codificación binaria. Codificación real. Codificación permutación. Codificación entera.

¿Qué codificación utiliza secuencias de tareas?. Binaria. Entera. Permutación. Real.

¿Qué NO es un requisito de una representación en algoritmos genéticos?. Permitir representar todo el espacio de búsqueda. Facilitar la selección de operadores. Ser fácil de decodificar. Garantizar soluciones siempre óptimas.

¿Qué asegura la presión selectiva en la selección?. Aumentar la diversidad. Favorecer a los mejores individuos. Garantizar una población uniforme. Reducir las generaciones necesarias.

¿Qué tipo de mutación usa perturbaciones aleatorias en codificación real?. Mutación uniforme. Mutación gaussiana. Intercambio. BLX-α.

¿Qué operador de cruce utiliza un punto de corte único?. Cruce en un punto. Cruce en N puntos. Cruce uniforme. Cruce aritmético.

¿Qué técnica de reemplazo preserva siempre al mejor cromosoma?. Crowding determinístico. Torneo restringido. Elitismo. Emparejamiento variado.

¿Qué problema aborda la técnica de niching?. Optimización multimodal. Convergencia prematura. Diversidad insuficiente. Generación aleatoria.

¿Qué característica define a un problema multimodal?. Conjunto de soluciones factibles infinito. Existencia de múltiples óptimos locales. Optimización binaria exclusivamente. Generación de soluciones aleatorias.

¿Qué condición de parada fija un límite de recursos computacionales?. Número máximo de generaciones. Tiempo de ejecución máximo. Convergencia prematura. Prohibición de incesto.

¿Qué asegura una función de evaluación rápida?. Mayor diversidad en la población. Reducción del tiempo computacional. Convergencia rápida al óptimo local. Eliminación de soluciones infactibles.

¿Qué estrategia mitiga la convergencia prematura?. Mutación adaptativa. Cruce uniforme. Codificación permutación. Modelo estacionario.

¿Qué relación existe entre cruce y explotación?. Cruce favorece la exploración. Cruce garantiza diversidad. Cruce promueve la explotación. Cruce evita la convergencia prematura.

¿Qué sucede con poca diversidad en una población?. Se produce optimización multimodal. Aumenta la convergencia prematura. Se reducen las soluciones infactibles. Se mejora la presión selectiva.

¿Qué técnica evita cruzar individuos similares?. Mutación uniforme. Prohibición de incesto. Torneo restringido. BLX-α.

¿Qué factor promueve la diversidad en una población?. Cruce aritmético. Selección de ruleta. Operadores de mutación. Modelo generacional.

¿Qué objetivo tiene la exploración en algoritmos genéticos?. Localizar zonas prometedoras. Garantizar convergencia al óptimo. Reducir la población inicial. Aumentar la presión selectiva.

¿Qué problema busca equilibrio entre exploración y explotación?. Diversidad insuficiente. Diseño de operadores genéticos. Convergencia prematura. Balance en la búsqueda de soluciones.

¿Qué es una tarea de Machine Learning?. El proceso de aprendizaje automático. El problema que se resuelve mediante el aprendizaje. La implementación de un algoritmo supervisado. La definición de un modelo predictivo.

¿Qué representa un ejemplo en Machine Learning?. Un vector con características medidas cuantitativamente. Un algoritmo supervisado para predicción. Una función de pérdida para evaluar el modelo. Una secuencia de hiperparámetros.

¿Qué define el rendimiento de un algoritmo de Machine Learning?. La complejidad del modelo. La accuracy en el conjunto de validación. La medida específica de la tarea evaluada. El tamaño del dataset.

¿Qué salida genera una tarea de clasificación?. Un valor continuo. Una categoría o clase. Un conjunto de características. Un valor faltante.

¿Qué caracteriza una tarea de regresión?. Predice categorías numéricas. Predice un valor continuo. Agrupa ejemplos similares. Clasifica ejemplos incompletos.

¿Qué tarea organiza ejemplos en grupos sin etiquetas?. Clasificación. Regresión. Clustering. Transcripción.

¿Qué tarea convierte datos no estructurados en texto?. Structured output. Transcripción. Traducción automática. Denoising.

¿Qué tarea genera nuevos ejemplos basados en datos existentes?. Detección de anomalías. Structured output. Síntesis y sampling. Imputación de valores.

¿Qué mide la accuracy en clasificación?. El porcentaje de predicciones correctas. La probabilidad de error en el test set. La capacidad de generalización. El rendimiento sobre datos no etiquetados.

¿Qué sucede generalmente con el test error respecto al training error?. Es igual. Es mayor. Es menor. Depende del modelo.

¿Qué métrica es menos adecuada para estimación de densidad?. Accuracy. Error rate. 0-1 Loss. Macro F-measure.

¿Qué diferencia principal existe entre aprendizaje supervisado y no supervisado?. El tamaño del dataset. La presencia de etiquetas en los datos. El uso de modelos lineales. La capacidad de optimización.

¿Qué objetivo tiene el aprendizaje no supervisado?. Minimizar el training error. Aprender propiedades de la estructura de datos. Optimizar hiperparámetros. Maximizar la capacidad del modelo.

¿Qué característica define el reinforcement learning?. Dataset estático. Etiquetas explícitas. Feedback loop con el entorno. Uso exclusivo de redes neuronales.

¿Qué describe el overfitting?. Incapacidad de reducir el training error. Diferencia grande entre training y test error. Rendimiento pobre en ejemplos no vistos. Uso de un modelo con capacidad limitada.

¿Qué describe el underfitting?. Alta capacidad del modelo. Memorización de ejemplos de entrenamiento. Incapacidad de obtener un training error pequeño. Uso excesivo de hiperparámetros.

¿Cómo afecta la capacidad baja de un modelo?. Generaliza bien pero tiene underfitting. Tiene bajo training error y buen test error. Produce overfitting por falta de regularización. No es capaz de aprender adecuadamente del training set.

¿Qué modifica el proceso de regularización?. Reduce el training error. Disminuye el test error. Reduce el generalization error. Aumenta la capacidad del modelo.

¿Qué uso tiene un validation set?. Entrenar el modelo final. Ajustar hiperparámetros. Estimar el error de generalización. Incrementar el tamaño del dataset.

¿Qué relación existe entre parámetros e hiperparámetros?. Los hiperparámetros se aprenden automáticamente. Los parámetros se ajustan con datos; los hiperparámetros, manualmente. Ambos definen la arquitectura del modelo. Los parámetros dependen del validation set.

¿Qué es la maldición de la dimensionalidad?. Reducción de ejemplos útiles en datasets grandes. Crecimiento exponencial de configuraciones con más variables. Memorización de ejemplos de entrenamiento. Incapacidad de predecir valores faltantes.

¿Qué componente de CNN realiza reducción espacial?. Capa convolucional. Capa RELU. Capa Pooling. Fully connected layer.

¿Qué función tiene la capa convolucional?. Reducir el overfitting. Aprender patrones a través de filtros. Convertir datos no estructurados en texto. Eliminar ruido en el dataset.

¿Qué efecto tiene un stride más alto en una capa convolucional?. Reduce el volumen de output. Incrementa la dimensionalidad del input. Mejora la precisión del modelo. Aumenta el tiempo de cómputo.

¿Qué operación realiza una Pooling Layer?. Producto escalar. Downsampling. Convolución inversa. Regularización.

¿Qué técnica modifica el contraste de una imagen?. Rotation. Flip. Color shift. Contrast change.

¿Qué ventaja tiene el Data Augmentation?. Aumenta el dataset con ejemplos sintéticos. Reduce el error de validación. Aumenta la capacidad del modelo. Incrementa la complejidad de entrenamiento.

¿Qué objetivo tienen las GANs?. Clasificar imágenes. Generar datos similares a los existentes. Predecir valores faltantes. Optimizar hiperparámetros automáticamente.

¿Qué describe mejor la técnica de noising en denoising?. Añadir ruido al dataset para simular imperfecciones. Reducir el error de generalización. Eliminar características irrelevantes. Incrementar la dimensionalidad del modelo.

¿Qué problema aborda la técnica de Zero-padding en CNNs?. Incrementar la capacidad del modelo. Preservar el tamaño espacial en convoluciones. Reducir la complejidad computacional. Aumentar el número de parámetros entrenables.

¿Qué es un corpus en NLP?. Un documento único de texto. Una colección de textos o documentos. Un modelo entrenado para clasificación. Un algoritmo para análisis de texto.

¿Qué es la vectorización en NLP?. Reducir las dimensiones de un texto. Convertir un texto en representaciones numéricas. Crear gráficos a partir de datos textuales. Procesar datos con redes neuronales profundas.

¿Qué representa un vector One-hot?. Un único valor continuo por palabra. Un vector con 1 y 0 para cada palabra. La frecuencia de las palabras en un corpus. Un conjunto de n-gramas extraídos del texto.

¿Qué técnica ignora el orden y la gramática en el texto?. One-hot encoding. Bag of Words. Word Embeddings. Syntax Trees.

¿Qué técnica utiliza frecuencias para identificar temas en textos?. N-grams. TF-IDF. Skip-grams. FastText.

¿Qué ventaja tiene TF-IDF sobre Bag of Words?. Captura la semántica de las palabras. Reduce la dimensionalidad del texto. Disminuye el peso de palabras comunes. Permite análisis supervisado.

¿Qué algoritmo se basa en una distribución probabilística para modelar temas?. Latent Semantic Analysis (LSA). Latent Dirichlet Allocation (LDA). TF-IDF. Word Embeddings.

¿Qué es la ley de Zipf?. Una ley que explica la semántica de las palabras. Un modelo de generación de texto. Una regla que relaciona la frecuencia y el ranking de las palabras. Una técnica para crear vectores de palabras.

¿Qué diferencia principal tienen los Word Embeddings frente a TF-IDF?. Son representaciones dispersas. Capturan la similitud semántica entre palabras. No consideran el contexto de las palabras. No necesitan entrenamiento previo.

¿Qué técnica predice el contexto de una palabra en el corpus?. CBOW. Skip-gram. LSA. GloVe.

¿Qué técnica se utiliza para entrenar Word2Vec en corpus pequeños?. CBOW. Skip-gram. TF-IDF. Bag of Words.

¿Qué técnica de embeddings es adecuada para palabras poco frecuentes?. Word2Vec. GloVe. FastText. Skip-gram.

¿Qué desventaja tienen los Word Embeddings?. Son demasiado precisos en corpus grandes. No capturan similitudes semánticas. Están sesgados por el corpus de entrenamiento. Requieren un vocabulario limitado.

¿Qué algoritmo es un clasificador probabilístico lineal?. Random Forest. Support Vector Machines. Naive Bayes. Latent Dirichlet Allocation.

¿Qué técnica modela relaciones no lineales y lineales?. Naive Bayes. Regresión Logística. Support Vector Machines. Random Forests.

¿Qué modelo genera múltiples árboles y combina sus resultados?. Random Forest. Latent Dirichlet Allocation. Support Vector Machines. GloVe.

¿Qué tipo de red neuronal detecta patrones locales en texto?. RNN. CNN. LSTM. Latent Dirichlet Allocation.

¿Qué ventaja tiene una RNN sobre una CNN en NLP?. Detecta patrones locales. Maneja dependencias a largo plazo. Reduce la dimensionalidad del texto. Procesa datos no estructurados.

¿Qué introduce LSTM en las RNN para mejorar la memoria?. Capas convolucionales. Puertas de entrada y salida. Modelado de temas. Vectorización de contexto.

¿Qué uso tienen las LSTM en NLP?. Clasificación de imágenes. Traducción automática. Predicción de temas. Limpieza de datos.

¿Qué red neuronal utiliza puertas de olvido y salida?. CNN. RNN. LSTM. Naive Bayes.

¿Qué mecanismo introducen los Transformers para procesar secuencias?. Capas convolucionales. Atención. Puertas de olvido. Vectorización One-hot.

¿Qué ventaja principal tienen los Transformers frente a las RNN?. Capturan relaciones locales. Procesan palabras simultáneamente. Usan menos datos de entrenamiento. No necesitan preprocesamiento de texto.

¿Qué modelo se basa en el objetivo de predecir palabras enmascaradas?. GPT. BERT. Word2Vec. GloVe.

¿Qué modelo es un Transformer multilingüe?. GPT. mBERT. Word2Vec. FastText.

¿Qué representa "Self-Attention" en un Transformer?. Procesar palabras secuencialmente. Capturar relaciones entre todas las palabras en una secuencia. Reducir la dimensionalidad del texto. Entrenar vectores dispersos.

¿Qué asegura el mecanismo de atención en traducción automática?. Captura de dependencias locales. Priorización de palabras relevantes en cada paso. Reducción del tiempo de cómputo. Limpieza de datos antes del entrenamiento.

¿Qué es el Fine-Tuning en Transfer Learning?. Ajustar pesos del modelo preentrenado para tareas específicas. Entrenar un modelo desde cero con nuevos datos. Dividir datos en conjuntos de entrenamiento y validación. Preprocesar datos textuales antes del entrenamiento.

¿Qué hace la tokenización basada en subpalabras?. Divide el texto en caracteres individuales. Usa palabras completas como tokens. Combina caracteres y palabras en subunidades. Predice palabras del contexto.

¿Qué es una serie temporal?. Datos organizados por categorías. Una variable medida en distintos instantes de tiempo. Un conjunto de datos estáticos. Un algoritmo para predicción de valores.

¿Cuál de los siguientes es un componente de una serie temporal?. Varianza. Aleatoriedad. Regresión logística. Causalidad.

¿Qué define la componente estacional de una serie temporal?. Cambios a largo plazo en los datos. Movimientos repetitivos en periodos cortos-medios. Variaciones no explicadas. Tendencia decreciente en los datos.

¿Qué diferencia a la componente cíclica de la estacional?. Es más aleatoria. Ocurre en periodos largos. Se presenta solo en datos estáticos. Es específica de series estacionarias.

¿Qué componente de una serie temporal no sigue un patrón predecible?. Tendencia. Aleatoria. Estacional. Cíclica.

¿Qué representa un modelo aditivo en series temporales?. La suma de las componentes. La multiplicación de las componentes. La eliminación de tendencia. La combinación de métodos estadísticos y machine learning.

¿Qué caracteriza a un modelo multiplicativo en series temporales?. La combinación de series estacionarias y no estacionarias. La multiplicación de las componentes. La eliminación de estacionalidad. La reducción de dimensionalidad.

¿Qué es una serie estacionaria?. Una serie sin componentes aleatorias. Una serie independiente del tiempo. Una serie con alta correlación entre los datos. Una serie con alta estacionalidad.

¿Qué técnica se utiliza para verificar si una serie es estacionaria?. Media móvil. Test Dickey-Fuller. Regresión logística. Clustering.

¿Qué indica un p-value > 0.05 en el Test Dickey-Fuller?. La serie es estacionaria. La serie no es estacionaria. La serie tiene tendencia. La serie presenta ruido.

¿Qué suposición hacen los modelos estadísticos clásicos?. Los datos son independientes y no correlacionados. Los datos presentan alta dimensionalidad. Los datos contienen múltiples etiquetas. Los datos son generados por redes neuronales.

¿Qué modelo utiliza medias ponderadas para predicciones?. Media móvil. Suavizado exponencial. ARIMA. Regresión logística.

¿Qué representa el parámetro 𝑑 d en un modelo ARIMA?. Número de diferencias necesarias para estacionarizar la serie. Número de observaciones en el modelo. Tamaño de la ventana para media móvil. Número de ciclos en la serie.

¿Qué modelo estadístico permite detectar patrones complejos?. Media móvil. Holt-Winters. ARIMA. Regresión logística.

¿Qué tipo de problema aborda una regresión en series temporales?. Predicción de categorías. Predicción de valores numéricos. Clasificación supervisada. Agrupación de datos similares.

¿Qué enfoque utiliza valores previos como entrada para predicciones?. Clustering. Regresión supervisada. Generación de centroides. Detección de anomalías..

¿Qué característica tienen las redes RNN?. Procesan secuencias considerando iteraciones previas. Detectan patrones locales en imágenes. Generan gráficos estáticos para análisis. Operan únicamente con datos categóricos.

¿Qué tipo de RNN maneja dependencias a largo plazo?. Redes convolucionales. Redes recurrentes básicas. LSTM. Redes de clustering.

¿Qué objetivo tiene la compuerta Forget en una LSTM?. Eliminar información irrelevante. Almacenar nuevos datos. Actualizar valores en la celda de estado. Generar datos sintéticos.

¿Qué tarea realiza una red LSTM con series temporales?. Clasificación de imágenes. Predicción de valores futuros. Agrupación de series estacionarias. Generación de nuevas etiquetas.

¿Qué modelo combina aprendizaje profundo y clustering en series temporales?. Variational Autoencoders. ARIMA. Holt-Winters. Bag of Words.

¿Qué herramienta agrupa series temporales similares?. tslearn. Dickey-Fuller. RNN básica. Media móvil.

¿Qué define un centroide en clustering de series temporales?. Un valor atípico dentro del grupo. La representación promedio del grupo. La distancia mínima entre series. Una celda de memoria en LSTM.

¿Qué define una anomalía en series temporales?. Un valor promedio. Un valor que se aleja de la normalidad. Una predicción errónea. Una serie estacionaria.

¿Qué técnica se utiliza para detectar anomalías?. Autoencoders. Regresión logística. N-grams. TF-IDF.

¿Qué objetivo tiene el suavizado en series temporales?. Eliminar valores futuros. Reducir el ruido en los datos. Incrementar la varianza. Transformar la serie en categórica.

¿Qué método combina memoria a corto y largo plazo en predicciones?. Holt-Winters. LSTM. Media móvil. Regresión supervisada.

¿Qué es una serie no estacionaria?. Una serie con valores promedio constantes. Una serie con tendencia y estacionalidad. Una serie con alta aleatoriedad. Una serie sin correlación entre datos.

¿Qué técnica utiliza ventanas deslizantes para análisis?. Media móvil. Test Dickey-Fuller. Clustering. Variational Autoencoders.

¿Qué tipo de problema aborda un modelo Holt-Winters?. Clasificación binaria. Suavizado y predicción en series temporales. Generación de datos sintéticos. Reducción de dimensionalidad.

¿Qué problema puede surgir al utilizar un modelo multiplicativo en series temporales?. El modelo no puede manejar series estacionarias. Los valores cercanos a cero generan problemas en la predicción. No es capaz de descomponer la estacionalidad y la tendencia. Requiere un dataset con muchos valores atípicos.

En un modelo ARIMA, si la serie temporal tiene una tendencia significativa, ¿qué parámetro es crítico para su ajuste?. p, para capturar la autocorrelación. 𝑞 q, para ajustar la ventana de media móvil. d, para diferenciar la serie y eliminar la tendencia. Ninguno, la tendencia no afecta el modelo.

¿Cuál es la desventaja principal de aplicar Autoencoders en la detección de anomalías en series temporales?. Requieren un gran número de etiquetas para entrenar. No son capaces de manejar datos con alta estacionalidad. Pueden aprender a reconstruir valores anómalos si no están correctamente etiquetados. No funcionan con series no estacionarias.

¿Cómo afecta un stride mayor a la sensibilidad de una RNN al analizar series temporales?. Mejora la captura de patrones locales en secuencias cortas. Reduce la capacidad de detectar dependencias a largo plazo. Incrementa la precisión al procesar series estacionarias. Facilita el entrenamiento en conjuntos de datos pequeños.

¿Qué sucede si un modelo LSTM tiene una celda de estado con alta capacidad de memoria pero datos insuficientes?. Puede sufrir underfitting al no aprovechar la memoria. El modelo producirá errores debido al gradiente desvanecido. Las predicciones serán inconsistentes debido al overfitting. No será capaz de realizar predicciones en tiempo real.

¿Qué busca maximizar el agente en el aprendizaje por refuerzo?. La cantidad de estados visitados. La señal de recompensa acumulada. La probabilidad de transición. La complejidad computacional.

¿Qué representa la política ( 𝜋 π) en RL?. El conjunto de todos los estados posibles. La probabilidad de tomar una acción en un estado dado. La señal de recompensa inmediata. El modelo del entorno.

¿Qué es un Proceso de Decisión de Markov (MDP)?. Un método supervisado para clasificación. Una representación probabilística de estados y transiciones en el tiempo. Un modelo determinista basado en reglas. Una función objetivo para redes neuronales.

¿Qué diferencia a las tareas episódicas de las tareas continuas?. Las episódicas tienen un estado terminal definido, las continuas no. Las continuas tienen recompensas negativas. Las episódicas no dependen del entorno. Las continuas tienen políticas deterministas.

¿Qué se maximiza en la ecuación de Bellman?. La recompensa inmediata. El valor esperado acumulado desde un estado dado. La probabilidad de transición entre estados. La complejidad de la política.

¿Qué suposición hace el método de Programación Dinámica en RL?. Que las dinámicas del entorno son desconocidas. Que las probabilidades de transición son conocidas. Que el agente opera en un entorno continuo. Que la política es fija durante el aprendizaje.

¿Qué ventaja tiene el método de MonteCarlo sobre la Programación Dinámica?. Puede operar en entornos con dinámicas desconocidas. Es más rápido en todos los casos. No requiere simulaciones de episodios. No necesita recompensas acumuladas.

¿Qué caracteriza al método de Temporal Difference (TD)?. Solo se usa en tareas continuas. Puede estimar valores antes de que el episodio termine. Necesita recompensas acumuladas en cada episodio. Es más lento que MonteCarlo.

¿Qué hace el algoritmo SARSA (On-Policy)?. Actualiza la función acción-valor siguiendo la política actual. Utiliza acciones óptimas de políticas futuras. Combina aprendizaje supervisado con RL. Solo funciona en tareas continuas.

¿Qué ventaja tiene Q-Learning (Off-Policy) sobre SARSA?. Considera la mejor acción posible en lugar de la política actual. Es más rápido en todos los entornos. No requiere un modelo del entorno. Maximiza la recompensa inmediata en cada paso.

¿Qué indica el factor de descuento ( 𝛾 γ) en RL?. La probabilidad de transición. El peso relativo entre recompensas inmediatas y futuras. La tasa de aprendizaje del agente.. La duración máxima del episodio.

¿Qué mide la función de valor ( 𝑉 ( 𝑠 ) V(s))?. La recompensa inmediata en un estado. El valor promedio esperado desde un estado. La probabilidad de una acción dada una política. El retorno acumulado de un episodio completo.

¿Qué representa el retorno en un episodio?. La suma de las recompensas ponderadas a lo largo del episodio. El número de acciones realizadas por el agente. La señal de recompensa inmediata en cada paso. El valor promedio esperado de todos los estados.

¿Qué ofrece OpenAI Gym para el aprendizaje por refuerzo?. Redes preentrenadas para clasificación. Entornos estandarizados para simular episodios. Modelos deterministas para tareas supervisadas. Herramientas para clustering no supervisado.

¿Qué define el espacio de observación en OpenAI Gym?. Las acciones posibles que puede tomar el agente. El estado actual que el agente puede percibir. La señal de recompensa acumulada. El número máximo de episodios permitidos.

¿Qué es un episodio en RL?. Una acción individual tomada por el agente. Una serie completa de pasos hasta un estado terminal. El tiempo necesario para alcanzar la recompensa máxima. La suma de las políticas estocásticas.

¿Cómo difieren las políticas deterministas de las estocásticas?. Las deterministas eligen siempre la misma acción para un estado dado. Las estocásticas no consideran las probabilidades de transición. Las deterministas funcionan solo en entornos continuos. Las estocásticas requieren recompensas inmediatas.

¿Qué representa un grafo en un MDP?. Los estados como nodos y las transiciones como aristas. La recompensa acumulada para cada política. Las probabilidades de cada política en un episodio. Las acciones como nodos y las recompensas como aristas.

¿Qué es una política óptima ( 𝜋 ∗ π ∗ )?. La que maximiza el retorno acumulado en promedio. La que sigue las probabilidades de transición actuales.. La que minimiza las recompensas negativas. La que termina el episodio en el menor tiempo posible.

¿Qué ventaja tiene TD frente a MonteCarlo?. No requiere esperar al final del episodio para actualizar valores. Es más preciso en entornos deterministas. Funciona mejor en tareas continuas. Utiliza políticas aleatorias durante todo el entrenamiento.

¿Qué tipo de entorno se adapta mejor a Q-Learning?. Determinista y discreto. Continuo con recompensas negativas. No estacionario y estocástico. Supervisado con múltiples etiquetas.

¿Qué tipo de entorno es ideal para aplicar SARSA?. Donde las recompensas futuras son inciertas. Donde las políticas deben ser estrictamente seguidas. Donde se necesitan múltiples simulaciones. Donde las recompensas inmediatas son irrelevantes.

¿Qué impacto tiene un factor de descuento ( 𝛾 γ) cercano a 0?. Favorece recompensas inmediatas sobre futuras. Da mayor peso a las recompensas acumuladas. Reduce la precisión del modelo. Favorece políticas estocásticas.

Denunciar Test