aans (examen)

COMENTARIOS

ESTADÍSTICAS

RÉCORDS

REALIZAR TEST

Título del Test:

aans (examen)

Descripción:
practicar examen

Autor:

Anónimo

OTROS TESTS DEL AUTOR

Fecha de Creación: 2026/07/02

Categoría: Otros

Número Preguntas: 74

Valoración:

(0)

COMPARTE EL TEST

Nuevo Comentario

Comentarios
NO HAY REGISTROS

Temario:

¿Qué representa el término “overfitting”?. Alta precisión en nuevos datos. Alta capacidad de generalización. Error sistemático bajo. Buen rendimiento solo en datos de entrenamiento.

¿Cuál es una limitación de K-Means?. Sólo funciona con textos. Sólo puede trabajar con variables categóricas no ordinales. Requiere especificar el número de clústeres. Nunca encuentra la solución óptima en menos de 100 iteraciones.

¿Cuál de los siguientes algoritmos aprovecha la desigualdad triangular?. Lloyd. MacQueen. Elkan. Soft K-Means.

En el clustering jerárquico, ¿qué se utiliza para representar las relaciones de inclusión entre diferentes grupos?. Gráfico de barras. Diagrama de cajas. Dendrograma. Gráfico de líneas.

¿Cómo se denomina un punto que tiene menos de MinPts dentro de la distancia ϵ pero que está cerca (es vecino) de un punto central?. Punto central. Punto de ruido. Punto aislado. Punto fronterizo.

¿Cuál es el principal objetivo de PCA?. Aumentar el número de variables en un conjunto de datos. Reducir la dimensionalidad manteniendo la mayor cantidad de variabilidad. Clasificar datos categóricos. Eliminar datos redundantes sin considerar la variabilidad.

¿Qué mide la divergencia de Kullback-Leibler (KL) en el contexto de t-SNE?. La distancia euclidiana entre puntos. La distancia manhattan entre puntos. Cuánto diverge una distribución de probabilidad de otra. El número de vecinos más cercanos.

En el método del percentil para la detección de anomalías, ¿cómo se identifican las anomalías?. Como valores que están dentro de un rango percentil específico. Como valores que superan un umbral de desviaciones estándar. Como valores que están por debajo o por encima de un percentil específico. Como puntos con una baja densidad local.

¿Qué tipo de utilidad introduce la idea de que las recompensas futuras valen menos que las recompensas inmediatas?. Utilidad aditiva. Utilidad maximizada. Utilidad descontada. Utilidad lineal.

¿En qué se diferencian fundamentalmente el aprendizaje por refuerzo y el aprendizaje supervisado según el documento?. El aprendizaje por refuerzo utiliza datos etiquetados, el supervisado no. El aprendizaje supervisado interactúa con el entorno, el por refuerzo no. El aprendizaje por refuerzo implica prueba y error guiado por recompensa, el supervisado se enfoca en patrones en datos etiquetados. El aprendizaje supervisado busca patrones ocultos en datos sin etiquetas, el por refuerzo usa datos etiquetados.

En un análisis PCA, el primer componente explica el 60% de la varianza, y el segundo el 25%. ¿Qué porcentaje acumulan ambos componentes juntos?. 85%. 60%. 75%. 95%.

¿Qué tipo de datos suele analizarse con el algoritmo Latent Dirichlet Allocation (LDA)?. Datos numéricos. Datos categóricos. Texto no estructurado. Imágenes.

En DBSCAN, ¿qué parámetro define la distancia máxima para considerar puntos como vecinos?. Silhouette score. Radio de exploración (eps). Número de clústeres. Distancia intra-clúster.

En el agrupamiento jerárquico, ¿cómo se denomina el gráfico que representa la jerarquía de clústeres?. Histograma. Diagrama de barras. Dendrograma. Árbol binario.

¿Cuál es el propósito principal del algoritmo Q-Learning?. Optimizar la red neuronal objetivo. Reducir la complejidad del entorno. Clasificar datos etiquetados para realizar predicciones. Determinar la acción que maximiza la recompensa acumulada a largo plazo en cada estado.

¿Cuál de las siguientes es una aplicación del aprendizaje por refuerzo en la vida real?. Reconocimiento de imágenes. Clasificación de texto. Conducción autónoma. Predicción de series temporales.

¿Qué ventaja importante tiene la detección temprana de anomalías?. Reduce la necesidad de preprocesamiento de datos. Mejora la precisión de los modelos sin eliminar valores atípicos. Ayuda a identificar problemas potenciales antes de que se vuelvan críticos. Elimina la necesidad de algoritmos supervisados.

¿Qué paso en el flujo de trabajo del aprendizaje no supervisado viene inmediatamente después de recolectar los datos?. Interpretación de los resultados. Entrenar el modelo con datos etiquetados. Evaluación de los resultados. Limpieza y preprocesamiento de los datos.

¿Cuál de los siguientes métodos de clustering no necesita predefinir el número de clústeres?. K-means. DBSCAN. Fuzzy C-means. K-medoids.

Analiza el siguiente código para K-means y elige la opción que mejor explica el propósito del parámetro random_state en KMeans(): from sklearn.cluster import KMeans kmeans = KMeans(n_clusters=3, random_state=42) kmeans.fit(X) labels = kmeans.labels_. Controla el tamaño de los clústeres. Determina el número de veces que se ejecuta el algoritmo. Establece una semilla aleatoria para obtener resultados reproducibles. Ajusta la precisión del modelo.

¿Cuál es un uso común de la detección de anomalías?. Segmentación de clientes. Reconocimiento facial. Identificación de fraudes. Clasificación de productos.

¿Qué paso inicial es esencial en PCA?. Escalar las características. Clasificar los datos. Elegir el número de clústeres. Determinar la métrica de distancia.

¿Qué técnica se utiliza para reducir dimensionalidad manteniendo relaciones no lineales?. PCA. t-SNE. DBSCAN. Regresión logística.

¿Cuál es una ventaja del algoritmo DBSCAN frente a K-means?. Requiere escalar los datos. Es más rápido en datasets grandes. Siempre necesita el número de clústeres previamente definido. Identifica clústeres de forma arbitraria.

¿Qué métrica de evaluación mide qué tan compactos son los clústeres?. Distancia de Mahalanobis. Índice de Silhouette. Distancia inter-clúster. Varianza explicada.

¿Cuál de los siguientes componentes no forma parte de un Proceso de Decisión de Markov (MDP)?. Estados (S). Recompensas (R). Política (π). Datos etiquetados.

Analiza el siguiente código de K-means y selecciona la opción que mejor describe el significado de kmeans.labels_: from sklearn.cluster import KMeans kmeans = KMeans(n_clusters=3, random_state=0) kmeans.fit(X) labels = kmeans.labels_. Representa el índice del centroide más cercano a cada muestra. Contiene los valores predichos para cada muestra en el conjunto de datos. Indica la pertenencia de cada muestra al clúster correspondiente. Define el número de clústeres recomendados.

¿Qué significa el factor de descuento (γ) en aprendizaje por refuerzo?. Un valor que refleja la importancia de las recompensas futuras frente a las inmediatas. Una medida de recompensa inmediata para una acción. La probabilidad de transitar entre estados. La tasa a la que se procesan los estados.

Tienes datos sobre ventas de productos con los atributos: precio, cantidad y región. Si aplicas clustering, ¿qué resultado podrías esperar?. Grupos de productos con patrones de compra similares. Etiquetas de productos. Una reducción de dimensiones a 2. Predicciones sobre ventas futuras.

Tienes un conjunto de datos no etiquetados con muchas dimensiones. ¿Qué harías primero?. Aplicar DBSCAN. Usar PCA para reducir dimensiones. Calcular centroides directamente. Entrenar un modelo supervisado.

Un cliente con características atípicas se detecta tras aplicar clustering. ¿Qué técnica podría confirmar que es un outlier?. PCA. t-SNE. DBSCAN. Análisis de Silhouette.

Al aplicar K-means, ¿cómo podrías determinar el número óptimo de clústeres?. Usando la regla de Mahalanobis. Aplicando el método del codo. Usando un dendrograma. Probando aleatoriamente varios valores.

Aplicas t-SNE a un dataset de alta dimensionalidad. ¿Cuál es el resultado esperado?. Reducción a dos o tres dimensiones. Agrupamiento jerárquico. Eliminación de ruido. Etiquetado automático.

En un dendrograma, ¿qué representa la altura de las uniones entre clústeres?. Distancia entre puntos. Número de puntos en el clúster. Nivel de similitud entre clústeres. Cantidad de datos analizados.

En DBSCAN, un punto tiene menos vecinos que el mínimo definido. ¿Cómo se clasifica?. Centroide. Ruido. Punto frontera. Punto de clúster.

Observa el código que sigue para aplicar el método del codo y elige la respuesta correcta sobre el propósito de inertia: from sklearn.cluster import KMeans import matplotlib.pyplot as plt inertia = [] k_values = range(1, 10) for k in k_values: kmeans = KMeans(n_clusters=k, random_state=0).fit(X) inertia.append(kmeans.inertia_) plt.plot(k_values, inertia, '-o') plt.xlabel('Número de Clusters') plt.ylabel('Inercia') plt.show(). Inertia mide la distancia promedio entre cada punto y el centroide del clúster. Inertia mide la suma de las distancias cuadradas entre puntos en cada clúster. Inertia es la distancia promedio entre clústeres. Inertia calcula la varianza total entre puntos.

¿Qué característica define a una política estacionaria en un MDP?. Las decisiones dependen únicamente del estado actual. Las decisiones dependen del tiempo. Las decisiones varían en cada iteración del modelo. Las decisiones dependen del estado actual y futuros.

¿Qué técnica de detección de anomalías es adecuada cuando no se pueden hacer suposiciones sobre la distribución de los datos?. Pruebas paramétricas. Método de percentiles. DBSCAN. Z-Score.

Un algoritmo de clustering divide a los clientes en 5 grupos. Si un grupo tiene un Silhouette score promedio de -0.2, ¿qué indica esto?. El grupo tiene buena cohesión. El grupo está mal definido o solapado con otros. El grupo tiene demasiados puntos. El grupo tiene valores homogéneos.

Revisa el código siguiente que aplica PCA. ¿Cuál es el efecto de cambiar el valor de n_components en PCA() sobre el conjunto de datos X? from sklearn.decomposition import PCA pca = PCA(n_components=3) X_reduced = pca.fit_transform(X). Cambia la cantidad de muestras en el conjunto de datos reducido. Cambia la cantidad de características en el conjunto de datos reducido. Aumenta la varianza en el conjunto de datos. Permite ajustar el número de clusters a formar.

Aplicas DBSCAN a un dataset con puntos distribuidos uniformemente. ¿Qué es más probable que ocurra?. Todos los puntos formarán un único clúster. DBSCAN identificará ruido en la mayoría de los puntos. DBSCAN no podrá ejecutarse sin etiquetas. Se crearán clústeres de tamaño uniforme.

Analiza el siguiente código que entrena un modelo Isolation Forest y elige la opción que describe correctamente el efecto del parámetro contamination: from sklearn.ensemble import IsolationForest clf = IsolationForest(contamination=0.2) y_pred = clf.fit_predict(X). Controla la cantidad de árboles en el bosque. Ajusta la tasa de aprendizaje del modelo. Indica la proporción de valores atípicos esperados en los datos. Determina el número de muestras a analizar en cada iteración.

¿Qué es un clúster en aprendizaje no supervisado?. Un conjunto de datos aleatorios. Un tipo de modelo predictivo. Un grupo de datos con características similares. Un parámetro de entrada.

¿Qué hace el algoritmo K-Means?. Clasifica datos en categorías ya etiquetadas. Agrupa datos similares en K clústeres. Reduce la dimensionalidad de los datos. Asigna etiquetas con aprendizaje supervisado.

¿En qué escenario se recomienda más usar MacQueen que Lloyd?. Datos estáticos. Datos en flujo continuo. Datos con ruido extremo. Datos altamente correlacionados.

¿Cuál es la principal diferencia entre el clustering jerárquico aglomerativo y el divisivo?. El aglomerativo siempre es más rápido que el divisivo. El aglomerativo requiere el número de clústeres previamente establecidos. El divisivo usa técnicas de enlace, mientras que el aglomerativo no. El aglomerativo fusiona los clústeres, mientras que el divisivo los divide.

En el contexto de DBSCAN, ¿para qué se utiliza un KD-Tree?. Acelerar la búsqueda de vecinos. Reducir el número de puntos en el dataset. Mejorar la precisión del clustering. Aumentar el número de clústeres.

¿Cómo se seleccionan las componentes principales en PCA?. Por orden alfabético de los nombres de las variables originales. Por el orden de aparición en el conjunto de datos original. Ordenando los valores propios de mayor a menor y seleccionando los vectores propios correspondientes. Aleatoriamente.

¿Cuál de las siguientes técnicas de reducción de dimensionalidad es más adecuada para datos lineales?. t-SNE. PCA. MDS. IsoMap.

¿Cuál es una desventaja común de los algoritmos de detección de anomalías?. No pueden manejar grandes volúmenes de datos. Requieren siempre datos etiquetados. Pueden generar falsos positivos. No son compatibles con técnicas de clustering.

¿Qué tipo de agente utiliza un modelo interno del entorno para tomar decisiones más informadas?. Agente reactivo simple. Agente basado en objetivos. Agente basado en modelo. Ninguna de las anteriores.

¿Qué es el "Ratio de probabilidad" en el contexto de PPO?. La probabilidad de que una acción sea óptima. El ratio entre la nueva política y la política antigua. La probabilidad de transitar a un nuevo estado. La relación entre la recompensa inmediata y la recompensa futura.

¿Cuál de estos ejemplos representa una anomalía (con sentido funcional/de negocio) frente a otro tipo de outliers (ruido) que pueden provenir de errores en la recolección de datos?. Un sensor de pH que da una medición de 25. Las transacciones de un cliente en un día por ser cantidades muy bajas (<5 euros) pero ser elevadas en número (10k transacciones/día). Un empleado que tiene 237 años y un sueldo de 200 euros. Un cliente que se gasta -1 euros en la compra de un televisor.

¿Qué método de K-Means es más simple de implementar?. Hartigan-Wong. MacQueen. Lloyd. Elkan.

¿Cuál es una desventaja del clustering jerárquico comparado con K-Means para volúmenes de datos elevados?. Requiere definir hiperparámetros. Puede ser computacionalmente más costoso. Requiere el número de clústeres previamente. No proporciona visualización de resultados.

¿Cuál de los siguientes parámetros es clave en DBSCAN?. K. Épsilon (e). Sigma. Alpha.

¿Qué se suele utilizar para calcular la matriz de covarianza en PCA?. Los centroides de los datos. Los datos estandarizados. Los datos en su forma original. Los valores propios de los datos.

¿Qué técnica utiliza el algoritmo de Floyd-Warshall o Dijkstra para calcular el camino más corto entre pares de puntos?. PCA. MDS. t-SNE. Isomap.

¿Qué significa “exploración” en RL?. Repetir las acciones exitosas. Tomar decisiones solo con la política aprendida. Probar nuevas acciones tratando de descubrir mejores recompensas. Minimizar el número de acciones.

¿Por qué es crítico el preprocesamiento de datos?. Para aumentar la varianza. Para generar datos sintéticos. Para detectar patrones más eficientemente. Para evitar el uso de algoritmos supervisados.

¿Qué método se basa exclusivamente en minimizar la inercia para encontrar el número óptimo de clústers?. Método de silueta. Método de Pearson. Método del codo. Regresión logística.

¿Qué función tiene fcmeans en Python?. Ajusta modelos supervisados. Ejecuta regresión logística. Ejecuta clustering difuso. Normaliza conjuntos de datos.

¿Cuándo funciona muy bien el algoritmo K-Means según la comparación con el clustering jerárquico?. Cuando no se conoce el número de clústeres. Cuando existe una estructura jerárquica natural en los datos. Cuando la separación entre los grupos está bien definida y busca minimizar la distancia intra-cluster. Con conjuntos de datos pequeños o medianos.

¿Cuál es el rango de valores posibles para la puntuación silueta?. 2 a 3. -1 a 1. -1 a 0. 0 a infinito.

¿Cuál es el objetivo principal del escalado multidimensional (MDS)?. Maximizar la dimensionalidad de los datos. Mantener las proximidades originales entre conjuntos de datos en un espacio de dimensiones más bajo. Calcular la media de cada característica. Identificar los componentes principales.

¿Qué asumen las pruebas estadísticas paramétricas sobre la distribución de los datos?. Que los datos no tienen una distribución específica. Que los datos siguen una distribución específica. Que los datos están distribuidos de manera uniforme. Que los datos tienen una distribución asimétrica.

¿Cuál de las siguientes es un ejemplo habitual de aplicación del aprendizaje por refuerzo en la vida real mencionada en el documento?. Reconocimiento facial. Clusterización de clientes. Conducción autónoma. Clasificación de correos electrónicos.

¿Cuál es la principal diferencia entre Q-learning y REINFORCE?. Q-learning requiere un modelo del entorno, REINFORCE no. Q-learning aprende directamente una política, REINFORCE aprende el valor de las acciones. Q-learning se enfoca en aprender el valor de las acciones, REINFORCE se centra en aprender directamente una política. Q-learning no utiliza la ecuación de Bellman, REINFORCE sí.

¿Cuál es uno de los objetivos de K-Means?. Minimizar la distancia entre clústeres. Minimizar la distancia de los puntos a su centroide. Maximizar la dispersión. Asignar categorías previamente conocidas.

¿Cuál es una ventaja del aprendizaje no supervisado?. No requiere grandes volúmenes de datos. Puede descubrir relaciones ocultas sin etiquetas. No necesita ningún preprocesamiento. Siempre es más preciso que el supervisado.

¿Cómo se conoce al algoritmo K-Means “base”?. Lloyd. MacQueen. Hartigan-Wong. Elkan.

¿Qué mide el método "complete linkage algorithm"?. La distancia mínima entre dos puntos de diferentes clústeres. La distancia promedio entre todos los pares de puntos de diferentes clústeres. La distancia máxima entre cualquier par de puntos que pertenezcan a diferentes grupos. La distancia entre los centroides de los clústeres.

¿Qué es RLHF (Reinforcement Learning from Human Feedback)?. Un método de clustering para agentes. Un algoritmo de selección de recompensas. Una técnica para mejorar modelos mediante retroalimentación humana. Un sistema de RL para hardware físico.

¿Qué tipo de algoritmo de detección de anomalías utiliza tanto datos etiquetados como no etiquetados?. Algoritmos supervisados. Algoritmos no supervisados. Algoritmos semisupervisados. Algoritmos basados en reglas.

Denunciar Test