option
Cuestiones
ayuda
daypo
buscar.php

Aprendizaje no supervisado

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
Aprendizaje no supervisado

Descripción:
Examen ANS VIU

Fecha de Creación: 2025/05/16

Categoría: Informática

Número Preguntas: 22

Valoración:(0)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

El algoritmo EM en aprendizaje semi-supervisado... a. permite calcular el parámetro K que indica el número de clústeres o clases. b. conoce cuáles son las clases existentes y calcula iterativamente la asignación de todos los ejemplos a las diferentes clases. c. conoce cuáles son las clases existentes y calcula iterativamente la asignación de los ejemplos sin etiqueta a las diferentes clases. d.Ninguna de las anteriores es correcta.

En un algoritmo de deep clustering basado en autoencoder, se pretende minimizar: a. El error de reconstrucción y la divergencia KL entre la mixtura de Gaussianas y la distribución aprendida por el autoencoder. b. La divergencia KL entre la mixtura de Gaussianas y la distribución aprendida por el autoencoder. c. El error de reconstrucción y las pérdidas del K-means iterativamente. d. Solo el error de reconstrucción.

Para evitar problemas de representación de valores de probabilidad muy pequeños durante el algoritmo EM, se transforma... a. la suma de probabilidades mediante el uso de la función exponencial. b. el producto de probabilidades en una suma de exponenciales de probabilidades. c. el producto de probabilidades en una suma de logaritmos de probabilidades. d. No se hace ninguna transformación.

En el algoritmo DBSCAN, un punto j es denso alcanzable desde otro i si... a. existe un camino entre i y j a través de puntos nucleares aunque j no lo sea. b. existe un camino entre i y j donde todos los puntos intermedios son puntos nucleares a excepción de i y j. c. existe un camino entre i y j a través de punto nucleares, incluido j. d. Ninguna de las anteriores es correcta.

En el algoritmo Mean Shift, ... a. los ejemplos de cada vecindario se sustituyen por el centro de masas de los datos. b. cada ejemplo es sustituido por el centro de masa de su vecindario. c. cada ejemplo es sustituido por su centro de masas. d. Ninguna de las anteriores.

Las componentes principales son... a. una proyección del conjunto de datos correladas entre sí. b. los casos principales (centroides) del conjunto de datos. c. diferentes proyecciones de los datos mutuamente no correlacionadas. d. Todas las anteriores son correctas.

El algoritmo K-means++ selecciona los centros iniciales... a. aleatoriamente de manera uniforme. b. de manera determinista tomando siempre el ejemplo más lejano con respecto a los centros. c. aleatoriamente de manera no uniforme según la distancia a los centros. d. Ninguna de las anteriores es correcta.

El algoritmo EM es un algoritmo iterativo que... a. maximiza la función de verosimilitud (probabilidad de que un conjunto de datos haya sido generado por una parametrización específica del modelo). b. minimiza la función de verosimilitud (probabilidad de que una parametrización del modelo haya sido aprendida a partir de un conjunto de datos dado). c. maximiza la función de verosimilitud (probabilidad de que una parametrización del modelo haya sido aprendida a partir de un conjunto de datos dado). d. Todas las anteriores son correctas.

En el algoritmo EM para el aprendizaje de una mixtura de Gaussianas, el paso M... a. calcula los parámetros (máximo verosímiles) de mezcla de las componentes dadas unas asignaciones de casos a componentes. b. calcula la probabilidad de que cada componente pertenezca a cada ejemplo. c. calcula la probabilidad de que cada ejemplo pertenezca a cada componente. d.Ninguna de las anteriores es correcta.

La construcción del grafo a partir de la matriz de similitudes basada en KNN... a. asigna un elemento al clúster más popular entre los K vecinos más cercanos. b. traza una arista entre dos nodos A y B si A es uno de los vecinos más cercanos de B y viceversa. c. traza una arista entre dos nodos A y B si A es uno de los vecinos más cercanos de B (o viceversa). d. Ninguna de las anteriores es correcta.

El agrupamiento divisivo se considera más complejo que el aglomerativo porque... a. además de elegir qué clúster se divide, es necesario elegir cómo. b. la elección de una separación en dos mitades requiere el uso de complejas métricas de medición. c. se parte del conjunto completo de ejemplos como clúster único, un caso extremo que no se alcanza con el aglomerativo. d. es necesario establecer cómo se agrupan los clústeres.

El diámetro de un clúster se define como... a. la distancia media entre los elementos del clúster. b. la distancia máxima entre dos elementos cualquiera del clúster. c. el doble de la distancia entre el centro(ide) y el punto más lejano. d. la distancia mínima entre dos elementos cualquiera del clúster.

El algoritmo APRIORI se centra en explotar la intuición de que... a. una transacción sin elementos frecuentes puede ser despreciada. b. un conjunto frecuente está presente en la mayoría de las transacciones. c. un conjunto es frecuente si todos sus subconjuntos también lo son. d. Ninguna de las anteriores es correcta.

En cuanto a los algoritmos basados en reglas de asociación: a. Un valor de lift de 1 indica cierto grado de co-ocurrencia. b. Un valor de lift mayor que 1 indica complementariedad. c. La confianza tiende a 1 a medida que se observa con mayor frecuencia Y cada vez que aparece X. d.Todas las anteriores son correctas.

La mayoría de medidas de evaluación intrínseca usan... a. estimaciones de la distancia intraclúster y la interclúster. b. el conocimiento de los clústeres reales y el resultado del algoritmo de agrupamiento. c. medidas de similitud ya que la distancia no puede ser calculada. d. el conocimiento de los clústeres reales y el resultado del algoritmo de agrupamiento además de estimaciones de la distancia intraclúster y la interclúster.

El algoritmo de ICA: a. Asume que las fuentes que se quiere estimar siguen una distribución gausiana. b. Asume que las fuentes que se quiere estimar son dependientes dado que si no lo fuesen no se podrían estimar. c. a y b son correctas. d. Ninguna de las anteriores es correcta.

La matriz Laplaciana, por sus propiedades matemáticas, al ser descompuesta en valores y vectores propios, da lugar a... a. valores propios que se interpretan como la dominancia (tamaño) del clúster asociado. b. vectores de datos que asignan valores a las instancias de tal manera que es posible separar los clústeres. c. vectores que asignan valores a las variables originales de tal manera que es posible determinar su influencia en la separación de los clústeres. d. Ninguna de las anteriores es correcta.

El algoritmo K-medoids y el algoritmo K-means se diferencian en... a. la manera de elegir los centros iniciales. b. k-medoides utiliza la media de los elementos de cada clúster como centroides. c. k-medoides elige el elemento que minimiza la distancia al resto de elementos del cluster como centroide. d. k-means elige el elemento que minimiza la distancia al resto de elementos del cluster como centroide.

¿Cuál es la particularidad de la distancia de Mahalanobis?. a. Se tiene en cuenta el valor máximo de cada variable en el cómputo de la distancia. b. Se tiene en cuenta el valor medio de cada variable en el cómputo de la distancia. c. Se tiene en cuenta el número de variables en el cómputo de la distancia. d. Se tiene en cuenta la relación entre las diferentes variables en el cómputo de la distancia.

En la búsqueda de agrupamientos, es necesario acudir a técnicas heurísticas porque... a. la búsqueda de los centros iniciales es muy compleja. b. la evaluación de todos los agrupamientos posibles es inabarcable. c. la selección de los centros adecuados requiere de técnicas bien pensadas para optimizar la búsqueda del mejor agrupamiento. d. Todas las anteriores son correctas.

Escribe el pseudocódigo del algoritmo K-means++.

Imaginemos que tienes un conjunto de datos compuesto por información sobre el rendimiento académico de estudiantes en diferentes asignaturas. Cada estudiante está representado por un conjunto de características, como calificaciones en matemáticas, ciencias, idiomas, entre otros. Tu objetivo es agrupar a los estudiantes en diferentes clústeres utilizando métodos de clustering vistos en clase. 1. Considerando el conjunto de datos mencionado anteriormente, ¿qué método de clustering elegirías y por qué? Describe brevemente los pasos que seguirías para aplicar este método y cómo interpretarías los resultados obtenidos. 2. Aemás, se te proporciona una matriz de adyacencia que representa las relaciones entre los estudiantes en función de su participación conjunta en actividades extracurriculares. ¿Cómo podrías combinar esta información utilizando el algoritmo PageRank para mejorar tus resultados de clustering?.

Denunciar Test