En relacion con las ventajas de los clasificadores generativos y ´
discriminativos, indica la afirmacion INCORRECTA : Los generativos son, por lo general, mas fáciles de ajustar Los discriminativos suelen ofrecer mejor precisión que los generativos Los generativos son mas flexibles en preproceso de características Los generativos facilitan el tratamiento de datos perdidos. Indica la afirmación INCORRECTA : Analisis discriminante Gaussiano asume que las densidades condicionales de las clases son Gaussianas independientes, lo
que resulta en discriminantes (log-posteriors) cuadráticas Análisis discriminante lineal asume que las densidades condicionales de las clases son Gaussianas de matriz de covarianzas común, lo que resulta en discriminantes (log-posteriors) lineales LDA coincide con regresión logística (multinomial) en términos
de modelo, pero se diferencia mucho en entrenamiento Todas son correctas. Regresión logística es un modelo de clasificación p(y | x; θ), donde x ∈ RD es un vector de D características, y ∈ {1, . . . , C} es la etiqueta de clase y θ es un vector de parámetros. Indica la respuesta incorrecta. Si C = 2, el modelo es de regresión logística binaria Si C > 2, el modelo es de regresión logística multinomial Si C > 2, el modelo es de regresión logística multiclase Todas son correctas. Sea D = {(xn, yn) : xn ∈ RD, yn ∈ {0, 1}}, un conjunto de muestras no linealmente separables. Se quiere aprender un modelo de clasificación
p(y | x; θ) que las clasifique sin error (perdida 0-1 nula).
Indica la respuesta correcta: Podemos usar regresión logística binaria convencional, esto es,
con p(y = 1 | x) = Ber(y | σ(wt x+b)) No podemos usar regresión logística binaria convencional, pero sí regresión logística binaria con una función de preproceso,
φ(x), que linearice las muestras No podemos usar regresión logística binaria, convencional o no,
pues necesitamos un modelo de clasificación multi-clase No podemos usar regresión logística binaria, convencional o no,
pues es un modelo lineal y necesitamos uno no lineal. Sea el algoritmo Perceptrón (en clasificación binaria) aplicado a una muestra (xn, yn) para actualizar el vector de parametros actual,
wi (supón xn0 = 1 y b=wi0) con factor de aprendizaje ηi = 1.
Si yn = 0 y yˆn=1(wti x> 0) = 1, entonces: wi+1=wi wi+1= wi + xn wi+1 = wi − xn Ninguna de las anteriores. Regresion lineal predice una variable dependiente o respuesta, y ∈ R, a partir de variables independientes, explicativas o regresoras, x ∈ RD. Indica la respuesta incorrecta:
Se asume que el valor esperado de y es función lineal de x Suele asumirse que las variables explicativas incluyen una constante x0 = 1 para representar el modelo de forma compacta En ocasiones, las variables regresoras son funciones no lineales de los datos pero el modelo sigue considerándose lineal Todas son correctas. Los arboles de clasificacion y regresión (CART) particionan el espacio de entrada recursivamente y definen un modelo local en cada región resultante; globalmente, el modelo es un árbol con una hoja por región. Indica la respuesta INCORRECTA. El árbol constituye un conjunto de reglas de decisi ´ on anidadas Los nodos internos definen splits paralelos a los ejes En cada hoja se especifica la salida predicha para toda entrada
dentro de su región asociada Todas son correctas. Un árbol de regresión de J hojas y parámetros θ = {(Rj, wj)} es
f(x; θ) = SUMATORIO Jj=1 wj 1(x ∈ Rj), donde Rj y wj denotan la región y salida asociadas a la hoja j. Indica la respuesta incorrecta Rj se define a partir de las características y umbrales empleados en cada split, en el camino de la raíz a la hoja j Con entradas categóricas, los splits pueden hacerse comparando la característica di con cada uno de sus valores posibles Si el árbol es de clasificación, cada hoja contiene una distribución sobre las etiquetas de clase; no una respuesta media Todas son correctas. El ajuste de un árbol f(x; θ) = SUMATORIO Jj=1 wj 1(x∈ Rj), θ={(Rj, wj)},
requiere minimizar la perdida empírica L(θ) = SUMATORIO Nn=1 ℓ (yn, f(
xn; θ)) =SUMATORIO Jj=1 SUMATORIO xn∈Rj ℓ (yn, wj) Indica la respuesta INCORRECTA. L no es diferenciable pues depende de la estructura del árbol Hallar una estructura optima del árbol es NP-Duro La estructura del árbol se suele aprender con un método voraz
como CART, C4.5 o ID3, que haga crecer el árbol añadiendo un nodo en cada iteración Todas son correctas. Los posibles splits // 4 / 34 ?? ??.
|