Análisis Bayesiano de Datos
|
|
Título del Test:
![]() Análisis Bayesiano de Datos Descripción: Tema 3 - Intro Inferencia Bayesiana |



| Comentarios |
|---|
NO HAY REGISTROS |
|
En un modelo beta-binomial con distribución previa p(θ)=Beta(1,1) observamos 5 éxitos en 8 ensayos. La distribución posterior de θ es igual a: Beta(5,8). Beta(5,3). Beta(6,4). En un modelo Bayesiano, la distribución previa de un parámetro θ es p(θ)=f(B1). Si sabemos que f(⋅) es una distribución conjugada para ese modelo, entonces la distribución posterior de θ, dado un conjunto cualquiera de datos y, se distribuye: Normalmente, es decir, N(μ,σ), para algún valor de μ y σ. Según f(B1) también. Según f(B2), para algún valor de B2. En el modelo Normal-Normal, la media posterior se puede expresar como un estimador de credibilidad: μ∗=(1−k)μ0+kyˉ. ¿Qué ocurre teóricamente si el tamaño de la muestra (n) aumenta hacia el infinito?. El factor de credibilidad k se acerca a 1, por lo que la distribución posterior ignora la información previa y se basa casi por completo en la media de la muestra (MLE). El factor de credibilidad k se acerca a 0, haciendo que la inferencia dependa exclusivamente de la creencia previa μ0. El modelo normal-normal deja de ser conjugado. Si en un modelo Normal-Normal conocemos que la varianza de la distribución previa es muy pequeña (σ0≈0), reflejando una información a priori muy precisa, ¿qué impacto tendrá en la distribución posterior?. La distribución posterior estará dominada casi exclusivamente por los datos empíricos, ignorando la previa. La distribución posterior será aproximadamente igual a la distribución previa, otorgando muy poca influencia a los datos empíricos. La varianza posterior se volverá infinita e impropia. Supón que el objeto samples_phi contiene muestras independientes e idénticamente distribuidas de la distribución posterior de un parámetro ϕ. La instrucción quantile(samples_phi, 0.5) aproxima: El estimador modal posterior de ϕ. La mediana de la distribución posterior de ϕ. El estimador esperado posterior de ϕ. ¿Qué característica teórica define a la Región de Máxima Densidad a Posteriori (HPDR)?. Deja exactamente la misma probabilidad (α/2) en ambas colas de la distribución, asegurando simetría. Es el conjunto más pequeño posible que contiene una probabilidad dada (ej. 95%), y cualquier valor dentro del intervalo tiene mayor densidad de probabilidad que cualquier valor fuera de él. Solo se puede calcular cuando la distribución previa es uniforme (no informativa). ¿Cuál de las siguientes es una desventaja teórica del intervalo CPDR (Central Posterior Density Region) frente al HPDR cuando tratamos con una distribución posterior que es marcadamente asimétrica?. El CPDR es imposible de calcular sin usar métodos avanzados de Monte Carlo (MCMC). El CPDR siempre da como resultado múltiples intervalos separados. En el CPDR, algunos valores incluidos dentro del intervalo pueden ser menos probables a posteriori que otros valores que han quedado fuera de él. Si te piden calcular el "estimador modal" de una distribución posterior, ¿qué concepto matemático debes buscar?. El valor esperado calculando la integral de la distribución. Cualquier valor m que divida la función de distribución acumulada exactamente en 0.5. El valor del parámetro que maximiza la función de densidad posterior (el valor "más probable dados los datos"). La ecuación central que resume el teorema de Bayes para modelos estadísticos es f(θ∣y)∝f(θ)L(y∣θ). ¿Cómo se debe leer y explicar conceptualmente esta fórmula fundamental?. La probabilidad posterior es directamente igual a la probabilidad previa sumada a los datos empíricos. El posterior es proporcional a la previa multiplicada por la verosimilitud (likelihood). La verosimilitud es proporcional a la actualización de la probabilidad total del sistema. La expresión matemática P(X)∝P(Y) se lee: "P(X) es proporcional a P(Y)". "P(X) se distribuye según P(Y)". "P(X) es complementaria a P(Y)". Dentro del teorema de Bayes, el término conocido como "Likelihood" o Verosimilitud, expresado como L(y∣θ), representa teóricamente: La densidad de la distribución empírica marginal de los datos f(y). La densidad de la distribución posterior expresada como función incondicional. La densidad del modelo evaluada en los datos, pero vista estadísticamente como una función del parámetro θ en lugar de los datos y. En el marco clásico del teorema de Bayes, ¿cuál es el gran inconveniente práctico de la inferencia bayesiana que la aproximación de proporcionalidad y el método de Monte Carlo intentan solucionar?. Que requiere siempre de tamaños de muestra infinitos para poder plantear un modelo válido. Que exige calcular múltiples integrales muy complejas o imposibles para obtener la constante de normalización f(y). Que no permite el uso de distribuciones conjugadas cuando hay información previa objetiva. Si nuestro objetivo es estimar la probabilidad oculta de que una moneda trucada caiga de cara, frente a estimar cuántos autobuses hay rodando ahora mismo en una ciudad, estamos abordando dos tipos teóricos de inferencia. ¿A cuáles corresponden, respectivamente?. Inferencia de población infinita (analítica) frente a inferencia de población finita (predictiva). Inferencia marginal frente a inferencia condicional asintótica. Inferencia empírica previa frente a inferencia objetiva posterior. En el modelo Normal-Normal, cuando existe una situación de "ignorancia a priori" absoluta sobre el parámetro de la media, es costumbre estadística asignar una varianza previa infinita (σ0=∞). ¿Qué efecto teórico produce esta elección?. Produce que el modelo no pueda ser resuelto numéricamente porque el factor de credibilidad da error. Crea una distribución previa "impropia" o plana, pero permite obtener un posterior propio que coincide exactamente con los intervalos y estimadores de la estadística clásica. Obliga a la media posterior a acercarse irremediablemente a infinito de forma proporcional al error de la muestra. La distribución predictiva posterior de un modelo Bayesiano representa la función de distribución de probabilidad: De observar nuevos datos, dados los parámetros del modelo y los datos de la muestra de ajuste. De observar los datos de la muestra de ajuste. Posterior de los parámetros del modelo. |




