Distribució predictiva posterior

Infotaula distribució de probabilitatDistribució predictiva posterior
Tipusdistribució de probabilitat Modifica el valor a Wikidata

En l'estadística bayesiana, la distribució predictiva posterior és la distribució de possibles valors no observats condicionats als valors observats.[1][2]

Donat un conjunt de N iid observacions X = { x 1 , , x N } {\displaystyle \mathbf {X} =\{x_{1},\dots ,x_{N}\}} , un nou valor x ~ {\displaystyle {\tilde {x}}} s'extreurà d'una distribució que depèn d'un paràmetre θ Θ {\displaystyle \theta \in \Theta } , on Θ {\displaystyle \Theta } és l'espai dels paràmetres.[3]

p ( x ~ | θ ) {\displaystyle p({\tilde {x}}|\theta )}

Pot semblar temptador connectar una única millor estimació θ ^ {\displaystyle {\hat {\theta }}} per θ {\displaystyle \theta } , però això ignora la incertesa sobre θ {\displaystyle \theta } , i com que s'ignora una font d'incertesa, la distribució predictiva serà massa estreta. Dit d'una altra manera, prediccions de valors extrems de x ~ {\displaystyle {\tilde {x}}} tindrà una probabilitat menor que si es té en compte la incertesa dels paràmetres donada per la seva distribució posterior.

Una distribució predictiva posterior explica la incertesa sobre θ {\displaystyle \theta } . La distribució posterior del possible θ {\displaystyle \theta } els valors depèn X {\displaystyle \mathbf {X} } :

p ( θ | X ) {\displaystyle p(\theta |\mathbf {X} )}

I la distribució predictiva posterior de x ~ {\displaystyle {\tilde {x}}} donat X {\displaystyle \mathbf {X} } es calcula marginant la distribució de x ~ {\displaystyle {\tilde {x}}} donat θ {\displaystyle \theta } sobre la distribució posterior de θ {\displaystyle \theta } donat X {\displaystyle \mathbf {X} } :

p ( x ~ | X ) = Θ p ( x ~ | θ ) p ( θ | X ) d θ {\displaystyle p({\tilde {x}}|\mathbf {X} )=\int _{\Theta }p({\tilde {x}}|\theta )\,p(\theta |\mathbf {X} )\operatorname {d} \!\theta }

Perquè explica la incertesa θ {\displaystyle \theta } , la distribució predictiva posterior serà, en general, més àmplia que una distribució predictiva que inclou una única millor estimació per θ {\displaystyle \theta } .

Distribució predictiva anterior vs. posterior [4]

La distribució predictiva prèvia, en un context bayesià, és la distribució d'un punt de dades marginat sobre la seva distribució prèvia. És a dir, si x ~ F ( x ~ | θ ) {\displaystyle {\tilde {x}}\sim F({\tilde {x}}|\theta )} i θ G ( θ | α ) {\displaystyle \theta \sim G(\theta |\alpha )} , aleshores la distribució predictiva prèvia és la corresponent H ( x ~ | α ) {\displaystyle H({\tilde {x}}|\alpha )} , on

p H ( x ~ | α ) = θ p F ( x ~ | θ ) p G ( θ | α ) d θ {\displaystyle p_{H}({\tilde {x}}|\alpha )=\int _{\theta }p_{F}({\tilde {x}}|\theta )\,p_{G}(\theta |\alpha )\operatorname {d} \!\theta }

Això és similar a la distribució predictiva posterior, excepte que la marginació (o equivalentment, expectativa) es pren respecte a la distribució anterior en lloc de la distribució posterior.

Referències

  1. «Posterior Predictive Distribution» (en anglès). SAS. [Consulta: 19 juliol 2014].
  2. Gelman, Andrew. Bayesian Data Analysis (en anglès). Third. Chapman and Hall/CRC, 2013, p. 7. ISBN 978-1-4398-4095-5. 
  3. «Posterior Predictive Distribution» (en anglès). https://people.stat.sc.edu.+[Consulta: 9 juliol 2023].
  4. «What is the difference between posterior and posterior predictive distribution?» (en anglès). https://stats.stackexchange.com.+[Consulta: 9 juliol 2023].