Distribuição de Dirichlet

Na probabilidade e estatística, a Distribuição de Dirichlet (nome em homenagem à Johann Peter Gustav Lejeune Dirichlet), frequentemente representada por Dir(α), é uma distribuição discreta multivaridada com um parâmetro (vetorial) α não-negativo e real.

Em análises Bayesianas, a distribuição de Dirichlet é usada como a distribuição conjugada da distribuição multinomial, ou seja, se a distribuição a priori é uma distribuição de Dirichlet e a variável observada é uma multinominal, então a distribuição a posteriori será uma distribuição de Dirichlet (com outro parâmetro).

Função de densidade das probabilidades

A função de densidade das probabilidades da distribuição de Dirichlet de ordem K são as seguintes:

f ( x 1 , , x K ; α 1 , , α K ) = 1 B ( α ) i = 1 K x i α i 1 {\displaystyle f(x_{1},\dots ,x_{K};\alpha _{1},\dots ,\alpha _{K})={\frac {1}{\mathrm {B} (\alpha )}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}

Onde x i 0 {\displaystyle x_{i}\geq 0\,} , i = 1 K x i = 1 {\displaystyle \sum _{i=1}^{K}x_{i}=1\,} , e α i > 0 {\displaystyle \alpha _{i}>0\,} .

A normalização constante é a multinomial função beta, que podem ser expressos nos termos da função gama:

B ( α ) = i = 1 K Γ ( α i ) Γ ( i = 1 K α i ) . {\displaystyle \mathrm {B} (\alpha )={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma \left(\sum _{i=1}^{K}\alpha _{i}\right)}}.}

Propriedades

se X = ( X 1 , , X K ) Dir ( α ) {\displaystyle X=(X_{1},\ldots ,X_{K})\sim \operatorname {Dir} (\alpha )} e α 0 = i = 1 K α i {\displaystyle \alpha _{0}=\sum _{i=1}^{K}\alpha _{i}} . então:

E [ X i | α ] = α i α 0 , {\displaystyle \mathrm {E} [X_{i}|\alpha ]={\frac {\alpha _{i}}{\alpha _{0}}},}
V a r [ X i | α ] = α i ( α 0 α i ) α 0 2 ( α 0 + 1 ) = E [ X i | α ] ( 1 E [ X i | α ] ) ( α 0 + 1 ) . {\displaystyle \mathrm {Var} [X_{i}|\alpha ]={\frac {\alpha _{i}(\alpha _{0}-\alpha _{i})}{\alpha _{0}^{2}(\alpha _{0}+1)}}={\frac {\mathrm {E} [X_{i}|\alpha ](1-\mathrm {E} [X_{i}|\alpha ])}{(\alpha _{0}+1)}}.}

De fato, essa é uma das propriedades da distribuição beta:

X i Beta ( α i , α 0 α i ) . {\displaystyle X_{i}\sim \operatorname {Beta} (\alpha _{i},\alpha _{0}-\alpha _{i}).}

Além disso:

C o v [ X i X j | α ] = α i α j α 0 2 ( α 0 + 1 ) . {\displaystyle \mathrm {Cov} [X_{i}X_{j}|\alpha ]={\frac {-\alpha _{i}\alpha _{j}}{\alpha _{0}^{2}(\alpha _{0}+1)}}.}

A maneira de distribuição resulta em um vetor (x1, ..., xK) com:

x i = α i 1 α 0 K , α i > 1. {\displaystyle x_{i}={\frac {\alpha _{i}-1}{\alpha _{0}-K}},\quad \alpha _{i}>1.}

A distribuição de Dirichlet é conjugada como uma distribuição multinomial com a seguinte lógica: se

β | X = ( β 1 , , β K ) | X Mult ( X ) , {\displaystyle \beta |X=(\beta _{1},\ldots ,\beta _{K})|X\sim \operatorname {Mult} (X),}

Onde βi São ocorrências dos números i na amostra de n Pontos na discreta distribuição de {1, ..., K} definida por X, então:

X | β Dir ( α + β ) . {\displaystyle X|\beta \sim \operatorname {Dir} (\alpha +\beta ).}

A relação usada nas estatísticas Bayesiana para descobrir o valor das incógnitas, X, de uma distribuição oculta de probabilidades, dada por n amostras. Intuitivamente, a distribuição prior representada como Dir(α), sendo Dir(α + β) resulta em uma distribuição posterior observadas com o historiograma β.

Neutralidade

(ver artigo principal: Vetor Neutro).

se X = ( X 1 , , X K ) Dir ( α ) {\displaystyle X=(X_{1},\ldots ,X_{K})\sim \operatorname {Dir} (\alpha )} , então o vetor ~ X {\displaystyle X} será neutro[1] se o sentido de X 1 {\displaystyle X_{1}} for independente de X 2 / ( 1 X 1 ) , X 3 / ( 1 X 1 ) , , X K / ( 1 X 1 ) {\displaystyle X_{2}/(1-X_{1}),X_{3}/(1-X_{1}),\ldots ,X_{K}/(1-X_{1})} e similar à X 2 , , X K 1 {\displaystyle X_{2},\ldots ,X_{K-1}} .

Ver também

Notas

  1. Disformização variável,por Luc Devroye

Referências

  1. R. J. Connor and J. E. Mosiman 1969. Concepts of independence for proportions with a generalization of the Dirichlet distibution. Journal of the American Statistical Association, volume 64, pp194--206

Ligações externas

  • (em finlandês)Estudos da Distribuição de Dirichlet
  • (em inglês)Calculando os parâmetros da distribuição de Dirichlet
  • SciencesPo: Pacote do R que contém funcões para simulação dos parâmetros da distribuição de Dirichlet.
Ícone de esboço Este artigo sobre matemática é um esboço. Você pode ajudar a Wikipédia expandindo-o.
  • v
  • d
  • e