Le post précédent portait sur 12 distributions de probabilités nommées d’après Irving Burr. Cet article porte sur 12 distributions de probabilités nommées d’après Karl Pearson. Les distributions de Pearson sont mieux connues et incluent certaines distributions très connues.
Les distributions de Burr sont définies par leurs CDF ; Les distributions de Pearson sont définies par leurs PDF.
Équation différentielle de Pearson
Les densités des distributions de Pearson satisfont toutes à la même équation différentielle :
Il s’agit d’une équation différentielle linéaire, et donc les multiples d’une solution sont aussi une solution. Cependant, une densité de probabilité doit s’intégrer à 1, il existe donc une solution de densité de probabilité unique donnée un, c0, c1et c2.
Distributions bien connues
Noter que F(X) = exp(-X²/2) satisfait l’équation différentielle ci-dessus si l’on pose un = 0, c0 = 1, et c1 = c2 = 0. Ceci dit que le distribution normale est une distribution de Pearson.
Si F(X) = Xm exp(-X) alors l’équation différentielle est satisfaite pour un = m, c0 = −1, et c0 = c2 = 0. Cela signifie que le distribution exponentielle et plus généralement les distribution gamma sont des distributions de Pearson.
Vous pouvez également montrer que le Distribution de Cauchy et plus généralement la Étudiant t distribution sont aussi des distributions de Pearson. Ainsi sont les distributions bêta (avec une gamme transformée).
Tableau des distributions de Pearson
Le tableau ci-dessous répertorie toutes les distributions Pearson avec leurs noms traditionnels. L’ordre de la liste est un peu étrange pour des raisons historiques.
Le tableau utilise la notation entre parenthèses d’Iverson : une expression booléenne entre parenthèses représente la fonction qui vaut 1 lorsque la condition est vérifiée et 0 sinon. De cette façon, toutes les densités sont définies sur toute la ligne réelle, bien que certaines d’entre elles ne soient positives que sur un intervalle.
Les densités sont présentées sans constante de normalisation ; la constante de normalisation est ce qu’elle doit être pour que la fonction s’intègre à 1. Les constantes de normalisation peuvent être des fonctions compliquées des paramètres et elles sont donc laissées de côté pour plus de simplicité.
Il y a beaucoup de redondance dans la liste. Toutes les distributions sont soit des cas particuliers, soit des cas limites des distributions I, IV et VI.
Notez que VII est l’étudiant t distribution après avoir introduit un facteur d’échelle.
Des moments
Les distributions de Pearson sont déterminées par leurs premiers moments, à condition qu’ils existent, et ces moments peuvent être dérivés des paramètres de l’équation différentielle de Pearson.
Cela suggère l’appariement des moments comme moyen d’adapter les distributions de Pearson aux données : résolvez les paramètres de distribution qui font correspondre les moments exacts aux moments empiriques. Parfois, cela fonctionne très bien, bien que parfois d’autres approches soient meilleures, selon vos critères de ce qui constitue une bonne correspondance.