Python >> Tutoriel Python >  >> Python Tag >> SciPy

comment interpréter les résultats de scipy.stats.probplot ?

J'ai cherché pendant des heures une réponse à cette question, et cela se trouve dans les commentaires du code Scipy/Statsmodel.

Dans Scipy , commentez sur https://github.com/scipy/scipy/blob/abdab61d65dda1591f9d742230f0d1459fd7c0fa/scipy/stats/morestats.py#L523 dit :

probplot génère un tracé de probabilité, qui ne doit pas être confondu avec un tracé Q-Q ou P-P. Statsmodels a des fonctionnalités plus étendues de ce type, voir statsmodels.api.ProbPlot .

Alors, maintenant, regardons Statsmodels , où le commentaire sur https://github.com/statsmodels/statsmodels/blob/66fc298c51dc323ce8ab8564b07b1b3797108dad/statsmodels/graphics/gofplots.py#L58 indique :

ppplot :Tracé Probabilité-ProbabilitéCompare l'échantillon et les probabilités théoriques (percentiles).

qqplot :Graphique Quantile-QuantileCompare l'échantillon et les quantiles théoriques

probplot :Tracé de probabilitéIdentique à un tracé Q-Q, mais les probabilités sont affichées dans l'échelle de la distribution théorique (axe des x) et l'axe des y contient les quantiles non calibrés des données de l'échantillon.

Ainsi, la différence entre le graphique QQ et le graphique de probabilité, dans ces modules, est liée aux échelles.


La probabilité théorique qu'un événement se produise est une probabilité « attendue » basée sur la connaissance de la situation. C'est le nombre d'issues favorables par rapport au nombre d'issues possibles.

Lorsque vous collectez des données à partir d'observations au cours d'une expérience, vous calculez une probabilité empirique (ou expérimentale).

Exemple :Vous avez lancé une pièce de monnaie et vous avez obtenu face.

Probabilité expérimentale (tête)=1

Probabilité théorique (tête)=0.5

Pour plus de simplicité, consultez le diagramme ci-dessous qui montre la probabilité d'obtenir un montant de facture particulier. les tracés p et q sont affichés.

ppplot :Tracé Probabilité-Probabilité Compare l'échantillon et les probabilités théoriques (percentiles).

qqplot :Graphique Quantile-Quantile Compare l'échantillon et les quantiles théoriques

probplot :Tracé de probabilité Identique à un tracé Q-Q, mais les probabilités sont affichées dans l'échelle de la distribution théorique (axe des x) et l'axe des y contient des quantiles non mis à l'échelle des données de l'échantillon.

La différence entre ppplot, qqplot et probplot est liée aux échelles. Les deux affichent des valeurs d'échantillon et théoriques sur les axes x et y.

Graphiques centilesLes graphiques centiles sont les graphiques les plus simples. Vous tracez simplement les données par rapport à leurs positions de traçage. Les positions de traçage sont affichées sur une échelle linéaire, mais les données peuvent être mises à l'échelle selon les besoins.

Graphiques quantiles Les graphiques quantiles sont similaires aux graphiques de probabilité. Les principales différences sont que les positions de traçage sont converties en quantiles ou scores ZZ basés sur une distribution de probabilité.

La distribution par défaut est la distribution standard-normale. Vous remarquerez que la forme des données est plus droite sur le tracé Q-Q que sur le tracé P-P. Cela est dû à la transformation qui a lieu lors de la conversion des positions de tracé en quantiles d'une distribution.

Lignes les mieux ajustées

L'ajout d'une ligne de meilleur ajustement à un diagramme de probabilité peut fournir un aperçu quant à savoir si un ensemble de données peut ou non être caractérisé par une distribution

Dans les statistiques et les quantiles de probabilité sont des points de coupure divisant la plage d'une distribution de probabilité en intervalles continus avec des probabilités égales, ou divisant les observations dans un échantillon de la même manière. Densité de probabilité d'une distribution normale, avec quartiles indiqués. La zone sous la courbe rouge est la même dans les intervalles (−∞,Q1), (Q1,Q2), (Q2,Q3) et (Q3,+∞).

En statistique, un graphique Q–Q (quantile-quantile) est un graphique de probabilité, qui est une méthode graphique pour comparer deux distributions de probabilité en traçant leurs quantiles l'un par rapport à l'autre.

Si les deux distributions comparées sont similaires, les points du tracé Q–Q se situeront approximativement sur la ligne y =x. Si les distributions sont linéairement liées, les points du tracé Q–Q se situeront approximativement sur une ligne, mais pas nécessairement sur la ligne y =x.

Un graphique Q–Q est utilisé pour comparer les formes des distributions, fournissant une vue graphique de la façon dont les propriétés telles que l'emplacement, l'échelle et l'asymétrie sont similaires ou différentes dans les deux distributions.

Un tracé P – P trace deux fonctions de distribution cumulatives (cdfs) l'une par rapport à l'autre :il s'agit d'un tracé de probabilité pour évaluer à quel point deux ensembles de données concordent, qui trace les deux fonctions de distribution cumulatives l'une par rapport à l'autre. Les tracés P-P sont largement utilisés pour évaluer l'asymétrie d'une distribution.