Distribució khi quadrat - Viquipèdia, l'enciclopèdia lliure
De la Viquipèdia, l'enciclopèdia lliure
Funció de densitat de probabilitat ![]() | |
Funció de distribució de probabilitat ![]() | |
Tipus | família exponencial, Distribució khi quadrat no central, distribució gamma, generalized chi-squared distribution (en) ![]() ![]() |
---|---|
Notació | |
Paràmetres | |
Suport | ![]() |
fdp | |
FD | |
Esperança matemàtica | |
Mediana | |
Moda | |
Variància | |
Coeficient de simetria | |
Curtosi | ![]() |
Entropia | |
FGM | ![]() |
FC | ![]() |
EOM | Chi-squared_distribution ![]() |
Mathworld | Chi-SquaredDistribution ![]() |
En Teoria de la probabilitat i Estadística la distribució distribució khi quadrat (pronunciat [xi] o [ci]), també anomenada khi quadrat de Pearson, amb
de llibertat és la distribució de la suma dels quadrats de
variables aleatòries normals estàndard independents. És un cas particular de la distribució gamma i es pot estendre a un nombre no enter de graus de llibertat. És molt important en Estadística ja que intervé en nombrosos tests estadístics, com el de la
de Student o de la
de Pearson, així com en la construcció de diversos intervals de confiança.
La referència bàsica d'aquest article és Johnson et al.[1].
Definició, funció de densitat i funció de distribució
[modifica]
Siguin variables aleatòries independents, totes amb distribució normal estàndard
. La variable aleatòria
es diu que té una distribució
amb
graus de llibertat i s'escriu
o
.
La funció de densitat és
on
és la funció gamma. Per tant, tenim que la distribució coincideix amb una distribució gamma amb paràmetre de forma
i paràmetre d'escala 2,
.
Prova
Comencem pel cas . Sigui
, amb
. La funció de distribució de
,
valdrà:
on és la funció de distribució de
.
Derivant obtenim la funció de densitat de ,
: per a
,
Per tant, identifiquem que
té una distribució gamma amb paràmetre de forma 1/2 i paràmetre d'escala 2:
.
Anem ara al cas general: podem escriure on
són independents i
. Llavors, pel caràcter reproductiu de les distribucions gamma,
, i, per tant, tindrà la densitat que hem indicat abans.
La funció de distribució es pot escriure en termes de la funció gamma incompleta: on
és la funció gamma incompleta inferior.
Extensió a graus de llibertat no enters
[modifica]
La funció està ben definida i és una funció de densitat per a qualsevol
: en efecte, fixat qualsevol nombre real
, tenim que
i
. Aleshores, una variable aleatòria amb aquesta densitat es diu que té una distribució
amb
graus de llibertat. Alternativament, la distribució
està definida per a qualsevol
. A partir d'ara, suposarem que
. i especificarem quan suposem que
és un nombre natural.
Moments, funció generatriu de moments i funció característica
[modifica]
Aquestes propietats es dedueixen particularitzant les corresponents propietats de la distribució gamma. Si aleshores té moments de tots els ordres, que valen
Utilitzant la funció Gamma es pot escriure
En particular,
d'on
Així,
Si és una variable aleatòria positiva,
, aleshores per a qualsevol
podem calcular
però pot donar
. Quan dona finit, llavors es diu que la variable
té moment d'ordre negatiu
.[2]
Sigui . Llavors, si
,
té moment d'ordre negatiu
i val [2]
Per exemple, si
, llavors
té moment negatiu d'ordre -1 i val
Aquesta propietat s'utilitza per a calcular els moments de distribucions de quocients (o ratios) de variables aleatòries independents quan al denominador hi ha una distribució khi quadrat, com en el cas d'una distribució
de Student o una distribució
.
La funció generatriu de moments és
La funció característica és
Del caràcter reproductiu de les distribucions gamma es dedueix el de les distribucions : Siguin
independents, amb distribucions
,
. Llavors,
- Propietat.:[3] Siguin
i
. Suposem que
és independent de
. Aleshores
.
- Propietat.:[3] Siguin
Aproximació per la distribució normal
[modifica]
En aquesta secció considerarem la distribució amb un nombre enter de graus de llibertat. D'acord amb el teorema central del límit, si
, aleshores
En altres paraules, per a
gran,
és aproximadament normal
.
Però aquesta aproximació demana força gran. La següent aproximació, deguda a Fisher,[4] és més ràpida
Equivalentment, per a
gran,
és aproximadament normal
.
Segons Johnson et al[5] encara és més ràpida l'aproximació deguda a Wilson and Hilferty:[6] per a gran,
és aproximadament normal
La distribució χ² i les mostres de poblacions normals
[modifica]
El següent resultat té una importància fonamental en la inferència estadística basada en mostres de poblacions normals.
A partir d'aquest teorema i del fet que , tenim que la variable aleatòria (estadístic)
té una distribució
de Sudent amb
graus de llibertat:
, on
és la variància mostral.
Prova
Aquesta demostració està extreta de DeGroot.[8]
Pas previ: reducció a una mostra d'una població normal estàndard. Siguin
que son variables independents amb distribució
.
Tenim que
Llavors,
Per tant,
Així, n'hi ha prou amb demostrar que si
són independents, totes amb llei
, aleshores
- Les variables aleatòries
i
són independents.
Per demostrar aquestes propietats utilitzarem l'anomenada matriu de Helmert de dimensió :[9]
que és una matriu ortogonal, és a dir,
on
denota la matriu transposada de
. Aquesta matriu té la següent propietat: sigui
(escriurem tots els vectors en columna) i
Aleshores, tenim que
En efecte, d'una banda,
D'altra banda, desenvolupant els quadrats de l'esquerra de (1) s'obté
El costat de la dreta de (1) és
amb la qual cosa queda provada la igualtat (1).
Ara considerem el vector normal multidimensional , i sigui
donat per
Per les propietats dels vectors normals multidimensionals, del fet que
són independents, totes amb llei
i que
és ortogonal, es dedueix que
són independents, totes amb llei
. Llavors,
La independència entre
i
es dedueix de les relacions
i de què i
són independents.
Relació amb altres distribucions
[modifica]
on
és una variable aleatòria amb una distribució de Poisson de paràmetre
.
Prova
Escrivim . Llavors,
Ara integrem per parts iteradament, començant per
i
.
Noteu que aquesta propietat és equivalent a la que es formula a la pàgina de la distribució de Poisson: Si és una variable amb distribució de Poisson de paràmetre
, aleshores [11] per a
,
on .
La distribució khi quadrat té moltes aplicacions en inferència estadística, per exemple en el test khi quadrat i en l'estimació de variàncies. També està involucrada en el problema d'estimar la mitjana d'una població normalment distribuïda i en el problema d'estimar el pendent d'una recta de regressió lineal, a través del seu paper en la distribució t de Student, i participa en tots els problemes d'anàlisi de variància, pel seu paper en la distribució F de Snedecor, que és la distribució del quocient de dues variables aleatòries de distribució khi-quadrat i independents. També té ús al contrast de poblacions amb els contrasts d'homogeneïtat i al d'independència.
- ↑ Johnson, Kotz i Balakrishnan, 1994, Chapter 18.
- ↑ 2,0 2,1 David, H. A. «Moments of Negative Order and Ratio-Statistics». Journal of the Royal Statistical Society. Series B (Methodological), 17, 1, 1955, pàg. 122–123. ISSN: 0035-9246.
- ↑ Seber, G. A. F.. Linear regression analysis. 2a edició. Hoboken, N.J.: Wiley-Interscience, 2003, p. 13. ISBN 0-471-41540-5.
- ↑ Fisher, Ronald A. Stastistical Methods for Social Workers. Edimburg: Oliver & Boyd, 1925, p. 63.
- ↑ Johnson, Kotz i Balakrishnan, 1994, p. 426.
- ↑ Wilson, Edwin B.; Hilferty, Margaret M. «The Distribution of Chi-Square» (en anglès). Proceedings of the National Academy of Sciences, 17, 12, 12-1931, pàg. 684–688. DOI: 10.1073/pnas.17.12.684. ISSN: 0027-8424. PMC: PMC1076144. PMID: 16577411.
- ↑ Williams, D. Weighing the odds : a course in probability and statistics. Cambridge: Cambridge University Press, 2001, p. 164. ISBN 0-521-80356-X.
- ↑ DeGroot, Morris H. Probabilidad y estadística. 2a. ed. Wilmington, Delawere, E.U.A.: Addison-Wesley Iberoamericaca, 1988, p. 373-374. ISBN 0-201-64405-3.
- ↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 149. ISBN 978-0-470-22678-0.
- ↑ Johnson, Kotz i Balakrishnan, 1994, p. 450.
- ↑ Johnson, Norman Lloyd. Univariate discrete distributions.. 2nd ed.. Nova York: Wiley, 1992, p. 162, formula (4.38). ISBN 0-471-54897-9.
- Johnson, N. L.; Kotz, S.; Balakrishnan, N. Continuous Univariate Distributions (en anglès). 1 1. 2a edició. Nova York: Wiley, 1994. ISBN 0-471-58495-9.