Varianza

De testwiki
Saltar a navegación Saltar a la gueta

Plantía:Ficha xenérica En teoría de probabilidá, la varianza o variancia (que suel representase como σ2) d'una variable aleatoria ye una midida de dispersión definida como la esperanza del cuadráu de la esviación de felicidá variable al respective de la so media. O en poques pallabres, ye la media de los residuos al cuadráu.

La so unidá de midida correspuende al cuadráu de la unidá de midida de la variable: por casu, si la variable mide una distancia en metros, la varianza espresar en metros al cuadráu. La varianza tien como valor mínimu 0. La esviación estándar (raigañu cuadráu de la varianza) ye una midida de dispersión alternativa, espresada nes mesmes unidaes que los datos de la variable oxetu d'estudiu.

Hai que tener en cuenta que la varianza puede trate bien influyida polos valores atípicos y nun s'aconseya'l so usu cuando les distribuciones de les variables aleatories tienen coles pesaes. En tales casos encamiéntase l'usu d'otres midíes de dispersión más robustes.

El términu varianza foi acuñáu por Ronald Fisher nun artículu publicáu en xineru de 1919 col títulu The Correlation Between Relatives on the Supposition of Mendelian Inheritance.[1]

Definición

Si tenemos un conxuntu de datos d'una mesma variable, la varianza calcular de la siguiente forma:

σn2=1ni=1n(XiX)2=(1ni=1nXi2)X2=1n2i=1nj>i(XiXj)2

Siendo:

  • Xi: cada datu *

X:media de los datos

  • n: númberu de datos

Variable aleatoria

Aplicando esti conceutu a una variable aleatoria con media μ = Y[X], defínese'l so varianza, Var(X) (tamién representada como σX2 o, a cencielles σ2), como

σX2=Y[(Xμ)2].

Desenvolviendo la definición anterior, llógrase la siguiente definición alternativa (y equivalente):

σX2=Y[(Xμ)2]=Y[(X22Xμ+μ2)]=Y[X2]2μY[X]+μ2=Y[X2]2μ2+μ2=Y[X2]μ2.

Si una distribución nun tien esperanza, como asocede cola de Cauchy, tampoco tien varianza. Esisten otres distribuciones que, entá teniendo esperanza, escarecen de varianza. Un exemplu d'elles ye la de Pareto cuando'l so índiz k satisfai Plantía:Nowrap.

Casu continuu

Si la variable aleatoria X ye continua con función de densidá f(x), entós

σX2=(xμ)2f(x)dx,

onde :μ=xf(x)dx, y les integrales tán definíes sobre'l rangu de X.

Casu discretu

Si la variable aleatoria X ye discreta con pesos x1 ↦ p1, ..., xn ↦ pn y n ye la cantidá total de datos, entós tenemos:

σX2=(i=1npi(xiμ)2)

onde

μ=(i=1npixi) .

Exemplos

Distribución esponencial

La distribución esponencial de parámetru λ ye una distribución continua con soporte nel intervalu [0,∞) y función de densidá

f(x)=λyλx1[0,)(x),

Tien media μ = λ−1. Poro, el so varianza ye:

0f(x)(xμ)2dx=0λyλx(xλ1)2dx=λ2.

Esto ye, σ2 = μ2.

Dadu perfectu

Un dadu de seis cares puede representase como una variable aleatoria discreta que toma, valores del 1 al 6 con probabilidá igual a 1/6. El valor esperáu ye (1+2+3+4+5+6)/6 = 3,5. Poro, el so varianza ye:

i=1616(i3,5)2=16((2,5)2+(1,5)2+(0,5)2+0,52+1,52+2,52)=1617,50=35122,92.

Propiedaes de la varianza

Delles propiedaes de la varianza son:

  • V(X)0
  • V(aX+b)=a2V(X) siendo a y b númberos reales cualesquier. D'esta propiedá deduzse que la varianza d'una constante ye cero, esto ye, V(b)=0
  • V(X+Y)=V(X)+V(Y)+2Cov(X,Y), onde Cov(X,Y) ye la covarianza de X y Y.
  • V(XY)=V(X)+V(Y)2Cov(X,Y), onde Cov(X,Y) ye la covarianza de X y Y.

Varianza muestral

En munches situaciones ye precisu envalorar la varianza d'una población a partir d'una muestra. Si toma una muestra con reemplazu (y1,,yn) de n valores d'ella, d'ente tolos estimadores posibles de la varianza de la población de partida, esisten dos d'usu corriente:

sn2=1ni=1n(yiy)2=(1ni=1nyi2)y2
que la so demostración ye:
sn2=1ni=1n(yiy)2=1ni=1n(yi22yiy+y2)=1ni=1nyi22y1ni=1nyi+y21ni=1n1=1ni=1nyi22y2+y2=(1ni=1nyi2)y2

y :s2=1n1i=1n(yiy)2=i=1nyi2ny2n1

que la so demostración ye:
s2=1n1i=1n(yiy)2=1n1i=1n(yi22yiy+y2)=1n1i=1nyi22yn1i=1nyi+y2n1i=1n1=1n1i=1nyi22ynn11ni=1nyi+y2nn1=1n1i=1nyi22y2nn1+y2nn1=1n1i=1nyi2y2nn1=i=1nyi2ny2n1

Cuando los datos tán arrexuntaos:

sn2=1ni=1nfi(yiy)2=(1ni=1nfiyi2)y2

que la so demostración ye:
sn2=1ni=1nfi(yiy)2=1ni=1nfi(yi22yiy+y2)=1ni=1nfiyi22y1ni=1nfiyi+y21ni=1nfi=1ni=1nfiyi22y2+y2=(1ni=1nfiyi2)y2

y :s2=i=1nfi(yiy)2n1=i=1nfiyi2ny2n1

que la so demostración ye:
s2=i=1nfi(yiy)2n1=1n1i=1nfi(yi22yiy+y2)=1n1i=1nfiyi22yn1i=1nfiyi+y2n1i=1nfi=1n1i=1nfiyi22ynn11ni=1nfiyi+y2nn1=1n1i=1nfiyi22y2nn1+y2nn1=1n1i=1nfiyi2y2nn1=i=1nfiyi2ny2n1

A los dos (cuando ta estremáu por n y cuando lo ta por n-1) denominar varianza muestral. Difieren llixeramente y, pa valores grandes de n, la diferencia ye irrelevante. El primeru tresllada direutamente la varianza de la muestra al de la población y el segundu ye un estimador insesgado de la varianza de la población. Ello ye que

Y[s2]=Y[1n1i=1nYi2nn1Y2]=1n1(Y[Yi2]nY[Y2])=1n1(nY[Y12]nY[Y2])=nn1(Var(Y1)+Y[Y1]2Var(Y)Y[Y]2)=nn1(Var(Y1)+μ21nVar(Y1)μ2)=nn1(n1nVar(Y1))=Var(Y1)=σ2

ente que

Y[sn2]=n1nσ2

Propiedaes de la varianza muestral

De resultes de la igualdá Y(s2)=σ2, s2 ye un estadísticu insesgado de σ2. Amás, si cumplen les condiciones necesaries pa la llei de los grandes númberos, s2 ye un estimador consistente de σ2.

Entá más, cuando les muestres siguen una distribución normal, pol teorema de Cochran, s2 tien la distribución chi-cuadráu:

(n1)s2σ2χn12.


Interpretaciones de la varianza muestral

Dexamos tres fórmules equivalentes pal cálculu de la varianza muestral sn

sn2=1ni=1n(yiy)2=(1ni=1nyi2)y2=1n2i<j(yiyj)2 (Demostración xeométrica en http://www.solin.16mb.com/estadistica_js/MediayDesviacion.htm)

Esta última igualdá tien interés pa interpretar los estimadores s2 y sn2, pos si quier evaluase la esviación d'unos datos o les sos diferencies, puede optase por calcular el permediu de los cuadraos de les diferencies de cada par de datos:

2sn2=(in,jn)(yiyj)2n2. Nótese que'l númberu de sumandos ye n2.

O puede considerase el permediu de los cuadraos de les diferencies de cada par de datos ensin tener en cuenta cada datu consigo mesmu, agora'l númberu de sumandos ye n(n1).

2s2=ij(yiyj)2n(n1)

Ver tamién

Referencies

Plantía:Llistaref

Enllaces esternos

  • [1] Simulación de la varianza d'una variable discreta con R (llinguaxe de programación)
  • [www.solin.16mb.com/estadistica_js/MediayDesviacion.htm] Un triángulu rectángulu.



Plantía:Tradubot

Plantía:Control d'autoridaes

  1. Fisher, R. A. (1919). «The Correlation Between Relatives on the Supposition of Mendelian Inheritance» Transactions of the Royal Society of Edinburgh Vol. 52, 02, pp 399-433.