Está en la página 1de 5

ESTADSTICA

Tema 1: Estadstica Descriptiva Unidimensional

INTRODUCCIN
Fenmeno determinista: al repetirlo en idnticas condiciones se obtiene el mismo resultado. (Ejemplo: kilmetros recorridos en un intervalo de tiempo a una velocidad determinada) Fenmeno aleatorio: no es posible predecir el resultado. (Ejemplo: resultado al lanzar un dado)

La estadstica se ocupa de aquellos fenmenos no deterministas donde es imposible predecir los resultados. Es una rama de las matemticas que trata de la recopilacin, el anlisis, la interpretacin y la representacin de una gran cantidad de datos numricos.

Tcnicas estadsticas
Estadstica descriptiva Inferencia estadstica

La estadstica descriptiva se ocupa del problema del manejo de ingentes cantidades de datos. Busca, fundamentalmente, el resumen de los mismos, presentndolos de forma ms manejable con el objetivo de facilitar su interpretacin. En pocos valores se refleja la mxima informacin posible. Conceptos: - Poblacin: conjunto objeto de estudio. - Individuo (o unidad): cada uno de los elementos de la poblacin. - Muestra: Subconjunto de la poblacin que se estudia. - Tamao de la poblacin: nmero de individuos de la poblacin (N). - Tamao de la muestra: nmero de individuos de la muestra (n). - Carcter o variable: propiedad que se desea observar sobre los elementos de la poblacin. - Modalidad: cada uno de los posibles valores observables de una caracterstica. Las modalidades han de ser incompatibles y exhaustivas.

Cualitativas
Tipos de variables:

Ordinales Nominales Discretas Continuas

Cuantitativas

Variable cualitativa: Las modalidades de la variable son caractersticas no numricas. (Ejemplo: color de pelo, nivel de estudios) Variable cuantitativa: Las modalidades de la variable son caractersticas numricas. (Ejemplo: ingresos mensuales, edad) - Discreta: El paso de un valor de la variable al siguiente representa un salto. (Ejemplo: nmero de empleados en una empresa) - Continua: Dados dos valores de la variable siempre existen infinitos valores posibles entre ellos dos. (Ejemplo: tiempo que transcurre entre dos averas de una mquina)

Curso 2010-2011

ESTADSTICA

Tema 1: Variables Estadsticas Unidimensionales

TABLAS DE FRECUENCIAS ni
Frecuencia absoluta de la modalidad Mi: nmero de individuos de la poblacin que presentan esta modalidad (nmero de veces que aparece esta modalidad en la poblacin)

fi Frecuencia relativa de la modalidad Mi: proporcin de individuos de la poblacin que presentan esta modalidad. Se obtiene dividiendo la frecuencia absoluta entre el nmero de elementos de la poblacin (N).
En variables cuantitativas u ordinales

Ni Fi

Frecuencia absoluta acumulada de la modalidad Mi: suma de las frecuencias absolutas hasta la i-sima modalidad.

Frecuencia relativa acumulada de la modalidad Mi: suma de las frecuencias relativas hasta la de la i-sima modalidad.

Modalidades M1 M2 Mk Suma ( )

Frecuencias absolutas ni n1 n2 nk N

Frecuencias relativas fi f1 f2 fk 1

Frecuencias absolutas acumuladas Ni N1 N2 Nk=N

Frecuencias relativas acumuladas Fi F1 F2 Fk=1

Cuando las modalidades vienen dadas en intervalos, la tabla de frecuencias se completa con las columnas

(Ii-1, Ii] xi ai

Intervalos.

Marca de clase: punto medio del intervalo (Ii-1, Ii]. Amplitud del intervalo: Lmite superior menos lmite inferior del intervalo.

Densidad de frecuencia: Frecuencia absoluta del intervalo entre la hi amplitud del mismo.

Intervalos (I0, I1] (I1, I2] (Ik-1, Ik] Suma

Marca de clase

xi x1 x2 xk

Amplitud ai a1 a2 ak

Densidad de frecuencia hi h1 h2 ... hk

ni n1 n2 nk N

fi f1 f2 fk 1

Ni N1 N2 Nk=N

Fi F1 F2 Fk=1

Curso 2010-2011

ESTADSTICA

Tema 1: Variables Estadsticas Unidimensionales

REPRESENTACIONES GRFICAS VARIABLES CUALITATIVAS Diagrama de barras Grfico de sectores


Color Color 45 40 35 30 25 20 15 10 5 0 Blanco Azul Rojo Gris Verde Otros Rojo 15% Azul 21% Gris 24% Verde 9% Otros 3% Blanco 28%

VARIABLES CUANTITATIVAS DISCRETAS Grfico o diagrama de barras Polgono de frecuencias


Tallas 100 90 80 70 60 50 40 30 20 10 0 menos de 36 36 38 40 42 44 46 mas de 46 100 90 80 70 60 50 40 30 20 10 0 menos de 36

Tallas

36

38

40

42

44

46

mas de 46

Curva acumulativa o de distribucin

Diagrama de tallo y hojas:


21 43 50 50 37 33 27 21 13 6 1 1 1 0|111112222223333444444 0|5555555667788888888899 1|0233444 1|5555667777789 2|1133 2|556789 3|111224 3|55666789 4|1222333 4|88899 5| 5| 6|4

VARIABLES CUANTITATIVAS CONTINUAS Histograma Histograma acumulado

Curso 2010-2011

ESTADSTICA

Tema 1: Estadstica descriptiva unidimensional

1. MEDIDAS DE POSICIN Medidas de posicin central Media aritmtica: Es la suma, ponderada por sus frecuencias relativas, de los valores de la variable.
Caso discreto

x = xi f i =
i =1

1 N

x i ni
i =1

Caso continuo Sustituimos los intervalos por sus marcas de clase

x = xi f i =
i =1

1 N

x i ni
i =1

Mediana: Valor de la variable que divide a los individuos de la poblacin en dos partes iguales, supuestos ordenados los datos.
Caso discreto
Si existe un valor para el cual Fi=0.5, se toma como valor mediano el punto medio entre xi y xi+1. En caso contrario, la mediana es el primer valor de la variable cuya frecuencia relativa acumulada Fi supere el valor 0.5.

Caso continuo
Si existe algn intervalo para el cual Fi=0.5, la mediana es el extremo superior de ese intervalo. En caso contrario, la mediana es un valor entre los extremos del intervalo para el cual Fi es mayor que 0.5 por primera vez.
Fk=1

F=0.5

Me = I i 1 +

N i 1 ai ni

Me

Moda: Es el valor ms frecuente de la distribucin. (No tiene por qu ser nica)


Caso discreto
La moda es el valor de la variable que corresponde a la mxima frecuencia. En el grfico de barras, es la modalidad a la que corresponde la barra ms alta.

Caso continuo
El intervalo al que pertenece la moda es el que tiene la base del rectngulo ms alto en el histograma

hi

hi-1 hi+1

Mo = I i 1 +

hi hi 1 ai (hi hi 1 ) + (hi hi +1 )

Ii-1 Mo

Ii

Curso 2010-2011

ESTADSTICA

Tema 1: Estadstica descriptiva unidimensional

Medidas de posicin no central


Cuantiles: El cuantil de orden ( es un valor entre 0 y 1) es el valor de la variable que acumula el 100 % de la distribucin. Variable continua: C ( ) = I i 1 +

N N i 1
ni

ai

- Cuartiles (Qi ): Son puntos de la distribucin que la dividen en cuatro partes, cada una de las cuales engloba el 25% de los datos. = 0.25, 0.5, 0.75

25% Q1

25% Q2

25% Q3

25%

- Deciles (Di): Son puntos que dividen a la distribucin en diez partes cada una de las cuales engloba el 10% de los datos. = 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 - Percentiles (Pi): Son puntos que dividen a la distribucin en cien partes, cada una de las cuales engloba el 1% de los datos. = 0.01, 0.02, 0.03, , 0.99

2. MEDIDAS DE DISPERSIN: cuantificamos la variabilidad de forma que sepamos si las medidas de posicin central son o no representativas del conjunto de datos.
Varianza:
2 X = Var ( X ) =

Desviacin tpica:

Coeficiente de variacin:

1 N

( xi x )2 ni =
i =1

1 N

xi2 ni x 2
i =1

X = Var ( X )

CV =

3. MOMENTOS:
1 k ( x i x ) ni n i =1 1 k r - Momento de orden r no centrados (o centrado con respecto al origen): m r = xi ni n i =1 r tr t - Relacin entre momento centrado y no centrado: r = ( 1) t m1 mr t t =0 4. ASIMETRA Y CURTOSIS:
- Momento de orden r centrado con respecto a la media:
r

r =

Coeficiente de asimetra:

1 = 3 3

Si Si Si Si Si Si

1 = 0 1 < 0 1 > 0 2 = 0 2 < 0 2 > 0

distribucin simtrica. distribucin asimtrica a la izquierda. distribucin asimtrica a la derecha distribucin mesocrtica. distribucin platicrtica (aplastada). distribucin leptocrtica (apuntada).

Coeficiente de curtosis:

2 = 4 3 4

Curso 2010-2011

También podría gustarte