Está en la página 1de 37

Probabilidad y Estadística

Ángelo Gárate

Departamento de Matemática
Universidad Técnica Federico Santa María
1-1

Estadística descriptiva - Nociones de


Población y muestra
Definición: Una población es un conjunto que contiene la
totalidad de individuos a ser estudiados por sus características.
Definición: Una muestra es un subconjunto de la población
seleccionada mediante alguna técnica de muestreo
Observación
En general denotaremos la cantidad de individuos de la
población por N y la cantidad de individuos de la muestra
por n.
En general denotaremos a una variable estadística por X ,
Y o Z. Si tenemos una muestra de tamaño n, esta será
denotada por X1 , X2 , . . . , Xn
1-2

Recolección de Datos

Censar: Proceso de recuento de todos los elementos de la


población
Muestrear: Proceso de selección de un subconjunto de la
población
I Muestreo aleatorio simple
I Muestreo aleatorio estratificado
I Muestreo aleatorio de conglomerados
I Muestreo aleatorio sistemático
1-3

Tipos de Variables Estadísticas

Cualitativas: Expresan cualidades, características,


categorías o modalidades
Cuantitativas: Toman como argumento cantitades
numéricas
I Discretas: El conjunto de valores posibles es finito o infinito
numerable.
Ejemplo: X : Número de integrantes de una familia
I Continuas: Son aquellas que toman infinitos valores
Ejemplo: Y : Rentabilidad de un fondo mutuo
1-4

Escala de Variables Estadísticas

Nominal: Las realizaciones de la variable estadística son


categorías que no tienen un orden.
Ejemplo: X : Color de ojos (Café, verde, azul,...)
Ordinal: Las realizaciones de la variable estadística se
pueden ordenar pero no son necesariamente números.
Ejemplo: Y : Calificación de un examen (Reprobado,
Aprobado, Distinción)
Intervalar: El recorrido de la variable estadística es un
subconjunto de R.
Ejemplo: Ingreso mensual de una compañía (miles de pesos)
1-5

Organización de la Información

Consideremos una muestra de tamaño n, obtenida desde alguna


técnica de muestreo. Supongamos que la variable estadística
está definida en k clases denotadas por C1 , C2 , . . . , Ck .

Definición: Se llama frecuencia absoluta de la clase Ci al


número de individuos que pertenece a dicha clase. Lo
denotamos por ni para i = 1, . . . , k.
Observación
Pk
n= i=1 ni
1-6

Definición: Se llama frecuencia relativa de la clase Ci al


número de individuos, sobre el total de la muestra, de la clase
i-ésima. Lo denotamos por fi para i = 1, . . . , k.
Observación
ni
fi = para i = 1, . . . , k
n
Pk
i=1 fi = 1
Las frecuencias definidas tienen sentido en cualquier tipo de
escala.
1-7

Ejemplo
Se registra la información de los grados de Mercalli de 20 sismos
ocurridos en la ciudad de Santiago.
V V I V I V II V IV IV III II III
II II III IV V V V I II I III
Resumen en la siguiente tabla:
Esc. Mercalli ni fi
I 1 1/20
II 4 4/20
III 4 4/20
IV 3 3/20
V 4 4/20
VI 3 3/20
VII 1 1/20
1-8
Supongamos que estamos trabajando en una escala ordinal, es
decir, las clases C1 , . . . , Ck están ordenadas.
Definición: Se llama frecuencia absoluta acumulada hasta la
clase Cj , al número de individuos que pertenecen a las clases
C1 , C2 , . . . , Cj . Lo denotamos por Nj con j = 1, . . . , k.
Observación
Pj
Nj = i=1 ni ; Nk = n

Definición: Se llama frecuencia relativa acumulada hasta la


clase Cj , al número de individuos, sobre el total de la muestra,
que pertenecen a las clases C1 , C2 , . . . , Cj . Lo denotamos por Fj
con j = 1, . . . , k.
Observación
Pj
Fj = i=1 fi ; Fk = 1
1-9

Ejemplo Anterior
Se registra la información de los grados de Mercalli de 20 sismos
ocurridos en la ciudad de Santiago.

Esc. Mercalli ni fi Nj Fj
I 1 1/20 1 1/20
II 4 4/20 5 5/20
III 4 4/20 9 9/20
IV 3 3/20 12 12/20
V 4 4/20 16 16/20
VI 3 3/20 19 19/20
VII 1 1/20 20 20/20=1
1-10

Procedimiento para construir una tabla de


frecuencias
1. Determinar la cantidad de clases o intervalos Ci , con
i = 1, . . . , k.
√ de Sturges: k ≈ 1 + 3, 3log(n)
I Regla
I k≈ n
I min{k} tal que 2k > n
2. Determinar el Rango de los datos.
R = max{Xi }ni=1 − min{Xi }ni=1
3. Determinar la amplitud del intervalo ai .
(ai = a ∀i = 1, . . . , k).
R + 1[Unidad]
a=
k
1-11

4. Determinar los límites. Sean


LIj : Límite inferior de la clase j-ésima
LSj : Límite superior de la clase j-ésima
Entonces se definen

LI1 = min{Xi }ni=1 − 12 [Unidad]


LS1 = LI1 + a
LI2 = LS1
LS2 = LI2 + a
..
.
LSk = LIk + a
1-12

Ejemplo
Supongamos que se desea estudiar las ventas de un producto de
una tienda. Se toman los datos de las ventas realizadas en 36
meses. Los datos son los siguientes:

490 650 1800 1240 1200 600 870 890 630 600
1200 1210 650 470 1070 1200 680 600 870 1020
880 1090 1050 1250 690 1210 810 810 890 1250
1200 1000 1000 630 690 1270

Observación
Una forma de ordenar los datos es usando un diagrama de tallo
y hoja.
1-13

Diagrama de tallo y hoja

Tallo Hoja
4 70 90
6 00 00 00 30 30 50 50 80 90 90
8 10 10 70 70 80 90 90
10 00 00 20 50 70 90
12 00 00 00 00 10 10 40 50 50 70
14
16
18 00
1-14

1. Cantidad de Clases : k = 1 + 3, 3log(36) = 6, 1350 ≈ 6


2. Rango: R = 1800 − 470 = 1330
1330+1
3. Amplitud: a = 6 ≈ 221, 8
4. Limites:
LI1 = 470 − 1/2 = 469, 5 ; LS1 = 469, 5 + 221, 8 = 691, 3
..
.
LS6 = 1800, 3

Observación
Definiremos la marca de clase de la clase i-ésima por:
LIi + LSi
mi =
2
1-15

Ventas mi ni fi Ni Fi
[469,5-691,3) 580,4 12 12/36 12 12/36
[691,3-913,1) 802,2 7 7/36 19 19/36
[913,1-1134,9) 1024 6 6/36 25 25/36
[1134,9-1356,7) 1245,8 10 10/36 35 35/36
[1356,7-1578,5) 1467,6 0 0 35 35/36
[1578,5-1800,3) 1684,4 1 1/36 36 1

Observación
Los datos resumidos en una tabla se conocen como datos
agrupados
1-16

Medidas Descriptivas

Son valores numéricos calculados a partir de una muestra y nos


entregan información contenida en ella. Las medidas
descriptivas que veremos son:
1. Tendencia central
2. Posición
3. Dispersión
4. Forma
1-17

Tendencia Central
Estas medidas nos entregan información para resumir los datos
y además tienden a ubicarse en el centro del conjunto de datos.
Supongamos que tenemos una muestra de tamaño n dada por
X1 , X2 , . . . , Xn .
1. Promedio o media aritmética: El promedio de un conjunto
es el centro de gravedad de dicho conjunto.
Pn
I Datos a granel: X = n1 i=1 Xi
Pk Pk
I Datos tabulados: X = n1 i=1 ni · mi = i=1 fi · mi
Ejemplo:
I Datos a granel: X = 935
I Datos tabulados: X = 912, 961
1-18
2. Mediana: Se define como el valor que ocupa el lugar central
de los datos, después de ser ordenados de menor a mayor.
I Datos a granel:
X( n+1 ) , n impar
(
2
Me(X) = h i
0, 5 · X( n ) + X( n +1) , n par
2 2

donde X(i) es el dato que ocupa la posición i-ésima cuando


están ordenados de menor a mayor.
I Datos tabulados: Primero se debe identificar la clase
mediana, es decir, la clase cuya frecuencia acumulada sea
mayor o igual a la mitad de la cantidad de total de datos.
n

2 − Ne−1
Me(X) = LIe + · ae
ne
Ejemplo:
I Datos a granel: Me(X) = 890
I Datos tabulados: Me(X) = 881, 41 (Clase mediana: C2 )
1-19

3. Moda: Corresponde al valor o clase con la mayor frecuencia


del conjunto de datos. Para calcularlo es necesario
identificar la clase modal, la cual es la que tiene la mayor
frecuencia.

 
ncmo − ncmo−1
Mo(X) = LIcmo + · acmo
2 · ncmo − ncmo−1 − ncmo+1

Ejemplo: Mo(X) = 626, 06 (Clase modal C1 )


1-20

Medias de Posición
Estas medidan están basadas en los cuantiles, los cuales son
medidas de un conjunto de datos que se consideran fracciones
acumuladas del conjunto de observaciones, cuando son
ordenados de menor a mayor.
1. Cuartil (Q): Divide el conjunto de datos en 4 sectores del
25% cada uno.
2. Quintil (K): Divide el conjunto de datos en 5 sectores del
20% cada uno.
3. Decil (D): Divide el conjunto de datos en 10 sectores del
10% cada uno.
4. Percentil (P ): Divide el conjunto de datos en 100 sectores
del 1% cada uno.
1-21

Datos a granel: Pi = X i(n+1)  i = 1, . . . , 100


100
i(n+1)
En el caso de que 100 no sea entero, se considerará como
percentil el promedio de los dos datos mas cercanos a dicha
posición.
Ejemplo:
P25 = Q1 = X 25(36+1)  = X(9,25)=665
100
P75 = Q3 = X 75(36+1)  = X(27,75)=1200
100
1-22

Datos tabulados: Primero se debe identificar la clase


percentil, la cual es la primera cuya frecuencia relativa
acumulada sea mayor o igual a i/100, con i = 1, . . . , 100
n·i

100 − Npi−1
Pi = LIpi + · api
npi

Ejemplo:
P25 = Q1 = 635, 85 (Clase percentil C1 )
P75 = Q3 = 1179, 26 (Clase percentil C4 )
1-23

Medidas de Variabilidad

Son medidas que nos muestran o miden la dispersión, precisión


o riesgo del conjunto de datos.
1. Rango:
I Datos a granel: R = max{Xi }ni=1 − min{Xi }ni=1
I Datos tabulados: R = LSk − LI1
Ejemplo:
I Datos a granel: R = 1330
I Datos tabulados: R = 1330, 8

Observación
Rango intercuartil: RIQ = Q3 − Q1
1-24

2. Desviación media:
Pn
I Datos a granel: DM = n1 i=1 |Xi − X|
I Datos tabulados:
Pk Pk
DM = n1 i=1 ni |mi − X| = i=1 fi |mi − X|
Ejemplo:
I Datos a granel: DM = 242, 5
I Datos tabulados: DM = 264, 781

Observación
También se puede definir la desviación mediana y desviación
modal, basta reemplazar el promedio por la mediana y la moda,
respectivamente.
1-25

3. Varianza:
1
Pn
I Datos a granel: S 2 = n−1 i=1 (Xi − X)
2

I Datos tabulados:
Pk Pk
S 2 = n1 i=1 ni (mi − X)2 = i=1 fi (mi − X)2

Observación
I Se puede probar:
P 2

n
• Datos a granel: S 2 = 1
n−1 i=1 Xi2 + nX
Pk 2
• Datos tabulados: S 2 = i=1 fi · m2i − X
I La raíz cuadrada de la varianza se define como la desviación
estándar .
1-26
4. Coeficiente de Variación: Este índice representa la
variabilidad relativa de una población o muestra. Nos
proporciona información sobre la homogeneidad de la
muestra.
S
CV =
|X|

Observación
I El CV nos permite comparar muestras con distintas
unidades de medidas.
I A mayor CV entonces la muestra es menos homogenea.
I Se puede definir el coeficiente de variación robusta:
RIQ
CV R =
Q1 + Q3
1-27

Medidas de Forma

Indicadores de Simetría: Apuntan a la tendencia que


tienen los datos para concentrarse en ciertos valores.
I Distribución Simétrica: Los datos están concentrados en
los valores centrales de la variable.
I Distribución Asimétrica Positiva: o a la Derecha Los
datos están concentrados en los valores bajos de la variable.
I Distribución Asimétrica Negativa o a la Izquierda:
Los datos están concentrados en los valores altos de la
variable.
1-28

Indicadores de Simetría

Q1 + Q3 − 2Q2
1. Indicador de Yule: Iy =
2Q2
Q1 + Q3 − 2Q2
2. Indicador de Simetría: Is =
RIQ
3(X − M e)
3. Coeficiente de Pearson: As =
S
m3
4. Coeficiente de simetría de Fisher: γ3 = 3
S
donde  P
1 n 3 ; granel
n i=1 (Xi − X)
m3 = P k 3 ; tabulados
i=1 fi (mi − X)
1-29

Se dice que la muestra es simétrica si los estadísticos de


simetría son iguales a cero.
Si el estadístico de simetría es positivo, entonces tenemos
una asimetría positiva o a la derecha en la muestra.
Si el estadístico de simetría es negativo, entonces tenemos
una asimetría negativa o a la izquierda en la muestra.
1-30

Indicadores de Curtosis: Apuntan al grado de


concentración de los datos.
I Mesocúrtica: Variabilidad ideal, se asemeja a una
distribución normal.
I Leptocúrtica: Presenta una gran concentración de los
datos en torno a la media.
I Platicúrtica: Presenta una concentración menor alrededor
a la media.
1-31

Indicadores de Curtosis
D9 − D1
1. Coeficiente K2 : K2 = −1
1, 9RIQ
m4
2. Coeficiente de Fisher: γ4 = 4 − 3
S
donde  P
1 n 4 ; granel
n i=1 (Xi − X)
m4 = P k 4 ; tabulados
i=1 fi (mi − X)

Observación
Si los coeficientes de curtosis son iguales a cero entonces la
variabilidad es mesocurtica.
Si los coeficientes de curtosis son positivos entonces la
variabilidad es leptocurtica.
Si los coeficientes de curtosis son negativos entonces la
variabilidad es platicurtica.
1-32

Ejemplo con datos a granel

Coeficiente de asimetría de Fisher: γ3 = 0, 4962.


Entonces la muestra presenta una asimetría positiva o a la
derecha.
Coeficiente de Fisher: γ4 = 0, 0495
Entonces la muestra presenta una variabilidad mesocúrtica.
1-33

Box-Plot
Es un gráfico que nos permite visualizar la simetría, la
existencia de outliers (datos atípicos), la dispersión con respecto
a la mediana y el rango de los datos. La construcción del gráfico
es la siguiente:
1-34

Box-Plot

El valor del bigote inferior se calcula de la siguiente forma:

BI = max{LI , min{Xi }ni=1 }

donde LI = Q1 − 1, 5 · RIQ.
El valor del bigote superior se calcula de la siguiente forma:

BS = min{LS , max{Xi }ni=1 }

donde LS = Q3 + 1, 5 · RIQ.
1-35

Muestra estratificada
El objetivo de analizar una muestra estratificada es el de
comparar la media y la varianza entre estratos (grupos).
Supongamos que tenemos m estratos y que se ha extraído una
muestra de tamaño n.
Supongamos que la muestra Pm en cada estrato es de ni , con
i = 1, . . . , m, donde n = i=1 ni .
Se define el peso del estrato i por ωi = nni ∀i = 1, . . . , m.
El promedio de cada estrato se define por:
ni
1 X
Xi = Xi ∀i = 1, . . . , m
ni
i=1
Pm
Por lo tanto el promedio total se define por: X T = i=1 ωi X i
1-36
La varianza de cada estrato se define por
ni
1 X
Si2 = (Xi − X i )2
ni
i=1

y la varianza total se define por:


Pm Pm
ST2 = 2
i=1 ωi Si + i=1 ω(X i − X T )
2

= Varianza intra + Varianza inter


Donde ST2 = n1 ni=1 (Xi − X i )2 .
P

Observación
La varianza intra muestra la variabilidad existente dentro de
cada estrato, mientras que la varianza inter muestra la
variabilidad entre los estratos.

También podría gustarte