Está en la página 1de 52

Inferencia

Estadística

Sesión 1 – 2 - 3
Introducción a la estadística
descriptiva
Universidad Javeriana
Estadística

Ciencia que se encarga de estudiar una determinada población


por medio de la recolección, recopilación e interpretación de
datos.

Inferencia estadística
Estadística

Descriptiva Inferencial

Descripción de un Generalización de
pequeño grupo pero características de una
sin generalización población a partir de
estimaciones
Recolecta, presenta,
describe y facilita el
análisis de los datos
resultantes de un
fenómeno de interés

Inferencia estadística
Estadística Descriptiva
Conjunto de técnicas para analizar, describir e interpretar datos
recolectados sobre un fenómeno de interés, con el fin de tomar
decisiones, obtener conclusiones o plantear hipótesis

Masa estadística: Conjunto total de observaciones en forma bruta de


una investigación

Inferencia estadística
Tipos de variables
Escalares Categóricas

Susceptibles de medición No susceptibles de


cuantitativa (métricas) medición

Discretas Continuas Nominales Ordinales

Valores puntuales Todos los valores posibles Categorías sin orden Jerarquía u ordenación
dentro de un intervalo dentro de un intervalo
• Colores • Nivel educativo
• # hijos por familia • Peso en kg de una • Estado civil • Nivel de preferencia de
• # estudiantes del persona un producto (1-5)
curso • Tiempo de una carrera
de atletismo

Inferencia estadística
Datos
ESCALAS DE MEDICIÓN

1. RAZÓN: Variables numéricas que representan magnitudes. Cuentan con un orden lógico,
permite medir distancias y cuentan con un cero absoluto (altura, peso, distancia).

2. INTERVALO: Variables numéricas que representan magnitudes. Cuentan con un orden


lógico y permite medir distancias. El cero no indica ausencia de variable y es arbitrario
(Temperatura, hora GTM).

3. ORDINAL: Variables numéricas que representan una categoría o identifican un grupo de


pertenencia. Cuentan con un orden lógico (Pregrado = 0, Postgrado = 1).

4. NOMINAL: Variables numéricas que representan una categoría o identifican un grupo de


pertenencia. No cuentan con un orden lógico (Mujer = 0, Hombre = 1).

Inferencia estadística
Datos
ESCALAS DE MEDICIÓN
Estadísticas Descriptivas
Escala Descripción Ejemplos
Permitidas

1. Para dos valores x1 y x2 el cociente


x1/x2 es una cantidad con un
significado práctico. El 0
corresponde a la ausencia del
atributo. • Longitud La media geométrica, la
Razón 2. Para dos valores x1 y x2 la • Peso media armónica, la
• Estatura media, el rango y la
distancia (x1- x2) es una cantidad • Dinero desviación estándar
con un significado práctico
3. Hay un orden natural (ascendente
o descendente) de los valores a
través de la escala.

• Temperatura
Satisface las propiedades 2 y 3 de la (Celsius o El rango, la media y la
Intervalo escala de Razón, pero no la 1. Fahrenheit)
desviación estándar.
• Años Calendario.
• Talla de zapatos.

Inferencia estadística
Datos
ESCALAS DE MEDICIÓN

Escala Descripción Ejemplos Estadísticas Descriptivas


Permitidas

• Clasificación de
Satisface únicamente la los equipos en un
torneo
Ordinal tercera propiedad de la Los percentiles.
escala de Razón. • Estratos
• Calificaciones A,
B, C

• No satisface ninguna de las


propiedades de la escala de • Color de los ojos
Nominal
Razón. • Género El porcentaje y la moda.
• Comprende variables que • Número de
identifican atributos o teléfono
cualidades.

Inferencia estadística
Datos

2.3 5.0 5.0 3.0 1.8


3.4 4.4 3.8 4.3 2.1
4.8 4.7 2.4 3.7 2.7
4.3 3.1 4.3 2.9 3.7
3.3 3.9 2.6 4.5 4.6
4.1 3.1 2.5 2.8 4.0

Inferencia estadística
Datos

1.8 2.7 3.3 4.0 4.5


2.1 2.8 3.4 4.1 4.6
2.3 2.9 3.7 4.3 4.7
2.4 3.0 3.7 4.3 4.8
2.5 3.1 3.8 4.3 5.0
2.6 3.1 3.9 4.4 5.0

Inferencia estadística
Distribución de frecuencias
Número de observaciones del conjunto de datos que caen en cada una de las clases

Inferencia estadística
Distribución de frecuencias
Número de observaciones del conjunto de datos que caen en cada una de las clases

1.8 2.7 3.3 4.0 4.5


2.1 2.8 3.4 4.1 4.6
2.3 2.9 3.7 4.3 4.7
2.4 3.0 3.7 4.3 4.8
2.5 3.1 3.8 4.3 5.0
2.6 3.1 3.9 4.4 5.0

Inferencia estadística
Distribución de frecuencias
Número de observaciones del conjunto de datos que caen en cada una de las clases

1.8 – 1 2.7 – 1 3.4 – 1 4.3 – 3 5.0 - 2


2.1 – 1 2.8 – 1 3.7 – 2 4.4 – 1
2.3 – 1 2.9 – 1 3.8 – 1 4.5 – 1
2.4 – 1 3.0 – 1 3.9 – 1 4.6 – 1
2.5 – 1 3.1 – 2 4.0 – 1 4.7 – 1
2.6 - 1 3.3 - 1 4.1 – 1 4.8 - 1

Inferencia estadística
Distribución de frecuencias
Número de observaciones del conjunto de datos que caen en cada una de las clases

1.5 – 2.0: 1
2.1 – 2.5: 4
2.6 – 3.0: 5
3.1 – 3.5: 4
3.6 – 4.0: 5
4.1 – 4.5: 6
4.6 – 5.0: 5

Inferencia estadística
Distribución de frecuencias

Intervalo de
clase
1.6 – 2.0
2.1 – 2-5
2.6 – 3.0
3.1 – 3.5
3.6 – 4.0
4.1 – 4.5
4.6 – 5.0

Inferencia estadística
Distribución de frecuencias

Intervalo de Marca de clase


clase
1.6 – 2.0 1.8
2.1 – 2-5 2.3
2.6 – 3.0 2.8
3.1 – 3.5 3.3
3.6 – 4.0 3.8
4.1 – 4.5 4.3
4.6 – 5.0 4.8

Inferencia estadística
Distribución de frecuencias

Intervalo de Marca de clase Frecuencia


clase absoluta (n)
1.6 – 2.0 1.8 1
2.1 – 2-5 2.3 4
2.6 – 3.0 2.8 5
3.1 – 3.5 3.3 4
3.6 – 4.0 3.8 5
4.1 – 4.5 4.3 6
4.6 – 5.0 4.8 5

Inferencia estadística
Distribución de frecuencias

Intervalo de Marca de clase Frecuencia Frecuencia


clase absoluta (n) relativa (h)
1.6 – 2.0 1.8 1 0.033
2.1 – 2-5 2.3 4 0.133
2.6 – 3.0 2.8 5 0.167
3.1 – 3.5 3.3 4 0.133
3.6 – 4.0 3.8 5 0.167
4.1 – 4.5 4.3 6 0.2
4.6 – 5.0 4.8 5 0.167

Inferencia estadística
Distribución de frecuencias

Intervalo de Marca de clase Frecuencia Frecuencia Frecuencia absoluta


clase absoluta (n) relativa (h) acumulada (N)
1.6 – 2.0 1.8 1 0.033 1
2.1 – 2-5 2.3 4 0.133 5
2.6 – 3.0 2.8 5 0.167 10
3.1 – 3.5 3.3 4 0.133 14
3.6 – 4.0 3.8 5 0.167 19
4.1 – 4.5 4.3 6 0.2 25
4.6 – 5.0 4.8 5 0.167 30

Inferencia estadística
Distribución de frecuencias

Intervalo de Marca de clase Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa


clase absoluta (n) relativa (h) acumulada (N) acumulada (H)
1.6 – 2.0 1.8 1 0.033 1 0.033
2.1 – 2-5 2.3 4 0.133 5 0.166
2.6 – 3.0 2.8 5 0.167 10 0.333
3.1 – 3.5 3.3 4 0.133 14 0.466
3.6 – 4.0 3.8 5 0.167 19 0.633
4.1 – 4.5 4.3 6 0.2 25 0.833
4.6 – 5.0 4.8 5 0.167 30 1

Inferencia estadística
Estadígrafos

Medidas estadísticas que se obtienen a partir de una distribución de frecuencias


o de una masa estadística, las cuales permiten resumir la información de las
variables involucradas para facilitar el análisis y la toma de decisiones

• Tendencia central
• Dispersión
• Forma y simetría de la distribución
• Posición relativa

Inferencia estadística
Estadígrafos
• Tendencia central
 • Media aritmética (promedio)

Inferencia estadística
Estadígrafos
• Tendencia central
• Mediana: Valor de la variable que no supera más de la mitad de los datos y que es
superada por no más de la mitad de los datos.

• Datos impares: valor medio


• Datos pares: promedio de los valores medios

• Moda: Dato/Intervalo más frecuente

Inferencia estadística
Estadígrafos
• Tendencia central
Las calificaciones de un grupo de exámenes se presentan a continuación:

2.3 5.0 5.0 3.0 1.8


3.4 4.4 3.8 4.3 2.1
4.8 4.7 2.4 3.7 2.7
4.3 3.1 4.3 2.9 3.7
3.3 3.9 2.6 4.5 4.6
4.1 3.1 2.5 2.8 4.0
Halle la mediana y la moda del conjunto de datos.

Inferencia estadística
Estadígrafos
• De Posición
Son los que dividen una distribución en partes iguales. Fractiles o cuantiles.
Representan el valor de la variable por debajo del cual se encuentra un porcentaje dado de
observaciones

Inferencia estadística
Estadígrafos
• De Posición
Son los que dividen una distribución en partes iguales. Fractiles o cuantiles.
Representan el valor de la variable por debajo del cual se encuentra un porcentaje dado de
observaciones

• Percentiles: división de la distribución en 100 partes iguales

• Deciles: división de la distribución de 10 partes iguales

• Cuartiles: división de la distribución en 4 partes iguales

Inferencia estadística
Ejercicio

Inferencia estadística
Ejercicio

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
59 65 67 68 71 72 75 79 81 83 85 87 88 91 92 93 94 95 100 100
5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% 75% 80% 85% 90% 95% 100%

Inferencia estadística
Estadígrafos
• De Posición

  • Cuartiles:

• Percentiles:

Inferencia estadística
Estadígrafos
• De Dispersión

• Rango: diferencia entre los valores máximo y mínimo de un conjunto de


observaciones

• Rango intercuartil: Q3 - Q1

Inferencia estadística
Ejercicio

Inferencia estadística
Ejercicio

𝑅𝑎𝑛𝑔𝑜=𝑀
  á 𝑥 − 𝑀 í 𝑛=20.300− 3.600=𝟏𝟔 .𝟕𝟎𝟎

𝑅𝑎𝑛𝑔𝑜𝐼𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙
  =𝑄 3 −𝑄 1=12.800− 8.200=𝟒 . 𝟔𝟎𝟎

Inferencia estadística
Estadígrafos
 • De Dispersión

• Rango intercuartil medio:

• Varianza: promedio de los cuadrados de las desviaciones medidas alrededor de la


media

• Desviación estándar: raíz cuadrada de la varianza

Inferencia estadística
Estadígrafos
 • Dispersión

• Varianza ajustada:

• Dispersión relativa

• Coeficiente de variación: medida de comparación relativa de variabilidad

Inferencia estadística
Ejercicio
Calcule la varianza y la desviación estándar de las millas manejadas por los empleados de la
compañía Casual Life Insurance del ejercicio anterior

Inferencia estadística
Ejercicio

Inferencia estadística
Estadígrafos
• De forma

• Simetría

• Asimetría

>0 <0
Inferencia estadística
Estadígrafos
 • De forma

• Asimetría

• Curtosis: agudeza de un conjunto de datos

Inferencia estadística
Estadígrafos
• De forma

• Curtosis: agudeza de un conjunto de datos

Inferencia estadística
Ejercicio
Ejercicio
Ejercicio
Diagrama de caja y bigotes
• Valores adyacentes: no atípicos
• Valores posiblemente atípicos: dudosos por su cercanía a la frontera
• Valores extremos: atípicos

Inferencia estadística
Diagrama de caja y bigotes

• Construcción:
1. Ordenar datos
2. Identificar mediana, Q1, Q3 y rango intercuartil
3. Calcular Barreras internas y externas
4. Graficar

Inferencia estadística
Diagrama de caja y bigotes

• Barrera inferior interna = Máximo {Valor Mín; Q1 - 1,5RIC}


• Barrera superior interna = Mínimo {Q3 + 1,5RIC; Valor Máx}

• Barrera inferior externa = Máximo {Valor Mín; Q1 - 3RIC}


• Barrera superior externa = Mínimo {Q3 + 3RIC; Valor Máx}

Inferencia estadística
Ejemplo

Inferencia estadística
Ejemplo

-24.6 -2.6 2.4 2.7 3.8 5.6 5.9 6.7 7 7.2 7.5 8 8.2 8.5 8.6 8.8 9 9.2 9.7 10 20.5

• Mediana: 7,5
• Q1: 5,6
• Q3: 8,8
• RIC: 8,8 – 5,6 = 3,2

• Barrera inferior interna = Máx {-24,6 ; 5,6 - 1,5(3,2)} = Máx {-24,6 ; 0,8} = 0,8
• Barrera superior interna = Mín {8,8 + 1,5(3,2) ; 20,5} = Mín {13,6 ; 20,5} = 13,6

• Barrera inferior externa = Máx {-24,6 ; 5,6 – 3(3,2)} = Máx {-24,6 ; -4} = -4
• Barrera superior externa = Mín {8,8 + 3(3,2) ; 20,5} = Mín {18,4 ; 20,5} = 18,4

Inferencia estadística
Ejemplo
• Valores adyacentes: 2,4 (inferior) y 10 (superior)
• Valores posiblemente atípicos: -2,6 (inferior)
• Valores extremos:-24,6 (inferior) y 20,5 (superior)

Inferencia estadística
Ejercicio
Construya el diagrama de cajas para el ejercicio de los precios de las habitaciones en
Estados Unidos

Inferencia estadística
Ejercicio
120
• Mediana: 161
123
• Q1: 136,5
125 • Q3: 170
126 • RIC: 33,5
134
139 • Barrera inferior interna = 120
• Barrera superior interna = 220,25
144
• Barrera inferior externa = 120
145 • Barrera superior externa = 245
146
160
162
163
166
167
167
173
177
192
207
245

Inferencia estadística
Ejercicio

Inferencia estadística
Ejercicio
Los siguientes datos representan el consumo diario de agua (en metros cúbicos) de un
apartamento, durante 10 días consecutivos.
Día Consumo
1 0,667 Realice una tabla de frecuencias sin agrupación de datos.
2 0,667 Complete la tabla con las frecuencias absoluta acumulada y
las frecuencias relativa y relativa acumulada.
3 0,567
4 0,8 Indique la media, mediana, moda y la desviación estándar de
5 0,867 dicho consumo.
6 0,767
7 0,6
8 0,767
9 0,933
10 0,667

Inferencia estadística

También podría gustarte