Semana 6 Estadstica Aplicada 1

También podría gustarte

Está en la página 1de 34

ESTADÍSTICA

APLICADA 1
Semana 6
OBJETIVOS DE LA SEMANA
El alumno construye y elaboración de diagramas de
puntos.
El alumno calcula e interpreta cuartiles, deciles y
percentiles.
El alumno calcula e interpretar el coeficiente de
sesgo.

IMAGENES CREATIVE COMMONS CCO


DIAGRAMAS DE PUNTOS
Cuando se realizan tablas de frecuencias, se pierde la observación exacta de los
datos, pues los mismos quedan agrupados en clases. Para un análisis donde se
necesite conocer un poco mas del comportamiento de los datos se utiliza un
diagrama de puntos, el cual es muy útil para muestras pequeñas.

Para elaborar un diagrama de puntos se necesita una recta numérica horizontal,


sobre la cual se dibujará cada observación, si existen observaciones iguales, se
apilaran una sobre otra.
DIAGRAMAS DE PUNTOS
Ejemplo:
Los siguientes datos son los resultados del primer examen de estadística aplicada 1,
de un grupo de 30 alumnos. Con estos datos realice un diagrama de puntos.

25 52 53 54 56 61 63 65 66 67
67 68 68 69 69 70 70 70 71 75
75 76 83 85 87 87 88 89 89 90
DIAGRAMA DE PUNTOS
Cada uno de los puntos representa cada nota obtenida en el examen parcial de
estadística aplicada 1.
El diagrama de tallos y hojas
es una técnica estadística en
donde cada dato numérico se
DIAGRAMA DE TALLO Y divide en dos, el digito
principal es el tallo el cual se
HOJAS localiza en el eje vertical. Los
dígitos secundarios son las
hojas los cuales se apilan unos
con otros en el eje horizontal.
DIAGRAMA DE
TALLOS Y HOJAS
Ejemplo:
A continuación se presenta un
grupo de 50 datos, los cuales
representan la cantidad de
tiempo en minutos que emplean
50 trabajadores para terminar
una pieza en una fábrica.
DIAGRAMA DE TALLOS Y HOJAS
Cada dato se dividirá en dos, el primer número es el tallo que representa a las
decenas y el segundo número es la hoja y representa a las unidades.
10 10 11 11 12 12 13 15 17 17
17 22 23 24 24 25 27 28 28 29
30 31 32 32 35 38 39 45 46 47
48 49 49 57 58 58 58 59 60 62
68 68 69 73 80 80 83 83 90 90

Tallos Hojas
1 0 0 1 1 2 2 3 5 7 7 7
De este diagrama se pueden interpretar varios
2 2 3 4 4 5 7 8 8 9 datos interesantes
3 0 1 2 2 5 8 9 • El menor de los tiempos es 10 y el mayor de
4 5 6 7 8 9 9 los tiempos es 90
5 7 8 8 8 9 • Tres personas hacen el trabajo en 17 minutos
6 0 2 8 8 9 y tres personas lo hacen en 58 minutos.
7 3 • 11 personas están por debajo de 20 minutos.
8 0 0 3
9 0
CUANTILES
De la misma forma como la mediana divide a la muestra en 2, en algunas ocasiones será
necesario dividir la muestra en 4 partes, para separar los datos en porciones de 25
porciento, pues a lo mejor el dato estudiado se encuentra entre el primer 25% de la
muestra.
Para poder dividir la muestra en 4 partes se utiliza la medida de posición llamada Cuartil,
Se utilizar el símbolo 𝑄𝑥 para identificar el Cuartil
Únicamente se pueden localizar 3 cuartiles, pues cada uno de ellos dividirá la muestra en
25%
El 𝑄1 dividirá la muestra desde el dato menor hasta el 25%
El 𝑄2 dividirá la muestra desde el 𝑄1 hasta el 50 % (de esta cuenta el 𝑄2 es igual a la
mediana)
El 𝑄3 dividirá la muestra desde el 𝑄2 hasta el 75 %, por esta razón no se necesita un
Cuartil 4
CUARTILES

Cuartil 1 Cuartil 2 Cuartil 3

25% 50% 75% 100%


Dato menor Dato mayor
DECILES
Es posible que el dato buscado se encuentre en el primer 10% de la muestra,
entonces un cuartil será un porcentaje muy grande para trabajar, si este es el caso
entonces se utiliza la medida llamada Decil, la cual como lo hace el cuartil divide la
muestra, pero en secciones de 10% cada una.
Se utilizar el símbolo 𝐷𝑥 para identificar el Decil
DECILES

𝐷 𝐷 𝐷 𝐷 𝐷 𝐷 𝐷 𝐷 𝐷

10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Dato menor Dato mayor
PERCENTILES
Mas aun en algunos casos será necesario conocer un dato especifico que ni los
cuartiles ni los percentiles pueden determinar, en estos casos se utilizará la medida
de posición percentiles, la cual divide la muestra en unidades de 1%, de esa cuenta
se pueden obtener los percentiles 1 hasta el percentil 99
Se utilizar el símbolo 𝑃𝑥 para identificar el percentil
PERCENTILES

𝑃 𝑃 𝑃 𝑃 𝑃 𝑃 𝑃 𝑃

1% 2% 3% 4% 97% 98% 99% 100%


Dato menor Dato mayor
POSICIÓN DE LOS PERCENTILES
Para poder determinar la posición de los cuartiles o deciles basta con utilizar con la
formula para encontrar la posición de los percentiles, pues si esta buscando el cuartil 1
que es el 25% entonces se busca el percentil 25%, si se busca el decil 2 que es el 20%
entonces se busca el percentil 20
POSICIÓN DEL PERCENTIL
𝑄 𝑄 𝑄

Cuartiles
25% 50% 75% 100%

𝐷 𝐷 𝐷 𝐷 𝐷 𝐷 𝐷 𝐷 𝐷
Deciles
10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Percentiles

𝑃 𝑃 𝑃 𝑃 𝑃 𝑃 𝑃 𝑃 𝑃
𝑃 𝑃
FORMULA DE POSICIÓN DEL PERCENTIL
Para poder encontrar la posición de cualquier percentil se utilizará la siguiente
formula.
𝑝
𝐿𝑝 = 𝑛 + 1
Donde:
n = total de datos de la muestra
p = percentil buscado.
EJEMPLO
Un restaurante quiere realizar un estudio sobre el tiempo que tarda en entregar el
producto al cliente, para lo cual se toma una muestra de 25 motoristas que entregan
pizza en la ciudad capital. El tiempo en minutos que se tarda un repartidor de pizza
desde el momento que sale del restaurante hasta que entrega el producto se
muestra a continuación
23 20 33 25 31
25 26 35 18 28
15 33 32 30 23
32 22 29 29 21
25 24 22 20 18

Determine el tiempo en minutos que separa al 25% de los pedidos que mas rápido
se entregan.
SOLUCIÓN
Lo que se esta solicitando es encontrar el cuartil 1, pues este dato separa el 25% de
los tiempos mas rápidos de entrega.
Se debe ordenar siempre la muestra de datos, en este caso se harán las mismas 5
filas y se ordenara de menor a mayor y colocándose de izquierda a derecha

15 18 18 20 20
21 22 22 23 23
24 25 25 25 26
28 29 29 30 31
32 32 33 33 35
SOLUCIÓN EJEMPLO
Se debe determinar entonces la posición del percentil 25 con la formula.
𝑝
𝐿𝑝 = 𝑛 + 1
En total son 25 tiempos, por lo tanto n= 25 y se busca el percentil 25 entonces p=25
𝐿 = 25 + 1
𝐿 = 26 𝑥0.25
𝐿 = 6.5
Ojo, muy importante! El percentil 25 no es 6.5 esta es la posición del dato, el cual se
buscara en los datos ordenados.
SOLUCIÓN EJEMPLO
Se busca entonces la posición 6.5

La posición 6 es el dato 21, ahora bien se tiene que determinar la diferencia entre
el dato 7 y el 6, en este caso 22-21= 1
Esta diferencia se multiplicara por el decimal que acompaña a la posición en este
caso 0.5
0.5x1 = 0.5
SOLUCIÓN EJEMPLO
El resultado de la multiplicación de la diferencia por el decimal, se suma al dato de
la posición 6, entonces el cuartil 1 o percentil 25 es
21 +0.5= 21.5
𝑄 .

25%

Quiere decir que entregas antes de los 21.5 minutos conforman el 25% las entregas
mas rápidas.
SOLUCIÓN EJEMPLO
Si ahora también se desea conocer el tiempo del 25% de los tiempos mas tardados,
se debe encontrar el cuartil 3 o que es lo mismo el percentil 75
𝑝
𝐿𝑝 = 𝑛 + 1

𝐿 = 25 + 1
𝐿 = 26 𝑥0.75
𝐿 = 19.5
Nuevamente el percentil 75 no es 19.5, esta es la posición donde se encuentra la
cual se debe buscar en los datos ordenados.
SOLUCIÓN EJEMPLO
La posición 19 en los datos ordenados es

La posición 19 es el numero 30, y la diferencia entre 30 y el numero siguiente 31 es 1


31-30 = 1
Esta diferencia se multiplica por el decimal que acompaña a 19.5 el cual es 0.5
0.5x1 = 0.5
Por lo tanto el percentil 75 o cuartil 3 es = 30+0.5 = 30.5
SOLUCIÓN EJEMPLO
Esto quiere decir que a partir del minuto 30.5 se encuentran los tiempos de las
entregas mas tardadas.

𝑄 .

100%
SOLUCIÓN EJEMPLO
Si ahora bien se desea saber cual es el tiempo máximo para el 10% de las entregas
mas rápidas se debe encontrar el percentil 10 o del decil 1.
𝑝
𝐿𝑝 = 𝑛 + 1

𝐿 = 25 + 1
𝐿 = 26 𝑥0.10
𝐿 = 2.6
Lo cual significa que el decil 1 esta en la posición 2.6
SOLUCIÓN EJEMPLO
Nuevamente se busca la posición 2 en los datos ordenados.

La posición 2 es el dato 18, luego se observa también el dato siguiente que también es 18, se restan
ambos 18-18 = 0, esta diferencia se multiplica por el decimal que acompaña a la posición 2.6 que
es 0.6
0.6x0= 0
Por lo tanto el percentil 10 o decil 1 es = 18 +0 = 18, lo cual indica que 18 minutos o menos es el
tiempo de entrega del 10% de los envíos mas rápidos.
DIAGRAMA DE CAJA O BIGOTES
El diagrama de caja o bigotes es una representación de los datos en base a
los cuartiles, para poder realizar el gráfico se necesitan
 Dato mínimo
 Dato máximo
 Cuartil 1
 Mediana
 Cuartil 3

Ejemplo: En base a los datos de tiempos de entrega del restaurante


anteriormente visto, realizar el diagrama de caja.
DIAGRAMA DE CAJA
Del ejemplo anterior se conocen
Dato menor = 15
Dato mayor = 35
Cuartil 1 = 21.5
Cuartil 3 = 30.5
La mediana es 25 (revisar las presentaciones anteriores)
DIAGRAMA DE CAJA
En una recta horizontal se ubican los valores máximos y mínimos, así como los
cuartiles y la mediana.

𝑄 mediana 𝑄

15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
COEFICIENTE DE SESGO DE PEARSON
La forma en la cual se presentan los datos es muy importante, si la media y la
mediana son iguales se dice que la muestra es simétrica.
Si la media es mas grande que la mediana se dice que tiene un sesgo positivo o
hacia la derecha
Si la media es mas pequeña que la mediana se dice que tiene un sesgo negativo o
hacia la izquierda.
COEFICIENTE DE SESGO DE PEARSON
Para calcular el sesgo de una muestra se puede utilizar la formula del sesgo de
Pearson.

𝑋−𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑠𝑘 =
𝑠
Donde
𝑠𝑘 = coeficiente del sesgo de Pearson
𝑋ത =media aritmética
𝑠= desviación estándar.
EJEMPLO
Calcular el sesgo de Pearson del tiempo de entrega de pizzas del restaurante.


La media aritmética 𝑋=25.56
La mediana = 25
La desviación estándar s = 5.45
EJEMPLO
Calcular el sesgo de Pearson del tiempo de entrega de pizzas del restaurante.


𝑋−𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑠𝑘 =
𝑠
. − . .
𝑠𝑘 = = = = 0.3082
. . .

Lo cual indica un pequeño sesgo positivo de la muestra.

También podría gustarte