Está en la página 1de 22

GUÍA # 14 - ESTADÍSTICA

GRADO: 8°
Lic. Lorena Bibiana González Camacho
CONTENIDO
CARACTERIZACIÓN DE VARIABLES CUANTITATIVAS
1. Medidas de localización.
2. Diagrama de caja y bigotes.
3. Medidas de variabilidad.
4. Enlaces de apoyo
5. Bibliografía.
1. MEDIDAS DE LOCALIZACIÓN
En este caso se examina el comportamiento de cada uno
de los datos. Si las medidas tomadas se calculan a partir
de una muestra recibe el nombre de estadísticos de la
muestra; si estas medidas se calculan tomando como base
los datos de una población se denomina parámetros
poblacionales.

a. MEDIDAS DE POSICIÓN
Dividen el total de datos en partes iguales y se usan para
clasificar una observación dentro de una población o
muestra.
 PERCENTILES ( Pi )
Son los valores de la variable que dividen a un conjunto
ordenado de datos en 100 partes porcentuales iguales. Son 99 y
se notan con la letra p : p1, p2 ,..., pk , pk 1,..., p99
Para determinar un percentil se tiene en cuenta:
Ordenar los datos en forma ascendente.
Calcula el coeficiente i, donde p es el número del percentil
que se va a encontrar y n es el número de datos de la
muestra.
 p 
i   n
 100 
Se dan dos casos, cuando i es un número entero o un
número decimal.
•Si i es un número entero, se toma la posición i e i + 1 y se
busca el promedio de los dos datos encontrados.
•Si i es un número decimal, se aproxima al entero
inmediatamente superior y se busca en el conjunto de
datos aquel que ocupa esta posición, siendo el percentil
buscado.
 CUARTILES ( Qi )
Son aquellos números que dividen los datos en cuatro partes
porcentualmente iguales, cada una de las cuales contiene
una cuarta parte de ellos (25%). Se representan Qi con i = 1,
2, 3. Se definen así:
Q1 : primer cuartil (25%) La mediana es igual a Q2
Q2: segundo cuartil (50%) q
i   n
Q3 : tercer cuartil (75%) 4

 DECILES ( Di )
Son aquellos números que dividen el conjunto de
observaciones en diez partes porcentualmente iguales.
d donde d = 1, 2, …, 9.
i   n
 10 
Ejemplo
En un almacén de ropa informal re reposta la cantidad de dinero
recaudada al finalizar el día. El reporte de ventas, en miles de pesos, de
los primeros quince días se relaciona a continuación.
780 450 350 548 704 678 602
748 540 467 657 789 1325 450 309
Calcular el valor de los cuartiles, el decil 7 y el percentil 80 y obtener
algunas conclusiones de los resultados.
Solución
309 350 450 450 457 540 548 602 657 678 704 748 780 789
1325
1
i   15  3, 75  4 Q1  450  25%
Q1  P25  450  4
Q  P  x  602
2 50
 2
i   15  7,5  8 Q2  602  50%
Q3  P75  748  4
 3
i   15  11,25  12 Q3  748  75%
 4
El 25% de los días, las ventas fueron $450.000 o menos.
El 25% de los días, las ventas estuvieron entre $450.000 y $602.000.
Además, el 50% de los días, las ventas estuvieron entre $450.000 y
$748.000.
El 75% de los días las ventas fueron superiores a $450.000.

7
i   15  10,5  11 D7  704  70%
 10 
 80  748  780
i  15  12 P80   764  80%
 100  2

El 70% de los días las ventas fueron $704.000 o menos.


El 80% de los días las ventas fueron $764.000 o menos.
Ejercicio en clase
Los siguientes datos son los puntajes obtenidos en una
prueba de admisión a una empresa de transporte.

100 122 121 134 123 142 118


123 142 126 127 131 98 116

Calcular los valores de los cuartiles.


Si para ser contratado en la empresa se escogerán los
postulantes que esté sobre 70% de los mejores puntajes
de todos los que realizaron la prueba, ¿cuál es el puntaje
de corte?
2. DIAGRAMA DE CAJA Y BIGOTES
Es una representación gráfica de los datos de una muestra o
población y es una estrategia muy útil para identificar que tan
agrupados están los datos en relación con las medidas de
tendencia central; además provee una visión gráfica en la cual
se pueden identificar las observaciones atípicas.

Para elaborar el diagrama de cajas y bigotes se realizan los


siguientes pasos:
Se calculan los cuartiles y el rango intercuartílico (RIC)
RIC  Q3  Q1
Se dibuja una recta numérica, con una escala adecuada.
Se ubica en ella un rectángulo (caja) cuya base se
determina por el rango intercuartílico, esta caja se ubica
desde Q1 hasta Q3. En la caja estará el 50% de los datos.
Dentro de la caja y sobre el lugar de la mediana se traza una
recta vertical de extremo a extremo del rectángulo. Donde la
mediana dividirá los datos en partes porcentualmente iguales.

x
Q1 Q2 Q3
RIC  Q3  Q1

Se construyen los bigotes teniendo en cuenta la siguiente


expresión que es constante para cualquier diagrama.

x
Q1 1,5 RIC Q1 Q2 Q3 Q3 1,5 RIC
RIC  Q3  Q1
Extremo inferior Extremo superior
Se ubican los datos teniendo en cuenta la escala planteada
en el diagrama

Los datos que se encuentran por fuera de los extremos de los


bigotes se consideran atípicos.
Cuando aparecen datos atípicos es importante analizar su
origen. Es decir, si corresponden a errores de escritura de
quién formó la base de datos, con lo cual es necesario
retirarlos de los datos.
Si estos datos son simplemente individuos con características
diferentes a la mayoría de la población, entonces, se debe
tener en cuenta en todas la apreciaciones y conclusiones.
El diagrama muestra qué tan dispersos están los datos entre
otros y a la vez qué tan simétrica es su distribución.
Ejemplo
Las edades de 20 personas que presentan una enfermedad se
registran en la siguiente lista.
10 20 11 20 14 20 17 20 17 21 18 22 19 24 24 19 19 24 41
Elaborar el diagrama de cajas y bigotes para el conjunto de datos.
•Ordenar
10 11 14 17 17 18 19 19 19 19 20 20 20 20 21 22 24 24 24 41
•Hallar los cuartiles (Q1, Q2, Q3)

1 17 18
i    20  5 Q1   17,5
 4 2
 2 19  20
i    20  10 Q2   19,5  x
 4 2
 3 21  22
i    20  15 Q3   21,5
 4 2
•Calcular el RIC y los extremos de los bigotes

RIC  Q3  Q1 Extremo inferior Extremo superior


 21,5 17,5 Q1 1,5 RIC Q3 1,5 RIC
RIC  4 17,5 1,5  4 21,5 1,5  4
17,5  6  11, 5 21,5  6  27, 5
•El diagrama es:
4 personas
Q1 Q2 Q3
1 persona

10 15 20 25 30 35 40

•Se puede observar que hay tres datos atípicos.


Ejercicio en clase
Para determinar la cobertura que ha tenido el nuevo programa de
atención y prevención de desastres, el alcalde decide realizar un
estudio sobre los 18 barrios de la ciudad. Para ello, pide el reporte,
por barrio, del número de instituciones que han sido visitadas para
implementar la capacitación correspondiente. Los presidentes de
cada una de las juntas reportan la siguiente información.
203 102 191 276 100 168 216 194 207
169 235 255 207 173 250 184 234 290

•Determina el promedio de la cantidad de instituciones visitadas.


•Encuentra los cuartiles para la muestra.
•Elabora el diagrama de cajas y bigotes y determina si existen
datos atípicos.
3. MEDIDAS DE VARIABILIDAD
Permiten saber si hay concentración de datos alrededor de la
media aritmética o promedio. Si existe dicha concentración
esta medida tiene una alta representatividad, pero si el
conjunto de valores es disperso, la media aritmética no es
muy representativa.

RANGO Rango  datomayor  datomenor


Se halla por la diferencia entre el dato mayor y el dato menor
de la muestra, brindando un intervalo en el cual se pueden
ubicar los datos.
Si el rango es un valor grande, indica que los datos presentan
mucha dispersión; mientras que, si el rango es un valor
pequeño, la dispersión de la muestra es pequeña.
VARIANZA
Corresponde a la distancia que hay entre cada dato y la
media aritmética. Se utilizan dos fórmulas, esto de pende del
origen de los datos. Si es de la población se divide entre el
número de datos; si es de la muestra, se divide entre uno
menos de total de los datos.

 2
  ( x  )
i
2
, población s2   ( x  x)
i
2
, muestra
N n 1

DESVIACIÓN ESTÁNDAR
Es el conjunto de datos correspondientes a la raíz cuadrada
de la varianza.
•Desviación estándar muestral: s  s
2

•Desviación estándar poblacional:  2  


Ejemplo
La asistencia de personas a una obra de teatro se registró
durante 10 días. Los datos que se obtuvieron son: 86, 49, 47,
42, 38, 60, 20, 78, 67, 80.
• Halla el rango del conjunto de datos.
•¿Cuál es la varianza y la desviación estándar de la
asistencia a la obra?
Rango R  86  20  66

Media Aritmética

  x i

20  38  42  47  49  60  67  78  80  86 567
    56, 7
N 10 10
Como el rango es mayor que la media aritmética, esto indica
que la asistencia a la obra de teatro presentan mucha
dispersión.
x - μ  μ 2


xi
x 
 2
2


 i 
i xi -
Varianza 20 20 – 56,7 = – 36,7 1346,89
N
4038,1 38 38 – 56,7 = – 18,7 349,69

10 42 42 – 56,7 = – 14,7 216,09
 2  403,81 47 47 – 56,7 = – 9,7 94,09
49 49 – 56,7 = – 7,7 59,29
La varianza poblacional de la 60 60 – 56,7 = 3,3 10,89
asistencia a la obra de teatro 67 67 – 56,7 = 10,3 106,09
es de 403,81. 78 78 – 56,7 = 21,3 453,69
80 80 – 56,7 = 23,3 542,89
Desviación estándar   403,81
2
86 86 – 56,7 = 29,3 858,49
El promedio de la   20,09
 x - μ
2
i 4038,1
asistencia a la obra de
teatro es baja con respecto a la media.
Ejercicio
Calcula el rango, la varianza y la desviación estándar
de las edades, en años cumplidos, de 10 estudiantes
del grado octavo: 14, 15, 15, 15, 16, 15, 15, 13, 15,
15. Escribe alguna conclusión con respecto al
promedio y a la variabilidad de la variable.
4. ENLACES DE APOYO
Cuartiles, deciles y percentiles
https://www.youtube.com/watch?v=-TvLMriL3NQ
Diagrama de cajas y bigotes
https://www.youtube.com/watch?v=GBNpyyApgdA
Varianza y desviación estándar
https://www.youtube.com/watch?v=cg4kUsbjQms
5. BIBLIOGRAFÍA
Joya Vega A. R, Ramírez Rincón M, Ortíz Wilches L. G,
Sánchez C. D, Sabogal Reyes Y. A, Dueñas Álvarez M. F.
(2016). Proyecto Saberes “ser hacer” Matemáticas 8.
Bogotá, Colombia. Santillana S.A.S.

Ramírez Rincón M, Salazar Suárez F. L, Joya Vega A. R,


Celys Rojas V. (2010). Hipertexto Matemáticas 8. Bogotá,
Colombia. Santillana S.A.S.

Rueda La Rotta F, Castro Rincón D, Joya Vera A. R,


Salgado Ramírez D. C, Romero Roa J. J, Torres Sánchez
W. E. (2007). Nuevas Matemáticas 8. Bogotá, Colombia.
Santillana S.A.S.
GRACIAS
CRECER… UN COMPROMISO GIMNASISTA

También podría gustarte