Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Mediana: Punto medio de los valores una vez que se han ordenado de menor a
mayor o de mayor a menor. (MARCHAL|WATHEN, 2012)
Moda.
La moda es otra medida de ubicación.
Moda: valor de la observación que aparece con mayor frecuencia.
(MARCHAL|WATHEN, 2012)
Media geométrica.
La media geométrica resulta útil para determinar el cambio promedio de
porcentajes, razones, índices o tasas de crecimiento. Posee amplias aplicaciones
en la administración y en la economía, ya que con frecuencia hay interés en
determinar los cambios porcentuales de ventas, salarios o cifras económicas, como
el producto interno bruto, los cuales se combinan o se basan unos en otros. La
media geométrica se escribe de la siguiente manera: (MARCHAL|WATHEN, 2012)
𝑛
Media geométrica 𝑀𝐺 = √(𝑋1 )(𝑋2 ) … (𝑋𝑛 )
La media geométrica siempre es menor o igual (nunca mayor que) que la media
aritmética. Todos los datos deben de ser positivos. (MARCHAL|WATHEN, 2012)
¿Por qué estudiar la dispersión?
Una medida de ubicación, como la media o la mediana, sólo describe el centro de
los datos. Desde este punto de vista resulta valiosa, pero no dice nada sobre la
dispersión de los datos. Por ejemplo, si la guía de turismo ecológico dice que el río
que se encuentra a pocos tiene en promedio 3 pies de profundidad, ¿querría usted
cruzarlo a pie sin más información? Quizá no. Usted desearía saber algo sobre la
variación de la profundidad. ¿Mide 3.25 pies la máxima profundidad y 2.75 pies la
mínima? En dicho caso, usted estaría de acuerdo en cruzar. ¿Qué hay si usted se
enteró de que la profundidad del río variaba de 0.50 a 5.5 pies?
(LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?, 2012)
Su decisión probablemente seria no cruzar. Antes de tomar una decisión, usted
desea información tanto de la profundidad típica como de la dispersión de la
profundidad del río. (LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?,
2012)
Una medida de dispersión pequeña indica que los datos se acumulan con
proximidad alrededor de la media aritmética. Por consiguiente, la media se
considera representativa de los datos. Por el contrario, una medida grande
dispersión indica que la media no es confiable. (LID|MARCHAL|WATHEN, ¿Por que
estudiar la disperción?, 2012)
Vea la grafica 3 − 5. Los empleados de Hammond Iron Works, Inc., una compañía
que fabrica acero, se organiza en un histograma basado en el número de años que
los empleados han laborado en la compañía. La media es de 4.9 años, pero la
dispersión de los datos es 6 meses a 16.8 años. La media de 4.9 años no es muy
representativa de todos los empleados. (LID|MARCHAL|WATHEN, ¿Por que
estudiar la disperción?, 2012)
Medidas de dispersión.
Consideraremos diversas medidas de dispersión. El rango se sustenta en los
valores máximos y mínimos del conjunto de datos, es decir, sólo se consideran dos
valores. La desviación media, la varianza y la desviación estándar se basan en
desviaciones de la media aritmética. (LID|MARCHAL|WATHEN, ¿Por que estudiar
la disperción?, 2012)
Rango.
La medida más simple de dispersión es el rango. Representa la diferencia entre
valores máximo y mínimo de un conjunto de datos. En forma de ecuación:
Rango 𝑅𝑎𝑛𝑔𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜.
El rango se emplea mucho en aplicaciones de control de procesos estadísticos
(CPE), debido a que resulta fácil de calcular y entender. (LID|MARCHAL|WATHEN,
¿Por que estudiar la disperción?, 2012)
Desviación media.
Un problema que presenta el rango estriba en que parte de dos valores, el más alto
y el más bajo, es decir, no los toma en cuenta a todos. La deviación media sí lo
hace; mide la cantidad media respecto de la cual los valores de una población o
muestra varían. Expresado en forma de definición: (LID|MARCHAL|WATHEN, ¿Por
que estudiar la disperción?, 2012)
Desviación media: Media aritmética de los valores absolutos de las desviaciones
con respecto a la media aritmética. (LID|MARCHAL|WATHEN, ¿Por que estudiar la
disperción?, 2012)
En el caso de una muestra, la desviación media, designada DM, se calcula
mediante la formula:
∑|𝑋−𝑋̅|
Desviación media: 𝐷𝑀 = 𝑛
En donde:
𝑋 = 𝐸𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛.
𝑋̅ = 𝐸𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑢𝑐𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠.
𝑛 = 𝐸𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
| | = 𝐼𝑛𝑑𝑖𝑐𝑎 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜.
¿Por qué ignorar los signos de las desviaciones de la media? De acuerdo, las
desviaciones positivas y negativas se compensarían con exactitud unas y otras y la
desviación siempre sería cero. Dicha medida (cero) resultaría un estadístico sin
utilidad. (LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?, 2012)
Varianza y desviación estándar.
La varianza y la desviación estándar también se fundamentan en las
desviaciones de la media. Sin embargo, en lugar de trabajar con el valor absoluto
de las desviaciones, la varianza y la desviación estándar lo hacen con el cuadrado
de las desviaciones. (LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?,
2012)
Varianza: Media aritmética de las desviaciones de la media elevadas al cuadrado.
(LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?, 2012)
La varianza es no negativa y es cero sólo si todas las observaciones son las
mismas.
Desviación estándar: Raíz cuadrada de la varianza. (LID|MARCHAL|WATHEN,
¿Por que estudiar la disperción?, 2012)
Varianza de la población. Las fórmulas de la varianza poblacional y la varianza de
la muestra so ligeramente diferentes. La varianza poblacional se estudia primero.
(recuerde que una población es la totalidad de las observaciones estudiadas.) La
varianza poblacional se determina de la siguiente manera:
(LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?, 2012)
2 ∑(𝑋−𝜇)2
Varianza de la población 𝜎 = 𝑁
En esta fórmula:
𝜎2 =
𝐸𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 (𝜎 𝑒𝑠 𝑙𝑎 𝑙𝑒𝑡𝑟𝑎 𝑚𝑖𝑛ú𝑠𝑐𝑢𝑙𝑎 𝑔𝑟𝑖𝑒𝑔𝑎 𝑠𝑖𝑔𝑚𝑎); 𝑠𝑒 𝑙𝑒𝑒 𝑠𝑖𝑔𝑚𝑎 𝑎𝑙
𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜.
𝑋 = 𝐸𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑢𝑛𝑎 𝑜𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛.
𝜇 = 𝐸𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛.
𝑁 = 𝐸𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛.
Observe el proceso de cálculo de la varianza:
1. Comience por determinar la media.
2. Calcule la diferencia entre cada observación y la media, y eleve
3. Calcule la diferencia entre cada observación y la media, y eleve al cuadrado
dicha diferencia.
4. Sume todas las diferencias elevadas al cuadrado.
5. Divida la suma de las diferencias elevadas al cuadrado entre el número de
elementos de la población.
Así, usted podrá pensar que la varianza de la población es la media de las
diferencias elevadas al cuadrado entre cada valor y la media. En las poblaciones
cuyos valores son cercanos a la media, la varianza de la población puede ser
pequeña. En las poblaciones cuyos valores se apartar de la media, la varianza de
la población puede ser grande. (LID|MARCHAL|WATHEN, ¿Por que estudiar la
disperción?, 2012)
La varianza compensa el inconveniente que se presenta el rango al utilizar todos
los valores de la población, mientras que el rango incluye sólo los valores
máximo y mínimo. El problema de que ∑(𝑋 − 𝜇) = 0, se corrige elevando al
cuadrado las diferencias, en lugar de emplear valores absolutos. Elevar al
cuadrado las diferencias siempre dará como resultado valores no negativos.
(LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?, 2012)
Desviación estándar de la población: Tanto el rango como la desviación media
resultan fáciles de interpretar. El rango es la diferencia entre los valores alto y
bajo de un conjunto de datos, y la desviación media es la media de las
desviaciones de la media. Sin embargo, la varianza de 124 del número de multas
levantadas no se expresa en términos de multas, sino en multas elevadas al
cuadrado. (LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?, 2012)
Existe una forma de salir del problema. Si extrae la raíz cuadrad de la varianza
de la población, puede convertirla a las mismas unidades de medición que
emplean los datos originales. La raíz cuadrada de 124 multas elevadas al
cuadrado es de 11.4 multas. La raíz cuadrada de la varianza de la población es la
desviación estándar de la población. (LID|MARCHAL|WATHEN, ¿Por que
estudiar la disperción?, 2012)
∑(𝑋−𝜇)2
Desviación estándar de la población 𝜎 = √ 𝑁
∑𝑋
Varianza muestral: La fórmula para determinar la media poblacional es 𝜇 = .
𝑁
∑𝑋
Sencillamente, cambie los símbolos de la media de la muestra; es decir, 𝑋̅ = .
𝑛
Desafortunadamente, la conversión de una varianza poblacional en una varianza
muestral no es tan directa. Requiere de un cambio en el denominador. En el lugar
de sustituir 𝑛 (el número de la muestra) por 𝑁 (el número de la población), el
denominador es 𝑛 − 1. Así, la fórmula de la varianza muestral es:
(LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?, 2012)
∑(𝑋−𝑋̅)2
Varianza muestral 𝑠2 = 𝑛−1
Donde:
𝑠 2 = 𝐸𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙.
𝑋 = 𝐸𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
𝑋̅ = 𝐸𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
𝑛 = 𝐸𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑟𝑒𝑎𝑙𝑖𝑧𝑎𝑑𝑎𝑠.
Desviación estándar de la muestra: La desviación estándar de la muestra se
utiliza para estimar la desviación estándar de la población. Como se hiso notar, la
desviación estándar de la población es la raíz cuadrada de la varianza de la
población. Así mismo, la desviación estándar de la muestra es la raíz cuadrada de
la varianza de la muestra. La desviación estándar de la muestra se calcula con
mayor facilidad de la siguiente manera: (LID|MARCHAL|WATHEN, ¿Por que
estudiar la disperción?, 2012)
∑(𝑋−𝑋̅)2
Desviación estándar de la muestra 𝑠 = √ 𝑛−1
donde:
𝑠 = 𝐸𝑠 𝑒𝑙 𝑠í𝑚𝑏𝑜𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
𝑀 = 𝐸𝑠 𝑒𝑙 𝑝𝑢𝑛𝑡𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒.
𝑛 = 𝐸𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
𝑋̅ = 𝐷𝑒𝑠𝑖𝑔𝑛𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙.
Otras medidas de posición.
La desviación estándar es la medida de dispersión que más se utiliza. No obstante,
existen otras formas de describir la variación o dispersión de un conjunto de datos.
Un método consiste en determinar la ubicación de los valores que dividen un
conjunto de observaciones en partes iguales. Estas medidas incluyen los cuartiles,
deciles y percentiles. (LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?,
2012)
Los cuartiles dividen a un conjunto de observaciones en cuatro partes iguales. Para
explicarlo mejor, piense en un conjunto de valores ordenados de menor a mayor. La
mediana es el valor intermedio de un conjunto de datos ordenados de menor a
mayor. Es decir que 50% de las observaciones son mayores que la mediana y 50%
son menores. La mediana constituye una medida de ubicación, ya que señala el
centro de los datos. De igual manera, los cuartiles dividen a un conjunto de
observaciones en cuatro partes iguales. El primer cuartil, se representa mediante
𝑄1 , es el valor debajo del cual se presenta 25% de las observaciones, y el tercer
cuartil, que simboliza 𝑄3 , es el valor debajo del cual se presenta 75% de las
observaciones. Lógicamente, 𝑄2 es la mediana. 𝑄1 puede considerarse como la
mediana de la mitad inferior de los datos y 𝑄3 como la mediana de la parte superior
de los datos. (LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?, 2012)
Así mismo, los deciles dividen un conjunto de observaciones en 10 partes iguales y
los percentiles en 100 partes iguales. Por lo tanto, si su promedio general en la
universidad se encuentra en el octavo decil, usted podría concluir que 80% de los
estudiantes tuvieron un promedio general inferior al suyo y 20%, un promedio
superior. Un promedio general ubicado en el trigésimo tercer percentil significa que
33% de los estudiantes tienen un promedio general más bajo y 67% un promedio
general más alto. (LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?,
2012)
Cuartiles, deciles y percentiles.
Para formalizar el proceso del cálculo, suponga que 𝐿𝑝 representa la ubicación de
cierto percentil que se busca. De esta manera, si quiere encontrar el trigésimo
tercer percentil, utilizaría 𝐿33 ; y si buscara la mediana, el percentil 50o., entonces
𝐿50 . El número de observaciones es 𝑛; por lo tanto, si desea localizar la mediana,
su posición se encuentra en (𝑛 + 1)/2, o podría escribir esta expresión como
(𝑛 + 1)(𝑃/100), en la que P representa el percentil que busca.
(LID|MARCHAL|WATHEN, ¿Por que estudiar la disperción?, 2012)
𝑃
Localización de un percentil 𝐿𝑝 = (𝑛 + 1) 100.
b. ¿Qué diferencia existe entre una población y una muestra?
Que una población es conjunto de todos los elementos de un tipo particular cuyo
conocimiento es de nuestro interés y la muestra es cualquier subconjunto de la
población es decir es una parte de ella. (LID|MARCHAL|WATHEN, ¿Por que
estudiar la disperción?, 2012)
c. ¿Cuál es la diferencia entre una variable cualitativa y una variable cuantitativa?
La variables cualitativas o no métrico no admiten medición numérica. Son atributos,
características o propiedades categóricas que identifican o describen a un sujeto.
Describen diferencias de tipo o clase, e indican la presencia o ausencia de una
característica propia. Por ejemplo, si una persona es mujer, se excluye que sea
hombre. Es decir, no hay cantidad de género, solo la condición de ser mujer u
hombre.
Por otro lado, los datos métricos o caracteres cuantitativos si es contable o medible
y están constituidos de manera que los sujetos puedan estar identificados por
diferencias entre sus cantidades. Es decir, las variables medidas métricamente
reflejan cantidades relativas. Por esta razón, las medidas métricas son las más
apropiadas para casos que involucren cantidad o magnitud, como la demanda de
trabajo, el nivel de ozono en la atmosfera, etcétera.
También se puede calcular con la tabla las siguientes áreas con respecto a 𝑧.
Toda el área vale 1 si del lado derecho vale 0.7 entonces del lado izquierdo vale 0.3
este mecanismo vamos a usar para poder usar mecanismo de un determinado
valor por encima de 𝑧. (Pildoras matemáticas. 05 Ejercicios con la tabla de
distribución normal, s.f.)
𝑃(𝑍 > 𝑧) = 1 − 𝑃(𝑍 ≤ 𝑧)
Por simetría el área que está por encima de −𝑧 es igual a el área que está por
debajo de 𝑧. Se le cambia el signo y el símbolo. (Pildoras matemáticas. 05
Ejercicios con la tabla de distribución normal, s.f.)
𝑃(𝑍 > −𝑧) = 𝑃(𝑍 ≤ 𝑧)
Área por debajo de un valor negativo.
El área que está por debajo del valor de −𝑧 es igual a el valor del área que está por
encima de 𝑧 está es igual a uno menos el área que está por debajo de 𝑧.
𝑃(𝑍 ≤ 𝑧) = 𝑃(𝑍 > 𝑧) = 1 − 𝑃(𝑍 ≤ 𝑧)
𝑃(𝑍 ≤ 𝑧)
𝑃(𝑍 > 𝑧) = 1 − 𝑃(𝑍 ≤ 𝑧)
𝑃(𝑍 > −𝑧) = 𝑃(𝑍 ≤ 𝑧)
𝑃(𝑍 ≤ −𝑧) = 𝑃(𝑍 > 𝑧) = 1 − 𝑃(𝑍 ≤ 𝑧)
𝑃(𝑧1 > 𝑍 < 𝑧2 ) = 𝑃(𝑍 ≤ 𝑧2 ) − 𝑃(𝑍 ≤ 𝑧1 )
La media
6 + 7 + 6 + 7 + 5 31
𝑥̅ = = = 6.2
5 5
8 + 9 + 5 + 10 + 5 37
𝑦̅ = = = 7.4
5 5
Desviación típica → √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
∑ 𝑥𝑖 2 195 √14
𝑠𝑥 = √ 2
− 𝑥̅ = √ 2
− 6.2 = √0.56 = = 0.74
𝑁 5 5
∑ 𝑦2 295 √106
𝑠𝑦 = √ 2
− 𝑦̅ = √ ( )2
− 7.4 = √4.24 = = 2.05
{ 𝑁 5 5
Covarianza.
∑ 𝑥𝑖 𝑦𝑖 236 33
𝑠𝑥𝑦 = − 𝑥̅ 𝑦̅ = − 6.2 ∗ 7.4 = = 1.32 → 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑖𝑟𝑒𝑐𝑡𝑎.
𝑁 5 25
Coeficiente de correlación de lineal.
𝑠𝑥𝑦 1.32
𝑟= = = 0.87 → 𝑝𝑟𝑜𝑥𝑖𝑚𝑜 𝑎 1 ℎ𝑎𝑦 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑖𝑟𝑒𝑐𝑡𝑎
𝑠𝑥 ∗ 𝑠𝑦 0.74 ∗ 2.05
Es decir que si saca una nota baja en física también la saca una nota baja en
matemáticas.
Recta de regresión: es la recta que mas se ajusta a la nube de puntos obtenida.
Pasa por el centro de gravedad de la nube de puntos.
𝑠𝑥𝑦 1.32
𝑦 − 𝑦̅ = (𝑥 − 𝑥̅ ) → 𝑦 − 7.4 = (𝑥 − 6.2)
(𝑠𝑥 ) (0.74)2
𝑦 − 7.4 = 2.4(𝑥 − 6.2) → 𝑟𝑒𝑐𝑡𝑎 𝑝𝑢𝑛𝑡𝑜 𝑝𝑒𝑑𝑖𝑒𝑛𝑡𝑒 𝑞𝑢𝑒 𝑢𝑛𝑖𝑟𝑖𝑎 𝑙𝑜𝑠 𝑝𝑢𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑛𝑢𝑏𝑒.
Usando la resta de regresión, hallar la nota en matemáticas de un alumno que ha
obtenido 4 en física.
𝑥 = 4, 𝑦 =?
𝑦 − 7.4 = 2.4(4 − 6.2)
𝑦 − 7.4 = 2.4(−2.2)
𝑦 − 7.4 = −5.28
𝑦 = −5.28 + 7.4 = 2.12
𝑥 = 4, 𝑦 = 2.12
Gráfico de cajas.
Un diagrama de cajas es una representación gráfica, basada en cuartiles, que
ayuda a presentar un conjunto de datos. Para construir un diagrama de cajas, solo
necesita cinco estadísticos: el valor mínimo, 𝑄1 (primer cuartil), la mediana, 𝑄3
(tercer cuartil) y el valor máximo. (LID|MARCHAL|WATHEN, ¿Por que estudiar la
disperción?, 2012)
Muestra una cantidad de datos distribuidos en un rango a lo largo de una recta
numérica. (Coronado GED Acadymi. Construir & interpretar un diagrama de caja y
bigotes, s.f.)
Los datos están agrupados en cuatro secciones con igual cantidad de datos.
(Coronado GED Acadymi. Construir & interpretar un diagrama de caja y bigotes,
s.f.)
Los asteriscos muestran valores atípicos muy pequeños o grandes. (Coronado
➢ Para construir el diagrama hacer una resta numérica a escala que incluya
todos los datos.
➢ Marcas lo cinco números calculados anteriormente.
➢ Trazar líneas por 𝑄1 = 29, 𝑀𝑒𝑑 = 23 y 𝑄3 = 29.
➢ Dibujar la caja. Dibujar el bigote menor y el mayor. (Coronado GED Acadymi.
Construir & interpretar un diagrama de caja y bigotes, s.f.)
Observe que la mediana divide los datos en dos grupos iguales, pero no está en
medio de la caja es por los datos de la derecha mediana están mas separados a
partir del numero 25 el rango es mayor a la derecha de la mediana. (Coronado
1
Cada sección del diagrama tiene la misma cantidad de datos 4 = 25%. (Coronado
GED Acadymi. Construir & interpretar un diagrama de caja y bigotes, s.f.)
El primer cuartil 𝑄1 tiene el 25% de los datos y es igual a 19.
𝑄1 = 25% = 19
El segundo cuartil 𝑄2 tiene el 50% de los datos y es igual a 23. (Coronado GED
Acadymi. Construir & interpretar un diagrama de caja y bigotes, s.f.)
𝑄2 = 50% = 23
El tercer cuartil tiene el 75% de los datos y es igual 29. (Coronado GED Acadymi.
Construir & interpretar un diagrama de caja y bigotes, s.f.)
𝑄3 = 75% = 29
El 100% de los datos ocurre en el punto máximo 33. (Coronado GED Acadymi.
Construir & interpretar un diagrama de caja y bigotes, s.f.)
Punto máximo = 100%
El rango Inter cual también se puede calcular con los porcentajes. (Coronado GED
Acadymi. Construir & interpretar un diagrama de caja y bigotes, s.f.)
𝐼𝑄𝑅 = 𝑄3 − 𝑄1 = 75% − 25% = 50%
Otra manera de calcular es sumando los porcentajes dentro la caja. (Coronado
GED Acadymi. Construir & interpretar un diagrama de caja y bigotes, s.f.)
25% + 25% = 50%
El 50% de los datos están dentro de la caja.
Para resolver problemas con diagrama de caja y bigotes debes de memorizar esos
porcentajes y sus ubicaciones. (Coronado GED Acadymi. Construir & interpretar un
diagrama de caja y bigotes, s.f.)