Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Descripción:
1
Ciencia.
Clasificar.
Contar.
Analizar.
Interpretar.
Se encarga de recopilar, tabular y presentar información. Tiene que ver con las
representaciones gráficas y el cálculo de las llamadas medidas de tendencia central y
de dispersión. Se auxilia con gráficas para facilitar la interpretación. Por ejemplo, en las
últimas elecciones el 57% votó por el PAP, el 34% por el PIP y el 9% por el POP.
2
1.1.3 Importancia: Los directivos de empresas utilizan la estadística como ayuda
para tomar decisiones ante la incertidumbre.
La estadística puede utilizarse para realizar proyecciones de ventas, análisis financie-
ros de proyectos de gasto de capital, construir proyecciones de beneficios para un nue-
vo producto, establecer cantidades de producción y hacer un análisis de muestreo para
determinar la calidad de un producto.
1.1.4 Población N
1.1.5 Muestra n
3
_
X = Media, S = Desviación estándar, P = Proporción, etc.
Variable aleatoria
Variable es un término utilizado para indicar que el valor de una cosa se puede
modificar (varía, variable). El cambio de valor de una cosa puede ser por causas de sí
misma o por factores ajenos, Por ejemplo:
Variable aleatoria discreta: Es aquella que toma valores que se puedan contar
pero no nos interesa medir: árboles en un bosque, alumnos en una escuela, autos
reparados, etc., En el siguiente ejemplo: ¿Cuántos refrigeradores se venden en un
mes? la variable es "refrigeradores" y puede que se vendan 20, 1000, 5000, etc.
Variable aleatoria continua: Es una variable que nos interesa medir en:
4
CLASIFICACIÓN DE VARIABLES
Variable
Cualitativa Cuantitativa
o categórica Discreta Continua
Sexo: hombre o Hijos por mujer Peso del hijo
mujer
Sexo Cantidad Hijos/muj. Mujeres Peso Cantidad
Hombre 77 0 8 Menor a 1 10
1 13 De 1 a 1.5 15
Mujer 75 2 19 De 1.5 a 2 30
3 15 De 2 a 2.5 80
4 9 De 2.5 a 3 40
5 7 De 3 a 3.5 15
6 ó mas 4 Mas de 3.5 5
5
CUESTIONARIO
1.
¿De donde se origina el término estadística?
2.
Defina estadística.
3.
¿En qué áreas se divide la estadística?
4.
¿Qué es estadística descriptiva?
5.
¿Qué es estadística inferencial?
6.
¿Qué es una variable aleatoria?
7.
¿Cómo se clasifican las variables aleatorias?
8.
¿Qué es una variable aleatoria categórica?
9. Dé ejemplos de variables aleatorias categóricas.
9. ¿Qué es una variable aleatoria discreta?
10. Dé ejemplos de variables aleatorias discretas.
11. ¿Qué es una variable aleatoria continua?
12. Dé ejemplos de variables aleatorias continuas.
13. ¿Cómo reconocen algunas empresas a las variables continuas?
14. ¿Cómo reconocen algunas empresas a las variables discretas y categóricas?
15. ¿Qué es un muestreo aleatorio?
16. ¿Qué tipos de muestreo se acostumbran?
17. ¿Qué es un muestreo aleatorio simple?
18. ¿Qué es un muestreo aleatorio sistemático?
19. ¿Qué es un muestreo aleatorio estratificado?
20. ¿Qué es una población?
21. ¿Qué son las notaciones de una población?
22. ¿Con qué tipo de letras se señalan los parámetros?
23. ¿Qué es una muestra?
24. ¿Cómo se le llama a las notaciones de una muestra?
25. ¿Con qué tipo de letras se señalan los estadísticos?
PREGUNTAS DE CRITERIO
6
10. ¿Cuándo se trabaja con una población y cuándo con una muestra?
PROBLEMA
7
1.2 DISTRIBUCIÓN DE FRECUENCIA.
El término distribución significa agrupar, repartir o dividir una cosa y frecuencia
quiere decir el número de veces que ocurre o se repite un evento. La distribución de
frecuencias consiste en agrupar datos de acuerdo a cierta característica o clase. Es
una tabla de datos agrupados. Por ejemplo, dividir los alumnos de un grupo de
acuerdo a su sexo, peso y libros por alumno:
1.58 1.86 1.62 1.70 1.81 1.67 1.79 1.68 1.92 1.84 1.74
1.64
1.73 1.73 1.75 1.68 1.56 1.87 1.79 1.89 1.84 1.74 1.79
1.72
1.72 1.75 1.76 1.69 1.87 1.74 1.80 1.72 1.85 1.67 1.82
1.73
Como puede observarse, el límite inferior (el más pequeño) es 1.56 y el superior
(el más alto) es 1.92. Para agrupar los datos podemos formar “N” número de clases,
por ejemplo cinco, de 10 cm. en 10 cm. Para hacer la clasificación, cuando un dato se
encuentre en el límite lo consideraremos como elemento de la clase anterior, por
ejemplo 1.70 pertenece a la clase 1.60 - 1.70:
8
CLASE FRECUENCIA
1.50 - 1.60 2
1.60 - 1.70 8
1.70 - 1.80 16
1.80 - 1.90 9
1.90 - 2.00 1
Frecuencia absoluta o
CLASE
"FRECUENCIA"
1.50 - 1.60 2
1.60 - 1.70 8
1.70 - 1.80 16
1.80 - 1.90 9
1.90 - 2.00 1
9
1.2.3. FRECUENCIA RELATIVA
FRECUENCIA
CLASE FRECUENCIA RELATIVA
Fracción Decimal
1.50 - 1.60 2 2/36 0.0556
1.60 - 1.70 8 8/36 0.2222
1.70 - 1.80 16 16/36 0.4444
1.80 - 1.90 9 9/36 0.2500
1.90 - 2.00 1 1/36 0.0278
Total 36 36/36 1.0000
10
1.60 - 1.70 (1.60 + 1.70) / 2 = 1.65
1.70 - 1.80 1.75
1.80 - 1.90 1.85
1.90 - 2.00 1.95
INTERVALO
CLASE
DE CLASE
1.50 - 1.60 (1.50 – 1.60) = 0.10
1.60 - 1.70 (1.60 – 1.70) = 0.10
1.70 - 1.80 0.10
1.80 - 1.90 0.10
1.90 - 2.00 0.10
AGRUPACIÓN DE DATOS
Para agrupar los datos es necesario determinar un rango, el número de clases y elaborar
los intervalos de clase:
Fórmula: Notación:
R es el rango.
R = Vmáx - Vmín Vmáx es el dato más grande
Vmín es el dato más pequeño
R = 154 - 120 = 34
11
2.b) Procedimiento utilizado en la industria:
En el ejemplo que estamos desarrollando escogeremos seis clases, pero podemos escoger
5 ó 7, esto no afecta significativamente el resultado.
3. Se elaboran los intervalos (amplitud) de clase:
35 ÷ 6 = 5.8, se redondea a 6.
Agrupamiento de datos.
Clase Frecuencia
(Unidades) "f"
120 - 125 5
126 - 131 10
132 - 137 6
138 - 143 7
144 - 149 3
150 - 155 4
12
1.3 Representación de datos (gráficas y sus tipos; tablas)
1.3.1. DIAGRAMA DE PARETO
PROBLEMA FRECUENCIA
A 16
B 9
C 8
D 2
E 1
DIAGRAMA DE PARETO
13
40.00
100%
30.00
80%
FRECUENCIA
Porcentaje
60%
20.00
40%
10.00
16.00
20%
9.00 8.00
2.00 1.00
0.00 0%
A B C D E
PROBLEMA
14
VENTAS
35
30
25
Frecuencia
20
VENTAS
15
10
0
1er. 2do. 3er. 4to.
Clase
Histograma de frecuencias
TRIMESTRE VENTAS
1 16
2 28
3 32
4 18
15
POLÍGONO
35
FRECUENCIA VENTAS 30
25
20
15
10
5
0
0 1 2 3 4 5
CLASE TRIMESTRE
Polígono de frecuencias
1.3.4. OJIVA
TRIMESTRE VENTAS
1 16
2 44
3 76
4 94
16
Ojiva
100
90
80
Frecueencia acumulada
70
60
50 VENTAS
40
30
20
10
0
1 2 3 4
Clase
Ojiva
17
1.4 Medidas de ubicación (tendencia central, dispersión,
posición y forma)
1.4.1 Tendencia central
Las medidas de tendencia central son valores numéricos que nos indican el
punto central o la mayor frecuencia de un conjunto de datos. De alguna manera miden
el centro o la parte media del universo o de la población o la posición central de una
serie de datos con respecto a un valor mayor y un valor menor. Por ejemplo:
1.4.1.1 MEDIA
18
La media de una muestra se define como:
Dados los valores X1, X2, ... Xn de una
muestra n, la media de la muestra se
obtiene de la siguiente manera: Notación:
_
X = La media de la muestra,
: Indica suma,
X = Cualquier dato y
n = Tamaño de la muestra
Se lee: La media de una muestra es igual
a la sumatoria de los datos entre
el tamaño de la misma.
PROMEDIO MÓVIL: Es una unidad de medida que sirve para determinar el valor de
un bien o servicio que se modifica muy frecuentemente, como una divisa, los bienes
que cotizan (se venden) en bolsa de valores, etc.
19
varios valores que se repiten con la misma frecuencia. Es posible que la moda no
exista, si ningún valor se repite más que los otros.
.95 .89 .93 1.02 .96 .97 .94 .99 .96 .87
Media:
Moda:
Por simple observación vemos que el valor que más se repite es .96
Mediana:
La mediana se calcula con los valores de la quinta posición: De izquierda a derecha .95
y de derecha a izquierda .96:
.87 .89 .93 .94 .95 .96 .96 .97 .99 1.02
Si solo existiesen 9 datos (por ejemplo que faltara 1.02) la mediana sería .95, cuatro
datos por cada lado:
20
Si el dato que faltase fuera .87, la mediana sería el primer .96.
Rango medio:
Ejemplos aplicados:
A1) MEDIA ARITMÉTICA:
Fórmula: Notación:
_
X = Media.
= Suma de los datos.
X = Datos. (ventas semanales)
n = Tamaño de la muestra. = 10 observaciones.
Solución:
21
Para solucionar el presente caso a través de Excel siga los siguientes pasos:
datos, separada por dos puntos consecutivos. (Por ejemplo A1..A10) y presione enter o
aceptar.
Interpretación:
Aplicación:
22
Calcular la media aritmética si la producción de un obrero durante un mes fue la
siguiente:
Fórmula: Notación:
_
X = Media.
= Suma de los datos.
X = Datos. (Unidades fabricadas)
n = Tamaño de la muestra =
24 observaciones.
Solución:
Interpretación:
Aplicación:
23
Calcular la media aritmética de defectos de una producción de cerraduras, si en
un muestreo al azar en 20 chapas se detectaron los siguientes errores:
Fórmula: Notación:
_
C X = Media.
= Suma de los datos.
X = Datos. (Unidades muestreadas)
n = Tamaño de la muestra =
20 observaciones.
Solución:
Interpretación:
Aplicación:
24
a) Ejemplo de media ponderada aplicado a la economía:
INCREMENTO DE PONDERACIÓN
PRODUCTOS
PRECIOS VENTAS EN UN PERIODO
Leche 12% $ 10,000
Gasolina 20 % $ 20,000
Azúcar 15 % $ 20,000
Pan 35 % $ 10,000
Fórmula: Notación:
Media ponderada
Sumatoria.
P = Ponderación.
X = Datos
Solución:
= 0.195 = 19.5%
Interpretación:
Aplicación:
25
Este promedio sirve para calcular la inflación en un período, claro que utilizando
los precios de más productos y servicios.
ELEMENTOS A
CALIFICACIÓN PONDERACIÓN
EVALUAR
90 40 %
Habilidades
Entrevista 80 30 %
Escolaridad 100 30 %
Fórmula: Notación:
_
Xp = Xp = Media ponderada.
Sumatoria.
P = Ponderación.
X = Datos.
La fórmula se lee: La media ponderada es igual a la sumatoria del producto de la
ponderación por los datos entre la sumatoria de ponderaciones.
Solución:
Aplicación: Este promedio sirve para evaluar a los aspirantes a ingresar a un empleo.
Se pueden agregar elementos a calificar y será un buen indicador para aceptar o
rechazar nuevos empleados.
Fórmula: Notación:
_
Xp = Media ponderada.
26
= Suma.
P = Ponderación.
X = Datos.
Solución:
Fórmula: Notación:
Media geométrica.
= Producto de todos los
elementos de la muestra.
Xi = Datos.
Se lee: La media geométrica es igual a
n = Tamaño de la muestra.
la raíz n del producto de todos los
= Raíz enésima.
elementos de la muestra, donde n es el
número de elementos.
Solución:
Porciento de inflación = Índice inflacionario menos 1 por 100: [(1.2453 - 1) * 100] =24.53%
Para solucionar el presente caso a través de Excel siga los siguientes pasos:
27
3. En el cuadro de categoría de función localice “Estadísticas” y presione “clic” (botón
izquierdo del mouse), después en el cuadro de nombre de la función encuentre
“MEDIA GEOM” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en donde están
los datos, separada por dos puntos consecutivos. (Por ejemplo A1..A4) y presione
enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.
Interpretación:
Aunque hay un salto muy fuerte sobre la media (51.97% en 1995), que casi
siempre se debe a situaciones extraordinarias (la devaluación en Dic. de 1994), la
mitad de los datos se ubican arriba de la media y la otra mitad abajo. En todas las
medias (aritmética, ponderada, geométrica) los datos siempre tenderán a que la mitad
de las observaciones queden arriba de ella y la otra mitad abajo.
Aplicación:
Sirve para hacer proyecciones cuando los datos son extremosos. Hay que
recordar que los datos siempre tienen relación con la media.
FÓRMULA: Notación:
Para muestra: Para población: h = Media armónica de una muestra.
a = Media armónica de una
población.
n = Tamaño de la muestra.
N = Tamaño de la población.
= Sumatoria.
x = Cualquier dato.
Máquina 1 2 3 4 5 6
piezas 20 18 15 24 12 15
28
Para solucionar el presente caso a través de Excel siga los siguientes pasos:
Interpretación:
Aplicación:
PROMEDIO MÓVIL
29
Se utiliza para calcular el valor de un bien [generalmente las divisas o las
acciones que cotizan (se venden) en bolsa de valores] que se está modificando
frecuentemente.
Fórmula: Notación:
_
Xm = Promedio móvil.
= Suma.
X = Datos.
n = Número de términos.
Solución:
Solución:
A4) MODA
30
8, 8, 7, 6, 7, 5, 7, 8, 10, 5, 8, 9, 10, 7, 7, 8, 8
No existe fórmula para determinar la moda cuando los datos no están agrupados. Se
obtiene por simple observación:
Pasos:
5, 5, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 9 10, 10
Interpretación:La mayoría de las personas utilizan zapatos No. 8. La medida que más se repitió
fue "8".
Datos agrupados. Los datos están agrupados cuando se clasifican de acuerdo a una
característica o clase. ejemplo, con los datos anteriores:
31
Edad (Clase) Frecuencia
17 - 18 6
19 - 20 3
21 - 22 2
23 - 24 1
O también:
Edad (Clase) 17 18 19 20 21 24
Frecuencia 2 4 2 1 2 1
Como se observa, los datos se agrupan, de acuerdo a la característica "edad".
Clase. Los datos se "agrupan" en "clases", hacemos "paquetes" con ellos, indicando la
frecuencia con la que aparecen. Cuando hacemos esto, estamos manejando datos
agrupados.
MEDIA:
Los conceptos de media, moda y mediana son los mismos tanto para datos
agrupados como para no agrupados. La media es el promedio de un conjunto de datos.
La fórmula de la media para datos agrupados es:
f = Frecuencia
x = Marca de clase o punto
medio o rango medio.
N = Tamaño de la población.
n = Tamaño de la muestra.
La fórmula se lee: La media es igual a la sumatoria de la frecuencia por la marca de clase, entre
el tamaño de la población o de la muestra.
Trab. a 126 Trab. h 148 Trab. ñ 126 Trab. u 137 Trab.bb 122
32
Trab. b 120 Trab. i 132 Trab. o 154 Trab. v 142 Trab.cc 127
Trab. c 125 Trab. j 123 Trab. p 138 Trab. w 134 Trab.dd 142
Trab. d 130 Trab. k 132 Trab. q 140 Trab. x 126 Trab.ee 128
Trab. e 150 Trab. l 150 Trab. r 129 Trab. y 145 Trab.ff 128
Trab. f 130 Trab.m 142 Trab. s 133 Trab. z 139 Trab.gg 140
Trab. g 151 Trab. n 124 Trab. t 130 Trab.aa 135 Trab.hh 145
Recuerde: x es el punto medio: (suma de los límites entre dos), para la primera clase:
Clase Frecuencia
x fx
(Unidades) "f"
120 - 125 5 122.5 612.5
126 - 131 10 128.5 1285.0
132 - 137 6 134.5 807.0
138 - 143 7 140.5 983.5
144 - 149 3 146.5 439.5
150 - 155 4 152.5 610.0
Suma 4737.5
Población:
Este problema se puede resolver con excel utilizando los mismos pasos que
para datos no agrupados. El resultado será más exacto (134.943 135). Se
agrupan datos para ahorrar tiempo en su proceso, pero si el cálculo se hace
con computadora, no es necesario agruparlos. El resultado de 126 es más
exacto por que se utilizaron datos individuales y no por que se utilizó
computadora. La computadora sólo ahorra tiempo en el proceso.
Aplicación: Un trabajador debe producir alrededor de 135 piezas, esto no quiere decir
que siempre fabricará 135. Este es un estándar que un gerente de producción debe
33
cuidar, que no produzcan ni muy por arriba ni muy por debajo de esta media. (Ver
desviación estándar)
MODA:
La fórmula para obtener la moda con datos agrupados es:
Fórmula Notación:
= Moda
Li = Límite exacto (frontera)
inferior de la clase que
contiene a la moda.
d1 = Diferencia absoluta entre la
frecuencia de la clase que
contiene a la moda y la de
la clase anterior.
d2 = Diferencia absoluta entre la
frecuencia de la clase que
contiene a la moda y la clase
posterior.
i = Amplitud del intervalo de
clase.
La fórmula se lee: La moda es igual al límite exacto inferior de la clase que contiene a
la moda más la proporción de la diferencia absoluta anterior multiplicada por la amplitud
del intervalo de clase.
Fórmula
34
144 - 149 143.5 - 149.5 3
150 - 155 149.5 -155.5 4
Determinación de elementos:
Li = 125.5
d1 = 5
d2 = 4
i = 6
Este problema se puede resolver con excel utilizando los mismos pasos que
para datos no agrupados, y el resultado será más exacto (126). Recuerde que
se agrupan datos para ahorrar tiempo en su proceso, pero si el cálculo se hace
con computadora, no es necesario agruparlos. El resultado de 126 es más
exacto por que se utilizaron datos individuales y no por que se utilizó
computadora. La computadora sólo ahorra tiempo en el proceso.
35
1.4.2 Medidas de posición
36
2) Si las observaciones son en número par, la mediana es el promedio de los dos
valores centrales.
CUARTIL: Al igual que el decil, el cuartil es una medida de posición que divide un
conjunto de datos, pero en cuatro partes iguales.
37
5) MEDIANA.
7, 8, 6, 7, 8, 8, 7, 8, 6, 7, 7
Pasos:
6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8
2. Se determina la posición:
Fórmula: Solución:
Mediana
38
Para solucionar el presente caso a través de Excel siga los
siguientes pasos:
1. Ingrese a Excel y capture los datos.
2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx).
3. En el cuadro de categoría de función localice “Estadísticas” y presione
“clic” (botón izquiero del mouse), después en el cuadro de nombre de la
función encuentre “MEDIANA” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en
donde están los datos, separada por dos puntos consecutivos. (Por
ejemplo A1..A10) y presione enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el
resultado.
B) Ejemplo de obtención de mediana con una muestra par:
7, 8, 6, 7, 8, 8, 7, 8, 6, 7
Pasos:
6, 6, 7, 7, 7, 7, 8, 8, 8, 8
2. Se determina la posición:
39
Interpretación: Tanto para las cifras pares como para las nones se cumple con la regla
de que la mitad de los datos están arriba de la mediana y la otra mitad abajo.
20, 32, 25, 34, 21, 22, 33, 24, 36, 30, 22
Pasos:
fórmula: Notación:
C1 = Cuartil 1
n = Número de
datos.
Solución:
40
1er. cuartil
20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36
Fórmula: Notación:
C2 = Cuartil 2
n = Número de datos.
Solución:
1er. cuartil
20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36
2do. cuartil
Fórmula: Notación:
C3 = Cuartil 3
n = Número de datos.
Solución:
41
1er. Cuartil 3er. cuartil
20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36
2do. cuartil
Fórmula: Notación:
C4 = Cuartil 4
n = Número de datos.
Solución:
20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36
Interpretación:
42
1. Para el primer cuartil: A la izquierda del primer siete se encuentra el 25% de los
datos. (Una cuarta parte),.
2. Para el segundo cuartil: en este caso es igual a la media, porque 1/4 + 1/4 = 1/2.
3. Para el tercer cuartil: a la izquierda del segundo ocho se encuentra el 75% de los
datos (3/4 partes).
4. Para el cuarto cuartil. A su izquierda se encuentran todos los datos, porque 4/4 = 1.
Aplicación: Aunque no es muy común, se puede aplicar cuando se quiere cortar los
extremos de un conjunto de datos, para tener una muestra más centrada.
Donde:
P es percentil
x es el dato buscado
n el tamaño de la muestra
20, 32, 25, 34, 21, 22, 33, 24, 36, 30, 22
Pasos:
1. Ordenar los datos:
20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36
Percentil 90
20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36
43
Para solucionar este caso a través de Excel siga los siguientes pasos:
1. Después de ingresar a Excel capture los datos.
2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx).3. En el
cuadro de categoría de función localice “Estadísticas” y presione “clic” (botón
izquiero del mouse), después en el cuadro de nombre de la función
encuentre “PERCENTIL” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Matriz” anote las celdas inicial y final en donde
están los datos, separada por dos puntos consecutivos. (Por ejemplo
A1..A11) y presione “clic”, en el cuadro de “K” anote el percentil en decimal y
oprima enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.
DECIL PERCEN
TIL
1 10
1.5 15
2 20
3 30
4 40
5 50
6 60
7 70
8 80
9 90
10 100
Partes por millón: Esta medida de posición se utiliza principalmente en los programas
de calidad. Actualmente la producción de “clase mundial” se fabrica con márgenes de eficiencia
44
casi perfectos, ya que los errores se cuentan en partes por millón. Por ejemplo en una fábrica de
chips, por cada millón de piezas elaboradas, de acuerdo a la inspección electrónica, 240 tienen
defectos:
Hay aparatos que tienen muchos componentes, por ejemplo un avión, una
computadora, un automóvil, etc., en donde si un componente tiene error, el aparato
puede que deje de funcionar, por esto se deben eliminar las fallas, además es la
exigencia del mercado mundial.
Datos no agrupados. Datos con los que se trabaja conforme van apareciendo o se
colectaron, por ejemplo, al preguntarle la edad a un grupo de alumnos de 1er.
semestre, se obtuvo: 19, 18, 21, 18, 17, 20, 18, 17, 21, 19, 24, 18, ... etc.
Datos agrupados. Los datos están agrupados cuando se clasifican de acuerdo a una
característica o clase. ejemplo, con los datos anteriores:
45
MEDIANA:
Notación:
Fórmula
ed= Mediana
Li = Límite exacto (frontera)
inferior de la clase que
contiene a la mediana.
n = Número de datos.
fAa = Frecuencia acumulada
anterior de la clase en que
se encuentre la mediana.
f = Frecuencia de la clase que
contiene a la mediana.
i = Amplitud del intervalo de
clase.
Frecuenci
Límite exacto Frecuenci a
Clase
o frontera a acumulad
(Unidades)
(Li) "f" a
FA
120 - 125 119.5 - 125.5 5 5
126 - 131 125.5 -131.5 10 15
132 - 137 131.5 -137.5 6 21
138 - 143 137.5 - 143.5 7 28
144 - 149 143.5 - 149.5 3 31
150 - 155 149.5 -155.5 4 35
46
Determinación de elementos:
fAa = 15 f=6
i = Amplitud del intervalo de clase = 6
n/2= 17.5
Li = 131.5
fAa = 15
f = 6
i = 6
Este problema se puede resolver con excel utilizando los mismos pasos que
para datos no agrupados, y el resultado será más exacto (133). Recuerde
que se agrupan datos para ahorrar tiempo en su proceso, pero si el cálculo
se hace con computadora, no es necesario agruparlos. El resultado de 133
es más exacto por que se utilizaron datos individuales y no por que se
utilizó computadora.
47
La fórmula de la mediana sirve para calcular cuartiles, deciles y percentiles, con
las siguientes adecuaciones:
CUARTIL
Nótese como sólo cambia Med (mediana) por C1 (Primer cuartil) y n/2 por n/4,
todos los demás datos son iguales. Para el segundo cuartil ( C2), el resultado es
exactamente igual a la mediana y para el tercer cuartil ( C3) n/2 se modifica a 3n/4.
Frecuenci
Límite exacto Frecuenci a
Clase
o frontera a acumulad
(Unidades)
(Li) "f" a
FA
120 - 125 119.5 - 125.5 5 5
126 - 131 125.5 -131.5 10 15
132 - 137 131.5 -137.5 6 21
138 - 143 137.5 - 143.5 7 28
144 - 149 143.5 - 149.5 3 31
150 - 155 149.5 -155.5 4 35
3n / 4 = 26.25
Li = 137.5
fAa = 21
48
f = 7
i = 6
Este problema se puede resolver con excel utilizando los mismos pasos que
para datos no agrupados, el resultado coincide (142). Recuerde que se
agrupan datos para ahorrar tiempo en su proceso, pero si el cálculo se hace
con computadora, no es necesario agruparlos.
Aplicación: Se utiliza para cortar los extremos de una muestra (los datos atípicos o
que se salen de lo normal), para centrar los datos.
DECIL Formula:
Nótese como sólo cambia Med (mediana) por D7 (Séptimo decil) y n/2 por
7n/10, todos los demás datos son iguales. Para cualquier decil, n/2 se modifica a
deciln/10.
Decil 1 es igual a percentil 10, decil 1.5 es igual a percentil 15, decil 8 es igual a
percentil 80, etc.
PERCENTIL
Fórmula:
49
Nótese como sólo cambia Med (mediana) por P70 (Percentil 70. Setenta indica
el porcentaje buscado) y n / 2 cambia por 70 n / 100, todos los demás datos son
iguales. Para cualquier percentil n / 2 se modifica a percentil n / 100.
Frecuenci
Límite exacto Frecuenci a
Clase
o frontera a acumulad
(Unidades)
(Li) "f" a
FA
120 - 125 119.5 - 125.5 5 5
126 - 131 125.5 -131.5 10 15
132 - 137 131.5 -137.5 6 21
138 - 143 137.5 - 143.5 7 28
144 - 149 143.5 - 149.5 3 31
150 - 155 149.5 -155.5 4 35
Determinación de elementos:
Li = 149.5 fAa = 31
i = Amplitud del intervalo de clase
=6
50
fAa = 31
f = 4
i = 6
Formula:
Este problema se puede resolver con excel utilizando los mismos pasos que
para datos no agrupados, el resultado de excel (150.3 150) es más exacto
por que se usaron datos no agrupados. Recuerde que se agrupan datos para
ahorrar tiempo en su proceso, pero si el cálculo se hace con computadora,
no es necesario agruparlos.
1.4.3 DISPERSIÓN
51
RANGOS: Recuerda que el rango es la diferencia entre los valores extremos -valor
más grande menos valor más pequeño de una serie de datos-, por lo tanto es una
medida de dispersión o de variabilidad y se utiliza para determinar el intervalo de clase,
para saber la variación total de los datos y para elaborar las gráficas en control de
calidad. Su fórmula es: R = Vmáx. - Vmín.
Notación:
Fórmula:
DM = Desviación media absoluta.
(Algunos autores utilizan DMA.)
= Suma _
Recuerde: Una cantidad entre dos rayas
X = Cualquier dato, X = Media
indica valor absoluto.
n = Tamaño de la muestra
52
Fórmula de la media:
Obtención de la media:
53
Obtención de la desviación media absoluta:
|17-18.2| + |20-18.2| + |16-18.2| + |18-18.2| + |17.18.2| + |16-18.2| + |19-18.2| + |20-18.2| + |21-18.2| + |18-18.2|
DM= =
10
|17-18.2| = 1.2
|20-18.2| = 1.8
|16-18.2| = 2.2
|18-18.2| = 0.2
|17-18.2| = 1.2
|16-18.2| = 2.2
|19-18.2| = 0.8
|20-18.2| = 1.8
|21-18.2| = 2.8
|18-18.2| = 0.2
14.4 DM = 14.4
10 = 1.44
Interpretación: Las ventas semanales tienen una desviación promedio de 1.44 con
respecto a la media.
54
VARIANZA Y DESVIACIÓN ESTÁNDAR
La fórmula es:
Notación:
2 = Varianza de una población.
2
S = Varianza de una muestra.
= Suma de datos.
X = Cualquier dato. _
= Media para una población.X = Media para una muestra.
N = Número de datos de una población.
n = Número de datos de una muestra.
\
18, 21, 17, 19, 18, 17, 20, 23, 22, 21, 23, 21.
55
Semana Ventas _ _ _
X X ( X - X) X - X )
2
1 18 18 - 20 = -2 (-2) 2 = 4
2 21 21 - 20 = 1 ( 1) 2 = 1
3 17 17 - 20 = -3 (-3) 2 = 9
4 19 19 - 20 = -1 (-1) 2 = 1
5 18 18 - 20 = -2 (-2) 2 = 4
6 17 17 - 20 = -3 (-3) 2 = 9
7 20 240/12 = 20 20 - 20 = 0 ( 0) 2 = 0
8 23 23 - 20 = 3 ( 3)2 = 9
9 22 22 - 20 = 2 ( 2) 2 = 4
10 21 21 - 20 = 1 ( 1) 2 = 1
11 23 23 - 20 = 3 ( 3) 2 = 9
12 21 21 - 20 = 1 ( 1) 2 = 1
_
= 240 X - X )
2 = 52
Para solucionar el presente caso a través de Excel siga los siguientes pasos:
56
Para una población la fórmula se lee: la desviación estándar es igual a la raíz cuadrada
de la suma de los valores menos la media al cuadrado, entre el número de datos. Para
una muestra es similar sólo hay que agregar entre el número de datos menos uno. O
de una manera abreviada: la desviación estándar es la raíz cuadrada de la varianza.
2
S = 4.7 y despejando: S = = 2.17 2.2
57
2 = Nivel de confianza de 95.44 %. ( )
3 = Nivel de confianza de 99.73 %.( )
Fórmula: Notación:
Rc es rango intercuartil.
Se lee: El rango intercuartil es igual C3 es el tercer cuartil.
al tercer cuartil menos el primero. C1 es el primer cuartil
Suponga que se obtuvieron los cuartiles: C 1 fue 22 y C3 fue 33, con estos datos
vamos a calcular el rango intercuartil:
58
Sesgo o asimetría: es una medida estadística que nos indica hacia que lado están
cargados los datos, -hacia donde es el sesgo o la asimetría-. La estadística trabaja con
las llamadas curvas normales, en donde la mayoría de los datos se ubican en el medio
o el centro de la misma, sin embargo hay ocasiones en donde los datos se cargan
hacia la derecha o hacia la izquierda de la curva, en este caso estamos hablando de
sesgo o asimetría.
CA = Coeficiente de asimetría.
_
= X = Media.
Se lee: El coeficiente de asimetría es igual a tres X = Mediana.
veces la media menos la mediana entre
la desviación estándar. = S = Desviación
estándar.
Ejemplo: Los siguientes datos representan los diámetros en milímetros de una muestra
de balines:
7, 6, 8, 7, 7, 6, 8, 9, 7, 8
Pasos:
Determinamos la media:
Obtenemos la mediana:
X = 6, 6, 7, 7, 7, 7, 8, 8, 8, 9 = ( 7 + 7 ) / 2 = 7
59
Calculamos la desviación estándar:
7, 6, 8, 7, 7, 6, 8, 9, 7, 8
_
X-X
7 - 7.3 = - 0.3 0.09
6 - 7.3 = - 1.3 1.69
8 - 7.3 = 0.7 0.49
7 - 7.3 = - 0.3 0.09
7 - 7.3 = - 0.3 0.09
6 - 7.3 = - 1.3 1.69
8 - 7.3 = 0.7 0.49
9 - 7.3 = 1.7 2.89
7 - 7.3 = - 0.3 0.09
8 - 7.3 = 0.7 0.49
8.10
Resolvemos:
Para solucionar el presente caso a través de Excel siga los siguientes pasos:
Aplicación. Este dato sirve para determinar que prueba de hipótesis es conveniente
aplicar.
60
Notación:
Fórmula:
CA = Coeficiente de asimetría.
X = Cualquier dato.
Se lee: El coeficiente de asimetría es igual al _
número de datos, entre el producto de n menos 1 X = Media.
por n menos 2, que multiplica a la sumatoria del
cubo de la diferencia entre cualquier dato y la n = Tamaño de la muestra.
media dividida entre la desviación estándar.
S = Desviación estándar.
n 10 10
= = = .1388 .14
(n - 1) (n - 2) (10 - 1) (10 - 2) 9X8
_ _ _
X-X (X - X) ÷ S [(X - X) ÷ S]3
7 - 7.3 = - 0.3 - 0.3 ÷ 0.95 = -0.31579 -0.03149
6 - 7.3 = - 1.3 - 1.3 ÷ 0.95 = -1.36842 -2.56247
8 - 7.3 = 0.7 0.7 ÷ 0.95 = 0.73684 0.40005
7 - 7.3 = - 0.3 - 0.3 ÷ 0.95 = -0.31579 -0.03149
7 - 7.3 = - 0.3 - 0.3 ÷ 0.95 = -0.31579 -0.03149
6 - 7.3 = - 1.3 - 1.3 ÷ 0.95 = -1.36842 -2.56247
8 - 7.3 = 0.7 0.7 ÷ 0.95 = 0.73684 0.40005
9 - 7.3 = 1.7 1.7 ÷ 0.95 = 1.78947 5.73028
7 - 7.3 = - 0.3 - 0.3 ÷ 0.95 = -0.31579 -0.03149
8 - 7.3 = 0.7 0.7 ÷ 0.95 = 0.73684 0.40005
1.67954
61
Para solucionar el presente caso a través de Excel siga los siguientes
pasos:
1. Después de ingresar a Excel, capture los datos.
2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx)
3. En el cuadro de categoría de función localice “Estadísticas” y presione “clic”
(botón izquierdo del mouse), después en el cuadro de nombre de la función
encuentre “COEFICIENTE.ASIMETRIA” oprima “clic” y presione enter o
aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en
donde están los datos, separada por dos puntos consecutivos. (Por ejemplo
A1..A10) y presione enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.
Fórmula: Notación:
K = Curtosis.
C3 = Tercer cuartil.
La fórmula se lee: La curtosis C1 = Primer cuartil.
es igual a un medio del tercer P90 = Percentil 90
cuartil menos el primero, entre
el percentil 90 menos el P10 = Percentil 10
percentil 10.
62
Donde: S es la desviación estándar de la muestra.
1. Ejemplo:
Los datos pertenecen a una distribución
platicurtica debido a que la kurtosis es
negativa.
63
1.- Localizar data Análisis PARA WINDOWS 7
64
3. Seleccionar estadística descriptiva, histograma, generación de números
aleatorios, rango o percetiles, dependiendo de lo que nos interese en el
problema.
65
cantidad de números aleatorios o variables aleatorias, el tipo de distribución de
probabilidad con el valor de sus respectivos parámetros (media y desviación
estándar) y el rango de salida (Posición donde quiero los resultados) de lo contrario
los resultados se asignan en una hoja nueva o en un libro nuevo.
66
En el cuadro de de dialogo para histograma, es indispensable asignar el rango de
entrada (posición de nuestros datos), el rango de limites de clases y el rango de salida
(Posición donde quiero los resultados) de lo contrario los resultados se asignan en una
hoja nueva o en un libro nuevo.
Es importante aclarar que lo que vamos a obtener será una distribución de frecuencias
que mediante el asistente de funciones graficas se pude convertir en la representación
grafica deseada.
67
En el cuadro de de dialogo para promedios móviles, es indispensable asignar el rango
de entrada (posición de nuestros datos), el intervalo del promedio móvil y el rango de
salida (Posición donde quiero los resultados) seleccionar la grafica y el error estándar.
EJERCICIOS:
CUESTIONARIO
1. ¿Qué significa el término distribución?
2. ¿Qué significa el término frecuencia?
3. ¿Qué es distribución de frecuencia?
4. ¿Qué es una clase?
5. ¿De qué otra manera se le llama a una clase?
6. ¿Que es un límite inferior?
7. ¿Qué es un límite superior?
8. ¿A qué se le llama frecuencia absoluta?
9. ¿A qué se le llama frecuencia acumulada?
10. ¿A qué se le llama frecuencia relativa?
11. ¿A qué se le llama frecuencia acumulada relativa?
68
12. ¿Qué es una marca de clase?
13. ¿Qué es un intervalo de clase?
14. ¿Qué es un diagrama de pareto?
15. ¿Cómo se elabora un diagrama de pareto?
16. ¿Qué es un histograma de frecuencia?
17. ¿Cómo se elabora un histograma de frecuencia?
18. ¿Qué es un polígono de frecuencias?
19. ¿Cómo se elabora un polígono de frecuencias?
20. ¿Qué es una ojiva?
21. ¿Cómo se elabora una ojiva?
PREGUNTAS DE CRITERIO
1. ¿Cuál es la diferencia entre una frecuencia absoluta y una relativa?
2. ¿Cuál es la diferencia entre un diagrama de pareto y un histograma de
frecuencias?
3. ¿Cuál es la semejanza entre un polígono de frecuencia y una ojiva?
EJERCICIO
I. El tiempo utilizado por los clientes de un banco en un cajero automático fue el
siguiente, medido en segundos:
Se pide:
1) Determine los límites inferior y superior.
2) Elabore cinco clases.
3) Determine el intervalo de clase.
4) Calcule la marca de clase.
5) Construya la distribución de frecuencias:
a) Absoluta.
b) Acumulada.
c) Relativa (En fracción, decimal y porciento).
d) Relativa acumulada (En fracción, decimal y porciento).
6) Elabore el histograma de frecuencia (absoluta y relativa).
7) Desarrolle los polígonos de frecuencia (relativa y absoluta).
8) Construya las ojivas (relativa y absoluta).
9) Calcule la media, la moda y la mediana para datos agrupados.
10)Calcule la desviación estándar, el coeficiente de asimetría y la Kurtosis y
caracterice a la distribución.
69
II. El consumo de latas de refresco en un evento fue de:
161 262 242 192 412 363 272 163 282 237
147 202 462 162 187 351 197 204 227 357
161 254 301 209 191 238 457 211 295 250
283 131 423 108 282 116 356 243 394 144
245 338 435 189 242 258 197 209 382 358
197 276 293 257 188 402 327 268 304 154
Se pide:
III. Una empresa dedicada a la fabricación de artículo de madera determinó las fallas
por lote de puertas elaboradas, las cuales fueron:
70