Está en la página 1de 70

UNIDAD I.

UNIDAD I. Introducción a la estadística Duración: 12 HORAS

Competencia: Calcular los indicadores descriptivos de tendencia


central, posición, forma y variabilidad de datos agrupados y no
agrupados, además de su representación gráfica, para conocer el
comportamiento de las variables, mediante el uso de tecnologías de la
información, con responsabilidad, actitud ordenada y analítica.

Contenido Temático, Duración: 3 horas


1.1. Conceptos generales de estadística (definición, tipos de estadística,
importancia, población, muestra, tipos de variables, escalas de medición)
1.2. Distribución de frecuencia
1.3. Representación de datos (gráficas y sus tipos; tablas)
1.4. Medidas de ubicación (tendencia central, dispersión, posición y
forma)
1.1 Conceptos generales de estadística (definición, tipos de
estadística, importancia, población, muestra, tipos de variables,
escalas de medición)
En Alemania, en la década de los 30’s, buscando conocer la popularidad de
Hitler, desarrollaron una metodología con base a encuestas y cálculos matemáticos,
como el resultado se consideró cuestión de "ESTADO", al instrumento con el que
hicieron el estudio le llamaron "ESTADÍSTICA", por lo tanto, ésta palabra se origina del
vocablo "estado", además quienes más la utilizaban eran los gobiernos.

En la actualidad la estadística se aplica en cualquier nivel y puede entenderse


como una ciencia matemática que se encarga de colectar, procesar, analizar,
interpretar y presentar información, o de una manera sencilla, la estadística se
encarga de recolectar y analizar datos para la toma de decisiones. Su definición
puede ser:

1.1.1 Definición de estadística:

Ciencia que tiene por objeto reunir, clasificar, contar, analizar e


interpretar los hechos de un mismo orden, como nacimientos,
defunciones, riqueza de un estado, nivel socioeconómico o de
escolaridad de la población, etc. y los métodos utilizados.

Descripción:

1
Ciencia.

Que tiene por objeto reunir.

Clasificar.

Contar.

Analizar.

Interpretar.

Los hechos de un mismo orden.

Los métodos utilizados.

La estadística -que es una ciencia aproximativa- tiene como interés primario la


formulación e interpretación de métodos para el análisis de información, que sirva en la
obtención de conclusiones útiles. Se divide en dos áreas importantes: Estadística
descriptiva y estadística inferencial.

1.1.2 Tipos de estadística

Estadística descriptiva. -Describe los hechos-

Se encarga de recopilar, tabular y presentar información. Tiene que ver con las
representaciones gráficas y el cálculo de las llamadas medidas de tendencia central y
de dispersión. Se auxilia con gráficas para facilitar la interpretación. Por ejemplo, en las
últimas elecciones el 57% votó por el PAP, el 34% por el PIP y el 9% por el POP.

Estadística inferencial. -Infiere o pronostica-

Se refiere al análisis e interpretación de la información. La estadística inferencial


utiliza a la estadística descriptiva (conjunto de datos numéricos) para sacar una
consecuencia, basadas en el cálculo de probabilidades. Por ejemplo, si las preferencias
de los votantes de mantienen, las elecciones de los próximos tres años las debe de
ganar el PAP. Otro ejemplo sería: si está nublado... es probable que llueva (se infiere
que va a llover), porque las últimas "X" veces que ha estado nublado, ha llovido.

Se combina la estadística descriptiva con la teoría de


la probabilidad para aplicarla en la toma de decisiones.

2
1.1.3 Importancia: Los directivos de empresas utilizan la estadística como ayuda
para tomar decisiones ante la incertidumbre. 
La estadística puede utilizarse para realizar proyecciones de ventas, análisis financie-
ros de proyectos de gasto de capital, construir proyecciones de beneficios para un nue-
vo producto, establecer cantidades de producción y hacer un análisis de muestreo para
determinar la calidad de un producto. 

El uso de la estadística proporciona datos reales sobre situaciones complejas en lugar


de tomar decisiones basadas en corazonadas sin fundamento. Un directivo debe tener
la capacidad de observar los datos y hacer predicciones sobre el futuro de la empresa
o de un departamento concreto. Hoy en día, cada decisión debe estar respaldada por
datos empíricos concretos, de ahí la importancia de la estadística en una empresa

1.1.4 Población N

La población o universo es el conjunto total de objetos individuales o personas


de interés en un estudio. Es el grupo que se va a observar, estudiar o predecir. La
estadística trata de llegar a conclusiones referentes a la población, a través del estudio
de una fracción de ella. Las notaciones de una población son parámetros y se señalan
en letras griegas:

µ= Media, σ = Desviación estándar, = Proporción, etc.

1.1.5 Muestra n

Estudiar totalmente una población a veces no es práctico ni costeable; si


encontramos como se comporta una parte de ella podemos intuir, con un nivel de
certeza aceptable, que la totalidad del universo actuará de la misma forma o cuando
menos, de manera similar. Por ejemplo, para predecir el resultado de unas elecciones,
no es necesario preguntarle a la totalidad de los votantes por quien sufragará (votará)
para conocer el posible resultado, basta con cuestionar a una muestra representativa
de los electores y con sus respuestas predecir, con un alto grado de certeza, quien
ganará. Para conocer la eficiencia de los cerillos no es necesario -ni costeable-
encenderlos todos, basta con una muestra representativa.

Una muestra es una fracción representativa del universo o el


subconjunto de la población que es observada realmente.

Las notaciones para la muestra son estadígrafos o estadísticos y se indican con


letras latinas:

3
_
X = Media, S = Desviación estándar, P = Proporción, etc.

A la X con una barrita encima se le llama equis barra.

1.1.6 Tipos de variables

Variable aleatoria

Variable es un término utilizado para indicar que el valor de una cosa se puede
modificar (varía, variable). El cambio de valor de una cosa puede ser por causas de sí
misma o por factores ajenos, Por ejemplo:

Aleatoria: Que depende del azar o de la casualidad.

Por lo anterior, una variable aleatoria puede tomar


cualquier valor, sin tener una regla determinada.

Variable aleatoria categórica o cualitativa: Es aquella variable que sólo


puede tomar asignaciones nominales o características, por ejemplo: color, sexo,
profesión, estado civil, lugar de residencia, etc.

Variable aleatoria discreta: Es aquella que toma valores que se puedan contar
pero no nos interesa medir: árboles en un bosque, alumnos en una escuela, autos
reparados, etc., En el siguiente ejemplo: ¿Cuántos refrigeradores se venden en un
mes? la variable es "refrigeradores" y puede que se vendan 20, 1000, 5000, etc.

Variable aleatoria continua: Es una variable que nos interesa medir en:

a) Tiempo: Hora, mes día, etc.


b) Peso: Gramo, kilogramo, libra, etc.
c) Longitud: Metro, milla, decímetro, etc.

Por ejemplo ¿En cuánto tiempo se pueden vender 100 refrigeradores? La


variable es el tiempo y depende de cuando se llegue a la meta. Puede ser en un día, en
una semana, en un año, etc.

A la variable continua algunos tratadistas le denominan simplemente "variable" y


a la variable discreta y categórica le llaman "atributos".

4
CLASIFICACIÓN DE VARIABLES

Variable
Cualitativa Cuantitativa
o categórica Discreta Continua
Sexo: hombre o Hijos por mujer Peso del hijo
mujer
Sexo Cantidad Hijos/muj. Mujeres Peso Cantidad

Hombre 77 0 8 Menor a 1 10
1 13 De 1 a 1.5 15
Mujer 75 2 19 De 1.5 a 2 30
3 15 De 2 a 2.5 80
4 9 De 2.5 a 3 40
5 7 De 3 a 3.5 15
6 ó mas 4 Mas de 3.5 5

1.1.7 Escalas de medición


Las escalas de medición se utilizan para categorizar y/o cuantificar variables.
Describiremos las cuatro escalas de medición que se utilizan comúnmente en
el análisis estadístico: nominal, ordinal, intervalo y escalas de relación.

5
CUESTIONARIO
1.
¿De donde se origina el término estadística?
2.
Defina estadística.
3.
¿En qué áreas se divide la estadística?
4.
¿Qué es estadística descriptiva?
5.
¿Qué es estadística inferencial?
6.
¿Qué es una variable aleatoria?
7.
¿Cómo se clasifican las variables aleatorias?
8.
¿Qué es una variable aleatoria categórica?
9. Dé ejemplos de variables aleatorias categóricas.
9. ¿Qué es una variable aleatoria discreta?
10. Dé ejemplos de variables aleatorias discretas.
11. ¿Qué es una variable aleatoria continua?
12. Dé ejemplos de variables aleatorias continuas.
13. ¿Cómo reconocen algunas empresas a las variables continuas?
14. ¿Cómo reconocen algunas empresas a las variables discretas y categóricas?
15. ¿Qué es un muestreo aleatorio?
16. ¿Qué tipos de muestreo se acostumbran?
17. ¿Qué es un muestreo aleatorio simple?
18. ¿Qué es un muestreo aleatorio sistemático?
19. ¿Qué es un muestreo aleatorio estratificado?
20. ¿Qué es una población?
21. ¿Qué son las notaciones de una población?
22. ¿Con qué tipo de letras se señalan los parámetros?
23. ¿Qué es una muestra?
24. ¿Cómo se le llama a las notaciones de una muestra?
25. ¿Con qué tipo de letras se señalan los estadísticos?

PREGUNTAS DE CRITERIO

1. Explique o analice la definición de estadística.


2. ¿Porqué se dice que la estadística es una ciencia aproximativa?
3. ¿Cuál es la diferencia entre estadística descriptiva y estadística inferencial?
5. Conociendo el valor de un estadígrafo y el de un parámetro ¿cuál utilizaría y porqué?
6. ¿Porqué el muestreo aleatorio tiene requisitos tan estrictos?
7. Para una votación ¿qué tipo de muestreo aleatorio utilizaría y porqué?
8. En la producción, ¿qué tipo de muestreo aleatorio utilizaría y porqué?
9. Dé un ejemplo de una población homogénea donde utilice un muestreo aleatorio
simple.

6
10. ¿Cuándo se trabaja con una población y cuándo con una muestra?

PROBLEMA

Clasifique los siguientes datos como variables categóricas o cualitativas,


discretas o continuas:

a) El tiempo de las colas o líneas de espera en un banco.


b) El número de personas en una cola.
c) La edad de las personas en una cola.
d) El sexo de las personas en una línea de espera.
e) El modelo (año y marca) de los automóviles en un estacionamiento.
f) El número de componentes de una computadora
g) El número de accidentes en una fábrica.
h) El número de defectos en un producto.
i) El número de reclamos en una tienda.
j) La edad de las personas que hacen los reclamos.
k) La profesión de las personas que hacen los reclamos.
l) El número de llamadas telefónicas recibidas en una empresa.
m) El tiempo de duración de las llamadas telefónicas.
n) La procedencia de las llamadas.
o) La ocupación de quien hace las llamadas.
p) El tiempo utilizado para trasladarse al trabajo.
q) El lugar de trabajo.
r) La cantidad de artículos vendidos.
s) El costo de los artículos vendidos.
t) La calificación de un alumno en un examen.
u) La calificación de una persona para desempeñar un trabajo.
v) Los principales problemas de una ciudad.
w) Automóviles con publicidad de un partido político.
x) Automóviles con publicidad de un partido político determinado.

Acuda a una empresa o a un lugar público y:

1. Identifique cinco variables categóricas.


2. Identifique cinco variables discretas.
3. Identifique cinco variables continuas.

7
1.2 DISTRIBUCIÓN DE FRECUENCIA.
El término distribución significa agrupar, repartir o dividir una cosa y frecuencia
quiere decir el número de veces que ocurre o se repite un evento. La distribución de
frecuencias consiste en agrupar datos de acuerdo a cierta característica o clase. Es
una tabla de datos agrupados. Por ejemplo, dividir los alumnos de un grupo de
acuerdo a su sexo, peso y libros por alumno:

VARIABLE VARIABLE VARIABLE


CATEGÓRICA DISCRETA CONTINUA
CLASE O CLASE O
CLASE O FRECUEN- FRECUEN-
CATEGORÍA CATEGORÍA
CATEGORÍA CIA CIA
(libros/alumno) (peso)*
Alumnos 15 0-2 2 Hasta 60 Kg.
Alumnas 16 3-5 10 60.0 - 70.0
6-8 14 70.0 - 80.0
9 ó más 5 Más de 80.0
* Donde termina uno empieza el otro.
CLASE

Una clase, que también se le llama intervalo de clase, es un intervalo al que le


corresponde un determinado número de datos. Al valor más pequeño de un intervalo
de clase se le llama “límite inferior de clase” y al valor más grande se le llama “límite
superior de clase”. Ejemplo: en una encuesta sobre estatura se obtuvieron los
siguientes datos:

1.58 1.86 1.62 1.70 1.81 1.67 1.79 1.68 1.92 1.84 1.74
1.64
1.73 1.73 1.75 1.68 1.56 1.87 1.79 1.89 1.84 1.74 1.79
1.72
1.72 1.75 1.76 1.69 1.87 1.74 1.80 1.72 1.85 1.67 1.82
1.73

Como puede observarse, el límite inferior (el más pequeño) es 1.56 y el superior
(el más alto) es 1.92. Para agrupar los datos podemos formar “N” número de clases,
por ejemplo cinco, de 10 cm. en 10 cm. Para hacer la clasificación, cuando un dato se
encuentre en el límite lo consideraremos como elemento de la clase anterior, por
ejemplo 1.70 pertenece a la clase 1.60 - 1.70:

8
CLASE FRECUENCIA
1.50 - 1.60 2
1.60 - 1.70 8
1.70 - 1.80 16
1.80 - 1.90 9
1.90 - 2.00 1

1.2.1. FRECUENCIA ABSOLUTA.

Es el número de veces que se repite un dato (o una característica) en una clase.


Algunos autores le llaman simplemente "frecuencia".

Frecuencia absoluta o
CLASE
"FRECUENCIA"
1.50 - 1.60 2
1.60 - 1.70 8
1.70 - 1.80 16
1.80 - 1.90 9
1.90 - 2.00 1

1.2.2. FRECUENCIA ACUMULADA

La frecuencia acumulada se obtiene "acumulando" o sumando las frecuencias,


de manera sucesiva, conforme se va elaborando la tabla:

CLASE FRECUENCIA FRECUENCIA ACUMULADA


1.50 - 1.60 2 2
1.60 - 1.70 8 2 + 8 = 10
1.70 - 1.80 16 2 + 8 + 16 = 26
1.80 - 1.90 9 2 + 8 + 16 + 9 = 35
1.90 - 2.00 1 2 + 8 + 16 + 9 + 1 = 36
Total 36

9
1.2.3. FRECUENCIA RELATIVA

Es la frecuencia expresada en fracción, decimal o porcentaje. a veces se le


llama probabilidad relativa:

FRECUENCIA
CLASE FRECUENCIA RELATIVA
Fracción Decimal
1.50 - 1.60 2 2/36 0.0556
1.60 - 1.70 8 8/36 0.2222
1.70 - 1.80 16 16/36 0.4444
1.80 - 1.90 9 9/36 0.2500
1.90 - 2.00 1 1/36 0.0278
Total 36 36/36 1.0000

1.2.3.1. FRECUENCIA RELATIVA ACUMULADA

La frecuencia relativa acumulada se obtiene acumulando las frecuencias


relativas, de manera sucesiva, conforme se va avanzando:

Frecuen- FRECUENCIA RELATIVA FREC. REL.


CLASE cia ACUMULADA
Fracción Decimal Porciento Fracción Decimal
1.50 - 1.60 2 2/36 0.0556 5.56 % 2/36 0.0556
1.60 - 1.70 8 8/36 0.2222 22.22 10/36 0.2778
1.70 - 1.80 16 16/36 0.4444 44.44 26/36 0.7222
1.80 - 1.90 9 9/36 0.2500 25.00 35/36 0.9722
1.90 - 2.00 1 1/36 0.0278 2.78 36/36 1.0000
Total 36 36/36 1.0000 100.00 %

1.2.4. MARCA DE CLASE

Es el punto central o promedio de una clase, se obtiene sumando los límites


inferior y superior y el resultado se divide entre dos. Por ejemplo:

CLASE MARCA DE CLASE


1.50 - 1.60 (1.50 + 1.60) / 2 = 1.55

10
1.60 - 1.70 (1.60 + 1.70) / 2 = 1.65
1.70 - 1.80 1.75
1.80 - 1.90 1.85
1.90 - 2.00 1.95

1.2.4.1. INTERVALO DE CLASE

El intervalo de clase es igual al ancho de clase (en variables continuas), se


obtiene restándole al límite superior el límite inferior:

INTERVALO
CLASE
DE CLASE
1.50 - 1.60 (1.50 – 1.60) = 0.10
1.60 - 1.70 (1.60 – 1.70) = 0.10
1.70 - 1.80 0.10
1.80 - 1.90 0.10
1.90 - 2.00 0.10

AGRUPACIÓN DE DATOS
Para agrupar los datos es necesario determinar un rango, el número de clases y elaborar
los intervalos de clase:

1. Determinación del rango:

El rango es la diferencia del valor más grande menos el más pequeño.

Fórmula: Notación:
R es el rango.
R = Vmáx - Vmín Vmáx es el dato más grande
Vmín es el dato más pequeño

Con los datos de la tabla anterior tenemos:

R = 154 - 120 = 34

2. Determinación del número de clases.

Aunque en realidad estas se determinan al azar, existen varias fórmulas o


procedimientos:

2.a) Donde K el es número de clases y N el tamaño de la población:

Con la tabla anterior:

11
2.b) Procedimiento utilizado en la industria:

Si el número de datos: Hacer:


Es menor de 50 de 5 a 7 clases.
Está entre 50 y 100 de 6 a 8 clases
Está entre 100 y 150 de 7 a 9 clases
Está entre 150 y 200 de 8 a 10 clases.
Mayor de 200 9 ó más clases.

En ambos casos el número de clases se "escoge", de acuerdo al criterio del


usuario, pues en el punto 2.a) se redondea a 6, como también pudo redondearse a 5, y
en el punto 2.b) no dice exactamente cuántas clases.

En el ejemplo que estamos desarrollando escogeremos seis clases, pero podemos escoger
5 ó 7, esto no afecta significativamente el resultado.
3. Se elaboran los intervalos (amplitud) de clase:

Amplitud = R ÷ K; donde R es rango y K es número de clases.

35 ÷ 6 = 5.8, se redondea a 6.

Agrupamiento de datos.

La amplitud de clase es "6", por lo que la clase va a ir aumentando de "6" en "6",


incluyendo los límites (Ejemplo: primera clase de 120 a 125, que contiene "6"
elementos: 120, 121, 122, 123, 124 y 125 y así sucesivamente):

Clase Frecuencia
(Unidades) "f"
120 - 125 5
126 - 131 10
132 - 137 6
138 - 143 7
144 - 149 3
150 - 155 4

12
1.3 Representación de datos (gráficas y sus tipos; tablas)
1.3.1. DIAGRAMA DE PARETO

Es una representación gráfica de la frecuencia de los eventos, de mayor a


menor, normalmente a través de una gráfica de barras. Por ejemplo en una empresa se
presentaron los siguientes problemas:

PROBLEMA FRECUENCIA
A 16
B 9
C 8
D 2
E 1

El diagrama de pareto se elabora utilizando los ejes de la “X” y de la “Y”. En el


primero se anota la problemática, de mayor a menor y en el segundo la frecuencia que
tiene cada problema:

DIAGRAMA DE PARETO

13
40.00

100%

30.00
80%
FRECUENCIA

Porcentaje
60%
20.00

40%

10.00
16.00
20%

9.00 8.00

2.00 1.00
0.00 0%
A B C D E
PROBLEMA

1.3.2. HISTOGRAMA DE FRECUENCIAS

Es una representación gráfica de la frecuencia de los eventos, que se ordena


con la secuencia en que haya aparecido una variable aleatoria, por ejemplo, las ventas
trimestrales fueron:

TRIMESTRE 1er. 2do. 3er. 4to.


VENTAS 16 28 32 18

El histograma de frecuencias también se elabora utilizando los ejes de la “X” y


de la “Y”. En el primero se anota el intervalo de clase, conforme ocurra y en el segundo
la frecuencia que tiene cada clase:

14
VENTAS

35

30

25
Frecuencia

20
VENTAS
15

10

0
1er. 2do. 3er. 4to.
Clase

Histograma de frecuencias

1.3.3. POLÍGONO DE FRECUENCIAS

Es una representación a través de una gráfica de barras, en donde se unen con


segmentos lineales (rayas) los extremos superiores de las barras. Con el ejemplo
anterior tenemos:

TRIMESTRE VENTAS
1 16
2 28
3 32
4 18

El polígono de frecuencias también se elabora utilizando los ejes de la “X” y de


la “Y”. En el primero se anota el intervalo de clase, conforme ocurra y en el segundo la
frecuencia que tiene cada clase el polígono se cierra medio punto antes de la primera
clase y medio punto después de la última clase:

15
POLÍGONO

35
FRECUENCIA VENTAS 30
25
20
15
10
5
0
0 1 2 3 4 5
CLASE TRIMESTRE

Polígono de frecuencias

1.3.4. OJIVA

Es un polígono de frecuencias que se presenta de manera acumulada.

La ojiva también se elabora utilizando los ejes de la “X” y de la “Y”. En el primero


se anota el intervalo de clase, conforme ocurra y en el segundo la frecuencia
acumulada de clases. Con los mismos datos del problema anterior tenemos:

TRIMESTRE VENTAS
1 16
2 44
3 76
4 94

16
Ojiva

100
90
80
Frecueencia acumulada

70
60
50 VENTAS
40
30
20
10
0
1 2 3 4
Clase

Ojiva

17
1.4 Medidas de ubicación (tendencia central, dispersión,
posición y forma)
1.4.1 Tendencia central

Las medidas de tendencia central son valores numéricos que nos indican el
punto central o la mayor frecuencia de un conjunto de datos. De alguna manera miden
el centro o la parte media del universo o de la población o la posición central de una
serie de datos con respecto a un valor mayor y un valor menor. Por ejemplo:

a) Con los datos 1, 2, 3, el centro es 2.


b) Con los datos 3, 1, 2, el centro es 2.
c) Con los datos 2, 3, 1, el centro es 2.

1.4.1.1 MEDIA

La media es el promedio de un conjunto de datos

Se puede obtener la media de una población o de una muestra. La de una población se


define como:

Dados los valores X1, X2, ... XN de una


población finita de tamaño N, la media de Notación:
la población se obtiene con la siguiente
 La media de la población.
Fórmula: : Indica suma.
 X = Datos
N = Tamaño de la población.
Se lee: La media de una población es igual
a la sumatoria de los datos entre el
número de ellos.

18
La media de una muestra se define como:
Dados los valores X1, X2, ... Xn de una
muestra n, la media de la muestra se
obtiene de la siguiente manera: Notación:
_
X = La media de la muestra,
 : Indica suma,
X = Cualquier dato y
n = Tamaño de la muestra
Se lee: La media de una muestra es igual
a la sumatoria de los datos entre
el tamaño de la misma.

La media de la muestra se proyecta para estimar la media de la población. Y son


tres tipos de medias los mas utilizados:

MEDIA ARITMÉTICA:La media aritmética es un promedio simple y se utiliza para


calcular promedios cuando los valores son iguales de importantes.

MEDIA PONDERADA: Es un promedio que considera diferentes pesos específicos de los


eventos. Se utiliza cuando unos valores son más importantes que otros, por ejemplo, en una
asamblea de accionistas pesa más el voto de los accionistas mayoritarios que el de los
minoritarios.

MEDIA GEOMÉTRICA: Es un promedio que suaviza las diferencias cuando la


característica que medimos tienen valores muy irregulares (extremosos), por ejemplo la
inflación a través de los años, el valor del dólar, etc.

MEDIA ARMÓNICA: Es una medida que se obtiene al calcular el valor promedio


para los inversos o recíprocos de un conjunto de datos. Se utiliza cuando hay pocos
datos (menos de diez) y son en dimensiones como Km/h, piezas/máquina, etc.

PROMEDIO MÓVIL: Es una unidad de medida que sirve para determinar el valor de
un bien o servicio que se modifica muy frecuentemente, como una divisa, los bienes
que cotizan (se venden) en bolsa de valores, etc.

MODA: La moda de una serie de observaciones es el valor que con más


frecuencia ocurre o el que más de repite. Puede haber más de una moda, si hay

19
varios valores que se repiten con la misma frecuencia. Es posible que la moda no
exista, si ningún valor se repite más que los otros.

RANGO MEDIO: Es una medida de tendencia central que ocasionalmente se utiliza.


Se obtiene como el promedio del valor mayor y el menor de una serie de datos.

Ejemplos de cálculo e interpretación de media:


Ejemplo sencillo, donde se calculan, a partir de la misma observación la media,
la moda, la mediana y el rango medio:

En un jardín de niños las estaturas de diez alumnos de nuevo ingreso en metros


son:

.95 .89 .93 1.02 .96 .97 .94 .99 .96 .87

Media:

Moda:

Por simple observación vemos que el valor que más se repite es .96

.87 .89 .93 94 .95 .96 .96 .97 .99 1.02

Mediana:

La mediana se calcula con los valores de la quinta posición: De izquierda a derecha .95
y de derecha a izquierda .96:

.87 .89 .93 .94 .95 .96 .96 .97 .99 1.02

Si solo existiesen 9 datos (por ejemplo que faltara 1.02) la mediana sería .95, cuatro
datos por cada lado:

.87 .89 .93 94 .95 .96 .96 .97 .99

20
Si el dato que faltase fuera .87, la mediana sería el primer .96.

.89 .93 94 .95 .96 .96 .97 .99 1.02

Rango medio:

Ejemplos aplicados:
A1) MEDIA ARITMÉTICA:

a) Ejemplo de media aritmética aplicado a la administración:

Se monitorearon las ventas de estéreos durante diez semanas y al colectarse los


siguientes datos deseamos saber la media aritmética:

Semana Unidades vendidas Semana Unidades vendidas


1a. 17 6a. 16
2a. 20 7a. 19
3a. 16 8a. 20
4a. 18 9a. 21
5a. 17 10a. 18

Fórmula: Notación:
_
X = Media.
 = Suma de los datos.
X = Datos. (ventas semanales)
n = Tamaño de la muestra. = 10 observaciones.

Solución:

21
Para solucionar el presente caso a través de Excel siga los siguientes pasos:

1. Después de ingresar a Excel capture los datos.


2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx)
3. En el cuadro de categoría de función localice “Estadísticas” y presione “clic”
(botón izquierdo del mouse), después en el cuadro de nombre de la función
encuentre “PROMEDIO” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en donde están los

datos, separada por dos puntos consecutivos. (Por ejemplo A1..A10) y presione enter o

aceptar.

5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.

Interpretación:

El resultado indica que aproximadamente la mitad del tiempo se venderán


menos de 18 unidades y que en la otra mitad se venderán más de 18. En este caso en
cuatro semanas se vendieron menos de 18 y en otras cuatro más de 18 y en dos se
vendieron exactamente 18. La muestra que estamos utilizando es de 10 semanas, si
aumentamos el tamaño de la muestra, la aproximación será más cercana a 50% de las
veces arriba y el otro 50% abajo.

Aplicación:

Un gerente de mercadotecnia podría estar disgustado con sus vendedores la


mitad del tiempo porque venden muy poco y la otra mitad felicitándolos porque venden
más, y esto podría llevar a los vendedores a renunciar, por no entender la actitud de su
superior. El gerente debe preocuparse por subir la media.

b) Ejemplo de media aritmética aplicado a la producción:

22
Calcular la media aritmética si la producción de un obrero durante un mes fue la
siguiente:

1a. Semana 2a. Semana 3a. Semana 4a. Semana.


175 182 187 191
210 208 225 199
212 215 205 211
215 209 180 225
208 207 195 180
190 198 220 185
4832
TOTAL DEL MES

Fórmula: Notación:
_
X = Media.
 = Suma de los datos.
X = Datos. (Unidades fabricadas)
n = Tamaño de la muestra =
24 observaciones.

Solución:

Para solucionar el presente caso


a través de Excel siga los pasos
señalados anteriormente.

Interpretación:

La media de producción de este obrero es de 201.33 unidades diarias. Aquí


también debemos entender que la mitad de las veces producirá menos de su media y
la otra mitad más.

Aplicación:

La media de producción de este obrero se debe comparar con el estándar de la fábrica


para ver si está dentro de los parámetros de la empresa. También es importante analizar el rango
superior y el inferior del obrero (225 y 175 respectivamente) pues si produce arriba de su limite
superior, las piezas pueden salir defectuosas y si fabrica menos de su rango inferior es muy
probable que algo anormal le suceda, por ejemplo enfermedad, protesta, defecto de maquinaria,
etc.

c) Ejemplo de media aritmética aplicado a la mejora de la calidad:

23
Calcular la media aritmética de defectos de una producción de cerraduras, si en
un muestreo al azar en 20 chapas se detectaron los siguientes errores:

CHAPA CHAPA ERROR CHAPA ERROR CHAPA ERROR


ERROR
#1 1 #6 0 # 11 0 # 16 1
#2 0 #7 1 # 12 1 # 17 0
#3 0 #8 0 # 13 0 # 18 0
#4 1 #9 2 # 14 0 # 19 3
#5 0 # 10 1 # 15 1 # 20 0
TOTAL 12

Fórmula: Notación:
_
C X = Media.
= Suma de los datos.
X = Datos. (Unidades muestreadas)
n = Tamaño de la muestra =
20 observaciones.

En aplicación de un programa de calidad la media se abrevia con la letra “C”


cuando se refiere a errores por producto.

Solución:

Para solucionar el presente caso a


través de Excel siga los pasos
señalados en páginas anteriores.

Interpretación:

En 20 chapas seleccionadas al azar se detectaron 12 errores o defectos, lo que


nos indica que el proceso de producción tiene un margen de error de 0.6 defectos por
pieza, esto no quiere decir que todas las cerraduras vayan a tener error, pero si de la
probabilidad de que un número considerable de ellas salga con uno o más defectos.

Aplicación:

Un programa de calidad tiende a sacar la producción con cero defectos, por lo


tanto 0.6 es un margen muy elevado. Se debe buscar las causas de los defectos y
tratar de eliminarlas.

A2) MEDIA PONDERADA

24
a) Ejemplo de media ponderada aplicado a la economía:

Obtener la media ponderada de la canasta básica, considerando los siguientes


datos:

INCREMENTO DE PONDERACIÓN
PRODUCTOS
PRECIOS VENTAS EN UN PERIODO
Leche 12% $ 10,000
Gasolina 20 % $ 20,000
Azúcar 15 % $ 20,000
Pan 35 % $ 10,000

Fórmula: Notación:

Media ponderada
Sumatoria.
P = Ponderación.
X = Datos

La fórmula se lee: La media ponderada es igual a la sumatoria del producto de la


ponderación por los datos entre la sumatoria de ponderaciones.

Solución:

= 0.195 = 19.5%

Interpretación:

El aumento general de precios fue de 19.5%. Es como se determina la inflación.

Aplicación:

25
Este promedio sirve para calcular la inflación en un período, claro que utilizando
los precios de más productos y servicios.

b) Ejemplo de media ponderada aplicado a la administración:

Obtener la media ponderada de la calificación de un aspirante a ingresar como


trabajador, considerando los siguientes datos:

ELEMENTOS A
CALIFICACIÓN PONDERACIÓN
EVALUAR
90 40 %
Habilidades
Entrevista 80 30 %
Escolaridad 100 30 %

Fórmula: Notación:
_
Xp = Xp = Media ponderada.
Sumatoria.
P = Ponderación.
X = Datos.
La fórmula se lee: La media ponderada es igual a la sumatoria del producto de la
ponderación por los datos entre la sumatoria de ponderaciones.
Solución:

Interpretación: La calificación ponderada del aspirante es 90, esta se compara


contra la media que utiliza la empresa para aceptar nuevos empleados y se toma la
decisión de si se acepta o se rechaza.

Aplicación: Este promedio sirve para evaluar a los aspirantes a ingresar a un empleo.
Se pueden agregar elementos a calificar y será un buen indicador para aceptar o
rechazar nuevos empleados.

c) Ejemplo de media ponderada aplicado a la mejora de la calidad:


Calcular la media ponderada con muestras de diferente tamaño sobre un mismo
producto:
Tamaño de la muestra 10 18 16 20 10
Productos con defecto 2 1 2 1 0

Fórmula: Notación:
_
Xp = Media ponderada.

26
 = Suma.
P = Ponderación.
X = Datos.

Solución:

Interpretación: Según la media ponderada se detectaron 1.2 piezas defectuosas por


muestra.

Aplicación: Se utiliza como las líneas centrales en una gráfica de control.


A3) MEDIA GEOMÉTRICA

No es tan utilizada, por lo que sólo desarrollaremos un ejemplo: Con la siguiente


inflación anual en México calcular la media geométrica:

1994 1995 1996 1997


AÑO
Inflación anual 7.05% 51.97% 27.7% 15.76 %
*ÍNDICE INFLACIONARIO 1.0705 1.5197 1.2770 1.1576
 Índice inflacionario = Porciento de inflación entre 100 + 1: [(7.05 / 100) + 1]

Fórmula: Notación:

Media geométrica.
 = Producto de todos los
elementos de la muestra.
Xi = Datos.
Se lee: La media geométrica es igual a
n = Tamaño de la muestra.
la raíz n del producto de todos los
= Raíz enésima.
elementos de la muestra, donde n es el
número de elementos.

Solución:

Porciento de inflación = Índice inflacionario menos 1 por 100: [(1.2453 - 1) * 100] =24.53%

Para solucionar el presente caso a través de Excel siga los siguientes pasos:

1. Después de ingresar a Excel capture los datos.


2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx).

27
3. En el cuadro de categoría de función localice “Estadísticas” y presione “clic” (botón
izquierdo del mouse), después en el cuadro de nombre de la función encuentre
“MEDIA GEOM” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en donde están
los datos, separada por dos puntos consecutivos. (Por ejemplo A1..A4) y presione
enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.
Interpretación:

Aunque hay un salto muy fuerte sobre la media (51.97% en 1995), que casi
siempre se debe a situaciones extraordinarias (la devaluación en Dic. de 1994), la
mitad de los datos se ubican arriba de la media y la otra mitad abajo. En todas las
medias (aritmética, ponderada, geométrica) los datos siempre tenderán a que la mitad
de las observaciones queden arriba de ella y la otra mitad abajo.

Aplicación:

Sirve para hacer proyecciones cuando los datos son extremosos. Hay que
recordar que los datos siempre tienen relación con la media.

A4) MEDIA ARMÓNICA

La media armónica es una medida de tendencia central que se obtiene al


calcular un valor promedio para los inversos o recíprocos de un conjunto de datos. Se
utiliza cuando hay pocos datos (menos de diez) y son de dimensiones como Km/h,
piezas/máquina, etc.

FÓRMULA: Notación:
Para muestra: Para población: h = Media armónica de una muestra.
a = Media armónica de una
población.
n = Tamaño de la muestra.
N = Tamaño de la población.
= Sumatoria.
x = Cualquier dato.

La fórmula se lee: La media armónica es igual a la división del tamaño de la


muestra o de la población (según el caso) entre la sumatoria de uno entre los datos.
Ejemplo: La siguiente información representa el número de piezas que se fabrican por
hora en seis máquinas:

Máquina 1 2 3 4 5 6
piezas 20 18 15 24 12 15

28
Para solucionar el presente caso a través de Excel siga los siguientes pasos:

1. Después de ingresar a Excel capture los datos.


2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx)
3. En el cuadro de categoría de función localice “Estadísticas” y presione “clic” (botón
izquierdo del mouse), después en el cuadro de nombre de la función encuentre
“MEDIA ARMO” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en donde están
los datos, separada por dos puntos consecutivos. (Por ejemplo A1..A6) y presione
enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.

Interpretación:

La producción media de cada máquina por hora de trabajo es de


aproximadamente 16 piezas. Aquí también, la mitad de las máquinas producirán por
debajo de la media y la otra mitad por encima.

Aplicación:

La media armónica siempre será ligeramente menor que la media aritmética. Se


utiliza cuando el tiempo de producción es constante -todas las máquinas trabajan el
mismo tiempo-. Hay ocasiones en que es importante maximizar la producción por
turnos (cuanto más se produzca en una unidad de tiempo, mejor) aquí se utiliza la
media armónica. Pero hay situaciones en donde se busca producir una cantidad
específica de unidades, por ejemplo, al producir cien piezas, la máquina deja de
funcionar. Se utiliza la media aritmética cuando sólo se considera las unidades
producidas.

PROMEDIO MÓVIL

29
Se utiliza para calcular el valor de un bien [generalmente las divisas o las
acciones que cotizan (se venden) en bolsa de valores] que se está modificando
frecuentemente.

a) Ejemplo aplicado al valor del dólar.

Si el valor de una acción en un día fue el siguiente, determine el promedio móvil


de cinco términos (datos):

HORA 09:00 10:00 11:00 12:00 13:00


VALOR $ 9.65 $ 9.70 $ 9.68 $ 9.64 $ 9.63

Fórmula: Notación:
_
Xm = Promedio móvil.
 = Suma.
X = Datos.
n = Número de términos.

Solución:

Interpretación: El promedio móvil fluctuó dentro de un rango (9.65 y 9.63), si


empezara a desplazarse, comenzaría a formarse una tendencia.

Aplicación: Se utiliza para pronosticar comportamientos, en un futuro próximo. Si a


las 14:00 se hiciera otra observación, para el nuevo cálculo se suma el nuevo dato y se
elimina el primero (por esto se llama promedio móvil):

HORA 10:00 11:00 12:00 13:00 14:00


VALOR $ 9.70 $ 9.68 $ 9.64 $ 9.63 $ 9.67

Solución:

A4) MODA

Ejemplo: Los tamaños de zapatos de un grupo de personas fueron:

30
8, 8, 7, 6, 7, 5, 7, 8, 10, 5, 8, 9, 10, 7, 7, 8, 8

No existe fórmula para determinar la moda cuando los datos no están agrupados. Se
obtiene por simple observación:

Pasos:

1. Si es posible se ordenan ascendente o descendentemente:

5, 5, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 9 10, 10

2. Se determina cual es el dato que más se repite: Moda = 8.

 Para solucionar el presente caso a través de Excel siga los


siguientes pasos:
1. Ingrese a Excel y capture los datos.
2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx).
3. En el cuadro de categoría de función localice “Estadísticas” y presione
“clic” (botón izquiero del mouse), después en el cuadro de nombre de
la función encuentre “MODA” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en
donde están los datos, separada por dos puntos consecutivos. (Por
ejemplo A1..A10) y presione enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el
resultado.

Interpretación:La mayoría de las personas utilizan zapatos No. 8. La medida que más se repitió
fue "8".

Aplicación: El tamaño que más se debe fabricar, según la muestra es el No. 8.

Datos agrupados. Los datos están agrupados cuando se clasifican de acuerdo a una
característica o clase. ejemplo, con los datos anteriores:

31
Edad (Clase) Frecuencia
17 - 18 6
19 - 20 3
21 - 22 2
23 - 24 1
O también:

Edad (Clase) 17 18 19 20 21 24
Frecuencia 2 4 2 1 2 1
Como se observa, los datos se agrupan, de acuerdo a la característica "edad".

Clase. Los datos se "agrupan" en "clases", hacemos "paquetes" con ellos, indicando la
frecuencia con la que aparecen. Cuando hacemos esto, estamos manejando datos
agrupados.

Media, moda y mediana con datos agrupados

MEDIA:
Los conceptos de media, moda y mediana son los mismos tanto para datos
agrupados como para no agrupados. La media es el promedio de un conjunto de datos.
La fórmula de la media para datos agrupados es:

Población: Muestra: Notación:

f = Frecuencia
x = Marca de clase o punto
medio o rango medio.
N = Tamaño de la población.
n = Tamaño de la muestra.

La fórmula se lee: La media es igual a la sumatoria de la frecuencia por la marca de clase, entre
el tamaño de la población o de la muestra.

Ejemplo de obtención de la media con datos agrupados, aplicado a la


producción: En una planta productiva el número de piezas que se fabricaron en una
semana, por cada trabajador fue la siguiente:

Trab. a 126 Trab. h 148 Trab. ñ 126 Trab. u 137 Trab.bb 122

32
Trab. b 120 Trab. i 132 Trab. o 154 Trab. v 142 Trab.cc 127
Trab. c 125 Trab. j 123 Trab. p 138 Trab. w 134 Trab.dd 142
Trab. d 130 Trab. k 132 Trab. q 140 Trab. x 126 Trab.ee 128
Trab. e 150 Trab. l 150 Trab. r 129 Trab. y 145 Trab.ff 128
Trab. f 130 Trab.m 142 Trab. s 133 Trab. z 139 Trab.gg 140
Trab. g 151 Trab. n 124 Trab. t 130 Trab.aa 135 Trab.hh 145

Recuerde: x es el punto medio: (suma de los límites entre dos), para la primera clase:

Clase Frecuencia
x fx
(Unidades) "f"
120 - 125 5 122.5 612.5
126 - 131 10 128.5 1285.0
132 - 137 6 134.5 807.0
138 - 143 7 140.5 983.5
144 - 149 3 146.5 439.5
150 - 155 4 152.5 610.0
Suma 4737.5

Población:

Media es igual a 135.36; redondeado a 135 piezas.

 Este problema se puede resolver con excel utilizando los mismos pasos que
para datos no agrupados. El resultado será más exacto (134.943 135). Se
agrupan datos para ahorrar tiempo en su proceso, pero si el cálculo se hace
con computadora, no es necesario agruparlos. El resultado de 126 es más
exacto por que se utilizaron datos individuales y no por que se utilizó
computadora. La computadora sólo ahorra tiempo en el proceso.

Interpretación: Al igual que en la media para datos no agrupados, aproximadamente la


mitad de los obreros fabricarán más de 135 piezas y la otra mitad menos de 135.

Aplicación: Un trabajador debe producir alrededor de 135 piezas, esto no quiere decir
que siempre fabricará 135. Este es un estándar que un gerente de producción debe

33
cuidar, que no produzcan ni muy por arriba ni muy por debajo de esta media. (Ver
desviación estándar)

MODA:
La fórmula para obtener la moda con datos agrupados es:

Fórmula Notación:

= Moda
Li = Límite exacto (frontera)
inferior de la clase que
 contiene a la moda.
d1 = Diferencia absoluta entre la
frecuencia de la clase que
contiene a la moda y la de
la clase anterior.
d2 = Diferencia absoluta entre la
frecuencia de la clase que
contiene a la moda y la clase
posterior.
i = Amplitud del intervalo de
clase.

La fórmula se lee: La moda es igual al límite exacto inferior de la clase que contiene a
la moda más la proporción de la diferencia absoluta anterior multiplicada por la amplitud
del intervalo de clase.

Continuando con el ejemplo aplicado a la producción, la moda se obtiene de la


siguiente manera:

Fórmula

Límite exacto Frecuenci


Clase
o frontera a
(Unidades)
(Li) "f"
120 - 125 119.5 - 125.5 5
126 - 131 125.5 -131.5 10
132 - 137 131.5 -137.5 6
138 - 143 137.5 - 143.5 7

34
144 - 149 143.5 - 149.5 3
150 - 155 149.5 -155.5 4

La moda es el valor que más se repite en un conjunto de datos, en el ejemplo se


encuentra en la clase de mayor frecuencia: entre 125.5 y 131.5.

Determinación de elementos:

Li = Límite exacto inferior de la clase que contiene a la moda = 125.5


d1 = Frecuencia que contiene a la moda menos frecuencia de la clase
anterior:
10 - 5 = 5

d2 = Frecuencia que contiene a la moda menos frecuencia de la clase


posterior:
10 - 6 = 4

i = Amplitud del intervalo de clase = 6

Resumiendo los datos tenemos:

Li = 125.5
d1 = 5
d2 = 4
i = 6

 Este problema se puede resolver con excel utilizando los mismos pasos que
para datos no agrupados, y el resultado será más exacto (126). Recuerde que
se agrupan datos para ahorrar tiempo en su proceso, pero si el cálculo se hace
con computadora, no es necesario agruparlos. El resultado de 126 es más
exacto por que se utilizaron datos individuales y no por que se utilizó
computadora. La computadora sólo ahorra tiempo en el proceso.

Interpretación: De acuerdo con la fórmula, el valor que más se repite es 129


unidades aproximadamente, de acuerdo a excel es 126. Este último es más exacto
porque se utilizaron datos individuales en vez de agrupados, no por que se calculó en
computadora.

Aplicación: Normalmente se utiliza la moda en lugar de la media cuando queremos


calcular la capacidad de un proceso y tenemos una distribucion asimétrica o sesgada.

35
1.4.2 Medidas de posición

MEDIANA: La mediana es el valor intermedio de una serie de observaciones que se


presentan en orden ascendente o descendente. Para calcular la mediana se presentan
dos situaciones:

1) Si las observaciones son en número impar, la mediana es el valor intermedio.

36
2) Si las observaciones son en número par, la mediana es el promedio de los dos
valores centrales.

DECIL: Es la medida de posición que divide un conjunto de datos en diez partes


iguales.

CUARTIL: Al igual que el decil, el cuartil es una medida de posición que divide un
conjunto de datos, pero en cuatro partes iguales.

PERCENTIL: Divide al conjunto de datos en 100 partes iguales.

PARTES POR MILLÓN: Divide al conjunto de datos en un millón de partes iguales.

37
5) MEDIANA.

A) Ejemplo de obtención de mediana con una muestra impar:

De un lote de once balines se encontraron los siguientes diámetros:

7, 8, 6, 7, 8, 8, 7, 8, 6, 7, 7
Pasos:

1. Se ordenan los datos:

6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8

2. Se determina la posición:

Fórmula: Solución:

Donde "n" es el número de datos.

La mediana es el dato que se encuentra en la sexta posición, no importa si se empieza a


contar de derecha a izquierda o de izquierda a derecha.

1a. 2a. 3a. 4a. 5a. 6a.


6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8
6a. 5a. 4a. 3a. 2a. 1a.

Mediana

38
 Para solucionar el presente caso a través de Excel siga los
siguientes pasos:
1. Ingrese a Excel y capture los datos.
2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx).
3. En el cuadro de categoría de función localice “Estadísticas” y presione
“clic” (botón izquiero del mouse), después en el cuadro de nombre de la
función encuentre “MEDIANA” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en
donde están los datos, separada por dos puntos consecutivos. (Por
ejemplo A1..A10) y presione enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el
resultado.
B) Ejemplo de obtención de mediana con una muestra par:

De un lote de diez balines se encontraron los siguientes diámetros:

7, 8, 6, 7, 8, 8, 7, 8, 6, 7

Pasos:

1. Ordenar los datos:

6, 6, 7, 7, 7, 7, 8, 8, 8, 8

2. Se determina la posición:

La mediana es el dato que se encuentra en la quinta posición, contando de


derecha a izquierda y de izquierda a derecha.

1a. 2a. 3a. 4a. 5a.


6, 6, 7, 7, 7, 7, 8, 8, 8, 8
5a. 4a. 3a. 2a. 1a.

 Para solucionarlo a través de Excel siga los pasos


antes indicados.

39
Interpretación: Tanto para las cifras pares como para las nones se cumple con la regla
de que la mitad de los datos están arriba de la mediana y la otra mitad abajo.

Aplicación: Se aplica para elaborar la gráfica de control de calidad.

DECILES, CUARTILES, PERCENTILES Y PARTES POR MILLÓN .

DECIL: Es la medida de posición que divide un conjunto de datos en diez partes


iguales. Ver ejemplo en percentil.

CUARTIL: Es la medida de posición que divide un conjunto de datos en cuatro


partes iguales. Ejemplo: dividir los siguientes datos en cuartiles:

20, 32, 25, 34, 21, 22, 33, 24, 36, 30, 22
Pasos:

1. Ordenar los datos:


20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36

2. Determinar la posición de cada cuartil:

2.1. Para el primer cuartil:

fórmula: Notación:

C1 = Cuartil 1
n = Número de
datos.

Se lee: El primer cuartil es igual al número


de datos entre cuatro más un medio.

Solución:

El primer cuartil se encuentra en la tercera posición:

40
1er. cuartil

20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36

2.2. Para el segundo cuartil:

Fórmula: Notación:

C2 = Cuartil 2
n = Número de datos.
Solución:

El segundo cuartil se encuentra en la sexta posición:

1er. cuartil

20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36

2do. cuartil

2.3. Para el tercer cuartil:

Fórmula: Notación:

C3 = Cuartil 3
n = Número de datos.

Solución:

El tercer cuartil se encuentra en la novena posición:

41
1er. Cuartil 3er. cuartil

20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36

2do. cuartil

2.4. Para el cuarto cuartil:

Fórmula: Notación:

C4 = Cuartil 4
n = Número de datos.

Solución:

El cuarto cuartil se encuentra en la onceava posición:

1er. Cuartil 3er. cuartil

20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36

2do. cuartil 4to. cuartil

 Para solucionar este caso a través de Excel siga los siguientes


pasos:
1. Ingresar a Excel y capture los datos.
2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx).
3. En el cuadro de categoría de función localice “Estadísticas” y presione
“clic” (botón izquiero del mouse), después en el cuadro de nombre de la
función encuentre “CUARTIL” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Matriz” anote las celdas inicial y final en
donde están los datos, separada por dos puntos consecutivos. (Por
ejemplo A1..A11) y presione “clic”, en el cuadro de “Cuartil” indique el
que desea (1ro, 2do., 3ro. ó 4to.) y oprima enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el
resultado.

Interpretación:

42
1. Para el primer cuartil: A la izquierda del primer siete se encuentra el 25% de los
datos. (Una cuarta parte),.
2. Para el segundo cuartil: en este caso es igual a la media, porque 1/4 + 1/4 = 1/2.
3. Para el tercer cuartil: a la izquierda del segundo ocho se encuentra el 75% de los
datos (3/4 partes).
4. Para el cuarto cuartil. A su izquierda se encuentran todos los datos, porque 4/4 = 1.

Aplicación: Aunque no es muy común, se puede aplicar cuando se quiere cortar los
extremos de un conjunto de datos, para tener una muestra más centrada.

Percentil: Es la medida de posición que divide un conjunto de datos en cien partes


iguales. La fórmula es:

Donde:
P es percentil
x es el dato buscado
n el tamaño de la muestra

Ejemplo, con los siguientes datos encontrar el percentil 90:

20, 32, 25, 34, 21, 22, 33, 24, 36, 30, 22
Pasos:
1. Ordenar los datos:
20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36

2. Determinar el percentil 90:

3. Ubicar el percentil: el percentil 90 se encuentra en la décima posición:

Percentil 90

20, 21, 22, 22, 24, 25, 30, 32, 33, 34, 36

43
 Para solucionar este caso a través de Excel siga los siguientes pasos:
1. Después de ingresar a Excel capture los datos.
2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx).3. En el
cuadro de categoría de función localice “Estadísticas” y presione “clic” (botón
izquiero del mouse), después en el cuadro de nombre de la función
encuentre “PERCENTIL” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Matriz” anote las celdas inicial y final en donde
están los datos, separada por dos puntos consecutivos. (Por ejemplo
A1..A11) y presione “clic”, en el cuadro de “K” anote el percentil en decimal y
oprima enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.

El decil se calcula con excel convirtiéndolo en percentil:

DECIL PERCEN
TIL
1 10
1.5 15
2 20
3 30
4 40
5 50
6 60
7 70
8 80
9 90
10 100

Partes por millón: Esta medida de posición se utiliza principalmente en los programas
de calidad. Actualmente la producción de “clase mundial” se fabrica con márgenes de eficiencia

44
casi perfectos, ya que los errores se cuentan en partes por millón. Por ejemplo en una fábrica de
chips, por cada millón de piezas elaboradas, de acuerdo a la inspección electrónica, 240 tienen
defectos:

120 unidades con error. (límite inferior)


999,760 unidades sin defectos
120 unidades con error. (límite superior)

Hay aparatos que tienen muchos componentes, por ejemplo un avión, una
computadora, un automóvil, etc., en donde si un componente tiene error, el aparato
puede que deje de funcionar, por esto se deben eliminar las fallas, además es la
exigencia del mercado mundial.

Si se hiciera una gráfica de la producción anterior podría tener la siguiente


forma:

Límite P r o d u c c i ó n a c e p t a b l e 999,760 unidades Límite


inferior superior
error
Error 120
120 unidades
unidades

Nótese como el error es prácticamente nulo (límite de la producción aceptable) o casi


no hay error.

Los programas de calidad enfatizan que la producción de bienes o servicios


debe ser con cero defectos o cero errores, hay muchas empresas en el mundo que casi
lo logran ya que trabajan con márgenes de error de partes por millón.

Tanto en la estadística, como en la probabilidad se utilizan datos -agrupados y


no agrupados-, con los que se hacen o se sacan conclusiones o predicciones.
Anteriormente utilizamos ejemplos con datos no agrupados.

Datos no agrupados. Datos con los que se trabaja conforme van apareciendo o se
colectaron, por ejemplo, al preguntarle la edad a un grupo de alumnos de 1er.
semestre, se obtuvo: 19, 18, 21, 18, 17, 20, 18, 17, 21, 19, 24, 18, ... etc.

Datos agrupados. Los datos están agrupados cuando se clasifican de acuerdo a una
característica o clase. ejemplo, con los datos anteriores:

45
MEDIANA:

La fórmula para obtener la mediana con datos agrupados es:

Notación:
Fórmula
ed= Mediana
Li = Límite exacto (frontera)
inferior de la clase que
contiene a la mediana.
n = Número de datos.
fAa = Frecuencia acumulada
anterior de la clase en que
 se encuentre la mediana.
f = Frecuencia de la clase que
contiene a la mediana.
i = Amplitud del intervalo de
clase.

La fórmula se lee: La mediana es igual al límite exacto inferior de la clase que


contiene a la mediana más el producto resultante de la diferencia de la mitad de
los datos menos la frecuencia acumulada anterior, entre la frecuencia de la clase
que contiene a la mediana por la amplitud del intervalo de clase.

Continuando con el ejemplo aplicado a la producción, la mediana se obtiene de


la siguiente manera:

Frecuenci
Límite exacto Frecuenci a
Clase
o frontera a acumulad
(Unidades)
(Li) "f" a
FA
120 - 125 119.5 - 125.5 5 5
126 - 131 125.5 -131.5 10 15
132 - 137 131.5 -137.5 6 21
138 - 143 137.5 - 143.5 7 28
144 - 149 143.5 - 149.5 3 31
150 - 155 149.5 -155.5 4 35

La mediana divide a un conjunto de datos en dos parte iguales. En el ejemplo se


encuentra en la clase que contiene a la mitad de los datos, dentro de frecuencia
acumulada.

46
Determinación de elementos:

Primero se encuentra la posición de la mediana:

De acuerdo con los datos, la mediana se encuentra en la clase de la


frecuencia acumulada mayor de 15 y menor de 21. (17.5 no cabe en 15)

Li = Límite exacto inferior de la clase que contiene a la mediana = 131.5

fAa = 15 f=6
i = Amplitud del intervalo de clase = 6

Resumiendo los datos tenemos:

n/2= 17.5
Li = 131.5
fAa = 15
f = 6
i = 6

 Este problema se puede resolver con excel utilizando los mismos pasos que
para datos no agrupados, y el resultado será más exacto (133). Recuerde
que se agrupan datos para ahorrar tiempo en su proceso, pero si el cálculo
se hace con computadora, no es necesario agruparlos. El resultado de 133
es más exacto por que se utilizaron datos individuales y no por que se
utilizó computadora.

Interpretación: De acuerdo con la fórmula, el resultado es 134 unidades


aproximadamente, de acuerdo a excel es 133. Este último es más exacto porque se
utilizaron datos individuales en vez de agrupados, no por que se calculó en
computadora.

Aplicación: Normalmente la mediana y la moda tienen preferencia sobre la media para


aplicarse cuando hay distribuciones asimétricas o sesgadas (que los datos se carguen
a un lado).

CUARTIL, DECIL Y PERCENTIL

47
La fórmula de la mediana sirve para calcular cuartiles, deciles y percentiles, con
las siguientes adecuaciones:

CUARTIL

Nótese como sólo cambia Med (mediana) por C1 (Primer cuartil) y n/2 por n/4,
todos los demás datos son iguales. Para el segundo cuartil ( C2), el resultado es
exactamente igual a la mediana y para el tercer cuartil ( C3) n/2 se modifica a 3n/4.

Continuando con el ejemplo, se pide obtener el tercer cuartil:

Frecuenci
Límite exacto Frecuenci a
Clase
o frontera a acumulad
(Unidades)
(Li) "f" a
FA
120 - 125 119.5 - 125.5 5 5
126 - 131 125.5 -131.5 10 15
132 - 137 131.5 -137.5 6 21
138 - 143 137.5 - 143.5 7 28
144 - 149 143.5 - 149.5 3 31
150 - 155 149.5 -155.5 4 35

Cuartil es la medida que divide un conjunto de datos en cuatro partes iguales.

Resumiendo los datos tenemos:

3n / 4 = 26.25
Li = 137.5
fAa = 21

48
f = 7
i = 6

Este problema se puede resolver con excel utilizando los mismos pasos que
para datos no agrupados, el resultado coincide (142). Recuerde que se
agrupan datos para ahorrar tiempo en su proceso, pero si el cálculo se hace
con computadora, no es necesario agruparlos.

Interpretación: De acuerdo con la fórmula y con excel, el tercer cuartil se encuentra en


el valor de 142 unidades. Las tres cuartas partes de los datos se encuentran de 142
hacia atrás.

Aplicación: Se utiliza para cortar los extremos de una muestra (los datos atípicos o
que se salen de lo normal), para centrar los datos.

DECIL Formula:

Nótese como sólo cambia Med (mediana) por D7 (Séptimo decil) y n/2 por
7n/10, todos los demás datos son iguales. Para cualquier decil, n/2 se modifica a
deciln/10.

Decil 1 es igual a percentil 10, decil 1.5 es igual a percentil 15, decil 8 es igual a
percentil 80, etc.

Ver ejemplo en percentil.

PERCENTIL
Fórmula:

49
Nótese como sólo cambia Med (mediana) por P70 (Percentil 70. Setenta indica
el porcentaje buscado) y n / 2 cambia por 70 n / 100, todos los demás datos son
iguales. Para cualquier percentil n / 2 se modifica a percentil n / 100.

Continuando con el ejemplo, se pide obtener el percentil 95:

Frecuenci
Límite exacto Frecuenci a
Clase
o frontera a acumulad
(Unidades)
(Li) "f" a
FA
120 - 125 119.5 - 125.5 5 5
126 - 131 125.5 -131.5 10 15
132 - 137 131.5 -137.5 6 21
138 - 143 137.5 - 143.5 7 28
144 - 149 143.5 - 149.5 3 31
150 - 155 149.5 -155.5 4 35

Cuartil es la medida que divide un conjunto de datos en cuatro partes iguales.

Determinación de elementos:

Primero se encuentra la posición del


percentil 95: 95 n / 100 = 33.25

De acuerdo con los datos, el


percentil 95 se encuentra en la clase
de la frecuencia acumulada de 35.

Li = 149.5 fAa = 31
i = Amplitud del intervalo de clase
=6

Resumiendo los datos tenemos:

95n /100 = 33.25


Li = 149.5

50
fAa = 31
f = 4
i = 6

Formula:

Este problema se puede resolver con excel utilizando los mismos pasos que
para datos no agrupados, el resultado de excel (150.3 150) es más exacto
por que se usaron datos no agrupados. Recuerde que se agrupan datos para
ahorrar tiempo en su proceso, pero si el cálculo se hace con computadora,
no es necesario agruparlos.

Interpretación: De acuerdo con la fórmula, el resultado es de 153 y el de Excel (que es


más exacto) es de 150. Indica que el 95% de los datos se encuentran de 150 hacia
atrás.

Aplicación: Se utiliza para determinar los intervalos de confianza, para cortar


extremos en un conjunto de datos y en la fórmula de la curtosis.

Los datos se agrupan para ahorrar tiempo en su proceso


manual.. Gracias a la computadora ya no es necesario
agruparlos para obtener resultados, sin embargo, para
elaborar gráficas siguen siendo útiles.

1.4.3 DISPERSIÓN

DEFINICIÓN: Las medidas de dispersión o de


variabilidad son valores que miden cuanto se
desvían los datos en una distribución.

51
RANGOS: Recuerda que el rango es la diferencia entre los valores extremos -valor
más grande menos valor más pequeño de una serie de datos-, por lo tanto es una
medida de dispersión o de variabilidad y se utiliza para determinar el intervalo de clase,
para saber la variación total de los datos y para elaborar las gráficas en control de
calidad. Su fórmula es: R = Vmáx. - Vmín.

DESVIACION MEDIA ABSOLUTA: Es una medida de dispersión que sirve para


calcular cuanto se desvía de manera absoluta cualquier dato con respecto a la media.

Notación:
Fórmula:
DM = Desviación media absoluta.
(Algunos autores utilizan DMA.)
= Suma _
Recuerde: Una cantidad entre dos rayas
X = Cualquier dato, X = Media
indica valor absoluto.
n = Tamaño de la muestra

La fórmula se lee: desviación media absoluta es igual a la sumatoria de la diferencia -


en términos absolutos- de los valores y la media, entre el número de datos.

Con los siguientes datos ejemplificaremos la desviación media absoluta: Se


monitorearon las ventas de estéreos durante diez semanas y al colectarse los
siguientes datos deseamos saber la desviación media absoluta:

Semana Unidades vendidas Semana Unidades vendidas


1a. 17 6a. 16
2a. 20 7a. 19
3a. 16 8a. 20
4a. 18 9a. 21
5a. 17 10a. 18

52
Fórmula de la media:

Obtención de la media:

53
Obtención de la desviación media absoluta:

|17-18.2| + |20-18.2| + |16-18.2| + |18-18.2| + |17.18.2| + |16-18.2| + |19-18.2| + |20-18.2| + |21-18.2| + |18-18.2|
DM=  =
10

Para efectos prácticos acomodamos los datos en columna:

|17-18.2| = 1.2
|20-18.2| = 1.8
|16-18.2| = 2.2
|18-18.2| = 0.2
|17-18.2| = 1.2
|16-18.2| = 2.2
|19-18.2| = 0.8
|20-18.2| = 1.8
|21-18.2| = 2.8
|18-18.2| = 0.2
 14.4 DM = 14.4 
10 = 1.44

Para solucionar el presente caso a través de Excel siga los siguientes


pasos:

1. Después de ingresar a Excel, capture los datos.


2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx)
3. En el cuadro de categoría de función localice “Estadísticas” y presione “clic” (botón
izquierdo del mouse), después en el cuadro de nombre de la función encuentre
“DESVPROM” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en donde están
los datos, separada por dos puntos consecutivos. (Por ejemplo A1..A10) y presione
enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.

Interpretación: Las ventas semanales tienen una desviación promedio de 1.44 con
respecto a la media.

Aplicación: Conociendo la media y la desviación media absoluta se puede calcular el


intervalo de variación normal o natural en las ventas semanales. En otras palabras,
cuanto pueden variar las ventas semanales y justificar que esto es normal o natural.

54
VARIANZA Y DESVIACIÓN ESTÁNDAR

Varianza: Al igual que la desviación media absoluta, la varianza es una medida de


dispersión que sirve para calcular cuanto varía cualquier dato respecto a la media. La
diferencia entre ambas es su aplicación, la DM se utiliza cuando hay pocos datos (10 ó
menos) y la varianza cuando hay más de diez datos.

La fórmula es:

Para una población: Para una muestra:

Para una población la fórmula se lee: la varianza es igual a la sumatoria de los


valores menos la media al cuadrado, entre el número de datos. Para una muestra es
similar sólo hay que agregar entre el número de datos menos uno.

Notación:
2 = Varianza de una población.
2
S = Varianza de una muestra.
= Suma de datos.
X = Cualquier dato. _
 = Media para una población.X = Media para una muestra.
N = Número de datos de una población.
n = Número de datos de una muestra.
\

Aplicación: Se monitorearon las ventas de refrigeradores durante 12 semanas y


deseamos saber la la varianza, las ventas fueron:

18, 21, 17, 19, 18, 17, 20, 23, 22, 21, 23, 21.

Primero obtendremos la media por que la necesitaremos para interpretar:

55
Semana Ventas _ _ _
X X ( X - X) X - X )
2

1 18 18 - 20 = -2 (-2) 2 = 4
2 21 21 - 20 = 1 ( 1) 2 = 1
3 17 17 - 20 = -3 (-3) 2 = 9
4 19 19 - 20 = -1 (-1) 2 = 1
5 18 18 - 20 = -2 (-2) 2 = 4
6 17 17 - 20 = -3 (-3) 2 = 9
7 20 240/12 = 20 20 - 20 = 0 ( 0) 2 = 0
8 23 23 - 20 = 3 ( 3)2 = 9
9 22 22 - 20 = 2 ( 2) 2 = 4
10 21 21 - 20 = 1 ( 1) 2 = 1
11 23 23 - 20 = 3 ( 3) 2 = 9
12 21 21 - 20 = 1 ( 1) 2 = 1
_
 = 240 X - X )
2 = 52

Para solucionar el presente caso a través de Excel siga los siguientes pasos:

1. Después de ingresar a Excel capture los datos.


2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx)
3. En el cuadro de categoría de función localice “Estadísticas” y presione “clic” (botón
izquierdo del mouse), después en el cuadro de nombre de la función encuentre
“VAR” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en donde están
los datos, separada por dos puntos consecutivos. (Por ejemplo A1..A10) y presione
enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.

Interpretación: La varianza por si sola no dice nada, siempre es necesario


compararla o utilizarla con otras medidas, enseguida la usaremos para calcular la
desviación estándar.

DESVIACIÓN ESTÁNDAR: Es una medida de dispersión que sirve para calcular


cuanto se desvía cualquier dato respecto a la media. La fórmula de la desviación
estándar es la misma que la de la varianza, despejando el cuadrado:

Para una población: Para una muestra

56
 

Para una población la fórmula se lee: la desviación estándar es igual a la raíz cuadrada
de la suma de los valores menos la media al cuadrado, entre el número de datos. Para
una muestra es similar sólo hay que agregar entre el número de datos menos uno. O
de una manera abreviada: la desviación estándar es la raíz cuadrada de la varianza.

Aplicación. Con los datos anteriores, determinar la varianza:

2
S = 4.7 y despejando: S = = 2.17  2.2

Para solucionar el presente caso a través de Excel siga los siguientes


pasos:

1. Después de ingresar a Excel, capture los datos.


2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx)

3. En el cuadro de categoría de función localice “Estadísticas” y presione “clic” (botón


izquierdo del mouse), después en el cuadro de nombre de la función encuentre
“DESVEST” oprima “clic” y presione enter o aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en donde están
los datos, separada por dos puntos consecutivos. (Por ejemplo A1..A10) y presione
enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.

Interpretación: En promedio, el 68.26% de los datos se encontrarán dentro del rango


17.8 a 22.2, ya que la desviación promedio en relación a su media, es de 2.2. Los datos
se desvían o varían 2.2 por arriba y por abajo de la media de 20. Ver siguiente párrafo.

Aplicación: La desviación estándar se utiliza para elaborar gráficas de control.

En estadística se acostumbra utilizar la desviación estándar, que también se le


denomina sigma por la letra griega con que se representa: - - para indicar la
confiabilidad en la interpretación de los datos. Cuando la información esta dentro de un
sigma, hay un 68.26% de posibilidades de que los datos efectivamente se encuentren
en el rango señalado, con dos sigmas hay un nivel de confianza de 95.44% y con tres
signmas es de 99.73%:

 = Nivel de confianza de 68.26 %. ( )

57
2 = Nivel de confianza de 95.44 %. ( )
3 = Nivel de confianza de 99.73 %.( )

Continuando con el caso anterior donde  es 2.2 tenemos:

Con un sigma = 20  2.2 = 17.8, 22.2.


Con dos sigmas = 20  4.4 = 15.6, 24.4.
Con tres sigmas = 20  6.6 = 13.4, 26.6.
Las ventas, en orden ascendente son: 17, 17, 18, 18, 19, 20, 21, 21, 21, 22, 23,
23. Dentro del rango de una sigma están 8 casos: del 18 al 22, que es igual a 66.67%
(8/12) cantidad muy aproximada al 68.26 %. En este ejemplo si usamos dos sigmas
está el 100% de los casos, ya que el rango es de 15.6 a 24.4 y el ejemplo tiene del 17
al 23.

RANGO INTERCUARTIL: Este rango se obtiene restándole al tercer cuartil el


primer cuartil:

Fórmula: Notación:

Rc es rango intercuartil.
Se lee: El rango intercuartil es igual C3 es el tercer cuartil.
al tercer cuartil menos el primero. C1 es el primer cuartil

Suponga que se obtuvieron los cuartiles: C 1 fue 22 y C3 fue 33, con estos datos
vamos a calcular el rango intercuartil:

Interpretación: A veces es conveniente ignorar extremos. El Rc (rango intercuartil) nos


sirve para determinar cuales datos se ignorarán. En este caso dejaremos los datos del
primer 22 hasta el 33 y se ignorarán los datos fuera de estos límites.

Aplicación: El cálculo de todos los rangos centrales (cuartiles, deciles, percentiles,


etc.) sirve para entender los intervalos de confianza -tema de inferencia estadística-.

1.4.4 Medidas de forma

58
Sesgo o asimetría: es una medida estadística que nos indica hacia que lado están
cargados los datos, -hacia donde es el sesgo o la asimetría-. La estadística trabaja con
las llamadas curvas normales, en donde la mayoría de los datos se ubican en el medio
o el centro de la misma, sin embargo hay ocasiones en donde los datos se cargan
hacia la derecha o hacia la izquierda de la curva, en este caso estamos hablando de
sesgo o asimetría.

La fórmula que se utiliza para calcular el coeficiente de asimetría de Pearson es:

Fórmula: Población Muestra Notación:

CA = Coeficiente de asimetría.
_
 = X = Media.


Se lee: El coeficiente de asimetría es igual a tres X = Mediana.
veces la media menos la mediana entre
la desviación estándar. = S = Desviación
estándar.

Ejemplo: Los siguientes datos representan los diámetros en milímetros de una muestra
de balines:
7, 6, 8, 7, 7, 6, 8, 9, 7, 8
Pasos:

Determinamos la media:

Obtenemos la mediana:

X = 6, 6, 7, 7, 7, 7, 8, 8, 8, 9 = ( 7 + 7 ) / 2 = 7

59
Calculamos la desviación estándar:

7, 6, 8, 7, 7, 6, 8, 9, 7, 8

_
X-X
7 - 7.3 = - 0.3 0.09
6 - 7.3 = - 1.3 1.69
8 - 7.3 = 0.7 0.49
7 - 7.3 = - 0.3 0.09
7 - 7.3 = - 0.3 0.09
6 - 7.3 = - 1.3 1.69
8 - 7.3 = 0.7 0.49
9 - 7.3 = 1.7 2.89
7 - 7.3 = - 0.3 0.09
8 - 7.3 = 0.7 0.49
 8.10

Resolvemos:

Para solucionar el presente caso a través de Excel siga los siguientes pasos:

El coeficiente de asimetría que maneja excel no es el de Pearson, por lo tanto,


para obtenerlo calcule paso a paso la media, la mediana y la desviación estándar, de
acuerdo a lo visto en cada tema y después obtenga con calculadora el paso 4 arriba
señalado.

Interpretación: Los datos representan una asimetría positiva.

Aplicación. Este dato sirve para determinar que prueba de hipótesis es conveniente
aplicar.

60
Notación:
Fórmula:
CA = Coeficiente de asimetría.

X = Cualquier dato.
Se lee: El coeficiente de asimetría es igual al _
número de datos, entre el producto de n menos 1 X = Media.
por n menos 2, que multiplica a la sumatoria del
cubo de la diferencia entre cualquier dato y la n = Tamaño de la muestra.
media dividida entre la desviación estándar.
S = Desviación estándar.

Con el ejemplo anterior tendremos el siguiente resultado:


_
X = 7.3
n = 10
S = 0.95

n 10 10
 =  =  = .1388  .14
(n - 1) (n - 2) (10 - 1) (10 - 2) 9X8

_ _ _
X-X (X - X) ÷ S [(X - X) ÷ S]3
7 - 7.3 = - 0.3 - 0.3 ÷ 0.95 = -0.31579 -0.03149
6 - 7.3 = - 1.3 - 1.3 ÷ 0.95 = -1.36842 -2.56247
8 - 7.3 = 0.7 0.7 ÷ 0.95 = 0.73684 0.40005
7 - 7.3 = - 0.3 - 0.3 ÷ 0.95 = -0.31579 -0.03149
7 - 7.3 = - 0.3 - 0.3 ÷ 0.95 = -0.31579 -0.03149
6 - 7.3 = - 1.3 - 1.3 ÷ 0.95 = -1.36842 -2.56247
8 - 7.3 = 0.7 0.7 ÷ 0.95 = 0.73684 0.40005
9 - 7.3 = 1.7 1.7 ÷ 0.95 = 1.78947 5.73028
7 - 7.3 = - 0.3 - 0.3 ÷ 0.95 = -0.31579 -0.03149
8 - 7.3 = 0.7 0.7 ÷ 0.95 = 0.73684 0.40005
 1.67954

61
Para solucionar el presente caso a través de Excel siga los siguientes
pasos:
1. Después de ingresar a Excel, capture los datos.
2. Posiciónese en una celda en blanco y oprima la tecla de función (ƒx)
3. En el cuadro de categoría de función localice “Estadísticas” y presione “clic”
(botón izquierdo del mouse), después en el cuadro de nombre de la función
encuentre “COEFICIENTE.ASIMETRIA” oprima “clic” y presione enter o
aceptar.
4. En el siguiente cuadro, en “Número 1” anote las celdas inicial y final en
donde están los datos, separada por dos puntos consecutivos. (Por ejemplo
A1..A10) y presione enter o aceptar.
5. En la celda que seleccionó de acuerdo al punto No. 2 aparecerá el resultado.

El resultado en Excel es 0.23424 positivo, similar a 0.23312 que


obtuvimos manualmente (la diferencia se debe al número de decimales)

La interpretación y la aplicación son iguales a las comentadas en el


coeficiente de asimetría de Pearson, en ambos casos el sesgo es positivo, lo que indica
que está sesgado a la derecha de la curva.

Curtosis: La curtosis es una medida de dispersión que indica el grado de agudez de


un conjunto de datos. (Agrupamiento hacia el centro o verticalidad de la curva)

Fórmula: Notación:

K = Curtosis.

C3 = Tercer cuartil.
La fórmula se lee: La curtosis C1 = Primer cuartil.
es igual a un medio del tercer P90 = Percentil 90
cuartil menos el primero, entre
el percentil 90 menos el P10 = Percentil 10
percentil 10.

La Kurtosis caracteriza lo agudo o plano de una distribución con relación a una


distribución normal. Una kurtosis positiva indica que la distribución es relativamente. La
kurtosis negativa indica que la distribución es relativamente plana.

62
Donde: S es la desviación estándar de la muestra.
1. Ejemplo:
Los datos pertenecen a una distribución
platicurtica debido a que la kurtosis es
negativa.

Utilización de paquetes. Data análisis (Excel), Estadística Básica de Minitab,


o SPSS.

1.- Localizar data Análisis PARA WINDOWS XP

63
1.- Localizar data Análisis PARA WINDOWS 7

En el icono de ayuda ?, seleccionar complementos.

Leer cargar herramientas para análisis.

Una vez comprendido el procedimiento, cargar el complemento.

2. Seleccionar data análisis

64
3. Seleccionar estadística descriptiva, histograma, generación de números
aleatorios, rango o percetiles, dependiendo de lo que nos interese en el
problema.

En el cuadro de de dialogo para estadística descriptiva, es indispensable asignar el


rango de entrada (posición de nuestros datos), el rango de salida (Posición donde
quiero los resultados) de lo contrario los resultados se asignan en una hoja nueva o
en un libro nuevo y seleccionar el resumen estadístico.

En el cuadro de de dialogo para generación de números aleatorios o variables


aleatorias, es indispensable asignar el numero de variables o columnas y la

65
cantidad de números aleatorios o variables aleatorias, el tipo de distribución de
probabilidad con el valor de sus respectivos parámetros (media y desviación
estándar) y el rango de salida (Posición donde quiero los resultados) de lo contrario
los resultados se asignan en una hoja nueva o en un libro nuevo.

66
En el cuadro de de dialogo para histograma, es indispensable asignar el rango de
entrada (posición de nuestros datos), el rango de limites de clases y el rango de salida
(Posición donde quiero los resultados) de lo contrario los resultados se asignan en una
hoja nueva o en un libro nuevo.
Es importante aclarar que lo que vamos a obtener será una distribución de frecuencias
que mediante el asistente de funciones graficas se pude convertir en la representación
grafica deseada.

67
En el cuadro de de dialogo para promedios móviles, es indispensable asignar el rango
de entrada (posición de nuestros datos), el intervalo del promedio móvil y el rango de
salida (Posición donde quiero los resultados) seleccionar la grafica y el error estándar.

Procedimientos similares se hacen con MINITAB o SPSS.

EJERCICIOS:

CUESTIONARIO
1. ¿Qué significa el término distribución?
2. ¿Qué significa el término frecuencia?
3. ¿Qué es distribución de frecuencia?
4. ¿Qué es una clase?
5. ¿De qué otra manera se le llama a una clase?
6. ¿Que es un límite inferior?
7. ¿Qué es un límite superior?
8. ¿A qué se le llama frecuencia absoluta?
9. ¿A qué se le llama frecuencia acumulada?
10. ¿A qué se le llama frecuencia relativa?
11. ¿A qué se le llama frecuencia acumulada relativa?

68
12. ¿Qué es una marca de clase?
13. ¿Qué es un intervalo de clase?
14. ¿Qué es un diagrama de pareto?
15. ¿Cómo se elabora un diagrama de pareto?
16. ¿Qué es un histograma de frecuencia?
17. ¿Cómo se elabora un histograma de frecuencia?
18. ¿Qué es un polígono de frecuencias?
19. ¿Cómo se elabora un polígono de frecuencias?
20. ¿Qué es una ojiva?
21. ¿Cómo se elabora una ojiva?

PREGUNTAS DE CRITERIO
1. ¿Cuál es la diferencia entre una frecuencia absoluta y una relativa?
2. ¿Cuál es la diferencia entre un diagrama de pareto y un histograma de
frecuencias?
3. ¿Cuál es la semejanza entre un polígono de frecuencia y una ojiva?

EJERCICIO
I. El tiempo utilizado por los clientes de un banco en un cajero automático fue el
siguiente, medido en segundos:

49 150 130 80 300 251 160 51 170 125


35 90 350 50 75 249 85 92 115 245
49 142 189 97 179 126 345 99 183 138
133 226 323 77 130 147 85 97 270 246
85 164 181 145 76 290 215 156 192 42

Se pide:
1) Determine los límites inferior y superior.
2) Elabore cinco clases.
3) Determine el intervalo de clase.
4) Calcule la marca de clase.
5) Construya la distribución de frecuencias:
a) Absoluta.
b) Acumulada.
c) Relativa (En fracción, decimal y porciento).
d) Relativa acumulada (En fracción, decimal y porciento).
6) Elabore el histograma de frecuencia (absoluta y relativa).
7) Desarrolle los polígonos de frecuencia (relativa y absoluta).
8) Construya las ojivas (relativa y absoluta).
9) Calcule la media, la moda y la mediana para datos agrupados.
10)Calcule la desviación estándar, el coeficiente de asimetría y la Kurtosis y
caracterice a la distribución.

69
II. El consumo de latas de refresco en un evento fue de:

161 262 242 192 412 363 272 163 282 237
147 202 462 162 187 351 197 204 227 357
161 254 301 209 191 238 457 211 295 250
283 131 423 108 282 116 356 243 394 144
245 338 435 189 242 258 197 209 382 358
197 276 293 257 188 402 327 268 304 154

Se pide:

1) Determine los límites inferior y superior.


2) Elabore seis clases.
3) Determine el intervalo de clase.
4) Calcule la marca de clase.
5) Construya la distribución de frecuencias:
a) Absoluta.
b) Acumulada.
c) Relativa (En fracción, decimal y porciento).
d) Relativa acumulada (En fracción, decimal y porciento).
6) Elabore el histograma de frecuencia (absoluta y relativa).
7) Desarrolle los polígonos de frecuencia (relativa y absoluta).
8) Construya las ojivas (relativa y absoluta).

9) Calcule la media, la moda y la medina para datos agrupados.


10) Calcule la desviación estándar, el coeficiente de asimetría y la Kurtosis y
caracterice a la distribución.

III. Una empresa dedicada a la fabricación de artículo de madera determinó las fallas
por lote de puertas elaboradas, las cuales fueron:

a) Pintura: 120 b) Golpes: 37 c) Lijado: 21


d) Medidas: 12 e) Chapas: 7 f) Pegamento: 146

Se pide que elabore el diagrama de Pareto en valores absolutos y en porcentajes.

70

También podría gustarte