Documentos de Académico
Documentos de Profesional
Documentos de Cultura
°F = °C * (9/5) + 32
MEDIDAS DE TENDENCIA CENTRAL
Son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores.
Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Se definen
como un valor representativo de un conjunto de datos. Las medidas de tendencia central más
utilizadas son: Media, Mediana y Moda.
MEDIDAS DE DISPERSIÓN
log (r+1)
Media Geométrica Modificada
Si lo realizamos usando logaritmo neperiano (ln) : ln (x1+1) + ln (x2+1) + ln (x3+1)
En este caso:
e [ln(xi+1)/n]
= X geo ----- (2.7182818….) 0 = 1
Coeficiente de Variación
COEFICIENTE DE VARIACIÓN
Medida estadística que nos informa acerca de la dispersión relativa de un conjunto de datos
El coeficiente de variación es una calificación que permite a los usuarios evaluar la calidad
estadística de las estimaciones.
3. Entre el 15% y 20% precisión regular y por lo tanto se debe utilizar con precaución.
4. Mayor del 20% indica que la estimación es poco precisa y por lo tanto se recomienda utilizarla
sólo con fines descriptivos
OTRAS MEDIDAS DE VARIABILIDAD
n
i 1
[ Xi X ] / N
n
i
[ X i Me ]
1
/N
n
i
[ X i Mo ]
1
/N
MEDIDAS DE POSICIÓN
Kx (X * n) / k
- Si los datos son impares, se aplica la siguiente formula:
Kx[X*(n+1)]/k
Donde:
X = percentil (1,2,3,....,98,99)
quartil(1,2,ó 3)
ó decil (1,2,3,4,...,9)
= 4 (si es quartil)
= 10 (si es decil)
Ejemplo:
P75 = (75*8)/100 =6
El percenlil 75 se encuentra en la sexta posición (su valor
es 16) y por debajo de este valor esta el 75 % de los
datos.
D7 = (7*8)/lO = 5.6
El decil 7 se encuentra entre el 5to. Y el 6to. dato, (su
valor esta entre 16-16).
Q3 = (3*8)/4 = 6
Esto significa que el Q3 se encuentra en la sexta posición
(su valor es 16).
Ejemplo. Caso de la fabricación de Chocolates
La fábrica de chocolate, tiene indicios que el peso de las barras que produce, presenta una
variabilidad más alta que la deseada, no obstante que el peso nominal es de 30 gramos.
Se desea estudiar esta situación e identificar algunas acciones que permitan generar una mejora en
cuanto a la heterogeneidad.
¿Qué tan grave es la situación?. Dado que la variabilidad es inevitable, ¿qué quiere decir una
variabilidad más alta que la deseada? ¿Cuál es la deseada? ¿Cuál es el peso de las barras de
chocolate que se producen?
La respuesta a esta última pregunta no es un solo número, porque existe variabilidad, porque se
sabe que es inevitable que todas las barras de chocolate salgan con peso diferente.
Una muestra aleatoria de barras de chocolate es obtenida, los pesos registrados aparecen a
continuación:
30,44 29,96 30,14 29,96 29,83 30,47 30,26 29,77 30,13 29,91
30,02 29,76 30,3 30,01 30,2 30,1 30,1 30,35 30,07 29,85
29,67 29,67 29,95 30,05 30,15 30,22 30,07 30,06 29,69 29,67
No obstante que son solo 30 datos, obtener alguna conclusión solo mirando los datos anteriores es
difícil. Para tener una primera mirada de la situación podemos recurrir al más sencillo de los
gráficos un diagrama de puntos.
Diagrama de puntos para el peso de barras de chocolate en una muestra aleatoria de 30 unidades.
Gráfico muy sencillo, que permite ver de un solo golpe de vista todos los datos, su ubicación relativa, las zonas donde
están más concentrados y si aparecen algunas posibles anomalías (puntos atípicos). Este gráfico es muy útil, sobre
todo cuando la muestra no es demasiado grande.
Se detecta que los datos varían entre los valores extremos de 29.67 gramos (mínimo) y 30,47 gramos
(máximo).
A la diferencia se le denomina rango. Rango = Máximo-Mínimo=30,47 gr. - 29,67 gr. = 0,8 gr.
Sabemos que la diferencia entre la barra más pesada y la más liviana es de 0,8 gramos. ¿Es grande este valor?
Para intentar responder, como clientes de los chocolates, hacemos conciencia que si en el mercado nos dieran
una barra de chocolate de 29,7 gramos, cuando en el empaque dice 30 gramos, muy seguramente no lo
notaríamos, de la misma manera si la barra pesara 30,5 gramos, tampoco nos enteraríamos del exceso.
La reflexión anterior, nos haría pensar, en calidad de consumidores, que la variabilidad revelada en la muestra
no es exagerada.
Sin embargo, desde el punto de vista del fabricante otro podría ser el panorama, pues por un lado, para la
industria de alimentos y los procesos de empacado, existe la legislación que toma en consideración la
variabilidad, pero que define normas muy precisas para su control.
En esta situación la pregunta podría convertirse en: ¿Estamos cumpliendo con las normas legales?
Por otro lado, dependiendo de la capacidad de los procesos de la fábrica y de las políticas de la empresa frente
a la competitividad, la propia empresa podría tener normas internas de calidad, mucho más exigentes que las
normas legales.
En este casos la pregunta sería: ¿Estamos cumpliendo con las normas y políticas de la empresa?
En ambos casos, para emitir un juicio, requeriríamos de las especificaciones para el producto.
Imaginemos que la empresa por todas las consideraciones anteriores, ha definido el siguiente límite de
especificación:
una barra de chocolate se considera conforme si su peso se encuentra entre 29,7 gramos y 30,3 gramos.
Calculemos pues, con este criterio, qué porcentaje de las barras de chocolate de la muestra no cumplen con
las especificaciones.
La respuesta puede deducirse a partir del siguiente diagrama de puntos en el que se han marcado los límites
de especificación para las barras de chocolate.
Valoración de la variabilidad al confrontar la muestra con los límites de especificación del producto.
Observemos que de las 30 barras de chocolate hay 5 que no cumplen con las especificaciones definidas por la
fábrica, lo cual representa aproximadamente es un 17%, lo cual denota una situación delicada.
Esta exploración, nos ha permitido corroborar la sensatez de la presunción que ha dado origen a
estas pesquisas. Antes de seguir adelante, conviene plantear una reflexión:
¿Si tomáramos de nuevo una muestra aleatoria de 30 barras, obtendríamos exactamente los mismos
resultados?
CONSTRUCCION DE HISTOGRAMA
Veamos el siguiente ejemplo : suponga que una persona investiga el precio de cierto artículo y
elige 40 puntos de venta al azar obteniendo los siguientes resultados :
60 75 89 77 65 80 63 72
87 64 73 75 67 74 75 74
68 73 75 75 74 76 71 76
86 82 70 71 68 78 83 77
74 67 88 80 72 78 85 84
Observaciones
Aunque podemos hacer cierto cálculos sobre lo datos tal como están ( datos no agrupados ) a
continuación estudiaremos la forma de agruparlos.
Para agrupar los datos contabilizaremos el número de veces que se repiten los diferentes datos en la
muestra.
A esto lo llamaremos frecuencia absoluta y lo denotaremos por ni
La tabla siguiente muestra estas frecuencias en el rango de valores de Xi.
En nuestro ejemplo :
K = 1 + 3.3*log(40).
K = 6.3
Algunos autores sugieren la siguiente regla:
El número de clases en que se agrupan los datos se determina con la raíz cuadrada del
Para muestras con 200 o más datos el número de clases se determina con la raíz cúbica
del
número de datos:
Dado que K es una referencia podemos utilizar 6 o 7 intervalos de clases.
Como norma, K debe ser mayor o igual que 5 y menor o igual que 20.
El siguiente paso es determinar la cantidad de datos que potencialmente será incluido en cada
intervalo de clase. Esta cantidad la llamaremos amplitud y la denotaremos por A.
Para ello hacemos A = R/K = 29/6= 4.833….
Si redondeamos podemos utilizar A = 5.
60 -
El limite inferior del primer intervalo de clase es 60
Construcción de los intervalos de clases
65 – 70
70 – 75
75 – 80
80 – 85
85 – 90
Tabla de Frecuencias
La tabla de frecuencias es una tabla cuyas filas corresponden a cada intervalo de clases y consta
de varias columnas.
La primera columna es la de frecuencias absolutas ni en cada intervalo y se obtiene asignando
cada dato en la muestra en cada intervalo.
Intervalo de Frecuencia
Clase Abs. ( ni )
[60 – 65[ 3
[65 – 70[ 5
[70 – 75[ 11
[75 – 80[ 11
[80 – 85[ 5
[85 – 90[ 5
Notemos que :
k
n
i 1
i n.
Además de tener una columna con las frecuencias absolutas podemos construir una
columna de frecuencias relativas f i.
n i n
ni
fi , i 1,...., k
i 1
n
Para construir un Histograma (gráfico de barras y sirve para graficar las frecuencias relativas o
absolutas para variables cuantitativas) seguimos el siguiente procedimiento :
2. A continuación dibujamos barras contiguas (pegadas entre sí), una por cada intervalo de clase,
haciendo coincidir su base con los límites del intervalo de clase respectivo.
HISTOGRAMA
HISTOGRAMA
Uniforme
HISTOGRAMA
HISTOGRAMA
Cuartil 1 = 15 min.
Mediana = 18 min.
Cuartil 3 = 22 min.
Enseguida, dibujamos una caja que inicie en Q1 (15 min) y termine Q3 (22 min).
Dentro de la caja trazamos una línea vertical para representar a la mediana (18 min).
Por último, prolongamos líneas horizontales a partir de la caja dirigidas al valor mínimo (13 min)
y al valor máximo (30 min).
Estas líneas horizontales que salen de la caja, a veces reciben e nombre de bigotes.
El Diagrama de caja muestra que el valor medio de las entregas, 50%, consume entre 15
y 22 minutos.