Está en la página 1de 22

Control de Calidad Aplicado a la Ingeniera Pg.

1
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
CONCEPTOS BSICOS DE ESTADSTICA DESCRIPTIVA
DISTRIBUCIONES UNIDIMENSIONALES.
Introduccin.
Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la
Descriptiva. Esta parte se dedica nica y exclusivamente al ordenamiento y
tratamiento mecnico de la informacin para su presentacin por medio de tablas
y de representaciones grficas, as como de la obtencin de algunos parmetros
tiles para la explicacin de la informacin (Larios, 1998). Adems, puede ser
usado para comparar dos (2) caractersticas medibles sobre algunas personas en un
grupo, para comparar grupos usando la misma caracterstica y comparar un grupo
con el universo (Otto, 1987). La Estadstica Descriptiva, por lo general, no pasa a
ser un anlisis ms profundo de la informacin. Es un primer acercamiento a la
informacin y, por esa misma razn, es la manera de presentar la informacin
ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere
decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un
medio accesible a la mayora de la poblacin humana, resulta de suma
importancia considerar para as evitar malentendidos, tergiversaciones o errores.
La informacin de toda clase y en particular procedente de los resultados de la
inspeccin y de las pruebas, debe ser ordenada en grupos o arreglos, de tal
manera que sea posible obtener la mejor representacin por medio de una
distribucin de frecuencias, mediante esta distribucin es posible comprender la
magnitud de la exactitud y precisin de un proceso o de una caracterstica de
calidad con respecto a una especificacin determinada.

CONCEPTO GRAFICO












Mtodos de Anlisis

Recolectar, organizar, resumir
grandes conjuntos de datos.

GRAFICOS:
-Histogramas de Frecuencias.
-Diagrama Tallos y Hojas.
-Diagrama de Caja.

Permite

NUMERICOS:
- Medidas de tendencia central.
- Medida de Dispersin.
- Medidas de Forma.

Mediante

Estadstica Descriptiva

Control de Calidad Aplicado a la Ingeniera Pg. 2
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
NMEROS RELATIVOS.
Utilizando los nmeros absolutos como base de anlisis se puede distorsionar la
realidad, esto normalmente ocurre cuando se usa la frecuencia o cantidad de
casos de una categora de inters con motivo de comparacin sin hacer referencia
del total.
Este apartado pretende mediante tcnicas de nmeros relativos, facilitar las
herramientas necesarias para poder minimizar o eliminar los anlisis
distorsionados cuando se utilizan los nmeros absolutos sin tener en consideracin
el tamao. Las tcnicas de los nmeros relativos a discutir sern: proporcin, por
ciento, razn, tasa de cambio o por ciento de cambio y tasas.
Proporcin.
Compara el nmero de casos en una categora de inters de una variable
especfica con el tamao total de la distribucin de los casos de todas las
categoras, incluyendo la categora de inters. Hay que resaltar que los casos de
dicha categora de inters formar parte del nmero total de casos en la
distribucin total. Adems, cuando todas las categoras de una variable se
expresan como proporcin (P), la suma de todas las (P) debe dar uno (1).
Podemos entonces convertir cualquier categora en una proporcin (P), dividiendo
el nmero de casos o frecuencia (a) de cualquier categora de inters por el
nmero total de casos en la distribucin de la variable especfica. La notacin
expresada sera:




donde:
- P = Proporcin
- = Frecuencia, cantidad o nmero de casos.
- a = Frecuencia, cantidad o nmero de casos de una categora de inters de
una variable especfica.
- i = Frecuencia(s), cantidad(es) o nmero(s) de caso(s) de otra(as)
categora(as) de la misma variable especfica.
- a + i = La suma de la frecuencia, cantidad o nmero de casos de la categora
de inters con la(as) frecuencia(as) o nmero de casos de otra(as) categora(as)
de la variable especfica. O sea, es el nmero total de casos en la distribucin
de una variable especfica.
Por Ciento.
La expresin "por ciento" viene de la frase latina "per centum", y de ella se deriva
la palabra "porcentaje". Un sinnimo para expresar el por ciento es distribucin
porcentual. El propsito de este mtodo es reflejar la frecuencia (a) de
ocurrencia de una categora de inters por cada cien (100) casos. Cuando todas
las categoras de una variable se expresan como porcentaje del total, la suma de
todos los porcentajes debe dar cien (100) o aproximado a cien (100). Para
Control de Calidad Aplicado a la Ingeniera Pg. 3
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
calcular un porcentaje multiplicamos cualquier proporcin por 100. La notacin
expresada sera:







donde: % = Por ciento; porcentaje; distribucin porcentual
Razn.
Compara directamente el nmero de casos que caen dentro de una categora de
inters (por ej., hombres) con el nmero de casos que caen dentro de otra
categora de inters (por ej. mujeres). Es un cociente que simboliza el resultado
de comparar dos cantidades. As, se puede obtener una razn (R) de la siguiente
manera, donde a es igual a la frecuencia de una categora de inters y b es
igual a la frecuencia de otra categora de inters. Como principio bsico hay que
establecer que el numerador no es una parte componente del denominador
(Daniel, 1985) como hemos notado en el mtodo de proporcin y por ciento. La
notacin expresada sera:




donde: R = Razn
b = Frecuencia, cantidad o nmero de casos de otra categora de inters que se
localiza en el denominador.
Una pregunta bsica es qu categora va en el numerador y que categora va en el
denominador. Veamos, si usted como investigador desea buscar en un lugar y
tiempo especfico cuntas mujeres existen por tantos hombres, estara usted
planteando cul sera la razn mujer vs. hombre. La primera categora que se
menciona en dicho problema es mujer y la segunda categora mencionada es el
hombre. Por consiguiente, la manera correcta sera tomar la primera categora
que se menciona como numerador y la segunda categora como denominador
(Snchez, 1992).
El resultado final se lee en trminos de tantos de la categora que representa la a
por cada 1 o 100 de la categora que representa la b. Adems, cancelando los
factores comunes en el numerador y el denominador, es posible reducir la razn a
su forma ms simple, siempre y cuando aplique. Sintetizando podemos sealar
que podemos resolver la razn por tres formas distintas:
a. razn utilizando la constante de uno,
b. razn utilizando la constante de cien,
c. cancelando los factores comunes de la razn.
Cambio Porcentual.
El cambio que puede ocurrir en un perodo dado puede reflejar un aumento o una
disminucin. El inters de este mtodo es establecer cunto representa
porcentualmente ese aumento o disminucin. Permite determinar en cunto por
ciento ha mermado (o aumentado) un fenmeno entre dos puntos de referencia
Control de Calidad Aplicado a la Ingeniera Pg. 4
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
(Snchez, 1992). Al computar la tasa de cambio o por ciento de cambio
comparamos el cambio real entre el evento ms reciente en un tiempo a contra
el evento menos reciente en otro tiempo b, sirviendo como base el evento menos
reciente tiempo b. La notacin expresada sera:



donde: % = Cambio porcentual o tasa de cambio.
tiempo a = es el valor, frecuencia o cantidad que esta ubicado en el tiempo ms
reciente.
tiempo b = es el valor, frecuencia o cantidad que esta ubicado en el tiempo
menos reciente.
Tasas.
Para medir el riesgo de que ocurra un evento dado (es decir; divorcio;
matrimonios; homicidios; suicidios; autos hurtados; criminalidad; desempleo;
natalidad; entre otros) en una poblacin y poder hacer comparaciones vlidas, se
debe relacionar ese evento con la poblacin en la cual aconteci o puede
acontecer (Snchez, 1992; Guerrero, et. al., 1981). Esa relacin se conoce con el
nombre de tasas. La misma se refiere a aquellos clculos que implican la
probabilidad de la ocurrencia de algn evento (Daniel, 1985), mediante las
comparaciones entre el nmero de casos reales y el nmero de casos potenciales
(Levin, 1979). Es preciso sealar que tanto el numerador (casos reales) como el
denominador (casos potenciales) deben referirse al mismo lugar, al mismo lapso o
tiempo de ocurrencia y al mismo grupo de poblacin. Las tasas pueden ser crudas
(brutas, globales), cuando los eventos se refieren a la poblacin total, incluyendo
elementos que no son afectados por el evento; y especficas, cuando se refiere a
una parte de la misma. Una tasa puede hacerse tan especfica siempre que sus
elementos se identifiquen con toda claridad. La notacin expresada sera:





Donde: T = Tasas
casos reales = La frecuencia con la cual ha ocurrido un evento durante algn
perodo y lugar especfico.
casos potenciales = El nmero de personas expuestas al riesgo del evento
durante el mismo perodo y lugar especfico.
k = El propsito del multiplicador k, llamado base, es evitar resultados que
comprendan nmeros muy pequeos, que puedan surgir en el clculo de tasas, y
facilitar la compresin de esta ltima. El valor elegido para k depender de las
magnitudes del numerador y el denominador. Algunas k para la tasa estn
preestablecidas como variables de salud (1,000); variables de economa (10,000);
variables de criminalidad (100,000).
Control de Calidad Aplicado a la Ingeniera Pg. 5
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
Los casos reales es la cantidad o frecuencia con que ha ocurrido un evento
normalmente son fciles de encontrar si estn registradas. Ejemplo del mismo son
las actas de defunciones, los nacimientos, matrimonios, divorcios, registro
electoral, autos hurtados, delito tipo I, suicidios, homicidios, empleos,
desempleos, entre otros. Estos eventos son registrados sistemticamente, y por
ende, podemos tener acceso a dichos totales.
Los casos potenciales, es decir, el nmero de personas expuestas al riesgo del
evento de inters es en ocasiones ms difcil de encontrar. Por ejemplo, si
nuestro inters como investigador es analizar la tasa de nacimientos para el ao
2002 tendramos que tener los siguientes elementos; por un lado los casos reales
(nacimientos ocurridos en el 2002) y los casos potenciales (la poblacin expuesta a
ese evento). Para buscar los casos potenciales se debe establecer que poblacin
esta expuesta al evento de inters (nacimientos). No toda la poblacin estuvo
expuesta al evento de nacimientos. Son las mujeres y no los hombres las que
estn expuestas al evento de los nacimientos. Es decir, son ellas las que tienen
nios(as) y por lo tanto, la poblacin femenina es la ms expuesta a los
nacimientos. Esta informacin de la poblacin femenina esta disponible, por lo
que es fcil de obtener. Como nota aclaratoria, si se insiste en calcular una tasa y
en los casos potenciales se incluyen elementos (poblaciones) que no estn
expuestos al evento, los resultados se denominas como tasas brutas. Es decir, si
calculamos una tasa de natalidad y los casos potenciales incluimos mujeres
(expuestas al evento) y hombres (no expuestos al evento), entonces lo que se
encontr fue una tasa bruta de natalidad. Hay que distinguir entre las mujeres
que estn en la edad reproductiva vs. las que no estn en la edad
reproductiva. Por consiguiente, la poblacin con mayor exposicin al evento de
nacimientos es el sector femenino en edad reproductiva, o sea, mujeres entre 15
a 49 aos. Sin ningn problema, esta informacin de la poblacin femenina por
edades esta disponible por lo que es fcil de obtener. No olvidemos que mientras
ms depurada tengamos los casos potenciales mejor ser la impresin ofrecida por
el valor calculado.
TABLAS ESTADSTICAS.
A partir de este momento nos vamos a ocupar de las estadsticas de una sola
variable, "Estadsticas Unidimensionales". Las tablas estadsticas segn el nmero
de observaciones y segn el recorrido de la variable estadstica, se tienen los
siguientes tipos de tablas estadsticas:
1.- Tablas tipo I.
Cuando el tamao de la muestra y el recorrido de la variable son pequeos, por
ejemplo si tenemos una muestra de las edades de 5 personas, por lo que no hay
que hacer nada especial simplemente anotarlas de manera ordenada en filas o
columnas.
Edad de los 5 miembros de una familia: 5, 8, 16, 38, 45 aos.
2.- Tablas tipo II.
Control de Calidad Aplicado a la Ingeniera Pg. 6
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
Cuando el tamao de la muestra es grande y el recorrido de la variable es
pequeo, por lo que se tienen valores de la variable que se repiten. Por ejemplo,
si preguntamos el nmero de incidentes que ocurrieron en 50 semanas obtenemos
la siguiente tabla:
2 1 2 2 1 2 4 2 1 1 2 3 2 1 1 1 3 4 2 2 2 2 1 2 1
1 1 3 2 2 3 2 3 1 2 4 2 1 4 1 1 3 4 3 2 2 2 1 3 3
Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo
que se requiere de una tabla, en la que se tiene que resumir estos datos,
quedando de la siguiente manera la tabla:
No. de Incidentes Nmero de semanas
1 16
2 20
3 9
4 5
Total 50
3.- Tablas tipo III.
Cuando el tamao de la muestra y el recorrido de la variable son grandes, por lo
que ser necesario agrupar en intervalos los valores de la variable. Por ejemplo si
a un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan
encima, nos encontramos con los siguientes datos:
450 1152 250 300 175 80 25 2680 605 785 1595 2300 5000 1200 100
5 180 200 675 500 375 1500 205 985 185 125 315 425 560 1100
Evidentemente, la variable estadstica tiene un recorrido muy grande, 5000 soles,
que es el ms alto, por lo que s queremos hacer una tabla con estos datos
tendremos que tomar intervalos. Para decidir la
amplitud de los intervalos, necesitaremos decidir
cuntos intervalos queremos?. Normalmente se
suele trabajar con no ms de 10 o 12 intervalos,
por lo que la amplitud ser a: Amplitud =5000/10 =
500, de esta manera tomaremos intervalos de
amplitud 500
Debemos tener en cuenta las siguientes
consideraciones:
- Tomar pocos intervalos implica que la "prdida
de informacin" sea mayor.
- Los intervalos sern siempre Cerrados por la
izquierda y Abiertos por la Derecha [ L
i-1
, L
i
)
Procuraremos que en la decisin de intervalos los
valores observados no coincidan con los valores de
los extremos del intervalo y si esto ocurre que no
sea en ms de un 5% del total de observaciones, as
tendremos la siguiente tabla:
[ L
i-1
- L
i
) Frecuencia
[ 5 - 505) 17
[ 505 - 1005) 5
[ 1005 - 1505) 4
[ 1505 - 2005) 1
[ 2005 - 2505) 1
[ 2505 - 3005) 1
[ 3005 - 3505) 0
[ 3505 - 4005) 0
[ 4005 - 4505) 0
[ 4505 - 5005) 1
E 30
Control de Calidad Aplicado a la Ingeniera Pg. 7
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
Tcnicas de recuento.
Aunque hoy en da, si se realiza un estudio estadstico importante esta tarea la
realiza el ordenador, ya sea por medio de programas de estadstica especficos
BMDP, SPSS, o bien utilizando herramientas informticas de propsito general
como Bases de Datos u Hojas de Clculo. A lo largo del curso, veremos como
mediante hojas de clculo o bases de datos podemos realizar este recuento.

Veamos como realizaramos este proceso manualmente, para ello veremos
diversas tcnicas de ir anotando las puntuaciones; aunque el mtodo ms utilizado
o conocido sea el primero, quizs el ms cmodo de utilizar es el 2 en la mayora
de los casos.
Tipos de Frecuencia.
Una de los primeros pasos que se realizan en cualquier estudio estadstico es la
tabulacin de resultados, es decir, recoger la informacin de la muestra resumida
en una tabla, en la que a cada valor de la variable se le asocian determinados
nmeros que representan el nmero de veces que se ha encontrado, su proporcin
con respecto a otros valores de la variable, estos nmeros se denominan
frecuencias: As tenemos los siguientes tipos de frecuencia:
a) Frecuencia absoluta.
La frecuencia absoluta de una variable estadstica es el nmero de veces que
aparece en la muestra, dicho valor de la variable la representaremos por n
i
b) Frecuencia relativa.
La frecuencia absoluta, es una medida que est influida por el tamao de la
muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de
la frecuencia absoluta. Esto hace que no sea una medida til para poder
comparar. Para esto es necesario introducir el concepto de frecuencia relativa,
que es el cociente entre la frecuencia absoluta y el tamao de la muestra. La
denotaremos por f
i

Donde N = Tamao de la muestra
c) Frecuencia Absoluta Acumulada.
Para poder calcular este tipo de frecuencias hay que tener en cuenta que la
variable estadstica ha de ser cuantitativa o cualitativa ordenable. En otro caso
no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta
acumulada de un valor de la variable, es el nmero de veces que ha aparecido
en la muestra un valor menor o igual que el de la variable; y lo representaremos
por N
k
.

=
=
k
i
i k
n N
1
N
n
f
i
i
=
Control de Calidad Aplicado a la Ingeniera Pg. 8
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
d) Frecuencia Relativa Acumulada.
Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia
absoluta acumulada dividido por el tamao de la muestra, denotaremos por F
i

e) Porcentaje.
La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante
frecuente hablar siempre en trminos de tantos por ciento o porcentajes, por lo
que esta medida resulta de multiplicar la frecuencia relativa por 100. La
denotaremos por p
i
.

f) Porcentaje Acumulado.
Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar por P
i

como la frecuencia relativa acumulada por 100.

La distribucin de frecuencia es la representacin estructurada, en forma de tabla
(ver tabla 1.1), de toda la informacin que se ha recogido sobre la variable que se
estudia en la muestra o poblacin original, y la forma secuencial como se construye
la tabla es la siguiente:
PROCESO DE CONSTRUCCIN DE DEL CUADRO DE DISTRIBUCIN DE FRECUENCIAS
Obtencin de datos de la muestra
Determinar el valor mnimo y mximo de la muestra, utilizando los valores
Determinar el rango (max-min)
Obtener el nmero de clases utilizando la regla de Sturges.
No. de clases = 1+3.33 * Log n
Determinar el Ancho de clase o Amplitud:
C = Rango / # clases
Determinar los intervalos de clases y proceso de conteo
Construir Histograma de Frecuencia
Construir tabla de frecuencia, incluyendo frecuencias como:
n
i
, f
i
, N
i
, F
i
, Y
i
, p
i
, P
i

Tabla 1.1.- Componentes de la tabla de frecuencias.
Intervalo
de
Clases (x
i
)
Conteo
Frecuencias Frecuencias
Absoluta (n
i
) Acumulada (N
i
) Relativa (f
i
) Acumulada (F
i
)
[X
1
X
2
) ||| n
1
n
1
f
1
= n
1
/ n f
1

[X
2
X
3
) |||| n
2
n
1
+ n
2
f
2
= n
2
/ n f
1
+ f
2

... ... ... ... ...
[X
n-1
X
n
) || n
n-1
n
1
+ n
2
+..+ n
n-1
f
n-1
= n
n-1
/ n f
1
+ f
2
+..+ f
n-1

E E n
n
E n fn = n
i
/ n E f
Siendo X los distintos valores que puede tomar los intervalos de clases.
Siendo n el nmero de veces que se repite en cada valor.
Siendo f el porcentaje que la repeticin de cada valor supone sobre el total

=
= =
k
i
i k
i
i
f F
N
N
F
1
% 100 - =
i i
f p
% 100 - =
i i
F P
Control de Calidad Aplicado a la Ingeniera Pg. 9
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
Ejemplo: Se analizaran medidas de resistencia a la ruptura de 58 muestras de
monofilamento, utilizado para la fabricacin de redes. Para dicho anlisis se har
uso de tecnologa computacional, utilizando las herramientas estadsticas; por
tanto, para los resultados se analizaron los datos originales, con el fin de observar
el patrn del comportamiento de dicha variable mediante su histograma y tabla de
frecuencia. Los datos de resistencia se muestran en la siguiente tabla:
66.4 74.2 72.1 71.2 70.3 70.3
69.2 67.7 74.5 72.2 71.3 71.3
70.0 69.3 68.0 75.3 72.3 72.4
71.0 70.1 69.3 68.0 68.3 68.4
71.9 71.1 70.2 69.5 69.5 69.6
70.8 70.6 70.6 70.5 70.4 70.9
71.8 71.7 71.6 71.6 71.5 71.8
73.3 73.1 72.9 72.7 72.6 73.5
69.1 69.0 68.9 68.8 68.6
70.0 69.9 69.8 69.8 69.7
Presentacin Grafica de Cuadros de Distribucin de Frecuencias.-
La construccin del histograma y las otras graficas representativas se determinan
utilizando las herramientas de anlisis de datos de Excel.
1.- Histogramas. El diagrama de barra o grafico de barra, son rectngulos
verticales en donde sus lados son el lmite inferior y superior de cada clase y cuya
altura de cada uno de ellos es igual a la frecuencia de clase (n
i
/ f
i
).
2.- Polgono de Frecuencias.- Es una grafica lineal que muestra la variacin de los
datos segn la distribucin de clases en variables continuas, las marcas de clase se
ubican en el eje de las abscisas y las frecuencias en las ordenadas; cuando la
variacin tiene causales fundamentales que van permaneciendo constantes recibe
en nombre de variacin inherente; para formar una figura cerrada se genera los
puntos extremos: (Y
i
C, 0 ) y (Y
k
+ C, 0 ).
H i s t o g r a m a d e F r e c u e n c i a
0
2
4
6
8
1 0
1 2
1 4
1 6
1 8
6
6
.
3

-

6
7
.
6
6
7
.
6

-

6
8
.
9
6
8
.
9

-

7
0
.
2
7
0
.
2

-

7
1
.
5
7
1
.
5

-

7
2
.
8
7
2
.
8

-

7
4
.
1
7
4
.
1

-

7
5
.
4
N u m e r o d e c l a s e s
F
r
e
c
u
e
n
c
i
F r e c u e n c i a
Control de Calidad Aplicado a la Ingeniera Pg. 10
Ing Edmundo Alarcn Cceres Estadstica Descriptiva

3.- Grafica de Frecuencias Acumuladas.- Es una grafica lineal, donde se muestra
la sumatoria de las frecuencias de cada clase, a esta representacin grafica
tambin se le conoce con el nombre de ojiva.












MEDIDAS ESTADSTICAS.
Introduccin.
En el resto del tema nos ocuparemos exclusivamente de las variables cuantitativas,
puesto que con los atributos no se pueden realizar operaciones aritmticas. Como
se ha estudiado, las variables estadsticas cuantitativas se dividen o clasifican en
discretas y continuas, por lo que necesitaremos precisar cmo se calculan dichas
medidas en cada caso.
0
0.05
0.1
0.15
0.2
0.25
0.3
66.95 68.25 69.55 70.85 72.15 73.45 74.75
F
r
e
c
u
e
n
c
i
a
Marcas de Clase
Poligono de Frecuencias
Series1
0
10
20
30
40
50
60
70
F
r
e
c
u
e
n
c
i
a
Numero de Clases
Ojiva
Frecuencua
Control de Calidad Aplicado a la Ingeniera Pg. 11
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
En las variables cuantitativas continuas, dado que la tabulacin de los datos se
hace mediante intervalos, necesitaremos tomar un valor del intervalo para poder
operar. Este valor se denomina marca de clase y es el punto medio del intervalo.

Las medidas estadsticas pretenden "resumir" la informacin de la "muestra" para
poder tener as un mejor conocimiento de la poblacin, para un estudio ordenado y
claro, se tienen los siguientes tipos:
TIPOS DE MEDIDA.
A.- MEDIDAS DE CENTRALIZACIN.
Aunque se organicen los datos en una forma til y significativa es preciso disponer
de los datos de forma tal que puedan presentarse proposiciones cuantitativas
(Haber y Runyon, 1992). Una forma til de describir a un grupo en su totalidad es
encontrar un nmero que lo represente (Levin, 1979). Se ha observado que una de
las caractersticas que se presenta en mltiples distribuciones de frecuencias es
que los datos se acumulan alrededor de un valor central situado entre los dos
extremos de la variable que se estudia (Haber y Runyon, 1992). En la
investigacin, ese valor se conoce como una medida de tendencia central, ya que
est generalmente localizada hacia el medio o centro de una distribucin en la
que la mayora de los puntajes tienden a concentrarse. La tendencia central es un
ndice de localizacin central empleado en la descripcin de las distribuciones de
frecuencias. La capacidad de localizar un punto de tendencia central puede ser
muy til para el investigador. Por ejemplo, podr reducir una masa de datos a un
simple valor cuantitativo que llegar a ser comprendido y comunicado a otros
especialistas.
Puesto que el centro de una distribucin puede ser definido de diferentes
maneras, habr tambin diferentes medidas de tendencia central. Usualmente se
conocen tres tcnicas: la moda, la mediana y la media aritmtica.
Las medidas de tendencia central son de dos tipos:
a) Medidas de posicin central.- informan sobre los valores medios de la serie
de datos.
b) Medidas de posicin no centrales.- informan de como se distribuye el resto de
los valores de la serie.
MEDIDAS DESCRIPTIVAS
Medidas de Posicin
Medidas de Tendencia
Central
Cuarteles y Percentiles
Medidas de Dispersin
Varianza
Desviacin Estndar
Desv. Absoluta Media
Coef. de Variacin
Rango Intercuartlico
Medidas de Forma
- Sesgos
- Curtosis
Control de Calidad Aplicado a la Ingeniera Pg. 12
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
Las principales medidas de posicin central son las siguientes:
MEDIA.- Vamos a estudiar en este apartado los distintos tipos de media que son:
Media aritmtica.- Para calcular la media aritmtica se tienen dos modelos:
Propiedades.- La media presenta el problema de que su valor (tanto en el caso de
la media aritmtica como geomtrica) se puede ver muy influido por valores
extremos, que se aparten en exceso del resto de la serie. Estos valores anmalos
podran condicionar en gran medida el valor de la media, perdiendo sta
representatividad. En todo caso, la media aritmtica es la medida de posicin central
ms utilizada.
Mtodo abreviado.- Se determina mediante los siguientes procesos:
a. Hallando el origen de trabajo Ow, este es igual a la marca de clase con mayor
frecuencia Ow = Y
i
con > n
j

b. Calcular los desvos por medio de la formula:


c. Calcular el promedio por medio de la frmula de:


Media geomtrica.- Segn el tipo de datos que se analice ser ms apropiado
utilizar la media aritmtica o la media geomtrica. La media geomtrica se suele
utilizar en series de datos como tipos de inters anuales, inflacin, etc., donde el
valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores.
La media geomtrica de N observaciones es la raz de ndice N del producto de
todas las observaciones. La representaremos por G.

Solo se puede calcular si no hay observaciones negativas. Es una medida
estadstica poco o nada usual.
Media armnica.- La media armnica de N observaciones es
la inversa de la media de las inversas de las observaciones y
la denotaremos por H; al igual que en el caso de la media
geomtrica su utilizacin es bastante poco frecuente.
Para datos no agrupados: Para datos agrupados se define como la
suma ponderada:

N
X
X
n
i
i
=
=
1
N
n Y
f Y X
n
i
i i
i
n
i
i

=
=
-
= - =
1
1
Control de Calidad Aplicado a la Ingeniera Pg. 13
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
MEDIANA.- La mediana es el valor central de la variable, es decir, supuesta la
muestra ordenada en orden creciente o decreciente, el valor que divide en dos
partes la muestra (es decir el valor tal que el 50% de los datos esta por arriba de
dicho valor y el 50% que esta por de bajo). Para calcular la mediana debemos tener
en cuenta si la variable es discreta o continua.
Clculo de la mediana en el caso discreto: Tendremos en cuenta el tamao de la
muestra.
Si N es Impar, hay un trmino central, el trmino que ser el valor de la mediana.
Si N es Par, hay dos trminos centrales, la mediana ser la media de esos dos
valores, Veamos un ejemplo.
N Par


N Impar

1,4,6,7,8,9,12,16,20, 24,25,27 N=12 1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13
Trminos Centrales el 6 y 7 9 y 12 Trmino Central el 7 , 12

Me =
Me = 12
Clculo de la mediana en el caso contnuo: Si la variable es continua, la tabla
vendr en intervalos, por lo que se calcula de la siguiente forma: Nos vamos a
apoyar en un grfico de un histograma de frecuencias acumuladas.


De donde la mediana es:

MODA. La moda es el valor de la variable que tenga mayor frecuencia absoluta, la
que ms se repite. Por su propia definicin, la moda no es nica, pues puede haber
dos o mas valores de la variable que tengan la misma frecuencia siendo esta
mxima.
a).- Calculo de Mo en el caso discreto.- es la nica medida de centralizacin que
no tiene sentido estudiar en una variable cualitativa, pues no precisa la realizacin
de clculo matemtico; por lo tanto, la moda se considera la mayor concentracin
de datos. En cuyo caso tendremos unimodal, bimodal o polimodal segn sea el
caso.


+ =

j
j
j real
n
N
N
C L Me
1
. inf
2
Control de Calidad Aplicado a la Ingeniera Pg. 14
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
b).- Calculo de No en el caso continuo.- Para este caso debemos detenernos un
poco en el clculo de la moda para distribuciones cuantitativas continuas.






Apoyndonos en el grfico podemos llegar a la determinacin de la expresin para
la Moda que es:

+

+ =
+

) ( ) (
1 1
1
. inf
j j j j
j j
i real
n n n n
n n
C L Mo
Otros autores dan una expresin aproximada para la moda que viene dada por la
siguiente expresin:

+
+ =
+
+
1 1
1
. inf
j j
j
i real
n n
n
C L Mo



B). MEDIDAS DE DISPERSIN:
Breve Introduccin
Una de las funciones de la estadstica se relaciona con el clculo de la
variabilidad, conocer las medidas de dispersin (variacin) es de suma
importancia, ya que la no consideracin de diferencias puede conducir a errores
de juicio en la toma de decisiones (Snchez, 1992). Una medida particular de
tendencia central da lugar a una puntuacin que, en cierto sentido, "representa" a
todas las puntuaciones de un grupo (Glass & Stanley, 1974). Sin embargo, cuando
se usa cualquier medida de tendencia central, sta nos da slo un cuadro
incompleto de un conjunto de datos y, por consiguiente, podra conducir a
conclusiones errneas o distorsionadas, porque este proceso pasa por alto las
diferencias entre las puntuaciones en s. Sera incorrecto concluir que dos
conjuntos de datos son iguales slo porque tienen la mismas medidas de tendencia
central, es decir, que el valor de la media aritmtica sea el mismo para ambos
0
2
4
6
8
10
12
14
16
18
20
45 - 55 55 - 65 65 - 75 75 - 85 85 - 95
F
r
e
c
u
e
n
c
i
a
Intervalos de Clase
HISTOGRAMA
0
5
10
15
20
40 50 60 70 80 90 100
F
r
e
c
u
e
n
c
i
a
Marcas de Clase
POLIGONO DE
FRECUENCIAS
0
10
20
30
40
50
60
45 - 55 55 - 65 65 - 75 75 - 85 85 - 95
F
r
e
c
u
e
n
c
i
a
Intervalos de Clase
OJIVA
Control de Calidad Aplicado a la Ingeniera Pg. 15
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
conjuntos, cuando la distancia de los datos de ambos conjuntos se distribuyen de
una forma diferente.
Para describir una distribucin en forma ms completa o para interpretar con ms
detalle una calificacin, necesitamos informacin adicional acerca de la dispersin
de las calificaciones con respecto a nuestra medida de tendencia central. Es
necesario un ndice de cmo estn diseminados los puntajes alrededor del centro
de la distribucin. A tales distancias se les suele denominar medidas de dispersin
o variacin. Las medidas de dispersin, tambin conocidas como medidas de
variacin o variabilidad, indican el grado en que los sujetos se dispersan respecto
al centro de la distribucin. A travs de las mismas, el investigador verifica cun
homogneos, parecidos o estables son los elementos bajo estudio, en contraste
con otros grupos de inters. Si todos los valores son los mismos, no existe
dispersin; si todos no son los mismos, hay dispersin en los datos. La magnitud de
la dispersin puede ser pequea, cuando los valores, aunque diferentes, estn
prximos entre s. Si los valores estn ampliamente separados, la dispersin es
mayor.
Este captulo trata slo de la medidas de dispersin o variabilidad ms conocidas:
el recorrido (rango) la varianza y la desviacin estndar. Estas tcnicas estarn
enmarcadas segn la composicin de los datos, es decir, arreglo de datos, datos
no agrupados y datos agrupados. Adems, se evaluar la tcnica de coeficiente de
variacin para variables cuantitativas y cualitativas, tales como: coeficiente de
variacin e ndice de dispersin cuantitativo. Cuando nuestro inters se centra en
las medidas de dispersin, debemos buscar un ndice de variabilidad que indique
la distancia a lo largo de la escala de calificaciones. El recorrido y la desviacin
estndar realizan dicha labor.
RANGO:
Es la primera medida que vamos a estudiar, se define como la diferencia existente
entre el valor mayor y el menor de la distribucin; Lo notaremos como R Realmente
no es una medida muy significativa en la mayora de los casos, pero
indudablemente es muy fcil de calcular.
R = V
max
- V
min

Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de
desviacin con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con
respecto a la media.
Concepto de Desviacin: Es la diferencia que se observa entre el valor de la
variable y el origen de trabajo. La denotaremos por d
i
.
No es una medida, son muchas medidas, pues cada valor de la variable lleva
asociada su correspondiente desviacin, por lo que precisaremos una medida que
resuma dicha informacin.


VARIANZA:
Control de Calidad Aplicado a la Ingeniera Pg. 16
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
Mide la distancia existente entre los valores de la serie y la media. Se calcula como
sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas
por el nmero de veces que se ha repetido cada valor. El sumatorio obtenido se
divide por el tamao de la muestra, y la denotaremos por:
o tambin por .
s = varianza del universo, = varianza de la poblacin.
Para datos no agrupados Para datos agrupados


Aunque tambin es posible calcularlo por medio de la formula de la recurrencia:
Para datos no agrupados Para datos agrupados


Mtodo abreviado:


DESVIACIN TPICA O ESTANDAR:
La desviacin estndar (DE) es la medida de dispersin ms adecuada para la
estadstica descriptiva. Tanto en la escalas de intervalo como en las de razones, la
varianza y la desviacin estndar son las mejores medidas de dispersin. Toman
en consideracin todos los puntajes y controlan por el efecto de valores extremos.
La DE permite una interpretacin precisa de las calificaciones dentro de una
distribucin, si todos los sujetos son iguales en una caracterstica (por ejemplo,
ndice acadmico), entonces el resultado ser igual a cero; por el contrario, si
aumentan las diferencias, aumentar el ndice, alejndose ms y ms del punto
cero.
Es la raz cuadrada de la varianza, se denota por S
x
o
x
.


Este estadstico se mide en la misma unidad que la variable por lo que se puede
interpretar mejor.
Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica,
que son los estimadores de la varianza y desviacin tpica poblacionales
respectivamente.
COEFICIENTE DE VARIACIN:
Control de Calidad Aplicado a la Ingeniera Pg. 17
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada
ninguna unidad, por lo que nos permitir decir entre dos muestras, cual es la que
presenta mayor dispersin. La denotaremos por C.V.

ndice de Dispersin Cualitativa
Normalmente en el campo de las ciencias sociales y la ingeniera se utilizan o
manejan muchas variables cualitativas. Se puede observar previamente que
dichas variables pueden variar de clase o cantidad. La premisa sera cun
diferentes son esas observaciones. Utilizando el coeficiente de variacin
cualitativa o un ndice de dispersin podemos encontrar dichas diferencias en las
observaciones. El ndice de dispersin flucta entre cero (0) y uno (1), donde cero
(0) implica homogeneidad perfecta y uno (1) representa heterogeneidad
perfecta. Si los casos o sujetos estn distribuidos entre las categoras de una
forma equitativa, es decir, que para cada categora de la variable existe la misma
cantidad de casos, podemos indicar que existe una distribucin heterognea
(equitativa) en las categoras de la variable de inters. Por el contrario, si todos
los casos estn ubicados en una sola categora podemos indicar que existe una
distribucin homognea (desproporcional). El ndice de dispersin cualitativo se
expresa de la siguiente manera:




donde: D = ndice de dispersin cualitativo
K = nmero de categoras
n = total de casos
E]
MEDIDAS DE LOCALIZACIN:
tiles para encontrar determinados valores importantes, para una "clasificacin" de
los elementos de la muestra o poblacin.
Cuartiles, deciles y percentiles.
Las medidas de localizacin dividen la distribucin en partes iguales, sirven para
clasificar a un individuo o elemento dentro de una determinada poblacin o
muestra. As en psicologa los resultados de los test o pruebas que realizan a un
determinado individuo, sirve para clasificar a dicho sujeto en una determinada
categoria en funcin de la 53-1-u-puntuaciMn obtenida.
- Cuartiles.
- Deciles.
- Percentiles.
- Ejemplos de clculo.
- Algunas medidas de dispersin asociadas
Control de Calidad Aplicado a la Ingeniera Pg. 18
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
Cuartiles: Medida de localizacin que divide la poblacin o muestra en cuatro
partes iguales.
- Q
1
= Valor de la variable que deja a la izquierda el 25% de la distribucin.
- Q
2
= Valor de la variable que deja a la izquierda el 50% de la distribucin = Me
- Q
3
= Valor de la variable que deja a la izquierda el 75% de la distribucin.
Al igual que ocurre con el clculo de la mediana, el clculo de estos estadsticos,
depende del tipo de variable.
Caso I: Variable cuantitativa discreta:
En este caso tendremos que observar el tamao de la muestra: N y para calcular
Q
1
o Q
3
procederemos como si tuvisemos que calcular la mediana de la
correspondiente mitad de la muestra.
Caso II: Variable cuantitativa contnua: En este caso el clculo es ms simple:, sea
la distribucin que sigue:


Siendo el intervalo coloreado donde se encuentra el Cuartil correspondiente:
y
Deciles: Medida de localizacin que divide la poblacin o muestra en 10 partes
iguales. No tiene mucho sentido calcularlas para variables cualitativas discretas.
Por lo que lo vamos a ver slo para las variables continuas. d
k =
Decil k-simo es
aquel valor de la variable que deja a su izquierda el k10 % de la distribucin.


Intervalo donde se encuentra el Decil correspondiente:
k = 1 .. 9
Percentiles: Medida de localizacin que divide la poblacin o muestra en 100
partes iguales. No tiene mucho sentido calcularlas para variables cualitativas
discretas. Por lo que lo vamos a ver slo para las variables continuas. p
k =
Percentil
k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribucin.



Intervalo donde se encuentra el percentil corespondiente:
[L
i-2
- L
i-1
) n
i-1
N
i-1

[L
i-1
- L
i
) n
i
N
i

[L
i-2
- L
i-1
) n
i-1
N
i-1

[L
i-1
- L
i
) n
i
N
i

[L
i-2
- L
i-1
) n
i-1
N
i-1

[L
i-1
- L
i
) n
i
N
i

Control de Calidad Aplicado a la Ingeniera Pg. 19
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
k=1 .. 99
Algunas medidas de Dispersin asociadas
Una vez estudiadas las medidas de localizacin surgen dos nuevas medidas de
dispersin, que son:
- Recorrido intercuartlico:
- Semirecorrido intercuartlico:
- Recorrido interdeclico:
- Recorrido intercentilico:
MEDIDAS DE LA SIMETRA:
Sirven para ver si la distribucin tiene el mismo comportamiento por encima y por
debajo de los valores centrales. La medias de asimetra, al igual que la curtosis, van
a ser medidas de la forma de la distribucin, es frecuente que los valores de una
distribucin tiendan a ser similares a ambos lados de las medidas de centralizacin.
La simetra es importante para saber si los valores de la variable se concentran en
una determinada zona del recorrido de la variable.
Comparan la forma que tiene la representacin grfica, bien sea el histograma o el
diagrama de barras de la distribucin, con la distribucin normal, dentro de ellos se
tiene los Sesgos y la Curtosis.
SESGOS.
a) Una distribucin es simtrica cuando su mediana, su moda y su media
aritmtica coinciden.
b) Una distribucin es asimtrica a la derecha si las frecuencias (absolutas o
relativas) descienden ms lentamente por la derecha que por la izquierda.
c) Una distribucin es asimtrica a la izquierda, si las frecuencias descienden
ms lentamente por la izquierda que por la derecha.
As<0 As=0 As>0
Asimetra Negativa a la
Izquierda

Simtrica

Asimetra Positiva a la
Derecha.

Control de Calidad Aplicado a la Ingeniera Pg. 20
Ing Edmundo Alarcn Cceres Estadstica Descriptiva








Para medir la asimetra se puede realizar atendiendo bsicamente a dos criterios:
a) Comparando la Media y la Moda.
Si la diferencia es positiva, diremos que hay asimetra positiva o a la derecha, en
el caso de que sea negativa diremos que hay asimetra negativa o a la izquierda.
No obstante, esta medida es poco operativa al ser una medida relativa, ya que
esta influida por la unidad en que se mida la variable, por lo que se define el
coeficiente de Asimetra como:

Esta medida es muy fcil de calcular,
pero menos precisa que el coeficiente
de asimetra de Pearson.
b) Comparando los valores de la variable con la media.
El coeficiente de asimetra de Pearson, se basa en la comparacin con la media de
todos los valores de la variable, as que es una medida que se basar en las
diferencias, como vimos en el caso de la dispersin si medimos la media de esas
desviaciones sera nulas, si las elevamos al cuadrado, seran siempre positivas por
lo que tampoco serviran, por lo tanto precisamos elevar esas diferencias al cubo.
Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo
tanto relativa, dividimos por el cubo de su desviacin tpica. Con lo que resulta la
siguiente expresin:

Algunas consideraciones:
El Estadstico Yule ha definido algunas propiedades deseables para una medida
estadstica:
1. Debe definirse de manera objetiva: dos observadores distintos deben llegar al
mismo resultado numrico.
3
n
1 i
i
x
2) 1)(n (n
n



=
o
x
CA
Control de Calidad Aplicado a la Ingeniera Pg. 21
Ing Edmundo Alarcn Cceres Estadstica Descriptiva
2. Usar todas las observaciones y no algunas de ellas solamente, de manera que si
varia alguna observacin la medida considerada debe reflejar esta variacin.
3. Tener un significado concreto: la interpretacin debe ser inmediata y sencilla.
4. Ser sencilla de calcular.
5. Prestarse fcilmente al clculo algebraico: Lo que permitir demostraciones mas
elegantes.
6. Ser poco sensible a las fluctuaciones muestrales. Esta condicin es
imprescindible en la Estadstica Matemtica y en la Teora de Sondeos.
MEDIDA DE APUNTAMIENTO.
CURTOSIS:
La curtosis es una medida del apuntamiento, que nos indicar si la distribucin es
muy apuntada o poco apuntada, tambin nos indica si miden la mayor o menor
cantidad de datos que se agrupan en torno a la moda.
Como podemos observar, el coeficiente de curtosis nos mide el grado de
apuntamiento de la distribucin. Este coeficiente lo vamos a denotar por K y se
calcula segn la siguiente expresin:

Se definen 3 tipos de distribuciones segn su grado de curtosis:
1) Distribucin mesocrtica: presenta un grado de concentracin medio
alrededor de los valores centrales de la variable (el mismo que presenta una
distribucin normal).
2) Distribucin leptocrtica: presenta un elevado grado de concentracin
alrededor de los valores centrales de la variable.
3) Distribucin platicrtica: presenta un reducido grado de concentracin
alrededor de los valores centrales de la variable.

Curtosis Positiva Curtosis nula Curtosis Negativa
Leptocrtica

Mesocrtica

Platicrtica

3) 2)(n (n
1) 3(n x
3) (n ) 2 1)(n n (
1) n(n
2
4
n
1 i
i



+
=

=
o
x
K
Control de Calidad Aplicado a la Ingeniera Pg. 22
Ing Edmundo Alarcn Cceres Estadstica Descriptiva








------ <*> ------

También podría gustarte