Está en la página 1de 19

ESTADISTICA Y CONTROL DE CALIDAD

Concepto estadstica y su clasificacin


La Estadstica es una rama de las matemticas que se ocupa de reunir, organizar y analizar datos
numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de
decisiones.
Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, se utilizaban
representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas
para contar el nmero de personas, animales o cosas. Hacia el ao 3000 a.C. los babilonios
usaban pequeas tablillas de arcilla para recopilar datos sobre la produccin agrcola y sobre los
gneros vendidos o cambiados mediante trueque. En el siglo XXXI a.C., mucho antes de construir
las pirmides, los egipcios analizaban los datos de la poblacin y la renta del pas. Los griegos
clsicos realizaban censos cuya informacin se utilizaba hacia el 594 a.C. para cobrar impuestos.
En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con
exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y
sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico
no consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin
de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las
aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran
exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de stas se
pueden utilizar para analizar datos estadsticos.
La estadstica es una importante herramienta para la toma de decisiones en los negocios y se
utiliza prcticamente en todos los campos de negocios.
La palabra estadstica tiene muchas connotaciones.
En realidad tiene dos significados
1. El uso ms comn, la estadstica se refiere a informacin numrica.
Ejemplo:
- En Canad la informacin correspondiente es que recorre 10 371 millas para automviles,
19 823 millas para autobuses, y 7 001 millas para camiones.
- El tiempo promedio que se pasa en espera para recibir apoyo tcnico es de 17 minutos.
- La oficina del Censo calcula que la poblacin en EUA ser de 335 050 000 en el ao 2025.
- La extensin promedio de los nueve ciclos empresariales desde 1945 (medidos de pico a
pico) es de 61 meses.
El tema de lo estadstico tiene un significado mucho mayor que el de la recopilacin y publicacin
de la informacin numrica.
2. Estadstica Es la ciencia que recolecta, organiza, presenta, analiza e interpretar datos
para ayudar en una forma de decisiones ms efectiva.
El primer paso en la investigacin de un problema es la recoleccin de datos importantes. Debe
de organizarse de cierta manera y presentarse. Podemos analizar e interpretar la informacin
hasta que los datos hayan sido organizados.
UNIDAD I

Pgina 1

ESTADISTICA Y CONTROL DE CALIDAD


Por qu hay que estudiar Estadstica?
En todos lados encontramos informacin numrica.
Las tcnicas estadsticas se utilizan para tomar decisiones que afectan nuestra vida
diaria.
El conocimiento de los mtodos estadsticos ayudarn a entender por qu se toman
ciertas decisiones, y aportarn una mejor comprensin sobre la manera en la que
afectan.
Generalmente el estudio de la Estadstica se divide en dos categoras: Estadstica descriptiva y
Estadstica inferencial.
ESTADISTICA DESCRIPTIVA
La estadstica descriptiva analiza, estudia y describe en su totalidad los individuos o elementos
de una poblacin. Su finalidad es obtener informacin, analizarla, elaborarla y simplificarla para
que pueda ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente
para el fin que se desee.
Los conjuntos de datos no organizados (como el censo de poblacin, los ingresos semanales de
programadores en informtica y las respuestas individuales de 2340 electores registrados acerca
de su seleccin para presidente de Mxico) son de poco valor. Sin embargo, hay tcnicas
disponibles para organizar este tipo de informacin de manera significativa.
Algunos datos pueden organizarse en una distribucin de frecuencias. Pueden utilizarse diversos
tipos de grficas para describir los datos. Pueden utilizarse un cierto nmero de medidas
estadsticas para describir como se agrupan estrechamente los datos respecto a un promedio y a
su variabilidad.
ESTADISTICA INFERENCIAL
La estadstica inferencial, trabaja con muestras, subconjuntos formados por algunos individuos de
la poblacin. A partir del estudio de la muestra se pretende inferir en aspectos relevantes de
toda la poblacin. Cmo se selecciona la muestra, cmo se realiza la inferencia, y qu grado de
confianza se puede tener en ella son aspectos fundamentales de la estadstica inferencial, para
cuyo estudio se requiere un alto nivel de conocimientos de estadstica, probabilidad y
matemticas.
Es un conjunto de mtodos utilizados para saber algo acerca de una poblacin, basndose en una
muestra.
Si un investigador rene datos de una muestra y utiliza la estadstica generada para llegar a
conclusiones acerca de la poblacin de la cual se toma la muestra, la estadstica es inferencial.

UNIDAD I

Pgina 2

ESTADISTICA Y CONTROL DE CALIDAD


Una poblacin en el sentido estadstico, no siempre se refiere a personas.
Poblacin Conjunto de todos los posibles individuos, objetos o medidas de inters.
Generalmente tomamos una muestra de una poblacin para deducir algo acerca de la
misma.
Muestra Una porcin, o parte, de una poblacin de inters y si se toma adecuadamente,
es representativa de la poblacin.
Existen algunos conceptos que se aplican al anlisis de las variables que deben quedar en claro.
Algunas medidas son generales y otras especiales de acuerdo al tipo de variable mensurada.
Medidas generales

n: es el nmero de casos de la muestra


N: es la suma del nmero de casos de varias muestras.
x: cada uno de los datos de la muestra
: sumatoria de los datos de una serie

Medidas para variables numricas:

Media: es la suma de todos los valores divido por el nmero de casos n.


Mediana: corresponde al valor central de la serie de datos observada.
Moda: valor ms frecuente de una serie de datos.
Varianza: es el promedio de los cuadrados de los desvos; la Varianza mide la
dispersin de los valores y marca el punto de inflexin de las curvas en los
histogramas.
Desviacin Estndar (SD) : es la raz cuadrada de la Varianza
Error Estndar: es la divisin entre el SD y la raz cuadrada de n.

Intervalo de Confianza para la Media ( ): se define como el espacio o intervalo comprendido por
los valores extremos de la muestra, en el que tericamente se va a encontrar la media de la
poblacin o universo. Habitualmente se utiliza el IC del 95% de la media, representado por un
valor mnimo y mximo.
Variables discretas y continuas, dando ejemplo.
Una variable aleatoria es un evento numrico cuyo valor es determinado mediante un proceso
escogido al azar, es decir, es una variable que asume cualquier valor. Una variable aleatoria es
una funcin que es asociado con un nmero o valor real a cada elemento de un conjunto de
todos los resultados posibles de un experimento (espacio muestral).

UNIDAD I

Pgina 3

ESTADISTICA Y CONTROL DE CALIDAD


Estas variables pueden ser discretas o continuas
1. Variable Discreta si un espacio muestral contiene un nmero finito de posibilidades o
una secuencia sin final con igual nmero de elementos que nmeros enteros, por
ejemplo: en un proceso de produccin se revisan las tarjetas electrnicas que se van
procesando al ser revisada cada tarjeta se clasifican como buena o mala, de manera que
los elementos son cantidades enteras, es decir el conjunto de posibles resultados son
contables.
2. Variable Continua si un espacio muestral contiene un nmero infinito de posibilidades,
es decir es cualquier valor dentro de lmites determinados, cuando una variable puede
tomar valores en una escala continua, por ejemplo: El tiempo de un corredor un una
distancia determinada, el tiempo es una variable que se puede medir con un grado de
precisin, entonces tenemos claro que podemos tener un nmero infinito de tiempos
posibles en el espacio muestral y que no puede igualarse a nmeros enteros
MUESTREO ALEATORIO Y TECNICAS DE MUESTREO
Un estudio con un nmero de posibles observaciones ya sea pequeo o grande finito o infinito,
por ejemplo; si se lanzara un dado de manera indefinida y registramos todos los datos obtenidos
de este lanzamiento, obtendramos un conjunto infinito de valores y cada valor es un resultado
de una sola tirada de dados.
En este caso la totalidad de las observaciones obtenidas, sea un nmero finito o infinito,
constituye lo que se llama una poblacin, una poblacin consiste en la totalidad de las
observaciones o valores.
Tomar una muestra ( es un subconjunto de una poblacin) significa escoger elementos de una
poblacin con el objeto de analizar alguna caracterstica que nos permita hacer deducciones
acerca de la poblacin, el hecho de tomar una muestra nos ahorra trabajo y costo en la
investigacin, por ejemplo, si recibimos un lote de 5000 unidades de un artculo, pensar en
revisar todo el lote completo para verificar si tiene las especificaciones con las que fueron
solicitados o las especificaciones que indica, implicara costo de mano de obra y tiempo, por esa
razn sacamos una muestra de ese lote y podemos obtener informacin acerca de la poblacin,
con esos datos podremos aceptar o rechazar el lote. Las unidades de un lote deben de ser
elegidas al azar, es decir que todos los elementos tienen la misma probabilidad de ser elegidos,
para una inspeccin y estas unidades son representativas de todos los artculos del lote.
Un muestreo aleatorio es cuando cada uno de los elementos de la poblacin tiene la misma
probabilidad de ser elegido para una muestra. Las muestras aleatorias son llamadas tambin
muestras probabilsticas o muestras cientficas.

UNIDAD I

Pgina 4

ESTADISTICA Y CONTROL DE CALIDAD


Los pasos principales para toma una MUESTRA son:
1. Especificar cul es el objetivo del estudio
2. Conocer la Poblacin
3. Recoleccin de datos es importante conocer los elementos que sern seleccionados
aleatoriamente estudiando sus caractersticas ya que estos elementos o unidades nos dan
una informacin representativa de la poblacin.
4. Especificar el grado de precisin los resultados muestrales siempre estn sujetos a
cierta incertidumbre debido a que solamente son una parte de la poblacin.
5. Mtodo de medicin se selecciona un instrumento de medicin y un mtodo adecuado
para muestrear la poblacin.
6. Estructura es la clasificacin adecuada de las unidades de medida, deben manejarse las
mismas unidades de medida, es decir, si utilizamos centmetros, metros, kilogramos, etc.
Organizacin de Datos.
Una manera de obtener datos es a travs de la observacin directa. Un experimento estadstico
es una forma de observacin directa en la que se controlan algunos o todos los factores que
pueden influir sobre la variable que se estudia.
En algunas situaciones, no es posible obtener datos en forma directa, sino que, ms bien, la
informacin debe obtenerse a partir de respuestas individuales. Una encuesta estadstica es el
proceso de recopilar datos pidiendo a personas que proporciones informacin. Los datos pueden
obtenerse con mtodos como la entrevista personal o telefnica o a travs de un cuestionario
escrito.
Ejemplo: Puede compararse dos mtodos de ensamblar un componente, haciendo que un grupo
de empleados utilice uno de ellos y que otro grupo el segundo. Se iguala a los miembros de los
dos grupos en trminos de factores como edad y experiencia.
En algunas situaciones la informacin debe obtenerse a partir de respuestas individuales. Una
encuesta estadstica es el proceso de recopilar datos pidiendo a personas que proporcionen
informacin y puede ser por entrevista personal, entrevista telefnica o cuestionarios escritos.
Ejemplo: Un analista de la Secretara del Trabajo necesita determinar que aumentos o
reducciones en el nivel de empleo tiene planeados las empresas. Un mtodo comn para obtener
los datos es efectuando una encuesta entre las empresas.
Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones bien
pensadas acerca de las causas y por tanto de los efectos probables de ciertas caractersticas en
situaciones dadas.
Antes de depositar nuestra confianza en cualquier conjunto de datos debemos asegurarnos que
stos estn basados en suposiciones e interpretaciones correctas, pues obtendramos resultados
falsos si se trabaja con datos incompletos, parciales y no representativos de nuestra poblacin.
Por ello es importante el muestreo.

UNIDAD I

Pgina 5

ESTADISTICA Y CONTROL DE CALIDAD


El muestreo aleatorio es aquel en el que cada uno de los elementos de la poblacin de inters, o
poblacin objeto, como se le conoce, tiene una probabilidad conocida, y frecuentemente igual,
de ser elegido para la muestra. Son cuatro los principales mtodos de muestreo aleatorio:
aleatorio simple, sistemtico, estratificado y por conglomerados.

TIPOS DE MUESTREO
1. Muestreo aleatorio simple se selecciona n unidades de una poblacin de tamao N
de tal forma que cada uno de sus elementos tiene la misma probabilidad de ser
seleccionada. Debido a que el nmero que es seleccionado se retira de la poblacin en
cada seleccin a este mtodo se le llama muestreo aleatorio simple sin reemplazamiento.
El muestreo aleatorio simple con reemplazamiento es cuando se selecciona un elemento
y es regresado Y seleccionado nuevamente, es decir todos los elementos tienen la misma
probabilidad de ser seleccionados no importando si ellos fueron seleccionados
previamente.
2. Muestreo aleatorio estratificado se utiliza cuando existe situaciones donde la
caracterstica de inters no parece homognea en toda la poblacin, ejemplo cuando se
desea estimar el tiempo promedio que tarda una persona en ser atendida en un
determinado banco de la ciudad, en este caso de debe de considerar la hora, el da de la
semana o el da del mes, puesto que el tiempo de atencin de una persona vara
considerablemente de acuerdo a estas caractersticas.
3. Muestreo sistemtico cuando tenemos un proceso continuo
se toma al azar o
aleatoriamente, el primer elemento para tomar muestra de los elementos siguientes para
saber si nos encontramos dentro de proceso, se toma la unidad cada k-esima unidad, por
ejemplo si k =10 y la primera unidad escogida al azar es de 7, las siguientes van a hacer
17, 27, 37 as sucesivamente hasta tener la muestra completa.
4. Muestreo por conglomerados cuando se tiene una poblacin grande y es imposible
enumerar se subdividen las poblaciones en subgrupos de igual tamao y posteriormente
se toma una muestra aleatoria simple de cada subgrupo, ejemplo, una compaa
productora de aparatos elctricos embarca radios en cajas que contienen 10 radios cada
una en este caso se toma una muestra de cajas y se inspeccionan los 10 radios de cada
caja.
5. Muestreo en dos etapas es cuando dividimos un nmero de unidades ms pequeas,
ejemplo suponga que en un almacn llega un embarque de 100 cajas con 20 cajas cada
una de 10 de diskettes para computadora, si deseamos verificar la calidad del producto
se toma una muestra al azar dentro de las 100 cajas (primera etapa de la muestra) y
posteriormente otra segunda muestra aleatoria de cajas de los diskettes
Un principio bsico de este modelo es aquel que define que todos los elementos tienen la
misma probabilidad de ser elegidos y consiste en seleccionar una muestra en forma
aleatoria, generalmente se utiliza una tabla de nmeros aleatorios (random) o por
procesos de computacin.

UNIDAD I

Pgina 6

ESTADISTICA Y CONTROL DE CALIDAD


Por ejemplo: si se desea elegir una muestra aleatoria de los padres de familia de una
determinada escuela, se obtiene el archivo de los nombres de los estudiantes, esta lista
se enumera en orden progresivo y se revisa la lista con el propsito de que no se
duplique los nombres.
Al tener la lista con una calculadora que tenga la funcin de nmeros aleatorios
(random), con una urna con nmeros o nombres de los alumnos, con una tabla ya
generada de nmeros aleatorios o con procesos computacionales, se eligen los alumnos
que sern parte de la investigacin que se realizar.
Ya que se han obtenido los datos, el siguiente paso es organizarlos en Distribuciones de
Frecuencia
Medidas de Tendencia central (o de posicin)
Una medida de tendencia central o de posicin es un valor que se calcula para un grupo de
datos y que se utiliza para describirlos de alguna manera. Normalmente se desea que el valor sea
representativo de todos los valores incluidos en el grupo y, por ello, se desea alguna clase de
promedio. En sentido estadstico, un promedio es una medida de tendencia central para un
conjunto de valores.
Medidas de Tendencia Central:
- Media Aritmtica
- Media Ponderada
- Mediana
- Moda
La media aritmtica y media ponderada.
La media aritmtica, o promedio aritmtico, se define como la divisin de la suma de todos los
valores entre el nmero de valores.
PROPIEDADES DE LA MEDIA ARITMETICA
1.
2.
3.
4.
5.

Todo conjunto de datos de nivel de intervalo y nivel de razn tienen un valor medio.
al evaluar la media se incluyen todos los valores
un conjunto de datos solo tiene una media
la media es una medida til para comparar dos o ms poblaciones
la media es la nica medida de posicin donde la suma de las desviaciones de cada valor
con respecto a la media siempre ser cero.

En estadstica es normal representar una medida descriptiva de una poblacin, o


parmetro poblacional, mediante letras griegas, en tanto que se utilizan letras romanas para las
medidas descriptivas de muestras, o estadsticos muestrales. As, la media aritmtica para una
poblacin de valores se presenta mediante el smbolo (que se pronuncia mu), en tanto que la
media aritmtica de una muestra de valores se representa mediante el smbolo X (que se lee x
barra).

UNIDAD I

Pgina 7

ESTADISTICA Y CONTROL DE CALIDAD


En estadstica las caractersticas o medidas descriptivas de una poblacin que son los parmetros
se representan mediante letras griegas.
Para las caractersticas o medidas descriptivas de una muestra que son estadsticos se
representan mediante letras romanas.
Media de la poblacin

x representa los valores de la variable de inters


N Nmero total de valores o elementos en la poblacin

x Media de la muestra

n Nmero total de valores o elementos en la muestra


En cuanto a operaciones se refiere, las dos frmulas son idnticas; en ambos casos se
suman todos los valores y despus se divide este total entre el nmero de valores que son. Sin
embargo, la diferencia en los denominadores se debe a que el anlisis estadstico, la N
normalmente indica el nmero de elementos de una poblacin, en tanto que la n seala el
nmero de elementos de una muestra.
La Media Aritmtica para Datos Agrupados.
Cuando se agrupan datos en una distribucin de frecuencias, se utiliza el punto medio de
cada clase como aproximacin de todos los valores contenidos en ella. El punto medio se
representa con el smbolo Xc, en donde el subndice c se debe a clase, y se utiliza la letra f
para representar la frecuencia observada de valores en la clase respectiva. Por ello, las frmulas
para la media de la poblacin y de la muestra para datos agrupados son:

Media ponderada.- es u caso especial de la media aritmtica en la cual se considera a cada uno
de los valores de acuerdo con su importancia en el grupo. A cada valor se le asigna una
ponderacin o peso de acuerdo a su importancia en el grupo.

w valor ponderado o peso


La Mediana.
UNIDAD I

Pgina 8

ESTADISTICA Y CONTROL DE CALIDAD

~x

La mediana (
) de un grupo de datos es el valor del dato que ocupa un lugar medio de
cuando se les agrupa a todos en orden ascendente o descendente. Si el nmero de medidas es
impar, la mediana ser la medida en el centro. Para un grupo con un nmero par de elementos,
se supone que la mediana se encuentra a la mitad entre los dos valores adyacentes al centro.
Cuando el conjunto de datos contiene un nmero grande de valores, resulta til la siguiente
frmula para determinar la posicin de la mediana en el conjunto ordenado.
PROPIEDADES DE LA MEDIANA
1. Es nica; esto es, a semejanza de la media, slo existe una mediana para un conjunto de
datos.
2. No se ve afectada por valores muy grandes o muy pequeos, por lo tanto es una medida
valiosa de tendencia central cuando ocurre este tipo de valores.
3. Puede calcularse para una distribucin de frecuencia con una clase de extremo abierto.
4. Puede calcularse para datos de nivel de razn, de intervalo y ordinal.
La media aritmtica puede no ser representativa cuando se tienen en los datos uno o dos valores
sumamente grandes o pequeos
La Mediana para Datos Agrupados.
Para datos agrupados, en primer lugar es necesario determinar la clase que contiene el
valor de la mediana, para despus determinar la posicin de la mediana dentro de la clase
mediante interpolacin. La clase que contiene la mediana es la primera cuya frecuencia
acumulada iguala o excede la mitad del total de observaciones. Una vez que se identifica esta
clase, se determina el valor especfico mediante la siguiente frmula:

En donde:

Li = lmite exacto inferior de la clase que contiene la mediana.


N = nmero total de observaciones en la distribucin de frecuencias (n para una
muestra)
faA = la frecuencia acumulada de la clase que precede (antes) a la clase que
contiene la
mediana
fc = nmero de observaciones en la clase que contiene la mediana.
c
= tamao del intervalo de clase.

UNIDAD I

Pgina 9

ESTADISTICA Y CONTROL DE CALIDAD


La Moda.
La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos. A
una distribucin que tiene una sola moda se le denomina unimodal. Para un conjunto de datos
poco numeroso, en el que no se repite ningn valor, no existe moda. Cuando dos valores no
adyacentes tienen frecuencias mximas similares, se dice que la distribucin es bimodal. A las
distribuciones de mediciones que tienen varias modas se les denomina multimodales.
La moda para el ejemplo es 2860 pues es el valor que presenta mayor frecuencia.
PROPIEDADES DE LA MODA
1. Puede calcularse para datos de nivel de razn, de intervalo, nominal y ordinal.
2. No se ve afectada por valores muy grandes o muy pequeos.
3. Puede utilizarse para una distribucin de frecuencia con una clase de extremo abierto.
Sin embargo, la moda tiene algunas desventajas que hacen que se utilice con menos frecuencia
que la media o la mediana.
1. Para muchos conjuntos de datos no hay valor modal porque ningn valor aparece ms de
una vez. Tendra que tomarse cada valor como una moda.
2. Para algunos conjuntos de datos hay ms de una moda. Sera cuestionable utilizar ms de
una moda para representar la tendencia central de un conjunto de datos.
con una moda se le denomina unimodal
cuando dos valores no adyacentes tienen frecuencias mximas similares en el
conjunto de datos se dice que se tiene dos modas se le denomina bimodal
a las distribuciones de mediciones que tienen varias modas se les denomina
multimodal.
La Moda para Datos Agrupados.
Para datos agrupados en una distribucin de frecuencias con intervalos de clase iguales, primero
se identifica la clase que contiene la moda determinando cul de ellas tiene el mayor nmero de
observaciones. Algunos profesionales de estadstica consideran que la moda es el punto medio de
la clase modal. Sin embargo, la mayora de ellos interpolan dentro de la clase modal, de acuerdo
con la siguiente frmula:
[
En donde:

UNIDAD I

Li = lmite exacto inferior de la clase que contiene la moda.


d1 = diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
precedente.
d2 = diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
siguiente.
c = tamao del intervalo de clase.

Pgina 10

ESTADISTICA Y CONTROL DE CALIDAD


La diferencia entre los valores de la media, la mediana y la moda permiten saber la forma de la
curva de frecuencia en trminos de asimetra.

Para una distribucin unimodal simtrica, el valor de la media, la mediana y la moda es


igual.

F
R
E
C
U
E
N
C
I
A

Media
Mediana
Moda

Para una distribucin asimtrica positiva, la media es el mayor valor de las tres y la
mediana es mayor que la moda pero menor que la media

F
R
E
C
U
E
N
C
I
A

Moda
Mediana
Media

Para una distribucin asimtrica negativa, la media es el menor valor de las tres y la
mediana es inferior a la moda pero mayor que la media

F
R
E
C
U
E
N
C
I
A

Media
Mediana
Moda

Medidas de dispersin.
UNIDAD I

Pgina 11

ESTADISTICA Y CONTROL DE CALIDAD


Las medidas de tendencia central son tiles para identificar un valor tpico en un conjunto de
datos. Estas localizan el centro de los datos.
Un promedio no dice nada de la dispersin o variabilidad de los datos.
Un valor pequeo para una medida de dispersin indica que los datos se encuentran acumulados
cercanamente, alrededor de la media por lo que es un promedio confiable.
Por lo contrario una medida de dispersin grande indica que la media no es factible.
Una segunda razn para estudiar la dispersin en un conjunto de datos es poder comparar cun
dispersas estn dos o ms distribuciones.
MEDIDAS DE DISPERSION
Amplitud de variacin o Rango (se basa en la ubicacin del valor mayor y el ms pequeo
en un conjunto de datos).
Desviacin media
Varianza
Desviacin estndar
Estas tres se basan en las desviaciones respecto a la media.
Amplitud de variacin o Rango.- es la medida de dispersin ms sencilla se trata de la
diferencia entre el valor ms grande y el ms pequeo de un conjunto de datos.
Una desventaja es que no se consideran todos los datos.
R = Xmay - Xmin
R = rango
Xmay = el valor mayor
Xmin = valor mnimo
Para los ejemplos de las medidas de tendencia central calcular el rango.
Las medidas de variabilidad o dispersin se ocupan de describir la variabilidad entre los
valores.
Rango.
El rango o R es la diferencia entre los valores mayor y menor del conjunto de datos. As cuando
U representa el mayor valor del grupo y L representa el menor, el rango de los datos es:

Las descripciones ms comprensivas de la dispersin son aquellas que tratan con la desviacin
promedio con respecto a alguna medida de tendencia central. Dos de tales medidas son
importantes para el estudio estadstico: la varianza y la desviacin estndar. Ambas medidas nos
dan una distancia promedio de cualquier observacin del conjunto de datos con respecto a la
media de la distribucin.

UNIDAD I

Pgina 12

ESTADISTICA Y CONTROL DE CALIDAD


Para el ejemplo, el rango de los datos no agrupados es:

Varianza.
Cada poblacin tiene una varianza, que se simboliza con ( sigma cuadrada). La frmula
para calcular la varianza de una poblacin es

La frmula para calcular la varianza muestral incluye un factor de correccin para que
la varianza muestral sea un estimador insesgado de la varianza poblacional.

La frmula de varianza para datos agrupados es:

Desviacin Estndar.
Por lo general resulta difcil interpretar el significado del valor de una varianza porque las
unidades en las que se expresa son valores al cuadrado, as que con mayor frecuencia
utilizamos la raz cuadrada de la varianza denominada desviacin estndar. La desviacin
estndar poblacional se denota por y la desviacin estndar muestral por s.

La frmula de desviacin estndar


correspondiente de varianza.

UNIDAD I

para datos agrupados es la raz de la frmula

Pgina 13

ESTADISTICA Y CONTROL DE CALIDAD


Coeficiente de Variacin.
El coeficiente de variacin proporciona una medida de variabilidad que es
independiente de la unidad de medida, por ello, puede usarse para comparar la variabilidad de
dos grupos de datos expresados en dos distintas unidades de medida. Por ejemplo, puede
usarse para comparar la desviacin estndar de la distribucin de los ingresos anuales, y la
desviacin estndar de los aos de servicio de todos los empleados de una compaa.
El coeficiente de Variacin (CV) expresa la desviacin estndar como un porcentaje de
la media y se define como

( )

Dicho de otra manera, el CV indica la magnitud relativa de la desviacin estndar con respecto a
la medida de la distribucin. El CV es til cuando se desea comparar la variabilidad de dos
conjuntos de datos con respecto al nivel general de los valores de cada conjunto.

FORMULARIO:
Distribucin de frecuencia
1. El intervalo de clase o amplitud w
Nm. Clases 3.3 lnn
n nm. Datos

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIN


(MEDIA, MODA, VARIANZA Y DESVIACIN ESTNDAR).

DATOS AGRUPADOS:
A)

MEDIDAS DE TENDENCIA CENTRAL:


1.

MEDIA DE LA POBLACIN:

2.

MEDIANA:

Li= limite exacto inferior de la clase que contiene la mediana


N = Nmero total de observaciones en la distribucin de frecuencias (n para muestras)
= Frecuencia acumulada de la clase que precede (antes) a la clase que contiene la
mediana
= Frecuencia de clase que contiene la mediana
w = longitud del intervalo de clase

UNIDAD I

Pgina 14

ESTADISTICA Y CONTROL DE CALIDAD


3.

MODA:
[

Li = limite exacto inferior de la clase modal


d1 = diferencia entre la frecuencia de clase modal y la frecuencia de clase precedente
(antes)
d2 = diferencia entre la frecuencia de clase modal y la frecuencia de la siguiente clase.
w = longitud del intervalo de clase.
VARIANZA:

DATOS NO AGRUPADOS:
A)

MEDIDAS DE TENDENCIA CENTRAL.


1. Media aritmtica .
n

x
2.

i 1

Media aritmtica ponderada ( xw ).


k

xw

wi xi
i 1
k

wi
i 1

B)

3.

Mediana (xmed).

4.

Moda (xmod).

Varianza o variancia (s2).


POBLACIN:

MUESTRA:

UNIDAD I

Pgina 15

ESTADISTICA Y CONTROL DE CALIDAD


DISTRIBUCIN DE FRECUENCIA (ELABORACION DE UN CUADRO):
2. Nmero de clases (NC): indica el rango de los valores incluidos dentro de una clase y puede
ser determinado restando el lmite exacto inferior de clase de su lmite exacto superior.
Cuando no se identifican lmites exactos, puede determinarse el intervalo de clase restando el
lmite nominal inferior de una clase del lmite nominal inferior de la clase inmediata siguiente.
Una sugerencia til para el nmero de clases est dado por la regla de Sturges, que
establece como nmero de clases (NC) necesario, aproximadamente NC = 3.3 (log n) + 1.
El valor NC es comn redondearlo al entero ms cercano.
EJEMPLO:
En la siguiente tabla se presentan las calificaciones de los alumnos de la materia de Estadstica
Administrativa I
88

95

70

70

90

100

90

83

70

95

100

95

80

80

100

90

100

85

77

100

100

95

98

70

100

70

90

76

70

80

70

100

70

85

100

97

90

97

95

92

75

100

80

77

66

90

100

100

90

90

75

80

90

82

3. Amplitud del intervalo aproximado (w):


Buscar entre los datos cual es el nmero ms pequeo y tomar la decisin de iniciar con
ese nmero o un nmero menor. Verifica que todos los datos estn en contenido en la
tabla, es decir que el dato este contenido en un intervalo.
Por razones de clculo, todos los intervalos de clase en una distribucin de frecuencias dada
tienden que ser iguales. Una frmula que puede utilizarse para determinar el intervalo de clase
aproximado es:

Intervalo

Nmero

Este valor significa que la separacin entre


un valor y otro es de 5 nmeros, por ejemplo:
Iniciamos en el valor 66, 67, 68, 69, 70, el
primer intervalo estar contemplado desde el
nmero 66 al 70 ya que se encuentran 5
nmeros, para construir el segundo intervalo se
inicia en el 71, 72, 73, 74, 75, es decir el
segundo intervalo estar desde el 71 al 75 y as
sucesivamente se realizan los clculos
correspondientes.

UNIDAD I

de Clase

Inferior

Superior

66

70

71

75

76

80

81

85

86

90

91

95

96

100

Pgina 16

ESTADISTICA Y CONTROL DE CALIDAD


4. Calculo de los limites inferior y superior

Los lmites de cada uno de los intervalos se pueden determinar identificando los puntos
que estn a la mitad entre el intervalo superior e inferior, respectivamente, de las clases
adyacentes.
Nmero
de Clase
1
2
3
4
5
6
7

Intervalo
Inferior Superior
66
70
71
75
76
80
81
85
86
90
91
95
96
100

Limites
Inferior Superior
65.5
70.5
70.5
75.5
75.5
80.5
80.5
85.5
85.5
90.5
90.5
95.5
95.5
100.5

Se considera el valor del intervalo superior


de la clase 1 despus suma el intervalo de la
clase 2 y calcula el promedio.

5. Captura la FRECUENCIA, todos los datos que se tienen en la tabla se concentran, es decir
revisa cada uno de los intervalos y captura la cantidad de datos que se encuentra entre esos
datos, al final la suma debe de dar el total de los datos.
Nmero
de Clase
1
2
3
4
5
6
7

Intervalo
Inferior Superior
66
70
71
75
76
80
81
85
86
90
91
95
96
100

Limites
Inferior Superior
65.5
70.5
70.5
75.5
75.5
80.5
80.5
85.5
85.5
90.5
90.5
95.5
95.5
100.5

Frecuencia
9
2
8
4
10
6
15

6. Elabora la FRECUENCIA ACUMULADA:


Nmero
de Clase
1
2
3
4
5
6
7

Intervalo
Inferior Superior
66
70
71
75
76
80
81
85
86
90
91
95
96
100

Limites
Inferior Superior
65.5
70.5
70.5
75.5
75.5
80.5
80.5
85.5
85.5
90.5
90.5
95.5
95.5
100.5

Frecuencia
9
2
8
4
10
6
15

Frecuencia
acumulada
9
11
19
23
33
39
54

De la columna de frecuencia suma el


nmero de clase 1 ms el nmero de
clase 2, despus el resultado smalo al
nmero de clase 3 y as sucesivamente:

UNIDAD I

Pgina 17

ESTADISTICA Y CONTROL DE CALIDAD


7. Una DISTRIBUCIN DE FRECUENCIAS RELATIVAS es aquella en la que la frecuencia de
cada clase se divide entre el nmero total de observaciones. Por esto, cada frecuencia relativa
es una proporcin y se le puede convertir en porcentaje multiplicndola por 100.

Nmero
de Clase
1
2
3
4
5
6
7

Intervalo
Inferior Superior
66
70
71
75
76
80
81
85
86
90
91
95
96
100

Limites
Inferior Superior
65.5
70.5
70.5
75.5
75.5
80.5
80.5
85.5
85.5
90.5
90.5
95.5
95.5
100.5

Frecuencia
9
2
8
4
10
6
15

Frecuencia
acumulada
9
11
19
23
33
39
54

Frecuencia
Relativa (%)
16.67
3.70
14.81
7.41
18.52
11.11
27.78

De la columna de frecuencia se divide entre el total de observaciones:

Ahora multiplcalo por 100 para representarlo en porcentaje:

8. FRECUENCIA RELATIVA ACUMULADA


Una de las ventajas que presenta la construccin de la distribucin de frecuencias relativas
reside en que la distribucin acumulada y la ojiva correspondiente indican la proporcin
acumulada (o porcentaje) de observaciones presentes hasta los diversos valores posibles
de la variable.

Intervalo

Nmero
de Clase

Inferior

Superior

1
2
3
4
5
6
7

66
71
76
81
86
91
96

70
75
80
85
90
95
100

Limites
Inferior Superior
65.5
70.5
75.5
80.5
85.5
90.5
95.5

70.5
75.5
80.5
85.5
90.5
95.5
100.5

Frecuencia

Frecuencia
acumulada

Frecuencia
Relativa (%)

9
2
8
4
10
6
15

9
11
19
23
33
39
54

16.67
3.70
14.81
7.41
18.52
11.11
27.78

Frecuencia
Relativa
Acumulada (%)
16.67
20.37
35.18
42.59
61.11
72.22
100

De la columna de frecuencia relativa se suma el nmero de clase 1


ms el nmero de clase 2:

HISTOGRAMA Y POLIGONO DE FRECUENCIA


Una de las formas ms comunes utilizadas para representar una distribucin de frecuencias es con
un histograma, este es un diagrama en el que se marcan los LMITES INFERIORES en el EJE
HORIZONTAL y las FRECUENCIAS de cada una de las clases en el EJE VERTICAL.

UNIDAD I

Pgina 18

ESTADISTICA Y CONTROL DE CALIDAD


EJERCICIOS:
1.

Los siguientes datos son el nmero de meses de duracin de una muestra de 40 bateras para
coche.
22
34
25
33
47

41
16
43
31
38

35
31
34
37
32

45
33
36
44
26

32
38
29
32
39

37
31
33
41
30

30
47
39
19
42

26
37
31
34
35

2. Los siguientes datos representan la duracin de la vida en meses de 30 bombas de combustible


similares.
24

36

40

16

18

30

60

72

66

78

28

67

72

15

18

48

71

22

57

54

12

72

3. Una compaa de luz seleccion una muestra de 20 clientes residenciales. Los siguientes datos son
las cuentas que se les factur el mes pasado:
54

48

58

50

25

47

75

46

60

70

67

68

39

35

56

66

33

62

65

67

4. Los resultados siguientes representan las calificaciones del examen final de un curso de estadstica
elemental.
23
80
52
41
60
34

UNIDAD I

60
77
10
71
78
67

79
81
64
83
89
17

32
95
75
54
76
82

57
41
78
64
84
69

74
65
25
72
48
74

52
97
80
88
84
63

70
85
98
62
90
80

82
55
81
74
15
85

36
76
67
43
79
61

Pgina 19

También podría gustarte