Está en la página 1de 108

Estadstica Bsica

El uso de herramientas cuantitativas


para el tratamiento de datos, tiene
origen en pocas remotas.
Las antiguas civilizaciones, como la
Egipcia,
aplicaron
continuamente
censos que ayudaban a la organizacin
del estado y la construccin de las
pirmides.
En la antigua Grecia y el Imperio
Romano, era comn la aplicacin de
censos para la planificacin de
impuestos y la prestacin del servicio

Estadstica Bsica
A comienzos del siglo XIX, la
palabra estadstica adopta un
significado ms generalizado
hacia la recoleccin y
clasificacin de cualquier tipo
de datos cuantitativos.

Estadstica Bsica
La primera persona que introdujo el trmino
estadstica en Inglaterra fue Sir John Sinclair
(1754-1835) con su trabajo Statistical
Account of Scotland (1791-,1799) trabajo
compilado en 21 volumenes.
La emple como generadora de informacin
interna para encontrar quiebras y proponer
mejoras en el pas.

Estadstica Bsica
Sir Francis Galton (1822-1911) cre los
conceptos estadsticos de regresin y
correlacin, y fue el primero en aplicar
mtodos estadsticos para estudiar las
diferencias humanas basado en el uso
de cuestionarios y entrevistas para
recolectar los datos.

Estadstica Bsica
Major Greenwood (1880-1949)
investig los problemas de salud
asociados al trabajo en fbricas.
Desarroll la Epidemiologa y en 1919
cre el Ministerio de la Salud en
Inglaterra, responsable de datos
estadsticos mdicos.

Estadstica Bsica
Definicin de Estadstica;
Ciencia encargada de recolectar,
analizar, presentar e interpretar
datos.
Enciclopedia Britnica

Estadstica Bsica
Definicin de Estadstica;
rea de la matemtica dedicada a
la recoleccin e interpretacin de
datos cuantitativos y al uso de la
teora de la probabilidad para
calcular los parmetros de una
poblacin.
Diccionario Ingles Word Reference

Estadstica Bsica
Definicin de Estadstico;
Cualquier caracterstica
medible calculada sobre una
muestrao poblacin.
Definicin de Muestra;
Es un subconjunto de una
poblacin.

Estadstica Bsica
Una muestra es representativa
cuando
los
elementos
son
seleccionados de tal forma que
pongan
de
manifiesto
las
caractersticas de una poblacin.

Clasificacin de la
Estadstica
Estadstica descriptiva:
se emplea para resumir de forma numrica o
grfica un conjunto de datos, describe los datos
que se analizan, no generaliza la informacin
hacia la poblacin.
Estadstica inferencial:
permite realizar conclusiones o inferencias,
basndose en los datos simplificados y
analizados de una muestra hacia la poblacin.
Error de aproximacin

Grficos Estadsticos
Son representaciones visuales que
emplean smbolos, barras, polgonos y
sectores, de los datos contenidos en
tablas de frecuencias, algunos son :
Grfico de sectores o pastel
Grficos de columnas
Histograma

Ejercicio
Una muestra de 100 estudiantes del programa de ingeniera de una
universidad, mostraron sus preferencias respecto a la creacin de un
nuevo laboratorio en una encuesta para el diario estudiantil:

Muestre los datos grficamente empleando:


a) Un grfico de columna
b) Un grfico de sectores

Caso para resolver


Una importante empresa desea contratar el suministro
de tubos de acero.
Para la licitacin se presentaron tres empresas (A, B y
C), las cuales venden la unidad al mismo precio y con
las mismas especificaciones del material.
La empresa solicita que el proveedor mantenga un
dimetro promedio por cada 30 tubos entregados de
200 mm; para lo cual solicit a cada empresa una
muestra de este tamao, obteniendo los siguientes
dimetros (las unidades estn en milmetros):

Cul de los tres


proveedores
escogera
usted?
Justifique su
respuesta

Variabilidad
Como
disciplina,
podemos
decir
informalmente
que la estadstica es el estudio de la
variabilidad.
Las tcnicas estadsticas permiten describir la
variabilidad y plantear hiptesis con el
objetivo
de comprenderla.

Variabilidad
Ejemplos:

Masa corporal, estatura, metabolismo


Reaccin ante un medicamento
Resultados de un experimento
Producto de un proceso industrial
Criterio en la eleccin de un producto
o servicio

Variabilidad
De acuerdo con los ejemplos anteriores,
podemos
distinguir
dos
tipos
variabilidad:

de

1) Variabilidad debido a diferencias entre


individuos
respeto
de
alguna
caracterstica.

2) Variabilidad debida a errores de medicin.

Datos
Son los valores de la variable en estudio,
pueden ser cuantitativos (numrico) o
categricos (cualitativo o de atributo).
Ejemplo. Consideremos el voltaje de salida de
cierto tipo de generadores:
5.10, 5.25, 5.80, 4.92, 6.10, 5.71, 5.94
los datos son una medida, son cuantitativos
y debemos expresarlos en unidades de
voltaje

Datos
Supongamos que las normas especifican que el voltaje de
salida debe estar en un rango de 5.1 a 5.9 y
consideramos las categoras:
cumple con las normas
no con las normas
tendremos datos categricos.

Datos
Si adems, se asigna 1 cuando el
generador
cumple con los requerimientos y 0 si no
cumple,
obtendremos los siguientes datos:
1, 1, 1, 0, 0, 1, 0
(5.10, 5.25, 5.80, 4.92, 6.10, 5.71,
5.94)

Calidad
Una definicin moderna de Calidad
es:
Aquella que es inversamente
proporcional a la variabilidad
Por lo tanto la Mejora de la
Calidad consiste en la reduccin
de la variabilidad en procesos y
productos

Datos
Para presentar datos cualitativos se
utilizan los diagramas de pastel y las
grficas de barras.
Una de las grficas de barras que es
muy importante y se utiliza como
herramienta de la calidad es el
llamado Diagrama de Pareto

Historia del principio de


Pareto
En 1909 el economista y socilogo Vilfredo
Pareto(1848 1923) public los resultados
de sus estudios sobre la distribucin de la
riqueza, observando que el 80% de la misma
se encontraba concentrada en el 20% de la
poblacin.
En la dcada de 1930, Joseph M. Juran
analizaba mediante tcnicas estadsticas la
produccin defectuosa y observ que los
defectos se concentraban en unos cuantos
tipos.

La relacin 80/20 ha sido encontrada en


distintos campos. Por ejemplo, el 80% de
los problemas de una organizacin son
debidos a un 20% de las causas posibles.
El 80% de los defectos de un producto se
debe al 20% de causas potenciales, la
relacin no debe ser exactamente 80/20,
pero s se puede aventurar que unas
pocas causas son responsables de la
mayor parte de los problemas.

Diagrama de Pareto
Grfica de barras dispuestas de la categora
mas numerosa a la menos numerosa.
Incluye una grfica hecha a base de rectas que
muestra los porcentajes acumulados y la
cantidad de datos representada en cada barra.
El eje vertical izquierdo es la frecuencia con la
que ocurren los valores individuales y el eje
vertical derecho es el porcentaje acumulado.

Elaboracin del Diagrama de Pareto

Los pasos a seguir para la elaboracin


de un diagrama de Pareto son:
1.Seleccionar los datosque se van
a analizar, as como el periodo de
tiempo al que se refieren dichos
datos.
2.Agrupar los datospor categoras,
de acuerdo con un criterio
determinado.

Elaboracin del Diagrama de Pareto

3.Tabular los datos.


Comenzando por la categora que
contenga ms elementos y,
siguiendo en orden descendente,
calcular:
Frecuencia absoluta.
Frecuencia absoluta acumulada.
Frecuencia relativa unitaria.
Frecuencia relativa acumulada.

Elaboracin del Diagrama de Pareto

4. Dibujar el diagrama de Pareto.

5. Representar el grfico de
barrascorrespondiente que, en el
eje horizontal, aparecer tambin en
orden descendente.

Elaboracin del Diagrama de Pareto

6.Delinear la curva acumulativa.


Se dibuja un punto que represente
el total de cada categora. Tras la
conexin de estos puntos se formar
una lnea poligonal.
7.Identificar el diagrama,
etiquetndolo con datos como: ttulo,
fecha de realizacin, periodo
estudiado,
8.Analizar el diagrama de Pareto.

Ejemplo de la aplicacin del


diagrama de Pareto

Diagrama de Pareto

Otro Ejemplo de un
Diagrama de Pareto
Los datos se
preparan y ordenan
como en la
siguiente tabla

Ejercicio

Elabore el Diagrama de Pareto

Respuesta

Conclusin

Distribucin

Listado, a menudo expresado en forma de


diagrama, que asocia cada valor de una
variable con su frecuencia.
La frecuencia f es el nmero de veces que
aparece el valor x en la muestra.
Frecuencias no agrupadas
Frecuencias agrupadas

Diagrama de Tallos y Hojas

Permite obtener simultneamente una distribucin


de frecuencias de la variable y su representacin
grfica.
Para construirlo basta separar en cada dato el
ltimo dgito de la derecha (que constituye
lahoja) del bloque de cifras restantes (que
formar eltallo).
Esta representacin de los datos presenta ms
informacin que un histograma.

Diagrama de Tallos y Hojas

Como
ejemplo
expongamos
los
horarios de los trenes de una cierta
ruta de Espaa

Diagrama de Tallos y Hojas

Para elaborarlo, se representa lahoraa la


izquierda de la barra de separacin|y
los minutosde la salida de cada tren a
la derecha.
Lafrecuenciade los trenes se deduce
fcilmente de lalongitud de las filasy
es muy fcil ver en que minutos de cada
hora pasan tpicamente los mismos.

Diagrama de Tallos y Hojas

Diagrama de Tallos y Hojas


(reducido)

Diagrama de Tallos y Hojas

Tambin puede utilizarse para comparar


dos distribuciones, por ejemplo si
tenemos
las
dos
siguientes
distribuciones (edades de 20 personas):
Distrib. 1

Distrib. 2

Diagrama de Tallos y Hojas

El resultado es el siguiente:
Distrib. 2
Distrib. 1

Ejercicio

Respuesta

Grfica de puntos

Muestra cada elemento de un conjunto


de datos numricos por encima de
una recta numrica, o eje horizontal.
Las grficas de puntos facilitan ver los
espacios vacos y los agrupamientos
en un conjunto de datos, as como la
manera en que se distribuyen los
datos a lo largo del eje.

Grfica de puntos

Ejemplo:
El pulso vara de una persona a otra,
pero por lo general, el pulso de una
persona saludable en reposo se
mantiene entre ciertos valores. Una
persona con un pulso muy rpido o
muy lento podra necesitar atencin
mdica.

Grfica de puntos

El siguiente conjunto de datos refleja las


pulsaciones por minuto de un grupo de 30
estudiantes:
68 60 76 68 64 80 72 76 92 68 56 72 68 60 84
72 56 88 76 80 68 80 84 64 80 72 64 68 76 72
Elaborando la grfica de puntos nos queda
como sigue.

Grfica de puntos

Diagrama o grfica de caja y bigotes

Es una presentacin visual que describe


varias caractersticas importantes, al
mismo tiempo, tales como la dispersin y
simetra.
Para su realizacin se representanlos tres
cuartilesy
los
valoresmnimoymximode los datos,
sobre un rectngulo, alineado horizontal o
verticalmente.

Diagrama o grfica de caja y bigotes

Una grfica de este tipo consiste en


unacajarectangular, donde los lados ms
largos
muestran
elrecorrido
intercuartlico.
Este rectngulo est dividido por un segmento
vertical que indica donde se posiciona la
mediana y por lo tanto su relacin con los
cuartiles primero y tercero (el segundo
cuartil coincide con la mediana).

Diagrama o grfica de caja y bigotes

Esta caja se ubica a escala sobre un


segmento que tiene como extremos
los valores mnimo y mximo de la
variable. Las lineas que sobresalen
de la caja se llamanbigotes.

Diagrama o grfica de caja y bigotes

Ejemplo: la distribucin de frecuencias


que representan la edad de un colectivo
de 20 personas.

Para elaborar el diagrama, se siguen los


pasos descritos a continuacin:

Diagrama o grfica de caja y bigotes

1. ORDENAR LOS DATOS


20 23 24 24 24 25 29 31 31 33 34 36 36 37 39
39 40 40 41 45
2. CALCULAR LOS CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de
los valores de la distribucin.
Como N = 20 resulta que N/4 = 5; el primer cuartil es
la media aritmtica de dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5

Diagrama o grfica de caja y bigotes


Q2, el Segundo Cuartil es, evidentemente, la mediana
de la distribucin, es el valor de la variable que
ocupa el lugar central en un conjunto de datos
ordenados. Como N/2 =10 ; la mediana es la media
aritmtica de dicho valor y el siguiente:
Q2= (33 + 34)/ 2 = 33,5
Q3, el Tercer Cuartil, es el valor que sobrepasa al 75%
de los valores de la distribucin. En nuestro caso,
como 3N / 4 = 15, resulta:
Q3 = (39 + 39) / 2 = 39

Diagrama o grfica de caja y bigotes

3. Dibujar la caja y los bigotes:

Informacin del Diagrama


La parte izquierda de la caja es mayor que la de la
derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la poblacin
est ms dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmm, Q 1) es ms corto
que el de la derecha; por ello el 25% de los ms
jvenes estn ms concentrados que el 25% de los
mayores.
Elrango intercuartlico= Q3- Q1= 14,5; es decir, el
50% de la poblacin est comprendido en 14,5 aos.

Comparando dos distribuciones

Realice el diagrama de caja y bigotes de la


segunda distribucin , compare con la
primera, compruebe que el resultado debe
ser como sigue:

Diagrama o grfica de caja y bigotes


(comparando dos distribuciones)

Ejercicio
Los datos a continuacin representan lecturas de viscosidad en
tres diferentes mezclas de material sin procesar en una lnea
de manufactura:
Mezcla 1
Mezcla 2
Mezcla 3
22.02
23.83
26.67
25.38
25.49
23.50
25.90
24.98

21.49
22.67
24.62
24.18
22.78
22.56
24.46
23.79

20.33
21.67
24.67
22.45
22.28
21.95
20.49
21.81

Elabore diagramas de cajas para los datos de viscosidad de


mezclas y compare.

Aplicaciones en el Control de Calidad

Parte de un estudio de control de calidad tuvo como


objetivo mejorar una lnea de produccin. Se
midieron los pesos (en onzas) de 50 barras de
jabn. Los resultados son los siguientes,
ordenados de menor a mayor:
11.7 12.2 13.2 13.4
14.8 14.8 15.1 15.2
15.7 15.8 15.8 15.9
16.2 16.4 16.7 16.7
17.1 17.2 17.2 17.2
17.6 17.6 17.8 17.8
19.0 19.1

14.4
15.3
15.9
16.8
17.4
17.9

14.4
15.4
15.9
16.8
17.5
18.2

14.7
15.5
15.9
16.8
17.5
18.2

14.7
15.7
16.0
17.0
17.5
18.7

Aplicaciones en el Control de Calidad


a) Construye un diagrama de tallos y hojas para estos
datos.
b) Construye un histograma para estos datos.
c) Construye un diagrama de cajas para estos datos.
d) Construye un grfico de puntos para estos datos.
e) Realiza un reporte con tus conclusiones.

* Investiga paquetes computacionales, softwares,


excel, etc para realizar clculos y grficos de esta
Unidad de Aprendizaje, aprende a usarlos y
preprate para resolver tareas y quiz una
presentacin en power point.

Medidas de tendencia
central

Media
Mediana
Rango medio
Moda

Medidas de dispersin
Rango
Varianza
Desviacin estndar

Desviacin con respecto a la


media
Es la diferencia entre el valor de un dato y
la media de los datos.
El valor promedio de estas desviaciones
siempre resultar en cero (por lo cual
no es un estadstico de calidad).
Las desviaciones al cuadrado se usan
para determinar la varianza.

Varianza muestral
Se puede definir como la media de las
desviaciones al cuadrado de los
datos con respecto a la media
muestral, calculada usando como
divisor n-1.
Su formula matemtica para el caso de
datos referentes a una muestra es:

Dos propiedades importantes de la varianza


son:
La varianza de una constante es cero
Si se tiene la varianzade un conjunto de
datos y a cada observacin se multiplica por
una constanteb, entonces la nueva varianza
de los datos se obtiene multiplicando a la
varianza de los datos porb al cuadrado.

Desviacin estndar
muestral
Se define como la raz cuadrada de la
varianza:

Coeficiente de variacin
Es una medida que se emplea fundamentalmente para:
Comparar la variabilidad entre dos grupos de datos
referidos a distintos sistemas de unidades de medida.
Comparar la variabilidad entre dos grupos de datos
obtenidos por dos o ms personas distintas.
Comparar dos grupos de datos que tienen distinta
media.
Determinar si cierta media es consistente con cierta
varianza.

Coeficiente de variacin
Se define con la siguiente ecuacin:

Ejemplo
Con un micrmetro, se realizan
mediciones del dimetro de un
balero, que tienen una media de 4.03
mm y una desviacin estndar de
0.012 mm; con otro micrmetro se
toman mediciones de la longitud de
un tornillo que tiene una media de
1.76 pulgadas y una desviacin
estndar de 0.0075 pulgadas. Cul
de los dos micrmetros presenta una

Respuesta

En consecuencia, las mediciones hechas por


el
primer
micrmetro
exhiben
una
variabilidad relativamente menor con
respecto a su media que las efectuadas por
el otro.

Distribucin Normal
Es la distribucin de probabilidad mas
importante.
Aunque
la
desviacin
estndar
proporciona una medida de la
dispersin de un conjunto de
resultados alrededor del valor medio,
no indica la forma de la distribucin.

Ejemplo de sistemas que siguen una


distribucin normal

Distribucin Normal
Para describir la forma de la poblacin
(de la que se extrae una muestra) de
los datos de concentracin de ion
nitrato, se necesita una curva
continua.
El
modelo
matemtico
que
habitualmente se emplea es la
distribucin normal o Gausiana.

Distribucin Normal
Es descrita por la siguiente ecuacin:

Curva acampanada
o Gausiana

Propiedades de la Distribucin
Normal

Distribucin Normal
estndar

Obtencin de el valor
estandarizado z

Propiedades de la
Distribucin Normal Estndar
El rea bajo la curva normal es igual a 1
La distribucin es simtrica
La distribucin tiene una media de 0 y
una desviacin estndar de 1
La media divide el rea a la mitad (0.5
de cada lado)
Casi toda el rea est entre z = -3 y z =
3

Ejercicios
Determinar el valor del rea bajo la
curva normal
a) Entre z = 0 y z = 1.52, P(0<z<1.52)
b) Entre z = 0 y z = 1.37, P(0<z<1.37)
c) A la derecha de 1.52, P(z>1.52)
d) A la izquierda de 1.52, P(z<1.52)

Ejercicios
Determinar el valor del rea bajo la curva
normal
e) A la derecha de z = 2.03, P(z>2.03)
f) A la izquierda de 1.73, P(z<1.73)
g) Entre -1.39 y la media
h) A la izquierda de z = -1.35
i) A la izquierda de z = -1.53
j) Entre z = -1.83 y z = 1.23
k) Entre z = 0.75 y z = 2.25

Aplicaciones de las
Distribuciones Normales
Por ejemplo: un qumico realiza
repetidamente varias mediciones del
volumen
de
un
producto,
las
mediciones tienen una media de
10.15 mL y una desviacin estndar
de 0.02mL.
Qu porcentaje de medidas caen entre
10.12 y 10.20 mL?

Aplicaciones de las
Distribuciones Normales
Otro
ejemplo:
los
valores
del
coeficiente intelectual (CI) de las
personas
estn
distribuidas
normalmente con una media de 100
y una desviacin estndar de 16. Si
se elige una persona al azar, cul es
la probabilidad de que su CI est
entre 100 y 115?

Ejercicios

Ejercicios

Ejercicios

Ejercicios

Intervalo de confianza
Rango de resultados en torno a un valor
medio que podra explicarse por un error
aleatorio.
Para una serie de datos dada, el tamao del
intervalo depende, en parte, del nivel de
exactitud deseada.

Intervalos de confianza
El verdadero valor de la media en una determinacin
es una constante que nunca se conoce.
Sin embargo, se pueden establecer los lmites
alrededor
de
la
media
determinada
experimentalmente dentro de los cuales cabe
encontrar la media verdadera, con un cierto grado de
probabilidad.
Estos lmites de denominanLmites de Confianza; el
intervalo definido por tales lmites se conoce
comoIntervalo de Confianza.

Parmetro estadstico t
Student
El
parmetrottiene
un
valor
matemtico que es funcin del
nmero de medidas efectuadas y de
la
prediccin
(o
grado
de
probabilidad) que nosotros deseemos
para la exactitud. Los estadsticos
han compuesto tablas con los valores
numricos de t para varios niveles de
confianza:

Grados de
libertad

Nivel de confianza
80%

90%

95%

99%

99,9%

3,08

6,31

12,7

63,7

637

1,89

2,92

4,30

9,92

31,6

1,64

2,35

3,18

5,84

12,9

1,53

2,13

2,78

4,60

8,60

1,48

2,02

2,57

4,03

6,86

1,44

1,94

2,45

3,71

5,96

1,42

1,90

2,36

3,50

5,40

1,40

1,86

2,31

3,36

5,04

1,38

1,83

2,26

3,25

4,78

10

1,37

1,81

2,23

3,17

4,59

11

1,36

1,80

2,20

3,11

4,44

12

1,36

1,78

2,18

3,06

4,32

13

1,35

1,77

2,16

3,01

4,22

14

1,34

1,76

2,14

2,98

4,14

1,29

1,64

1,96

2,58

3,29

Si, por ejemplo, queremos tener un


nivel de confianza de 95% (lo cual es
muy comn), entonces usamos la
distribucin
normal
estndar
y
encontramos
los
valores
que
incluyen a 95% del rea.

Ejercicios

Ejercicios

Contrastes de significacin
Son pruebas estadsticas que se utilizan
para probar si hay diferencia significativa
entre 2 resultados o si estos se pueden
justificar por variaciones aleatorias.
Por ejemplo, para comparar una media
experimental con un valor conocido, es
necesario probar si x y difieren
significativamente

Clculo del estadstico t

Hiptesis Nula (Ho): no hay otra diferencia


entre el valor observado y el conocido
que la atribuible a la variacin aleatoria

Decisin
Si el valor absoluto calculado de t (t calc.) es
mayor que un cierto valor crtico (t crit.)
entonces se rechaza la hiptesis nula
(Ho).
El valor t crtico est reportado en tablas
(Ver diapositiva No. 103).

Ejemplo

Comparacin de dos medias


experimentales

Ejemplo