Está en la página 1de 68

U N I V E R S I D A D DE C A R T A G E N A

PROGRAMA DE ADMINISTRACIN FINANCIERA


COMPENDIO DE MODELOS INFERENCIALES
INTRODUCCIN A LOS MODELOS INFERENCIALES

La Estadstica es la parte de las Matemticas que se encarga del estudio de una determinada
caracterstica en una poblacin, recogiendo los datos, organizndolos en tablas, representndolos
grficamente y analizndolos para sacar conclusiones de dicha poblacin.
Segn se haga el estudio sobre todos los elementos de la poblacin o sobre un grupo de ella, vamos
a diferenciar dos tipos de Estadstica:
Estadstica descriptiva. Realiza el estudio sobre la poblacin completa, observando una
caracterstica de la misma y calculando unos parmetros que den informacin global de toda la
poblacin.
Estadstica inferencial. Realiza el estudio descriptivo sobre un subconjunto de la poblacin llamado
muestra y, posteriormente, extiende los resultados obtenidos a toda la poblacin.
Vocabulario estadstico:
Las primeras definiciones necesarias para el inicio de cualquier estudio estadstico son:
Poblacin: Conjunto de todos los elementos que verifican una caracterstica que ser objeto de
estudio.
Individuo: Cada uno de los elementos de la poblacin.
Muestra: Cualquier subconjunto de la poblacin. Este subconjunto es muy importante que
sea representativo de la poblacin.
Carcter: Cada una de las propiedades que poseen los individuos de la poblacin y que pueden
ser objeto de estudio.

Modelos Inferenciales - 2014

Caracteres
Cualitativos

Cuantitativos
Continuos

Discretos

http://recursostic.educacion.es/descartes/web/indice_ud.php

Una diferencia importante entre la estadstica y probabilidad es que:


En la Probabilidad se razona a partir de la poblacin hasta llegar a la muestra.
En la Estadstica el razonamiento parte de la muestra para llegar al conocimiento de toda la
poblacin.
El estudio de una poblacin tomando como base las muestras, se llama ESTADSTICA
INFERENCIAL o INDUCTIVA, algunos autores la citan como teora de muestras.
La inferencia estadstica trata de conocer o explicar el comportamiento de la poblacin, mediante
los datos obtenidos de una muestra. Como no podemos estar absolutamente seguros de la veracidad
de las inferencias obtenidas, las llamaremos probabilidades. Ahora, para predecir a partir de una
muestra, es necesario haberla seleccionado y recopilado cuidadosamente; si la muestra no se
selecciona adecuadamente, o si la recoleccin es incorrecta o hay desviaciones en los datos, con
ningn anlisis estadstico que se aplique, se llegar a buenas conclusiones.
Por lo tanto es necesario estudiar elTema: teora de muestreo
Definicin de Estadstica Inferencial: De acuerdo con el diccionario de la Real Academia Espaola,
inferir significa "sacar una consecuencia o deducir algo de otra cosa".
El principal objetivo de la Estadstica consiste en poder decir algo con respecto a un gran conjunto de
personas, mediciones u otros entes (poblacin) con base en las observaciones hechas sobre slo
una parte (muestra) de dicho gran conjunto.
La capacidad para "decir algo" sobre poblaciones con base en muestras est basada en supuestos
con respecto a algn modelo de probabilidad que permite explicar las caractersticas del fenmeno
bajo observacin.
Al conjunto de procedimientos estadsticos en los que interviene la aplicacin de modelos de
probabilidad y mediante los cuales se realiza alguna afirmacin sobre poblaciones con base en la
informacin producida por muestras se le llama Inferencia Estadstica o Estadstica Inferencial.
La estadstica inferencial es una parte de la estadstica que comprende los mtodos y
procedimientos para deducir propiedades de una poblacin estadstica, a partir de una pequea parte
de la misma. La estadstica inferencial comprende como aspectos importantes:
La toma de muestras o muestreo.
La estimacin de parmetros o variables estadsticas.
El contraste de hiptesis.
El diseo experimental.
La inferencia bayesiana.
Los mtodos no paramtricos
Modelos Inferenciales - 2014

Planteamiento del problema: Un problema de inferencia estadstica suele iniciarse con una fijacin
de objetivos o algunas preguntas del tipo:
Cul ser la media de esta poblacin respecto a tal caracterstica?
Se parecen estas dos poblaciones?
Hay alguna relacin entre?
En el planteamiento se definen con precisin la poblacin, la caracterstica a estudiar, las variables,
etc.
Elaboracin de un modelo: Se establece un modelo terico de comportamiento de la variable de
estudio. En ocasiones no es posible disear el modelo hasta realizar un estudio previo.
Los posibles modelos son distribuciones de probabilidad.
Extraccin de la muestra: Se usa alguna tcnica de muestreo o un diseo experimental para
obtener informacin de una pequea parte de la poblacin.
Tratamiento de los datos: En esta fase se eliminan posibles errores, se depura la muestra, se
tabulan los datos y se calculan los valores que sern necesarios en pasos posteriores, como la media
muestral, la varianza.
Los mtodos de esta etapa estn definidos por la estadstica descriptiva.
Estimacin de los parmetros: Con determinadas tcnicas se realiza una prediccin sobre cules
podran ser los parmetros de la poblacin
Contraste de hiptesis: Artculo principal: Contraste de hiptesis.
Los contrastes de hiptesis son tcnicas que permiten simplificar el modelo matemtico bajo anlisis.
Frecuentemente el contraste de hiptesis recurre al uso de estadsticos mustrales.
Ministerio de educacin y ciencia de Espaa:
http://recursostic.educacion.es/descartes/web/
http://descartes.cnice.mec.es/
http://recursostic.educacion.es/descartes/web/Descartes1/Bach_HCS_2/Distri...
http://ntic.educacion.es/w3//eos/MaterialesEducativos/mem2001/estadistica/index2.htm

Modelos Inferenciales - 2014

UNIDAD 1: DISTRIBUCIONES DE PROBABILIDAD


Contenido temtico
Propsito del contenido temtico
Conceptos fundamentales
Nmeros de sesiones

Las nociones elementales de la probabilidad


Las nociones elementales de la probabilidad, son de gran importancia
para las unidades siguientes, especialmente en la eleccin de un modelo
que permita la descripcin del comportamiento de los datos para que el
alumno lo utilice al realizar trabajos de investigacin cientfica.
El concepto de probabilidad
1 (semana) con alto porcentaje de estudio independiente

ACTIVIDADES DE APERTURA
Te damos una cordial bienvenida como estudiante del curso de Modelos
Inferenciales y te deseamos xito en ste semestre. Te recomendamos que
contestes todas tus actividades de aprendizaje y participes activamente en las
siguientes secuencias didcticas para que construyas un aprendizaje
significativo. Recuerda lo importante es que aprendas a aprender, a resolver
problemas de la vida cotidiana.
ACTIVIDADES DE DESARROLLO
Revisin de contenido:
1. Lee de manera individual y cuidadosamente, los contenido relacionados
al problema en tu gua didctica:
Distribucin Binomial.
Distribucin Poisson.
Distribucin Hper geomtrica
Distribucin Normal.
2. Junto con los integrantes de tu equipo, comenten las estrategias para la
solucin de las preguntas antes sealadas.

OBSERVACIN
Contextualizar el tema
integrador en base a:
Las expectativas
educativas en el presente
semestre y al momento de
egresar del programa.

Consultar la presente gua


didctica para argumentar
su solucin y otras
bibliografas.

3. Realicen otras consultas, en libros, internet, o apuntes diversos.


ACTIVIDADES DE CIERRE

En reunin plenaria, expondrn las vas de solucin que hayan


encontrado a dichos preguntas ya sea con lminas, o presentaciones
PowerPoint.
Tambin podrn confrontar las respuestas de otros equipos.
En la plenaria, encontraras la solucin ms idnea entre todo el grupo.
De manera respetuosa podrs solicitar a todo el grupo, te disipen
algunas dudas que tengas respecto al tema y a la solucin del problema
en general.
El tutor propiciar la exposicin libre de las inquietudes e impresiones
generadas durante el desarrollo del tema.

Se considera conveniente
realizar un ejercicio similar
en tu programa, como
tarea.

BIBLIOGRAFA, CIBERGRAFIA Y OTRAS FUENTES DE INFORMACIN


Estadstica y Muestreo. Ciro Martnez Bencardino, Ecoe Ediciones, Novena Edicin. Eco Ediciones, Novena Edicin.
Chao Lincoln. (1992). Introduccin a la estadstica. Editorial McGraw Hill Interamericana. Mxico.
Texto Estadstica Aplicada a los Negocios y la Economa. Decimo tercera Edicion. McGrawHill. Autores Lind, Douglas A.,
Marchal, William G., Wathen, Samuel A.
http://descartes.cnice.mec.es/ del ministerio de educacin y ciencia de Espaa

http://ntic.educacion.es/w3//eos/MaterialesEducativos/mem2001/estadistica/index2.htm
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Distribucion_normal/Distribucion_normal.htm
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Distribucion_binomial/binomial.htm

Modelos Inferenciales - 2014

1.1. DISTRIBUCCION BINOMIAL


Algunos la denominan como mtodo exacto y, corresponde a una distribucin de variable aleatoria discreta.
Una forma corriente de descripcin de los experimentos aleatorios equiprobables con variable discreta es la
distribucin binomial. En este tipo de distribucin se estudia la probabilidad de que se produzca un cierto
resultado, que se describe por medio de dos parmetros: el nmero de repeticiones realizadas del experimento
y la probabilidad individual del suceso aleatorio que se persigue como resultado.

Qu es una distribucin binomial? Una distribucin de probabilidad ampliamente utilizada de una variable aleatoria
discreta en la distribucin binomial. Esta describe varios procesos de inters para los administradores.
Describe datos discretos, resultantes de un experimento denominado proceso de Bernoulli en honor del
matemtico suizo Jacob Bernoulli, quien vivi en el siglo XVII.
Empleo del proceso de Bernoulli.
Podemos servirnos de los resultados de un nmero fijo de lanzamientos de una moneda como ejemplo de un
proceso de Bernoulli. Este proceso lo describimos as:
1. Cada ensayo (cada lanzamiento, en nuestro caso) tiene slo dos resultados posibles: lado A o lado B,
s o no, xito o fracaso.
2. La probabilidad del resultado de cualquier ensayo (lanzamiento) permanece fija con el tiempo.
Tratndose de una moneda la probabilidad de que salga del lado A sigue siendo de 0.5 en cada
lanzamiento, cualquiera que sea el nmero de veces que la moneda sea arrojada.
3. Los ensayos son estadsticamente independientes, es decir, el resultado de un lanzamiento no afecta al
de cualquier otro lanzamiento.
Cada proceso de Bernoulli tiene su propia probabilidad caracterstica. Pongamos el caso en que siete dcimas
partes de las personas que solicitaron cierto tipo de empleo pasaron la prueba. Diremos entonces que la
probabilidad caracterstica fue de 0.7 pero podemos describir los resultados de la prueba como un proceso de
Bernoulli slo si tenemos la seguridad de que la proporcin de los que fueron aprobados permaneci constante
con el tiempo.
Desde luego, la otra caracterstica del proceso de Bernoulli tambin deber ser satisfecha. Cada prueba deber
arrojar tan slo dos resultados (xito o fracaso = y los resultados de las pruebas habrn de ser estadsticamente
independientes.
En un lenguaje ms formal, el smbolo p representa la probabilidad de un xito y el smbolo q (1- p ) representa
la probabilidad de un fracaso. Para representar cierto nmero de xitos, utilizaremos el smbolo k y para
simbolizar el nmero total de ensayos emplearemos el smbolo n.
Frmulas de la distribucin binomial
n = es el nmero de pruebas.
k = es el nmero de xitos.
p = es la probabilidad de xito.
q = es la probabilidad de fracaso.
E l nm ero c om binator io

Parmetros de la Distribucin Binomial


Media

Modelos Inferenciales - 2014

Varianza

Desviacin Tpica

np

= npq
npq

Ejemplo 1:
Un examen consta de 10 preguntas a las que hay que contestar SI o NO. Suponiendo que a las personas que
se le aplica no saben contestar a ninguna de las preguntas y, en consecuencia, contestan al azar, hallar.
a. Probabilidad de obtener cinco aciertos.
b. Probabilidad de obtener algn acierto.
c. Probabilidad de obtener al menos cinco aciertos.
En una distribucin binomial, la persona solo puede acertar o fallar la pregunta.
Suceso A (xito) = acertar la pregunta p = p(A) = 0.5
Suceso A = no acertar la pregunta = p(A) = 0.5
Distribucin binomial de parmetros n= 10, p= 0.5 B (10; 0.5)
a- Probabilidad de obtener cinco aciertos:
Obtener exactamente cinco aciertos k= 5, aplicamos la frmula:

Factorial = ( ! )
b- Probabilidad de obtener algn acierto
P(x ) = p (x = 1) + p (x = 2) + p (x =3) + P(x =4) + p(x =5) + p(x =6) + p( x=7) + p(x =8) + p(x 9) + p( x= 10)
Hacerlo de esta forma resulta muy pesado. Lo hacemos por sucesos contrarios.
El suceso obtener algn acierto es el suceso contrario a no obtener ningn acierto
P(x 1) = 1 p (x =0)
Calculemos la probabilidad de no obtener ningn acierto p (x =o)

c) Probabilidad de obtener a los menos cinco aciertos Acertar cinco o ms


p(x 5) = p (x= 5) + P(x =6) + p(x =7) + p(x= 8) + p(x =9) + p(x =10)
p(x 5) = 0.2461 + 0.2051+ 0.1172 + 0.0439 + 0.0098 + 0.0010 = 0.6231

Modelos Inferenciales - 2014

Ejemplo 2
La probabilidad de que un estudiante obtenga el ttulo de licenciado en farmacia es 0.3.
Hallar la probabilidad de que un grupo de siete estudiantes matriculados en primer curso finalice la carrera:
a- Ninguno de los siete finalice la carrera.
b- Finalicen todos.
c- Al menos dos acaben la carrera.
d- Hallar la media y la desviacin tpica del nmero de alumnos que acaban la carrera.
A = Obtener el ttulo p = p (A) = 0.3
A = No obtener el ttulo

= p (A) = 1 0.3 = 0.7

B (7; 0.3)

a- Ninguno de los siete finalice la carrera. X=0

b- Finalicen todos. X = 7

c- Al menos dos terminen la carrera. X= 2


Calculamos la probabilidad del suceso contrario. Probabilidad que no termine ninguno ms la
probabilidad de que termine uno.
P(x 2) = 1 [ p(X= 0) + p(X =1)]
-

La probabilidad de que no termine ninguno la hemos calculado en el apartado a. p(x = 0) = 0.0824


Probabilidad de que termine uno:

d- Media y desviacin tpica.


Media: = n x p = 7 x 0.3 = 2.1
Desviacin tpica

Modelos Inferenciales - 2014

Ejemplo3.
La probabilidad de que un alumno de 1 de bachillerato repita curso es de 0.3.
Elegimos 20 alumnos al azar. Cul es la probabilidad de que haya exactamente 4 alumnos repetidores.
Es una distribucin binomial, el alumno repite o pasa de curso.
- Consideremos suceso xito el ue nos preguntan El alumno repite curso P (A) = p = 0.3.
- El alumno no repite curso P( A) =1-p = q q = 1 0.3 = 0.7
- Elegimos 20 alumno n = 20
- Es una distribucin binomial de parmetros n= 20 , p = 0.3 B (n, p) B( 20, 0.3)
Probabilidad de ue haya exactamente 4 alumnos repetidores X = 4

Ejemplo 4.
Calcular la probabilidad de que una familia que tiene cuatro hijos, tres e ellos sean nios.
Es una distribucin binomial, los hijos solo pueden ser nios o ms.
- Suceso A (xito) tener un nio p (a) = 0.5 p = 0.5
- Suceso A tener una nia p( A) = 0.5 q = 0.5
- n = 4 (hijos) B (n, p) B ( 4; 0.5 )
Probabilidad de tener tres nios X = 3

Modelos Inferenciales - 2014

La distribucin binomial se puede expresar de forma grfica,

http://gmein.uib.es/bioinformatica/estadistica/index.html

Modelos Inferenciales - 2014

1.2. DISTRIBUCION DE POISSON


En una distribucin binomial cuando n es grande, por lo general mayor de cincuenta, y p, la probabilidad de
xito de un suceso, se acerca a cero, mientras que q la probabilidad de fracaso, se aproxima a 1 de tal manera
que el producto de np, llamado lambda , es menor o igual a 5, debe utilizarse la distribucin de Poisson.
Algunos autores consideran no solo el hecho de que p sea muy pequeo, sino tambin cuando p es tan grande
que se aproxima a 1, tambin para > 5, en ambos casos, se puede aplicar esta distribucin.
Condicin: Los eventos deben ser independientes.
Su distribucin de probabilidad est dada por

Dnde:

e = es la base del logaritmo natural= (e = 2.71828...),


X! =es el factorial de x,
X = nmero de casos favorables
= nxp, es un nmero real positivo, equivalente al nmero esperado de ocurrencias durante un intervalo dado.
= lambda
La distribucin de Poisson es una distribucin de probabilidad discreta.
Trabaja con la probabilidad de ocurrencia en un tiempo determinado o regin especfica, teniendo como
parmetro de la distribucin el promedio de ocurrencias en el mismo intervalo de tiempo o regin especfica. Por
ejemplo, el nmero de llamadas telefnicas que entran a un conmutador por hora; nmero de personas que se
inscriben a la universidad por semestre, nmero de artculos defectuosos que salen por hora, etc.
Caractersticas de la distribucin de Poisson
La distribucin de Poisson sirve para estudiar las ocurrencias de un evento por intervalo de tiempo. Para que un proceso
de esta naturaleza sea estudiado bajo esta distribucin de probabilidades, deben cumplirse todas las siguientes
caractersticas.
El promedio de individuos que
esperan ser atendidos en una hora
pico, puede ser estimada con base
en
los
datos
disponibles
observando con anterioridad
La probabilidad que un
individuo llegue exactamente
en un segundo es muy
pequea
y
permanece
constante para los dems
intervalos de la hora pico

Debemos ser capaces de


calcular la ocurrencia promedio
de este evento utilizando datos
anteriores
La probabilidad que dos o
ms individuos lleguen en un
intervalo igual a un segundo
es tan pequeo que se
puede considerar igual a
cero
El nmero de individuos que
llegan en un intervalo de un
segundo, es independiente
del momento que este se
presente en la hora pico
El nmero de individuos
que llegan en un segundo
es
independiente
del
nmero de individuos que
llegan en cualquier otro
segundo

Modelos Inferenciales - 2014

10

1- Ejemplo: Si el 1% de las bombillas fabricadas por una compaa son defectuosas, hallas la probabilidad de
que, en una muestra de 100 bombillas, 3 sean defectuosas.
Solucin:

=nxp
= 100 x (0,01)= 1
=1
X=3
e = 2,71828
3x

P(X=3)= 1

e -1 = 1 x (0.36788) = 0.06131

3!

P (X =3) = 6,13%
2- Ejemplo: Su pongamos que hay 300 errores de impresin distribuidos aleatoriamente a lo largo de un libro
de 500 pg.
Encuentre la probabilidad de que en una pg., dada contenga exactamente 2 errores de impresin.
Solucin:

n = 300 errores
P = _1_ es muy pequeo
500
X = 2 Dist. Poisson
= n x p
= 300 x _1_ = 0.6
500
= 0.6
- 0,6
P (x=2)= (0,6)2 x e
P (x=2)= (0,36) (0,549)
2!
2!

P (x=2)= 0,0988

P (x=2)= 9.88 %

3- Ejemplo: Un cajero automtico es utilizado cada 20 minutos por 6 personas. Se debe saber cul es la
probabilidad:
a. Que el cajero sea utilizado por 5 personas en 20 minutos.
b. Que el cajero sea utilizado por 10 personas en 20 minutos.
c. Que el cajero sea utilizado por 5 personas o menos en 20 minutos.
Solucin:

e = 2,71828
a) X=5
b) X=10
c) X= 5

Modelos Inferenciales - 2014

11

a)- P(X=5) = 65 x e -6
5!

P(X=5)= 7776 x 0,0025 = 0,162


120

b)- P(X=10) = 610 x e -6


10 !

P(X=10)= 60466176 x 0,0025 = 0.04165


3628800

P(X=5)= 16,2 %

P(X=5)= 4,16 %

c)- P(X 5) = P(X=0) + P(X=1) + P(X=3) + P(X=4) + P(X=5)


P(X 5) = 60 x e -6 + 61 x e -6 + 62 x e -6 + 63 x e -6 + 64 x e -6 + 65 x e -6 =
0!
1!
2!
3!
4!
5!
P(X 5) = 0.0024787 + 0.01487 + 0.044617 + 0.08923 + 0.13385 + 0.16062 = 0.44567

44.56%

Ejemplo: En un interseccin de la ciudad de Villahermosa, las autoridades de trnsito han reportado que
suceden en promedio 4 accidentes al mes, y la distribucin de este fenmeno est bajo un modelo de Poisson.
Las autoridades han declarado que mejorarn los sealamientos en la interseccin si se conociera que la
probabilidad de que ms de tres accidentes por mes, fuera mayor de 0.50 de acuerdo con esta informacin,
debern las autoridades mejorar los sealamientos en dicha interseccin?
Primero se requiere conocer la probabilidad de que sucedan 0, 1, 2, y 3 accidentes por mes.

P(x)= x e -
x!
P(0)= (4)0(2.71828)-4
0!

=(1) (0.01832) =0.01832


1

P(1)= (4)1(2.71828)-4
1!

=(4) (0.01832) =0.07328


1

P(2)= (4)2(2.71828)-4
2!

=(16) (0.01832) =0.14656


2

P(3)= (4)3(2.71828)-4
3!

=(64) (0.01832) =0.195413


6

Para contestar la pregunta se requiere conocer la suma de todas las probabilidades de ocurrencia de P(x=0),
P(x=1), P(x=2), P(x=3), la cual es de 0.43357, ste valor lo restamos de uno, y dar como resultado la
probabilidad que se est tratando contestar, que es de 0.56643, por lo que respondiendo a la interrogante de
las autoridades, se debe de mejorar los sealamientos ya que la probabilidad de que sucedan ms de tres
accidentes por mes es de 0.56.
La distribucin probabilstica de Poisson para este ejemplo es como se muestra.
Nmero de accidentes (x)
0
1
2
3
4
5
6
7
8
9
Total de 0 a 9
Probabilidad de ms de 10

Probabilidad exacta de x
0.01832
0.07328
0.14656
0.19541
0.19541
0.15630
0.10420
0.05955
0.02970
0.01323
0.99196
0.00804

La distribucin Poisson se puede expresar de forma grfica: http://gmein.uib.es/bioinformatica/estadistica/index.html

Modelos Inferenciales - 2014

12

1.3. DISTRIBUCION HPERGEOMTRICA


Al igual que la distribucin Binomial y la de Poisson corresponde a variables aleatorias discretas.
La distribucin Hpergeomtrica est asociada generalmente con un proceso de muestras sin reposicin en una
poblacin finita.
Las caractersticas o condiciones que debe reunir una distribucin hipergeomtrica son:
a. La informacin de la muestra se toma sin reposicin de una poblacin finita.
b. La probabilidad de xito no es contante, cambia para cada observacin.
c. El resultado de una prueba es dependiente de la prueba anterior, siempre se ver afectado por el resultado
de observaciones previas.
d. El tamao de la muestra (n) debe ser superior en un 5% con respecto al tamao poblacional N.
e. Se relaciona con situaciones de dos o ms resultados.
f. Esta distribucin es adecuada cuando el tamao de la poblacin es pequea. Esta condicin limita su
aplicacin.
La frmula que se debe emplear para la distribucin Hpergeomtrica es:
Siendo: N= Tamao de la poblacin
A= Numero de xitos en la poblacin
n= Tamao de la muestra
X= Numero de xitos en la muestra

Es necesario tener en cuenta que X no puede exceder a A ni n.

1-Ejemplo: De 50 edificios en un parque industrial 12 no cumplen el cdigo elctrico. Si se selecciona 10


edificios aleatoriamente determina la probabilidad de que:
a- 3 no cumplan el cdigo.
b- 4 no cumplan el cdigo.
c- Menos de 5 no cumplan el cdigo.
Datos:
N = Total poblacin = 50
A = xito poblacin = 12
n = Muestras = 10

Modelos Inferenciales - 2014

13

R/T.

1.4. DISTRIBUCION NORMAL


Entre la gran cantidad de distribuciones continuas que se usan en la estadstica, la ms importante, es la
distribucin normal o curva normal. La frmula de esta distribucin fue publicada por primera vez por
Abraham Demoivre (1667-1754) en 1733. Otros matemticos que figuran, en la historia inicial de la distribucin
normal, son Pierre Simn, el Marqus de Laplace (1749-1827) y Carl Friedrich Gauss (1777-1855), en cuyo
honor se denomina a veces, como distribucin de Gauss.
La frmula de la distribucin normal es:

La frmula de la distribucin normal es:


Dnde: = la media de la distribucin
= la desviacin tpica de la distribucin
= la constante 3.1459 y,

Indica que el termino entre corchetes es el exponente de

Modelos Inferenciales - 2014

e, donde e = la constante 2.71828

14

La curva normal, es una curva en forma de campana que se extiende indefinidamente en ambos
extremos, cada vez, pegndose ms al eje horizontal sin llegarlo a tocarlo.
Algunas caractersticas importantes de la distribucin normal, son las que se mencionan a
continuacin:
a. El rea total comprendida bajo la curva y por encima del eje horizontal, es igual a 1 (unidades
cuadradas).
b. La distribucin es simtrica al respecto de su media. Es decir, el 50% del rea est a la
derecha de la media y el 50% a la izquierda.
c. La media, la mediana y la moda son todas iguales.

4. La distancia horizontal, que hay desde el punto de inflexin de la curva (el punto donde la curva
deja de ser cncava hacia abajo y empieza a ser cncava hacia arriba), hasta una perpendicular
levantada sobre la media, es igual a la desviacin estndar , como se muestra en la siguiente figura:

5. La distribucin normal, es realmente una familia de distribuciones, puesto ue existe una


distribucin diferente para cada valor de y . En la siguiente figura se pueden ver tres distribuciones
normales con la misma desviacin estndar, pero diferente media. Las distribuciones que tienen
diferentes medias, se sitan en diferentes posiciones sobre el eje horizontal.

Modelos Inferenciales - 2014

15

Ahora se muestran, tres distribuciones normales con la misma media, pero con diferentes
desviaciones estndar. Aqu nos muestra, cmo mientras ms grande sea la distribucin estndar,
ms plana y ms extendida es la grfica de la distribucin.

6. La curva de una distribucin normal se extiende de (infinito) hasta +

Afortunadamente en la prctica, no es necesario alargar estas colas muy lejos, pues se encuentran
tan cerca del eje horizontal, que el rea bajo ellas es despreciable cuando nos alejamos ms de
cuatro o cinco desviaciones estndar de la media.
En la prctica, se pueden calcular las probabilidades de una variable X que est distribuida
normalmente, y que tenga valores entre ciertos nmeros Xa y Xb, utilizando la tabla reas bajo la
curva normal estndar (que se encuentra ms adelante), donde aparecen las reas entre los
valores 0 y Z, con Z > 0, para la curva normal estndar. ( = 0 y = 1 ).
Si utilizamos la simetra de la curva alrededor de la media, podemos calcular reas entre cualquiera
de los dos valores Xa y Xb. Para obtener reas bajo cualquier curva normal, efectuamos el cambio de
escala (ver la figura siguiente), que convierte las unidades de medida de la escala original o la escala
X, en unidades estndar por medio de la frmula:

Esta nueva escala o valor de Z simplemente, nos indica en cuntas desviaciones estndar por
encima o por debajo de la media de su distribucin, se desva el valor correspondiente de X. (La
anterior expresin tambin es conocida como desviacin normal).

Antes de utilizar la frmula para valores de Z, te invitamos a que reflexiones detenidamente unos
ejemplos y calculemos, las reas correspondientes a probabilidades de una variable aleatoria normal.
Modelos Inferenciales - 2014

16

a) Encuentra el rea bajo la curva normal estndar a la


izquierda de 0.83 o P(Z < 0.83)
Como el rea bajo toda la curva es 1, el rea que est a la izquierda
del 0 es 0.5; el rea que est a la izquierda de 0.83 es igual a la suma
del rea a la izquierda del 0 ms el rea entre 0 y 0.83. En la tabla
reas bajo la curva normal estndar encontramos que este ltimo
valor es 0.2967. El rea que buscamos es entonces 0.5 + 0.2967 =
0.7967 observa su curva.
El rea que se ha calculado corresponde a la probabilidad de que
esta variable, tome valores menores a 0.83 que es de 0.7967 o
79.67%

b) Encuentra el rea bajo la curva normal estndar a la derecha


de 1.07 o P(Z > 1.07)
El rea a la derecha del 0 es 0.5 y la podemos descomponer como la
suma del rea entre 0 y 1.07 y el rea a la derecha del 1.07. En la
tabla reas bajo la curva normal estndar, obtenemos ue el rea
entre 0 y 1.07 es 0.3577. El rea a la derecha de 1.07 es lo que le
falta a 0.3577 para llegar a 0.5, es decir, 0.5 0.3577 = 0.1423.
Por tanto, la probabilidad de que esta variable tome valores mayores
a 1.07 es de 0.1423 o 14.23%

c) Encuentra el rea bajo la curva normal estndar entre 0.24 y


1.18 o P(0.24 Z < 1.18)
Si el rea entre 0 y 1.18 le restamos el rea entre 0 y 0.24 obtenemos
el rea que buscamos. El rea entre 1.18 y 0.24 es 0.3810 0.0948 =
0.29
Por tanto, la probabilidad de que esta variable tome valores entre
0.24 y 1.18 es de 0.29 o 29%

d) Encuentra el rea bajo la curva normal estndar entre 1.70 y


0.93 o P(-1.70Z<-0.93)
Debemos observar primero que el nmero -1.70 est a la izquierda
del -0.93. El rea que deseamos calcular es el rea de -1.70 a 0,
menos el rea de 0.93 a 0, esto es, 0.4554 0.3238 = 0.1316
Por tanto, la probabilidad de que esta variable tome valores entre
-1.70 y -0.93 es de 0.1316 o 13.16%

e) Encuentra el rea bajo la curva normal a la derecha de


0.47 o P ( Z - 0.47)
Esta rea es la suma del rea de 0.47 a 0 ms el rea a la
derecha del 0, ue por la tabla reas bajo la curva normal
estndar vemos ue es 0.1808 + 0.5 = 0.6808
Por tanto, la probabilidad de que esta variable aleatoria tome
valores mayores a -0.47 es de 0.6808 o 68.08%

Modelos Inferenciales - 2014

17

Ejemplo: La media de un grupo de ingresos semanales con distribucin aproximadamente normal para un
conjunto de gerentes de nivel medio es de 1000 dlares y presenta una desviacin estndar de 100 dlares.
Cul es la probabilidad.
a. Que los gerentes tengan un ingreso semanal entre 840 y 1200 dlares.
b. Con ingresos semanales de 1245 dlares o ms.

Modelos Inferenciales - 2014

18

Ejemplo: La panadera sureste elabora piezas de pan, la longitud de una pieza se distribuye de forma normal
con una media de 15 cm y una varianza de 2,25 cm. Determine:
a. Probabilidad de que una pieza exceda los 18 cm.
b. Probabilidad de que las piezas de pan estn entre 13 y 17 cm.
Datos:
X = 15 cm
= 2.25 cm
=
=1,5 cm

Modelos Inferenciales - 2014

19

La distribucin Normal se puede expresar de forma grfica: http://gmein.uib.es/bioinformatica/estadistica/index.html

Modelos Inferenciales - 2014

20

ACTIVIDADES DE APRENDIZAJE:
Les recomiendo ue utilices una curva normal por cada ejercicio, y apoyndote en la tabla reas bajo la curva
normal estndar, encuentres las respuestas correctas.

Modelos Inferenciales - 2014

21

UNIDAD 2: TEORIA DE MUESTREO


Contenido temtico
Propsito del contenido temtico
Conceptos fundamentales
Nmeros de sesiones

Teorema elemental de muestreo


Conocer los conceptos bsicos de la teora elemental de muestreo para
que el alumno lo utilice al realizar trabajos de investigacin cientfica.
Teora elemental de muestreo
1 (semana) con alto porcentaje de estudio independiente

ACTIVIDADES DE APERTURA

OBSERVACIN

Te damos una cordial bienvenida como estudiante del curso de


Contextualizar el tema
Modelos Inferenciales y te deseamos xito en ste semestre. Al igual
integrador en base a:
que otros semestres, te recomendamos que contestes todas tus
actividades de aprendizaje y participes activamente en las siguientes Las expectativas educativas
secuencias didcticas para que construyas un aprendizaje
en el presente semestre y
significativo. Recuerda lo importante es que aprendas a aprender, a al momento de egresar del
resolver problemas de la vida cotidiana.
programa.
ACTIVIDADES DE DESARROLLO

Revisin de contenido:
1. Lee de manera individual y cuidadosamente, los contenido
relacionados al problema en tu gua didctica:
La teora de muestreo.
El muestreo aleatorio simple.
Los nmeros aleatorios.
El muestreo con o sin remplazamiento.
Los diseos de muestras.
2. Junto con los integrantes de tu equipo, comenten las estrategias
para la solucin n de las preguntas antes sealadas.
3. Realicen otras consultas, en libros, internet, o apuntes diversos.

Consultar la presente gua


didctica para argumentar
su solucin y otras
bibliografas.

ACTIVIDADES DE CIERRE

En reunin plenaria, expondrn las vas de solucin que hayan


encontrado a dichos preguntas ya sea con lminas, o
presentaciones PowerPoint.
Tambin podrn confrontar las respuestas de otros equipos.
En la plenaria, encontraras la solucin ms idnea entre todo el
grupo.
De manera respetuosa podrs solicitar a todo el grupo, te disipen
algunas dudas que tengas respecto al tema y a la solucin del
problema en general.
El tutor propiciar la exposicin libre de las inquietudes e impresiones
generadas durante el desarrollo del tema.

Se considera conveniente
realizar un ejercicio similar
en tu programa, como
tarea.

BIBLIOGRAFA, CIBERGRAFIA Y OTRAS FUENTES DE INFORMACIN


Estadstica y Muestreo. Ciro Martnez Bencardino, Ecoe Ediciones, Novena Edicin. Eco Ediciones, Novena Edicion.
Chao Lincoln. (1992). Introduccin a la estadstica. Editorial McGraw Hill Interamericana. Mxico.
Texto Estadstica Aplicada a los Negocios y la Economa. Decimotercera Edicion. McGrawHill. Autores Lind, Douglas A.,
Marchal, William G., Wathen, Samuel A.
http://recursostic.educacion.es/descartes/web/aplicaciones.php?bloque=4#28
http://recursostic.educacion.es/descartes/web/materiales_didacticos/muestreo_poblaciones_ccg/tipos_muestreo.htm
http://recursostic.educacion.es/descartes/web/materiales_didacticos/muestreo_poblaciones_ccg/tamano_muestra.htm

Modelos Inferenciales - 2014

22

2. LA TEORA DE MUESTREO
Recordemos que el objeto de un estudio estadstico es doble. Deseamos describir la muestra que tenemos a
mano y queremos sacar conclusiones o inferencias sobre la poblacin de donde hemos extrado dicha muestra.
Las decisiones tomadas respecto de la poblacin, a partir de la informacin de la muestra, se basan en la
probabilidad.

Figura 1. Esquema de cmo se lleva a cabo un estudio estadstico

Aunque el objetivo al llevar a cabo una investigacin es, por lo general, conocer las caractersticas de los
individuos de una poblacin, en la prctica suele ser difcil, cuando no imposible.
Para obviar estos inconvenientes, se recurre al estudio de una muestra, a partir de la cual podemos inferir,
inducir o estimar las caractersticas de la poblacin entera de la cual aquella ha sido extrada. Por
consiguiente, en contraposicin a la estadstica descriptiva, a esta parte que vamos a estudiar la
denominaremos estadstica inferencial, inductiva o analtica.
Es el estudio de las relaciones existentes entre una poblacin y las muestras extradas de ellas. Es de gran
utilidad en muchos campos; por ejemplo, para ESTIMAR caractersticas desconocidas de poblaciones (como la
media y la varianza poblacionales), denominadas parmetros de la poblacin o simplemente parmetros, a
partir del conocimiento de las caractersticas muestrales correspondientes, nombradas estadsticos de la
muestra o, en forma sencilla, estadsticos.
A los valores (mu) y (ro) que son, respectivamente la media y la desviacin estndar poblacionales, se les
llama PARMETROS DE LA POBLACIN.
Como la media de la muestra ( ) nos da una idea del valor de , se dice que ESTIMA a o que es un
estimador del parmetro ; anlogamente, S (desviacin estndar) estima a (Desviacin estndar de la
poblacin), o de otra forma, que S es un estimador de .

Modelos Inferenciales - 2014

23

Recordemos sus frmulas:

La teora del muestreo tambin sirve para determinar si las diferencias observadas entre dos muestras se
deben a variaciones por el azar o si en realidad son significativas. Dichas cuestiones surgen, por ejemplo, al
probar un nuevo suero para el tratamiento de una enfermedad o al decidir si un proceso de produccin es mejor
que otro. Sus respuestas involucran el uso de las denominadas pruebas significativas y de hiptesis, que son
importantes en la teora de decisiones, la cual estudiaremos ms adelante.
2.1 TIPOS DE MUESTREO.
Como ya se seal al principio de este apartado; para que las conclusiones de la teora de muestreo y la
estadstica inferencial sean vlidas, se deben elegir muestras REPRESENTATIVAS de la poblacin.

2.1.1. MUESTREO ALEATORIO SIMPLE O AL AZAR Y NUMERO ALEATORIOS :


Una forma de obtener una muestra representativa, es por medio del proceso denominado muestreo aleatorio
simple, en el cual cada miembro de una poblacin tienen las mismas probabilidades de ser incluido en la
muestra. Una tcnica de obtencin de una muestra aleatoria es la asignacin de nmeros a cada miembro de la
poblacin, anotar estos nmeros en pedazos de papel, colocarlos en una urna y despus sacar nmeros de
dicha urna, teniendo cuidado de mezclarlos muy bien antes de cada extraccin.
Otro concepto importante es si la poblacin es finita o infinita. Una poblacin es FINITA, si consta de un nmero
finito o fijo de elementos, medidas u observaciones. En cambio, una poblacin es INFINITA, al menos
hipotticamente, porque contienen una infinidad de elementos, medidas u observaciones.
Resumiendo
Una muestra de tamao n de una poblacin finita de tamao N, es una variable aleatoria
si se selecciona de manera tal que cada una de las (N Cn) muestras posibles, tiene la
misma probabilidad, 1/N Cn de ser seleccionada
Recordemos con un ejemplo Cuntas muestras distintas de n, podemos tomar de una poblacin finita de
tamao N ?.
Cuando n = 2
N = 12

Tamao de la muestra
Tamao de la Poblacin

Modelos Inferenciales - 2014

24

Solucin; hay 12C2= 12 x 11/ 2! = 66 muestras distintas.


12. C2= 12 x 11/2
12. C2= 12 x 5.5
12.C2 = 66
Podemos utilizar la frmula de Combinacin:
nCr =

n!
=
12 !
= 12 x 11x 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2
(n r)! r! (12 2 )! 2!
(10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 ) 2!

= 12 x 11
2!

= 66

En la calculadora 12C2:
12 tecla SHIFT y nCr queda 12C colocas el 2 queda 12C2 ubicas el signo = y te da la repuesta 66
Y cuando n = 3 y N = 100 Solucin; Hay 100C3 = 161,700 muestras distintas.
Ahora con poblacin infinita
Una muestra de tamao n de una poblacin infinita, es aleatoria si consta de
valores de variables aleatorias independientes, que tienen la misma distribucin.
Por independiente ueremos decir, ue las probabilidades relacionadas con cual uiera de las variables
aleatorias son las mismas, sin que tengan importancia los valores que se hayan observado, para las otras
variables aleatorias.

NMEROS ALEATORIOS:
Otro mtodo alternativo al muestreo aleatorio o al azar, es el uso de una tabla de nmeros aleatorios,
especialmente elaborados para dicho propsito (como la tabla siguiente), que contienen nmeros entre cero
y uno, distribuidos uniformemente.
Para obtener una muestra aleatoria, escogemos un nmero cualquiera de stos, digamos que elegimos en
la (Tabla N1 Nmeros Aleatorios) el sptimo nmero de la quinta columna (.266194) y a partir de l,
tomamos tantos nmeros como tenga la muestra. Para elegir una muestra de 6 de 20 individuos nos fijamos
en los siguientes cinco nmeros, los multiplicamos por 20, (el tamao de la poblacin), y redondeamos a
nmeros enteros.
En la siguiente tabla tenemos estos clculos:
ri
20 x ri
Redondeado

.246194
4.92388
5

.361474
7.22948
7

.721938
14.43876
14

.874239
17.48478
17

.588587
11.77174
12

.987107
19.74214
20

Esto significa que la muestra que obtuvimos, consiste de los individuos 5, 7, 14, 17, 12 y 20. En caso de que
despus de redondear, obtengamos un nmero repetido simplemente lo ignoramos y tomamos un nmero
aleatorio ms de la tabla. Existen tablas extensas de nmeros aleatorios que pueden consultarse en caso
necesario, o bien, es posible generar secuencias de nmeros aleatorios en hojas de clculo para
computadoras personales.
MUESTREO CON Y SIN REEMPLAZAMIENTO:
Si se saca un nmero de una urna, existe la opcin de reponer o no, el nmero en la urna antes de la
segunda extraccin. En el primer caso, el nmero puede salir una y otra vez, mientras que en el segundo
caso, esto pasara una vez. El muestreo en que cada miembro de la poblacin sera elegido ms de una vez,
se denomina MUESTREO CON REEMPLAZAMIENTO, mientras que si cada miembro no puede ser elegido
ms de una vez, se denomina MUESTREO SIN REEMPLAZAMIENTO.
Las poblaciones son finitas o infinitas. Si, por ejemplo, se extraen 10 bolas sucesivamente sin
reemplazamiento de una urna con 100 bolas, se hace un muestreo de una poblacin finita; mientras que si
Modelos Inferenciales - 2014

25

se lanza una moneda 50 veces y se cuenta el nmero de caras, el muestreo es de una poblacin infinita.
Una poblacin finita en la que se realiza un muestreo con reemplazamiento, puede considerarse
tericamente infinita, ya que es posible extraer cualquier nmero de muestras sin agotar la poblacin. Para
muchos propsitos prcticos, efectuar el muestreo de una poblacin finita muy grande, llega a tomarse como
muestreo de una poblacin infinita.

Guillermo Pastor. Estadstica Bsica. Editorial Trillas, Conalep. 1 Edicin 12 reimpresin enero 2003 .

DISEOS DE MUESTRAS:
Las clases de muestras que hasta ahora hemos estudiado, son las muestras aleatorias simples y nmeros
aleatorios y no hemos considerado la posibilidad, de que en ciertas condiciones, puede haber muestras que son
ms fciles de obtener, ms econmicas o ms informativas que las muestras aleatorias y no hemos entrado en
detalles sobre la pregunta de lo qu, podra hacerse, cuando el muestreo aleatorio es imposible.
Hay muchas otras maneras de seleccionar una muestra de la poblacin y hay gran cantidad de bibliografa
sobre el tema de los procedimientos del diseo del muestreo.
A continuacin estudiaremos brevemente, algunos diseos de muestras que no son ms que un plan
determinado, antes de recopilar cualquier dato, para tomar una muestra de una poblacin.
Modelos Inferenciales - 2014

26

2.1.2. MUESTREO SISTEMTICO:


En algunos casos, la manera ms prctica de efectuar un muestreo, consiste en seleccionar, digamos, cada
vigsimo nombre de una lista, cada decimosegunda casa de un lado de una calle y as sucesivamente.
Esto se conoce como muestreo sistemtico. En este caso, se divide la poblacin en subconjuntos de tamao
igual, segn la frmula que a continuacin analizaremos, despus se toma al azar, la unidad en la que se debe
comenzar, que ocupa el lugar K y el resto de los elementos de la muestra, ocupan los siguientes lugares.

Hagamos un ejemplo para comprender mejor este muestreo

Ejemplo: En una colonia de la ciudad de Jalisco, de 8060 habitantes segn el censo, se va a hacer una
encuesta, y se selecciona una muestra sistemtica de 20 personas, entre 1200 padres de familia, para conocer
el grado de aceptacin de la gestin administrativa de la ciudad, por parte del alcalde municipal.
Primero calculamos el factor de elevacin = N/n =1200/20 = 60 a continuacin seleccionamos un elemento,
AL AZAR, entre el 1 y el 60, supongamos que el seleccionado es el 27(este ser K), entonces, el primer
nmero ser 27; el segundo nmero ser 27+60= 87; el tercer nmero seleccionado ser 27+ 2(60) = 147; el
cuarto nmero 27+ 3(60)= 207 y as sucesivamente sern el 267, 327, 387, 447, 507, 567, 627, 687, 747, 807,
867, 927, 987, 1047, 1107, 1167. Se han seleccionado a 20 personas, a las que les corresponden los nmeros
citados.
Cuando el resultado de N/n no es entero, se redondea al entero menor, esto puede producir una pequea
dificultad que no afecta y debe despreciarse cuando n > 50.
El muestreo sistemtico es semejante al aleatorio simple, si se selecciona el elemento
inicial en forma aleatoria. Sus ventajas son: de fcil aplicacin y se extiende la muestra
a toda la poblacin. Sus desventajas son que se presentan dificultades al tratar de
calcular la varianza, y aumento de la varianza si existe periodicidad en la numeracin
de los elementos; adems, de posible presencia de periodicidades ocultas.

2.1.3. MUESTREO ESTRATIFICADO:


En este muestreo, la poblacin se divide en estratos homogneos internamente y lo ms heterogneos
externamente entre s.
Si tenemos informacin acerca de la constitucin de una poblacin (es decir, su composicin) y sta es
importante para nuestra investigacin, podemos mejorar el muestreo aleatorio por medio de la
ESTRATIFICACIN. Este es un procedimiento, que consiste en estratificar (o dividir) en un nmero de
subpoblaciones o estratos que no se traslapen y luego tomar una muestra de cada estrato. Si los artculos,
personas o cosas seleccionados de cada estrato constituyen muestras aleatorias simples, el procedimiento
completo (primero la estratificacin y luego el muestreo aleatorio) se conoce como muestreo aleatorio simple
estratificado.
Ejemplo, para analizar mejor este tipo de muestreo.
En una colonia con una poblacin aproximada de 17000 habitantes se sabe, segn el censo reciente, que 7800
son jvenes, 2950 de la tercera edad y 6250 son nios.
Calcular el tamao de la muestra de cada estrato, si se desea saber las preferencias de 300 personas, en sus
programas de televisin.

Modelos Inferenciales - 2014

27

Para las personas jvenes su clculo ser: 300 (7800/17000) = 300 (0.4588) = 138
Para la tercera edad: 300 (2950/17000) = 300 (0.1735) = 52
Para los nios: 300 (6250/17000) = 300 (0.3674) = 110
Suma total = 300
Se contina con el muestreo aleatorio, para seleccionar las personas de cada estrato que van a hacer motivo
de la investigacin.
La ventaja del muestreo estratificado, es que permite obtener informacin, sobre las caractersticas motivo
de estudio y aumenta la precisin de las estimaciones sobre toda de la poblacin; y en general, da mejores
resultados que el muestreo aleatorio, mientras ms diferentes sean los estratos entre s y sean ms
homogneos internamente.
Sus desventajas son: dificultad para decidir a qu estrato se asigna cada uno de los elementos de la poblacin
y cmo elegir el tamao de la muestra de cada estrato, para que el total sea n.

2.1.4. MUESTREO POR CONGLOMERADOS:


Esta tcnica tiene utilidad, cuando el universo que se requiere estudiar admite ser subdividido en universos
menores, de caractersticas similares a las del universo total. La poblacin se divide en reas, que se llaman
conglomerados; cada uno de stos, ser lo ms heterogneo posible internamente, y lo ms homogneo entre
s; a continuacin se selecciona, al azar, uno o algunos conglomerados, que forman la muestra.
Ejemplo: Para ilustrar esta clase de muestreo, supongamos que una gran empresa quiere estudiar los
diferentes gastos familiares, en el rea de Cartagena, Bolvar. Al intentar elaborar los programas de gastos de
1200 familias, la empresa encuentra que el muestreo aleatorio simple es prcticamente imposible.
Dado que no se cuenta con las listas adecuadas, y el costo de ponerse en contacto con las familias dispersas
en esta gran ciudad, es muy alto. Una manera en que se puede tomar una muestra de esta situacin, es
dividiendo el rea total de Cartagena, en varias reas ms pequeas que no se traslapen, digamos, manzanas,
regiones, sectores etc., de la ciudad; entonces se seleccionan algunas casas al azar, y todas las familias que
residen en estas manzanas, constituyen la muestra definitiva.
Este mtodo, se utiliza cuando resulta muy costoso elaborar una lista completa, de todos los
elementos de la poblacin. El inconveniente se presenta, cuando los conglomerados no son
homogneos entre s, ya que la muestra final, puede no ser representativa de la poblacin. Sin
embargo, tiene la ventaja de simplificar, el levantamiento de la poblacin
Tanto en el muestreo estratificado como en el de conglomerados, la poblacin se divide en grupos bien
definidos. Usamos el muestreo estratificado, cuando cada grupo tiene una pequea variacin dentro de s
mismo, pero hay una amplia variacin dentro de los grupos. Usamos el muestreo por conglomerados en el caso
opuesto: cuando hay una variacin considerable dentro de cada grupo, pero los grupos son esencialmente
similares entre s.

2.2 ERRORES AL MUESTREAR.


Recordemos que la muestra descansa, en el principio de que las partes representan al todo y, por tal, refleja las
caractersticas que definen a la poblacin de la cual fue extrada, lo cual nos indica, que es representativa. Es
decir, que para hacer una generalizacin exacta de una poblacin, es necesario tomar una muestra
representativa. Por lo tanto, la validez de la generalizacin, depende de la validez y tamao de la muestra.
Cuando trabajamos con muestras, generalmente se presentan dos tipos de errores:
Error sistemtico. Llamado de distorsin o sesgo de la muestra, se presentan por causas ajenas a la
muestra:
Situaciones inadecuadas: se presentan, por ejemplo, cuando el encuestador tiene dificultades para
obtener la informacin y la sustituye por la que ms fcilmente est a su alcance, que no siempre es la
ms confiable.
Modelos Inferenciales - 2014

28

Insuficiencia en la recoleccin de datos: hay distorsin por falta de respuestas, o respuestas


inadecuadas, ya sea por ignorancia o falta de datos relativos a los elementos incluidos. Distorsiones
del encuestador causadas por prejuicios, inters personal o por fallas en la aplicacin de instrumentos.
Errores de cobertura a causa de que no se han incluido elementos importantes y significativos para la
investigacin que se realiza.
Error de muestreo o muestral. Cualquiera que sea el procedimiento utilizado y la perfeccin del
mtodo empleado, la muestra diferir de la poblacin. A esta diferencia se la denomina error de
muestreo.
Cuando una muestra es aleatoria o probabilstica, es posible calcular sobre ella, el error muestral. Este
error, indica el porcentaje de incertidumbre, es decir, el riesgo que se corre que la muestra elegida no
sea representativa. Si trabajamos con un error calculado en 5%, ello significa que existe un 95% de
probabilidades de que el conjunto muestral, represente adecuadamente, al universo del cual ha sido
extrado.
A medida que incrementamos el tamao de la muestra, el error muestral tiende a reducirse, pues la
muestra va acercndose ms al tamao del universo. Del mismo modo, para una muestra determinada,
su error ser menor cuanto ms pequeo sea el universo a partir del cual se la ha seleccionado.
Ejemplo: As, para un universo de 10,000 casos, una muestra de 200 unidades tendr un error mayor
que una de 300; esto es; N =10,000 y n =200 por lo tanto su fraccin de muestreo n/N = 200 /10,000 =
0.02 y
N=10,000 y n =300 por lo que su fraccin de muestreo n/N = 300/10,000 = 0.03, por lo tanto la
fraccin de muestreo ms chica (0.02), ser la que tenga mayor error muestral.
De manera similar, si vara el tamao del universo con igual tamao de muestra, se confirma tambin la
anterior afirmacin; por ejemplo para una muestra de n=200 casos, se tendr un error mayor, si el
universo tiene 10,000 unidades, que si el universo posee solamente 2,000 unidades.
Hagamos los clculos, n =200 y N =10,000; la fraccin de muestreo es n/N = 0.02; en la otra poblacin
N = 2,000 y n = 200, n/N = 0.1 se confirma que la primera fraccin de muestreo que es la ms chica,
tendr un error de muestreo mayor, ya que disminuy el universo de la poblacin, con una misma
muestra.
Para fijar el tamao de la muestra adecuado a cada investigacin, es preciso primero determinar el
porcentaje de error que estamos dispuestos a admitir.
Una vez hecho esto, debern realizarse las operaciones estadsticas correspondientes, para poder
calcular el tamao de la muestra, que nos permite situarnos dentro del margen de error aceptado.
Dichos clculos se estudiarn en otro apartado; sin embargo, si el tamao de la muestra queda
determinado previamente por consideraciones prcticas; no hay otra alternativa que aceptar el nivel de
error, que su magnitud acarree.

Modelos Inferenciales - 2014

29

A continuacin resuelve las siguientes actividades de aprendizaje para que reafirmes lo aprendido hasta el
momento
ACTIVIDADES DE APRENDIZAJE:
Contesta las siguientes preguntas?
1. Escribe el nombre y smbolo de los dos principales parmetros de la poblacin, as como sus dos estadsticos de la
muestra.
2. Cuntas muestras distintas de tamao n = 4, podemos escoger de una poblacin finita de tamao N = 30?
Respuesta: _________
3. Cuntas muestras distintas de tamao n =3, podemos tomar de una poblacin finita de tamao N = 110?,
Respuesta: _________
4. Cules son los tipos de errores que se pueden cometer cuando se trabaja con muestras?
___________________________ y ______________________ explcalos brevemente con tus palabras.
5. Asigna a cada uno de los integrantes de tu grupo un nmero y utiliza la Tabla N1 de nmeros aleatorios, a partir del
elemento 21 de la sexta columna hacia la derecha determina una muestra aleatoria de seis estudiantes. Realiza tus
clculos.
6. De los nmeros asignados en el ejercicio anterior, ahora a partir del 14 elemento de la primera columna hacia abajo
determina una muestra aleatoria de cuatro estudiantes.
7. Escribe que entiendes por MUESTREO ALEATORIO SIMPLE: __________________________________

8. Elabora un mapa conceptual o esquema, con los principales conceptos hasta aqu estudiados.
9. De la lista de tus compaeros del grupo, anota en un pedazo de papel el nmero que corresponde a cada uno de ellos.
Mezcla bien todos los papelitos en una caja o urna y extrae sin reemplazamiento 6 estudiantes para un muestra aleatoria
simple. Anota aqu tu resultado.
__________________
_________________
_________________
__________________
_________________
_________________
10. De la misma manera que el ejercicio anterior, Extrae una muestra aleatoria simple de 5 estudiantes con
reemplazamiento. Anota aqu tus resultados.
__________________
_________________
_________________
__________________
_________________
11. En la colonia 2 de agosto de Turbaco, de 1980 habitantes, se pretende realizar una encuesta y seleccionar a 16
personas entre 180 seoras, para conocer el grado de aceptacin de un nuevo producto de limpieza. De acuerdo al tipo de
muestreo sistemtico, calcula, cules sern las 16 personas seleccionadas para ser entrevistadas?
Realiza tus clculos.
12. A medida que se incrementa el tamao de la muestra, Se incrementa el error muestral?
SI___
NO____
Porque? _______________________________________________________
13. Observa detenidamente los siguientes datos y contesta Cul tendr mayor error muestral?
Poblacin 1 Universo (N = 350) y Muestra (n = 150)
Poblacin 2 Universo (N = 350) y Muestra (n = 250)
Qu poblacin tiene mayor error muestral? __________
14. Poblacin 1 N = 70 y n = 15
Poblacin 2 N = 800 y n = 150
Qu poblacin tiene mayor error muestral? ____________

Modelos Inferenciales - 2014

30

2.3. DISTRIBUCIONES MUESTRALES.


El concepto de distribucin muestral, es el concepto ms bsico de la inferencia estadstica y se puede definir
como una distribucin de probabilidad, que consta de todos los valores posibles de un estadstico de la
muestra de tamao n (con o sin remplazo). En cada muestra, se suele calcular un estadstico, como la media o
la desviacin estndar, que vara de una muestra a otra. De esta forma se obtiene una distribucin del
estadstico denominada distribucin muestral.
Si por ejemplo, el estadstico utilizado es la MEDIA MUESTRAL, entonces la distribucin se llama distribucin
del muestreo de medias o distribucin muestral de la media. De forma similar, se puede obtener distribuciones
mustrales de las desviaciones estndar, las varianzas, las medianas, etctera.

2.3.1.

DISTRIBUCIN MUESTRAL DE MEDIAS:

Con el propsito de familiarizarnos con la forma de estudiar estos problemas, analizaremos un caso muy
simple.
Ejemplo: Supongamos que tenemos una poblacin de N = 5 nios y que la nuestras son de tamao n = 2.
(Es claro que para un problema de este tamao simplemente tomamos las alturas de los cinco nios, las
sumamos, dividimos entre 5 y se acab)
El objetivo de ste anlisis, es entender algunos aspectos importantes de la distribucin muestral de medias a
travs de este ejemplo.

Nio
Altura

1
1.20

2
1.18

3
1.32

4
1.23

5
1.28

La media poblacional de las alturas es:

y su desviacin estndar poblacional es:

Ahora Cuntas muestras posibles hay en una poblacin ( N ) de 5 nios y queremos muestras ( n ) de
tamao 2, sin reemplazo? O dicho de otra manera, Cules son todas las muestras de tamao igual a 2, que
pueden obtenerse sin reemplazo de la poblacin de 5 nios?
Como es sin reemplazo, hay un total de 5C2 = (5) x (4)/ 2! = 10 muestras posibles.
Que son los NIOS: {1,2}, {1,3}, {1,4}, {1,5}, {2,3}, {2,4}, {2,5}, {3,4}, {3,5}, {4,5}.
Estas 10 muestras posibles, se pueden observar en la siguiente tabla

Modelos Inferenciales - 2014

31

Para cada una de estas muestras, tenemos una media .


Por ejemplo, para la muestra {1,2}, su media es = (1.20 + 1.18) / 2 = 1.19 y para la muestra {3,5} su media es
= (1.32 + 1.28)/2 =1.30, etc. Segn se muestra en la siguiente tabla de medias.

Ahora calculemos dos aspectos importantes de esta variable aleatoria, como son la MEDIA Y LA DESVIACION
ESTANDAR de la distribucin muestral de medias.
La media que denotamos por
las medias de cada muestra.

Su frmula es:

la llamamos MEDIA DE LA DISTRIBUCION MUESTRAL que es la media de

Resultado es igual a la media poblacional obtenida.

Esto es, LA MEDIA DE LA POBLACION, ES IGUAL A LA MEDIA DE LA DISTRIBUCION MUESTRAL DE


MEDIAS (1.24)

Modelos Inferenciales - 2014

32

Ahora, la desviacin estndar, que denotamos y llamaremos ERROR ESTANDAR DE LA MEDIA, que es
la desviacin estndar de la distribucin muestral de medias; Calculemos, siguiendo los datos de la tabla y
posteriormente analizaremos otra manera ms fcil.
ERROR ESTNDAR DE LA MEDIA
Muestra
(1,2)
(1,3)
(1,4)
(1,5)
(2,3)
(2,4)
(2,5)
(3,4)
(3,5)
(4,5)
Total

Media

Medias al Cuadrado

1.19
1.26
1.215
1.24
1.25
1.205
1.23
1.275
1.30
1.255
12.45

1.4161
1.58761
1.476225
1.5376
1.5625
1.452025
1.5129
1.625625
1.69
1.575025
15.4356

Con los datos anteriores, podemos utilizar una formula y obtener el error estndar de la media que es:

Hasta aqu, hagamos un espacio de reflexin:


Hay dos resultados muy importantes, que describen la distribucin de la variable aleatoria de la distribucin
muestral de medias.
El primero de ellos nos dice, que la media de la distribucin muestral de medias, siempre coincide con la media
de la poblacin y que el error estndar de la media, es siempre menor que la desviacin estndar de la
poblacin, o igual a ella, si la dividimos entre la raz cuadrada del tamao de la muestra. Ms precisamente:
Si tomamos muestras de tamao n de una poblacin de tamao N con media y desviacin estndar
simbolizan la media y la desviacin estndar de la distribucin muestral de medias por
respectivamente, entonces:

, y se
y

Para el ejemplo que venimos desarrollando, utilizaremos la ltima frmula para estimar la desviacin estndar
de las medias muestrales o el error estndar de la media.

Coincide con el valor que obtuvimos antes para la desviacin estndar de la distribucin muestral de medias.
Modelos Inferenciales - 2014

33

Pero es preciso indicar que el factor

de la segunda formula, se conoce como factor de correccin de

la poblacin finita (cpf), ya que sin este, las dos frmulas (para poblaciones infinitas y finitas) son las mismas.
Una regla de uso muy frecuente, establece que el factor de correccin de poblacin finita (cpf), se puede pasar
por alto cuando n/N es menor o igual a 0.05, esto es, cuando la muestra contiene el 5% o menos de la
poblacin.
Por lo tanto, si la poblacin es infinita; o el muestreo se hace de una poblacin infinita con reemplazamiento; o
cuando N > 20n la frmula para encontrar el error estndar se reduce a

Para encontrar el error estndar de la media cuando la poblacin es finita y el muestreo se hace sin reemplazo;
o cuando N< 20n es:

ACTIVIDADES DE APRENDIZAJE:
Contesta adecuadamente las siguientes preguntas y completa los espacios correctamente:

El tamao de la muestra se denota cmo?________________________________

El tamao de la poblacin se denota cmo?_______________________________

La media poblacional se denota cmo?___________________________________

La desviacin estndar poblacional se escribe cmo?________________________

La media de la distribucin muestral de medias se denota?____________________

El error estndar de la media se denota cmo? _____________________________

En una distribucin muestral de medias:


La frmula de la media de la distribucin muestral de medias es: ___________________________________
y su resultado es: _______________________ a la media poblacional.
(Igual o diferente)

Modelos Inferenciales - 2014

34

En cambio el error estndar de la media es:____________________, que la desviacin estndar poblacional


(Igual o diferente)
Son dos frmulas para calcular el error estndar de la media
(1) Para poblaciones ______________o muestreo ________________ su frmula es _________________
(Finitas o infinitas)
(Con o sin reemplazo)
(2) Para poblaciones _______________o muestreo _______________ su frmula es __________________
(Finitas o infinitas)
(Con o sin reemplazo)
Cuando N > 20n se utiliza la frmula _________________

para poblaciones______________

Cuando N < 20n se utiliza la frmula _________________

para poblaciones______________

Realiza un esquema, mapa conceptual, o formulario con los anteriores conceptos y frmulas, para que las
tengas a la mano y las utilices posteriormente.

2.4. ERROR ESTNDAR O TPICO:


Como se seal en el ejemplo anterior, en lugar de decir "la desviacin estndar de la distribucin de las
medias de la muestra" nos referimos al error estndar de la media. De manera similar, la "desviacin estndar
de la distribucin de las proporciones de la muestra" se abrevia como error estndar de la proporcin.
El trmino error estndar se utiliza porque da a entender que la variabilidad en los estadsticos de la muestras,
provienen de un error de muestreo debido al azar; es decir, hay diferencias entre cada muestra y la poblacin,
y adems entre las diversas muestras debido nicamente a los elementos que decidimos escoger para las
muestras. Por lo tanto, mide el grado en el que se puede esperar que flucten o varen los estadsticos de una
muestra como consecuencia del azar, pero no solo mide el error de azar que se ha cometido, sino tambin la
probable precisin que obtendremos si utilizamos una estadstica de muestra para estimar un parmetro de
poblacin.

Si el error estndar es bajo, hay buenas posibilidades de que el estadstico de una muestra se
aproxime al de la poblacin; en cambio.

Si el error estndar es alto es ms probable que obtengamos una muestra que difiera
considerablemente de la poblacin..

Ejemplo: Supngase que la estatura de 3000 estudiantes universitarios hombres, se distribuye normalmente,
con una media de 68 pulg. y una desviacin estndar de 3 pulg. Si se obtienen 80 muestras de 25 estudiantes
cada una.
Cules seran las medias y las desviaciones estndar (error estndar) esperadas de la distribucin
muestral de medias, si los muestreos se hubieran hecho:
a) Con reemplazamiento y
b) sin reemplazamiento?
El nmero de muestras de tamao 25 ue podran obtenerse tericamente de un grupo de 3,000 estudiantes
con reemplazamiento es de (3000)25 = 8.47x1086 y, sin reemplazamiento es de 3000C25=4.91x1061 que son
mucho mayores que 80.

Modelos Inferenciales - 2014

35

Por tanto, no se obtiene una verdadera distribucin muestral de medias, sino slo una distribucin muestral
terica. Por tanto

a)- Con reemplazamiento x =

b)- Sin reemplazamiento x =

= 68 pulg y

= 68 pulg y

Este ltimo resulto, es solo ligeramente menor que 0.6 pulg. y puede, para propsitos prcticos, considerarse
igual que el muestreo con reemplazamiento.
Por lo tanto, se esperara que la distribucin muestral de media este distribuida aproximadamente de manera
normal, con media de la distribucin muestral = 68.0 pulg, y el error estndar de la media = 0.6 pulg.

2.5 TEOREMA DEL LMITE CENTRAL


La relacin entre la forma de la distribucin de la poblacin y la forma de la distribucin de muestreo se
denomina teorema del lmite central, que es tal vez, el teorema ms importante de toda la inferencia
estadstica; su importancia radica en que nos permite usar los estadsticos de la muestra, para hacer inferencias
con respecto a los parmetros de poblacin, sin saber nada sobre la forma de la distribucin de frecuencias de
esa poblacin, ms que lo que podamos obtener de la muestra.
El teorema del lmite central, nos permite el empleo de la distribucin normal en una amplia variedad de
problemas; an, cuando la variable en estudio no tenga distribucin normal, o su distribucin sea desconocida.
Si el nmero de elementos de la muestra es suficientemente grande, por aplicacin del Teorema del Lmite
Central, la media aritmtica igualmente va a tener aproximadamente distribucin normal.
TEOREMA DEL LMITE CENTRAL:
Si n es grande, la distribucin muestral de las medias puede aproximarse a una distribucin normal, sin
importar la forma de la distribucin de la poblacin.
Aun cuando no especifica que tan grande debe ser el tamao de la muestra n, para poder aproximar la
distribucin muestral por una distribucin normal, una buena regla es que basta que n sea mayor o igual a
30, o sea, n 30.
Otro aspecto importante, es que para convertir cualquier variable aleatoria normal, en una variable aleatoria
normal estndar, debemos sustraer la media de la variable que se est estandarizando y dividir el resultado
entre el error estndar (la desviacin estndar de dicha variable), segn la siguiente frmula, donde z = son las
unidades estndar.
Anlogamente, tambin podemos utilizar
la frmula

Modelos Inferenciales - 2014

36

Siguiendo el mismo ejercicio de los 3000 estudiantes universitarios que se distribuyen normalmente con una
media =68.0 pulg y desviacin estndar
pul y donde calculamos un error estndar de la media
= 0.6 pulg. Ahora las preguntas sern
En cuntas muestras de las 80 del anterior problema, esperaramos encontrar la media
- a) entre 66.8 y 68.3 pulg y tambin
- b) Menor que 66.4 pulg.?
La media

de una muestra en UNIDADES ESTANDAR est dada aqu por:

a) Cuantas muestras hay entre 66.8 y 68.3 pulgadas? O


P (66.8 Z < 68.3 )
66.8 en unidades estndar = 68.8 68.0 = -2.0
0.6
68.3 en unidades estndar = 68.3 68.0 = - 0.5
0.6
La proporcin de muestras con media entre 66.8 y 68.3 pulg es
igual al rea bajo la curva normal entre Z = -2.0 y Z = 0.5, esto
es igual al (rea entre Z = - 2.0 y Z = 0) + mas (rea entre Z = 0
y Z = 0.5 ).
Buscamos los valores en la tabla rea bajo la curva normal
estndar y encontramos ue para 2 = 0.4772 y para 0.5 = 0.1915
Sumamos los dos valores = 0.6687 = 66.87 % y entonces
finalmente, el nmero esperado de muestras es:
( 80 ) (0.6687) = 53.496 o 53 muestras.
b) Cuantas muestras son menor que 66.4 pulg. o P (Z < 66.4 )
66.4 en unidades estndar = 66.4 68.0 = - 2.67
0.6
La proporcin de muestras con medias menores
que 66.4 pulg. = (rea bajo la curva normal a la
izquierda de Z = - 2.67 ) = ( rea a la derecha de
Z = 0 ) menos ( rea entre Z = 2.67 y Z = 0 ) =
0.5 0.4962 = 0.0038 = 0.38%
Por lo tanto, el numero esperado de muestras
es (80)(0.0038)= 0.304 o cero muestras

Con base en el teorema del lmite central. Cul es la probabilidad de que el error de una variable aleatoria sea
menor que 5, cuando se usa la media de una muestra aleatoria de tamao n = 64 para estimar la media de una
poblacin infinita con = 20?
Aunque el valor de es desconocida, sabemos que la distribucin muestral de las medias es normal con la
media poblacional . Por lo tanto, la probabilidad se obtiene por medio del rea de la zona bajo la curva de
normal estndar, entre

Modelos Inferenciales - 2014

37

Dado que la entrada de la tabla corresponde a Z = - 2.00 es 0.4772 y Z = 2.00 es 0.4772 la probabilidad que se
pide es 0.4772 + 0.4772 = 0.9544
Entonces afirmamos, la probabilidad de que una media de una muestra aleatoria de tamao n=64 de la
poblacin infinita con
, difiera de la poblacin por menos de 5 es de 0.9544 o el 95.44 %

SIGUE PRACTICANDO OTROS PROBLEMAS, Y TE RECOMENDAMOS QUE INGRESES A LA PAGINA


INTERACTIVA DE INTERNET. http://descartes.cnice.mec.es/ del ministerio de educacin y ciencia de Espaa,
modalidad de humanidades y ciencias sociales, en el tema, Distribucin Normal e inferencia estadstica.

ACTIVIDADES DE APRENDIZAJE:
Con el propsito que reafirmes lo aprendido, contesta utilizando tus palabras y criterio las siguientes
preguntas
1. Explica brevemente qu entiendes por distribucin muestral?
Respuesta: ______________________________________________________________________________
_______________________________________________________________________________________

2. Qu estudiamos cuando analizamos una distribucin muestral de medias?


Respuesta: ______________________________________________________________________________
_______________________________________________________________________________________

Modelos Inferenciales - 2014

38

3. Cul es el nmero de muestras de tamao 5, que podran obtenerse de un grupo de 200 estudiantes, con
reemplazo y sin reemplazo? Realiza tus clculos aqu. Por favor.
Con reemplazo: _________
Sin reemplazo: __________

4. Cul es el nmero de muestras de tamao 4, que podran obtenerse de un grupo de 30 personas, con
reemplazo y sin reemplazo?
Con reemplazo: __________
Sin reemplazo: __________

5. Qu es lo que mide el error estndar en una distribucin muestral de medias?


Respuesta: _____________________________________________________________________________
_______________________________________________________________________________________

6. Si el error estndar es bajo o alto que nos sugiere?


Si es bajo indica: ______________
Si es alto indica: ___________________

7. Que nos indica el teorema del lmite central?


Respuesta:______________________________________________________________________________
Resuelve adecuadamente los siguientes problemas.
8. Una poblacin consiste de cinco nmeros 2, 3, 6, 8 y 11. Considere todas las muestras de tamao igual a 2
que pueden obtenerse, con reemplazamiento y sin reemplazamiento, a partir de estas poblaciones. Calcule a)
la media de la poblacin, b) la desviacin estndar de la poblacin, c) la media de la distribucin muestral de
medias, y d) la desviacin estndar de la distribucin de medias, es decir, el error estndar de medias.
9. Quinientos baleros de rodamiento tienen un peso medio de = 5.02 g y una desviacin estndar de = 0.30
g., de una muestra aleatoria de n = 100 baleros de rodamiento elegida de este grupo. Calcula la probabilidad
de que, el peso combinado est entre 496 y 500 g, si el peso medio de los 100 baleros, est entre 4.96 y 5.00 g
y la probabilidad de que el peso combinado exceder 510 g, si el peso medio de los 100 baleros excede 5.10 g.

Modelos Inferenciales - 2014

39

UNIDAD 3: ESTIMACION ESTADISTICA


Contenido temtico
Propsito del contenido temtico
Conceptos fundamentales
Conceptos subsidiarios
Nmeros de sesiones

Teora de Estimacin Estadstica


Analizar los conceptos de la teora de la estimacin estadstica, para que el
estudiante los utilice durante el desarrollo de trabajos estadsticos
inferenciales.
Intervalos de confianza
Intervalos de confianza de parmetros poblacionales: Intervalos de
confianza para medias e Intervalos de confianza para proporciones.
1 (semana) con alto porcentaje de estudio independiente

ACTIVIDADES DE APERTURA
Te invitamos a que reflexiones un momento sobre el tema de las RELACIONES
HUMANAS y la difcil tarea de tomar decisiones. Contesta honestamente
Cules son las personas que ms respetas y por qu?
Cules son las personas que menos toleras y por qu?
Por qu son importantes las relaciones humanas en la toma decisiones?

OBSERVACIN
Es conveniente un tiempo
aceptable para desarrollar
esta importante
introduccin.
Integrarse en equipos de
3 estudiantes.

ACTIVIDADES DE DESARROLLO
1. Consultar la presente gua didctica, en los temas correspondientes a:
Estimacin de parmetros.
Estimacin sin sesgo.
Estimacin puntual y estimacin por intervalos.
Estimacin por intervalos de confianza de los parmetros poblacionales:
para medias y de proporciones.
Error probable o error mximo y Tamao de la muestra.
2. Investigar de manera personal, otras fuentes de informacin a tu alcance para
enriquecer tus conocimientos de los temas antes mencionados.
3. Integrado en equipos de tres compaeros, comenten las estrategias para la
solucin de las preguntas antes sealadas.
4. Realicen esquemas, lminas, o presentaciones para su exposicin grupal en
el aula.

Consultar la presente
gua didctica para
argumentar su solucin y
otras bibliografas.

ACTIVIDADES DE CIERRE
En reunin plenaria, expondrn ya sea con, lminas, o presentaciones
PowerPoint; las vas de solucin que se hayan encontrado a dichos
preguntas.
En la plenaria, encontraras la solucin ms idnea entre todo el grupo.
De manera respetuosa podrs solicitar a todo el grupo, te disipen algunas
dudas que tengas respecto al tema y a la solucin del problema en general.
El tutor propiciar la exposicin libre de las emociones y sentimientos generados
durante el desarrollo del tema.

El cierre se har en dos


fases
1ra. Sobre las relaciones
humanas
2da. Sobre el problema
estadstico

BIBLIOGRAFA, CIBERGRAFIA Y OTRAS FUENTES DE INFORMACIN


Estadstica y Muestreo. Ciro Martnez Bencardino, Ecoe Ediciones, Novena Edicin. Eco Ediciones, Novena
Edicin.
Chao Lincoln. (1992). Introduccin a la estadstica. Editorial McGraw Hill Interamericana. Mxico.
Texto Estadstica Aplicada a los Negocios y la Economa. Decimotercera Edicion. McGrawHill. Autores Lind,
Douglas A., Marchal, William G., Wathen, Samuel A.
http://recursostic.educacion.es/descartes/web/aplicaciones.php?bloque=4
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Muestreo_Inferencia_Estadistica/estimacion_puntual.html
http://recursostic.educacion.es/descartes/web/materiales_didacticos/inferencia_estadistica/estimac.htm

Modelos Inferenciales - 2014

40

3. TEORIA DE ESTIMACIN ESTADSTICA


Hay dos tipos de inferencia estadstica; la estimacin y la verificacin de hiptesis; en este tema (teora de la
estimacin estadstica) vamos a estudiar los conceptos y tcnicas fundamentales de la estimacin de
intervalos y en el apartado siguiente (teora de la decisin estadstica), analizaremos los principios
indispensables para la verificacin o prueba de hiptesis.
3.1. ESTIMACIN DE PARMETROS
En el tema anterior, se revis la manera en que la teora de muestreo puede emplearse para obtener
informacin acerca de las muestras obtenidas aleatoriamente de una poblacin conocida. Tambin
observamos, cmo la desviacin estndar de la poblacin y el tamao de la muestra, determinan la variabilidad
de la distribucin muestral de la medias, ya que entre menor sea el error estndar de la media, mejor ser
nuestra estimacin. Un problema que consideraremos en este tema, es el de la estimacin de parmetros
poblacionales o simplemente parmetros, como la media y la desviacin estndar, a partir de los estadsticos
muestrales correspondientes o tambin llamados estadsticos, como la media y la desviacin estndar
muestrales.
3.2. ESTIMADOS SIN SESGO Y EFICIENTE
Si la media de la distribucin muestral de un estadstico, es igual al parmetro poblacional correspondiente, el
estadstico se denomina estimador sin sesgo (insesgado) del parmetro; de otra manera, es denominado
estimador sesgado. La media de la distribucin muestral de las medias es = , la media poblacional.
Por lo tanto la media muestral es un estimado sin sesgo de la media poblacional . Si las distribuciones
muestrales de dos estadsticos tienen la misma media, entonces el estadstico con la MENOR varianza o
desviacin estndar, se denomina estimador eficiente de la media, mientras que el otro estadstico, se llama
estimador ineficiente.
Si se consideran todos los estadsticos posibles, cuyas distribuciones muestrales tienen la misma media; aqul
con la menor varianza o desviacin estndar, suele denominarse el mejor o ms eficiente estimador de dicha
media.

3.3. ESTIMACIN PUNTUAL Y ESTIMACIN POR INTERVALO


El estimado de un parmetro poblacional dado por un solo nmero, se denomina estimado puntual del
parmetro. El estimado de un parmetro poblacional dado por dos nmeros, entre los cuales, se considera que,
est el parmetro, se denomina estimado por intervalo del parmetro. Los estimados por intervalo, indican la
precisin de un estimado y son, por lo tanto, preferibles al estimado puntual. Si se dice que una distancia es de
5.28 metros, se est dando un estimado puntual. Si por otro lado, la distancia es de 5.28 0.03 metros, es
decir, la distancia est entre 5.25m y 5.31m, se est dando un estimado por intervalo. La informacin sobre el
error (o precisin) de un estimado, se conoce como su confiabilidad.
3.4. ESTIMACIN POR INTERVALOS DE CONFIANZA DE LOS PARMETROS POBLACIONALES
En este apartado nicamente vamos a analizar dos parmetros poblaciones, los intervalos de confianza para
medias y los intervalos de confianza de proporciones
Sean s y s la media y la desviacin estndar (error estndar), en ese orden, de la distribucin muestral de un
estadstico. Entonces, si la distribucin muestral es en forma aproximada a la normal (lo cual es verdadero para
muchos estadsticos, si el tamao de la muestra es N =30), se puede esperar encontrar un estadstico muestral,
real que caiga en los intervalos.

Modelos Inferenciales - 2014

41

Debido a lo anterior, se llaman intervalos de confianza a 68.26%, 95.44% y 99.74% de estimacin para s.
Los nmeros extremos de estos intervalos, se denominan lmites de confianza. De forma similar, S 1.96 s
y S 2.58 s son los lmites de confianza a 95% y 99%, o (0.95 y 0.99) de S. El porcentaje de confianza suele
denominarse nivel de confianza.
Las cifras 1.96, 2.58, etctera, en los lmites de confianza; se llaman coeficientes de confianza o valores
crticos y se denotan por Zc. A partir de los niveles de confianza se pueden calcular los coeficientes de
confianza y viceversa.
En la tabla siguiente se muestran algunos de los valores crticos de Zc, correspondientes a diversos niveles de
confianza. Los valores de Zc, para los niveles de confianza, no incluidos en la tabla, pueden obtenerse en la
tabla reas bajo la curva normal estndar.
Completar la tabla, ejemplo: 95%/2 = 47.5 / 100 = 0.475 en la tabla Zc = 1.96
Nivel de
confianza
Zc
Nivel de
confianza
Zc

99.73%

99%

98%

96%

95.45%

2.575

95%

90%

1.96

1.645

80%

68.27%

50%

99.73%

99%

98%

96%

95.45%

95%

90%

80%

68.27%

50%

3.00

2.575

2.33

2.06

2.00

1.96

1.645

1.28

1.00

0.68

Si queremos un intervalo de 90% de confianza, tenemos 1 = 0.90, y el valor correspondiente a un rea


central de 0.90 en la distribucin normal estndar es de Z= 1.645 segn se indica en la tabla y la figura
siguiente.

Denotamos con la letra griega (alfa) a la probabilidad con la que estamos dispuestos a cometer error (=0.10);
entonces, no cometer el error o confiabilidad ser: 1- (0.90), recordando que la probabilidad de un evento ms
la probabilidad de su complemento, es igual a 1; dicho de otra manera, como se ha definido como la
probabilidad de cometer el error y la probabilidad del evento complementario a este, es la probabilidad de NO
cometer error, esto es, la confiabilidad, entonces se tiene que la suma de estos eventos complementarios es 1.

Modelos Inferenciales - 2014

42

Resolvamos un problema para analizar y resumir lo dicho hasta el momento


Intervalos de confianza para medias:
En la zona metropolitana de la ciudad de Mxico, se tom una muestra de 30 lecturas del nivel de ozono
durante cierto periodo invernal. En la tabla siguiente tenemos estas lecturas:
178
193
246

190
203
227

228
215
211

211
226
195

187
231
202

165
209
212

172
220
219

244
258
216

229
278
204

208
235
193

La media de esta muestra es


=213.5 inmecas. Si sta es la nica informacin que tenemos, podemos
emplear este valor como una estimacin de la media del nivel de ozono en la zona durante la poca invernal.
Una estimacin as es llamada una estimacin puntual pues consiste de un nico nmero o punto de la recta
real.
Este tipo de estimacin puntual no brinda informacin sobre el tamao del error. Una alternativa que brinda ms
informacin, consiste en estimar la media por medio de un intervalo o aquellos nmeros reales que se
encuentran entre dos valores o lmites del intervalo.
El teorema del lmite central nos permite entonces asociar a un intervalo alrededor de nuestro valor
de = 213.5, una probabilidad o grado de certidumbre de que la media que estimamos se encuentre
efectivamente entre estos lmites.
Cuando no se tiene mayor informacin acerca de la desviacin estndar de la poblacin , y n es grande (n
30) podemos sustituir por la desviacin estndar de la muestra S. En nuestro problema tenemos que la
desviacin estndar, como se trata de una muestra, est dada por

Si la poblacin es grande en relacin al tamao de la muestra (N>20n), el tamao de la muestra es mayor o


igual que 30 y si el muestreo se lleva a cabo a partir de una poblacin infinita o de una poblacin finita con
remplazamiento, el intervalo de confianza para de grado de confianza es:

Si el muestreo se realiza sin remplazamiento de una poblacin finita.


Donde el rea de la curva normal estndar entre 0 y Zc es /2, esto es, con un grado de confianza el error al
estimar la media () por es menor a.

Una estimacin por intervalo o un intervalo de confianza consta de 3 partes (primera ecuacin); que
estimador, Zc es el factor de confiabilidad y

es el

que es el error tpico del estimador y en la segunda ecuacin

incluye, el factor de correccin finita

Modelos Inferenciales - 2014

43

Los grados de confianza que ms emplearemos son 0.95 y 0.99 y sus correspondientes coeficientes de
confianza o valores crticos Zc que son 1.96 y 2.575, respectivamente. A estos intervalos, tambin se les
conoce, como los intervalos de confianza del 95% y 99%.
Para encontrar los intervalos de confianza al 95% de confianza, en el caso del nivel de contaminacin de ozono
tenemos:

213.5 1.96. (4.54) = 213.5 8.90 = 204.60 y


213.5 + 1.96. (4.54) = 213.5 + 8.90 = 222.40
por lo que el intervalo de confianza del 95% es 204.60 < < 222.40 por lo tanto.
Con una probabilidad de 0.95 la media poblacional se encuentra entre 204.60 y 222.4 o bien, que con un
grado de confianza del 95% el error al estimar la media como 213.5 es menor a 8.9 Analicemos ms
detenidamente esto ltimo.

3.5. ERROR PROBABLE O ERROR MAXIMO Y TAMAO DE LA MUESTRA


ERROR PROBABLE O MXIMO: La expresin.

Representa el error probable o mximo al estimar

la media poblacional () con grado de confianza , y puede ser usada para determinar el tamao de la
muestra, cuando se desea cierto grado de precisin; esto lo analizaremos un poco ms adelante.
Por lo tanto, el Error mximo del nivel de contaminacin de ozono al 95% de confianza es:

Si se aumenta el grado de confianza, aumentar el error mximo al estimar la media.


Seguimos practicando con los intervalos de confianza
Si deseamos aumentar el grado de certeza al 99% Cul ser el intervalo de confianza y su error probable?

213.5 2.575.(4.54)= 213.5 11.69 = 201.81 y 213.5 + 2.575.(4.54)=213.5 + 11.69 = 225.19.


El error probable o mximo al estimar la media con 99% de confianza, es de 11.69
Los intervalos de confianza a un 99% es de 201.81< < 225.19.
Observamos, que entre mayor sea la certidumbre (grado de confianza), mayor es tambin el intervalo. Por lo
tanto, podemos afirmar que con una probabilidad de 0.99, la media poblacional se encuentra entre 201.81 y
225.19. y con un grado de confianza del 99%, el error al estimar la media como 213.5 es menor a 11.69.
Ejemplo: Para comprender y aprender mejor este tema
Una regin agrcola consta de 200 000 hectreas donde se siembra trigo. Para estimar la produccin media por
hectrea, se realiza una muestra de 900 hectreas que tuvieron en promedio una productividad de = 3.4
toneladas. La SAGARPA estima que la que la desviacin estndar de la productividad del trigo en la regin es
de = 0.8 Toneladas. Cul es la probabilidad de que nuestra estimacin de la produccin media en la
regin, tenga un error de a lo ms 0.05 toneladas?

Modelos Inferenciales - 2014

44

Consideremos de nuevo el ejemplo del captulo anterior de la regin agrcola de 200,000 hectreas, donde se
siembra trigo. Se realiz una muestra de 900 hectreas, con una productividad media de = 3.4 toneladas y
donde la desviacin estndar de la productividad del trigo, es de = 0.8 toneladas.
Obtengamos los intervalos de confianza de 90%, 95% y 99% y sus errores mximos
Como el nmero total de hectreas (200,000, N > 20n) es muy grande podemos emplear la frmula

Para obtener el intervalo de confianza del 90%, debemos encontrar el valor de Zc (de la tabla reas bajo la
curva normal estndar), que corresponde a 90/2 (dos colas)= 0.45 que es Zc = 1.645 debido a que 0.4495 =
1.64 y 0.4505 = 1.65 la parte media ser 0.45 =1.645. Por lo tanto, los intervalos al 90 % de confianza sern
3.4 1.645.(0.0267) = 3.4 0.0439 = 3.36 y 3.4 + 1.645. (0.0267) = 3.4 + 0.0439 = 3.44
El intervalo de confianza al 90% es 3.36 < < 3.44 y su error mximo de 0.0439
Como ya sabemos el valor de Zc=1.96 para el nivel de confianza de 95 %, por lo tanto, sus intervalos de
confianza sern

3.4 1.96. (0.0267) = 3.4 0.0523 = 3.35 y


3.4 + 1.96. (0.0267) = 3.4 + 0.0523 = 3.45
El intervalo de confianza al 95% es 3.36 < < 3.44 y su error mximo de 0.0523
Finalmente y como ya sabemos, el valor de Zc = 2.575 para el nivel de confianza de 99 %, por lo tanto, sus
intervalos de confianza sern

3.4 2.575. (0.0267) = 3.4 0.0688 = 3.33 y


3.4 + 2.575. (0.0267) = 3.4 + 0.0688 = 3.47
El intervalo de confianza al 99% es 3.33 < < 3.47 y su error probable de 0.0688
TAMAO DE LA MUESTRA: Como se indic anteriormente, la expresin.

Representa el error

mximo al estimar la con un grado de confianza media poblacional (), por x y puede ser usada, para
determinar el tamao de la muestra, cuando se desea cierto grado de precisin.
Para comprender mejor, resolvamos un problema de un fabricante de llantas:
Un Fabricante de llantas, desea determinar la vida promedio de cierto tipo de llantas, con un grado de certeza
del 99% y con un error menor a 1000 Km. Por estudios previos, el fabricante sabe, que la desviacin estndar
para este tipo de llantas es de 3000 Km. Qu tan grande debe ser la muestra?
Si E, es el error mximo o error probable, entonces

y como deseamos

Que E sea menor de 1000, obtenemos la ecuacin

, que al resolver da

Modelos Inferenciales - 2014

)(

45

Para obtener el valor de n, elevamos al cuadrado para llegar a n = 59.67, y como este nmero, no es entero
debemos redondear hacia arriba para tener n= 60 llantas.
Con un 99% de certeza, el fabricante de llantas, debe obtener una muestra de 60 llantas para tener un error
menor de 1000 Km.
Tambin se puede utilizar la siguiente frmula para calcular el tamao de la muestra, para estimar a como
sigue.

Ejemplo para reflexionar:


Un investigador a cuyo cargo est un departamento de educacin fsica, desea hacer una estimacin del
consumo de oxgeno (en litros por minuto), de los estudiantes normales que estn entre los 17 y los 21 aos de
edad, despus de haber hecho un tipo especial de ejercicio.
El investigador, desea que su estimacin se encuentre por lo menos a 0.10 litros de la media verdadera, con
una confianza del 95%. Los estudios que se han hecho, indican que la varianza del consumo de oxgeno de
este tipo de sujetos, bajo las condiciones especificadas, es aproximadamente igual a 0.09 litros por minuto
cuadrado.
Qu tamao debe tener la muestra que necesita este investigador?
Con base en la informacin dada, tenemos que E= 0.10, Z= 1.96 y

= 0.30

La sustitucin de estos valores se efecta en la siguiente ecuacin:

Como el tamao de la muestra tiene que ser un entero, el investigador necesitara tomar una muestra de
tamao 35, para lograr la confianza y la amplitud de intervalo deseado.

Es importante sealar lo siguiente en este tema:


Si hay que sacar la muestra de una poblacin finita, puede resultar conveniente incorporar el factor de
correccin poblacional finita (cpf), a la frmula para n, en este caso la frmula se transforma en

Modelos Inferenciales - 2014

46

ACTIVIDADES DE APRENDIZAJE:
Resuelve adecuadamente los siguientes problemas.
1) Un centro de verificacin vehicular, efecta una muestra aleatoria de 50 vehculos para estimar el tiempo
promedio, que se requiere para efectuar la prueba obteniendo una media de 7.2 minutos y una desviacin
estndar s = 0.8 minutos. Determina los intervalos de confianza de la media del 95% y del 99%, as como
los errores mximos de estos grados de confianza.
Al 95%:
Al 99%:
2) Se desea estimar las horas que un amplificador de msica puede ser usado antes de necesitar alguna
reparacin. Si por estudios previos se sabe que = 500 horas, Qu tan grande debe ser el tamao de la
muestra, si necesitamos tener un grado de confianza del 95% y un error de 100 horas?
RESPUESTAS CORRECTA: ______________

3) Una compaa de reparto de paquetera, efecta una muestra tamao n = 60 del nmero de paquetes que
entrega por da una camioneta. Si se obtuvo una media de
= 26.8 paquetes y una desviacin estndar de s =
1.4 paquetes, construye los intervalos de confianza del 90% y del 95%, para el promedio de paquetes que
entrega una camioneta.
Al 95%:
Al 90%:

4) Una compaa de seguros efecta una muestra de tamao n = 80 reclamaciones hospitalarias, obteniendo
un periodo promedio de hospitalizacin de 4.5 das y una desviacin estndar de 0.81 das. Si = 4.5 das se
emplea como la estimacin del periodo promedio de hospitalizacin de sus asegurados
a) Cul es el error mximo en esta estimacin, si se desea tener un grado de confianza del 95% y cul
es el correspondiente intervalo de confianza?
RESPUESTAS CORRECTA: ________________
5) Cul es el error mximo en esta estimacin, si se desea tener un grado de confianza del 99% y cul
es el correspondiente intervalo de confianza?
RESPUESTAS CORRECTA: ___________________
6) Una empresa publicitaria, desea investigar el tiempo promedio semanal que las amas de casa, de cierta
regin dedican a ver telenovelas. Si saben que es razonable tomar =2.8 horas para estos estudios. Qu tan
grande debe ser la muestra, si desean tener un grado de confianza del 99% y un error mximo de media
hora?
RESPUESTAS CORRECTA: ____________________
7) El dimetro promedio de una muestra aleatoria de 40 balines, fue de = 0.998 pulgadas y su desviacin
estndar fue s = 0.002 pulgadas. Cul es el mximo error al estimar el dimetro promedio del lote de
balines en 0.998 pulgadas, si deseamos tener un grado de confianza del 95%?
RESPUESTAS CORRECTA: _____________________
8) Unos diseadores industriales, desean determinar el tiempo promedio que un adulto requiere para ensamblar
un juguete fcil de ensamblar, para lo cual obtuvieron una muestra de n = 36
X = 19.9 y S = 5.73 Encuentre un intervalo de confianza del 95% para el tiempo promedio que un adulto,
requiere ensamblar dicho juguete?.
RESPUESTAS CORRECTA: _____________________
9) Un profesor, quiere calcular el tamao de la muestra del tiempo promedio que los estudiantes necesitan para
pasar de una clase a otra, y quiere afirmar con una probabilidad de 0.95, que su error ser a l o sumo de 0.25
minutos. Cul es el tamao de la muestra que necesita, si sabe que en estudios similares = 1.50
minutos?
RESPUESTAS CORRECTA: _____________________

Modelos Inferenciales - 2014

47

UNIDAD 4: PRUEBA DE HIPTESIS


Contenido temtico
Propsito del contenido temtico
Conceptos fundamentales
Conceptos subsidiarios
Nmeros de sesiones

Teora de decisin estadstica


Reflexionar y ejecutar las decisiones estadsticas, sobre poblaciones con
base en la informacin de muestras, para poner a prueba las hiptesis
planteadas
Prueba de hiptesis sobre una media y una proporcin poblacional
Decisiones estadsticas, Hiptesis estadsticas, Estrategia de prueba, dos
tipos de errores, Esquema general de la prueba de hiptesis, prueba de
hiptesis para una media y de una proporcin poblacional
1 (semana) con alto porcentaje de estudio independiente

ACTIVIDADES DE APERTURA
Para contextualizar la presente secuencia didctica, se sugiere reflexionar sobre
los avances tecnolgicos en la salud humana; especficamente, en la importancia
de la estadstica inferencial en la longevidad de la vida humana. Algunas
preguntas podran ser; Por qu el promedio de vida es ms largo hoy, que en
siglos pasados? Cmo ha influido la estadstica inferencial, en ste importante
fenmeno?
ACTIVIDADES DE DESARROLLO
1. Integrado en equipos de 5 estudiantes, realizar una lectura comentada y
analtica de los contenidos de la presente gua didctica, correspondientes a
los temas:
Decisiones estadsticas.
Hiptesis estadsticas.
Estrategia de prueba.
Tipos de errores que se cometen.
Esquema general de la prueba de hiptesis.
2. Reflexionar y discutir los ejemplos del apartado referente a las pruebas de
hiptesis sobre una media poblacional de sta gua.
3. Consultar de manera personal, otras fuentes de informacin a tu alcance, para
enriquecer los conocimientos de los temas antes mencionados. Mnimo dos
citas.
4. Integrado en equipos, desarrollar las estrategias para la solucin de las
preguntas antes sealadas.
5. Realicen esquemas, lminas, o presentaciones para su exposicin grupal en
el aula.
ACTIVIDADES DE CIERRE
El tutor propiciar la exposicin libre de las inquietudes, e impresiones
generada durante el desarrollo del tema.
En reunin plenaria, expondrn ya sea con, lminas, o presentaciones
PowerPoint; las vas de solucin que hayan encontrado a dichos preguntas.
En la plenaria, encontraras la solucin ms idnea entre todo el grupo.
De manera respetuosa podrs solicitar a todo el grupo, te disipen algunas
dudas que tengas respecto al tema y a la solucin del problema en general.

OBSERVACIN
Proyectar videos, audio, o
presentaciones
estadsticas
Integrarse en equipos de
3 estudiantes para su
anlisis.

Consultar la presente
gua didctica y otras
bibliografas, para
argumentar la solucin.

El cierre se har en dos


fases
1ra. Sobre las relaciones
humanas
2da. Sobre el problema
estadstico

BIBLIOGRAFA, CIBERGRAFIA Y OTRAS FUENTES DE INFORMACIN


Estadstica y Muestreo. Ciro Martnez Bencardino, Ecoe Ediciones, Novena Edicin. Eco Ediciones, Novena Edicion.
Chao Lincoln. (1992). Introduccin a la estadstica. Editorial McGraw Hill Interamericana. Mxico.
Texto Estadstica Aplicada a los Negocios y la Economa. Decimotercera Edicion. McGrawHill. Autores Lind, Douglas A., Marchal, William
G., Wathen, Samuel A.
http://recursostic.educacion.es/descartes/web/aplicaciones.php?bloque=4
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Muestreo_Inferencia_Estadistica/pruebas_hipotesis.html
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Muestreo_Inferencia_Estadistica/pruebas_hipotesis.html
http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/docs_curso/contenido.html

Modelos Inferenciales - 2014

48

4.1. DE CISIONES ESTADSTICAS


En la prctica, con frecuencia se est obligado a tomar decisiones sobre poblaciones con base en la
informacin de muestras. stas se denominan decisiones estadsticas. Por ejemplo, quizs se quiera decidir,
apoyado en datos muestrales, si un procedimiento educativo es mejor que otro; si un nuevo suero es realmente
efectivo para curar una enfermedad; si un material didctico (libro o apuntes) es mejor que otro; si un fertilizante
es mejor que la materia orgnica, para el desarrollo de algunas plantas, etctera.
En el tema anterior, estudiamos los conceptos y las tcnicas de la estimacin por intervalos de una media y de
una proporcin poblacional; esto ha servido para empezar a familiarizarse con la inferencia estadstica, que
consiste en ver si se puede considerar, a travs de la informacin contenida en una muestra representativa de
la poblacin bajo estudio, como verdadera una conjetura planteada acerca de la poblacin. En el presente
tema, vamos a analizar otro problema tpico de la inferencia estadstica: LA PRUEBA DE HIPOTESIS.
Los mtodos estadsticos que permiten poner a prueba una hiptesis; conforman una importante rama de la
estadstica; dichos mtodos siguen una estrategia general; nosotros abordaremos el camino que sigue del
planteamiento de una hiptesis de investigacin hasta su manejo estadstico, comentaremos los tipos de
errores que se pueden cometer, as como los conceptos y la estrategia bsica para la prueba de hiptesis.
Con el propsito de abordar de manera diferente ste tema, y esperando que sea ameno y sobre todo, ms
lgica su comprensin, abordaremos con un ejemplo sencillo, los distintos subtemas en donde iremos
realizando actividades de aprendizaje y cuando sea conveniente, generalizaremos el concepto que estemos
analizando (hiptesis estadsticas, estrategia de prueba, dos tipos de errores, regla de decisin,
esquema general de la prueba de hiptesis), para despus, regresar nuevamente a nuestro ejemplo.
Ejemplo: En el Departamento de Bolvar, un grupo de profesores realizan una investigacin acerca del
aprendizaje de las matemticas, en las escuelas secundarias. Uno de los objetivos de la investigacin es
comparar el nivel de conocimientos, que tienen los jvenes de las zonas rurales, con el que tienen, los de las
zonas urbanas del Departamento. Para ello, disean un examen de conocimientos en matemticas, cuyas
caractersticas permiten considerar, que la calificacin que obtenga cada joven, es un indicador de su nivel, as
como que las calificaciones se distribuyen normalmente. Este examen es aplicado a todos los jvenes que
asisten a las escuelas secundarias de las zonas urbanas del departamento, y se encuentra que el promedio de
calificaciones es de 7,5.
Los profesores sospechan que los jvenes de las zonas rurales tienen un nivel de conocimientos en
matemticas diferentes del de los de zonas urbanas, por lo que plantean que, de aplicarse el examen en zonas
rurales, se obtendra un promedio de calificaciones, distinto de 7,5. Sin embargo, las zonas rurales del
Departamento de Bolvar, son de difcil acceso, por lo que resulta imprctico aplicar el examen en todas las
escuelas de dichas zonas. Por ello, los profesores deciden trabajar con una muestra representativa de 30
jvenes de las zonas rurales, dicha muestra es elegida con base en tcnicas de muestreo que ya analizamos
en el primer tema, por lo que el promedio de las calificaciones obtenidas por los 30 jvenes, ser un estimador
del promedio de las calificaciones de todos los jvenes de las zonas rurales, del Departamento de Bolvar.
Hagamos un breve anlisis de algunos elementos de este problema.
La variable con la que trabajaremos es la calificacin, obtenida en el examen de matemticas y la denotamos
con X. La poblacin que nos interesa es la coleccin de las calificaciones que obtendran en los exmenes,
todos los jvenes de las zonas rurales del Departamento y. La caracterstica que nos interesa es el promedio
de estas calificaciones; es decir, el valor del parmetro . El valor de es desconocido, pero podemos
estimarlo puntualmente, mediante la media de las calificaciones obtenidas por los 30 jvenes.
SUPONGAMOS que esta media muestral es de 7.86, es decir

= 7.86

Se podra afirmar que, como


7.5, el promedio de calificaciones en zonas rurales difiere del de zonas
urbanas? SI_________ o NO __________
Claro que no! Recuerde que la media ( ), vara de muestra a muestra, por ello, no es evidente que a partir del
valor de obtenido en una muestra, podamos inferir que el promedio poblacional, , difiere del promedio de
calificaciones en zonas rurales.

Modelos Inferenciales - 2014

49

4.2. HIPTESIS ESTADSTICAS


La palabra hiptesis se define como:
1) Una afirmacin que est sujeta a verificacin o comprobacin.
2) Una suposicin que se utiliza como base para una accin.
3) Una conjetura que se hace sobre algo, para sacar una conclusin.
El punto clave de estas definiciones est, en que una hiptesis es una afirmacin o suposicin y no un hecho
establecido.
Al intentar tomar una decisin, es til hacer suposiciones o conjeturas acerca de las poblaciones implicadas.
Dichas suposiciones, que pueden o no ser verdaderas, se denominan hiptesis estadsticas. En general las
hiptesis, son afirmaciones acerca de las distribuciones de probabilidad de las poblaciones .
Podemos expresar, en trminos estadsticos la conjetura del grupo de profesores de nuestro ejemplo como
sigue: El promedio poblacional , de las calificaciones que obtendran en el examen de matemticas los
jvenes de las zonas rurales del Departamento de Bolvar, difieren del promedio poblacional de las
calificaciones, obtenidas por los jvenes de las zonas urbanas
Denotemos con u (mu u de urbana) al promedio de las zonas urbanas, entonces sabemos, u = 7.5 y la
conjetura de los profesores se puede expresar:
7.5 o bien
u ( = no es igual a )
En adelante nos referimos a la conjetura de los profesores como hiptesis de investigacin y la expresamos
como sigue:
Hinv: 7.5 o bien Hinv: u
(Prueba Bilateral por corresponder a ambos lados de la media o en ambas colas de la distribucin, 2 colas)
Es importante sealar que los profesores de nuestro ejemplo, podran haberse planteado alguna de las
siguientes hiptesis:
El nivel promedio de conocimientos en matemticas, de los jvenes de las zonas rurales es mayor
que el de los jvenes de las zonas urbanas. En este caso se conjetura ue > u y la hiptesis de
investigacin es Hinv: > u.
(Prueba Unilateral, una cola de la distribucin)
El nivel promedio de conocimientos en matemticas de los jvenes de las zonas rurales es menor
que el de los jvenes de las zonas urbanas. En este caso se conjetura que < u y la hiptesis de
investigacin es Hinv: < u .
(Prueba Unilateral, una cola de la distribucin)
El nivel promedio de conocimientos en matemticas de los jvenes de las zonas rurales no difiere al
de los jvenes de las zonas urbanas. Hinv: = u
(Prueba Bilateral o de 2 colas)
Nosotros nos limitaremos a estudiar los casos en los que las hiptesis de investigacin plantea la existencia de
alguna diferencia, como en las tres posibilidades sealadas en nuestro ejemplo : Hinv: u , Hinv: > u ,

Hinv: < u .

Como se indic anteriormente, al tomar una decisin, es til hacer suposiciones o conjeturas acerca de las
poblaciones implicadas. Dichas suposiciones, pueden o no ser verdaderas, a stas se les denominan
hiptesis estadsticas. Esto nos conduce a considerar DOS POSIBILIDADES; una coincide con la hiptesis de
investigacin y la otra la contradice.
La hiptesis que contradice a la hiptesis de investigacin se llama HIPTESIS NULA y se denota H0
La hiptesis que coincide con la hiptesis de investigacin se llama HIPTESIS ALTERNATIVA y se
denota H1

Modelos Inferenciales - 2014

50

Ahondaremos ms en este aspecto, para ver cmo se generan las hiptesis estadsticas. Para ello,
consideremos las distintas modalidades que, segn se mencion anteriormente, puede adoptar la hiptesis de
investigacin.
CASO 1. En nuestro ejemplo se postul:

Hinv : 7.5

o bien

(Hinv : u ).

La hiptesis nula, que niega a la hiptesis de investigacin, es:

H0: = 7.5

o bien

(H0: = u)

Y la hiptesis alternativa, que afirma lo mismo que la de investigacin, es:

H1: 7.5

o bien

(H1: u).

(Prueba Bilateral o de 2 colas)


CASO 2. Si se hubiera postulado que el nivel de conocimientos en promedio de matemticas es ms alto en
las zonas rurales que en las urbanas, se tendra:

Hinv : > 7.5

o bien

(Hinv: > u ).

Como la hiptesis nula contradice a la de investigacin, sera de la siguiente manera:

H0: 7.5

o bien

(H0: u ).

o bien

(H1: > u ).

La hiptesis alternativa sera:

H1: > 7.5

(Prueba Unilateral o de 1 colas)


CASO 3. Si se hubiera postulado que el nivel de conocimientos en promedio de matemticas es ms bajo en
zonas rurales que en las urbanas, se tendra :

Hinv: < 7.5

o bien

(H inv: < u).

o bien

(H0: u).

La hiptesis nula tendra la forma:

H0: 7.5
La hiptesis alternativa sera:

H1: < 7.5

o bien

(H1: < u).

(Prueba Unilateral o de 1 colas)


La siguiente tabla, resume la relacin de smbolos que aparecen en las hiptesis en los tres casos
considerados:

Modelos Inferenciales - 2014

51

ACTIVIDADES DE APRENDIZAJE:
1. Establezca las hiptesis nulas (H0) y las hiptesis alternativa (H1) en cada uno de los siguientes casos:
a) Hinv: > 0

H0: _______________

H1:______________

b) Hinv: 9.43

H0: _______________

H1:______________

c) Hinv: < -3.28

H0: _______________

H1:______________

d) Hinv: -10.11< 0

H0: _______________

H1:______________

e) Hinv: + 4.01 > 0

H0: _______________

H1:______________

Si se est trabajando con una variable categrica y el parmetro de la poblacin, que nos interesa, es la
proporcin poblacional P, con la que ocurre cierta categora, se puede hacer una hiptesis de investigacin
sobre P. En seguida te damos una lista de hiptesis de investigacin H inv. Establezca la hiptesis nula H0 y la
hiptesis alternativa H1 en cada uno de los casos:
a) Hinv: p .37

H0: _______________

H1:______________

b) Hinv: p < .5

H0: _______________

H1:______________

c) Hinv: p - .48 0

H0: _______________

H1:______________

d) Hinv: p - .93 > 0

H0: _______________

H1:______________

4.3. ESTRATEGIA DE PRUEBA


Regresemos a nuestro ejemplo
La hiptesis de investigacin Hinv: 7.5 gener la pareja siguiente de hiptesis estadsticas
Hiptesis nula H0: = 7.5 y la Hiptesis alternativa H1: 7.5
Con estas hiptesis, nos estamos haciendo preguntas acerca del parmetro . Estas preguntas pueden ser:
Hiptesis nula H0: Podemos considerar que es igual al promedio (u = 7.5) obtenido en zonas urbanas?
Hiptesis alternativa H1: Podemos considerar que es distinto de u ?
Como no conocemos el valor de , la respuesta a estas preguntas se obtendr de una inferencia a partir del
valor del estimador de , que es . Para esto, le daremos a priori, mayor credibilidad a la hiptesis nula que
a la hiptesis alternativa, es decir, seremos estrictos con nuestra hiptesis de investigacin: para que la
aceptemos, NO bastar que la informacin de la muestra, proporcione evidencia a su favor, sino que exigiremos
tambin que dicha informacin, proporcione evidencia en contra de la hiptesis nula H0, que es su negacin.
Para ello, consideraremos provisionalmente que la hiptesis nula es verdadera y luego, veremos si la
informacin contenida en la muestra, contradice este supuesto o no.
a) Si lo contradice, nuestra conclusin estadstica, ser rechazar la hiptesis nula, con lo que podremos
considerar, que la hiptesis de investigacin, es verdadera.
b) Si no lo contradice, la conclusin ser no rechazar la hiptesis nula, por lo que no podremos considerar,
que la hiptesis de investigacin, sea verdadera.
Recordemos que el estimador de la media poblacional (), la media muestral de las 30 calificaciones es
= 7.86, por lo tanto

Modelos Inferenciales - 2014

52

Si esta media muestral difiere MUCHO de 7.5, podemos considerar ue es distinto de 7.5 y la informacin
contenida en la muestra contradice, en este caso, a la hiptesis nula.
Si la media muestral difiere POCO de 7.5, estaremos inclinados a pensar ue es igual a 7.5 por lo que la
informacin contenida en la muestra no contradice, en este caso, a la hiptesis nula. Pero
Qu tanto es MUCHO y u tanto es POCO?.
Necesitamos un criterio que nos aclare estos trminos y
que nos indique si la diferencia u= 7.86 7.5 = 0.36 puede ser considerada GRANDE o PEQUEA.
Este criterio, que veremos ms adelante, recibe el nombre de regla de decisin y es el que nos permite llegar
a la conclusin de rechazar o no la hiptesis nula.
4.4. TIPOS DE ERRORES QUE SE COMETEN
1) Si la media muestral difiere MUCHO de 7.5, la conclusin estadstica ser rechazar H0. Ahora bien, en
realidad puede ocurrir una de dos situaciones:
a) H0 es verdadera: en este caso estaremos cometiendo un error, al rechazar una hiptesis nula, que es
verdadera;
b) H0 es falsa: en cuyo caso nuestra conclusin ser acertada.
2) Si la media muestral difiere POCO de 7.5, la conclusin ser no rechazar H0. Ahora bien, tambin aqu
puede ocurrir en realidad, una de las dos situaciones mencionadas.
a) H0 es verdadera: en este caso nuestra conclusin ser acertada.
b) H0 es falsa: en este caso estaremos cometiendo un error, al no rechazar una hiptesis nula, que es falsa.
Es decir, en cada posibilidad de conclusin estadstica podemos estar cometiendo un error. Estos errores
reciben los siguientes nombres:
1) El error que cometemos en caso de rechazar una hiptesis nula, que es verdadera se llama ERROR TIPO I
2) El error que cometemos en caso de no rechazar una hiptesis nula, que es falsa se llama ERROR TIPO II.
En la siguiente tabla se resume lo anteriormente sealado:

Antes de seguir adelante, veamos en qu consiste cada uno de estos dos errores, en los trminos de nuestro
ejemplo inicial. Hinv: 7.5 H0: = 7.5 H1: 7.5
Como vimos anteriormente, la estrategia de prueba ser considerar como verdadera, la hiptesis de
investigacin Hinv, slo si podemos rechazar la hiptesis nula H0. Entonces:
1) EL ERROR TIPO I consiste en rechazar la hiptesis H0: =7.5 cuando en realidad es verdadera. Dicho
en otras palabras, si en nuestro problema se cometiera el error de tipo I, esto equivaldra a considerar que el
nivel en matemticas, que tienen los jvenes de las zonas rurales del Departamento de Bolvar, difiere del que
tienen los de las zonas urbanas del Departamento, cuando en realidad, no difieren.

Modelos Inferenciales - 2014

53

2) EL ERROR TIPO II consiste en no rechazar la hiptesis H0: =7.5 cuando en realidad es falsa. O sea, si
en nuestro problema se cometiera el error tipo II, esto equivaldra a no considerar que el nivel en matemticas,
que tienen los jvenes de las zonas rurales, del Departamento de Bolvar, difiera del que tienen los de las zonas
urbanas, cuando en realidad, si difieren.
La probabilidad de cometer el error de tipo I, lo llamaremos P(EI) y la probabilidad de cometer el error tipo II, lo
llamaremos, P(EII). Ahora, si deseamos tener el mnimo riesgo posible de cometer error, en caso de que
consideremos la hiptesis de investigacin como verdadera, entonces, lo que queremos es tener el mnimo
riesgo posible de cometer el error tipo I, por lo tanto, deseamos que P(EI) sea un nmero pequeo.
Los valores de P(EI) que se usan ms comnmente son: 0.10, 0.05, 0.01. Al decidir qu probabilidad de
cometer el error tipo I permitimos; estamos diciendo qu confianza queremos tener, en caso de considerar la
hiptesis de investigacin verdadera. Los valores de P(EI) que acabamos de dar, corresponden a
confiabilidades de 90%, 95% y 99% respectivamente.
ACTIVIDAD DE APRENDIZAJE:
La siguiente tabla es similar a la de la pgina anterior, en donde est expresada en trminos de H0. Ahora t
exprsala en trminos de la hiptesis alternativa, H1.
SITUACION REAL
(desconocida)

SITUACION
ESTADISTICA

4.4.1.

REGLAS DE DECISIN O SIGNIFICANCIA

Los procedimientos que permiten determinar si las muestras observadas, difieren significativamente de los
resultados esperados y que, por lo tanto, ayudan a decidir si se aceptan o rechazan las hiptesis, se denominan
pruebas de decisin o significancia.
Regresemos a nuestro ejemplo, para esto, los profesores cuentan con una muestra de 30 calificaciones, en la
que se obtuvo un promedio muestral de 7.86, es decir: n = 30 y = 7.86.
La regla de decisin que queremos, nos debe indicar si la diferencia - u = 7.86 7.5 = 0.36 puede ser
considerada lo suficientemente GRANDE, como para rechazar la hiptesis nula, o si, por el contrario, debe ser
considerada los suficientemente PEQUEA, como para no rechazar H0. Tambin, que los valores de la media
de distintas muestras tienen una distribucin muestral, cuya dispersin estimamos mediante el error estndar
muestral,

si esta dispersin es grande, el promedio de cada muestra, puede alejarse bastante del

promedio poblacional , y si es pequea se espera que cada promedio est cercano a . Esto hace que
evaluemos la diferencia
muestral

u, con respecto al error estndar muestral

difiere mucho o poco de u con respecto al error muestral

diremos que el promedio

Para ver cmo es la regla de decisin que nos permitir decir una cosa u otra, nuestro punto de partida ser, el
intervalo de confianza para que ya estudiamos en el tema anterior. Como sabemos, para hacer una
estimacin por intervalo de , decidiremos con qu probabilidad estamos dispuestos a cometer el error en la
estimacin.
Modelos Inferenciales - 2014

54

Por ejemplo si decidimos que = 0.05, sabemos que podemos encontrar un intervalo de (1 - ) 100% = 95%
confianza para . Debido a que no conocemos el valor de (desviacin estndar poblacional), tendremos que
calcular el de la muestra, el valor de s (desviacin estndar muestral) y hacer uso de la distribucin
t de Student para construir el intervalo de confianza;

Donde t (n -1) es el valor de la distribucin t de Student con n -1 grados de libertad** y en dos colas.
En nuestro ejemplo, t (n 1) es el valor de la distribucin t de Student con 30 1 = 29 grados de libertad y
= 0.05 en dos colas.
Entonces (ver la tablat de Student de la pgina siguiente), t (n 1) = t (29) = 2.045, y tenemos que, con una
probabilidad 1 = 0.95, est en el intervalo.

<<

de donde se deduce que, con una probabilidad de 0.95.

Observemos que esta regla de decisin es precisamente la que desebamos obtener, ya que:

1) Si el valor de

no est en el intervalo < - 2.045, 2.045 > , podemos decir que

difiere

mucho de cero y que es porque la diferencia


(que puede ser negativa o positiva) difiere
mucho de cero con respecto al error estndar muestral
.
Este es el caso en el que difiere mucho de 7.5 y que nos dice cuando podemos rechazar la hiptesis
nula.

2) Si el valor de

si est en el intervalo < - 2.045, 2.045 >, podemos decir que

difiere

poco de cero y que es porque la diferencia


difiere poco de cero con respecto al error
estndar muestral
.
Este es el caso en el que
difiere poco de 7.5 y que nos dice cuando no podemos rechazar la
hiptesis nula.
A la experiencia

la llamaremos estadstico de prueba y la denotamos por tc. Si este valor de tc es

tal que tc si est en el intervalo < - 2.045, 2.045 >, no se rechaza Ho, por lo que el intervalo < - 2.045, 2.045 >,
se le denomina la regin de no rechazo de Ho. Si el valor de tc es tal que tc no est en el intervalo < - 2.045,
2.045 >, se rechaza Ho.

Sabemos que si rechazamos Ho, podemos estar cometiendo el error tipo I. Por lo tanto, se tiene que
probabilidad de que siendo Ho verdadera, tc no est en el intervalo y rechazo Ho

Modelos Inferenciales - 2014

es la

55

** Grados de libertad: Es un parmetro de la distribucin t. para determinar un estimado de intervalo de una media de poblacin, tiene n
1 grados de libertad, siendo n el tamao de la muestra aleatoria.

TABLA DE DISTRIBUCIN t de Student


Valores de t para algunas probabilidades

Modelos Inferenciales - 2014

56

4.5. ESQUEMA GENERAL DE LA PRUEBA DE HIPTESIS.


La mayora de los conceptos que hemos estudiado hasta el momento, son comunes a todos los procesos
estadsticos de prueba de hiptesis. Enseguida se propone, un esquema general para probar hiptesis en el
cual se consideran en forma sistematizada y secuencial las partes que se deben considerar en cada prueba de
hiptesis.
Los pasos que consideraremos al probar una hiptesis son los siguientes:
1. Planteamiento de las hiptesis
2. Estadstico de prueba y condiciones para su uso.
3. Regla de decisin
4. Clculos
5. Decisin estadstica
6. Interpretacin de los resultados.
A continuacin se detallan cada uno de ellos de manera somera.
1) Planteamiento de las hiptesis: Se plantear en trminos del problema a tratar la hiptesis de
investigacin, la que se traducir a trminos estadsticos. Se plantearn tambin las hiptesis nula y alternativa.
2) Estadstico de prueba y condiciones para su uso: Se indicar el estadstico de prueba, que es una
variable aleatoria que relaciona el planteamiento de la hiptesis nula con la informacin contenida en la
muestra. Se identificar la distribucin que tiene el estadstico de prueba bajo el supuesto de que la hiptesis
nula es cierta. Adems, se enunciarn las condiciones para el uso del estadstico de prueba y en algunos
casos, deberemos suponer que se cumplen las condiciones.
3) Regla de decisin: Se especificar el valor de , esto es, la probabilidad con la que se est dispuesto a
cometer el error de tipo I, y se indicar, de acuerdo con el planteamiento de la hiptesis alternativa, si se
localiza en una o dos colas de la distribucin que tiene el estadstico de prueba bajo el supuesto que de que la
hiptesis nula es verdadera. Se consultar la tabla de probabilidades correspondiente a dicha distribucin y se
encontrar el valor (que suele llamarse valor crtico) que permita definir las regiones de rechazo de H0 y de no
rechazo de H0.
4) Clculos: Se encontrar el valor del estadstico de prueba correspondiente a la muestra obtenida,
sustituyendo en la expresin algebraica del estadstico de prueba, los nmeros que corresponden a los
estimadores y dems datos mustrales y los que corresponden al planteamiento de la hiptesis nula.
5) Decisin estadstica: Se identificar en cules de las regiones definidas en el paso 3, se encuentra el valor
del estadstico de prueba calculado en el paso 4. Si este valor est en la regin de rechazo de H0 se tomar la
decisin de rechazar H0, y si est en la regin de no rechazo de H0, se tomar la decisin de no rechazar H0.
6) Interpretacin de los resultados: Se expresar la decisin tomada en el paso 5 en trminos de la hiptesis
de investigacin. Esto es, se traducirn las conclusiones que se obtuvieron en trminos estadsticos a los
trminos del problema original.
Ahora Terminemos el ejemplo haciendo un resumen y sometamos a prueba la hiptesis inicial.
1)

Planteamiento de la hiptesis: El nivel de conocimiento que tienen los jvenes de las escuelas
secundarias de las zonas rurales del Departamento de Bolvar, es diferente del de los jvenes de las
escuelas secundarias de las zonas urbanas del estado.
Las Hiptesis estadsticas son:

Hinv: 7.5
Ho : = 7.5
H1 : 7.5
Recordando que es el promedio de calificaciones que se obtendran en las zonas rurales y u es el promedio
de calificaciones que se obtuvo en las zonas urbanas ( u = 7.5). Conocemos el valor de u, pero no el de .

Modelos Inferenciales - 2014

57

2)

Estadstico de prueba y condiciones para su uso: El estadstico de prueba que usaremos es:

El cual se distribuye en forma t de Student con n 1 grados de libertad bajo el supuesto de que H0 es
cierta. La condicin para usar este estadstico de prueba es que la variable bajo estudio se distribuye
normalmente. Como el examen se construy de tal forma que la calificacin fuera una variable que se
distribuyera normalmente, esta condicin se cumple.
3) Regla de decisin: Como se desea probar H1: 7.5 ( u) con un nivel de significancia de 5%, se
tienen que =0.05 en dos colas. El valor en la tabla de la distribucin t de Student con 30 1 = 29 grados
de libertad es tc (29) = 2.045. A partir de este valor se definen las regiones de rechazo y no rechazo de H0,
como sigue

4) Clculos: Como n = 30,

=7.86, S = 0.71 y u = 7.5, tenemos:

5) Decisin estadstica: Como tc = 2.778 no est en el intervalo < -2.045, 2.045>, se decide rechazar H0.
6) Interpretacin de los resultados: Como se rechaz la hiptesis nula, H0 : = 7.5 con = 0.05 se puede
sealar:
La muestra proporciona evidencia suficiente para considerar, con 95% de confianza, que la hiptesis de
investigacin es verdadera, o sea que los jvenes de las escuelas secundarias ubicadas en las zonas
rurales del Departamento de Bolvar, tienen un nivel de conocimientos en matemticas que es distinto del
que tienen los jvenes de las secundarias urbanas del mismo estado. Dicho de otra forma, podemos decir
que hay diferencias significativas del nivel de conocimientos en matemticas entre los jvenes de las
escuelas secundarias de las zonas rurales y los de las zonas urbanas del Departamento de Bolvar.
Si reflexionas y analizas detenidamente lo anterior, observaras que para llegar a stas conclusiones
estadsticas, intervinieron adems del valor de u (postulado por la hiptesis nula H0: = u ), los siguientes
nmeros;

El promedio muestral ( );
La desviacin estndar muestral (s);
El tamao de la muestra (n ); y
La probabilidad con la que se est dispuesto a cometer el error tipo I ().

En las siguientes actividades de aprendizaje te permitir reflexionar cmo influye cada uno de estos nmeros
en la conclusin estadstica de rechazar o no rechazar la hiptesis nula.
Hiptesis nula = H0 e Hiptesis alternativa = H1

Modelos Inferenciales - 2014

58

ACTIVIDADES DE APRENDIZAJE:
1) En el ejercicio se trabaj con s = 0.71, n = 30 y = 0.05. Obtenga la conclusin estadstica si
cada uno de los indicados en la columna de la izquierda en la siguiente tabla:

hubiera sido

Qu relacin guarda la distancia entre y u=7.5 con la distancia entre tc y cero? Qu relacin guarda la
distancia entre y u con la conclusin estadstica?, analiza tus conclusiones.
_________________________________________________________________________________________
________________________________________________________________________________________

2) En el ejercicio se trabaj con = 7.86, n = 30 y = 0.05. Obtenga la conclusin estadstica si


cada uno de los indicados en la columna de la izquierda en la siguiente tabla:

s hubiera sido

Qu relacin hay entre la dispersin de los datos de la muestra (s) y el valor tc del estadstico de prueba?
Qu relacin hay entre la dispersin de los datos de la muestra y la conclusin estadstica?
_________________________________________________________________________________________
_________________________________________________________________________________________

Modelos Inferenciales - 2014

59

3) En el ejercicio se trabaj con = 7.86, s = 0.71 y = 0.05. Obtenga la conclusin estadstica si n hubiera
sido cada uno de los indicados en la columna de la izquierda en la siguiente tabla:

Qu relacin hay entre n y el intervalo; n con tc ; n y la conclusin estadstica?, analiza tus conclusiones
_____________________________________________________________________________________
_____________________________________________________________________________________

4) En el ejercicio se trabaj con = 7.86, s = 0.71 y n = 30. Obtenga la conclusin estadstica si n hubiera sido
cada uno de los indicados en la columna de la izquierda en la siguiente tabla:

Qu relacin hay entre y la amplitud de la regin de no rechazo de H0? Con cuanta confianza podemos
aceptar H1?, analiza tus conclusiones
_________________________________________________________________________________________
_________________________________________________________________________________________

Modelos Inferenciales - 2014

60

Ejemplo, para analizar detenidamente


El gerente de compras de una tienda de autoservicio analiza la cantidad de azcar de un lote de naranjas
procedentes de Veracruz para determinar su precio de venta. De acuerdo con el productor, el contenido de
azcar de las frutas es en promedio 12.5%. El gerente enva a analizar una muestra aleatoria de n = 20
naranjas y los resultados del laboratorio arroja una media en = 11.9% de azcar y una desviacin estndar
S = 0.9%. Debe el gerente aceptar la afirmacin del producto de que el promedio de azcar es del 12.5% si el
nivel de significancia es de 0.05?
1) Planteamiento de las hiptesis: Hinv: El promedio del contenido de azcar del lote de naranjas procedentes
de Veracruz es diferente al promedio afirmado por el productor del 12.5%.
Hinv: 12.5 Hiptesis estadsticas H0: = 12.5 H1: 12.5
2) Estadstico de prueba y condiciones para su uso:

El estadstico de prueba que usaremos es:


Cuya distribucin es la de t de Student con n 1 grados de libertad, bajo el supuesto de que H0 es cierta. La
condicin para usar este estadstico de prueba, es que la variable bajo estudio se distribuya normalmente y
suponemos que el contenido de azcar de las naranjas se distribuye normalmente por lo que sta condicin se
cumple.
3) Regla de decisin: Como se desea probar H1: 12.5 con un nivel de significancia de 0.05 o 5%, se tiene
= 0.05 en dos colas. El valor en la tabla (ver pgina 56) de la distribucin t de Student con 20 1 = 19
grados de libertad es = 2.093. A partir de este valor se definen las regiones de rechazo y no rechazo de H0,
como sigue

4) Clculos:
Como n = 20, la media muestral es

= 11.9, la desviacin estndar muetral es s = 0.9

Tenemos:

5) Decisin estadstica: Como tc = - 2.98 no se encuentra en el intervalo <-2.093, 2.093>, se debe rechazar la
H0 ( = 12.5%) dicho de otra manera, tc < -2.093 ya que -2.98 se encuentra a la izquierda de -2.093 en la recta
real, por lo tanto se debe rechazar la hiptesis nula.
6) Interpretacin de resultados: Como se rechaz la hiptesis nula nos indica lo siguiente:
Hay evidencia suficiente para considerar, con una confianza de 95% que el promedio del contenido de azcar
de las naranjas de las muestras (x = 11.9%) es significativamente diferente respecto al promedio del contenido
de azcar de las frutas que aseguraba el productor ( =12.5%). Por lo tanto, en respuesta a la pregunta inicial,
el gerente no debe aceptar la afirmacin del producto de que el promedio de azcar es del 12.5%; o lo que es
lo mismo, la diferencia en el porcentaje de azcar entre 12.5 y 11.9 es muy grande para deberse a la
variabilidad de las diferentes muestras.

Modelos Inferenciales - 2014

61

UNIDAD 5: DISTRIBUCIONES BIDIMENSIONALES - REGRESIN Y CORRELACIN


Contenido temtico
Anlisis de regresin y correlacin
El anlisis de regresin es una tcnica para investigar y modelar la relacin entre
Propsito del contenido
variables. Aplicaciones de regresin son numerosas y ocurren en casi todos los
temtico
campos.
Conceptos
Construccin de modelos para distribuciones, variables aleatorias en la muestra,
fundamentales
estimacin de los parmetros y los contrastes de hiptesis.
Conocer y diferenciar los conceptos de relacin funcional y estadstica, saber el
concepto de correlacin, Conocer la influencia de la correlacin en los diagramas
Conceptos subsidiarios
de dispersin, Saber encontrar los diferentes parmetros que gobiernan una
distribucin bidimensional, Conocer el concepto de covarianza y qu mide, Definir
el concepto de correlacin lineal
Nmeros de sesiones
1 (semana) con alto porcentaje de estudio independiente
ACTIVIDADES DE APERTURA

1. Valoracin de la matemtica de la aleatoriedad como una parte de la


matemtica tan cientfica como el anlisis, el lgebra o el clculo.
2. Comprensin y valoracin de la necesidad del rigor en los clculos
probabilsticos, de cuyos resultados depende la decisin que afecta a
poblaciones.
3. Reconocimiento y valoracin del trabajo en equipo como la manera de realizar,
de forma eficaz y con menor riesgo de error, los trabajos de aplicacin de
modelos probabilsticos a situaciones reales estadsticas.
4. Sensibilidad y gusto por la elaboracin y presentacin cuidadosa de los trabajos
estadsticos realizados.
ACTIVIDADES DE DESARROLLO
1. Integrado en equipos de 3 estudiantes, realizar una lectura comentada y analtica de los
contenidos de la presente gua didctica, correspondientes a los temas:

Distribucin bidimensional

Idea de correlacin.

Nube de puntos o diagrama de dispersin.

Correlacin lineal y recta de regresin.

Medida de la correlacin.

Estimacin mediante la recta de regresin.

Propiedades de la recta de regresin de los mnimos cuadrticos.


2. Consultar de manera personal, otras fuentes de informacin a tu alcance, para
enriquecer los conocimientos de los temas antes mencionados. Mnimo dos citas.
3. Integrado en equipos, desarrollar las estrategias para la solucin de las preguntas antes
sealadas.
4. Realicen esquemas, lminas, o presentaciones para su exposicin grupal en el aula.
ACTIVIDADES DE CIERRE

El tutor propiciar la exposicin libre de las inquietudes, y impresiones generada durante


el desarrollo del tema.
En reunin plenaria, expondrn ya sea con, lminas, o presentaciones PowerPoint; las
vas de solucin que hayan encontrado a dichos preguntas.
En la plenaria, encontraras la solucin ms idnea entre todo el grupo.
De manera respetuosa podrs solicitar a todo el grupo, te disipen algunas dudas que
tengas respecto al tema y a la solucin del problema en general.

OBSERVACIN

Proyectar videos, audio,


o
presentaciones
estadsticas
Integrarse en equipos
de 3 estudiantes para su
anlisis.

Consultar la presente gua


didctica
y
otras
bibliografas,
para
argumentar la solucin.

El cierre se har en dos


fases
1ra. Sobre las relaciones
humanas
2da. Sobre el problema
estadstico

BIBLIOGRAFA, CIBERGRAFIA Y OTRAS FUENTES DE INFORMACIN


Estadstica y Muestreo. Ciro Martnez Bencardino, Ecoe Ediciones, Novena Edicin. Eco Ediciones, Novena Edicion.
Libro de texto de Matemticas Aplicadas a las Ciencias Sociales I., Autores: varios, Editorial: Editex.
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Correlacion_regresion_recta_regresion/correlacion_y_regresion.htm
http://recursostic.educacion.es/descartes/web/aplicaciones.php?bloque=4
http://recursostic.educacion.es/descartes/web/materiales_didacticos/distrib_bidimensionales/distribuciones_bidimensionales.htm
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Variables_estadisticas_bidimensionales_regresion_correlacion/Indice.htm

Modelos Inferenciales - 2014

62

5.

INTRODUCCION

Si sobre una poblacin de nios entre 0 y 6 aos, estudiamos las variables peso y estatura, esperamos que en
general ocurra que a mayor estatura tambin encontremos mayor peso, aunque es posible que en algunos
pocos casos no ocurra as.
Vemos que existe una relacin entre las dos variables, aunque no es funcional, o sea, no puedo determinar con
exactitud el peso que corresponder a cada talla.
En este tema trataremos de describir y medir este tipo de relaciones, que aparecen en gran cantidad de
problemas.
a.

DISTRIBUCIONES BIDIMENSIONALES

Cuando sobre una poblacin estudiamos simultneamente los valores de dos variables estadsticas, el conjunto
de los pares de valores correspondientes a cada individuo se denomina distribucin bidimensional.
EJEMPLO:
Las notas de 10 alumnos en Matemticas y en Lengua vienen dadas en la siguiente tabla:
MATEMTICAS

LENGUA

10

Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribucin bidimensional.

b.

IDEA DE CORRELACION

Es frecuente que estudiemos sobre una misma poblacin los valores de dos variables estadsticas distintas, con
el fin de ver si existe alguna relacin entre ellas, es decir, si los cambios en una de ellas influyen en los valores
de la otra. Si ocurre esto decimos que las variables estn correlacionadas o bien que hay correlacin entre
ellas.
En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en Matemticas, mejor es
la de lengua.

c.

NUBE DE PUNTOS O DIAGRAMA DE DISPERSION

La primera forma de describir una distribucin bidimensional es representar los pares de valores en el plano
cartesiano. El grfico obtenido recibe el nombre de nube de puntos o diagrama de dispersin.

Modelos Inferenciales - 2014

63

d.

CORRELACION LINEAL Y RECTA DE REGRESION

Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva.
Aqu nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si as ocurre diremos que
hay correlacin lineal. La recta se denomina recta de regresin.

Hablaremos de correlacin lineal fuerte cuando la nube se parezca mucho a una recta y ser cada vez ms
dbil (o menos fuerte) cuando la nube vaya desparramndose con respecto a la recta.
En el grfico observamos que en nuestro ejemplo la correlacin es bastante fuerte, ya que la recta que hemos
dibujado est prxima a los puntos de la nube.
Cuando la recta es creciente la correlacin es positiva o directa: al aumentar una variable, la otra tiene
tambin tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlacin es
negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.
EJEMPLO:
Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la grfica se
describen el n de errores que corresponden a los intentos realizados.
Observa que hay una correlacin muy fuerte (los puntos estn "casi" alineados) y negativa (la recta es
decreciente).

Modelos Inferenciales - 2014

64

EJEMPLO:
A 12 alumnos de un centro se les pregunt a qu distancia estaba su residencia del Instituto, con fin de estudiar
si esta variable estaba relacionada con la nota media obtenida. Se obtuvieron los datos que figuran en la
siguiente tabla:
Distancia (en km) 0,05 0,1 0,12 0,4 0,5 0,7 1
Nota media

8,4

5,7

1,2 2,1 2,5 3

9,1 6,3 6,7 4,3 5,4 7,8 4,5 7,2 8,1

Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlacin es
prcticamente inexistente, es decir, no tiene nada que ver con el rendimiento acadmico la distancia del
domicilio al instituto.
e.

MEDIDA DE LA CORRELACION

La apreciacin visual de la existencia de correlacin no es suficiente. Usaremos un parmetro,


llamado coeficiente de correlacin que denotaremos con la letra, que nos permite valorar si sta es fuerte o
dbil, positiva o negativa.
El clculo es una tarea mecnica, que podemos realizar con una calculadora o un programa informtico.
Nuestro inters est en saber interpretarlo.
Antes de ponernos a trabajar destacaremos una de sus propiedades
-1 < r < 1
A continuacin tienes unos ejes con una nube de puntos. Las coordenadas de los puntos las puedes saber con
aproximacin haciendo clic en cualquier punto del plano y arrastrando hasta colocarte encima del punto.

Observa el valor de r, as como el ajuste de la nube a la recta. Intenta deducir las propiedades de r,
relacionando su valor con la forma de la nube y realizando los siguientes ejercicios.
Modelos Inferenciales - 2014

65

1. Acerca los puntos a la recta. Hacia qu valor se aproxima r?


2. Aleja los puntos de la recta, separndolos entre s Hacia qu valor se aproxima r?
3. Mueve los puntos hasta que la recta tenga pendiente negativa, es decir, sea decreciente. En estas
condiciones contesta a las preguntas anteriores.
4. Si alineas todos los puntos Qu valor aproximadamente toma r?

Modelos Inferenciales - 2014

66

f.

ESTIMACION MEDIANTE LA RECTA DE REGRESION

Es evidente que no todos dibujaramos exactamente la misma recta para una nube de puntos, aunque la
correlacin fuera bastante fuerte.
De todas las rectas posibles los matemticos han elegido como la mejor aproximacin la llamada de los
mnimos cuadrticos, Su clculo es tambin algo mecnico que podemos hacer con calculadora o un
ordenador. En el siguiente apartado encontrars un ejercicio para estudiar sus propiedades.
La recta de regresin sirve para hacer estimaciones, teniendo en cuenta que:
Los valores obtenidos son aproximaciones en trminos de probabilidad: es probable que el valor
correspondiente a x0 sea y0.
La fiabilidad es mayor cuanto ms fuerte sea la correlacin.
La fiabilidad aumenta al aumentar el nmero de datos.
La estimacin es ms fiable para los valores de x prximos a la media.

EJEMPLO:
Con los datos del primer ejemplo, (las notas de 10 alumnos en Matemticas y en Lengua), podemos contestar
con aproximacin a la siguiente cuestin: si un alumno no realiz el examen de lengua, pero s el de
matemticas, obteniendo un 7, qu nota cabe esperar que obtuviera en lengua?
MATEMTICAS

LENGUA

10

Observa el punto amarillo, cuya abscisa corresponde a la nota de matemticas y su ordenada a la nota que
esperamos que tenga en lengua. Es resultado es aproximado y relativamente fiable, ya que la correlacin es
fuerte Y el valor de la nota no est muy prximo a la media, aunque el n de datos que tenemos no es muy alto.
Puedes cambiar el valor de la nota de matemticas sin ms que cambiar su valor en el recuadro de la parte
inferior.

Modelos Inferenciales - 2014

67

g.

PROPIEDADES DE LA RECTA DE REGRESIN DE LOS MNIMOS CUADRTICOS

En la siguiente escena puedes comprobar las principales propiedades de la recta de regresin mnimocuadrtica.
1. Observa la recta blanca, cuyos coeficientes a y b puedes hacer variar en los recuadros inferiores de la
escena, bien con las flechas o introduciendo los valores deseados. Observa los segmentos
denominados di, que marcan las distancias de los puntos de la nube a la recta en la direccin del eje
OY.
Haz variar los valores de a y de b. Cuando la recta coincida con la recta de regresin mnimo-cuadrtica
(en color azul claro) la suma de los cuadrados de las distancias di es la mnima posible.
2. Observa el punto P(p,q), cuyas coordenadas puedes hacer variar en los recuadros correspondientes de
la parte inferior de la escena. Observa lo que ocurre si le das ap y a q los valores de las medias de la
distribucin (puedes escribir mx en la casilla de p y pulsar intro y escribir my en la casilla de q y pulsar
intro). Mueve ahora los puntos rojos y repite el ejercicio. qu propiedad puedes deducir?

En este link puedes revisar los ejercicios descritos anteriormente:


http://recursostic.educacion.es/descartes/web/materiales_didacticos/Correlacion_regresion_recta_regresion/correlacion_y_regresion.htm
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Variables_estadisticas_bidimensionales_regresion_correlacion/Indice.htm

ACTIVIDADES DE APRENDIZAJE
1. El coeficiente de correlacin de una distribucin bidimensional es 0,87. Si los valores de las variables se
multiplican por 10, cul ser el coeficiente de correlacin de esta nueva distribucin?
2. Hemos calculado la covarianza de una cierta distribucin y ha resultado negativa. Justifica por qu podemos
afirmar que, tanto el coeficiente de correlacin como las pendientes de las dos rectas de regresin, son
nmeros negativos.
3. Qu punto tienen en comn las dos rectas de regresin?
4. Qu condicin debe cumplir r para que las estimaciones hechas con la recta de regresin sean fiables?
Prueba que el producto de los coeficientes de regresin (correspondientes a cada uno de las rectas de
regresin) es igual al cuadrado del coeficiente de

Modelos Inferenciales - 2014

68

También podría gustarte