Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Asesor de Contenido
Prof. Susana Coves
Diseadora Instruccional
Prof. Luisa Mrquez
ESTADSTICA II
Trabajo Acompaado
Trabajo Independiente
Horas por semana
Total horas por trimestre
horas
3
3
6
42
UNIDAD
TEMTICA
1. Probabilidad
Participacin en desarrollo endgeno
Compromiso social
Habilidades y Destrezas
Relaciones asertiva.s
proyectos Formular
Conocimientos
Competencias a desarrollar
COMPETENCIAS
Actitudes y valores
2. Estimacin
Puntual
3. Prueba de
Hiptesis
4. Regresin y
Correlacin
Tabla de Contenidos
Programa instruccional
Introduccin
Contenidos de Repaso. Teora de conjuntos
UNIDAD 1 PROBABILIDAD
Experimento, Resultado y Evento
Distribuciones de probabilidad
o Probabilidad binomial
o Probabilidad normal
o Aproximacin de la distribucin normal a la binomial
UNIDAD 2 ESTIMACIN PUNTUAL
Poblacin y muestra
Mtodos de muestreo
Teorema del lmite central
Estimadores
o Estimador puntual
o Intervalos de confianza
o Determinacin de parmetros para la media y la proporcin
o Caractersticas de un buen estimador
Clculo del tamao de la muestra
UNIDAD 3 PRUEBA DE HIPTESIS
Qu es una hiptesis?
Qu es una prueba de hiptesis?
Procedimiento para probar una hiptesis
Prueba para una o dos colas
Pruebas para media y proporcin
UNIDAD 4 REGRESIN Y CORRELACIN
Variable dependiente e independiente
Diagrama de dispersin
Coeficiente de correlacin
Respuestas
Bibliografa
Anexos
Pg.
4
6
7
13
16
18
19
23
29
30
32
32
34
35
35
36
37
39
41
44
46
46
46
50
51
59
61
62
62
PROGRAMA INSTRUCCIONAL
Objetivo General:
Analizar situaciones organizacionales a travs de estadsticos idneos que permitan
considerar el efecto y la interaccin entre los diferentes factores que intervienen en la
toma de decisiones administrativas.
Sinopsis de Contenidos:
UNIDAD 1. PROBABILIDAD
Objetivo: Aplicar los conceptos de probabilidad que permitan reducir los riesgos en la
toma de decisiones
Conceptos bsicos:
Probabilidad
Experimento, resultado y evento
Espacio muestral
Punto muestral
Sucesos y sus probabilidades
Distribuciones de probabilidad
Variable aleatoria
Valor esperado
Probabilidad binomial
Probabilidad normal
Concepto, propiedades e importancia
Funcin de probabilidad
reas bajo la curva
Tablas
Ajuste de la distribucin normal a la distribucin experimental y a
la binomial
Estimadores
Caractersticas de los estimadores
Intervalos de confianza para la media y la proporcin
6
Coeficiente de determinacin
Modelo de anlisis de regresin lineal
Recta de mnimos cuadrados
Error estndar de estimacin
INTRODUCCIN
La Estadstica es la ciencia que se preocupa de la recoleccin de datos, su
organizacin y anlisis, as como de las predicciones que, a partir de estos datos,
pueden hacerse. Esas predicciones se realizan a travs de la estadstica inferencial
cuyo objetivo es sacar conclusiones generales para toda la poblacin a partir del
estudio de una muestra.
La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga del
estudio de los mtodos para la obtencin del modelo de probabilidad (forma funcional y
parmetros que determinan la funcin de distribucin) que sigue una variable aleatoria
de una determinada poblacin, a travs de una muestra (parte de la poblacin) obtenida
de la misma.
Los dos problemas fundamentales que estudia la inferencia estadstica son el
"Problema de la estimacin" y el "Problema del contraste de hiptesis" Cuando se
conoce la forma funcional de la funcin de distribucin que sigue la variable aleatoria
objeto de estudio y slo tenemos que estimar los parmetros que la determinan,
estamos en un problema de inferencia estadstica paramtrica, este tipo de problemas
son las que abordaremos en este material, el cual est conformado por cuatro unidades
sobre: Probabilidad, estimacin puntual, prueba de hiptesis y por ltimo correlacin y
regresin.
Contenidos de Repaso
Uniones, Intersecciones y Relaciones entre Eventos
Un conjunto es toda reunin de objetos. Con frecuencia es de utilidad identificar cmo
pueden relacionarse los conjuntos entre s. Con frecuencia es de utilidad identificar
cmo pueden relacionarse los conjuntos entre s. Se asume que se han identificado dos
conjuntos A y B. Cada uno contiene numerosos elementos. Es completamente posible
que algunos elementos. Es completamente posible que algunos elementos estn en
ambos conjuntos. Por ejemplo, se asume que el conjunto A consta de todos los
estudiantes de la clase de estadstica, y el conjunto B consta de todos los estudiantes
de la universidad que estn especializndose en economa. Aquellos elementos
(estudiantes) que estn en ambos conjuntos son los especialistas en economa de la
clase de estadstica. Tales estudiantes constituyen la interseccin entre A y B, que se
escribe A B y se lee como A interseccin B, consta de los elementos que son
comunes tanto a A como a B. Un diagrama de Venn es una herramienta til para
mostrar la relacin entre conjuntos, observemos:
A
Todos los
estudiantes la
clase
B
Todos los
especialistas en
economa
A interseccin de B
Especialistas en economa en la clase
Notacin
Por lo regular se usan letras maysculas para representar a los conjuntos, y letras
minsculas para representar a los elementos de un conjunto dado. Si
es un conjunto,
y
(lase
en
). La negacin de
de un conjunto
se escribe
, usamos la
donde el smbolo
ejemplo, el conjunto
. Por
El smbolo
Complemento de un conjunto
Dado un conjunto
, se representa por
al complemento de
, el cual es un
Subconjuntos y Superconjuntos
Un conjunto
se dice subconjunto de otro
elemento de
, es decir, cuando se verifique
, si todo elemento de
es tambin
,
sea cual sea el elemento . En tal caso, se escribe
.
Cabe sealar que, por definicin, no se excluye la posibilidad de que si
, se
cumpla A = B. Si
tiene por lo menos un elemento que no pertenezca al conjunto
,
pero si todo elemento de
es elemento de
, entonces decimos que
es un
subconjunto propio de
, lo que se representa por
.
Si
es un subconjunto de
, decimos tambin que
es un superconjunto de
, lo
que se escribe
. As pues
,
y tambin
significando
que
,
es superconjunto propio de
.
10
y
:
.
Si dos conjuntos
conjuntos disjuntos.
, entonces
se dicen
Diferencia
Los elementos de un conjunto
que no se encuentran en otro conjunto
otro conjunto llamado diferencia de
y
, representado por,
:
, forman
.
Vemos que
,
de manera que
11
. Pero tambin
,
de modo que
Diferencia simtrica
Se define la diferencia simtrica de dos conjuntos por
Cuantificadores
Los cuantificadores sirven para indicar cuantos elementos de un conjunto dado cumplen
con cierta propiedad. Tales cuantificadores son:
El cuantificador universal, representado por
. Este cuantificador se emplea para
afirmar que todos los elementos de un conjunto cumplen con determinada propiedad.
Se escribe
.
La proposicin anterior suele usarse como la equivalente de
El cuantificador existencial se usa para indicar que al menos un elemento de un
conjunto
cumple con una propiedad. Se escribe:
Aplicaciones
Sean
y
dos conjuntos. Un subconjunto
, lo que se representa por
, se dice aplicacin de
en
12
Si
, el elemento
antecedente de
por
por
, y el elemento
. Se emplea la notacin
por
se llama
se dice imagen de
, y por tanto
para representar a la
.
y
. Se define
,
y se dice que
Vemos que
y
por lo que
13
Unidad I
Probabilidad
Objetivo:
Conocer los conceptos de probabilidad a fin de establecer las posibles
relaciones entre eventos que permitirn reducir riesgos en a toma de
decisiones en a practica profesional
Contenidos:
Probabilidad normal
Conceptos Bsicos
Probabilidades
Experimentos, resultados y evento
Espacio muestral
Punto muestral
Sucesos y sus probabilidades
Distribuciones de probabilidad
Variable aleatoria
Valor esperado
Probabilidad binomial
Probabilidad normal
14
No s cuando
podr realizarse el
sueo de Bolvar
pero nosotros
iremos poniendo
las piedras
Augusto
Sandino
Probabilidad
Probabilidad es un concepto que en administracin nos permite trabajar en funcin de
nuestras expectativas con la ocurrencia algn resultado, esto significa que hacemos
proyecciones sobre la posibilidad de xito o fracaso de un suceso, lo que a su vez
genera una reduccin de riesgos y de incertidumbre en la toma de decisiones.
Probabilidad es una palabra que empleamos de forma cotidiana, y, efectivamente
cuando preguntamos Qu probabilidad hay de que est listo para hoy? Suponemos
que la persona que va a contestar nos dar una respuesta que nos permitir
proyectarnos y predecir eventos a futuro; si la respuesta es no creo por que tienes
varias personas por delante eso nos va programando para dos acciones que impedirn
que ese evento interrumpa nuestro accionar. As mismo pasa en administracin, pues
un administrador debe considerar todos los escenarios posibles a la hora de decidir las
acciones que debe emprender una organizacin, a fin de minimizar la incertidumbre y
reducir riesgos.
El propsito de esta unidad es ofrecer en una primera parte los conceptos bsicos
sobre probabilidad y luego la aplicacin de dichos conceptos en la construccin de las
distribuciones de probabilidad, que es una lista que contiene todos los resultados de un
experimento y la probabilidad de ocurrencia de cada uno de ellos.
15
UNIDAD I. PROBABILIDAD
Probabilidad
Es la posibilidad de que algo va a ocurrir, es medida entre 1 y 0. Mientras mayor sea la
probabilidad de que el evento ocurra, la probabilidad asignada estar ms cerca de
uno, si hay certeza del que el evento va a ocurrir la probabilidad es de 1, y por el
contrario la posibilidad de que no ocurra es de 0.
Existen tres formas de enfocar la probabilidad: el modelo de frecuencia relativa, el
modelo subjetivo y el modelo clsico. El modelo de frecuencia relativa utiliza datos que
se han observado empricamente, registra la frecuencia con que ha ocurrido algn
evento en el pasado y estima la probabilidad de que el evento ocurra nuevamente con
base en estos datos histricos. La probabilidad de un evento con base en el modelo de
frecuencia relativa se determina mediante:
P (E)=
Si por ejemplo durante el ao pasado hubo 200 nacimientos en un hospital local, de los
cuales 122 fueron varones el modelo de frecuencia relativa revela que la probabilidad
de que el prximo nacimiento o un nacimiento seleccionado al azar sea una nia se
obtiene dividiendo el nmero de nias que naci el ao anterior dividido entre le nmero
total de nacimientos:
P ( nia )
78
0,39
200
1
0,5
2
En este ejemplo slo hay una posibilidad de que salga cara, y dos posibles resultados,
que salga cara o que salga sello. Segn el resultado de la ecuacin existen iguales
posibilidades de que salga cara o sello, pues la probabilidad se halla en medio de 0 y 1.
Aun sin conocer a fondo la probabilidad clsica, se puede estar consciente de que la
probabilidad de obtener una cara en el lanzamiento de una moneda es de la mitad.
Tipos de
Probabilidad
Probabilidad
Objetiva
Modelo Clsico
Probabilidad
Modelo de
Frecuencia
Relativa
Modelo Subjetivo
Experimento
Seguramente asocias la palabra experimento a las ciencias fsicas donde nos
imaginamos a alguien mezclando qumicos y manipulando tubos de ensayos, sin
embargo, en administracin se realizan experimentos para conocer los posibles
resultados de una accin. Se dice que experimento es toda accin definida que conlleva
a un resultado nico bien definido que tiene dos o ms posibles resultados y no se sabe
cul va a ocurrir.
Resultado
Una consecuencia particular de un experimento.
Evento
Una coleccin de uno o ms resultados. De acuerdo a como se relacionan los eventos
de un experimento se pueden clasificar en: mutuamente excluyentes, colectivamente
exhaustivos, independientes o complementarios.
Mutuamente excluyente: la ocurrencia de cualquiera de los eventos implica que
ninguno de los otros eventos puede ocurrir al mismo tiempo. Como ejemplo tenemos el
lanzamiento de una moneda en la cual si sale cara garantiza que no puede salir sello.
17
Colectivamente exhaustivo: por lo menos uno de los eventos tiene que ocurrir, un
ejemplo es el lanzamiento de un dado, los resultados posibles son 1,2,3,4,5 y 6 y existe
la certeza que uno de ellos va a ocurrir.
Independientes: son eventos en los que la ocurrencia de uno no tiene nada que ver con
la ocurrencia del otro, por ejemplo lanzar un dado y una moneda a la vez, el resultado
del lanzamiento del dado no afecta al de la moneda.
Complementarios: son los eventos en los que si un evento no ocurre debe ocurrir el
otro. Una buena representacin de estos eventos la podemos apreciar al lanzar un
dado podemos decir que un evento A es sacar un nmero par, pero si esto no ocurre, el
complemento es sacar un nmero impar. En estos casos los eventos se denominan A
y no A.
Existe una ltima categora que son los eventos compuestos consiste en la coocurrencia de dos o ms eventos aislados. Las operaciones de conjuntos de
interseccin y unin implican eventos compuestos. De esta manera si se lanza una
moneda y un dado a la vez el resultado es un evento compuesto y se puede calcular la
probabilidad de tal evento. Los eventos compuestos son ms interesantes e incluso
ms tiles en la administracin ya que por medio de ellos pueden estudiarse las
relaciones entre dos sucesos que ocurren de forma paralela.
Para que visualicemos mejor las definiciones de experimento, resultado y evento,
observemos el siguiente cuadro:
Experimento: Tirar un dado
Obtener un 1
Obtener un 2
Todos los resultados Obtener un 3
posibles
Obtener un 4
Obtener un 5
Obtener un 6
Obtener un nmero par
Algunos eventos
Obtener un nmero mayor que 4
posibles
Obtener el nmero 3 o uno menor
En el experimento del lanzamiento de un dado hay seis posibles resultados, pero hay
muchos eventos posibles.
Ejercicio 1:
Clasifica los siguientes eventos:
El lanzamiento de dos monedas a la vez ___________________________________
Que un vuelo de avin salga retrasado ____________________________________
Que un beb sea varn ________________________________________________
Que la comida de hoy no quede salada ____________________________________
Que en la prxima temporada de bisbol Magallanes sea el campen____________
18
2
3
4
5
El conjunto de los
nmeros del 1 al 6, es el
espacio muestral
U = {1,2,3,4,5,6}
Distribuciones de Probabilidad
Una distribucin de probabilidad aporta el rango completo de valores susceptibles de
ocurrir con base en un experimento. Una distribucin de probabilidad es similar a una
distribucin de frecuencia, con la diferencia que no describe el pasado sino muestra que
tan probable es que ocurra un evento. Dado que esta clase de distribuciones se ocupan
de las expectativas son modelos de gran utilidad para hacer inferencias y tomar
decisiones en condiciones de incertidumbre.
Variable Aleatoria.
Una variable aleatoria es aquella que asume diferentes valores, a consecuencia de los
resultados de un experimento aleatorio, cada uno de los cuales tiene una determinada
probabilidad. Por ejemplo si contamos la cantidad de alumnos inasistentes a las clases
de estadstica II durante un mes, el nmero de ausencias es la variable aleatoria. Si esa
variable toma slo valores enteros, se dice que es de tipo discreto, tal es el caso del
ejemplo anterior, sera imposible decir que faltaron 3,5 estudiantes. Pero si por el
19
contrario la variable puede tomar valores fraccionarios se dice que es de tipo continuo.
Un ejemplo de una variable aleatoria discreta es el peso de los perros que recibe un
veterinario en su consulta, 50.5 Kg, 25.6 Kg, etc.
Una variable aleatoria es una variable
cuyo valor es el resultado de un evento
aleatorio.
Supongamos que tenemos una variable aleatoria x, y que esta puede tomar los valores
x1, x 2 , x 3 ...x n que pueden ser discretos o continuos; cada uno de estos valores tiene
cierta probabilidad que en la prctica se desconoce; sin embargo, a travs de
planteamientos tericos podemos obtener dichas probabilidades, a las cuales
designamos por f(x); al desarrollo que toman estos valores de f(x), es lo que se llama
distribuciones de probabilidad de la variable aleatoria x. Estas distribuciones de
probabilidad toman diferentes formas o tipos, sin embargo, las ms importantes son la
distribucin binomial y la distribucin normal.
Valor Esperado.
El valor esperado es un concepto fundamental en el estudio de las distribuciones de
probabilidad. Desde hace muchos aos este concepto ha sido aplicado ampliamente en
el negocio de seguros y en los ltimos veinte aos ha sido aplicado por otros
profesionales que casi siempre toman decisiones en condiciones de incertidumbre.
Para obtener el valor esperado de una variable aleatoria discreta, multiplicamos cada
valor que sta puede asumir por la probabilidad de ocurrencia de ese valor y luego
sumamos los productos. Es un promedio ponderado de los resultados que se esperan
en el futuro.
Probabilidad Binomial
Es una distribucin de probabilidad que emplea las variables aleatorias discretas, su
principal caracterstica es que slo existen dos resultados posibles para cada
experimento, gracias a ello su nombre binomial; adems posee las siguientes
propiedades:
1. Slo debe haber dos resultados posibles. Uno se identifica como xito y el otro como
fracaso, pero este resultado no trae una connotacin de bueno o malo, es decir, un
xito no significa que el resultado sea deseable.
2. La probabilidad de que una observacin se clasifique como xito, p, es constante de
observacin a observacin. Por tanto, la probabilidad de que una observacin se
clasifique como fracaso, q= 1-p, es constante sobre todas las observaciones.
3. Cada observacin puede clasificarse en una o dos categoras mutuamente
excluyentes y colectivamente exhaustivas. El resultado de cualquier observacin es
independiente del resultado de cualquier observacin.
4. El experimento puede repetirse muchas veces, pues un experimento no afecta al
otro.
20
Probabilidad de xito.
Probabilidad de fracaso.
Nmero de xitos deseados.
Nmero de ensayos efectuados.
n!
p r q nr
r! ( n r )!
r
nr
Utilicemos la frmula P r! (n r )! p q , considerando que n=5 vuelos, y p=0,20
No olvides que
q=1-p
P
n!
5!
120
p r q n r
0,20 0 0,80 5
1(0,3277) 1(0,3277) 0,3277
r!( n r )!
0!(5 0)!
1(120)
n!
5!
120
p r q n r
0,2010,80 4
0,2(0,4096) 5(0,08) 0,4096
r!( n r )!
1!(5 1)!
1( 24)
n!
5!
120
p r q n r
0,20 5 0,80 0
0,0032(1) 1(0,0032) 0,0032
r!( n r )!
5!(5 5)!
120(1)
Ejercicio 2:
Ahora realiza t la ecuacin sustituyendo r por los valores 2, 3 y 4. En la tabla de la
Distribucin Binomial, que se te presenta a continuacin, se muestran los resultados
para que verifiques tu ejercicio:
Distribucin Binomial para n=5, p=0,20
Nmero de Vuelos con
Retraso
0
1
2
3
4
5
Total
Probabilidad
0.3277
0.4096
0.2048
0.0512
0.0064
0.0003
1.0000
22
Ejercicio 3:
Imaginemos una escuela primaria donde los alumnos llegan tarde a menudo. Cinco
alumnos estn en el jardn de nios. La directora lleva tiempo estudiando el problema,
habiendo llegado a la conclusin de que hay una probabilidad de 0.4 de que un alumno
llegue tarde y de que los alumnos lleguen independientemente uno de otro Cmo
trazamos una distribucin binomial de probabilidad que ilustre las probabilidades de que
0,1,2,3,4 5 estudiantes lleguen tarde simultneamente?
n. p.q
donde :
n= nmero de ensayos.
p= probabilidad de xito.
q= probabilidad de fracaso.
Recuerda que la
Desviacin Estandar se
determina calculndole la
raz cuadrada de la
Varianza( 2 ), por lo que
inferimos que 2 (npq )
23
Ejemplo:
Una mquina empaquetadora que produce 20% de paquetes defectuosos. Si se extrae
una muestra aleatoria de 10 paquetes, podremos calcular la media y la desviacin
estndar de la distribucin binomial de ese proceso en la forma que sigue:
= np = 10*0.2 = 2 Media.
= npq = (10) (0.2) (0.8) = 1.6 = 1.265 Desviacin estndar.
Probabilidad normal
De todas las distribuciones de probabilidad la normal es la ms importante. Esta
distribucin es frecuentemente utilizada en las aplicaciones estadsticas; su propio
nombre indica su extendida utilizacin, justificada por la frecuencia o normalidad con la
que ciertos fenmenos tienden a parecerse en su comportamiento a esta distribucin.
Muchas variables aleatorias continuas presentan una funcin de densidad cuya grfica
tiene forma de campana. En otras ocasiones, al considerar distribuciones binomiales,
tipo B(n,p), para un mismo valor de p y valores de n cada vez mayores, se ve que
sus polgonos de frecuencias se aproximan a una curva en "forma de campana".
La distribucin normal de probabilidad es una distribucin de probabilidad continua
tanto simtrica como mesocrtica. La curva de probabilidad de probabilidad que
representa a la distribucin normal de probabilidad tiene forma de campana
Leptocrtica
Ambas mitades de la
campana son idnticas
Mesocrtica
Platicrtica
24
Donde:
X: es el valor de cualquier observacin o medicin especfica.
: es la media de la distribucin.
: es la desviacin estndar de la distribucin
Para cualquier distribucin normal de probabilidad, todos los intervalos que contienen el
mismo nmero de desviaciones estndar a partir de la media contendrn la misma
fraccin del rea total bajo la curva para cualquier distribucin de probabilidad normal.
Ejemplo
(Tomado
continua.shtml)
de
http://www.monografias.com/trabajos26/distribucion-continua/distribucion-
= 0.718
Distribucin
Normal Estndar
Normal
11
Media
10.55
Desviacion Estandar
0.71
0.64
28
f(X)
f(Z)
8.42
0.0013
-3
0.0013
9.13
0.0227
-2
0.0227
9.84
0.1591
-1
0.1591
10.55
0.5019
0.5019
11.26
0.8432
0.8432
11.97
0.9778
0.9778
11.26
0.8432
0.8432
Interpretacin:
La probabilidad de que el valor de hemoglobina en una gestante adolescente que curse
el tercer trimestre del embarazo sea menor a 11 mg/dl es de 0.64. Es decir, el 64% de
las gestantes adolescentes que acuden a maternidad de Lima sufren de anemia
asociada a la gestacin.
Ejercicio 4:
El costo de una chupetas de diferentes marcas tiene una distribucin aproximadamente
normal con una media de 500 y una desviacin estndar de 10Cul es el valor z para
un valor x de 520 y otro de 490?
Uso de la tabla de distribucin de probabilidad normal estndar.
En esta tabla, el valor z est derivado de la frmula:
z = (x - m ) / s
en la que:
29
30
Unidad II
Estimacin Puntual
Objetivo:
Calcular los intervalos de confianza de los estimadores para la toma de
decisin.
Contenidos:
Poblacin y muestra
Mtodos de muestreo
Muestro aleatorio simple
Muestreo aleatorio sistemtico
Muestreo aleatorio estratificado
Muestreo por conglomerados
Estimadores
Intervalos de confianza para la media y la proporcin
Determinacin del tamao de la muestra
31
Vive como si
fueras a morir
maana.
Aprende como
si fueras a vivir
siempre.
Mohandas
Gandhi
Estimacin Puntual
En administracin es usual realizar estudios en los que se aborden diversas
poblaciones, sin embargo acceder a cada miembro de esas poblaciones es un trabajo
imposible de realizar, por ello se seleccionan muestras que nos den una evidencia de lo
que gusta, opina, etc. una poblacin, no obstante el hecho de no poseer los datos
reales nos obliga a estimarlos, para ello existen los estimadores. En esta unidad
encontrars algunos aspectos relacionados con los estimadores puntuales y sus
intervalos de confianza.
32
misma probabilidad de ser incluidos por lo tanto se corre el riesgo de que los resultados
estn sesgados, lo que significa que los resultados no sean representativos a la
poblacin.
Muestreo Aleatorio Simple
Una muestra aleatoria simple puede obtenerse simplemente enumerando las
observaciones sobre pedazos idnticos de papel, colocndolos en un sombrero y
sacando el nmero deseado de modo que cada uno de los elementos o personas en la
poblacin tenga las mismas probabilidades de ser incluidos. Adems, tambin puede
hablarse de la tabla de nmeros aleatorios.
Muestreo Sistemtico
Una muestra sistemtica se forma seleccionando cada i-simo tem de la poblacin. Si
se determina que i es igual a 10, una muestra sistemtica consta de cada dcima
observacin en la poblacin. La poblacin debe ordenarse o enumerarse en forma
aleatoria. La primera seleccin debe determinarse aleatoriamente, y si i= 10, entonces
estar en alguna de las primeras 10 observaciones. El punto inicial exacto puede
identificarse bien sea seleccionando un nmero entre 1 y 10 sacado de un sombrero, o
utilizando una tabla de nmeros aleatorios. En cualquiera de los casos se selecciona de
all en adelante cada dcima observacin.
Este muestreo es ventajoso porque no requiere de un experto altamente calificado para
contar hasta 10 y registrar el resultado. Adems el mtodo permite flexibilidad ya que
puede establecerse que i sea 10, 100, 1000 o cualquier otro nmero deseado. La
determinacin del valor apropiado para i tambin es muy fcil. Si se desea seleccionar
una muestra de tamao 100 de una poblacin de 1000. El peligro principal que debe
evitarse es la ocurrencia de un patrn en el ordenamiento de la poblacin. Por ejemplo
enumerar a la poblacin alfabticamente.
Muestreo Estratificado
Una muestra estratificada se divide una poblacin en subgrupos llamados estratos, y se
selecciona una muestra para cada uno de ellos, forzando las proporciones de la
muestra de cada estrato para que est conforme al patrn poblacional. Se emplea
comnmente cuando la poblacin es heterognea, o dismil, aunque ciertos grupos
homogneos puedan aislarse. De esta forma el investigador puede incrementar la
precisin ms all del obtenido por una muestra aleatoria simple de tamao similar.
Muestreo por Conglomerados
El muestreo por conglomerados ofrece ciertas ventajas sobre otros mtodos. Consiste
en dividir toda la poblacin en conglomerados o grupos y luego seleccionar una
muestra de estos conglomerados. Todas las observaciones en estos conglomerados
seleccionados estn incluidas en la muestra. Este procedimiento con frecuencia es
34
X x
X x
X x
60 50
2
5
X x
725 700
1,44
17,3
Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749
Es decir, la probabilidad de que la suma de las rentas de 100 personas seleccionadas al
azar supere los 725 millones de bolvares es tan slo del 7,49%
Ejercicio 5
En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada
clase es del 10%. A lo largo del ao tienes 100 clases de esa asignatura. Cul es la
probabilidad de tener que salir a la pizarra ms de 15 veces?
Estimadores
Estimador puntual:
Es un valor que se calcula a partir de la informacin de la muestra, y que se usa para
estimar el parmetro de la poblacin. Cuando no poseemos los datos de una poblacin
es necesario estimar la media de la poblacin, para ello utilizamos un nmero nico. A
ese nmero se le conoce como estimador puntual. No obstante un estimador puntual
slo se refiere a una parte de la historia. Si bien no se espera que es estimador puntual
36
est prximo al parmetro de la poblacin, se deseara expresar que tan cerca est,
para ello sirve el intervalo de confianza.
Un estimador puntual es el valor numrico de una estadstica muestral empleado para
estimar el valor de un parmetro de la poblacin o proceso. Una de las caractersticas
ms importante de un estimador es que sea insesgado. Un estimador insesgado es
una estadstica muestral cuyo valor esperado es igual al parmetro por estimar. A
continuacin se presentan algunos de los estimadores puntales de uso ms frecuente:
Parmetro de la Poblacin
Media,
Diferencia entre las medias de dos poblaciones,
1 2
X1 - X 2
Proporcin,
Estimador
X
poblaciones
de
dos
p 1 p 2
s2
Intervalo de Confianza:
EL intervalo de confianza es un rango de valores que se construyen a partir de datos de
la muestra de modo que el parmetro ocurre dentro de dicho rango con una
probabilidad especfica. La probabilidad especfica se conoce como nivel de confianza.
La media de la muestra es un estimador puntual de la media de la poblacin, por lo que
si una tienda desean estimar la edad promedio de las personas que compran equipos
de computacin, con tan solo tomar una muestra aleatoria de los compradores
recientes pueden determinar la edad de la poblacin, por lo tanto la media de la
muestra estima la media de la poblacin.
Cuando el tamao de la muestra, n, es por lo menos de 30, generalmente se acepta
que el teorema del lmite central asegurar una distribucin normal de las medias de las
muestras. Esta consideracin es importante. Si las medias de las muestras tienen una
distribucin normal, es posible usar la distribucin normal estndar, es decir, z, en
nuestros clculos. Los intervalos de confianza de 95 y 99 por ciento se calculan de la
siguiente forma cuando n es igual o mayor que 30.
37
n
s
Intervalo de confieanza de 99 % para una media x 2,58
n
s
n
P (X xitos)=
X
, donde:
n
X= nmero de xitos
N= tamao de la muestra
Cmo se calcula el intervalo de confianza para proporcin de la poblacin
P z p
Donde
38
c) Una idea del valor aproximado del parmetro que queremos medir (en este caso una
proporcin). Esta idea se puede obtener revisando la literatura, por estudio pilotos
previos. En caso de no tener dicha informacin utilizaremos el valor p = 0.5 (50%).
Ejemplo: A cuantas personas tendramos que estudiar para conocer la prevalencia de
diabetes?
Seguridad = 95%; Precisin = 3%: Proporcin esperada = asumamos que puede ser
prxima al 5%; si no tuvisemos ninguna idea de dicha proporcin utilizaramos el valor
p = 0,5 (50%) que maximiza el tamao muestral:
donde:
Za 2 = 1.962 (ya que la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1 0.05 = 0.95)
d = precisin (en este caso deseamos un 3%)
donde:
N = Total de la poblacin
Za2 = 1.962 (si la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1-0.05 = 0.95)
d = precisin (en este caso deseamos un 3%).
A cuntas personas tendra que estudiar de una poblacin de 15.000 habitantes para
conocer la prevalencia de diabetes?
Seguridad = 95%; Precisin = 3%; proporcin esperada = asumamos que puede ser
prxima al 5% ; si no tuviese ninguna idea de dicha proporcin utilizaramos el valor p =
0.5 (50%) que maximiza el tamao muestral.
(Tomado de http://www.fisterra.com/material/investiga/8muestras/8muestras.htm)
Donde:
x = es el error de la media llamado tambin desviacin estndar de la distribucin
muestra de medias
= es la desviacin estndar de la poblacin
n= es el tamao de la muestra
En la mayora de los casos se desconoce la desviacin estndar de la poblacin, por lo
que se le estima por la desviacin estndar de la muestra, ello implica que en la frmula
presentada anteriormente se reemplaza (desviacin estndar de la muestra) por s
(desviacin estndar de la muestra). Vale la pena acotar que mientras ms mayor sea
el valor de n el error en el muestreo es menor
Caractersticas de un buen estimador
Cuando se tiene una frmula para estimar y se aplica a una muestra aleatoria, el
resultado es aleatorio, es decir los estimadores son variables aleatorias.
Por ejemplo si se recibe un embarque de objetos que pueden:
defectuosos.
Podemos seleccionar al azar algunos de ellos para darnos una idea de la proporcin de
defectuosos en el embarque. El parmetro de inters es la proporcin de defectuosos
en toda la poblacin, pero lo que observamos es la proporcin de defectuosos en la
muestra. El valor de la proporcin en la muestra es una variable aleatoria cuya
distribucin est emparentada directamente con la binomial (si se tratara del nmero de
defectuosos, sera binomial).
Como cualquier variable aleatoria, el estimador tiene
Distribucin de probabilidad.
Valor esperado.
Ya que es muy probable que el valor del estimador est cerca de su valor esperado,
una propiedad muy deseable es que ese valor esperado del estimador coincida con el
del parmetro que se pretende estimar. Al menos, quisiramos que el valor esperado no
difiera mucho del parmetro estimado. Por esa razn es importante la cantidad que,
tcnicamente llamamos sesgo. El sesgo es la diferencia entre el valor esperado del
estimador y el parmetro que estima.
Si el sesgo 0, se dice que el estimador es instigado y sta es una caracterstica buena
para un estimador. Un estimador que es instigado tiene una alta probabilidad de tomar
un valor cercano al valor del parmetro.
Varianza de un estimador
Otra propiedad importante de un estimador es su varianza (o su raz cuadrada, la
desviacin estndar). La importancia de la desviacin estndar es que nos permite
darle un sentido numrico a la cercana del valor del estimador a su valor esperado.
Entre menor sea la desviacin estndar (o la varianza) de un estimador, ser ms
probable que su valor en una muestra especfica se encuentre mas cerca del valor
41
esperado. Para aclarar esto, considere dos estimadores T1 y T2, suponga que ambos
son instigados y suponga que la varianza de T1 es menor que la de T2 Qu quiere
decir esto? Simplemente que en un entorno fijo del valor del parmetro, los valores de
T1 son ms probables que los de T2. O sea que vamos a encontrar a T1 ms cerca del
valor del parmetro que a T2. Esto hace que nuestras preferencias estn con T1.
Cuando un estimador tiene una varianza menor que otro decimos que el estimador es
ms eficiente.
Por lo tanto, e
( X )
Z
donde( X )
n
n
Z
de all se despeja n para calcular el tamao de la muestra
n
z 2 2
Para una poblacin infinita n 2
e
42
Z 2 2
e2
ps p
pq
n
z 2 pq
pq . Se llega a: n
e2
n
Z 2 pq
e2
En resumen:
Parmetro. Son las medidas o datos que se obtienen sobre la poblacin.
Estadstico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una
estimacin de los parmetros.
Error Muestral, de Estimacin o Standard. Es la diferencia entre un estadstico y su
parmetro correspondiente. Es una medida de la variabilidad de las estimaciones de
muestras repetidas en torno al valor de la poblacin, nos da una nocin clara de hasta
dnde y con qu probabilidad una estimacin basada en una muestra se aleja del valor
que se hubiera obtenido por medio de un censo completo. Siempre se comete un error,
pero la naturaleza de la investigacin nos indicar hasta qu medida podemos
cometerlo (los resultados se someten a error muestral e intervalos de confianza que
varan muestra a muestra). Vara segn se calcule al principio o al final. Un estadstico
ser ms preciso en cuanto y tanto su error es ms pequeo. Podramos decir que es la
desviacin de la distribucin muestral de un estadstico y su fiabilidad.
Nivel de Confianza. Probabilidad de que la estimacin efectuada se ajuste a la
realidad. Cualquier informacin que queremos recoger est distribuida segn una ley de
probabilidad (Gauss o t de Student), as llamamos nivel de confianza a la probabilidad
de que el intervalo construido en torno a un estadstico capte el verdadero valor del
parmetro.
Varianza Poblacional. Cuando una poblacin es ms homognea la varianza es menor
y el nmero de entrevistas necesarias para construir un modelo reducido del universo, o
43
44
Unidad III
Prueba de Hiptesis
Objetivo:
Aplicar con propiedad y de forma pertinente a situaciones
administrativas la prueba de hiptesis
Contenidos:
Qu es una hiptesis
Qu es una prueba de hiptesis
Contraste de hiptesis
Paramtricas (Media aritmtica y proporcin)
Para una poblacin
Para dos poblaciones
45
Prueba de Hiptesis
Siempre las personas, en diversas oportunidades y circunstancias, hemos realizado
afirmaciones considerando experiencias previas, conocimientos superficiales de algo,
etc. Esas afirmaciones las llamamos hiptesis, y esas hiptesis pueden ser aceptadas o
rechazadas; sin embargo en estadstica para poder aceptar o rechazar una hiptesis se
deben realizar una serie de clculos que sustenten la veracidad o no de ese supuesto,
para ello existe la prueba de hiptesis.
La prueba de hiptesis es un procedimiento mediante el cual se prueba
estadsticamente si una hiptesis es verdadera o no. En esta unidad encontrars los
pasos para realizar una prueba de hiptesis en funcin de la media aritmtica y la
proporcin para una y dos poblaciones
46
Paso 1
Establecer las
hiptesis nula y
alternativa
Paso 2
Seleccionar un
nivel de
significancia
Paso 3
Identificar la
estadstica de
prueba
Paso 4
Formular la
regla de
decisin
No rechazar H0
Rechazar H0 y
Aceptar H1
Paso 5
Tomar una
muestra, llegar
a una decisin
48
H0
Es verdadera
Decisin
correcta
Error tipo I
H0
Es falsa
Error tipo II
Decisin
correcta
49
X x
Probabilidad de 0,95
Probabilidad de 0,05
Valor Crtico
Valor Crtico
Punto de divisin entre la regin en que se rechaza la
hiptesis nula y la regin en la que no se rechaza
50
Los valores crticos determinan la zona de rechazo. Para hallarlos se divide entre dos
el 95%. En la tabla z (revisar anexos), el rea de 0,95/2=0,4750 lo que indica un valor
de 1.96. El 5% restante est distribuido entre las dos colas, son 2,5% en cada zona de
rechazo. Es posible encontrar los valores crticos al otro lado de la cola:
51
Ejemplo:
Una cooperativa fabricante de salsa de tomate indican en su etiqueta que el contenido
de la botella es de 16 onzas. Cada hora se toma una muestra de 36 botellas y se pesa
el contenido. La muestra de la ltima hora tiene un peso medio de 16.12 onzas con una
desviacin estndar de .5 onzas. Est el proceso fuera de control para un nivel de
significancia de .05?
Paso 1: establezca la hiptesis nula y alterna
Paso 2: establezca la regla de decisin:
Paso 3: calcule el valor del estadstico de prueba: H 0 se rechaza si z <- 1.96 o z > 1.96
Paso 4: decisin sobre H0: no se rechaza H0 porque 1.44 es menor que el valor crtico
1.96
52
(Tomado de
monografas.com)
Da
Usuarios Da
Usuario
356
11
305
21
429
427
12
413
22
376
387
13
391
23
328
510
14
380
24
411
288
15
382
25
397
290
16
389
26
365
320
17
405
27
405
350
18
293
28
369
403
19
276
29
429
x
s
n
52,414
x
s
54
iguales. Para este caso se siguen igualmente los cinco pasos planteados pero habr
una diferencia en la frmula para la estadstica z:
Z
X1 X 2
s12 s 22
n1 n2
GRUPO
B
4
Proporcionan los datos evidencias suficientes que indique que la efectividad de los
dos tratamientos no es la misma? Utilice un nivel de significacin de 0.05.
Solucin:
1. Planteamiento de hiptesis:
Ho: 1 = 2
H1: 1 2
2. Nivel de significancia de: = 0.05
3. Prueba estadstica:
Z
X1 X 2
s12 s 22
n1 n2
3,85 2,71
2,85 2
7
7,42 2
1,14
1,16 7,86
1,14
9,02
1,14
3
0,38
56
pP
, donde:
P es la proporcin de la poblacin
p es la proporcin de la muestra
n tamao de la muestra
p es el error estndar de la proporcin de la poblacin. Se calcula por
p (1 p ) / n
pP
p (1 P )
n
pP
p (1 P)
n
1550
0,80
2000
2,80
0,80(1 0,80)
2000
El valor z -2,80 est en la zona de rechazo, de modo que la hiptesis nula queda
rechazada en el nivel 0,05.
Ejercicio:
Se dan las siguientes hiptesis
57
H0= p 0.70
H1=p>0.70
Una muestra de 100 observaciones revel que p=0.75. En el nivel de significancia de
0,05Es posible rechazar la hiptesis nula?
Prueba para la Diferencia entre dos Proporciones Poblacionales
En este tipo de pruebas interesa saber si dos proporciones de la poblacin son iguales.
A continuacin se presentan algunos ejemplos:
Una cooperativa de ropa casual elabor un nuevo diseo de camisas para
caballeros, el nuevo modelo se le mostr a un grupo de posibles compradores
menores de 30 aos y a otros mayores de 60 aos. La cooperativa desea saber si
existe diferencia en la proporcin de personas de ambos grupos a quienes les gusta
el nuevo diseo.
Una aerolnea est investigando sobre el miedo a volar entre adultos, de forma
especfica quieren saber si existe alguna diferencia significativa entre la proporcin
de hombres y de mujeres.
p1 p 2
p c (1 p c pc (1 pc )
n1
n2
Donde:
n1 es el nmero en la primera muestra
n2 es el nmero en la segunda muestra
p1 es la proporcin en la primera muestra que posee la caracterstica
p2 es la proporcin en la segunda muestra que posee la caracterstica
pc es la proporcin conjunta que posee la caracterstica en la muestra combinada, se
calcula con la siguiente frmula:
X X
Nmero _ total _ de _ xitos
1 2
Proporcin conjunta pc
Nmero _ total _ de _ las _ muestras n1 n2
Donde:
X1 es el nmero que posee la caracterstica en la primera muestra
X2 es el nmero que posee la caracterstica en la segunda muestra
Ejemplo
Una fbrica de perfumes desarrollo una nueva fragancia llamada Rojo. Varias pruebas
indican que tiene una muy buena aceptacin en el mercado, sin embargo interesa saber
si el perfume lo prefieren mujeres jvenes o maduras. Se tomar una muestra aleatoria
de mujeres jvenes y maduras y se les realizar una prueba dndoles a oler varios
perfumes entre ellos Rojo y se les piden que indiquen el que ms les guste.
H0 no hay diferencia entre la proporcin de mujeres jvenes y maduras que prefieren
Rojo. La hiptesis alterna es que ambas proporciones no son iguales.
Ho: p1 p 2
H1: p1 p 2
58
X1
20
0.20
n1
100
p2
X 2 100
0.50
n2
200
0.40
n1 n 2
100 200 300
Observemos que la proporcin conjunta de 0.40 est ms cerca de 0.50 que de 0.20.
Esto se debe a que el muestreo incluy ms mujeres maduras.
p1 p 2
0.20 0.50
0.3
z
5.0
0.06
p c (1 p c p c (1 p c )
0.4(1 0.4) 0.40(1 0.4)
100
200
n1
n2
El valor z calculado de -5 est en el rea de rechazo, es decir, que la hiptesis de que
es igual la proporcin de mujeres jvenes y maduras que prefieren Rojo se rechaza, por
lo que se acepta la hiptesis alternativa.
Ejercicios: Realzalos y comprtelos con tu grupo de estudio y tu profesor asesor.
1. De 150 adultos que probaron unos caramelos nuevos de sabor a durazno, 87 les
parecieron muy buenos. De 200 nios a 123 les gustaron muchsimo. Utilizando un
nivel de significancia de 0.10 se puede concluir que existe una diferencia
significativa en la proporcin de adultos contra la de nios que consideran el nuevo
sabor como excelente.
a. Cul es la hiptesis nula y la alternativa
b. Cual es la probabilidad de un error tipo I
c. Es una prueba de una o dos colas, por qu
d. Cual es el valor crtico
e. Debera rechazarse la hiptesis nula
2. Las hiptesis son: H0: p1 p 2 y H1: p1 p 2 . Una muestra de 200 observaciones de
la primera poblacin indic que X 1 es 170. Una muestra de 150 observaciones de la
segunda poblacin revel que X 2 es de 110. Use el nivel de significancia de 0.05
para probar la hiptesis.
59
Unidad IV
Regresin y
Correlacin
Objetivo:
Interpretar el coeficiente de correlacin y determinacin con el
propsito de obtener la relacin o variacin entre dos variables.
Contenidos:
Variables dependiente e independientes
Grfico de dispersin
Coeficiente de correlacin
Correlacin lineal
Coeficiente de determinacin
Modelo de anlisis de regresin lineal
Recta de mnimos cuadrados
Error estndar de estimacin
Lo maravilloso de
aprender algo es que
nadie puede
arrebatrnoslo.
B.B.King
60
Regresin y Correlacin
La regresin y la correlacin son las dos herramientas estadsticas ms eficaces que se
pueden utilizar para solucionar problemas comunes en la administracin por el hecho
de que se emplean para identificar y cuantificar la relacin entre dos o ms variables.
El anlisis de regresin consiste en estimar el valor de la variable dependiente a partir
de un valor conocido, el cual denominamos variable independiente a travs de la
ecuacin de regresin. Existen dos tipos de anlisis de regresin el simple y el mltiple.
El anlisis de regresin simple indica el valor de una variable dependiente estimado a
partir de una variable independiente. Mientras que el anlisis de regresin mltiple se
ocupa de la estimacin del valor de una variable dependiente con base a dos o ms
variables independientes.
El anlisis de correlacin mide la magnitud de la relacin entre las variables. As
podemos precisar que la regresin establece la relacin y la correlacin la amplitud de
esa relacin.
61
Ejercicio:
A continuacin escribe cuatro casos en los cuales reflejes las variables dependiente e
independiente:
Caso
Variable
dependiente
Variable
independiente
62
Diagrama de Dispersin
Para recordar
Las medidas de tendencia central (estudiadas en
Estadstica I) carecen de significado si a la par no se
realiza el clculo de las medidas de dispersin para poder
observar cuanto difieren unos valores de otros.
Un diagrama de dispersin es una grfica en la que cada punto trazado representa un
par de valores observados de las variables independiente y dependiente. El valor de la
variable independiente X se identifica respecto del eje horizontal, mientras que el valor
de la variable dependiente Y se identifica respecto del eje vertical.
Correlacin Lineal
En ocasiones nos puede interesar estudiar si existe o no algn tipo de relacin entre
dos variables aleatorias. Por ejemplo, podemos preguntarnos si hay alguna relacin
entre las notas de la asignatura Estadstica I y las de Matemticas I. Una primera
aproximacin al problema consistira en dibujar en el plano un punto por cada alumno:
la primera coordenada de cada punto sera su nota en estadstica, mientras que la
segunda sera su nota en matemticas. As, obtendramos una nube de puntos la cual
podra indicarnos visualmente la existencia o no de algn tipo de relacin (lineal,
parablica, exponencial, etc.) entre ambas notas.
Otro ejemplo, consistira en analizar la facturacin de una empresa en un periodo de
tiempo dado y de cmo influyen los gastos de promocin y publicidad en dicha
facturacin. Si consideramos un periodo de tiempo de 10 aos, una posible
representacin sera situar un punto por cada ao de forma que la primera coordenada
de cada punto sera la cantidad en euros invertidos en publicidad, mientras que la
segunda sera la cantidad en euros obtenidos de su facturacin. De esta manera,
63
obtendramos una nube de puntos que nos indicara el tipo de relacin existente entre
ambas variables. En particular, nos interesa cuantificar la intensidad de la relacin lineal
entre dos variables.
El parmetro que nos da tal cuantificacin es el coeficiente de correlacin lineal de
Pearson r, cuyo valor oscila entre 1 y +1 :
Correlacin de Pearson
Definicin. Creado por Kart Pearson en el siglo XIX, es una tcnica estadstica que
permite evaluar el grado o nivel de relacin entre dos variables, en otras palabras, es
una herramienta que permite evaluar en que medida el comportamiento de una variable
dependiente se ve afectada por la accin directa de una variable independiente. Por
ejemplo, si queremos establecer la razn del incremento de las ventas al detal en el
mes de diciembre (variable dependiente), es muy probable que encontremos una
correlacin elevada si la cruzamos con la variable independiente ingreso familiar. La
correlacin lineal adquiere valores entre -1 y 1.
0= correlacin nula.
+1= Correlacin directamente proporcional perfecta
-1= Correlacin inversamente proporcional perfecta
64
Interpretacin de la Correlacin
El coeficiente de correlacin como previamente se indic oscila entre 1 y +1
encontrndose en medio el valor 0 que indica que no existe asociacin lineal entre las
dos variables a estudio. Un coeficiente de valor reducido no indica necesariamente que
65
no exista correlacin ya que las variables pueden presentar una relacin no lineal como
puede ser el peso del recin nacido y el tiempo de gestacin. En este caso el r
infraestima la asociacin al medirse linealmente. Los mtodos no paramtrico estaran
mejor utilizados en este caso para mostrar si las variables tienden a elevarse
conjuntamente o a moverse en direcciones diferentes.
La significancia estadstica de un coeficiente debe tenerse en cuenta conjuntamente
con la relevancia clnica del fenmeno que estudiamos ya que coeficientes de 0.5 a 0.7
tienden ya a ser significativos como muestras pequeas. Es por ello muy til calcular el
intervalo de confianza del r ya que en muestras pequeas tender a ser amplio. La
estimacin del coeficiente de determinacin (r 2) nos muestra el porcentaje de la
variabilidad de los datos que se explica por la asociacin entre las dos variables.
La correlacin elevada y estadsticamente significativa no tiene que asociarse a
causalidad. Cuando objetivamos que dos variables estn correlacionadas diversas
razones pueden ser la causa de dicha correlacin: a) pude que X influencie o cause Y,
b) puede que influencie o cause X, c) X e Y pueden estar influenciadas por terceras
variables que hace que se modifiquen ambas a la vez. El coeficiente de correlacin no
debe utilizarse para comparar dos mtodos que intentan medir el mismo evento, como
por ejemplo dos instrumentos que miden la tensin arterial. El coeficiente de correlacin
mide el grado de asociacin entre dos cantidades pero no mira el nivel de acuerdo o
concordancia. Si los instrumentos de medida miden sistemticamente cantidades
diferentes uno del otro, la correlacin puede ser 1 y su concordancia ser nula.
Valores que asume y como interpretarlos.
0= correlacin nula, no existe relacin entre A y B
+1= Correlacin directamente proporcional perfecta,
a medida que aumenta A, aumenta B
-1= Correlacin inversamente proporcional perfecta,
a medida que aumenta A, disminuye B
Coeficiente de Correlacin
El coeficiente de correlacin es un grupo de tcnicas para medir la magnitud de la
relacin entre dos variables, para ello se suele graficar todos los datos en un diagrama
de dispersin
Un coeficiente de Correlacin es
una medida de la magnitud de la
relacin lineal entre dos
66
n( XY ) ( X )( Y )
n( X
) ( X ) 2 n( Y 2 ) ( Y ) 2
Donde:
n: es el nmero de pares de observaciones
X : es la suma de las variables X
Y : es la suma de las variables Y
2
( X ): es la suma de los cuadrados de la variable X
( X )2 : es la suma de las variables X elevadas al cuadrado
2
( Y ) : es la suma de los cuadrados de la variable Y
( Y )2: es la suma de las variables Y elevada al cuadrado
XY : es la suma de los productos de X y Y
Sin embargo la correlacin que se halle entre dos variables puede deberse a una
casualidad o un error de muestreo para verificar que esto no sea as se aplica una
prueba de significanca del coeficiente de correlacin, esto se realiza calculando un
valor t y aplicando la prueba de hiptesis, slo que en esta oportunidad utilizaremos la
tabla de valores t (ver anexos) para verificar si la hiptesis plantead queda dentro o
fuera del rea de rechazo.
Prueba t para el coeficiente de correlacin
t
r n2
1 r2
Regin de rechazo
-2,306
Regin de rechazo
+2,306
67
El Coeficiente de Determinacin
El coeficiente de determinacin es una medida ms precisa, se obtiene elevando al
cuadrado el coeficiente de correlacin. Es una proporcin de la variacin total de la
variable dependiente Y que se explica por, o se debe a, la variacin en la variable
independiente X.
Modelo de Anlisis de Regresin Lineal
Anlisis de Regresin
Es un modelo matemtico para expresar la relacin entre dos variables y estima el valor
de la variable dependiente Y basndonos en el valor de la variable independiente X.
Anlisis de Regresin
Es una ecuacin que define la relacin entre dos
variables.
Principio de los mnimos cuadrados
Este mtodo proporciona un mejor ajuste y consiste en determinar la ubicacin de la
lnea de regresin. Este principio es el mejor porque la suma de los cuadrados de las
desviaciones verticales respecto de ella es la mnima. La forma general de la ecuacin
de regresin es:
Y ' a bX
Donde:
Y: se lee Y prima, es el valor predictorio de la variable Y para un valor de X
seleccionado.
a: es la interseccin con el eje Y. Es el valor estimado de Y cuando X=0. Otra manera
de expresar este es: a es valor estimado de Y donde la lnea de regresin cruza el eje Y
cuando X es cero.
b: es la pendiente de la lnea, o el cambio de la lnea de regresin en Y por cada
cambio en una unidad (ya sea aumentando o disminuyendo) de la variable
independiente X.
X: es el valor que se escoge para la variable independiente.
A los valores a y b de la ecuacin de regresin se les conoce como coeficientes
estimados de regresin o coeficientes de regresin.
n( XY ) ( X )( Y )
n( X 2 ) ( X ) 2
68
Y
n
X
n
Donde:
X: es un valor de la variable independiente
Y: es un valor de la variable dependiente
n: es el nmero de elementos de la muestra
Error estndar de Estimacin
Es una medida que describe que tan precisa es la prediccin de Y con la base en X o,
inversamente, que tan inexacta puede ser la estimacin. El error estndar de
estimacin se denota con la letra sx.y. La desviacin estndar mide la dispersin
alrededor de la media; el error estndar de estimacin mide dispersin alrededor de la
lnea de regresin.
Error Estndar de Estimacin
Una medida de dispersin de los valores observados alrededor
de la lnea de regresin.
(Y Y ' )
n2
a ( Y ) b( XY
n2
69
Respuestas
Ejercicio 1:
Clasifica los siguientes eventos:
a. El
lanzamiento
de
dos
monedas
a
la
vez
________Independiente______________
b. Que un vuelo de avin salga retrasado __ Mutuamente excluyente y
Complementario
c. Que un beb sea varn __Mutuamente excluyente y colectivamente exhaustivo
d. Que la comida de hoy no quede salada __Mutuamente excluyente y
Complementario
e. Que en la prxima temporada de bisbol Magallanes sea el campen
Colectivamente exhaustivo
Ejercicio 2
P
n!
5!
120
p r q n r
0,20 2 0,80 3
0,04(0,512) 10(0,0204) 0,2048
r!( n r )!
2!(5 2)!
2(6)
n!
5!
120
p r q n r
0,20 3 0,80 2
0,008(0,64) 10(0,0051) 0,0512
r!( n r )!
3!(5 3)!
6( 2)
n!
5!
120
p r q n r
0,20 4 0,801
0,0016(080) 5(0,0012) 0,0064
r!( n r )!
4!(5 4)!
24(1)
Ejercicio 3
P= 0.4
Q= 0.6
N= 5
Realicemos el clculo de cada valor de R:
Para R= 0 obtenemos que: P(0) = 5!/ 0!(5-0)! (0.4 ) 0 (0.6)5, P(0) = 0.07776
Para R= 1 obtenemos que: P(1) = 5!/ 1!(5-1)! (0.4 ) 1 (0.6)4, P(1) = 0.2592
Para R=2 obtenemos que: P(2) = 5!/ 2!(5-2)! (0.4 ) 2 (0.6)3, P(2) = 0.3456
Para R= 3 obtenemos que: P(3) = 5!/ 3!(5-3)! (0.4 ) 3 (0.6)2 P(3) = 0.2304
Para R= 4 obtenemos que: P(4) = 5!/ 4!(5-4)! (0.4 ) 4 (0.6)1 P(4) = 0.0768
Para R= 5 obtenemos que: P(5) = 5!/ 5!(5-5)! (0.4 ) 5 (0.6)0, P(5) = 0.01024
Ejercicio 4:
70
X 510 500
10
X 490 500
10
Ejercicio 5
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9
La media y la varianza de cada variable independiente es:
m = 0,10
s2 = 0,10 * 0,90 = 0,09
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya media y
varianza son:
Media : n * m = 100 * 0,10 = 10
Varianza : n * s2 = 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos el valor
equivalente de la variable normal tipificada:
Luego:
P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475
Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo largo del
curso es tan slo del 4,75%.
71
Bibliografa
Berenson, M. y Levine, D (1996) Estadstica Bsica en Administracin. Pretince
Hall:Mxico. Mxico DF.
Gonzalez, E. (2000) Estadstica General. Ediciones de la biblioteca UCV: Carcas,
Venezuela.
Kazmier, L. (1998) Estadstica aplicada a la Administracin y a la Economa. Mc Graw
Hill: Mxico DF, Mxico.
Lind, D., Mason, R. y Marchal, W. (2001) Estadstica para Administracin y Economa.
Mc Graw Hill Interamericana: Mxico D.F. Mxico
Salama, D. (2002) Estadstica. Metodologa y aplicaciones. Editorial Torino: Caracas,
Venezuela.
Webster, A. (2000) Estadstica Aplicada a los Negocios y a la Economa. Irwin-Mc Graw
Hill: Santa f de Bogot, Colombia.
72
ANEXOS
73
74
75
Distribucin t de Student
76
77