Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Libro de Nrys y Renc3a9 para Profesorado Margenes2
Libro de Nrys y Renc3a9 para Profesorado Margenes2
Septiembre de 2010.
ndice general.
Introduccin.............................................................................................................................5
Captulo 1. Conceptos Bsicos de Estadstica.....................................................6
1.1. La Estadstica y sus aplicaciones..............................................................................................6
1.1.1. Qu es la Estadstica?.......................................................................................................6
1.1.2. Aplicaciones de la Estadstica............................................................................................6
1.2. Poblacin, Muestra y tcnicas de muestreo............................................................................10
1.3. Unidad de estudio y unidad de muestreo................................................................................13
1.4. Variables y datos.....................................................................................................................14
1.5. Escalas de medicin...............................................................................................................15
1.5.1. Escalas nominales............................................................................................................15
1.5.2. Escalas ordinales..............................................................................................................16
1.5.3. Escalas de intervalos........................................................................................................16
1.5.4. Escalas de razones o cocientes.........................................................................................17
1.6. Diseo de Experimentos estadsticos......................................................................................18
1.7. Gua de ejercicios N 1...........................................................................................................18
Captulo 2. Distribuciones de frecuencias y sus representaciones
grficas......................................................................................................................................20
2.1. Estadstica Descriptiva con una variable...............................................................................20
2.1.1. Distribucin de frecuencias.............................................................................................20
2.1.2. Descripcin de Variables Cualitativas.............................................................................21
2.1.3. Variables cuantitativas discretas......................................................................................29
2.2. Distribucin de frecuencias agrupadas...................................................................................30
2.2.1 Representacin grfica de variables continuas................................................................32
2.3. Gua de ejercicios N 2...........................................................................................................33
Captulo 3. Medidas Caractersticas de una Distribucin Cuantitativa
Emprica....................................................................................................................................35
3.1 Medidas de posicin...........................................................................................................35
3.2 Medidas de Dispersin........................................................................................................42
3.3 Medidas de forma...............................................................................................................43
3.4. Gua de Ejercicios N 3..........................................................................................................44
Captulo 4. Distribuciones Bivariadas.......................................................................73
4.1. Distribuciones bidimensionales.............................................................................................73
4.2. Distribuciones marginales y condicionales.............................................................................74
4.3. Coeficiente de correlacin lineal............................................................................................77
4.4. Introduccin al modelos de regresin lineal...........................................................................77
4.5. Modelo de regresin simple...................................................................................................82
4.5.1. Estimacin de los parmetros por mnimos cuadrados....................................................82
4.5.2. Propiedades de los estimadores por mnimos cuadrados y el modelo ajustado de
regresin.....................................................................................................................................84
4.5.3. Intervalos de confianza...................................................................................................86
2
Introduccin.
La estadstica como herramienta para el anlisis de los datos es esencial en los profesionales que
con frecuencia tienen la necesidad de realizar anlisis de datos para la toma de decisiones.
Este libro, recoge en 10 captulos conocimientos estadsticos bsicos que van desde el anlisis
descriptivo de datos, probabilidad e inferencia estadstica.
Debemos aclarar que los mtodos descriptivos aqu propuestos son elementales univariantes y en
el enfoque de la probabilidad slo hemos considerado espacios probabilsticos discretos
incluyendo dos continuas la uniforme y la normal.
Este libro, es recomendables para principiantes en el rea de estadstica. Los conocimientos aqu
planteados son base para ir enfrentando otros de estadstica de mayor dificultad.
La Estadstica en la Poltica
Conocidas son las famosas encuestas de tipo poltico, que entregan una orientacin de la
intencin de voto, de la aceptacin de un candidato, del impacto de un programa o proyecto de
estado, etc. de una muestra estadstica representativa, sobre la opinin de las personas en un
tiempo determinado, teniendo esta herramienta una gran confiabilidad. As es que el uso de la
estadstica es imprescindible para determinar caminos a seguir para los candidatos de eleccin
popular.
2.
La Estadstica en la Publicidad
Cuando las grandes marcas trasnacionales y/o nacionales como Coca-cola, Pepsi, Nice, Adidas,
Laboratorios Lpez, etc. nos llenan de slogans, msica y colores en sus comerciales, lo nico que
buscan es que la gente adquiera los productos y/o servicios que ofrecen.
Se dedican, entonces, a realizar las llamadas campaas publicitarias, y, antes de lanzar una
campaa, hacen un estudio de mercado para encontrar las mejores alternativas posibles a fin de
lograr el xito de ventas deseado. Estos estudios son de carcter estadstico, es decir, hacen un
diseo muestral y seleccionan una muestra para inferir las caractersticas de la poblacin.
3.
En la administracin es una herramienta del control, como parte del proceso administrativo (o lo
que es lo mismo: planeacin, organizacin, direccin y control) ya que la estadstica ayuda a
7
recolectar, estudiar y al final interpretar los datos que obtienen al terminar el proceso
administrativo, retroalimenta con esta informacin y al final se observa en que pueden mejorar y
que se est haciendo bien.
En la mercadotecnia es una herramienta muy importante cuando tienes la necesidad de trabajar
con datos de muestreo para conocer los gustos y preferencias de las personas. Igualmente en la
auditoria administrativa cuando recabas datos para conocer en que puede mejorar una
organizacin. En pocas palabras te puede servir en cualquier rea de una organizacin debido a
que muestra los resultados de las actividades que bienes realizando.
En la economa se utiliza como una herramienta de prediccin para pronosticar el
comportamiento futuro, por ejemplo, de los precios de los metales (oro, plata, cobre) tomando
como base el comportamiento pasado de los precios de los mismos. Tambin puede servir para
estudiar el comportamiento de la bolsa de valores, de ciertos productos bsicos, los economistas
por lo regular se sienten magos que creen predecir cosas. En general, la Estadstica suministra los
valores que ayudan a descubrir interrelaciones entre mltiples parmetros macro y
microeconmicos, a travs de la evaluacin de modelos economtricos para el establecimiento de
polticas econmicas; anlisis del costo de la canasta bsica, el poder adquisitivo de la poblacin,
etc.
5. La estadstica en la Banca y Seguros
El profesional del seguro de vida ha de ser capaz de asignar primas suficientes para cubrir las
cantidades que habr de pagar la compaa en el caso de muerte del asegurado. En consecuencia,
la prediccin adecuada de las probabilidades de muerte constituye uno de los ejes centrales de la
reduccin del riesgo que se asume. Por ello, el objetivo de la Estadstica de Seguros es una
presentacin exhaustiva de los mtodos disponibles para ajustar tablas de mortalidad y tablas de
seguros no vida, ejemplo, aseguramiento de vehculos, viviendas, etc.
Por otra parte, algunas de las aplicaciones concretas de la Estadstica en el sistema bancario son
las siguientes:
Sistemas de concesin de tarjetas de crdito y fijacin de su lmite.
Sistemas de estimacin del potencial econmico de los clientes.
Definicin de tipologas comerciales de clientes.
Determinacin del pblico objetivo en campaas comerciales.
Modelizacin del riesgo segn las caractersticas de los clientes.
Aplicacin de la teora de colas para brindar un servicio de calidad.
Finalmente, es de mucha utilidad la tcnica de minera de datos para el anlisis de bases de
datos del sistema bancario.
6.
8.
En el rea de las ciencias biolgicas, interesa estudiar el comportamiento de ciertas plantas y sus
cruces a fin de determinar cmo se relacionan genticamente los padres con los hijos, hablando
de Genotipo y Fenotipo. En esta categora es tambin donde se realizan los mayores avances de la
humanidad, en descubrimientos. Cada ao se descubren miles de frmulas cientficas que
relacionan fenmenos de la naturaleza con modelos matemticos.
Los cientficos se dedican a realizar estudios estadsticos, recogiendo datos y muestras,
investigando el tiempo de reproduccin de un virus, el comportamiento migratorio de algunas
aves o insectos, adems de factores de tamao y volumen del crecimiento de ciertas especies de
animales o vegetales. Todo esto funciona con la idea de recopilar informacin, muestrear ciertas
reas para ver cmo se han comportado algunas aves, por ejemplo, se pueden dibujar o simular
curvas que se supone que son relativamente parecidas al comportamiento migratorio de aves. Con
esta herramienta se podran determinar tambin las pocas de mayor probabilidad de contagio,
diseminacin de algn virus o bien enfermedades transmitidas por insectos.
Algunas aplicaciones concretas en esta rea son: Determinacin del tamao de poblaciones
naturales en una regin; efectividad de la utilizacin de barreras naturales (filas de rboles
plantados en los lmites del terreno) como medio de prevenir las plagas de insectos o aves sobre
las plantaciones y as disminuir la utilizacin de pesticidas: y, determinacin de los niveles
ptimos de utilizacin de los fertilizantes. Obviamente, en esta rea es donde ms se hace usos de
la teora de Diseos de Experimentos.
9.
Permite establecer pautas sobre la evolucin de las enfermedades y los enfermos, los ndices de
mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etctera.
Bajo este conjunto de ideas, se ha presentado un panorama de la utilidad de la estadstica,
haciendo un recorrido por diversas reas del conocimiento humano, con el fin, de conocer cmo
se relacionan con las diversas ciencias, formando una sola verdad. Evidentemente, existen,
muchas disciplinas donde se aplica la estadstica, que no han sido consideradas en este apartado,
por ejemplo, las ingenieras, la pintura, la msica, etc. Finalmente, es de resaltar que en todos los
temas donde se analice informacin est presente la estadstica.
10
llevar a cabo alguna investigacin debe de tenerse en cuenta algunas caractersticas esenciales al
seleccionarse la poblacin bajo estudio. Entre stas tenemos:
Homogeneidad - que todos los miembros de la poblacin tengan las mismas caractersticas
segn las variables que se vayan a considerar en el estudio o investigacin. Por ejemplo, si se
fuera a investigar la incidencia de la drogadiccin entre jvenes mujeres adolescentes, entonces
hay que definir claramente las edades que comprenden la adolescencia y cuando se seleccione la
poblacin asegurarse de que todas las personas entrevistadas sean de la edad determinada y del
sexo femenino. (La adolescencia se define operacionalmente como el periodo comprendido de
edad que flucta entre 12 y 21 aos.)
Tiempo - se refiere al perodo de tiempo donde se ubicara la poblacin de inters. Determinar si
el estudio es del momento presente o si se va a estudiar a una poblacin de cinco aos atrs o si
se van a entrevistar personas de diferentes generaciones.
Espacio - se refiere al lugar donde se ubica la poblacin de inters. Un estudio no puede ser muy
abarcador y por falta de tiempo y recursos hay que limitarlo a un rea o comunidad en especfico.
Cantidad - se refiere al tamao de la poblacin. El tamao de la poblacin es sumamente
importante porque ello determina o afecta al tamao de la muestra que se vaya a seleccionar,
adems que la falta de recursos y tiempo tambin nos limita la extensin de la poblacin que se
vaya a investigar.
MUESTRA - la muestra es un subconjunto fielmente representativo de la poblacin.
Hay diferentes tipos de muestreo. El tipo de muestra que se seleccione depender de la calidad y
cun representativo se quiera que sea el estudio de la poblacin, en este sentido, la muestra puede
ser:
ALEATORIA - cuando se selecciona al azar y cada miembro tiene igual oportunidad de ser
incluido.
Un procedimiento de extraer una muestra aleatoria de una poblacin finita es: enumerar todos
los elementos que conforman la poblacin, escribir esos nmeros en papelitos y echarlos en una
urna o bolsa mezclarlos bien removindolos y sacar uno a uno tantos como lo indique el tamao
de la muestra. En este caso los elementos de la muestra lo constituirn los elementos de la
poblacin cuyos nmeros coincidan con los extrados de la bolsa o urna.
El tamao de la muestra (MAS):
Al realizar un muestreo probabilstica nos debemos preguntar Cul es el nmero mnimo de
unidades de anlisis (personas, organizaciones, captulo de telenovelas, etc), que se necesitan
para conformar una muestra n que me asegure un error estndar menor que 0.01 ( fijado por el
muestrista o investigador), dado que la poblacin es aproximadamente de N elementos.
En el tamao de una muestra de una poblacin se debe tener presente la varianza poblacional,
error mximo permisible prefijado (diferencia del parmetro y estimador), con un nivel de
confianza de 1 . Simblicamente se refiere a lo siguiente: P X d 1 , bajo este
contexto podemos utilizar la frmula:
11
Calcular: ,
=1.96
: Para calcular la desviacin estndar hay que solicitar la estatura de cada estudiante y luego
2
1 n
2
calcular la varianza utilizando la siguiente frmula: S X xi x , posteriormente se
n i 1
obtiene la raz cuadrada y ese es el valor que se debe utilizar en esta ecuacin. Supongamos
que =12cm, entonces:
Determinar:
1
2
2
2
d
10
elementos en el estrato i=1, 2, , k . No se entrar en detalle del clculo del tamao muestral, ya
que supera el alcance de esta asignatura.
12
Personas
Grupos humanos
Poblaciones completas
Unidades geogrficas determinadas
Eventos o interacciones sociales (enfermedades, accidentes, casos de infecciones
intrahospitalarias, etc)
Entidades intangibles, susceptibles de medir (exmenes, das, camas)
13
14
Por ejemplo, si vas a comprar pintura azul en la ferretera te presentan una escala con diferentes
tonalidades del color azul y cada tonalidad posee un nmero, pero este nmero slo es para
facilitar al vendedor identificar el color solicitado entre cientos de colores. De igual modo en
muchas solicitudes se le asigna el nmero 1 al sexo masculino y nmero dos al femenino y esta
clasificacin slo es para facilitar los cmputos y manejos de informacin estadstica, pero no
quiere decir que los masculinos tengan ms o menor valor que las del sexo femenino. Los
nmeros que se utilizan para efectos de identificacin en una escala nominal nunca se utilizarn
para llevar a cabo los procedimientos matemticos de suma, resta, multiplicacin y divisin.
utilizan este tipo de escalas, estn divididos en unidades iguales, la diferencia en la temperatura
entre 100 grados y 101 grados es equivalente a la diferencia entre 110 grados y 111 grados.
La numeracin de los aos en nuestro calendario utiliza tambin una escala de intervalos. Las
autoridades eclesisticas y gubernamentales de la poca decidieron arbitrariamente fijar como el
ao 1 el del nacimiento de Cristo y como unidad de medida un lapso de 365 das. Por lo tanto, el
lapso de tiempo que estuvo Bill Clinton como presidente de los Estados Unidos desde 1993
2001 es igual al que transcurri George Bush desde 2001 2009.
Nominal
Ordinal
Intervalo
Razones
LIMITACIONES
CARACTERSTICAS
Se clasifican las personas, eventos u
objetos en categoras.
Se clasifican u ordenan las
personas, objetos y eventos en
determinada posicin.
Escala que posee unidades de igual
magnitud. El punto cero de la escala
es arbitrario y no refleja la ausencia
del atributo.
Escala que posee un punto
cero absoluto e intervalos de igual
magnitud.
USOS/EJEMPLOS
Denominaciones religiosas, afiliacin
poltico partidista, codificaciones en
la clasificacin de objetos, pinturas,
movimientos literarios.
Orden de llegada de atletas en una
carrera, puntuaciones de una prueba,
rangos militares, nivel de popularidad
de estudiantes en una escuela.
Temperaturas (Celsius y Fahrenheit),
fechas del calendario, escala de
inteligencia.
Distancia, peso,
estatura, tiempo
requerido para realizar una tarea
escolar.
17
objetivo
es
obtener
Durante los ltimos dos das se ha informado de un total de cinco homicidios diarios en
San Salvador, este es un ejemplo de estadstica inferencial.
18
Escala nominal
Escala ordinal
Escala de intervalo.
Escala de razn
19
Variables
Las variables cualitativas o atributos son aquellas que no toman valores numricos. Describen
diferentes cualidades denominadas modalidades. Ejemplo: Sexo, estado civil, color de los ojos,
etc. Las variables cualitativas estn formadas por datos que toman valores numricos y pueden
ser discretas, si slo toman un nmero entero de valores, y continuas, si pueden tomar cualquier
valor real dentro de un intervalo.
Entre los sistemas para ordenar los datos se encuentran principalmente dos: a) la distribucin de
frecuencias y b) la representacin grfica.
20
La siguiente tabla recoge las principales caractersticas de una distribucin de frecuencias simple
o no agrupada.
Datos
x1
Frecuencias Absolutas
Simples
Acumuladas
N1 n1
n1
Frecuencias Relativas
Simples
Acumuladas
f1 n1 / n
F1 N1 / n
x2
n2
N 2 n1 n2
f 2 n2 / n
F2 N 2 / n
.
.
.
xk
.
.
.
nk
.
.
.
.
.
.
.
.
.
Fk N k / n
N k ni
f k nk / n
i 1
Total
ni n
i 1
f
i 1
La primera columna representa los distintos valores de esos datos y la segunda la frecuencia
simple, es decir, el nmero de veces que se ha observado el correspondiente valor; la tercera
columna recoge la frecuencia acumulada (nmero de veces que se han observado valores
menores o iguales que el que corresponde a dicha fila). Las frecuencias relativas se obtienen a
partir de las frecuencias absolutas, dividiendo por el tamao de la muestra.
Verde
Azul
Color de ojos
k 4
Marron
Negro
Representamos mediante n1, n2, , nk el nmero de datos que aparecen en cada una de las k
categoras.
Frecuencia absoluta de la clase i-sima (ni): nmero de observaciones en la clase i.
21
decir, f
ni
.
N
Nos permiten comparar las frecuencias de las categoras en conjuntos de datos con
distinto nmero de observaciones
Distribucin de frecuencias: es la tabla que presenta las categoras de una variable y sus
respectivas frecuencias.
1
2
Nivel educativo
3
4
sin estudios
primarios
medios
sup eriores
1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3;
N=20; k=4
Frecuencias absolutas:
n1=3; n2=7; n3=6; n4=4
3 7 6 4 2 0
Frecuencias relativas:
f1
3
20
0 ,1 5 ;
f2
7
20
0 ,3 5 ;
f3
6
20
0 ,3 ;
f4
4
20
0 ,2
22
f 1 f 2 f 3 f 4 0 ,1 5 0 , 3 5 0 , 3 0 , 2 1
Distribucin de frecuencias:
Categoras
ni
fi
1. Sin estudios
0,15
2. Primaria
3. Media
4. Superior
7
0,35
6
0,3
4
0,2
N=20
1
La categora ms frecuente es la de estudios primarios y la menos frecuente la de sin estudios
REPRESENTACIN GRFICA DE LA DISTRIBUCIN DE FRECUENCIAS
A) Diagrama de barras: Permite visualizar de forma sencilla la distribucin de una variable
cualitativa. Se dibuja sobre cada categora una barra (o rectngulo) cuya altura coincida
con la frecuencia absoluta o relativa de dicha clase.
Ejemplo: Nivel de estudios (Continuacin ejemplo 1)
Frecuencias relativas fi
0.40
0.35
0.30
0.25
0.20
0.15
0.10
1
B)
23
A principios del Siglo XX, Vilfredo Pareto (1848-1943), un economista italiano, realiz
un estudio sobre la riqueza y la pobreza. Descubri que el 20% de las personas
controlaba el 80% de la riqueza en Italia.
La grfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar
visualmente en una sola revisin las minoras de caractersticas vitales a las que es importante
prestar atencin.
Algunos ejemplos de tales minoras vitales son:
La minora de clientes que representan la mayora de las ventas.
La minora de productos, procesos, o caractersticas de la calidad causantes del grueso de
desperdicio de los costos de retrabajos.
Ejemplo: Nivel educativo (Continuacin ejemplo 1)
Frecuencias relativas fi (Grfico de Pareto)
0.40
0.35
0.30
0.25
0.20
0.15
0.10
2
f2=0,35
f2+ f3=0,35+0,3=0,65
f2+ f3+ f4=0,35+0,3+0,2=0,85
f2+ f3+ f4+f1=0,35+0,3+0,2+0,15=1
Un 35 por ciento de la poblacin llega hasta la educacin primaria y el 65 por ciento de la
poblacin tiene un nivel educativo primario o media.
24
Diagrama de Pareto
1.0
0.8
0.6
0.4
0.2
0.0
2
1.
2.
3.
4.
Categoras
Sin estudios
Primario
Medio
Superior
ni
3
7
6
4
N=20
fi
0,15
0,35
0,3
0,2
1
25
3 obreros
SOC 4 autonomos
5 clase media
6 clase alta
7 retirados
(b)
n2=9
n6=3
n7=11
n3=25 n4=3
n5=16
f1
n1
8
0 ,1 1
N
75
f2
n2
9
0 ,1 2
N
75
f3
n3
25
0 ,3 3
N
75
f4
n4
3
0 ,0 4
N
75
n
N
f6
n6
3
0 ,0 4
N
75
f7
n7
11
0 ,1 5
N
75
16
0 ,2 1
75
Ntese que:
f1 f
f4 f5 f
fi 1
i 1
26
Distribucin de frecuencias:
1.
2.
3.
4.
5.
6.
7.
Categora
Trabajadores agrarios
Empresarios agrarios
Obreros
Autnomos
Clase media
Clase alta
Retirados
(c)
ni
8
9
25
3
16
3
11
N=75
fi
0,11
0,12
0,33
0,04
0,21
0,04
0,15
1
f3=0,33;
f3+f5=0,33+0,21=0,54
f3+f5+f7=0,33+0,21+0,15=0,69
f3+f5+f7+f2=0,33+0,21+0,15+0,12=0,81
f3+f5+f7+f2+f1=0,33+0,21+0,15+0,12+0,11=0,92
f3+f5+f7+f2+f1+f4=0,33+0,21++0,11+0,04=0,9
F3+F5+F7+F2+F1+F4+F6=0,33+0,21++0,04+0,04=1
El 33 por ciento de la poblacin son obreros y el 54 por ciento de la poblacin son obreros o clase
media, y as sucesivamente.
27
Grfico de sectores:
En el caso de variables cualitativas el diagrama circular se utiliza con mucha frecuencia. Consiste
en representar sobre un crculo los diferentes atributos, mediante un sector circular de ngulo
proporcional a la correspondiente frecuencia. El ngulo de cada sector circular se calcula
multiplicando por 360 la frecuencia relativa.
Los grficos de sectores, tambin conocidos como diagramas de "tartas o pastel", se divide un
crculo en tantas porciones como clases tenga la variable, de modo que a cada clase le
corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa. Si el nmero de
categoras es excesivamente grande, la imagen proporcionada por el grfico de sectores no es lo
suficientemente clara y por lo tanto la situacin ideal es cuando hay alrededor de cuatro
categoras. En este caso se pueden apreciar con claridad dichos subgrupos.
Ejemplo.
La poblacin segn nivel de estudio del Municipio de Ayutuxtepeque se presenta en el siguiente
cuadro:
Superior
no
Tcnico
Superior
Parvulari Primaria Educaci universita universita universita Maestr Doctora
a
o bsica n media ria
rio
ria
a
do
Total
1168
15895
6842
499
363
4556
70
7 29400
Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.
28
Es evidente que la mayora de la poblacin tiene un nivel educativo bsico o media con el
54.06% y 23.27% respectivamente. En general la poblacin de Ayutuxtepeque tiene un nivel
educativo relativamente bajo, son muy pocos los que llegan a hacer estudios universitarios.
Madres
mujeres salvadoreas.
278290
509469
339180
177050
92233
50916
27791
15004
7328
7366
Ejemplo.
La poblacin segn condicin de ocupacin del Municipio de Ayutuxtepeque se presenta en el
siguiente cuadro:
REA URBANA
EL ZAPOTE
LOS LLANITOS
Total
29
L1 L2
.
.
.
Lk 1 Lk
.
.
.
xk
L0 L1
.
.
.
nk
.
.
.
k
N k ni
Frecuencias Relativas
Simples
Acumuladas
f1 n1 / n
F1 N1 / n
f 2 n2 / n
F2 N 2 / n
.
.
.
.
.
.
Fk N k / n
f k nk / n
i 1
Total
ni n
i 1
f
i 1
A cada uno de los intervalos se les denomina clase y al punto medio marca de clase. A efectos de
clculo la marca de clase se elige como representante del intervalo. El nmero de clases en que se
dividen los datos no debe ser excesivo. A modo orientativo, el nmero de clases se puede obtener
mediante la siguiente frmula emprica, llamada de Sturges:
30
3 log(n)
nmero de clases
(Tomar la parte entera)
2 log(2)
31
Total
10188
4
10470
7
11010
6
11687
9
12231
7
12201
2
13533
7
14798
2
14003
6
13936
0
14490
8
14124
3
14692
8
13444
5
13882
3
12827
5
12351
0
12287
9
11617
4
10972
7
10532
8
97617
97435
Eda
d
Hombr
e
Mujer
36
31398 40111
37
31414 38801
38
29639 37419
39
29435 37454
40
31769 39411
41
24732 32964
42
26840 34653
43
24578 32639
44
24299 31746
45
24451 31422
46
21989 29308
47
22251 28713
48
20682 26481
49
20584 26241
50
22897 28057
51
17664 22874
52
19081 24360
53
17671 22344
54
17962 22824
55
17848 22561
56
17114 21361
57
58
16816 20974
14462 17853
Total
7150
9
7021
5
6705
8
6688
9
7118
0
5769
6
6149
3
5721
7
5604
5
5587
3
5129
7
5096
4
4716
3
4682
5
5095
4
4053
8
4344
1
4001
5
4078
6
4040
9
3847
5
3779
0
3231
Eda
d
72
73
74
75
76
77
78
79
80
Hombr Muje
e
r
Total
1071 1930
8591
7
8
1698
7461 9522
3
1003 1804
8011
0
1
1795
8067 9886
3
1728
7535 9745
0
1576
6897 8872
9
1294
5825 7123
8
1203
5334 6700
4
1280
5717 7089
6
81
4124
5274 9398
82
3841
5220 9061
83
3438
4508 7946
84
3281
4378 7659
85
3263
4413 7676
86
3096
4286 7382
87
2750
3758 6508
88
1767
2358 4125
89
1595
2219 3814
90
1405
2091 3496
91
786
1143 1929
92
826
1206 2032
93
94
673
559
990
869
1663
1428
32
23
42864
24
42894
25
42616
26
41993
27
43473
28
39209
29
39672
30
41911
31
33494
32
35940
33
33124
34
33931
35
34628
9
4927
8
5112
6
5055
2
5070
7
5221
4
4807
6
4937
8
5074
4
4293
3
4531
2
4199
0
4287
0
4284
8
92142
59
15478 18608
94020
60
17461 19979
93168
61
12470 15424
92700
62
13590 17093
95687
63
12274 15528
87285
64
12412 15633
89050
65
12802 15513
92655
66
11774 14915
76427
67
11864 14597
81252
68
9694
12291
75114
69
9647
12060
76801
70
77476
71
10861 13101
8525
10638
5
3408
6
3744
0
2789
4
3068
3
2780
2
2804
5
2831
5
2668
9
2646
1
2198
5
2170
7
2396
2
1916
3
95
482
816
1298
96
416
674
1090
97
98
+
356
588
944
526
948
1474
33
34
[50,
60)
[60,
70)
[70, 80)
[80,90)
[90,
100)
fi
10
16
14
10
Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un
examen de Fsica.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13,
22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
a) Construir la tabla de frecuencias agrupadas en intervalos de amplitud 5 unidades.
b) Dibujar el histograma y el polgono de frecuencias.
4. Se ha realizado una encuesta en 30 hogares en la que se les pregunta el n de individuos
que conviven en el domicilio habitualmente. Las respuestas obtenidas han sido las
siguientes: 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
a) Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias absolutas,
relativas y sus correspondientes acumuladas.
b) Qu proporcin de hogares est compuesto por tres o menos personas? Qu proporcin
de individuos vive en hogares con tres o menos miembros?
c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera.
5. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el
nmero de empleados que hay en cada una de ellas para un estudio posterior. Las
observaciones obtenidas han sido: 12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,14,15, 11, 11,
12, 16, 17, 17,16,16, 15, 14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10,
11, 12, 12, 11, 13, 13, 15, 13, 11, 12.
a) Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias
absolutas, relativas y sus correspondientes acumuladas.
35
62
67
68
72
65
73
66
75
69
65
75
62
73
57
76
55
80
74
55
75
63
69
65
75
65
73
68
66
67
62
55
67
62
68
58
79
55
68
65
63
64
68
75
81
65
81
66
73
67
63
60
59
80
64
64
56
71
65
63
59
Ventas
1,107
1,041
535
333
164
110
725
36
Sabiendo que el empleado ms joven tiene 18 aos, escrbase la distribucin de frecuencias para
datos agrupados (amplitud del intervalo definida segn su conveniencia).
37
1
x1n1 x2 n2 . . . xk nk
n
G x1n1 x2 n2 . . . xk nk
H
1/ n
n
n1 n2
n
. . . k
xk
x1 x2
38
lo que se pretende presentar, ya que la distribucin de los datos puede requerir de la aplicacin de
un promedio diferente a la media, ya sea, media geomtrica o media armnica.
Le media es altamente sensible a cualquier cambio en los valores de la distribucin. No es
recomendable su uso cuando la variable est dada en forma de tasas o porcentajes. La media es
representativa del conjunto de datos si se quiere promediar cantidades semejantes, que presentan
variaciones dentro de un margen razonable.
Media Aritmtica simple. Se define como el cociente que se obtiene al dividir la suma de los
valores de la variable por el nmero total de observaciones. Su frmula est dada por:
n
i 1
n
Ejemplo. Supongamos que en un almacn tienen empleados a 12 vendedores, y sus ingresos
mensuales son: $ 585, $ 521, $ 656, $ 465, $ 536, $ 487, $ 564, $ 490, $ 563, $ 1234, $ 469 y $
547. Se pide determinar la media de los ingresos de los 12 vendedores.
Solucin.
Ejemplo. Consideremos las utilidades y prdidas de un almacn por departamentos, como se
muestra en la siguiente tabla.
Departamentos
2008 2009
OBSERVACIN. El promedio por departamento se
Calzado
-10
20
mantiene de un ao a otro, pero nos oculta los cambios que
Electrodomsticos 153
58
se han producido por departamentos donde ha habido un
Juguetera
-40
-20
desplazamiento de los beneficios. Para superar estas
Ropa
130
152
deficiencias se requiere trabajar con la media ponderada.
Miscelneos
-13
10
Promedio
44
44
Media aritmtica ponderada
Cuando el nmero de observaciones es grande, las operaciones para calcular la media se
simplifican si agrupamos los datos en una tabla de frecuencias. La frmula matemtica est dada
por:
k
x
i 1
fi
n
Si los datos estn agrupados en clase, no se conoce el valor de x, por lo tanto se toma el punto
medio de cada clase en vez de x (marca de clase).
Propiedades de la media.
Dada la importancia de la media y su uso frecuente, conviene considerar algunas de sus
propiedades:
1. La suma de las desviaciones respecto a la media es cero, esto es:
39
( x x)n
i 1
( x c) n
i
xc
n
5. La media aritmtica de una muestra dividida en submuestras, es igual, a la media
ponderada de las submuestras, tomando como ponderacin los tamaos de las
i 1
x n
i
i 1
donde n n1 n2 ... nm
3, 453
n1 n2
1200 800
En promedio el inversionista gasta $ 3,453 dlares en las 2000 acciones.
Mg n x1n1 x2 n2 . . . xk nk
donde los ni es el nmero de veces que se repite cada dato, en caso que los datos no se repitan los
ni=1.La frmula de la media geomtrica tal como se ha presentado tiene el inconveniente de que
40
tanto el producto de los xi como su raz n-sima, pueden ser un valor demasiado alto que dificulte
las operaciones. Para obviar esta dificultad se transforma la ecuacin anterior en:
ln xi
. Es obvio que las dos ecuaciones son equivalentes, esta ltima
Mg exp i 1
n
7 x5 x 4 5.192
La Mg da una cifra de ganancia ms conservadora porque no tiene una ponderacin alta para la
tasa de 7%.
Ma
ni
x
i 1
Ma
n
ni
i 1 xi
k
Ma
1
1
x1
x2
par de zapatos.
Ma
2
1
1
50 40
44.44
El mayor uso de la media armnica es para calcular la velocidad promedio. Recordemos que:
41
dista n cia
, supongamos que se han recorrido k trayectos (distancias) a cierta
tiempo
velocidad cada trayecto, entonces la velocidad media vendr dada por:
Velocidad
Vm
k
di
i 1 Vi
d
k
di
V
i 1
Vm
d
200
86.956
k
80 120
di
100
80
i 1 Vi
3.1.4. La moda
La moda es una medida de posicin, menos importante que los promedios y su uso es bastante
limitado. Se utiliza en distribuciones cuando la variable o el atributo presentan una frecuencia
demasiado grande con respecto a las dems.
La moda se define aquel valor de la variable o del atributo que presenta la mayor densidad, es
decir, la mayor frecuencia.
Si se tiene un atributo o una variable con mxima frecuencia, la distribucin es unimodal. Si hay
dos valores en la variable con la misma frecuencia mxima, la distribucin es bimodal. Si hay
ms de dos, la distribucin es multimodal. Cuando ninguno de los valores que toma la variable se
repite, no existe moda.
Datos agrupados.
Cuando la moda se aplica a una variable continua, se requiere que la amplitud de los intervalos
sea constante. A se presenta una frmula para obtener una aproximacin del valor modal:
ni 1
C
ni 1 ni 1
Moda Li 1
42
3.1.5. La mediana.
La mediana de una distribucin de frecuencia corresponde al valor, supuesto los datos ordenados
de menor a mayor, que deja a ambos lados el mismo nmero de observaciones. Cuando
calculamos la mediana en datos no agrupados, ordenamos las observaciones de menor a mayor o
viceversa. En su clculo se presentan dos casos:
a) Cuando el nmero de datos es impar: En este caso la mediana coincide con el dato central.
Ejemplo: Consideremos los salarios en dlares para 11 vendedores; 243, 320, 311, 254, 234,
261, 239, 310, 218, 267, 287. Calcular la mediana.
Solucin:
Primero ordenar los datos de menor a mayor: 218, 234, 239, 243, 254, 261, 267, 287, 310, 311,
320
La posicin donde se encuentra la mediana: (11+1)/2=6, la mediana se encuentra en la sexta
posicin y corresponde al valor de: Md=261.
b) Cuando los datos son pares: La mediana ser el trmino medio de los dos valores centrales.
Ejemplo. Consideremos los salarios en dlares para 12 vendedores; los cuales se han
presentado ordenados anteriormente 218, 234, 239, 243, 254, 261, 267, 287, 310, 311, 320 y
322:. Calcular la mediana.
Solucin:
n 1 12 1
6.5 , entonces
Para obtener la posicin central se aplica la siguiente frmula:
2
2
la mediana corresponde al promedio de los dos valores sombreados de amarillo, esto es:
Md=(261+267)/2=264.
Para el caso de distribuciones agrupadas en intervalos se utiliza una frmula aproximada. Se
comienza calculando el intervalo donde se encuentra la mediana, para lo cual se calculan las
frecuencias acumuladas, y se escoge el primer intervalo cuya frecuencia acumulada sea igual o
superior a n/2. A continuacin se aplica la frmula:
n / 2 N i 1
Mediana Li 1
Ci
ni
Quintiles
Se representan con la letra K. Su frmula aproximada es i*n/5.
El primer quintil. Separa a la muestra dejando al 20 % de los datos a su izquierda.
El segundo quintil. Es el valor que indica que el 40 % de los datos son menores.
El tercer quintil. Indica que el 60 % de los datos son menores que l.
El cuarto quintil. Separa al 80 % de los datos inferiores del otro 20 %.
Deciles
Se representan con la letra D. Son 9 valores que distribuyen la serie de datos, ordenada de
forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos
concentra el 10% de los resultados. Su frmula aproximada es i*n/10.
Es el decil i-simo, donde la i toma valores del 1 al 9. El (i*10) % de la muestra son
valores menores que l y el 100-(i*10) % restante son mayores.
Percentiles
jn / k N i 1
Ci
ni
44
Con el objeto de que no exista dependencia de los valores extremos, se introduce el recorrido
intercuartlico, que es la semidiferencia entre el tercer y el primer cuartil:
R1
Q3 Q1
2
Se define tambin la desviacin absoluta media como la media de los valores absolutos de las
diferencias de los datos a la media, es decir:
AM
1 k
xi x ni
n i 1
S X Varianza
45
La relacin entre la varianza de una variable X y la de una nueva variable definida como a+bX
es:
S a2bX b 2 S X2
Por lo tanto, si a los datos de la distribucin les sumamos una cantidad constante la varianza no se
modifica y si multiplicamos por una constante, la varianza queda multiplicada por el cuadrado de
esa constante.
En ocasiones puede interesar comparar la dispersin de dos muestras y la desviacin tpica no ser
vlida, si las dos muestras tienen unidades diferentes. Para obviar este inconveniente se define el
coeficiente de variacin:
Desviacin Tpica
S
CV
X
Media
x
Que no depende de cambios de escala en la variable.
m
n i 1
g1 33
3/ 2
S
2
1 k
x
n
n i
i
i 1
1 k
xi x
n i 1
m
g 2 44 3
S
1 k
n xi x
i 1
ni
n i
G x1n1 x2 n2 . . . xk nk
1/ n
7) Una persona viaja 4 das. Diariamente recorre 200 Km, pero maneja el primero y el ltimo
da a 50Km/h, el segundo a 55Km/h y el tercer da a 70Km/h. Cul es la velocidad media
durante el viaje?
8) Las ciudades A, B y C son equidistantes entre s. Un automovilista viaja de A a B a 30 Km/h
de B a C a 40 Km/h y de C a A a 50 Km/h. Determine el promedio de velocidad para el viaje
completo.
9) Un fabricante dispone $600,000 anuales para la compra de materia prima. Durante tres aos
invierte la misma cantidad de dinero. Si el precio promedio por Kg ha aumentado en los
ltimos tres aos sucesivos de $2,200 a $2,800 y luego a $4,600, Cul es el precio promedio
que ha pagado el fabricante en los tres aos?
10) El 1 de mayo de 2002 se ahorraron $ 50,000 en un banco al 7.6% de inters anual,
capitalizados semestralmente. Obtener la cantidad media depositada en la cuenta, entre el 1 de
mayo de 2002 y el 31 de octubre de 2006, suponga que no se hicieron retiros durante el
periodo.
11) Tres amas de casa fueron a comprar a tres mercados diferentes. Cada una gast $ 10 dlares
en la compra de naranjas. La ama de casa A compr 4 docenas de naranjas; B compr 6
docenas y C compr 3 docenas. Cul es el precio promedio por docena?
12) El siguiente cuadro muestra la distribucin de la renta anual (en miles de dlares) en que
incurren 50 viviendas:
Marca de Clase
N de Viviendas
18.85
21.55
24.25
26.95
29.65
32.35
35.05
11
11
7
48
57
55
54
52
62
55
59
80
40
62
72
46
80
40
49
ni: nmero
Sucursales
5
12
20
8
5
Se pide:
a) Media aritmtica, mediana y moda. Qu puede decir de la asimetra de la
distribucin con estos datos?
b) Desviacin tpica,
resultados.
20) La siguiente tabla recoge la cifra de ventas (en miles de millones) y el nmero de empleados
(en miles) de las diez mayores empresas del sector de automvil durante el ao 1989:
Empresa
SEAT
Fasa Renault
General Motors
Ford
Citroen
Peugeot
Nissan
Mercedes Benz
ENASA
Ventas
457.3
449.7
372.7
356.1
224.6
198.0
161.1
110.7
97.3
Plantilla
23.8
19.2
9.4
9.5
7.6
6.7
6.6
3.4
5.5
Finca 1
Finca 2
Finca 3
Finca 4
Finca 5
Produccin (Tm)
15
5
20
8
30
Rendimiento (Tm/Ha)
9
2
10
4
20
Solucin.
El rendimiento medio por hectrea en el total de la fincas vendr dado por el cociente entre el
total de la produccin y el total de hectreas. Esta ltima cantidad la podemos calcular como
cociente produccin/rendimiento en cada finca:
Total produccin
15 5 20 8 30
= 8.07 Tm/hectrea.
Total hectrea
15 / 9 5 / 2 20 /10 8 / 4 30 / 20
Observe que la frmula aplicada coincide con la media armnica de los rendimientos ponderados
por la produccin de cada fila.
RM
22) La primera etapa de un rally consta de 4 tramos cronometrados. En cada uno de los 4 tramos,
un determinado piloto ha alcanzado las siguientes velocidades medias:
Tramo 1
Tramo 2
Tramo 3
Tramo 4
Distancia (km)
20
10
15
30
Calcular la velocidad media total alcanzada por el piloto en la primera etapa del rally.
Solucin.
La velocidad media total vendr dada por el cociente entre el total de la distancia y el tota del
tiempo:
VM
= 90.32 Km/hora.
Total tiempo
20 /120 10 / 70 15 / 80 30 / 90
Observe que la frmula aplicada vuelve a ser la media armnica, de las velocidades ponderadas
por la distancia de cada tramo.
23) Se tienen tres ciudades A, B y C. La distancia que hay de B a C es el triple de la distancia de
A a B; y la distancia de C a A es el doble de la distancia de B a C. Un automovilista viaja de A
a B a 70 Km/h de B a C a 75 Km/h y de C a A 85 Km/h. Determine el promedio de velocidad
para el viaje completo.
24) En la asignatura de Matemtica Bsica se obtuvo una nota media de 4 puntos y desviacin
estndar 1.8. Se aaden 20 nuevos datos, todos iguales a 4 puntos.
a) Calcular la media total
51
n1 S X2 1
b) Verificar que la varianza total est dada por:
S X2 1
20 n1 , donde n1 es el nmero de
25) Supongamos que se tienen dos variables aleatorias X, Y de las que se conocen los siguientes
datos muestrales: X , S x , g1 X , yi kxi b y n tamao de la muestra (k y b son constantes
positivas). Calcular:
a) La media y la desviacin estndar de Y
b) Comparar el coeficiente de asimetra de ambas variables
52
Como tenemos que los trabajadores del turno de da reciben en promedio $800 dlares menos que
los de la noche
Entonces
Ecu. 1
870,000= 100
- 32,000
902,000=100
=
9,020=
Sustituyendo
en Ecu.1 tenemos
=
= 8220, salario promedio en el grupo uno.
3. En un supermercado trabajan 35 mujeres, con un salario promedio mensual de $ 650
dlares y 15 hombres en promedio ganan un 12% ms que las mujeres cul es el salario
promedio de los empleados del supermercado?
Solucin
Datos
= 35
=15
53
Construccin(km)
4.82
20.50
10.18
32.83
65.66
Construccin promedio(km/d)
0.9
3.4
1.7
5
10
Ma=
Ma=
= 4.39km/d
54
= 9.25
Sean:
, Ecu. 1
Ahora utilicemos la media geomtrica
4=
, sustituyendo
16=
+16=0
Sustituyendo
en Ecu 1
Sustituyendo
en Ecu 1
56
= 3.2
7. Una persona viaja 4 das. Diariamente recorre 200km, pero maneja el primero y el ultimo
da a 50km/h. cul es la velocidad media durante el viaje?
Solucin
Construimos la siguiente tabla
das
1
2
3
4
Distancia(km)
200
200
200
200
Ma=
= 55.19
57
Utilizamos la media armnica, porque con ella encontramos la velocidad media, y como nos dice
que las ciudades son equidistantes, entonces tenemos
Ma=
= 38.29
9. Un fabricante dispone $600,000 anuales para la compra de materia prima. Durante tres
aos invierte la misma cantidad de dinero. Si el precio promedio por kg ha aumentado en
los ltimos tres aos sucesivamente de $2,200 a $2,280 y luego a $4,600. Cul es el
precio promedio que ha pagado el fabricante en los tres aos?
Solucin
Utilizar la media geomtrica
Mg=
Sustituyendo los valores tenemos
Mg=
=3,048.69
10. El primero de mayo de 2002 se ahorraron $50,00 en un banco al 7.6% del inters anual,
capitalizado semestralmente. Obtener la cantidad media depositada en la cuenta, entre el
primero de mayo de 2002 y el 31 de octubre de 2006, suponga que no se hicieron retiros
durante el periodo.
Solucin
Como el problema se refiere a inters se utiliza la media geomtrica
Mg=
58
Semestres
1/05-31/10
1/11-31/05
1/05-31/10
1/11-31/05
1/05-31/10
1/11-31/05
1/05-31/10
1/11-31/05
1/05-31/10
ao
2,002
2,002
2,003
2,003
2,004
2,004
2,005
2,005
2,005
Total
capital
50,000
51,900
53,872.2
55,919.34
58,044.27
60,249.95
62,539.44
64,915.94
67,382.74
Mg=
Mg=
Ln
10.82
10.85
10.89
10.93
10.97
11.01
11.04
11.08
11.12
98.71
, tenemos
=29.81
11. Tres amas de casa fueron a comprar a tres mercados diferentes. Cada una gasto $10
dlares en la compra de naranjas. La ama de casa A compro 4 docenas de naranjas, la ama
de casa B compro 6 docenas de naranjas y la ama de casa C, compro 3 docenas de
naranjas. Cul es el precio promedio por docena?
Solucin
A=
B=
C= =3.3
59
12. el siguiente cuadro muestra la distribucin de renta anual (en miles de dlares) en que
incurren 50 viviendas.
Marca de clase
N de viviendas
18.85
3
21.55
2
24.25
7
26.95
7
29.65
11
32.35
11
35.05
9
18.85
21.55
24.25
26.95
29.65
32.35
35.05
3
2
7
7
11
11
9
n=50
3
5
12
19
30
41
50
-hallar la media
-hallar la mediana
Md=
60
Buscar la clase
Md=
Md=
=29.95
Md=
=32.21
,
Sustituyendo los datos en la formula tenemos
Pruebas
Puntaje obtenido por A
Puntaje obtenido por B
1
57
80
2
55
40
3
54
62
4
52
72
5
62
46
6
55
80
7
59
40
Mediana
62
Entonces
55
62
-hallar moda
40
80
63
,
Entonces estadsticamente el candidato que debe de ser contratado es el A, ya que el coeficiente
de variabilidad de este es ms pequeo que el del candidato B, es decir que la media de A es ms
representativa.
14. se toman las medidas de 80 personas las que tiene estatura media de 1.70m y desviacin
estndar de 3.4cm. Posteriormente se verifico que la media usada tena 4 cm de menos.
Rectifique los estadsticos mencionados.
Solucin
Tenemos que
Por propiedad de la varianza sabemos que si a todos los datos que tenemos le sumamos o le
restamos algo esta no cambia entonces la varianza ser la misma
=3.4
15) una asistencia social desea saber cul es el ndice de natalidad en 2 municipios de san
salvador para ello encuesto a 10 familias de cada municipio obteniendo los siguientes resultados.
A
B
0
3
6
4
1
1
2
4
3
2
1
3
4
1
3
5
6
4
4
3
64
4
4
6
b) Considera Ud. que el distrito B, el nmero de hijos por familia es ms homogneo que en el
distrito A. Para saber cual distrito es ms homogneo encuentro su respectivo coeficiente de
variacin
Encontrar desviacin estndar del municipio A
65
,
Entonces el municipio ms homogneo es el B.
16) El salario promedio anual en una ciudad es de 8,000 dlares, con una varianza de 1,000
dlares. Cules sern la nueva media y la nueva varianza si se efectan los siguientes cambios?
a) se aumenta 810 dlares a todos
66
=8000, pero como a cada uno de los trabajadores se les aumenta 810 dlares mas por propiedad
de la media se sabe que si a cada dato se le suma o se le resta una constante entonces esta
constante se le suma o se le resta a la media, entonces tendremos
=8000+810=8,810, esta es la nueva media
Ahora para encontrar la varianza lo hacemos por la propiedad que dice que si a cada uno de los
valores se le suma o resta una constante la varianza no cambia entonces
=1,000,
b) Se aumenta el 15% de su salario a cada trabajador
En lo anterior realizado se puede observar que a cada salario se est multiplicando por una
constante, y por propiedad de la media tenemos que si la media de multiplicar cada uno de los
valores de una variable por una constante es igual a multiplicar la constante por la media.
Entonces la nueva media ser
=8000x1.15=9,200
La nueva varianza la encontramos utilizando la propiedad que dice que si todos los datos son
multiplicados por una constante entonces se multiplica la constante al cuadrado por la varianza
entonces tendremos
=1,000x
c)
=1322.5
17) En un examen 20 alumnos del curso A obtienen una media de 60 puntos y desviacin
estndar de 20 puntos. En el curso B los alumnos obtienen una media de 80 y desviacin
67
estndar de 16. Ante unos reclamos se decide subir en 5% mas 5 puntos adicionales a todos
los alumnos del curso A, en cambio como hubo muchas copias en el curso B se decidi
disminuir la quinta parte de la calificacin. Despus de los mencionados ajustes cul es el
puntaje promedio de los 50 alumnos?
Solucin
Datos
A
B
=20
=30
60
80
20
16
= 22.05,
68
= 10.24,
0
1
2
3
4
5
6
13
20
25
20
11
7
4
N=100
.se pide:
a) Calcular el nmero medio de hijos, la mediana y la moda.
b) La media
=2.33
-mediana
Buscar la posicin
Entonces Md=2
69
-moda
Como en esta caso el valor que ms se repite es 2, entonces
Mo=2
c) Calcular los cuartiles y el decil 7
-cuartil 1
Buscar la posicin
Entonces
=1
-cuartil 2
Buscar la posicin
Entonces
=2
-cuartil 3
Buscar la posicin
Entonces
75
=3
-calcular el decil 7
Buscar la posicin
=3
d) Analizar la dispersin de la distribucin, interpretando los resultados.
Para ello deb calcular el coeficiente de variacin, para encontrarla deb primero conocer la
varianza y esta viene dada por la siguiente formula
70
=2.39
Comente su respuesta
Que es una distribucin platicurtica y asimtrica a la derecha
19) la siguiente distribucin expresa el nmero de vehculos vendidos durante un mes por cada
uno de las 50 sucursales que una determinada firma tiene en El Salvador.
1
3
4
5
12
20
71
6
10
8
5
N=50
.se pide
a) Media aritmtica, mediana y moda.
-media aritmtica
=4.38
-mediana
Buscar la posicin
Entonces Md=4
-moda
Como en esta caso el valor que ms se repite es 4, entonces
Mo=4
Se espera una distribucin aproximadamente simtrica
b) Desviacin tpica, coeficiente de asimetra de Fisher y curtosis. Comente resultados.
-desviacin tpica
=1.17
72
=1
Tiene una distribucin asimtrica a la derecha y platicurtica
20. la siguiente tabal recoge la cifra de ventas (en miles de millones de dlares) de las diez
mayores empresas del sector de automvil durante el ao 1989.
empresa
ventas
Plantilla
Sea
457.3
23.8
Fasa Renault
449.7
19.2
General Motors
372.7
9.4
Ford
356.1
9.5
Citroen
224.6
7.6
Peugeot
198.0
6.7
Nissan
161.1
6.6
Mercedes Benz
110.7
3.4
Enasa
97.3
5.5
a) Calcular las ventas medias y el nmero medio de empleados.
-ventas medias
73
,
Entonces existe ms homogeneidad en las ventas.
c) Calcular las ventas media por empleados
Luego lo dividimos entre mil para obtener las ventas medias por empleado
74
21) una empresa dedicada al cultivo y explotacin de naranjas posee 5 fincas. La produccin de
naranjas y el rendimiento medio por hectrea para cada una de las fincas estn dados en la
siguiente tabla. Calcular el rendimiento medio por hectrea par el total de las 5 fincas.
Fincas
1
2
3
4
5
Produccin( Tm)
15
5
20
8
30
Rendimiento(Tm/Ha)
9
2
10
4
20
22. la primera etapa de un rally consta de 4 tramos cronometrados. En cada uno de los 4 tramos,
un determinado piloto ha alcanzado las siguientes velocidades.
Tramos
1
2
3
4
Distancia(km)
20
10
15
30
Velocidad media(km/h)
120
70
80
90
.calcular la velocidad media total alcanzada por el piloto en la primera etapa del rally.
75
( x1 , y1 ), ( x2 , y2 ),. . ., ( xn , yn )
En este caso tenemos una variable estadstica bidimensional o distribucin bidimensional de
frecuencias, la cual representaremos por (X, Y). Cuando se cuenta con una gran cantidad de
datos, un modo de presentar la distribucin bidimensional es a travs de una tabla de doble
entrada de la forma:
Tabla de doble entrada
X/Y
y1
y2
... yj
...
yk
Total
x1
n11
n12
. . . n1 j
...
n1k
n1
n21
n22
. . . n2 j
...
n2 k
n2
.
.
.
ni 1
.
.
.
ni 2
.
.
.
. . . nij
.
.
.
nl 1
.
.
.
nl 2
n1
n2
x2
.
.
.
xi
.
.
.
xl
Total
.
.
.
...
nik
.
.
.
. . . nlj
...
.
.
.
nlk
.
.
.
ni
.
.
.
nl
. . . n j
...
n k
Donde los valores de X e Y pueden venir dados en intervalos, al igual que en el caso de una
dimensin. En el caso de que las dos variables sean atributos, la tabla anterior recibe el nombre
de tabla de contingencia.
La representacin grfica ms utilizada en el caso bidimensional es la nube de puntos o diagrama
de dispersin. Consiste en representar cada pareja de datos como un punto sobre unos ejes
cartesianos.
76
n1
x2
n2
.
.
.
xl
.
.
.
nl
y1
y2
.
.
.
yk
n j
n1
n2
.
.
.
n k
Distribuciones condicionadas de X e Y.
ni / j
nj /i
Y/X= xi
n1 j
x2
n2 j
.
.
.
.
.
.
nlj
xl
y1
y2
.
.
.
yk
ni1
ni 2
.
.
.
nik
Ejemplo:
Se desea investigar el ganado caprino (cabras) y el ganado ovino (ovejas) de un pas. En la tabla
de doble entrada adjunta se presentan los resultados de un estudio de 100 explotaciones
ganaderas, seleccionadas aleatoriamente del censo agropecuario. Se proporcionan las frecuencias
conjuntas del nmero de cabezas (en miles) de cabras (X) y ovejas (Y) que poseen las
explotaciones.
X\Y
0
1
2
3
4
0
4
6
9
4
1
1
5
10
7
4
2
2
7
8
5
3
1
3
5
5
3
2
1
4
2
3
2
1
0
a) Hallar las medias, varianzas y desviaciones tpicas marginales.
b) Hallar el nmero medio de cabras condicionado a que en la explotacin hay 2,000 ovejas.
c) Hallar el nmero medio de ovejas que tienen aquellas explotaciones que sabemos que no
77
tienen cabras.
Solucin:
Primero completar la tabla anterior con las distribuciones de frecuencias de X e Y.
X\Y
0
1
2
3
4
n j
4
5
7
5
2
23
6
10
8
5
3
32
9
7
5
3
2
26
4
4
3
2
1
14
1
2
1
1
0
5
ni
24
28
24
16
8
100
a) La media de X es:
X
0* 24 1* 28 2* 24 3*16 4*8
= 156/100= 1.56
100
La varianza de X es:
S
2
X
100
= 1.3077
78
Yi
nij
Y/X4
2
4 4
6
ni.
1
1
0
1
2
Distribuciones marginales de X e Y.
Distribucin de Y condicionado a X=3
Covarianza
Solucin.
Si Cov(X,Y)=0, no se puede concluir que no exista relacin entra ambas variables. Pero
se puede decir que no existe relacin lineal entre las variables.
Cov( X , Y ) S XY
x
l
i 1
Y nij
79
S XY
S X SY
1 n
( xi x )( y i y )
n i 1
2
1 n
1 n
( xi x )
( y i y )2
n i 1
n i 1
De modo que valores de r cercanos a 1 indican una dependencia lineal y positiva entre las dos
variables, y valores de r cercanos a -1 indican dependencia lineal negativa. Cuando el valor de r
est cercano a cero, no existe dependencia lineal entre X e Y. Esto ltimo puede ser, bien porque
X e Y son variables independientes, o bien porque la dependencia existente entre ambas variables
es de otro tipo diferente al lineal.
Observaciones
Variables a explicar
(aleatoria)
Y1
---Yj
---Yn
80
Se trata en general de estudiar las posibles relaciones existentes entre la distribucin de Y j y los
valores de las X ij . A la Y se le denomina generalmente la variable dependiente, mientras que
frecuentemente a X i se les llama variables independientes o exgenos del modelo, aunque se
prefiere denominarlas variables explicativas.
Los grficos de dispersin son tiles debido a que proporcionan informacin sobre la relacin
existente entre las variables, permiten sugerir modelos posibles, pueden sealar la existencia de
observaciones atpicas, etc.
EJEMPLO 1. Analicemos la relacin que existe entre el peso y la estatura segn el sexo en el
siguiente diagrama de dispersin. 1: Hombres, 2: Mujeres. ESTAPESO.xls
Con el objetivo de dar una idea intuitiva del concepto de covarianza, razonemos el siguiente
diagrama de dispersin, correspondiente a las variables: TEMPERATURA-COSTO, en la que las
rectas horizontal y vertical sobre el conjunto de puntos corresponden a los valores medios (42.83,
79.25).
En este caso, existe claramente una fuerte relacin negativa, la mayor parte de los puntos caen en
los cuadrantes II Y IV. Cuando la relacin existente sea positiva la mayora de los puntos caern
en los cuadrantes I y III
Si consideramos para cada punto xi , y i del diagrama el signo que tiene el producto
xi x yi y vemos que ste resulta positivo en los cuadrantes I y III y negativo en los
cuadrantes II Y IV. Por lo tanto el producto anterior ser en promedio positivo si existe una
relacin creciente entre las dos variables (es decir, si la Y tiende a crecer cuando lo hace la X) y
negativo si la relacin existente es decreciente.
Por definicin la covarianza entre dos variables no es ms que el promedio de los productos de
las desviaciones de ambas variables respecto a sus medias respectivas. De forma similar a como
se procedi a definir la varianza, el promedio se calcula dividiendo por n-1 en vez de n.
x
n
Cov xy
i 1
x yi y
n 1
Cov xy
SxSy
correlacin lineal est siempre comprendido entre -1 y 1. Los valores extremos slo los toma en
el caso de que los puntos del diagrama de dispersin estn alineados exactamente en lnea recta.
82
Cuanto ms estrecho es el grado de relacin lineal existente entre dos variables ms cercano a 1
es el valor de r (o a -1 si la relacin es decreciente). Por el contrario un valor de r nulo o cercano
a cero indicar una relacin lineal inexistente o nula.
OBSERVACIONES
EJERCICIO 1.
Dada una alta inflacin, el seor Chvez ha cuidado mucho de su presupuesto. Como su casa
tiene calefaccin elctrica, llev un registro de la cuenta del consumo mensual de energa
elctrica durante el ao pasado y del promedio mensual de la temperatura exterior. Los datos
aparecen en la siguiente tabla. La temperatura est dada en grados Celsius y el costo de la energa
est en dlares. TEMPERACOSTO.xls.
Tabla2. Registro mensual: TEMPERATURA-COSTO.
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Temperatura
Promedio
10
18
35
39
50
65
75
84
52
40
25
21
costo de
energa
120
90
118
60
81
64
26
38
50
80
100
124
Identificar las variables, dependiente y explicativa. Hacer sus conjeturas de la relacin entre las
variables a partir del siguiente grfico y calcular la Cov xy y rxy .
83
Descriptive Statistics
Mean Std. Deviation N
TEMPERATURA 42.83
COSTO
79.25
23.218 12
32.628 12
Correlations
TEMPERATURA COSTO
TEMPERATURA Pearson Correlation
Sig. (2-tailed)
Sum of Squares and Cross-products
Covariance
COSTO
N
Pearson Correlation
Sig. (2-tailed)
Sum of Squares and Cross-products
Covariance
N
-.863**
.000
5929.667 -7188.500
539.061
-653.500
12
-.863**
12
1
.000
-7188.500 11710.250
-653.500 1064.568
12
12
es una
componente aleatorio del error. Se supone que los errores tienen promedio cero y varianza 2
desconocida. Adems se suele suponer que los errores no estn correlacionados. Esto quiere decir
que el valor de un error no depende del valor de cualquier otro error.
2
S 0 , 1 yi 0 1 xi . Los estimadores por mnimos cuadrados de o y 1 , que se
i 1
designarn por
0 1 , deben satisfacer
y
85
2
y
i
i
0
1
0 ,
i 1
0 1
x 0
2
y
i
i
0
1 i
1 ,
i 1
0 1
n
2
0 xi 1 xi xi yi
i 1
i 1
i 1
n xi yi ;
0
1 i1
i 1
Que son las llamadas ecuaciones normales de mnimos cuadrados. Su solucin es la siguiente:
n
y
i xi
n
i 1
i 1
yi xi
n
i 1
n
0 y 1 x ;
x
i 1
, en donde y
1 n
yi
n i 1
1 n
xi son
n i 1
i 1
S xx xi
i 1
i 1
S xy
S xx
, donde:
xi x ; S xy yi xi
i 1
i 1
y x
i 1
i 1
yi xi x
i 1
yi se llama
residual, matemticamente el
i-simo residual es:
ei yi yi yi 0 1 xi
i 1,2,....n .
ei Tiene un papel importante para investigar la adecuacin del modelo de regresin ajustado.
86
Tenemos que:
0 y 1 x
S xy y x
n
S xx
E 1
i 1
S xx
E yi
E 0 0 ;
Var 1
sxx
1 xi
1 x 2
Var 0 2
n sxx
Propiedades tiles
n
ei 0
1. i
i 1
i 1
i 1
i 1
2. yi y i
3. La lnea de regresin de mnimos cuadrados siempre pasa por el centroide de los datos
que es el punto y, x
n
4.
xe
5.
y e
i i
i 1
n
i 1
0
0
87
Estimacin de 2
2
Adems de estimar 0 y 1 , se requiere estimar . Se obtiene de la suma de cuadrados
SC Re s ei
i 1
n
yi yi
i 1
y i 0 1 x i
i 1
y i y 1 x 1 x i
i 1
y i y 2 1 y i y xi x 1
i 1
i 1
x
n
i 1
yi 2 yi y y 2 1 xi yi 2 1 yi x 2 1 xi y 2 1 x y 1 s xx
i 1
y i 2n
2
i 1
y y
i
i 1
i 1
i 1
i 1
i 1
i 1
n y 2 1 xi y i 2 1
2
i 1
n
1 n
xi y i
n i 1 i 1
s
1
1 n 1 n
2 1 yi xi 2 1 n xi yi 1 . xx .s xx
n i 1 i 1
n i 1 n i 1
s xx
n
y i 2 n y n y 2 1 xi y i 2 1
2
i 1
i 1
yi n y 2 1
2
i 1
n
x y
i 1
1 n
x
y
i i 1 S xy
n i 1 i 1
1 n
xi yi 1 S xy
n i 1 i 1
yi n y 2 1 S xy 1 S xy
2
i 1
n
SC Re s yi n y 1 S xy
2
i 1
Pero y y y
n
i 1
i 1
2
2
n y SCT
SCRe s SCT 1 S xy
E SCRe s n 2 2
88
La suma de cuadrados residuales tiene n-2 grados de libertad, porque 2 grados de libertas se
asocial con los estimados
0 1
y
yi . El estimador insesgado de
2 es:
2
SC Re s
CM Re s (Cuadrado Medio Residual)
n2
: Error
estndar de regresin.
2
Es un estimado de dependiente del modelo.
1 1
0 0
independiente, entonces la distribucin de muestreo tanto de
y
es t con n-2
Se 1
Se 0
grados de libertad.
Un intervalo de confianza de 1001 % para 1 es:
1 t
2 ,n 2
Se 1 1 1 t
2 ,n 2
Se 1
0 t
2 ,n 2
Se 0 0 0 t
2 ,n2
Se 0
E
y x0 0 1 x 0
x
89
y
Para obtener un intervalo de confianza de 1001 % para E x , se debe notar primero que
0
x0
es una variable aleatoria normalmente distribuida, porque es una combinacin lineal de las
observaciones y i . La varianza de y
Var
x0 x
1
y x0 2
n
S xx
es:
x0
y / x0 E y / x0
CM Re s
x0 x
1
n
S xx
de libertad.
Un intervalo de confianza de 1001 % para la respuesta media en el punto x x 0 es:
x0 t
1
x x
0
n
S xx
. CM Re s
,n 2
E y
x0 x
y x0 t , n 2 . CM Re s
x
n
2
0
S xx
x
x0 es una funcin de 0 . El ancho del
x0 x
Las mejores estimaciones de y se hacen con valores de x cerca del centro de los datos.
ei son NID 0, 2
(Promedio de 1 ); Var 1
2
(Varianza de 1 )
S xx
90
Estadstico t (Definicin)
CM Re s
Dentese a Se 1
: Como el error estndar estimado o error estndar de la pendiente,
S xx
1 10
entonces t 0
H 0 : 0 00
H1 : 0 00
0 00
t0
CM Re s
Se 0
1 x2
n S xx
CM Re s
0 00
2
1 x
Se 0
n S xx
t 0 t 2 , n2 .
Nota: El que una variable no sea significativa no quiere decir que en realidad no lo es, es
necesario el conocimiento no estadstico del problema para determinar por ejemplo si los
intervalos de los datos fue el adecuado.
Prueba de significancia de la regresin (Caso particular del test anterior: la conste es igual
a cero).
H 0 : 1 0
H1 : 1 0
cualquier x es y y
La verdadera relacin entre x e y no es lineal
Si se rechaza H 0 : 1 0 , explica que x tiene valor para explicar la variabilidad de y. Rechazar
H 0 : 1 0 podra equivaler a que:
91
Aunque hay un efecto lineal en x se podran obtener mejores resultados agregando trminos
polinomiales en x.
El procedimiento de prueba para H 0 : 1 0 se puede establecer con dos mtodos.
Una aplicacin importante del modelo de regresin es predecir nuevas observaciones y que
correspondan a un nivel especificado de la variable regresora x. Si x 0 es el valor de inters de la
Var y 0 Var 0 1 x 0
2
1
x x
2 2 0
S xx
n
x x
1
Var 2 1 0
n
S xx
x x
1
y 0 t , n 2 . CM Re s 1 0
2
n
S xx
92
Lo anteriormente expuesto se puede observar en el siguiente grfico que muestra las bandas de
confianza y de prediccin para un conjunto de datos.
SCR
SC Re s
1
. Se llama coeficiente de determinacin.
SCT
SCT
1 S xx
Y su valor esperado: E R
2
1 2 S xx 2
regresora x.
n
consideracin a x.
SCR
1; 0 R 2 1 .
SCT
modelo
xi , y i ,
sin
ordenada
al
origen
es: y 1 x .
Dadas
n
las
observaciones
2
i 1
93
yi xi
i 1
n
x i2
i 1
yi yi
El estimador de 2 es: 2
i 1
CM Re s
n 1
yi2 1 yi xi
i 1
i 1
n 1
1 : 1 t , n 1
2
CM Re s
n
x i2
i 1
x02 .CM Re s
y
E
: y x t , n 1
n
0
2
x0
xi2
i 1
y 0 t , n 1 CM Re s 1
i 1
n
yi
x 02
x
i 1
2
i
yi y
i 1
n 2
yi
y i2
i 1
A veces, el diagrama de dispersin proporciona una gua para decidir si se ajusta o no el modelo
sin ordenada al origen. Tambin, se pueden ajustar ambos modelos y escoger entre ellos de
acuerdo con la calidad del ajuste obtenido. Si no se puede rechazar la hiptesis 0 0 en el
modelo sin ordenada al origen, quiere decir que se puede mejorar el ajuste si se usa es modelo.
El cuadrado medio de residuales es una forma til de comparar la calidad del ajuste. El modelo
que tenga el cuadrado medio residual menor, es el mejor ajuste.
En general, R 2 no es un buen estadstico para comparar los dos modelos.
94
x x
1
y 0 t , n 2 . CM Re s 1 0
2
n
S xx
SCR
SC Re s
1
. Se llama coeficiente de determinacin.
SCT
SCT
Y su valor esperado: E R
1 S xx
1 2 S xx 2
regresora x.
2
consideracin a x.
SCR
1; 0 R 2 1 .
SCT
Transformacin
Forma lineal
y 0 x 1
y log y, x log x
y log 0 1 x
y 0 e 1x
y ln y
y ln 0 1 x
95
y 0 1 log x
x
0 x 1
x log x
y
1
1
, x
y
x
y 0 1 x
y 0 1 x
96
Como se esperaba, hoy los datos se ajustan a una lnea recta. El proceso manual para obtener la
ecuacin de prediccin es el mismo que el de regresin simple. En SPSS se obtiene siguiendo la
RUTA: Analyze>Regression> Linear (Dependent: LOGNATURAL, Independent: Horas>Ok
ANOVAb
Sum of
Squares
Model
1
Regression
Residual
Total
Df
Mean Square
12.627
.013
12.640
Sig.
12.627 4936.297
.000a
.003
Coefficientsa
Unstandardized
Coefficients
Model
Std. Error
Standardized
Coefficients
Beta
1 (Consta
nt)
2.278
53.28
.043
Horas
.336
.005
.999
70.25
9
Sig
Lower
Upper
Bound
Bound
.
00
2.168
2.388
.323
.348
0
.
00
0
97
ANOVAb
Sum of
Squares
Model
1
Regression
Residual
Total
Df
Mean Square
12.627
.013
12.640
Sig.
12.627 4936.297
.000a
.003
Coefficientsa
Unstandardized
Coefficients
Model
Std. Error
Standardized
Coefficients
Beta
Sig
Lower
Upper
Bound
Bound
a. Dependent Variable:
LOGNATURAL
El modelo lineal encontrado es entonces: y 2.278 0.336.Horas . Para determinar el modelo
ajustado a los datos originales, se debe considerar la transformacin y ln y y su modelo lineal:
y ln 0 1 x . Resolviendo: ln 0 2.278 , entonces 0 9.757 .
98
En el anlisis, ste caso se conoce el orden en que fueron recolectados los datos, y debe hacerse
para determinar si hay dependencia de los residuos con la secuencia del tiempo de recoleccin
Para realizar una regresin no lineal mediante SPSS tenemos que elegir los mens
Analize>Regression>Curve Estimation.
Este men nos da la opcin de calcular los siguientes modelos de regresin.
Lineal, Y 0 1 X
Logartmica, Y 0 1 ln X
Inversa Y 0 1
X
2
Cuadrtico Y 0 1 X 2 X
2
3
Cubico. Y 0 1 X 2 X 3 X
Potencia. Y 0 X 1 o ln Y ln 0 1 ln X
Compuesto Y 0 1 o ln Y ln 0 X ln 1
Curva S Y e 1 o ln Y 0 1
t
t
0 1 X
ln
Y
Crecimiento Y e
o
0 1 X
X
Exponencial Y 0 e 1 o ln Y ln 0 1 X
Para el caso anterior, elegimos exponencial, y los resultados son los siguientes:
99
Model Summary
R
Adjusted R
Square
R Square
.999
.999
Std. Error of
the Estimate
.999
.051
df
12.627
.013
12.640
Mean Square
1
5
6
12.627 4936.297
.003
Sig.
.000
Standardized
Coefficients
Std. Error
.336
9.755
Beta
.005
.417
t
.999
70.259
23.394
Sig.
.000
.000
4.7. Ejercicios.
1. Determine una ecuacin que describa la relacin entre la frecuencia de
accidentes y el nivel de educacin preventiva
X
150
200
300
450
Y
8.00
7.00
6.50
5.20
XY
1200
1400
1950
2340
X2
22500
40000
90000
202500
100
500
600
800
900
3900
6.40
4.40
4.00
3.10
44.60
3200
2640
3200
2790
18720
250000
360000
640000
810000
241500
Metros 2
X
55
80
85
90
90
110
130
140
180
180
200
200
215
260
300
2315
Ingreso
Y
45
60
75
75
80
95
95
110
120
105
115
130
140
170
200
1615
XY
2475
4800
6375
6750
7200
10450
12350
15400
21600
18900
23000
26000
30100
44200
60000
289600
X2
3025
6400
7225
8100
8100
12100
16900
19600
32400
32400
40000
40000
46225
67600
90000
430075
XY
65
240
340
180
200
300
X2
169
256
289
324
400
625
101
26
32
15
30
38
40
40
50
42
40
287
247
390
960
152
0
200
0
168
0
787
5
676
1024
1444
1600
1764
857
1
6. En una distribucin bidimensional ( xi , yi ) se sabe que: Los valores de la variable X son (1, 2,
3, 4 y 5); la recta de regresin de Y sobre X ( x 3 y 8 0) y el coeficiente de correlacin
lineal (r=0.8). Hallar:
a) La media y la varianza de X
b) Los valores estimados de 0 y 1 de la recta de regresin de Y sobre X.
c) La covarianza
d) La media y la varianza de Y.
7. En un estudio donde se investig la relacin que existe entre la temperatura de la superficie
de una carretera (X, medida en grados Fahrenheit) y la deformacin del pavimento (Y). El
20
resumen
de
cantidades
es
la
siguiente:
n=20,
y
i 1
20
y
i 1
2
i
20
8, xi 1470;
i 1
20
x
i 1
2
i
143215
20
x y
i 1
12 ,
1083 .
103
Sexo
Hombre
Mujer
25,097
12,849
11,384
19,587
21,264
16,219
4,834
111,234
23,858
12,490
11,810
23,372
28,725
21,645
8,269
130,169
Total
48,955
25,339
23,194
42,959
49,989
37,864
13,103
241,403
se
Porcentajes:
104
Los porcentajes se hacen para expresar las proporciones en base 100. En el ejemplo anterior, los
nios representan el 31%, los jvenes el 47%, los adultos el 15% y los ancianos 4%.
Ejemplo: En el censo de poblacin de El Salvador, 2007, se encuentra que en el Municipio de
Mejicanos, tiene los siguientes sobre la condicin laboral, para la poblacin mayor de 10 aos.
CONDICION LABORAL
NOMBRE DEL
LUGAR
Zona Urbana
CANTN
CHANCALA
CANTN
MIGUEL
CANTN
ROQUE
Poblacin
ocupada
Inactiv
os
Total
10647
46288
7
54295
5894
286
52
335
673
467
32
478
977
3739
494
3991
58787
6472
51092
8224
11635
1
SAN
SAN
Total
Si
109205
No
8872
Total
118077
672
123
795
916
221
1137
8027
1343
9370
SAN
SAN
105
Total
118820
10559
129379
Ejercicio.
La poblacin de 15 aos o ms segn su condicin de analfabetismo se presenta en el siguiente
cuadro.
Sexo
Soyapango
Ilopango
San Martn
No
161,155
66,240
43,033
10,801
5,420
5,376
Total
171,956
71,660
48,409
Obtener las tasas de analfabetismo de cada municipio y hacer un anlisis comparativo de los
resultados.
X it X i 0
*100
X i0
Ejemplo:
El siguiente cuadro presenta el nmero de homicidios para los aos 2004, 2005, 2006, 2007 y
2008, para los municipios de Soyapango, Ilopango y San Martn.
Grupos
SOYAPANGO
ILOPANGO
SAN MARTN
de
edades Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total
AO 2004
Total
15
167
182
12
78
90
11
42
53
AO 2005
Total
14
228
242
5
74
79
11
75
86
AO 2006
Total
16
246
262
15
69
84
6
48
54
AO 2007
Total
20
179
199
10
67
77
8
71
79
106
Grupos
SOYAPANGO
ILOPANGO
SAN MARTN
de
Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total
edades
AO 2008
Total
10
128
138
9
66
75
7
54
61
Fuente: Fuente estadsticas de homicidios de Instituto de Medicina Legal. Los cadveres que no se pudo identificar
el sexo, no aparecen registrados en el cuadro anterior.
Obtener la diferencia relativa del nmero de homicidios por ao, sexo y municipio.
de valor que experimenta una variable o magnitud en dos situaciones, una de las cuales se toma
como referencia. La comparacin suele hacerse por cociente.
A la situacin inicial se le llama periodo base y a la situacin que queremos comparar periodo actual o
corriente.
ndices simples: Se denomina as a los referidos a una nica magnitud y se obtienen dividiendo cada
precio, cantidad o valor de un periodo (anual, mensual, semanal, etc.), por un precio, cantidad o valor de
un periodo fijo, considerado base, multiplicado luego por 100.
Si X i es una magnitud simple, representamos por X i 0 el valor de la magnitud en el periodo base y por
X it
*100
X i0
Pit
0
*100
b. Precio: I t (i )
Pi 0
qit
0
*100
c. Cantidad: I t (i )
qi 0
a.
0
Valor: I t (i )
107
Ejemplo 1. Con los datos de la serie 2001-2006, calcular los ndices de base fija 2001 y 2004;
luego el ndice de base variable para esa misma serie.
aos
2001
2002
2003
2004
2005
2006
yi
20
28
24
40
48
70
Observe que tomando de base el ao 2001, en el 2004 se tuvo un aumento del 100% y en el 2006
se tuvo un aumento de precios del 250% con respecto al ao 2001; si tomamos de base el ao
2004, en el 2006 se tuvo un aumento del 75%. Finalmente, si tomamos Base Variable en el ao
2006 hubo un aumento del 45.83% con respecto al ao 2005.
EJERCICIO DE APLICACIN. En enero de 2006 una fbrica pag un total de $
99,200,000.00 a 120 empleados en nmina. En julio del mismo ao, la fbrica tuvo 30 empleados
ms en nmina y pag $ 30,000,000 ms que en enero. Tomando el mes de enero como base,
hallar e interpretar:
a) El ndice de empleo (NIE)
b) El ndice del costo de mano de obra (ICMD)
c) Precio relativo
Solucin.
a) NIE= N de empleados en julio / N de empleados en enero
150
NIE
*100 125 . Durante los 6 meses hubo un incremento de empleados del 25%
120
b) ICMD = Salarios pagados en Julio / Salarios pagados en enero
129, 200, 000
ICMD
*100 130.24 . Durante los 6 meses considerados en este estudio
99, 2000, 000
hubo un aumento de costo de mano de obra en la empresa de 30.24%, observe que no se
ha considerado en aumento de empleados.
c) El precio relativo (PR) es equivalente al riesgo relativo utilizado en medicina (RR), es
decir,
108
150 1.04193
. El ndice de costo medio por empleado aument en un
99, 200, 000
120
4.10% para el mes de julio en relacin con el mes de enero.
PR
Ahora, suponer que se tienen nicamente los ndices de base variable y se requiere la
variacin del precio en el 2006 respecto al precio de 2003.
Solucin:
I 0306 I 0303 * R0304 * R0405 * R0506 100*0.8571*1.6666*1.2 171.43 .
Ejercicio. Un ndice para 2006 revela un aumento del 20% respecto al ao anterior. En el 2007
alcanz a 174, es decir, presenta un incremento anual del 18%. Calcular los ndices de base fija
de los aos 2005 y 2006.
Solucin:
05
06
Se requiere encontrar: I 0 , I 0 ?
06
07
Informacin disponible: I 05 120, I 06 118 .
La base o periodo de inicio no se conoce, por lo tanto puede ser cualquier ao, as:
I 007 174 adems sabemos que I 007 I 006 * R0607 , reemplazando 174 en la ltima expresin se
obtiene:
109
174
147.45 .
1.18
05
Para obtener I 0 , se realiza un procedimiento anlogo al anterior.
I 006
I
t
0
X (i)
i 1
n
X
i 1
(i )
*100
I
t
0
P (i)
i 1
n
P (i)
i 1
I
t
0
*100
q (i)
i 1
n
q (i)
i 1
*100
Las expresiones anteriores son muy tiles cuando no existen variaciones significativas entre
productos, ya estos ndices no se ven afectados por las variaciones en algn producto. Para
recoger las variaciones entre productos se recomienda calcular primeramente los ndices simples
y luego sumarlos y finalmente dividirlos por el nmero de productos. Esto es,
n
I
t
0
I
i 1
t
0
(i )
*100
Ejemplo: Con los datos de la siguiente tabla, calcular el ndice agregativo de las
cantidades que resultaron en mal estado de conservacin, en un grupo de artculos, comparados
en el mes de junio de 2009, respecto a las cantidades comparadas, en mal estado de conservacin,
en el
mes de mayo del mismo ao.
Artculos medida Defectuosas
mayo Junio
A
Kg
12
18
B
Lt
8
15
110
C
Docena 20
8
D
Libras
14
20
E
Unidad 50
70
Total
104
131
Solucin:
Primer mtodo.
n
I
t
0
q (i)
i 1
n
q (i)
i 1
*100
131
*100 125.96 . Este mtodo es poco usual, ya que no es afectado
104
por las variaciones grandes que puede presenta uno varios artculos.
Segundo mtodo.
n
t
0
(i )
i 1
*100
Este ndice puede interpretarse, como la relacin existente, al comparar los precios actuales de
un grupo de artculos, con los precios de esos mismos artculos considerados en el periodo base,
mantenindose constante como ponderacin las cantidades del periodo base. La expresin es la
siguiente:
n
I 0t
P (i)q (i)
i 1
n
P (i)q (i)
i 1
*100
I 0t
P (i)q (i)
t
i 1
n
P (i)q (i)
0
i 1
*100
La diferencia entre las dos frmulas anteriores, radica nicamente en la base tomada para las
ponderaciones, en la primera se refiere a las cantidades del periodo base y en la segunda, las
cantidades corresponden al periodo que se investiga.
I 0t
I 0t
L P
I 0t
Pt (i)q0 (i)
i 1
n
P (i )q (i)
i 1
n
P (i )q (i) P (i )q (i )
0
i 1
i 1
*100
I 0t
P0 (i)qt (i)
i 1
n
P (i)q (i)
i 1
P (i)q (i)
I 0t
*100
i 1
n
P (i)q (i)
i 1
I 0t
I 0t
I 0t
F L P
*100
i 1
n
i 1
*100
Ejemplo: Con los siguientes datos referentes a los precios y cantidades para un grupo de
artculos dados para dos periodos.
Artculos Unidad
2006
2007
Precio Cantidad Precio Cantidad
A
Kg
26
10
38
8
B
Lt
6
5
10
7
C
Lbs
1
2
4
5
D
Docena 6
1
15
2
E
Unidad 3.6
2
2
1
Calcular los ndices de precios y de cantidad de las Laspeyres, Paasche y Fisher.
Solucin:
112
P07q07
304
70
20
30
2
426
P07q06
380
50
8
15
4
457
P06q07
208
42
5
12
3.6
270.6
I 0t
Laspeyres: L
P (i)q (i)
t
i 1
n
P (i)q (i)
0
i 1
I 0t
Paasche: P
P (i)q (i)
i 1
n
P (i)q (i)
i 1
Laspeyres: (270.6/305.2)*100=88.66
Paasche: (426/457)*100= 93.22
Fisher: 90.91
Ejercicio. El ndice de cantidad de un grupo de artculos es igual a 200, s se usa la frmula de
Fisher, y a 160 si se emplea la de Laspeyres. Cul es el ndice de cantidad usando la frmula de
Paasche?
Solucin.
t
40, 000
250
160
113
Ejercicio. El ndice de precios de Laspeyres es de 2/3 del de Paasche y ste asciende a 130.
Cul es el ndice de Fisher?
Solucin.
t
t
t
LI0 (2 / 3) * P I0 (2 / 3)(130) 86.66 F I0 86.66*130 106.14
114
Ventas
18
18
19
15
12
16
20
24
35
a) Hallar los ndices de ventas, tomando como base primero 2002 y luego
2005.
b) Hallar los ndices de ventas con base variable
2. Un empleado ganaba $ 772 dlares mensuales en 2009 en el 2010 gana $ 912 mensuales, con
lo cual mejora su ingreso real en 16%. Si el actual ndice de precios es de $ 560 Cul era el
ndice de precios del 2009?
3. La produccin de tomates (en toneladas) en la provincia de Valparaso fue durante los ltimos
10 aos:
AO
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
PRODUCCION (ton)
1300
1280
1189
1234
1100
1250
1310
1270
1140
1240
Se Pide:
a) Establezca una serie de nmeros ndice, que
permita estudiar la evolucin de dichas producciones,
considerando como base el ao 1997.
b) Determine el porcentaje de variacin de la
produccin entre los aos 1997 y 2006.
c) Determine la tasa de crecimiento promedio (tcp) entre los aos 1997 y 2007.
4. La entrada de turistas Alemanes a nuestro Pas durante los ltimos 7 aos segn SERNATUR
viene dada por la tabla siguiente:
AO
2000
2001
2002
2003
2004
2005
2006
Nmero de Turistas
12565
13124
11897
14578
16243
14890
15321
Se Pide:
a) Establezca una serie de nmeros ndice, que permita estudiar
todos los datos, considerando como base el ao 2000.
b) Con respecto al ao 2003. Qu porcentaje de aumento o
disminucin se dio en los aos 2004 y 2005.
115
Se Pide:
a) Establezca una serie de nmeros ndice, que
permita estudiar todos los consumos,
considerando como base el ao 2002.
b) Determine el porcentaje de variacin del consumo entre los aos 2002 y 2006.
c) Determine la tasa de crecimiento promedio (tcp) entre los aos 2002 y 2006.
6. Una fbrica de automviles chinos produce cuatro modelos distintos, todos en versin
econmica, cuyos precios expresados en millones de pesos y nmero de unidades producidas
en 1998 y 2000 son respectivamente:
Modelo
1
2
3
4
Precio (M$)
0.9
1.3
1.9
3.8
Ao 1998
N de unidades
3200
3200
3200
3200
Precio (M$)
1.2
1.5
2.1
4.3
Ao 2000
N de unidades
5600
4300
2000
1200
Se Pide:
a) Hallar el ndice de precios y de cantidad de LASPEYRE, con base el ao 1998.
b) Hallar el ndice de precios y de cantidad de PAASCHE, con base el ao 1998.
c) Hallar el ndice de FISHER para precio y cantidad, considerando el mismo ao base.
7. Si, por ejemplo, el consumo final de un pas, expresado en miles de dlares corrientes de cada
ao, y el I.P.C. de los mismos aos son los siguientes, expresar en dlares. Constantes el
consumo final de ese pas:
Aos
2000
2001
2002
2003
2004
Consumo final
17
20
22
25
30
IPC
100
105
110
115
118
116
Teorema
Dada una poblacin de N elementos se pueden seleccionar N n muestras diferentes con
remplazamiento de tamao n, y (N)n muestras diferentes sin remplazamiento de tamao n.
Demostracin.
Al realizar n selecciones sucesivas con exactamente N opciones posibles, en cada una de las n
selecciones, que son las correspondientes a los N elementos de la poblacin. As, pues, segn el
resultado anterior N.N . . . N N n , muestras diferente de tamao n, en un muestreo con
remplazamiento, tomando n1 n2 . . . nn N .
Si efectuamos un muestreo sin remplazamiento, tendremos N opciones posibles en la primera
seleccin, pero tan slo (N-1) en la segunda, pues los elementos de la poblacin no son devueltos
a la misma; de la misma manera, en la tercera slo se tendrn (N-3+1) opciones, y as
sucesivamente hasta la n-sima, en la cual se tendrn (N-n+1) posible opciones. Por tanto,
existirn (N)n = N.(N-1) . . . (N-n+1) muestras diferentes de tamao n, en el muestreo sin
remplazamiento.
Ejemplo.
Supongamos una urna que contiene 9 bolas numeradas del 1 al 9. Si realizamos un muestreo
aleatorio con remplazamiento de tamao 6, el espacio muestral , estar compuesto por
96 531,441 elementos.
Ejemplo.
Si lanzamos un dado 5 veces, entonces el espacio muestral estar formado por 65 7,776
elementos, ya que este experimento es equivalente a muestrear con remplazamiento, donde el
nmero de veces que lanzamos el dado es equivalente al tamao n de la muestra aleatoria y N al
nmero de caras del dado.
Ejemplo.
Supongamos una urna que contiene 11 bolas numeradas del 1 al 11. Si realizamos un muestreo
aleatorio sin remplazamiento de tamao n=3, el espacio muestral estar formado por
(11)3 990 elementos.
Teorema.
El nmero de ordenaciones diferentes de N elementos es
RVN ,n N n
6.3.3. Permutaciones.
Las permutaciones o, tambin llamadas, ordenaciones son aquellas formas de agrupar los
elementos de un conjunto teniendo en cuenta que:
Influye el orden en que se colocan.
Tomamos todos los elementos de que se disponen o una parte de ellos.
Sern Permutaciones SIN repeticin cuando todos los elementos de que disponemos son
distintos.
Sern Permutaciones CON repeticin si disponemos de elementos repetidos. (Ese es el n
de veces que se repite el elemento en cuestin).
P ( n, r )
n!
( n r )!
RPN n1...nr
N!
n1 !.n2 !...nr !
Para tener una idea de la deduccin de la ecuacin anterior, observe que una poblacin de
tamao n puede dar lugar a n! muestras ordenada de tamao n. Adems, el nmero de muestra
ordenadas de tamao n, en un muestreo sin remplazamiento, efectuado en una poblacin de
tamao N, es (N)n , con lo que si llamamos A al nmero de subpoblaciones distintas de tamao n
de una poblacin de N elementos, ser:
120
N
N!
n !(N n )!
n
Ahora, tenemos r grupos distintos, n1, n2, , nr, y los elementos del primer grupo pueden ser
N
seleccionados de maneras, de los N- n1 elementos restantes, podemos seleccionar los n 2 del
n1
N n1
segundo grupo de
maneras, etc. Despus de formar el (r-1)-simo grupo quedarn N n2
n1 - n2 - - nr-1 = nr elementos, que constituirn el grupo r-simo, que podremos seleccionar de
nr N n1 n2 . . . n r 1
=1 manera. Por tanto, el nmero de permutaciones con
nr
nr
N!
N n1 n2 . . . nr 1
N N n1
. . .
= n !.n !...n !
nr
1
2
r
n1 n2
6.3.4. Combinaciones.
Llamaremos combinaciones de N elementos tomados de n en n, a los diferentes grupos que se
pueden formar figurando n elementos en cada uno, de modo que cada dos grupos difieran en la
naturaleza de, por lo menos, un elemento. Puede observarse, que no se tiene en cuenta el orden
de los elementos en la disposicin. Se denota por CN ,n y el nmero de grupos que podemos
formar de tamao n, ser:
N
N!
n !(N n )!
n
CN ,n
Observe que una combinacin, es un arreglo de elementos en donde no nos interesa el lugar o
posicin que ocupan los mismos dentro del arreglo.
Ejemplo 1.
a) Si se cuenta con 14 alumnos que desean colaborar en una campaa pro limpieza, cuantos
grupos de limpieza podrn formarse si se desea que consten de 5 alumnos cada uno de ellos,
b) Si entre los 14 alumnos hay 8 mujeres, cuntos de los grupos de limpieza tendrn a 3
mujeres?,
121
14
= 14 x 13 x 12 x 11 x 10 x 9!/ 9!5!
= 2,002 grupos
Entre los 2002 grupos de limpieza hay grupos que contienen solo hombres, grupos que contienen
solo mujeres y grupos mixtos, con hombres y mujeres.
b) n = 14 (8 mujeres y 6 hombres),
r=5
En este caso nos interesan aquellos grupos que contengan 3 mujeres y 2 hombres
r=9
12
122
= 12! / 3!9! = 12 x 11 x 10 / 3!
= 220 maneras de seleccionar las nueve preguntas o dicho de otra manera, el
alumno puede seleccionar cualquiera de 220 grupos de 9 preguntas para aprobar el examen.
b)
C2*10C7 = 1 x 120 = 120 maneras de seleccionar las 9 preguntas entre las que estn las
dos primeras preguntas.
c)
3C1*9C8 = 3 x 9 = 27 maneras de seleccionar las 9 preguntas entre las que est una de las
tres primeras preguntas.
Ejemplo 3.
Una seora desea invitar a cenar a 5 de 11 amigos que tiene,
a) Cuntas maneras tiene de invitarlos?,
b) Cuntas maneras tiene si entre ellos est una pareja de recin casados y no asisten el uno
sin el otro?,
c) Cuntas maneras tiene de invitarlos si Rafael y Arturo no se llevan bien y no van juntos?
Solucin:
a) n = 11,
r=5
11
= 11 x 10 x 9 x 8 x 7 x 6! / 6!5!
= 462 maneras de invitarlos.
Es decir, que se pueden formar 462 grupos de cinco personas para ser invitadas a cenar.
b) Esta seora tiene dos alternativas para hacer la invitacin, la primera es no invitar a la pareja y
la segunda es invitar a la pareja.
C0*9C5 +
C2*9C3 = (1 x 126)
En este caso separamos a la pareja de los dems invitados para que efectivamente se cumpla el
que no asistan o que asistan a la cena.
123
c) La seora tiene dos alternativas para hacer la invitacin, una de ellas es no invitar a Rafael y a
Arturo o que asista solo uno de ellos.
C0*9C5 +
invitacin.
2
C1*9C4 = (1 x 126)
CRN ,m CN n 1, n
Ilustracin
Suponemos que cada elemento del conjunto de los N distintos se representa por el espacio entre
dos lneas verticales del siguiente dibujo formado por N+1 lneas verticales:
1 2 3 ..... N-1 N
N+1
N+1
La posicin de la primera y la ltima de las barras es fija y elegir una ubicacin para las n
estrellas es equivalente a elegir un orden entre N-1 barras y n estrellas. El nmero de esas
posibles elecciones es el nmero de combinaciones sin repeticin de N + n 1 elementos
tomados de n en n.
Cmo se forman?. Para construir las combinaciones con repeticin, partimos del conjunto
A={1,2,3,4} y vamos a construir todas las combinaciones con repeticin posibles.
a)
frecuencia, podemos relacionar una expresin algebraica con algn proceso de conteo. Varias
tcnicas avanzadas de conteo utilizan estos mtodos.
Los nmeros C(n, r) se llaman Coeficientes Binomiales, pues aparecen en el desarrollo del
binomio (a+b) elevado a una potencia.
El Teorema del Binomio proporciona una frmula para los coeficientes en el desarrollo de
n
n
a b (1a 4
b4)(44
a 2b4
)L4(a443
b)
b
.
Como
el desarrollo surge al elegir a o b en
n factores
cada uno de los n factores, multiplicando las selecciones entre ellas, y luego sumando todos los
3
productos obtenidos de esta manera. Por ejemplo, en el desarrollo de a b , se elige a o b en el
primer factor (a + b); a o b en el segundo factor (a + b), y a o b en el tercer factor (a + b); se
multiplican las selecciones entre ellas y luego se suman los productos obtenidos. Si elegimos a en
todos los factores y multiplicamos, obtenemos el trmino aaa.
Si elegimos a en el primer factor, b en el segundo factor y a en el tercer factor y multiplicamos,
obtenemos el trmino aba. La tabla 1 muestra todas las posibilidades. Si sumamos los productos
de todas las selecciones, obtenemos
125
Seleccin
del primer
factor (a+b)
a
a
a
a
b
b
b
b
Seleccin
del segundo
factor (a+b)
Seleccin
del tercer
factor (a+b)
a
a
b
b
a
a
b
b
a
b
a
b
a
b
a
b
Producto de
selecciones
aaa= a 3
aab= a 2 b
aba= a 2 b
Abb= ab 2
baa= ba 2
bab= ab 2
bba= ab 2
bbb= b3
Tabla 1. Clculo de a b
Un trmino de la forma a n k b k surge de elegir b en k factores y a de los otros n-k factores. Pero
esto puede realizarse de C(n, k) formas, pues C(n, k) cuenta el nmero de formas de elegir k
cosas de n elementos. As, a n k b k aparece C(n, k) veces. Esto implica que
126
EJEMPLO
Desarrollar
n = 4, obtenemos
EJEMPLO
Determine el coeficiente de
en el desarrollo de
El trmino relacionado con
aparece en el teorema del binomio considerando n = 9 y k = 4.
As el coeficiente de
es 126.
EJEMPLO
Determine el coeficiente de
en el desarrollo de
Como
(Nueve trminos)
Obtenemos
cada vez que multiplicamos dos x elegidas de los nueve trminos, tres y
elegidas de los nueve trminos para las x de C(9,2) formas. Una vez realizada esta seleccin,
podemos elegir as tres trminos para las y de C(7,3) formas. Esto deja los cuatro trminos
restantes para las z. As el coeficiente de
en el desarrollo
es
127
Por consiguiente, el trmino correspondiente al lado derecho del teorema del binomio cuenta el
nmero de subconjuntos de X.
Exprsense los coeficientes binomiales en una disposicin triangular conocida como tringulo de
Pascal (vase la figura 1.).
Los dos lados superiores estn formados por nmeros 1 y cualquier valor interior es la suma de
los dos nmeros que estn por encima y a los lados de l.
1
1
1
1
1
1
2
3
4
5
1
1
3
6
10
1
4
10
1
5
10. Una mesa presidencial est formada por ocho personas, de cuntas formas distintas se
pueden sentar, si el presidente y el secretario siempre van juntos?
11. Cuntas diagonales tiene un pentgono y cuntos tringulos se puede informar con sus
vrtices?
12. Un grupo, compuesto por cinco hombres y siete mujeres, forma un comit de 2 hombres y
3 mujeres. De cuntas formas puede formarse, si:
a) Puede pertenecer a l cualquier hombre o mujer.
b) Una mujer determinada debe pertenecer al comit.
c) Dos hombres determinados no pueden estar en el comit.
13. De cuntas formas distintas pueden sentarse ocho personas en una fila de butacas?
14. En una clase de 35 alumnos se quiere elegir un comit formado por tres alumnos.
Cuntos comits diferentes se pueden formar?
15. De cuntas formas distintas pueden sentarse ocho personas alrededor de una mesa
redonda?
16. En una bodega hay cinco tipos diferentes de botellas. De cuntas formas se pueden elegir
cuatro botellas?
17. En el palo de seales de un barco se pueden izar tres banderas rojas, dos azules y cuatro
verdes. Cuntas seales distintas pueden indicarse con la colocacin de las nueve
banderas?
18. Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules. Si las bolas de igual
color no se distinguen entre s, de cuntas formas posibles pueden ordenarse?
19. Cuatro libros distintos de matemticas, seis diferentes de fsica y dos diferentes de
qumica se colocan en un estante. De cuntas formas distintas es posible ordenarlos si:
1. Los libros de cada asignatura deben estar todos juntos.
2. Solamente los libros de matemticas deben estar juntos.
20. Una persona tiene cinco monedas de distintos valores. Cuntas sumas diferentes de
dinero puede formar con las cinco monedas?
6.6. Solucines.
1. De cuntas formas diferentes se pueden cubrir los puestos de presidente, vicepresidente y
tesorero de un club de ftbol sabiendo que hay 12 posibles candidatos?
No entran todos los elementos.
S importa el orden.
No se repiten los elementos.
2. Con las letras de la palabra libro, cuntas ordenaciones distintas se pueden hacer que
empiecen por vocal?
La palabra empieza por i u o seguida de las 4 letras restantes tomadas de 4 en 4.
129
3. De cuntas formas pueden mezclarse los siete colores del arco iris tomndolos de tres en
tres?
No entran todos los elementos.
No importa el orden.
No se repiten los elementos.
4. Cuntos nmeros de cinco cifras distintas se pueden formar con las cifras impares?
Cuntos de ellos son mayores de 70.000?
S entran todos los elementos.
S importa el orden.
No se repiten los elementos.
7. Con las cifras 1, 2 y 3, cuntos nmeros de cinco cifras pueden formarse? Cuntos son
pares?
S entran todos los elementos: 3 < 5
S importa el orden.
S se repiten los elementos.
9. Una mesa presidencial est formada por ocho personas, de cuntas formas distintas se
pueden sentar, si el presidente y el secretario siempre van juntos?
Se forman dos grupos el primero de 2 personas y el segundo de 7 personas, en los dos se cumple
que:
131
10. Cuntas diagonales tiene un pentgono y cuntos tringulos se puede informar con sus
vrtices?
Vamos a determinar en primer lugar las rectas que se pueden trazar entre 2 vrtices.
No entran todos los elementos.
No importa el orden.
No se repiten los elementos.
Son
, a las que tenemos que restar los lados que determinan 5 rectas que no son diagonales.
11. Un grupo, compuesto por cinco hombres y siete mujeres, forma un comit de 2 hombres y 3
mujeres. De cuntas formas puede formarse, si:
1. Puede pertenecer a l cualquier hombre o mujer.
132
12. De cuntas formas distintas pueden sentarse ocho personas en una fila de butacas?
S entran todos los elementos. Tienen que sentarse las 8 personas.
S importa el orden.
No se repiten los elementos. Una persona no se puede repetir.
13. En una clase de 35 alumnos se quiere elegir un comit formado por tres alumnos.
Cuntos comits diferentes se pueden formar?
No entran todos los elementos.
Noimporta el orden: Juan, Ana.
Nose repiten los elementos.
14. De cuntas formas distintas pueden sentarse ocho personas alrededor de una mesa
redonda?
15. En una bodega hay cinco tipos diferentes de botellas. De cuntas formas se pueden elegir
cuatro botellas?
No entran todos los elementos. Slo elije 4.
No importa el orden. Da igual que elija 2 botellas de ans y 2 de ron, que 2 de ron y 2 de ans.
S se repiten los elementos. Puede elegir ms de una botella del mismo tipo.
16. En el palo de seales de un barco se pueden izar tres banderas rojas, dos azules y cuatro
verdes. Cuntas seales distintas pueden indicarse con la colocacin de las nueve
banderas?
133
17. Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules. Si las bolas de igual
color no se distinguen entre s, de cuntas formas posibles pueden ordenarse?
18. Cuatro libros distintos de matemticas, seis diferentes de fsica y dos diferentes de qumica
se colocan en un estante. De cuntas formas distintas es posible ordenarlos si:
1. Los libros de cada asignatura deben estar todos juntos.
19. Una persona tiene cinco monedas de distintos valores. Cuntas sumas diferentes de
dinero puede formar con las cinco monedas?
134
135
, es decir, el conjunto de partes de , P(,) el cual obtendr todos los elementos de inters
en nuestro experimento.
Por ltimo, parece razonable tener una medida de dicha incertidumbre: es decir, su
probabilidad P. As pues, en todo experimento aleatorio se deben considerar los siguientes tres
elementos (, P(), P).
A U Ai
c
i 1
S , , ( , a ], (b, c], ( d , ) / a, b, c, d
semilgebra (, ) .
1) S por definicin
2) Para todo par de intervalos de la clase, su interseccin est en la clase ya que cualquier
intervalo intersecado con ser el mismo intervalo, y cualquier intervalo intersecado con ,
ser , que por definicin ha sido incluido en S.
Por otro lado,
(, a ] (b, c] (b, a] S , si b a c,
(, a ] (b, c] S , si a b c,
(, a ] (b, c] (b, c] S , si b c a,
Adems,
(, a ] (d , ] (d , a] S , si d a ,
(, a ] (d , ] S , si a d ,
Y por ltimo,
137
(b, c] (d , ) S , si b c d ,
(b, c] (d , ) (d , c] S , si b d c ,
(b, c] (d , ) (b, c] S , si d b c ,
3) Dado un intervalo, el complementario se puede poner como unin finita de elementos de la
clase:
Dado , c y dado , c , as pues, slo debemos estudiar el resto de los intervalos:
a , (, a]c (a, ) S . b, c , (b, c]c ( , b] (c, ), perteneciendo ambos intervalos
a S. Por ltimo, d , (d , ]c (, d ] S .
Ejemplo.
Sea (0,1] verificar que la clase de intervalos (a, b] con 0 a b 1 forman una semilgebra.
Definicin 2. (Estructura de lgebra)
Dado el espacio total , una clase Q P () tiene estructura de lgebra si y slo si:
a) Q
b) A, B Q es A B Q
c) A Q, existe una sucesin finita A1 , A2 , ..., An Q con Ai Aj i j tal que
n
A U Ai
c
i 1
d ) A, B Q se tiene A B Q
-lgebra)
Dado el espacio total , una clase A P () tiene estructura de -lgebra si y slo si:
a) A
b) A A Ac A
c) Para toda sucesin An n A se tiene
UA A
n
n 1
n 1
An
UA
c
n
n 1
Ejemplo:
138
C5 [ a, b) ;
C2 (, b) ;
C3 (a, ) ; C4 ( , b] ;
C6 [ a, b) ; C7 [a, b] ;
Ejercicio
Sea el conjunto de casos posibles que resulta de la tirada de un dado. Decir cules de las
siguientes clases de conjuntos son lgebras.
a ) M 1 ,
b) M
, 1, 3, 5 , 2, 4, 6 , , I , P,
, 1 , 1, 5 , 2, 4, 6 ,
Axioma 3. sucesin An n A tal que Ai Aj i j es P U An P ( An )
n 1
n 1
P () 0 .
1.
UA
En
efecto,
sea
la
sucesin
A, , ... con
A A ;
evidentemente
n 1
An
U
n 1
n 1
n2
P An P A P An P A P 0
B* = B complemento.
B= (A B ) (A* B)
Ahora, P(A)= P(A B ) + P (A B*) y P(B) = P(A B ) + P (A* B) por otra parte, A B
= (A B ) (A B*) (A* B)
P(A B) = P(A B ) + P (A B*) + P(A* B)
= P(A B ) + P(A) - P(A B ) + P(B) - P(A B )
= P(A) + P(B) - P(A B )
5. Como generalizacin de la propiedad anterior, podemos expresar la probabilidad de la
unin de n elementos no disjuntos de la -lgebra A de la forma
n
n
n
P
(
A
)
P
(
A
A
)
i
i
i1
i2
i 1
i1 ,i2 1
i1 , i2 ,i2 1
i 1
i1 i2
i1 i2 i3
i 1
Ai
k
n
Hemos obtenido as la clsica regla de Laplace: Cociente entre casos favorables y casos
posibles considerados stos como equiprobables.
En este caso, necesitamos determinar qu nmero de situaciones son consideradas como
favorables y qu nmero de situaciones son posibles al realizar nuestro experimento aleatorio.
Para ello, es de mucha utilidad el anlisis combinatorio y al de su base probabilstica asociada.
Ejercicio. Se elige un nmero al azar del 1 al 6,000, todos igualmente probables. Hallar la
probabilidad de que sea mltiplo de 2 de 3 de 4 de 5.
altura superior a 1.7m. Estos sucesos son parte de , ya que despus de realizar el experimento
tienen respuesta las preguntas: es rubia la persona encuestada? es de altura superior a 1.7m?
Supongamos que estamos en la situacin que una persona rubia (sin saber cul) es elegida, o
dicho de otra manera ha ocurrido el suceso A. A priori, B ha podido tener lugar o no; para que
hubiese ocurrido, habra sido necesario y suficiente que se hubiera elegido una persona del
subconjunto A B de , y para que no hubiese ocurrido, habra sido necesario y suficiente el
que se hubiese elegido una persona del subconjunto A B* de . Supongamos, que ha ocurrido
A y se ha revisado el que B tenga lugar; A ya es un suceso seguro y B no se realizar a menos
que se realizase A B. La probabilidad de realizacin de B, sabiendo que ha ocurrido A, es el
caso de sucesos favorables A B con respecto al nmero de casos posibles que realizan A; es
N A B
decir,
N A , de donde dividiendo por N las dos cantidades ser:
N A B
N P( A B)
NA
P ( A)
N
En resumen, sabiendo que A se ha realizado, una nueva evaluacin de las probabilidades de los
sucesos, conducen a una nueva ley de probabilidades sobre ( ,P( )), denotada por PA , dando
al suceso A una probabilidad igual a uno, y dando una probabilidad nula a los sucesos disjuntos
con A, viniendo definida por:
PA B
P( A B)
P ( A)
1
2. P / A
P ( A)
P ( A)
3. Por ltimo, si An n A es una sucesin de disjuntos de A entonces
P
P U An / A
n 1
An A
P
U
n 1
P ( A)
A
n 1
P ( A)
U A
142
P A
n 1
P ( A)
n 1
P An A
P An / A
P ( A)
n 1
n 1
A A ya que ser
n 1
UB
n
n 1
A AA
Por ser
UC
UCn U Bn A
n 1
UB A .
n
n 1
Por otro lado, PA es una probabilidad sobre (A, A A ) ya que PA es la restriccin de P(/A) al
espacio (A, A A ).
Teorema. (Teorema del Producto o Regla de multiplicacin)
Si A y B son dos sucesos del espacio probabilstico ( , A , P) con P(A) > 0 y P(B) > 0, a partir
de la proposicin 5 se tiene que:
P ( A B ) P ( A) P B / A y P ( A B ) P ( B ) P A / B
Demostracin (Inmediata)
Aj > 0 entonces,
j=1
n-1
143
An
j=1
Ij=1 A j
n-1
UA
n 1
Sea B A un suceso para el que se conocen las probabilidades condicionadas P(B/A i), y
supongamos, por ltimo, que se conocen tambin las probabilidades P(A i), con P(Ai)>0, para
todo i=1,2, . . . En estas condiciones,
P( B)
P( B /
i 1
Ai ) P ( Ai )
Demostracin.
P ( B ) P ( B ) P B
A i P
U
i 1
P ( B / Ai ) P ( Ai )
i
i 1
i 1
P ( Ai / B )
P ( Ai ) P ( B / Ai )
P( A ) P B / A
i 1
, i
P ( A B ) P( B ) P A / B .
Existen muchos experimentos aleatorios en los que la informacin suministrada por el suceso B
no afecta para nada la probabilidad del suceso A, es decir, P(A/B)=P(A). Pues bien, esa es
precisamente la nocin de independencia.
Definicin. (Independencia)
Sea ( , A , P) un espacio probabilstico y sea A,B A , los suceso A y B son independientes si y
slo si:
P ( A B ) P ( A) P ( B )
145
146
Vamos a representar por A el suceso consistente en que un pedido determinado que se est
despachando sea de la mercanca A, y por A* el suceso complementario consistente en que no
sea de la mercanca A.
Como la probabilidad de que un pedido determinado se refiera a una clase de mercanca
determinada (sea A o A*) est influida por el nmero de pedidos de la misma clase que se hayan
despachado antes, este problema ilustra la ley general de la probabilidad compuesta, expresada en
la Ley general de la probabilidad compuesta:
An
A
Ij=1 j
n-1
Una buena forma de considerar el problema es imaginar un mazo de 60 cartas, todas iguales,
excepto que 5 de ellas estn sealadas con A y 55 sealadas con A*. La accin de cumplimentar
los pedidos se puede asociar a la de sacar cartas de un mazo bien barajado, de forma que todas las
cartas que se pueden sacar en una prueba determinada tienen las mismas probabilidades de ser
elegidas.
El suceso de que los pedidos primero y cuarto sean de la mercanca A y el segundo y tercero no,
corresponde a sacar la sucesin de cartas A ,A*, A*, A. Como hay 5 cartas sealadas con A, la
probabilidad de que la primera carta sea una A es 5/60. En la segunda prueba hay 59 cartas en la
baraja, y 55 de ellas estn sealadas con A*. Luego la probabilidad condicionada de que la
segunda carta sea una A* es 55/59. En la tercera prueba quedan 58 cartas, y 54 de ellas estn
sealadas con A*. Luego, la probabilidad condicionada de que la tercera carta sea una A* es
54/58. Finalmente, en la cuarta prueba quedan 57 cartas, de las cuales 4 estn sealadas con A,
luego la probabilidad de que la cuarta carta sea una A es 4/57. Por tanto, multiplicando estas
probabilidades de acuerdo con el teorema que expresa la ley general de la probabilidad
compuesta, obtenemos:
P(A, A*, A*, A) = (5/60) (55/59)(54/58)(4/57) = 0.0051.
Si llamamos E al suceso de que al menos dos pedidos de los cuatro primeros a cumplimentar sean
de la mercanca A, su probabilidad es igual a 1-P(E*), siendo E* el suceso de que los primeros
cuatro pedidos contengan menos de dos pedidos de la mercanca A, es decir, cero o uno. Pero la
probabilidad de que ninguno de los pedidos sea de la mercanca A est dada por:
P(0)= P(A*, A*, A*, A*)= (55/60)(54/59)(53/58)(52/57) = 0.6994.
Como el suceso de que uno de los pedidos sea de la mercanca A puede ocurrir de cuatro formas
mutuamente excluyentes, su probabilidad total es:
P(1) = P(A, A*, A*, A*)+ P(A*, A, A*, A*)+ P(A*, A*, A, A*)+ P(A*, A*, A*, A)
= (5/60)(55/59)(54/58)(53/57) + (55/60)(5/59)(54/58)(53/57)+ (55/60)(54/59)(5/58)
(53/57)+ (55/60)(54/59)(53/58)(5/57) = 0.269
Por todo ello tendremos: P(E*)= P(0)+P(1) = 0.6994+0.269= 0.9684 y la probabilidad buscada
es:
147
que el 20% estudian Arquitectura, el 30% Ciencias y el 50% Letras. Eligiendo un estudiante al
azar, se pide:
d) Probabilidad de que sea de Arquitectura y haya terminado la carrera.
e) Nos dice que ha terminado la carrera. Probabilidad de que sea de Arquitectura.
Ejercicio 16. Un jugador tira un dado, sale 6 y gana. Hallar la probabilidad de que haya hecho
trampa. (Sugerencia: Resolverlo bajo el supuesto de que el 50% de los jugadores son tramposos)
Ejercicio 17. Se lanzan tres monedas simtricas. Calcular la probabilidad de que salgan las tres
tiradas iguales.
Ejercicio 18. Se lanza un dado n veces. Calcular la probabilidad de obtener al menos un seis.
Ejercicio 19. Se tiene un cuadrado inscrito en un circulo de radio r. Se eligen tres puntos al azar e
independientes dentro del circulo. Hallar la probabilidad de que los tres puntos caigan dentro del
cuadrado.
*Ejercicio 20. Al contestar una pregunta con sus n posibles respuestas, una persona o bien
conoce la respuesta correcta (lo cual ocurre con probabilidad p) o bien lo adivina con
probabilidad 1/n. Calcular la probabilidad de que conociese la respuesta, supuesto que ha
contestado correctamente.
*Ejercicio 21. Con una moneda se juega a cara o cruz. Se para de lanzar cuando por primera vez
la diferencia entre el nmero de caras y el nmero de cruces es en valor absoluto igual a 3.
Calcular la probabilidad de que paremos de lanzar la moneda en la sexta tirada o antes. Idem en
la n-sima tirada o antes.
*Ejercicio 22. Entre 5 ciudades situada en los vrtices de un pentgono A-B-C-D-E-A, un
transportista que parte de A realiza viajes de modo que en cada ciudad tiene probabilidad 1/3 de ir
a la izquierda y 2/3 de ir a la derecha. Calcular la probabilidad de que el primer regreso a A sea
por la ciudad contraria hacia la que parti habiendo pasado una sola vez por D. Idem pero
regresando por BA, y pasando adems por D una sola vez.
**Ejercicio 23. Un profesor tiene una caja de cerillas en cada una de sus dos bolsillos, ambas con
el mismo nmero N de cerillas, y va sacando al azar cerillas de cada bolsillo, una a una. Calcular
la probabilidad de que en el bolsillo izquierdo quede exactamente k cerillas cuando en el derecho
saca la ltima.
**Ejercicio 24. En 4 ciudades situadas en los vrtices de un cuadrado, un transportista realiza
viajes de manera que en cada ciudad tiene una probabilidad p de ir a la derecha y q=1-p de ir
hacia la izquierda. Hallar la probabilidad de que el primer regreso a la ciudad de partida, A, se
produzca por la ciudad contraria hacia la que parti.
1. Una experiencia puede dar k resultados posibles mutuamente excluyentes, R 1, R2, ,Rk cuyas
probabilidades respectivas son p1, p2, , pk, siendo su probabilidad total igual a la unidad, es
decir, p1 + p2 + + pk = l. Si se ejecutan N pruebas independientes de la experiencia, cul es la
probabilidad de obtener exactamente n1 resultados del primer tipo, n2 del segundo,, y nk del ksimo,
siendo
n1
+
n2
+
+
nk
=
N?
RESPUESTA 1.
Como las pruebas son independientes, la probabilidad de obtener un resultado determinado
cualquiera Ri en una prueba dada no est influida en absoluto por los resultados de otras pruebas.
Por tanto, la probabilidad Ps de una sucesin determinada cualquiera de resultados es igual al
producto de sus probabilidades incondicionales separadas y, por tanto,
El nmero S de sucesiones distintas que dan el nmero deseado de resultados de cada clase es
igual a Pm(N; n1, n2, , nk) y la probabilidad total P(n1, n2, , nk) viene dada por el producto
S.Ps ; por consiguiente :
P ( n1, n2 , ... , nk )
N!
p1n1 p2 n2 ... pk nk
n1 ! n2 ! ... nk !
2. El informe de un ingeniero sobre las causas de avera en los calentadores de agua domsticos
revel que el 90% de las averas se deban a uno de estos tres factores : escapes en las soldaduras,
escapes en las juntas, o corrosin en puntos aislados, siendo las probabilidades respectivas de
0.4 ; 0.3 y 0.2. Despreciando la posibilidad remota de que se produzcan averas simultneas, y
suponiendo pruebas independientes, cul es la probabilidad de que una muestra aleatoria de
cinco averas contenga dos casos de escapes en las soldaduras, dos de escapes en las juntas, uno
de corrosin en un punto aislado y ninguno debido a otras causas?
RESPUESTA 2.
Aceptando la hiptesis de que las averas simultneas son despreciables, podemos considerar los
diferentes tipos de averas como sucesos mutuamente excluyentes, e incluyendo la categora de
"averas diversas", obtenemos un sistema exhaustivo. Por tanto, podemos aplicar directamente la
ley polinomial de la probabilidad, y la solucin est dada por:
3. La probabilidad de que un vendedor a domicilio consiga una venta en un solo intento es 1/6.
a) Cul es la probabilidad de que consiga al menos una venta en los cinco intentos siguientes?
b) Cul es la probabilidad de que consiga, en esos cinco intentos, cuatro o ms ventas?
RESPUESTA 3.
Aunque puede no ser estrictamente cierto, vamos a suponer que un intento no afecta a otro.
150
a) La probabilidad P(E) del suceso de que el vendedor consiga al menos una venta en los cinco
intentos es igual a 1 P (E ) , siendo el suceso complementario de que no consiga ninguna venta.
En este caso:
P (E )
5!
(1/ 6)0 (5 / 6)5 =0.402
0!5!
P (E)
5!
5!
(1/ 6)4 (5 / 6)1
(1/ 6)5 (5 / 6)0 0.0032 0.0001 0.0033
4!1!
5!0!
(1/ 3)(1/ 5)
33
P (U2 / A)
(1/ 3)(1/ 3)
55
151
P (U3 / A)
152
6. Un avin cubre diariamente el servicio entre dos ciudades. Suponemos que la probabilidad de
accidente en da sin niebla es 0.002 y en da con niebla 0.01. Cierto da de un mes que hubo 18
das sin niebla y 12 con niebla se produjo un accidente. Calcular la probabilidad de que el
accidente haya ocurrido: a) en da sin niebla; b) en da con niebla.
RESPUESTA 6.
Sea A1 el suceso "da sin niebla"; A2 el suceso "da con niebla" y B el suceso "ocurrir accidente".
Se tiene:
7. Un avin con tres bombas trata de destruir una lnea frrea. La probabilidad de destruir la lnea
con cualquiera de las bombas es 1/3. Cual es la probabilidad de que la lnea quede destruida
si el avin emplea las tres bombas?
RESPUESTA 7.
.) Denotemos por Ai al suceso de que la bomba i destruya la lnea frrea; se tiene:
P(A i) = p = 1/3, con i = 1, 2, 3.
Si A es el suceso de que la lnea quede destruida podemos escribir:
P(A) = 1 P(B) = 1 (8/27) = 19/27 y evidentemente, este resultado coincide con el anterior.
8. Se hace un disparo con cada uno de tres caones (A, B y C), siendo la probabilidad de hacer
blanco 0.1, 0.2 y 0.3, respectivamente. Calclese la probabilidad de cada uno de los nmeros
posibles de blancos. Calcular la probabilidad de obtener al menos un blanco.
RESPUESTA 8.
Los nmeros posibles de blancos son:
a) 3 si se hace blanco con cada uno de los caones.
b) 2 si se falla en un disparo.
c) 1 si se fallan dos disparos
d) 0 si se fallan los tres disparos.
En el caso (a), la probabilidad de acertar en todos los disparos vendr dada como el producto de
las probabilidades independientes de acertar cada disparo, es decir:
P ( A B C ) = P(A).P(B).P(C) = (0.1)*(0.2)*(0.3) = 0.006
En el caso b) tenemos:
1) Probabilidad de acertar A y B fallando C:
P(A) .P(B) .P(C) = P(A) .P(B)[ 1 P(C)] = 0.1 x 0.2 x 0.7 = 0.014
2) Probabilidad de acertar A y C fallando B :
P(A).P(B').P(C) = F(A)[1 - P(B)]P(C) = 0.1 x 0.8 x 0.3 = 0.024
3) Probabilidad de acertar B y C fallando A :
P(A').P(B).P(C) = [1 - P(A)P(B).P(C) = 0.9 x 0.2 x 0.3 = 0.054
As, la probabilidad total de fallar un disparo es:
0.014 + 0.024 + 0.054 = 0.092
156
2 y 12. El tiempo de vida de un foco que se extrae aleatoriamente de un lote de focos depende
tambin del azar, este constituye otro ejemplo de una variable aleatoria que vara entre el tiempo
0 y un valor indeterminado, ya que no sabemos exactamente cunto tiempo va durar. El nmero
de varones de una familia con 5 hijos tambin es una variable aleatoria que vara de 0 a 5, ya que
en una familia de cinco hijos puede que no haya ningn varn, uno, dos, tres, cuatro o cinco
varones.
Si las observaciones no se dan en trminos numricos, podemos asignarles nmeros y reducir las
observaciones cualitativas al caso cuantitativo; as tenemos que la funcin que asigna valores
numricos a cada uno de los elementos del espacio muestra con una probabilidad definida, se
denomina "variable aleatoria".
Por ejemplo, si se lanza una moneda 3 veces, el nmero de guilas X es una variable aleatoria
que toma los valores 0, 1, 2, 3; es decir puede que ninguna vez, una sola, dos o tres veces salga
guila como resultado; la probabilidad de que
(dos guilas) es 3/8 ya que el espacio muestra
S={aaa, aas, asa, ass, sas, ssa, saa, sss}. Y de estos ocho resultados hay tres en los cuales hay dos
guilas. Con esto podemos ver que el espacio muestral es el dominio de la funcin y el conjunto
de valores que la variable puede tomar es el rango o recorrido de la funcin, que es un
subconjunto de los reales .
158
X :
w X ( w)
que asocia a cada suceso elemental un nmero real, verificando que
PrX ( B) Pr[ X B] Pr w / X ( w) B B
El conjunto S es el espacio muestral y es la coleccin de todos los subconjuntos de .
Identificacin de una variable aleatoria discreta X: es preciso conocer el conjunto de los
posibles resultados de X:
{x1, x2, ,xk, }, donde los xi no necesariamente son todos enteros, pero si se pueden
contar o numerar.
El conjunto de las probabilidades siguientes:
p1 = P(X = x1)
p2 = P(X = x2)
...
Pk = P(X = xk)
...
termina, ya que quizs nunca exceda estos lmites permitidos, por lo tanto, el conjunto de valores
de X es el conjunto de los nmeros enteros positivos. Como podemos enlistar o numerar el
conjunto (es un conjunto numerable) de valores de la variable X, decimos que la variable
aleatoria X es una variable aleatoria discreta.
Ejemplo 8.2. Supongamos que nos interesamos por el nmero de varones X en el experimento de
observar al azar dos nios recin nacidos (Sea H = hombre y M = mujer). Entonces, el espacio
muestra, los valores de la variable aleatoria X que cuenta el nmero de varones y su funcin de
probabilidad se dan en la siguiente tabla:
S
Valores de X: xi
MM
MH , HM
HH
Ejemplo 8.3. Sea X la variable aleatoria que indica la suma de los puntos en las caras superiores
al lanzar dos dados, Determine el espacio muestral, el conjunto de valores de X y las
probabilidades respectivas.
Solucin: El espacio muestral S es el conjunto de los 36 pares ordenados que se indican a
continuacin:
Este conjunto se puede visualizar como el conjunto de puntos del plano cartesiano que se muestra
a continuacin
Fig. 3.2 Diagrama del Espacio Muestral del lanzamiento de dos dados
160
La variable aleatoria es la suma de los elementos de cada par, por lo tanto, toma los valores del 2
al 12,
indican en la siguiente tabla:
Valores de X : xi
(1,1)
(1,2) (2,1)
10
(5,6) (6,5)
11
(6,6)
12
Total:
161
(verificarla)
Varianza = 2 = n p q (verificarla)
Grficamente el aspecto de la distribucin depende de n y de p. Por ejemplo, si p=0.5 y n
cualquiera es simtrica; si p n es 0.5, la binomial no es simttrica. El siguiente grfico lo ilustra
para n=4.
ASPECTO DE LA BINOMIAL PARA n=4 Y p=0.5 Y p=0.25.
163
0, t 0
0.7738, 0 t 1
0.9774, 1 t 2
b) FX (t ) 0.9988, 2 t 3
1
, 3t 4
, 4t 5
1
1
, t5
c)
E[ X ] np 5(0.05) 0.25
2 V [ X ] npq 5(0.05)(0.95) 0.2375
(verificarlo)
(verificarlo)
Las variables Poisson cumplen la propiedad de que la suma de variables Poisson independientes
es otra Poisson con media igual a la suma las medias.
El aspecto de la distribucin depende muchsimo de la magnitud de la media. Como ejemplo,
mostramos tres casos con = 0,5 (arriba a la izquierda), = 1,5 (arriba a la derecha) y = 5
(abajo) Obsrvese que la asimetra de la distribucin disminuye al crecer y que, en paralelo, la
grfica empieza a tener un aspecto acampanado.
165
p( x 4 , 6 )
0.13392
4!
24
b)
x= variable que nos define el nmero de cheques sin fondo que llegan al banco en dos das
consecutivos = 0, 1, 2, 3, ......, etc., etc.
= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos
166
Nota: siempre debe de estar en funcin de x siempre o dicho de otra forma, debe hablar de lo
mismo que x.
p( x 10, 12 )
0.104953
10!
3628800
0.329307
1!
1
b) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 5 minutos =
0, 1, 2, 3, ...., etc., etc.
= 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata
( 1 )0 ( 2.718 )1 ( 1 )( 2.718 )1
p( x 2,3,4,etc.... 1 ) 1 p( x 0 ,1, 1 ) 1
0
!
1
!
=1-(0.367918+0.367918) = 0.26416
c)
x = variable que nos define el nmero de imperfecciones en la hojalata por cada 15 minutos
= 0, 1, 2, 3, ....., etc., etc.
= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata
p( x 0 ,1, 3 ) p( x 0, 3 ) p( x 1, 3 )
0!
1!
167
168
1)
(verificarlas)
Si n es pequeo, con relacin a N (n << N), la probabilidad de un xito varia muy poco de una
prueba a otra, as pues, la variable, en este caso, es esencialmente binomial; en esta situacin, N
suele ser muy grande y los nmeros combinatorios se vuelven prcticamente inmanejables, as
pues, la probabilidades se calculan ms cmodamente aproximando por las ecuaciones de una
binomial con p = K / N.
La media de la variable aproximada ( = n p = n (K / N)) es la misma que la de la variable antes
de la aproximacin; sin embargo, la varianza de la variable binomial es ligeramente superior a la
de la hipergeomtrica.
el factor por el que difieren ser siempre menor que 1 y tan prximo a 1 como cierto sea que n <<
N.
170
15 C3
15 C3
15 C3
0.81538
455
455
455
455
455
C0* 9 C3
C
15 3
( 1 )( 84 )
0.184615 0.815385
455
171
C0* 9 C3
15 C3
( 1 )( 84 )
0.184615
455
C4* 3 C0 ( 35 )( 1 ) 35
0.16667
210
210
10 C4
b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan
p(al menos 2 no exploten) = p( 2 o ms proyectiles no exploten) = p(x = 2 o 3; n=4) =
C2* 7 C2 3 C3* 7 C1 ( 3 )( 21 ) ( 1 )( 7 ) 63 7
70
0.333333
210
210
210
10 C4
172
Su grfico es:
1
ba
1
entre el rea de todo el rectngulo de base b-a
ba
1
. Este hecho se puede usar para calcular la funcin de distribucin.
ba
173
E[ X ] xf ( x)dx x
Pero
xdx
1
1 b
dx
xdx
a
ba
ba
B
A
A B
ab
H
(b a) ; por tanto
el cual es un trapecio, cuya rea es
2
2
E[ X ]
ab
2
174
(b a ) 2
V[X ]
12
Ejemplo 8.11. Un meteorlogo hace una medicin del tiempo al azar, suponiendo que est
distribuida uniformemente en el intervalo [1, 4]. A) Calcule la probabilidad de que la medicin
este entre 5/2 y 3. b) Si se realizan 6 mediciones independientes, hallar la probabilidad de que
exactamente 3 de ellas estn entre 2 y 3.
175
4)
Sus
colas son
asintticas
al eje X.
Para
calcular
probabilidades en
intervalos
de
valores de la
variable, habra
que integrar la
funcin
de
densidad entre los
extremos
del
intervalo.
por
desgracia (o por suerte), la funcin de densidad normal no tiene primitiva, es decir, no se puede
integrar. Por ello la nica solucin es referirse a tablas de la funcin de distribucin de la variable
(calculadas por integracin numrica) Estas tablas tendran que ser de triple entrada (, , valor)
y el asunto tendra una complejidad enorme.
Afortunadamente, cualquier que sea la variable normal, X, se puede establecer una
correspondencia de sus valores con los de otra variable con distribucin normal, media 0 y
varianza 1, a la que se llama variable normal tipificada o Z. La equivalencia entre ambas
variables se obtiene mediante la ecuacin:
P ( x1 X x2 ) P ( z1 Z z 2 ) , donde
z1
x1
z2
x2
176
Ejemplo 3.13. En una dis tribucin normal de media 4 y des viacin tpica 2,
calcular el valor de a para que P (4 a x 4+ a) = 0.5934.
S olucin:
P ( x1 X x2 ) P ( z1 Z z2 ) 0.5934, donde
z1
x1
z2
x2
y x1 4 a y x2 4 a
P or tanto:
4a4
4a4
y z2
2
2
a
a
z1
y
z2
2
2
z1
Pb ( X x ) PN ( x 0.5 X x 0.5)
8.9. Ejercicios.
1. En una ciudad s e es tima que la temper atura mxi ma en el mes de j unio
s igue una dis tribucin normal, con med ia 23 y des viacin tpica 5 .
C alcular el nmero de das del mes en los que s e es pera alcanzar
mx imas entre 21 y 27.
2. La medi a de los pes os de 500 es tudiantes de un colegio es 70 kg y la
des viacin tpica 3 kg. S uponiendo que los pes os s e dis tribu ye n
norma lmen te, hallar cuntos es tudiantes pes an:
a. Entre 60 kg y 75 kg.
178
b. M s de 90 kg.
c. M enos de 64 kg.
d. 64 kg.
e. 64 kg o menos.
3.
Se supone que los resultados de un examen siguen una distribucin normal con media 78
y varianza 36. Se pide:
Varios test de inteligencia dieron una puntuacin que sigue una ley normal con media 100
y desviacin tpica 15.
179
180
distribucin normal.
Cuando el muestreo se realiza a partir de una poblacin que sigue una distribucin normal, la
distribucin de la medida de la muestra tiene las siguientes propiedades:
1. La distribucin de
2. La media
ser normal
, de la distribucin de
La varianza,
, de la distribucin de
y varianza finita
y varianza
Observe que el teorema del lmite central permite tomar muestras a partir de poblaciones con
distribucin no normal y garantizar que se obtengan aproximadamente los mismos resultados
que si la poblacin tuviera una distribucin normal, siempre que se tome una muestra muy
grande.
Ejemplo
Suponga que en una poblacin grande de seres humanos, la dimensin del dimetro craneal sigue
una distribucin aproximadamente normal, con una media de 185.6 mm y una desviacin
estndar de 12.7 mm. Cul es la probabilidad de que una muestra aleatoria de tamao 10 de esta
poblacin tenga una media mayor que 190?
Solucin
181
Cuando se dice que la poblacin sigue una distribucin aproximadamente normal, se supone que
la distribucin muestral de
sabe que la media y la desviacin estndar de la distribucin muestral son iguales a 185.6 y
, respectivamente.
182
Al consultar la tabla normal estndar, se encuentra que el rea a la derecha de 1.10 es 0.1357;
por lo tanto, se puede decir que la probabilidad de que la muestra de tamao tenga una media
mayor que 190 es 0.1357.
Ejemplo:
Si la media y desviacin estndar de la concentracin de hierro en el suero en hombres sanos es
de 120 y 15 microgramos por cada 100 ml, respectivamente, cul es la probabilidad de que una
muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por
cada 100 ml.
Solucin:
La probabilidad buscada es:
Ejercicios:
1. La National Health and Nutrition Examination Survey de 1976-1980 en una investigacin
encontr que los niveles de colesterol en individuos varones, estadounidenses, con edades
entre 20-74 aos, fue de 211. La desviacin estndar fue de aproximadamente de 90.
Considere la distribucin muestral de la media de la muestra basada en muestras de
tamao 50 extradas de esta poblacin de individuos varones. Cul es la media de la
distribucin muestral y el error estndar?
i) Mayor a 6 das
ii) Entre 4 y 6 das
iii) Entre 4.5 y 5.5 das.
Solucin:
Para responder a esta pregunta es necesario conocer la naturaleza de la distribucin muestral para
la estadstica principal, es decir, la diferencia entre las dos medias,
. Es importante notar
que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar
de una.
184
Distribucin muestral de
: caractersticas.
Lo que se pretende es calcular la distribucin de la diferencia entre las medias de las muestras. Si
se elabora una grfica de las diferencias de las muestras contra sus frecuencias de ocurrencia, se
podra obtener una distribucin normal con una media igual a
medias reales de los dos grupos o poblaciones, y una varianza igual a
185
izquierda de
Al consultar la tabla de la normal, se encuentra que el rea bajo la curva normal estndar a la
izquierda de -1.78 es igual a 0.0375. Para responder a la pregunta original, se puede decir que, si
no hay diferencia entre las medias poblacionales, la probabilidad de obtener una diferencia mayor
o igual que 13 entre las medias de las muestras es de 0.0375.
Muestreo a partir de poblaciones normales.
El procedimiento anterior es vlido incluso cuando el tamao de la muestras n1 y n2, son
diferentes, y cuando las varianzas
, y varianzas
, la
tamao n1 y n2 extradas de esas poblaciones siguen una distribucin normal con media
y varianza
y una
estadstica, el procedimiento es el mismo que el muestreo que se hace a partir de poblaciones con
distribucin normal.
186
Ejemplo:
Suponga que se estableci que para cierto tipo de pacientes el tiempo promedio de visita
domiciliaria hecha por una enfermera es de 45 minutos con una desviacin estndar de 15
minutos, y para un segundo tipo de paciente, el promedio de visita domiciliaria es de 30 minutos
con una desviacin estndar de 20 minutos. Si la enfermera visita al azar a 32 pacientes del
primer tipo y 40 del segundo tipo, cul es la probabilidad de que el tiempo promedio de visita
domiciliaria difiera entre los dos grupos por 20 minutos o ms?
Solucin:
No se menciona nada respecto a la forma funcional de las poblaciones, por lo que se supone que
esta caracterstica se desconoce, o que las poblaciones no presentan una distribucin normal.
Puesto que las muestras son grandes (mayores que 30) en ambos casos, se hace uso de los
resultados del teorema del lmite central. Se sabe que la diferencia entre las muestras sigue una
distribucin al menos aproximadamente normal con las siguientes media y varianza:
En la tabla de la distribucin normal se encuentra que el rea a la derecha de z=1.23 es: 1-0.8907
=0.1093. por lo tanto, se puede decir que la probabilidad de que las visitas al azar de la enfermera
difieren entre las dos medias por 20 o ms minutos es de 0.1093. La curva de
y la curva
187
. Si se eligen
Solucin:
Para responder esta pregunta es necesario conocer algunas de las propiedades de la distribucin
muestral de la proporcin de la muestra. Se designar la proporcin de la muestra con el smbolo
.
188
es igual a
La pregunta que surge ahora es: qu tan grande debe ser la muestra para que sea vlido el uso de
la aproximacin normal? Un criterio ampliamente utilizado es que
deben ser
aproximadamente
normal
con
una
son
sigue una
media
a la
derecha de 0.15. Esta rea es igual al rea bajo la curva normal estndar a la derecha de:
es 1en una
189
es 0.0008. De hecho, si
se extrajera una muestra de este tipo, mucha gente la considerara un evento extrao.
Ejercicios:
1. Una investigacin realizada en 1990 por el National Center for Health Statistics, 19 por
ciento de los encuestados mayores de 18 aos, dijo no saber del virus VIH del SIDA.
Cul es la probabilidad de que en una muestra de 175 individuos de esa poblacin 25 por
ciento o ms no sepa de la existencia del SIDA?
2. Se sabe que 35 por ciento de los miembros de una poblacin sufren de enfermedades
crnicas. Cul es la probabilidad de que en una muestra aleatoria de 200 individuos 80 o
ms de ellos tengan al menos una enfermedad crnica?
: caractersticas.
Con varianza
190
consideran
n1
n2
suficientemente
grandes
cuando
Ejemplo:
Suponga que la proporcin de consumidores moderados a grandes consumidores de
estupefacientes ilegales es de 0.50 para la poblacin 1, en tanto que en la poblacin 2 la
proporcin es de 0.33. Cul es la probabilidad de que muestras de tamao 100, extradas de cada
una de las poblaciones, presente un valor de
igual a 0.30?
Solucin:
Se supone que la distribucin muestral de
de
Y varianza:
191
Al consultar la tabla de la normal, se encuentra que el rea bajo la curva normal estndar que est
a la derecha de z=1.89 es 1-0.9706=0.0294. Por lo tanto, la probabilidad de observar una
diferencia igual a 0.30 es de 0.0294.
Ejemplo:
Se sabe que en una poblacin de adolescentes 10 por ciento de los varones son obesos. Si la
misma proporcin de mujeres en esa poblacin son obesas, cul es la probabilidad de que una
muestra al azar de 250 varones y 200 mujeres proporcione un valor de
Solucin:
Se supone que la distribucin muestral de
es aproximadamente normal. Si la
correspondiente de z es:
de 0.16
o ms?
2. Se tienen bases para suponer que 40 por ciento de las casas en cierta rea de la ciudad
estn en malas condiciones. Una muestra aleatoria de 75 casas de esa rea y otra
compuesta de 90 casas de otra seccin dieron una diferencia
. Si no hay
192
diferencia en la proporcin de casas en malas condiciones entre esas dos reas, cul es la
probabilidad de observar una diferencia de esta magnitud o mucho mayor?
Despejando
en la ecuacin se tiene:
193
Ejemplo:
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresin
(mayor puntaje significa mayor depresin).
2
11
14
16
19
5
11
15
16
19
6
13
15
17
19
8
13
16
17
19
8
14
16
17
19
9
14
16
18
19
9
14
16
18
19
10
14
16
18
20
11
14
16
19
20
Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los
datos tienen distribucin normal, con varianza poblacional
desconocida. Como
es
desconocido, lo estimamos por s =18,7. Luego, un intervalo de confianza aproximado es:
Luego, el intervalo de confianza para es (13.2, 15,8). Es decir, el puntaje promedio poblacional
se encuentra entre 13,2 y 15,8 con una confianza 95%.
Ahora construya un intervalo de confianza utilizando la distribucin t-Student.
III. Intervalo de Confianza para una Proporcin.
A menudo es necesario construir intervalos de confianza para una proporcin. Por ejemplo,
supngase que se toma una muestra de tamao n de una poblacin grande (posiblemente infinita)
y que X observaciones de esta muestra pertenecen a una clase de inters.
Ejemplo: El nmero de caras obtenidas al lanzar una moneda n veces.
X1, X2, X3,.Xn
X caras
B(n, p)
194
,a
Ntese que
195
z/2
z/2
Pero:
Luego:
y el parmetro p sea
196
Obsrvese que:
Por lo que:
Note que para utilizar esta ecuacin se requiere una estimacin del parmetro p. Si se tiene una
estimacin
de alguna muestra anterior, entonces p puede sustituirse por , de tal manera que:
Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:
197
O bien:
Ejemplo:
En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15
aos en la Regin Metropolitana, se encontr que el 17.6% eran hipertensas. Un intervalo de 95%
de confianza para la proporcin de mujeres hipertensas en la Regin Metropolitana est dado por:
Luego, la proporcin de hipertensas vara entre (0.139, 0.212) con una confianza de 95%.
IV. Intervalos de confianza para la diferencia de dos proporciones
Supngase que existen dos proporciones de inters p1 y p2, y es necesario obtener un intervalo
de confianza para la diferencia de p1 - p2 con un nivel de confianza de (1-)%. Supngase que se
toman dos muestras independientes de tamao n1 y n2 de dos poblaciones infinitamente grandes.
En estas dos muestras sean X1 el nmero de observaciones de la primera muestra que pertenecen
a la clase de inters y X2 el nmero de observaciones en la muestra de la segunda poblacin que
pertenecen a la clase de inters.
P1
P2
X1~B(n1,p)
Xn1 observaciones
Xn2 observaciones
X2~B(n2, p)
Luego:
198
=
=
As para
Donde Z tiene una distribucin que es aproximadamente normal, esto implica que podemos
sustituir el valor de Z directamente para construir el intervalo de confianza:
son defectuosas. Encuentre un intervalo de confianza del 99% para la diferencia en fracciones de
productos defectuosos producidos por las dos lneas.
Solucin:
Se tiene que
Pero:
. Como (1-)=0.99, entonces /2= 0.005.
Ejemplos:
1. Un fabricante asegura, a una compaa que le compra un producto en forma regular, que el
porcentaje de productos defectuosos no es mayor del 5%. La compaa decide comprobar la
afirmacin del fabricante seleccionando de su inventario, 200 unidades de este producto y
probndolas. Deber sospechar la compaa de la afirmacin del fabricante si se descubre un
total de 19 unidades defectuosas en la muestra?
Solucin:
La sospecha estar apoyada si existe un intervalo de confiabilidad alto para el cual la proporcin
p se encuentra completamente a la derecha del valor asegurado 0.05. Si seleccionamos una
200
confiabilidad del 95%, entonces /2=0.025, y ya conocemos que X=19 y n=200, por lo que
=19/200=0.095
Aparentemente existe una razn para sospechar del fabricante, ya que el intervalo de confianza se
encuentra completamente a la derecha del valor asegurado.
2. Calcular el tamao de la muestra del ejemplo anterior para el cual la diferencia entre el
parmetro y el estimador es menor que 0.02 con un nivel de confianza mayor a 0.9.
Considrese el mismo valor para .
Solucin:
201
Solucin:
Se tiene que
Pero:
202
203
H0 es cierta
H0 es Falsa
205
Aceptar H0
Decisin Correcta
Error tipo II
()
Rechazar H0
Error tipo I
()
Decisin Correcta
Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los
errores de decisin. En la prctica un tipo de error puede tener ms importancia que el otro, y as
se tiene a conseguir poner una limitacin al error de mayor importancia. La nica forma de
reducir ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no ser
posible.
Paso 3: Clculo del valor estadstico de prueba
Valor determinado a partir de la informacin muestral, que se utiliza para determinar si se rechaza
la hiptesis nula., existen muchos estadsticos de prueba para nuestro caso utilizaremos los
estadsticos z y t. La eleccin de uno de estos depende de la cantidad de muestras que se toman, si
las muestras son de la prueba son iguales a 30 o mas se utiliza el estadstico z, en caso contrario
se utiliza el estadstico t.
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hiptesis planteada se formula con la igualdad
Ejemplo
H0 : = 200
H1 : 200
b) Pruebas unilateral o de un
extremo: la hiptesis planteada se
formula con o
H0 : 200 H0 : 200
H1 : < 200 H1 : > 200
En las pruebas de hiptesis para la media (), cuando se conoce la desviacin estndar ()
poblacional, o cuando el valor de la muestra es grande (30 o ms), el valor estadstico de prueba
es z y se determina a partir de:
206
En la prueba para una media poblacional con muestra pequea y desviacin estndar poblacional
desconocida se utiliza el valor estadstico t.
donde
207
Donde
Distribucin muestral del valor estadstico z, con prueba de una cola a la derecha
Valor crtico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la
regin en la que no se rechaza la hiptesis nula.
Paso 5: Tomar una decisin.
En este ltimo paso de la prueba de hiptesis, se calcula el estadstico de prueba, se compara con
el valor crtico y se toma la decisin de rechazar o no la hiptesis nula. Tenga presente que en una
prueba de hiptesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hiptesis
nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hiptesis nula cuando no
debera haberse rechazado (error tipo I). Tambin existe la posibilidad de que la hiptesis nula se
acepte cuando debera haberse rechazado (error de tipo II).
Ejemplo 1:
Prueba la hiptesis
H0 : p = 0.4
H1 : p 0.4
Paso 1
H0 : p = 0.4
H1 : p 0.4
Paso 2
Paso 3
Z=
Paso 4
obtenemos:
0.4(1 0.4)
0.0346
200
.005
0.45 0.4
1.45
0.0346
-2.575
2.575
.005
.005
-2.575
Paso 5
rechazamos Ho.
.005
2.575
p = p0
H1 :
p > p0
p < p0
p p0
Paso 2
Z=
p p0
, donde p
p
p0 (1 p0 )
.
n
Paso 3
Usando la hiptesis alterna dibuja la regin bajo la curva z que representa los
valores extremos.
209
Valor P
Valor P
P/2
-z
z
(H1 : > o)
P/2
-z
(H1 : < o)
(H1 : o)
Paso 4
Paso 5
Ejemplo 1:
Pruebe la hiptesis
H0 : p = 0.4
H1 : p 0.4
H0 : p = 0.4
H1 : p 0.4
Paso 2
p
Z=
Paso 3
0.4(1 0.4)
0.0346
200
0.45 0.4
1.45
0.0346
Paso 4
1.45
P/2
P/2
= 0.147
Paso 5
Ejercicios.
1.
H0 : p=0.6
H1 : p 0.6,
2.
n = 100, y = 0.01
H0 : p = 0.29
H0 : p = 0.36
Bibliografa
Gardner, Robert C. (2003). Estadstica para Psicologa Usando SPSS para Windows.
Prentice-Hall, 1 ED.
211