Está en la página 1de 221

ANLISIS EXPLORATORIO DE DATOS Y

PROBABILIDAD E INFERENCIA ESTADISTICA


Dr. Jos Nerys funes Torres
Lic. Ren Armando Pea Aguilar
Facultad de Ciencias Naturales y Matemtica
Escuela de Matemtica
Departamento de Estadstica
Universidad de El Salvador
Septiembre de 2010.
ndice general.
Introduccin......................................................................................................................................4
Captulo 1. Conceptos Bsicos de Estadstica.................................................................................5
1.1. La Estadstica y sus aplicaciones...............................................................................................5
1
1.1.1. Qu es la Estadstica?.......................................................................................................5
1.1.2. Aplicaciones de la Estadstica............................................................................................6
1.2. Poblacin, Muestra y tcnicas de muestreo.............................................................................10
1.3. Unidad de estudio y unidad de muestreo.................................................................................13
1.4. Variables y datos.....................................................................................................................13
1.5. Escalas de medicin................................................................................................................15
1.5.1. Escalas nominales.............................................................................................................15
1.5.2. Escalas ordinales...............................................................................................................15
1.5.3. Escalas de intervalos.........................................................................................................16
1.5.4. Escalas de razones o cocientes.........................................................................................16
1.6. Diseo de Experimentos estadsticos......................................................................................17
1.7. Gua de ejercicios N 1. ..........................................................................................................18
Captulo 2. Distribuciones de frecuencias y sus representaciones grficas...................................20
2.1. Estadstica Descriptiva con una variable................................................................................20
2.1.1. Distribucin de frecuencias..............................................................................................20
2.1.2. Descripcin de Variables Cualitativas..............................................................................21
2.1.3. Variables cuantitativas discretas.....................................................................................29
2.2. Distribucin de frecuencias agrupadas....................................................................................30
2.2.1 Representacin grfica de variables continuas.................................................................34
2.3. Gua de ejercicios N 2. .........................................................................................................35
Captulo 3. Medidas Caractersticas de una Distribucin Cuantitativa Emprica..........................38
3.1 Medidas de posicin............................................................................................................38
3.2 Medidas de Dispersin........................................................................................................45
3.3 Medidas de forma................................................................................................................46
3.4. Gua de Ejercicios N 3. .........................................................................................................47
Captulo 4. Distribuciones Bivariadas............................................................................................81
4.1. Distribuciones bidimensionales..............................................................................................81
4.2. Distribuciones marginales y condicionales.............................................................................82
4.3. Coeficiente de correlacin lineal.............................................................................................86
4.4. Introduccin al modelos de regresin lineal............................................................................87
4.5. Modelo de regresin simple...................................................................................................92
4.5.1. Estimacin de los parmetros por mnimos cuadrados.....................................................92
4.5.2. Propiedades de los estimadores por mnimos cuadrados y el modelo ajustado de
regresin.....................................................................................................................................94
4.5.3. Intervalos de confianza ...................................................................................................96
4.5.4. Prueba de hiptesis de la pendiente y de la ordenada al origen........................................97
4.6. Prediccin de nuevas observaciones........................................................................................99
4.7. Ejercicios...............................................................................................................................107
Captulo 5. Los Valores Relativos................................................................................................111
5.1. Razones, Proporciones, Porcentajes y Tasas.........................................................................111
5.2. Diferencia Relativa................................................................................................................113
5.3.Los nmeros ndices...............................................................................................................114
5.3.1. Relacin entre ndices de base fija y variable.................................................................116
5.3.2. ndices agregativos simples............................................................................................117
5.3.3. ndices de precios...........................................................................................................119
5.3.4. ndices de cantidad.........................................................................................................120
5.3.5. Clculo del salario e ingreso real....................................................................................121
2
5.4. Gua de ejercicios N 5..........................................................................................................122
Captulo 6. Mtodos de Conteo...................................................................................................126
6.1 Introduccin ...........................................................................................................................126
6.2 Muestras ordenadas................................................................................................................126
6.3 Variaciones, combinaciones y permutaciones........................................................................128
6.3.1. Variaciones de N elementos tomados de n en n.............................................................128
6.3.2. Variaciones con repeticin de N elementos tomados de n en n.....................................128
6.3.3. Permutaciones................................................................................................................128
6.3.4. Combinaciones...............................................................................................................130
6.4. Teorema del Binomio............................................................................................................134
6.5. Gua de Ejercicios N 1........................................................................................................137
6.6. Solucines..............................................................................................................................138
Captulo 7. Conceptos Bsicos de Probabilidad..........................................................................144
7.1 Introduccin............................................................................................................................144
7.2. Experimento aleatorio............................................................................................................144
7.3. Espacio Muestral..................................................................................................................145
7.4. Sucesos o Eventos.................................................................................................................145
7.4.1. Estructuras con subconjunto...........................................................................................146
7.5. Axiomas de Probabilidad.......................................................................................................148
7.5.1. Probabilidad (Axiomtica)..............................................................................................148
7.6. Resultado Igualmente Probables o Modelo Uniforme de Probabilidad................................150
7.7. Probabilidad condicional......................................................................................................150
7.8. Independencia de sucesos.....................................................................................................153
7.9. Ejercicios de clculo de probabilidad....................................................................................154
7.9.1. Problemas variados de probabilidad...............................................................................158
7.9.2. Hoja 4. Ejercicios de probabilidad (Repaso, Captulo 6 y 7).........................................165
Captulo 8. Variables aleatorias y distribuciones de probabilidad...............................................166
8.1. Nociones bsicas....................................................................................................................166
8.2. Distribucin de probabilidad binomial..................................................................................171
8.3. Distribucin de Poisson.........................................................................................................173
8.4. Distribucin geomtrica........................................................................................................177
8.5. Distribucin hipergeomtrica................................................................................................178
8.6. Densidad uniforme................................................................................................................181
8.7. Densidad normal o de Gauss.................................................................................................184
8.8. Aproximacin de la binomial por medio de la normal..........................................................187
8.9. Ejercicios...............................................................................................................................187
Captulo 9. Estimacin de Parmetros..........................................................................................190
9.1. Distribucin de la medida de la muestra...............................................................................190
9.2. Distribucin de la diferencia entre las medias de dos muestras............................................193
9.3. Distribucin de la proporcin de la muestra..........................................................................197
9.4. Distribucin de la diferencia entre las proporciones de dos muestras...................................199
9.5. Intervalos de confianza..........................................................................................................202
9.5.1. Seleccin del tamao de la muestra................................................................................205
Captulo 10. Contraste de hiptesis..............................................................................................213
10.1.- Introduccin.......................................................................................................................213
10.2. Nociones bsicas..................................................................................................................213
10.3. Procedimiento sistemtico para una prueba de hiptesis de una muestra...........................214
3
10.4. Procedimiento sistemtico para una prueba de hiptesis de dos muestras independientes. 217
10.5. Prueba de hiptesis para una y dos proporcin independientes ........................................217
Bibliografa...................................................................................................................................221
Introduccin.
La estadstica como herramienta para el anlisis de los datos es esencial en los profesionales que
con frecuencia tienen la necesidad de realizar anlisis de datos para la toma de decisiones.
Este libro, recoge en 10 captulos conocimientos estadsticos bsicos que van desde el anlisis
descriptivo de datos, probabilidad e inferencia estadstica.
Debemos aclarar que los mtodos descriptivos aqu propuestos son elementales univariantes y en
el enfoque de la probabilidad slo hemos considerado espacios probabilsticos discretos
incluyendo dos continuas la uniforme y la normal.
Este libro, es recomendables para principiantes en el rea de estadstica. Los conocimientos aqu
planteados son base para ir enfrentando otros de estadstica de mayor dificultad.
4
Captulo 1. Conceptos Bsicos de Estadstica.
1.1. La Estadstica y sus aplicaciones
1.1.1. Qu es la Estadstica?
La Estadstica es una ciencia que estudia las caractersticas de un conjunto de casos para hallar en
ellos regularidades en el comportamiento, que sirven para describir el conjunto y para efectuar
predicciones.
La Estadstica tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos
a un conjunto de objetos, personas, procesos, etc. A travs de la cuantificacin y el ordenamiento
de los datos intenta explicar los fenmenos observados, por lo que resulta una herramienta de
suma utilidad para la toma de decisiones.
Bajo este contexto, la Estadstica se divide en dos reas: Estadstica Descriptiva y Estadstica
Inferencial.
5
ESTADSTICA DESCRIPTIVA: permite organizar y presentar un conjunto de datos de
manera que describan en forma precisa las variables analizadas haciendo rpida su lectura e
interpretacin. Obviamente, la materia prima de la Estadstica Descriptiva la constituyen los
datos, que son el resultado de las observaciones y/o experimentos.
Ejemplos:
1. Durante los ltimos dos das se ha informado de un total de trece homicidios diarios.
2. La encuesta Gallup informa una ventaja de 25% para el candidato de izquierda.
ESTADSTICA INFERENCIAL: Generaliza los resultados de una muestra a los de una
poblacin total, es cuando de los datos estadsticos obtenidos de una muestra se infiere o se
deduce una observacin la cual se generaliza sobre la poblacin en total. Para determinar la
confiabilidad de la inferencia de los datos estadsticos de una muestra, se hace necesario
comprobar la misma para poder asegurar que lo que se observa en una muestra se observar
tambin en la poblacin. Generalmente el anlisis estadstico inferencial se lleva a cabo para
mostrar relaciones de causa y efecto, as como para probar hiptesis y teoras cientficas.
1.1.2. Aplicaciones de la Estadstica.
Mucha gente piensa que la Estadstica no tiene nada que ver con otras disciplinas que no sean las
ingenieras y economa. Otros nunca le encuentran aplicaciones tiles, y por eso tampoco les
gusta. Pero, en realidad tiene infinitas aplicaciones en todo el conocimiento adquirido por la
humanidad, partiendo ante todo, lo relacionado con las ingenieras, economa, las ciencias
biolgicas, ciencias sociales e incluso en algunas ramas del rea Jurdica. Y, en definitiva, casi
todos los campos de las ciencias emplean instrumentos estadsticos de importancia fundamental
para el desarrollo de sus modelos de trabajo.
En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con
exactitud los valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y
fsicos, entre otros, y sirven como herramienta para relacionar y analizar dichos datos. El trabajo
del experto estadstico no consiste ya slo en reunir y tabular los datos, sino el proceso de
interpretacin de esa informacin a travs de modelos estadsticos-matemticos, aumentando el
alcance de las aplicaciones de la estadstica, esto se ha logrado, gracias al desarrollo de la teora
de probabilidad.
Dentro de las Aplicaciones de la Estadstica se destacan las siguientes:
1. La Estadstica en el Periodismo
En general, los periodistas adems de dedicarse al mbito de la noticia, realizan crnicas y
estudios de investigacin, que nos entregan preguntas y respuestas frente a determinados sucesos
o situaciones de inters pblico. Algunos de los estudios ms frecuentes realizados por los
periodistas son sobre alcoholismo, enfermedades, sexualidad, delincuencia, poltica, etc. Para
ello, hacen uso de las encuestas u otros instrumentos tcnicos de medicin propios de la
estadstica, a travs de dichos estudios es posible conocer la opinin de la gente y con ello
informar a la opinin pblica, a travs de los medios de comunicacin, desde donde las
6
autoridades pertinentes e interesadas en estos estudios pueden adoptar las medidas correctivas, si
es el caso. Tal es as, que la estadstica forma parte importante del periodismo investigativo.
1. La Estadstica en la Poltica
Conocidas son las famosas encuestas de tipo poltico, que entregan una orientacin de la
intencin de voto, de la aceptacin de un candidato, del impacto de un programa o proyecto de
estado, etc. de una muestra estadstica representativa, sobre la opinin de las personas en un
tiempo determinado, teniendo esta herramienta una gran confiabilidad. As es que el uso de la
estadstica es imprescindible para determinar caminos a seguir para los candidatos de eleccin
popular.
2. La Estadstica en la Publicidad
Cuando las grandes marcas trasnacionales y/o nacionales como Coca-cola, Pepsi, Nice, Adidas,
Laboratorios Lpez, etc. nos llenan de slogans, msica y colores en sus comerciales, lo nico que
buscan es que la gente adquiera los productos y/o servicios que ofrecen.
Se dedican, entonces, a realizar las llamadas campaas publicitarias, y, antes de lanzar una
campaa, hacen un estudio de mercado para encontrar las mejores alternativas posibles a fin de
lograr el xito de ventas deseado. Estos estudios son de carcter estadstico, es decir, hacen un
diseo muestral y seleccionan una muestra para inferir las caractersticas de la poblacin.
3. La Estadstica en la economa y las finanzas.
En la administracin es una herramienta del control, como parte del proceso administrativo (o lo
que es lo mismo: planeacin, organizacin, direccin y control) ya que la estadstica ayuda a
recolectar, estudiar y al final interpretar los datos que obtienen al terminar el proceso
administrativo, retroalimenta con esta informacin y al final se observa en que pueden mejorar y
que se est haciendo bien.
En la mercadotecnia es una herramienta muy importante cuando tienes la necesidad de trabajar
con datos de muestreo para conocer los gustos y preferencias de las personas. Igualmente en la
auditoria administrativa cuando recabas datos para conocer en que puede mejorar una
organizacin. En pocas palabras te puede servir en cualquier rea de una organizacin debido a
que muestra los resultados de las actividades que bienes realizando.
En la economa se utiliza como una herramienta de prediccin para pronosticar el
comportamiento futuro, por ejemplo, de los precios de los metales (oro, plata, cobre) tomando
como base el comportamiento pasado de los precios de los mismos. Tambin puede servir para
estudiar el comportamiento de la bolsa de valores, de ciertos productos bsicos, los economistas
por lo regular se sienten magos que creen predecir cosas. En general, la Estadstica suministra los
valores que ayudan a descubrir interrelaciones entre mltiples parmetros macro y
microeconmicos, a travs de la evaluacin de modelos economtricos para el establecimiento de
polticas econmicas; anlisis del costo de la canasta bsica, el poder adquisitivo de la poblacin,
etc.
7
5. La estadstica en la Banca y Seguros
El profesional del seguro de vida ha de ser capaz de asignar primas suficientes para cubrir las
cantidades que habr de pagar la compaa en el caso de muerte del asegurado. En consecuencia,
la prediccin adecuada de las probabilidades de muerte constituye uno de los ejes centrales de la
reduccin del riesgo que se asume. Por ello, el objetivo de la Estadstica de Seguros es una
presentacin exhaustiva de los mtodos disponibles para ajustar tablas de mortalidad y tablas de
seguros no vida, ejemplo, aseguramiento de vehculos, viviendas, etc.
Por otra parte, algunas de las aplicaciones concretas de la Estadstica en el sistema bancario son
las siguientes:
Sistemas de concesin de tarjetas de crdito y fijacin de su lmite.
Sistemas de estimacin del potencial econmico de los clientes.
Definicin de tipologas comerciales de clientes.
Determinacin del pblico objetivo en campaas comerciales.
Modelizacin del riesgo segn las caractersticas de los clientes.
Aplicacin de la teora de colas para brindar un servicio de calidad.
Finalmente, es de mucha utilidad la tcnica de minera de datos para el anlisis de bases de
datos del sistema bancario.
6. La estadstica en ciencias humanas y sociales
La investigacin en Psicologa, Sociologa y Educacin, al igual que ocurre en otras ciencias, en
buena medida se basa en el manejo de recursos estadsticos como elementos indispensables para
llegar a conclusiones aceptables por el resto de la comunidad cientfica. Dada la peculiaridad de
su objeto de estudio, inabordable en la mayora de los casos sino es a travs de perspectivas
complejas de relacin entre variables, la atencin de los investigadores en las ciencias humanas y
sociales se concentra cada vez ms en la llamada Estadstica Multivariante (Anlisis Cluster,
Factorial, Discriminante, etc.).
Las ciencias sociales se han visto apabulladas en los ltimos aos por avances vertiginosos en
informtica y aplicaciones estadsticas, por ejemplo, en El Salvador, se ha elaborado el Mapa de
Pobreza, donde se ha interrelacionado una gran variedad de variables de diferentes reas:
Educativas, Econmicas, Salud, entre otras. Tambin, se ha hecho investigacin sobre los
factores que estn asociados al rendimiento acadmico de los estudiantes, finalmente, se han
utilizado diferentes tcnicas para el anlisis de los resultados acadmicos de los estudiantes.

Las ciencias sociales: es un pilar bsico del desarrollo de la demografa y la sociologa aplicada,
lo que conlleva a:
Definicin de indicadores de fenmenos sociales.
Medicin de constructos o variables no directamente observables (la satisfaccin, la
inteligencia, ...)
8
Medicin de los efectos entre constructos no observables para establecer polticas
sociales.
Estudio de la evolucin de la demografa.
Estudios sociales sobre la integracin de la poblacin inmigrada.
Fenmenos sociales como las pandillas, criminalidad, delincuencia, contaminacin, entre
otros.
7. La estadstica en las ciencias qumicas.
En Qumica, la estadstica se aplica en varias reas: En el diseo de experimentos se usan
mtodos estadsticos, en el control de procesos y control de calidad (o gerenciamiento de calidad)
de procesos y productos. En EEUU est muy de moda el sistema seis sigma, creado por general
electric, que utiliza algunos conceptos estadsticos para lograr el aseguramiento de la calidad.
Por otra parte la produccin qumica tiene su costo econmico y financiero que tambin requiere
mucho uso de estadstica, por ejemplo, si no se elabora un buen diseo experimental, se
necesitarn muchas rplicas para validar una formulacin qumica.
Algunas de las aplicaciones concretas que podemos mencionar:
Utilizacin de diseos experimentales para optimizar la composicin de productos
alimenticios.
Evaluacin de la superficie de respuesta de una reaccin qumica segn determinados factores.
Prediccin del comportamiento de un componente no sintetizado a partir de las propiedades
moleculares de sus descriptores.
Control de procesos de produccin para detectar problemas evitando a su vez falsas alarmas.
8. La estadstica en Ciencias biolgicas.
En el rea de las ciencias biolgicas, interesa estudiar el comportamiento de ciertas plantas y sus
cruces a fin de determinar cmo se relacionan genticamente los padres con los hijos, hablando
de Genotipo y Fenotipo. En esta categora es tambin donde se realizan los mayores avances de la
humanidad, en descubrimientos. Cada ao se descubren miles de frmulas cientficas que
relacionan fenmenos de la naturaleza con modelos matemticos.
Los cientficos se dedican a realizar estudios estadsticos, recogiendo datos y muestras,
investigando el tiempo de reproduccin de un virus, el comportamiento migratorio de algunas
aves o insectos, adems de factores de tamao y volumen del crecimiento de ciertas especies de
animales o vegetales. Todo esto funciona con la idea de recopilar informacin, muestrear ciertas
reas para ver cmo se han comportado algunas aves, por ejemplo, se pueden dibujar o simular
curvas que se supone que son relativamente parecidas al comportamiento migratorio de aves. Con
esta herramienta se podran determinar tambin las pocas de mayor probabilidad de contagio,
diseminacin de algn virus o bien enfermedades transmitidas por insectos.
9
Algunas aplicaciones concretas en esta rea son: Determinacin del tamao de poblaciones
naturales en una regin; efectividad de la utilizacin de barreras naturales (filas de rboles
plantados en los lmites del terreno) como medio de prevenir las plagas de insectos o aves sobre
las plantaciones y as disminuir la utilizacin de pesticidas: y, determinacin de los niveles
ptimos de utilizacin de los fertilizantes. Obviamente, en esta rea es donde ms se hace usos de
la teora de Diseos de Experimentos.
9. La estadstica en las ciencias mdicas.
Permite establecer pautas sobre la evolucin de las enfermedades y los enfermos, los ndices de
mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etctera.
Bajo este conjunto de ideas, se ha presentado un panorama de la utilidad de la estadstica,
haciendo un recorrido por diversas reas del conocimiento humano, con el fin, de conocer cmo
se relacionan con las diversas ciencias, formando una sola verdad. Evidentemente, existen,
muchas disciplinas donde se aplica la estadstica, que no han sido consideradas en este apartado,
por ejemplo, las ingenieras, la pintura, la msica, etc. Finalmente, es de resaltar que en todos los
temas donde se analice informacin est presente la estadstica.
1.2. Poblacin, Muestra y tcnicas de muestreo.
Las estadsticas de por s no tienen sentido si no se considera o se relaciona dentro del contexto
con que se trabajan. Por lo tanto es necesario entender los conceptos de poblacin y de muestra
para lograr comprender mejor su significado en la investigacin educativa o social que se lleva a
cabo.
POBLACIN - es el conjunto total de individuos, objetos o medidas que poseen algunas
caractersticas comunes observables en un lugar y en un momento determinado. Cuando se vaya a
llevar a cabo alguna investigacin debe de tenerse en cuenta algunas caractersticas esenciales al
seleccionarse la poblacin bajo estudio. Entre stas tenemos:
Homogeneidad - que todos los miembros de la poblacin tengan las mismas caractersticas
segn las variables que se vayan a considerar en el estudio o investigacin. Por ejemplo, si se
fuera a investigar la incidencia de la drogadiccin entre jvenes mujeres adolescentes, entonces
hay que definir claramente las edades que comprenden la adolescencia y cuando se seleccione la
poblacin asegurarse de que todas las personas entrevistadas sean de la edad determinada y del
sexo femenino. (La adolescencia se define operacionalmente como el periodo comprendido de
edad que flucta entre 12 y 21 aos.)
Tiempo - se refiere al perodo de tiempo donde se ubicara la poblacin de inters. Determinar si
el estudio es del momento presente o si se va a estudiar a una poblacin de cinco aos atrs o si
se van a entrevistar personas de diferentes generaciones.
Espacio - se refiere al lugar donde se ubica la poblacin de inters. Un estudio no puede ser muy
abarcador y por falta de tiempo y recursos hay que limitarlo a un rea o comunidad en especfico.
Cantidad - se refiere al tamao de la poblacin. El tamao de la poblacin es sumamente
importante porque ello determina o afecta al tamao de la muestra que se vaya a seleccionar,
10
adems que la falta de recursos y tiempo tambin nos limita la extensin de la poblacin que se
vaya a investigar.
MUESTRA - la muestra es un subconjunto fielmente representativo de la poblacin.
Hay diferentes tipos de muestreo. El tipo de muestra que se seleccione depender de la calidad y
cun representativo se quiera que sea el estudio de la poblacin, en este sentido, la muestra puede
ser:
ALEATORIA - cuando se selecciona al azar y cada miembro tiene igual oportunidad de ser
incluido.
Un procedimiento de extraer una muestra aleatoria de una poblacin finita es: enumerar todos
los elementos que conforman la poblacin, escribir esos nmeros en papelitos y echarlos en una
urna o bolsa mezclarlos bien removindolos y sacar uno a uno tantos como lo indique el tamao
de la muestra. En este caso los elementos de la muestra lo constituirn los elementos de la
poblacin cuyos nmeros coincidan con los extrados de la bolsa o urna.
El tamao de la muestra (MAS):
Al realizar un muestreo probabilstica nos debemos preguntar Cul es el nmero mnimo de
unidades de anlisis (personas, organizaciones, captulo de telenovelas, etc), que se necesitan
para conformar una muestra n que me asegure un error estndar menor que 0.01 ( fijado por el
muestrista o investigador), dado que la poblacin es aproximadamente de N elementos.
En el tamao de una muestra de una poblacin se debe tener presente la varianza poblacional,
error mximo permisible prefijado (diferencia del parmetro y estimador), con un nivel de
confianza de 1 . Simblicamente se refiere a lo siguiente:
1 P X d
1
<
]
, bajo este
contexto podemos utilizar la frmula:
Ejemplo. Se desea estimar la estatura promedio de los estudiantes de la asignatura de
Tratamiento de la Informacin Estadstica. Se sabe que la estatura de un estudiante es una
variable aleatoria con distribucin normal. Determine el tamao de muestra aleatoria necesaria
para garantizar una probabilidad igual a 0.95 de que el estimador y el parmetro se diferencien en
menos de 10cm.
Solucin.
Datos conocidos.
d= 10cm
11
Calcular:

,
1
2
Z

=1.96

: Para calcular la desviacin estndar hay que solicitar la estatura de cada estudiante y luego
calcular la varianza utilizando la siguiente frmula: ( )
2
2
1
1
n
X i
i
S x x
n

, posteriormente se
obtiene la raz cuadrada y ese es el valor

que se debe utilizar en esta ecuacin. Supongamos


que

=12cm, entonces:
Determinar:
2
2
1
2
12(1.96)
5.53 6
10
Z
n n n
d

_
_




,

,
, se requiere una muestra de 6
estudiantes para cumplir las hiptesis del problema.
ESTRATIFICADA - cuando se subdivide en estratos o subgrupos segn las variables o
caractersticas que se pretenden investigar. Cada estrato debe corresponder proporcionalmente a
la poblacin.
El nmero determinado de elementos muestrales es:
1
k
i
i
n n

, donde ni es el nmero de
elementos en el estrato i=1, 2, , k . No se entrar en detalle del clculo del tamao muestral, ya
que supera el alcance de esta asignatura.
SISTEMTICA - cuando se establece un patrn o criterio al seleccionar la muestra. Ejemplo: se
entrevistar una familia por cada diez que se detecten.
El muestreo es indispensable para el investigador ya que es imposible entrevistar a todos los
miembros de una poblacin debido a problemas de tiempo, recursos y esfuerzo. Al seleccionar
una muestra lo que se hace es estudiar una parte o un subconjunto de la poblacin, pero que la
misma sea lo suficientemente representativa de sta para que luego pueda generalizarse con
seguridad de ellas a la poblacin.
El tamao de la muestra depende de la precisin con que el investigador desea llevar a cabo su
estudio, pero por regla general se debe usar una muestra tan grande como sea posible de acuerdo
a los recursos que haya disponibles. Es de especificar que para cada mtodo de muestreo existen
frmulas para determinar el tamao de muestra.
12
1.3. Unidad de estudio y unidad de muestreo
La unidad de anlisis o estudio corresponde a la entidad mayor, primaria o representativa de lo
que va a ser objeto especfico de estudio en una medicin y se refiere al qu o quin es objeto de
inters en una investigacin. Por ejemplo: Condiciones de hacinamiento de las familias del
Municipio de Soyapango, San Salvador. Unidad de Anlisis: Familias del Municipio de
Soyapango.
Debe estar claramente definida en un protocolo de investigacin y el investigador debe obtener la
informacin a partir de la unidad que haya sido definida como tal, aun cuando, para acceder a
ella, haya debido recorrer pasos intermedios. Las unidades de anlisis pueden corresponder a las
siguientes categoras o entidades:
Personas
Grupos humanos
Poblaciones completas
Unidades geogrficas determinadas
Eventos o interacciones sociales (enfermedades, accidentes, casos de infecciones
intrahospitalarias, etc)
Entidades intangibles, susceptibles de medir (exmenes, das, camas)
El tipo de anlisis al que se someter la informacin es determinante para elegir la unidad de
anlisis. Por ejemplo, si el objetivo es dar cuenta de la satisfaccin del usuario de un servicio
mdico, la unidad de anlisis natural es el paciente atendido, o la persona que se atiende en ese
servicio mdico. Si el objetivo es dar cuenta de la satisfaccin del alumno sobre el desempeo
docente, la unidad de anlisis es el alumno que recibe clases con el docente evaluado.
La unidad de muestreo corresponde a la entidad bsica mediante la cual se acceder a la unidad
de anlisis. En algunos casos, ambas se corresponden. Por ejemplo, si se desea estimar la
prevalencia de dao auditivo en relacin con niveles de ruido ambiental en una muestra de
trabajadores de una fbrica, la unidad de muestreo puede corresponder a la entidad "sujeto", si se
dispone de un registro detallado de cada sujeto. La unidad de anlisis es por cierto el trabajador
de la fbrica.
1.4. Variables y datos
VARIABLES
Las variables son las caractersticas observables de un objeto, problema o evento que se puede
describir segn un esquema de medicin bien definido. Cada rasgo o aspecto de una poblacin
constituye una variable. La edad de unas personas, su sexo, color de su piel, nacionalidad, su
nivel de motivacin, niveles de ansiedad, el nmero de nacimientos, nmero de matrimonios,
frecuencia de suicidios, estatura, peso, niveles de inteligencia, actitudes, entre muchas otras.
13
Las variables pueden adquirir diferentes valores o clasificarse en diferentes categoras segn la
naturaleza o tipo de estudio que se lleve a cabo. Entre stas tenemos las siguientes
clasificaciones:
VARIABLES CUALITATIVAS - son aquellas que se expresan en forma verbal como
categoras o atributos. Por ejemplo, el sexo, color, afiliacin poltica, nacionalidad, motivacin,
rea acadmica o profesin de una persona.
VARIABLES CUANTITATIVAS - son las que varan en trminos de cantidad y se registran o
expresan en forma numrica. Por ejemplo, edad, promedio acadmico, puntuaciones de
exmenes, frecuencia de delitos, temperatura, ingresos anuales o salarios por hora. Hay algunas
caractersticas que pueden clasificarse o expresarse como variable cuantitativa y transformarla a
cualitativa o viceversa. Por ejemplo, nivel de aprovechamiento acadmico estudiantes de 4:00
puntos, o estudiantes de 3:00 puntos y as sucesivamente. El investigador puede expresar
mediante una escala numrica el aprovechamiento acadmico al clasificar a los estudiantes, como
tambin puede clasificarlos como variable cualitativa en las categoras de excelentes, buenos,
regulares y deficientes.
VARIABLES DISCRETAS - son aquellas que slo adquieren un valor absoluto o especfico
que nunca cambian. Pueden ser cualitativas. Ejemplo: el sexo, nacionalidad, grupo tnico, entre
otras.
VARIABLES CONTINUAS - que siempre son cuantitativas, son las que pueden asumir
cualquier valor. Por ejemplo, la edad, altura, peso, ndice acadmico.
En el campo de la investigacin, que se suele examinar las relaciones entre dos o ms variables al
investigar un asunto o problema, se clasifican las variables como:
VARIABLES INDEPENDIENTES - son las caractersticas controladas por el investigador y
que se supone tendrn efectos sobre otras variables.
VARIABLES DEPENDIENTES - son las caractersticas o aspectos que se alteran por
consecuencia del control que ejerce el investigador sobre otras variables.
Estos dos ltimos tipos de variables suelen darse ms en estudios o investigaciones
experimentales, pero tambin podemos considerarlas en estudios descriptivos. Por ejemplo, en un
estudio experimental se investiga si un nuevo medicamento mejora las condiciones del sida. A
tales efectos se seleccionaron 30 pacientes, de los cules 15 reciban el nuevo medicamento
(grupo experimental) y otros 15 continuaban con su tratamiento tradicional (grupo control). El
nuevo medicamento viene a ser la variable independiente porque es la que los investigadores
controlan y que luego examinarn sus efectos en la condicin del sida, la cual viene a ser la
variable dependiente, porque es la condicin que se va alterar o quedar afectada por el nuevo
medicamento.
En un estudio descriptivo donde interesa saber si la clase social es factor determinante en el
aprovechamiento acadmico en las escuelas, entonces la clase social es la variable independiente
y el aprovechamiento acadmico la dependiente.
Una variable puede ser independiente en una investigacin y dependiente en otra, todo depender
de la finalidad de la investigacin. Por ejemplo, si se lleva a cabo un estudio para determinar
14
cmo las condiciones socio-econmicas influyen a la drogadiccin, en este caso, status socio-
econmico es una variable independiente. Por el contrario, si se lleva a cabo una investigacin
para saber cmo la drogadiccin afecta las condiciones sociales y econmicas, entonces, el status
socio-econmico resultara ser la variable independiente.
DATOS: son los hechos que describen sucesos y entidades.
1.5. Escalas de medicin
Una escala es un esquema especfico para asignar nmeros o smbolos con el objeto de designar
caractersticas de una variable. Las escalas de medicin comnmente conocidas son: nominales,
ordinales, de intervalos y de razn. A continuacin veamos los cuatro tipos de escalas de
medicin.
1.5.1. Escalas nominales
Las escalas nominales son aquellas donde se clasifican los objetos, personas o variables en
categoras cualitativamente distintas. Consiste simplemente en agrupar objetos en clases o asignar
las personas de acuerdo a alguna cualidad una vez que los objetos o personas posean
caractersticas comunes que lo hagan pertenecer a una categora. Por ejemplo, todos los
estudiantes que obtuvieron sobre 9 puntos fueron clasificados como excelentes, los que
obtuvieron menos de 8.9 pero ms de 8.0 como muy buenos y de 7.0 a 7.9 como buenos. En una
redada de drogas se arrestaron 22 mareros, cuatro acusados de homicidios, ocho acusados de
violacin y diez por extorciones.
Se pueden utilizar nmeros en las escalas nominales, pero stos no representan magnitudes
absolutas. Los nmeros slo se utilizan con el propsito de clasificarlos a determinada categora.
Por ejemplo, si vas a comprar pintura azul en la ferretera te presentan una escala con diferentes
tonalidades del color azul y cada tonalidad posee un nmero, pero este nmero slo es para
facilitar al vendedor identificar el color solicitado entre cientos de colores. De igual modo en
muchas solicitudes se le asigna el nmero 1 al sexo masculino y nmero dos al femenino y esta
clasificacin slo es para facilitar los cmputos y manejos de informacin estadstica, pero no
quiere decir que los masculinos tengan ms o menor valor que las del sexo femenino. Los
nmeros que se utilizan para efectos de identificacin en una escala nominal nunca se utilizarn
para llevar a cabo los procedimientos matemticos de suma, resta, multiplicacin y divisin.
1.5.2. Escalas ordinales
Las escalas ordinales son las que clasifican a las personas, eventos u objetos en una posicin con
relacin a cierto atributo, pero sin indicar la distancia que hay entre las posiciones. Cuando se
asignan nmeros es slo para indicar el orden de las posiciones de lo que se est clasificando. Por
ejemplo, en un determinado grupo escolar se decidi seleccionar los cinco estudiantes con el
15
promedio ms alto para premiarlos con un viaje al Lago de Coatepeque y result que Esteban
qued tercero con un promedio de 8.90, seguido de Jorge con 8.88 y, luego Leticia con 8.75.
Esteban como tercero se le asigna el nmero tres, pero sta designacin numrica slo indica su
posicin con relacin a los otros cuatro alumnos. Sabemos que Esteban tiene un mejor promedio
que Jorge y que su promedio es superior que el de Leticia. Sin embargo, no podremos saber hasta
qu punto es mejor su promedio comparado con los otros.
Con las escalas ordinales tampoco se pueden llevar a cabo las operaciones aritmticas de suma,
resta, multiplicacin y divisin. La diferencia que puede haber entre unas personas u objetos en
este tipo de escala no necesariamente constituye unidades iguales o absolutas que puedan
utilizarse para determinar si el que tiene un segundo lugar posee el doble valor que el que queda
en cuarta posicin. Por ejemplo, en un evento atltico de una carrera que no haya sido
cronometrada, podemos saber quin lleg primero, segundo y tercer lugar, pero no podemos
saber con precisin la velocidad entre un corredor y otro. La diferencia que hay entre el primero y
el segundo no necesariamente es igual a la que hubo entre el segundo y el tercero.
1.5.3. Escalas de intervalos
Las escalas de intervalos son aquellas que ordenan los objetos o eventos segn la magnitud del
atributo que representan y proveen intervalos iguales entre las unidades de medida. Adems, no
poseen un punto cero absoluto o verdadero ya que el mismo es establecido por convencin de
forma arbitraria por los expertos en el rea o materia de estudio y no implica la ausencia del
atributo o la propiedad en cuestin. Por ejemplo, la escala de inteligencia posee un punto cero,
pero administrando cualquier tipo de prueba que intente medir la inteligencia, nunca va a
encontrar un ser humano con cero inteligencia. De igual modo si el agua est en 0 grado C, esto
no quiere decir que carezca de temperatura, ya que en una escala de intervalos, como se ha
indicado, es una designacin arbitraria y convencional.
Una diferencia de cierta magnitud en una escala de intervalos significa lo mismo en todos los
puntos de la escala. As por ejemplo, en los termmetros de grados Fahrenheit y centgrados que
utilizan este tipo de escalas, estn divididos en unidades iguales, la diferencia en la temperatura
entre 100 grados y 101 grados es equivalente a la diferencia entre 110 grados y 111 grados.
La numeracin de los aos en nuestro calendario utiliza tambin una escala de intervalos. Las
autoridades eclesisticas y gubernamentales de la poca decidieron arbitrariamente fijar como el
ao 1 el del nacimiento de Cristo y como unidad de medida un lapso de 365 das. Por lo tanto, el
lapso de tiempo que estuvo Bill Clinton como presidente de los Estados Unidos desde 1993
2001 es igual al que transcurri George Bush desde 2001 2009.
1.5.4. Escalas de razones o cocientes
Las escalas de razones o cocientes se diferencian de las de intervalos solamente en que la de
razones el punto cero no es arbitrario y corresponde a una total ausencia del asunto o propiedad
estudiada. La escala de una simple regla de 12 pulgadas posee una escala de razones la cual est
dividida en 12 unidades cada una de igual magnitud y parte de un punto cero absoluto y
verdadero.
16
La mayora de las variables con las cuales se utiliza este tipo de escalas se refieren ms a la
ejecucin de tareas motoras, a las medidas de objetos y de aspectos fisiolgicos.
Dos ejemplos de las escalas de razones y cocientes son: las medidas de la estatura y el peso. Si
una columna mide seis metros es el doble de alto de otra columna que mide tres metros. Si
Enrique pesa 180 libras, entonces pesa el doble que Mara quin pesa 90 libras. Las razones de
los nmeros en estas escalas tienen un determinado sentido, lo que hace posible que se
interpreten los valores numricos entre las cantidades obtenidas de los objetos.
Adems pueden llevarse a cabo las diferentes operaciones matemticas.
RESUMEN: CARACTERSTICAS, EJEMPLOS Y LIMITACIONES
DE LAS ESCALAS DE MEDICIN
ESCALA
CARACTERSTICAS USOS/EJEMPLOS
LIMITACIONES
Nominal
Se clasifican las personas, eventos u
objetos en categoras.
Denominaciones religiosas, afiliacin
poltico partidista, codificaciones en
la clasificacin de objetos, pinturas,
movimientos literarios.
No se pueden precisar diferencias
cuantitativas entre las categoras.
Ordinal
Se clasifican u ordenan las
personas, objetos y eventos en
determinada posicin.
Orden de llegada de atletas en una
carrera, puntuaciones de una prueba,
rangos militares, nivel de popularidad
de estudiantes en una escuela.
Restringida para Identificar
diferencias relativas, pero no
precisa diferencias en cantidad
absoluta entre personas u objetos.
Intervalo
Escala que posee unidades de igual
magnitud. El punto cero de la escala
es arbitrario y no refleja la ausencia
del atributo.
Temperaturas (Celsius y Fahrenheit),
fechas del calendario, escala de
inteligencia.
Razones no tienen sentido ya que el
punto cero es establecido
convencionalmente.
Razones
Escala que posee un punto
cero absoluto e intervalos de igual
magnitud.
Distancia, peso, estatura, tiempo
requerido para realizar una tarea
escolar.
Ninguna, excepto que su uso se
supedita mayormente a medir
cualidades fsicas ms que para la
medicin de aspectos psicolgicos.
1.6. Diseo de Experimentos estadsticos.
El diseo de un experimento es la secuencia completa de los pasos que se deben tomar de
antemano, para planear y asegurar la obtencin de toda la informacin relevante y adecuada al
problema bajo investigacin, la cual ser analizada estadsticamente para obtener conclusiones
vlidas y objetivas con respecto a los objetivos planteados.
Un Diseo Experimental es una prueba o serie de pruebas en las cuales existen cambios
deliberados en las variables de entrada de un proceso o sistema, de tal manera que sea posible
observar e identificar las causas de los cambios que se producen en la respuesta de salida.
El propsito de cualquier Diseo Experimental, es proporcionar una cantidad mxima de
informacin pertinente al problema que se est investigando. Y ajustar el diseo que sea lo ms
simple y efectivo; para ahorrar dinero, tiempo, personal y material experimental que se va a
utilizar. Es de acotar, que la mayora de los diseos estadsticos simples, no slo son fciles de
analizar, sino tambin son eficientes en el sentido econmico y en el estadstico.
De lo anterior, se deduce que el diseo de un experimento es un proceso que explica tanto la
metodologa estadstica como el anlisis econmico.
17
DISEO: Consiste en planificar la forma de hacer el experimento, materiales y mtodos a usar,
etc.
EXPERIMENTO: Conjunto de pruebas o ensayos cuyo objetivo es obtener
informacin, que permita mejorar el producto o el proceso en estudio.
1.7. Gua de ejercicios N 1.
1. Contestar verdadero o falso y comentar su respuestas segn sea el caso:
a) La Estadstica es una ciencia que estudia y describe las caractersticas de un conjunto de
casos.
b) La estadstica inferencial generaliza los resultados de una muestra a los de la poblacin
total.
c) Durante los ltimos dos das se ha informado de un total de cinco homicidios diarios en
San Salvador, este es un ejemplo de estadstica inferencial.
d) A las medidas que se obtienen de una muestra se les da el nombre de parmetro.
e) En una muestra aleatoria ciertos elementos tienen mayor probabilidad que otros de ser
seleccionados.
2. Mediante ejemplos, explicar la diferencia entre la estadstica descriptiva y estadstica
inferencial.
3. POBLACIN - es el conjunto total de individuos, objetos o medidas que poseen algunas
caractersticas comunes observables en un lugar y en un momento determinado. A partir
de esta definicin enumere las caractersticas de una poblacin.
4. Describir dos ejemplos de poblacin.
5. Describir dos ejemplos de muestra de una poblacin.
6. Definir al menos dos tipos de muestreo y dar ejemplos de aplicacin de cada uno.
7. Se desea estimar la edad promedio de los estudiantes de la asignatura de Tratamiento de
la Informacin Estadstica. Se sabe que la edad de un estudiante es una variable aleatoria
con distribucin normal con desviacin estndar de 6aos. Determine el tamao de
muestra aleatoria necesaria para garantizar una probabilidad igual a 0.95 de que el
estimador y el parmetro se diferencien en menos de 5aos.
8. Establecer las diferencias entre la unidad de anlisis y la unidad muestral.
9. Establecer las diferencias entre variables cualitativas y cuantitativas.
10. Definir al menos dos ejemplos de variables cualitativas y de variables cuantitativas.
18
11. Establecer las diferencias entre variables discretas y continuas.
12. Definir al menos dos ejemplos de variables discretas y de variables continuas.
13. Definir las siguientes escalas de Medicin y presentar dos ejemplos de cada una de ellas:
Escala nominal
Escala ordinal
Escala de intervalo.
Escala de razn
19
Captulo 2. Distribuciones de frecuencias y sus
representaciones grficas.
2.1. Estadstica Descriptiva con una variable
La estadstica descriptiva permite organizar y presentar un conjunto de datos de manera que
describan en forma precisa las variables analizadas haciendo rpida su lectura e interpretacin.
Obviamente, la materia prima de la Estadstica Descriptiva la constituyen los datos, que son el
resultado de las observaciones y/o experimentos. Se denomina variable al carcter o fenmeno de
la realidad objeto de estudio. Las variables pueden ser de diferentes tipos, dependiendo de los
datos que la forman.
:
Cualitativas o atributos
Variables
Cuantitativas Discretas o Continuas

'

Las variables cualitativas o atributos son aquellas que no toman valores numricos. Describen
diferentes cualidades denominadas modalidades. Ejemplo: Sexo, estado civil, color de los ojos,
etc. Las variables cualitativas estn formadas por datos que toman valores numricos y pueden
ser discretas, si slo toman un nmero entero de valores, y continuas, si pueden tomar cualquier
valor real dentro de un intervalo.
Entre los sistemas para ordenar los datos se encuentran principalmente dos: a) la distribucin de
frecuencias y b) la representacin grfica.
2.1.1. Distribucin de frecuencias
Supongamos que hemos recogido un conjunto de n datos englobados en una variable X. La tabla
que recoge de modo sistemtico estos datos se denomina distribucin de frecuencias. La
Distribucin de Frecuencias (Simples o agrupadas en intervalos). Comnmente llamada tabla de
frecuencias, se utiliza para hacer la presentacin de datos provenientes de las observaciones
realizadas en el estudio, estableciendo un orden mediante la divisin en clases y registro de la
cantidad de observaciones correspondientes a cada clase. Lo anterior facilita la realizacin de un
mejor anlisis e interpretacin de las caractersticas que describen y que no son evidentes en el
conjunto de datos brutos o sin procesar.
20
La siguiente tabla recoge las principales caractersticas de una distribucin de frecuencias simple
o no agrupada.
Datos Frecuencias Absolutas Frecuencias Relativas
Simples Acumuladas Simples Acumuladas
1
2
.
.
.
k
x
x
x
1
2
.
.
.
k
n
n
n
1 1
2 1 2
1
.
.
.
k
k i
i
N n
N n n
N n

1 1
2 2
/
/
.
.
.
/
k k
f n n
f n n
f n n

1 1
2 2
/
/
.
.
.
/
k k
F N n
F N n
F N n

Total
1
k
i
i
n n

1
1
k
i
i
f

La primera columna representa los distintos valores de esos datos y la segunda la frecuencia
simple, es decir, el nmero de veces que se ha observado el correspondiente valor; la tercera
columna recoge la frecuencia acumulada (nmero de veces que se han observado valores
menores o iguales que el que corresponde a dicha fila). Las frecuencias relativas se obtienen a
partir de las frecuencias absolutas, dividiendo por el tamao de la muestra.
2.1.2. Descripcin de Variables Cualitativas
DISTRIBUCIN DE FRECUENCIAS
Supongamos que tenemos N observaciones de una variable cualitativa.
Supongamos que la variable puede tomar valores pertenecientes a k clases o categoras:
4
Verde
Azul
Color de ojos k
Marron
Negro


'

Representamos mediante n
1
, n
2
, , n
k
el nmero de datos que aparecen en cada una de las k
categoras.
Frecuencia absoluta de la clase i-sima ( n
i
): nmero de observaciones en la clase i.
21
Frecuencia relativa de la clase i-sima ( f
i
): es la proporcin de datos en la clase i-sima, es
decir, f
n
N
i
i
.
- La suma de las k frecuencias relativas es igual a la unidad: f
1
+ f
2
++ f
k
=1
- Nos permiten comparar las frecuencias de las categoras en conjuntos de datos con
distinto nmero de observaciones
Distribucin de frecuencias: es la tabla que presenta las categoras de una variable y sus
respectivas frecuencias.
- Nos indica cmo se distribuye la frecuencia total entre las categoras
- Es el resumen ms importante de la informacin contenida en una variable cualitativa
Ejemplo 1: nivel educativo
Se ha clasificado a 20 individuos segn su nivel de estudios que puede tomar valores:
1 sin
2
3
4 sup
estudios
primarios
Nivel educativo
medios
eriores

'

y se han obtenido los siguientes datos:


1 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3;
N=20; k=4
Frecuencias absolutas:
n
1
=3; n
2
=7; n
3
=6; n
4
=4
N n n n n + + + + + +
1 2 3 4
3 7 6 4 2 0
Frecuencias relativas:
f f f f
1 2 3 4
3
2 0
0 1 5
7
2 0
0 3 5
6
2 0
0 3
4
2 0
0 2 , ; , ; , ; ,
f f f f
1 2 3 4
0 1 5 0 3 5 0 3 0 2 1 + + + + + + , , , ,
22
Distribucin de frecuencias:
Categoras n
i
f
i
1. Sin estudios 3 0,15
2. Primaria 7 0,35
3. Media 6 0,3
4. Superior 4 0,2
N=20 1
La categora ms frecuente es la de estudios primarios y la menos frecuente la de sin estudios
REPRESENTACIN GRFICA DE LA DISTRIBUCIN DE FRECUENCIAS
A) Diagrama de barras : Permite visualizar de forma sencilla la distribucin de una variable
cualitativa. Se dibuja sobre cada categora una barra (o rectngulo) cuya altura coincida
con la frecuencia absoluta o relativa de dicha clase.
Ejemplo: Nivel de estudios (Continuacin ejemplo 1)
Frecuencias relativas f
i
0.10
0.15
0.20
0.25
0.30
0.35
0.40
1 2 3 4
B) Diagrama de Pareto : Es como un diagrama de barras en el que se ordenan las clases de
mayor a menor frecuencia (absoluta o relativa). En la parte superior de la figura suele
trazarse una lnea que representa la suma de la frecuencia de cada clase y las que la
preceden, esto se usa para identificar la minora de las caractersticas que representan la
mayora de casos.
A principios del Siglo XX, Vilfredo Pareto (1848-1943), un economista italiano, realiz
un estudio sobre la riqueza y la pobreza. Descubri que el 20% de las personas
controlaba el 80% de la riqueza en Italia.
23
La grfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar
visualmente en una sola revisin las minoras de caractersticas vitales a las que es importante
prestar atencin.
Algunos ejemplos de tales minoras vitales son:
La minora de clientes que representan la mayora de las ventas.
La minora de productos, procesos, o caractersticas de la calidad causantes del grueso de
desperdicio de los costos de retrabajos.
Ejemplo: Nivel educativo (Continuacin ejemplo 1)
Frecuencias relativas f
i
(Grfico de Pareto)

0.10
0.15
0.20
0.25
0.30
0.35
0.40
2 3 4
1
f
2
=0,35
f
2
+ f
3
=0,35+0,3=0,65
f
2
+ f
3
+ f
4
=0,35+0,3+0,2=0,85
f
2
+ f
3
+ f
4
+f
1
=0,35+0,3+0,2+0,15=1
Un 35 por ciento de la poblacin llega hasta la educacin primaria y el 65 por ciento de la
poblacin tiene un nivel educativo primario o media.
Diagrama de Pareto
24
0.0
0.2
0.4
0.6
0.8
1.0
2 3 4 1
En el diagrama anterior se observa que el 65 por ciento de la poblacin, tiene un nivel
educativo primaria o media.
C) Pictograma: Es una forma de representar las cantidades estadsticas por medio de
dibujos, utilizando para ello objetos y figuras. Las figuras empleadas deben explicarse por
s mismas.
Ejemplo: Nivel de educativo (Continuacin).
a) Distribucin de frecuencias :
Categoras n
i
f
i
1. Sin estudios 3 0,15
2. Primario 7 0,35
3. Medio 6 0,3
4. Superior 4 0,2
N=20 1
b) Elaboracin del Pictograma (Ejercicio para el estudiante)
25
Ejemplo: Variable socioeconmica (SOC): La variable SOC describe la categora
socioeconmica:
1
2
3
4
5
6
7
trabajadores agrarios
empresarios agrarios
obreros
SOC autonomos
clase media
clase alta
retirados

'

Los datos de 75 hogares (o unidades de gasto) son:


3 7 3 5 3 5 1 5 7 5 5 3 3 5 1 1 3 2 2 3 1 3 7 5 3 3 3 5 5 5 7 7 5 1 4 2 1 7 3 4 3 3 3 5 3 3 6
6 7 2 7 1 3 3 2 5 3 7 2 2 7 5 2 2 7 6 1 5 3 5 3 3 3 4 3
(a) Obtener las frecuencias absolutas de cada una de las categoras.
n
1
=8 n
2
=9 n
3
=25 n
4
=3 n
5
=16
n
6
=3 n
7
=11
(b) Calcular las frecuencias relativas y mostrar la distribucin de frecuencias
f
n
N
1
1
8
7 5
0 1 1 , f
n
N
2
2
9
7 5
0 1 2 ,
f
n
N
3
3
2 5
7 5
0 3 3 , f
n
N
4
4
3
7 5
0 0 4 ,
f
n
N
5
5
1 6
7 5
0 2 1 , f
n
N
6
6
3
7 5
0 0 4 ,
f
n
N
7
7
1 1
7 5
0 1 5 ,
Ntese que:
f f f f f f f f
i
i
1 2 3 4 5 6 7
1
7
1 + + + + + +

26
Distribucin de frecuencias:
Categora n
i
f
i
1. Trabajadores agrarios 8 0,11
2. Empresarios agrarios 9 0,12
3. Obreros 25 0,33
4. Autnomos 3 0,04
5. Clase media 16 0,21
6. Clase alta 3 0,04
7. Retirados 11 0,15
N=75 1
(c) Construir el diagrama de Pareto
0.0
0.2
0.4
0.6
0.8
1.0
3 5 7 2 1 4 6
f
3
=0,33; f
3
+f
5
=0,33+0,21=0,54
f
3
+f
5
+f
7
=0,33+0,21+0,15=0,69
f
3
+f
5
+f
7
+f
2
=0,33+0,21+0,15+0,12=0,81
f
3
+f
5
+f
7
+f
2
+f
1
=0,33+0,21+0,15+0,12+0,11=0,92
f
3
+f
5
+f
7
+f
2
+f
1
+f
4
=0,33+0,21++0,11+0,04=0,9
F
3
+F
5
+F
7
+F
2
+F
1
+F
4
+F
6
=0,33+0,21++0,04+0,04=1
El 33 por ciento de la poblacin son obreros y el 54 por ciento de la poblacin son obreros o clase
media, y as sucesivamente.
27
Grfico de sectores:
En el caso de variables cualitativas el diagrama circular se utiliza con mucha frecuencia. Consiste
en representar sobre un crculo los diferentes atributos, mediante un sector circular de ngulo
proporcional a la correspondiente frecuencia. El ngulo de cada sector circular se calcula
multiplicando por 360 la frecuencia relativa.
Los grficos de sectores, tambin conocidos como diagramas de "tartas o pastel", se divide un
crculo en tantas porciones como clases tenga la variable, de modo que a cada clase le
corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa. Si el nmero de
categoras es excesivamente grande, la imagen proporcionada por el grfico de sectores no es lo
suficientemente clara y por lo tanto la situacin ideal es cuando hay alrededor de cuatro
categoras. En este caso se pueden apreciar con claridad dichos subgrupos.
Ejemplo.
La poblacin segn nivel de estudio del Municipio de Ayutuxtepeque se presenta en el siguiente
cuadro:
Parvulari
a
Primaria
o bsica
Educaci
n media
Superior
no
universita
ria
Tcnico
universita
rio
Superior
universita
ria
Maestr
a
Doctora
do Total
1168 15895 6842 499 363 4556 70 7 29400
Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.
Elaborar un grfico de sectores.
Se tienen 8 categoras, por lo tanto debe aparecer el crculo dividido en 8 porciones. La tabla
anterior presenta las frecuencias absolutas, habr que dividir cada dato por el total (29,400) a fin
de obtener la frecuencia relativa y luego multiplicar esta ltima por 100. Por ejemplo, para la
categora de educcin bsica: (15,895/ 29,400)*100 = 54,06%. Observe que no se ha
multiplicado por 360, ya que es ms ilustrativo el porcentaje (As trabaja Excel).
Figura 2. Nivel educativo de la poblacin de Ayutuxtepeque, por ciento.
28
Es evidente que la mayora de la poblacin tiene un nivel educativo bsico o media con el
54.06% y 23.27% respectivamente. En general la poblacin de Ayutuxtepeque tiene un nivel
educativo relativamente bajo, son muy pocos los que llegan a hacer estudios universitarios.
2.1.3. Variables cuantitativas discretas.
Diagrama de Barras:
Para el caso de distribuciones de frecuencias no agrupadas en intervalos, el diagrama de barras es
el grfico ms empleado. Que se usa cuando se pretende resaltar la representacin de porcentajes
o frecuencias de datos que componen un total. Una grfica de barras contiene barras verticales
que representan valores numricos. Las frecuencias estn asociadas con categoras. Una grfica
de barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de
largo (alto si es horizontal) igual a la frecuencia. La grfica de barras sirve para comparar y tener
una representacin grfica de la diferencia de frecuencias o de intensidad de la caracterstica
numrica de inters. Si en vez de frecuencias simples utilizamos frecuencias acumuladas,
tenemos el llamado diagrama de escalera.
Ejemplo. Con la informacin del VI Censo de Poblacin y V de Vivienda, El Salvador, 2007, se
han clasificado las mujeres de El Salvador de 12 aos y ms, segn el nmero de hijos varones,
resultando los siguientes datos.
Construir un grfico de barras para el nmero de hijos varones de las
mujeres salvadoreas.
29
N Hijos
Varones Madres
0 278290
1 509469
2 339180
3 177050
4 92233
5 50916
6 27791
7 15004
8 7328
9+ 7366
Ejemplo.
La poblacin segn condicin de ocupacin del Municipio de Ayutuxtepeque se presenta en el
siguiente cuadro:

OCUPAD
OS
DESOCUPA
DOS
INACTIVO
S Total
REA URBANA 10966 2832 8531 22329
EL ZAPOTE 329 42 477 848
LOS LLANITOS 2410 227 2550 5187
Total 13705 3101 11558 28364
Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.
Elaborar un grfico de barras para la poblacin total de Ayutuxtepeque segn su condicin de
ocupacin.
2.2. Distribucin de frecuencias agrupadas.
Cuando en la muestra existen muchos valores diferentes y mucha variabilidad se recomienda, an
a costa de perder informacin, agrupar los datos en clases, en lo que se denomina distribucin de
frecuencias agrupada en intervalos.
Clase Marca Frecuencias Absolutas Frecuencias Relativas
Clase Simples Acumuladas Simples Acumuladas
30
0 1
1 2
1
.
.
.
k k
L L
L L
L L

<
<
<
1
2
.
.
.
k
x
x
x
1
2
.
.
.
k
n
n
n
1 1
2 1 2
1
.
.
.
k
k i
i
N n
N n n
N n

1 1
2 2
/
/
.
.
.
/
k k
f n n
f n n
f n n

1 1
2 2
/
/
.
.
.
/
k k
F N n
F N n
F N n

Total
1
k
i
i
n n

1
1
k
i
i
f

A cada uno de los intervalos se les denomina clase y al punto medio marca de clase. A efectos de
clculo la marca de clase se elige como representante del intervalo. El nmero de clases en que se
dividen los datos no debe ser excesivo. A modo orientativo, el nmero de clases se puede obtener
mediante la siguiente frmula emprica, llamada de Sturges:
3 log( )
2 log(2)
n
nmero de clases +





(Tomar la parte entera)
31
Ejemplo. Poblacin de El Salvador, por sexo y edad, ao 2007..
Eda
d
Hombr
e Mujer Total
Eda
d
Hombr
e Mujer Total
Eda
d
Homb
re
Muje
r Total
< 1 51787
5009
7
10188
4 36 31398 40111
7150
9 72 8591
1071
7
1930
8
1 53230
5147
7
10470
7 37 31414 38801
7021
5 73 7461 9522
1698
3
2 55845
5426
1
11010
6 38 29639 37419
6705
8 74 8011
1003
0
1804
1
3 59752
5712
7
11687
9 39 29435 37454
6688
9 75 8067 9886
1795
3
4 62658
5965
9
12231
7 40 31769 39411
7118
0 76 7535 9745
1728
0
5 62274
5973
8
12201
2 41 24732 32964
5769
6 77 6897 8872
1576
9
6 69088
6624
9
13533
7 42 26840 34653
6149
3 78 5825 7123
1294
8
7 75310
7267
2
14798
2 43 24578 32639
5721
7 79 5334 6700
1203
4
8 71525
6851
1
14003
6 44 24299 31746
5604
5 80 5717 7089
1280
6
9 70953
6840
7
13936
0 45 24451 31422
5587
3 81 4124 5274 9398
10 74244
7066
4
14490
8 46 21989 29308
5129
7 82 3841 5220 9061
11 71744
6949
9
14124
3 47 22251 28713
5096
4 83 3438 4508 7946
12 74093
7283
5
14692
8 48 20682 26481
4716
3 84 3281 4378 7659
13 68251
6619
4
13444
5 49 20584 26241
4682
5 85 3263 4413 7676
14 71191
6763
2
13882
3 50 22897 28057
5095
4 86 3096 4286 7382
15 64523
6375
2
12827
5 51 17664 22874
4053
8 87 2750 3758 6508
16 61880
6163
0
12351
0 52 19081 24360
4344
1 88 1767 2358 4125
17 61255
6162
4
12287
9 53 17671 22344
4001
5 89 1595 2219 3814
18 57590
5858
4
11617
4 54 17962 22824
4078
6 90 1405 2091 3496
19 53136
5659
1
10972
7 55 17848 22561
4040
9 91 786 1143 1929
20 50243
5508
5
10532
8 56 17114 21361
3847
5 92 826 1206 2032
21 45994
5162
3 97617 57 16816 20974
3779
0 93 673 990 1663
22 46006 5142 97435 58 14462 17853 3231 94 559 869 1428
32
9 5
23 42864
4927
8 92142 59 15478 18608
3408
6 95 482 816 1298
24 42894
5112
6 94020 60 17461 19979
3744
0 96 416 674 1090
25 42616
5055
2 93168 61 12470 15424
2789
4 97 356 588 944
26 41993
5070
7 92700 62 13590 17093
3068
3
98
+ 526 948 1474
27 43473
5221
4 95687 63 12274 15528
2780
2
28 39209
4807
6 87285 64 12412 15633
2804
5
29 39672
4937
8 89050 65 12802 15513
2831
5
30 41911
5074
4 92655 66 11774 14915
2668
9
31 33494
4293
3 76427 67 11864 14597
2646
1
32 35940
4531
2 81252 68 9694 12291
2198
5
33 33124
4199
0 75114 69 9647 12060
2170
7
34 33931
4287
0 76801 70 10861 13101
2396
2
35 34628
4284
8 77476 71 8525 10638
1916
3
Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.
Elabore una tabla de frecuencias agrupadas por edad.
33
2.2.1 Representacin grfica de variables continuas
Histogramas y polgono de frecuencias.
El histograma y el polgono de frecuencias son las representaciones grficas usadas para
distribuciones de frecuencias agrupadas en intervalos. El histograma se construye dibujando en
cada clase un rectngulo de base la amplitud del intervalo y de altura se representan las
frecuencias. Si desde el extremo superior de cada una de las barras que representan los intervalos
de clase se hace una marca en el punto medio y luego se unen los puntos por lnea recta se
obtiene el polgono de frecuencias.
El polgono de frecuencias se lleva hasta el eje horizontal en los extremos hasta los puntos que
seran los puntos medios si hubiera una clase adicional en cada extremo del histograma
correspondiente. Esto permite que el rea total quede incluida. Es decir, el rea total bajo el
polgono de frecuencias equivale al rea bajo el histograma.
Ejemplo: Estatura de los estudiantes de clase (ejercicio prctico)
Ejemplo:
El siguiente cuadro presenta el nmero de homicidios para los aos 2004, 2005, 2006, 2007 y
2008, para los municipios de Soyapango, Ilopango y San Martn.
Grupos
de
edades
SOYAPANGO ILOPANGO SAN MARTN
Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total
AO 2004
Total 15 167 182 12 78 90 11 42 53
AO 2005
Total 14 228 242 5 74 79 11 75 86
AO 2006
Total 16 246 262 15 69 84 6 48 54
AO 2007
Total 20 179 199 10 67 77 8 71 79
AO 2008
Total 10 128 138 9 66 75 7 54 61
Fuente: Fuente estadsticas de homicidios de Instituto de Medicina Legal. Los cadveres que no se pudo identificar
el sexo, no aparecen registrados en el cuadro anterior.
Utilizar la mejor representacin grfica para la informacin anterior (Diagrama de barras e
histogramas)
34
2.3. Gua de ejercicios N 2.
Distribucin de frecuencias y sus representaciones grficas.
1. Las calificaciones de 50 alumnos en Matemticas han sido las siguientes:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7,
6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
Construir la tabla de distribucin de frecuencias y dibuja el diagrama de barras.
2. Los pesos de los 65 empleados de una fbrica vienen dados por la siguiente tabla:
Peso
[50,
60)
[60,
70)
[70, 80) [80,90)
[90,
100)
[100, 110) [110, 120)
f
i
8 10 16 14 10 5 2
a) Construir la tabla de frecuencias.
b) Representar el histograma y el polgono de frecuencias.
3. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un
examen de Fsica.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13,
22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
a) Construir la tabla de frecuencias agrupadas en intervalos de amplitud 5 unidades.
b) Dibujar el histograma y el polgono de frecuencias.
4. Se ha realizado una encuesta en 30 hogares en la que se les pregunta el n de individuos
que conviven en el domicilio habitualmente. Las respuestas obtenidas han sido las
siguientes: 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
a) Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias absolutas,
relativas y sus correspondientes acumuladas.
b) Qu proporcin de hogares est compuesto por tres o menos personas? Qu proporcin
de individuos vive en hogares con tres o menos miembros?
c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera.
5. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el
nmero de empleados que hay en cada una de ellas para un estudio posterior. Las
observaciones obtenidas han sido: 12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,14,15, 11, 11,
12, 16, 17, 17,16,16, 15, 14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10,
11, 12, 12, 11, 13, 13, 15, 13, 11, 12.
a) Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias
absolutas, relativas y sus correspondientes acumuladas.
35
b) Qu proporcin de sucursales tiene ms de 15 empleados?
c) Dibuje el diagrama de barras y el diagrama en escalera correspondientes.
d) Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su distribucin
de frecuencias y represente su histograma y su polgono de frecuencias.
6. Los siguientes valores son los niveles de glucosa en sangre extrada a 100 nios en
ayunas:
5
6
6
1
5
7
7
7
6
2
7
5
6
3
5
5
6
4
6
0
6
0
5
7
6
1
5
7
6
7
6
2
6
9
6
7
6
8
5
9
6
5
7
2
6
5
6
1
6
8
7
3
6
5
6
2
7
5
8
0
6
6
6
1
6
9
7
6
7
2
5
7
7
5
6
8
8
1
6
4
6
9
6
4
6
6
6
5
6
5
7
6
6
5
5
8
6
5
6
4
6
8
7
1
7
2
5
8
7
3
5
5
7
3
7
9
8
1
5
6
6
5
6
0
6
5
8
0
6
6
8
0
6
8
5
5
6
6
7
1
7
2
7
3
7
3
7
5
7
5
7
4
6
6
6
8
7
3
6
5
7
3
7
4
6
8
5
9
6
9
5
5
6
7
6
5
6
7
6
3
6
7
5
6
6
7
6
2
6
5
7
5
6
2
6
3
6
3
5
9
a. Elabore una distribucin de frecuencias
b. Un histograma y un polgono de frecuencias.
7. Los siguientes datos representan las ventas de tabaco en Espaa durante el ao 1992, en
millones de cajetillas, segn marcas:
Marcas Ventas
Ducados
Fortuna
Marlboro
Winston (1)
Lucky Strike (1)
Chesterfiel
Otros marcas
1,107
1,041
535
333
164
110
725
a. Calcular el porcentaje de ventas de cada marca sobre el total.
b. Representar los datos anteriores mediante un diagrama circular
36
8. Las edades de los empleados de una determinada empresa son las que aparecen en la
siguiente tabla:
Edad N de empleados
Menos de 25 22
Menos de 35 70
Menos de 45 121
Menos de 55 157
Menos de 65 184
Sabiendo que el empleado ms joven tiene 18 aos, escrbase la distribucin de frecuencias para
datos agrupados (amplitud del intervalo definida segn su conveniencia).
37
Captulo 3. Medidas Caractersticas de una
Distribucin Cuantitativa Emprica.
3.1 Medidas de posicin
Los promedios o medidas de posicin proporcionan valores tpicos o representativos de la
variable en estudio. Podemos hablar de medidas de posicin centrales, como la media (aritmtica,
geomtrica y armnica), la mediana y la moda y medidas de posiciones no centrales, como los
cuartiles, quintiles, deciles y percentiles.
La media aritmtica es la medida de posicin ms utilizada (esta muy influenciada por los valores
extremos de la variable). Viene definida como la suma de los datos divido por el nmero de ellos.
Dependiendo de la naturaleza de los datos que pretendemos promediar, ser conveniente el uso
de otro tipo de medidas, como son la media geomtrica (Todos los datos son positivos y hay
mucha dispersin; ejemplo: porcentajes, tasas de crecimiento, razones, nmeros ndices, inters
anual, inflacin, etc.) y la media armnica (resulta poco influida por la existencia de
determinados valores muy grandes que el conjunto de los otros, siendo en cambio sensible a
valores muy pequeos), cuyas frmulas se presentan en la siguiente tabla. Si a cada observacin
se le asigna un valor diferente, dado en forma de peso, y a continuacin se calcula la media, nos
encontramos con una media ponderada. La moda de un conjunto de valores es aquel valor que
ocurre con ms frecuencia. Si todos los valores son distintos, no hay moda, por otra parte, un
conjunto de datos puede tener ms de una moda.
Medidas de tendencia central
Media aritmtica
( )
1 1 2 2
1
. . .
k k
x x n x n x n
n
+ + +
Media geomtrica
( )
1 2
1/
1 2
. . .
k
n
n n n
k
G x x x
Media armnica
1 2
1 2
. . .
k
k
n
H
n n n
x x x

_
+ + +

,
3.1.1. Media aritmtica.
Es la medida ms conocida, la ms fcil de calcular y con la que siempre estamos ms
familiarizados, ya que siempre hemos calculado el promedio de calificaciones obtenidas en cada
periodo escolar (Ciclo, ao, etc.) A veces se le denomina simplemente media o promedio, y es
utilizada con tanta frecuencia, que en algunas ocasiones nos conduce a resultados que no revelan
lo que se pretende presentar, ya que la distribucin de los datos puede requerir de la aplicacin de
un promedio diferente a la media, ya sea, media geomtrica o media armnica.
38
Le media es altamente sensible a cualquier cambio en los valores de la distribucin. No es
recomendable su uso cuando la variable est dada en forma de tasas o porcentajes. La media es
representativa del conjunto de datos si se quiere promediar cantidades semejantes, que presentan
variaciones dentro de un margen razonable.
Media Aritmtica simple. Se define como el cociente que se obtiene al dividir la suma de los
valores de la variable por el nmero total de observaciones. Su frmula est dada por:
1
n
i
i
x
x
n

Ejemplo. Supongamos que en un almacn tienen empleados a 12 vendedores, y sus ingresos


mensuales son: $ 585, $ 521, $ 656, $ 465, $ 536, $ 487, $ 564, $ 490, $ 563, $ 1234, $ 469 y $
547. Se pide determinar la media de los ingresos de los 12 vendedores.
Solucin.
Ejemplo. Consideremos las utilidades y prdidas de un almacn por departamentos, como se
muestra en la siguiente tabla.
OBSERVACIN. El promedio por departamento se mantiene de un ao a otro, pero nos oculta
los cambios que se han producido por departamentos donde ha habido un desplazamiento de los
beneficios. Para superar estas deficiencias se requiere trabajar con la media ponderada.
Media aritmtica ponderada
Cuando el nmero de observaciones es grande, las operaciones para calcular la media se
simplifican si agrupamos los datos en una tabla de frecuencias. La frmula matemtica est dada
por:
1
k
i i
i
x f
x
n

Si los datos estn agrupados en clase, no se conoce el valor de x, por lo tanto se toma el punto
medio de cada clase en vez de x (marca de clase).
Propiedades de la media.
39
Departamentos 2008 2009
Calzado -10 20
Electrodomsticos 153 58
Juguetera -40 -20
Ropa 130 152
Miscelneos -13 10
Promedio 44 44
Dada la importancia de la media y su uso frecuente, conviene considerar algunas de sus
propiedades:
1. La suma de las desviaciones respecto a la media es cero, esto es:
Para datos no agrupados:
1
( ) 0
n
i
i
x x

Para datos agrupados:


1
( ) 0
n
i i
i
x x n

. La verificacin de esta propiedad es inmediata.


2. La media aritmtica de una constante es igual a la constante.
3. La media del producto de una constante por una variable, es igual a multiplicar a la
constante por la media de la variable.
4. La media de una variable ms (o menos) una constante ser igual a la media de la
variable, ms (o menos) la constante, es decir,
1
( )
k
i i
i
x c n
x c
n

t
t

5. La media aritmtica de una muestra dividida en submuestras, es igual, a la media


ponderada de las submuestras, tomando como ponderacin los tamaos de las
submuestras. Esto es,
1
1 2
...
m
i
i
i
m
x n
x donde n n n n
n

+ + +

Ejemplo: Un inversionista tiene 1,200 acciones de un precio inferior a $3,490 dlares


siendo su valor promedio de $ 2,905; adems, 800 acciones cuyo valor unitario es
superior a $ 3,490 y su valor promedio de $ 4,275. Calcular el valor promedio de las
2,000 acciones.
Solucin.
1 2
1 2
1 2
2905(1200) 4275(800)
3, 453
1200 800
x n x n
x
n n
+ +

+ +
En promedio el inversionista gasta $ 3,453 dlares en las 2000 acciones.
3.1.2. La media geomtrica (Mg)
La media geomtrica se define como la raz n-sima de la multiplicacin de los n valores de la
variable. Se utiliza cuando se quiere dar importancia a valores pequeos de la variable o cuando
se desea obtener el promedio de valores que estn dados en progresin geomtrica.
En el campo industrial y comercial se utiliza para obtener promedios sobre el crecimiento o
decrecimiento de una variable. Por ejemplo, un capital ahorrado a una tasa de inters compuesto,
durante un periodo de tiempo.
40
La media geomtrica se calcula utilizando la siguiente frmula:
1 2
1 2
. . .
k
n n n
n
k
Mg x x x

donde los ni es el nmero de veces que se repite cada dato, en caso que los datos no se repitan los
ni=1.La frmula de la media geomtrica tal como se ha presentado tiene el inconveniente de que
tanto el producto de los xi como su raz n-sima, pueden ser un valor demasiado alto que dificulte
las operaciones. Para obviar esta dificultad se transforma la ecuacin anterior en:

1
ln
exp
k
i i
i
n x
Mg
n

_




,

. Es obvio que las dos ecuaciones son equivalentes, esta ltima


ecuacin es la ms utilizada en el clculo de la media geomtrica.
Ejemplo (Media geomtrica)

Las tasas de inters de tres bonos son 5%, 7% y 4%.
La media geomtrica es:
3
7 5 4 5.192 G x x
La Mg da una cifra de ganancia ms conservadora porque no tiene una ponderacin alta para la
tasa de 7%.
3.1.3. La media armnica (Ma)
Iniciamos diciendo que el inverso de la media armnica es igual a la media aritmtica del inverso
de los valores de la variable, esto es:
1
1
1
k
i
i i
k
i
i i
n
x n
Ma
n Ma n
x

Ejemplo: Se sabe que dos obreros A y B, se tardan 50 y 40 minutos respectivamente en reparar


un par de zapatos. Cul es el tiempo requerido para reparar un par de zapatos?
Solucin.
1 2
2
44.44
1 1 1 1
50 40
n
Ma Ma
x x

+ +
, es el tiempo requerido para reparar un
par de zapatos.
41
El mayor uso de la media armnica es para calcular la velocidad promedio. Recordemos que:
n dista cia
Velocidad
tiempo

, supongamos que se han recorrido k trayectos (distancias) a cierta


velocidad cada trayecto, entonces la velocidad media vendr dada por:
1 1
tan
k k
i i
i i i i
dis cia total d
Vm
d d
V V



Ejemplo. Supongamos que la distancia entre dos ciudades, A y B, es de 80 kilmetros y entre B
y C de 120 kilmetros. Si un automovilista recorre de A a B a una velocidad de 100Km/h y de B
a C a una velocidad de 80Km/h. Cul es la velocidad promedio?
Solucin.
1
200
86.956
80 120
100 80
k
i
i
i
d
Vm
d
V

3.1.4. La moda
La moda es una medida de posicin, menos importante que los promedios y su uso es bastante
limitado. Se utiliza en distribuciones cuando la variable o el atributo presentan una frecuencia
demasiado grande con respecto a las dems.
La moda se define aquel valor de la variable o del atributo que presenta la mayor densidad, es
decir, la mayor frecuencia.
Si se tiene un atributo o una variable con mxima frecuencia, la distribucin es unimodal. Si hay
dos valores en la variable con la misma frecuencia mxima, la distribucin es bimodal. Si hay
ms de dos, la distribucin es multimodal. Cuando ninguno de los valores que toma la variable se
repite, no existe moda.
Datos agrupados.
Cuando la moda se aplica a una variable continua, se requiere que la amplitud de los intervalos
sea constante. A se presenta una frmula para obtener una aproximacin del valor modal:
1
1
1 1
i
i
i i
n
Moda L C
n n
+

+
_
+

+
,
42
3.1.5. La mediana.
La mediana de una distribucin de frecuencia corresponde al valor, supuesto los datos ordenados
de menor a mayor, que deja a ambos lados el mismo nmero de observaciones. Cuando
calculamos la mediana en datos no agrupados, ordenamos las observaciones de menor a mayor o
viceversa. En su clculo se presentan dos casos:
a) Cuando el nmero de datos es impar: En este caso la mediana coincide con el dato central.
Ejemplo: Consideremos los salarios en dlares para 11 vendedores; 243, 320, 311, 254, 234,
261, 239, 310, 218, 267, 287. Calcular la mediana.
Solucin:
Primero ordenar los datos de menor a mayor: 218, 234, 239, 243, 254, 261, 267, 287, 310, 311,
320
La posicin donde se encuentra la mediana: (11+1)/2=6, la mediana se encuentra en la sexta
posicin y corresponde al valor de: Md=261.
b) Cuando los datos son pares: La mediana ser el trmino medio de los dos valores centrales.
Ejemplo. Consideremos los salarios en dlares para 12 vendedores; los cuales se han
presentado ordenados anteriormente 218, 234, 239, 243, 254, 261, 267, 287, 310, 311, 320 y
322:. Calcular la mediana.
Solucin:
Para obtener la posicin central se aplica la siguiente frmula:
1 12 1
6.5
2 2
n + +
, entonces
la mediana corresponde al promedio de los dos valores sombreados de amarillo, esto es:
Md=(261+267)/2=264.
Para el caso de distribuciones agrupadas en intervalos se utiliza una frmula aproximada. Se
comienza calculando el intervalo donde se encuentra la mediana, para lo cual se calculan las
frecuencias acumuladas, y se escoge el primer intervalo cuya frecuencia acumulada sea igual o
superior a n/2. A continuacin se aplica la frmula:
1
1
/ 2
i
i i
i
n N
Mediana L C
n

+
3.1.5. Cuartiles, Deciles y Percentiles
Dados una serie de valores X
1
,X
2
,X
3
...X
n
ordenados en forma creciente, los cuartiles son los tres
valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q
1
, Q
2
, Q
3
. El segundo cuartil es precisamente la
mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de
todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo del
cual quedan las tres cuartas partes (75%) de los datos.
43
Para Datos No Agrupados
Si se tiene una serie de valores X
1
, X
2
, X
3
... X
n
, se localiza mediante las siguientes frmulas:
El primer cuartil:
La posicin del primer cuartil: 1*(n+1)/4
Para el tercer cuartil
La posicin del primer cuartil : 3*(n+1)/4
Quintiles
Se representan con la letra K. Su frmula aproximada es i*n/5.
El primer quintil. Separa a la muestra dejando al 20 % de los datos a su izquierda.
El segundo quintil. Es el valor que indica que el 40 % de los datos son menores.
El tercer quintil. Indica que el 60 % de los datos son menores que l.
El cuarto quintil. Separa al 80 % de los datos inferiores del otro 20 %.
Deciles
Se representan con la letra D. Son 9 valores que distribuyen la serie de datos, ordenada de
forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos
concentra el 10% de los resultados. Su frmula aproximada es i*n/10.
Es el decil i-simo, donde la i toma valores del 1 al 9. El (i*10) % de la muestra son
valores menores que l y el 100-(i*10) % restante son mayores.
Percentiles
Se representan con la letra C. Su frmula aproximada es i*n/100.
Es el percentil i-simo, donde la i toma valores del 1 al 99. El i % de la muestra son
valores menores que l y el 100-i % restante son mayores.
Para Datos Agrupados
Cuando los datos no estn agrupados en intervalos los cuartiles, as como el resto de las medidas
de posicin, tienen un valor claro, tal como se ha descrito anteriormente. Sin embargo, cuando
tenemos una agrupacin de los datos ya no es tan sencillo realizar el clculo. S que resulta claro
ver en cul de los intervalos est el cuartil (quintil, decil o percentil) buscado, pero para calcular
su valor aproximado necesitaremos usar una frmula. El clculo es similar al de la mediana, hay
que empezar calculando el intervalo cuya frecuencia acumulada sea igual o mayor que el valor
jn/k, para a continuacin aplicar la frmula:
1
; 1
/
i
j k i i
i
jn k N
Q L C
n

+
44
donde k = 4 (j = 1, 2, 3) para los cuartiles, k = 10 (j = 1, 2, . . . , 9) para los deciles, k=100 (j= 1,
2, . . . , 99) para los percentiles.
3.2 Medidas de Dispersin
Las medidas de dispersin estudian la separacin existente entre los diversos valores que toma la
variable. Se dividen en medidas de dispersin absoluta y relativa. Las absolutas suelen hacer
referencia a un promedio, y permiten estudiar su representatividad. Este tipo de medidas depende
de las unidades, lo que es un inconveniente para realizar comparaciones entre poblaciones. En
este sentido, las medidas de dispersin relativas no dependen de las unidades y permiten
comparar variabilidad entre poblaciones.
El rango estadstico, tambin llamado amplitud o recorrido, es la diferencia entre el valor
mximo y el valor mnimo en un grupo de nmeros. Para averiguar el rango de un grupo de
nmeros:
Ordenamos los nmeros segn su tamao.
Restamos el valor mnimo del valor mximo.
Con el objeto de que no exista dependencia de los valores extremos, se introduce el recorrido
intercuartlico, que es la semidiferencia entre el tercer y el primer cuartil:
3 1
1
2
Q Q
R

Se define tambin la desviacin absoluta media como la media de los valores absolutos de las
diferencias de los datos a la media, es decir:
1
1
k
i i
i
AM x x n
n

Varianza, desviacin tpica y coeficiente de variacin


La varianza es una medida de dispersin que sirve para estudiar la representatividad de la media.
Viene definida como la media de las diferencias cuadrticas de las puntuaciones respecto a su
media aritmtica:
( )
2
2
1
1
k
X i i
i
S x x n
n

Una varianza grande es indicativa de que la media no es representativa, mientras que una
varianza pequea indica que la media es un buen representante de los datos. Con el objeto de
tener una medida de dispersin similar a la varianza, pero que venga medida en las mismas
unidades de la variable, se define la desviacin tpica como la raz cuadrada positiva de la
varianza:
X
S Varianza
45
La relacin entre la varianza de una variable X y la de una nueva variable definida como a+bX
es:
2 2 2
a bX X
S b S
+

Por lo tanto, si a los datos de la distribucin les sumamos una cantidad constante la varianza no se
modifica y si multiplicamos por una constante, la varianza queda multiplicada por el cuadrado de
esa constante.
En ocasiones puede interesar comparar la dispersin de dos muestras y la desviacin tpica no ser
vlida, si las dos muestras tienen unidades diferentes. Para obviar este inconveniente se define el
coeficiente de variacin:
X
S Desviacin Tpica
CV
Media x

Que no depende de cambios de escala en la variable.
3.3 Medidas de forma
Este tipo de medidas permite conocer la forma de la distribucin sin necesidad de recurrir a su
representacin grfica. Existen dos tipos de medidas de forma: Asimetra y curtosis. Para
clasificar la distribucin segn estas medidas, se establece en ambos casos una tipologa de
distribuciones. Una variable se dice que es simtrica si al doblar la distribucin respecto a un
eje (centro de simetra), las frecuencias coinciden. Caso contrario se dice que la distribucin es
asimtrica positiva o negativa, dependiendo que la rama larga de la distribucin se encuentra en
el sentido positivo o negativo del eje de las x. La medida ms popular de asimetra es el
coeficiente de asimetra de Fisher, que viene dado por:
( )
( )
3
3 1
1 3/ 2 3
2
1
1
1
k
i i
i
k
i i
i
x x n
m n
g
S
x x n
n

1
]

Este coeficiente es invariante frente a cambios de origen y de escala.


Cuya interpretacin es:
Si g1 = 0, la distribucin es simtrica.
Si g1 > 0, la distribucin es asimtrica positiva
Si g1 < 0, la distribucin es asimtrica negativa.
El coeficiente de curtosis trata de estudiar la concentracin de frecuencias en la zona central de la
variable, de modo que variables con curtosis alta (leptocrticas) tienen forma alargada y variables
con curtosis baja tienen forma aplanada (platicrticas). La comparacin se realiza respecto a una
distribucin moderada como es la distribucin normal (mesocrtica). El coeficiente de curtosis
viene dado por:
46
( )
( )
4
1 4
2 2 4
2
1
1
3 3
1

1
]

k
i i
i
k
i i
i
x x n
m n
g
S
x x n
n
Que se interpreta del siguiente modo:
Si g2 = 0, la distribucin es mesocrtica o normal.
Si g2 > 0, la distribucin es leptocrtica o por encima de lo normal.
Si g2 < 0, la distribucin es platicrtica o por debajo de la normal.
Al igual que el coeficiente de asimetra de Fisher, el coeficiente de curtosis es invariante frente a
cambios de origen y de escala.
3.4. Gua de Ejercicios N 3.
Medidas caractersticas de una distribucin cuantitativa emprica
1) Por qu no se aplica la media geomtrica cuando uno de los valores es cero? Si la frmula es
( )
1 2
1/
1 2
. . .
k
n
n n n
k
G x x x
.
2) De un grupo de 100 obreros en una fbrica, 40 trabajan en el da y 60 en la noche. Se sabe
que el salario promedio anual de los 100 obreros es de $8,700 dlares y que los del turno de
da reciben en promedio $800 dlares menos que los trabajadores nocturnos. Cul es el
salario promedio anual en cada grupo?
3) En un supermercado trabajan 35 mujeres, con un salario promedio mensual de $650 dlares
y 15 hombres, en promedio ganan un 12% ms que las mujeres Cul es el salario promedio
de los empleados del supermercado?
4) Durante un mes se construyeron 134 Km de carretera en la siguiente forma: 3.6% del total en
la primera semana; 15.3% del total en la segunda semana; 7.6% en la tercera semana; 24.5%
en la cuarta semana y en la ltima semana el 49%. La construccin promedio por da en cada
semana fue de: 0.9Km/d, 3.4Km/d, 1.7Km/d, 5Km/d y 10Km/d, respectivamente. Hallar la
medida de tendencia central que mejor represente el promedio de esta distribucin.
5) La media aritmtica de tres nmeros es 7, su mediana es 6 y su media geomtrica es
3
216 .
Con los tres nmeros calcular la media armnica.
6) Se sabe que la media aritmtica de dos nmeros es 5 y la media geomtrica es 4. Cul es la
media armnica?
47
7) Una persona viaja 4 das. Diariamente recorre 200 Km, pero maneja el primero y el ltimo
da a 50Km/h, el segundo a 55Km/h y el tercer da a 70Km/h. Cul es la velocidad media
durante el viaje?
8) Las ciudades A, B y C son equidistantes entre s. Un automovilista viaja de A a B a 30 Km/h
de B a C a 40 Km/h y de C a A a 50 Km/h. Determine el promedio de velocidad para el viaje
completo.
9) Un fabricante dispone $600,000 anuales para la compra de materia prima. Durante tres aos
invierte la misma cantidad de dinero. Si el precio promedio por Kg ha aumentado en los
ltimos tres aos sucesivos de $2,200 a $2,800 y luego a $4,600, Cul es el precio promedio
que ha pagado el fabricante en los tres aos?
10) El 1 de mayo de 2002 se ahorraron $ 50,000 en un banco al 7.6% de inters anual,
capitalizados semestralmente. Obtener la cantidad media depositada en la cuenta, entre el 1 de
mayo de 2002 y el 31 de octubre de 2006, suponga que no se hicieron retiros durante el
periodo.
11) Tres amas de casa fueron a comprar a tres mercados diferentes. Cada una gast $ 10 dlares
en la compra de naranjas. La ama de casa A compr 4 docenas de naranjas; B compr 6
docenas y C compr 3 docenas. Cul es el precio promedio por docena?
12) El siguiente cuadro muestra la distribucin de la renta anual (en miles de dlares) en que
incurren 50 viviendas:
Marca de Clase 18.85 21.55 24.25 26.95 29.65 32.35 35.05
N de Viviendas
3 2 7 7 11 11 9
a) Halle e interprete segn el enunciado
i) Media, mediana y moda.
ii) Desviacin estndar y coeficiente de variabilidad.
b) Estime el porcentaje de viviendas con rentas superiores o iguales a 26,000 dlares pero
menores que 32, dlares.
c) Si las rentas menores que 28,300 dlares se incrementaron en 2,500 dlares y las rentas
mayores o iguales que 28,300 dlares se redujeron en un 30%. Calcule la nueva renta
promedio.
13) Una compaa requiere los servicios de un tcnico especializado. De los expedientes
presentados, se han seleccionado 2 candidatos: A y B, los cuales renen los requisitos
mnimos requeridos. Para decidir cul de los 2 se va a contratar, los miembros del Jurado
deciden tomar 7 pruebas a cada uno de ellos. Los resultados se dan a continuacin:
Pruebas
1 2 3 4 5 6 7
48
Puntaje obtenido por A 57 55 54 52 62 55 59
Puntaje obtenido por B 80 40 62 72 46 80 40
a) Halle e interprete la media, mediana y moda de los dos candidatos.
b) Estadsticamente Cul de los candidatos debe ser contratado? Fundamente su respuesta.
14) Se toman las medidas de 80 personas las que tienen estatura media de 1.70 m y desviacin
estndar de 3.4 cm. Posteriormente se verific que la media usada tena 4 cm de menos.
Rectifique los estadgrafos (estadsticos) mencionados.
15) Una asistencia social desea saber cul es el ndice de natalidad en 2 municipios de San
Salvador para ello encuest a 10 familias de cada municipio obteniendo los siguientes
resultados
A 0 6 1 2 3 1 4 3 6 4
B 3 4 1 4 2 3 1 5 4 3
a) Calcule la media, mediana y moda para cada municipio e interprtelos.
b) Considera Ud. que en el distrito B, el nmero de hijos por familia es ms homogneo que en
el distrito A.
16) El salario promedio anual en una ciudad es de 8,000 dlares con una variancia de 1,000
dlares Cuales sern la nueva media y la nueva variancia si se efectan los siguientes
cambios:
a) Se aumenta 810 dlares a todos
b) Se aumenta el 15 % de su salario a cada trabajador
c) Si se duplican los sueldos
17) En un examen 20 alumnos del curso A obtienen una media de 60 puntos y desviacin
estndar de 20 puntos. En el curso B los alumnos obtienen una media de 80 y desviacin
estndar de 16. Ante un reclamo se decide subir en 5% ms 5 puntos adicionales a todos los
alumnos del curso A, en cambio como hubo muchas copias en el curso B se decidi disminuir
la quinta parte de la calificacin.
Despus de los mencionados ajustes Cul es el puntaje medio de los 50 alumnos?
18) Se ha realizado un estudio entre 100 mujeres mayores de 15 aos y el
nmero de hijos de las mismas. El resultado ha sido:
Xi: N hijos ni: N mujeres
0
1
2
3
4
5
6
13
20
25
20
11
7
4
Se pide:
a) Calcular el nmero medio de hijos, la mediana y la moda.
49
b) Calcular los cuartiles y el decil 7.
c) Analizar la dispersin de la distribucin, interpretando los resultados.
d) Analizar la forma de la distribucin calculando los coeficientes correspondientes.
Comente los resultados.
19) La siguiente distribucin expresa el nmero de vehculos vendidos durante un
mes por cada uno de las 50 sucursales que una determinada firma tiene en El
Salvador:
xi: nmero de
vehculos
vendidos
ni: nmero
Sucursales
1
3
4
6
10
5
12
20
8
5
Se pide:
a) Media aritmtica, mediana y moda. Qu puede decir de la asimetra de la
distribucin con estos datos?
b) Desviacin tpica, Coeficientes de asimetra de Fisher y curtosis. Comente los
resultados.
20) La siguiente tabla recoge la cifra de ventas (en miles de millones) y el nmero de empleados
(en miles) de las diez mayores empresas del sector de automvil durante el ao 1989:
Empresa Ventas Plantilla
SEAT
Fasa Renault
General Motors
Ford
Citroen
Peugeot
Nissan
Mercedes Benz
ENASA
457.3
449.7
372.7
356.1
224.6
198.0
161.1
110.7
97.3
23.8
19.2
9.4
9.5
7.6
6.7
6.6
3.4
5.5
a) Calcular las ventas medias y el nmero medio de empleados.
b) Dnde existe mayor homogeneidad, en las ventas o en la plantilla?
c) Calcular las ventas medias por empleado.
21) Una empresa dedicada al cultivo y explotacin de naranjos posee 5 fincas. La produccin de
naranjas y el rendimiento medio por hectrea para cada una de las fincas estn dados en la
siguiente tabla. Calcular el rendimiento medio por hectrea para el total de las 5 fincas.
50
Produccin (Tm) Rendimiento (Tm/Ha)
Finca 1
Finca 2
Finca 3
Finca 4
Finca 5
15
5
20
8
30
9
2
10
4
20
Solucin.
El rendimiento medio por hectrea en el total de la fincas vendr dado por el cociente entre el
total de la produccin y el total de hectreas. Esta ltima cantidad la podemos calcular como
cociente produccin/rendimiento en cada finca:
15 5 20 8 30
15/ 9 5/ 2 20/10 8/ 4 30/ 20
Total produccin
RM
Total hectrea
+ + + +

+ + + +
= 8.07 Tm/hectrea.
Observe que la frmula aplicada coincide con la media armnica de los rendimientos ponderados
por la produccin de cada fila.
22) La primera etapa de un rally consta de 4 tramos cronometrados. En cada uno de los 4 tramos,
un determinado piloto ha alcanzado las siguientes velocidades medias:
Distancia (km) Velocidad media (km/h)
Tramo 1
Tramo 2
Tramo 3
Tramo 4
20
10
15
30
120
70
80
90
Calcular la velocidad media total alcanzada por el piloto en la primera etapa del rally.

Solucin.
La velocidad media total vendr dada por el cociente entre el total de la distancia y el tota del
tiempo:
tan 20 10 15 30
20/120 10/ 70 15/ 80 30/ 90
Total dis cia
VM
Total tiempo
+ + +

+ + +
= 90.32 Km/hora.
Observe que la frmula aplicada vuelve a ser la media armnica, de las velocidades ponderadas
por la distancia de cada tramo.
23) Se tienen tres ciudades A, B y C. La distancia que hay de B a C es el triple de la distancia de
A a B; y la distancia de C a A es el doble de la distancia de B a C. Un automovilista viaja de
A a B a 70 Km/h de B a C a 75 Km/h y de C a A 85 Km/h. Determine el promedio de
velocidad para el viaje completo.
24) En la asignatura de Matemtica Bsica se obtuvo una nota media de 4 puntos y desviacin
estndar 1.8. Se aaden 20 nuevos datos, todos iguales a 4 puntos.
a) Calcular la media total
51
b) Verificar que la varianza total est dada por:
1
2
1
1
20
X
n S
n +
, donde
1
n
es el nmero de
alumnos del primer grupo y
1
2
X
S
representa la varianza del primer grupo de alumnos.
25) Supongamos que se tienen dos variables aleatorias X, Y de las que se conocen los siguientes
datos muestrales:
1
, , ,
x X i i
X S g y kx b
y n tamao de la muestra (k y b son constantes
positivas). Calcular:
a) La media y la desviacin estndar de Y
b) Comparar el coeficiente de asimetra de ambas variables
SOLUCIN: GUIA DE EJERCICIOS N 3
Medidas caractersticas de una distribucin cuantitativa emprica.
1. Por qu no se aplica la media geomtrica cuando uno de los valores es cero? Si la
frmula es G = (
Respuesta: porque si uno de los valores es cero, la multiplicacin de todos ellos dar cero y la
media geomtrica ser cero, que no representa el valor de la media geomtrica, entonces no tiene
sentido aplicar la frmula de la media geomtrica.
2. De un grupo de 100 obreros en una fbrica, 40 trabajan en el da y 60 en la noche. Se sabe
que el salario promedio anual de los 100 obreros es de $ 8700 y que los del turno del da
reciben en promedio $800 menos que los trabajadores nocturnos. Cul es el salario
promedio anual en cada grupo?
Solucin
Datos:
n= 100=
=60, trabajadores de noche.
52
= 8,700
Como tenemos que los trabajadores del turno de da reciben en promedio $800 dlares menos que
los de la noche
Entonces = Ecu. 1
Luego utilizando la frmula de la media ponderada
, luego sustituyendo tenemos

870,000= 100 - 32,000
902,000=100
=
9,020= , salario promedio en el grupo dos
Sustituyendo en Ecu.1 tenemos
=
= 8220, salario promedio en el grupo uno.
3. En un supermercado trabajan 35 mujeres, con un salario promedio mensual de $ 650
dlares y 15 hombres en promedio ganan un 12% ms que las mujeres cul es el salario
promedio de los empleados del supermercado?
Solucin
Datos
53
= 35
=15
Ahora como tenemos dos grupos utilizamos la media ponderada
, sustituyendo
Salario promedio de los empleados del supermercado.
4. Durante un mes se construyeron 134 Km de carretera en la siguiente forma: 3.6% del
total en la primera semana; 15.3% del total en la segunda semana; 7.6% en la tercera
semana; 24.5% en la cuarta semana y en la ltima semana el 49%. La construccin
promedio por da en cada semana fue de: 0.9Km/d, 3.4Km/d, 1.7Km/d, 5Km/d y 10Km/d,
respectivamente. Hallar la medida de tendencia central que mejor represente el promedio
de esta distribucin.
Solucin
La medida de tendencia central que mejor representa el promedio de esta distribucin es la media
armnica.
Construimos la siguiente tabla.
semanas Construccin(km) Construccin promedio(km/d)
1 4.82 0.9
2 20.50 3.4
3 10.18 1.7
4 32.83 5
5 65.66 10
54
Ma=
Ma= = 4.39km/d
5. La media aritmtica de tres nmeros es 7, su mediana es 6, y su media geomtrica es
. Con los tres nmeros calcular la media armnica.
Solucin
Sean: los tres nmeros.
Datos:
= 7
Md=6
Mg=
n=3
Como la mediana es el valor central entonces
Md=
6=
Entonces los nmeros son x1= 3, X2=6 y X3=12
Luego encontrar la media armnica de los tres nmeros
55
= 9.25
6. Se sabe que la media aritmtica de dos nmeros es 5 y la geomtrica es 4. cul es la
media armnica?
Solucin
Sean: los dos nmeros.
Datos:
= 5 Mg=4 n=2
La media aritmtica
, Ecu. 1
Ahora utilicemos la media geomtrica
4= , sustituyendo
16=
+16=0
56
(

Sustituyendo en Ecu 1
Sustituyendo en Ecu 1
Los nmeros son 8 y 2
Luego encontrar la media armnica de los dos nmeros
= 3.2
7. Una persona viaja 4 das. Diariamente recorre 200km, pero maneja el primero y el ultimo
da a 50km/h. cul es la velocidad media durante el viaje?
Solucin
Construimos la siguiente tabla
das Distancia(km) Velocidad media (km/h)
1 200 50
57
2 200 55
3 200 70
4 200 50
Para calcular la velocidad media utilizamos la media armnica
Ma= = 55.19
8. Las ciudades A, B y C son equidistantes entre s. Un automovilista viaja de A a B a
30km/h, de B a C a 40km/h y de C a A a 50km/h. Determinar el promedio de velocidad
para el viaje completo.
Solucin
Utilizamos la media armnica, porque con ella encontramos la velocidad media, y como nos dice
que las ciudades son equidistantes, entonces tenemos
Ma= = = = 38.29
9. Un fabricante dispone $600,000 anuales para la compra de materia prima. Durante tres
aos invierte la misma cantidad de dinero. Si el precio promedio por kg ha aumentado en
los ltimos tres aos sucesivamente de $2,200 a $2,280 y luego a $4,600. Cul es el
precio promedio que ha pagado el fabricante en los tres aos?
Solucin
Utilizar la media geomtrica
Mg=
Sustituyendo los valores tenemos
58
Mg= =3,048.69
10. El primero de mayo de 2002 se ahorraron $50,00 en un banco al 7.6% del inters anual,
capitalizado semestralmente. Obtener la cantidad media depositada en la cuenta, entre el
primero de mayo de 2002 y el 31 de octubre de 2006, suponga que no se hicieron retiros
durante el periodo.
Solucin
Como el problema se refiere a inters se utiliza la media geomtrica
Mg=
Construir la siguiente tabla
Semestres ao capital Ln
1/05-31/10 2,002 50,000 10.82
1/11-31/05 2,002 51,900 10.85
1/05-31/10 2,003 53,872.2 10.89
1/11-31/05 2,003 55,919.34 10.93
1/05-31/10 2,004 58,044.27 10.97
1/11-31/05 2,004 60,249.95 11.01
1/05-31/10 2,005 62,539.44 11.04
1/11-31/05 2,005 64,915.94 11.08
1/05-31/10 2,005 67,382.74 11.12
Total 98.71
Luego sustituir los datos en Mg= , tenemos
Mg= =29.81
59
11. Tres amas de casa fueron a comprar a tres mercados diferentes. Cada una gasto $10
dlares en la compra de naranjas. La ama de casa A compro 4 docenas de naranjas, la ama
de casa B compro 6 docenas de naranjas y la ama de casa C, compro 3 docenas de
naranjas. Cul es el precio promedio por docena?
Solucin
A= B= C= =3.3
Luego utilizamos la media armnica
, sustituyendo los datos tenemos
=2.27, precio promedio por docena
12. el siguiente cuadro muestra la distribucin de renta anual (en miles de dlares) en que
incurren 50 viviendas.
Marca de clase 18.85 21.55 24.25 26.95 29.65 32.35 35.05
N de viviendas 3 2 7 7 11 11 9
A) Halle e intrprete segn el enunciado
i) media, mediana y moda
Para encontrarlas necesito construir la tabla de frecuencias.
Para encontrar la clase utilizo
= 21.55-18.85=2.7
60
Entonces tenemos que las amplitudes de las clases son 2.7
Luego construimos la tabla de frecuencias agrupadas
Clases
17.5-<20.2 18.85 3 3
20.2-<22.9 21.55 2 5
22.9-<25.6 24.25 7 12
25.6-<28.3 26.95 7 19
28.3-<31 29.65 11 30
31-<33.7 32.35 11 41
33.7-<36.4 35.05 9 50
Total n=50
-hallar la media

Sustituyendo los datos tenemos
-hallar la mediana
Md=
Buscar la clase = =25, en las frecuencias acumuladas
Sustituyendo los datos tenemos
61
Md=
-hallar la moda.
Como la moda en los datos agrupados en clases es el valor que ms se repite pero en las
frecuencias simples entonces tenemos dos clases modales (las que tiene color rosado)
Para encontrarlas utilizamos
Md= Md=
Md= =29.95 Md= =32.21
ii) desviacin estndar y coeficiente de variabilidad
-desviacin estndar
Para encontrarla deb primero conocer la varianza y esta viene dada por la siguiente formula
,
Sustituyendo los datos en la formula tenemos
62
Entonces la desviacin estndar es
S=4.62
-coeficiente de variabilidad
Sustituyendo los datos tenemos
La media es representativa porque el coeficiente es muy bajo
b) estime el porcentaje de viviendas con rentas superiores o iguales a 26,000 dlares pero
menores que 32,000 dlares
Es la clase que esta coloreada de amarillo
, es el porcentaje
13) una compaa requiere los servicios de un tecnico especializado. De los expedientes
presentados, se han seleccionado dos candidatos: A y B los cuales renen los requisitos mnimos
requeridos. Para decidir cul de los dos se va a contratar, los miembros del jurado deciden tomar
siete pruebas a cada uno de ellos. Los resultados se dan a continuacin.
63
Pruebas 1 2 3 4 5 6 7
Puntaje obtenido por A 57 55 54 52 62 55 59
Puntaje obtenido por B 80 40 62 72 46 80 40
a) Halle media, mediana y moda de los candidatos
= , media del candidato A
, media del candidato B
- Mediana
Ordenar los datos
A
B
Para encontrar la mediana se busca la posicin
Entonces
55 62
-hallar moda
Como la moda es el valor que ms se repite entonces tenemos
64
55 40
80
Estadsticamente. cul de los dos candidatos debe ser contratado? Fundamente su
respuesta.
Para saber si las medias de los candidatos A y B son representativas como para elegir un
candidato debo encontrar el coeficiente de variabilidad de ambos.
Encontrar desviacin estndar del candidato A
=9.63, varianza del candidato A
Desviacin estndar del candidato A
El coeficiente de variacin de A
, coeficiente de variacin de del candidato A
Encontrar desviacin estndar del candidato B
= varianza del candidato B
, desviacin estndar del candidato B
65
Encontrar el coeficiente de variacin
,
Entonces estadsticamente el candidato que debe de ser contratado es el A, ya que el coeficiente
de variabilidad de este es ms pequeo que el del candidato B, es decir que la media de A es ms
representativa.
14. se toman las medidas de 80 personas las que tiene estatura media de 1.70m y desviacin
estndar de 3.4cm. Posteriormente se verifico que la media usada tena 4 cm de menos.
Rectifique los estadsticos mencionados.
Solucin
Tenemos que =1.70 y como tiene un error de 4cm entonces la nueva media es
=1.64.
Ahora encontrar la varianza,
Por propiedad de la varianza sabemos que si a todos los datos que tenemos le sumamos o le
restamos algo esta no cambia entonces la varianza ser la misma
=3.4
15) una asistencia social desea saber cul es el ndice de natalidad en 2 municipios de san
salvador para ello encuesto a 10 familias de cada municipio obteniendo los siguientes resultados.
A 0 6 1 2 3 1 4 3 6 4
B 3 4 1 4 2 3 1 5 4 3
a) Calcule la media, mediana y moda para cada municipio e interprtelos.
-media
66
= 3, media del municipio A
, media del municipio B
-mediana
Ordenar los datos de los municipios
A
B
Buscar la posicin =5.5, entonces tenemos que
=3
La moda es el valor que ms se repite entonces tenemos que
1 3
3 4
4
6
67
b) Considera Ud. que el distrito B, el nmero de hijos por familia es ms homogneo que en el
distrito A. Para saber cual distrito es ms homogneo encuentro su respectivo coeficiente de
variacin
Encontrar desviacin estndar del municipio A
=3.8, varianza del municipio A
Desviacion estndar del municipio A
El coeficiente de variacin de A
, coeficiente de variacion del municipio A
Encontrar desviacin estndar del municipio B
= varianza del municipio B
, desviacin estndar del municipio B
Encontrar el coeficiente de variacin
,
68
Entonces el municipio ms homogneo es el B.
16) El salario promedio anual en una ciudad es de 8,000 dlares, con una varianza de 1,000
dlares. Cules sern la nueva media y la nueva varianza si se efectan los siguientes cambios?
a) se aumenta 810 dlares a todos
=8000, pero como a cada uno de los trabajadores se les aumenta 810 dlares mas por propiedad
de la media se sabe que si a cada dato se le suma o se le resta una constante entonces esta
constante se le suma o se le resta a la media, entonces tendremos
=8000+810=8,810, esta es la nueva media
Ahora para encontrar la varianza lo hacemos por la propiedad que dice que si a cada uno de los
valores se le suma o resta una constante la varianza no cambia entonces
=1,000,
b) Se aumenta el 15% de su salario a cada trabajador
En lo anterior realizado se puede observar que a cada salario se est multiplicando por una
constante, y por propiedad de la media tenemos que si la media de multiplicar cada uno de los
valores de una variable por una constante es igual a multiplicar la constante por la media.
Entonces la nueva media ser
=8000x1.15=9,200
69
La nueva varianza la encontramos utilizando la propiedad que dice que si todos los datos son
multiplicados por una constante entonces se multiplica la constante al cuadrado por la varianza
entonces tendremos
=1,000x =1322.5
c) Se duplican los sueldos
Utilizando las propiedades del literal c) tendremos que
=8000x2=16,000, esta ser la nueva media
=1,000x =4,000, esta ser la nueva varianza
17) En un examen 20 alumnos del curso A obtienen una media de 60 puntos y desviacin
estndar de 20 puntos. En el curso B los alumnos obtienen una media de 80 y desviacin
estndar de 16. Ante unos reclamos se decide subir en 5% mas 5 puntos adicionales a todos
los alumnos del curso A, en cambio como hubo muchas copias en el curso B se decidi
disminuir la quinta parte de la calificacin. Despus de los mencionados ajustes cul es el
puntaje promedio de los 50 alumnos?
Solucin
Datos
A B
=20 =30
60 80
70
20 16
-encontrar la nueva media y desviacin estndar de los cursos A y B
Para el curso A tenemos
Entonces la nueva media utilizando la propiedad correspondiente ser
60x 1.05+ 5 =68
Y la nueva varianza utilizando la propiedad correspondiente ser
20x = 22.05,
Ahora para el curso B tenemos
Por propiedad de la median tendremos
71
80x = 64
Por propiedad de la varianza tendremos
16x = 10.24,
Ahora encontrar el puntaje promedio de los 50 alumnos
Para ello utilizamos la median pondera.
, luego sustituyendo tenemos
=65.6. Puntaje promedio de los alumnos.
18) se ha realizado un estudio entre 100 mujeres mayores de 15 aos y el nmero de hijos de las
mismas. El resultado ha sido:
0 13
1 20
2 25
3 20
4 11
72
5 7
6 4
N=100
.se pide:
a) Calcular el nmero medio de hijos, la mediana y la moda.
b) La media
=2.33
-mediana
Buscar la posicin
Entonces Md=2
-moda
Como en esta caso el valor que ms se repite es 2, entonces
Mo=2
c) Calcular los cuartiles y el decil 7
-cuartil 1
Buscar la posicin
Entonces =1
-cuartil 2
Buscar la posicin
73
Entonces =2
-cuartil 3
Buscar la posicin 75
Entonces =3
-calcular el decil 7
Buscar la posicin
=3
d) Analizar la dispersin de la distribucin, interpretando los resultados.
Para ello deb calcular el coeficiente de variacin, para encontrarla deb primero conocer la
varianza y esta viene dada por la siguiente formula
Entonces la desviacin estndar es
S=1.59
-coeficiente de variabilidad
Sustituyendo los datos tenemos
74
d) analizar la forma de la distribucin calculando los coeficientes correspondientes, comente su
respuesta.
-calcular el coeficiente de asimetra y este viene dado por
-calcular el coeficiente de curtosis
=2.39
Comente su respuesta
Que es una distribucin platicurtica y asimtrica a la derecha
75
19) la siguiente distribucin expresa el nmero de vehculos vendidos durante un mes por cada
uno de las 50 sucursales que una determinada firma tiene en El Salvador.
1 5
3 12
4 20
6 8
10 5
N=50
.se pide
a) Media aritmtica, mediana y moda.
-media aritmtica
=4.38
-mediana
Buscar la posicin
Entonces Md=4
-moda
Como en esta caso el valor que ms se repite es 4, entonces
Mo=4
Se espera una distribucin aproximadamente simtrica
b) Desviacin tpica, coeficiente de asimetra de Fisher y curtosis. Comente resultados.
-desviacin tpica
76
Entonces la desviacin estndar es
S=2.28
-coeficiente de Fisher
=1.17
-calcular el coeficiente de curtosis
=1
Tiene una distribucin asimtrica a la derecha y platicurtica
20. la siguiente tabal recoge la cifra de ventas (en miles de millones de dlares) de las diez
mayores empresas del sector de automvil durante el ao 1989.
77
empresa ventas Plantilla
Sea 457.3 23.8
Fasa Renault 449.7 19.2
General Motors 372.7 9.4
Ford 356.1 9.5
Citroen 224.6 7.6
Peugeot 198.0 6.7
Nissan 161.1 6.6
Mercedes Benz 110.7 3.4
Enasa 97.3 5.5
a) Calcular las ventas medias y el nmero medio de empleados.
-ventas medias
-nmero medio de empleados
b) donde existe mayor homogeneidad, en las ventas o en la planilla.
Para saberlo deb calcular el coeficiente de variacin
Encontrar desviacin estndar de las ventas
=17,737.70, varianza de las ventas
Desviacin estndar de las ventas
El coeficiente de variacin de las ventas
78
, coeficiente de variacin de las ventas
Encontrar desviacin estndar de los empleados
= varianza de los empleados
, desviacin estndar de los empleados
Encontrar el coeficiente de variacin
,
Entonces existe ms homogeneidad en las ventas.
c) Calcular las ventas media por empleados

Luego lo dividimos entre mil para obtener las ventas medias por empleado

79
21) una empresa dedicada al cultivo y explotacin de naranjas posee 5 fincas. La produccin de
naranjas y el rendimiento medio por hectrea para cada una de las fincas estn dados en la
siguiente tabla. Calcular el rendimiento medio por hectrea par el total de las 5 fincas.
Fincas Produccin( Tm) Rendimiento(Tm/Ha)
1 15 9
2 5 2
3 20 10
4 8 4
5 30 20
El rendimiento medio por hectrea lo encontramos con la media armnica.
, rendimiento medio por hectrea.
22. la primera etapa de un rally consta de 4 tramos cronometrados. En cada uno de los 4 tramos,
un determinado piloto ha alcanzado las siguientes velocidades.
Tramos Distancia(km) Velocidad media(km/h)
1 20 120
2 10 70
3 15 80
4 30 90
.calcular la velocidad media total alcanzada por el piloto en la primera etapa del rally.
80
Captulo 4. Distribuciones Bivariadas
4.1. Distribuciones bidimensionales
Supongamos que en una poblacin, y para un conjunto de n individuos, se miden dos caracteres
X e Y:
1 1 2 2
( , ), ( , ),. . ., ( , )
n n
x y x y x y
En este caso tenemos una variable estadstica bidimensional o distribucin bidimensional de
frecuencias, la cual representaremos por (X, Y). Cuando se cuenta con una gran cantidad de
datos, un modo de presentar la distribucin bidimensional es a travs de una tabla de doble
entrada de la forma:
Tabla de doble entrada
X / Y
1 2
. . . . . .
j k
y y y y Total
1
x
2
x
.
.
.
i
x
.
.
.
l
x
11 12 1 1
. . . . . .
j k
n n n n
21 22 2 2
. . . . . .
j k
n n n n
. . . .
. . . .
. . . .
1 2
. . . . . .
i i ij ik
n n n n
. . . .
. . . .
. . . .
1 2
. . . . . .
l l lj lk
n n n n
1
n
+
+ 2
n
.
.
.
+ i
n
.
.
.
+ l
n
Total
+ + + + 1 2
. . . . . .
j k
n n n n n
Donde los valores de X e Y pueden venir dados en intervalos, al igual que en el caso de una
dimensin. En el caso de que las dos variables sean atributos, la tabla anterior recibe el nombre
de tabla de contingencia.
La representacin grfica ms utilizada en el caso bidimensional es la nube de puntos o diagrama
de dispersin. Consiste en representar cada pareja de datos como un punto sobre unos ejes
cartesianos.
81
4.2. Distribuciones marginales y condicionales.
Dada una variable estadstica bidimensional, las distribuciones marginales permiten estudiar de
un modo aislado cada una de las componentes. A partir de una tabla de doble entrada, las
distribuciones de frecuencias marginales se obtienen sumando las frecuencias de la tabla por filas
y por columnas.
Distribuciones marginales de X e Y.
X
+ i
n Y

+ j
n

1
x
2
x
.
.
.

l
x
1
n
+
+ 2
n
.
.
.

+ l
n
1
y
2
y
.
.
.

k
y
1 +
n
2 +
n
.
.
.
+k
n

Las distribuciones condicionadas permiten estudiar el comportamiento de una de las variables
cuando la otra permanece constante. Vienen dadas por:
Distribuciones condicionadas de X e Y.
X/Y=
j
y
/ i j
n
Y/X=
i
x

/ j i
n

1
x
2
x
.
.
.

l
x
1 j
n
2 j
n
.
.
.

lj
n
1
y
2
y
.
.
.

k
y
1 i
n
2 i
n
.
.
.

ik
n
Ejemplo:
Se desea investigar el ganado caprino (cabras) y el ganado ovino (ovejas) de un pas. En la tabla
de doble entrada adjunta se presentan los resultados de un estudio de 100 explotaciones
ganaderas, seleccionadas aleatoriamente del censo agropecuario. Se proporcionan las frecuencias
conjuntas del nmero de cabezas (en miles) de cabras (X) y ovejas (Y) que poseen las
explotaciones.
X\Y 0 1 2 3 4
0 4 6 9 4 1
1 5 10 7 4 2
2 7 8 5 3 1
3 5 5 3 2 1
4 2 3 2 1 0
a) Hallar las medias, varianzas y desviaciones tpicas marginales.
b) Hallar el nmero medio de cabras condicionado a que en la explotacin hay 2,000 ovejas.
c) Hallar el nmero medio de ovejas que tienen aquellas explotaciones que sabemos que no
tienen cabras.
82
Solucin:
Primero completar la tabla anterior con las distribuciones de frecuencias de X e Y.
X\Y 0 1 2 3 4
+ i
n
0 4 6 9 4 1 24
1 5 10 7 4 2 28
2 7 8 5 3 1 24
3 5 5 3 2 1 16
4 2 3 2 1 0 8
+ j
n 23 32 26 14 5 100
a) La media de X es:
0*24 1*28 2*24 3*16 4*8
100
+ + + +
X = 156/100= 1.56
La varianza de X es:
2 2 2 2 2
2
(0 1.56) *24 (1 1.56) *28 (2 1.56) *24 (3 1.56) *16 (4 1.56) *8
100
+ + + +

X
S = 1.5264
La desviacin tpica (Estndar) es la raz cuadrada positiva de la varianza, es decir:
2

X X
S S =1.2355
Observe que la media muestral es un buen representante de los datos, ya que la desviacin
estndar no es demasiado alta.
Para completar el literal a) debe obtenerse la media, varianza y desviacin estndar para la
variable Y.
b) El nmero medio de ovejas condicionado a que en la explotacin hay 2,000 cabras, se obtiene
manteniendo fija la columna donde la variable Y es igual a 2. Esto es:
( )
0*9 1*7 2*5 3*3 4*2
/ 2
26
+ + + +
X Y = 1.3077
83
c) De forma anloga al literal b) (la media de Y es 1.46)
Ejemplo. Dada la siguiente distribucin de frecuencias conjunta:
84
Construir una tabla de correlacin (doble entrada) y obtener:
Distribuciones marginales de X e Y.
Distribucin de Y condicionado a X=3
Covarianza
Solucin.
La tabla de correlacin pedida y sus distribuciones marginales estn dadas en la siguiente tabla:

La distribucin de Y/X=3
Y/X=3 2 4 6
/ 3 j i
n

1 1 0
Hay que introducir el concepto de covarianza:
85
i
X
i
Y
ij
n
1 2 1
1 6 1
2 2 2
3 2 1
3 4 1
4 2 1
4 4 2
4 6 1
Y/X 1 2 3 4
. j
n
2 1 2 1 1 5
4 0 0 1 2 3
6 1 0 0 1 2
. i
n 2 2 2 4 10=N
Cuando se observa el comportamiento conjunto de dos variables, el objetivo principal es
determinar si existe o no algn tipo de variacin conjunta o covariacin entre ellas. La
covarianza, ayuda a cuantificar la covariacin entre dos variables; as:
Si la Cov(X,Y)>0, existe una tendencia a que mayores observaciones de una de las
variables se correspondan con mayores observaciones de la otra variable.
Si Cov(X,Y)<0, existir una tendencia a que mayores observaciones de una variable se
correspondan con menores observaciones de la otra variable.
Si Cov(X,Y)=0, no se puede concluir que no exista relacin entra ambas variables. Pero
se puede decir que no existe relacin lineal entre las variables.
Matemticamente la covarianza se define como:
( ) ( )
1
( , )
l k
i j ij
i j
XY
x X y Y n
Cov X Y S
N




4.3. Coeficiente de correlacin lineal
Consideremos una variable estadstica bidimensional (X, Y) donde X e Y son de tipo continuo y
suponemos que existe entre ellas algn tipo de relacin, constatable mediante la correspondiente
representacin grfica. Pregunta: Cmo de grande es la relacin entre X e Y y cmo
cuantificarla? El coeficiente de correlacin lineal es un valor que permite estudiar el grado de
dependencia lineal existente entre X e Y. Viene definido por:
1
2
2
1 1
1
( )( )
1 1
( ) ( )
n
i i
XY i
n n
X Y
i i
i i
x x y y
S n
r
S S
x x y y
n n


El trmino
XY
S
se denomina covarianza. Una propiedad importante del coeficiente de
correlacin es que no depende de cambios de origen y escala, y su valor siempre est
comprendido entre -1 y 1:
1 1 r
De modo que valores de r cercanos a 1 indican una dependencia lineal y positiva entre las dos
variables, y valores de r cercanos a -1 indican dependencia lineal negativa. Cuando el valor de r
est cercano a cero, no existe dependencia lineal entre X e Y. Esto ltimo puede ser, bien porque
X e Y son variables independientes, o bien porque la dependencia existente entre ambas variables
es de otro tipo diferente al lineal.
86
4.4. Introduccin al modelos de regresin lineal
Los modelos de regresin lineal constituyen una poderosa herramienta para analizar la relacin
existente entre la pauta de variabilidad de una variable aleatoria y los valores de una o ms
variables (aleatorias o no) de las que la primera depende o puede depender. El modelo
fundamental se esquematiza en la siguiente tabla.
Tabla 1 Datos del problema
Se trata en general de estudiar las posibles relaciones existentes entre la distribucin de j
Y
y los
valores de las ij
X
. A la
Y
se le denomina generalmente la variable dependiente, mientras que
frecuentemente a i
X
se les llama variables independientes o exgenos del modelo, aunque se
prefiere denominarlas variables explicativas.
Los grficos de dispersin son tiles debido a que proporcionan informacin sobre la relacin
existente entre las variables, permiten sugerir modelos posibles, pueden sealar la existencia de
observaciones atpicas, etc.
EJEMPLO 1. Analicemos la relacin que existe entre el peso y la estatura segn el sexo en el
siguiente diagrama de dispersin. 1: Hombres, 2: Mujeres. ESTAPESO.xls
87
Variables a explicar
(aleatoria)
Variables o factores explicativos
(aleatorios o no)
Y
1
X
11
X
i1
.X
In
----
Y
j
X
1i
Xii.X
in
----
Yn X
1n
X
in
.X
nn
Observaciones
Figura1 Diagrama de dispersin ESTATURA-PESO.
El diagrama presenta claramente, una relacin positiva entre las dos variables estudiadas, que se
refleja en una nube de puntos cuyo eje principal tiene un sentido creciente, como consecuencia
del hecho de que, en trminos generales, los individuos ms altos pesan ms que los ms bajos.
El diagrama tambin pone de manifiesto que las mujeres tienen en general valores menores de
ambas variables que los hombres, pero que la relacin entre PESO Y ESTATURA es bastante
similar en ambos sexos.
Covarianza. Coeficiente de Correlacin
88
Con el objetivo de dar una idea intuitiva del concepto de covarianza, razonemos el siguiente
diagrama de dispersin, correspondiente a las variables: TEMPERATURA-COSTO, en la que las
rectas horizontal y vertical sobre el conjunto de puntos corresponden a los valores medios (42.83,
79.25).
En este caso, existe claramente una fuerte relacin negativa, la mayor parte de los puntos caen en
los cuadrantes II Y IV. Cuando la relacin existente sea positiva la mayora de los puntos caern
en los cuadrantes I y III
Si consideramos para cada punto
( )
i i
y x ,
del diagrama el signo que tiene el producto
( )( ) y y x x
i i
vemos que ste resulta positivo en los cuadrantes I y III y negativo en los
cuadrantes II Y IV. Por lo tanto el producto anterior ser en promedio positivo si existe una
relacin creciente entre las dos variables (es decir, si la Y tiende a crecer cuando lo hace la X) y
negativo si la relacin existente es decreciente.
Por definicin la covarianza entre dos variables no es ms que el promedio de los productos de
las desviaciones de ambas variables respecto a sus medias respectivas. De forma similar a como
se procedi a definir la varianza, el promedio se calcula dividiendo por n-1 en vez de n.
( )( )
1
1

n
y y x x
Cov
n
i
i i
xy
.
La covarianza presenta el inconveniente de que depende de las dimensiones en que se expresan
las variables. As la covarianza entre TEMPERATURA y COSTO ser mayor si se mide la
temperatura en grados kelvin que si se mide en Fahrenheit. Para obviar este problema se utiliza
universalmente en Estadstica, como grado de relacin lineal entre dos variables, el coeficiente
de correlacin lineal que no es ms que la covarianza dividida por el producto de las
desviaciones tpicas de las dos variables.
y x
xy
xy
S S
Cov
r
. Se puede demostrar que el coeficiente de
correlacin lineal est siempre comprendido entre -1 y 1. Los valores extremos slo los toma en
el caso de que los puntos del diagrama de dispersin estn alineados exactamente en lnea recta.
89
Cuanto ms estrecho es el grado de relacin lineal existente entre dos variables ms cercano a 1
es el valor de r (o a -1 si la relacin es decreciente). Por el contrario un valor de r nulo o cercano
a cero indicar una relacin lineal inexistente o nula.
OBSERVACIONES
En general cuanto ms estrechamente se agrupen los puntos del diagrama de dispersin
alrededor de una recta ms fuerte es el grado de relacin lineal existente entre las dos
variables consideradas.
Es importante resaltar que tanto la covarianza como el coeficiente de correlacin miden
slo el grado de relacin lineal existente entre dos variables. Dos variables pueden tener
una relacin estrecha y sin embargo resultar r cercano a cero por ser dicha relacin no
lineal.
Es importante del conocimiento no estadstico del problema al momento de hacer
predicciones.
EJERCICIO 1.
Dada una alta inflacin, el seor Chvez ha cuidado mucho de su presupuesto. Como su casa
tiene calefaccin elctrica, llev un registro de la cuenta del consumo mensual de energa
elctrica durante el ao pasado y del promedio mensual de la temperatura exterior. Los datos
aparecen en la siguiente tabla. La temperatura est dada en grados Celsius y el costo de la energa
est en dlares. TEMPERACOSTO.xls.
Tabla2. Registro mensual: TEMPERATURA-COSTO.
Mes
Temperatura
Promedio
costo de
energa
Enero 10 120
Febrero 18 90
Marzo 35 118
Abril 39 60
Mayo 50 81
Junio 65 64
Julio 75 26
Agosto 84 38
Septiembre 52 50
Octubre 40 80
Noviembre 25 100
Diciembre 21 124
Identificar las variables, dependiente y explicativa. Hacer sus conjeturas de la relacin entre las
variables a partir del siguiente grfico y calcular la xy
Cov
y xy
r
.
90
Figura 2. Diagrama de dispersin TEMPERATURA- COSTO.
Correlations
TEMPERATURA COSTO
TEMPERATURA Pearson Correlation 1 -.863
**
Sig. (2-tailed) .000
Sum of Squares and Cross-products 5929.667 -7188.500
Covariance 539.061 -653.500
N 12 12
COSTO Pearson Correlation -.863
**
1
Sig. (2-tailed) .000
Sum of Squares and Cross-products -7188.500 11710.250
Covariance -653.500 1064.568
N 12 12
**. Correlation is significant at the 0.01 level (2-tailed).
RUTA:Analyze>Correlate>Bivariate (En variables trasladar TEMPERATURA,
COSTO)>Opciones (Seleccionar los estadsticos, Exclude cases pairwise)>Continue>Ok
91
Descriptive Statistics
Mean Std. Deviation N
TEMPERATURA 42.83 23.218 12
COSTO 79.25 32.628 12
4.5. Modelo de regresin simple.
En este tipo de regresin se desea caracterizar el efecto lineal de una nica variable explicativa
sobre la variable respuesta. Los pasos para efectuar un anlisis son los siguientes (JURAN y
GRYNA, 1997, cap. 23):
1. Representacin grfica de datos
2. Planteamiento del modelo
3. Estimacin de la ecuacin de prediccin
4. Examen de la adecuacin del modelo lineal
5. Intervalos de confianza para la estimacin
En este apartado se explica el modelo de regresin lineal simple, un modelo con un solo regresor
x que tiene una relacin con una respuesta y, donde la relacin es una lnea recta. Este modelo de
regresin lineal simple es:
+ + x y
o 1 (Modelo poblacional de regresin)
Donde la ordenada al origen o

y la pendiente
1
son constantes desconocidas, y

es una
componente aleatorio del error. Se supone que los errores tienen promedio cero y varianza
2

desconocida. Adems se suele suponer que los errores no estn correlacionados. Esto quiere decir
que el valor de un error no depende del valor de cualquier otro error.
4.5.1. Estimacin de los parmetros por mnimos cuadrados
Los parmetros
o

y
1
son desconocidos, y se debe estimar con los datos de la muestra.
Supongamos que hay n pares de datos:
( ) ( ) ( )
n n
y x y x y x , , , , , ,
2 2 1 1

. Estos datos pueden
obtenerse en un experimento controlado, diseado en forma especifica para recolectarlos, o en un
estudio observacional, o a partir de registros histricos existentes (lo que se llama un estudio
retrospectivo).
Estimacin de o

y
1

Para estimar o

y
1
se utiliza el mtodo de mnimos cuadrados. Esto es, se estima o

y
1

tales que la suma de los cuadrados de las diferencias entre las observaciones i
y
y la lnea recta
sea mnima. La ecuacin se puede escribir i i o i
x y + +
1
n i ,..., 2 , 1
(Modelo muestral de
regresin), escritos en trminos de los n pares de datos
( )
i i
x y ,
,
n i ,..., 2 , 1
. As el criterio de
mnimos cuadrados es:
92
( ) ( )


n
i
i i
x y S
1
2
1 0 1 0
,
. Los estimadores por mnimos cuadrados de o

y
1
, que se
designarn por
0

y
1

, deben satisfacer

,
_


n
i
i i
x y
S
1
,
0
0
1 0
2
1 0

,
_


n
i
i i i
x x y
S
1
,
1
0
1 0
2
1 0


Simplificando estas dos ecuaciones se obtiene:



+
n
i
n
i
i i
y x n
1 1
1 0

;



+
n
i
i
n
i
n
i
i i i
x
y x x
1
1 1
2
1 0

Que son las llamadas ecuaciones normales de mnimos cuadrados. Su solucin es la siguiente:
x y
1 0



;

,
_

,
_

,
_

n
i
n
i
i
i
n
i
n
i
i
n
i
i
i i
n
x
n
x y
x y
x
1
2
1
2
1
1 1
1
, en donde

n
i
i
y
n
y
1
1

n
i
i
x
n
x
1
1
son
los promedios de
i i
x y y
respectivamente. Por consiguiente,
1 0


y
, son los estimadores
por mnimos cuadrados. El modelo ajustado de regresin lineal simple es entonces:
x
y
1 0


+
.Esta ecuacin produce un estimado puntual, de la media de y para una
determinada x.
Otra forma ms compacta de escribir
xx
xy
S
S

, donde:
( ) ( )






,
_

,
_

,
_


n
i
i i
n
i
n
i
i
n
i
i
i i xy
n
i
i
n
i
n
i
i
i
xx
x x y
n
x y
x y S x x
n
x
S
x
1 1
1 1
1
2
1
2
1
2
;
La diferencia entre el valor observado i
y
y el valor ajustado correspondiente
i
y

se llama
residual, matemticamente el
i-simo residual es:
n i x y y y e
i i i i i
,.... 2 , 1
1 0

,
_

+


.
93
i
e
Tiene un papel importante para investigar la adecuacin del modelo de regresin ajustado.
4.5.2. Propiedades de los estimadores por mnimos cuadrados y el
modelo ajustado de regresin.
Tenemos que:
x y
1 0



( )
xx
n
i
i i
S
x x y
xx
xy
S
S

1
1

Son combinaciones lineales de i


y
, entonces se puede escribir,
1
1
E

_

,

( )
i
x
i
y E
1 0
+
0
0
E


,
;
2
1
xx
Var
s


,

2
2
0
1
xx
x
Var
n s

_
_
+


,
,
Propiedades tiles
1.
0
1 1

,
_

n
i
i
n
i
i i
e y y
2.

n
i
n
i
i i
y y
1 1
3. La lnea de regresin de mnimos cuadrados siempre pasa por el centroide de los datos
que es el punto ( ) x y,
4.

n
i
i i
e x
1
0
5.

n
i
i i
e y
1
0
94
Estimacin de
2

Adems de estimar 1 0
y
, se requiere estimar
2

. Se obtiene de la suma de cuadrados


residuales, o suma de cuadrados del error.
( ) ( )( ) ( )
( )
xy
n
i
i s
xy xy
n
i
i
xy
n
i
i
n
i
i
n
i
i i
n
i
i
xy
n
i
i
n
i
i
n
i
i i
n
i
i
xx
xx
xx
n
i
i
n
i
i
n
i
i
n
i
i
n
i
n
i
i
n
i
i i i
n
i
i
n
i
i n
i
i
xx
n
i
n
i
i
n
i
n
i
i i i
n
i
i i
n
i
n
i
i i i
n
i
i
n
i
i i
n
i
i i
n
i
i i
n
i
i s
S y n y SC
S S y n y
S y x
n
y x y n y
S y x
n
y x y n y n y
s
s
s
y
n
x
n
n x y
n
y x
n
y x y n
n
y
n
y
n y
s y x y x x y y x y y y y
x x x x y y y y
x x y y
x y
y y
e SC


+
+
1
]
1


+ + +
+ +
+ +
+ + + +
+

,
_

,
_

,
_

1
2
1
2
Re
1 1
2
1
2
1
1 1 1
1
2
1
2
1
1 1
1
1
1
2 2
1
2
1
1 1
1
1 1
1
1 1 1
1 1
2
1 1
1
2
2
1
1
1
1
1
1 1
1 1
1
2
2
1 1
2
2
1 1
1
2
1
2
1 1
1
2
1 0
1
2
1
2
Re
2
1
2
1
2 2 2
. .
1 1
2
1
2
1
2 2 2
2 2 2 2 2
2










Pero ( ) SCT y n y y y
n
i
i
n
i
i



2
1
2
1
2
xy s
S SCT SC


1 Re

( ) ( )
2
Re
2 n SC E
s
95
La suma de cuadrados residuales tiene n-2 grados de libertad, porque 2 grados de libertas se
asocial con los estimados
0

y
1

que se usan para obtener


i
y

. El estimador insesgado de
2
es:

s
s
CM
n
SC
Re
Re
2
2

(Cuadrado Medio Residual)



:
2

Error estndar de regresin.


2

Es un estimado de
2
dependiente del modelo.
4.5.3. Intervalos de confianza
Intervalos de confianza de
0 1
y
. Si los errores se distribuyen en forma normal e
independiente, entonces la distribucin de muestreo tanto de

,
_

1
1 1


Se
y

,
_

0
0 0


Se
es t con n-2
grados de libertad.
Un intervalo de confianza de
( )% 1 100
para
1
es:

,
_

+
,
_

1 2 , 2 1 1 1 2 , 2 1


Se t Se t
n n
Un intervalo de confianza de
( )% 1 100
para
0

es:

,
_

+
,
_

0 2 , 2 0 0 0 2 , 2 0


Se t Se t
n n
Estimacin de intervalos de la respuesta media.
Una aplicacin importante de un modelo de regresin es estimar la respuesta media,
( ) y E
, para
determinado valor de la variable regresora x.
Sea 0
x
el valor o nivel de la variable regresora para el que se desea estimar la respuesta media,
es decir,
,
_

0
x
y
E
. Se supone que 0
x
es cualquier valor de la variable regresora dentro del
intervalo de los datos originales de x que se usaron para ajustar el modelo.
Un estimador insesgado de
,
_

0
x
y
E
se determina a partir del modelo ajustado como sigue:
0 1 0
0
0
x
x
y
E
x y

,
_


96
Para obtener un intervalo de confianza de
( )% 1 100
para
,
_

0
x
y
E
, se debe notar primero que

0
x y

es una variable aleatoria normalmente distribuida, porque es una combinacin lineal de las
observaciones
i
y
. La varianza de

0
x y

es:
( )
0
2
0
2
1
y x
xx
x x
Var
n S

_
1
+

1
,
1
]
La distribucin de muestreo de:
( )
( )
0
/ 0
2
0
/
1
Re
y x
xx
E y x
x x
CM s
n S


+


,
es una distribucin t, con n-2 grados
de libertad.
Un intervalo de confianza de
( )% 1 100
para la respuesta media en el punto 0
x x
es:
( ) ( )

,
_


+ +

,
_

,
_

xx
n
x y
xx
n
x y
S
x x
n
s CM t
x
y
E
S
x x
n
s CM t
2
0
2 ,
2 0
2
0
2 ,
2
1
Re .
1
Re .
0 0


Ntese que el ancho del intervalo de confianza para
,
_

0
x
y
E
es una funcin de 0
x
. El ancho del
intervalo es mnimo para
x x
0
, y crece a medida que aumenta
x x
0 .
Las mejores estimaciones de y se hacen con valores de x cerca del centro de los datos.
4.5.4. Prueba de hiptesis de la pendiente y de la ordenada al origen.
Uso de la prueba t
Supongamos que deseamos probar que la pendiente es igual a una constante.
10 1 1
10 1 0
:
:

H
H
( )
2
, 0 NID son e
i

Es una combinacin lineal de las observaciones, y est distribuida normalmente.


1 1

,
_

E
(Promedio de
1
);
xx
S
Var
2
1

,
_


(Varianza de
1
)
97
Estadstico t (Definicin)
Dentese a
xx
s
S
CM
Se
Re
1

,
_

: Como el error estndar estimado o error estndar de la pendiente,


entonces

,
_

1
10 1
0


Se
t
. Se rechaza la hiptesis nula si 2 2 0
,

>
n
t t
.
Hiptesis para la ordenada al origen.
00 0 1
00 0 0
:
:

H
H
;

,
_

,
_


0
00 0
2
Re
00 0
0
1

Se
S
x
n
CM
t
xx
s

,
_

,
_


xx
s
S
x
n
CM Se
2
Re 0
1

Error estndar de la ordenada al origen.


Se rechaza la hiptesis nula s 2 2 0
,

>
n
t t
.
Nota: El que una variable no sea significativa no quiere decir que en realidad no lo es, es
necesario el conocimiento no estadstico del problema para determinar por ejemplo si los
intervalos de los datos fue el adecuado.
Prueba de significancia de la regresin (Caso particular del test anterior: la conste es igual
a cero).
0 :
0 :
1 1
1 0

H
H
El no rechazar
0 :
1 0
H
implica que no hay relacin lineal entre x e y.
X tiene muy poco valor para explicar la variacin de Y, por lo tanto el mejor estimador para
cualquier x es
y y

La verdadera relacin entre x e y no es lineal


Si se rechaza
0 :
1 0
H
, explica que x tiene valor para explicar la variabilidad de y. Rechazar
0 :
1 0
H
podra equivaler a que:
El modelo de lnea recta es adecuado
98
Aunque hay un efecto lineal en x se podran obtener mejores resultados agregando trminos
polinomiales en x.
El procedimiento de prueba para
0 :
1 0
H
se puede establecer con dos mtodos.
4.6. Prediccin de nuevas observaciones
Una aplicacin importante del modelo de regresin es predecir nuevas observaciones y que
correspondan a un nivel especificado de la variable regresora x. Si 0
x
es el valor de inters de la
variable regresora, entonces:
0 1 0 0
x y

+
es un estimador puntual del nuevo valor de la
respuesta 0
y
.
Una aplicacin importante del modelo de regresin es predecir nuevas observaciones y que
correspondan a un nivel especificado de la variable regresora x. Si 0
x
es el valor de inters de la
variable regresora, entonces:
0 1 0 0
x y

+
es un estimador puntual del nuevo valor de la
respuesta 0
y
.
A continuacin se obtendr un estimado del intervalo para esta observacin futura
0
y
.
Sea


0 0
y y
, con distribucin normal con media cero y varianza.
( ) ( )
( )
( )
( )
( )
1
1
]
1


+ +
1
1
]
1


+ +

,
_

+ +

,
_

,
_

,
_




xx
xx
S
x x
n
Var
S
x x
n
x Var y Var
y y Cov y Var y Var y y Var Var
2
0 2
2
0 2 2
0 1 0 0
0 0 0 0 0 0
1
1
1
, 2


El resultado de prediccin de
( )% 1 100
de confianza para una observacin futura en
0
x
es:
( )

,
_


+ + t

xx
n
S
x x
n
s CM t y
2
0
2 ,
2
0
1
1 Re .

99
Lo anteriormente expuesto se puede observar en el siguiente grfico que muestra las bandas de
confianza y de prediccin para un conjunto de datos.
El intervalo de prediccin en
0
x
siempre es ms ancho que el intervalo de confianza en
0
x
,
porque el intervalo de prediccin depende tanto del error del modelo ajustado como el error
asociado con observaciones futuras.
Coeficiente de determinacin.
La cantidad
SCT
s SC
SCT
SCR
R
Re
1
2

. Se llama coeficiente de determinacin.
Y su valor esperado:
( )
2 2
1
2
1 2

xx
xx
S
S
R E
( )
2
1

n
i
i
y y SCT : es una medida de variabilidad de y sin considerar el efecto de la variable
regresora x.
2
1
Re
,
_

n
i
i i
y y s SC : es una medida de variabilidad de y que queda despus de haber tenido en
consideracin a x.
2
R
: Proporcin de la variacin explicada por el regresor x.
Ya que
1 0 ; 1 0 : 0
2
R
SCT
SCR
SCT SCR
.
Regresin por el origen
EL modelo sin ordenada al origen es:
+ x y
1
. Dadas las n observaciones
( ) n i y x
i i
,... 2 , 1 , ,
, la funcin de mnimos cuadrados es:
( ) ( )


n
i
i i
x y S
1
2
1 1

100
Siguiendo el proceso por mnimos cuadrados:

n
i
i
n
i
i i
x
x y
1
2
1
1

EL modelo de regresin ajustado es:


x y

.
El estimador de
2
es:
1 1
Re
1 1
1
2
1
2
2

,
_

n
x y y
n
y y
s CM
n
i
n
i
i i i
n
i
i i

Los intervalos de confianza son:


t
n
i
i
x
s CM
n t
1
2
2
1 1
Re
1 , :

,
_

n
i
i
x
y
x
s CM x
n t
x
y
E
1
2
2
0
2 0
Re .
1 , :
0

Para una observacin futura:

,
_

+ t

n
i
i
x
x
s CM n t y
1
2
2
0
2
0
1 Re 1 ,

Modelo con ordenada al origen


( )

,
_

n
i
i
n
i
i
y y
y y
R
1
2
1
2
2
Modelo sin ordenada al origen:

n
i
i
n
i
i
y
y
R
1
2
1
2
2
A veces, el diagrama de dispersin proporciona una gua para decidir si se ajusta o no el modelo
sin ordenada al origen. Tambin, se pueden ajustar ambos modelos y escoger entre ellos de
acuerdo con la calidad del ajuste obtenido. Si no se puede rechazar la hiptesis
0
0

en el
modelo sin ordenada al origen, quiere decir que se puede mejorar el ajuste si se usa es modelo.
El cuadrado medio de residuales es una forma til de comparar la calidad del ajuste. El modelo
que tenga el cuadrado medio residual menor, es el mejor ajuste.
En general,
2
R
no es un buen estadstico para comparar los dos modelos.
101
El resultado de prediccin de
( )% 1 100
de confianza para una observacin futura en 0
x
es:
( )

,
_


+ + t

xx
n
S
x x
n
s CM t y
2
0
2 ,
2
0
1
1 Re .

El intervalo de prediccin en 0
x
siempre es ms ancho que el intervalo de confianza en 0
x
,
porque el intervalo de prediccin depende tanto del error del modelo ajustado como el error
asociado con observaciones futuras.
Coeficiente de determinacin.
La cantidad
SCT
s SC
SCT
SCR
R
Re
1
2

. Se llama coeficiente de determinacin.
Y su valor esperado:
( )
2 2
1
2
1 2

xx
xx
S
S
R E
( )
2
1

n
i
i
y y SCT : es una medida de variabilidad de y sin considerar el efecto de la variable
regresora x.
2
1
Re
,
_

n
i
i i
y y s SC : es una medida de variabilidad de y que queda despus de haber tenido en
consideracin a x.
2
R
: Proporcin de la variacin explicada por el regresor x.
Ya que
1 0 ; 1 0 : 0
2
R
SCT
SCR
SCT SCR
.
4.7. Transformaciones para linealizar un modelo.
A partir de un diagrama de dispersin o de la teora sobre ciertas funciones, podemos conocer que
la relacin entre las dos variables puede representarse adecuadamente solo por cierta funcin
matemtica curvilnea (no lineal), por ejemplo la tendencia general del crecimiento poblacional
sigue un modelo exponencial positivo, el decaimiento radioactivo sigue un modelo exponencial
negativo, etc. En algunos casos una funcin no lineal se puede lineal izar con una transformacin
adecuada.
Funcin linealizable Transformacin Forma lineal
1
0

x y x x y y log , log x y +
1 0
log
x
e y
1
0

y y ln x y
1 0
ln +
102
x y log
1 0
+ x x log x y +
1 0

1 0

x
x
y
x
x
y
y
1
,
1

x y
1 0

EJEMPLO. Los datos siguientes se obtuvieron de observaciones peridicas hechas durante el
crecimiento de una poblacin de clulas de levadura. Se efectuaron recuentos cada dos horas.
El grfico de dispersin muestra que los datos provienen de una funcin exponencial
x
e y
1
0


Con el fin de transformar la curva en recta conviene hacer la transformacin,
y y ln
tomamos
los logaritmos de las clulas.: RUTA: Transform>Compute Variable (LOGNATURAL)>
103
n Horas
(X)
Nmero
de clulas(Y)
1 2 19
2 4 37
3 6 72
4 8 142
5 10 295
6 12 584
7 14 995
n Horas
(X)
Nmero de
clulas (Y)
Ln (Y)
1 2 19 2.944439
2 4 37 3.610918
3 6 72 4.276666
4 8 142 4.955827
5 10 295 5.686975
6 12 584 6.369901
7 14 995 6.902743
Seguidamente se verifica por medio de un grfico de dispersin si la transformacin es adecuada
RUTA:Graphs>Legacy Dialogs>Simple Scatter>Define (Y: LOGNATURAL;X: Horas>
Como se esperaba, hoy los datos se ajustan a una lnea recta. El proceso manual para obtener la
ecuacin de prediccin es el mismo que el de regresin simple. En SPSS se obtiene siguiendo la
RUTA: Analyze>Regression> Linear (Dependent: LOGNATURAL, Independent: Horas>Ok
104
ANOVA
b
Model
Sum of
Squares Df Mean Square F Sig.
1 Regression 12.627 1 12.627 4936.297 .000
a
Residual .013 5 .003
Total 12.640 6
a. Predictors: (Constant), Horas
b. Dependent Variable: LOGNATURAL
Coefficients
a
Model
Unstandardized
Coefficients
Standardized
Coefficients
t
Sig
.
95% Confidence Interval
for B
B Std. Error Beta
Lower
Bound
Upper
Bound
1 (Consta
nt) 2.278 .043
53.28
7
.
00
0
2.168 2.388
Horas
.336 .005 .999
70.25
9
.
00
0
.323 .348
a. Dependent Variable:
LOGNATURAL
El modelo lineal encontrado es entonces:
Horas y . 336 . 0 278 . 2 +
. Para determinar el modelo
ajustado a los datos originales, se debe considerar la transformacin
y y ln
y su modelo lineal:
x y
1 0
ln +
. Resolviendo:
278 . 2 ln
0

, entonces
757 . 9
0

.
Finalmente, el modelo ajustado es:
Horas
e y
. 336 . 0
757 . 9 .
Las pruebas de idoneidad para el modelo se discutirn posteriormente.
105
En el anlisis, ste caso se conoce el orden en que fueron recolectados los datos, y debe hacerse
para determinar si hay dependencia de los residuos con la secuencia del tiempo de recoleccin
Para realizar una regresin no lineal mediante SPSS tenemos que elegir los mens
Analize>Regression>Curve Estimation.
Este men nos da la opcin de calcular los siguientes modelos de regresin.
Lineal,
X Y
1 0
+
Logartmica,
X Y ln
1 0
+
Inversa
X
Y
1
0

+
Cuadrtico
2
2 1 0
X X Y + +
Cubico.
3
3
2
2 1 0
X X X Y + + +
Potencia.
1
0

X Y o
X Y ln ln ln
1 0
+
Compuesto
X
Y
1 0
o 1 0
ln ln ln X Y +
Curva S
t
e Y
1 0

+ o
t
Y
1
0
ln

+
Crecimiento
X
e Y
1 0
+

o
X Y
1 0
ln +
Exponencial
X
e Y
1
0

o
X Y
1 0
ln ln +
106
Para el caso anterior, elegimos exponencial, y los resultados son los siguientes:
Model Summary
R R Square
Adjusted R
Square
Std. Error of
the Estimate
.999 .999 .999 .051
The independent variable is Horas.
ANOVA
Sum of
Squares df Mean Square F Sig.
Regression 12.627 1 12.627 4936.297 .000
Residual .013 5 .003
Total 12.640 6
The independent variable is Horas.
Coefficients
Unstandardized
Coefficients
Standardized
Coefficients
t Sig. B Std. Error Beta
Horas .336 .005 .999 70.259 .000
(Constant) 9.755 .417 23.394 .000
The dependent variable is ln(clulas).
4.7. Ejercicios.
1. Determine una ecuacin que describa la relacin entre la frecuencia de
accidentes y el nivel de educacin preventiva
X Y XY X
2
150 8.00 1200 22500
200 7.00 1400 40000
107
300 6.50 1950 90000
450 5.20 2340 202500
500 6.40 3200 250000
600 4.40 2640 360000
800 4.00 3200 640000
900 3.10 2790 810000
3900 44.60 18720 241500
2. Una compaa que tiene 15 tiendas ha recopilado datos en relacin con
los metros cuadrados de rea de ventas respecto a los ingresos
mensuales. Trace una grfica de los datos, y si parece apropiado un
modelo lineal determine la ecuacin de regresin.
108
Tienda Metros
2
Ingreso
X Y XY X
2
a 55 45 2475 3025
o 80 60 4800 6400
j 85 75 6375 7225
e 90 75 6750 8100
k 90 80 7200 8100
d 110 95 10450 12100
n 130 95 12350 16900
g 140 110 15400 19600
c 180 120 21600 32400
l 180 105 18900 32400
b 200 115 23000 40000
i 200 130 26000 40000
h 215 140 30100 46225
f 260 170 44200 67600
m 300 200 60000 90000
15 2315 1615 289600 430075
3. Determine una ecuacin predictiva para calcular el monto del seguro, en
funcin del ingreso anual para los siguientes datos:
Ingres
o
Prim
a
X Y XY X
2
13 5 65 169
16 15 240 256
17 20 340 289
18 10 180 324
20 10 200 400
25 12 300 625
26 15 390 676
32 30 960 1024
38 40
152
0 1444
40 50
200
0 1600
42 40
168
0 1764
287 247
787
5
857
1
4. De una distribucin de dos variables se conocen los siguientes datos:
r = 0.9; Sx = 1.2; Sy = 2.1;
5; 10 X Y
. A partir de los
mismos, obtnganse las rectas de regresin mnimo
cuadrticas de X sobre Y y de Y sobre X. (30%)
5. Para un mismo grupo de observaciones de las variables X e Y, se han
obtenido las dos rectas de regresin siguientes:
3x + 2y = 26
6x + 2y = 32
a) Obtener las medias de X e Y.
b) Obtener el coeficiente de correlacin lineal.
109
6. En una distribucin bidimensional
( , )
i i
x y
se sabe que: Los valores de la variable X son (1, 2,
3, 4 y 5); la recta de regresin de Y sobre X
( 3 8 0) x y +
y el coeficiente de correlacin
lineal (r=0.8). Hallar:
a) La media y la varianza de X
b) Los valores estimados de
0 1
y
de la recta de regresin de Y sobre X.
c) La covarianza
d) La media y la varianza de Y.
7. En un estudio donde se investig la relacin que existe entre la temperatura de la superficie
de una carretera (X, medida en grados Fahrenheit) y la deformacin del pavimento (Y). El
resumen de cantidades es la siguiente: n=20,
20
1
12
i
i
y

,
20 20 20 20
2 2
1 1 1 1
8, 1470; 143215 1083
i i i i i
i i i i
y x x y x y



.
a) Calcular las estimaciones de mnimos cuadrados de la pendiente y la ordenada al
origen.
b) Qu cambio se espera en la deformacin del pavimento cuando la temperatura de la
superficie cambia 1F?
c) Suponga que la temperatura se mide en grados centgrados (C), en lugar de F.
Escriba el nuevo modelo de regresin. (Recuerde que F= (9/5) C+32).
8. A partir de un conjunto de valores de las variables X e Y, se ha determinado la
regresin de Y sobre X, obtenindose la siguiente recta:
$
10 0.45 y x + , r=0.95;
20 x
Se pide que, a partir de la definicin de la anterior recta, determine los
parmetros de la recta de regresin de X sobre Y.
110
Captulo 5. Los Valores Relativos
5.1. Razones, Proporciones, Porcentajes y Tasas.
Razn: Es una fraccin donde el valor considerado en el numerador no debe estar incluida en el
denominador, en consecuencia la razn puede ser un nmero superior o inferior a la unidad.
Ejemplo: Supongamos que el nmero de personas que visitan un centro comercial, en un da
cualquiera es 7,000, de las cuales 4,200 son mujeres y 2,800 son hombres. Obtener la razn de
mujeres respecto a los hombres.
Solucin:
La razn o relacin = 4200/2800 = 1.5, indica que las mujeres frecuentan ese centro comercial en
un 50% ms que los hombres.
Proporciones:
Las proporciones se hacen para dar cuenta de la fraccin que representa cada uno de los
subconjuntos que componen el conjunto total. Por ejemplo, los subconjuntos formados por nios,
jvenes, adultos, y ancianos si, respectivamente, los comparamos con la totalidad del conjunto
daremos cuenta de la proporcin respectiva de cada uno de los subconjuntos. Si en una localidad
viven 2,000 nios, 3,000 jvenes, 1,000 adultos y 300 ancianos, la totalidad de la poblacin
sumaran 6,300 habitantes, y las proporciones de nios sera 0.31, de jvenes 0.47, de adultos
0.15 y de ancianos 0.04.
Ejemplo: La poblacin del municipio de Soyapango distribuida por rango de edades se
presenta en el siguiente cuadro.
Rango de edades
Sexo
Total
Hombre Mujer
Edad de 0 a 10 aos 25,097 23,858 48,955
Edad de 11 a 15 aos 12,849 12,490 25,339
Edad de 16 a 20 aos 11,384 11,810 23,194
Edad de 21 a 30 aos 19,587 23,372 42,959
Edad de 31 a 45 aos 21,264 28,725 49,989
Edad de 46 a 65 aos 16,219 21,645 37,864
Edad de 66 aos ms 4,834 8,269 13,103
Total 111,234 130,169 241,403
Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.
Obtener la proporcin que representa cada grupo de edades.
NOTA: Cuando el valor del numerador est incluido en el denominador se
establece una proporcin.
Porcentajes:
111
Los porcentajes se hacen para expresar las proporciones en base 100. En el ejemplo anterior, los
nios representan el 31%, los jvenes el 47%, los adultos el 15% y los ancianos 4%.
Ejemplo: En el censo de poblacin de El Salvador, 2007, se encuentra que en el Municipio de
Mejicanos, tiene los siguientes sobre la condicin laboral, para la poblacin mayor de 10 aos.
NOMBRE DEL
LUGAR

CONDICION LABORAL

Total
Poblacin
ocupada
Poblacin que busca
trabajo
Inactiv
os
Zona Urbana 54295 5894 46288
10647
7
CANTN
CHANCALA 286 52 335 673
CANTN SAN
MIGUEL 467 32 478 977
CANTN SAN
ROQUE 3739 494 3991 8224
Total 58787 6472 51092
11635
1
Obtener la proporcin de la poblacin segn condicin de laboral por cantn y municipio.
Tasas:
Las tasas se hacen cuando el conjunto se fracciona en dos subconjuntos y se quiere dar cuenta de
la parte que representa uno de los subconjuntos sobre el total del conjunto. Esta representacin se
suele expresar en base 100, pero se pude hacer en base 10, 1000, etc. Por ejemplo, si el conjunto
de la poblacin activa se divide en dos subconjuntos denominados desempleados y ocupados, la
tasa de desempleo sera el resultado de multiplicar por cien el nmero resultante de dividir el
nmero de desempleados por el total de activos (ocupados y desocupados). Si de las 4,000
personas activas que hay en una localidad, 3,600 estn ocupadas y 400 estn desempleadas, la
tasa de desempleo sera (400/ 4,000) X 100= 10%.
Ejemplo: En el censo de poblacin de El Salvador, 2007, se encuentra que en el Municipio de
Mejicanos, tiene los siguientes datos de analfabetismo, para la poblacin mayor de 5 aos.
LUGARES

Sabe leer y
escribir


Total Si No
Zona Urbana 109205 8872 118077
CANTN
CHANCALA 672 123 795
CANTN SAN
MIGUEL 916 221 1137
CANTN SAN
ROQUE 8027 1343 9370
112
Total 118820 10559 129379
Obtener la tasa de analfabetismo por cantn y municipio.
Ejercicio.
La poblacin de 15 aos o ms segn su condicin de analfabetismo se presenta en el siguiente
cuadro.
Sexo
Sabe leer y escribir
Total
Si No
Soyapango 161,155 10,801 171,956
Ilopango 66,240 5,420 71,660
San Martn 43,033 5,376 48,409
Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007
Obtener las tasas de analfabetismo de cada municipio y hacer un anlisis comparativo de los
resultados.
5.2. Diferencia Relativa
La diferencia relativa se calcula como el cociente entre la diferencia de dos cantidades, precio
absoluto y la cantidad, precio o valor del periodo de referencia. Supongamos que
i
X
es una
magnitud simple, representamos por
0 i
X
el valor de la magnitud en el periodo base y por
it
X
el valor de la magnitud en el periodo que queremos estudiar entonces:
La diferencia relativa est dada por:
0 0
0
( ) *100
it i
t
i
X X
DF i
X

Ejemplo:
El siguiente cuadro presenta el nmero de homicidios para los aos 2004, 2005, 2006, 2007 y
2008, para los municipios de Soyapango, Ilopango y San Martn.
Grupos
de
edades
SOYAPANGO ILOPANGO SAN MARTN
Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total
AO 2004
Total 15 167 182 12 78 90 11 42 53
AO 2005
Total 14 228 242 5 74 79 11 75 86
AO 2006
Total 16 246 262 15 69 84 6 48 54
AO 2007
Total 20 179 199 10 67 77 8 71 79
113
Grupos
de
edades
SOYAPANGO ILOPANGO SAN MARTN
Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total
AO 2008
Total 10 128 138 9 66 75 7 54 61
Fuente: Fuente estadsticas de homicidios de Instituto de Medicina Legal. Los cadveres que no se pudo identificar
el sexo, no aparecen registrados en el cuadro anterior.
Obtener la diferencia relativa del nmero de homicidios por ao, sexo y municipio.
5.3. Los nmeros ndices
El nmero ndice es una cifra relativa, expresada en trminos porcentuales o al tanto por uno,
que sirve para indicar las variaciones que sufre una variable con respecto a un valor de la misma,
la cual es tomada como punto de referencia, denominada base.
Es evidente que los ndices no miden, tan solo sirven para indicar las variaciones en los precios,
cantidades y valores de un periodo con respecto a otro.
Definicin: Un ndice es una medida estadstica que tiene la propiedad de informar de los cambios
de valor que experimenta una variable o magnitud en dos situaciones, una de las cuales se toma
como referencia. La comparacin suele hacerse por cociente.
A la situacin inicial se le llama periodo base y a la situacin que queremos comparar periodo actual o
corriente.
ndices simples: Se denomina as a los referidos a una nica magnitud y se obtienen dividiendo cada
precio, cantidad o valor de un periodo (anual, mensual, semanal, etc.), por un precio, cantidad o valor de
un periodo fijo, considerado base, multiplicado luego por 100.
Si
i
X es una magnitud simple, representamos por
0 i
X el valor de la magnitud en el periodo base y por
it
X
el valor de la magnitud en el periodo que queremos estudiar entonces:
El nmero ndice simple es:
0
0
( ) *100
it
t
i
X
I i
X

Mide la variacin en tanto por uno o tanto por cien que ha sufrido la magnitud X entre los dos periodos
considerados y pueden ser:
a. Valor:
0
0
( ) *100
it
t
i
X
I i
X

b. Precio:
0
0
( ) *100
it
t
i
P
I i
P

c. Cantidad:
0
0
( ) *100
it
t
i
q
I i
q

114
Se puede calcular manteniendo fijo o constante el periodo base, permaneciendo inalterado
durante el periodo que es objeto de anlisis. Tambin se puede calcular con base variable,
en este caso, la base es el periodo inmediatamente anterior, partiendo de un ndice iguala a
100, bajo el supuesto del desconocimiento de informacin anterior a ese periodo.
Ejemplo 1. Con los datos de la serie 2001-2006, calcular los ndices de base fija 2001 y 2004;
luego el ndice de base variable para esa misma serie.

Base fija 2001, 2004. Base Variable
aos yi ndice
2001=10
0
% de
Variaci
n
ndice
2004=10
0
% de
Variaci
n
ndice
Variable
% de
Variaci
n
2001 20 100 0 50 -50 100 0
2002 28 140 40 70 -30 140 40
2003 24 120 20 60 -40 85.71 -14.29
2004 40 200 100 100 0 166.66 66.66
2005 48 240 140 120 20 120 20
2006 70 350 250 175 75 145.83 45.83
Observe que tomando de base el ao 2001, en el 2004 se tuvo un aumento del 100% y en el 2006
se tuvo un aumento de precios del 250% con respecto al ao 2001; si tomamos de base el ao
2004, en el 2006 se tuvo un aumento del 75%. Finalmente, si tomamos Base Variable en el ao
2006 hubo un aumento del 45.83% con respecto al ao 2005.
EJERCICIO DE APLICACIN. En enero de 2006 una fbrica pag un total de $
99,200,000.00 a 120 empleados en nmina. En julio del mismo ao, la fbrica tuvo 30 empleados
ms en nmina y pag $ 30,000,000 ms que en enero. Tomando el mes de enero como base,
hallar e interpretar:
a) El ndice de empleo (NIE)
b) El ndice del costo de mano de obra (ICMD)
c) Precio relativo
Solucin.
a) NIE= N de empleados en julio / N de empleados en enero
150
*100 125
120
NIE . Durante los 6 meses hubo un incremento de empleados del
25%
b) ICMD = Salarios pagados en Julio / Salarios pagados en enero
129, 200, 000
*100 130.24
99, 2000, 000
ICMD
. Durante los 6 meses considerados en este
estudio hubo un aumento de costo de mano de obra en la empresa de 30.24%,
observe que no se ha considerado en aumento de empleados.
115
c) El precio relativo (PR) es equivalente al riesgo relativo utilizado en medicina (RR),
es decir,
129, 200, 000
150
1.04193
99, 200, 000
120
PR
. El ndice de costo medio por empleado aument en
un 4.10% para el mes de julio en relacin con el mes de enero.
5.3.1. Relacin entre ndices de base fija y variable.
El ndice de base variable puede transformarse en ndice de base fija, utilizando la siguiente
relacin:
0 0 1 2
0 0 1 1
* * *...*
t
t t
I I R R R

donde
1
h
h
R

es el ndice relativo, es decir,
1
1
h h
h
h
X
R
X

Ejemplo: Se tiene la informacin del precio de un producto.


Se desea indicar la variacin del precio en el 2006
respecto al precio de 2003.
Solucin:
06 06
03
03
4800
*100 *100 171.43
2800
X
I
X

Ahora, imaginemos que se tiene el ndice de precios con base fija para 2003 y 2006 y se
requiere la variacin del precio en el 2006 respecto al precio de 2003.
Solucin:
06
06 02
03 03
02
240
*100 *100 171.43
140
I
I
I

. Observe que se tiene el mismo resultado si se
dispone de los precios o de los ndices de base fija.
Ahora, suponer que se tienen nicamente los ndices de base variable y se requiere la
variacin del precio en el 2006 respecto al precio de 2003.
116
Base fija 2002
aos Yi ndice
2002 2,00
0
100
2003 2,80
0
140
2004 2,40
0
120
2005 4,00
0
200
2006 4,80
0
240
2007 6,00
0
300
Solucin:
06 03 04 05 06
03 03 03 04 05
* * * 100*0.8571*1.6666*1.2 171.43 I I R R R .
Ejercicio. Un ndice para 2006 revela un aumento del 20% respecto al ao anterior. En el 2007
alcanz a 174, es decir, presenta un incremento anual del 18%. Calcular los ndices de base fija
de los aos 2005 y 2006.
Solucin:
Se requiere encontrar:
05 06
0 0
, ? I I
Informacin disponible:
06 07
05 06
120, 118 I I .
La base o periodo de inicio no se conoce, por lo tanto puede ser cualquier ao, as:
07
0
174 I adems sabemos que
07 06 07
0 0 06
* I I R , reemplazando 174 en la ltima expresin se
obtiene:
06
0
174
147.45
1.18
I .
Para obtener
05
0
I , se realiza un procedimiento anlogo al anterior.
06 05 06
0 0 05
* I I R , reemplazando 147.45 se tiene:
05
0
147.45
122.87
1.2
I .
Ejercicio. Se tienen tres ndices de base variable, cuyas cifras son: Para 2005=107, para
2006=108, para 2007=104, es decir, que entre 2004 y 2007, hubo un aumento del 19%. Decir si
la afirmacin anterior es cierta o falsa.
Solucin:
Recordemos que
07 04 05 06 07
04 04 04 05 06
* * * 100*1.07*1.08*1.04 120.18 I I R R R , por lo tanto la
afirmacin es falsa.
5.3.2. ndices agregativos simples
Cuando se dispone de una serie de precios de un grupo de artculos, dados en unidades diferentes,
los ndices simples ya no son utilizables, en esta situacin se requiere utilizar los ndices
agregativos simples.
Estos ndices se calculan teniendo en cuenta la suma de los precios, cantidades o valores de un
grupo de artculos para un periodo, divida por la suma de los precios cantidades o valores para
ese grupo de artculos en otro periodo, considerado como base. Matemticamente se expresan
como:
1
0
0
1
( )
*100
( )
n
t
t i
n
i
X i
I
X i


1
0
0
1
( )
*100
( )
n
t
t i
n
i
P i
I
P i


1
0
0
1
( )
*100
( )
n
t
t i
n
i
q i
I
q i

117
Las expresiones anteriores son muy tiles cuando no existen variaciones significativas entre
productos, ya estos ndices no se ven afectados por las variaciones en algn producto. Para
recoger las variaciones entre productos se recomienda calcular primeramente los ndices simples
y luego sumarlos y finalmente dividirlos por el nmero de productos. Esto es,
0
1
0
( )
*100
n
t
t i
I i
I
n

Ejemplo: Con los datos de la siguiente tabla, calcular el ndice agregativo de las
cantidades que resultaron en mal estado de conservacin, en un grupo de artculos, comparados
en el mes de junio de 2009, respecto a las cantidades comparadas, en mal estado de conservacin,
en el mes de mayo del mismo ao.
Solucin:
Primer mtodo.
1
0
0
1
( )
131
*100 *100 125.96
104
( )
n
t
t i
n
i
q i
I
q i

. Este mtodo es poco usual, ya que no es afectado


por las variaciones grandes que puede presenta uno varios artculos.
Segundo mtodo.
0
1
0
( )
150 187.5 40 142.8 140
*100 132.06
5
n
t
t i
I i
I
n

+ + + +

Este resultado es un poco mayor al obtenido por el primer mtodo. Este aumento se debe,
a la variacin que presenta el artculo B, durante ese periodo.
118
Artculos medida Defectuosas
mayo Junio
A Kg 12 18
B Lt 8 15
C Docena 20 8
D Libras 14 20
E Unidad 50 70
Total 104 131
5.3.3. ndices de precios
Existen gran cantidad de frmulas para calcular ndices de precios, cuyo empleo depender de la
naturaleza misma del problema. Generalmente, las ponderaciones en los ndices de precios son
las cantidades y en el clculo de los ndices de cantidad las ponderaciones son los precios.
5.3.3.1 ndice de Laspeyres de precios. 5.3.3.1 ndice de Laspeyres de precios.
Este ndice puede interpretarse, como la relacin existente, al comparar los precios actuales de
un grupo de artculos, con los precios de esos mismos artculos considerados en el periodo base,
mantenindose constante como ponderacin las cantidades del periodo base. La expresin es la
siguiente:
0
0
1
0 0
1
( ) ( )
*100
( ) ( )
t
n
t
I i
n
i
P i q i
L
P i q i

5.3.3.2 ndice de Paasche de precios.


Se interpreta como la relacin existente entre los precios actuales de un grupo de artculos, con
los precios de esos mismos artculos en el periodo base, mantenindose constante las
ponderaciones correspondientes a las cantidades de dichos artculos, dadas por el periodo que se
investiga, esto es:
0 1
0
1
( ) ( )
*100
( ) ( )
t
n
t t
I i
n
t
i
P i q i
P
P i q i

La diferencia entre las dos frmulas anteriores, radica nicamente en la base tomada para las
ponderaciones, en la primera se refiere a las cantidades del periodo base y en la segunda, las
cantidades corresponden al periodo que se investiga.
5.3.3.3. ndice de Fisher de precios.
Este ndice es un promedio geomtrico, que se define como la raz cuadrada del producto del
ndice de Laspeyres por el de Paasche, as:
0 0 0
0
1 1
0 0 0
1 1
( ) ( ) ( ) ( )
* *100
( ) ( ) ( ) ( )
t t t
n n
t t t
I I I i i
n n
t
i i
P i q i P i q i
F L P
P i q i P i q i





119
5.3.4. ndices de cantidad.
Los ndices de cantidad de Laspeyres, Paasche y Fisher son muy parecidos a los ndices de
precios, con la diferencia de que las ponderaciones son los precios. Las frmulas son las
siguientes:

0
0
1
0 0
1
( ) ( )
*100
( ) ( )
t
n
t
I i
n
i
P i q i
L
P i q i


0 1
0
1
( ) ( )
*100
( ) ( )
t
n
t t
I i
n
t
i
P i q i
P
P i q i

0 0 0
0
1 1
0 0 0
1 1
( ) ( ) ( ) ( )
* *100
( ) ( ) ( ) ( )
t t t
n n
t t t
I I I i i
n n
t
i i
P i q i P i q i
F L P
P i q i P i q i





Ejemplo: Con los siguientes datos referentes a los precios y cantidades para un grupo de
artculos dados para dos periodos.
Artculos Unidad 2006 2007
Precio Cantidad Precio Cantidad
A Kg 26 10 38 8
B Lt 6 5 10 7
C Lbs 1 2 4 5
D Docena 6 1 15 2
E Unidad 3.6 2 2 1
Calcular los ndices de precios y de cantidad de las Laspeyres, Paasche y Fisher.
Solucin:
Ordenando los datos de la tabla anterior:
Articulos P06 q06 P07 q07 P06
q06
P07q07 P07q0
6
P06q07
A 26 10 38 8 260 304 380 208
B 6 5 10 7 30 70 50 42
C 1 2 4 5 2 20 8 5
D 6 1 15 2 6 30 15 12
E 3.6 2 2 1 7.2 2 4 3.6
305.2 426 457 270.6
Clculo de los ndices de precios
Laspeyres:
0
0
1
0 0
1
( ) ( )
*100
( ) ( )
t
n
t
I i
n
i
P i q i
L
P i q i

=(457/305.2)*100 = 149.34
Paasche:
0 1
0
1
( ) ( )
*100
( ) ( )
t
n
t t
I i
n
t
i
P i q i
P
P i q i

= (426/270.6)*100= 157.43
120
Fisher: 0 0 0
149.34*157.43 153.54
t t t
I I I
F L P
Los ndices de cantidad se calculan de forma anloga.
Laspeyres: (270.6/305.2)*100=88.66
Paasche: (426/457)*100= 93.22
Fisher: 90.91
Ejercicio. El ndice de cantidad de un grupo de artculos es igual a 200, s se usa la frmula de
Fisher, y a 160 si se emplea la de Laspeyres. Cul es el ndice de cantidad usando la frmula de
Paasche?
Solucin.
0 0 0 0 0
2
40, 000
200 160* 250
160
t t t t t
I I I I I
F L P P P
Ejercicio. Una empresa espera aumentar sus ventas en el ao prximo en un 50%. En qu
porcentaje debera incrementar los precios para que el ingreso total se convierta en un 250%?
Solucin.
Se sabe que el ndice de ingreso total es igual al ndice de cantidad vendida por el ndice de
precios.
250=150*ind. Precios, entonces Ind. Precios = (250/150)=166.66
Se debe aumentar los precios en un 66.67%.
Ejercicio. El ndice de precios de Laspeyres es de 2/3 del de Paasche y ste asciende a 130.
Cul es el ndice de Fisher?
Solucin.
0 0 0
(2 / 3) * (2 / 3)(130) 86.66 86.66*130 106.14
t t t
I I I
L P F
5.3.5. Clculo del salario e ingreso real.
Los nmeros ndices tienen numerosas aplicaciones, especialmente en el rea econmica, por
ejemplo, para estimar el salario real o ingreso real, los cuales se obtienen a travs de las
siguientes frmulas:
Salario real: (salario nominal/ ndice de precios al consumidor)*100
Ingreso real: (Ingreso nominal/ndice de precios al consumidor)*100
121
Este proceso de convertir el salario o el ingreso nominal en real se conoce como deflacin o sea
la transformacin de valores expresados a precios corrientes en valores o precios constantes, con
respecto a un periodo.
Ejemplo: Un profesor Universitario III de la Universidad de El Salvador en junio de 2009
ganaba $ 1,400.00 dlares US y en el mes de enero de 2010, su salario fue reajustado con un
aumento de $ 200.00 dlares. Se sabe adems que el precio de la canasta bsica para esos mismos
meses y aos fue de $550 y $675 respectivamente. Se quiere saber si con el reajuste en el salario
mejor la situacin econmica de los profesores universitarios.
Solucin.
El ndice de precios de la canasta bsica es:
10
0
675
*100 122.73
550
I
Los artculos de primera necesidad aumentaron de junio de 2009 a enero de 2010 en un 22.73%,
por lo tanto, tuvo que haber un incremento igual a este porcentaje o mayor, para que las
condiciones econmicas sean iguales o mejores en el ao 2010.
Salario real=
1600
*100 1, 303.67
122.73
, esto indica que el aumento fue demasiado bajo, es decir,
que a pesar de estar recibiendo ms dinero que antes, este salario a penas equivale a 1,303.67, el
aumento esperado debi ser de $ 318.22 = 1400*0.2273, o sea que su nuevo salario debera de ser
de $1,718.22 en vez de $ 1,600.
5.4. Gua de ejercicios N 5.
1. Las cifras de ventas en millones de $ (dlares) de unos granos bsicos almacenados desde
2002 hasta 2010 son los siguientes:
122
a) Hallar los ndices de ventas, tomando como base primero 2002 y luego
2005.
b) Hallar los ndices de ventas con base variable
2. Un empleado ganaba $ 772 dlares mensuales en 2009 en el 2010 gana $ 912 mensuales, con
lo cual mejora su ingreso real en 16%. Si el actual ndice de precios es de $ 560 Cul era el
ndice de precios del 2009?
3. La produccin de tomates (en toneladas) en la provincia de Valparaso fue durante los ltimos
10 aos:
Se Pide:
a) Establezca una serie de nmeros ndice, que permita estudiar la evolucin de dichas
producciones, considerando como base el ao 1997.
b) Determine el porcentaje de variacin de la produccin entre los aos 1997 y 2006.
c) Determine la tasa de crecimiento promedio (tcp) entre los aos 1997 y 2007.

4. La entrada de turistas Alemanes a nuestro Pas durante los ltimos 7 aos segn SERNATUR
viene dada por la tabla siguiente:
123
Aos Ventas
2002 18
2003 18
2004 19
2005 15
2006 12
2007 16
2008 20
2009 24
2010 35
AO PRODUCCION (ton)
1997 1300
1998 1280
1999 1189
2000 1234
2001 1100
2002 1250
2003 1310
2004 1270
2005 1140
2006 1240
Se Pide:
a) Establezca una serie de nmeros ndice, que permita estudiar todos los datos, considerando
como base el ao 2000.
b) Con respecto al ao 2003. Qu porcentaje de aumento o disminucin se dio en los aos
2004 y 2005.
5. La Municipalidad de San Antonio, ubicada en la V Regin ha estudiado el consumo de anual
de agua por habitante durante los ltimos 5 aos, obteniendo:
Se Pide:
a) Establezca una serie de nmeros ndice, que permita estudiar todos los consumos,
considerando como base el ao 2002.
b) Determine el porcentaje de variacin del consumo entre los aos 2002 y 2006.
c) Determine la tasa de crecimiento promedio (tcp) entre los aos 2002 y 2006.
6. Una fbrica de automviles chinos produce cuatro modelos distintos, todos en versin
econmica, cuyos precios expresados en millones de pesos y nmero de unidades producidas
en 1998 y 2000 son respectivamente:
Ao 1998 Ao 2000
Modelo Precio (M$) N de unidades Precio (M$) N de unidades
1 0.9 3200 1.2 5600
2 1.3 3200 1.5 4300
3 1.9 3200 2.1 2000
4 3.8 3200 4.3 1200
Se Pide:
a) Hallar el ndice de precios y de cantidad de LASPEYRE, con base el ao 1998.
b) Hallar el ndice de precios y de cantidad de PAASCHE, con base el ao 1998.
c) Hallar el ndice de FISHER para precio y cantidad, considerando el mismo ao base.
124
AO Nmero de
Turistas
2000 12565
2001 13124
2002 11897
2003 14578
2004 16243
2005 14890
2006 15321
AO Consumo agua por habitante (lt)
2002 345
2003 367
2004 354
2005 389
2006 325
7. Si, por ejemplo, el consumo final de un pas, expresado en miles de dlares corrientes de cada
ao, y el I.P.C. de los mismos aos son los siguientes, expresar en dlares. Constantes el
consumo final de ese pas:
Aos Consumo
final
IPC
2000 17 100
2001 20 105
2002 22 110
2003 25 115
2004 30 118
125
Captulo 6. Mtodos de Conteo.
6.1 Introduccin
Antes de entrar al estudio del anlisis combinatorio, se considera que dentro del muestreo
aleatorio se distingue que la seleccin sea sin remplazamiento o con remplazamiento:
a. Sin remplazamiento: Se seleccionan n elementos de la poblacin, mediante n extracciones
sucesivas sin remplazamiento, asignando en cada una de ellas probabilidades iguales a los
elementos no seleccionados en las anteriores.
b. Con remplazamiento: Se seleccionan n elementos de la poblacin, mediante n extracciones
sucesivas con remplazamiento, asignando en cada una de ellas probabilidades iguales a todos
los elementos de la poblacin.
En estos dos procedimientos podemos considerar a los objetos o elementos de la poblacin
extrados, ordenados o sin ningn orden, originando as las muestras ordenadas, y las muestras
sin ordenar.
Tenemos, pues, cuatro procedimientos bsicos de muestreo aleatorio en el modelo uniforme:
1. Muestreo con remplazamiento y los objetos ordenados
2. Muestreo sin remplazamiento y los objetos ordenados
3. Muestreo con remplazamiento y los objetos sin ordenar
4. Muestreo sin remplazamiento y los objetos sin ordenar.
Los dos primeros originan las muestras ordenadas.
6.2 Muestras ordenadas.
El smbolo (N)n se utilizar para representar productos del tipo siguiente:
(N)n = N.(N-1) . . . (N-n+1), con n entero positivo y nN, definindolo como (N)n =0 para los
enteros n > N.
Si tenemos un conjunto { }
1 2
, , . . .,
n
A a a a
con n elementos, y un conjunto { }
1 2
, , . . .,
m
B b b b
con m es posible formar n.m pares de la forma
( , )
i i
a b
en donde el primer elemento del par
pertenece a A y el segundo a B. Este resultado se puede generalizar.
Proposicin
Si tenemos k conjuntos
1
, . . .,
k
A A
con elementos
1
, . . .,
k
n n
, respectivamente, el nmero de
ordenaciones de la forma
1
( , . . ., )
k
x x
, en donde
1
x
es un elemento de A1 y
k
x
es un elemento de
Ak, es
1
. . .
k
n n
.
Demostracin.
Este resultado se sigue por induccin.
Como consecuencia del resultado anterior, se tiene que si se realizan k selecciones sucesivas con
exactamente
i
n
opciones posibles en el i-simo paso o etapa, produce un total de
1
. . .
k
n n

resultados diferentes posibles.
Teorema
126
Dada una poblacin de N elementos se pueden seleccionar
n
N
muestras diferentes con
remplazamiento de tamao n, y (N)n muestras diferentes sin remplazamiento de tamao n.
Demostracin.
Al realizar n selecciones sucesivas con exactamente N opciones posibles, en cada una de las n
selecciones, que son las correspondientes a los N elementos de la poblacin. As, pues, segn el
resultado anterior . . . .
n
N N N N , muestras diferente de tamao n, en un muestreo con
remplazamiento, tomando
1 2
. . .
n
n n n N
.
Si efectuamos un muestreo sin remplazamiento, tendremos N opciones posibles en la primera
seleccin, pero tan slo (N-1) en la segunda, pues los elementos de la poblacin no son devueltos
a la misma; de la misma manera, en la tercera slo se tendrn (N-3+1) opciones, y as
sucesivamente hasta la n-sima, en la cual se tendrn (N-n+1) posible opciones. Por tanto,
existirn (N)n = N.(N-1) . . . (N-n+1) muestras diferentes de tamao n, en el muestreo sin
remplazamiento.
Ejemplo.
Supongamos una urna que contiene 9 bolas numeradas del 1 al 9. Si realizamos un muestreo
aleatorio con remplazamiento de tamao 6, el espacio muestral , estar compuesto por
6
9 531,441 elementos.
Ejemplo.
Si lanzamos un dado 5 veces, entonces el espacio muestral estar formado por
5
6 7,776
elementos, ya que este experimento es equivalente a muestrear con remplazamiento, donde el
nmero de veces que lanzamos el dado es equivalente al tamao n de la muestra aleatoria y N al
nmero de caras del dado.
Ejemplo.
Supongamos una urna que contiene 11 bolas numeradas del 1 al 11. Si realizamos un muestreo
aleatorio sin remplazamiento de tamao n=3, el espacio muestral estar formado por
3
(11) 990
elementos.
Teorema.
El nmero de ordenaciones diferentes de N elementos es
! .( 1). . .3.2.1 N N N
Observacin: El nmero de ordenaciones coincide con el nmero de muestras en un muestreo
sin remplazamiento.
Ejemplo.
Si se realiza un muestreo aleatorio con remplazamiento de tamao n de una poblacin de N
elementos, el nmero de muestras en las que no aparece ningn elemento dos veces es
+ ( ) .( 1). . .( 1)
n
N N N N n
127
6.3 Variaciones, combinaciones y permutaciones.
6.3.1. Variaciones de N elementos tomados de n en n.
Se llaman variaciones de N elementos tomados de n en n, a los diferentes grupos que pueden
formarse con los N elementos dados, tomados de n en n, de modo que cada dos grupos difieran
entre s, ya por la naturaleza de un elemento, ya por el orden de sucesin de los mismos. Se
represente por
, N n
V
.
El muestreo que se considera es sin remplazamiento, pues las variaciones en las que no se
especifica nada se entender que son sin repeticin. As pues,
,
.( 1). . .( 1)
N n
V N N N n +
6.3.2. Variaciones con repeticin de N elementos tomados de n en n.
Se llaman variaciones con repeticin de N elementos tomados de n en n a los diferentes grupos
que pueden formarse con los N elementos dados, tomados de n en n, en los que eventualmente
pueden aparecer elementos repetidos y con la condicin de que dos grupos sean distintos entre s,
si tienen distintos elementos, o estn situados en distintos lugares. Se representa por
, N n
RV
.
Observe, que aqu tambin se tiene en cuenta el orden de los elementos de cada grupo y de hecho
de lo nico que se diferencian de las variaciones antes definidas es que eventualmente algn
elemento puede aparecer repetido en un mismo grupo. Es decir, el muestreo se hace con
remplazamiento. As
,
n
N n
RV N
6.3.3. Permutaciones.
Las permutaciones o, tambin llamadas, ordenaciones son aquellas formas de agrupar los
elementos de un conjunto teniendo en cuenta que:
Influye el orden en que se colocan.
Tomamos todos los elementos de que se disponen o una parte de ellos.
Sern Permutaciones SIN repeticin cuando todos los elementos de que disponemos son
distintos.
Sern Permutaciones CON repeticin si disponemos de elementos repetidos. (Ese es el n
de veces que se repite el elemento en cuestin).
Permutaciones sin repeticin:
128
Una permutacin es una combinacin en donde el orden es importante. La notacin para
permutaciones es P(n,r) que es la cantidad de permutaciones de n elementos si solamente se
seleccionan r. As
!
( , )
( )!
n
P n r
n r

Ejemplo: Si nueve estudiantes toman un examen y todos obtienen diferente calificacin,


cualquier alumno podra alcanzar la calificacin ms alta. La segunda calificacin ms alta podra
ser obtenida por uno de los 8 restantes. La tercera calificacin podra ser obtenida por uno de los
7 restantes. Cuntas permutaciones de tres estudiantes pueden formarse.
Solucin:
Observe que interesa el orden, es decir, que en una permutacin donde un estudiante aparezca
con la calificacin ms alta y otro estudiante con la segunda calificacin ms alta, si
intercambiamos los estudiantes obtenemos otra permutacin totalmente diferente a la primera
permutacin.
As, la respuesta es: 9*8*7 = 504 o equivalentemente, 9! / (9-3)! = P(9,3).
Permutaciones de n elementos:
Permutaciones de n elementos diferentes son los distintos grupos que pueden formarse entrando
en cada uno de ellos los n elementos dados, difiriendo nicamente en el orden de sucesin de sus
elementos. Se representa por n!
Permutaciones con repeticin:
Llamaremos permutaciones con repeticin de r elementos distintos tal que el primero aparece n1
veces; el segundo n2 veces; . . . ; el r-simo nr veces, con n1 + n2 + + nr = N, a las distintas
disposiciones que pueden formarse con los r elementos distintos, de tal forma que en cada
disposicin cada elemento aparezca n1, n2, , nr veces y esto en un orden determinado. Se
representa por:
1
...
r
n n
N
RP
As:
1
...
1 2
!
!. !... !
r
n n
N
r
N
RP
n n n


Para tener una idea de la deduccin de la ecuacin anterior, observe que una poblacin de
tamao n puede dar lugar a n! muestras ordenada de tamao n. Adems, el nmero de muestra
ordenadas de tamao n, en un muestreo sin remplazamiento, efectuado en una poblacin de
tamao N, es (N)n , con lo que si llamamos A al nmero de subpoblaciones distintas de tamao n
de una poblacin de N elementos, ser:
129
A. n! = (N)n; entonces A = (N)n / n! =
!
!( )!
N N
n n N n
_

,
Ahora, tenemos r grupos distintos, n1, n2, , nr, y los elementos del primer grupo pueden ser
seleccionados de
1
N
n
_

,
maneras, de los N- n1 elementos restantes, podemos seleccionar los n2 del
segundo grupo de
1
2
N n
n
_

,
maneras, etc. Despus de formar el (r-1)-simo grupo quedarn N-
n1 - n2 - - nr-1 = nr elementos, que constituirn el grupo r-simo, que podremos seleccionar de
1 2 1
. . .
r r
r r
n N n n n
n n

_ _


, ,
=1 manera. Por tanto, el nmero de permutaciones con
repeticin de r elementos distintos ser el producto de esos nmeros combinatorios, es decir:
1
N
n
_

,
1
2
N n
n
_

,
. . .
1 2 1
. . .
r
r
N n n n
n

_

,
despus de desarrollar estos productos se llega a :
1
N
n
_

,
1
2
N n
n
_

,
. . .
1 2 1
. . .
r
r
N n n n
n

_

,
=
1 2
!
!. !... !
r
N
n n n
6.3.4. Combinaciones.
Llamaremos combinaciones de N elementos tomados de n en n, a los diferentes grupos que se
pueden formar figurando n elementos en cada uno, de modo que cada dos grupos difieran en la
naturaleza de, por lo menos, un elemento. Puede observarse, que no se tiene en cuenta el orden
de los elementos en la disposicin. Se denota por
, N n
C
y el nmero de grupos que podemos
formar de tamao n, ser:
,
!
!( )!
N n
N N
C
n n N n
_

,
Observe que una combinacin, es un arreglo de elementos en donde no nos interesa el lugar o
posicin que ocupan los mismos dentro del arreglo.
Ejemplo 1.
a) Si se cuenta con 14 alumnos que desean colaborar en una campaa pro limpieza, cuantos
grupos de limpieza podrn formarse si se desea que consten de 5 alumnos cada uno de ellos,
b) Si entre los 14 alumnos hay 8 mujeres, cuntos de los grupos de limpieza tendrn a 3
mujeres?,
c) Cuntos de los grupos de limpieza contarn con 4 hombres por lo menos?
130
Solucin: NO INTERESA EL ORDEN.
a) n = 14, r = 5
14
C
5
= 14! / (14 5 )!5! = 14! / 9!5!
= 14 x 13 x 12 x 11 x 10 x 9!/ 9!5!
= 2,002 grupos
Entre los 2002 grupos de limpieza hay grupos que contienen solo hombres, grupos que contienen
solo mujeres y grupos mixtos, con hombres y mujeres.
b) n = 14 (8 mujeres y 6 hombres), r = 5
En este caso nos interesan aquellos grupos que contengan 3 mujeres y 2 hombres
8
C
3
*
6
C
2
= (8! / (8 3)!3!)*(6! / (6 2)!2!)
= (8! / 5!3!)*(6! / 4!2!)
= 8 x7 x 6 x 5 /2!
= 840 grupos con 3 mujeres y 2 hombres, puesto que cada grupo
debe constar de 5 personas
c) En este caso nos interesan grupos en donde haya 4 hombres o ms
Los grupos de inters son iguales a: grupos con 4 hombres + grupos con 5 hombres, as:
6
C
4
*
8
C
1

+
6
C
5
*
8
C
0
= 15 x 8 + 6 x 1 = 120 + 6 = 126 grupos.
Ejemplo 2.
Para aprobar un examen un alumno debe contestar 9 de 12 preguntas,
a) Cuntas maneras tiene el alumno de seleccionar las 9 preguntas?,
b) Cuntas maneras tiene si forzosamente debe contestar las 2 primeras preguntas?,
c) Cuntas maneras tiene si debe contestar una de las 3 primeras preguntas?,
d) Cuntas maneras tiene si debe contestar como mximo una de las 3 primeras preguntas?
Solucin: NO INTERESA EL ORDEN.
a) n = 12, r = 9

12
C
9
= 12! / (12 9)!9!
= 12! / 3!9! = 12 x 11 x 10 / 3!
131
= 220 maneras de seleccionar las nueve preguntas o dicho de otra manera, el
alumno puede seleccionar cualquiera de 220 grupos de 9 preguntas para aprobar el examen.
b)
2
C
2
*
10
C
7
= 1 x 120 = 120 maneras de seleccionar las 9 preguntas entre las que estn las
dos primeras preguntas.
c)
3
C
1
*
9
C
8
= 3 x 9 = 27 maneras de seleccionar las 9 preguntas entre las que est una de las
tres primeras preguntas.
d) En este caso debe seleccionar 0 1 de las tres primeras preguntas

3
C
0
*
9
C
9
+
3
C
1
*
9
C
8
= (1 x 1) + (3 x 9) = 1 + 27 = 28 maneras de seleccionar las preguntas a
contestar.
Ejemplo 3.
Una seora desea invitar a cenar a 5 de 11 amigos que tiene,
a) Cuntas maneras tiene de invitarlos?,
b) Cuntas maneras tiene si entre ellos est una pareja de recin casados y no asisten el uno
sin el otro?,
c) Cuntas maneras tiene de invitarlos si Rafael y Arturo no se llevan bien y no van juntos?
Solucin:
a) n = 11, r = 5

11
C
5
= 11! / (11 5 )!5! = 11! / 6!5!
= 11 x 10 x 9 x 8 x 7 x 6! / 6!5!
= 462 maneras de invitarlos.
Es decir, que se pueden formar 462 grupos de cinco personas para ser invitadas a cenar.
b) Esta seora tiene dos alternativas para hacer la invitacin, la primera es no invitar a la pareja y
la segunda es invitar a la pareja.
2
C
0
*
9
C
5
+
2
C
2
*
9
C
3
= (1 x 126) + (1 x 84) = 210 maneras de invitarlos
En este caso separamos a la pareja de los dems invitados para que efectivamente se cumpla el
que no asistan o que asistan a la cena.
c) La seora tiene dos alternativas para hacer la invitacin, una de ellas es no invitar a Rafael y a
Arturo o que asista solo uno de ellos.
132
2
C
0
*
9
C
5
+
2
C
1
*
9
C
4
= (1 x 126) + (2 x 126) = 126 + 252 = 378 maneras de hacer la
invitacin.
6.3.4.1. Combinaciones con repeticin.
Llamamos combinaciones con repeticin de N elementos distintos tomados de n en n a todos los
conjuntos de n elementos tomados entre los N dados permitiendo repetir elementos.
La frmula para calcular el nmero de posibles combinaciones con repeticin de N elementos
distintos tomados de n en n es
+
+ _ +

,
, 1,
1 1!
!( 1)!
N m N n n
N n N n
CR C
n n N
Ilustracin
Suponemos que cada elemento del conjunto de los N distintos se representa por el espacio entre
dos lneas verticales del siguiente dibujo formado por N+1 lneas verticales:
1 2 3 ..... N-1 N N + 1

Elegir una combinacin con repeticin de N elementos distintos tomados de n en n es equivalente
a colocar n estrellas dentro de los N espacios pudiendo meter varias en un mismo espacio
1 2 3 ..... N-1 N N + 1
* * * * *
1 2 3 4 .... n
La posicin de la primera y la ltima de las barras es fija y elegir una ubicacin para las n
estrellas es equivalente a elegir un orden entre N-1 barras y n estrellas. El nmero de esas
posibles elecciones es el nmero de combinaciones sin repeticin de N + n 1 elementos
tomados de n en n.
Cmo se forman?. Para construir las combinaciones con repeticin, partimos del conjunto
A={1,2,3,4} y vamos a construir todas las combinaciones con repeticin posibles.
a) De un elemento. Si tenemos un conjunto de cuatro elementos y queremos hacer grupos
de uno, nicamente podremos hacer cuatro grupos: 1 , 2 , 3 , 4. (C4,1)
b) De dos elementos. La forma de construirlas ser similar a las combinaciones sin
repeticin aunque con la diferencia de que al permitirse repetir los elementos tendremos
que aadir a cada una de las de orden uno, el mismo elemento y todos los siguientes. As
se obtienen: 11, 12, 13, 14, 22, 23, 24, 33, 34, 44. (C4+1,2)
c) De tres elementos. Se pueden construir a partir de las anteriores aadiendo a cada
combinacin de orden dos el ltimo elemento y todos los elementos siguientes. Se
133
obtienen: 111 , 112 , 113 , 114 , 122 , 123 , 124 , 133 , 134 , 144 , 222 , 223 , 224 , 233 ,
234 , 244 , 333 , 334 , 344 , 444. (C4+2,3)
d) De cuatro elementos. Se pueden obtener a partir de las de orden tres, aadiendo a cada
una de ellas el ltimo elemento y los elementos siguientes. (C4+3,4)
e) De cinco o ms elementos. Como estamos construyendo combinaciones con repeticin y
los elementos se pueden repetir, podramos continuar construyendo combinaciones de
orden cinco o ms elementos. (C4+4,5)

6.4. Teorema del Binomio.
Se podra decir a primera vista, la expresin ( ) +
n
a b no parece tener mucho que ver con las
combinaciones, pero como veremos a continuacin, podemos obtener una frmula para
desarrollar ( ) +
n
a b utilizando la frmula para el nmero de r-combinaciones de n objetos. Con
frecuencia, podemos relacionar una expresin algebraica con algn proceso de conteo. Varias
tcnicas avanzadas de conteo utilizan estos mtodos.
Los nmeros C(n, r) se llaman Coeficientes Binomiales, pues aparecen en el desarrollo del
binomio (a+b) elevado a una potencia.
El Teorema del Binomio proporciona una frmula para los coeficientes en el desarrollo de
( ) +
n
a b . Como
( ) + + + + L
1 4 4 442 4 4 4 43
( )( ) ( )
n
n factores
a b a b a b a b
el desarrollo surge al elegir a o b en
cada uno de los n factores, multiplicando las selecciones entre ellas, y luego sumando todos los
productos obtenidos de esta manera. Por ejemplo, en el desarrollo de ( ) +
3
a b , se elige a o b en el
primer factor (a + b); a o b en el segundo factor (a + b), y a o b en el tercer factor (a + b); se
multiplican las selecciones entre ellas y luego se suman los productos obtenidos. Si elegimos a en
todos los factores y multiplicamos, obtenemos el trmino aaa.
Si elegimos a en el primer factor, b en el segundo factor y a en el tercer factor y multiplicamos,
obtenemos el trmino aba. La tabla 1 muestra todas las posibilidades. Si sumamos los productos
de todas las selecciones, obtenemos
Seleccin
del primer
Seleccin
del segundo
Seleccin
del tercer
Producto de
selecciones
134
factor (a+b) factor (a+b) factor (a+b)
a a a
aaa=
3
a
a a b
aab=
2
a b
a b a
aba=
2
a b
a b b
Abb=
2
ab
b a a
baa=
2
ba
b a b
bab=
2
ab
b b a
bba=
2
ab
b b b
bbb=
3
b
Tabla 1. Clculo de ( ) +
3
a b
Un trmino de la forma
n k k
a b surge de elegir b en k factores y a de los otros n-k factores. Pero
esto puede realizarse de C(n, k) formas, pues C(n, k) cuenta el nmero de formas de elegir k
cosas de n elementos. As,
n k k
a b aparece C(n, k) veces. Esto implica que
Este resultado se conoce como el teorema del binomio.
TEOREMA: Teorema del Binomio.
Si a y b son nmeros reales y n es un entero positivo, entonces
DEMOSTRACION. La demostracin aparece antes del enunciado del teorema.
EJEMPLO
Tomando n = 3 se obtiene
si se toma a = b = 1, da como resultado la siguiente identidad
EJEMPLO
135
Desarrollar utilizando el teorema del binomio. Si hacemos a = 3x , b= -2y
n = 4, obtenemos
EJEMPLO
Determine el coeficiente de en el desarrollo de El trmino relacionado con
aparece en el teorema del binomio considerando n = 9 y k = 4.
As el coeficiente de es 126.
EJEMPLO
Determine el coeficiente de en el desarrollo de Como
(Nueve trminos)
Obtenemos cada vez que multiplicamos dos x elegidas de los nueve trminos, tres y
elegidas de los nueve trminos para las x de C(9,2) formas. Una vez realizada esta seleccin,
podemos elegir as tres trminos para las y de C(7,3) formas. Esto deja los cuatro trminos
restantes para las z. As el coeficiente de en el desarrollo es
Dado un conjunto de X con n elementos, cuenta el nmero de subconjuntos con k
elementos.
136
Por consiguiente, el trmino correspondiente al lado derecho del teorema del binomio cuenta el
nmero de subconjuntos de X.
Exprsense los coeficientes binomiales en una disposicin triangular conocida como tringulo de
Pascal (vase la figura 1.).
Los dos lados superiores estn formados por nmeros 1 y cualquier valor interior es la suma de
los dos nmeros que estn por encima y a los lados de l.
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 1
0
1
0
5 1
Figura 1. Tringulo de Pascal
Una identidad que surge de algn proceso de conteo es una identidad combinatoria y el
argumento que conduce a su formulacin es un argumento combinatorio.

6.5. Gua de Ejercicios N 1.
1. Una ciudad cuenta con 7 candidatos para elegir al Alcalde y al Sndico. De cuantas
maneras puede asignar estos cargos.
2. De cuntas formas diferentes se pueden cubrir los puestos de presidente, vicepresidente y
tesorero de un club de ftbol sabiendo que hay 12 posibles candidatos?
3. Con las letras de la palabra libro, cuntas ordenaciones distintas se pueden hacer que
empiecen por vocal?
4. De cuntas formas pueden mezclarse los siete colores del arcoris tomndolos de tres en
tres?
5. Cuntos nmeros de cinco cifras distintas se pueden formar con las cifras impares?
Cuntos de ellos son mayores de 70,000?
6. De cuntos partidos consta una liguilla formada por cuatro equipos?
7. A una reunin asisten 10 personas y se intercambian saludos entre todos. Cuntos
saludos se han intercambiado?
8. Con las cifras 1, 2 y 3, cuntos nmeros de cinco cifras pueden formarse? Cuntos son
pares?
9. De cuntas formas pueden colocarse los 11 jugadores de un equipo de ftbol teniendo en
cuenta que el portero no puede ocupar otra posicin distinta de la portera?
10. Una mesa presidencial est formada por ocho personas, de cuntas formas distintas se
pueden sentar, si el presidente y el secretario siempre van juntos?
137
11. Cuntas diagonales tiene un pentgono y cuntos tringulos se puede informar con sus
vrtices?
12. Un grupo, compuesto por cinco hombres y siete mujeres, forma un comit de 2 hombres y
3 mujeres. De cuntas formas puede formarse, si:
a) Puede pertenecer a l cualquier hombre o mujer.
b) Una mujer determinada debe pertenecer al comit.
c) Dos hombres determinados no pueden estar en el comit.
13. De cuntas formas distintas pueden sentarse ocho personas en una fila de butacas?
14. En una clase de 35 alumnos se quiere elegir un comit formado por tres alumnos.
Cuntos comits diferentes se pueden formar?
15. De cuntas formas distintas pueden sentarse ocho personas alrededor de una mesa
redonda?
16. En una bodega hay cinco tipos diferentes de botellas. De cuntas formas se pueden elegir
cuatro botellas?
17. En el palo de seales de un barco se pueden izar tres banderas rojas, dos azules y cuatro
verdes. Cuntas seales distintas pueden indicarse con la colocacin de las nueve
banderas?
18. Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules. Si las bolas de igual
color no se distinguen entre s, de cuntas formas posibles pueden ordenarse?
19. Cuatro libros distintos de matemticas, seis diferentes de fsica y dos diferentes de
qumica se colocan en un estante. De cuntas formas distintas es posible ordenarlos si:
1. Los libros de cada asignatura deben estar todos juntos.
2. Solamente los libros de matemticas deben estar juntos.
20. Una persona tiene cinco monedas de distintos valores. Cuntas sumas diferentes de
dinero puede formar con las cinco monedas?
6.6. Solucines.
1. De cuntas formas diferentes se pueden cubrir los puestos de presidente, vicepresidente y
tesorero de un club de ftbol sabiendo que hay 12 posibles candidatos?
No entran todos los elementos.
S importa el orden.
No se repiten los elementos.
2. Con las letras de la palabra libro, cuntas ordenaciones distintas se pueden hacer que
empiecen por vocal?
La palabra empieza por i u o seguida de las 4 letras restantes tomadas de 4 en 4.
S entran todos los elementos.
138
S importa el orden.
No se repiten los elementos.
3. De cuntas formas pueden mezclarse los siete colores del arco iris tomndolos de tres en
tres?
No entran todos los elementos.
No importa el orden.
No se repiten los elementos.
4. Cuntos nmeros de cinco cifras distintas se pueden formar con las cifras impares?
Cuntos de ellos son mayores de 70.000?
S entran todos los elementos.
S importa el orden.
No se repiten los elementos.
Si es impar slo puede empezar por 7 u 9.
5. De cuntos partidos consta una liguilla formada por cuatro equipos?
No entran todos los elementos.
S importa el orden.
No se repiten los elementos.
6. A una reunin asisten 10 personas y se intercambian saludos entre todos. Cuntos
saludos se han intercambiado?
139
No entran todos los elementos.
No importa el orden.
No se repiten los elementos.
7. Con las cifras 1, 2 y 3, cuntos nmeros de cinco cifras pueden formarse? Cuntos son
pares?
S entran todos los elementos: 3 < 5
S importa el orden.
S se repiten los elementos.
Si el nmero es par tan slo puede terminar en 2.
8. De cuntas formas pueden colocarse los 11 jugadores de un equipo de ftbol teniendo en
cuenta que el portero no puede ocupar otra posicin distinta de la portera?
Disponemos de 10 jugadores que pueden ocupar 10 posiciones distintas.
S entran todos los elementos.
S importa el orden.
No se repiten los elementos.
9. Una mesa presidencial est formada por ocho personas, de cuntas formas distintas se
pueden sentar, si el presidente y el secretario siempre van juntos?
Se forman dos grupos el primero de 2 personas y el segundo de 7 personas, en los dos se cumple
que:
140
S entran todos los elementos.
S importa el orden.
No se repiten los elementos.
10. Cuntas diagonales tiene un pentgono y cuntos tringulos se puede informar con sus
vrtices?
Vamos a determinar en primer lugar las rectas que se pueden trazar entre 2 vrtices.
No entran todos los elementos.
No importa el orden.
No se repiten los elementos.
Son , a las que tenemos que restar los lados que determinan 5 rectas que no son diagonales.
11. Un grupo, compuesto por cinco hombres y siete mujeres, forma un comit de 2 hombres y 3
mujeres. De cuntas formas puede formarse, si:
1. Puede pertenecer a l cualquier hombre o mujer.
2. Una mujer determinada debe pertenecer al comit.
3. Dos hombres determinados no pueden estar en el comit.
141
12. De cuntas formas distintas pueden sentarse ocho personas en una fila de butacas?
S entran todos los elementos. Tienen que sentarse las 8 personas.
S importa el orden.
No se repiten los elementos. Una persona no se puede repetir.
13. En una clase de 35 alumnos se quiere elegir un comit formado por tres alumnos.
Cuntos comits diferentes se pueden formar?
No entran todos los elementos.
Noimporta el orden: Juan, Ana.
Nose repiten los elementos.
14. De cuntas formas distintas pueden sentarse ocho personas alrededor de una mesa
redonda?
15. En una bodega hay cinco tipos diferentes de botellas. De cuntas formas se pueden elegir
cuatro botellas?
No entran todos los elementos. Slo elije 4.
No importa el orden. Da igual que elija 2 botellas de ans y 2 de ron, que 2 de ron y 2 de ans.
S se repiten los elementos. Puede elegir ms de una botella del mismo tipo.
16. En el palo de seales de un barco se pueden izar tres banderas rojas, dos azules y cuatro
verdes. Cuntas seales distintas pueden indicarse con la colocacin de las nueve
banderas?
142
S entran todos los elementos.
S importa el orden.
S se repiten los elementos.
17. Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules. Si las bolas de igual
color no se distinguen entre s, de cuntas formas posibles pueden ordenarse?
18. Cuatro libros distintos de matemticas, seis diferentes de fsica y dos diferentes de qumica
se colocan en un estante. De cuntas formas distintas es posible ordenarlos si:
1. Los libros de cada asignatura deben estar todos juntos.
2.Solamente los libros de matemticas deben estar juntos.
19. Una persona tiene cinco monedas de distintos valores. Cuntas sumas diferentes de
dinero puede formar con las cinco monedas?
143
Captulo 7. Conceptos Bsicos de Probabilidad
7.1 Introduccin.
La palabra probabilidad aparece en nuestro lenguaje ordinario en multitud de ocasiones. As,
afirmaciones del tipo de que la probabilidad de obtener dos seis al lanzar dos dados no cargados
es uno entre 36, de que hay una probabilidad ligeramente inferior a un medio de que un beb
recin nacido sea varn y de que en los prximos dos aos se pueda curar el SIDA es pequea.
El primero se refiere a un juicio de probabilidad que podemos llamar clsico, en el que los
posibles resultados son equiprobables. El segundo es una afirmacin de tipo frecuentista y se
refiere a la frecuencia relativa con la que cierta probabilidad aparece entre los miembros de una
clase determinada y el tercero constituye un ejemplo de lo que podramos llamar un juicio de
credibilidad y es una medida del grado de confianza que tenemos en la verdad de una cierta
proposicin.
7.2. Experimento aleatorio.
La finalidad de todo experimento cientfico es la obtencin de informacin de inters acerca de
cualquier fenmeno de la Naturaleza. Dentro de los experimentos cientficos hay algunos cuyo
desarrollo es previsible con certidumbre, y sus resultados estn perfectamente determinados una
vez fijada las condiciones del mismo: se conocen con el nombre de experimentos
determinsticos.
Frente a estos experimentos que pueden realizarse en contexto de certidumbre, aparecen los que
pueden realizarse en un contexto de incertidumbre. A estos se les llama experimentos o
fenmenos aleatorios; estos fenmenos dependen del azar. El objeto de estudio del Clculo de
Probabilidades lo constituyen los fenmenos o experimentos aleatorios. Algunas propiedades que
caracterizan los fenmenos aleatorios son:
1. En las mismas condiciones iniciales pueden dar lugar a diferentes resultados finales.
2. Todos los resultados posibles se conocen por anticipado.
3. No se puede predecir el resultado en cada experimento particular.
4. En general, puede repetirse en las mismas condiciones indefinidamente.
Ejemplo.
Para fijar los elementos fundamentales que intervienen en la teora de probabilidades,
elegimos uno de los ejemplos ms habituales como es el de lanzamiento de un dado.
Claramente es un fenmeno aleatorio.
Los resultados posibles son: = {1, 2, 3, 4, 5, 6}
Los aspectos que presentan incertidumbre en este experimento son: los posibles subconjuntos
de , as presenta incertidumbre el subconjunto {2, 4, 6} al que podemos denominar par o
su complementario impar. Un segundo elemento a considerar son todos los subconjuntos de
, es decir, el conjunto de partes de , P(,) el cual obtendr todos los elementos de inters
en nuestro experimento.
144
Por ltimo, parece razonable tener una medida de dicha incertidumbre: es decir, su
probabilidad P. As pues, en todo experimento aleatorio se deben considerar los siguientes
tres elementos (, P(), P).
7.3. Espacio Muestral.
Dado un experimento aleatorio, llamaremos espacio muestral al conjunto de todos los
resultados posibles distintos de dicho experimento aleatorio. Los elementos de se denominan
sucesos elementales.
Ejemplos de espacios muestrales hay muchos. Consideremos el experimento aleatorio de lanzar
dos monedas al aire, el espacio muestral asociado ser el = {(C, C), (C, F), (F, C), (F, F)} en el
caso que se distinguiesen las dos monedas.
Tipos de espacios muestrales asociados a un experimento aleatorio.
a) Espacio muestral finito: Se da cuando est formado por un nmero finito de elementos.
Ejemplos, lanzamiento de un dado o de una moneda.
b) Espacio muestral infinito numerable: A priori un experimento de este tipo puede dar
lugar a un conjunto infinito de eventualidades. Ejemplo, Lanzar una moneda hasta
obtener cara por primera vez:
C, FC, FFC, FFFC, . . . , FFFFF FC,
El espacio muestral deber contener como elementos todas aquellas sucesiones finitas
de la forma FFFC.
c) Especio muestral continuo: Cuando los elementos del experimento aleatorio pueden ser
cualquier valor dentro de un intervalo o regin. Ejemplo, el desplazamiento de una
partcula en un plano y supongamos que estamos interesados en la posicin que ocupa
dicha partcula en el plano, en este caso es todo el plano y por tanto continuo.
7.4. Sucesos o Eventos
Sea A una coleccin no vaca de subconjuntos del espacio muestral , en principio, cualquier
elemento de A, es decir, cualquier subconjunto de contendr una cierta incertidumbre:
llamaremos a dicho conjunto suceso, siendo la medida de la incertidumbre, su probabilidad.
As, suceso es un conjunto A de A. Diremos que se ha presentado un suceso A al realizar el
experimento, si el resultado de dicho experimento es algn punto (es decir, un suceso
elemental de contenido en A).
Obviamente, los sucesos son conjuntos, por lo tanto, al hablar de uniones, intersecciones,
diferencia, complementario, etc. de sucesos no es ms que hablar de uniones, intersecciones,
diferencias, complementarios, etc. de conjuntos. El suceso correspondiente al conjunto vaco
es denominado suceso imposible y representado por y definido como el conjunto de que
no contiene ningn suceso elemental.
145
Desde el punto de vista matemtico A no es ms que una coleccin especificada de
subconjunto de . En algunos casos (cuando sea finito o numerable ser A=P() y
contendr
2
n
elementos, pero otras deber ser A P()).
En clculo de probabilidades la exigencia habitual que haremos a la clase A es que sea
lg ebra
.
7.4.1. Estructuras con subconjunto
Definicin 1. (Estructuras de Semilgebra)
Dado el espacio total , una clase
( ) S P
tiene estructura de semilgebra si y slo si:
)
) ,
a S
b A B S es A B S



) , c A S
existe una sucesin finita
1 2
, , ...,
n
A A A S
con
i j
A A i j
tal que
1
n
c
i
i
A A

U
Ejemplo. (Intervalos finitos o infinitos de )
Sea { } , , ( , ], ( , ], ( , ) / , , , S a b c d a b c d
verificar que S tiene estructura de
semilgebra ( ) ( , )
.
1) S por definicin
2) Para todo par de intervalos de la clase, su interseccin est en la clase ya que cualquier
intervalo intersecado con ser el mismo intervalo, y cualquier intervalo intersecado con ,
ser , que por definicin ha sido incluido en S.
Por otro lado,
( , ] ( , ] ( , ] , ,
( , ] ( , ] , ,
( , ] ( , ] ( , ] , ,
a b c b a S si b a c
a b c S si a b c
a b c b c S si b c a
< < <
< < <
< < <
Adems,
( , ] ( , ] ( , ] , ,
( , ] ( , ] , ,
a d d a S si d a
a d S si a d
< < <
< < <

Y por ltimo,
146
( , ] ( , ) , ,
( , ] ( , ) ( , ] , ,
( , ] ( , ) ( , ] , ,
b c d S si b c d
b c d d c S si b d c
b c d b c S si d b c
< < <
< < <
< < <
3) Dado un intervalo, el complementario se puede poner como unin finita de elementos de la
clase:
Dado ,
c
y dado ,
c
, as pues, slo debemos estudiar el resto de los intervalos:
, ( , ] ( , ) . , , ( , ] ( , ] ( , ),
c c
a a a S b c b c b c perteneciendo ambos intervalos
a S. Por ltimo, , ( , ] ( , ] .
c
d d d S
Ejemplo.
Sea
(0,1]
verificar que la clase de intervalos (a, b] con0 1 a b forman una semilgebra.
Definicin 2. (Estructura de lgebra)
Dado el espacio total , una clase
( ) Q P
tiene estructura de lgebra si y slo si:
)
) ,
a Q
b A B Q es A B Q



) , c A Q
existe una sucesin finita
1 2
, , ...,
n
A A A Q
con
i j
A A i j
tal que
1
n
c
i
i
A A

U
) , d A B Q se tiene A B Q
Nota: Toda lgebra es semilgebra y adems es cerrada bajo complemento (
c
A Q A Q ).
Definicin 3. (Estructura de -lgebra)
Dado el espacio total , una clase A
( ) P
tiene estructura de

-lgebra si y slo si:


) a
A
) b A
A

c
A A
c) Para toda sucesin { }
n
n
A

A se tiene
1
n
n
A

U
A
Nota: El conjunto vaco se encuentra en la clase y es cerrado bajo intersecciones
numerables
1 1
c
c
n n
n n
A A


_


,
I U
.
Ejemplo:
147
Sea y la clase { } ( , ]: , C a b a b
entonces la

-lgebra engendrada por C es muy


importante en Clculo de Probabilidades y se denomina

-lgebra de Borel. Se representa por


( ) B
.
La

-lgebra de Borel no slo est engendrada por C , sino que est engendrada por cualquiera
de las siguientes clases de intervalos:
{ } { } { } { }
1 2 3 4
( , ) ; ( , ) ; ( , ) ; ( , ] ; C a b C b C a C b
{ } { } { }
5 6 7
[ , ) ; [ , ) ; [ , ] ; C a b C a b C a b
Ejercicio
Sea el conjunto de casos posibles que resulta de la tirada de un dado. Decir cules de las
siguientes clases de conjuntos son lgebras.

{ }
{ } { } { } { }
( )
{ } { } { } { }
1
2
3
4
) ,
) , 1, 3, 5 , 2, 4, 6 , , , ,
) ,
) , 1 , 1, 5 , 2, 4, 6 ,





a
b I P
c P conjunto de las partes de
d
M
M
M
M
7.5. Axiomas de Probabilidad
Definicin (Espacio Probabilizable)
Al par ( , ) A , donde ( ) A P es una -lgebra de conjuntos de se le denomina
espacio medible o espacio probabilizable. A los elementos de A se les denomina conjuntos
medibles.
7.5.1. Probabilidad (Axiomtica).
El tercero de los elementos a considerar en relacin con un experimento aleatorio es, la
probabilidad de los sucesos de la -lgebra de subconjuntos del espacio muestral

.
Axiomas de Kolmogorov.
Sea ( , ) A un espacio probabilizable. Definimos una funcin de conjunto P, de A en
que cumple los siguientes axiomas:
Axioma 1. A A es P(A) 0 .
Axioma 2.
( ) 1 P
.
Axioma 3. sucesin { }
n
n
A

A tal que
1 1
( )


_


,
U i j n n
n n
A A i j es P A P A
Consecuencias de los Axiomas de Kolmogorov.
148
1.
( ) 0 P
. En efecto, sea la sucesin
, , ... A
con A

A ; evidentemente
1
...
n
n
A A A


U
con lo que por el axioma 3
( ) ( ) ( ) ( ) ( )
1 2 1
0
n n n
n n n
P A P A P A P A P A P


_
+

,
U
2 Se cumple la aditividad finita. Sea la sucesin
1 2
, ,..., , , ,...
n
A A A
Donde
i
A
A ,
1, 2,..., , , .
i j
i n y A A i j con i j n
En efecto. Directamente del axioma 3 y 1.
1. Para todo A

A ; es ( )
c
P A
=1 P(A). En efecto, escribir el espacio total como la unin de A
y su complemento, luego aplicar la funcin de probabilidad y el axioma 2.
2. Si A, B

A y A

B, entonces P(A) P(B). En efecto, B = A

(B-A);
P(B)= P(A) + P(B-A), entonces P(B) P(A), ya que P(B-A) 0.
3. Para todo A

A , P(A) 1. Observe que A

, entonces P(A) P( )=1.


4. Para todo A, B

A , P(A

B) = P(A) + P(B) - P(A

B).
Verificacin:
A = (A

B )

(A

B*) B* = B complemento.
B= (A

B )

(A*

B)
Ahora, P(A)= P(A

B ) + P (A

B*) y P(B) = P(A

B ) + P (A*

B) por otra parte, A

B
= (A

B )

(A

B*)

(A*

B)
P(A

B) = P(A

B ) + P (A

B*) + P(A*

B)
= P(A

B ) + P(A) - P(A

B ) + P(B) - P(A

B )
= P(A) + P(B) - P(A

B )
5. Como generalizacin de la propiedad anterior, podemos expresar la probabilidad de la
unin de n elementos no disjuntos de la -lgebra A de la forma
1 2 1 2 3
1 2 1 2 2
1 2 1 2 3
1
1 , 1 , , 1 1 1
( ) ( ) ( ) ... ( 1)
+

< < <
_ _
+ +

, ,
U I
n n n n n
n
i i i i i i i i
i i i i i i i i
i i i i i
P A P A P A A P A A A P A
La demostracin se hace por induccin.
Definicin 7. (Espacio probabilstico)
149
Al tro ( , A , P) donde es el espacio muestral, A -lgebra de sucesos sobre y P una
medida de probabilidad sobre A recibe el nombre de espacio probabilstico, o espacio de
probabilidades. A los elemento de A se les llama sucesos.
7.6. Resultado Igualmente Probables o Modelo Uniforme de
Probabilidad
En muchas ocasiones, como en el estudio de algunos jugos de azar, de ciertos procedimientos de
muestreo, etc., se trabaja con espacios muestrales finitos, en los cuales los sucesos elementales
son equiprobables. El modelo matemtico asociado suele recibir el nombre de modelo uniforme
y se expresa como sigue:
Sea ( , A , P) un espacio probabilstico tal que el conjunto de sucesos elementales asociado,
1 2
, , . . . ,
n
a a a
es finito. En esta situacin el espacio muestral se podr poner como
1 2
. . .
n
a a a
y por ser los sucesos elementales incompatibles dos a dos, ser:
1 2
( ) ( ) . . . ( ) 1
n
P a P a P a + + +
Adems,
1
( ) , 1, . . . ,
i
P a i n
n
con lo que todo AA unin de k sucesos elementales ser:
1 2
( ) ( ) ( ) . . . ( )
k
k
P A P a P a P a
n
+ + +
Hemos obtenido as la clsica regla de Laplace: Cociente entre casos favorables y casos
posibles considerados stos como equiprobables.
En este caso, necesitamos determinar qu nmero de situaciones son consideradas como
favorables y qu nmero de situaciones son posibles al realizar nuestro experimento aleatorio.
Para ello, es de mucha utilidad el anlisis combinatorio y al de su base probabilstica asociada.
Ejercicio. Se elige un nmero al azar del 1 al 6,000, todos igualmente probables. Hallar la
probabilidad de que sea mltiplo de 2 de 3 de 4 de 5.
7.7. Probabilidad condicional.
El problema que vamos a tratar en este apartado va a ser el de formalizar la idea intuitiva de que
la informacin aportada por el hecho de que haya ocurrido un suceso B, ha de ser recogida
cambiando el espacio de partida.
Consideremos el siguiente experimento aleatorio: Un encuestador elige al azar una persona en
una poblacin de N individuos. Si suponemos que todas las elecciones son equiprobables, la
situacin aleatoria es fcilmente descrita por el espacio probabilstico ( , A , P), en donde es
el conjunto constituido por la propia poblacin en cuestin, A =P( ) : conjunto potencia, y P
est definida por las masas 1/N situadas en cada punto de . Entre los sucesos de A
consideremos el suceso A = Se elige una persona rubia y el suceso B=se elige una persona de
150
altura superior a 1.7m. Estos sucesos son parte de , ya que despus de realizar el experimento
tienen respuesta las preguntas: es rubia la persona encuestada? es de altura superior a 1.7m?
Supongamos que estamos en la situacin que una persona rubia (sin saber cul) es elegida, o
dicho de otra manera ha ocurrido el suceso A. A priori, B ha podido tener lugar o no; para que
hubiese ocurrido, habra sido necesario y suficiente que se hubiera elegido una persona del
subconjunto A

B de , y para que no hubiese ocurrido, habra sido necesario y suficiente el


que se hubiese elegido una persona del subconjunto A

B* de . Supongamos, que ha ocurrido


A y se ha revisado el que B tenga lugar; A ya es un suceso seguro y B no se realizar a menos
que se realizase A

B. La probabilidad de realizacin de B, sabiendo que ha ocurrido A, es el


caso de sucesos favorables A

B con respecto al nmero de casos posibles que realizan A; es


decir,
A B
A
N
N

, de donde dividiendo por N las dos cantidades ser:


( )
( )
A B
A
N
P A B
N
N
P A
N

En resumen, sabiendo que A se ha realizado, una nueva evaluacin de las probabilidades de los
sucesos, conducen a una nueva ley de probabilidades sobre ( ,P( )), denotada por
A
P
, dando
al suceso A una probabilidad igual a uno, y dando una probabilidad nula a los sucesos disjuntos
con A, viniendo definida por:
( )
( )
( )
A
P A B
P B
P A

Definicin. (Probabilidad condicional)


Sea ( , A , P) un espacio probabilstico y sea A

A un suceso tal que P(A) > 0. Llamaremos


probabilidad condicionada del suceso B respecto al A, y lo escribiremos P(B/A) a
( )
( )
/ , ( )
( )
P A B
P B A P A
P A

> 0
Proposicin.
Sea ( , A , P) un espacio probabilstico y sea A

A con P(A) > 0. Entonces, ( , A , P(/A)) es


un espacio de probabilidad, donde P(B/A) es la definida anteriormente.
Demostracin.
1. ( )
( )
/ 0
( )
P A B
P B A
P A


; B A
2. ( )
( ) ( )
/ 1
( ) ( )
P A P A
P A
P A P A


3. Por ltimo, si { }
n
n
A

A es una sucesin de disjuntos de A entonces


[ ]
1 1
1
/
( ) ( )
n n
n n
n
n
P A A P A A
P A A
P A P A

_ 1 _


1
_
] , ,


,
U U
U
151
=
( )
( )
( )
1
1 1
/
( ) ( )
n
n n
n
n n
P A A
P A A
P A A
P A P A

La parte relevante de A es A

A ya que P(B/A) = 0 si B

A*. De hecho, si P(A) > 0,


A
A
=A

A es una -lgebra y P(/A) es una probabilidad sobre


A
A
.
Proposicin.
El tro (A,
A
A
, PA) es un espacio probabilstico si P(A) > 0.
Demostracin.
A
A
es la clase de todos los sucesos que se pueden expresar como interseccin de un elemento de
A y A, es decir,
A
A
=A

A={B

A ; B A }. Pues bien,
A
A
tiene estructura de -lgebra
con espacio total el propio A, ya que:
a) A

A
A
por ser A = A

A, con A A .
b) Si C

A
A
y por C, representemos el complementario de C en
A
A
y por C* el
complementario en A , entonces C

A
A
, ya que C = C*

A y C* A , por ser A -
lgebra y C A .
c) Para toda sucesin { }
n
n
C

A
A
es

U
1
n
n
C
A
A
ya que ser
[ ]
1 1 1
n n n n n
n n n
C B A y C B A B A


_


,
U U U A
A
Por ser
1
n
n
B


,
U
A .
Por otro lado,
A
P
es una probabilidad sobre (A,
A
A
) ya que
A
P
es la restriccin de P(/A) al
espacio (A,
A
A
).
Teorema. (Teorema del Producto o Regla de multiplicacin)
Si A y B son dos sucesos del espacio probabilstico ( , A , P) con P(A) > 0 y P(B) > 0, a partir
de la proposicin 5 se tiene que:
( ) ( )
( ) ( ) / ( ) ( ) / P A B P A P B A y P A B P B P A B .
Demostracin (Inmediata)
El teorema anterior se puede generalizar: Sea
1 2
, ,...,
n
A A A
A con
n-1
j=1
P
j
A
_

,
I
> 0 entonces,
152
n
n-1 1 2 1 3 1 2
j=1
j=1
P ( ). ( / ). ( / )...P
n
j
j
A
A P A P A A P A A A
A
_

_




,

,
I
I
fcilmente se demuestra por induccin.
Teorema. (Teorema de la probabilidad total)
Sea ( , A , P) un espacio probabilstico y sea { }
n
n
A

A un sistema completo de sucesos, es


decir, una sucesin de disjuntos,
1


U i j n
n
A A i j tal que A
Sea B A un suceso para el que se conocen las probabilidades condicionadas P(B/Ai), y
supongamos, por ltimo, que se conocen tambin las probabilidades P(Ai), con P(Ai)>0, para
todo i=1,2, . . . En estas condiciones,
1
( ) ( / ) ( )

i i
i
P B P B A P A
Demostracin.
[ ]
1 1 1
( ) ( ) ( / ) ( )


_ 1 _

1
] , ,
U U i i i i
i i i
P B P B P B A P B A P B A P A
Teorema. (Teorema de Bayes o de la Probabilidad inversa)
Sea ( , A , P) un espacio probabilstico y sea { }
n
n
A

A un sistema completo de sucesos tal


que P(Ai)>0, i . Sea B A un suceso con P(B)>0, para el que se conocen las
probabilidades P(B/ Ai). Entonces,
( )
1
( ) ( / )
( / ) ,
( ) /

i i
i
i i
i
P A P B A
P A B i
P A P B A

Demostracin: Inmediata. Aplicacin del teorema de la Probabilidad total.
A las probabilidades P(Ai)>0 se les suele llamar probabilidades a priori. A las P(Ai/B)
probabilidades a posteriori, y a las P(B/Ai) verosimilitudes.
7.8. Independencia de sucesos.
Sea ( , A , P) un espacio probabilstico y sean A, B A con P(B)>0. El teorema del producto
nos dice que
153
( ) ( ) ( ) / P A B P B P A B
.
Existen muchos experimentos aleatorios en los que la informacin suministrada por el suceso B
no afecta para nada la probabilidad del suceso A, es decir, P(A/B)=P(A). Pues bien, esa es
precisamente la nocin de independencia.
Definicin. (Independencia)
Sea ( , A , P) un espacio probabilstico y sea A,B

A , los suceso A y B son independientes si y


slo si:
( ) ( ) ( ) P A B P A P B
Frecuentemente se confunde sucesos incompatibles con sucesos independientes, observemos que
los sucesos incompatibles son los ms dependientes que existen, puesto que la ocurrencia de uno
de ellos proporciona la mxima informacin; el otro suceso no va a ocurrir.
Proposicin.
Si A y B son dos sucesos independientes entonces,
P(A/B) =P(A) si P(B)>0; y P(B/A)= P(B) si P(A) > 0.
Proposicin.
Si A y B son dos sucesos independientes, entonces, tambin lo son A y B*, A* y B, A* y B*.
Demostracin:
P(A*

B) = P(B - [ A

B]) = P(B) P(A

B) , ya que (A

B )

B, con lo que:
P(A*

B) = P(B)(1-P(A)) = P(B)P(A*). Anlogamente, se verifica la independencia de A y B*.


Por ltimo,
P(A*

B*) = P[(A

B)*] = 1 P(A

B) = 1- [P(A) + P(B) P(A

B)]
= 1 -P(A) -P(B) + P(A)P(B) = P(A*) P(B)(1-P(A)) =P(A*)P(B*) .
A continuacin se presenta una serie de ejercicios de probabilidad, se han ordenado de acuerdo a
su dificultad al momento de resolver. Los ejercicios con un * tienen un grado mayor de dificultad
y los ejercicios con ** se recomienda dejarlos hasta el final ya que se requieren mucha
concentracin para su comprensin y resolucin. Esta clasificacin se hace con base al nivel de
dificultad que encontr el profesor al momento de resolverlos.
7.9. Ejercicios de clculo de probabilidad
Hoja de ejercicios 2.
Ejercicio 1: Altube y Vitoria son dos estaciones metereolgicas. Representaremos por A y V el
que llueva respectivamente en Altube y Vitoria durante cualquier periodo de 24 horas en el mes
de Junio; se tiene que P(A) = P(V) = 0, 40 y que P(A V) = 0, 28. Determnense las dos
probabilidades condicionales P(A/V) y P(V/A), as como la probabilidad total P(A V). Son
independientes A y V?
Solucin.
Para obtener las probabilidades condicionadas aplicamos la expresin:
154
Para obtener la probabilidad total consideramos
P(A V) = P(A) + P(V) P(A V)= 0, 40 + 0, 40 - 0, 28 = 0, 52
Se dice que dos sucesos son independientes si su probabilidad compuesta es igual al producto de
sus probabilidades incondicionales respectivas. La definicin formal de independencia de dos
sucesos es:

P(B/A) = P(B) ; P(A/B) = P(A)
Tambin, podemos ver que en el caso de sucesos independientes la probabilidad compuesta toma
la forma:
P(A B) = P(A)P(B).
En nuestro caso resulta fcil comprobar que los dos sucesos no son independientes ya que se
tiene:
P(A/V) P(A) ; P(V/A) P(V) P(A V) P(A)P(V)
Ejercicio 2. Un mecanismo elctrico que contiene cuatro interruptores slo funciona cuando
todos ellos estn cerrados. En sentido probabilstico, los interruptores son independientes en lo
que se refiere al cierre o a la apertura, y, para cada uno de ellos, la probabilidad de que no
funcione es 0,1. Calclese la probabilidad de que no funcione el mecanismo en conjunto,
despreciando todas las causas que pueden hacer que el mecanismo no funcione, excepto los
propios interruptores.

Solucin
Representando por F el hecho de que el mecanismo no funcione y por F* el suceso
complementario. Llamando S
1
al suceso de que el interruptor 1 est cerrado y S
1
* al suceso
complementario (que est abierto), se sabe que P(S
1
*)=0.1, luego P(S1) =0.9. Y anlogamente
para los otros interruptores. El mecanismo solo funciona cuando los interruptores estn cerrados,
y esto corresponde al suceso compuesto S1 S2 S3 S4, luego P(F*)=P(S1 S2 S3 S4).
Aplicando ahora el teorema sobre la ley de la probabilidad compuesta para sucesos
independientes, tenemos:
P(S1 S2 S3 S4) = P(S1)P(S2)P(S3)P(S4)= (0.9)(0.9)(0.9)(0.9)= 0.6561 y a partir de ah:
P(F*)= 1 0.6561 = 0.3439.
Ejercicio 3. En un almacn se tiene que despachar 60 pedidos, y se sabe que 5 de ellos son de
una cierta mercanca A. Si se cumplimentan los 60 pedidos al azar, cul es la probabilidad de
que el primero y el cuarto pedido sean de la mercanca A y de que simultneamente no lo sean el
segundo y el tercero?. Cul es la probabilidad de que en los cuatro primeros pedidos a
cumplimentar haya al menos dos pedidos de la mercanca A?
Solucin.
155
Vamos a representar por A el suceso consistente en que un pedido determinado que se est
despachando sea de la mercanca A, y por A* el suceso complementario consistente en que no
sea de la mercanca A.
Como la probabilidad de que un pedido determinado se refiera a una clase de mercanca
determinada (sea A o A*) est influida por el nmero de pedidos de la misma clase que se hayan
despachado antes, este problema ilustra la ley general de la probabilidad compuesta, expresada en
la Ley general de la probabilidad compuesta:
n
n-1 1 2 1 3 1 2
j=1
j=1
P ( ). ( / ). ( / )...P
n
j
j
A
A P A P A A P A A A
A
_

_




,

,
I
I
Una buena forma de considerar el problema es imaginar un mazo de 60 cartas, todas iguales,
excepto que 5 de ellas estn sealadas con A y 55 sealadas con A*. La accin de cumplimentar
los pedidos se puede asociar a la de sacar cartas de un mazo bien barajado, de forma que todas las
cartas que se pueden sacar en una prueba determinada tienen las mismas probabilidades de ser
elegidas.
El suceso de que los pedidos primero y cuarto sean de la mercanca A y el segundo y tercero no,
corresponde a sacar la sucesin de cartas A ,A*, A*, A. Como hay 5 cartas sealadas con A, la
probabilidad de que la primera carta sea una A es 5/60. En la segunda prueba hay 59 cartas en la
baraja, y 55 de ellas estn sealadas con A*. Luego la probabilidad condicionada de que la
segunda carta sea una A* es 55/59. En la tercera prueba quedan 58 cartas, y 54 de ellas estn
sealadas con A*. Luego, la probabilidad condicionada de que la tercera carta sea una A* es
54/58. Finalmente, en la cuarta prueba quedan 57 cartas, de las cuales 4 estn sealadas con A,
luego la probabilidad de que la cuarta carta sea una A es 4/57. Por tanto, multiplicando estas
probabilidades de acuerdo con el teorema que expresa la ley general de la probabilidad
compuesta, obtenemos:
P(A, A*, A*, A) = (5/60) (55/59)(54/58)(4/57) = 0.0051.

Si llamamos E al suceso de que al menos dos pedidos de los cuatro primeros a cumplimentar sean
de la mercanca A, su probabilidad es igual a 1-P(E*), siendo E* el suceso de que los primeros
cuatro pedidos contengan menos de dos pedidos de la mercanca A, es decir, cero o uno. Pero la
probabilidad de que ninguno de los pedidos sea de la mercanca A est dada por:
P(0)= P(A*, A*, A*, A*)= (55/60)(54/59)(53/58)(52/57) = 0.6994.
Como el suceso de que uno de los pedidos sea de la mercanca A puede ocurrir de cuatro formas
mutuamente excluyentes, su probabilidad total es:
P(1) = P(A, A*, A*, A*)+ P(A*, A, A*, A*)+ P(A*, A*, A, A*)+ P(A*, A*, A*, A)
= (5/60)(55/59)(54/58)(53/57) + (55/60)(5/59)(54/58)(53/57)+ (55/60)(54/59)(5/58)
(53/57)+ (55/60)(54/59)(53/58)(5/57) = 0.269
Por todo ello tendremos: P(E*)= P(0)+P(1) = 0.6994+0.269= 0.9684 y la probabilidad buscada
es:
156
P(E)= 1- P(E*)= 1 - 0.9684= 0.0316.
Ejercicio 4. Sea un dado tal que la probabilidad de las distintas caras es proporcional al nmero
de puntos inscritos en ellas. Hallar la probabilidad de obtener con este dado un nmero par.
Ejercicio 5. Se elige un nmero al azar del 1 al 6,000, todos igualmente probables. Hallar la
probabilidad de que sea mltiplo de 2 de 3 de 4 de 5.
Ejercicio 6. En un juego de dados, hemos apostado por el 2. Se tira el dado, y antes de ver el
resultado, nos dicen que ha salido par. Hallar la probabilidad de ganar.
Ejercicio 7. En una reunin hay 25 personas. Calcular la probabilidad de que celebren su
cumpleaos el mismo da del ao al menos dos personas.
Ejercicio 8. Un dado slo tiene tres caras posibles: 1, 2 y 3, igualmente probables. Realizamos el
siguiente juego: tiramos el dado, si sale 3 ganamos, si sale 1 2 continuamos tirando hasta repetir
el resultado de la primera tirada, en cuyo caso ganamos, o hasta obtener un tres y entonces
perdemos. Se pide la probabilidad de ganar.
Ejercicio 9. Un parque natural est dividido en dos partes A y B por un ro. Hay 10 ciervos en la
parte A y otros 10 en la parte B. Un bilogo realiza investigaciones sobre la conducta de un cierto
ciervo X que est en A. Por un descuido de los vigilantes 9 ciervos de A pasan a B. stos lo
advierten y devuelven 9 ciervos (escogidos al azar) al territorio A. Informado el bilogo de tal
contingencia, desea proseguir sus investigaciones sobre X. En cul de las dos partes A y B es
preferible que empiece a buscar su ciervo?
Ejercicio 10. Se hacen 6 tiradas con una moneda. Hallar la probabilidad de obtener una racha
ininterrumpida de por lo menos tres caras.
Ejercicio 11. En una reunin, n personas (n > 2) lanzan una moneda al aire. Si hay una que
difiere de todas las dems, su propietario paga una ronda. Cul es la probabilidad de que esto
ocurra?
Ejercicio 12. Un examen consta de 5 temas numerados. Para elegir un tema al azar, se propone
lanzar un dado. Si sale de 1 a 5, el nmero del tema es el resultado del dado; si sale 6 se vuelve a
tirar hasta que sale de 1 a 5. Demostrar que la probabilidad de eleccin de cada tema es 1/5.
Ejercicio 13. Una urna contiene 5 bolas blancas y 3 bolas negras. Tres jugadores A, B y C
extraen una bola, sin devolucin, en este mismo orden. Gana el primer jugador que saca bola
blanca. Calcular la probabilidad de que gane C.
Ejercicio 14. Una urna se ha llenado tirando una moneda al aire dos veces y poniendo una bola
blanca por cada cara y una bola negra por cada cruz. Se extrae una bola que es blanca. Hallar la
probabilidad de que la otra bola tambin lo sea.
Ejercicio 15. En una universidad en la que slo hay estudiantes de Arquitectura, Ciencias y
Letras, termina la carrera el 5% de Arquitectura, el 10% de Ciencias y el 20% de Letras. Se sabe
157
que el 20% estudian Arquitectura, el 30% Ciencias y el 50% Letras. Eligiendo un estudiante al
azar, se pide:
d) Probabilidad de que sea de Arquitectura y haya terminado la carrera.
e) Nos dice que ha terminado la carrera. Probabilidad de que sea de Arquitectura.
Ejercicio 16. Un jugador tira un dado, sale 6 y gana. Hallar la probabilidad de que haya hecho
trampa. (Sugerencia: Resolverlo bajo el supuesto de que el 50% de los jugadores son tramposos)
Ejercicio 17. Se lanzan tres monedas simtricas. Calcular la probabilidad de que salgan las tres
tiradas iguales.
Ejercicio 18. Se lanza un dado n veces. Calcular la probabilidad de obtener al menos un seis.
Ejercicio 19. Se tiene un cuadrado inscrito en un circulo de radio r. Se eligen tres puntos al azar e
independientes dentro del circulo. Hallar la probabilidad de que los tres puntos caigan dentro del
cuadrado.
*Ejercicio 20. Al contestar una pregunta con sus n posibles respuestas, una persona o bien
conoce la respuesta correcta (lo cual ocurre con probabilidad p) o bien lo adivina con
probabilidad 1/n. Calcular la probabilidad de que conociese la respuesta, supuesto que ha
contestado correctamente.
*Ejercicio 21. Con una moneda se juega a cara o cruz. Se para de lanzar cuando por primera vez
la diferencia entre el nmero de caras y el nmero de cruces es en valor absoluto igual a 3.
Calcular la probabilidad de que paremos de lanzar la moneda en la sexta tirada o antes. Idem en
la n-sima tirada o antes.
*Ejercicio 22. Entre 5 ciudades situada en los vrtices de un pentgono A-B-C-D-E-A, un
transportista que parte de A realiza viajes de modo que en cada ciudad tiene probabilidad 1/3 de
ir a la izquierda y 2/3 de ir a la derecha. Calcular la probabilidad de que el primer regreso a A sea
por la ciudad contraria hacia la que parti habiendo pasado una sola vez por D. Idem pero
regresando por BA, y pasando adems por D una sola vez.
**Ejercicio 23. Un profesor tiene una caja de cerillas en cada una de sus dos bolsillos, ambas con
el mismo nmero N de cerillas, y va sacando al azar cerillas de cada bolsillo, una a una. Calcular
la probabilidad de que en el bolsillo izquierdo quede exactamente k cerillas cuando en el derecho
saca la ltima.
**Ejercicio 24. En 4 ciudades situadas en los vrtices de un cuadrado, un transportista realiza
viajes de manera que en cada ciudad tiene una probabilidad p de ir a la derecha y q=1-p de ir
hacia la izquierda. Hallar la probabilidad de que el primer regreso a la ciudad de partida, A, se
produzca por la ciudad contraria hacia la que parti.
7.9.1. Problemas variados de probabilidad
Hoja de ejercicios 3 (Problemas de refuerzo).
158
1. Una experiencia puede dar k resultados posibles mutuamente excluyentes, R
1
, R
2
, ,R
k
cuyas
probabilidades respectivas son p
1
, p
2
, , p
k
, siendo su probabilidad total igual a la unidad, es
decir, p
1
+ p
2
+ + p
k
= l. Si se ejecutan N pruebas independientes de la experiencia, cul es la
probabilidad de obtener exactamente n
1
resultados del primer tipo, n
2
del segundo,, y n
k
del k-
simo, siendo n
1
+ n
2
+ + n
k
= N?
RESPUESTA 1.
Como las pruebas son independientes, la probabilidad de obtener un resultado determinado
cualquiera Ri en una prueba dada no est influida en absoluto por los resultados de otras pruebas.
Por tanto, la probabilidad Ps de una sucesin determinada cualquiera de resultados es igual al
producto de sus probabilidades incondicionales separadas y, por tanto,
El nmero S de sucesiones distintas que dan el nmero deseado de resultados de cada clase es
igual a Pm(N; n
1
, n
2
, , n
k
) y la probabilidad total P(n
1
, n
2
, , n
k
) viene dada por el producto
S.P
s
; por consiguiente :
2. El informe de un ingeniero sobre las causas de avera en los calentadores de agua domsticos
revel que el 90% de las averas se deban a uno de estos tres factores : escapes en las soldaduras,
escapes en las juntas, o corrosin en puntos aislados, siendo las probabilidades respectivas de
0.4 ; 0.3 y 0.2. Despreciando la posibilidad remota de que se produzcan averas simultneas, y
suponiendo pruebas independientes, cul es la probabilidad de que una muestra aleatoria de
cinco averas contenga dos casos de escapes en las soldaduras, dos de escapes en las juntas, uno
de corrosin en un punto aislado y ninguno debido a otras causas?
RESPUESTA 2.
Aceptando la hiptesis de que las averas simultneas son despreciables, podemos considerar los
diferentes tipos de averas como sucesos mutuamente excluyentes, e incluyendo la categora de
"averas diversas", obtenemos un sistema exhaustivo. Por tanto, podemos aplicar directamente la
ley polinomial de la probabilidad, y la solucin est dada por:
3. La probabilidad de que un vendedor a domicilio consiga una venta en un solo intento es 1/6.
a) Cul es la probabilidad de que consiga al menos una venta en los cinco intentos siguientes?
b) Cul es la probabilidad de que consiga, en esos cinco intentos, cuatro o ms ventas?
RESPUESTA 3.
Aunque puede no ser estrictamente cierto, vamos a suponer que un intento no afecta a otro.
159
1 2
1 2 1 2
1 2
!
( , , ... , ) ...
! ! ... !
k
n n n
k k
k
N
P n n n p p p
n n n

a) La probabilidad P(E) del suceso de que el vendedor consiga al menos una venta en los cinco
intentos es igual a 1 ( ) P E , siendo el suceso complementario de que no consiga ninguna venta.
En este caso:
0 5
5!
( ) (1/ 6) (5/ 6)
0!5!
P E =0.402
Ahora, P(E)= 1-0.402= 0.598
b) El suceso E' de conseguir cuatro o ms ventas se puede producir de dos maneras mutuamente
excluyentes: consiguiendo exactamente cuatro ventas o consiguiendo exactamente cinco ventas.
Luego:
4 1 5 0
5! 5!
( ) (1/ 6) (5/ 6) (1/ 6) (5/ 6) 0.0032 0.0001 0.0033
4!1! 5!0!
P E + +
4. Tres urnas, U
1
, U
2
, U
3
, contienen bolas blancas, negras y rojas en proporciones diferentes. U
1
contiene una bola blanca, dos negras y tres rojas; U
2
contiene dos bolas blancas, una negra y
una roja, y U
3
contiene cuatro bolas blancas, cinco negras y tres rojas. Sacamos dos bolas de
una urna, sin saber de qu urna son. Si resulta que una bola es blanca y la otra es roja,
calclense las probabilidades respectivas de que la urna de la cual se han sacado las bolas sea
la U
1
, la U
2
la U
3
.
RESPUESTA 4.
Podemos suponer razonablemente que las tres urnas tienen la misma probabilidad de haber sido
elegidas, por lo que tenemos P(U
i
) = 1/3 (i = 1, 2, 3). Las probabilidades condicionadas del
suceso A (sacar una bola blanca y otra roja, a la vez) las calculamos como sigue: En la urna U1
tenemos una bola blanca y tres rojas frente a 6 bolas en total. Esto supone que tenemos tres casos
favorables dados por la bola blanca con cada una de las rojas y 15 casos posibles que resultan del
nmero de combinaciones de 6 elementos tomados de dos en dos, C(6, 2) = 6!/2!(6-2)! = 15. Por
todo ello, la probabilidad P(A/U
1
) vale 3/15 = 1/5. De forma anloga obtenemos tambin P(A/U
2
)
= 1/3 y P(A/U
3
) = 2/11.
Sustituyendo estos valores en la frmula de Bayes, obtenemos las probabilidades respectivas
1
(1/ 3)(1/ 5) 33
( / )
(1/ 3)(1/ 5) (1/ 3)(1/ 3) (1/ 3)(2/11) 118
P U A
+ +
2
(1/ 3)(1/ 3) 55
( / )
(1/ 3)(1/ 5) (1/ 3)(1/ 3) (1/ 3)(2/11) 118
P U A
+ +
160
3
(1/ 3)(2/11) 30
( / )
(1/ 3)(1/ 5) (1/ 3)(1/ 3) (1/ 3)(2/11) 118
P U A
+ +
Resulta evidente que la suma de los tres casos es la unidad.
5. Se lanza una moneda y, si sale cara, se mete una bola negra en una urna; si sale cruz, se mete
en la urna una bola blanca. Se hace esta operacin cuatro veces. A continuacin otra persona
saca dos bolas simultneamente de la urna, que resultan ser negras. Cul es la probabilidad de
que en la urna hubiera dos bolas blancas y dos negras?
RESPUESTA 5.
Debido al mtodo utilizado para llenar la urna, existen cinco posibilidades para la distribucin
final del color de las cuatro bolas, y se puede calcular la probabilidad de que se produzca cada
una de las distribuciones de colores. Son las siguientes:
Grupos de 4 bolas blancas (B1) = 4!/4!0! = 1
Grupos de 3 blancas y una negra (B2) = 4!/3!1! = 4
Grupos de 2 blancas y 2 negras (B3) = 4!/2!2! = 6
Grupos de 1 blanca y 3 negras (B4) = 4!/1!3! = 4
Grupos de 4 bolas negras (B
5
) = 4!/0!4! = 1
En total tenemos 2
n
= 2
4
= 16 grupos, por lo que las probabilidades respectivas son:
P(B
1
) = 1/16 ; P(B
2
) = 4/16 ; P(B
3
) = 6/16 ; P(B
4
) = 4/16 ; P(B
5
) = 1/16.
En el caso que estamos considerando, el suceso A (sacar dos bolas negras) no puede ocurrir con
los antecedentes B
1
, y B
2
, por lo que las probabilidades condicionadas P(A/B
1
) y P(A/B
2
) tienen
que ser nulas. Las otras tres probabilidades condicionadas se calculan como sigue: para la
primera tenemos 1 caso favorable y 6 casos posibles que resultan del nmero de combinaciones
de 4 elementos tomados de 2 en 2. As pues:
P(A/B
3
) = 1/C(4, 2) = 1/6
Para la segunda y tercera, por una deduccin anloga tenemos
P(A/B
4
) = C(3, 2)/C(4, 2) = 1/2 ; P(A/B
5
) = C(4, 2)/C(4, 2) = 1
Por lo tanto, la probabilidad buscada viene dada por la frmula de Bayes
161
6. Un avin cubre diariamente el servicio entre dos ciudades. Suponemos que la probabilidad de
accidente en da sin niebla es 0.002 y en da con niebla 0.01. Cierto da de un mes que hubo 18
das sin niebla y 12 con niebla se produjo un accidente. Calcular la probabilidad de que el
accidente haya ocurrido: a) en da sin niebla; b) en da con niebla.
RESPUESTA 6.
Sea A
1
el suceso "da sin niebla"; A
2
el suceso "da con niebla" y B el suceso "ocurrir accidente".
Se tiene:
y aplicando la frmula de Bayes:
7. Un avin con tres bombas trata de destruir una lnea frrea. La probabilidad de destruir la lnea
con cualquiera de las bombas es 1/3. Cual es la probabilidad de que la lnea quede destruida
si el avin emplea las tres bombas?

RESPUESTA 7.
.) Denotemos por A
i
al suceso de que la bomba i destruya la lnea frrea; se tiene:
P(A
i
) = p = 1/3, con i = 1, 2, 3.
Si A es el suceso de que la lnea quede destruida podemos escribir:
De ese modo, la probabilidad de que la lnea quede destruida es de 19/27.
..) El problema se puede resolver tambin como sigue: Sea B
i
el suceso de que la bomba i no
destruya la lnea, y B el suceso de que la lnea no se destruya.
Se tiene:
Como los sucesos B
1
, B
2
y B
3
son independientes, resulta:
P(B) = P(B
1
).P(B
2
).P(B
3
) = (2/3) (2/3) (2/3)= 8/27 y la probabilidad de que la lnea quede
destruida vendr dada por :
162
P(A) = 1 P(B) = 1 (8/27) = 19/27 y evidentemente, este resultado coincide con el anterior.
8. Se hace un disparo con cada uno de tres caones (A, B y C), siendo la probabilidad de hacer
blanco 0.1, 0.2 y 0.3, respectivamente. Calclese la probabilidad de cada uno de los nmeros
posibles de blancos. Calcular la probabilidad de obtener al menos un blanco.
RESPUESTA 8.
Los nmeros posibles de blancos son:
a) 3 si se hace blanco con cada uno de los caones.
b) 2 si se falla en un disparo.
c) 1 si se fallan dos disparos
d) 0 si se fallan los tres disparos.
En el caso (a), la probabilidad de acertar en todos los disparos vendr dada como el producto de
las probabilidades independientes de acertar cada disparo, es decir:
( ) P A B C
= P(A).P(B).P(C) = (0.1)*(0.2)*(0.3) = 0.006
En el caso b) tenemos:
1) Probabilidad de acertar A y B fallando C:
P(A) .P(B) .P(C) = P(A) .P(B)[ 1 P(C)] = 0.1 x 0.2 x 0.7 = 0.014
2) Probabilidad de acertar A y C fallando B :
P(A).P(B').P(C) = F(A)[1 - P(B)]P(C) = 0.1 x 0.8 x 0.3 = 0.024
3) Probabilidad de acertar B y C fallando A :
P(A').P(B).P(C) = [1 - P(A)P(B).P(C) = 0.9 x 0.2 x 0.3 = 0.054
As, la probabilidad total de fallar un disparo es:
0.014 + 0.024 + 0.054 = 0.092
En el caso (c) tenemos varias posibilidades:
1) Probabilidad de acertar A y fallar B y C:
P(A).P(B').P(C') = P(A)[1 - P(B)][1 - P(C)] = 0.1 x 0.8 x 0.7 = 0.056
2) Probabilidad de acertar B y fallar A y C:
P(A').P(B).P(C') = [1 - P(A)]P(B)[1 P(C)] = 0.9 x 0.2 x 0.7 = 0.126
3) Probabilidad de acertar C y fallar A y B:
P(A') .P(B') .P(C) = [1 - P(A)] [1 - P(B)] P(C) = 0.3 x 0.9 x 0.8 = 0.126
163
As pues, la probabilidad total de fallar dos disparos ser:
0.056 + 0.126 + 0.216 = 0.392
Caso d)
Puesto que cada disparo es independiente de los otros dos, la probabilidad de fallar en todos
vendr dada por el producto de las probabilidades respectivas de fallo, es decir
( ) P A B C
= P(A').P(B').P(C') = [1 - P(A)][1 - P(B)][1 P(C)] = 0.9x0.8x0.7 = 0.504
9. Distribuimos al azar r bolas en n celdas. Hallar la probabilidad de que una celda especificada a
priori tenga exactamente k bolas.
10. De una urna que contiene b bolas blancas y n bolas negras se extrae k bolas al azar (sin
remplazamiento). Calcular la probabilidad de que exactamente x de ellas sean blancas.
11. De los 30 temas de un examen, un alumno sabe 18. Le proponen dos tipos de examen: Los
miembros del tribunal eligen 3 temas y debe contestar dos; o bien el tribunal elige 5 temas y debe
contestar 3 de ellos. Cul es el examen ms favorable para el alumno?
12. Una persona ha comprado 40 billetes de una lotera de 100 nmeros. Si la lotera consta de
tres premios. Cul es la probabilidad de que gane slo un premio? Al menos uno? Ninguno?
13. Una caja contiene 90 piezas buenas y 10 defectuosas. Sacamos 10 piezas aleatoriamente.
Calcular la probabilidad de que entre esas 10 piezas no haya ninguna defectuosa. Idem que haya
k defectuosas.
14. Un grupo de diez concejales son elegidos al azar de un total de 50 municipios para formar una
comisin. Suponiendo que cada municipio tiene dos concejales, Cul es la probabilidad de que
los dos concejales de cierto municipio estn en dicha comisin? Y de que ninguno est?
*15. En una urna se introducen n bolas, cada una de las cuales pueden ser blanca o negra con
probabilidades iguales. A continuacin se extraen k bolas con remplazamiento. Cul es la
probabilidad de que la urna contenga slo bolas blancas si las k extradas han resultado ser
blancas?
*16. Una secretaria ha escrito n cartas con sus correspondientes n sobres. Se introduce al azar las
cartas en los sobres, Cul es la probabilidad de que al menos una carta vaya a parar a su
correspondiente sobre? Hallar el valor de esta probabilidad cuando n tiende a infinito.
** 17. La probabilidad de que un rbol de una cierta variedad de mangos tenga n flores es
(1 )
n
p p (n=0, 1, 2, 3, 4, . . .) . Cada flor tiene una probabilidad de 2/3 de ser fecundada y dar
fruto, independientemente del resto de las flores del rbol. Cada fruto tiene probabilidad de ser
picado por los pjaros antes de la cosecha. Se desea: a) obtener la probabilidad de que una flor
produzca fruto cosechable; b) Calcular la probabilidad de que un rbol que tiene r frutos haya
tenido n flores.
164
7.9.2. Hoja 4. Ejercicios de probabilidad (Repaso, Captulo 6 y 7)
1. De cuntas maneras pueden sentarse 10 personas en un banco si hay 4 sitios disponibles?
2. Hay que colocar a 5 hombres y 4 mujeres en una fila de modo que las mujeres ocupen los
lugares pares. De cuntas maneras puede hacerse?
3. Cuntos nmeros de 4 dgitos se pueden formar con las cifras 0,1,. . . ,9. a) permitiendo
repeticiones; b) sin repeticiones.
4. Cul es el mnimo nmero de alumnos que debe tener una clase para garantizar una
probabilidad 0.5 de que el da de cumpleaos de algn alumno coincida con el da de
cumpleaos del rector de la universidad? Se asume que los aos son de 365 das.
5. Un banco ha comprobado que la probabilidad de que un cliente con fondos extienda un
cheque con fecha equivocada es de 0.001. En cambio, todo cliente sin fondos pone una
fecha errnea en sus cheques. El 90% de los clientes del banco tienen fondos. Se recibe
hoy en caja un cheque con fecha equivocada. Qu probabilidad hay de que sea de un
cliente sin fondos?
6. *En una bolsa hay cinco bolas, blancas o negras. Se extrae una bola y es blanca. Hllese
la probabilidad de que en la bolsa haya dos blancas y tres negras si para formar la urna se
tiraron cinco monedas y se metieron tantas blancas como caras resultaron y tantas negras
como cruces.
7. *Una urna contiene cinco dados con sus caras de color blanco o rojo. El dado nmero i (i
= 1; 2; 3; 4; 5) tiene i de sus caras blancas y el resto rojas. Se selecciona al azar un dado
de la urna, se lanza y sale cara roja. Cul es la probabilidad de que el dado seleccionado
sea el i?
8. Dos personas lanzan una moneda n veces cada una. Cul es la probabilidad de que
obtengan el mismo nmero de caras?
9. Se tiene un examen con 10 preguntas con respuesta dicotmicas (V/F). El examen se
aprueba cuando se aciertan 6 ms preguntas. Calcular la probabilidad de aprobar el
examen dado que no se sabe ninguna pregunta.
10. Una moneda tiene probabilidad p de caer cara. Hallar la probabilidad de que al tirar esta
moneda 11 veces se obtenga la sexta cara en la undcima tirada.
11. N bolas se reparten al azar en n celdas (N>n). Cul es la probabilidad de que todas las
celdas queden ocupadas?
12. *Un examen de oposicin consta de 14 temas. Se debe escoger un tema de entre dos
tomados al azar. Calcular la probabilidad de que a un alumno que ha preparado 5 temas le
toque al menos uno que sabe. Cul es el nmero mnimo de temas que debe preparar
para que tenga una probabilidad superior a 1/2 de superar el examen?
13. Obtener la probabilidad p de que al lanzar n veces dos dados se obtenga al menos un 6
doble. Cuntas partidas habr que jugar para que tengamos p = 1/2 de obtener un 6
doble?
14. N parejas se renen y se emparejan al azar para bailar. Calcular la probabilidad de que
ninguna baile con su pareja.
165
15. *Cuatro ciudades (1,2,3 y 4) estn interconectadas, un transportista realiza viajes de
manera que: a) La probabilidad de ir de la ciudad 1 a la i (i=1, 2, 3, 4) es
. (1, ), d i

y d(1,i)=|i-1| y la suma de estas probabilidades es 1. b) La probabilidad de ir de la ciudad
2 a la j (j=1, 2, 3,4) es
. (2, ), d j
y d(2,j)=|j-2| y la suma de estas probabilidades
es 1. c) La probabilidad de ir de la ciudad 3 a la k (k=1, 2, 3, 4) es
. (3, ), d k
y
d(3,k)=|k-3| y la suma de estas probabilidades es 1. Si el transportista sale de la ciudad 1,
Cul es la probabilidad de llegar por primera vez a la ciudad 4 sin haber regresado a la
ciudad de partida?
16. El profesor Prez olvida poner su despertador 3 de cada 10 das. Adems, ha comprobado
que uno de cada 10 das en los que pone el despertador acaba no levandandose a tiempo
de dar su primera clase, mientras que 2 de cada 10 das en los que olvida poner el
despertador, llega a tiempo a dar su primera clase.
a) Cul es la probabilidad de que el profesor Prez llegue a tiempo a dar su primera
clase?
b) Si un da no ha llegado a tiempo, qu probabilidad hay de que olvidase poner el
despertador la noche anterior?
17. Un banco local revisa su poltica de tarjetas de crdito, con el objetivo de cancelar algunas
de ellas. En el pasado, el 5% de los clientes con tarjeta ha pasado a ser moroso, esto es ha
dejado de pagar sin que el banco pudiera recuperar la deuda. Adems, el banco ha
comprobado que la probabilidad de que un cliente normal se atrase en un pago es de 0.2.
Naturalmente, la probabilidad de que un cliente moroso se atrase en un pago es 1.
a) Elegido un clienta al azar, qu probabilidad hay de que el cliente se atrase en un pago
mensual?
b) Si un cliente se atrasa en un pago mensual, calcular la probabilidad de que el cliente acabe
convirtindose en moroso.
c) Al banco le gustara cancelar la lnea de crdito de un cliente si la probabilidad de que
ste acabe convirtindose en moroso es mayor de 0.25. De acuerdo con los resultados
anteriores, debe cancelar una lnea si un cliente se atrasa en un pago? Por qu?
18. *En un pueblo de n + 1 habitantes, una persona le rumorea algo a una segunda persona,
quien lo repite a una tercera, etc. En cada paso se elige aleatoriamente al receptor del
rumor de entre n personas. Encontrar la probabilidad de que el rumor pase r veces sin: a)
Regresar al que lo origin y b) Repetrsele a una persona.
Captulo 8. Variables aleatorias y distribuciones de
probabilidad
8.1. Nociones bsicas
Para introducir el concepto de variable aleatoria, veamos primero algunos ejemplos, al arrojar dos
dados, sabemos que la suma X de los puntos que caen hacia arriba debe ser un nmero entero
entre 2 y 12, pero no podemos predecir que valor de X aparecer en el siguiente ensayo, por lo
que decimos que X depende del azar, por lo tanto es una variable aleatoria que toma valores entre
166
2 y 12. El tiempo de vida de un foco que se extrae aleatoriamente de un lote de focos depende
tambin del azar, este constituye otro ejemplo de una variable aleatoria que vara entre el tiempo
0 y un valor indeterminado, ya que no sabemos exactamente cunto tiempo va durar. El nmero
de varones de una familia con 5 hijos tambin es una variable aleatoria que vara de 0 a 5, ya que
en una familia de cinco hijos puede que no haya ningn varn, uno, dos, tres, cuatro o cinco
varones.
Si las observaciones no se dan en trminos numricos, podemos asignarles nmeros y reducir las
observaciones cualitativas al caso cuantitativo; as tenemos que la funcin que asigna valores
numricos a cada uno de los elementos del espacio muestra con una probabilidad definida, se
denomina "variable aleatoria".
Por ejemplo, si se lanza una moneda 3 veces, el nmero de guilas X es una variable aleatoria
que toma los valores 0, 1, 2, 3; es decir puede que ninguna vez, una sola, dos o tres veces salga
guila como resultado; la probabilidad de que (dos guilas) es 3/8 ya que el espacio muestra
S={aaa, aas, asa, ass, sas, ssa, saa, sss}. Y de estos ocho resultados hay tres en los cuales hay dos
guilas. Con esto podemos ver que el espacio muestral es el dominio de la funcin y el conjunto
de valores que la variable puede tomar es el rango o recorrido de la funcin, que es un
subconjunto de los reales .
Fig.3.1. Variable aleatoria
Si el conjunto de valores de X es un conjunto finito o infinito numerable, es decir, si se pueden
enlistar o enumerar, se dice que la variable aleatoria es discreta, y si el conjunto de valores de X
es no numerable, la variable aleatoria se llama variable aleatoria continua. Son ejemplos de
variables aleatorias continuas: la estatura, el peso, la edad, el volumen, el pH, etc. Algunos
ejemplos de variables discretas aleatorias son: el nmero de alumnos que asisten diariamente
durante un semestre, el nmero de accidentes automovilsticos en una ciudad por da, el nmero
de piezas defectuosas por lote, el nmero de alumnos aprobados por grupo en un examen, etc.
Una variable aleatoria X es una funcin cuyo dominio es el espacio muestral S y cuyo
rango es un subconjunto de los nmeros reales que tiene asociada a su conjunto de
valores una funcin de probabilidad.
Matemticamente, decimos: Dado un espacio de probabilidad ( , ,Pr), una variable aleatoria
es cualquier funcin, X,
167

:
( )
X
w X w

que asocia a cada suceso elemental un nmero real, verificando que


{ } Pr ( ) Pr[ ] Pr / ( )
X
B X B w X w B B
El conjunto S es el espacio muestral y es la coleccin de todos los subconjuntos de .
Identificacin de una variable aleatoria discreta X: es preciso conocer el conjunto de los
posibles resultados de X:
{x
1
, x
2
, ,x
k
, }, donde los x
i
no necesariamente son todos enteros, pero si se pueden
contar o numerar.
El conjunto de las probabilidades siguientes:
p1 = P(X = x
1
)
p2 = P(X = x
2
)
...
P
k
= P(X = x
k
)
...
Propiedades importantes de la funcin de probabilidad:
a) pi 0 para todo i
b) pi = 1 para todo i
La representacin grfica de la funcin de probabilidad de una variable aleatoria discreta es
anloga al diagrama de barras de frecuencias relativas de una variable estadstica discreta.
La funcin de distribucin de una variable aleatoria discreta X es:

( ) ( ) Pr( )
i
X i
x t
F t P X t x

para todo t
La representacin grfica de la funcin de distribucin de una variable aleatoria discreta es
anloga al grfico de frecuencias relativas acumuladas de una variable estadstica discreta.
La media de una variable aleatoria discreta X es:
= E(X) = xi pi , para todo i.
La varianza de una variable aleatoria discreta X es:

2
= Var(X) = (xi-)
2
pi, para todo i
La desviacin tpica de una variable aleatoria discreta X es:
= (Var(X))
1/2
Ejemplo 8.1. Supongamos que la Secretara del Medio Ambiente inspecciona una vez al mes la
cantidad de un contaminante que descarga una compaa de productos qumicos. Si la cantidad
del contaminante excede el nivel mximo permitido, se multa a la compaa y se le obliga a
corregir el problema. Consideremos las siguientes dos variables aleatorias asociadas a este
problema:
Primero digamos que X es el nmero de meses antes de que la compaa excede los lmites
permitidos del contaminante. Esta variable toma valores 1, 2, 3, pero no conocemos donde
168
termina, ya que quizs nunca exceda estos lmites permitidos, por lo tanto, el conjunto de valores
de X es el conjunto de los nmeros enteros positivos. Como podemos enlistar o numerar el
conjunto (es un conjunto numerable) de valores de la variable X, decimos que la variable
aleatoria X es una variable aleatoria discreta.
Ejemplo 8.2. Supongamos que nos interesamos por el nmero de varones X en el experimento de
observar al azar dos nios recin nacidos (Sea H = hombre y M = mujer). Entonces, el espacio
muestra, los valores de la variable aleatoria X que cuenta el nmero de varones y su funcin de
probabilidad se dan en la siguiente tabla:
S Valores de X: x
i
MM 0
MH , HM 1
HH 2

Ejemplo 8.3. Sea X la variable aleatoria que indica la suma de los puntos en las caras superiores
al lanzar dos dados, Determine el espacio muestral, el conjunto de valores de X y las
probabilidades respectivas.
Solucin: El espacio muestral S es el conjunto de los 36 pares ordenados que se indican a
continuacin:
Este conjunto se puede visualizar como el conjunto de puntos del plano cartesiano que se muestra
a continuacin
Fig. 3.2 Diagrama del Espacio Muestral del lanzamiento de dos dados
169
La variable aleatoria es la suma de los elementos de cada par, por lo tanto, toma los valores del 2
al 12, y las probabilidades para cada uno de los valores de la variable se
indican en la siguiente tabla:
S Valores de X : xi
(1,1) 2
(1,2) (2,1) 3
(1,3) (3,1) (2,2) 4
(1,4) (4,1) (2,3) (3,2) 5
(1,5) (5,1) (2,4) (4,2) (3,3) 6
(1,6) (6,1) (2,5) (5,2) (3,4) (4,3) 7
(2,6) (6,2) (3,5) (5,3) (4,4) 8
(3,6) (6,3) (4,5) (5,4) 9
(4,6) (6,4) (5,5) 10
(5,6) (6,5) 11
(6,6) 12

Total:
La grfica de lneas para este ejemplo es:
170
Fig. 3.3. Grfico de probabilidad
8.2. Distribucin de probabilidad binomial
La distribucin binomial es tpica de las variables que proceden de un experimento que cumple
las siguientes condiciones:
1) El experimento est compuesto de n pruebas iguales, siendo n un nmero natural fijo.
2) Cada prueba resulta en un suceso que cumple las propiedades de la variable binmica o de
Bernouilli, es decir, slo existen dos posibles resultados, mutuamente excluyentes, que se
denominan generalmente como xito y fracaso.
3) La probabilidad del xito (o del fracaso) es constante en todas las pruebas. P(xito) = p ;
P(fracaso) = 1 - p = q
4) Las pruebas son estadsticamente independientes.
En estas condiciones, la variable aleatoria X que cuenta el nmero de xitos en las n pruebas se
llama variable binomial. Evidentemente, el espacio muestral est compuesto por los nmeros
enteros del 0 al n. Se suele decir que una variable binmica cuenta objetos de un tipo
determinado en un muestreo de n elementos con reemplazamiento.
La funcin de probabilidad de la variable binomial se representa como b(x,n,p) siendo n el
nmero de pruebas y p la probabilidad del xito, n y p son los parmetros de la distribucin.
La funcin de probabilidad de una variable Binomial es:
171
La media y la varianza de la variable binomial se calculan como:
Media = = n p (verificarla)
Varianza =
2
= n p q (verificarla)
Grficamente el aspecto de la distribucin depende de n y de p. Por ejemplo, si p=0.5 y n
cualquiera es simtrica; si p n es 0.5, la binomial no es simttrica. El siguiente grfico lo ilustra
para n=4.
ASPECTO DE LA BINOMIAL PARA n=4 Y p=0.5 Y p=0.25.
Fig. 3.4. Grficos de probabilidad binomial.
Ejemplo 8.4. Se sabe que el 5% de los libros que se prestan en una biblioteca escolar se
devuelven con retraso. Se realiza el experimento que consiste en observar si la devolucin de 5
libros se hacen con retraso o no.
a) Determinar la funcin de probabilidad y hacer su representacin grfica.
b) Calcular la funcin de distribucin y hacer su representacin grfica.
c) Hallar la media y la varianza.
Solucin:
X= Variable aleatoria = Nmero de devoluciones con retrazo.
X=0,1,2,3,4,5.
a) El Modelo o funcin de probabilidad es
5
5
( , 5, 0.05) 0.04 (1 0.05) , 0,1, 2, 3, 4, 5
x x
b x n p x
x

_


,
172
b)
0, 0
0.7738, 0 1
0.9774, 1 2
( ) 0.9988, 2 3
1 , 3 4
1 , 4 5
1 , 5
X
t
t
t
F t t
t
t
t
<

<

<

<
'

<

<

Grfico de la funcin de distribucin


Fig. 3.5. Grfico de la Funcin de distribucin
c)
2
[ ] 5(0.05) 0.25
[ ] 5(0.05)(0.95) 0.2375
E X np
V X npq



8.3. Distribucin de Poisson
Una variable de tipo Poisson cuenta xitos (es decir, objetos de un tipo determinado) que ocurren
en una regin del espacio o del tiempo.
En este tipo de experimentos los xitos buscados son expresados por unidad de rea, tiempo,
pieza, etc, etc. Ejemplos:
- Nmero de defectos de una tela por m
2
- Nmero de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc, etc.
- Nmero de bacterias por cm
2
de cultivo
- Nmero de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
- Nmero de llegadas de embarcaciones a un puerto por da, mes, etc, etc.
173
El experimento que la genera debe cumplir las siguientes condiciones:
1. El nmero de xitos que ocurren en cada regin del tiempo o del espacio es independiente de
lo que ocurra en cualquier otro tiempo o espacio disjunto del anterior.
2. La probabilidad de un xito en un tiempo o espacio pequeo es proporcional al tamao de
este y no depende de lo que ocurra fuera de l.
3. La probabilidad de encontrar uno o ms xitos en una regin del tiempo o del espacio tiende
a cero a medida que se reducen las dimensiones de la regin en estudio.
Como consecuencia de estas condiciones, las variables Poisson tpicas son variables en las que se
cuentan sucesos raros.
La funcin de probabilidad de una variable Poisson es:
El parmetro de la distribucin es que es igual a la media y a la varianza de la variable.
=E[X]= (verificarlo)

2
=V[X]= (verificarlo)
La distribucin de Poisson se puede considerar como el lmite al que tiende la distribucin
binomial cuando n tiende a y p tiende a 0, siendo np constante (y menor que 7); en esta
situacin sera difcil calcular probabilidades en una variable binomial y, por tanto, se utiliza una
aproximacin a travs de una variable Poisson con media
np
.
La varianza de la variable aproximada es ligeramente superior a la de la variable binomial
Las variables Poisson cumplen la propiedad de que la suma de variables Poisson independientes
es otra Poisson con media igual a la suma las medias.
El aspecto de la distribucin depende muchsimo de la magnitud de la media. Como ejemplo,
mostramos tres casos con = 0,5 (arriba a la izquierda), = 1,5 (arriba a la derecha) y = 5
(abajo) Obsrvese que la asimetra de la distribucin disminuye al crecer y que, en paralelo, la
grfica empieza a tener un aspecto acampanado.
174
Fig. 3.6. Grficos de probabilidad de Poisson.
Ejemplos:
Ejemplo 8.5. Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un da dado, b) 10 cheques sin
fondos en cualquiera de dos das consecutivos?
Solucin:
a) x = variable que nos define el nmero de cheques sin fondo que llegan al banco en un da
cualquiera = 0, 1, 2, 3, ....., etc, etc.
= 6 cheques sin fondo por da

13392 0
24
00248 0 1296
4
718 2 6
6 4
6 4
.
) . )( (
!
) . ( ) (
) , x ( p


b)
x= variable que nos define el nmero de cheques sin fondo que llegan al banco en dos das
consecutivos = 0, 1, 2, 3, ......, etc., etc.
= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos
175
Nota: siempre debe de estar en funcin de x siempre o dicho de otra forma, debe hablar de lo
mismo que x.
104953 0
3628800
000006151 0 10 1917364 6
10
718 2 12
12 10
12 10
.
) . )( . (
!
) . ( ) (
) , x ( p

Ejemplo 8.6. En la inspeccin de hojalata producida por un proceso electroltico continuo, se


identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de
identificar a) una imperfeccin en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c)
cuando ms una imperfeccin en 15 minutos.
Solucin:
a) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 3 minutos =
0, 1, 2, 3, ...., etc., etc.
= 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata


329307 0
1
548845 0 6 0
1
718 2 6 0
6 0 1
6 0 1
.
) . )( . (
!
) . ( ) . (
) . , x ( p
.


b) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 5 minutos =
0, 1, 2, 3, ...., etc., etc.
= 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata

,
_

+

!
) . )( (
!
) . ( ) (
) , , x ( p ) .... etc , , , x ( p
1
718 2 1
0
718 2 1
1 1 1 0 1 1 4 3 2
1 1 0


=1-(0.367918+0.367918) = 0.26416

c) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 15 minutos
= 0, 1, 2, 3, ....., etc., etc.
= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata


+ +

!
) . ( ) (
!
) . ( ) (
) , x ( p ) , x ( p ) , , x ( p
1
718 2 3
0
718 2 3
3 1 3 0 3 1 0
3 1 3 0


= 0.0498026 + 0.149408 = 0.1992106
176
8.4. Distribucin geomtrica
Esta distribucin es un caso especial de la Binomial, ya que se desea que ocurra un xito por
primera y nica vez en el ltimo ensayo que se realiza del experimento, para obtener la frmula
de esta distribucin, haremos uso de un ejemplo.
Ejemplo 8.7. Se lanza al aire una moneda cargada 8 veces, de tal manera que la probabilidad de
que aparezca guila es de 2/3, mientras que la probabilidad de que aparezca sello es de 1/3,
Determine la probabilidad de que en el ltimo lanzamiento aparezca una guila.
Solucin: Si nosotros trazamos un diagrama de rbol que nos represente los 8 lanzamientos de la
moneda, observaremos que la nica rama de ese rbol que nos interesa es aquella en donde
aparecen 7 sellos seguidos y por ltimo una guila; como se muestra a continuacin:
S S S S S S S A
S denotamos;
x = el nmero de repeticiones del experimento necesarias para que ocurra un xito por primera y
nica vez = 8 lanzamientos
p = probabilidad de que aparezca una guila = p( xito) = 2/3
q = probabilidad de que aparezca un sello = p(fracaso) = 1/3
Entonces la probabilidad buscada sera;
P(aparezca una guila en el ltimo lanzamiento)=p(S)*p(S)*p(S)*p(S)*p(S)*p(S)*p(S)*p(A) =
=q*q*q*q*q*q*q*p = q
x-1
p
Luego, la frmula a utilizar cuando se desee calcular probabilidades con esta distribucin sera;

1
( )
x
p x q p

Donde:
p(x) = probabilidad de que ocurra un xito en el ensayo x por primera y nica vez
p
= probabilidad de xito
1 q p
= probabilidad de fracaso
177
Resolviendo el problema de ejemplo;
x = 8 lanzamientos necesarios para que aparezca por primera vez una guila
p = 2/3 probabilidad de que aparezca una guila
q = 1/3 probabilidad de que aparezca un sello
p(x=8) = (1/3)
81
(2/3)= 0.0003048
Ejemplo 8.8. S la probabilidad de que un cierto dispositivo de medicin muestre una desviacin
excesiva es de 0.05, cul es la probabilidad de que; a) el sexto de estos dispositivos de medicin
sometidos a prueba sea el primero en mostrar una desviacin excesiva?, b) el sptimo de estos
dispositivos de medicin sometidos a prueba, sea el primero que no muestre una desviacin
excesiva?.
Solucin:
a) x = 6 que el sexto dispositivo de medicin probado sea el primero que muestre una variacin
excesiva
p = 0.05 =probabilidad de que un dispositivo de medicin muestre una variacin excesiva
q = 0.95 =probabilidad de que un dispositivo de medicin no muestre una variacin excesiva
p(x = 6) = (0.95)
61
(0.05)= 0.03869
b) x = 7 que el sptimo dispositivo de medicin probado, sea el primero que no muestre una
desviacin excesiva
p = 0.95 = probabilidad de que un dispositivo de medicin no muestre una variacin excesiva
q = 0.05 = probabilidad de que un dispositivo de medicin muestre una variacin excesiva
p(x = 7) = (0.05)
71
(0.95)= 0.0000000148
8.5. Distribucin hipergeomtrica
Una variable tiene distribucin hipergeomtrica si procede de un experimento que cumple las
siguientes condiciones:
178
1) Se toma una muestra de tamao n, sin reemplazamiento, de un conjunto finito de N
objetos.
2) K de los N objetos se pueden clasificar como xitos y N - K como fracasos.
X cuenta el nmero de xitos obtenidos en la muestra. Los valores de X en el espacio muestral es
el conjunto de los nmeros enteros de 0 a n, de 0 a K si K < n.
En este caso, la probabilidad del xito en pruebas sucesivas no es constante pues depende del
resultado de las pruebas anteriores. Por tanto, las pruebas no son independientes entre s.
La funcin de probabilidad de la variable hipergeomtrica es:
Los parmetros de la distribucin son n, N y K.
Notacion:
( )
!
! !
n r
n
n
C
r r n r
_

,
.
Los valores de la media y la varianza se calculan segn las ecuaciones:
(verificarlas)
Si n es pequeo, con relacin a N (n << N), la probabilidad de un xito varia muy poco de una
prueba a otra, as pues, la variable, en este caso, es esencialmente binomial; en esta situacin, N
suele ser muy grande y los nmeros combinatorios se vuelven prcticamente inmanejables, as
pues, la probabilidades se calculan ms cmodamente aproximando por las ecuaciones de una
binomial con p = K / N.
La media de la variable aproximada ( = n p = n (K / N)) es la misma que la de la variable antes
de la aproximacin; sin embargo, la varianza de la variable binomial es ligeramente superior a la
de la hipergeomtrica.

el factor por el que difieren ser siempre menor que 1 y tan prximo a 1 como cierto sea que n <<
N.
179
El aspecto de la distribucin es bastante similar al de la binomial. Como ejemplo, mostramos los
casos anlogos a los de la binomial presentados anteriores.
Fig.3.7. Grficos de probabilidad hipergeomtrica
Ejemplo 8.9. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de
narctico en una botella que contiene 9 pldoras de vitamina que son similares en apariencia. Si el
oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) Cul es la
probabilidad de que el viajero sea arrestado por posesin de narcticos?, b) Cul es la
probabilidad de que no sea arrestado por posesin de narcticos?.
Solucin:
a) N = 9+6 =15 total de tabletas
a = 6 tabletas de narctico
n = 3 tabletas seleccionadas
x = 0, 1, 2, o 3 tabletas de narctico = variable que nos indica el nmero de tabletas de
narctico que se puede encontrar al seleccionar las 3 tabletas

p(viajero sea arrestado por posesin de narcticos) = p(de que entre las 3 tabletas
seleccionadas haya 1 o ms tabletas de narctico)


+ +
3 15
0 9 3 6
3 15
1 9 2 6
3 15
2 9 1 6
3 3 2 1
C
C * C
C
C * C
C
C * C
) n ; tabletas , x ( p



81538 0
455
371
455
20 135 216
455
1 20
455
9 15
455
36 6
.
) )( ( ) )( ( ) )( (

+ +
+ +

otra forma de resolver;
p(el viajero sea arrestado por posesin de narcticos) = 1 p(de que entre las tabletas
seleccionadas no haya una sola de narctico)



3 15
3 9 0 6
1 3 0 1
C
C * C
) n ; x ( p


815385 0 184615 0
455
84 1
1 . .
) )( (

180
b) p(no sea arrestado por posesin de narcticos)



3 15
3 9 0 6
3 0
C
C * C
) n ; x ( p


184615 0
455
84 1
.
) )( (

Ejemplo 8.10. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote
contiene 3 proyectiles defectuosos que no explotarn, cul es la probabilidad de que , a) los 4
exploten?, b) al menos 2 no exploten?
Solucin:
a) N = 10 proyectiles en total
a = 7 proyectiles que explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el nmero de proyectiles que
explotan entre la muestra que se dispara


16667 0
210
35
210
1 35
4 4
4 10
0 3 4 7
.
) )( (
C
C * C
) n ; x ( p

b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan

p(al menos 2 no exploten) = p( 2 o ms proyectiles no exploten) = p(x = 2 o 3; n=4) =


333333 0
210
70
210
7 63
210
7 1 21 3
4 10
1 7 3 3 2 7 2 3
.
) )( ( ) )( (
C
C * C C * C

+


8.6. Densidad uniforme
La funcin de densidad de probabilidad de una variable aleatoria con distribucin uniforme
continua se denota por
( , ) X U a b
y su funcin de densidad es:
181
Su grfico es:
Tiene las siguientes propiedades:
1. ( ) 0
2. ( ) 1
f x x
Toda el rea entre f x y el eje x es

La probabilidad de un intervalo [a,x] con
( , ] x a b
, se puede calcular sin usar la integral:

1
b a

a x b
es el rea del rectngulo de base x-a y altura
1
b a
entre el rea de todo el rectngulo de base b-a
y altura
1
b a
. Este hecho se puede usar para calcular la funcin de distribucin.
La funcin de distribucin de probabilidad es:
182
La grfica de la funcin de distribucin es:
El valor esperado de la
( , ) X U a b
es:
1 1
[ ] ( )
b b
a a
E X xf x dx x dx xdx
b a b a




Pero
b
a
xdx

es el rea comprendida entre la funcin


( ) g x x
en el intervalo de [a,b]
a b
el cual es un trapecio, cuya rea es
( )
2 2
A B a b
H b a
+ +

; por tanto
[ ]
2
a b
E X
+

183
f(x)
B
A
2
( )
[ ]
12
b a
V X

Ejemplo 8.11. Un meteorlogo hace una medicin del tiempo al azar, suponiendo que est
distribuida uniformemente en el intervalo [1, 4]. A) Calcule la probabilidad de que la medicin
este entre 5/2 y 3. b) Si se realizan 6 mediciones independientes, hallar la probabilidad de que
exactamente 3 de ellas estn entre 2 y 3.
8.7. Densidad normal o de Gauss
La distribucin normal fue definida por De Moivre en 1733 y es la distribucin de mayor
importancia en el campo de la estadstica.
Una variable es normal cuando se ajusta a la ley de los grandes nmeros, es decir, cuando sus
valores son el resultado de medir reiteradamente una magnitud sobre la que influyen infinitas
causas de efecto infinitesimal.
Las variables normales tienen una funcin de densidad con forma de campana a la que se llama
campana de Gauss.
Su funcin de densidad es la siguiente:
Cuando una variable aleatoria X es de densidad normal con media
[ ] E X
y varianza
2
[ ] V X la denotamos por
2
( , ) X N
Los parmetros de la distribucin son la media y la varianza, y
2
, respectivamente. Como
consecuencia, en una variable normal, media y varianza no deben estar correlacionadas en ningn
caso (como desgraciadamente ocurre en la inmensa mayora de las variables aleatorias reales que
se asemejan a la normal.
La curva normal cumple las siguientes propiedades:
1) El mximo de la curva coincide con la media.
2) Es perfectamente simtrica respecto a la media (g
1
= 0).
3) La curva tiene dos puntos de inflexin situados a una desviacin tpica de la media. Es
convexa entre ambos puntos de inflexin y cncava en ambas colas.
184
4) Sus
colas son
asintticas
al eje X.
Para calcular
probabilidades en
intervalos de
valores de la
variable, habra
que integrar la
funcin de
densidad entre los
extremos del
intervalo. por
desgracia (o por suerte), la funcin de densidad normal no tiene primitiva, es decir, no se puede
integrar. Por ello la nica solucin es referirse a tablas de la funcin de distribucin de la variable
(calculadas por integracin numrica) Estas tablas tendran que ser de triple entrada (, , valor)
y el asunto tendra una complejidad enorme.
Afortunadamente, cualquier que sea la variable normal, X, se puede establecer una
correspondencia de sus valores con los de otra variable con distribucin normal, media 0 y
varianza 1, a la que se llama variable normal tipificada o Z. La equivalencia entre ambas
variables se obtiene mediante la ecuacin:
y
1 2 1 2
1 2
1 2
( ) ( ), P x X x P z Z z donde
x x
z y z





La grfica de la densidad de Z es la que se muestra en el siguiente grfico para
2
1
185
La funcin de distribucin de la variable normal tipificada Z est tabulada y, simplemente,
consultando en las tablas se pueden calcular probabilidades en cualquier intervalo que nos
interese.
De forma anloga a lo que pasaba con las variables Poisson, la suma de variables normales
independientes es otra normal.
Los histogramas que deben esperarse para una variable normal son:

Histograma de una normal idealizada Histograma de una muestra de una variable
normal

Ej empl os:
Ejemplo 8.12. Si X es una vari abl e al eat ori a de una di st ri buci n N(, ),
hal l ar:
P(3 X +3)
Sol uci n:
( 3 3 ) ( 3 3) 0.9974 P X P Z +
186
Ejemplo 3.13. En una di st ri buci n normal de medi a 4 y desvi aci n t pi ca 2,
cal cul ar el val or de a para que P(4a x 4+a) = 0. 5934.
Sol uci n:
1 2 1 2
1 2
1 2 1 2
( ) ( ) 0.5934,
4 4
P x X x P z Z z donde
x x
z y z y x a y x a




+
Por t ant o:

1 2
1 2
4 4 4 4
2 2
2 2
a a
z y z
a a
z y z
+


Como Z
2
=0. 83, por t ant o 1.66 a .
8.8. Aproximacin de la binomial por medio de la normal
Si una vari abl e al eat ori a es
( , , ) X b x n p
con n grande, entonces, esta se puede
aproximar por una
2
( , (1 )) X N np np p
Las probabilidades puntuales se calculan ocupando la correccin de continuidad:
( ) ( 0.5 0.5)
b N
P X x P x X x +
8.9. Ejercicios.
1. En una ci udad se est i ma que l a t emperat ura mxi ma en el mes de j uni o
si gue una di st ri buci n normal , con medi a 23 y desvi aci n t pi ca 5.
Cal cul ar el nmero de d as del mes en l os que se espera al canzar
mxi mas ent re 21 y 27.
2. La medi a de l os pesos de 500 est udi ant es de un col egi o es 70 kg y l a
desvi aci n t pi ca 3 kg. Suponi endo que l os pesos se di st ri buyen
normal ment e, hal l ar cunt os est udi ant es pesan:
a. Ent re 60 kg y 75 kg.
187
b. Ms de 90 kg.
c. Menos de 64 kg.
d. 64 kg.
e. 64 kg o menos.
3. Se supone que los resultados de un examen siguen una distribucin normal con media 78
y varianza 36. Se pide:
a. Cul es l a probabi l i dad de que una persona que se present a el examen
obt enga una cal i fi caci n superi or a 72?
b. Cal cul ar l a proporci n de est udi ant es que t i enen punt uaci ones que
exceden por l o menos en ci nco punt os de l a punt uaci n que marca l a
front era ent re el Apt o y el No-Apt o (son decl arados No-Apt os el 25% de l os
est udi ant es que obt uvi eron l as punt uaci ones ms baj as).
c. Si se sabe que la calificacin de un estudiante es mayor que 72 cul es la probabilidad de
que su calificacin sea, de hecho, superior a 84?
4. Tras un t est de cul t ura general se observa que l as punt uaci ones
obt eni das si guen una di st ri buci n una di st ri buci n N(65, 18). Se desea
cl asi fi car a l os exami nados en t res grupos (de baj a cul t ura general , de
cul t ura general acept abl e, de excel ent e cul t ura general ) de modo que
hay en el pri mero un 20% l a pobl aci n, un 65% el segundo y un 15% en
el t ercero. Cul es han de ser l as punt uaci ones que marcan el paso de un
grupo al ot ro?
5. Varios test de inteligencia dieron una puntuacin que sigue una ley normal con media 100
y desviacin tpica 15.
a. Det ermi nar el porcent aj e de pobl aci n que obt endr a un coefi ci ent e ent re
95 y 110.
b. Qu i nt erval o cent rado en 100 cont i ene al 50% de l a pobl aci n?
c. En una pobl aci n de 2500 i ndi vi duos cunt os i ndi vi duos se esperan que
t engan un coefi ci ent e superi or a 125?
6. En una ci udad una de cada t res fami l i as posee t el fono. Si se el i gen al
azar 90 fami l i as, cal cul ar l a probabi l i dad de que ent re el l as haya por l o
menos 30 t engan t el fono.
188
7. En un examen t i po t est de 200 pregunt as de el ecci n ml t i pl e, cada
pregunt a t i ene una respuest a correct a y una i ncorrect a. Se aprueba si se
cont est a a ms de 110 respuest as correct as. Suponi endo que se cont est a
al azar, cal cul ar l a probabi l i dad de aprobar el examen.
8. Un est udi o ha most rado que, en un ci ert o barri o, el 60% de l os hogares
t i enen al menos dos t el evi sores Se el i ge al azar una muest ra de 50
hogares en el ci t ado barri o. Se pi de:
a. Cul es l a probabi l i dad de que al menos 20 de l os ci t ados hogares
t engan cuando menos dos t el evi sores?
b. Cul es l a probabi l i dad de que ent re 35 y 40 hogares t engan cuando
menos dos t el evi sores?
189
Captulo 9. Estimacin de Parmetros.
9.1. Distribucin de la medida de la muestra.
Distribucin muestral de : muestreo a partir de poblaciones que siguen una
distribucin normal.
Cuando el muestreo se realiza a partir de una poblacin que sigue una distribucin normal, la
distribucin de la medida de la muestra tiene las siguientes propiedades:
1. La distribucin de ser normal
2. La media , de la distribucin de ser igual a la medida de la poblacin de la cual se
seleccionaron las muestras.
3. La varianza, , de la distribucin de ser igual a la varianza de la poblacin
dividida entre el tamao de la muestra.
Teorema del lmite central.
Dada una poblacin de cualquier forma funcional no normal con una media y varianza finita
, la distribucin muestral de , calculada a partir de muestras de tamao n de dicha
poblacin, ser casi normal con media y varianza , cuando la muestra es muy grande.
Observe que el teorema del lmite central permite tomar muestras a partir de poblaciones con
distribucin no normal y garantizar que se obtengan aproximadamente los mismos resultados
que si la poblacin tuviera una distribucin normal, siempre que se tome una muestra muy
grande.
Ejemplo
Suponga que en una poblacin grande de seres humanos, la dimensin del dimetro craneal sigue
una distribucin aproximadamente normal, con una media de 185.6 mm y una desviacin
estndar de 12.7 mm. Cul es la probabilidad de que una muestra aleatoria de tamao 10 de esta
poblacin tenga una media mayor que 190?
Solucin
190
Cuando se dice que la poblacin sigue una distribucin aproximadamente normal, se supone que
la distribucin muestral de sigue, para fines prcticos, una distribucin normal. Tambin se
sabe que la media y la desviacin estndar de la distribucin muestral son iguales a 185.6 y
, respectivamente.
Se obtiene la siguiente frmula para transformar la distribucin normal de

en la distribucin normal estndar:
La probabilidad que responde a la pregunta formulada se representa en el
rea a la derecha de de bajo la curva de la distribucin muestral.
Esta rea es igual al rea de la derecha de:
191
Al consultar la tabla normal estndar, se encuentra que el rea a la derecha de 1.10 es 0.1357;
por lo tanto, se puede decir que la probabilidad de que la muestra de tamao tenga una media
mayor que 190 es 0.1357.
Ejemplo:
Si la media y desviacin estndar de la concentracin de hierro en el suero en hombres sanos es
de 120 y 15 microgramos por cada 100 ml, respectivamente, cul es la probabilidad de que una
muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por
cada 100 ml.
Solucin:
La probabilidad buscada es:
Ejercicios:
1. La National Health and Nutrition Examination Survey de 1976-1980 en una investigacin
encontr que los niveles de colesterol en individuos varones, estadounidenses, con edades
entre 20-74 aos, fue de 211. La desviacin estndar fue de aproximadamente de 90.
Considere la distribucin muestral de la media de la muestra basada en muestras de
tamao 50 extradas de esta poblacin de individuos varones. Cul es la media de la
distribucin muestral y el error estndar?
2. Si las concentraciones de cido rico en hombres adultos normales siguen una
distribucin aproximadamente normal, con una media y desviacin estndar de 5.7 y 1 mg
por ciento, respectivamente, encuentre la probabilidad de que una muestra de tamao 9
proporcione una media:
i) Mayor que 6
ii) Entre 5 y 6
iii) Menor que 5.2
3. Para cierto sector amplio de la poblacin en un ao determinado, suponga que el nmero
medio de das de incapacidad es de 5.4, con una desviacin estndar de 2.8 das.
Encuentre la probabilidad de que una muestra aleatoria de tamao 49 de esa poblacin
tenga una media:
192
i) Mayor a 6 das
ii) Entre 4 y 6 das
iii) Entre 4.5 y 5.5 das.
9.2. Distribucin de la diferencia entre las medias de dos
muestras.
Con frecuencia, el inters en una investigacin se dirige hacia dos poblaciones. Especficamente,
puede ser que un investigador desee saber algo acerca de la diferencia entre las medias de dos
poblaciones. En una investigacin, por ejemplo, el investigador tal vez desear saber si es
razonable concluir que dos medias poblacionales son diferentes. En otra situacin, es posible que
el investigador quiera conocer la magnitud de la diferencia entre ellas. Un equipo de
investigacin mdica, por ejemplo, quiz requiera saber si el nivel medio de colesterol en el
suero es mayor en un grupo de oficinistas que en un grupo de obreros. Si los investigadores
concluyen que las medias de la poblacin son diferentes, es posible que deseen saber qu tanto
difieren. El conocimiento acerca de la distribucin muestral de la diferencia entre dos medias es
muy til en investigaciones de este tipo.
Ejemplo:
Suponga que se tienen dos poblaciones de individuos. Una de ellas ( la poblacin 1 ) ha
experimentado alguna enfermedad que se considera est asociada con retraso mental, y la otra (la
poblacin 2) no ha experimentado tal enfermedad. Se cree que la distribucin de calificaciones de
inteligencia de cada una de las poblaciones presenta una distribucin aproximadamente normal
con una desviacin estndar de 20.
Suponga, tambin, que se toma una muestra de 15 individuos de cada poblacin y se calcula en
cada muestra la media de las calificaciones de inteligencia, con los siguientes resultados:
y Si no hay diferencia entre las dos poblaciones con respecto a la media
real de las calificaciones de inteligencia, cul es la probabilidad de observar una diferencia de
esta magnitud
( o mayor entre las medias de las muestras?
Solucin:
Para responder a esta pregunta es necesario conocer la naturaleza de la distribucin muestral para
la estadstica principal, es decir, la diferencia entre las dos medias, . Es importante notar
que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar
de una.
193
Distribucin muestral de : caractersticas.
Lo que se pretende es calcular la distribucin de la diferencia entre las medias de las muestras. Si
se elabora una grfica de las diferencias de las muestras contra sus frecuencias de ocurrencia, se
podra obtener una distribucin normal con una media igual a , la diferencia entre las
medias reales de los dos grupos o poblaciones, y una varianza igual a . Esto es,
el error estndar de la diferencia entre las medias sera igual a
Para el ejemplo anterior habra una distribucin normal con una media igual a 0 (si no hay
diferencia entre las medias reales de la poblacin) y una varianza de [(20)
2
/15]+ [(20)
2
/15]=53.33.
La grfica de la distribucin muestral se ilustra en la siguiente figura:
Se sabe que la distribucin normal descrita en el ejemplo se puede transformar en una
distribucin normal estndar mediante la modificacin de una frmula estudiada con
anterioridad. La nueva frmula es como sigue:
194
El rea bajo la curva de correspondiente a la probabilidad buscada es el rea a la
izquierda de . Suponiendo que no hay diferencia entre las medias
de las poblaciones, el valor de z correspondiente a -13 es:
Al consultar la tabla de la normal, se encuentra que el rea bajo la curva normal estndar a la
izquierda de -1.78 es igual a 0.0375. Para responder a la pregunta original, se puede decir que, si
no hay diferencia entre las medias poblacionales, la probabilidad de obtener una diferencia mayor
o igual que 13 entre las medias de las muestras es de 0.0375.
Muestreo a partir de poblaciones normales.
El procedimiento anterior es vlido incluso cuando el tamao de la muestras n
1
y n
2
, son
diferentes, y cuando las varianzas y , tienen valores diferentes. Los resultados tericos
sobre los que se basa este procedimiento, se resumen de la siguiente forma.
Dadas dos poblaciones con una distribucin normal, con medias , y varianzas y , la
distribucin muestral de la diferencia, entre las medias de muestras independientes de
tamao n
1
y n
2
extradas de esas poblaciones siguen una distribucin normal con media

y varianza .
Muestreo a partir de poblaciones no normales.
La mayora de las veces el investigador se enfrenta a uno de los siguientes problemas: 1) la
necesidad de extraer de una poblacin con distribucin no normal, o 2) extraer muestras de
poblaciones cuya forma funcional se desconoce. Una solucin para estos problemas consiste en
tomar muestras grandes, dado que, cuando el tamao de las muestras es muy grande, el teorema
del lmite central es aplicable y la distribucin de la diferencia entre las dos medias de las
muestras sigue una distribucin aproximadamente normal, con una media igual a y una
varianza . Para calcular probabilidades asociadas con los valores especficos de la
estadstica, el procedimiento es el mismo que el muestreo que se hace a partir de poblaciones con
distribucin normal.
195
Ejemplo:
Suponga que se estableci que para cierto tipo de pacientes el tiempo promedio de visita
domiciliaria hecha por una enfermera es de 45 minutos con una desviacin estndar de 15
minutos, y para un segundo tipo de paciente, el promedio de visita domiciliaria es de 30 minutos
con una desviacin estndar de 20 minutos. Si la enfermera visita al azar a 32 pacientes del
primer tipo y 40 del segundo tipo, cul es la probabilidad de que el tiempo promedio de visita
domiciliaria difiera entre los dos grupos por 20 minutos o ms?
Solucin:
No se menciona nada respecto a la forma funcional de las poblaciones, por lo que se supone que
esta caracterstica se desconoce, o que las poblaciones no presentan una distribucin normal.
Puesto que las muestras son grandes (mayores que 30) en ambos casos, se hace uso de los
resultados del teorema del lmite central. Se sabe que la diferencia entre las muestras sigue una
distribucin al menos aproximadamente normal con las siguientes media y varianza:
El rea bajo la curva de que se busca se encuentra a la derecha de 20. El valor
correspondiente de z en la distribucin normal estndar es:
En la tabla de la distribucin normal se encuentra que el rea a la derecha de z=1.23 es: 1-0.8907
=0.1093. por lo tanto, se puede decir que la probabilidad de que las visitas al azar de la enfermera
difieren entre las dos medias por 20 o ms minutos es de 0.1093. La curva de y la curva
normal estndar correspondiente se muestran en la siguiente figura:
196
9.3. Distribucin de la proporcin de la muestra.
En las secciones anteriores se estudiaron las distribuciones muestrales para estadsticas calculadas
a partir de variables medidas. Sin embargo, frecuentemente se tiene inters en la distribucin
muestral de estadsticas, como la proporcin de muestras, que resulta de los datos de conteo o
frecuencias.
Ejemplo:
Suponga que una poblacin de seres humanos, 0.08 son daltnicos. Si la proporcin de la
poblacin se designa como , se puede decir para este ejemplo que . Si se eligen
aleatoriamente 150 individuos de esa poblacin, cul es la probabilidad de que la proporcin en
la muestra de individuos daltnicos sea igual a 0.15?
Solucin:
Para responder esta pregunta es necesario conocer algunas de las propiedades de la distribucin
muestral de la proporcin de la muestra. Se designar la proporcin de la muestra con el smbolo
.
197
Distribucin muestral de : caractersticas.
Cuando la muestra es grande, la distribucin de las proporciones de la muestra es
aproximadamente normal de acuerdo con el teorema del lmite central. La media de la
distribucin , que es el promedio de todas las proporciones posibles de la muestra, es igual a la
proporcin real de la poblacin , y la varianza de la distribucin, es igual a o
donde . Entonces para responder a las preguntas acerca de la probabilidad
respecto a , se utiliza la siguiente frmula:
La pregunta que surge ahora es: qu tan grande debe ser la muestra para que sea vlido el uso de
la aproximacin normal? Un criterio ampliamente utilizado es que y deben ser
mayores que 5, por lo que se seguir dicha regla en el presente texto.
Ahora se est en posibilidad de responder a la pregunta referente al daltonismo en la muestra de
150 individuos de una poblacin en la cual 0.08 son daltnicos. Puesto que y son
mayores que 5 (150x0.08=12 y 150x0.92=138), se puede decir que, en este caso, sigue una
distribucin aproximadamente normal con una media y
. La probabilidad buscada es el rea bajo la curva de a la
derecha de 0.15. Esta rea es igual al rea bajo la curva normal estndar a la derecha de:
La transformacin para la distribucin normal estndar se lleva a cabo de la manera usual: z se
calcula al dividir el error estndar entre la diferencia de un valor de la estadstica y su medida. Al
utilizar la tabla de la distribucin normal se tiene que el rea a la derecha de es 1-
0.9992= 0.0008. Por lo tanto, se puede decir que la probabilidad de observar en una
198
muestra aleatoria de tamao n=150 de una poblacin en la que es 0.0008. De hecho, si
se extrajera una muestra de este tipo, mucha gente la considerara un evento extrao.
Ejercicios:
1. Una investigacin realizada en 1990 por el National Center for Health Statistics, 19 por
ciento de los encuestados mayores de 18 aos, dijo no saber del virus VIH del SIDA.
Cul es la probabilidad de que en una muestra de 175 individuos de esa poblacin 25 por
ciento o ms no sepa de la existencia del SIDA?
2. Se sabe que 35 por ciento de los miembros de una poblacin sufren de enfermedades
crnicas. Cul es la probabilidad de que en una muestra aleatoria de 200 individuos 80 o
ms de ellos tengan al menos una enfermedad crnica?
9.4. Distribucin de la diferencia entre las proporciones de
dos muestras.
Con frecuencia son de inters las proporciones de dos poblaciones y se desea averiguar la
probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras
extradas de cada una de dichas poblaciones. La distribucin muestral pertinente es la
distribucin de la diferencia entre las proporciones de dos muestras.
Distribucin muestral de de : caractersticas.
Las caractersticas de esta distribucin muestral se resumen como sigue:
Si se extraen muestras aleatorias independientes de tamao n
1
y n
2
de dos poblaciones de
variables dicotmicas, donde las proporciones de las observaciones con la caracterstica de
inters en ambas poblaciones son , respectivamente, la distribucin de la diferencia
entre las proporciones de las muestras , es aproximadamente normal con una media de:
Con varianza
199
Cuando n
1
y n
2
son grandes.
Se consideran a n
1
y n
2
suficientemente grandes cuando
son mayores que 5.
Para responder a preguntas respecto a la diferencia entre proporciones de dos muestras, se utiliza
la siguiente frmula:
Ejemplo:
Suponga que la proporcin de consumidores moderados a grandes consumidores de
estupefacientes ilegales es de 0.50 para la poblacin 1, en tanto que en la poblacin 2 la
proporcin es de 0.33. Cul es la probabilidad de que muestras de tamao 100, extradas de cada
una de las poblaciones, presente un valor de igual a 0.30?
Solucin:
Se supone que la distribucin muestral de es aproximadamente normal, con una media
de
Y varianza:
El rea correspondiente a la probabilidad buscada es la que se encuentra baja la curva de

a la derecha de 0.30. Al transformar en la distribucin normal estndar se obtiene
200
Al consultar la tabla de la normal, se encuentra que el rea bajo la curva normal estndar que est
a la derecha de z=1.89 es 1-0.9706=0.0294. Por lo tanto, la probabilidad de observar una
diferencia igual a 0.30 es de 0.0294.
Ejemplo:
Se sabe que en una poblacin de adolescentes 10 por ciento de los varones son obesos. Si la
misma proporcin de mujeres en esa poblacin son obesas, cul es la probabilidad de que una
muestra al azar de 250 varones y 200 mujeres proporcione un valor de ?
Solucin:
Se supone que la distribucin muestral de es aproximadamente normal. Si la
proporcin de individuos obesos es la misma en ambas poblaciones, la media de la distribucin
es igual a 0 y la varianza es:
El rea de inters bajo la curva de es la que se encuentra a la derecha de 0.06. El valor
correspondiente de z es:
Al consultar la tabla de la normal se encuentra que el rea a la derecha de z=2.11 es 1-
0.9826=0.0174.
Ejercicios:
1. En una poblacin de nios con retraso mental, se sabe que la proporcin del os que son
hiperactivos es de0.40. Se extrajo una muestra aleatoria de tamao 120 de esa poblacin,
y otra de tamao 100 a partir de otra poblacin de nios con el mismo problema. Si la
proporcin de nios hiperactivos es la misma en ambas poblaciones, cul es la
probabilidad de que la muestra presente como resultado una diferencia de 0.16
o ms?
2. Se tienen bases para suponer que 40 por ciento de las casas en cierta rea de la ciudad
estn en malas condiciones. Una muestra aleatoria de 75 casas de esa rea y otra
compuesta de 90 casas de otra seccin dieron una diferencia . Si no hay
201
diferencia en la proporcin de casas en malas condiciones entre esas dos reas, cul es la
probabilidad de observar una diferencia de esta magnitud o mucho mayor?
9.5. Intervalos de confianza
I- Concepto de Intervalo de Confianza (para una media, varianza conocida).
En el contexto de estimar un parmetro poblacional, un intervalo de confianza es un rango de
valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parmetro, con
una probabilidad determinada.
La probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo construido
se denomina nivel de confianza, y se denota 1- . La probabilidad de equivocarnos se llama
nivel de significancia y se simboliza . Generalmente se construyen intervalos con confianza 1-
=95% (o significancia =5%). Menos frecuentes son los intervalos con =10% =1%.
Para construir un intervalo de confianza, se puede comprobar que la distribucin Normal
Estndar cumple:
P(-1.96 < z < 1.96) = 0.95
(Lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional
que calcule probabilidades normales).
Luego, si una variable X tiene distribucin N( , ), entonces el 95% de las veces se cumple:
Despejando en la ecuacin se tiene:
El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de
confianza al 95% para la media cuando la variable X es normal y es conocido.
II- Intervalo de confianza para un promedio (Varianza desconocida):
Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional ,
la varianza poblacional es desconocida, por lo que el intervalo para construido al final de II
es muy poco prctico.
Si en el intervalo se reemplaza la desviacin estndar poblacional por la desviacin estndar
muestral s, el intervalo de confianza toma la forma:
202
La cual es una buena aproximacin para el intervalo de confianza de 95% para con
desconocido. Esta aproximacin es mejor en la medida que el tamao muestral sea grande.
Cuando el tamao muestral es pequeo, el intervalo de confianza requiere utilizar la distribucin t
de Student (con n-1 grados de libertad, siendo n el tamao de la muestra), en vez de la
distribucin normal (por ejemplo, para un intervalo de 95% de confianza, los lmites del intervalo
ya no sern construidos usando el valor 1.96). Se utiliza la siguiente expresin:
Ejemplo:
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresin
(mayor puntaje significa mayor depresin).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20
Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los
datos tienen distribucin normal, con varianza poblacional desconocida. Como es
desconocido, lo estimamos por s =18,7. Luego, un intervalo de confianza aproximado es:
Luego, el intervalo de confianza para es (13.2, 15,8). Es decir, el puntaje promedio poblacional
se encuentra entre 13,2 y 15,8 con una confianza 95%.
Ahora construya un intervalo de confianza utilizando la distribucin t-Student.
III. Intervalo de Confianza para una Proporcin.
A menudo es necesario construir intervalos de confianza para una proporcin. Por ejemplo,
supngase que se toma una muestra de tamao n de una poblacin grande (posiblemente infinita)
y que X observaciones de esta muestra pertenecen a una clase de inters.
Ejemplo: El nmero de caras obtenidas al lanzar una moneda n veces.
X
1,
X
2
, X
3
,.X
n
X caras

X

B(n, p)
203
El parmetro p es desconocido, sin embargo podemos obtener un estimador denotado por , a
partir de los datos de la muestra.
Ntese que es un estimador insesgado de p, ya que:


Recurdese que para n grande, la distribucin de muestreo de es aproximadamente normal con
media p y varianza p(1-p)/n. Por lo que la distribucin de la siguiente variable
Tiene aproximadamente una distribucin normal (Teorema de Lmite Central).
Como Z N(0,1), podemos construir fcilmente el intervalo de confianza para p, tal que:

204


z
/2 -
z
/2
Pero:



Luego:
Desafortunadamente el lmite superior e inferior del intervalo de confianza contiene el parmetro
desconocido p. Sin embargo es vlido reemplazar p por ,
El intervalo de confianza para el parmetro de proporcin p es:
9.5.1. Seleccin del tamao de la muestra
Para estimar un intervalo de confianza para el parmetro p, y para que este intervalo sea
confiable, es preciso considerar que la diferencia entre el estimador y el parmetro p sea
mnima con un nivel de confianza mayor o igual al (1-)%, es decir:
205
Obsrvese que:
Por lo que:

Note que para utilizar esta ecuacin se requiere una estimacin del parmetro p. Si se tiene una
estimacin de alguna muestra anterior, entonces p puede sustituirse por , de tal manera que:
Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:
206
O bien:
Donde p es el porcentaje de personas con la caracterstica de inters en la poblacin (o sea, es el
parmetro de inters) y p es su estimador muestral.
Luego, procediendo en forma anloga al caso de la media, podemos construir un intervalo de
95% de confianza para la proporcin poblacional p.
Ejemplo:
En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15
aos en la Regin Metropolitana, se encontr que el 17.6% eran hipertensas. Un intervalo de 95%
de confianza para la proporcin de mujeres hipertensas en la Regin Metropolitana est dado por:
Luego, la proporcin de hipertensas vara entre (0.139, 0.212) con una confianza de 95%.
IV. Intervalos de confianza para la diferencia de dos proporciones
Supngase que existen dos proporciones de inters p1 y p2, y es necesario obtener un intervalo
de confianza para la diferencia de p1 - p2 con un nivel de confianza de (1-)%. Supngase que se
toman dos muestras independientes de tamao n1 y n2 de dos poblaciones infinitamente grandes.
En estas dos muestras sean X1 el nmero de observaciones de la primera muestra que pertenecen
a la clase de inters y X2 el nmero de observaciones en la muestra de la segunda poblacin que
pertenecen a la clase de inters.
P
1
X
1,
X
2
, X
3
,..X
n1
Xn
1
observaciones
P
2
Y
1
, Y
2
, Y
3
,.Y
n2
Xn
2
observaciones
= = X
1
~B(n
1
,p) X
2
~B(n
2
, p)
Luego:
207
=
=
As para se hace la siguiente transformacin:
Donde Z tiene una distribucin que es aproximadamente normal, esto implica que podemos
sustituir el valor de Z directamente para construir el intervalo de confianza:
Si desarrollamos esta expresin llegaremos a que el intervalo de confianza para p1 - p2 es:
Ejemplo. Se analiza la fraccin de productos defectuosos producidos por dos lneas de
produccin. Una muestra aleatoria de 100 unidades provenientes de la lnea uno contienen 10 que
son defectuosas, mientras que en una muestra aleatoria de 120 unidades de la lnea 2 tiene 25 que
208
son defectuosas. Encuentre un intervalo de confianza del 99% para la diferencia en fracciones de
productos defectuosos producidos por las dos lneas.

Solucin:
Se tiene que

Pero:
Nos resta calcular . Como (1-)=0.99, entonces /2= 0.005.
Luego como el valor para no se encuentra en la tabla, promediamos los valores ms
prximos y Luego
Sustituyendo estos valores tenemos:
El intervalo de confianza buscado es:
Ejemplos:
209
1. Un fabricante asegura, a una compaa que le compra un producto en forma regular, que el
porcentaje de productos defectuosos no es mayor del 5%. La compaa decide comprobar la
afirmacin del fabricante seleccionando de su inventario, 200 unidades de este producto y
probndolas. Deber sospechar la compaa de la afirmacin del fabricante si se descubre un
total de 19 unidades defectuosas en la muestra?
Solucin:
La sospecha estar apoyada si existe un intervalo de confiabilidad alto para el cual la proporcin
p se encuentra completamente a la derecha del valor asegurado 0.05. Si seleccionamos una
confiabilidad del 95%, entonces /2=0.025, y ya conocemos que X=19 y n=200, por lo que
=19/200=0.095
Al sustituir estos valores en:
Se tiene que el intervalo de confianza del parmetro p es:
El cual resulta ser de:
Aparentemente existe una razn para sospechar del fabricante, ya que el intervalo de confianza se
encuentra completamente a la derecha del valor asegurado.
2. Calcular el tamao de la muestra del ejemplo anterior para el cual la diferencia entre el
parmetro y el estimador es menor que 0.02 con un nivel de confianza mayor a 0.9.
Considrese el mismo valor para .
Solucin:
210
3. Se analiza la fraccin de productos defectuosos producidos por dos lneas de produccin.
Una muestra aleatoria de 100 unidades provenientes de la lnea uno contienen 10 que son
defectuosas, mientras que en una muestra aleatoria de 120 unidades de la lnea 2 tiene 25 que
son defectuosas. Encuentre un intervalo de confianza del 99% para la diferencia en fracciones
de productos defectuosos producidos por las dos lneas.

Solucin:
Se tiene que
Pero:
Nos resta calcular . Como (1-)=0.99, entonces /2= 0.005.
211
Luego como el valor para no se encuentra en la tabla, promediamos los valores ms
prximos y Luego
Sustituyendo estos valores tenemos:
El intervalo de confianza buscado es:
212
Captulo 10. Contraste de hiptesis.
10.1.- Introduccin
Dentro del estudio de la inferencia estadstica, se describe como se puede tomar una muestra
aleatoria y a partir de esta muestra estimar el valor de un parmetro poblacional en la cual se
puede emplear el mtodo de muestreo y el teorema del valor central lo que permite explicar cmo
a partir de una muestra se puede inferir algo acerca de una poblacin, lo cual nos lleva a definir y
elaborar una distribucin de muestreo de medias muestrales que nos permite explicar el teorema
del lmite central y utilizar este teorema para encontrar las probabilidades de obtener las distintas
medias maestrales de una poblacin.
Pero es necesario tener conocimiento de ciertos datos de la poblacin como la media, la
desviacin estndar o la forma de la poblacin, pero a veces no se dispone de esta informacin.
En este caso es necesario hacer una estimacin puntual que es un valor que se usa para estimar un
valor poblacional. Pero una estimacin puntual es un solo valor y se requiere un intervalo de
valores a esto se denomina intervalos de confianza y se espera que dentro de este intervalo se
encuentre el parmetro poblacional buscado. Tambin se utiliza una estimacin mediante un
intervalo, el cual es un rango de valores en el que se espera se encuentre el parmetro poblacional
En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveracin acerca
de un parmetro poblacional este mtodo es denominado Prueba de hiptesis para una muestra.
10.2. Nociones bsicas
En el anlisis estadstico se hace una aseveracin, es decir, se plantea una hiptesis, despus se
hacen las pruebas para verificar la aseveracin o para determinar que no es verdadera.
Por tanto, la prueba de hiptesis es un procedimiento basado en la evidencia muestral y la teora
de probabilidad; se emplea para determinar si la hiptesis es una afirmacin razonable.
Prueba de una hiptesis: se realiza mediante un procedimiento sistemtico de cinco paso:
213
Siguiendo este procedimiento sistemtico, al llegar al paso cinco se puede o no rechazar la
hiptesis, pero debemos de tener cuidado con esta determinacin ya que en la consideracin de
estadstica no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de
prueba ms all de una duda razonable. Analizaremos cada paso en detalle
Objetivo de la prueba de hiptesis.
El propsito de la prueba de hiptesis no es cuestionar el valor calculado del estadstico
(muestral), sino hacer un juicio con respecto a la diferencia entre estadstico de muestra y un
valor planteado del parmetro.
10.3. Procedimiento sistemtico para una prueba de
hiptesis de una muestra.
.Paso 1: Plantear la hiptesis nula Ho y la hiptesis alternativa H1.
Cualquier investigacin estadstica implica la existencia de hiptesis o afirmaciones acerca de las
poblaciones que se estudian.
La hiptesis nula (Ho) se refiere siempre a un valor especificado del parmetro de poblacin, no a
una estadstica de muestra. La letra H significa hiptesis y el subndice cero no hay diferencia.
Por lo general hay un "no" en la hiptesis nula que indica que "no hay cambio" Podemos rechazar
o aceptar Ho.
La hiptesis nula es una afirmacin que no se rechaza a menos que los datos maestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hiptesis nula
siempre contiene un signo de igualdad con respecto al valor especificado del parmetro.
La hiptesis alternativa (H1) es cualquier hiptesis que difiera de la hiptesis nula. Es una
afirmacin que se acepta si los datos maestrales proporcionan evidencia suficiente de que la
hiptesis nula es falsa. Se le conoce tambin como la hiptesis de investigacin. El planteamiento
de la hiptesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado
del parmetro.
Paso 2: Seleccionar el nivel de significancia.
214
Nivel de significancia: Probabilidad de rechazar la hiptesis nula cuando es verdadera. Se le
denota mediante la letra griega , tambin es denominada como nivel de riesgo, este trmino es
ms adecuado ya que se corre el riesgo de rechazar la hiptesis nula, cuando en realidad es
verdadera. Este nivel esta bajo el control de la persona que realiza la prueba.
Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin indicar
la probabilidad de no aceptarla, es decir, estn fuera de rea de aceptacin. El nivel de confianza
(1-), indica la probabilidad de aceptar la hiptesis planteada, cuando es verdadera en la
poblacin.
La distribucin de muestreo de la estadstica de prueba se divide en dos regiones, una regin de
rechazo (conocida como regin crtica) y una regin de no rechazo (aceptacin). Si la estadstica
de prueba cae dentro de la regin de aceptacin, no se puede rechazar la hiptesis nula.
La regin de rechazo puede considerarse como el conjunto de valores de la estadstica de prueba
que no tienen posibilidad de presentarse si la hiptesis nula es verdadera. Por otro lado, estos
valores no son tan improbables de presentarse si la hiptesis nula es falsa. El valor crtico separa
la regin de no rechazo de la de rechazo.
Tipos de errores
Cualquiera sea la decisin tomada a partir de una prueba de hiptesis, ya sea de aceptacin de Ho
o de Ha, puede incurrirse en error:
Un error tipo I se presenta si la hiptesis nula Ho es rechazada cuando es verdadera y deba ser
aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa
Un error tipo II, se denota con la letra griega se presenta si la hiptesis nula es aceptada cuando
de hecho es falsa y deba ser rechazada.
En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las
consecuencias posibles.
Decisin H0 es cierta H0 es Falsa
215
Aceptar H0 Decisin Correcta
Error tipo II
()
Rechazar H0
Error tipo I
()
Decisin Correcta
Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los
errores de decisin. En la prctica un tipo de error puede tener ms importancia que el otro, y as
se tiene a conseguir poner una limitacin al error de mayor importancia. La nica forma de
reducir ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no ser
posible.
Paso 3: Clculo del valor estadstico de prueba
Valor determinado a partir de la informacin muestral, que se utiliza para determinar si se
rechaza la hiptesis nula., existen muchos estadsticos de prueba para nuestro caso utilizaremos
los estadsticos z y t. La eleccin de uno de estos depende de la cantidad de muestras que se
toman, si las muestras son de la prueba son iguales a 30 o mas se utiliza el estadstico z, en caso
contrario se utiliza el estadstico t.
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hiptesis planteada se formula con la igualdad
Ejemplo
H0 : = 200
H1 : 200
b) Pruebas unilateral o de un
extremo: la hiptesis planteada se
formula con o
H0 : 200 H0 : 200
H1 : < 200 H1 : > 200
En las pruebas de hiptesis para la media (), cuando se conoce la desviacin estndar ()
poblacional, o cuando el valor de la muestra es grande (30 o ms), el valor estadstico de prueba
es z y se determina a partir de:
216
El valor estadstico z, para muestra grande y desviacin estndar poblacional desconocida se
determina por la ecuacin:
En la prueba para una media poblacional con muestra pequea y desviacin estndar poblacional
desconocida se utiliza el valor estadstico t.
10.4. Procedimiento sistemtico para una prueba de
hiptesis de dos muestras independientes.
La prueba para la igualdad de medias con varianzas conocidas es:
El estadstico de prueba es

Si las varianzas son desconocidas, el estadstico de prueba es:

donde
10.5. Prueba de hiptesis para una y dos proporcin
independientes
Prueba para una proporcin:
El estadstico de prueba es:
Prueba de hiptesis sobre dos proporciones independientes:
217
Donde
Paso 4: Formular la regla de decisin
Se establece las condiciones especficas en la que se rechaza la hiptesis nula y las condiciones
en que no se rechaza la hiptesis nula. La regin de rechazo define la ubicacin de todos los
valores que son tan grandes o tan pequeos, que la probabilidad de que se presenten bajo la
suposicin de que la hiptesis nula es verdadera, es muy remota
Distribucin muestral del valor estadstico z, con prueba de una cola a la derecha
Valor crtico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la
regin en la que no se rechaza la hiptesis nula.
Paso 5: Tomar una decisin.
En este ltimo paso de la prueba de hiptesis, se calcula el estadstico de prueba, se compara con
el valor crtico y se toma la decisin de rechazar o no la hiptesis nula. Tenga presente que en
una prueba de hiptesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hiptesis
nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hiptesis nula cuando no
debera haberse rechazado (error tipo I). Tambin existe la posibilidad de que la hiptesis nula se
acepte cuando debera haberse rechazado (error de tipo II).
Ejemplo 1: Prueba la hiptesis H
0
: p = 0.4
H
1
: p 0.4
Presuma que n = 200, y = .01.
Solucin:
218
Paso 1 H
0
: p = 0.4
H
1
: p 0.4
Paso 2 Usando = .01, el diagrama de la regin de rechazo es:
Paso 3 Calculando el valor z para la proporcin muestral p = 0.45, obtenemos:
0346 . 0
200
) 4 . 0 1 ( 4 . 0

Z = 45 . 1
0346 . 0
4 . 0 45 . 0

Paso 4 Dibujando z = 1.45 en el diagrama de la regin de rechazo (Paso 2)


obtenemos:
Paso 5 Como el valor z est fuera de la regin de rechazo (sombreada), por lo tanto no
rechazamos H
o
.
Ejemplo. MTODO DEL VALOR P (MTODO 2, SPSS)
Dejemos que p
0
sea la proporcin aceptada o reclamada.
Paso 1 Establezca las hiptesis: H
0
: p = p
0
H
1
: p > p
0

p < p
0

p p
0
Paso 2 Calcule el valor z para la proporcin muestral
,
_

n
x
p
usando la frmula:
Z =
p
p p

, donde
n
p p
p
) 1 (
0 0

.
Paso 3 Usando la hiptesis alterna dibuja la regin bajo la curva z que representa los
valores extremos.
219
.005 .005
-2.575 2.575
.005 .005
-2.575 2.575
1.45

(H
1
: >
o
) (H
1
: <
o
) (H
1
:
o
)
Paso 4 El valor P = al rea de la cola sombreada (s) en el Paso 3.
Paso 5 Si el valor P < , entonces rechaza H
0
Si el valor P , entonces no rechaces H
0
.
Ejemplo 1: Pruebe la hiptesis H
0
: p = 0.4
H
1
: p 0.4
Presuma que n = 200, y = 0.01.
Solucin:
Paso 1 H
0
: p = 0.4
H
1
: p 0.4
Paso 2 Calculando el valor z de p , obtenemos
0346 . 0
200
) 4 . 0 1 ( 4 . 0

Z = 45 . 1
0346 . 0
4 . 0 45 . 0

Paso 3 La regin bajo la curva z que contiene los valores extremos de es


Paso 4 El valor P = suma de las reas de las regiones sombreadas en el Paso3.
= 2(el rea a la derecha de 1.45)
= 2(0.5 0.4265)
= 0.147
Paso 5 Como el valor P es mayor que , entonces no podemos rechazar H
0
.
220
Valor P
z
Valor P
-z
P/2 P/2
-z z
P/2 P/2
-1.45 1.45
Ejercicios.
1. H
0
: p=0.6
H
1
: p 0.6, n = 100, y = 0.01
2. H
0
: p = 0.29
H
1
: p 0.29, n = 90, y = 0.01
3. H
0
: p = 0.36
H
1
: p < 0.36, n = 630, y = 0.05
Bibliografa
Canavos, George C. (1988). Probabilidad y Estadstica Aplicaciones y Mtodos.
McGrawHill.
Gardner, Robert C. (2003). Estadstica para Psicologa Usando SPSS para Windows.
Prentice-Hall, 1 ED.
Jhonson, R y Kuby, P. (1999). Estadstica Elemental, lo Esencial. Mxico: Thomson.
Martnez Bencardino, Ciro. (2006). Estadstica Bsica Aplicada. Colombia: ECOE
EDICIONES, 3 ED.
Martnez Bencardino, Ciro. (2008). Estadstica y Muestreo. Colombia: ECOE
EDICIONES, 12 ED.
Montgomery, Douglas C. y Runger, George C. (1996). Probabilidad y Estadstica.
McGrawHill.
Peralta Astudillo, Mara Josefa y at. (2000). Estadstica: Problemas resueltos.
Ediciones Pirmide.
221

También podría gustarte