Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Federico Villarreal
GUA ACADMICA
ESTADSTICA
CONTABILIDAD IV CICLO
Euded
Escuela Universitaria
Educacin a distancia
INDICE
PRESENTACIN 04
INTRODUCCIN A LA ASIGNATURA 05
ORIENTACIONES GENERALES DE ESTUDIO 06
TUTORAS 07
CRONOGRAMA 07
EVALUACIN 08
MEDIOS Y RECURSOS DIDCTICOS 09
OBJETIVOS GENERALES 10
ACTIVIDADES 27
AUTOEVALUACIN N1 29
ACTIVIDADES 41
AUTOEVALUACIN N2 43
UNIDAD 3: ANALISIS DE CORRELACION Y REGRESION E INTRODUCCIN A LAS 44
PROBABILIDADES
ACTIVIDADES 62
AUTOEVALUACIN N3 64
ACTIVIDADES 82
AUTOEVALUACIN 4 84
SOLUCIONARIO DE AUTOEVALUACIONES 85
ANEXOS 89
INTRODUCCIN A LA ASIGNATURA
En nuestros das, la estadstica se ha convertido en mtodo efectivo para describir con exactitud
los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve
como herramienta para relacionar y analizar dichos datos. El objetivo que se persigue es ya no
slo reunir y tabular los datos, sino sobre todo conocer el proceso de interpretacin de esa
informacin
Estimados participantes:
La razn de ser de los cursos virtuales es facilitar el acceso a los programas educativos de
aquellos estudiantes cuyos horarios o situacin geogrfica no son compatibles con la formacin
presencial, sin embargo, su objetivo es muy claro: ofrecer una calidad acadmica igual o superior
a la que se brinda en los programas presenciales. Por ello, los programas virtuales se apoyan en
la ms moderna tecnologa informtica y de comunicaciones (aulas virtuales) que permiten un alto
grado de interaccin y orientacin del profesor y una elevada interrelacin entre los estudiantes.
Leer, estudiar y trabajar el material didctico diariamente. Es preferible una hora diaria
durante siete das consecutivos, que 10 horas en un solo da. Las claves del xito son
continuidad y constancia.
Organizar el tiempo de estudio segn las propias condiciones, dificultades y necesidades de
trabajo; en caso contrario el plan de estudios no se cumplir.
Leer varias veces el material y despus comenzar con el resaltado de las ideas principales
para organizar el material de estudio (resmenes, cuadros sinpticos, etc.
Trabajar el material en el mismo orden en que se entrega. No olvide de realizar las actividades
que tiene en su Texto como en su Gua Acadmica.
Estudiar en un lugar donde se sienta cmodo para realizar las lecturas y hacer sus tareas. En
lo posible un lugar con claridad y libre de ruido.
TUTORAS
CRONOGRAMA
Referencias electrnicas
http://estadisticaparaadministracion.blogspot.com/
http://www.dm.uba.ar/materias/estadistica_Q/2011/1/modulo%
20descriptiva.pdf
http://www.fuenterrebollo.com/Economicas2013/unidime
nsional-ejercicios.pdf
Referencias electrnicas:
http://www.youtube.com/watch?v=lpUkW6xxWog&feature=shar
e&list=PLqEro_vpDCG5DJsnzJDiYQ-0jhGsYcVYA
http://youtu.be/_mbO-ndr740
Textos
complementarios VISAUTA. Anlisis Estadstico con SPSS 17. EstadsticaBsica.
Editorial Mcgraw-Hill 2010
Plataforma
virtual Herramientas a emplearse en plataforma virtual:
Foros,tareas, chat
Enlaces, videos, examen, pginas entre otros
OBJETIVOS
GENERALES
Estadstica.
correspondientes en la administracin.
OBJETIVOS ESPECFICOS
CONTENIDO TEMTICO
1.1. LA ESTADSTICA
La Estadstica es una ciencia aplicada que nos proporciona un conjunto de mtodos para:
recopilar, organizar (clasificar, agrupar), presentar y analizar datos, con el fin de describirlos
solamente o realizar generalizaciones vlidas, asumiendo un margen de certeza en los resultados.
Por ello, las probabilidades desempean un rol importante en el proceso de toma de decisiones.
1.4. MUESTRA
DATO. Son nmeros que representan las modalidades de las variables. Por ejemplo, el 1
puede representar la modalidad "Mujer", el 6.3 representa una de las magnitudes que
podemos registrar en la variable "grado de conocimiento de las tcnicas estadsticas". Los
datos pueden ser clasificados segn diferentes criterios, uno de los cuales se basa en las
modalidades que presentan: Se dir que son datos dicotmicos los que provienen de
variables que solo admiten dos modalidades (por ejemplo la variable "gnero"), son datos
separados aquellos que presentan dos categoras pero provienen de variables con ms de
dos modalidades (por ejemplo datos con valores 1 y 0 que representan aprobado y
suspenso).
UNIDAD ESTADSTICA. Es un valor numrico que se obtiene a partir de datos muestrales.
Describe alguna caracterstica de la muestra, y la toma de decisiones respecto a la poblacin
contiene cierto grado de incertidumbre.
PARMETRO. Una vez obtenido todos los valores de las variables a estudiar podramos
describir este conjunto de valores usando solo una determinada caracterstica o medida. Por
ejemplo: el promedio de todos los valores obtenidos, el porcentaje de cada una de las
categoras, etc. Estos indicadores cuando se toman datos poblacionales se conocen como
Parmetro.
ESTADSTICO O ESTADIGRAFO. Es un valor numrico que se obtiene a partir de datos
muestrales. Describe alguna caracterstica de la muestra, y la toma de decisiones respecto a
la poblacin contiene cierto grado de incertidumbre.
1.6. VARIABLE ESTADISTICA
Una variable estadstica es el conjunto de valores que puede tomar cierta caracterstica
de la poblacin sobre la que se realiza el estudio estadstico. Estas variables pueden ser:
la edad, el peso, las notas de un examen, etc.
A. SEGN SUNATURALEZA:
1.8. SUMATORIAS
x
i 1
i x1 x2 ......... xn
Ejemplo:
4
* 2i 3 2(1) 3 2(2) 3 2(3) 3 2(4) 3 5 7 9 11 32
i 1
PROPIEDADES
n n
a) cxi c xi , para todo constante c
i 1 i 1
n n n
b) x i yi x i yi
i 1 i 1 i 1
n n n
c) x i yi x i yi
i 1 i 1 i 1
TEMA ORGANIZACIN DE DATOS EN TABLAS DE
II FRECUENCIA
Despus de recoger toda la informacin que necesitamos, es decir, al agotar todo el trabajo de
campo, existe un cmulo de datos y cifras desordenadas que, al ser tomados como
observaciones individuales, dicen muy poco sobre la poblacin estudiada, es entonces, tarea
del investigador , comenzando por la clasificacin y ordenacin, consignando la informacin en
tablas inteligibles que denominamos distribuciones de frecuencias (Guarn, 2002).
Tabla 1
Valor de x fi Fi hi Hi
x1 f1 F1 h1 H1
x2 f2 F2 h2 H2
xk fk Fk n hk Hk
TOTAL k k
i 1
fi n h
i 1
i 1
f1 f 2 f 3 ....... f k n
k
En notacin sigma: f
i 1
i n
variables cuantitativas o cualitativas ordenables, en los dems casos no tiene mucho sentido
el clculo de esta frecuencia. La frecuencia absoluta acumulada es el nmero de veces
que ha aparecido en la muestra un valor menor o igual que el de la variable., as tenemos:
F1 f1
F2 f1 f 2
F3 f1 f 2 f 3
Fi f1 f 2 f 3 .... f i , i 1, 2, 3, ....., n
Frecuencia Relativa Simple ( hi ), Es el cociente entre la frecuencia absoluta y el nmero de
observaciones realizadas ( n ). Sus valores son nmeros reales que oscilan entre 0 y 1. La
suma de todas las frecuencia relativas es igual a 1. Se denota por:
fi
hi ; 0 hi 1
n
H 3 h1 h2 h3 Hi i
n n
H i h1 h2 h3 .... hi
2.2. TABLA DE DISTRIBUCIN DE FRECUENCIAS DE UNA VARIABLE CUALITATIVA
Preferencia fi Fi hi Hi
Siempre 24 24 0.48 0.48
A veces 9 33 0.18 0.66
Nunca 17 50 0.34 1
Total 50 1
Interpretacin:
f2: 9 amas de casa a veces utilizan el jabn
F2: 33 amas de casa siempre utilizan el jabn o a veces
h3: 34% de amas de casa nunca utilizan el jabn
H2: 66% amas de casa siempre utilizan el jabn o a veces
Son aquellas que se utilizan para agrupar datos cuantitativos de acuerdo a los diferentes
valores que toman las variables.
Ejemplo: Los siguientes corresponden al nmero de viajes que realizan por da un grupo de
vendedores entrevistados a azar en la empresa SPORTX
4 2 6 3 5 5 3 4 3 3
3 4 4 4 3 5 4 5 5 4
3 2 2 3 5 3 6 5 2 4
3 3 6 4 3 3 2 2 4 3
4 3 3 4 5 4 2 4 3 5
Tabla 3
TABLA DE FRECUENCIAS SOBRE EL NMERO DE VIAJES DE LOS
VENDEDORES
N Viajes fi Fi hi Hi
2 viajes 7 7 0.14 0.14
3 viajes 17 24 0.34 0.48
4 viajes 14 38 0.28 0.76
5 viajes 9 47 0.18 0.94
6 viajes 3 50 0.06 1.00
Total 50 1.00
Interpretacin:
f3:14 vendedores de SPORTX realizaron 4 viajes
F2: 24 vendedores realizaron menos 4 viajes (mximo 3)
H3: 76% de vendedores realizaron menos 5 viajes (mximo 4)
ser el punto medio del intervalo, esto es, . Para construir la tabla con intervalos
de clase se debe seguir los siguientes pasos:
Paso1: Rango (R). Llamado tambin recorrido de los datos, es la diferencia entre el valor
mximo y el valor mnimo de la variable. Consideremos las siguientes variables
y1 , y2 , y3 , ......, yn , entonces: R Ymax Ymin
Paso3: Amplitud de Clase ( c ). Es el tamao o longitud que deben tener los intervalos; se
recomienda tener intervalos del mismo tamao. Se calcula mediante la frmula:
R
c
m
Es la semisuma entre el lmite superior y el lmite inferior del intervalo de clase. Sea el
LI LS
intervalo LI LS entonces yi
2
Ejemplo: Los siguientes datos indican el nmero de minutos que ocuparon sus asientos 50
clientes en una cafetera:
73 65 82 70 45 50 70 54 32 75
75 67 65 60 75 87 83 40 72 64
58 75 89 70 73 55 61 78 89 93
43 51 59 38 65 71 75 85 65 85
49 47 55 60 76 75 69 35 45 63
Li Ls Yi fi Fi hi Hi
32 41 36.5 4 4 0.08 0.08
41 50 45.5 5 9 0.1 0.18
50 59 54.5 6 15 0.12 0.3
59 68 63.5 11 26 0.22 0.52
68 77 72.5 15 41 0.3 0.82
77 86 81.5 5 46 0.1 0.92
86 95] 90.5 4 50 0.08 1
50 1
Interpretacin:
f3: 4 clientes ocuparon sus asientos como mnimo 32 minutos pero menos de 41
F4: 26 clientes estuvieron sentados menos de 68 minutos
h5: 30% clientes se sentaron al menos 68 minutos pero menos de 77
H3: ___________________________________________________________________
TEMA GRAFICOS ESTADISTICOS
III
Al igual que las tablas estadsticas, los grficos estadsticos deben tener un ttulo y una
explicacin de QUE, DONDE y CUANDO se obtuvo la informacin. Tiene las siguientes
partes:
El ttulo principal
Ttulo secundario o subttulo
El grfico propiamente dicho
Fuente
Las notas explicativas
Interpretacin
Programa
# Nios
Televisivo
Caricaturas 13 nios
Concursos 10 nios
Deportes 7 nios
Aventuras 8 nios
Telenovelas 10 nios
Documentales 4 nios
Lucha libre 13 nios
Comunidad Amplitud de
autnoma de Nmero de cada sector
nacimiento alumnos (fi) (360 - hi)
Andaluca 19 64%
Extremadura 7 23%
Catalua 2 7%
Asturias 1 3%
Galicia 1 3%
Total 30 100.00%
Interpretacin: La mayora de alumnos (64%)
proceden de Andaluca, el 3% proceden de Asturias
y Galicia
3.3.3 GRAFICO DE LINEAS.Los Grficos de lneas representan los valores de los datos en
dos ejes cartesianos ortogonales entre s. Pueden utilizarse para ms de una serie de
datos. Se utilizan para representar valores con grandes incrementos entre s.
Mes Precios
Jul-09 106.3
Ago-09 106.7
Sep-09 106.4
Oct-09 107.2
Nov-09 107.8
Dic-09 107.8
Ene-10 106.7
Feb-10 106.5
Mar-10 107.3
Abr-10 108.4
May-10 108.7
Jun-10 108.9
Jul-10 108.4
3.3.4 HISTOGRAMAS.
Un histograma es una representacin grfica de una variable en forma de barras, donde
la superficie de cada barra es proporcional a la frecuencia de los valores representados.
En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las
variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo
en el que estn agrupados los datos.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de
la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores
continuos. En los casos en los que los datos son cualitativos (no-numricos), como
sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que
en ciencias naturales y exactas. Y permite la comparacin de los resultados de un
proceso.
Su grfica se realiza entre: (Intervalos vs fi) e (Intervalos vs hi)
Ejemplo: Se realiza un estudio a 50 restaurantes de la ciudad a los cuales se les consult los
precios de sus platos.
Li Ls fi
14 21 1
21 28 5
28 35 7
35 42 16
42 49 10
49 56 9
56 63 1
63 70 1
50
Es decir, por tanto, podramos establecer que un polgono de frecuencia es aquel que se
forma a partir de la unin de los distintos puntos medios de las cimas de las columnas
que configuran lo que es un histograma de frecuencia. Este se caracteriza porque utiliza
siempre lo que son columnas de tipo vertical y porque nunca debe haber espacios entre
lo que son unas y otras.
Ejemplo: Del ejemplo anterior construir el polgono de frecuencia
Li Ls fi Fi
14 21 1 1
21 28 5 6
28 35 7 13
35 42 16 29
42 49 10 39
49 56 9 48
56 63 1 49
63 70 1 50
50
ACTIVIDADES
3. Los siguientes corresponden a los delitos econmicos registrados por la polica nacional durante el ao
2012, se cuenta con 40 registros elegidos aleatoriamente.
B A B C A C A B A A
Utiliza:
D C A B D B A B D A A: Adulteracin
A B C A A C A A B A B: Acaparamiento
A A B C A D B A A B C: Especulacin
D: Piratera
a) Organice los datos en una tabla de distribucin de frecuencias de acuerdo a los delitos econmicos.
b) Interprete las siguientes frecuencias: f 3 ; F2 ; h4 ; H 3
4. Los siguientes datos pertenecen a la distribucin de la produccin de papas (en toneladas) en 40 zonas
del pas:
y1 20 ; f 2 f 5 2 ; y5 100 ; f1 4 ; f 3 20
Si se sabe que la distribucin es simtrica y presenta 5 intervalos de clase con amplitud constante.
Construya una tabla de frecuencias.
5. En una clase de Estadstica hemos medido la altura de los 25 alumnos. Sus medidas, en cm, son:
N de empleados
LI LS yi fi Fi hi Hi
[ 82 12
[ 90 44
[
[ 30
[ ] 17
TOTAL 1.00
7. El cociente intelectual de los 200 alumnos de un centro de bachillerato est representado en el siguiente
grfico.
8. El siguiente grfico representa un total de 600 elementos. Cul es la frecuencia de cada categora?
AUTOEVALUACIN N 1
1. El Gerente de Personal de una gran empresa manufacturera que cuenta con 1850 trabajadores, desea
conocer la experiencia promedio de un trabajador en el puesto que actualmente ocupa. Para ello
selecciona al azar 20 trabajadores de cada uno de los 6 departamentos que constituyen la empresa. Uno
de los trabajadores manifest que tiene una experiencia de 6 aos y medio. En esta condicin identifique
a) Objetivo del problema ______________________________________________________________
b) Variable y tipo ____________________________________________________________________
c) Poblacin ________________________________________________________________________
d) Muestra _________________________________________________________________________
e) Parmetro _______________________________________________________________________
3. Se ha realizado un estudio de las rentas de alquiler de 390 viviendas (donde la renta viene dada en miles
de soles), en una poblacin de tamao medio, obtenindose:
Rentas de N de viviendas
alquiler yi fi Fi hi Hi
[ 400 - 450 20
[ - 140
[ - 180
[ - 40
[ - ]
Total
a) Completa la tabla de frecuencias e interprete f3 y F2
b) Qu porcentaje de viviendas tienen alquileres de al menos a S/.500?
c) Construya un polgono de frecuencias
______________________________________________________________________________________
________________________________________________________________________________
UNIDAD 2
En esta unidad el alumno determinara las medidas de tendencia central y dispersin mediante
tcnicas descriptivas y ser capaz de resolver problemas, as como la aplicacin de las leyes de
tendencia central y de variabilidad.
OBJETIVOS ESPECFICOS
Conocer los diferentes tipos de medidas de tendencia central para su aplicacin en distintos
problemas segn los datos que pueden ser no agrupados y agrupados.
Identificar las medidas de dispersin que ms se utilizan y su aplicacin en problemas de
distribucin de frecuencia y en datos, as como diferenciar estas con las medidas de
centralizacin.
CONTENIDO TEMTICO
4.1. DEFINICIN
Las Medidas de Tendencia Central o Medidas de Posicin son aquellos valores que
representan un conjunto de datos y que generalmente estn ubicados en la parte de la
distribucin central de la distribucin. Los conocimientos de estas medidas es de gran utilidad,
tanto en los niveles de decisin como de ejecucin.Las ms comunes son:
Media Aritmtica
Mediana
Moda
i 1
Xi
X1 X 2 ........... X N
X
N N
Ejemplo1: Sea las edades en aos de 5 nios son 8, 3, 5, 12 y 10. Entonces la Media
Aritmtica de las edades de stos nios es:
8 3 5 12 10 38
X 7.6
5 5
fy i i
x i 1
; donde n es igual al nmero total de datos.
n
Inversiones
LI LS yi fi fi yi
[4 10 7 1 7
[10 16 13 3 39
[16 22 19 6 114
[22 28 25 12 300
[28 34 31 11 341
[34 40 37 5 185
[40 46 43 2 86
TOTAL n =40 1072
4.3. MODA
1
M o LI c j
2 1
Donde:
Inversiones
LI LS yi fi
[4 10 7 1
[10 16 13 3
[16 22 19 6
[22 28 25 12
[28 34 31 11
[34 40 37 5
[40 46 43 2
TOTAL n =40
Pasos:
Ubicamos primero la mayor frecuencia: f j 12
1 12 6 6 ; 2 12 11 1
6
Mo 22 6 28.857
6 1
Interpretacin: El monto de inversin que ms se repite es $28857 lo que significa que
la mayora de las empresas invierte esa cantidad.
4.4. MEDIANA
La Mediana es la medida que divide en dos grupos iguales a la distribucin de datos, previa
ordenacin en forma ascendente o descendente. En otras palabras, es el valor que ocupa el
lugar central.
4.4.1 MEDIANA DE DATOS NO AGRUPADOS
Para determinar la Mediana de n observaciones x1 , x2 ,........., xn primero se ordenan
n
2 F j 1
Me LI c j
F j F j 1
Donde:
LI : Lmite inferior de la clase mediana
Observacin:
Se denomina clase mediana al intervalo de clase que contiene a la mediana en una
tabla de distribucin de frecuencias
Inversiones
LI LS yi fi Fi
[4 10 7 1 1
[10 16 13 3 4
[16 22 19 6 10
[22 28 25 12 22
[28 34 31 11 33
[34 40 37 5 38
[40 46 43 2 40
TOTAL n =40
Pasos:
n 40
i) Calcular 20 y ubicar en los Fi
2 2
ii) Luego la mediana se encuentra en la clase [22 28 , por lo tanto:
LI 22 ; Fj 22 ; F j 1 10 ; ; c j =6
20 10 10
Me 22 6 22 6 27
22 10 12
xi 61 64 67 70 73
fi 5 18 42 27 8
Calcular:
xi fi Fi xi fi |x x | |x x | fi xi2 fi
Moda
Mo = 67
Mediana
100/2 = 50 Me = 67
Media
Desviacin media
Rango
r = 73 61 = 12
Varianza
Desviacin tpica
2). El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes
sigue una ley normal con media desconocida y desviacin tpica 0,5 minutos. Para
una m uestra aleatoria de 25 clientes se obtuvo un tiem po medio de 5,2 m inutos.
1. Calcula el intervalo de confianza al nivel del 95% para el tiem po m edio que se
tarda en cobrar a los clientes .
Solucin:
2. Indica el tamao muestral necesario para estim ar dicho tiem po medio con
un el error de 0,5 minutos y un nivel de confianza del 95%.
Solucin:
n 4
3). La empresa Purina los implementados nuevos bonos quincenales en dlares encontrando los
siguientes resultados de 40 empleados:
63 82 36 49 56 64 59 35
43 51 70 57 62 43 68 62
64 72 52 51 62 60 71 26
59 60 67 57 67 61 67 51
50 64 76 44 73 56 62 63
a) Construya una tabla de distribucin de frecuencias con su respectivo ttulo, para determinar el
nmero de intervalos utilice la Ley de Surges.
b)
Tabla de Frecuencias sobre los nuevos bonos quincenales en dlares de los empleados
DISTRIBUCION DE FRECUENCIAS
63 82 36 49 56 64 59 35 43 51
70 57 62 43 68 62 64 72 52 51
62 60 71 26 59 60 67 57 67 61
67 51 50 64 76 44 73 56 62 63
N DE DATOS 40
V MAX 82
V MIN 26
RANGO( R ) 56
N DE INETRVALOS( K ) 7 1.60 5.32 6.32
AMPLITUD DE CLASE ( A ) 8 8.00
INTERVALOS
L.I L.S M f h p% F2 H2 P%2
[26 34> 30 1 0.03 3% 1 0.03 3%
[34 42> 38 2 0.05 5% 3 0.08 8%
[42 50> 46 4 0.10 10% 7 0.18 18%
[50 58> 54 9 0.23 23% 16 0.40 40%
[58 66> 62 14 0.35 35% 30 0.75 75%
[66 74> 70 8 0.20 20% 38 0.95 95%
[74 82> 78 2 0.05 5% 40 1 100%
40 1 100%
4). Una encuesta de preferencia aplicada a los clientes de Leydy Tours sobre el pago del ticket de
vuelo a ciudad de Trujillo, en dlares, los clientes respondieron que les gustara que cueste:
67 80 75 66 57 78 56 55 54 50
58 48 50 90 85 65 58 65 50 49
N DE DATOS 20
V MAX 90
V MIN 48
RANGO( R ) 42
N DE INETRVALOS( K ) 6
AMPLITUD DE CLASE ( A ) 7
1268
= = 63.4
20
Interpretacin: El pago de ticket promedio para el viaje a la ciudad de Trujillo fue de 63.4 dlares.
Li ls Yi fi Fi
[48 55> 51.5 6 6
[55 62> 58.5 5 11
[62 69> 65.5 4 15
[69 76> 72.5 1 16
[76 83> 79.5 2 18
[83 90] 86.5 2 20
Total N=20
106
Me=55 + 7 ( ) = 60.6
116
Interpretacin: El 50% de los pagos de los tickets de viaje a la ciudad a Trujillo cuestan un monto menor o
igual a 60.6 dlares
Li ls Yi fi fixyi
[48 55> 51.5 6 309
[55 62> 58.5 5 292.5
[62 69> 65.5 4 262
[69 76> 72.5 1 72.5
[76 83> 79.5 2 159
[83 90] 86.5 2 173
Total N=20 1268
6
Mo=48 + 7 ( ) = 51.84 52
6+65
Interpretacin: El pago de ticket que ms se repite para el viaje a la ciudad de Trujillo fue de 50 dlares en
donde la mayora de pasajeros compran un ticket a ese costo.
5.1 DEFINICIN
Son indicadores estadsticos que representan cuan dispersas se encuentran los datos de la
variable, sealando el grado de concentracin de los mismos con respecto al promedio de la
distribucin. Las ms comunes son:
Recorrido o rango
Varianza
Desviacin Estndar o Tpica
Coeficiente de Variacin
Ejemplo: Sean las distancias de tres viviendas en dos muestras en que muestra las viviendas
estn ms separadas o dispersas?
El rango de una variable es la diferencia entre el valor mximo y valor mnimo. Se define como:
R X max X min
Ejemplo: Observando las edades de un grupo de personas: 6, 10, 16, 22, 36, 48 ,56
Hallar el rango de los datos. R 56 6 50 aos.
5.3. VARIANZA Y DESVIACIN ESTNDAR
Xi X
N
Xi N X 2 2
POBLACIONAL i 1
V(X )
2
V(X)
N N
n n
x x xi2 nx
2 2
i
MUESTRAL
s2 V ( x) i 1
i 1
s V ( x)
n 1 n 1
N N
2 2
fi X i X fi X i N X 2
POBLACIONAL i 1 i 1
2 V(X ) V(X)
N N
n n
f i xi x fi xi2 nx
2 2
MUESTRAL
s2 V ( x) i 1
i 1
s V ( x)
n 1 n 1
OBSERVACIONES:
A la desviacin estndar tambin se la llama desviacin tpica y es la raz cuadrada
de la varianza. La varianza nunca es negativa.
Cuando la variable toma un nico valor; es decir cuando es constante entonces la
varianza es cero.
Mientras ms se aproxima a cero, ms concentrados estn los valores de la serie
alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms
dispersos estn.
Varianza : s 2
475.12
10 1
Desviacin estndar : s 475.12 21.8
Impuestos (miles) xi fi f i xi f i xi 2
35 41 38 4 152 5776
41 47 44 9 396 17424
47 53 50 14 700 35000
53 59 56 11 616 34496
59 65 62 8 496 30752
TOTAL n=46 2360 123448
fi xi 2360
Determinando la media: x n
46
51.3
123448 46(51.3) 2
La Varianza es: s 53.12
2
46 1
S
C .V % 100 (Coeficiente de variacin muestral)
X
OBSERVACIN:
Al realizar comparaciones entre dos variables, el C.V. mas pequeo ser el que tenga
menor dispersin relativa.
Un C.V. mayor a 30% indica un alto grado de dispersin y pequea representatividad de la
media, pero cuanto menor sea a 30% la media ser mas representativa.
Conclusin
Comparando los tres coeficientes de variacin se observa que el segundo obrero tiene el
menor coeficiente, por lo tanto dicho obrero tiene rendimiento ms homogneo o uniforme
ACTIVIDADES
1. Una compaa de transportes conserva los registros del kilometraje en todo su equipo rodante. A
continuacin se anotan los registros del kilometraje semanal de sus camiones:
810 450 756 789 210 657 589 488 876 689
1450 560 469 890 987 559 788 943 447 775
2. Las ventas de cinco vendedores de una empresa son: $8000, $9000, $10500, $9800 y $55000. Calcula el
sueldo medio, la moda y la mediana e indica cul representa mejor a los datos.
Sueldos yi fi Fi yi fi
200 400 25
400 600 26
600 800 35
800 1000 8
1000 1200 15
5. Los costos de fabricacin, en soles, de diez objetos son los siguientes: 9.35, 9.46, 9.20, 9.80, 9.77, 9.00,
9.99, 9.36, 9.50, 9.60, si el precio de venta de cada objeto es 3 veces su costo de fabricacin menos 5
soles, calcular la utilidad media por objeto.
6. Se desea analizar el precio de las viviendas en el municipio de Surco para ello tras un minucioso estudio
en el registro de la propiedad y una agrupacin de los datos se obtiene que durante los primeros 5
meses del presente ao los precios vienen reflejados en la tabla siguiente y las unidades vienen dadas
en miles de dlares:
Li Ls Yi fi Fi Yi fi
- 880
- 1950
- 35 1800
- 13
- 200
- ] 4 70
90 110 33
42
110 130 9
12
130 150 8 3
10. En una fbrica, el personal de planta est dividido en supervisores, operarios calificados y asistentes. Se
cuenta con la siguiente informacin:
Ingresos yi fi Fi hi Hi
[ - ) 5
[ - ) 10
[ - 25 ) 25
[ - 30 ) 35
[ - ) 22
[ - )
a) Cul es el gasto total anual para pagar el sueldo de todos los contadores?
b) Qu medida me permite comparar la dispersin de salarios?
c) Qu grupo de contadores tiene los sueldos ms homogneos?
x i 187 ; x2
i 5009 ;
Calcule el Coeficiente de Variacin e interprete.
UNIDAD 3
En esta unidad se analizar la correlacin y regresin lineal existente entre dos variables X,Y.
Adems se conocer y aplicar la teora de la probabilidad en diversos sucesos y eventos.
OBJETIVOS ESPECFICOS
CONTENIDO TEMTICO
Es frecuente que estudiemos sobre una misma poblacin los valores de dos variables
estadsticas X e Y distintas, con el fin de ver si existe alguna relacin entre ellas. El anlisis de
este relacionamiento presenta dos aspectos diferentes.
Unas veces nuestro inters est en conocer si las dos variables estn asociadas y medir
hasta qu punto los cambios en una pueden explicarse por los cambios que ocurren en la
otra. En tal caso tenemos un problema de correlacin y la medida que cuantifica es el llamado
Coeficiente de Correlacin.
Otras veces, cuando estamos seguros que existe un alto grado de asociacin entre las dos
variables, el anlisis se encamina a cuantificar la relacin existente con el fin de predecir
cules sern los valores de la variable respuesta, en este caso tenemos un problema de
Regresin.
6.1.1 DEFINICIN. El anlisis de correlacin tiene como objetivo medir la fuerza de una
relacin entre variables cuantitativas y/o cualitativas, esta es medida a travs del
coeficiente de correlacin, para variables cuantitativas que tienen distribucin normal se
utilizar la correlacin momento-producto de Pearson y para variables que no tienen
distribucin normal o cualitativas la correlacin de rango de Tau de Kendall o Spearman.
Esta relacin que es analizada puede estar dada de manera lineal, la cual nos dice que
los datos se ajustaran a una lnea recta o tambin estara de una forma no lineal en este
caso los datos se ajustaran ms a una curva. Es decir, dos variables pueden estar
perfectamente relacionadas, pero si la relacin no es lineal, el coeficiente de correlacin
de Pearson o de Spearman no ser un estadstico adecuado para medir su asociacin.
Si la relacin que se busca es solamente entre dos variables, recibe el nombre de
correlacin simple o bivariada.
Correlacin Positiva
(Directa)
Correlacin Negativa
(Inversa)
Sin correlacin
Ejemplo1: Los siguientes datos representan los aos de prctica profesional y el ingreso
anual (en miles de soles) para un conjunto de servidores pblicos. Construir el diagrama de
dispersion e indicar el tipo de correlacin.
Aos de
Practica (X) Ingreso (Y)
5 40
15 40
24 90
16 70
19 60
3 20
6 30
12 30
27 70
13 50
Interpretacin: Observando el grfico podemos decir los aos de
prctica y el ingreso anual tienen una correlacin Directa o Positiva.
Observacin: Si se desea investigar la relacin existente entre dos variables el primer paso
ser trazar el diagrama de dispersin, el cual proporcionar una idea del tipo de relacin
existente entre ambas variables.
6.1.4 COEFICIENTE DE CORRELACIN.
Es un nmero que indica el grado de asociacin entre las variables y se define del
siguiente modo:
n
xi yi nxy
r i 1
n x 2 nx 2 n y2 ny 2
i i
i 1 i 1
Caractersticas:
iv) Si r 1 Existe una perfecta asociacin positiva entre las dos variables
vi) Si r 0 No Existe asociacin entre las dos variables, no existe asociacin lineal.
Ejemplo2: Del ejemplo1 sobre los aos de prctica profesional y el ingreso anual hallar el
coeficiente de correlacin:
N Aos de XY X2 Y2
Practica(X) Ingreso(Y)
1 5 40 200 25 1600
2 15 40 600 225 1600
3 24 90 2160 576 8100
4 16 70 1120 256 4900
5 19 60 1140 361 3600
6 3 20 60 9 400
7 6 30 180 36 900
8 12 30 360 144 900
9 27 70 1890 729 4900
10 13 50 650 169 2500
Total 140 500 8360 2530 29400
X Y XY X2 Y2
n 10 ; x
x 140 14 ; y
500
50
n 10 10
Entonces:
n
xi yi nxy
i 1 8360 10(14)(50)
r 0.859
n x 2 nx 2 n y2 ny 2
i i
2530 10(14)2 29400 10(50) 2
i 1 i 1
Interpretacin: Como r=0.859, existe una correlacin positiva fuerte entre los aos de
prctica y el ingreso.
Cuando existe relacin lineal, el objetivo se transforma en representar esta relacin mediante una
forma matemtica, o sea utilizando una ecuacin que determine la relacin existente entre las
variables realizas. El procedimiento a seguir es buscar una lnea o curva, que se ajuste ms a los
valores de las variables, en el caso de que sea una lnea recta, se le conoce con el nombre de
Regresin lineal y si la ecuacin resulta una curva, recibe el nombre de Regresin no lineal Si
la ecuacin que se busca es solamente en base a dos variables, se le conoce con el nombre de
Regresin simple. Si el nmero de variables es ms de dos variables, se le conoce con el nombre
de Regresin Mltiple.
6.2.1 REGRESIN LINEAL SIMPLE. Relacin de dos variables a las cuales se ajusta a una
lnea recta. Est definida por la siguiente ecuacin lineal en su forma general:
Y b0 b1 X e
Donde:
e Es el error de prediccin
A ei se le llama desviacin o error que puede ser negativo o positivo, si elevamos las
errores al cuadrado e12 e22 e32 ..... en2 debe ser lo ms pequea posible.
Y b0 b1 X
n
xi yi nxy
b i 1 b yb x
0 1
1 n
x 2
i
nx 2
i 1
Ejemplo1: Una empresa tiene 7 vendedores, y se quiere analizar las ventas mensuales (en miles
de soles) frente a los aos de experiencia. Los datos estn en la siguiente tabla.
Experiencia Ventas(miles)
N XY X2 Y2
(X) (Y)
1 13 26 338 169 676
4 2 16 32 4 256
5 8 26 208 64 676
6 6 19 114 36 361
n 7 ; x
x 106 15.14 ; y
194
27.71
n 7 7
n
xi yi nxy
i 1 3478 7(15.14)(27.71)
b 0.688
2390 7(15.14)2
1 n
x 2
i
nx 2
i 1
Y 17.29 0.688X
Interpretacin:
b0 17.29 , Son las ventas de un empleado cuando X es cero o cuando no tienen aos
palabras es el aumento en S/. 688 por cada ao de experiencia que adquiera un empleado.
( x x )( y y )
2
R
2
r2
xi nx yi ny
2 2 2 2
Caractersticas:
Ejemplo2: Del ejemplo anterior sobre la regresin entre los aos experiencia y las
ventas:
Interpretacin: El 88.3% de la variacin de las ventas (Y) son explicados por los aos de
experiencia. Existe adems un (100 -88.3)%=11.7% que no es explicado por los aos de
experiencia.
TEMA INTRODUCCIN A LAS PROBABILIDADES
VII
Las preguntas anteriores esperan como respuesta una medida de confianza para conocer un
evento futuro, o bien de una forma sencilla interpretar la probabilidad. El estudio de las
probabilidades proporciona las reglas para el estudio de los experimentos aleatorios o de
azar, que constituyen la base para la estadstica inferencial.
7.2. EXPERIMENTO
2). La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribucin
normal de media 1,62 m y la desviacin tpica 0,12 m. Cul es la probabilidad de que la media de una
3). Si se sabe que la calificacin de un estudiante es mayor que 72 cul es la probabilidad de que su
normal de media 1,62 m y la desviacin tpica 0,12 m. Cul es la probabilidad de que la media de una
5). Para encontrar una probabilidad es la divisin entre casos a favor y todos los casos posibles, este
ltimo se le conoce como espacio muestral, el espacio muestral para todos los casos es 6 debido a que un
dado tiene 6 posibles nmero.
Casos a favor= (1, 3, 5), espacio muestral (1, 2, 3, 4, 5,6) = probabilidad 3/6=1/2 o 50%
VARIABLE f F h p
BLANCO 8 8 0.4 40%
NEGRA 9 17 0.45 45%
ROJA 3 20 0.15 15%
20 1.00 100%
b) Interpretar:
P2 : el 45% de los consumidores prefieren la bebida de color negra.
Prctica 2
Se lanzan tres dados. Encontrar la probabilidad de que:
A) Salga 4 en todos
1 1 1 1
P (414243)= = = 0.0046
6 6 6 216
1x2x5
1x5x2
2x1x5 = = .
2x5x1
5x1x2
5x2x1
1 1 1 1 1 2 2 2 2 3 3 3 4 4
5
1 2 3 4 5 1 2 3 4 1 2 3 1 2
1
5 4 3 2 1 4 3 2 1 3 2 1 2 1
1
() = = =
A. ESPACIO MUESTRAL
Es denotado por , es el conjunto de todos los resultados posibles de un experimento.
B. EVENTO O SUCESO
Es cualquier subconjunto de resultados de un espacio muestral y se denota con las
letras maysculas A, B, C, etc.
Ejemplo3: Sea el experimento de lanzar un dado y observar el nmero que aparece en la
cara superior. El espacio muestral asociado a este experimento como ya sabemos es:
1, 2, 3,4,5,6
Para este experimento se pueden definir los siguientes eventos:
A: Observar un nmero impar. A 1, 3,5
E: Observar que al menos 2 monedas sean caras. E ccc, ccs, csc, scc
F: Observar que salgan solo 1 sello en cualquiera de las tres. F ccs, csc, scc
PROBLEMAS DESARROLLADOS
1). S e h a t o m a d o u n a m u e s t r a d e l o s p r e c i o s d e u n m i s m o p r o d u ct o
a l i m e n t i c i o e n 1 6 c o m e r c i o s, e l e g i d o s a l a za r e n u n b a r r i o d e u n a c i u d a d , y
s e h a n e n c on t r a d o lo s s ig u i e n t e s pr e c i os :
95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.
Suponiendo que los precios de este producto se distribu yen s egn una ley norm al
3). En una muestra de 100 pacientes que sufrieron infarto de miocardio se observa que 75 sobrevivieron
ms de 5 aos (xito). Se quiere estudiar su posible asociacin con la realizacin de ejercicio moderado
(factor). La tabla es
F nF
50 25 75
E
10 15 25
NE
60 40 100
PASO 1:
HO: Son independientes
H1: Son dependientes
F nF
60*75/100=45 40*75/100=30
E
60*25/100=15 40*25/100=10
NE
PASO 3: Obsrvese que una vez calculado uno de los valores esperados, los dems vienen dados para
conservar los totales marginales (eso es lo que significa que hay 1 grado de libertad).
PASO 4: A partir de aqu calculamos
PASO 5:
5.56 < 3.84
Rechazamos la H 0 y concluimos que hay asociacin entre el ejercicio y la supervivencia. Obviamente esta
asociacin no es necesariamente causal.
4). La cantidad de hemoglobina en sangre del hombre sigue una ley normal con una desviacin tpica de
2g/dl.
Calcule el nivel de confianza de una muestra de 12 extracciones de sangre que indique que la media
12 17 16 15 10 12 14 14 13 17
13 14 16 16 10 17 16 11 10 14
14 14 17 14 13 15 12 15 11 16
c) Construya una tabla de distribucin de frecuencias con su respectivo ttulo, para determinar el
nmero de intervalos utilice la Ley de Surges.
10 10 10 11 11 12 12 12 13 13
13 14 14 14 14 14 14 14 15 15
15 16 16 16 16 16 17 17 17 17
R=17-10 R=7
K=1+3,32log(30)
K=5.90 K=6 intervalos
A=7/6 A=1
Intervalos m f h p F H P
[10;11> 10.5 3 0.10 10% 3 0.10 10%
[11;12> 11.5 2 0.07 7% 5 0.17 17%
[12;13> 12.5 3 0.10 10% 8 0.27 27%
[13;14> 13.5 3 0.10 10% 11 0.37 37%
[14;15> 14.5 7 0.23 23% 18 0.60 60%
[15;16> 15.5 3 0.10 10% 21 0.70 70%
[16;17] 16.5 9 0.30 30% 30 1.00 100%
n=30 =1 100%
RANGO
31 34 29 28 36 28 33 26 25 19
40 37 12 8 31 10 35 38 36 31
22 34 25 26 33 31 15 35 32 29
1. Construya la tabla de distribucin de frecuencias.
(Muestre todas sus caractersticas: nmero, ttulo, encabezados, cuerpo y fuente).
Solucin:
Dado que los resultados en este ejercicio son un poco ms dispersos, utilizaremos la Regla de
Sturges para agruparlos y as construir la tabla de frecuencias.
i) Orden de Datos:
8 10 12 15 19 22 25 25 26 26
28 28 29 29 31 31 31 31 32 33
33 34 34 35 35 36 36 37 38 40
R= 40-8
R = 32
k = 1+ 3.32 log(n)
k = 1+ 3.32 log(30)
k = 5.88
k=6
A= R/K
A= 32/6
A= 5.33
A= 6
Intervalos fi hi pi Fi Hi Pi
[8, 14> 3 0,10 10,00% 3 0,10 10,00%
[14,20> 2 0,07 6,67% 5 0,17 16,67%
[20, 26> 3 0,10 10,00% 8 0,27 26,67%
[26, 32> 10 0,33 33,33% 18 0,60 60,00%
[32, 38> 10 0,33 33,33% 28 0,93 93,33%
[38, 44> 2 0,07 6,67% 30 1,00 100,00%
n = 30 1 100%
F3: 8 currculos obtuvieron puntaje menor a 26, siendo 8 el puntaje ms bajo alcanzado en el
grupo.
P4:A partir de este valor (60%) se puede deducir por complemento que el 40% (equivalente a
12 postulantes) obtuvieron un puntaje mayor a 32.
vii. Grfico:
Grfico 3
20-26
4
26-32
3
32-38
2
38-44
1
0
8-14 14-20 20-26 26-32 32-38 38-44
Puntaje
Para responder esta pregunta, nos basaremos en el Orden de Datos efectuado en la pregunta 1, acpite (i).
Segn dicha tabla, hay 4 puntajes por debajo de 18; por lo tanto, habrn 26 puntajes por encima de 18
(sabiendo que n = 30).
El clculo sera:
Porcentaje encima de 18 = (26 / 30) . 100
Porcentaje encima de 18 = (26 / 30) . 100
Porcentaje encima de 18 = 87%
7.5.2 PERMUTACIONES
Son eventos de tipo multiplicativo, donde el nmero de posibilidades va disminuyendo y si
importa el orden una permutacin es un arreglo de un conjunto de objetos en un orden
definido. El nmero de permutaciones diferentes de estos objetos es; esto se ve
fcilmente si pensamos que para la primera alternativa disponemos de los elementos del
conjunto, cada uno de los cuales puede complementarse con los restantes como
segunda opcin, y as hasta llegar a la ltima eleccin, conformando el producto. El
nmero de permutaciones posibles al tomar objetos del conjunto de elementos ser,
siguiendo el mismo razonamiento.
A. PERMUTACIONES DE n ELEMENTOS
Por el principio fundamental del conteo podemos enunciar que el nmero de
permutaciones de n objetos distintos tomados de n en n, es: Pn = n!
El smbolo ! se lee factorial y es el producto resultante de todos los enteros positivos de 1
a n; es decir, sea n un nmero entero positivo, el producto n (n-1) (n-2)...3 x 2 x 1 se
llama factorial de n.
n! = n (n -1 ) (n -2 )...3 x 2 x 1
5! = 5 x 4 x 3 x 2 x 1 = 120
Por definicin 0! = 1
7.5.3 COMBINACIONES
Son eventos similares a las
permutaciones. Pero el orden ya no importa y es necesario eliminar de las permutaciones
aquellas donde los elementos se repiten aunque con distinto orden
Una combinacin es una seleccin de objetos sin importar el orden en que se escojan:
Ejemplo5: Se tienen cinco obreros para un trabajo especial que requiere de tres de ellos.
De cuntas maneras diferentes se puede seleccionar un equipo de tres?
1
Sea el evento A 5 , un resultado favorable P ( A) 0,167
6
Determinar la probabilidad de que se obtenga un nmero par
3 1
Sea el evento B 2, 4, 6 , 3 resultados favorables P ( B ) 0,5
6 2
iii. P 0
iv. P A B P A P B P A B .
Ocurre cuando dos eventos se relacionan de manera tal que la probabilidad de ocurrencia de
uno depende de la ocurrencia del otro.
Definicin: Sean A y B dos eventos tal que P( B ) 0 , la probabilidad condicional de que
ocurra el evento A dado que ha ocurrido B, se denota:
P( A B )
P( A / B )
P( B )
Ejemplo9: En una ciudad el 55% de los habitantes consume arroz, el 30% consume trigo y el
20% consume ambos. Se pide: A= Arroz T= Trigo
a) Cul es la probabilidad de que coma trigo dado que consumi arroz?
P(T A ) 0.20
P(T / A ) 0.364
P( A ) 0.55
b) Sabiendo que un habitante consume trigo, cul es la probabilidad de que consuma arroz?.
P(T A ) 0.20
P( A / T ) 0.667
P(T ) 0.30
Ejemplo10: En una universidad el 70% de los estudiantes son de ciencias y el 30% de letras;
de los estudiantes de ciencias el 60% son varones y los de letras son varones el 40%. Si se
elige aleatoriamente un estudiante, calcular la probabilidad que:
a) Sea un estudiante varn
b) Sea un estudiante varn si es de ciencias
c) Sea un estudiante de ciencias si es varn
d) Sea un estudiante de ciencias y varn
P( C V ) 0.42
a) P(V ) 0.54 c) P( C / V ) 0.778
P(V ) 0.54
P(V C ) 0.42
b) P(V / C ) 0.6 d) P(V C ) 0.42
P( C ) 0.70
7.7.1 REGLA DE MULTIPLICACIN
Se define a partir de la probabilidad condicional:
Definicin: Sean A y B dos eventos cualesquiera, entonces se tiene:
P( A B ) P( A )P( B / A ) P( B )P( A / B )
Ejemplo12: Se conoce que cierta mquina que produce tornillos trabaja correctamente el
90% del tiempo. Si la mquina no est trabajando correctamente, el 5% de los tornillos
producidos son defectuosos. Cuando est trabajando bien solamente el 0.5% de tornillos
son defectuosos. Si se escoge un tornillo aleatoriamente Cul es la probabilidad que
sea defectuoso?
P( D ) P( C )P( D / C ) P( C )P( D / C )
= 0.90( 0.005 ) 0.10( 0.05 ) 0.0095
7.8. TEOREMA DE BAYES
Si los eventos A1 , A2 , ...., An forman una particin del espacio muestral , y B un evento
cualquiera de , entonces:
P( Ai )P( B / Ai )
P( Ai / B ) n
P( A )P( B / A )
i 1
i i
Ejemplo 1: En una lnea de produccin hay dos procesos A y B. En el proceso A hay un 20%
de defectuosos y en B 25%. En una muestra de 300 productos
hay 200 de A y 100 del B.
a) Si se extrae un producto al azar, hallar la probabilidad que
sea defectuoso.
b) Si al extraer el producto result defectuoso, halle la
probabilidad de que sea del proceso A.
2. Una casa de empanadas realiza promociones a travs de publicidad repartiendo volantes publicitarios. Se
cree que existe relacin entre x cantidad de volantes repartidos por semana en cientos e y ventas en
cientos de pesos. Se tomaron 8 semanas al azar que arrojaron la siguiente informacin:
a) Determine en qu medida la variable cantidad de volantes explica las variaciones de las ventas.
b) Determine la recta de ajuste e interprete los coeficientes.
c) Pronostique el valor las ventas, cuando se reparten 350 volantes.
3. Los siguientes datos corresponden al nmero de policas destacados por da (durante una semana) y al
nmero de asaltos que se produjeron en cierto distrito.
N policas en servicio 20 40 45 60 32 25 28
N de asaltos 54 25 20 12 27 48 42
5. De cuantas maneras se pueden colocar 12 nios en una fila, de manera que cuatro nios, en particular
queden juntos?
6. Hay dos obras de 3 volmenes y otras de dos volmenes cada una De cuantas maneras pueden
colocarse los diez libros en un estante, si deben quedar de tal manera que no se separen los volmenes
de la misma obra?
7. Al planificar una familia de 4 nios, una pareja est interesada en los siguientes eventos:
A: Todos del mismo sexo B: Exactamente un varn C: Por lo menos dos varones
Liste los elementos de los eventos A, B y C
8. En una caja hay 20 bolas numeradas del 1 al 20. Se extrae al azar una bola Cul es la probabilidad que
el nmero de la bola extrada?
a) No exceda de 20 ; b) Sea el 32 ; c) sea por lo menos 15
9. De una baraja de 52 naipes bien mezclada se sacan 5 naipes. Hallar la probabilidad de que:
a) 4 sean ases; b) 4 sean ases y 1 rey;
c) 3 sean dieces y 2 Jotas ; d) al menos uno sea un as
10. Para obtener licencia para conducir, es necesario aprobar tanto el examen terico como el prctico. Se
sabe que la probabilidad que un alumno apruebe la parte terica es 0,68, la de que apruebe la parte
prctica es 0,72 y la de que haya aprobado alguna de las dos partes es 0,82. Si se elige un alumno al
azar, cul es la probabilidad de que apruebe el examen para obtener licencia?
11. Suponga que se estudia si el color del pelo est asociado al color de los ojos. Se analizaron 300
personas seleccionadas aleatoriamente con los siguientes resultados:
12. En un supermercado el 70% de las compras las realizan las mujeres; de las compras realizadas por
estas, el 80% supera los S/. 2000, mientras que de las compras realizadas por hombres slo el 30%
supera esa cantidad. (Construya el diagrama del rbol)
a) Elegido un ticket de compra al azar, cul es la probabilidad de que supere los S/. 2000?
b) Si se sabe que el ticket de compra no supera los S/. 2000. cul es la probabilidad de que la compra
haya sido hecha por una mujer?
AUTOEVALUACIN N 3
1. Un hipermercado ha decidido ampliar el negocio. Decide estudiar de forma exhaustiva el nmero de cajas
registradoras que va a instalar, para evitar grandes colas. Para ello, se obtuvieron los siguientes datos
procedentes de otros establecimientos similares acerca del nmero de cajas registradoras y del tiempo
medio de espera.
N de cajas registradoras 10 12 14 12 18 20
2. Un estudio de mercado en una ciudad indica que, durante cualquier semana, el 18% de los adultos vieron
un programa de televisin orientado a temas financieros y empresariales, el 12% leen una publicacin
orientada a esta temtica y el 10% realizan ambas actividades.
a) Cul es la probabilidad de que un adulto de esta ciudad vea el programa de televisin o lea la
publicacin mencionada?
b) Cul es la probabilidad de que un adulto de esta ciudad, que lee la publicacin, vea dicho programa
de televisin?
3. El administrador de una obra encargada de la construccin de una autopista, sabe que el terminar a
tiempo puede demorarse por causa de una huelga. Adems sabe que debido al ambiente laborar, la
posibilidad de que exista una huelga es de 60%. Tambin sabe que de no darse la huelga la probabilidad
de acabar a tiempo es de 85%, mientras que si la huelga se da es de 0.35.
a) Cul es la probabilidad de no acabar la obra a tiempo?
b) Cul es la probabilidad de que tras haberse acabado la obra, durante la misma se haya conjurado
una huelga?
c) Cul es la probabilidad de que dado que no se acab la obra a tiempo no se haya conjurado la
huelga?
4. Se hace una encuesta en un grupo de 120 personas, preguntando si les gusta leer y ver la televisin. Los
resultados son:
A 32 personas les gusta leer y ver la tele.
A 92 personas les gusta leer.
A 47 personas les gusta ver la tele.
Si elegimos al azar una de esas personas:
a) Cul es la probabilidad de que no le guste ver la tele?
b) Cul es la probabilidad de que le guste leer, sabiendo que le gusta ver la tele?
c) Cul es la probabilidad de que le guste leer?
UNIDAD 4
OBJETIVOS ESPECFICOS
CONTENIDO TEMTICO
8.1. DEFINICIN
X: 0, 1, 2
Rx x / x 0,1,2 ; en smbolos
w X(w)
Variable aleatoria discreta: se dice que una variable aleatoria es discreta si el conjunto de
todos los valores que puede tomar es un conjunto numerable.
Variable aleatoria continua: se dice que una variable aleatoria es continua si el conjunto
de todos los valores que puede tomar no es numerable.
8.2. VARIABLE ALEATORIA DISCRETA
Rx x1 , x2 , x3 ,......
Ejemplo2: En 100 das de trabajo, los records de los empleados se marcan cada da que
ellos estn ausentes del trabajo. Se selecciona aleatoriamente un record y se observa los
das marcados. Hallar Rx
Rx 0,1,2,3,....,100
p(x)=p X=x P w
p(x)=0 si x x j j=1,2,3....
X x1 x2 xk
X 0 1 2
p(x) 1/4 2/4 1/4
F( x ) P X x p( x i )
xi x
X 0 1 2
p(x) 1/4 2/4 1/4
F(x) 1/4 3/4 1
a) P X>b 1 P X b
b) P X<b P X b P X b
c) P a<X b P X b P X a
d) P a X b P X b P X a
e) P a X b P X b P X a
ii) E ax b aE x b
i 1
X 0 1 2 3 4
P(x) a 0.15 0.35 5a 0,20
a) Calcular el valor de a
b) Hallar su funcin de distribucin acumulada
c) Obtener el promedio y desviacin estndar del nmero de coches que espera vender.
d) Calcular P 1 X 4 ; P X 3 ; P X 2
Solucin:
a) Aplicando la propiedad de que la suma de todas las probabilidades es 1 tenemos que:
6a 0.70 1 entonces a 0.05
b) Hallando F(X)
X 0 1 2 3 4
P(x) 0.05 0.15 0.35 0.25 0,20
F(X) 0.05 0.20 0.55 0.80 1
P X 2 0.35
Ejemplo 1: Sea X la variable aleatoria N de kilogramos que pierde una persona al seguir
una dieta durante cierto periodo. Su Rx pueden ser todos los puntos de un intervalo como
1;3 .
Ejemplo 2: Sea X: Tiempo de vida de un transistor. Es variable aleatoria continua por que
Rx puede ser 0;+
f(x) 0 ; x Rx
Rx
f ( x )dx 1
f ( x) a(3x x 2 ) , Si 0 x 3
0 , En otros caso
0 2 3 0 2 9
2
2
x2 2 x3
b) P 1 x 2 3 x x dx
2 13
2
1
9 3 27 1 17
EX x. f ( x )dx
Rx
Var x E x 2 E( x )
2
Donde: E x x
2 2
. f ( x )dx
Rx
3
2 x2
3 3
6 x3 2 x4 x4 2 x5
E X
2
3 x x dx 9 9 dx 6 45 2.7
2
0 0
0
9
PROBLEMAS DESARROLLADOS
1). Se desea saber si se acepta o no con los siguientes datos:
= 850
n = 46
= 650
S = 460
= 5% = 0.05
1 = 1 5% = 95%
Z = 1.96 (Teora)
Z=
-2.9 -1.96 1.96
650850
Z= 460
46
Z= -2.9
2 ) . D et e r m i n a r e l p or c e n t aj e d e p o b l a c i n q u e o b t e n dr a u n c o ef i c i e n t e e nt r e
95 y 110.
4). En una poblacin una variable aleatoria sigue una ley normal de media
la media de la poblacin.
2. Con el mismo nivel de confianza, qu tamao mnimo debe tener la muestra
n 76
Cualitativa
Cuantitativa contina.
Cuantitativa discreta.
Cuantitativa discreta.
Cualitativa.
6 El rea de las distintas baldosas de un edificio.
Solucin:
i) Clculo de la Media:
fi Marca de
Li Ls Clase (mi) fi . mi
10 12 250 11 2750
12 14 150 13 1950
14 18 100 16 1600
18 20 20 19 380
n = 520 = 6680
.
=
6680
=
520
= 12.85
fi Marca de
Li Ls Clase (m) f.m2
10 12 250 11 30250
12 14 150 13 25350
14 18 100 16 25600
18 20 20 19 7220
n = 520 = 88420
( 2 ) ( 2 )
2 =
1
2557.6
2 =
519
2 = 4.93
iii) Clculo de la Desviacin Estndar:
= 2
= 4.93
= 2.22
. . = 100%
2.22
. . = 100%
12.85
. . = 17.28%
v) Interpretacin:
a. El coeficiente de variacin obtenido se podra usar de diversas formas para obtener conclusiones
sobre las evaluaciones de estos alumnos. Por ejemplo, en caso que estos datos correspondan a
una muestra de alumnos y no a la poblacin completa, una de los usos del C.V. podra ser para
conocer el nivel de confiabilidad que podramos tener al inferir sobre lo que ocurre con la poblacin
total a partir de los resultados de esta muestra. Si ese fuese el caso, un C.V. de 17.27% (que es el
que hemos obtenido en este ejercicio) tal vez podra considerarse muy alto como para considerar
que las conclusiones sobre la poblacin seran precisas. Normalmente, un C.V. alrededor de 5% o
hasta 8% podra considerarse como mediciones precisas, dependiendo de la metodologa. De igual
forma, teniendo un C.V. por encima de 15% podramos estar hablando de una precisin regular, y
con ms de 20% la medicin se tomara como poco precisa. Dado nuestro resultado de 17.27%,
podramos decir que una proyeccin de la distribucin de las evaluaciones sobre la poblacin entera
de estudiantes podra tener una precisin solamente regular.
b. Por otro lado, si los datos corresponden a toda la poblacin, el C.V. podra usarse ms bien para
tener una idea sobre el grado de dispersin de las evaluaciones de los alumnos. Este grado de
dispersin se usara como complemento a la visin que nos proporciona la media. En este ejercicio,
la media es de 12.85. Bajo un anlisis superficial, uno podra pensar que la mayora de los alumnos
tienen una nota alrededor de ese valor. Sin embargo, eso podra no ser correcto, ya que la media
puede ser el resultado simplemente de valores extremos como 07 y 19, y podra ser que nadie
tenga evaluaciones alrededor de 12.85. Para saber si esto es realmente as, es que adems de
mirar la media, tambin consideramos la desviacin estndar y el C.V. En nuestro ejercicio, hemos
obtenido una desviacin estndar de 2.22, que nos indica que probablemente la mayora de los
alumnos tengan evaluaciones ms o menos entre 10.6 y 15. Esto nos da una figura ms clara sobre
cmo estn en su rendimiento la mayora de los alumnos, independientemente de los valores
extremos que puedan existir. En conclusin, una mirada combinada de la media y el C.V. de los
alumnos de este centro educativo nos da una idea ms completa y real del nivel de rendimiento de
la mayora de sus alumnos.
c. Tomando en cuenta lo anterior, dicho anlisis combinado de media y C.V. podra tambin permitir a
las autoridades del centro educativo comparar los resultados de sus alumnos ao tras ao y ver si el
nivel acadmico reflejado por las evaluaciones va mejorando, est estancado y viene decayendo.
Adems, si este centro educativo pudiese acceder a informacin similar de otros centros educativos
de su mismo segmento de relevancia, podra comparar el rendimiento de sus alumnos con los de
estos otros centros, ubicarse en un ranking, y tal vez adoptar mejores prcticas de aquellos centros
que obtienen mejores resultados con sus estudiantes.
6). Los ingresos diarios (en dlares) de 40 trabajadores del Poder Judicial se presentan en la siguiente
tabla:
Tabla No. 3
Ingreso de Trabajadores del Poder Judicial
188000(40)(64)2
2 = = 619.49 2 = 619.49
39
Interpretacin:
Nos indica un 38.89% de variacin de datos respecto de la media aritmtica, por lo que podemos decir que
la media aritmtica es poco representativa, no es tan confiable porque hay dispersin de los datos.
TEMA DISTRIBUCIONES ESTADISTICASPRINCIPALES
IX
iii) Los ensayos son independientes. Es decir, el resultado (xito o fracaso) de cualquier
ensayo es independiente del resultado de cualquier otro ensayo.
Definimos la variable aleatoria X de la siguiente manera:
X ( w ) : N de xitos en n ensayos de Bernoulli
Con Rx 0,1,2,3,.....n
n x n x
p q ; x 0 ,1,2, ...,n
p( x ) P( X x ) x
0 ; en otro caso
Donde: pq 1
0 ; x<0
x
n k n k
F ( x ) P( X x ) p q ;0 x n
k 0 k
1 ; x n
Si X b( n, p ) , entonces:
i) E( X ) np
Ejemplo1: Una factora observa que en promedio, el 20% de las tuercas producidas por una
mquina son defectuosas. Si se toman 10 tuercas al azar, hallar
a) La probabilidad de que exactamente 2 sean defectuosas
10
a) P( X 2 ) 0.2 20.8 8 0.3020
2
b) P( X 2 ) 1 P( X 2 ) 1 P( X 0 ) P( X 1 )
10 10
1 0.20 0.8 10 0.2 10.8 9
0 1
1 0.1074 0.2684 0.6242
c) P( X 5 ) P( X 6 ) P( X 6 ) P( X 7 ) P( X 8 ) P( X 9 ) P( X 10 )
10 10 10 10
0.26 0.8 4 0.27 0.8 3 0.2 8 0.8 2 0.2 9 0.8 1 0.2 10
6 7 8 9
0.00637
(Usar tabla de distribucin binomial que esta dado en P( X x ) )
10
d) P( X 0 ) 0.20 0.8 10 0.1074
0
e) E( X ) 10( 0.2 ) 2
Con Rx 0,1,2,3,.....n
e x
; x 0,1,2,...
p( x ) P( X x ) x!
0 ; en otro caso
Ejemplo1: Cierta oficina de bomberos recibe en promedio 3 llamadas por da. Calcular la
probabilidad de que:
a) Reciba 4 llamadas en un da
b) Reciba 3 o ms llamadas en un da
Solucin:
e 3 3 4
a) 3; P( x 4 ) 0.16803
4!
b) P( x 3 ) 1 P( x 3 ) 1 P( x 0 ) P( x 1 ) P( x 2 ) 1 0.423 0.577
Solucin:
a) Primero analizamos el periodo, en 9 minutos Cuntas llamadas pueden darse?, si 2
llamadas se reciben cada 3 minutos, entonces en 9 minutos recibirn 6 llamadas.
Entonces 6
e 6 6 0
b) P( X 0 ) e 6 0.00248
0!
Var( X )
n e x
p( x ) P X x p x q n x ( se aproxima ) P X x
x x!
Ejemplo3: Supongamos que la proporcin de personas que tienen cierta enfermedad es
0.01. Determine la probabilidad que en un grupo aleatorio de 400 personas, al menos 6
personas tienen la enfermedad.
Una variable aleatoria X tiene una distribucin hipergeomtrica si se toma una muestra sin
reemplazo de un conjunto de N elementos, de los cuales M son considerados de una categora
en especial (xitos) y los otros N-M son considerados de otra categora (fracasos) y se desea
obtener x aciertos de una muestra de n elementos ensayos. Por ejemplo, un saln de clase
con N estudiantes, de los cuales M estn aprobados y N-M desaprobados.
Definimos la variable aleatoria X de la siguiente manera:
X ( w ) Nmero de xitos en la muestra de tamao n sin reemplazo:
Rx 0,1, 2, 3,....,min( n, M )
M N M
x n x para x 0,1, 2,....., min(n, M )
P ( x ) h ( x; N , n , M ) N
n
0 en otro caso
M
E( X ) n
N
nM M N n
2 Var( X ) 1
N N N 1
Ejemplo1: Una caja contiene 9 bateras de las cuales 4 estn en buen estado y las restantes
defectuosas. Se toma una muestra eligiendo al azar tres bateras. Calcule la probabilidad que
en la muestra se obtengan,
a) Ninguna batera en buen estado
b) Al menos una batera en buen estado
c) No ms de dos bateras en buen estado
Solucin:
Este es un experimento de muestreo sin reemplazo, por lo tanto es un experimento
hipergeomtrico con
N=9 (total de elementos del conjunto)
M=4 (total de elementos considerados xitos)
n=3 (tamao de la muestra)
X: cantidad de bateras en buen estado en la muestra (variable aleatoria discreta)
Entonces la distribucin de probabilidad de X es:
4 9 4
x 3 x
P( x) h( x;9,3, 4) = , x 0,1,2,3
9
3
4 9 4
0 3 0
a) P(X=0) = = 0.119
9
3
b) P(X1) = 1 P(X<1) = 1 - 0.119 = 0.881
c) P(X2) = P(X=0) + P(X=1) + P(X=2)
4 9 4 4 9 4 4 9 4
0 3 0 1 3 1 2 3 2
= + +
9 9 9
3 3 3
= 0.119 + 0.4762 + 0.3571 = 0.9523
Solucin:
= 3(4/9) = 1.333 (es la cantidad promedio de bateras en buen estado
que se obtienen en la muestra)
3( 4 ) 4 93
2 = (1 )( ) = 0.555
9 9 91
9.4.1 DEFINICIN
Se dice que una variable aleatoria continua sigue una distribucin normal de media y
1 x 2
1 2
f ( x) e
2
DISTRIBUCIN NORMAL
1). Un investigador cientfico reporta que unos ratones vivirn un promedio de 40 meses
cuando sus dietas se restringen drsticamente y despus se enriquecen con vitaminas y
protenas. Suponga que las vidas de tales ratones se distribuyen normalmente con una
desviacin estndar de 6.3 meses, encuentre la probabilidad de que un ratn dado viva.
40
6,3
x
a) Ms de 32 meses
3240
P (X >32) = 1 P (x<32) = 1 P (Z < )
6.3
1 P (Z < -1.27) = 1 0.10204 = 0.89796
b) Menos de 28 meses
2840
P (X < 28) = P (Z<28) = P (Z< )
6.3
P (Z < -1.90) = 0.02872
c) Entre 37 y 49 meses
3740 4940
P (37< X< 49) = P ( <Z< ) = P ( -0.48 < Z < 1.43 )
6.3 6.3
P (Z < 1.43) P (Z < -0.48)
0.92364 0.31561
0.60803
-0.48 1.43
-0.48
50
P= = 0.33
150
= 150
= 0.05 (se supone)
= 1.96 (95%)
= 0.05 = 5/100 = 5%
1 = 1 5% = 95%
z = 1.96
Solucin:
()
Pe ( P Z )
() ()
LI:( P - Z )LS: ( P + Z )
0.33 (0.67) 0.33 (0.67)
LI: 0.33 1.96 LS: 0.33 + 1.96
150 150
LI = 0.256 =
0.26 LS = 0.405 =
0.41
Z=
-2.9 -1.96 1.96
650850
Z= 460
46
Z= -2.9
x2
1
( z ) e2
2
( z ) P Z z (u)du , z
z
9.4.4 ESTANDARIZACIN DE UNA VARIABLE ALEATORIA X (Para buscar en tablas)
X
Z
La cual tiene distribucin N ( 0,1 ) , esto es la V.A. Z tiene distribucin normal con media
cero y varianza 1. Este tipo de procedimiento se denomina estandarizacin de la V.A. X.
X 60 72 93 72 72 72
a) Z 0.8 b) Z 1.4 c) Z 0
15 15 15
Ejemplo 2. El gerente de personal de una gran compaa requiere que los solicitantes a
un puesto efecten cierta prueba y alcancen una calificacin de 500. Si las calificaciones
de la prueba se distribuyen normalmente con media 485 y 30
520 485
P( x 520 ) P Z P Z 1.17 0.878
30
c) Cul es la probabilidad que un solicitante obtenga entre 450 y 510 en la prueba?
P( 450 x 510 ) P( x 510 ) P( x 450 )
510 485 450 485
PZ PZ P Z 0.83 P Z 1.17
30 30
= 0.79767 - 0.12167=0.676
PROBLEMAS DESARROLLADOS
2). Se realiz un estudio sobre la infraestructura de los centros educativos inicial del distrito de los olivos,
durante el ao 2010.
Tabla No.1
Situacin de Infraestructura de los Centros Educativos Iniciales del Distrito de Los Olivos
variable cualitativa
Variable fi hi pi
n=24 =1 100%
d) Interpretar:
P2 = 29%
Significa que el 29% de los Centros Educativos Iniciales del Distrito de Los Olivos, en el ao 2010,
contaban con una infraestructura cuyo estado de conservacin estaba en buenas condiciones.
3). La cantidad de hemoglobina en sangre del hombre sigue una ley normal con una desviacin tpica de
2g/dl.
Calcule el nivel de confianza de una muestra de 12 extracciones de sangre que indique que la
1. Sea x una variable aleatoria que expresa el n de personas que habitan en una vivienda elegida al azar.
La distribucin de probabilidad de x es la siguiente:
xi 1 2 3 4 5 6 7
p(x) 0.230 K 0.177 0.155 0.067 0.024 0.025
a) Halla el valor de K
b) Obtener el n medio de personas que habitan en una vivienda y su desviacin estndar
c) Hallar la probabilidad que el n de personas que viven en un hogar sea como mximo cuatro.
d) Calcular la probabilidad de que al menos dos personas vivan en una vivienda.
3. El tiempo T, en minutos, necesarios para que un Psiclogo evale a un empleado sobre sus aptitudes, es
una variable aleatoria con la siguiente distribucin de probabilidad:
T 2 3 4 5 6 7
P(T) 0.15 2a 0.25 0.25 0.20 a
4. El nmero total de horas, medidas en unidades de 100 horas, que una familia utiliza una aspiradora en un
periodo de un ao es una variable aleatoria continua X que tiene funcin de densidad:
k 0 x2
f ( x) k ( x 1) 2 x4
a) Hallar el valor k
b) Determinar su funcin F(x) y encuentre la probabilidad de que en un periodo de un ao, una familia
utilice la aspiradora por lo menos de 50 horas pero menos 240
Y 5 x 2
2
c) Calcular el promedio de la variable
5. La opinin que tiene la poblacin sobre la gestin de su Ayuntamiento es favorable en el 30% de los
casos y desfavorable en el resto. Elegidas 10 personas al azar, halla:
a) La probabilidad de que dos la consideren favorable.
b) La de que ninguno la considere desfavorable.
7. Una prisin de mxima seguridad reporta que el nmero de intentos de escape por mes sigue una
distribucin aproximadamente Poisson con una media de 1,5 intentos/mes. Calcule:
a. Probabilidad de tres intentos de escape durante el prximo mes.
b. Probabilidad de al menos un intento de escape el prximo mes.
8. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narctico en una
botella que contiene 9 pldoras de vitamina que son similares en apariencia. Si el oficial de la aduana
selecciona 3 tabletas aleatoriamente para analizarlas,
a) Cul es la probabilidad de que el viajero sea arrestado por posesin de narcticos?,
b) Cul es la probabilidad de que no sea arrestado por posesin de narcticos?
9. Un representante realiza 5 visitas cada da a los comercios de su ramo y por su experiencia anterior
sabe que la probabilidad de que le hagan un pedido en cada visita es del 0.4. Obtener:
a) El nmero medio de pedidos por da y la varianza
b) La probabilidad de que el N de pedidos que realiza durante un da est entre 1 y 3.
c) La probabilidad de que por lo menos realice dos pedidos
10. El nmero medio de automviles que llegan a una gasolinera es de 240 por hora. Si dicha estacin
puede atender a un mximo de 8 automviles por minuto, determine la probabilidad de que, en un minuto
dado, lleguen a la estacin ms automviles de los que puede atender.
11. Un almacn recibi 2000 botellas de agua mineral. La probabilidad de que al transportar una botella
resulte rota es igual a 0.003. Hallar la probabilidad de que el almacn reciba rotas:
a) Exactamente tres botellas
b) Por lo menos 2
12. Entre los 16 aspirantes a obtener un empleo, 10 tienen grado universitario. Si para ser entrevistados se
elige al azar a tres de los solicitantes, cules son las probabilidades de que:
a)Ninguno tenga un grado universitario b) Dos tengan grado universitario
13. Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Por la experiencia de
pruebas anteriores, se sabe que las puntuaciones siguen una distribucin normal de media 80 y
desviacin estndar 25. Qu porcentaje de candidatos obtendr entre 75 y 100 puntos?
14. Las ventas diarias, en euros, en un determinado comercio siguen una distribucin con media
poblacional de 950 euros y desviacin estndar de 98 euros. Calcula la probabilidad de que las ventas
diarias en ese comercio:
a) Superen los 1200 euros. c) Sean exactamente de 1000 euros
b) Estn entre 700 y 1000 euros. d) Sean al menos1100 euros
15. Gensa es una asociacin internacional de personas con alto coeficiente intelectual. Para pertenecer a
ella, una persona debe tener un coeficiente intelectual de 132 o ms alto (USA today, 13 de febrero de
1992). Si las calificaciones del coeficiente de inteligencia se distribuyen normalmente con promedio de
100 y desviacin estndar de 15, qu porcentaje de personas califican para ser miembros de Gensa?
AUTOEVALUACIN N 4
1. El Gerente de ventas de la Librera Estudia ha determinado que la demanda por semestre del libro
Harry Potter es una variable aleatoria X con distribucin de probabilidad:
X 10 20 30 40 50
P X 0.1 2k 0.2 0.3 3k
a) Hallar el valor de K
b) Cuanto es la demanda esperada de libros
c) Calcula la probabilidad que al demanda sea a lo mucho 30 libros
d) Calcula la probabilidad que al demanda sea al menos 20 libros menos 50
2. Se sabe que el 30% de la poblacin de una determinada ciudad ve un concurso que hay en televisin.
Desde el concurso se llama por telfono a 10 personas de esa ciudad elegidas al azar. Calcula la
probabilidad de que, entre esas 10 personas, estuvieran viendo el programa:
a) Al menos 6 personas pero no ms de 8.
b) Menos de 5 personas
c) Halla la media y la desviacin tpica.
3. En una clase en la que hay 20 estudiantes, 15 estn insatisfechos con el texto que se utiliza. Si se le
pregunta acerca del texto a cuatro estudiantes tomados al azar, determine la probabilidad de que:
a) exactamente tres estn insatisfechos con el texto.;
b) cuando menos tres estn insatisfechos.
4. Desde el ao 1980 el nmero medio de empresas que han presentado suspensin de pagos ha sido de
6,8 por ao y admitimos que el nmero de empresas X que han presentado suspensin de pagos
durante un periodo determinado de tiempo sigue una distribucin de Poisson. Obtener:
a) Probabilidad de que ninguna empresa presente suspensin de pagos durante un trimestre.
b)Probabilidad de que por lo menos dos empresas presente suspensin de pagos durante un
determinado ao.
5. Los depsitos en el banco de Arequipa durante el mes de Mayo ltimo estn normalmente distribuidos,
con media S/.10000 y una desviacin estndar de 1500. Un depsito es seleccionado al azar de los
depsitos referentes al mes de Mayo. Encontrar la probabilidad de que el depsito sea:
a) menor de S/.14000
b) Por lo menos S/.12000
c) Un valor entre S/.12000 y S/.15000
SOLUCIONARIO DE AUTOEVALUACIONES
AUTOEVALUACIN DE UNIDAD I
3.
Rentas yi fi Fi hi Hi
[ 400 - 450 425 20 20 0.051 0.051
[ 450 - 500 475 140 160 0.359 0.410
[ 500 - 550 525 180 340 0.462 0.872
[ 550 - 600 575 40 380 0.103 0.974
[ 600 - 650 ] 625 10 390 0.026 1.000
Total
a) Interpretacin
f3: 180 viviendas pagan mnimo S/. 500 en rentas pero menos de S/.550
F2: 160 viviendas pagan menos de S/.500 en rentas
b) 58.97%
4. Interpretacin: Segn el grfico las exportaciones son mayores a las importaciones desde el 2000 hasta
el 2003, teniendo un saldo positivo adems el mayor crecimiento de exportaciones fue en el 2002
AUTOEVALUACIN DE UNIDAD 2
1.
Ingresos yi fi Fi hi Hi
10 15 12.5 5 5 0.04 0.04
15 20 17.5 10 15 0.08 0.13
20 25 22.5 25 40 0.21 0.33
25 30 27.5 35 75 0.29 0.63
30 35 32.5 22 97 0.18 0.81
35 40 37.5 23 120 0.19 1.00
2.
Grado n x S n. x C.V
I 18000 8000 800 144000000 0.100
II 13000 9500 950 123500000 0.100
III 5500 11500 1100 63250000 0.096
330750000
3. A) c B) b C) d D) b
8 7
9.55
s 9.55 C .V 0.409 0.30 La distribucin es heterognea.
23.375
AUTOEVALUACIN DE UNIDAD 3
1. 70
y = -3.2301x + 84.965
60
R = 0.742
Tiempo de espera
50
40
30
20
10
0
a) Var X: N de cajas registradoras Var Y: Tiempo medio de espera
b) r= 0.861 R2= 0.742
c) Y= 84.965 3.2301X
d) Si X=25 entonces Y= 84.965 3.2301(25)=4.21
a) P (T L) 0.20
0.10
b) P (T / L) =0.833
0.12
3.
4.
73 32 92
a) P (T ) 0.608 b) P ( L / T ) 0.681 c) P ( L) 0.767
120 47 120
AUTOEVALUACIN DE UNIDAD 4
X 10 20 30 40 50
P X 0.1 0.16 0.2 0.3 0.24
a) K=0.08
b) Demanda esperada E(X)= 34.2
c) P ( X 30) 0.46
p 0.3 q 0.7 n 10
a) P (6 X 8) P ( X 8) P ( X 6) 0.047
b) P ( X 5) 0.8497
15 5 a) P ( X 3) 0.4695
x 4-x
b) P ( X 3) 0.7512
20
4
e x
6.8 (por ao) P( X x )
x!
X N( 10000,1500 2 )
a) P ( X 14000) 0.9962
b) P ( X 12000) 0.0912
De las tres medidas de posicin central, la media aritmtica suele ser ms frecuentemente
utilizado, quiz por la facilidad de su clculo a pesar de que en muchas ocasiones la mediana o al
moda resultan de mayor inters.
b) La mediana por su parte debe ser utilizada cuando entre los valores que se estudian, hay
alguno muy diferente entre los otros. Si por ejemplo, los gasto administrativos mensuales
de 5 compaas constructoras del mismo nivel fuera respectivamente 2000, 3000, 4000,
6000 y $30000; el valor ltimo, debido tal vez a que la compaa indemnizo a algn
empleado hace aparecer un incremento muy alto de lo que generalmente es.
c) La moda no es una medida de tendencia central muy usual, pero se emplea cuando el
inters se centra en conocer el valor que se presenta ms frecuentemente. Por ejemplo en
los negocios, sirve para determinar qu tamao del producto es el de mayor demanda.
Similarmente para programar la produccin de un medicamento el fabricante estar
interesado en Cul es la dosis ms comnmente recetada por lo mdicos?
ANEXO 2
TABLA DE DISTRIBUCIN NORMAL ESTANDAR A1
B
BERNOULLI. Es un experimento que tiene dos posibles resultados mutuamente excluyentes, generalmente
llamados xitos y fracasos
BINOMIAL. Distribucin de probabilidad discreta que cuenta el nmero de xitos en una secuencia
den ensayos de Bernoulli independientes entre s, con una probabilidad fija p de ocurrencia del xito entre
los ensayos.
C
COEFICIENTE DE VARIACIN. Es una medida relativa de dispersin y se utiliza para comparar el grado
de dispersin de dos distribuciones o muestras distintas. Es la razn entre la desviacin estndar y el
promedio.
CORRELACION. Indica la fuerza y la direccin de una relacin lineal y proporcionalidad entre dos variables
estadsticas. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una
de ellas varan sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos variables
(A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B y viceversa. La
correlacin entre dos variables no implica, por s misma, ninguna relacin de causalidad
D
DESVIACIN ESTNDAR ( ).es una medida de dispersin para variables de razn (variables cuantitativas o
cantidades racionales) y de intervalo. Se define como la raz cuadrada de la varianza de la variable.
DATO. Valor de la variable asociado con un elemento de la poblacin o muestra. Puede ser un nmero, una
palabra o un smbolo.
DIAGRAMA DE DISPERSIN. Es un tipo de diagrama matemtico que utiliza las coordenadas cartesianas para
mostrar los valores de dos variables para un conjunto de datos.
E
ESTADGRAFO O ESTADSTICA. Es toda medida resumen o caracterstica de la muestra. Busca explicar
las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en
forma aleatoria o condicional.
EXPERIMENTO ALEATORIO. Llamado tambin No determinstico donde cada experimento podr ser
repetido indefinidamente sin cambiar esencialmente las condiciones.
ESPACIO MUESTRAL. Es denotado por , es un conjunto formado por todos los posibles resultados de
un experimento.
EVENTO. Un evento es un subconjunto del espacio muestral y se denota con las letras maysculas A,
B, C, etc. Se cumple: Si A es un evento
ESPERANZA MATEMATICA. Tambin se le conoce como promedio o media aritmtica. Cuando la variable
aleatoria es discreta, la esperanza es igual a la suma de la probabilidad de cada posible suceso
aleatorio multiplicado por el valor de dicho suceso. Por lo tanto, representa la cantidad media que se
"espera" como resultado de un experimento aleatorio cuando la probabilidad de cada suceso se mantiene
constante y el experimento se repite un elevado nmero de veces.
G
GRAFICO ESTADISTICO. El grfico es la representacin de la informacin estadstica, con el fin de obtener
una impresin visual global del material presentado, que facilite su rpida comprensin .
GRAFICO CIRCULAR. Sirve para representar, en trminos de porcentaje, las distintas partes de un todo. El
rea de cada sector circular representa el porcentaje sobre el total de cada categora
H
HISTOGRAMA. Es una representacin grfica de una distribucin de frecuencias agrupadas en intervalos
de clase, mediante una serie de rectngulos contiguos.
HIPERGEOMTRICA. Una variable aleatoria X tiene una distribucin hipergeomtrica si se toma una
muestra sin reemplazo de un conjunto de N elementos.
M
MEDIDAS DE DISPERSIN O DE VARIABILIDAD. Son medidas que nos dan el grado de concentracin o
dispersin de las observaciones alrededor de un valor central o de posicin. Las ms comunes son:
Recorrido o rango, Varianza, Desviacin Estndar o Tpica y Coeficiente de Variacin.
MEDIA ARITMETICA. Llamado tambin promedio, se define como el cociente de la suma de los valores de
una variable entre el nmero de observaciones o valores.
MEDIANA. La Mediana es valor que se encuentra en el centro luego de ordenar los datos y divide el
conjunto de datos en dos partes iguales.
MODA. La moda de un conjunto de observaciones es el valor que se presenta con ms frecuencia o el que
ms se repite.
MUESTRA. Parte o porcin extrada de la poblacin por mtodos que permiten considerarla como
representativa de la poblacin
MARCO MUESTRAL. El listado completo de las unidades de muestreo. Nos permite identificar a los
elementos de la poblacin y puede ser una relacin de viviendas, un listado de personas, una relacin de
reactivos qumicos, etc.
P
POBLACIN. Es el conjunto total de individuos, objetos o medidas que poseen algunas caractersticas
comunes observables en un lugar y en un momento determinado.
PROBABILIDAD CONDICIONAL. Ocurre cuando dos eventos se relacionan de manera tal que la
probabilidad de ocurrencia de uno depende de la ocurrencia del otro.
POISSON. Es otra distribucin discreta importante y es generalmente utilizada en los problemas en que se
cuentan el nmero de eventos de cierto tipo, que ocurren en un intervalo de tiempo, o en una regin, o en
un volumen.
R
RANGO O RECORRIDO. Es la diferencia entre el valor mayor y menor de una variable. Su frmula es:
Ejemplo: Observando las edades en aos de un grupo de personas: 6, 10, 16, 22, 36, 48 ,56 Hallar el rango
de los datos. aos.
REGRESIN. Es un mtodo que se emplea para encontrar una funcin que se ajusta a una nube de puntos
o diagrama de dispersin, con la finalidad de obtener una prediccin aproximada de una de las variables a
partir de la otra.
REGRESIN LINEAL SIMPLE.Este tipo de regresin se utiliza cuando existe solo una variable
independiente X para una variable dependiente Y. Est definida por la siguiente ecuacin lineal en su forma
general:
T
TABLA DE DISTRIBUCION DE FRECUENCIAS. Una tabla es un esquema para resumir la informacin.
VARIABLES. Es la caracterstica de la muestra o poblacin que se est observando. una variable est
formada por un espacio en el sistema de almacenaje (memoria principal de un ordenador) y un nombre
simblico (un identificador) que est asociado a dicho espacio.
VARIABLES CUANTITATIVAS (Numricas).Son aquellas que toman valores numricos y se pueden medir
y a su vez se clasifican en discretas o continuas.
VARIABLE INDEPENDIENTE. Es aquella que el investigador desea medir su efecto y est bajo su control.
Por ejemplo, consideremos un experimento diseado para medir la efectividad de dos fertilizantes en la
produccin de trigo, el experimentador tiene bajo su control los fertilizantes, por lo cual el fertilizante se
denomina variable independiente.
VARIABLE DEPENDIENTE. Son todas aquellas variables que son explicadas por el modelo y reflejan el
efecto de las variables independientes. En el ejemplo anterior la produccin de trigo en cada parcela se
denomina variable dependiente.