Está en la página 1de 89

GUA METODOLGICA DE INGENIERIA EN ADMINISTRACION EN EMPRESAS TURISTICAS
(PERODO OCTUBRE 2010- MARZO 2011)

## DATOS DEL TUTOR

Nombre del Tutor : Mauricio Garca Oquendo

Telfonos:

2990800 Ext 2245 Universidad Tecnolgica Equinoccial (Direccin del Sistema de Educacin a Distancia)

## MAT. MAURICIO GARCIA

PAG

INDICE RESUMEN HOJA DE VIDA __________________________________________________ 4 IMPORTANCIA DE LA ESTADSTICA ________________________________________ 4 A. OBJETIVO GENERAL DE LA ASIGNATURA: _______________________________ 6 B. CONTENIDOS ___________________________________________________________ 7 PRIMER BIMESTRE ________________________________________________________ 8 UNIDAD I __________________________________________________________________ 8 C. CONTENIDOS ___________________________________________________________ 8 D. ASESORA DIDCTICA I _________________________________________________ 9 1. INTRODUCCIN ________________________________________________________ 10 2. CONSTRUCCIN DE INTERVALOS DE CLASE __________________________________ 11 3. HISTOGRAMAS ____________________________________________________________ 13 4. GRFICA DE DISTRIBUCIN ACUMULADA (OJIVAS) _______________________________ 18 5. DIAGRAMAS POR SECTORES. DIAGRAMA DE PASTEL (PIE) __________________________ 19 6. DIAGRAMA DE TALLO Y HOJA ________________________________________________ 23 7. REPRESENTACIN DE LAS DISTRIBUCIONES _____________________________________ 25 8. MEDIDAS DE CENTRALIZACIN ______________________________________________ 26 8.1 Media Aritmtica _________________________________________________________ 26 8.2 Mediana________________________________________________________________ 27 8.3 Moda __________________________________________________________________ 28 8.4 Medidas de Dispersin ____________________________________________________ 31 8.5 El coeficiente de variacin ________________________________________________ 32 8.6 Diagrama de Caja y Bigote _________________________________________________ 34 ACTIVIDADES DE APRENDIZAJE I _________________________________________ 37 UNIDAD II ________________________________________________________________ 42 INTRODUCCIN A LA PROBABILIDAD _____________________________________ 42 2.1 TEORA DE LAS PROBABILIDADES ____________________________________________ 43 2.2 PROPIEDADES DE LAS PROBABILIDADES _______________________________________ 43 2.3 COMBINACIONES _________________________________________________________ 49 2.4 PERMUTACIONES _________________________________________________________ 50 ACTIVIDADES DE APRENDIZAJE II ________________________________________ 51 A. TEORA DE PROBABILIDAD: COMBINACIONES Y PERMUTACIONES _____ 51 B. PROPIEDADES DE LAS PROBABILIDADES ________________________________ 52 C. TEOREMA DE BAYES ___________________________________________________ 53 SEGUNDO BIMESTRE _____________________________________________________ 55 UNIDAD III _______________________________________________________________ 55 II. DISTRIBUCIN DE PROBABILIDADES DISCRETAS Y CONTINUAS _________ 55

## MAT. MAURICIO GARCIA

PAG

A. VARIABLES DISCRETAS ________________________________________________ 56 1. DISTRIBUCIN BINOMIAL____________________________________________________ 57 2. DISTRIBUCIN DE POISSON __________________________________________________ 59 3. DISTRIBUCIN HIPERGEOMTRICA ____________________________________________ 60 B. DISTRIBUCIONES CONTINUAS __________________________________________ 62 4. DISTRIBUCIN NORMAL ____________________________________________________ 62 ACTIVIDADES DE APRENDIZAJE III _______________________________________ 67 UNIDAD IV _______________________________________________________________ 70 IV. DISTRIBUCIONES DE MUESTREO _______________________________________ 71 ASESORA DIDCTICA IV _________________________________________________ 71 A. DISTRIBUCIN DE MUESTREO ___________________________________________ 71 B. TEOREMA DEL LMITE CENTRAL _________________________________________ 72 ACTIVIDADES DE APRENDIZAJE IV _______________________________________ 74 FORMA DE EVALUACIN _________________________________________________ 75 BIBLIOGRAFIA: __________________________________________________________ 89

PAG

## RESUMEN HOJA DE VIDA

INFORMACIN DE LA ASIGNATURA Estamos seguros de que al finalizar este curso, el estudiante ser capaz de manejar los conceptos de Estadstica Descriptiva que le permitirn realizar posteriormente la toma de decisiones. IMPORTANCIA DE LA ESTADSTICA Histricamente el crecimiento y desarrollo de la estadstica moderna puede trazarse desde dos fenmenos separados: la necesidad del gobierno de obtener informacin sobre los ciudadanos y el desarrollo de las matemticas, de la teora de las probabilidades. A lo largo de la historia registrada se han recabado datos. Durante las civilizaciones egipcia, griega y romana, los datos se obtenan principalmente con fines de impuestos y reclutamiento militar. En la Edad Media, las instituciones eclesisticas a menudo mantenan registros de nacimientos, muertes y matrimonios. En Amrica se mantuvieron diversos registros y comenzando en 1790, la Constitucin de E.E.U.U requiri el levantamiento de censo cada diez aos. Actualmente estos datos se usan para muchos propsitos, incluyendo, prorrateo del Congreso y la asignacin para fondos del presupuesto nacional.

## MAT. MAURICIO GARCIA

PAG

Seleccionar muestras con propsitos de auditora Para comprender los derroteros de costos en contabilidad de costos
Finanzas

Para estar al tanto de medidas financieras en el transcurso del tiempo Para desarrollar formas de pronsticos de valores de estas medidas en momentos futuros

Para describir caractersticas de empleados dentro de una organizacin Para mejorar la calidad de los productos o de los servicios procurados en la organizacin

## MAT. MAURICIO GARCIA

PAG

Para estimar la proporcin de clientes que prefieren un producto en vez del otro y la razn de
esto Para sacar conclusiones respecto a estrategias de publicidad que sera ms til para el incremento de ventas de un producto Los empresarios saben que los complejos problemas con que se enfrentan en el mundo de hoy exigen soluciones cuantitativas y que tienen que estar acompaadas de dichos datos para tomar decisiones en casi todas las disciplinas se exigen el empleo del razonamiento estadstico tales como en la economa, en la investigacin operativa, en las finanzas (los financieros aplican tcnicas estadsticas para hallar soluciones viables y realizar la toma de decisiones), marketing, ingenieros industriales. En el mercado actual de trabajo los empresarios se resisten a emplear o retener a analfabetos estadsticos. En sus aspiraciones profesionales se encaminan tanto a la industria privada como a la administracin. Se encontrarn respaldados si tienen fundamentos slidos de anlisis estadsticos. Algunos pueden creer que el tipo de trabajo que aspiran no exige el conocimiento del anlisis estadstico, se deber tener un mnimo de conocimientos en la formacin de este campo con la finalidad de disear soluciones adecuadas para la mejor toma de decisin. Una vez conocidos estos aspectos del anlisis estadstico se sorprender de las variadas formas de que ste puede ayudar a resolver conflictos que se producen en el mundo laboral. Dentro de pocos aos se dejar la seguridad relativa de nuestro entorno acadmico y se deber lanzar al mundo competitivo. El empresario esperar que el profesional que queremos formar para una empresa haga dos cosas: 1. Tomar decisiones. 2. Resolver problemas. Estos dos aspectos pueden llevarse a cabo siguiendo procedimientos estadsticos.

A. OBJETIVO GENERAL DE LA ASIGNATURA: Resolver problemas de recoleccin, organizacin, presentacin e interpretacin de datos numricos con la finalidad de realizar una toma de decisiones ms efectiva. Esto es: Manejar los conceptos estadsticos eficientemente. Disear cuestionarios eficientemente, con la mayor claridad posible. Procesar una encuesta realizada, con la ayuda de al menos un paquete estadstico computacional. Interpretar los resultados obtenidos de una encuesta para la mejor toma de decisiones.

PAG

## Al finalizar el presente captulo los estudiantes estarn en capacidad de:

Organizar datos originales en una distribucin de frecuencias. Organizar un conjunto de datos en una distribucin de frecuencias Construir los distintos diagramas y grficos estadsticos Determinar el mtodo ms eficiente para presentar un conjunto de datos Representar la distribucin de frecuencias en un histograma, o polgono de frecuencias acumuladas Desarrollar una representacin de tallo y hoja Calcular las medidas de centralizacin : la media aritmtica, la mediana, la moda. Explicar las desventajas y ventajas de cada una de las medidas de centralizacin. Identificar la posicin de la media aritmtica, la mediana y la moda, tanto para distribuciones

Explicar varias medidas de dispersin (rango, rango intercuartlico, desviacin media, desviacin

## Al finalizar el presente captulo los estudiantes estarn en capacidad de:

Utilizar las propiedades de las probabilidades para hallar determinada probabilidad Conocer los principios bsicos de la Probabilidad Distinguir entre eventos mutuamente excluyentes y no excluyentes Establecer la diferencia entre eventos dependientes e independientes Manejar las reglas de adicin y multiplicacin de probabilidades Aplicar el teorema de Bayes Distinguir entre Permutaciones y Combinaciones Determinar el nmero de posibles permutaciones y combinaciones.

PAG

III.

## DISTRIBUCIN DE PROBABILIDADES DISCRETAS Y CONTINUAS

Al finalizar el presente captulo los estudiantes estarn en capacidad de: Definir una distribucin de probabilidad o probablistica Distinguir entre una distribucin probablistica discreta y una distribucin probabilstica continua Elaborar una distribucin binomial, una distribucin hipergeomtrica, una de Poisson, una Uniforme y una Exponencial Determinar que distribucin emplear en una situacin dada Explicar y aplicar la distribucin normal Usar la tabla de la curva normal Manejar el parmetro Z

IV.

DISTRIBUCIONES DE MUESTREO

## Al finalizar el presente captulo los estudiantes estarn en capacidad de:

Explicar por qu en muchas situaciones una muestra es la nica forma posible de tener conocimiento
acerca de una poblacin

Definir una distribucin de muestreo de medias muestrales Elaborar una distribucin de muestreo de medias muestrales Explicar el teorema del lmite central y su importancia en la inferencia estadstica. Describir las caractersticas, forma, propiedades de las distribuciones T de student, F de Fisher y

Manejar las tablas de las distribuciones continuas T de student, F de Fisher y Chi- Cuadrado.
PRIMER BIMESTRE UNIDAD I C. CONTENIDOS I. 1.1. RECOLECCIN DE DATOS Introduccin a la estadstica: Tipos de muestra Edicin, Codificacin Recoleccin de datos

## MAT. MAURICIO GARCIA

PAG

1.2.

1.3. 1.4.

1.5. 1.6.

1.7.

Distribucin de frecuencias de una muestra: Clasificacin ordenada Tabulacin de datos Construccin de tablas de frecuencia: Nmero apropiado de agrupamientos de clase Representacin grfica de datos agrupados y sin agrupar: Histogramas Polgonos de frecuencia Diagrama de tallo y hojas Medidas de Tendencia Central: Media aritmtica, Mediana, Moda Medidas de dispersin y asimetra: Diagrama de Pareto Diagrama de caja y bigote Percentiles

## D. ASESORA DIDCTICA I PREGUNTAS DE AUTOEVALUACION

(Las respuestas estn al final del captulo) 1. La poblacin es el conjunto de todos los elementos en estudio a) Verdadero b) Falso 2. Para construir un polgono de frecuencia es necesario primero realizar un Histograma a) Verdadero b) Falso 3. Cuando se construye una tabla de frecuencias, el nmero de clases de intervalos depende del a) tamao de la muestra b) de que sean nmeros reales o enteros. 4. Una parte de la poblacin en estudio recibe el nombre de 5. Una grfica cuya distribucin es acumulativa recibe el nombre de 6. Indique con sus propias palabras la diferencia entre variables aleatorias continuas y discretas. Ponga un ejemplo de cada uno. 7. Se desea tomar una muestra de las opiniones del desempeo de los 130 asambleistas sobre la nueva constitucin. Indique a) cul es la muestra? b) Cul es la poblacin? 8. El valor que recibe ms frecuentemente se repite se conoce como mediana a) Verdadero b) Falso 9. Las medidas de dispersin de un conjunto de datos mide el punto central de stos. a) Verdadero b) Falso 10. Ordene los siguientes pasos para el clculo de la mediana de un conjunto de datos a) Obtener la media aritmtica de los valores centrales b) ordenar de menor a mayor los datos c) Ninguno de los anteriores. 11. Cul de las siguientes medidas son de centralizacin: a) mediana b) moda c) media d) todas las anteriores 12. Puede darse el caso de que la media aritmtica sea negativa a) Verdadero b) Falso. Porqu?

## MAT. MAURICIO GARCIA

PAG

13. Puede darse el caso de que la desviacin tpica sea negativa a) Verdadero b) Falso. Porqu? 14. La diferencia entre el valor ms alto y ms bajo recibe el nombre de . 15. Bajo que condicin es ms confiable la mediana que la media en lo que respecta a sus datos a) por el tamao de la muestra b) por la gran dispersin que presenta la muestra c) por ser tener variables cualitativas

1. INTRODUCCION Definicin. FRECUENCIA ABSOLUTA O FRECUENCIA ( f) Representa el nmero de veces que ms frecuentemente aparece un valor determinado x del conjunto de datos, previamente deben ordenarse dicho conjunto de datos. Definicin. FRECUENCIA RELATIVA ( fr) Se obtiene dividiendo cada valor de la columna de la frecuencia por el tamao de muestra. Definicin. FRECUENCIA ACUMULADA (fa.) En esta columna van todos aquellos valores de X que corresponden a la frecuencia, y que se van acumulando o sumando con los valores anteriores Definicin. FRECUENCIA RELATIVA ACUMULADA (f.r.a) Se obtiene dividiendo cada valor de la frecuencia acumulada por el tamao de la muestra. Ejemplos. 1. Una de las preguntas realizadas en una encuesta a 36 personas, se refiere al nmero de telfonos mviles que ha tenido, y los resultados son los siguientes: 1 5 1 3 3 2 3 3 0 3 2 2 3 0 1 1 0 2 1 4 2 3 3 0 4 4 2 1 2 3 3 2 1 4 5 2

Determine la distribucin de frecuencias f, fr y fra, de los siguientes datos sin agrupar, pero antes, especifique el tipo de variable que se estudia. Solucin: La variable que se estudia es el nmero de telfonos que posee cada encuestado. A continuacin se tiene el siguiente cuadro de frecuencias, previamente ordenado dicho conjunto de datos:

PAG 10

## NMERO DE TELEFONOS MOVILES

0,11 0,31 0,56 0,83 0,94 1,00

MUESTRA
0 1 2 3 4 5

FRECUENCIA
4 7 9 10 4 2

FRECUENCIA RELATIVA
0,11 0,19 0,25 0,28 0,11 0,06

4 11 20 30 34 36

TOTAL

36

Se puede observar claramente que existen 10 personas que manifestaron poseer hasta tres telfonos mviles, esto representa el 27.8%, adems el 83.35% de los encuestados indic que tuvieron entre 0 a 3 telfonos mviles. Los dems resultados se interpretan de manera anloga. Observaciones: a) Se puede indicar del ejercicio anterior que la suma de la columna de la frecuencia siempre deber ser igual a tamao de la muestra, a manera de comprobacin. b) Adems la suma de la columna de la frecuencia relativa, debe dar siempre uno. c) El ltimo valor de la frecuencia acumulada debe ser siempre igual al del tamao de la muestra d) El ltimo valor de la columna de la frecuencia relativa acumulada, siempre, debe ser de 1 o 100%. 2. Construccin de Intervalos de Clase En el caso que se deseen agrupar los datos, datos agrupados, existen varias maneras de elegir los lmites de clase. Indicaremos un conjunto de pasos para la eleccin del nmero de clases. Se decidir el nmero de clases que interesa, esto depender del nmero del tamao de la muestra. 1. Nmero recomendado de clases de acuerdo al tamao de la muestra,

## MAT. MAURICIO GARCIA

PAG 11

De 128 255 De 256 - 511 De 512 - 1023 De1024 - 2047 De 2048 - 4095 De 4096 - 8190

8 9 10 11 12 13

2. Se calcula el rango de los datos que es la diferencia entre el mximo y el mnimo. 3. Se divide el rango para el nmero de intervalos elegidos aproximndolo al entero

inmediatamente superior, llamado h. Luego se sugiere que si los datos son enteros, se deben disminuir 0.5 al valor mnimo y aumentar 0.5 al valor ms alto, con la finalidad de asegurar que todos los datos se encuentren en dichos intervalos. En caso de que los datos contengan un decimal, se sugiere disminuir al valor mnimo 0.05 y aumentar 0.05 al valor ms alto, y as sucesivamente. 4. Los lmites de cada clase restante, se obtienen al sumar el valor mnimo restado 0.5 con el valor de h y as sucesivamente hasta llegar al valor mximo sumado 0.5, claro est si el conjunto de datos es enteros.

Utilice los datos del ejemplo siguiente, para realizar una tabla de datos agrupados. 2. Los siguientes datos representan el nmero de horas semanal, trabajadas por 50 personas encuestadas. 35 40 39 38 31 31 38 48 39 38 38 34 47 36 38 31 32 45 44 43 40 36 48 39 40 47 39 38 43 35 40 45 33 39 36 38 34 46 47 34 40 42 40 42 41 38 44 40 40 42

## MAT. MAURICIO GARCIA

PAG 12

Para nuestro caso tenemos: que el valor superior es 48 y el valor inferior es 31, de acuerdo a los pasos anteriormente descritos, tenemos,
(48 31) 6 2.83 3 . Por tanto se puede comenzar en 30.5 a 33.5,

luego de33.5 a 36.5, etc., disminuimos 0.5 en el primer valor, para asegurarnos de que ste se incluya, asimismo al ltimo valor le sumamos 0.5 con el mismo fin, adems debemos ir sumando tres en cada nuevo intervalo de clase, obteniendo:

Datos agrupados de las horas trabajadas sem analm ente Porc entaje valido 10,0 16,0 26,0 24,0 12,0 12,0 100, 0 Porc entaje acumulativo 10,0 26,0 52,0 76,0 88,0 100, 0

30.5 a 33.5 33.5 a 36.5 36.5 a 39.5 39.5 a 42.5 42.5 a 45.5 45.5 a 48.5 Total

Frequencia 5 8 13 12 6 6 50

## Porc entaje 10,0 16,0 26,0 24,0 12,0 12,0 100, 0

Los comandos para transformar datos sin agrupar a datos agrupados son : TransformeRecodeInto Different VariableSe selecciona (Servicio) la lista de variables por ejemplo

En Output VariableSe escribe el nuevo nombre de la variable por ejemplo (horas1) Change Luego hacer clic en Old and New Values.... Recodificamos la variable con los siguientes intervalosEn Range hacemos clic Va el lmite inferior hasta luego lmite superior, va de 30.5 incluido el 33.5 por ejemplo, en New ValuePoner 1, luego lmite inferior 33.5 Through luego lmite superior 36.5 en New ValuePoner 2 y as sucesivamentecontinueOK 3. Histogramas Si se tiene un gran conjunto de datos, se puede utilizar los llamados histogramas, que son una representacin grfica de barras verticales u horizontales. Consiste en una serie de rectngulos que tienen su base en el eje horizontal con centros en las marcas de clase, de longitud de igual tamao y que son superficies proporcionales a las frecuencias de clase. Definicin: La marca de clase se obtiene sumando el lmite inferior y superior dividindolos por dos.

## MAT. MAURICIO GARCIA

PAG 13

Con slo observar la forma del histograma permite una idea de la familia de variables aleatorias a la cual pertenece la variable que se analiza. 3. Utilice los datos de la tabla de datos agrupados anteriormente, para realizar un Histograma, para lo cual tenemos:
14 13 12

12

10

6 5 4

## 2 0 1,0 2,0 3,0 4,0 5,0 6,0

En el SPSS se tiene: El comando sera: GraphsHistogra.... Variable (Servic4) OK

## MAT. MAURICIO GARCIA

PAG 14

30

26

20 18 14 10 10 8 18

Percent

## 0 1,00 2,00 3,00 4,00 5,00 6,00 7,00

VAR00001

Interpretacin: Se puede observar que el 26% de los departamentos pagan entre \$160 a \$ 180 mensualmente. AnalyzeDescriptive StatisticsExplorePlotsMarcar histogram y eliminar grfico de tallo y hojaOK

PAG 15

## y luego el siguiente cuadro:

y se obtiene el mismo grfico anterior. Adems se puede graficar el polgono de frecuencia que consiste en unir los puntos medio de las bases de los rectngulos, obtenindose
14

12

10

4 30.5-33.5

33.5-36.5

36.5-39.5

39.5-42.5

42.5-45.5

45.5-48.5

PAG 16

## Para realizar el polgono de frecuencia en el SPSS tenemos: GraphsLine..

DefineCategoria (Servic4) OK

30

20

10

0 1,00

2,00

3,00

4,00

5,00

6,00

7,00

SERVICIO4

## MAT. MAURICIO GARCIA

PAG 17

4. Grfica de Distribucin Acumulada (Ojivas) Se puede estar interesado en utilizar la distribucin de frecuencia acumulada de los datos. Para aproximar una funcin de distribucin acumulativa (fa), se puede usar la distribucin acumulativa de una variable aleatoria.

A partir de esta grfica se puede responder preguntas como: cul es el porcentaje aproximado de la variable en estudio durante las primeras n horas, n kilos, etc?., para lo cual se puede localizar dicho punto en el eje horizontal y proyectar una lnea horizontal hasta la ojiva y luego otra horizontal hasta el eje vertical. Pero tambin se puede preguntar el proceso inverso, es decir, qu tiempo o cantidad, etc, representa el punto medio en el sentido de que la mitad de la variable en estudio falla en dicho momento antes de llegar a l?

4. Cul es el porcentaje aproximado de horas trabajadas semanalmente durante las primeras 35 horas de trabajo, del ejercicio anterior?

Solucin: Al localizar el punto 35 en el eje horizontal y proyectar una lnea vertical hasta la ojiva y luego otra horizontal hasta el eje vertical como se ilustra en el grfico, el porcentaje que interesa es aproximadamente el 42%.

Adems qu tiempo representa el punto medio en el sentido de que la mitad de las horas trabajadas antes de llegar a 35 horas . Esta pregunta se contesta al localizar 0.5 ( o 50%) en el eje vertical e invertir el proceso, la respuesta es un poco ms de 38 horas.

## MAT. MAURICIO GARCIA

PAG 18

120

100

80

60

40

20

0 30.5 a 33.5 33.5 a 36.5 36.5 a 39.5 39.5 a 42.5 42.5 a 45.5 45.5 a 48.5

5. Diagramas por Sectores. Diagrama de Pastel (Pie) Se utilizan para representar distribuciones de frecuencia de variables cualitativas. Se representan en un crculo cuyas porciones o sectores circulares tienen un rea proporcional a las frecuencias absolutas a las modalidades de la variable. Se lo obtiene el ngulo central alfa de la modalidad i-sima cuya frecuencia absoluta es ni, y puede expresarse como i = 360 fi. Otra forma habitual de construir grficos de sectores consiste en asignar al sector circular un porcentaje igual al tanto por ciento, que se puede expresar de la siguiente manera: pi = 100 fr. 5. Realice un diagrama de pastel para el siguiente conjunto de datos:

Pas de destino No. Hombres Espaa 49.5 Estados Unidos 21.9 Italia 7.4 Otros pases 13.9

PAG 19

## Otros 13,90 Italia 7,40 49,50 21,90 EEUU Espaa

Grafico 1

Para realizar el grfico en el SPSS, debemos tener en cuenta: 1. 2. Ingresar los datos esto es :

PAG 20

Nos vamos a:

Luego

PAG 21

y luego tenemos:

Grafico 1

## MAT. MAURICIO GARCIA

PAG 22

5. Diagrama de Tallo y Hoja El diagrama de tallo y hoja permite determinar la idea de cmo se comporta ese conjunto de datos, especialmente cuando el tamao de muestra es moderado. Existen varias formas de construir la distribucin de una variable aleatoria continua. Una de ellas es el diagrama de tallo y hoja creado por J. Tukey, el mismo que consta de una serie de filas horizontales de nmeros el cual tiene como rtulo un nmero llamado tallo, en tanto que los dems nmeros de las filas se llaman hojas. Existen distintas maneras de construir este tipo de diagramas, para su construccin se sugiere: 1. Tratar que el primer dgito o los dos primeros dgitos de la muestra sean los que trabajen como tallos. 2. Se escriben las filas con los tallos seleccionados. 3. Se reproduce grficamente el conjunto de datos mediante el registro del dgito que sigue al tallo como una hoja. 4. Para darse cuenta de la forma de la distribucin se acuesta la grfica sobre uno de sus lados. Cuando los conjuntos de datos son grandes o no existe mucha variabilidad en los datos se utilizan diagramas llamados de doble tallo y hoja, es decir, se trata de usar dos veces cada tallo. 6.. Los siguientes datos representan la cantidad de tiempo (en segundo) para llegar de 0 a 60 mph durante una prueba de caminos para una muestra de 22 modelos de automviles alemanes y una muestra de 30 modelos de automviles japoneses: a) Desarrolle la clasificacin ordenada b) Forme el diagrama de tallo y hoja. Automviles Alemanes 10 6.4 8.5 5.5 5.1 10.9 7.9 6.9 6.4 6 4.9 8.9 7.1 8.7 7.5 5.4 8.5 8.6 8.3 6.7 6.9 8.8

PAG 23

## 8.2 9.7 11.7 6.5 10.5

Solucin: Escogeremos a los nmeros enteros, como el tallo y los decimales como la hoja, casos como valores 6.3, 6.5, 6.7 y 6.8. Se escoge el nmero 6 como tallo y se agrupa a los decimales 3,5,7 y 8 como se muestra en la grfica . MODELO JAPONS FREC. TALLO & HOJA 1,00 4,00 2,00 5,00 6,00 1,00 1,00 1,00 5. 7 6 . 3578 7 . 12 8 . 02359 9 . 134557 10 . 5 11 . 7 12 . 5

MODELO AMERICANO FREC. TALLO & HOJA 1,00 3,00 6,00 3,00 7,00 ,00 2,00 4. 9 5 . 145 6 . 044799 7 . 159 8 . 3556789 9. 10 . 09

## MAT. MAURICIO GARCIA

PAG 24

1. El menor nmero de segundos que se demora para llegar de 0 a 60 millas por hora durante una prueba de caminos de un carro japons es de 5.7 segundos y el de mayor es de 12.5 segundos, en tanto el del americano es de 4.9 segundos y 10.9 segundos respectivamente. Siete carros japoneses se demoraron menos de 8 segundos en tanto 13 carros americanos se demoraron menos de 8 segundos. La mayor concentracin de autos que se demoraron es de entre 8 a 9 segundos para los japoneses, y los americanos de 8 segundos. Se observa tambin que 6 carros japoneses se demoraron entre 9.1 a 9.7 segundos en tanto existieron 7 carros americanos que se demoraron entre 8.3 y 8.9 segundos

determinada edad, pero existen muy pocos que se gradan posteriormente a esa edad. Tambin podra mencionarse el ingreso familiar anual, pues la mayora gana muy poco y unos pocos ganan mucho.

Se dice negativa cuando la curva se extiende hacia la izquierda. Ejemplos de aquellos valores bajos de la distribucin podrn ser las notas obtenidas, de un examen muy elemental, pues la mayora tendra buena calificacin y unos pocos tendran mala calificacin.

1. Medidas de Centralizacin Analizaremos a continuacin tres medidas. Las ms importantes con la media, mediana y moda que permitirn determinar los valores centrales de un conjunto de datos. El smbolo Xj se lee X sub j, y representa cualquier valor de las frecuencias de un conjunto de nmeros dados. La variable j se llama subndice o ndice o variable muda y puede ser cualquier letra del alfabeto, es decir Xr, Xk, Xp, etc. As en la serie de nmeros 8,4,5,7, la posicin X3 es 5, y as sucesivamente. Se utiliza la letra griega mayscula sigma, que representa la suma de un conjunto de nmeros dados,
n

i 1

xi

## 2, .., n. PROPIEDADES DE LAS SUMATORIAS

n n n

1.
i 1 n

xi axi
i 1 n

yi
i 1 n

xi
i 1

yi

2. 3.
i 1

a
i 1

xi

8.1 Media Aritmtica La media aritmtica en general resulta la medida de centralizacin ms confiable, pues permite obtener el promedio de un conjunto de datos. a) La frmula para la media aritmtica de datos sin agrupar, viene dada por:

## MAT. MAURICIO GARCIA

PAG 26

Se representa x , se lee media aritmtica y se define como las suma de todos sus valores y est dividida por el nmero de elementos, esto es:
n

xi x
i 1

x1

x2 n

... x n

## b) La frmula para la media aritmtica de datos agrupados, viene da por:

n

f i xi n de clase. x
i 1

f1 x1

f 2 x2 ... n

f n xn

## donde fi representa las frecuencias, la xi representa las marcas

8.2 Mediana Representa la mediana. El 50% de los datos estn por debajo de un valor especfico y el otro 50% por encima, de dicho valor dado. Se deben primeramente ordenar los valores en forma ascendente. a) La frmula para la mediana de datos sin agrupar, viene dada por: Si los datos son impares , la mediana viene dada por :

n 1 2

Si los datos son pares, la mediana es el promedio de las posiciones: b) La frmula para la mediana de datos agrupados, viene dada por:

n y 2

n 2

Me

Li

## n f 2 * h donde f clase med

Primeramente se debe calcular la clase mediana, para lo cual dividimos frecuencia sumamos acumuladamente, hasta que supere dicho valor.

n y de la columna de la 2

Li representa el lmite real inferior, el mismo que se obtiene calculando el promedio entre el lmite inferior de la clase mediana y el lmite superior anterior a la clase mediana.

## f clase med representa la frecuencia de la clase mediana.

h representa la diferencia del lmite inferior y superior de la clase mediana.

## MAT. MAURICIO GARCIA

PAG 27

8.3 Moda La moda nos indica el nmero de veces que ms se repite en un conjunto de datos dados. Se simboliza con Mo, es decir no necesita de frmula. Adems la moda no puede existir. Pueden haber una moda (unimodal), dos modas (bimodal), etc. a) La frmula para la moda de datos agrupados, viene dada por:

Mo

Li
1

1 2

* h donde

Primeramente se debe calcular la clase modal para lo cual se deber tomar el valor ms alto de la frecuencia, asimismo Li representa el lmite real inferior, el mismo que se obtiene calculando el promedio entre el lmite inferior de la clase modal y el lmite superior anterior a la clase modal. representa la diferencia de la frecuencia de la clase modal con el valor de la frecuencia inmediatamente anterior.
1

representa la diferencia de la frecuencia de la clase modal con el valor de la frecuencia inmediatamente posterior.
2

h representa la diferencia del lmite inferior y superior de la clase modal. Ejemplos: 1. Halle la media, moda y mediana de las preguntas realizadas en una encuesta a 36 personas en lo que se refiere al nmero de telfonos mviles que ha tenido, y los resultados son los siguientes: 1 5 1 3 3 2 3 3 0 3 2 2 3 0 1 1 0 2 1 4 2 3 3 0 4 4 2 1 2 3 3 2 1 4 5 2 Solucin: Podemos resumir en el siguiente cuadro, los ndices estadsticos, de los datos sin agrupar, obtenindose:

PAG 28

## NDICES ESTADSTICOS telfonos N Media Mediana Moda Mnimo Mximo Muestra

36 2,25 2,00 3 0 5

La interpretacin nos indica que el promedio de nmero de celulares que han tenido los 36 encuestados es de aproximadamente 2, adems menos del 50% de los encuestados han tenido 2 celulares y ms del 50% de los encuestados ha tenido ms de dos celulares. El nmero de celulares que ms veces han tenido los encuestados es de 3. El mnimo de celulares de los encuestados ha sido ninguno y el mximo que han tenido es de 5 celulares. 2. La siguiente tabla representa los ingresos mensuales, en dlares, de 20 trabajadores de una empresa. a) halle la media moda y mediana b) Qu conclusiones puede sacar? c) Qu tipo de distribucin representa?.

Intervalo de clase (en dlares) 100,5 120,5 120,5 140,5 140,5 160,5 160,5 180,5 180,5 200,5 200,5 220,5

frecuencia 2 3 5 5 3 2

Solucin: a) Calcularemos previamente la media aritmtica para estos datos agrupados, para lo cual tenemos los siguientes clculos:

## MAT. MAURICIO GARCIA

PAG 29

Intervalo de clase (en dlares) 100,5 120,5 120,5 140,5 140,5 160,5 160,5 180,5 180,5 200,5 200,5 220,5

frecuencia fi 2 3 5 5 3 2 20

## Marca de clase Xi 110,5 130,5 150,5 170,5 190,5 210,5

fi*Xi
221 391,5 752,5 852,5 571,5 421 3210

3210 160.5 , esto nos indica que en promedio los salarios de los encuestados es n 20 de 160.5 dlares mensualmente.
Luego x
i 1

f i xi

n 20 10 por lo que tenemos la suma 2 2 acumulativa en la columna de la frecuencia que cae en el intervalo 160.5 a 180.5, es decir que
Para hallar la mediana, calcularemos la clase mediana, esto es:

Li

## 160.5 160.5 160.5 , adems 2

n f 2 * h 160.5 f clase med

## Finalmente, h= 180.5-160.5=20 , reemplazndolo en la frmula respectiva, esto es:

10 10 * 20 160.5 , esto nos indica que el 50% de los 5

Me

Li

encuestados gana hasta 160.5 dlares mensuales y el otro 50% gasta ms de 160.5 dlares mensuales.

Ahora calcularemos la moda. Para ello encontraremos la clase modal de la tabla. Se puede observar que existen 2 modas, que seran el 5 en los intervalos de 140.5 a 160.5 y de 160.5 a180.5 respectivamente, por lo que se puede escoger cualquiera de ellos, en nuestro caso escogemos como clase modal el intervalo entre 140.5 a 160.5 , luego tenemos:

## 140.5 140.5 140.5 , adems 2 reemplazndolo tenemos: Li

5 3

2 y

5 5

0 con h= 160.5-140.5=20,

PAG 30

Mo

Li
1

1 2

* h 140.5

2 2 0

## * 20 160.5 , esto nos indica que el valor que ms ganan los

trabajadores es de 160.5 dlares. b) La conclusin es que los tres ndices estadsticos de centralizacin son los mismos. c) Como la media, mediana y moda dieron exactamente los mismos resultados la forma de la distribucin de los datos se comporta en forma normal simtrica. 8.4 Medidas de Dispersin La dispersin permite medir el grado de variacin que tiene un conjunto de datos con respecto a la media aritmtica. Dentro de los ndices estadsticos de dispersin, el ms importante y confiable es la desviacin estndar para datos sin agrupar que viene dada de la siguiente manera:
n

xi s
i 1

n 1

Donde xi representa, la posicin de las frecuencias del conjunto de datos, x representa la media aritmtica de los datos sin agrupar. La frmula para datos agrupados de la desviacin estndar viene dada por:
n

f i xi s
i 1

donde fi representa las frecuencias, la xi las marcas de clase, x representa la media n 1 aritmtica de los datos agrupados. La varianza no es sino el cuadrado de la desviacin estndar, esto es s2. 2. Calcule la desviacin estndar de los ingresos mensuales del ejemplo anterior. Realizando los clculos pertinentes, utilizando la frmula de la desviacin estndar de datos agrupados tenemos:

## MAT. MAURICIO GARCIA

PAG 31

Intervalo de clase (en dlares) 100,5 120,5 120,5 140,5 140,5 160,5 160,5 180,5 180,5 200,5 200,5 220,5

frecuencia fi 2 3 5 5 3 2 20

## fi (XI-media) 5000 2700 500 500 2700 5000 16400

f i xi

Luego, s

i 1

n 1

16400 20 1

29.38

Esto nos indica que la mayora de los empleados encuestados gana entre 131.12 y 189.88 dlares mensuales. ( x s .

8.5

El coeficiente de variacin

Permite medir el grado de variacin de un conjunto de datos, especialmente si se compara dos tipos de datos con unidades distintas, se expresa en tanto por ciento y viene dada por:

CV

S *100 X

Ahora explicaremos las medidas de posicin relativa para datos sin agrupar, que no es sino el inters que se tiene en hallar un determinado valor con un porcentaje dado dentro del conjunto de datos, previamente deben ser ordenados de menor a mayor. Entre estas tenemos: El primer cuartil Q1 , representa el 25% de la posicin, es decir que el 25% de los datos se encuentra n 1 por debajo del valor encontrado. Se calcula Q1 , si la divisin cae en la mitad redondee al 4 entero ms prximo. El segundo cuartil Q 2 o mediana, representa el 50% de la posicin, es decir cuando el 50% de los datos se encuentra por debajo del valor encontrado y el otro 50% por encima de un valor especfico, medida est analizada. El tercer cuartil Q3 , representa el 75% de la posicin, es decir el 75% de los datos se encuentra por 3 n 1 debajo del valor hallado. Se calcula Q3 , si la divisin cae en la mitad, hay que redondear al 4 entero inmediato inferior.

## MAT. MAURICIO GARCIA

PAG 32

Los centiles ( o percentiles) son nmeros que dividen en 100 partes iguales un conjunto de datos ordenados, dicho conjunto tiene 99 centiles. El k-simo centil, Pk., representa un valor tal que el k% de los datos, es menor o igual que un valor hallado. La frmula para determinar cualquier percentil para datos agrupados viene dado por:
Pk Li n* p f f * h , donde

## frec del int ervalo k

Primeramente se debe hallar el intervalo de clase k, para lo cual multiplicamos n*p y sumamos acumulativamente en la columna de la frecuencia, el valor que supere a dicho valor, ste ser el intervalo de clase k.
Li representa el lmite real inferior, el mismo que se obtiene calculando el promedio entre el lmite inferior de la clase del intervalo k y el lmite superior anterior a la clase del intervalo k.

k 100

f representa la suma acumulada antes de la frecuencia de la clase del intervalo k f clase med representa la frecuencia de la clase del intervalo k y

h representa la diferencia del lmite inferior y superior de la clase del intervalo k. Ntese que, a ms de pedir el punto percentil k, se puede realizar tambin el proceso inverso. Dada una cantidad, encuentre el valor de k menor o igual a dicho valor dado. 3. La siguiente tabla representa los ingresos mensuales, en dlares, de 20 trabajadores de una empresa. a) halle el percentil 80 b) Qu porcentaje de trabajadores ganan menos de 150 dlares mensuales ?.
Intervalo de clase (en dlares) 100,5 120,5 120,5 140,5 140,5 160,5 160,5 180,5 180,5 200,5 200,5 220,5 frecuencia 2 3 5 5 3 2

Solucin:

k 80 0.8 100 100 Luego n*p=20*0.8=16, por tanto dicho valor se encuentra en el intervalo 180.5 a 200.5, as 16 15 P 80 180.5 * 20 187.16, es decir el 80% de los empleados gana hasta 187.333333 3 dlares.
a) Tenemos que calcular el percentil 80, esto es k= 80, n=20. p

## MAT. MAURICIO GARCIA

PAG 33

b) Como el valor de 150 dlares se encuentra en el intervalo de 140.5 a 160.5, entonces tenemos que k 20 * 5 n* p f 100 P k Li * h esto implica que, 150 140.5 * 20 .Despejando k, f frec del int ervalo k 5 tenemos que k=36.875%, es decir, el 36,875% de los encuestados gana hasta 150 dlares. Para obtener los ndices estadsticos bsicos, en SPSS, se pueden realizar por varios procedimientos; 1. Analyze Descriptive StatisticsFrequenciesEscoger las variables cualitativas que uno desee, puede escoger varias o una sola StatisticsMarcar los que uno desee ContinueOK. 2. Analyze Descriptive StatisticsDescriptiveEscoger las variables cualitativas que uno desee, puede escoger varias o una sola Options ContinueOK. 3. Analyze Descriptive StatisticsExploreEscoger las variables cualitativas que uno desee, puede escoger varias o una sola ContinueOK. Ntese que adems aqu nos calcula el intervalo de confianza para la media poblacional.

8.6 Diagrama de Caja y Bigote Analiza y resume un conjunto de datos de una variable dada. Permite describir si existe o no la simetra de los datos, adems permite hallar valores que no son comunes al conjunto de datos, y asimismo, se analiza si se ajusta dicho conjunto de datos a una distribucin de frecuencias determinadas. Se utilizan cinco nmeros, que son el mnimo, el primer cuartil, la mediana, el tercer cuartil y el mximo, de izquierda a derecha. Pueden existir valores atpicos (outliers) que pueden estar a la izquierda del bigote izquierdo y a la derecha del bigote derecho. La interpretacin indica que si la mediana est en el centro de la caja (entre el primer cuartil y el tercer cuartil) los datos se comportan en forma normal, esto es:

## Asimtrica hacia la izquierda

Simtrica

4. Utilice los siguientes datos, para realizar un diagrama de caja y bigote. Los siguientes datos representan el nmero de horas trabajadas semanalmente por 50 personas encuestadas.

## MAT. MAURICIO GARCIA

PAG 34

35 40 39 38 31 31 38 48 39 38

38 34 47 36 38 31 32 45 44 43

40 36 48 39 40 47 39 38 43 35

40 45 33 39 36 38 34 46 47 34

40 42 40 42 41 38 44 40 40 42

25 50 75

PAG 35

## Y cuyo grfico es:

20

30

40

50

El grfico de caja y bigotes presenta una caja central dividida en dos reas por una lnea vertical y dos segmentos horizontales (bigotes) que parten del centro de cada lado vertical de la caja. La caja central encierra el 50% de la frecuencia. El sistema dibuja la mediana como una lnea vertical en el interior de la caja. Si la lnea est en el centro de la caja no hay asimetra de la variable, que es este nuestro caso, por lo tanto los datos se comportan como una distribucin simtrica o normal. Para realizar los grficos de caja y bigote en SPSS debe tomar en cuenta : Graph Boxplot... Summaries of separate variables Define... Escoger las variables cualitativas que uno desee graficar, puede escoger una o varias variables OK, o tambin: Analyze Descriptive StatisticsExploreEscoger las variables cualitativas que uno desee, puede escoger varias o una sola PlotMarcar caja y bigoteBorrar las dems opciones ContinueOK

## MAT. MAURICIO GARCIA

PAG 36

Realice los siguientes ejercicios y problemas:

1. Los siguientes datos representan el nmero de das, que se demoraron en obtener trabajo, 100 personas encuestadas, en el sector informal en la ciudad de Quito.
64 32 72 54 118 89 136 91 133 45 68 122 124 115 41 91 103 49 77 46 36 144 134 120 146 33 132 84 94 138 76 83 131 91 95 74 137 91 39 88 32 63 41 69 130 79 94 118 97 64 55 47 106 37 120 52 105 144 36 59 133 126 150 31 49 51 112 47 74 85 130 146 108 142 43 49 49 142 87 30 49 79 58 133 62 113 30 31 144 106 42 82 86 31 114 80 110 97 42 116

Conteste: a. Se pide realizar la tabla de frecuencias, fr, fa, fra. Interprete el resultado de la fila ms alta. a. Cuntos personas consiguieron trabajo no ms de 70 das? b. Qu porcentaje de individuos consiguieron trabajo cuando mucho esperando 120 das? c. Cuntos individuos consiguieron trabajo ms de 71 pero no ms de 122 das? d. Qu porcentaje de individuos consiguieron trabajo a lo sumo 115 das? e. Cuntos individuos consiguieron trabajo menos de 65 das ms de 123 das? f. Realice el grfico de datos no agrupados de la frecuencia y fra. Interprete el grfico. g. Calcule los ndices estadsticos, de la tabla para datos no agrupados, esto es la media, mediana, moda, desviacin estndar, primer y tercer cuartil, interprete los resultados. h. Calcule el coeficiente de variacin e interprete el resultado. i. Construya slo los intervalos de clase de acuerdo a la metodologa enseada. j. Construya una tabla de datos agrupados desde el 29 a 40, de 40 a 51, 51 a 62, etc. k. Calcule la tabla completa de las frecuencias, esto es f, fr, fr, fra l. Realice el Histograma y Polgono de frecuencia. m. Grafique la ojiva o frecuencia relativa acumulada.

## MAT. MAURICIO GARCIA

PAG 37

n. De acuerdo a este ltimo grfico, indique aproximadamente el monto de los ingresos semanales de menos del 50%. o. As mismo de acuerdo a este ltimo grfico, indique aproximadamente el porcentaje de personas que consiguieron trabajo en 100 das? p. Calcule los ndices estadsticos, de la tabla para datos agrupados, del literal k), esto es, la media, mediana, moda, desviacin estndar, primer y tercer cuartil, interprete los resultados. q. Calcule el porcentaje de personas, que consiguieron trabajo en menos de 110 das, de los datos de la tabla de datos agrupados, del literal k). Interprete el resultado. r. Calcule el tiempo mnimo de las personas del 90% que consiguieron trabajo, de los datos de la tabla de datos agrupados, del literal k). Interprete el resultado. 2. En la tabla de frecuencias que se da a continuacin faltan algunos datos. Compltela y represente grficamente la frecuencia acumulada. VALORES f f.r. f.a. f.r.a. 0 1 2 3 4 5 0.2 2 5 9 14 0.7

3. En la tabla de frecuencias que se da a continuacin faltan algunos datos. Compltela y represente grficamente la frecuencia acumulada. VALORES f f.r. f.a. f.r.a. 0 1 2 3 2 5 9 14 0.7

## MAT. MAURICIO GARCIA

PAG 38

4 5

0.2

4. Los datos que a continuacin aparecen son los datos generales de la juventud en Ecuador de acuerdo al censo de la poblacin del 2001. En base al siguiente cuadro:

## No. Hombres 617.087 571.018 457.309 1.645.414 6.018.353

Fuente: Censo de poblacin 2001 INEC Conteste las preguntas: a. Especificar la poblacin, las variables indicadas y el tipo de variable. b. Calcular el porcentaje de hombres y mujeres para cada una de las categoras o grupo de edad. c. Representar grficamente la distribucin de hombres y mujeres por grupos de edad (histograma). d. Calcule el promedio de edad de acuerdo al sexo, interprete el resultado. e. Dnde existe mayor variabilidad, en hombres o mujeres de acuerdo a su edad. f. Halle la moda y mediana de las mujeres. Interprete el resultado. g. Calcule el 30%, 60% Q1 y Q3 cuartil de las mujeres. Interprete los resultados. h. Realice el diagrama de caja y bigote de la variable hombres. Interprete el resultado de los hombres. 5. La siguiente tabla representa un cuadro comparativo a nivel nacional del primer semestre, causas de detencin (las diez principales causas) entre los aos 2000 y 2003. En base al siguiente cuadro:
Causas Robo Asalto y robo 2000 1049 279 2001 821 407 2002 557 295 2003 467 266 Total 2894 1247

## MAT. MAURICIO GARCIA

PAG 39

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL Escndalo pblico Tenencia de arma Libar en la va pblica Investigacin Operativo antidelincuencial Tenencia de droga Agresin fsica Violacin

## 193 154 --24 47 31 16 14

349 142 4 46 21 37 49 30

GUIA DE ESTADISTICA DESCRIPTIVA 245 397 1184 138 42 57 59 46 26 20 116 316 64 119 61 47 40 550 362 191 246 175 138 104

a. Especificar la variable y poblacin que se han considerado. b. Determinar los porcentajes correspondientes a toda la informacin expresada del ao 2002 y 2003. As como su fa y fra. c. Comparar grficamente los datos de los dos aos (2002 y 2003) para dos de las causas de detencin, cualesquiera. Interprete los resultados. d. Dnde existe mayor variabilidad de las causas de delitos entre los aos 2000 y 2003? 6. La informacin que se expresa a continuacin corresponde al gasto mensual (en dlares) en llamadas de telfono mvil, a lo largo de una semana, de 50 Organismos No Gubernamentales (ONG).

67 63 64 57 56 55 53 53 54 54 45 45 46 47 37 23 34 44 27 44 45 34 34 15 23 43 16 44 36 36 35 37 24 24 14 43 37 27 36 26 25 36 26 5 44 13 33 33 17 33

Conteste:

a. Calcule las f, fr, fa y fra. b. Realice el grfico de las f, fa. c. Indique cuntas ONG tienen gastos menores a 43 dlares. d. Indique qu porcentaje de ONG tiene gastos entre 23 a 36 dlares mensuales. MAT. MAURICIO GARCIA PAG 40

e. Cuntas ONG tienen gastos de ms de 24 dlares pero no ms de 37 dlares? f. Cuntas ONG tienen a lo sumo 44 dlares de gastos semanales? g. Realice una tabla de datos agrupados comenzando por 4.5 a 15.5; de 15.5 26.5, as sucesivamente. h. Realice un histograma y el diagrama del polgono de frecuencia. Interprete los resultados. i. Cul es el valor que tienen que pagar las ONG por gasto mensual en llamadas de telfono mvil? j. Calcule la moda, media, mediana, la desviacin estndar, e interprete los resultados.
k.

Calcule el primer y tercer cuartil e interprete los resultados La siguiente tabla muestra la distribucin de costes de 10000 empleados de una multinacional.
Salarios (en dlares) 0-15000 15000-20000 20000-25000 25000-30000 30000-35000 35000-40000 40000-50000 50000-100000 100000-300000 No. de Empleados 1945 1430 1140 1005 1140 2422 590 228 100

7..

a) Halle la media del salario por trabajador, el salario tal que la mitad de los restantes sea inferior a l. b) Calcule el percentil 40 y el cuartil inferior salarial. c) Realice el grfico del histograma y polgono de frecuencia. En base a este grfico indique el porcentaje de personas que ganan aproximadamente menos de 32000 dlares. d) Halle el percentil 80 e interprete el resultado. e) Qu porcentaje de los empleados gana menos de 38000 dlares? f) Indique el porcentaje de empleados que ganan entre 32000 y 60000 dlares anuales 9. Se van a comparar la variabilidad en los precios anuales de las acciones que se venden a menos de
\$10 dlares y la dispersin en los precios de aquellas que se venden por arriba de \$60 dlares. El precio medio de las acciones que se venden a menos de \$10 dlares es de \$5,25 y la desviacin estndar es de \$1,52. El precio medio de las acciones que se venden a ms de \$60 es de \$92,5 y la desviacin estndar es de \$5,28. a) Qu pasa con sus precios? y b) Compare la variabilidad de ambas acciones e interprete el resultado. 8. Se ha recogido informacin de los Organismos No Gubernamentales (ONG), sobre los salarios de

PAG 41

## Pasanta Eventual Indefinido

400-800 10 13 2

800-1200 14 34 12

1200-2000 1 18 46

Halle a) La moda, la mediana de los que ganan entre 400 a 800, e interprete los resultados, b) Realice el grfico del histograma de los que ganan entre 800 -1200 c) Calcule el porcentaje de trabajadores con contratos de Pasanta que cobran ms de 450 dlares, d) Realizar el estudio comparativo del salario de los empleados con contrato Indefinido y con contrato Eventual, interprete los resultados e) Indique la poblacin y las variables que se consideran.

## RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION

1. VERDADERO 2. VERDADERO 3. a) 4, MUESTRA 5. OJIVA 7. a) NO EXISTE b) 130 8. FALSO 9. FALSO 10. b) a) 11. d) 12. a) 13. b) NO EXISTEN RACES DE NMEROS NEGATIVOS EN LOS REALES 14. RANGO. 15. b) UNIDAD II INTRODUCCIN A LA PROBABILIDAD

PREGUNTAS DE AUTOEVALUACION
1. El conjunto de todos los resultados posibles se llama 2. Una probabilidad subjetiva se puede decir que es una hiptesis bien estructurada a) Verdadero b) Falso 3. La notacin de una probabilidad condicionada viene dada por P(AB) a) Verdadero b) Falso 4. Dos sucesos son mutuamente excluyentes si cumple P(AB)=P(A)P(B) a) Verdadero b) Falso 5. La probabilidad de que al lanzar una moneda que caiga de filo es: a) 0 b) 1 c) Ninguno de los anteriores 6 .Un suceso es una condicin particular de un . 7. Al lanzar un par de dados, halle el evento de que su suma sea siete y su producto 12 a) (3,4) b) (4,3) c) (4,3) (3,4) d) (5,2)(2,5) e) Ninguna de las anteriores 8. La probabilidad de un evento se define como

2.1.

2.2. 2.3.

## 2.4. 2.5. 2.6.

Rol de la probabilidad en la estadstica: Definicin de eventos y espacio muestral Definicin de probabilidad, Propiedades Tablas de frecuencia, Tablas de probabilidades, Tablas de contingencia Probabilidad condicional: rboles de decisin Independencia estadstica Eventos independientes: Regla de la multiplicacin Participaciones, Probabilidad total y teorema de Bayes: Anlisis combinatorio: Combinaciones y Permutaciones

## MAT. MAURICIO GARCIA

PAG 42

ASESORA DIDCTICA II
La teora de probabilidades nace a principios del siglo XVII como resultado de investigaciones sobre distintos tipos de juego de azar. Entre los ms destacados exponentes se encuentran Fermat, Bernoulli, Gauss y Laplace, que dan la mayor formalidad y rigurosidad matemtica a la teora de las Probabilidades. Esta teora de Probabilidades, analiza las leyes que gobiernan ciertos tipos de fenmenos llamados fenmenos aleatorios, que buscan un modelo matemtico que se acerque o se aproxime al comportamiento de dichos fenmenos. Se define el suceso o evento, de un experimento aleatorio, como una caracterstica o particularidad del mismo, se lo denota con cualquier letra mayscula. En tanto un espacio muestral, es el conjunto de todos los resultados posibles de un experimento, lo simbolizaremos como la letra E. Existe una manera alternativa de representar un conjunto de resultados posibles, mediante lo que se conoce como diagrama de rbol, el mismo que se encuentra trazado como un crculo pequeo a la izquierda, representado por el tronco del rbol. 2.1 Teora de las Probabilidades Definicin.- Sea E un espacio muestral, mediante una funcin P, a todo evento de A se le asocia un nmero real, llamado probabilidad de A, que se lo denota P(A), es decir
1. P: A 0,1 A P( A) Esto nos indica que la probabilidad siempre variar entre 0 y 1 o entre 0% y 100%.

2. 3.

P( E ) = 1, esto nos indica que la probabilidad del espacio muestral siempre ser 1 o 100%. P A B P A P( B) si A B

2.2 Propiedades de las Probabilidades En base a los tres axiomas anteriores se pueden deducir las siguientes propiedades: 1. P 0 , esto nos indica que la probabilidad de un evento imposible es cero. 2. Sea A un evento cualquiera, P A C 1 P ( A) , es decir la probabilidad de calcular 1 mas eventos hasta n, se puede calcular el evento contrario y restar de 1. 3. Sean A y B, eventos cualesquiera, se tiene que: P A B C P( A B) P( A) P( A B) 4. P A B P A P( B) P( A B) si A B 5. Si A, B, C son eventos cualesquiera se tiene que:

P A B C P A P( B) P(C ) P( A B) P( A C ) P( B C ) P( A B C ) 6. Muchas veces se necesita calcular la probabilidad de un evento Una vez que se ha producido otro, en expresiones en un experimento, tales como dado, si, si se conoce, si se sabe,etc,

## MAT. MAURICIO GARCIA

PAG 43

se debe utilizar la probabilidad condicional, la expresin P(A/B), se lee la probabilidad de A dado B y se define P( A B) P A/ B si P( B) 0 P( B ) 7. Dos sucesos son mutuamente excluyentes si se cumple que PA B 0

8.

Dos sucesos son independientes si la ocurrencia del uno no incide en la ocurrencia del otro evento, esto es

P A B P A * P( B) P A / B P( A) P B / A

P( B)

EJERCICIOS
1. Se lanza una moneda y se observa si cae por cara, se lanza una moneda, si cae por sello se lanza por segunda vez. De acuerdo a las condiciones del problema, tenemos que:

C C S C C S S S C

## MAT. MAURICIO GARCIA

PAG 44

nmeros resultantes sea mayor que 4 3. Se saca al azar de una caja que contiene 6 bolas rojas, 4 blancas y 5 azules. Determine la probabilidad de que la bola a) no sea roja b) sea roja o blanca 4. Encuentre la probabilidad de no obtener un 7 u 11 en la suma del lanzamiento de dos dados. 5. Si P( A B) 0.9 y P( B) 0.6, halle P( A B)

6. Los siguientes datos representan el tiempo en segundos que se demoran 50 programas en ser compilados:

Valores Frecuencia 12 2 14 1 15 1 16 2 17 2 18 4 19 2 20 4 21 4 22 5 23 4 24 3 25 3 28 2 29 1 30 1 31 2 33 1 35 2 36 1 37 1 39 1 40 1 Halle la probabilidad de que un programa escogida al azar Dure entre 15 a 24 seg.

cf 31 0.62 62% cp 50 Existe, por tanto, un 62% de probabilidades de que el programa dure entre 15 a 24 seg.
Solucin: definimos el evento A. Dure entre 15 a 24 seg, luego P( A) Sea mayores de 25 seg,

## MAT. MAURICIO GARCIA

PAG 45

Solucin: definimos el evento B, Mayor de 25 seg, luego cf 13 P( B) 0.26 26% cp 50 Existe, por tanto, un 22% de probabilidades de que el programa dure ms de 25 seg.

Dure entre 16 a 23 seg. Solucin: definimos el evento C Dure entre 16 a 23 seg, luego cf 27 P(C ) 0.54 54% cp 50 Existe, por tanto, un 54% de probabilidades de que el programa dure entre 16 a 23 segundos. 7. En un experimento para estudiar la diferencia entre hombres y mujeres que fuman o no, se obtuvieron los siguientes datos:

## No fuman Hombres Mujeres 21 48

Si se elige al azar a una de estas personas, encuentre la probabilidad de que la persona a) Sea mujer b) Sea gran fumador c) Sea hombre y no fume d) Sea mujer o sea un fumador moderado e) Si es hombre, cul es la probabilidad de que sea fumador moderado? Solucin: a) De acuerdo a las condiciones definimos el evento A sea mujer cf 93 P( A) 0.516 51.6% cp 180 Luego, existe un 51.6% de probabilidades de que la persona escogida al azar sea mujer. cf 49 b) Definimos el evento B sea gran fumador P( B) 0.27 27% cp 180 Luego, existe un 27% de probabilidades de que la persona escogida al azar sea un gran fumador.

cf 21 0.116 11.6% cp 180 Luego, existe un 11.6% de probabilidades de que la persona escogida al azar sea hombre y no fume.
c) Definimos el evento C sea hombre y no fume P(C ) d) Definimos el evento D sea mujer y definimos el evento F sea un fumador moderado , por tener la conjuncin o, esto nos indica unin, por tanto tenemos: 93 62 26 P ( D F ) P ( D) P ( F ) P ( D F ) 0.72 72% 180 180 180 MAT. MAURICIO GARCIA PAG 46

Luego, existe un 72% de probabilidades de que la persona escogida al azar sea mujer o sea un fumador moderado.

e) Definimos el evento dado que G es hombre y definimos el evento H sea un fumador moderado , por tanto es una probabilidad condicional, esto es: 36 PH G 180 0.416 P( H / G ) 87 PG 180 Por lo tanto, existe un 41,6% de probabilidades de que sabiendo de que es hombre, sea un fumador moderado.

TEOREMA DE BAYES Una generalizacin para que el espacio muestral se divida en k subconjuntos, utiliza la llamada regla de eliminacin, mediante el siguiente: Teorema. Si existen B1, B2. . . , Bk, y forman una particin o divisin del espacio muestral E, y cumple que P( Bi ) 0 para i 1, 2,..., k , luego si A es cualquier evento del espacio muestral E, se tiene
k k

P A
i 1

P( Bi

A)
i 1

P( Bi ) P( A / Bi )

Obsrvese que este teorema se aplica cuando se pide solamente la probabilidad de un evento simple cualquiera. Si ahora se considera encontrar la probabilidad condicional, se utiliza el llamado teorema de Bayes, esto es: Teorema. Si existen B1, B2. . . , Bk, y forman una particin o divisin del espacio muestral E, y cumple que P( Bi ) 0 para i 1, 2,..., k , luego si A es cualquier evento del espacio muestral E, tal que

P(A)

0 se tiene P Br / A

P( Br
k

A) A)

P( Br ) P A / Br
k

para r 1 ,2,...k

P( Bi
i 1

P( Bi ) P( A / Bi )
i 1

EJERCICIOS 8. Dentro de un grupo de empresas 2/5 son compaas annimas y 3/5 son limitadas. De las annimas la mitad tiene utilidades menores a 5000 dlares, mientras que 2/3 de las limitadas estn en el mismo caso. Calcule la probabilidad de que: a) Una empresa elegida al azar tenga

## MAT. MAURICIO GARCIA

PAG 47

ms de 5000 dlares de utilidades, b) Una empresa elegida al azar tenga menos de 5000 dlares, sea compaa limitada. Solucin: Realizaremos el diagrama de rbol,

## <\$50000 2/5 CA 1/2 >\$5000

2/3

<\$5000

3/5

CL >\$5000

De acuerdo al grfico tenemos: a) Ntese que nos pide solamente un evento simple, por lo que aplicando el teorema de eliminacin, definiendo el evento A ms de 5000 dlares de utilidades, buscamos el camino que nos lleva a ms de 5000 dlares de utilidades, luego k k 2 1 3 1 2 P A P( Bi A) P( Bi ) P( A / Bi ) * * 0.40 5 2 5 3 5 i 1 i 1 Por lo que existe un 40% de probabilidades, de que la empresa tenga ms de 5000 dlares de utilidades. b) Definamos el suceso A menos de 5000 dlares y el evento B sea compaa limitada , es una probabilidad condicionada, por lo que, aplicamos el teorema de Bayes, de acuerdo al grfico tenemos: 3 2 * P ( B A) 2 5 3 P B/ A 0.66 66% 2 1 3 2 P ( A) 3 * * 5 2 5 3 Luego existe un 66% de probabilidades de que la empresa elegida al azar tenga menos de 5000 dlares sea compaa limitada.

## MAT. MAURICIO GARCIA

PAG 48

i.

Una compaa compra tubos de cemento a cuatro proveedores diferentes, la compaa A proporciona 25% de los tubos, B 25%, C 35% y D 15%. La compaa A ofrece tubos de buena calida con apenas el 4% de defectuosos, B con el 5% de defectuosos, C con el 2% y D con el 6% de defectuosos. A) Cul es el porcentaje de tubos defectuosos? b) En el ltimo envi, se hall un defectuoso. Cul es la probabilidad de que sea de la compaa C?

ii.

El departamento de crdito, report que el 40% de sus ventas, se pagan en efectivo, 25% con cheque en el momento de la compra y 35% con tarjeta de crdito. Se realizan compras por ms de 80 dlares, pagndose el 30% de las compras en efectivo, 70% se las pagan con cheque y 55% con tarjeta de crdito, usted ha comprado un artculo que cuesta \$ 100. a) Cul es la probabilidad de que haya pagado en cheque? b) en efectivo? c) con tarjeta de crdito?

iii. Los registros de asalto en una ciudad nos indican que el 25% de ellos son muy violentos y el 75% no lo son. Se sabe tambin que se denuncian 90% de los muy violentos y el 70% de los no violentos. a) cul es la proporcin total de delitos que se denuncian en la ciudad? b) si se conoce que se realiz un delito, cul es la probabilidad de que el delito sea violento? Y cul que no sea violento? 2.3 COMBINACIONES Definicin. Si de n objetos tomamos r a la vez, se denota

## denomina combinacin, y se define

n r

n! r! n r !

n! se lee n factorial y se define n! =n*(n-1)*(n-2)**3*2*1. De acuerdo con la definicin de combinacin, se puede deducir las siguientes propiedades: 1.

2.

3.

4.

5.

n 1 0 n n 1 n 1 n n n r n r n n 1 r r

n 1 r 1
PAG 49

## MAT. MAURICIO GARCIA

EJERCICIOS 1. De un grupo de 15 contadores y 12 Financieros cuntos comits de 5 contadores y 3 financieros se pueden formar?

Solucin: Se observa que el orden no importa por tanto, es una combinacin, esto es:

15 12 5 3

15! 12! * 5! 15 5 ! 3! 12 3 !

660660

Por tanto existen 660660 formas de elegir 5 contadores de entre 15 y 3 financieros de entre 12. 2. De un grupo de 15 empresas cuntos grupos de dos tres cuatro se pueden formar? Solucin: Obsrvese que el orden no importa, por tanto es una combinacin, como dice la expresin se suma esto es:

15 2

15 3

15 4

15! 2! 15 2 !

15! 3! 15 3 !

15! 4! 15 4 !

49140

## Por tanto existen 49140 maneras de escoger 2 3 4 empresas de entre 15.

18. De cuntas maneras pueden seleccionarse, 3 contadores, 4 financieros, 5 economistas con 7 contadores, 10 financieros y 8 economistas. 19. En un Campeonato de ftbol participan doce equipos, cuntos partidos deben jugarse si cada equipo debe jugar con todos los otros?. 2.4 PERMUTACIONES Definicin: Una permutacin es un arreglo de todos o parte de un conjunto de objetos o personas, en el que el orden importa, se define as:

P (n, r )

n! n r !

De aqu se pueden deducir las siguientes propiedades: 1. El nmero de permutaciones de n objetos distintos es: P (n, n) n ! 2. El nmero de permutaciones de n objetos, dispuestos en forma de crculo es (n -1) !

EJERCICIOS iv. En una carrera intervienen 18 atletas. de cuntas maneras pueden distribuirse los cinco primeros puestos?

## MAT. MAURICIO GARCIA

PAG 50

Solucin: Obsrvese que el orden si importa, por tanto es una permutacin, luego tenemos:

P (18,5)

18 ! 1028160, 18 5 !

## luego existen 1028160 formas de llegar a los cinco primeros lugares.

v.

vi. vii.

Hallar cuntos nmeros enteros de tres cifras pueden formarse con los 9 dgitos 1,2,3, , 9 si a) los tres dgitos usados son diferentes b) los tres dgitos usados no son necesariamente diferentes c) los enteros formados deben ser pares , permitindose la repeticin de dgitos. De cuntas maneras posibles se pueden seleccionar 10 carpetas para un trabajo si solamente hay cuatro vacantes posibles? En cuntas formas diferentes se pueden formarse 8 nios alrededor en un crculo

PROBABILIDAD USANDO EL ANALISIS COMBINATORIO 20. Se escoge al azar 3 empresas, de entre 15, de las cuales 5 son pequeas empresas, hallar la probabilidad de que: a) Ninguna sea pequea empresa b)Exactamente una sea pequea empresa c) Por lo menos una sea pequea empresa 21. En una urna existen 9 bolas numeradas del 1 al 9, se extrae aleatoriamente dos bolas, cul es la probabilidad de que a) los dos nmeros sean pares b) los dos sean impares c) el uno par y el otro impar. 22. De un grupo de empresas 8 limitadas y 6 annimas se escoge un comit de 4 para un trabajo especfico. Cul es la probabilidad de que el comit conste de de 2 compaas limitadas y 2 annimas?

A. TEORA DE PROBABILIDAD: COMBINACIONES Y PERMUTACIONES
1.

13 19 4

PAG 51

## UNIVERSIDAD TECNOLOGICA EQUINOCCIAL 2. Una empresa que tiene 13 accionistas

va a elegir, en votacin secreta, cuatro directivos, esto es, un presidente, un vicepresidente, un secretario y un tesorero. Los trece miembros son elegibles y desean participar en la votacin. Cuntos grupos posibles de cuatro miembros pueden formarse, si no se tiene en cuenta el tipo de trabajo? Quince contadores han pasado las pruebas de contabilidad intermedia. De estos se escogern seis para que conformen un comit, Cuntos comits diferentes se pueden formar con estos 15?

3.

4.

Una empresa tiene 14 candidatos como contadores entre los cuales debe seleccionar nueve para ocupar dichos cargos. Cuntos grupos de nueve se pueden hacer? Una profesora debe nombrar un comit de cuatro muchachos y tres muchachas entre los estudiantes. Debe escogerlos entre un grupo de ocho hombres y seis mujeres. Cuntos comits diferentes se pueden nombrar?

5.

6.

Se lanza un par de dados. Encontrar la probabilidad de que el mximo de los dos nmeros resultantes sea mayor que 4. Sea P (A) = 0.3, P (A B)= 0.40, P(Bc) = 0.9

7.

Halle a) P (B/A) b) A y B son eventos independientes, indique Por qu? c) P A B En una ciudad grande, el 70% de las empresas compra revistas econmicas y el 90% revistas de finanzas. Suponer que estos dos eventos son independientes. Qu probabilidad hay que una empresa escogida al azar sea una de las que compra ambas revistas? 9. Una facultad tiene los datos sobre la edad y el estado civil de 140 estudiantes.
8.

## Edad (aos) < 30 30 a 40 > 40 a. b. c. d.

Soltero(a) 77 49 10

Cul es la probabilidad de cada uno de los estados maritales de los estudiantes? Cul es la probabilidad de que un estudiante seleccionado al azar, tenga menos de 30 aos o sea divorciado? Cul es la probabilidad de que un estudiante seleccionado al azar, tenga ms de 40 aos y sea soltero? Si un estudiante nos dice que es casado, cul es la probabilidad de que tenga entre 30 a 40 aos? PAG 52

## MAT. MAURICIO GARCIA

C. TEOREMA DE BAYES
10.

Una empresa tiene dos fbricas en Guayaquil y otra en Quito. La fbrica de Guayaquil produce el 40% del total de unidades, con un ndice de defectos del 10%. La de Quito tiene un ndice de defectos del 20%. Si una unidad suelta se encuentra defectuosa, de dnde es ms probable que proceda, de Guayaquil o de Quito?

11.

En el departamento de contabilidad de una empresa, tres empleados tienen la tarea de procesar los registros de los clientes. El primer empleado, A, procesa el 45% de los registros, el segundo B el 30% y el tercero C el 25%. El primer empleado tiene un porcentaje de error en su trabajo del 3%, el segundo del 5% y el tercero del 2%. Se selecciona un registro al azar entre los que se procesaron durante una semana y se encuentra que tiene un error. El auditor desea verificar la probabilidad de que el registro haya sido procesado por el empleado C. En un grupo de hombres adultos, el 10% presenta educacin primaria, el 70% tiene educacin secundaria y el 20% educacin universitaria. El 5% de los que presentan educacin primaria pertenece al grupo de ingresos altos. Por su lado, el 15% de los que tienen educacin secundaria y el 75% de los que tienen educacin universitaria pertenece al grupo de ingresos altos. Se selecciona un individuo al azar entre esta poblacin y se encuentra que est en el grupo de ingresos altos. Encontrar la probabilidad de que este individuo slo presente educacin primaria, de que presente educacin secundaria y de que presente educacin universitaria. Un mdico ha descubierto, en una gran empresa industrial, que el 20% de los casos de emergencia que examina, proviene del departamento A, el 10% provienen del departamento B, el 45% del departamento C y el 25% del departamento D. Tambin ha descubierto que el 10% de los casos de emergencia del departamento A, el 5% del departamento B, el 15% del departamento C y el 12% del departamento D son accidentes debidos a aparente descuido. Se presenta en la clnica un caso de accidente ocasionado por descuido. Qu probabilidad hay que ese paciente pertenezca al departamento A?, B?, C?, D?

12.

13.

En el paquete estadstico SPSS se puede realizar el cruce de variables de la siguiente manera: Analyze Descriptive Statistics Croostabs Row (variable 1) Column (variable 2) OK Adems se puede hacer el cruce de ms de dos variables, por ejemplo de una base de datos tenemos: 1) Haga una clasificacin cruzada de la sindicalizacin ( pregunta 14) con la satisfaccin en el trabajo (pregunta 9) en lo que respecta al sexo. Analyze Descriptive Statistics Crosstabs

PAG 53

## Continue y luego OK, los resultados son:

Interpretacin: Ntese que existen 89 hombres que no son miembros del sindicato y que estn muy satisfechos con su
sati sfaccion con el trabajo * sexo de l encuestado * MIEMBRO DEL SI NDICATO Crosstabulation Count MIEMBRO DEL SINDICATO SI satisfaccion con el trabajo sex o del encuestado mas culino femenino 19 9 20 7 2 48 89 80 12 4 185 8 1 3 21 68 63 7 8 146 Total 28 28 8 5 69 157 143 19 12 331

MUY SATISFECHO MODERADAMENTE SATISFECHO UN POCO SATISFECHO MUY INSATISFECHO MUY SATISFECHO MODERADAMENTE SATISFECHO UN POCO SATISFECHO MUY INSATISFECHO

NO

## MAT. MAURICIO GARCIA

Total

PAG 54

trabajo. Advirtase que existe una sola mujer que pertenece al sindicato y esta un poco satisfecha con su trabajo, adems existen tan slo 21mujeres en total que pertenecen al sindicato.

## RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION

1. ESPACIO MUESTRAL 2. VERDADERO 3.FALSO 4, FALSO 5.a) 6. EXPERIMENTO 7. c)

II. DISTRIBUCIN DE PROBABILIDADES DISCRETAS Y CONTINUAS

PREGUNTAS DE AUTOEVALUACION
viii. Determine la diferencia en lo que corresponde a sus parmetros, al aplicar la Distribucin Binomial y la Hipergeomtrica ix. Es la distribucin de Poisson una variable aleatoria continua? a) verdadero b) Falso x. Como tambin es llamada la Distribucin Normal xi. Para que un conjunto de datos se considere que es normal, la media, mediana y moda deben ser iguales a) Verdadero b) Falso xii. El rea bajo cualquier curva es 1 100% a) verdadero b) Falso xiii. La distribucin que se analiza fracasos y xitos es la distribucin xiv. La distribucin en que el suceso es constante para cada intervalo temporal es llamado xv. La probabilidad de que el evento no es constante entre ensayos se llama .. 3.1. Variables aleatorias: Definicin Tipos Propiedades Distribucin de probabilidad para una variable aleatoria discreta: Definicin. Propiedades Valor esperado y desviacin estndar Distribucin de probabilidad binomial: de Poisson, Hipergeomtrica y Binomial Negativa. Definiciones, propiedades y caractersticas Modelos matemticos Caractersticas y propiedades PAG 55

3.2.

3.3.

## MAT. MAURICIO GARCIA

3.4.

3.5.

Distribucin normal: Naturaleza e importancia Propiedades y modelo matemtico Manejo de la tabla Aplicaciones de la curva normal: Clculo de probabilidades con la variable tipificada

3.6.

## ASESORA DIDCTICA III

Existen las llamadas variables aleatorias (va), que son funciones que asocian un nmero real a cada elemento del espacio muestral. Las variables aleatorias se clasifican en discretas y continuas. Las variables aleatorias discretas (vad), son aquellas variables que toman valores enteros, y se presentan generalmente por medio de una tabla. En cambio las variables aleatorias continuas ( vac), son aquellas variables que toman valores en una escala continua, es decir cualquier nmero real en un intervalo dado, no es posible representarlas en forma tabular. Existen adems funciones de densidad de probabilidades (fdp) tanto para vad como para vac, que deben cumplir bsicamente dos cosas: que la probabilidad vare siempre entre 0 y 1 y que la suma de las probabilidades sea 1 para las vad, y en el caso de las vac que el rea bajo cualquier curva de siempre 1. Analizaremos las siguientes variables aleatorias discretas:

A. VARIABLES DISCRETAS

Definicin. Se dice que una variable aleatoria (v.a) es una funcin f: A espacio muestral y los nmeros reales. Existen dos tipos de variables aleatorias, las discretas y continuas.

, donde A representa el

Definicin. Un espacio que contienen un nmero finito de posibilidades o infinita con igual nmero de elementos que nmeros enteros, se conoce como espacio muestral discreto. Definicin. Un espacio que contienen un nmero infinito de posibilidades iguales nmero de elementos de los nmeros reales, se conoce como espacio muestral continuo.

## MAT. MAURICIO GARCIA

PAG 56

Una variable aleatoria discreta toma cada uno de sus valores con alguna probabilidad, por lo que se puede dar la siguiente: Definicin. Una funcin de densidad es llamada de probabilidades (f.d.a) si cumple:

a)

1) 0

P( A) 1

2)
i 1

p ( x) 1

b)

b

1) 0

P( A) 1
b,

2)

## p( x)dx 1 , recordar que

p( x)dx
a

1. Distribucin Binomial Definicin: Sea x una variable aleatoria discreta (vad), en la que se realizan n pruebas independientes y la probabilidad de que sucedan k veces un suceso viene dado por la siguiente funcin de densidad de probabilidades (fdp)

n P n, k , p k

p k (1 p) n k , k

0,1,2,3..., n

0 en otro caso Donde n representa el tamao de la muestra, k es el nmero de veces que ocurre un suceso, p la probabilidad de ocurrencia. Esta distribucin Binomial, se aplica a) cuando cada ensayo tiene dos resultados posibles (xito o fracaso; si o no; verdadero o falso, etc) b) adems existen n ensayos independientes repetidos c) la probabilidad de xitos o aciertos , permanece constante de un experimento a otro d) los experimentos son independientes. La v.a binomial k es la cuenta del nmero de ensayos exitosos que ocurren, k toma valores entre 0 y n.
Adems se pueden deducir las siguientes propiedades: 1. La esperanza matemtica o media promedio viene dado por E(x)=np n * p * (1 p) 2. La desviacin estndar, es S Utilice La tabla de la distribucin Binomial del apndice I, es acumulativa La distribucin binomial que presenta el programa es acumulativo es decir va desde k=0 hasta el k que se desee. TransformeCompute y

## MAT. MAURICIO GARCIA

PAG 57

Obsrvese que CDF nos permite calcular el rea acumulativa dado el punto.

Ejemplo: 1. La probabilidad de que una empresa pague sus utilidades a tiempo, es de 0.3. a) Determine la probabilidad que de 6 empresas escogidas al azar hasta 2 paguen a tiempo. b) Calcule el promedio de empresas que paguen sus utilidades a tiempo. Solucin: De acuerdo a las condiciones de los datos tenemos: n=6; p=0.3 y k=0,1,2. Utilizando la distribucin Binomial, tenemos:

P n, k , p

n k

p k (1 p) n

P(6;0;0.3)+ P(6;1;0.3)+ P(6;2;0.3)= 6 6 6 0.30 (1 0.3) 6 0.31 (1 0.3) 5 0.32 (1 0.3) 4 0.7443 0 1 2 Por tanto existe un 74.43% de las probabilidades de que hasta 2 empresas paguen sus utilidades a tiempo.

b) Nos pide la esperanza matemtica, esto es: E(x)=np= 6*0.3=1.8, por tanto el promedio del nmero de empresas que paguen sus utilidades a tiempo es aproximadamente 2.

EJERCICIOS DE DISTRIBUCION BINOMIAL

1. El diez por ciento de los contadores tienen hbitos de realizar peridicamente anlisis financieros de la situacin de la empresa. Hallar la probabilidad de que de una muestra de 10 contadores elegidos al azar sean exactamente 2 los que tengan hbitos. 2. Un paquete contable, se diseo, para que sea 99% confiable, se sabe que 9 empresas compraron este paquete. Encuentre la probabilidad de que : a) Por lo menos una empresa esta contenta con este paquete b) Por lo menos 6 empresas, este contentas con este paquete c) A lo sumo 5 empresas estn satisfechas d) como mximo 2 empresas, estn satisfechas. 3. Se sabe que en el 10% de las compaas, trabajan personas discapacitadas, si se selecciona al azar 40 empresas, cual es la probabilidad de que a) Cuando mucho trabajen 2 personas

## MAT. MAURICIO GARCIA

PAG 58

discapacitadas b) Mas de tres pero no mas de 7 personas discapacitadas c) como mnimo cuatro personas discapacitadas. d) Halle el nmero esperado de compaas que laboran personas discapacitadas.

2. Distribucin de Poisson Definicin: Si el tamao de la muestra es demasiado grande y la probabilidad muy pequea, utilizar la distribucin binomial resulta bastante tedioso, por lo que se aconseja utilizar la distribucin de Poisson que viene dada por:
e P k, k!
k

,k

0,1,2,3....

0 en otro caso Donde = np, e=2.718281., k es el nmero de veces que ocurre un suceso. Adems, para tener un mayor grado de seguridad, en la aplicacin de la Distribucin de Poisson se sugiere utilizar la siguiente regla emprica, esto es: 1. Si se cumple que np 5 y si n50, se aplica la distribucin de Poisson 2. Si se cumple que p 0.10 se aplica la distribucin de Poisson, pero si no cumplen los dos, entonces se aplica la distribucin Binomial.

Adems se pueden deducir las siguientes propiedades: 1. La probabilidad de ocurrencia en un intervalo dado es independiente de la ocurrencia en otro intervalo. 2. La probabilidad de que se de resultado en un intervalo muy corto es proporcional a la magnitud del intervalo de tiempo, y no tiene nada que ver con la cantidad de resultados que se produzcan fuera de ese intervalo. 3. La probabilidad es despreciable cuando se produce mas de un resultado en ese intervalo. 4. La esperanza matemtica o media, viene dada por E(x)==np 5. La desviacin estndar, es S Utilice La tabla acumulativa del la distribucin de Poisson del apndice II La distribucin de Poisson que presenta el programa es acumulativo es decir va desde k=0 hasta el k que se desee. TransformeCompute y

Ejemplo 2. Si la probabilidad de que una persona cometa al menos un error al declarar su impuesto a la renta, es del 0.001. Determine la probabilidad de que entre 2000 personas ms de 2 cometan un error en su declaracin.

## MAT. MAURICIO GARCIA

PAG 59

Solucin: Obsrvese que se tiene que n=2000; p=0.001; y k= 3,4,,2000 Podemos hacer cumplir las condiciones, np=0.001*2000=2 5 y si n=200050, se aplica entonces la distribucin de Poisson, para lo cual calcularemos el evento contrario esto es k= 0,1,2,es decir: =n*p= 0.001*2000=2

P k,
P 0,2

e k!
P 1,2

, reemplazndolo tenemos:

0.6767 , ahora bien como queremos el evento 0! 1! 2! contrario tenemos1-0.6767= 0.3233, por tanto existe un 32.33%, de probabilidades de que ms de dos personas cometan al menos un error en su declaracin. P 2,2

20

21

22

EJERCICIOS DE DISTRIBUCION DE POISSON

4. Se sabe que en una ciudad de 60000 habitantes, hay un promedio anual de tres robos de carros diarios. Para una ciudad de 120000 habitantes, halle la probabilidad de que en un da dado haya a) Un robo b) Mas de dos c) No mas de 6 d) Ms de cinco pero no mas de 9 e) exceda de tres. 5. El nmero de errores que se comenten al declarar el impuesto a lamenta es de 1 de cada 1000. Si escogen 10000 declaraciones, obtenga la probabilidad de que 4 5 6 tengan errores. 6. Se calcula que el 0.5% de las personas que llaman al Municipio de su ciudad no son atendidas. Cul es la probabilidad de que de 2100 llamadas, a) por lo menos 5 no hayan sido atendidas b) cul es el nmero de llamadas esperadas que no fueron atendidas? c) cul es su desviacin estndar d) es probable que el nmero de llamadas no atendidas sea superior a 15? 3. Distribucin Hipergeomtrica Definicin: Se aplica cuando el tamao de muestra, n, con respecto al tamao de la poblacin, N, no es muy grande, adems de que se tiene una caracterstica, x, y el nmero de veces que ocurre un suceso, k, se utiliza x N x

k P n, N , k , x 0

n N n

0,1,2....n k

x; n - k

N - x, n, x, N

en otro caso

Obsrvese que se necesita cuatro parmetros, para utilizar esta distribucin. PAG 60

## MAT. MAURICIO GARCIA

Adems se pueden deducir las siguientes propiedades: 1. La esperanza matemtica o media viene dada por E(x)=

nx N

2. La desviacin estndar, es S

xN

r n N n) N N 1
2

## Tambin la tabla es acumulativa desde un k=0 a un k determinado,con el siguiente comando: TransformeCompute y

Ejemplo 3. En una clase en la que hay 20 estudiantes, 15 estn insatisfechos con el texto que se utiliza. Si se le preguntara acerca del texto a una muestra aleatoria de cuatro estudiantes, determine la probabilidad de que exactamente tres de ellos estn insatisfechos con el texto. Solucin: De acuerdo a los datos se observa que N=20; como 4 son elegidos al azar, n=4 ; la caracterstica o particularidad es x=15 y k= 3,el evento a ser contestado, utilizando la distribucin Hipergeomtrica, tenemos:

P 4,20,3,15

x N x k n k N n

15 5 3 1 20 4

## 0 en otro caso tres personas estn insatisfechos con el texto gua.

EJERCICIOS DE DISTRIBUCION HIPERGEOMETRICA

7. En una clase en la que hay 20 estudiantes, 15 estn insatisfechos con el texto que se utiliza. Si se le preguntara acerca del texto a una muestra aleatoria de cuatro estudiantes, determine la probabilidad de que a) exactamente tres y b) cuando menos tres de ellos estn insatisfechos con el texto.

## MAT. MAURICIO GARCIA

PAG 61

8. Una empresa recibe un lote de 20 computadores de los cuales cinco estn defectuosos, el gerente selecciona al azar tres de ellos y prueba su funcionamiento, se aceptar el lote si no se encuentran defectos, cul es la probabilidad de que se acepte este lote? 9. Un fabricante de autos, indica que su marca, es una de cuatro de las nueve marcas, que ms ahorran gasolina. Determine la probabilidad de que en una muestra de tres, por lo menos una se encuentre su marca..

B. DISTRIBUCIONES CONTINUAS 4. Distribucin Normal Una de las funciones, de variables aleatorias continuas (v.a.c) ms importantes en Estadstica, es la llamada Distribucin Normal o Campana de Gauss o Curva Simtrica, que se presenta con frecuencia en las aplicaciones reales, viene dada por: Definicin: Una variable aleatoria x tiene una distribucin normal, llamado variable aleatoria normal cuya funcin de densidad de probabilidades viene expresada por:

p( x; x; s)

1 e s 2

(1 / 2 ) ( x x ) / s

con s 0 ,

3.14159... y e 2.71828... ,

## cuyo grfico es:

Propiedades: xvi. xvii. xviii. xix. La moda tiene su mximo en la media aritmtica La curva es simtrica con respecto al eje y. El rea bajo la curva es de 1 100%. Las colas de la curva jams cruzan el eje de las X, es decir se aproximan en forma asinttica al eje horizontal. xx. La tabla a utilizarse, calcula el rea del punto a la izquierda, esto es:

## MAT. MAURICIO GARCIA

PAG 62

Se han tabulado sus reas, cuando x 0 y s 1, ya que su frmula de densidad, no puede integrarse directamente, es decir, se utilizar la tabla estandarizada del apndice III, y son valores de 1 2 x 1 e 2 dx 2 z

Si se desean realizar clculos de probabilidades relacionadas con variables aleatorias distintas de la distribucin normal estndar, usamos el siguiente Teorema. Sea x una distribucin normal con media x y desviacin estndar se tiene x x (1), tiene la distribucin normal estndar. z s Para usar las tablas de distribucin normal estandarizada ( con una media 0 y una desviacin estndar de 1), en el programa se debe seguir : TransformeCompute Y

Esto nos permitir encontrar el rea dado el punto. El programa nos permite calcular el rea del punto a la izquierda. Dada una distribucin normal estandarizada determine las siguientes probabilidades: a) Z sea lo ms +1.08? Solucin: a) Como se calcula el rea desde el punto a la izquierda tenemos:

Obteniendo como resultado un rea de 0.8599 o el 85.99% b) Este entre 0.21 y +0.18? Se calcula el rea entre 0.21 y +0.18

## MAT. MAURICIO GARCIA

PAG 63

Obteniendo como resultado un rea de 0.1546 o el 15.46%. Ejemplo 4. Las ventas diarias de una empresa, se comportan como una distribucin normal, con media de 530 dlares y una desviacin tpica de 120 dlares, cul es la probabilidad de que las ventas excedan de 700 dlares en un da en particular? Solucin: De acuerdo a los datos tenemos: x Grficamente tenemos:

\$530 ; s

\$130 y x

700 ,

x x 700 530 1.41, utilizando la tabla de la curva normal( ver s 130 apndice III) , tenemos: A(-1.41)=0.0793 existe apenas un 7.93% de probabilidades de que el propietario tenga ganancias superiores a \$700 diarios.
Por tanto, utilizando z Ejemplo 5. Se sabe que el tiempo promedio para realizar una transaccin, se comporta como una aproximacin normal, con una media de 70 minutos y una desviacin estndar de 12 minutos. cunto debe durar este tipo de transacciones, si se pretende que el 90% de las personas lo terminen? Solucin: De acuerdo a los datos tenemos: x 70 ; s \$12 y Z 90% , cuyo grfico es:

## MAT. MAURICIO GARCIA

PAG 64

x x despejando x z * s x , luego de la s tabla de la curva norman observamos un valor que se aproxime a 0.90, esto es Z=1.28, reemplazando tenemos: x z * s x =1.28*12+70=85.36, por tanto para que el 90% de las personas terminen sus transacciones debe durar como mximo 85.36 minutos.
Para lo cual debemos despejar x, de la expresin: z

Ejemplo 6. Un anlisis estadstico de 1000 llamadas telefnicas de larga distancia indica que la duracin de estas llamadas se distribuye normalmente con un media muestral de 240 segundos y una s= 40segundos a. b. c. d. e. Qu porcentaje de estas llamadas dur al menos 180 segundos. Cul es la probabilidad de que una llamada particular dure entre 180 y 300 segundos. Cuntas llamadas duraron menos de 180 segundos o ms de 300 segundos. Qu porcentaje de las llamadas dur entre 110 y 180 segundos Cul es la duracin de una llamada particular si solo el 1% de todas las llamadas son las cortas.

Solucin: Se utilizar el comando CDF.NORMAL, el mismo que nos encontrar el porcentaje para lo cual nos pedir el valor de x, la media y la desviacin estndar. a) El rea que nos pide es de al menos de 180 segundos, esto es:

## Usando los comandos del Spss tenemos:

Obteniendo como resultado un porcentaje del 6.68%. Existe apenas un 7% de probabilidades de que las llamadas duren menos de 180 segundos.

PAG 65

## b) El rea esta entre 180 a 300 segundos, esto es :

Obteniendo como resultado un porcentaje del 86.64%. Existe un porcentaje alto de 87% de que las llamadas duren entre 180 a 300 segundos

c) Restar de 1 del rea entre 180 a 300 segundos del item anterior esto es: 1-0.8664 = 0.1336, luego el nmero de llamadas ser de 133.6; o 134 llamadas.

## d) Calcularemos el rea entre 110 y 180 llamadas.

Al ir a Transform

Compute... tenemos:

## MAT. MAURICIO GARCIA

PAG 66

Obteniendo como resultado un porcentaje del 6.622%. Existe una baja probabilidad del 7% de que las llamadas duren entre 110 y 180. e) Aqu debemos realizar el proceso inverso, esto es dado el rea encontrar el punto, para lo cual iremos a: TransformeCompute y (se utiliza IDF.NORMAL; el mismo que nos permite calcular el punto dado el rea, la media, y desviacin estndar.

luego tenemos: x

z * s x reemplazando nos da x

## 2.33* 40 240 146.8 seg.

EJERCICIOS DE LA DISTRIBUCION NORMAL

10. Se ha determinado que la distribucin de frecuencias de la duracin de la estancia de pacientes amparados por el IESS, es aproximadamente normal, con una media de 8.4 das y una desviacin estndar de 2.6 das. Cul es la probabilidad de que un individuo aleatoriamente seleccionado pase en el hospital: a.- Menos de 7 das; b.- Entre 9.1 y 9.8 das. 11. Los gastos mensuales en alimentacin para familias de cuatro miembros en cierta ciudad es en promedio 420 dlares mensuales con una desviacin de 80 dlares. Determinar: a. Qu porcentaje de estos gastos esta entre 250 y 450 dlares. b. Qu porcentaje de estos gastos es menor de 250 o mayor de 450 dlares. 12. Si un conjunto de calificaciones, de los activos, a las empresas tiene una distribucin aproximadamente normal de 74 (en miles de dlares) y una desviacin estndar de 7.9 ( n miles de dlares). Todas las empresas con activos desde 88 hasta 94 obtuvieron N (No riesgosas) y 8 obtuvieron N, cuntas empresas en total fueron analizadas.

## MAT. MAURICIO GARCIA

PAG 67

Cuando la distribucin binomial toma valores grande n (20,25,30, etc), y cuya probabilidad de acertar en un evento particular, se acerca a 0.5, se puede utilizar a la distribucin normal como una buena aproximacin de la Binomial, se puede observar que presentan un tendencia en forma de campana, como la distribucin normal. Se aplica cuando n*p > 5 y n*(1-p) > 5.

APROXIMACIN DE LA DISTRIBUCIN BINOMIAL A LA NORMAL 13. Un examen de opcin mltiple existen 40 preguntas con cuatro posibles respuestas. Estime la probabilidad de que, al adivinar, el nmero de respuestas sea de cuatro a diez inclusive. 14. En una determinada ciudad, el 45% de las empresas han pagado a tiempo el dcimo tercero. Si de 400 empresas, elegidas al azar, estime la probabilidad de que el al menos 180 hayan pagado a tiempo el dcimo tercero.

15. Un informe indic que dos terceras partes de las empresas tiene su contabilidad atrasada, si se escoge al azar 200 de ellas, a) cuntas empresas se espera que tengan atrasada su contabilidad? b) cul es la desviacin estndar? c) Cul es la probabilidad de que 18 menos tengan su contabilidad atrasada?

EJERCICIOS VARIOS 16. La probabilidad de que un bachiller pase sus exmenes de ingreso es de 0.3. Determinar la probabilidad de que de 6 estudiantes 2 pasen dichos exmenes. 17. Un estudiante que no se ha preparado en absoluto para un examen, ve que este contiene 20 preguntas de verdadero y falso. Decide lanzar al aire una moneda para responder. Anota verdadero si la moneda cae por cara y falso si cae por sello. a. Qu probabilidad hay de que pase el examen si para hacerlo debe contestar correctamente el 70% de las preguntas? b. Qu probabilidad hay de que conteste por lo menos la mitad de las preguntas correctamente? 18. En una zona geogrfica el 15% de los adultos es analfabeto. Dada una muestra aleatoria de 25 adultos de esta rea, cul es la probabilidad de que el nmero de analfabetos sea: c. Exactamente 10 d. Menos de 5 e. Cinco o ms f. Entre 3 y 5 inclusive g. Menos de 7 pero ms de 4?

## MAT. MAURICIO GARCIA

PAG 68

19. Diez por ciento de los contadores tiene hbitos de realizar peridicamente anlisis financieros de la situacin de la empresa. Hallar la probabilidad de que de una muestra de 10 contadores elegidos al azar sean exactamente 2 los que tengan hbitos. 20. En una poblacin de adolescentes, la proporcin de ellos que fuman es del 0.40. Se selecciona una muestra aleatoria de 20 en esa poblacin. Cul es la probabilidad de que el nmero de jvenes que fuman sea: (a) Mayor que 10, (b) Menor que 5, (c) Mayor o igual a 5 y menor o igual a 15? 21. En una ciudad se encontr que el 20% de los hogares estaba asegurado contra incendios. Con objeto de establecer una encuesta en el rea, una compaa de seguros selecciona 5 hogares al azar. Se pide: a. Nmero medio de hogares que se espera estn asegurados b. Probabilidad de que 2 hogares estn asegurados

c. Probabilidad de que al menos 3 estn asegurados d. Probabilidad de que ninguno est asegurado e. Probabilidad de que alguno est asegurado 22. Si la probabilidad de que un individuo reaccione ante un determinado estmulo es 0.001 determinar la probabilidad de que en un total de 2000 individuos reaccionen: a. Exactamente 3 b) Ms de 2 23. Dada la variable aleatoria Z que se distribuye como la distribucin normal estndar, hallar lo siguiente: h. i. j. k. l. m. n. o. p.

P(z 1.63) P(z < 2.02) P(0 z 0.85) P( 2.74 z 0.68) P( 1.87 z 0.45) P(1.92 < z < 3.05) La proporcin de valores z mayores que 1.72 La probabilidad de que z asuma valores entre 1.96 y + 1.96. La probabilidad de que z sacada al azar est entre 1.645 y + 1.645

24. Una empresa ha encontrado que la duracin de sus llamadas telefnicas a larga distancia tiene aproximadamente una distribucin normal, con media de tres minutos y desviacin tpica de un minuto. q. En qu proporcin las llamadas a larga distancia tiene una duracin de ms de un minuto, pero de menos de tres y medio minutos? r. Qu proporcin de llamadas se completan en un dos minutos o menos?

## MAT. MAURICIO GARCIA

PAG 69

s. Una secretaria va a hacer una llamada a larga distancia. cul es la probabilidad de que dura ms de cuatro minutos? 25. Un peridico llev a cabo una encuesta entre 400 personas seleccionadas aleatoriamente sobre el control de armas. De las 400 personas, 220 se pronunciaron a favor de un control estricto, qu tan probable resulta el hecho de tener 220 o ms personas a favor del control de armas, si la poblacin se encuentra dividida en opinin de igual manera?. 26. En una empresa se venden impresoras, y se comportan las ventas como una distribucin normal con media de 50 impresoras al mes y una desviacin estndar de 10. Si estos meses se venden 80 y 75 impresoras, respectivamente. Si estos meses son tpicos qu tan probable es, bajo las suposiciones dadas, vender 80 ms y 75 o ms impresoras? Interprete el resultado. 27. La probabilidad de que un contador maneje antes de dos meses un programa de contabilidad es del 14.5 %, averiguar la probabilidad de que entre 240 contadores, 38 ms maneje un programa de contabilidad

## RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION

1. EN LA DISTRIBUCION BINOMIAL SE NECESITAN TRES PARAMETROS, EN TANTO EN LA HIPERGEOMETRICA CUATRO PARAMETROS. 2. SIMETRICA O CAMPANA DE GAUSS 3. a) 4. a) 5. BINOMIAL 6. POISSON 7. HIPERGEOMETRICA UNIDAD IV

## MAT. MAURICIO GARCIA

PAG 70

IV. DISTRIBUCIONES DE MUESTREO PREGUNTAS DE AUTOEVALUACION 1. El parmetro es una caracterstica de la muestra a) Verdadero b) Falso 2. Ser fcil obtener la desviacin tpica de la poblacin a) Verdadero b) Falso por qu? 3. La media de todas las medias muestrales de una distribucin muestral es llamada . 4. El error muestral es la diferencia entre el estadstico y el parmetro desconocido a) Verdadero b) Falso 5. Definir y poner un ejemplo de distribucin muestral

4.1.

4.2.

Distribucin muestral de la media: Propiedades Error estndar Teorema del lmite central Distribucin de la media: Muestreo de poblaciones finitas, Distribucin de la proporcin

ASESORA DIDCTICA IV A. DISTRIBUCIN DE MUESTREO Bsicamente la Inferencia Estadstica trata de generalizar o inferir los resultados de una muestra hacia la poblacin o de un estadstico para inferir el parmetro dado. Definicin: La distribucin de probabilidad de un estadstico se conoce como distribucin muestral. Se define el error de muestreo como la diferencia existente entre el estadstico de la muestra y el parmetro poblacional, con la finalidad de estimar el parmetro. La distribucin de las medias muestrales no es sino el conjunto de todas las medias muestrales dadas.

Lo mismo podemos definir para el error estndar de la distribucin muestral, que no es otra cosa que el grado de variacin alrededor de la media poblacional. A continuacin se realizar la diferencia de notacin entre los parmetros y los estadsticos. Nombre Media Desviacin Estndar Varianza Tamao Proporcin Diferencia de medias Diferencia de Proporciones Estadsticos( Muestra) x s s2 n p Parmetros (Poblacin)
2

N P
1 2

x1 p1

x2 p2

P1 P2

## MAT. MAURICIO GARCIA

PAG 71

B. TEOREMA DEL LMITE CENTRAL Es uno de los teoremas ms importantes dentro de la Estadstica , este teorema lo que nos indica es que, a medida que el tamao de muestra es grande, la distribucin de medias muestrales se va aproximando a x una curva normal con z
n Teorema. Si X 1 , X 2, ... X n forman una muestra aleatoria que tiene una poblacin infinita con media , la

varianza

entonces z

cuando n

, es la distribucin estndar.

## 30 , sin contar la forma de la poblacin que se

Ejemplos 8. Los depsitos medios en un banco son de \$7012, con una desviacin tpica de \$532, y sigue una distribucin normal. Si se escoge al azar una muestra de 35 depsitos cul es la probabilidad de que la media sea superior a \$6911?

Solucin. De acuerdo a los datos podemos observar que =\$7012; =\$532 y x > \$6911, y cuyo grfico es:

## 1.12 , por lo que tenemos que A(-1.12)=0.1314, es

n 35 decir, existe (1-0.1314) 86.86% de probabilidades de que los depsitos sean superiores a \$6911.

7. Una poblacin normal tiene una media de 180 dlares de ingreso y una desviacin estndar de 36. Se selecciona al azar una muestra aleatoria de 25 personas, calcule la probabilidad de que las medias muestrales sea: a) mayor que 185 b) Menor que 177 c) Entre 175 y 186.

## MAT. MAURICIO GARCIA

PAG 72

8. El nmero medio de refrigeradoras que se venden anualmente, en una ciudad es de 950, con una desviacin estndar de 210. Si se selecciona una muestra de 70 clientes, cul es la probabilidad de que la media est por debajo de 910? 9. Un auditor sobre una poblacin de 1.000 ctas por cobrar adopta 36 de ellas, determinando que el valor promedio de esa ctas por cobrar es de USD \$ 2.600 y = USD \$ 450,00. Cul es la probabilidad de que la muestra sea inferior a USD \$ 2.500?. 10. El gerente de la empresa se encuentra preocupado por la cantidad de montos que adeuda a 236 proveedores sobre los cuales establece un promedio de USD \$22.500 y una desviacin estndar de de USD \$ 4.000. Para el efecto adopta una muestrea de 30 proveedores y se pregunta. t. Qu posibilidad existe de que las deudas sean superiores a USD \$ 30.000? u. Qu posibilidad existe de que las deudas sean inferiores a USD \$ 18.000?. 6. Se conoce que la desviacin tpica al realizar una operacin manufacturera es de 10.2 minutos, con una media de 37.2 minutos. Cul es la probabilidad de que se demore en promedio ms de 35 minutos en las ltimas 32 piezas producidas? . DISTRIBUCIONES MUESTRALES DE PROPORCIONES Tambin se pueden tratar de proporciones o porcentajes de la poblacin P, es decir, se trata de estimar una proporcin muestral p , para estimar un parmetro poblacional P y su expresin viene dada por: p P x , donde p , con x como una caracterstica o particularidad del evento. z n P(1 P) n

Ejemplo 2. Si se sabe que el 32% de las empresas tiene cuentas por cobrar, al escoger 100 empresas, cul es la probabilidad de que ms de 40 tengan cuentas por cobrar? x 40 Solucin: De acuerdo a los datos tenemos: P=32%; n=100 ;, p 0.4 , cuyo grfico es: n 100

utilizando z

1.71 luego A(-1.71) = 0.0436, por tanto existe una P(1 P) 0.32 * (1 0.32) n 100 probabilidad bastante pequea, de apenas el 4.32% de que ms de 40 empresas tengan cuentas por cobrar.

p P

0.4 0.32

## MAT. MAURICIO GARCIA

PAG 73

11. Segn algunos estudios, el 48% de las personas consumen dulces, con mucha frecuencia, si se selecciona al azar a 100 personas a) cul es la probabilidad de que la proporcin muestral sea mayor que 0.6? b) este dentro de un intervalo entre 0.40 y 0.58 12. Una fbrica genera 8% de unidades defectuosas, se compra 200 unidades. Cul es la probabilidad de que sean defectuosas menos de 12%?

## RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION

1. 2. 3. 4. FALSO FALSO LA MEDIA GENERAL VERDADERO

## MAT. MAURICIO GARCIA

PAG 74

FORMA DE EVALUACIN La evaluacin consiste en la entrega de dos deberes al finalizar cada trimestre, los mismos que sern calificados cada uno sobre 20 puntos, y para presentarse al examen, como mnimo entre los dos se deben tener 28/40, adems de la recepcin de dos exmenes, sobre treinta puntos, cada uno . En caso de no alcanzar el puntaje de 32, el estudiante automticamente pierde la materia, si tiene entre 32 a 41 debe presentarse al examen supletorio. Si tiene 42 ms en los dos exmenes automticamente se encuentra exonerado. Para la presentacin de los trabajos que va a resolver, indique el enunciado del problema y el literal a resolver, entregue en forma ordenada y limpio el trabajo, adems debe siempre estar presente la interpretacin de los resultados y sus posibles comparaciones as como la toma de decisin ms correcta. En lo posible, si es del caso realice la comprobacin o verificacin de los mismos. En la resolucin del examen presencial trimestral deben hacerse lo ms claro posible, indicando el ejercicio que est resolviendo, los pasos necesarios para llegar a la respuesta. En la interpretacin del problema, se puede hacer la respuesta con esfero, el resto se puede hacerlo con lpiz, siendo ordenado. Se entregar la resolucin del examen una vez finalizado dicho examen. Cmo estudiar la asignatura? Bsicamente esta asignatura debe ser estudiada con mucho cuidado, ya que tanto las interpretaciones como sus clculos deben ser correctamente realizadas para que no existan falacias ni malas interpretaciones. Se recuerda que para que exista un cierto dominio de la asignatura deben realizarse ejercicios de tal manera que el estudiante tenga habilidades y destrezas que sean desarrolladas exitosamente, de nada sirve aprenderse el sinnmero de frmulas que la materia tiene, si no se las sabe aplicar adecuadamente.

Cmo utilizar la Gua Didctica? Se ha escrito esta gua de tal manera que sea muy fcil de manejarla, pues en primer lugar se encuentran detallados los temas que se deben estudiar en cada captulo, luego se indica el tipo de material bsico a utilizar. Entre ellos tenemos: tipo de calculadora, caractersticas, el libro a utilizar, ventajas pedaggicas, etc. Se indica tambin el tipo de habilidades y destrezas que se manifiesten explcitamente, a travs del desarrollo tanto de los deberes como de los aportes parciales. Se han diseado las asesoras didcticas con la finalidad de mostrar cmo deben ser enfrentados los temas de cada captulo y qu se pretende ensear en cada uno de ellos. Finalmente se indica los nmeros de las los ejercicios que tienen que ser resueltos, con su respectiva pgina del libro texto.

## MAT. MAURICIO GARCIA

PAG 75

Cmo utilizar la Unidad de Estudios? Se debe tener en cuenta las explicaciones que se dan en cada captulo de los temas , cules son los objetivos, qu temas se pretende que los estudiantes se apropien de estos conocimientos. Cmo presentar los trabajos? Los trabajos deben ser presentados, indicando la materia, qu se est presentando con el nombre del estudiante y el nivel en el que se encuentra. Hay que indicar los enunciados (pueden ser escritos o pegados), luego el desarrollo del mismo indicando los pasos que se desarrolla, mostrando el resultado y luego la interpretacin del mismo, que es el aporte ms importante, pero hay que hacerlo sobre todo con una gran claridad, limpieza y orden. Debe ser presentado grapado, en hojas cuadriculadas del mismo tipo. Cmo preparar los exmenes? Desde el principio, con una gran disciplina en el cumplimiento del calendario acadmico, la organizacin semanal es fundamental. Hay que cumplir las tareas que se han impuesto, con la finalidad de que al final de cada aporte se tengan las tareas realizadas y sobre todo hechas por el mismo estudiante, para lo cual se aconseja realizar los trabajos encomendados una vez recibidas las tutoras semanales. En caso de no poder asistir, hay que estudiar el libro gua meticulosamente, y traer las dudas para el prximo encuentro. Una semana antes de cada aporte, se deben traer las dudas que no quedaron claras en los encuentros anteriores o en la realizacin de sus tareas. Hay que manejar con mucha habilidad el uso de la calculadora, como herramienta de trabajo.

PAG 76

APENDICE I

PAG 77

PAG 78

PAG 79

PAG 80

PAG 81

PAG 82

PAG 83

PAG 84

PAG 85

PGINA 86

PGINA 87

PGINA 88

## GUIA METODOLOGICA DE ESTADISTICA DESCRIPTIVA

BIBLIOGRAFIA: Anderson, D.; Sweeney, D; Williams, T. (2.001) Estadstica para Administracin y Economa, Mxico, Thomson, Sptima Edicin. Berenson, M. y Levine, D. (1996) Estadstica Bsica en la Administracin , Mxico, Prentice Hall, Sexta edicin. Webster, A. (2000) Estadstica Aplicada a los negocios y a la Economa, Bogot , Irwin McGraw-Hill, Tercera edicin. Mason, R. y Lind, D. (1998) Estadstica para la Administracin y Economa, Mxico, Alfaomega, Octava edicin. Freund, J. y Walpole, R. (1996) Estadstica Matemtica con Aplicaciones, Mxico, Prentice Hall, Cuarta edicin. Hines,W. y Montgomery, D. (1992) Probabilidad y Estadstica para Ingeniera y Administracin, Mxico, CECSA, Cuarta edicin. Mendenhall, W (1990) Estadstica para Administradores, Mxico, Grupo editorial Iberoamrica. Gujarati, D. (1994) Econometra, Mxico, McGrawHill, Segunda edicin. Hanke, J. y Reitsch, A. (1996) Pronsticos en los Negocios, Mxico, Prentice Hall, Quinta edicin. Manual del paquete estadstico computacional SPSS, versin 6.0 y 8.0 Windows. para

Monzon, D. Introduccin al Diseo de Experimentos, Maracay, Segunda edicin. Salvatore, D. (1984) Econometra, Mxico, McGrawHill. Walpole, R. y Myers, R. (1990) Probabilidad y Estadstica para Ingenieros , Mxico, Interamericana, Tercera edicin.

PGINA 89