Está en la página 1de 69

Pgina 1 de 69

Universidad Nacional Jos Faustino Snchez Carrin


Facultad de Ingeniera Industrial, Sistemas e Informtica

Huacho, setiembre de 2012.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 2 de 69

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 3 de 69

PRESENTACIN

La presente publicacin, contiene material didctico, para el curso de INFERENCIA ESTADSTICA, destinados a los alumnos de la Facultad de Ingeniera Industrial, Sistemas e Informtica de esta Casa de Estudios; desarrollada con el propsito de facilitar material didctico complementario al desarrollo de las clases tericas impartidas en el aula. No pretende sustituir al profesor, ni menos a la abundante bibliografa especializada existente en nuestro medio; quienes estamos inmersos en este proceso, somos conscientes, que los alumnos deben contar con los materiales adecuados como para afrontar exitosamente los retos que la nueva competitividad los exige, en este mundo globalizado, el cual lo ha convertido en una pequea aldea global. No es suficiente con asistir a clases, escuchar y revisar lo transmitido; tambin es necesario contar con las herramientas adecuadas; siendo la Inferencia Estadstica, parte de la matemtica aplicada, los alumnos deben contar con los equipos adecuados, para afrontar los retos de la temtica que el curso exige, por lo menos deben contar con una calculadora cientfica, llevar sus tablas estadsticas, e idealmente una Laptop, y ganas y buena voluntad de aprender; con estos implementos, aunado a la gua proporcionada, los alumnos estarn expeditos como para afrontar retos ms grandes, que en la universidad, por limitaciones de tiempo no se pueden tratar. Esta gua est programado para desarrollarse en una sesin de 14 semanas de clase, teniendo en cuenta que el ciclo acadmico consta de 17 semanas, tres de los cuales son dedicadas a evaluacin; en tal sentido se los ha dividido en seis unidades temticas principales; cada uno de ellos presenta una breve introduccin del temario, con nociones bsicas y ejemplos tipos; tambin los alumnos aprendern a manejar el software estadstico SPPS, sin embargo, ello no desmerece a los otros existentes en el mercado; la razn de su uso, reside simplemente en su disponibilidad.

Moiss E. Armas Profesor del curso.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 4 de 69

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 5 de 69

UNIVERSIDAD NACIONAL JOS FAUSTINO SNCHEZ CARRIN

Facultad de Ingeniera Industrial, Sistemas e Informtica


Escuela Acadmico Profesional de Informtica SLABO
ASIGNATURA: INFERENCIA ESTADSTICA I. DATOS GENERALES 1.1. Cdigo de la Asignatura 1.2. Escuela Acadmico Profesional 1.3. Departamento Acadmico 1.4. Ciclo 1.5. Crditos 1.6. Plan de Estudios 1.7. Condicin 1.8. Horas Semanales 1.9. 1.10. 1.11. Pre-requisito Semestre Acadmico Docente Colegiatura Correo Electrnico

: 33 04 - 303 : Informtica : Ingeniera Industrial :V : 04 : 04 : Obligatorio : T 3 P

: Estadstica y Probabilidades : 2012-II : ARMAS INGA, Moiss Emilio : CIP 19771 : emiarin@gmail.com

II.

SUMILLA (Por Objetivos)


Estimacin de parmetros mediante intervalos. Estimacin de parmetros mediante pruebas de hiptesis.Anlisis de varianza. Anlisis de Regresin.

III.

METODOLOGIA DE ENSEANZA
3.1 Objetivos Al finalizar el dictado del curso, el alumno ser capaz de formular hiptesis de problemas reales, y solucionarlos mediante pruebas estadsticas. 3.2 Estrategias Metodolgicas Se emplea el mtodo expositivo y participativo de los alumnos; para ello se les proporcionar oportunamente los materiales didcticos para ser analizados y discutidos en grupos; de igual manera, los alumnos obligatoriamente debern desarrollar un trabajo de investigacin de campo, motivo por el cual se conformarn grupos de a lo ms de cuatro alumnos, para la consecucin de dichos objetivos; la participacin de los alumnos en las exposiciones y trabajos encargados sern tomados en cuenta para la respectiva evaluacin.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 6 de 69 3.3. Medios y Materiales de enseanza. Pizarra acrlica, tablas estadsticas, Laptop, software estadstico SPSS, proyector multimedia, calculadora y bibliografa complementaria.

IV.

CONTENIDO TEMTICO Y CRONOGRAMA


UNIDAD TEMTICA I. ESTIMACIN DE PARMETROS MEDIANTE INTERVALOS. PRIMERA SEMANA: Estimacin de parmetros. Estimacin puntual. Estimador insesgado. Estimacin de la media y una proporcin poblacional por intervalos Objetivo: El alumno ser capaz de estimar parmetros, puntualmente o por intervalos. SEGUNDA SEMANA: Intervalo de confianza para estimar la diferencia de medias poblacionales, en muestras grandes y pequeas. Intervalos de confianza para la varianza de la poblacin. Determinacin de tamao de una muestra poblacional. Objetivo: El alumno ser capaz de estimar parmetros mediante intervalos de confianza. Actividad: Conformacin de grupos de investigacin, de a lo ms de cuatro alumnos, para desarrollar trabajos de investigacin relacionados con las materias de los cursos enseados, los cuales les sern indicados en clase. UNIDAD TEMTICA II. HIPTESIS ESTADSTICA TERCERA SEMANA: Planteamiento de hiptesis. Hiptesis nula y alternativa. Contraste de hiptesis. Nivel de significancia. Prueba de hiptesis acerca de la media con varianza poblacional conocida. Objetivo: El alumno aprender a formular contraste de hiptesis de situaciones reales, y estimar medias poblacionales mediante estas tcnicas. CUARTA SEMANA: Prueba de hiptesis acerca de la media con varianza poblacional desconocida. Prueba de hiptesis acerca de proporciones. Pruebas de hiptesis acerca de dos medias poblacionales. Objetivo: El alumno estimar de ms de una media poblacional mediante pruebas de hiptesis. Primera Prctica calificada: Tema, lo tratado hasta la tercera semana de clases. QUINTA SEMANA: Prueba de hiptesis para estimar varianzas poblacionales y razn de varianzas. Otras pruebas de hiptesis: Objetivo: El alumno ser capaz de estimar varianzas poblacionales utilizando la prueba del Chi cuadrado. SEXTA SEMANA: Pruebas de contingencia y pruebas de bondad de ajuste. Objetivo: El alumno ser capaz de evaluar la independencia entre dos variables y evaluar una curva de tendencia para distribuciones de frecuencia observadas, mediante la prueba del Chi cuadrado. SPTIMA SEMANA: Introduccin a los diseos experimentales. Elementos que intervienen en un diseo experimental. Ejemplo de modelo matemtico para un diseo experimental

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 7 de 69
Objetivo: El alumno, ser capaz de formular modelos matemticos donde intervienen ms de dos varianzas poblacionales para estimar el comportamiento de sus medias poblacionales. Segunda prctica calificada: Tema, lo tratado entre la cuarta y sexta semana de clases. OCTAVA SEMANA: PRIMER EXAMEN PARCIAL UNIDAD TEMTICA III. ANLISIS DE VARIANZA NOVENA SEMANA: Diseo completamente aleatorizado. Evaluacin mediante el ANVA. Objetivo: Determinar si las medias poblacionales difieren como efecto de los tratamientos. DCIMA SEMANA: Diseo aleatorizado por bloques. Objetivo: Determinar si las medias poblacionales difieren, cuando se eliminar un factor perturbador de un diseo experimental que pueden influir en sus medias poblacionales y evaluarlos mediante el ANVA. DECIMO PRIMERA SEMANA: Comparaciones mltiples. Objetivo: El alumno ser capaz de determinar si una media dada, o grupos de medias, difieren significativamente de la otra media u otras medias, usando la prueba F. DECIMO SEGUNDA SEMANA: Cuadrado latino. Objetivo: El alumno aprender a disminuir los efectos de las fuentes de variacin, de dos factores perturbadores en un diseo experimental. Tercera prctica calificada: Tema, lo tratado entre la novena y dcimo primera semana de clases. UNIDAD TEMTICA IV: ANLISIS DE REGRESIN LINEAL SIMPLE DECIMOTERCERA SEMANA: Nube de puntos. Relaciones causales. Modelo lineal de regresin simple. Deduccin de Ajuste por Mnimos cuadrados. Errores de estimacin. Adecuacin a modelos lineales. Objetivo: El alumno aprender establecer si existen relaciones causales entre dos variables, utilizando el modelo de regresin lineal simple. DCIMO CUARTA SEMANA: Coeficiente de correlacin. Covarianza. Inferencia sobre el modelo de regresin lineal. Adecuacin de otros modelos a modelos lineales. Objetivo: El alumno aprender a validar el ajuste de sus modelos de regresiones. DCIMO QUINTA SEMANA: Intervalos de confianza para E(y/x). Intervalos de prediccin. Coeficiente de determinacin. Objetivo: Evaluar la ecuacin de correlacin y formular otras ecuaciones. Cuarta prctica calificada: Presentacin y exposicin de los trabajos de investigacin a cargo de los grupos conformantes.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 8 de 69
DCIMOSEXTA SEMANA: SEGUNDO EXAMEN PARCIAL

V.

METODOLOGA DE EVALUACIN (de acuerdo al Captulo X del Reglamento)


Criterios a evaluar: Cumplimiento de los exmenes y prcticas programadas, participacin en el desarrollo de las clases y prcticas; presentacin y pulcritud de los trabajos acadmicos encomendadas.

Normas de Evaluacin:

En caso que los alumnos no cumplan con las respectivas evaluaciones programadas sern calificadas con el

calificativo de Cero. Se tomarn dos exmenes parciales EP1 y EP2, siendo el primero cancelatorio. El examen sustitutorio reemplaza a la nota ms baja de cualquiera de stos. Se tomarn cuatro prcticas calificadas P1, P2, P3, P4, cuyo promedio, PP, constituir parte de la nota promocional. La cuarta prctica calificada, P4, consistir en la exposicin del trabajo de investigacin por el grupo conformante, constituidos oportunamente, en el desarrollo de las clases. Los alumnos que tengan nota promocional acumulada, mayor o igual a 07, podrn dar un examen sustitutorio; en este caso, la nota promocional no ser mayor de doce. La nota promocional NP se determinar: NP = 0,35EP1 + 0,35EP2 + 0,30PP, siendo NP ser mayor o igual de 10,5 para aprobar el curso.

VI.

BIBLIOGRAFA BSICA Y COMPLEMENTARIA


Armas M. E. [2012]; Gua de Prcticas de Inferencia Estadstica, UNJFSC. Devore, Jay L. [1998]; Probabilidad y Estadstica para Ingeniera y Ciencias, Ed. Thomson, Mxico. Hines William; Montgomery Douglas .[2002]; Probabilidad y Estadstica para Ingenieros; Ed. CECSA, Mxico. Martnez Bencardino Ciro. [2005]; Estadstica y Muestreo; Ecoe Ediciones Ltda. Colombia. Meyer, Paul; Probabilidad y Aplicaciones Estadsticas. Morris de Groot; Probabilidad y Aplicaciones Estadsticas. Navidi, William . [2006]; Estadstica para Cientficos e Ingenieros; Mc Graw Hill, Mxico. Nieves Hurtado, A., y Domnguez Snchez, Federico G., [2010]; Probabilidad y Estadstica para Ingeniera, Un enfoque moderno; Ed. Mac Graw Hill, Mxico. Sheldon Ross M. [2000]; Probabilidad y Estadstica para Ingenieros; Mc Graw Hill, Mxico. Walpole Ronald E., Myers Raymond H., y Myers Sharon L., [2007]; Probabilidad y Estadstica, Octava Ed., Prentice Hall, Mxico. Weimer, Richard. [2006]; Estadstica, Ed. CECSA, Mxico.

Huacho, setiembre de 2012 Moiss Emilio Armas Inga Docente del curso

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 9 de 69

Trabajo de Investigacin del curso de INFERENCIA ESTADSTICA ciclo 2012-II


Los alumnos del curso de Inferencia Estadstica debern desarrollar un trabajo de investigacin relacionado con la temtica del curso, en grupos conformados a lo ms de cuatro alumnos. La problemtica del problema se plantea a continuacin: En estos ltimos aos, sobre todo en nuestra patria, la tendencia por el uso de los telfonos mviles (celulares) ha tenido un crecimiento exponencial, existiendo prcticamente un celular por persona; sin embargo, tambin se ha observado que estos celulares prcticamente se renuevan en promedio cada tres aos, reemplazndole por nuevos equipos de ltima generacin, como los Iphone, los Smartphone, etc.; entonces se trata de hacer una investigacin en este campo, para poder conocer el comportamiento y actitud de las personas a la adaptacin e importancia de este nuevo equipo en la vida cotidiana de cada una de los usuarios; en este sentido, puntualmente se trata de averiguar: Quines son los usuarios de los celulares? Nmero de celulares con los que cuenta. Empresa a la que pertenece la lnea. A qu grupos de edades pertenecen? Qu gnero? Estado civil? Grado de instruccin? Sistema de pago: Pre pago o post pago. Promedio de gastos mensuales en estos equipos. Cada cunto tiempo renuevan su equipo? Cul es la tendencia hacia las nuevas tecnologas? Iphone, Tablets, Smartphone, etc. Lugar donde residen: Zona residencial, pueblo joven, zona rural, etc.

Para procesar estos datos, los alumnos previamente seleccionarn un tamao muestral, mediante las tcnicas enseadas, motivo por el cual, podrn utilizar, una entrevista, una encuesta, o cualquier otro medio, explicado tambin en clase, de preferencia en los lugares donde residen. Una vez recopilado los datos, el grupo conformante podr abocarse al desarrollo de cualquiera de los temarios: A) Pruebas de Hiptesis para estimar las medias o varianzas poblacionales de los usuarios de los celulares. B) Pruebas de contingencia para establecer una relacin de dependencia o independencia entre dos variables categricas. C) Construccin y validacin de curvas de tendencia del comportamiento de las variables observadas. D) Diseos experimentales, desarrollando ensayos con las muestras.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 10 de 69

A fin de orientarles un diseo de un formulario de encuestas, en el caso de querer desarrollar una encuesta, en el Anexo 1, se muestra un modelo de ello, el cual deber ser tomado como un punto de referencia para sus investigaciones.
El trabajo desarrollado por el grupo deber ser plasmado en un documento monogrfico, escrito en el formato APA, el cual deber ser presentado en documento fsico y documento digital, teniendo en cuenta la siguiente estructura bsica: ASPECTOS GENERALES Cartula del trabajo. Ttulo del trabajo de investigacin, relacionando lo que ha desarrollado, escogido de cualquiera de los temarios: A, B, C o D. Curso, ciclo, ao. Alumnos conformantes. Lugar o zona de estudio. Nombre del docente. Fecha de presentacin. Dedicatoria, agradecimientos, si as lo prefieren ndice Resumen El resumen es un extracto del trabajo escrito a lo ms en 15 lneas, en un solo prrafo 200 palabras. Abstract Es un resumen escrito en ingls. Introduccin En este punto, todo lo que se escribe en el trabajo, en breves palabras se presenta una informacin genrica de la naturaleza del estudio, indicando el problema a resolver y el contenido del trabajo, de modo que al leerlos, el lector, tenga una idea de lo que se va tratar. Captulo I. MARCO CONCEPTUAL En este captulo se exponen las bases conceptuales, de los temas que se van a tratar, exponindole con un enfoque crtico; as por ejemplo, si se va tratar de explicar el comportamiento de las ventas de PC en un determinado centro comercial, deber explicarse qu es una distribucin normal, y cules son sus caractersticas, etc. Captulo II. METODOLOGA DEL TRABAJO En este punto se explica todo el proceso desarrollado para recopilar los datos: Cmo se hizo para obtener los datos? Cmo se seleccion la muestra?
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 11 de 69 Cmo y cundo se seleccion el lugar? Qu problemas existieron para obtener estos datos?, Qu tipo de investigacin se desarroll? Qu tipo de variables se consideraron?, etc.

Captulo III. PROCESAMIENTO Y ANLISIS DE LOS DATOS CAPTURADOS Los datos capturados segn el temario seleccionado, debern ser procesados, explicados, y analizados, con ejemplos reales obtenidos mediante las tcnicas utilizadas; presentar tablas y grficos. Captulo IV. ANLISIS CRTICO DE LOS DATOS PROCESADOS Explicar de una manera general, qu experiencias y conclusiones podran obtenerse, con los datos recopilados y procesados; es decir, a manera de ejemplo, qu podra decir del grupo de personas estudiadas?, qu piensan?, qu perspectivas tienen?, etc. CONCLUSIONES Se presenta una serie de conclusiones, relacionados con todo lo encontrado al momento de desarrollar el trabajo; considerando los problemas que pudieron haberse generado, el conocimiento generado, los conocimientos que podra ampliarse, etc. ANEXOS En todos los trabajos hay una serie de tablas, cuadros, operaciones aritmticas, encuestas, etc., que se desarrollan, que por su naturaleza extensiva y rutinaria, y por elegancia se les incluye al final del trabajo como anexos: Anexo 1 Ttulo .., Anexo 2 Ttulo ... BIBLIOGRAFA Considerar por orden alfabtico la bibliografa consultada, segn el siguiente orden: Apellidos del autor, iniciales de sus nombres, ao de publicacin, ttulo en cursiva, lugar de publicacin y editorial.

OJO! 1. Los avances y coordinaciones de los trabajos preliminares, sern tomados en cuenta para la evaluacin final. 2. Los trabajos desarrollados, sern debidamente sustentados por el grupo participante; la no sustentacin de algunos de los miembros del grupo, invalida su presentacin, no considerndose como presentado al ausente. 3. El trabajo final ser presentado y sustentado por el grupo, en la semana quinceava de iniciado el ciclo, en la hora correspondiente a la hora de prctica; por ningn motivo existir prrroga.
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 12 de 69 4. El desarrollo de este trabajo, est en concordancia a lo estipulado en el slabo.

Huacho, setiembre de 2012

NOTA:
De acuerdo a lo establecido en el estilo de presentacin de trabajos de investigacin, segn el formato APA, bsicamente ste deber tenerse las siguientes caractersticas: Se pueden utilizar las letras Arial, Times New Roman o Courier de tamao 12. Al inicio de cada prrafo deben hacerse sangra de 5 espacios. Los ttulos de los captulos debern estar centrados al inicio de la pgina. Despus del Captulo se escribe el Ttulo centrado y en maysculas y letra de tamao 14 en negrita; luego escribir los sub niveles a tres espacios del Ttulo. Los ttulos deben estar escritos por lo menos en una lnea. Los captulos se numeran en nmeros romanos, como Captulo I. y los subniveles 1.1 1.2 . Y si se desea ms sub niveles de stos: 1.1.1 1.1.2 1.2.1 1.2.2 1.2.3 ..; Captulo II. 2.1 2.2 2.2 .. Los sub niveles se escriben a partir del margen izquierdo, con letra de tamao 12 en negrita, el cual debe terminar en dos puntos, como el siguiente: 1.2. Estudio de la estadstica:, esta modalidad seguir hasta el cuarto nivel, ejemplo: 1.2.1.1. Usos de la estadstica en la ingeniera: los textos se escriben dejando tres espacios antes del subttulo. La compaginacin se hace a partir del captulo uno, escrito en nmeros arbigos y en la parte inferior centrada de la hoja, en papel bond A4. Las pginas preliminares, desde la portada hasta antes del inicio del Captulo I, se escriben en nmeros romanos, tambin en orden consecutivo, en minscula y centrado al pi de la pgina. Las referencias bibliogrficas se enlistan al final del trabajo; en ella se escribe en orden alfabtico el autor o los autores, comenzando por Apellido, iniciales de sus nombres, ao de publicacin, entre parntesis, ttulo de la obra en cursiva, nmero de edicin, ciudad de publicacin y editorial. Si esta referencia ocupa ms de una lnea, la segunda comenzar despus de cinco espacios de la primera. Ejemplo: Becerra, M. E. (2010). Incidencia del consumo de madres gestantes, en el cerebro de los nonatos, Lima, Ed. Los Arboles. Los cuadros o tablas, deben llevar una numeracin correlativa de acuerdo al captulo donde se est tratando el tema, escritos en el mismo tamao de la letra y resaltada en negrita. El ttulo debe reflejar las caractersticas del cuadro o tabla que se desea presentar, y debe tener el mismo acho que la tabla. Debajo de la tabla debe presentarse una nota o referencia que indique la procedencia de los datos, escrito en letra de tamao 10 y en itlica. Los textos de los ttulos de las tablas, deben tener el mismo ancho de la tabla. Ejemplo de presentacin de una tabla o cuadro.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 13 de 69 Tabla 1.1


Ingresos mensuales, en Nuevos Soles, de una muestra de trabajadores de las empresas privadas, de la provincia de Barranca correspondiente a marzo de 2011.

Nivel de ingresos Nmero mensuales trabajadores 600 1000[ 45 1000 1400[ 89 1400 1800[ 149 1800 2200[ 172 2200 2600[ 68 2600 3000[ 31 3000 3400[ 14 3400 3800[ 7

de

Fuente: Datos obtenidos mediante una encuesta desarrollada, por los investigadores en el mes de marzo de 2011.

Los grficos tambin deben tener la misma numeracin correlativa, igual al colocado a las tablas, y debe indicar las caractersticas de la informacin que se quiere mostrar. Esta numeracin se escribe debajo del grfico en itlica y de tamao 10, solo el nombre del grfico, como: Figura 1.1. luego el texto en forma normal y del mismo tamao, y del mismo ancho del cuadro de la figura; este grfico debe tener tambin su fuente o referencia. Ejemplo.
40 40 35 30 25 20 15 10 5 0 MAANA TARDE NOCHE Figura 1.1 Registro de llenado de botellas en miles de unidades/ hora de acuerdo a la procedencia de los equipos, segn turnos de trabajo. Fuente: Tabla 1.1 25 35 32 26 BRASILERO ALEMAN ITALIANO 35 37 31 39

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 14 de 69

I.

ESTIMACIN PUNTUAL Y ESTIMACIN POR INTERVALOS DE CONFIANZA DE LA MEDIA POBLACIONAL

Las poblaciones, por lo general son grandes o muy grandes, por lo tanto trabajar con todos sus elementos resultara contraproducente, penoso, costoso y demorara mucho tiempo en procesar la informacin, aparte de que no tendra significado trabajar con todos ellos; en su lugar se trabaja con sus muestras, seleccionadas teniendo en cuenta que cada elemento de la poblacin tiene la misma posibilidad de ser seleccionada; este elemento muestral, dentro de determinados limitaciones, est representando a la poblacin y con ellos, tranquilamente pueden extraerse conclusiones y tomar decisiones. Los indicadores obtenidos procesando a los elementos muestrales, se llaman estadsticos, y los indicadores de la poblacin, se llaman parmetros; entonces al obtener los estadsticos, se estar en condiciones de estimar los parmetros poblacionales, y como parmetros poblacionales se tienen: la media, la varianza, la desviacin estndar, la proporcin poblacional, en el caso de trabajar con una sola poblacin, sin embargo cuando se trabaja con dos o ms poblaciones, tambin se tienen otros indicadores, como las diferencias de medias poblacionales, las razones de varianza, y los diseos experimentales. Cuando se desea estimar la media poblacional, puede hacerse mediante la estimacin puntual, la estimacin por intervalos de confianza o por prueba de hiptesis.

ESTIMACIN PUNTUAL DE LA MEDIA POBLACIONAL


Este caso es el ms simple procedimiento para estimar la media poblacional; para ello se toma una muestra estadstica, y el valor de esta media estima a la media poblacional; as se puede decir que = .

ESTIMACIN POR INTERVALOS DE LA MEDIA POBLACIONAL


La estimacin puntual no siempre es el mtodo preferido para estimar la media poblacional, porque siempre habr un riesgo de que esta estimacin no cumpla con los objetivos del estudio; por lo general se puede estimar la media poblacional dentro de ciertos rangos; as cuando se quiere conocer los niveles de ingresos medios mensuales de los ingenieros, alguien podra decir que estos estn ganando entre S/ 2000 y S/ 5000, como tambin otro podra manifestar que estos ingresos estn comprendidos entre los S/ 3000 y S/ 4000, y as sucesivamente. Esta forma de hacer estas apreciaciones, se dice estimacin de la media poblacional mediante intervalos de confianza, y para hacerlo se toma una muestra estadstica, suponiendo siempre que las poblaciones se distribuyen normalmente, porque se est dentro de la estadstica paramtrica, se determina su media y considerando ciertas condiciones puede estimar entre qu mrgenes podra estar esa media poblacional; al hacer este trabajo, podra suceder dos situaciones; se conoce la varianza poblacional, y supuestamente se lo conoce. Estimacin de la media poblacional, conocido su varianza.
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 15 de 69 Podra suceder que la poblacin sea infinita o finita; en ambos casos el tratamiento es igual, solo que en el segundo caso habr que tener en cuenta el ajuste por factor poblacional. Considrese el caso de una poblacin infinita con distribucin normal, con varianza 2 conocida, del cual se extrae una muestra aleatoria de tamao n; de esta muestra se determina su media muestral y con esta informacin podra afirmarse que su media poblacional podra estar comprendido dentro de un intervalo definido por [L1, L2]; en trminos de probabilidades, puede afirmarse que existir una probabilidad 1- de que la media poblacional se encuentre dentro de ese intervalo, tal como se muestra en el siguiente:
Intervalo de confianza con 1 -

1/2 /2

L1 x -

L2

x+

Fig. 1.1 Estimacin de la media poblacional mediante un intervalo de confianza Desde el punto de vista de las probabilidades, siempre habr una posibilidad de que la media poblacional estar dentro de los lmites L1 y L2, el cual se lo denota por: P(L1 L2) = 1 - ; de este modo, podra afirmarse que en el peor de los casos esta media estar en L1 y en el mejor de los casos en L2, donde L1 = y L2 = + ; lo normal sera que la media poblacional coincida con la media muestral; la distancia geomtrica de la media muestral a los extremos de los lmites L1 y L2, se conocen como error de estimacin . Al hacer la estimacin por este mtodo, la probabilidad 1 , llamada nivel de confianza, debe prefijarse de antemano y ello determina la probabilidad de que el parmetro est limitado dentro del rea comprendido por estos lmites, siendo la probabilidad de equivocarse al fijar este intervalo. De igual manera tambin se estima previamente, en los casos extremos ser = L1 - = L2 - ; cuanto ms pequeo sea el error de estimacin, mayor ser el tamao de muestra que deber tomarse. Prefijado ya el nivel de confianza, sus extremos crticos sealados por L1 y L2, pueden obtenerse utilizando la tabla de distribucin normal conocidos por zc; el error de estimacin se define en trminos de este valor y la desviacin estndar: = zc*

; de esta expresin podemos concluir, que

cuanto ms grande sea el nivel de confianza, los valores crticos sern mayores en valores absolutos; de igual manera, cuanto ms grande sea el tamao de la muestra, los errores de estimacin sern menores; combinando estas expresiones, podemos obtener un error de estimacin apropiado. Reemplazando estas expresiones en el intervalo de confianza, la media poblacional estar comprendido dentro de los intervalos:

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 16 de 69 : [ zc* , + zc* ] , siendo N el * ].

Cuando la poblacin es finita, deber aplicrsele el ajuste poblacional: tamao de la poblacin del siguiente modo: : [ zc* * , + zc*

Estimacin de la media poblacional, conocido supuestamente su varianza. En este caso, de la poblacin se sigue el mismo procedimiento anterior, pero al no conocer su varianza poblacional, se trabajar con su varianza muestral; sin embargo esta muestra sigue una distribucin t con r = n -1 grados de libertad, donde el error de estimacin poblacin es infinita ser: = tc*

s , si la n

o finita, se hace los mismos ajustes poblacionales que el caso anterior; por lo tc*

tanto la media poblacional estar comprendido: : [ infinitas, y : [ t c*

s , n

+ tc*

s ],para poblaciones n

s * n

+ tc*

s * n

]. Para poblaciones finitas.

EJERCICIOS 1.1. Seale (F) o verdadero (V) para cada una de las siguientes proposiciones: ( ) Un parmetro puede estimarse a base de su poblacin. ( ) La estimacin de una parmetro solo puede hacerse puntualmente. ( ) Una proposicin deja de ser proposicin cuando es falsa. ( ) No es necesario hacer estimaciones para conocer los parmetros poblacionales. ( ) La varianza muestral es un buen estimador del parmetro poblacional. ( ) Cuanto ms grande es el nivel de confianza, mejor es la estimacin del parmetro. ( ) El error de estimacin, depende del nivel de confianza. ( ) Los estadsticos pueden ser estimados. ( ) El promedio de notas de una muestra de alumnos, puede estimar a toda la poblacin. ( ) Para conocer la calidad de servicio de un restaurante debe hacerse una estimacin. 1.2. Indique la alternativa correcta, para cada una de las preguntas: En una estimacin de parmetros debe usar: a) Datos poblacionales. b) Datos muestrales. c) Datos poblacionales o muestrales. d) Solamente datos poblacionales. La estimacin de parmetros puede servir:
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 17 de 69 a) b) c) d) e) Solo para conocer la media muestral. Solo para conocer la varianza. Solo para conocer la media y la varianza. Conocer una medida poblacional. Para conocer sus valores representativos.

Una estimacin de parmetros se hace: a) Solo seleccionado una muestra aleatoria de pequeo tamao. b) Solo seleccionado una muestra aleatoria de tamao grande. c) Solo seleccionando una muestra aleatoria de cualquier tamao. d) No hay necesidad de estimar parmetros. 1.3. Cul es el objeto de hacer estimaciones de parmetros? 1.4. En qu casos se pueden hacer estimaciones puntuales, y qu efecto tendran en los resultados? 1.5. Considere que los alumnos de ingeniera de la Universidad, en estos momentos afrontan grandes problemas econmicos que les dificulta contar con los suficientes recursos financieros como para seguir estudiando dentro de las aulas universitarias, y que por el momento, usted, no cuenta con la informacin exacta como para establecer un indicador, de qu manera lo obtendra, considerando que al presente cuenta con las herramientas adecuadas? 1.6. El promedio de nota de los alumnos de ingeniera se distribuye normalmente con una desviacin estndar de 2,53. Se toma una muestra aleatoria de 12 alumnos, y los resultados de sus respectivos promedios de notas fueron: 13,2, 14,1, 07,8, 10,4, 11,8, 13,3, 06,9, 10,5, 13,2, 12,4, 08,5, y 14,2, respectivamente. a) Estime un intervalo de confianza del 95% para poder apreciar el promedio de notas de todos los alumnos de ingeniera. b) Considere el caso que la poblacin estudiantil est conformado por 456 alumnos; estime un intervalo de confianza del 95% para apreciar el promedio de notas de toda la poblacin estudiantil. 1.7. Se desea estimar el promedio a asistencia a cursos de capacitacin, de los profesionales de ingeniera radicados en la ciudad de Lima, durante el ao 2010; con tal propsito se tom una muestra aleatoria de siete ingenieros que participaron en determinados cursos, y las respuestas que se obtuvieron fueron los siguientes: 2, 3, 0, 2, 5, 4, 1 asistencias a diferentes cursos respectivamente. Se estima que la asistencia a los cursos de capacitacin sigue una distribucin normal. a) Mediante una estimacin puntual, indique, de qu manera se puede estimar el promedio de asistencia a los cursos de capacitacin de los ingenieros de la ciudad de Lima. b) Mediante un intervalo de confianza del 92% y otro, del 95%, estime el promedio de asistencia a los cursos de capacitacin; explique la diferencia de sus resultados con respecto al anterior, y la diferencia entre estos ltimos. c) Considere que la poblacin de ingenieros est conformado por 356 profesionales; resuelva los mismos problemas considerando los tems a) y b). 1.8. Se llev una encuesta para estudiar el grado de conocimiento en el curso de Base de Datos, a una muestra de 34 alumnos estudiantes de ingeniera informtica, de los cuales solo 8 manifestaban saber algo de este tema. Encuentre un intervalo de confianza del 98%, para estimar la poblacin estudiantil, que se supo conocen este tema, y adems explique el error de estimacin que podra cometerse.
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 18 de 69 1.9. Una empresa de material elctrico fabrica bombillas de alumbrado cuyo tiempo de duracin est aproximadamente distribuida de forma normal, con una desviacin estndar de 40 horas. Si una muestra de 51 bombillas tiene una duracin promedio de 780 horas, encuentre un intervalo de confianza de 96% para la media de la poblacin de todas las bombillas que produce esta empresa; adems explique qu tan grande sera el tamao de la muestra, para que el error de estimar la media total, sea menor el error encontrado. 1.10. Una mquina produce piezas metlicas de forma cilndrica; se toma muestra aleatoria de las piezas y los dimetros son: 1,01, 0,98, 1,03, 1,02, 0,98, 0,97, 0,99, 1,04, 0,97 centmetros. Encuentre un intervalo de confianza del 98% para estimar el dimetro medio de las piezas de esta mquina; suponga una distribucin aproximadamente normal. 1.11. El 13% de las motobombas hidrulicas, que una empresa fabrica, tienden a fallar a los dos aos de funcionamiento, por problemas de diseo y componentes en la materia prima al momento de su fabricacin; se toma una muestra aleatoria de 40 piezas de un lote de 500 motobombas. a) Encuentre un intervalo de confianza del 99% para estimar el porcentaje de piezas hidrulicas que podran estar fallando. b) Si el intervalo de confianza estimado para este lote fabricado estuvo dentro de los mrgenes 10% y 16%, con qu nivel de confianza se lo determin? 1.12. A continuacin se tiene el estado nutricional de los alumnos de ingeniera informtica de una universidad. 1. EN ++ 8. N 15. O 22. N 29. EN + 36. EN + 43. EN ++ 2. O 9. EN + 16. EN + 23. EN + 30. O 37. O 44. N 3. EN + 10. EN ++ 17. O 24. EN ++ 31. N 38. EN ++ 45. EN + 4. O 11. N 18. EN ++ 25. EN + 32. O 39. N 46. O 5. EN ++ 12. N 19. O 26. EN + 33. N 40. O 47. EN ++ 6. N 13. EN ++ 20. EN + 27. O 34. EN ++ 41. N 48. EN + 7. O 14. N 21. N 28. O 35. O 42. EN + 49. O Donde: N= normal EN + = Desnutrido en 1er grado. O = obeso EN ++ = Desnutrido en 2do grado. a) Encuentre un intervalo de confianza del 95% para estimar el promedio de desnutridos en primer grado. b) Encuentre un intervalo de confianza del 93% para estimar el promedio de obesos. c) Compare y analice estos dos resultados. 1.13. Una muestra seleccionadas al azar, de 37 transportistas que conducen camiones de carga en el territorio peruano, manifestaron que en promedio sus camiones haban recorrido 17 809 kilmetros en un ao, con una desviacin estndar de 2 354 kilmetros, asumiendo que el kilometraje de los transportistas se distribuye normalmente y el Ministerio de Transportes y Comunicaciones, tiene empadronados a 1 148 transportistas. a) Construya un intervalo de confianza del 99% para estimar el promedio de kilmetros que anualmente recorren los camioneros en todo el Per. b) Qu puede afirmar con una probabilidad de 99% de confianza, acerca del tamao posible del error a cometerse, si se estima que el nmero promedio de camiones manejados por sus respectivos propietarios es de 17 809 kilmetros? 1.14. Los ingresos mensuales de un grupo de ingenieros informticos fueron estimados entre los S/ 2 300 y S/ 3 900; estime la probabilidad con el cual se determin este intervalo, si la muestra
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 19 de 69 tomada fue de 14 ingenieros y stos presentaron una desviacin estndar en sus ingresos de S/ 654. 1.15. De una muestra de 86 familias de un barrio de Lima, se supo que solo el 25% de ellos manifestaron contar con equipos de cmputo dotados de internet; encuentre un intervalo de confianza del 95% para poder estudiar la poblacin total de este barrio compuesto de 1 200 familias, los que cuentan con servicios de internet. 1.16. A fin de conocer el temperamento del electorado peruano, ante el advenimiento de las elecciones municipales de una provincia del Per, se toma una muestra 112 electores, de los cuales 40 dijeron que votaran por el candidato A; encuentre un intervalo de confianza del 96% para conocer la fraccin de electores que apoyan a este candidato. 1.17. Un distribuidor de discos DVD, utiliza un conjunto de pruebas para evaluar la funcin elctrica de su producto; todos los reproductores de DVD, deben pasar las pruebas diseadas para tales fines, antes de ser lanzados al mercado, para su respectiva comercializacin. Se tom una muestra aleatoria de 356 DVD, de los cuales se encontr que ocho fallan en una o ms de las pruebas; encuentre un intervalo de confianza del 99% para determinar la proporcin de reproductores DVD de la poblacin que pasan todas las pruebas. 1.18. Un estudio realizado a 478 clientes que adquirieron equipos de cmputo en la ciudad de Lima, el ao 2011, en relacin al grado de satisfaccin, y el costo de los equipos, mostr los siguientes resultados: Grado de satisfaccin de acuerdo al costo de los equipos de cmputo, de una muestra de clientes, en la ciudad de en el ao. Costo de los equipos Grado satisfaccin Satisfecho Insatisfecho Total de Costoso N 223 107 % N Econmico % Total 255

a) Complete las celdas vacas de esta tabla. b) Encuentre un intervalo de confianza del 98%, para estimar el porcentaje de clientes que consideran econmico los equipos. c) Determine un intervalo de confianza del 90%, para estimar el porcentaje de clientes insatisfechos con el servicio. d) Determine un intervalo de confianza del 95% para estimar la diferencia entre clientes satisfecho e insatisfecho, respecto al costo de los equipos, considerando un margen de error de estimacin en 3%. e) Si el intervalo de confianza de clientes que consideraron costoso e insatisfechos con estos equipos fue determinado entre el 60,00 y 70,00%, determine el error con el cual se lo estim, y la probabilidad de que ese evento haya ocurrido. f) De qu tamao deber tomarse una muestra poblacional para estudiar el grado de clientes satisfechos con la compra de estos equipos, asumiendo un nivel de confianza del 95% y un margen de error del 4%?
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 20 de 69 1.19. A continuacin se presentan los resultados de una muestra de un grupo de vendedores que laboran dentro de un centro comercial, donde se ofrecen y venden equipos y servicios de cmputo; los resultados presentan la respectiva actitud de los vendedores ante el pblico, al momento de atender a los clientes, bajo sus requerimientos: Nivel de estrs y afn de servicios de una muestra de empleados de un centro comercial.. Empleado Nivel de estrs Afn de Servicio 1 1 2 2 2 1 3 2 1 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Donde: Estrs: 1 = Alta 2 = Normal 1 2 1 2 1 1 1 2 1 2 2 2 1 2 1 2 2 1 2 1 1 Afn de Servicio: 2 1 2 1 1 2 2 1 1 2 1 2 1 1 2 1 1 2 1 2 1 1 = Buena 2 = Poca

a) Estime un intervalo de confianza del 92% para conocer el grado de estrs Alta de los empleados. b) Determine el intervalo de confianza del 95% para conocer que los empleados muestran un buen afn de servicio. c) Determine el error absoluto al estimar con un intervalo de confianza del 96%, el grado de estrs normal de los empleados.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 21 de 69

II. TAMAO DE MUESTRA, ESTIMACIN DE LA VARIANZA POBLACIONAL Y RAZONES DE VARIANZA POR INTERVALOS DE CONFIANZA

El tamao de muestra que debe seleccionarse de una poblacin, est asociado a un margen de error con el que se los deseara estimar, as como un cierto nivel de confianza; es evidente que cuanto ms grande sea el tamao de la muestra, mayor ser la seguridad de que los resultados muestrales reflejan las caractersticas poblacionales; sin embargo tambin es preciso indicar, que cuanto ms grande sea este tamao, los problemas de trabajar con stas sern ms complicadas, ya que demandarn tiempo y esfuerzo para estudiarlo, todo lo cual podra atentar contra la economa de los interesados en la investigacin. En Estadstica no es necesario trabajar con toda la poblacin; basta con seleccionar su muestra representativa, y con los resultados de sta, inferir para toda la poblacin, el problema es determinar de qu tamao debera seleccionarse la muestra, para estar realmente seguros de que ste tamao representar efectivamente a la poblacin. El tamao de muestra se puede seleccionar de una poblacin infinita o de una poblacin finita, para ello se sigue los siguientes procedimientos: a) Seleccionar una muestra aleatoria de cualquier tamao, y determinar su varianza. b) Estimar con qu margen de error deber estimarse la media poblacional. c) Estimar con qu nivel de confianza 1 - deber estimarse tambin la media poblacional. d) Relacionar los siguientes casos: i) Si la poblacin es infinita: = zc*

s , donde zc se obtiene n
, el

de acuerdo al nivel de confianza estimado, s es la desviacin estndar de la muestra y margen de error estimado; ii) Si la poblacin es finita, entonces = zc*

s * n

, en ambos

casos, solo es cuestin de despejar n, lo cual proporcionar el tamao de muestra que deber seleccionarse para estudiar las caractersticas de la poblacin.

Estimacin de la proporcin poblacional, mediante intervalos de confianza La estimacin de este parmetro sigue los mismos procedimientos que el caso anterior, siendo en ese caso = , donde p = es la proporcin poblacional, q su complemento y
= zc*

Estimacin de la diferencia de dos medias poblacionales mediante intervalos de confianza Cuando se est interesado en estimar las diferencias de dos medias poblaciones que se distribuyen normalmente, mediante intervalos de confianza, podra suceder que se conocen sus respectivas varianzas poblacionales, o supuestamente se los conoce.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 22 de 69 a) Estimacin de la diferencia de dos medias poblacionales mediante intervalos de confianza, cuando se conocen sus varianzas poblacionales Para estimar mediante intervalos de confianza, con un nivel de confianza 1 la diferencia de dos medias poblaciones (1 - 2), cuando sus respectivas varianzas poblacionales son conocidas , se extraen dos muestras de tamaos n1 y n2, respectivamente de cada poblacin; la diferencia (1 - 2) estar comprendido dentro del intervalo: [ ], siendo el error estndar de la diferencia de estas dos medias, equivalente a:

b) Estimacin de la diferencia de dos medias poblacionales mediante intervalos de confianza, cuando supuestamente se conocen sus varianzas poblacionales Cuando supuestamente se conocen sus varianzas poblacionales, se extraen dos muestras de cada poblacin de tamaos n1 y n2, luego se calculan sus respectivas varianzas muestrales s12 y s22; la diferencia de estas medias muestrales siguen una distribucin t, con r = n1 + n2 2 g.l; la estimacin de la diferencia de sus medias poblacionales, mediante intervalos de confianza se encontrar dentro del intervalo: (1 - 2) [ ], donde , y s02( ) define el promedio de la diferencia de la varianza

de sus medias muestrales.

Estimacin de la varianza poblacional mediante intervalos de confianza Para hacer esta estimacin se utiliza la distribucin chi cuadrado. Si de una poblacin que sigue una distribucin normal se extrae una muestra de tamao n y se obtiene su varianza s 2, entonces el estadstico
2

sigue una distribucin chi cuadrado con r = n 1 g.l.; con esta referencia puede

estimarse su varianza poblacional 2 con un nivel de confianza 1 ; una idea de la forma de estimarlo se obtiene con la ayuda de un grfico de la curva de distribucin de la chi, como lo mostrado:

1-

x2 1

x2

x2 2

Fig. 2.1 Estimacin de la varianza poblacional mediante un intervalo de confianza

x2 x2 x2 1 2 El chi cuadrado poblacional estar dentro de los intervalos para un nivel de confianza 1 y un tamao de muestra n; de acuerdo a esto se obtiene los coeficientes crticos del
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 23 de 69 chic cuadrado, haciendo uso de la respectiva tabla, donde 12(/2;n-1) y 22(1-/2; n-1), y 2= (n 1)s2/ 2 , utilizando estas expresiones en la relacin de desigualdad de estimacin del intervalo se obtiene los lmites donde podrn estar estimado la varianza poblacional. Estimacin de la razn de dos varianzas poblacionales mediante intervalos de confianza Tambin se puede estimar las razones de variacin de dos poblaciones que se distribuyen normalmente, dentro de un intervalo de confianza 1 ; para ello se extraen sus respectivas muestras de tamaos n1 y n2 respectivamente; de igual modo, se calculan sus respectivas varianzas muestrales s12 y s22, donde s12 > s22. El estadstico F = sigue una distribucin F con r1 = n1 -1 y r2

= n2-1 grados de libertad, respectivamente. De acuerdo al nivel de confianza 1 , de la tabla F, se determina sus valores crticos F1 y F2, y haciendo la respectiva deduccin de F, se podr estimar la razn confianza, la siguiente figura muestra el criterio de estimacin. dentro del intervalo de

1-

F1

F2

Fig. 2.2 Estimacin de la razn de dos varianzas poblacionales mediante intervalos de confianza

EJERCICIOS
2.1. Una muestra de 12 pacientes que acudieron a un hospital, a fin de medir sus niveles de colesterol en la sangre, mostr los siguientes resultados: 165, 200, 265, 240, 178, 201, 198, 179, 258, 216, 220 y 232, respectivamente. a) Si el hospital en promedio recibe mensualmente 932 pacientes para hacerse estos anlisis, de qu tamao deber tomarse la muestra a fin de estimar el nivel promedio de colesterol en la sangre de esta poblacin? b) Determine un intervalo de confianza del 95% para estimar el promedio de niveles de colesterol en la sangre de estos pacientes. c) Si el error de estimacin en los niveles de colesterol, de estos pacientes, se determin con un margen de 15, con qu nivel de confianza fue hecho esta estimacin? d) Si el error de estimacin de los niveles de colesterol, de estos pacientes, se determin con un margen de 10, y un nivel de confianza del 90%, de qu tamao se determin la muestra de esta poblacin?
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 24 de 69 e) Si solamente el 33% de estos pacientes muestran niveles normales de colesterol, estime un intervalo de confianza del 95%, para conocer el comportamiento poblacional, asumiendo que se cometa un margen de error de no ms del 4%. f) Determine un intervalo de confianza del 95% para conocer la variacin de los niveles de colesterol de los pacientes de este hospital. 2.2. Se quiere estudiar el grado de estrs que afrontan los alumnos de ingeniera, por la intensidad de los estudios; para tales fines se toma una muestra aleatoria de un grupo de estudiantes, y se encuentra que el estado emocional de estos eran: E+, E++, N, E++, E++, E+, N, E++, N, E+, E+; donde E+ = estrs moderado, E++ = estrs alto, N = Normal. a) De qu tamao deber tomarse una muestra de alumnos, para estimar el grado de estrs alto de la poblacin estudiantil, compuesto de 320 alumnos, si el nivel de confianza debe ser del 95% y un margen de error de a lo ms 4%? (204) b) Si solo se estara interesado en conocer a aquellos que tienen estrs moderado, de qu tamao debera tomarse la muestra, asumiendo las mismas caractersticas del problema anterior. (209) 2.3. Ante el advenimiento de las prximas elecciones generales, a fin de elegir al nuevo presidente de la repblica, entre dos candidatos A y B, se desea evaluar la intencin de votos a favor del candidato A, en la provincia de Huaral; para tales fines, no contando con ninguna informacin al respecto, se toma una muestra aleatoria de 15 ciudadanos de esta provincia, encontrndose como respuesta, que seis de ellos manifestaban que iban a votar por este candidato. a) Si la poblacin de electores est conformada por 8 500 personas, de qu tamao deber tomarse una muestra?, a fin de estimar el comportamiento poblacional, por este candidato, asumiendo que el nivel de confianza sea del 93%, y el margen de error de estimacin sea a lo ms de: i) 7%, ii) 4%, iii) 2%. ( i - 161; ii- 492; iii-1966) b) Resuelva el mismo problema asumiendo que la poblacin estudiada est conformada por 1 200 ciudadanos. (142) c) Analice los resultados obtenidos en cada caso. 2.4. En la facultad de ingeniera industrial de la UNI, la muestra de un grupo de alumnos, mostr el siguiente rcord acadmico, por cada uno de ellos: 12,1, 13,2, 10,6, 09,8, 10,5, 11,1, 12,2 y 10,8; en tanto, en la UNMSM, otro grupo de alumnos de la misma facultad, mostr los siguientes promedios: 13,2, 14,1, 09,5, 10,3, 11,4, 12,1, 08,6, 09,9, 12,7 y 12,4. Asumiendo que la distribucin de notas sigue una distribucin normal, determine: a) Un intervalo de confianza del 95% para estimar el promedio de las diferencias de notas de los San Marcos y los de la UNI. -1,4; 1,7 b) Un intervalo de confianza del 95% para estimar la variacin de notas de los alumnos de la UNI. 0,74; 2,27 c) Un intervalo de confianza del 95% para estimar la variacin de notas de los de San Macos. 1,28; 3,26 d) Un intervalo de confianza del 95% para estimar la razn de variacin de notas de estas poblaciones estudiantiles. 0,53; 0,61 2.5. En una investigacin desarrollada para conocer los efectos de trabajos prolongados, en los niveles de triglicridos, en la sangre de los ingenieros informticos, entre quienes practicaban deportes y tambin entre quienes no los practicaban, mostr los siguientes resultados:
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 25 de 69 Tabla Niveles de triglicridos en la sangre de los ingenieros informticos al desarrollar trabajados prologados entre deportistas y no deportistas Deportes n Promedio Desviacin estndar Hacen deporte 14 152 27,3 No hacen deporte 15 208 22,1 Se considera que las poblaciones siguen distribuciones normales y que ambas varianzas son supuestamente conocidas; por lo tanto, se pretende estimar la diferencia entre las medias de los niveles de triglicridos, entre las dos poblaciones, as como la variacin de cambio de estos niveles, siendo el nivel de confianza del 95%. 2.6. El promedio general de calificaciones de una muestra de ocho estudiantes en edad escolar fue de 12 con una desviacin estndar 2,4. a) Si se desea estimar el promedio general de la poblacin estudiantil con una error de ms o menos 0,5 puntos, de qu nmero de estudiantes averiguarse sus notas, si nivel de confianza debe ser del 95%? R:89 b) Si la poblacin estudiantil estuvo conformada por 523 alumnos, de qu tamao se determin su muestra, sabiendo que el promedio general de notas estimado estuvo comprendido entre 11 y 13. 2.7. De diez libros tomadas al azar, publicadas por la Editorial Las Amricas, dos de ellos presentaban fallas de compaginacin. a) Cuntos libros de esta editorial debern revisarse para reducir el nivel de error de medida a un 50%, con un nivel de confianza del 99%? R: 2 663 b) Determine un intervalo de confianza del 99%, si se espera que el margen de error en la compaginacin de los libros no debe ser mayor del 5%. 2.8. Una mquina envasadora que llena lubricantes debe hacerlo en volmenes de 10 centmetros cbicos (cc), de otro modo deber detenerse el proceso productivo a fin de hacer los respectivos ajustes a los sifones de llenado. Para averiguar si este proceso se viene desarrollando de acuerdo a las expectativas, se toman muestras al azar de diez envases llenados, y se procede a medirlos; los resultados de estas medidas fueron: 10, 12, 8, 9, 9, 10, 11, 9, 8 y 12 cc. a) Determine el error estndar de la medida de esta muestra. b) De qu tamao deber ser la nueva muestra, si es que el error estndar de la media muestral desea reducirse a la mitad? c) Determine un intervalo de confianza del 99% para estimar el promedio de llenado de la mquina envasadora. d) Determine un intervalo de confianza del 99% para estimar las variaciones de cambio de estos llenados. 2.9. Una muestra de quince clientes que acudan a un cajero automtico de un banco, indic que en promedio tardaban 2,36 minutos en hacer sus transacciones; si el tiempo de demora en estos servicios se distribuye normalmente con una desviacin estndar de 0,48 minutos. a) Determine el error estndar de la media muestral. b) Determine un intervalo de confianza del 94% para estimar el tiempo promedio de demora de los clientes en este cajero. c) Explique el error de estimacin. 2.10. Un negocio dedicado a la venta de equipos electrodomsticos, ha implementado un sistema de ventas al crdito, mediante el uso de tarjetas de crdito; sin embargo pasado un determinado tiempo el Gerente de Ventas reporta que este sistema no funciona en la medida esperada, dado que existe un alto porcentaje de morosidad de los clientes, por lo que la empresa duplicar
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 26 de 69 esfuerzos en el cobro de los adeudos. El Gerente toma una muestra de 80 clientes que hacen uso de esta modalidad de compras y encuentra a 50 morosos, a los que debern aplicar los cargos por mora: a) Determine un intervalo de confianza del 95% para estimar la verdadera proporcin de clientes que utilizan este sistema de ventas, de los cuales se considera que debern estar incurriendo en morosidad. b) De qu tamao deber tomarse una nueva muestra, si se considera que el intervalo de estimacin de la media poblacional sea calculado con un nivel de confianza del 97%, con un margen de error no mayor del 4%. 2.11. Un sistema artesanal de elaboracin de vasos de cristal indic que una muestra de 13 vasos est logrando que tengan un volumen de 22 cm3. Encuentre un intervalo de confianza para estimar la desviacin estndar de su poblacin: i) Al 91% de confianza. ii) Al 93% de confianza. iii) Al 98% de confianza. 2.12. El 18% de una muestra de 16 alumnos de Bromatologa se encuentran desnutridos, en tanto que el 25% de una muestra de diez alumnos de Informtica se encuentran, en las mismas condiciones. Encuentre un intervalo de confianza del 95%, para estimar la razn de variacin de estos grados nutricionales, entre ambos grupos de alumnos. R:[0,41; 4,70] 2.13. De la Facultad de Medicina de la Universidad, compuesto por 468 alumnos, se selecciona al azar una muestra de nueve de ellos, de los cuales se obtuvieron sus notas promocionales, durante el pasado ciclo 2011-II, stas notas fueron: 14,2 13,8 12,5 14,2 10,9 13,2 12,6 12,2 y 12,7, respectivamente. a) Si el promedio de notas de los alumnos de esta Facultad, fue estimado entre 11,92 y 13,92, con qu nivel de confianza fue estimado? b) De qu tamao deber tomarse una muestra de alumnos, si el error de estimacin del promedio de notas de stos alumnos, no sea mayor de 0,8 puntos, a un nivel de confianza del 95%? R) a) 1- = 98%, b) n > 151 alumnos 2.14. A continuacin se presenta el estado nutricional de una muestra de los alumnos de ingeniera informtica de una universidad. 1. EN ++ 8. N 15. O 22. N 29. EN + 36. EN + 43. EN ++ 2. O 9. EN + 16. EN + 23. EN + 30. O 37. O 44. N 3. EN + 10. EN ++ 17. O 24. EN ++ 31. N 38. EN ++ 45. EN + 4. O 11. N 18. EN ++ 25. EN + 32. O 39. N 46. O 5. EN ++ 12. N 19. O 26. EN + 33. N 40. O 47. EN ++ 6. N 13. EN ++ 20. EN + 27. O 34. EN ++ 41. N 48. EN + 7. O 14. N 21. N 28. O 35. O 42. EN + 49. O Donde: N= normal EN + = Desnutrido en 1er grado. O = obeso EN ++ = Desnutrido en 2do grado. a) Encuentre un intervalo de confianza del 95% para estimar la diferencia del promedio desnutridos en primer grado, con los desnutridos del segundo grado. b) Encuentre un intervalo de confianza del 93% para estimar la diferencia del promedio obesos y los desnutridos. c) Encuentre un intervalo de confianza del 95% para estimar los niveles de variacin de alumnos normales. d) Encuentre un intervalo de confianza del 95% para estimar la razn de variacin de desnutridos y los no desnutridos. e) Analice e interprete sus resultados.
Inferencia Estadstica Ciclo 2012-II

de de los los

Moiss E. Armas

Pgina 27 de 69

III.

ESTIMACIN DE PARMETROS POBLACIONALES MEDIANTE PRUEBA DE HIPTESIS

HIPTESIS
Una hiptesis es solo una conjetura o suposicin de un hecho que podra suceder o haya sucedido, pero que an no ha sido demostrado; as por ejemplo, si un empresario estara deseoso de incursionar en el mercado de la provincia de Huaura, para ello, segn sus asesores en marketing les aseguraron que incursionando en ste mercado, sus utilidades financieras sera altas; en este caso, como puede apreciarse, solo existe una suposicin de que efectivamente habrn ganancias, y basado en esto decide incursionar en este mercado; sin embargo, existir cierta duda de que realmente eso no ocurriese; qu sucedera si luego de haber realizado las inversiones no logra obtener los resultados esperados?, tambin podra suceder que los pronsticos se cumplieron tal como lo aseguraban sus asesores de marketing. Como podr apreciarse, en una hiptesis, solo se conjetura, y producto de los hechos o la evidencia, esa conjetura podra ser cierta o falsa, ante esta situacin, los responsables de la toma de decisiones debern decidir qu acciones se tomarn ante esta conjetura; la decisin tomada podra conducir a cuatro resultados posibles: i) Haber aceptado una conjetura cierta, ii) Haber rechazado una conjetura cierta, iii) Haber aceptado una conjetura falsa, y iv) Haber rechazado una conjetura falsa; es evidente que en estas cuatro alternativas, solo las decisiones i) y iv) son las correctas, en cambio la ii) y la iii) son decisiones incorrectas, y podra traer graves consecuencias para quienes tomaron esas decisiones equivocadas.

CONTRASTE DE HIPTESIS
En estadstica cuando se trabaja con hiptesis, se formulan dos hiptesis, una hiptesis nula H0 y una hiptesis alternativa H1; la H0 solo se lo formula con el nico propsito de negar lo que se quiere demostrar, y la H1 es la hiptesis que se quiere demostrar o conocido tambin como la hiptesis de investigacin. El objetivo del contraste de hiptesis es rechazar la H0, ya que rechazndole, se estar aceptando la H1, con lo cual se confirmara lo que se quera demostrar; sin embargo surgir los problemas planteados en el caso anterior, de tomar decisiones incorrectas.

TIPOS DE ERRORES EN UN CONTRASTE DE HIPTESIS


Se comete Error Tipo I, cuando se rechaza una conjetura cierta y se comete Error Tipo II, cuando se acepta una conjetura falsa, como se est en el hecho de conjeturaciones, siempre existir una probabilidad de cometer Error de Tipo I, a esa probabilidad se le llama nivel de significancia y se le denota por ; al hacer contraste de hiptesis, este nivel de significancia se predetermina de antemano; por lo general = 5%, cuando se hace contraste de hiptesis relacionados con conductas humanas y biolgicas, y = 1%, cuando los estudios estn relacionados con las ciencias fsicas y
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 28 de 69 qumicas, sin embargo, esto es solo una medida referencial, puesto que estos niveles pueden tener otros valores. A la probabilidad de cometer Error de Tipo II, se le conoce por , y su valor est asociado al Error Tipo I. Si se quisiera reducir estos errores, habra que aumentar el tamao de la muestra, ya que cuanto ms grande sea esta, menores habrn menores riesgos de equivocacin, sin embargo, por lo que se manifestado, no es posible ni conveniente trabajar con muestras grandes, para estudiar conductas poblacionales.

TIPOS DE CONTRASTE DE HIPTESIS


Los contrastes de hiptesis pueden hacerse para demostrar que hay mejora, que hay reduccin o simplemente no hay ninguna variacin, en las observaciones o experimentaciones; en los dos primeros casos, se dice que el contraste es unilateral o de una sola cola, y en el segundo caso es bilateral o de dos colas. Al hacer el contraste de hiptesis, por lo general se comienza formulndole en trminos cualitativos, posteriormente se lo expresa en trminos cuantitativos, que es lo que al final sirve para propsitos de clculo. El siguiente ejemplo ilustra el caso de formularse un contraste de hiptesis: En un centro educativo se ha observado que los alumnos presentan fuertes grados de desnutricin; la direccin de servicio social, sugiere que a los alumnos se les proporcione cierta dosis de dietas alimenticias a fin de mejorar estos niveles actuales; la direccin general, sugiere que estas dietas no sern efectivas, por lo tanto no es conveniente seguir con los consejos de servicio social. El contraste de hiptesis ser en los trminos siguientes: H0: La dieta alimenticia, propuesto por servicio social, no mejorar los niveles nutricionales de los alumnos del centro educativo. H1: La dieta alimenticia, propuesto por servicio social, si mejorar los niveles nutricionales de los alumnos del centro educativo. Como podr observarse, este contraste de hiptesis es de tipo unilateral, en el sentido de que se busca mejorar el estado nutricional de los alumnos; la hiptesis nula formulada, se lo hizo solo con el propsito de negar lo que se desea demostrar, es decir, mejorar el estado nutricional de los alumnos; la hiptesis alternativa, tratar de demostrar que efectivamente habr mejora proporcionando la dieta alimenticia propuesto por servicio social; el objetivo de esta investigacin, ser rechazar la hiptesis nula, para aceptar la hiptesis alternativa; expresndole en trminos cuantitativos esta hiptesis puede expresarse del siguiente modo: El estado nutricional actual de los alumnos es de un valor a, proporcionndole la dieta alimenticia, el nuevo estado nutricional ser mayor de este valor, o sea: H0: = a H1: > a La hiptesis nula, siempre se lo formula en trminos de menor o igual , igual , o mayor o igual , y la hiptesis alternativa, en trminos opuestos a la nula; es decir mayor que , diferente a , o menor que.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 29 de 69

PROBLEMA TIPO
Se est interesado en implementar un nuevo tipo de tratamiento teraputico, que resulta costoso, pero se piensa que ser efectivo para rehabilitar a las personas que habitualmente fuman cigarrillos, ya que se ha demostrado que el cigarro es una fuente primaria del incremento de los casos de cncer. Formule un contraste de hiptesis, explicando los tipos de errores que podran cometerse al tomar la respectiva decisin, y cul de ellas sera la ms grave. H0: El tratamiento teraputico no permitir rehabilitar a los pacientes fumadores de cigarrillos, por lo que no vale la pena hacer gastos en costosos equipos. H1: El tratamiento teraputico permitir rehabilitar a los pacientes fumadores de cigarrillos, no interesando su alto costo, ya que este consumo, es la causa principal de los casos de cncer. Error Tipo I. Rechazar la hiptesis nula cuando es cierta; se estar aceptando que el tratamiento teraputico ser beneficioso, cuando en realidad no lo es as, haciendo gastos innecesarios, en la creencia de que los ndices de cncer se controlarn. Error Tipo II. Aceptar la hiptesis nula cuando es falsa; es decir que este tratamiento no permitir rehabilitar a las personas que fuman cigarrillos, dejando de hacer gastos excesivos en su tratamiento, con la posibilidad de que mueran ms personas por causas del cncer, solo por querer evitar gastos. A la luz de estos dos contrastes, resulta que la decisin ms peligrosa sera el cometer Error Tipo II, ya que por querer ahorrar, se estara condenando a la muerte a las personas, al decidir no hacer dicho tratamiento.

EJERCICIOS
3.1. Considere que en las actuales circunstancias, la seleccin peruana de ftbol se clasificar para el mundial del 2014, a desarrollarse en Brasil; formule un contraste de hiptesis, indicando las decisiones que podran tomarse, y los posibles errores por las que sucedera, y qu consecuencias acarreara el decidir por una de ellas. 3.2. Con los acontecimientos polticos del pas, la opinin pblica ha quedado conmocionado por el supuesto caso de trfico de influencias cometido por el ex Segundo Vicepresidente de la Repblica, Omar Chehade, a favor del Grupo Wong, en el sentido de que este grupo estara aprovechndose de la situacin para obtener favores y con el apoyo de la polica, desalojar la actual administracin a cargo de los trabajadores de Andahuasi, situacin actual que estara colisionando con las normas legales y dejando mal parado a la actual administracin de la presidencia de la repblica, ya que el Presidente pregona por todos los lados, la lucha contra la corrupcin e impunidad. a) Formule un contraste de hiptesis para este caso, indicando cualitativamente la hiptesis de investigacin y la hiptesis nula. b) Indique los tipos de errores a cometerse, y seale cul de ellos sera el ms grave, al optar por una de ellas
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 30 de 69 3.3. Suponga que un investigador desea probar la hiptesis de que a lo ms el 65% de los huachanos es alrgico a la leche fresca; explique cmo el investigador podra cometer: c) Error de tipo I. d) Error de tipo II. 3.4. Un socilogo se interesa en la eficacia de un curso de entrenamiento diseado para lograr que ms personas se interesen por la limpieza de su ciudad, dado que se observa en demasa, que hoy en da las ciudades lucen atiborradas de suciedad por doquier, producto del descuido y decida de sus habitantes; formule un contraste de hiptesis y responda: d) Qu hiptesis prueba si comete Error Tipo I? e) Qu hiptesis prueba si comete Error Tipo II? f) Cul de estos dos errores sera el ms grave al tomar una decisin? 3.5. Una empresa es acusada de discriminar en la contratacin de sus profesionales. a) Si el Juez comete Error de Tipo I, qu tipo de hiptesis est aceptando? b) Si el Juez comete Error Tipo II, qu hiptesis est probando? 3.6. Un experto en ingeniera informtica recomienda a una empresa implementar un DATA MART de sistema de ventas, dado que considera que ste le permitir mejorar su sistema de administracin y procesamiento de datos, producindole a la larga beneficios econmicos; los administradores de la empresa son escpticos a esta propuesta, dado que consideran que no requieren de sistemas complejos y costosos, como para seguir obteniendo beneficios, por lo tanto, el pedido del experto, no es viable por el momento. Formule su contraste de hiptesis, y seale los tipos de errores que podran optarse por cualquiera de estas decisiones, indicado cul de ellos sera de consecuencias ms negativas.
R H0: La implementacin del DATA MART, en la empresa no reviste importancia, dado que la gestin administrativa actual marcha por buenas condiciones, y ste nuevo es complejo y costoso. H1: La implementacin de un DATA MART, ser beneficioso para la empresa, ya que le permitir mejorar la gestin administrativa, producindole a la larga beneficios econmicos. Error Tipo I. Creer que la implementacin del DATA MART, ser beneficioso para la empresa, cuando en realidad no lo ser; solo le ocasionar complejidades y mayores costos. Error Tipo II. Creer que el DATA MART, no mejorar la gestin administrativa, por lo tanto, perdindose la oportunidad de mejorar la economa de la empresa. Error ms grave: Perder la oportunidad de mejorar la gestin administrativa de la empresa, por no implementar un DATA MART.

3.7. Un fabricante desarrolla un nuevo sedal para pesca que, segn afirma tiene una resistencia media a la rotura de 15 kg con una desviacin estndar de 1,5 kg. Para probar la hiptesis de = 15 kg contra la alternativa de que < 15 kg, se prueba una muestra aleatoria de 50 sedales; la regin crtica se define cuando el promedio muestral es menor de 14,4 kg. Encuentre la probabilidad de cometer Error de Tipo I. 3.8. En un restaurante, una mquina de bebidas gaseosas se ajusta de manera que la cantidad de bebida que sirva por botella, se distribuir aproximadamente de forma normal, con una media de 200 ml y una desviacin estndar de 15 ml por botella. La mquina se verifica peridicamente tomando una muestra de 9 botellas y calculando el contenido promedio; si el promedio muestral por botella cae en el intervalo 191 y 209 ml, se considerar que la mquina trabaja de manera satisfactoria, de otro modo se concluir que el promedio es diferente de los 200 ml. Encuentre la probabilidad de cometer error de tipo I, cuando el promedio de llenado es de 200 ml. 3.9. Los salarios diarios de los obreros de construccin civil en la ciudad de Lima se distribuyen normalmente con una media de S/ 63 y una desviacin estndar de S/ 18. Se detecta que una
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 31 de 69 empresa constructora de la zona cuenta con 52 obreros, paga en promedio S/ 59,60, podra asegurarse que esta empresa est pagando salarios inferiores al normal?; qu podra afirmar si encuentra que en promedio si dicha empresa est pagando S/ 65,30 diarios? 3.10. Una empresa de material elctrico fabrica bombillas de luz elctrica que tienen una duracin que se distribuyen normalmente con una media de 800 horas y una desviacin estndar de 92 horas; pruebe la hiptesis nula de que la media es igual a 800 horas frente a la alternativa de que la media es diferente de 800 horas, si una muestra de 48 bombillas tiene una duracin de 788 horas. 3.11. Una compaa afirma que el tiempo necesario para fabricar un artculo es de 53 minutos, con una desviacin estndar de 7 minutos. Se toma una muestra de 90 artculos y se encuentra que el tiempo de fabricacin promedio de cada pieza fue de 56 minutos. a) Al nivel del 5% se podra afirmar que el producto requiere un tiempo mayor de fabricacin que lo afirmado por la compaa? b) Si el tiempo real de fabricacin es de 50 minutos, en la prueba de significacin se cometi un error de tipo I? 3.12. Un profesor examina el curso de Matemtica II; sabe por experiencia que en promedio los alumnos obtienen una calificacin de 12,3. En la actualidad, el profesor selecciona una muestra de 15 alumnos, de una poblacin de 212 alumnos y encuentra que en promedio esta muestra de alumnos obtuvo una calificacin de 12,8 con una desviacin estndar de 3,5. Acierta el profesor al afirmar que estos alumnos tienen rendimiento superior, en comparacin al anterior? Considere un nivel de significancia de 2%. 3.13. Pruebe la hiptesis de que el contenido promedio de los envases de un tipo de lubricante que una empresa debe producir diariamente, es de 10 litros; el ingeniero de planta toma una muestra aleatoria de diez envases, y encuentra que estos contenan las siguientes cantidades: 10,2, 9,7, 10,1 10,3, 10,1, 9,8, 9,9, 10,4, 10,3, y 9,5 litros. Utilice un nivel de significancia de 1% y suponga que la distribucin del contenido es normal. De qu tamao deber tomarse una muestra para rechazar la hiptesis de que estos contenidos no estn cumpliendo con lo establecido? 3.14. Se afirma que el diseo especial de un nuevo automvil, puede recorrer en promedio no menos de 20 000 kilmetros por ao, antes de ser sometido a un programa de mantenimiento correctivo. Para probar tal afirmacin se toma una muestra de 60 propietarios de automviles con este diseo, los que llevan un registro del kilometraje recorrido; estara de acuerdo con esta afirmacin, si la muestra indic que estos automviles requirieron mantenimiento al haber recorrido tan solo 19 457 kilmetros en promedio, con una desviacin estndar de 3 000 kilmetros? 3.15. Se realiza un estudio para determinar si los temas de la materia en un curso de fsica se comprenden mejor cuando se emplea un laboratorio en parte del curso. Se seleccionan estudiantes al azar para que participen, ya sea en un curso de tres horas semestre-hora sin laboratorio, o en un curso de cuatro horas semestre-hora con laboratorio. En la seccin con laboratorio, 11 estudiantes tuvieron una calificacin promedio de 85 con una desviacin estndar de 4,7; mientras que en la seccin sin laboratorio, 17 estudiantes tuvieron una nota promedio de 79 con una desviacin estndar de 6,1. Se podra decir que el curso con laboratorio aumenta la calificacin promedio hasta en 8 puntos? Considere una probabilidad de equivocarse del 5%.
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 32 de 69 3.16. Se cree que no menos el 65% de los residentes de un centro poblado est a favor de anexarse a otra provincia. Qu conclusin extraera, si solo 23 vecinos de una muestra de 38 estn a favor de este deseo? Utilice un nivel de significancia del 5%. 3.17. Suponga que hasta hace poco tiempo, 40% de todos los ciudadanos estn a favor de la imprescriptibilidad de los delitos cometidos por los funcionarios pblicos; habra razn para creer que la proporcin de ciudadanos en la actualidad ha aumentado, si en una muestra de 125 consultados, solo 54 ciudadanos manifestaban estar a favor de la imprescriptibilidad?; considere un riesgo de equivocarse del 5%. 3.18. Por antecedentes histricos se conoce que el tiempo promedio que requieren los estudiantes para sustentar su tesis sigue una distribucin normal, con una media de 37 minutos y una desviacin estndar de 6 minutos. Si una muestra de 15 tesistas demostr que demoraban en sustentar su tesis un tiempo promedio de 41 minutos, podra afirmarse que esta sustentacin est demorando ms del tiempo normal? 3.19. Los siguientes datos proporcionan los tiempos de respuesta a un sistema de informacin gerencial, proporcionado por dos modelos de PC, probados en PC seleccionados al azar: Modelo de PC tiempo (en segundos) Modelo A 2.04 3.02 1.92 1.87 2.01 2.00 1.89 1.95 Modelo B 2.62 1.47 1.83 2.00 1.42 1.76 1.48 Podra afirmarse que el tiempo de respuesta del modelo A es mayor al tiempo de respuesta del modelo B en ms de 0,20 segundos, si la probabilidad de equivocarse es a lo ms del 5%? 3.20. Un fabricante de bateras de litio para las Laptop, distribuye sus productos en sus diferentes clientes, asegurando que estos trabajan a un voltaje de 12 voltios, voltaje que permitir trabajar en las mejores condiciones; sin embargo, pasado un cierto tiempo recibe quejas de sus clientes quienes aseguran que estos productos no estn trabajando en las condiciones especificadas, generando problemas a las Laptop; el fabricante decide averiguar si estos clientes tienen la razn, motivo por el cual, selecciona al azar una muestra de bateras, y evala las condiciones de trabajo; los resultados de esta muestra indicaron que la muestra de bateras trabajaban en los siguientes voltajes: 12,5 13 11,9 12,0 12,1 11,5 11,6 12,1 12,8 11,2 y 12,0 Voltios, respectivamente. a) A los resultados de estas evidencias, debera atenderse las quejas de los clientes, o stas podran deberse a una simple casualidad?, asuma un riesgo de equivocarse del 5%. b) Indique los tipos de errores que podran cometerse, y evale las consecuencias de decidir por ellos.
R: Contraste de hiptesis en forma cualitativa: H0: Las bateras de litio, estn diseadas para trabajar a 12 voltios, lo cual permitir trabajar en las mejores condiciones a los equipos. H1: Las bateras de litio, no estn trabajando a 12 voltios, los cuales estn generando que los equipos se estn daando. Contraste de hiptesis en forma cuantitativa: H0: = 12,0 voltios H1: 12,0 voltios Muestras pequeas; distribucin t; por lo tanto tc(0,95,10)= 2,228 y tr = 0,392; por lo tanto debera aceptarse la hiptesis nula, en el sentido de que las bateras estn trabajando en el voltaje especificado, la diferencia encontrada, puede deberse a una simple casualidad. Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 33 de 69
Error Tipo I: Creer que las bateras no estn trabajando en los 12 voltios establecidos, haciendo caso a los clientes, que podran estar reclamando si fundamento. Error Tipo II: Creer que las bateras estn trabajando a 12 voltios, cuando en realidad no lo estn; por lo tanto no se le estara haciendo caso a los justos reclamos de los clientes, con las consecuencias de poder daar a los equipos de cmputo. Decisin ms grave: Cometer Error Tipo II; podra perderse a los clientes y ganarse un juicio de parte de ellos por daar sus equipos.

3.21. Se dice que una mquina despachadora de bebidas gasificadas est fuera de control, si la desviacin estndar de los contenidos excede de 1.15 decilitros. Si una muestra aleatoria de 25 bebidas llenadas con esta mquina tiene una desviacin estndar de 1,82 decilitros, podramos asumir, al nivel de significancia del 5%, que la mquina est fuera de control? 3.22. El administrador de una empresa de taxis, trata de decidir si el uso de llantas radiales, en lugar de llantas regulares cinturadas mejora la economa de combustible. Se equipan 12 llantas radiales y se manejan durante un recorrido de prueba preestablecido; sin cambiar a los conductores, los mismos automviles se equipan con llantas regulares cinturadas y se manejan otra vez en el recorrido de prueba. El consumo de gasolina, en kilmetros por litro, se registr de la siguiente manera:
Consumo de gasolina en kilmetros por litro, por una muestra de automviles, segn tipo de llantas utilizadas

Automvil Llantas radiales Llantas cinturadas 1 4,7 6,1 2 4,6 5,2 3 5,2 4,2 4 5,9 4,7 5 6,1 5,2 6 4,8 4,6 7 5,0 4,3 8 4,9 4,7 9 5,1 4,9 10 6,3 5,2 11 4,8 6,1 12 5,4 4,4 Podra concluirse que los automviles equipados con llantas radiales dan una economa de combustible mejor que aquellos equipadas con llantas cinturadas? Asuma que la poblacin se distribuye normalmente. Si en promedio se espera que el uso de llantas radiales en los automviles, consuma 5,4 litros por kilmetro, de qu tamao deber tomarse una muestra de otros automviles, para rechazar la hiptesis de que estas muestras no estn cumpliendo con lo esperado? Asuma un nivel de significancia del 1%. 3.23. Una agencia de publicidad desea probar, dos formas diferentes de presentacin de publicidad de una locin para hombres. En la publicidad A, el producto es enfocado desde el punto de vista sexy; en la segunda publicidad el producto es enfocado desde el punto de vista profesional; se seleccion una muestra de 15 hombres, usuarios potenciales de esta locin. El procedimiento seguido en la prueba, consiste en dejar que los entrevistados hojeen libremente la publicidad y luego se sometan a un cuestionario diseado para medir el grado de recordacin de los anuncios mostrados; los resultados en puntos, en una escala de 1 al 10, son los siguientes:
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 34 de 69
Grado de recordacin, en puntos, de la Locin para hombres segn tipo de publicidad utilizada en una muestra de hombres, potenciales usuarios de este producto

Persona N 1 2 3 4 5 6 7 8 9 10 11 12 Publicidad A 5 6 4 7 4 6 5 6 4 3 3 4 Publicidad B 4 3 6 7 7 5 4 5 5 2 2 2 Considerando un riesgo de equivocarse del 5%, podra asegurarse que ambas publicidades, generan el mismo tipo de atencin? 3.24. Un ingeniero industrial cree que ha perfeccionado un programa de entrenamiento que puede acortar el tiempo de ensamble de una pieza en fabricacin. Para verificar esta suposicin, planea seleccionar diez obreros en forma aleatoria, y realizar estudios de tiempos y movimientos, con ellos, antes y despus de que hayan acabado su programa de entrenamiento; los resultados se muestran a continuacin:
Tiempo de ensamble en segundos, antes y despus de perfeccionamiento del programa para la produccin de la pieza de., desarrollado por una muestra de obreros en

Obrero N 1 2 3 4 5 6 7 8 9 10 Antes 12 13 14 13 14 12 11 15 13 14 Despus 11 12 10 14 12 12 12 10 10 11 a) Obtenga los lmites de confianza al 99%, sabiendo que el error de estimacin no debe sobrepasar los 5 segundos. b) Confirme si el programa de entrenamiento sirve para reducir el tiempo de ensamble, considerando un margen de equivocarse del 5%. c) Puede asegurarse que la variacin de tiempo antes de implementar el nuevo programa es mayor de 2 segundos? d) Puede considerarse que hay diferencia entre la variacin de tiempos entre ambos programas? 3.25. Una nueva variedad de manzana presenta un sabor muy agradable; para ello se ha decidido someter a prueba su rendimiento, plantando este tipo de manzanas junto a otra manzana corriente, en ocho huertos diseminados en una regin apropiada para la produccin de ambas variedades; cuando los rboles empiezan a rendir, se mide su produccin en cajas; los datos obtenidos son los siguientes:
Rendimiento en cajas, por huerto, segn variedad de manzanas

Nueva variedad Manzana corriente de manzana 1 15 12 2 12 14 3 14 13 4 13 12 5 10 11 6 12 14 7 14 15 8 17 10 a) Estime un intervalo de confianza del 99%, para conocer la diferencia promedio de produccin de las manzanas nuevas y las manzanas corrientes, si el margen de error no debe ser mayor de 0,5.
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Huerto

Pgina 35 de 69 b) Si el rendimiento esperado por la nueva variedad de manzana es de 15 cajas por huerto, podra asegurarse que se est cumpliendo con el programa de produccin? Asuma un riesgo de equivocarse del 1%? c) En cuntos huertos deber probarse el cultivo de esta nueva variedad de manzanas, para rechazar la hiptesis de que esta nueva variedad no est cumpliendo con lo esperado? Considere un riesgo de equivocarse del 1%? d) Sealan estos resultados una mayor produccin de las nuevas manzanas, que las de las manzanas corrientes? Asuma un margen de error de 0,01. e) Hay variacin en el rendimiento por cajas, en la produccin de estas manzanas? 3.26. Una comunidad urbana quiere demostrar que la incidencia de cncer de seno es mayor que en las comunidades rurales, si se encuentra que 20 de cada 200 mujeres adultas en la comunidad urbana tienen cncer de seno, y 10 de 150 mujeres adultas de la comunidad rural tienen cncer de seno, podra concluirse a un nivel de significancia del 5%, que este tipo de cncer, prevalece en la comunidad urbana? 3.27. Una empresa desea saber el efecto que puede generar sobre la productividad, dar un relax a su personal, para saborear una taza de caf especial; para ello selecciona al azar un grupo de trabajadores a los cuales se les mide la productividad, sin saborear el caf, y saboreando el caf. Los resultados se muestran en la siguiente tabla:
Productividad en unidades producidas, por trabajador

Trabajador Saboreando caf Sin saborear caf 1 23 24 2 24 27 3 26 24 4 20 25 5 25 23 6 28 27 7 22 24 8 25 28 9 26 24 10 30 27 11 20 a) Podra asegurarse que saboreando el caf, la productividad es mejor? b) Podra asegurarse que hay mayor variacin en la productividad saboreando caf? 3.28. Se realiza un estudio para comparar el tiempo de demora entre hombres y mujeres para ensamblar un producto. La experiencia indica que la distribucin de los tiempos, tanto como para hombres como para mujeres es aproximadamente normal, pero que la varianza de los tiempos para las mujeres en menor que el de los hombres; una muestra aleatoria de 11 mujeres y 16 hombres mostr los siguientes resultados: Varianza de tiempos de los hombres, 36,8 seg 2; varianza de tiempo de las mujeres 27,4 seg2; extraiga sus conclusiones a la luz de los planteamientos del problema. 3.29. Una empresa distribuidora de Laptops, sabe que las bateras de sus Laptop, se distribuyen normalmente con una duracin promedio de 4,6 horas antes de ser recargadas; en este sentido desea comprobar la duracin de stas en las sierras de Hunuco y de Cusco; para ello toman muestras de estos aparatos y los somete a observacin; los resultados de la duracin de estas bateras, antes de ser recargadas muestras se observan a continuacin:
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 36 de 69
Tiempo de duracin en horas, de las bateras de Laptop, antes de ser recargadas

Hunuco 5,2 3,9 4,8 4,6 3,7 3,9 5,1 4,8 5,3 4,4 Cusco 5,1 4,2 4,5 3,6 4,7 4,0 4,6 4,2 4,3 a) Hay razn suficiente para considerar que las bateras de las Laptop, en Hunuco tienen mayor tiempo de duracin que en Cusco? b) Puede considerarse hay diferentes variaciones en la duracin de estas bateras? c) De qu tamao deber tomarse una muestra, si se quiere rechazar la hiptesis, de que el tiempo de duracin de las bateras en Cusco es diferente de 4,6 horas?
R: a) No hay razn suficiente como para afirmar que el promedio de duracin de las bateras de las Laptop en Hunuco, duran ms que en Cusco (diferencia de medias poblacionales con muestras pequeas); b) No hay razn suficiente como para afirmar que hay variacin en la duracin de estas bateras (prueba F); c) La muestra debe ser mayor o igual 17, haciendo la prueba t.

3.30.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 37 de 69

IV.

OTRAS PRUEBAS DE HIPTESIS:

AJUSTE DE CURVAS Y PRUEBAS DE CONTINGENCIA

Ejemplo 4.1 Se desea averiguar si el pertenecer a un grupo socioeconmico es fundamental como para desear seguir una carrera profesional, por el cual optaban los estudiantes que culminaban su educacin secundaria; en ese sentido se toma una muestra de grupos de estos estudiantes y se les pregunta por la carrera universitaria que desearan continuar en el futuro; las respuestas afirmativas por dichas carreras se muestran en la siguiente tabla. Tabla 4.1
Inters por seguir una carrera universitaria por los estudiantes secundarios, segn su grupo socioeconmico familiar

Grupo socioeconmico familiar Carrera profesional Medicina Ingeniera Derecho Contabilidad Docencia A 7 6 8 3 2 B 9 10 5 5 1 C 3 7 8 4 5 D 10 8 7 4 3 E 9 7 10 5 2

Podra asegurarse que las carreras universitarias deseadas por los estudiantes secundarios, est asociado a su grupo socioeconmico, o es que estos resultados solo se deben a la casualidad? Considere un riesgo de equivocarse del 5%. Solucin: Es una prueba de contingencia, ya que se trata de establecer si dos variables categricas, en este caso, Grupo socioeconmico familiar y Carrera profesional, ambos con diferentes categoras, estn asociados o son independientes; en este sentido, el contraste de hiptesis ser: H0: El desear estudiar una carrera profesional, no tiene que ver nada con el grupo socioeconmico. H1; El desear una carrera profesional, est asociado al grupo socioeconmico al que pertenece el estudiante. Haciendo los respectivos clculos, se obtiene que su Chi cuadrado real es 10,34, el cual contrastado con su Chi cuadrado terico(0,95; 16), es 26,3. Por lo tanto, dado que ste es mayor que el real obtenido, no debera rechazarse la hiptesis nula, y aceptar que la eleccin de la carrera universitaria de los estudiantes secundarios, no tiene nada que ver con el grupo socioeconmico al cual pertenece.

USO DE SOFTWARE SPSS 15.0 PARA DESARROLLAR PRUEBAS DE CONTINGENCIA


Ejemplo 4.2 Considere que los alumnos de ingeniera informtica han desarrollado una encuesta relacionado con la motivaciones de visita de los forneos a la provincia de Huaura, y que estos
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 38 de 69 visitantes se caracterizan por pertenecer a diferentes grupos ocupacionales; adems tuvieron diversas motivaciones que los impulsaron a venir a estos lugares. Como puede inferirse, en este caso se cuentan con dos variables categricas: Grupo ocupacional y Razones de visita; el grupo ocupacional puede estar conformado por las siguientes categoras: Comerciante, Empleado, Jubilado, Estudiante, Ama de casa y Profesional; la variable Razones de visita, puede estar conformado por las siguientes categoras: Gastronoma, Arqueologa, Curanderismo, Aventura y Distraccin. Para introducir estos datos en el SPSS, habr que definir primeramente los tipos de datos de las variables, con sus respectivas caractersticas; as hagamos la siguiente definicin: Grupo ocupacional Razones de visita GO RV GrupoOC RazonV 1 Comerciante 7 Gastronoma 2 Empleado 8 Arqueologa 3 Jubilado 9 Curanderismo 4 Estudiante 10 Aventura 5 Ama de casa 11 Distraccin 6 Profesional Los datos que se introducirn en este software tendrn estas caractersticas; para ello abra su editor, observar una matriz formada por filas y columnas; cada columna define un tipo de variable y cada fila, un elemento de informacin, del ente que se est estudiando. En vista de variables, que aparece al pie izquierdo del editor, haga clic con el ratn para ingresar al proceso de definicin de cada variable, del siguiente modo: 1. En la primera fila, se definir las caractersticas de la variable Grupo ocupacional; para eso defina en Nombre con GO, en Tipo, indique Numrico, en Ancho escriba un nmero como 3, sin decimales; en Etiqueta escriba GrupoOC, y en Valores, haciendo clic en los puntos suspensivos se ingresa a la ventana de valor; aqu es donde deber definir las categoras de las variables establecidos en la tabla; as donde dice Valor, escriba 1, y donde dice Etiqueta, escriba Comerciante, luego haga clic en Aadir; repita hasta completar la categora 6 Profesional; luego pulse el botn Aceptar; de esta manera la variable Grupo ocupacional ha quedado definido. 2. En la segunda fila, se definir las caractersticas de la variable Razones de visita, siguiendo los mismos pasos que el anterior: Nombre RV, Tipo Numrico, Ancho 3, sin decimales; en Etiqueta escriba RazonV, y en valores, una vez ingresado a su ventana escriba Valor 7, Etiqueta Gastronoma, Aadir y repetir este proceso hasta culminar con 11 Distraccin, y finalmente Aceptar; de esta manera esta otra variable ha quedado completamente definido. 3. Ahora haga clic en Vista de datos del editor del SPSS, observar que la primera columna est definido como GO, y la segunda columna como RV. 4. En la columna correspondiente a GO, de acuerdo a los datos obtenidos en su encuesta, escriba los nmeros del 1 al 6; y en la columna correspondiente a RV, escriba los nmeros correspondientes entre 7 y 11; ambas columnas debern tener la misma cantidad de datos; cuando termine de introducir sus datos, estar en condiciones de pasar hacia otras etapas de anlisis, como a continuacin se indicar. 5. En el men principal vaya a Analizar Estadsticos descriptivos Tablas de contingencia y le proporcionar los resultados en una tabla, donde deber interpretar los mensajes proporcionados.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 39 de 69

EJERCICIOS 4.1.
De qu manera pueden aproximarse el comportamiento de las observaciones empricas a comportamientos tericos? 4.2. Puede considerarse que una observacin real, coincide exactamente con una distribucin terica; sustente su respuesta? 4.3. Suponiendo que una serie de observaciones sean ajustadas a una distribucin normal, cuntos parmetros debern utilizarse para dicho ajuste? 4.4. Por qu considerara que la edad de los alumnos de un centro educativo sigue una distribucin normal? 4.5. Segn cifras proporcionadas por el Ministerio de Transportes y Comunicaciones, los accidentes de trnsito ocasionados por causa de los peatones, por da, durante el ao pasado, en un tramo de la Carretera Central, fueron reportadas del siguiente modo: Reporte de accidentes de trnsito por imprudencia del peatn, en un tramo de la Carretera Central, en la zona de Lima, en el ao 2011 N accidentes 0 1 2 3 4 5 6 7 N de ocurrencias 6 25 38 50 34 23 15 9 Encuentre una curva de tendencia para explicar el comportamiento de estas observaciones y valdelo a un nivel de significancia del 5%.
R: El comportamiento de estas observaciones debe seguir una Poisson; para ello se determina el promedio de accidentes por da = 3,275; luego la funcin propuesta debera ser f(x) = , para x = 0,1,,7 accidentes/da. Plantendose la hiptesis nula en el sentido que esta ecuacin define el comportamiento de estos accidentes, frente a la alternativa, que manifiesta que no lo describe, se construye el modelo terico y se encuentra luego que su chi cuadrado real es R = 5,92 frente al chi cuadrado terico c(0,95,6) = 12,59. Haciendo la respectiva comparacin se ve que se debe aceptar la hiptesis nula, por lo tanto la ecuacin planteada es vlida para describir el comportamiento de estas observaciones.

4.6.

Una empresa cuenta con una plana heterognea de personal en cuanto a su experiencia laboral; de este modo ha clasificado la siguiente tabla experiencia laboral en aos, dentro y fuera de la institucin: Ex. Aos 05 5 10 10 15 15 20 20 25 25 30 30 35 # Traba. 50 40 32 24 16 12 7 Ajuste estas observaciones a una distribucin triangular validndolo al 5%. 4.7. El servicio de emergencia de un hospital presenta un resumen de llegada de personas accidentadas por causas de trnsito segn se muestra en la tabla: Nmero de personas 0 1 2 3 4 5 ingresados por emergencia Nmero de veces observado 6 25 36 21 15 7 a) Determine el nmero promedio de pacientes ingresados por da, as como su desviacin estndar. b) Encuentre una curva de tendencia del comportamiento de llegada de pacientes, y valdelo al 5%

4.8.

Una casa comercial vende sus equipos de cmputo bajo la modalidad de al contado y al crdito; cuando vende al crdito, algunos de sus clientes se atrasan en sus pagos, generando problemas de liquidez a la empresa; el encargado de Estadstica lleva un registro histrico de los clientes quienes tuvieron pagos atrasados, los que se muestran en la siguiente tabla
Ciclo 2012-II Moiss E. Armas

Inferencia Estadstica

Pgina 40 de 69
Problemas de pago de los clientes que compraron al crdito

Nmero de atrasos de pago 1 2 3 4 5 6 7 8 del cliente Nmero de clientes con 1 6 18 35 60 48 23 7 problemas de pago Formule una curva de tendencia para describir el comportamiento de pago de estos clientes, validndole al 5%. 4.9. Con la finalidad de conocer la distribucin de edad de los alumnos de un centro educativo de nivel superior se confecciona la siguiente tabla: Tabla
Distribucin de edad de los alumnos del CE

Edad de los alumnos N de alumnos en aos 14 17 35 17 20 39 20 23 50 23 26 42 26 29 38 29 32 30 Existe suficiente evidencia como para decir que la edad de estos alumnos sigue una distribucin uniforme? R: 20,05; 5 = 11,07 2 r = 5,8462 4.10. Un alumno est tratando de construir un modelo de distribucin de probabilidades del comportamiento de llegada de clientes al cajero automtico de un banco de la localidad; para ello se pone a observar la llegada de estos al cajero cada cinco minutos, lo cual le permite confeccionar el siguiente cuadro de llegadas:
Llegadas de clientes al cajero automtico del Banco XXX

Llegan clientes cada Cantidad de clientes cinco minutos que llegaron 0 12 1 45 2 34 3 21 4 13 5 8 Ayude a construir al alumno un modelo de distribucin de probabilidad de llegadas, validndole respectivamente; considera un nivel de significancia del 5%. 4.11. El promedio de notas de los alumnos de ingeniera, obtenidos en el curso de Lenguaje de Programacin durante el ciclo pasado, estn tabulados en la siguiente tabla:
Notas obtenidas por los alumnos Nmero de alumnos observados

[ 0 4[ 8 [ 4 8[ 13 [ 8 12[ 20 [12 16[ 10 [16 20[ 4 Encuentre una curva de comportamiento terico del comportamiento de estas notas, y valdelo al 1%. 4.12. Para qu se desarrolla una prueba de contingencia?
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 41 de 69

4.13. Qu significa decir que las variables son independientes, en una prueba de contingencia? 4.14. De qu manera se puede validar una prueba de contingencia? 4.15. Explique el significado de que dos variables son dependientes, luego de desarrollar la prueba
de contingencia.

4.16. Un investigador est interesado en conocer, si la lectura de los diarios chicha de circulacin
nacional, est asociado al nivel cultural de las personas y el lugar donde residen; para ello se hace un muestreo en diferentes lugares dentro del mbito de influencia de la Universidad, preguntndosele a cada uno de ellos por las habituales lecturas de estos diarios, encontrndose los siguientes resultados:
Preferencia por los diarios chicha, de una muestra de personas de diferentes mbitos del rea de influencia de la Universidad Localidades del mbito de influencia de la Universidad

Grado de Instruccin Vgueta Carqun Supe Sayn Humaya Primaria 7 9 3 10 9 Secundaria Incompleta 6 10 7 8 7 Secundaria Completa 8 5 8 7 10 Superior Incompleta 3 5 4 4 5 Superior Completa 2 1 5 3 2 Analice los resultados de esta tabla y formule sus propias conclusiones; considere un riesgo de equivocarse del 5%.
R: La hiptesis nula debe plantearse en los siguientes trminos: La lectura de los diarios chicha , nada tiene que ver con el grado de instruccin de las personas que los leen, as como el lugar donde habitualmente se encuentran, frente a la alternativa, que si efectivamente se darn estas condiciones, dado que hay suficiente evidencia como para afirmar que los resultados de la tabla, as lo evidencian. Construyendo su tabla de valores esperados, se obtiene que su chi cuadrado real es R = 10,32, el cual contrastado con el c(0,95,16) = 26,36, se puede concluir que efectivamente la lectura de estos diarios, no est asociado al grado de instruccin de las personas que los leen, ni al lugar de procedencia.

4.17. Una compaa de seguros tiene que optar por escoger dentro de cuatro planes de seguros de
vida que actualmente ofrece a sus clientes; para ello desea conocer si la preferencia por algn plan de seguros de sus clientes est asociada al nivel ocupacional en ejercicio. Se toma una muestra aleatoria de un grupo de clientes usuarios de este plan, obtenindose los siguientes resultados:
Plan de seguros optados por los clientes

Nivel ocupacional A B C D Obreros 30 45 35 70 Comerciantes 48 39 47 65 Profesionales 59 46 52 60 Independientes 20 15 10 22 a) Podra asegurarse que el plan de seguros optado por los clientes nada tiene que ver con los tipos de clientes?, considere un riesgo de equivocarse del 1%. b) Qu debera pasar para decir que el plan de seguros optados por los clientes, est asociado a su nivel ocupacional, considerando un riesgo de equivocarse del 5%? c) De qu manera podra utilizarse el SPSS para resolver este problema? 4.18. Un canal de televisin est interesado en saber si los programas que transmite da a da influyen en el grado de conducta de su tele audiencia; para tales fines selecciona una muestra aleatoria de un grupo de televidentes de diferentes grupos de edades, y los somete a una
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 42 de 69 prueba psicolgica, despus de un perodo de observacin, encontrndose los siguientes resultados:
Nivel de conducta observada en una muestra de televidentes, como resultado de sus programaciones, de la Empresa Televisiva XXXX

Grupo de Muy Agresivo Normal Hiperactivo personas agresivo Nios 15 28 22 20 Jvenes 24 14 20 17 Adultos 10 12 24 14 Tercera edad 6 16 14 9 Podra asegurarse que existe una relacin entre el nivel de conducta de los grupos de edades de las personas y la programacin emitida por la empresa televisiva, asumiendo un riesgo de equivocarse del 5%?

4.19. Una empresa textil trabaja a tres turnos, en razn de que debe satisfacer fuertes pedidos de
sus clientes provenientes del exterior; sin embargo el departamento de control de calidad alega que este sistema de trabajos no es conveniente dado que frecuentemente encuentran fallas de calidad en las prendas confeccionadas por sus trabajadores, lo cual puede perjudicar la imagen de la empresa ante sus clientes. A fin de determinar si realmente existe este tipo de problemas como lo alega control de calidad, se toman muestras aleatorias de un grupo de trabajadores de loa diferentes turnos y se les evala sus respectivos trabajos, y determinar el nmero de fallas encontradas en las prendas producidas; los resultados de estos se encuentran en la siguiente tabla: Resultados del muestreo hecho a una muestra de trabajadores, para determinar el nmero de fallas encontrados en las prendas confeccionadas Estado de las Maa Tarde Noch prendas na e confeccionad as Mal 5 3 11 Regular 4 12 6 Aceptable 16 9 7 Ninguna 7 5 3 a) Podra asegurarse que lo manifestado por el departamento de control de calidad es vlido y no trabajarse con este sistema de turnos, o es que estos problemas pueden deberse a otros factores?; considere un riesgo de equivocarse del 5%. b) Utilice el SPSS para contrastar sus resultados manuales con lo proporcionado por ste. 4.20. Ante el advenimiento de las prximas elecciones para elegir al nuevo presidente de la repblica, los tres partidos polticos ms voceados por las empresas encuestadoras, deciden implementar un nuevos spot publicitario a travs de la TV, con la finalidad de influir en el nimo de la poblacin electoral que an se mantienen indecisos o no les interesa el proceso electoral. Despus de una semana de lanzado este spot se encarga a una encuestadora desarrollar un estudio sobre los efectos de ste en el nimo de los electores; la empresa selecciona una muestra de electores y recoge sus opiniones acerca del spot, obteniendo los siguientes resultados:

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 43 de 69 Tabla
Estado de nimo de los electores, respecto a los partidos polticos A, B, y C, como resultado del lanzamiento del nuevo spot publicitario Partidos polticos

Estado de A B C nimo Muy a gusto 10 12 9 Gustoso 7 8 12 No le gusta 6 9 6 No le interesa 13 10 12 Podra asegurarse que el spot publicitario, influy en el estado de nimo de los electores, o es que esto nada tiene que ver con ese estado de cosas? Sustente su respuesta considerando una probabilidad de equivocarse con el 5%. 4.21. Se quiere establecer si existe una relacin entre la duracin de los discos duros y los distintos lugares donde son utilizados, dado que por parte de los clientes que los utilizan, sobre todo en la sierra, donde hace mucho fro, dicen que estos discos, despus de un perodo corto de vida, empiezan a tener problemas en sus pistas, debindose hacer continuas reparaciones, con el SanDisk; para descartar las afirmaciones de los clientes quejosos, se decide hacer pruebas de confiabilidad de los discos duros de las marcas Quantum, Maxtor, Fireball o Seagate, en diferentes lugares que presentan climas propios, como climas fros, muy fros, templados, clidos, y muy calurosos; estos discos duros, despus de un tiempo de uso, deber registrarse el nmero de veces que fue reparado con el SanDisk. Los resultados de este ensayo se muestran en la siguiente tabla: Tabla
Nmero de veces que fueron sometidos a un proceso de Scan Disk los discos duros, en concordancia al clima donde fueron expuestos

Tipo de clima Fro Muy fro Templado Clido Muy clido

Quantum 12 15 9 11 13

Maxtor 10 9 11 9 13

Fireball 8 13 12 9 12

Seagate 13 10 12 13 8

Con estos resultados, podra darse la razn a los clientes quejosos, o es que estos casos solo son problemas provenientes de la casualidad? Considere un nivel de significancia del 1% 4.22. Analizando el problema de la contaminacin del medio ambiente, realizado por las personas en la provincia de Huaura, los alumnos del V ciclo de Ing. Informtica de la Universidad se abocan a averiguar si la manera cmo las personas que contaminaban el medio ambiente estaban relacionados con su nivel cultural; para ello muestrearon a un grupo de personas, de diferentes grados de instruccin y los relacionaron con las diversas modalidades de contaminar el medio ambiente, contabilizando el nmero de veces que contaminaban, en un determinado perodo de tiempo; los resultados de esta investigacin se muestran en la siguiente tabla:

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 44 de 69 Tabla
Nmero de veces que contaminaban el medio ambiente de acuerdo a sus diferentes niveles culturales Diversas modalidades de contaminar

Nivel Escupe Tira papeles Orina en la Fuma Cultural u otros calle Primaria 13 8 7 5 Secundaria 15 10 3 11 Superior 9 15 4 10 Incompleta Profesional 5 12 2 16 Universitario A la luz de estos resultados, formlese una teora y generalcese para la poblacin de la provincia, asumiendo un riesgo de equivocarse del 5%. 4.23. Se quiere establecer si realmente existe una relacin entre la apreciacin de parte de los estudiantes, respecto a la actitud de sus profesores, ya que segn se especula, esta apreciacin, incide mucho en su rendimiento acadmico; para ello, en una universidad, se toma una muestra aleatoria de un grupo de estudiantes, a los cuales se les clasifica en cuatro expectativas respecto a qu actitud debera tomarse en el docente, parta sentirse ms motivado en el desarrollo de sus clases; las opiniones de los estudiantes respecto a estas preguntas, fueron los siguientes: Tabla
Caractersticas valoradas por los estudiantes segn las actitudes de sus profesores

Actitud del profesor

Domina el tema 13 10 7 Prepara bien 5 7 8 clases Es ordenado en la 5 9 8 7 clase Hace apuntes en la 8 4 2 9 pizarra Es puntual en las 10 6 7 5 clases Evala con justicia 5 3 3 7 Tiene buena diccin 9 4 6 12 Evale los resultados de esta tabla, teniendo en cuenta el grado de conocimiento con el que cuenta hasta el momento.

Muy bueno 12 sus 6

Bueno

Regular

Malo

4.24. Los alumnos del V ciclo de ingeniera informtica, en el ciclo que fenece, desarrollaron un
trabajo de investigacin, el cual consisti en averiguar las preferencias de continuar estudios superiores en una universidad pblica del departamento de Lima; para ello, encuestaron a una muestra de estudiantes del cuarto y quinto ao de la educacin secundaria, a quienes les preguntaron sobre esta posible opcin; los alumnos encuestados fueron clasificados segn el nivel de ingresos mensuales de sus respectivos padres, y registrados en los casilleros correspondientes a las preferencias de continuar estudios superiores en las universidades, que a continuacin se presenta:
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 45 de 69 Tabla
Preferencias de continuacin de estudios superiores, en una institucin universitaria de Lima, de una muestra de alumnos, clasificados segn los ingresos de sus padres de familia. Universidades nacionales del departamento de Lima

Nivel de ingresos S/ 800 1600 1600 - 2400 2400 3200 3200 4000 4000 - 4800

UNI 3 2 1 6 4

UNJFSC 5 3 2 1 0

UNMSM 6 2 3 4 5

UNFV 4 2 1 1 1

LA MOLINA 0 6 2 5 3

a) Cuntos estudiantes fueron encuestados, y qu tipo de anlisis deber hacerse para obtener una conclusin, respecto a estas observaciones? b) Formule un contraste de hiptesis para aceptar o rechazar la evidencia segn su respuesta anterior; asuma un riesgo de equivocarse del 5%.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 46 de 69

V.

DISEOS EXPERIMENTALES

DISEO COMPLETAMENTE AL AZAR

Ejemplo 5.1 Considere que un investigador est interesado en probar tres mtodos de enseanza a fin de mejorar el rendimiento acadmico de los alumnos de un instituto educativo; para ello selecciona al azar un grupo de estudiantes, y al azar, sin que stos lo solicitaron ni conocan el mtodo de enseanza, fueron asignados a solo uno de los mtodos, identificados por T1, T2 y T3; despus de un perodo de observacin, los alumnos fueron calificados con notas comprendidos entre cero y 100, cuyos resultados se muestra en la siguiente tabla: Tabla 5.1
Puntajes obtenidos segn mtodo De enseanza en un centro educativo

T1 23 12 16 24 21

T2 44 51 56 78 42 58

T3 78 56 65 66 43 67 77 52

Podra asegurarse que la implementacin de estos tres mtodos, hubo mejora en el rendimiento acadmico de los alumnos, asumiendo un riesgo de equivocarse del 5%? Solucin: Se trata de averiguar si por lo menos con uno de estos tres mtodos de enseanza, se logr mejora; en trminos de contraste de hiptesis: H0: El rendimiento acadmico de los alumnos seguir siendo el mismo, pese a la implementacin de nuevos mtodos de enseanza. H1: Por lo menos, con uno de los mtodos de enseanza, se lograr elevar el rendimiento acadmico de los alumnos. En trminos cuantitativos, este contraste podr expresarse: H0: 1 = 2 = 3 H1: Por lo menos uno de estos k, ser mayor que los dems, donde k = 1, 2, 3. Haciendo los clculos respectivos, se obtiene su tabla de anlisis de varianza, donde el Fr = 25,26 deber contrastarse con el Fc(0,95;2, 16 ) = 3,50.
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 47 de 69 TABLA DE ANVA FUENTE SC gl Tratamiento 6212.16 Error 1967.63 Total 8179.79

CM Fr 2 3106.08 25.26 16 122.98 18

Del anlisis de esta tabla, se puede observar claramente que Fr es mayor que el Fc, por lo tanto, la hiptesis nula debe ser rechazada, a favor de la hiptesis alternativa, debindose aceptar que efectivamente hubo mejora en el rendimiento acadmico de los alumnos con uno de los tratamientos, siempre con el riesgo de que habr un 5% de probabilidad de equivocarse al optar por esta decisin..

EJERCICIOS 5.1.
Una compaa de seguros tiene que optar por escoger dentro de cuatro planes de seguros de vida que actualmente ofrece a sus clientes; para ello desea ofrece a sus clientes cuatro planes de seguros, selecciona una muestra de clientes, se le da una explicacin detallada de las ventajas de este plan y al final se les pide que evalen sus bondades, los cuales deben expresarse en una nota cuantitativa, calificada entre cero y cien; los resultados de este ensayo dieron lo siguiente:

Calificaciones, entre 0 y 100 a los planes de seguro, por una muestra de clientes seleccionadas al azar A B C D 30 45 55 78 68 39 67 69 59 66 92 80 20 45 47 42 89 56 59 78 72 81 a) Identifique: La variable independiente; la variable dependiente; la unidad de medida; la unidad experimental y el de tipo de experimento. b) Podra asegurarse que por lo menos uno de los planes de seguros de seguros optado por los clientes tienen mejor apreciacin que los otros, por los clientes potenciales?, considere un riesgo de equivocarse del 1%. c) Qu poltica debera desarrollarse, si las circunstancias muestran que los planes no tienen la debida aceptacin por los clientes? 5.2. Una empresa textil trabaja a tres turnos, en razn de que debe satisfacer la gran demanda por parte del mercado europeo; para ello, queriendo saber en qu turno de trabajo, el rendimiento de los trabajadores es mejor, selecciona una muestra de ellos, y los somete a observacin, sin que ellos se den cuenta, a fin de cuantificar el nmero de piezas producidas en un turno de trabajo. Debe considerarse que todos los trabajadores estaban sometidos a las mismas condiciones laborales, por lo que se puede inferir que no exista por parte de la administracin, ningn sesgo en la medida o apreciacin por parte de las observaciones registradas a los trabajadores. Despus de un tiempo de observacin, se pudo obtener los siguientes resultados:

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 48 de 69
Resultados de produccin de nmero de piezas por turno, de una muestra de trabajadores de la empresa ..

Maana Tarde Noche a) b) c) d) e)

17 12 19

11 16 17

15 15 16

20 20 12

8 21 10

12 18 23

14 19 21

18 16

11 17

10

Cuntos trabajadores fueron observados? Formule un modelo para describir el comportamiento de estas observaciones? En qu turnos de trabajo hay mejor rendimiento? Cul es el objetivo de desarrollar el ANVA? A un nivel de significancia del 1%, podra asegurarse que por lo menos en uno de los turnos de trabajo hay mejor rendimiento? 5.3. Estn en consideracin seis mquinas diferentes para utilizarlas en las manufacturas de juntas de caucho. Las mquinas se comparan con respecto a la tensin del producto. Se emplea una muestra aleatoria de cuatro juntas procedentes de cada mquina, para determinar si la resistencia media de la tensin vara de una mquina a otra; las siguientes son mediciones de esa resistencia en kilogramos por centmetro cuadrado con cada centmetro. Mquinas 1 2 3 4 5 6 16,3 13,1 14,2 14,1 14,9 13,8 18,1 14,2 15,0 13,6 14,2 12,8 14,5 15,0 13,2 13,3 13,9 14,1 13,2 13,7 14,1 12,9 12,8 12,9 Lleve a cabo el anlisis de varianza con un nivel de significancia del 1%, e indique si las resistencia medias a la tensin difieren o no en forma significativa para las seis mquinas.

5.4. 5.5.

Demuestre que:

- C; donde C =

Una nueva empresa vinculada al negocio informtico est interesada en abrir nuevas sucursales en los diferentes mbitos del pas, con la finalidad de impartir enseanza en ciencias de la computacin; los posibles lugares donde se abriran estos negocios son: Arequipa, Trujillo, Cajamarca, Chiclayo, Cusco y Huancayo; en vista de que carece de informacin sociocultural de cada uno de los lugares, selecciona muestras aleatorias de posibles candidatos de cada lugar a fin de someterlos a una prueba de percepcin de conocimientos, los cuales son cuantificados en notas que van de cero a veinte, cuyos resultados se muestran en la siguiente tabla:
Calificativos obtenidos por los candidatos seleccionados por una Prueba de percepcin, desarrollada durante el perodo.. Lugares

Arequipa Trujillo Cajamarca Chiclayo Cusco Huancayo

12,6 11,5 09,2 14,2 15,1 13,3

08,5 12,2 13,1 11,6 12,3 10,7

12,4 10,2 13,2 10,1 12,5 11,2

13,2 07,7 09,8 10,2 11,8 10,9

07,2 11,5 11,7 14,4 16,2 12,8

10,7 13,6 11,6 08,7 13,4 05,5 12,2 10,3 11,5 07,5

Podra asegurarse, que los potenciales candidatos, mantienen diferentes percepciones de conocimientos, asumiendo un riesgo de equivocarse del 5%?
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 49 de 69

5.6.

Con la finalidad de reducir los niveles de colesterol en la sangre de las personas mayores de los treinta aos, se disean cinco tipos de dietas con diferentes formulaciones, los cuales son sometidas a un grupo de personas que tenan altos niveles de colesterol, durante un perodo de cuatro meses; pasado este tiempo se les vuelve a medir y se encuentra los siguientes resultados: Tabla
Niveles de colesterol en la sangre de una muestra personas, seleccionadas al azar, sometidos a base de las principales dietas

Verduras 203 263 205 222 299 201 242

Pescado 217 220 198 234 250 200 201 238 240

Carne 205 231 233 198 210 216 208 242

Granos 200 204 245 210 216 205 205 212 217

Constituyen estos resultados, suficiente evidencia como para manifestar que los niveles de colesterol en la sangre de las personas son iguales, pese a la diversidad de dietas; considere un nivel de significancia del 5%? 5.7. Una empresa dedicada a la venta de partes de equipos de PC, seleccionar un tipo de tner de impresoras lser, a fin de comercializar y competir en el mercado informtico; su eleccin estar basado en aquella marca que presente mayores rendimientos, y para ello cuenta con cinco ofertas; como no sabe por cul decidir, selecciona tner al azar, y lo somete a prueba de impresin, obteniendo los siguiente resultados: Tabla
Cantidad de hojas impresas con las mismas caractersticas de la muestra de tner de impresoras

HP EPSON LEXMARK CANON XEROX

206 187 230 195 201

200 198 185 215 198

184 208 198 215 195

199 217 200 207 218

230 208 192 205 215 195 192 196 212

Qu sugerencias proporcionara a los directivos de la empresa a la luz de estos resultados?; considere un nivel de significancia del 1%.

5.8. Considere los problemas 6 y 7, del presente caso; de qu manera podra identificarse el 5.9.
tratamiento ms adecuado, en el caso de rechazar la hiptesis nula. Explique el valor de la prueba Tukey.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 50 de 69

DISEO DE BLOQUES AL AZAR


Ejemplo 5.2 Un empresario vinculado a la exportacin de productos agrcolas sembradas con productos orgnicos est interesado en saber si los rendimientos de tomates, abonados con humus, dependen de los meses de siembra, ya que sabe que estos productos requieren un perodo de cuatro meses para ser cosechados; para tales fines prepara parcelas con las mismas dimensiones en diferentes lugares del departamento de Lima, pero como sabe adems que estas parcelas, por ms que todas tengan las mismas dimensiones, siempre estn afectadas por caractersticas particulares del medio donde se va cultivar; por ello, a fin de reducir los efectos en los resultados de los tratamientos, los que pueden surgir producto de estas particularidades, los agrupa de acuerdo a su procedencia, y hace el ensayo durante un perodo de seis meses. Los resultados de la cosecha en kilos por parcela, obtenida en cada mes observado, se muestran en la siguiente tabla: Tabla
Rendimiento de tomate en kilos, por parcela, tratadas con abono orgnico, entre los meses de enero a junio del presente ao, en diferentes lugares del departamento de Lima

LUGARES Huaral Barranca Huaura Cajatambo Oyn Canta

ENE 274,3 245,2 227,8 301,2 308,5 312,0

FEB 285,2 261 241,8 289,4 273,9 315,8

MAR 270 255,3 228,9 302,2 288,5 317,8

ABR 285,5 260,8 278,2 306,8 298,5 322,4

MAY 233,7 244,2 228,6 302,7 282,3 288,6

JUN 223,4 250,2 229,9 271,7 290,3 292,5

Teniendo en cuenta estas evidencias, extraiga sus propias conclusiones y diga en qu mes sera ms conveniente sembrar los tomates. En todos los casos considere un riesgo de equivocarse del 1%. Solucin: El contraste de hiptesis se dar en los siguientes trminos: Ho: El rendimiento de tomate, tratados con abono orgnico, cultivados en los diferentes meses del ao, ser el mismo, pese a que las parcelas fueron ubicadas de acuerdo los lugares donde se cultivaron. H1: Por lo menos, en uno de los meses del ao, el rendimiento de tomate, tratados con abono orgnico, cultivados en los diferentes meses del ao, ser mayor que los otros meses, agrupando a las parcelas segn lugar donde se cultivaron. Claramente este experimento corresponde a un diseo de bloques al azar, donde los tratamientos corresponden a los meses del ao en que se sembraron el producto, y los bloques los lugares donde se hacen los cultivos.
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 51 de 69 Desarrollando los clculos que conllevan a este diseo, se obtiene la siguiente tabla: Tabla de ANVA Fuente variacin Mes del ao Lugares Error Total Suma Cuadrado 4098,291 22239,56 4328,68 30666,53 g.l 5 5 25 35 Cuad Medio 819,66 173,15 Fc(0,95;5,25) = Fc(0,99;5,25) = Prueba de Tukey. Si se considera que el nivel de significancia fuese del 1%, entonces contrastando Fr = 4,73 con el Fc(0,01, 5,25) = 3,85, se puede concluir, que efectivamente, por lo menos en uno de los meses del ao, se obtiene mejor rendimiento en las cosechas; para determinar en cul de los meses es eso posible, se har la prueba de Tukey; para esto, de los clculos desarrollados se obtiene que los promedios por meses de cosecha, fueron los siguientes: Meses Promedio Smbolo ENE 278.2 y.1 FEB 277.9 y.2 MAR 277.1 y.3 ABR 292.0 y.4 MAY 263.4 y.5 JU 259.7 y.6 2,65 3,85 Fr 4,73

Ordenndoles de mayor a menor y parendole, para obtener sus diferencias, entre cada uno de ellos, se obtiene el lado derecho de la matriz a partir de su diagonal: y.4 0 y.1 13,8 0 y.2 14,1 0,3 0 y.3 14,9 1,1 0,8 0 y.5 28,6 14,8 14,5 13,7 0 y.6 32,3 18,5 18,2 17,4 3,7 0

y.4 y.1 y.2 y.3 y.5 y.6

El coeficiente de Tukey al nivel de = 5%, es: q(=0,05; 6,30) = 4,30 y el DHS es 23,099, comparando este valor con la tabla de las diferencias de medias pareadas, se pueden concluir que solamente las diferencias de y.4 con y.5 y y.4 con y.6 son significativas, lo cual quiere decir, que solamente en el mes de abril es donde se obtiene mejores rendimientos; en los otros meses es insignificante.

EJERCICIOS 5.10. Explique la diferencia entre un diseo completamente al azar, frente a un diseo de bloques
al azar.

5.11. Se hace un estudio para saber si el nivel de gasto por da que desarrollan los turistas
extranjeros en el Per, provenientes de USA, Inglaterra, Alemania y Francia, depende de su procedencia; para ello se toman muestras aleatorias de nueve turistas de cada pas, con la
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 52 de 69 finalidad de conocer el promedio de gasto por da en US$, encontrndose los siguientes resultados:
Promedio de gasto por da en el pas, en US$, de los turistas extranjeros

Pas 1 2 3 4 5 6 7 8 9 USA 120 90 110 99 105 129 118 130 100 Alemania 133 110 95 95 100 110 100 125 130 Inglaterra 100 130 130 127 105 95 97 99 102 Francia 102 118 115 112 100 100 106 118 115 Encuentre la respuesta para este caso, asumiendo un nivel de significancia del 5%. 5.12. La siguiente tabla proporciona las notas promocionales de Estadstica y Matemtica, de un grupo de estudiantes de ingeniera cursados el ciclo anterior. Calificativo en Estadstica 00 05 05 10 10 - 15 23 17 12 6 15 14 8 4 24 19 26 5 15 20 8 16 5 2

Calificativo Matemtica 00 05 05 10 10 15 15 20

Podra asegurarse que las notas obtenidas por los alumnos, tanto en Estadstica como en Matemtica, guardan una relacin entre s, o es que son totalmente independientes? Sea = 5%. 5.13. Un casa comercial, especializada en el ensamblaje de equipos de cmputo, est por potar qu tipo de marca de discos duros (HD) de las marcas Quantum, Maxtor, Fireball o Seagate, deber adoptarse, a fin de incorporar a los nuevos modelos de PC, que piensa lanzar al mercado; para ello es preciso conocer el promedio de vida de estos HD, que se cree, mucho depender del lugar donde sea llevado la PC. Como los productos de la empresa son comercializados en todo el Per, en cuatro regiones del pas, se le somete a un proceso de simulacin del perodo de vida en aos, encontrndose los siguientes resultados:
Duracin simulada, en aos, de los discos duros en las cuatro regiones del pas:

Lima Arequipa Huancavelica Cerro de Pasco Puno

Quantum 5,2 5,3 4,7 4,4 4,8

Maxtor 5,1 5,8 5,2 4,6 5,0

Fireball Seagate 4,8 4,9 5,2 5,4 5,1 5,3 4,7 4,9 4,8 4,9

Los tcnicos que hicieron la prueba de duracin de estos HD, manifiestan que el promedio de vida de estos discos duros, es el mismo, pese a que trabajan en diferentes lugares del pas, usted, con los conocimientos que posee al presente, podra darles la razn? Considere un riesgo de equivocarse del 5%. 5.14. La Municipalidad de Huaura est investigando acerca del perodo de pago trimestral en el cumplimiento de pagos por concepto del impuesto predial, en todos sus clientes, conformados por contribuyentes de los siguientes tipos: Rural, Residencial, Comercial e Industrial. Para ello toma una muestra aleatoria entre todos los clientes que pagaron oportunamente sus impuestos el pasado ao, obteniendo la siguiente informacin:
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 53 de 69
Nmero total de clientes que pagaron sus respectivos impuestos prediales en los trimestres correspondientes

Tipo de cliente Rural Residencial Comercial Industrial

Trimestres del ao I II III 21 16 19 32 21 27 16 12 17 5 7 8

IV 21 30 21 6

Despus de eliminar los efectos, pagos por tipo de cliente, podran las autoridades municipales, concluir que los trimestres del ao, tienen diferentes efectos en el pago del impuesto predial?; considere = 0,025. 5.15. El departamento de ventas de una casa comercial dedicada a la venta de ropas exclusivas de hombres, est interesado en conocer si existe diferencias en las comisiones de ventas que perciben sus cinco vendedores en los das de atencin al pblico; los resultados de estos ingresos en S/ se indican en la siguiente tabla:
Ingreso de los vendedores por comisin de ventas en los das de la semana

Lunes Martes Mircoles Jueves Viernes Sbado

A 20 21 15 10 23 30

B 12 17 20 12 17 18

C 11 30 12 15 15 30

D 45 12 10 10 12 15

E 18 17 23 23 28 16

Podra asegurarse que existe diferencia en las comisiones de los vendedores, o es que esta diferencia solo se debe al azar?, asuma un nivel de significancia del 5%. 5.16. Se hace un estudio para saber si la estatura de las personas estaba ligado al lugar de donde provenan; para ello, en la ciudad de Huacho se toman muestras aleatorias de un grupo poblacional, de diferentes edades, quienes provenan de Huaraz, Oyn, Hunuco, Celendn y Sihuas, a quienes se les toma sus respectivas medidas en metros, encontrndose los siguientes resultados:
Estatura promedio, en metros, de una muestra de personas segn procedencia de origen y rango de edades

Rango de edad en aos 8 11 > 11 14 > 14 17 > 17 20 > 20 23 >

Huarz

Oyn

Hunuco

Celendn

Sihuas

1,34 1,42 1,67 1,70 1,68

1,28 1,41 1,70 1,69 1,69

1,36 1,43 1,58 1,62 1,66

1,42 1,44 1,65 1,72 1,70

1,45 1,46 1,73 1,71 1,72

A raz de estos datos, formule su contraste de hiptesis y explique sus conclusiones, asumiendo un riesgo de equivocarse del 5%. 5.17. En un centro de experimentacin agrcola se va estudiar los efectos de cuatro tipo de fertilizantes en el rendimiento de un tipo de tomate; para ello se dividen cinco parcelas de igual
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 54 de 69 tamao y forma, se los codifica y se les asigna al azar un tipo de fertilizante, de tal manera que esto se hace una sola vez. La siguiente tabla muestra los resultados de la cosecha segn parcela y fertilizante empleado:
Rendimiento de tomate en kilos por parcela, segn tipo de fertilizante utilizado

Tipo de fertilizante Parcela A B C D 1 50 45 44 51 2 55 56 44 52 3 45 45 56 41 4 48 43 58 40 5 40 41 47 44 Proporcionan estos datos, suficiente evidencia como para concluir que el rendimiento de tomate, est asociado al tipo de fertilizante y l parcela utilizada, considerando un nivel de significancia del 1%? 5.18. Considere los adjuntos de la tabla, sobre crecimiento de las plantas despus de la aplicacin de diferentes tipos de hormona del crecimiento. 1 13 17 7 14 21 2 21 13 20 18 13 Hormonas 3 18 15 20 19 8 4 7 11 18 8 10 5 6 11 15 10 15 6 11 9 14 7 15 a) Realice una prueba F al nivel del 5%. b) Qu sucede cuando se aplica la prueba Tukey? 5.19. Las instalaciones para generar energa nuclear producen gran cantidad de calor que, en general se descarga a cuerpos de agua. Ese calor eleva la temperatura del lquido, lo cual da como resultado una mayor concentracin de clorofila que, a la vez, alarga la temporada de crecimiento. Para estudiar este efecto, se tomaron muestras de agua en forma mensual en 3 estaciones durante un perodo de 12 meses. La estacin A es la que se ubica ms cerca de una descarga potencial de agua caliente, la estacin C es la ms lejana, y la estacin B, se encuentra dentro de estas dos estaciones; se registraron las dos concentraciones de clorofila : ESTACION Mes A B C Enero 9,867 3,723 4,410 Febrero 14,035 8,416 11,100 Marzo 10,700 20,723 4,470 Abril 13,853 9,168 8,010 Mayo 7,067 4,778 34,080 Junio 11,670 9,145 8,090 Julio 7,357 8,463 3,350 Agosto 3,358 4,086 4,500 Setiembre 4,210 4,233 6,830 Octubre 3,630 2,320 5,800 Noviembre 2,953 3,843 3,480 Diciembre 2,640 3,610 3,020
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 55 de 69 Realice un anlisis de varianza y pruebe la hiptesis de que con un nivel de significancia de 0,05, si hay diferencia en las concentraciones medias de clorofila en las 3 estaciones. 5.20. En un estudio realizado sobre efectos de componentes alimenticios, se asignaron 3 dietas durante un perodo de 3 das a cada uno de 6 sujetos, con el diseo mostrado abajo. Los sujetos que desempean el papel de bloques, recibieron las siguientes 3 dietas, en orden aleatorio: Dieta 1: grasas mixtas y carbohidratos, Dieta 2: muchas grasas, Dieta 3. Muchos carbohidratos. Al terminar el perodo de 3 das, se puso a cada sujeto en una banda caminadora y se midi el tiempo en segundos, en que quedaban exhaustos. Se registraron los siguientes datos: Sujeto Dieta 1 2 3 4 5 6 1 84 35 91 57 56 45 2 91 48 71 45 61 61 3 122 53 110 71 91 122 Efecte un anlisis de varianza para determinar si existe diferencia significativa entre las dietas. 5.21. Unos emprendedores estn interesados en invertir en la ciudad de Barranca, colocando una sucursal de servicios informticos, de tal manera que proporcione resultados en tiempo real y al costo mnimo; previo a ello desean saber si los potenciales clientes podran asociar su presencia al tipo de publicidad desarrollada; los clientes potenciales sern los estudiantes universitarios, los profesionales, los comerciantes, los agricultores y los docentes del magisterio; para ello se emprende un programa de difusin masiva mostrando las bondades del futuro negocio; los resultados de este programa se muestra en la siguiente tabla:
Resultados de satisfaccin en una muestra de clientes potenciales, de acuerdo al tipo de campaa publicitaria, a favor de la empresa de Servicios Informticos.

Tipo de campaa publicitaria Tipo cliente Radio TV Diario Perifoneo Volante Banderola Estudiantes 15 5 4 9 9 10 Profesionales 7 12 16 4 5 7 Comerciantes 13 5 4 12 15 13 Agricultores 8 7 3 9 12 11 Docentes del magisterio 9 10 8 13 7 12 Otros 6 11 2 7 9 8 De acuerdo a los resultados de esta tabla, qu podra sugerirle a estos emprendedores, asumiendo un riesgo de equivocarse el 5%?

5.22. Una compaa de seguros tiene que optar por escoger dentro de cuatro planes de seguros de
vida que actualmente ofrece a sus clientes; para ello desea conocer si la preferencia por algn plan de seguros de sus clientes est asociada a su nivel ocupacional. Se toma una muestra de un grupo de clientes usuarios de este plan, obtenindose los resultados mostrados en la siguiente pgina:

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 56 de 69
Plan de seguros optados por los clientes

Nivel ocupacional Obreros Comerciantes Profesionales Independientes

A 30 48 59 20

B 45 39 46 15

C 35 47 52 10

D 70 65 60 22

a. Podra asegurarse que el plan de seguros optado por los clientes nada tiene que ver con los tipos de clientes?, considere un riesgo de equivocarse del 1%. b. Qu debera pasar para decir que el plan de seguros optados por los clientes, est asociado a su nivel ocupacional, considerando un riesgo de equivocarse del 5%?

5.23. En un experimento para comparar la calidad de cuatro marcas diferentes de cintas de grabar
de carrete a carrete, se seleccionan cinco carretes de 800 metros de cada marca, determinndose el nmero de imperfecciones en cada uno. A 10 7 12 15 9 Marca de Carrete B 14 13 13 10 10 C 13 20 9 8 21 D 17 14 10 21 13 Se cree que el nmero de imperfecciones sigue una distribucin Poisson, para cada marca. Analice los datos al nivel de significancia del 1%, con el objeto de averiguar si el nmero esperado de imperfecciones por carrete es el mismo para cada marca; de otra manera, explique cules de las marcas es la que presenta mayor desconfianza. 5.24. Un distribuidor de equipos de cmputo est interesado en saber, si diferentes marcas de discos duros, HD, tienen diferentes tiempos de duracin, de acuerdo a las condiciones ambientales donde son utilizadas; para ello toma seis marcas diferentes de HD y se les somete a una prueba de simulacin de tiempo de duracin, a fin de determinar qu marca es la ms adecuada para comercializarlo; dado que considera que las condiciones ambientales no son las mismas en diferentes lugares del pas, los que podran influir en los clculos de la variabilidad total, los agrupa de acuerdo al lugar donde se hacen los ensayos; luego de un tiempo de observacin, logr configurar la siguiente tabla de ANVA, de manera incompleta: Tabla ANVA Fuente S.C. g.l. CM Fr Marcas de HD Lugar de prueba 30,75 7,86 Error 415 Total 29 a) Complete las celdas vacas de esta tabla. b) Formule un contraste de hiptesis para este experimento, y extraiga sus conclusiones, asumiendo un margen de equivocarse del 1%. Solucin:
a) La SCT es 1353,475; la SCTR = 815,475 y la SCB = 123; el resto continua. b) Contraste de hiptesis: H0: La duracin de las marcas de los HD ser la misma, pese a que estas estn clasificadas segn su lugar de procedencia. Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 57 de 69
H1: Por lo menos, una de las marcas de HD, tienen mayor duracin que las otras, pese a que estas fueron clasificadas segn el lugar de las condiciones climatolgicas donde estaban expuestas. Considerando que Fc(0,99; 5,20) = 3,70; debe aceptarse esta ltima hiptesis.

5.25. Una empresa textil trabaja a tres turnos, en razn de que debe satisfacer las grandes
cantidades de pedidos de sus clientes provenientes del exterior; sin embargo el departamento de control de calidad alega que este sistema de implementar turnos de trabajo no es conveniente dado que frecuentemente se encuentran fallas de calidad en las prendas confeccionadas por sus trabajadores, lo cual puede perjudicar la imagen de la empresa ante sus clientes. A fin de determinar si realmente existe este tipo de problemas como lo alega este departamento, se toman muestras de un grupo de trabajadores de los diferentes turnos y se les evala sus respectivos trabajos, a fin de determinar el nmero de fallas encontradas en las prendas producidas; los resultados de estos se encuentran en la siguiente tabla:
Resultados del muestreo hecho a una muestra de trabajadores, para determinar el nmero de fallas encontrados en las prendas confeccionadas

Estado de las prendas confeccionadas Mal Regular Aceptable Ninguna

Maana 5 4 16 7

Tarde 3 12 9 5

Noche 11 6 7 3

a. Podra asegurarse que lo manifestado por el departamento de control de calidad es vlido y no trabajarse con este sistema de turnos, o es que estos problemas pueden deberse a otros factores?; considere un riesgo de equivocarse del 5%. b. En el caso de darse la razn a control de calidad, por qu otro sistema debera optarse?

CUADRADO LATINO
En los diseos de bloque al azar, a fin de reducir los efectos de la variacin por efectos de su heterogenidad, se les agrupa en grupos homogneos, llamados bloques; en el cuadrado latino se tiene en cuenta dos factores de variacin y de igual modo, a los elementos muestrales se le agrupa teniendo en cuenta estos dos factores, y se asigna el respectivo tratamiento. Este diseo permitir configurar una serie de opciones, dependiendo del nmero de elementos con los que cuentan los factores; as los factores son de tres elementos, entonces el cuadrado latino estar formado por 3 x 3 = 9 celdas, donde en cada celda, solo se le asignar un tratamiento, sin que este se repita en su respectiva fila y columna. Ejemplo 5.3 Un empresario est interesado en introducir un nuevo producto al mercado, para ello utilizar diferentes medios publicitarios a fin de evaluar, en cules de ellos, los clientes recuerdan ms la publicidad del producto; dichos medios publicitarios sern: la Radio, la TV, los Diarios, los Perifoneos, las Revistas especializadas, y la emisin de Volantes, en esta publicidad se explicar las bondades del nuevo producto; sin embargo sus analistas de marketing consideran que los potenciales clientes, tambin podran estar influenciados por el lugar donde habitan, adems de los meses del ao en que se hace la publicidad; en este sentido, a fin de reducir la influencia en la suma
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 58 de 69 de los cuadrados de las varianzas totales, a estos potenciales clientes se los agrupa de acuerdo a estos rasgos homogneos y aleatoriamente se seleccionan a un grupo de clientes y tambin aleatoriamente se les asigna a uno de los medios publicitarios; luego se les pregunta si recordaba o haber visto la publicidad del producto a travs del medio publicitado; las respuestas mostradas en el diseo experimental, de manera incompleta se muestra en la siguiente tabla: Tabla
Nmero de veces que recordaba el cliente sobre la publicidad del producto, Utilizando diferentes medios publicitarios, y agrupados segn lugar de residencia y mes del ao

Lugar de residencia de los clientes potenciales Mes del ao Chimbote Huarmey Huaura Lima Ica Hunuco Enero C, 5 9 12 14 5 15 Febrero 15 7 5 8 9 D, 4 Marzo 14 E, 5 3 0 11 13 Abril 7 11 A, 6 10 13 8 Mayo 12 6 5 14 B, 9 2 Junio 14 16 9 F, 5 4 11 Donde: A = representa el medio publicitario como la Radio, B = la TV, C = los Diarios, D = Perifoneos, E = Revistas especializadas, y F = los Volantes. a) Complete con los tratamientos en cada una de las celdas de esta matriz. b) Evale los resultados de este experimento, asumiendo un riesgo de equivocarse del 5%. c) En los casos de que el experimento resultase positivo, indique, con cul de los medios publicitarios deber contar la empresa, a fin de llegar a un mayor nmero de clientes. Solucin: Una posible forma de diseo de cuadrado latino tiene la siguiente configuracin: Lugar de residencia del elemento en experimentacin Mes del ao Chimbote Huarmey Huaura Enero Febrero Marzo Abril Mayo Junio C, A, B, F, E, D, 5 15 F, B, 9 7 5 11 6 B, C, D, A, F, 12 5 3 6 5 9 Lima D, 14 E, 8 C, 0 B, 10 A, 14 F, 5 Ica E, 5 F, 9 A, 11 D, 13 B, 9 C, 4 Hunuco A, D, F, E, C, B, 15 4 13 8 2 11

14 E, 7 12 14 C, D, A,

16 E,

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 59 de 69 Siendo el problema un tema correspondiente a un cuadrado latino; los desarrollos de los elementos de informacin son: Mes del ao Enero Febrero Marzo Abril Mayo Junio Chimbote Huarmey Huaura Lima 5 15 14 7 12 14 9 7 5 11 6 16 12 5 3 6 5 9 14 8 0 10 14 5 Ica 5 9 11 13 9 4 Hunuco 15 4 13 8 2 11 53 2809 Ti.. 60 48 46 55 48 59 Ti..^2 3600 2304 2116 3025 2304 3481

T.j.. 67 54 T.j..^2 4489 2916 La suma de sus tratamientos: T..A T..B T..C T..D T..E T..F 77 63 27 54 47 48 Y..a T..a^2= 5929 = T..b^2= 3969 y..b = T..c^2= y..c = 729 T..d^2= 2916 y..d = T..e^2=2209 y..e = T..f^2= 2304 y..f =

40 51 51 1600 2601 2601

12.8 10.5 4.5 9.0 7.8 8.0

T.. = C= SCT = SCTR = SCColu = SCFila = SCE =

316.000 2773.778 622.222 235.556 62.222 31.222 293.222 TABLA ANVA Scuadrados g.l 235.556 62.222 31.222 293.222 622.222 F(0.95; 5,20)= 2.71

Fuente Tratamiento Columna Fila Error TOTAL

Cmedio Fr 5 47.111 3.213 5 5 20 14.661 35 35


Ciclo 2012-II Moiss E. Armas

Inferencia Estadstica

Pgina 60 de 69 Como podr apreciarse, el Fr es mayor que el Fc proporcionado por la tabla; por lo tanto deber rechazarse la hiptesis nula; debindose aceptar al alternativa, en el sentido, que por lo menos con uno de los medios publicitarios, las personas tienen tendencia a recordarse de la publicidad del producto. Con la prueba de Tukey se determina que el medio publicitario que tiene mayor efecto recordatorio es: la Radio, en comparacin a los otros medios, ya que el DHS = 6,722 y la nica diferencia de las medias pareadas entre Y..a Y..c = 8,3, es el nico valor que supera al DHS.

EJERCICIOS 5.26. El departamento de matemticas de una universidad, quiere evaluar las habilidades didcticas
de cuatro profesores; para eliminar cualesquiera de los efectos debidos a los horarios y cursos distintos de matemticas a lo largo del da, se decidi realizar un experimento utilizando el diseo del cuadrado latino, en el que las letras A, B, C, y D representaban a los cuatro profesores. Cada uno de ellos ense una parte de cada uno de los cuatro cursos programados en cuatro horarios distintos del da. Los datos siguientes muestran las calificaciones asignadas a los maestros por los 16 estudiantes de capacidad aproximadamente igual. Utilice un nivel de significancia de 0,05 para probar la hiptesis de que los distintos profesores no tienen ningn efecto en las calificaciones. Curso Horario Algebra Geometra Estadstica Clculo 1 A: 84 B: 79 C: 53 D: 93 2 B: 91 C: 84 D: 84 A: 81 3 C: 59 D: 48 A: 79 B: 82 4 D: 75 A: 55 B: 65 C: 61

5.27. Una empresa de manufactura desea investigar los efectos de 5 aditivos para el color en el
tiempo de preparacin de una nueva mezcla de concreto. Se esperan variaciones en los tiempos de preparacin debido a los cambios diarios de temperatura y humedad, as como a los distintos trabajadores que preparan los moldes de prueba. para eliminar estas fuentes extraas de variacin, se dise un cuadrado latino de 5 x 5, en el cual, las letras A, B, C, D y E representan los 5 aditivos. En la tabla que sigue se presentan los tiempos de preparacin en horas, para los 25 moldes: Da Trabajador 1 2 3 4 5 1 D:10,7 11,3 11,8 14,1 14,5 2 10,3 10,5 10,9 11,6 11,5 3 11,2 12,0 C: 10,5 11,0 11,5 4 10,9 11,5 11,3 11,7 12,7 5 10,5 10,3 7,5 11,5 B: 10,9

Complete las celdas de esta matriz, y con un nivel de significancia de 0,05, es posible decir que los aditivos para el color no tienen efecto alguno en el tiempo de preparacin de la mezcla de
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 61 de 69 concreto?, Si lo fuese as, cules seran los aditivos que influyen en el tiempo de preparacin de la mezcla de concreto? 5.28. Se hace un modelo de experimento para conocer la produccin de 6 variedades de trigo, utilizando 6 fertilizantes en 6 aos diferentes, cuyos resultados se muestran en la tabla siguiente:
Producciones de trigo en kilogramos por parcela, utilizando seis fertilizantes en seis aos diferentes

Aos Fertilizantes F1 F2 F3 F4 F5 F6 1 C; 70 81 70 63 62 75 2 75 60 62 63 67 80 3 80 71 A;63 66 61 50 4 65 80 87 52 F; 48 75 5 43 56 72 79 85 80 6 56 85 72 73 76 59

Haga un diseo experimental, completando las celdas de la matriz, y evale sus resultados, planteando correctamente sus contrastes de hiptesis, y asumiendo un riesgo de equivocarse del 5%. Considere que A, B,F, son las variedades de trigo, cuyas cosechas son las que figuran en la tabla.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 62 de 69

VI.

REGRESIONES SIMPLES

Ser original es una cualidad, quererlo ser es un defecto. Las personas afortunadas no se corrigen nunca, siempre creen tener razn, incluso en sus malas acciones. Triunfan aquellos que saben cundo luchar y cundo no. La mujer llora antes del matrimonio, el hombre despus.

A menudo existe la necesidad de estudiar la relacin entre dos variables; as nos interesara saber qu relacin existe entre el peso de las madres gestantes y sus respectivos bebs; o qu relacin existe entre las notas obtenidas por los alumnos, cuando dedican un determinado nmero de horas de estudio a la semana. En estas y otras situaciones, podramos tratar de encontrar una relacin entre estas dos variables; para ello, de una serie de observaciones encontradas entre estas dos variables, podemos representarlo grficamente, utilizando el sistema de coordenadas cartesianas, para ello identificamos la variable independiente y la variable dependiente; a la variable independiente lo podemos denotar por x y a la variable dependiente por y; de esta manera, podemos plotearlo en el plano X-Y, y seguramente podramos encontrar una representacin grfica como el siguiente: En este grfico nos interesar encontrar una curva terica que nos permita explicar el comportamiento de estas observaciones; una de esas curvas, la ms sencilla sera una recta de la forma = a + b*x, que lo podemos trazar, tratando de que la mayor cantidad de puntos, estn lo ms cerca posible a la recta estimada, de all podramos obtener por extrapolacin los valores de a y b, los cuales podran explicar el comportamiento terico de estas observaciones. Ejemplo 6.1 Considere el caso de que se asuma que el rendimiento acadmico de los alumnos, est asociado al nmero de horas dedicadas al estudio semanalmente; en este sentido se ha hecho la averiguacin posible con una muestra de alumnos seleccionados al azar, cuyos resultados se muestran en la siguiente tabla: Horas/estudio 25 20 22 30 31 36 40 18 22 15 10 21 Promedio 12 11 12 15 16 14 18 10 10 7 8 10 acadmico Construyendo su nube de puntos, de estas dos relaciones se obtiene la figura adjunta, en el cual se puede apreciar tambin la recta que permite construir un modelo terico que permita explicar este comportamiento.

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 63 de 69

17.50

15.00

NotaFinal

12.50

10.00

Sq r lineal = 0.869 7.50

10.00

15.00

20.00

25.00

30.00

35.00

40.00

Horas estudio/semana

__ __ Ejemplo 6.2 Considere que una empresa est interesado en conocer la relacin existente entre los gastos en publicidad y los ingresos obtenidos, por ventas de Laptop; para ello la tabla siguiente muestra el comportamiento de estas dos variables. Tabla 6.2
Ingresos en Nuevos Soles por ventas de Laptop, segn gastos desarrollados en publicidad

Gastos en Publicidad X 2560 3201 4500 4800 5238 5493 6394 6521 7368 8891
Inferencia Estadstica

Ingresos por gastos en publicidad Y 10239 12303 21753 21392 28736 25439 34547 27653 38450 36827
Ciclo 2012-II Moiss E. Armas

Pgina 64 de 69 A fin de simplificar los procedimientos de clculo, se usar el SPSS; para ello en su editor, defina las variables X como numrica, con etiqueta Publicidad; de igual manera Y como numrica con etiqueta Ingreso; en lista de variables introduzca los datos segn corresponda a cada columna. En el men principal escoja la opcin: Analizar Regresin Estimacin curvilnea; cuando aparezca esta ventana, donde diga Dependientes, introduzca con el cursor Ingreso (Y), y en Independientes, Variable introduzca con el cursor Publicidad (X) ; con esto estn definidas las dos variables, independiente y dependiente, donde podr escoger los modelos de regresin deseados; en este caso, al pie de Modelos, marque con el cursor las opciones: Lineal, Potencia, Exponencial; luego pulse la opcin Aceptar, observar la tabla de resultados como los siguientes: Tabla Coeficientes(a) Coeficiente s estandariza dos Beta

Modelo

Coeficientes no estandarizados B

t Lmite inferior -.123

Sig. Lmite superior .905 .000

Intervalo de confianza para B al 95% Error tp. 7761.0 -8636.365 59 3.344 6.179 B

Error tp. 1 (Constante) 3555.37 -437.653 6 Publicidad 4.761 .615 a Variable dependiente: Ingreso

.939

7.745

Esta tabla proporciona los coeficientes del modelo de regresin lineal; si el modelo estimado tiene como ecuacin Y = a + b*X, entonces a = -437,653 y el coeficiente b = 4,761. La siguiente tabla proporciona el anlisis de varianza que valida la ecuacin obtenida; en este caso podr apreciar que el Fr = 59,982, el cual contrastado con el Fc(0,005, 1,8) = 5,12, puede apreciarse que el modelo es vlido. ANOVA(b) Media cuadrtic a 73267149 1 5.788 12214809 8 .889 9

Model o 1

Suma de cuadrados Regresin Residual 732671495.788 97718479.113

gl

F 59.982

Sig. .000(a)

Total 830389974.900 a Variables predictoras: (Constante), Publicidad b Variable dependiente: Ingreso

La siguiente tabla proporciona los resmenes de los coeficientes de sus Fr y sus constantes y coeficientes segn los modelos requeridos.
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 65 de 69 Resumen del modelo y estimaciones de los parmetros Variable dependiente: Ingreso Resumen del modelo R cuadrado F gl1 gl2 Lineal .882 59.982 1 8 Potencia .934 112.615 1 8 Exponencial .842 42.511 1 8 La variable independiente es Publicidad. Ecuacin Estimaciones de los parmetros Constant Sig. e b1 .000 -437.653 4.761 .000 1.315 1.146 .000 7263.806 .000

El siguiente grfico, proporciona el diagrama de dispersin y los modelos tericos, segn lo solicitado.

__

EJERCICIOS
6.1 Qu diferencias existen entre una relacin causal y una serie de tiempos? Mediante ejemplos, 6.2 6.3 6.4 6.5

sustente sus respuestas. Explique geomtricamente el significado de a y b, en los modelos de regresin. Por qu se dice que una ecuacin de regresin simple, se basa en el mtodo de los mnimos cuadrados? Qu explica el coeficiente de determinacin y el coeficiente de correlacin en una ecuacin de regresin? Se realiz un estudio sobre la cantidad de azcar convertida, en cierto proceso, a distintas temperaturas. Los datos se codificaron y registraron como sigue:
Ciclo 2012-II Moiss E. Armas

Inferencia Estadstica

Pgina 66 de 69 Temperatura Azcar convertida a) b) c) d) e) 1,0 1,1 8,1 7,8 1,2 8,5 1,3 9,8 1,4 9,5 1,5 8,9 1,6 8,6 1,7 10,2 1,8 9,3 1,9 9,2 2,0 10,5

Construya su diagrama de dispersin y tantee su curva de tendencia. Estime y analice su coeficiente de covarianza. Estime y analice su coeficiente de determinacin. Estime la recta de regresin lineal. Calcule la cantidad media de azcar convertida que se produce cuando la temperatura registrada es 1,75. f) Grafique los residuos contra la temperatura; comente el resultado. g) Valide su modelo, considerando un riesgo de equivocarse del 5%. h) Estime un intervalo de confianza del 95%, para esta recta de regresin. i) Utilice el SPSS, para obtener su modelo de regresin y compruebe con lo obtenido manualmente. 6.6 Un comerciante al detalle realiz un estudio para determinar la relacin que hay entre los gastos de publicidad semanal y las ventas; registr los datos siguientes: Costo publicidad S/ 40 20 25 20 30 50 40 20 50 40 25 50 Ventas S/ 385 400 395 365 475 440 490 420 560 525 480 510 a) Elabore un diagrama de dispersin. b) Determine su coeficiente covarianza. c) Elabore su ecuacin de regresin para pronosticar las ventas semanales, a partir de los gastos en publicidad. d) Estime las ventas semanales cuando los costos en publicidad sean de S/ 35. e) Valide su modelo al 1%. f) Encuentre un intervalo de confianza del 95%. 6.7 El empuje de un motor (y) es funcin de la temperatura de escape (x) en F, cuando otras variables de importancia se mantienen constantes. Considere los siguientes datos: y x y x 4300 1760 4010 1665 4650 1652 3810 1550 3200 1485 4500 1700 3150 1390 3008 1270 4950 1420 a) Ajuste a una recta de regresin simple y valdelo, asumiendo un riesgo de equivocarse del 5%; luego estime un intervalo de confianza del 95%, para predecir el comportamiento del empuje del motor en la medida que la temperatura vaya incrementndose. b) Con el intervalo de confianza obtenido, estime el empuje del motor, cuando la temperatura sea de 1300F. 6.8 La cantidad de poblacin de una determinada regin tuvo el siguiente comportamiento a travs de los aos: Ao 1950 1960 1970 1980 1990 2000 2010 N habitantes 23 723 12 465 7 654 6 907 4 632 3 681 2 637

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas

Pgina 67 de 69 a) Encuentre su covarianza, as como su coeficiente de correlacin y coeficiente de determinacin; analice estos resultados. b) Dibuje su diagrama de dispersin y encuentre una ecuacin de regresin simple, luego valdelo al 5%. c) Confronte sus resultados con un modelo de regresin exponencial, y diga cul de ellos es el mejor, sustentando sus respuestas cuantitativamente. d) Construya un intervalo de confianza del 95%, y estime cuntos habitantes se tendra en el 2005. e) Estime la poblacin que tuvo en 1940. f) Estime la poblacin que tendr al 2020. g) Qu puede explicar sobre el comportamiento de estos datos? 6.9 Segn tendencias obtenidas, de acuerdo a estudios estadsticos, la poblacin de un pas presenta un crecimiento explosivo como se muestra a continuacin: Ao 1940 1950 1960 1970 1980 1990 2000 2010 N habitantes 7 320 8 654 10 116 13 189 15 472 21 682 25 485 28 626 a) De acuerdo a su diagrama de dispersin, qu caractersticas presenta este crecimiento poblacional, y qu tipo de modelo de regresin podra utilizarse? b) Qu caractersticas presenta su coeficiente de correlacin lineal? c) Encuentre un modelo regresin, y valdelo al 5%. d) Cuntos habitantes se espera tener el ao 2020 y cuntos el ao 2030? e) Cuntos habitantes hubieron el ao 2005? f) Qu acciones de previsin debera tomarse para los prximos dos decenios, ante este crecimiento poblacional? 6.10 La alta densidad de la poblacin de un determinado pas genera un sin nmero de problemas de consumo de recursos, as como su eliminacin; de esa manera, una empresa disea una mquina compresora para procesar lodos de las lagunas de oxidacin de sus aguas servidas; as se relaciona el contenido de humedad de grnulos comprimidos en % con la velocidad de filtracin de la mquina en kh-DS/m/h. Los siguientes datos muestran resultados de la investigacin, de las relaciones entre estas dos variables: Velocidad 125,3 98,2 201,4 147,3 145,9 124,7 112,2 120,4 161,2 178,9 159,5 145,8 75,1 % 77,9 76,8 81,5 79,8 78,2 78,3 77,5 77,0 80,1 80,2 79,9 79,0 76,7 humedad

a) Encuentre una curva de tendencia para explicar el comportamiento de estas observaciones, utilizando el mtodo de los mnimos cuadrados. R: Y = 72.824 + 0.0424X; b) Qu explica su coeficiente de determinacin? r2 = 89,13% (El 89,13% de los valores observados de y,
quedan explicados dentro de la ecuacin de regresin) ; r = 94,41% (El 94,41% de las observaciones estn correlacionados) c)

Valide esta curva de tendencia, considerando un riesgo de equivocarse del 1%. R: el modelo se
acepta dado que Fr= 90,174.

d) Utilizando el SPSS, encuentre un modelo polinomial de grado 3 y confronte sus resultados con el modelo lineal.
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 68 de 69 e) Establezca los intervalos de confianza al 95%, de modo que pueda establecerse un margen de pronstico. f) Estime el porcentaje de humedad que se alcanzara cuando la velocidad sea de 160. g) Si el porcentaje de humedad encontrado fue de 90%, a qu velocidad de oxidacin se espera estar trabajando?
6.11

Por problemas de extrema pobreza, la poblacin de un centro poblado ubicado en la sierra norte de Lima, tiende a migrar hacia otras ciudades, donde supuestamente pueden mejorar sus condiciones de vida; de este modo se ha podido comprobar que la poblacin local, solamente se va quedando con personas mayores y con nios, segn se muestra en la siguiente tabla: Ao de censo 1950 1960 1970 1980 1990 2000 Poblacin censada 21 602 18 574 16 105 11 638 9 244 9 058

Formule y valide al 5%, un modelo de regresin simple para explicar el comportamiento poblacional de esta localidad, y estime: a) Nmero de habitantes que se espera, tendr la localidad al ao 2010. b) En qu ao, se espera que la localidad se quede sin ningn habitante?
6.12

En el mercado informtico se observa que a medida que los mrgenes de ganancia por un tipo de software desarrollado, se incrementan, los volmenes de oferta tambin siguen el mismo comportamiento; los resultados histricos as lo determinan, segn se muestra en la siguiente tabla:
Evolucin del comportamiento de la oferta de software

Margen de ganancia Cantidad de en US$ por software software ofrecido vendido 50 10 180 14 100 23 130 28 150 32 200 61 270 89 315 95 a) Formule un modelo de comportamiento polinmico de estas observaciones, validndole al 5%, y estime la cantidad de software que se espera ofrecer si la ganancia esperada fuera de $ 350. b) Explique el comportamiento de su coeficiente de determinacin y el su coeficiente de correlacin.
Inferencia Estadstica Ciclo 2012-II Moiss E. Armas

Pgina 69 de 69 c) Encuentre un intervalo de confianza del 95% de confianza para estimar los mrgenes de ganancia, cuando la cantidad de software vendido, se incremente. d) Podra aceptarse este modelo, dentro del marco de la racionalidad, como vlido, para estimar futuras mrgenes de ganancia? 6.13 En determinado lugar del pas, a travs del tiempo, se ha observado que a medida que los precios de las computadoras han ido disminuyendo, el volumen de ventas ha ido aumentando, conforme se puede apreciar en la siguiente tabla. Precio de las Cantidades de computadoras en computadoras miles de US $ vendidas 8,0 12 7,0 13 5,0 18 4,0 22 2,5 34 1,5 51 1,0 69 0,5 108 Formule y valide, a un nivel de significancia del 1%, un modelo matemtico del comportamiento de ventas de las computadoras, y estime las cantidades que podran venderse si los precios fueran de $ 0,40 y $ 10. Sug. Pruebe con el modelo hiperblico 6.14 Una empresa dedicada a la venta de refrescos de jugo de cocona, reporta que sus ventas anuales durante los ltimos cuatro aos, variaron de acuerdo a la estacin climatolgica, segn reporta en la siguiente tabla:
Venta en miles de botellas de refrescos de cocona de 500 ml., entre los aos 2008 y 2011 en la provincia de Lima

AOS 2008 2009 2010 2011

VERANO 200 210 217 231

OTOO 182 193 208 219

INVIERNO 170 181 193 207

PRIMAVERA 196 205 211 225

Pronostique las ventas de estas bebidas para los prximos cuatro aos.
6.15

Inferencia Estadstica

Ciclo 2012-II

Moiss E. Armas