Está en la página 1de 86

Curso de Estadística Básica

Ingeniería Industrial
11/07/2011 Instituto Tecnológico Superior de Tierra Blanca I.I VIRIDIANA SÁNCHEZ VÁZQUEZ

Curso de Estadística Básica ESTRUCTURA DEL CURSO

• Conceptos basicos • Distribución de frecuencias

• Pruebas de hipótesis • Regresión Lineal

Día 1

Día 2

• ANOVA • Diseño de Experimentos

D ía 3
Instituto Tecnológico Superior de Tierra Blanca Página 2

Tema 1: Introducción a la Estadística Una meta común e importante de la materia de estadística es la siguiente: aprender acerca de un grupo grande examinando los datos de algunos de sus miembros. En dicho contexto los términos muestra y población adquieren importancia. Las definiciones formales de estos y otros términos básicos se muestran a continuación Datos: son las observaciones recolectadas (como mediciones, géneros, respuestas de encuestas). Estadística: es un conjunto de todo el plan de estudios experimentos, obtener datos y luego organizado, resumió, presentar, analizar, interpretar y llegar a conclusiones basadas en datos. Población: es el conjunto completo de todos los elementos (puntuaciones, personas, medidas, etc.) Que se va a estudiar. El conjunto es completo porque incluye a todos los objetos que se estuvieran. Censo: es el conjunto de datos de cada uno de los miembros de la población. Muestra: es un conjunto de miembros seleccionados de una población. • • Los datos muestran les deben reunirse de una forma adecuada, como a través de un proceso de selección aleatoria. Si los datos muestran les no se reúnan de la forma apropiada, resultaron tan inútiles que ninguna cantidad de estadística podrá salvarnos.

Estadística Descriptiva. Es la parte de la Estadística dedicada a colectar, organizar, resumir, presentar y analizar datos. Estadística Inferencial. Es la parte de la Estadística dedicada a generar conclusiones válidas acerca de las características de “la fuente” de donde fueron obtenidos los datos. Muestra Aleatoria. Es una muestra obtenida de la población de tal manera que todas las posibles Muestras de igual número de observaciones tienen la misma probabilidad de ser seleccionada. En otras palabras, en una muestra aleatoria solo el azar es “quien decide” que elementos están en la muestra, se debe evitar cualquier procedimiento que involucre la participación del investigador ya que inconscientemente se podría sesgar el muestreo y se no representativo de la población. Se dice que una muestra aleatoria es representativa de la población cuando tiene las mismas características de la población, y el muestreo aleatorio es la manera con mayores posibilidades de obtener una muestra representativa.

TIPOS DE DATOS Concepto clave en la materia de estadística se trata totalmente de utilizar datos muestrales para ser inferencias se (o generalizaciones) sobre una población completa. Debemos saber y entender las definiciones de población, muestra, parámetro y estadístico, ya que son básicas y fundamentales. También necesitamos reconocer la diferencia entre datos cuantitativos y datos cualitativos. Tenemos que entender que algunos números, como los códigos postales, no son cantidades en el sentido de que realmente mide no cuenten algo. Los códigos postales son. En realidad, ubicaciones geográficas, por lo que no tiene sentido hacer cálculos con ellos, como calcular su promedio. En esta sección se describen distintos aspectos de la naturaleza de los datos muestran les, los cuales pueden afectar de manera importante los métodos estadísticos que se utilicen con ellos. Definiciones Parámetro es una medición numérica que escribe algunas características de una población. Estadístico es una medición numérica que describe algunas características de una muestra. Los datos cuantitativos consisten en números que representan conteos con mediciones. Los datos cualitativos (o categóricos poder atributo) se dividen en diferentes categorías que se distinguen por algunas características no numéricas. Los datos discretos resultan cuando el número de valores posibles en un número finito un número que “puede contarse” (es decir, el número de valores posibles es 0,1, 2, etcétera). Uno los datos continuos (numéricos) resultan de un infinito de posibles valores que corresponden a alguna escala continua que cubre un rango de valores sin huecos, interrupciones o asaltos. Niveles de medición El nivel de medición nominal se caracteriza por datos que consiste en exclusiva mente en nombres, etiquetas o categorías. Los datos no se pueden acomodar en un esquema de orden (como demás bajo al más alto). Ejemplos veamos algunos ejemplos de datos muestrales a nivel de medición nominal. 1. Sí/no/indeciso: respuesta es decir, no e indeciso en una encuesta. 2. Colores: los colores de los automóviles conducidos por estudiantes universitarios (rojo, negro, azul, blanco, magenta, púrpura, etcétera)

tercero. Por ejemplo. la diferencia entre la ciudad de nueva York y Boston no se puede comparar de forma cuantitativa con la diferencia entre San Luis y Filadelfia. los datos son ordinales no deben utilizarse para hacer cálculos como promedios. Sin embargo. segundo. etcétera) determinan un orden. Las calificaciones de un curso: un Profesor universitario asigna calificaciones de A. una revista ordena las ciudades de acuerdo a su “ habitabilidad”. . Dichos valores están ordenados. pero estos números no tienen un significado computacional real y cualquier promedio que se calcule carece de sentido. Por ejemplo. Ejemplos veamos algunos ejemplos de datos muéstrales a nivel de medición ordinal. D o F. sabemos que A es mayor que B (por lo que hay un orden). aunque no es posible determinar diferencias entre tales calificaciones. aunque no es posible determinar diferencias entre los valores de los datos con tales diferencias carecen de significado.4°F. La diferencia entre la primera y la segunda ciudades no es la misma que la diferencia entre la segunda y la tercera ciudades. 1. no se deben utilizar para hacer cálculos. B. y podemos determinar su diferencia de 0. Dicho rangos (primero. Sin embargo. pero esta diferencia de 1 no tiene significado porque no es una cantidad exacta que sea comparable con otras diferencias de este tipo. Los datos están en el nivel de medición ordinal cuando pueden acomodarse en algún orden.Puesto que los datos nominales carecen de orden y no tienen un significado numérico. no podemos restar B de A (por lo que no se puede calcular las diferencias) 2. Tales calificaciones se pueden ordenar. pero con la propiedad adicional de que la diferencia entre los valores de datos cualesquiera tiene un significado. D. los datos en este nivel no tienen punto de partida cero natural inherente (donde nada de la cantidad está presente). 1. Utilizando los rangos de la revista. Sin embargo. Por lo General. Ejemplos los siguientes ejemplos ilustran el nivel de medición de intervalo. Los datos ordinales proporcionen información sobre comparaciones relativas pero no las magnitudes de las diferencias.2 °F y 98. las diferencias entre los rangos no tiene ningún significado. Pareciera que el Valor de 0 °F no es un punto de partida cero natural. la diferencia “del segundo menos el primero” sugeriría 2-1 = 1. aunque en ocasiones esta norma se infringe (como sucede cuando utilizamos calificaciones con letras para calcular una calificación promedio). no existe un punto de inicio natural. Temperaturas: las temperaturas corporales de 98. El nivel de medición de intervalo se parece al nivel ordinal. sería incorrecto decir que 50°F es dos veces más caliente que 25°F. En ocasiones se asigna números a las distintas categorías (especialmente cuando los datos e codifican para utilizarse en computadoras). C.6° F son ejemplos de datos a nivel de medición intervalo. Rangos: con base en varios criterios.

Esos: los presos (en quilates) de anillos de compromiso de diamante (el cero realmente representa la ausencia de 4 quilates que es dos veces el peso de 2 quilates). En nivel de medición de razón es similar a nivel de intervalo. 2008. (El tiempo no inician en el año cero. Nivel Nominal Resumen Ejemplo de Solo categorías.1776 y 1492. los presos están en el nivel de razón. Para una comparación y un repaso concisos. pero con la propiedad adicional de que sí tiene un punto de partida cero natural (donde el cero indica que nada de la cantidad está presente). tanto las diferencias como las proporciones tienen significado. 1. estudie la siguiente tabla que señala las diferencias entre los cuatro niveles de medición. por lo que el año cero es arbitrario y no constituye un punto de partida cero natural que represente “la ausencia de tiempo”). Sugerencia: para simplificar esta diferencia. Precios: los precios de libros de texto universitarios ($0 realmente representa ningún costo y un libro de $90 es tres veces más caro que un libro de $30). Ordinal De intervalo Automóviles de los participantes: 3 medianos 2 compactos Las diferencias tienen un significado pero no hay Temperaturas de Tierra punto de partida cero natural y los cocientes no Blanca: tienen significado 20 ºC 40 ºC 50 ºC . Para valores a este nivel. Puesto que un preso de 200 libras estos meses más pesado que un peso de sien libras pero 50°F no es dos veces más caliente que 25°F. Este nivel de medición se denomina de razón porque el punto de partida cero hace que las razones poco sientes tengan significado. así como el uso de proporciones que significan “dos veces” y “tres veces”. 2.2. los datos no pueden acomodarse Origen en un esquema de orden. Daños: los años 1000. utilice una sencilla “prueba razón”: considere dos cantidades en las cuales un número es dos veces en otro y pregunté seis y “dos veces” sirve para describir correctamente las cantidades. Entre los cuatro niveles de medición. Observé la presencia de un Valor ser natural. Ejemplos los siguientes ejemplos de datos al nivel de medición de razón. participantes: 1 Córdoba 1 Orizaba 1 Puebla Las categorías están ordenadas pero no hay diferencias o carecen de significado. mientras que las temperaturas faringe y están en el nivel de intervalo. la principal dificultad surge del distinguir entre los niveles de intervalo y de razón.

En la actualidad el 42% de los gobernadores de las 50 entidades de Estados Unidos son demócratas. se encontró que 706 sobrevivieron cuando se hundió. 5 Km 10 Km 220 Km EJERCICIOS: Consulte el conjunto de datos de la OECD que da información sobre censos. R= . Distancia de traslado de los participantes. datos económicos y comerciales de 29 países.De razón Hay un punto de partida cero natural y los cocientes tienen significado.58 (según los datos de la oficina censal mexicana) R= . determine cuales son variables cualitativas y cuales son cuantitativas.. Determine si el valor dado es un estadístico o un parámetro 1. 3. 2... .En un estudio de los 2223 pasajeros del Titanic. Variable Tipo X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 Escriba la respuesta que considere correcta Si un experimento produce datos que son de naturaleza continua.Se selecciona una muestra de hogares y la media de personas por familia es de 2. ¿los datos también pueden ser cuantitativos o pueden ser cualitativos? . R= . de acuerdo a las variables presentadas en la tabla.

Una muestra de respuesta voluntaria (o muestra auto seleccionada) es aquella en que los propios sujetos deciden ser incluidos. Otro 5% dijo que sí.. Calificaciones de los participantes al curso de estadística. Por ejemplo. Cuando Newsweek o alguien más hace una encuesta por internet. ningún método estadístico es capaz de producir resultados válidos. Es importante saber que cuando los datos muéstrales se reúnen de manera inapropiada.Número de billetes de $20 en circulación en México. 3. no recomendado”. por lo que .. R= Pensamiento Crítico Esta sección está diseñada para ilustrar la forma en que se utiliza el sentido común cuando pensamos críticamente acerca de datos y estadísticos. . 1. En esta sección. La siguiente definición se refiere a uno de los usos incorrectos de la estadística más comunes y graves.. . MSNDC. Número de estudiantes matriculados en el ITSTB. COM. porque continúa siendo más barato que comprar los CD. R= . 2. los propios individuos deciden participar. .Las calificaciones que da la revista del consumidor recomendado. R= 3.Los números en las camisetas de los corredores de maratones R= 2.. . .La distancia que recorren los estudiantes para llegar a la escuela R= 5. . R= 6. que estuvo permitiendo el libre acceso a la copia de CD musicales. 4. como cuando se utiliza una muestra de respuestas voluntarias (que se define más adelante en esta sección).. que se sentirían más cómodos utilizándolo por una cuota.Los números de seguridad social R= .. a los lectores se les planteó la siguiente pregunta: “¿continuará utilizando Napster si tuviera que pagar una cuota?” los lectores podían registrar sus respuestas en el sitio web Newsweek. De las 1873 respuestas recibidas.Determine si los valores dados provienen de un conjunto de datos discretos o continuos 1. Cantidad de horas de estudio por semana de los estudiantes. R= Determine cuál de los cuatro niveles de medición es el más apropiado. hay que enfocarse en el pensamiento y el uso del sentido común al analizar datos. la revista Newsweek hizo una encuesta sobre el controvertido sitio web Napster. en cada momento.Velocidad de un coche (km/h) R= . de “la mejor compra. en vez de memorizar métodos o procedimientos específicos. el 19% dijo que sí.

de radio o de periódicos le piden que llame voluntariamente a un número especial para registrar su opinión. las personas con opiniones extremas son más proclives a participar. el Children´s Defence Fund público Children Out of School in America. Gráficas Las gráficas. provocando que los lectores crean de manera incorrecta que la diferencia es mucho mayor de lo que realmente es. aunque una práctica común consiste en afirmar o sacar conclusiones incorrectas sobre una población más grande. S. describe los mismos datos obtenidos de u. La figura enseña una lección importante: para interpretar de manera correcta una gráfica. de los estudiantes de secundaria suspendidos en una region. Como el eje vertical no inicia en cero. por su naturaleza. ¡Pero esta cifra está basada en una muestra de tan sólo tres estudiantes! Los informes en los medios de comunicación no mencionaron que el tamaño de la muestra era muy pequeño. Encuestas telefónicas. un como las de barras y las de pastel (circulares). (En el capítulo dos analizaremos diferentes tipos de gráficas). Muestras pequeñas Las conclusiones no se deben basar en muestras demasiado pequeñas. una muestra de este tipo es defectuosa y no debe usarse para hacer afirmaciones generales sobre una población más grande. el 67% fueron suspendidos al menos 3 veces. Con este tipo de muestras de respuesta voluntaria sólo se logran conclusiones válidas sobre el grupo de gente específico que decidió participar. Encuestas por correo. donde anuncios televisivos. donde se reporto que. donde los sujetos decía si responden o no. la gráfica del inciso B) tiende a producir una impresión subjetiva engañosa. . Sin embargo. tenemos que analizar la información numérica que va presentar. donde los sujetos deciden si responden o no. se muestra se décadas como éstas: • • • Encuestas por internet. tienen graves errores y no deberíamos obtener conclusiones sobre una población. por lo que su respuesta no son representativas de toda la población. Como ejemplo. Desde un punto de vista estadístico. se pueden utilizar para exagerar O subestimar a la verdadera naturaleza de los datos. BUREAU OF ECONOMIC ANALYSIS. su estado vecino. para no engañarnos por su forma General. Las dos gráficas de la figura que se muestra abajo. aunque en el inciso B) está diseñado para exagerar la diferencia entre el ingreso personal per cápita en California y nevada. A continuación se presentan algunos ejemplos de muestras de respuesta voluntaria que.constituye una muestra de respuesta voluntaria.

sino que aumenta en un factor de ocho. barriles (para la producción de petróleo) y casas (para la construcción de viviendas). En la figura a) parece que estados unidos consume aproximadamente cuatro veces un más petróleo que Japón. Si usted duplica cada lado de un cubo. el inciso b) de la figura se dibujó con barriles. Instituto Tecnológico Superior de Tierra Blanca Página 10 . también suelen ser confusos. en los que cada dimensión está dibujado en proporción a las cantidades reales vea como la figura B) exagera mucho la diferencia al crear la falsa impresión de que el consumo de petróleo en estados unidos es aproximadamente 50 veces mayor que en el de Japón. el volumen no solamente se duplica. Al dibujar este tipo de objetos artistas podrían crear falsas impresiones que distorsionan las diferencias.Pictogramas los dibujos de objetos. sino comenta en un factor de cuatro. sacó de monedas y tanques del ejército (para gastos militares). como las bolsas de dinero. Algunos objetos que se utilizan comúnmente para describir datos son los objetos tridimensionales. Sin embargo. Si usted duplica cada lado de un cuadrado. el área no tan sólo se duplica. llamados pictogramas. Vea la figura donde el inciso a) está dibujado para describir correctamente la relación entre el consumo diario de petróleo en estados unidos y Japón.

Sin embargo. como los individuos con bajos ingresos que son menos proclives a reportar cuánto dinero gana. el 24 % culpo al tránsito y el 57% culpó a la industria. Al referirse la pérdida de equipaje. Estas pueden estar “cargadas” o redactadas intencionalmente para obtenerlas respuesta deseada. continental Airlines publicó anuncios que afirmaban que se trataba de una haría que “mejoraron un 100% durante los últimos seis meses”. Observé estas preguntas de una encuesta aplicada en Alemania: • • ¿Cree usted que el tránsito vehicular contribuye a la contaminación del aire más o menos que la industria? ¿Cree usted que leyendo se contribuye la contaminación del aire más o menos que el tránsito vehicular? Cuando se presentó primero el tránsito. (No se requiere del 110 % de esfuerzo para entender esta afirmación). Cuando se plantean preguntas de crecido en los últimos años.Porcentajes En ocasiones utilizan porcentajes confusos o poco claros. Falta de respuesta Existe una falta de respuesta cuando alguien se rehúsa a responder una pregunta de encuesta o cuando la persona no está disponible. la está tomando toda. el new York times interpretado correctamente que la cifra de mejora de un 100% significa que ya no se pierde el equipaje: un logro que todavía no disfruta continental Airlines. Si usted toma el 100% de alguna cantidad. algunos datos faltan debido a factores especiales. iniciando con un argumento de venta similar a un encuesta de opinión. Datos faltantes En ocasiones los resultados se ven muy afectados por datos faltantes. lo cual implica que la posibilidad de que falte un dato no tiene ninguna relación con sus valores u otros valores. Instituto Tecnológico Superior de Tierra Blanca Página 11 . A veces faltan datos muéstrales por el azar. Preguntas predispuestas hay muchos aspectos que afectan las preguntas de encuestas. el 45% culpo a este factor. y el 27% a la industria. En un editorial el que criticaba de estadística. cuando la industria se presentó primero. Observe las tasas reales de la respuesta “sea” para las diferentes formas de redacción de una pregunta: 97% sí: “¿debería el Presidente utilizar su poder de veto para eliminar los desperdicios?” 57 % sí: “ ¿debería el Presidente utilizar su poder de veto uno?” Orden de las preguntas En ocasiones las preguntas de una encuesta se sesgan de manera no intencional debido a factores como el orden de los reactivos que se someten a consideración. en parte debido a que muchos televendedores persistentes tratan de vender bienes o servicios.

entre las compañías de renta de automóviles. Esto significa que cuando encontramos una asociación estadística entre dos variables. mucha gente considera erróneamente que también es exacta. 027 hogares en estados unidos”. el número de subestimado y sería mejor decir que el número de hogares es aproximadamente de 103 millones. Números precisos “en la actualidad hay 103. no podemos de concluir que una de las variables ser causa de (o lo que afecta directamente a) la otra variable. Si encontramos una correlación entre la riqueza y el CI.Correlación y casualidad correlación no implica causalidad. encargó un estudio que dio como resultado la siguiente aseveración impresa en algunos periódicos: “ de acuerdo con la encuesta nacional de 250 empleadores profesionales. no podemos concluir que el coeficiente intelectual de una persona afecta directamente su riqueza. Puesto que estas cifras muy precisa. Instituto Tecnológico Superior de Tierra Blanca Página 12 . Distorsiones deliberadas en el libro Tainted Truth. Imágenes parciales (el 90 % de todos nuestros automóviles. Cuando Hertz solicitó información detallada sobre la encuesta. continúa circulando”. la respuesta originales desaparecieron y el coordinador de encuesta de la revista anuncio. Millones de consumidores escucharon ese mensaje comercial y no se dieron cuenta de que el 90 % de los automóviles que el anunciante vendió en este país se vendieron durante los últimos tres años por lo que la mayoría de esos automóviles que circulaban estaban casi nuevos. como no Journal of the American Medical Association.215. un fabricante de los lustrador para calzado. vendidos en este país en los últimos diez años. ni que la riqueza de una persona afecta directamente su puntuación de CI. kiwi brands. En este caso. Harris fue la ganadora en una encuesta realizada a las personas que utilizan dicho servicio. La afirmación era técnicamente correcta. aunque muy engañosa pues no presentaba los resultados completos. En los medios de comunicación masiva son muy comunes los reportes de una correlación recién encontrada con una redacción que indicado implica directamente que una de las variables de causa de la otra. la razón más común por la que un solicitante de empleo no logró dar una buena impresión fue por llevar los zapatos desaseados”. donde el patrocinador puede obtener ganancias monetarias con base en los resultados. En los últimos años ha aumentado la preocupación por la práctica de las empresas farmacéuticas financiera médicos que realizan experimentos clínicos y reportan sus resultados en revistas de prestigio. un Cynthia Crossen cita un ejemplo de la revista corporate travel que publicó resultados que mostraban que. Por ejemplo. Estudios para el propio beneficio En ocasiones los estudios reciben el patrocinio de grupos con intereses específicos que buscan promover. Debemos ser muy cautos con encuestas como éstas.

. . ¿Qué es incorrecto en este estudio? Instituto Tecnológico Superior de Tierra Blanca Página 13 . El chocolate contiene flavonoides. la empresa de dulces. Con base en un estudio que revela que las personas que se gradúan de la universidad viven más tiempo que quienes no lo hacen. después de comer chocolates. reportados en el Journal Nutrition revelaron que. los sujetos a prueba incrementaron los niveles de antioxidantes en su sangre. Inc. Varios estudios.. Mars.EJERCICIOS En los siguientes ejercicios utilice el pensamiento crítico para elaborar una alternativa Considere un informe de los medios de comunicación masiva de que los automóviles BMW causan que las personas estén saludables. Por lo tanto se cree que los individuos de recursos bajos exceden la velocidad límite más que las personas con un nivel económico de alto. y la chocolate manufactures Association financiaron gran parte de la investigación”. ya que se ha descubierto que los individuos que conducen automóviles BMW están más saludables que quienes no lo hacen. los vegetales y el té verde. junto a sus vecinos de clase alta: el vino tinto. Utilice el pensamiento crítico para indicar lo que se pide El New York Times publico un articulo que incluía la siguiente afirmación: “porfin. antioxidantes asociados con la disminución del riesgo de enfermedades cardiacas y embolias. Un estudio reveló que en la ciudad de Tierra Blanca se expiden mas multas por exceso de velocidad a los individuos de nivel económico más bajo que a las personas que cuentan con alguna empresa o microempresa. un investigador concluye que el estudio provoca que la gente viva más tiempo. el chocolate ocupa el lugar que merece en la pirámide alimenticia. . las frutas.

Algunos motociclistas testificaron que habían participado en choques donde los cascos resultaron inútiles. Centro: Valor promedio o representativos que indica la localización de la mitad el conjunto de los datos. “Cuidado con los Virus que Destruyen el Valioso Trabajo” Instituto Tecnológico Superior de Tierra Blanca Página 14 . Valores extremos: valores muéstrales que están muy alejados de la vasta mayoría de los demás valores de la muestra. uniforme o sesgada). basó sus conclusiones en las 4500 respuestas que recibió después de enviar por correo 100 000 cuestionarios a diversos grupos de mujeres. 4. 5.. 2. exploran y comparan conjuntos de datos. Distribución: la naturaleza o forma de la distribución de los datos (como en forma de campana. exploran y comparan conjunto de datos. Variación: medida de la cantidad en que los valores de los datos varían entre sí. en el sentido de que puedan aplicarse a la población general de todas las mujeres? ¿Por qué? . ESTADÍSTICA DESCRIPTIVA Cuando se describen. Cuando la autora Shere Hite escribió la Mujer y el amor: Una revolución cultural en progreso. ¿Qué grupo importante no fue capaz de testificar? . Tiempo: características cambiantes de los datos a través del tiempo. las siguientes características suelen ser sumamente importantes. 3. Característica importante de los datos 1. El senado de la republica entró en audiencia para considerar una ley que obligaba a los motociclistas a usar cascos. ¿Es probable que sus conclusiones sean validas. cuando se describen.

20. 20. 15. Para esto se debe hacer una tabla de frecuencias. 18. 21. Luego.2 Lo siguiente son horas por semana dedicadas a ver TV de una muestra de 50 estudiantes. 19. Longitud de los intervalos de clase. 22. 18. 20. 18. 21. Hay otros criterios pero usaremos este que es muy sencillo. 18. Tablas de Frecuencias. 23. 20. 20. 23. Ejercicio 1. 22. primero debemos definir el número de clases. ahora de deben organizar de una manera conveniente para que el investigador pueda percibir rápidamente el comportamiento de la distribución de los datos. 15. 19. Número de clases.Distribución de frecuencias Cuando ya se tienen los datos de la muestra. luego se cuenta el número de observaciones que “caen” en cada clase. 21. La tabla de frecuencias se hace con datos que son números reales correspondientes a una variable continua. luego usaremos 7 clases. 21. 21. Frecuencia acumulada absoluta de una clase. 19. 22. Es su frecuencia acumulada absoluta dividida entre n. Ahora para obtener la longitud de clase. 18. 21. 16. También se recomiendan un mínimo de 5 clases y un máximo de 20 clases y evitar si son posibles las clases vacías. 21. Frecuencia acumulada relativa de una clase. la longitud de clases es: − ú Lo anterior es considerando que todas las clases tienen la misma longitud. 20. tenemos que MAX = 25 y MIN = 15 de donde Instituto Tecnológico Superior de Tierra Blanca Página 15 . Sea MAX la mayor observación de la muestra y sea MIN la menor observación de la muestra. El número de observaciones menores al límite superior de la clase. 21. 20. 23. 22. 15. 20. Sea n el tamaño o número de observaciones en la muestra. 20. 21. 19. 23. 15. Luego el número de clases se puede determinar como √ . 25.071 que redondeando a entero nos da 7. 22. que básicamente es un agrupamiento de datos en grupos pequeños llamados intervalos de clase o clases. 22. 21. se recomiendan de 5 a 20 clases. Tenemos que √50= 7. 24. 17. Es su frecuencia absoluta dividida entre n. 22. 18. 19. Frecuencia absoluta de una clase. Es el número de observaciones contenidas en dicha clase. 22. Frecuencia relativa absoluta de una clase. Se hará una tabla de frecuencias. Los datos se agrupan en clases o intervalos de clase.

15. luego la primera clase tiene una frecuencia absoluta de 5.715. Para la segunda clase solo se tiene al 17 lo cual da una frecuencia absoluta de 1. es recomendable redondear la longitud de clase hacia arriba para asegurar que el valor máximo de la muestra se incluya en la última clase.43. etc.86)/2= 17.43. para la segunda clase se tiene que la marca de clase es (16.43 = 16.43 = 17. etc. el límite superior de la primera clase es el límite inferior de la segunda. Ahora obtenemos la frecuencia absoluta de cada clase. Para la primera clase se tiene que la marca de clase es (15 + 16. 15. es decir la cantidad de valores de la muestra ubicados en cada clase.16.43.43)/2 = 15.longitud de clase = (25 – 15)/7 = 1.43 y 16. la razón de esto es que no da una visión anticipada del aspecto del histograma. Es recomendable que en la tabla de frecuencias se agregue la columna “conteo” en donde se coloca la frecuencia absoluta de clase con la correspondiente cantidad de líneas verticales como se muestra en la tabla 1. es decir el límite inferior de la primera clase es 15 y el límite superior es 16. Observe que la suma de las frecuencias absolutas debe ser igual a n. la primera clase es el intervalo que inicia en el valor mínimo de la muestra que es 15 hasta el valor 15 + 1.2 muestra los intervalos de clase y sus marcas de clase en las primeras tres columnas. tal que los límites de la segunda clase son: 16. Entonces. Luego. El resto de las frecuencias absolutas se muestran en la tabla 1.3.43 + 1. y así sucesivamente. 15.3.145. Otro valor importante es el valor central de cada clase que se llama marca de clase. Instituto Tecnológico Superior de Tierra Blanca Página 16 . Para la primera clase se tienen los valores: 15. éste se obtiene promediando los límites del intervalo de clase.86.43 + 17. La tabla 1.

4 La tabla siguiente muestra la cantidad de anuncios en 30 segundos que se transmitieron por radio y fueron adquiridos por cada uno de los 45 miembros de una asociación de agentes de ventas de automóviles. Es una gráfica de la tabla de frecuencias. para un grupo de maestros con automóvil. 28 31 25 26 48 21 37 32 41 25 19 31 32 43 26 35 16 42 23 38 23 33 29 28 36 a) ¿Cuántas clases serian recomendables? b) ¿Qué intervalo de clase sugiere? Instituto Tecnológico Superior de Tierra Blanca Página 17 .Ejercicio 1. La longitud de la base es la longitud del intervalo de clase y la altura es la frecuencia de clase. ¿Alrededor de que valores tienden a agruparse el número de anuncios de publicidad? ¿Cuál es el menor número de anuncios adquiridos por un agente de ventas? ¿Cuál es el mayor número de anuncios? (realizarlo mediante el software Minitab) 96 142 132 143 93 94 111 120 88 107 125 103 117 125 104 113 127 155 106 124 95 155 139 138 113 103 134 96 112 119 108 127 97 94 117 89 148 120 118 156 112 136 139 135 125 Representación gráfica de una distribución de frecuencias Histograma. Organice los datos en una representación de tallo y hoja.5 A continuación se presenta la cantidad de minutos que toma viajar desde el hogar al trabajo. EJERCICIOS 1.3 Determinar las frecuencias faltantes en la tabla. colocando una barra rectangular sobre cada intervalo de clase. Ejercicio 1.

Si n es par. La primera se aplica cuando lo que se tiene es la población (cosa en es poco usual). primero se ordenan los datos en forma creciente (de menor a mayor). pero hay dos tipos de varianza. Luego. Tratan de medir el alejamiento o distanciamiento de los datos. y mientras esta medida sea menor. Es el valor cuya frecuencia acumulada relativa es el 50% (el 2º. La varianza muestral se aplica cuando se tiene una muestra aleatoria de la población y con ella se desea estimar la varianza poblacional Instituto Tecnológico Superior de Tierra Blanca Página 18 . ~ La mediana X . La Moda. dato mayor – dato menor. La otra medida importante de dispersión es la varianza. La moda es el valor con mayor frecuencia Conceptos básicos de las medidas de dispersión Medidas de dispersión. si n es un número impar la mediana es el valor ubicado en el “centro” de los datos. La media aritmética. Conceptos básicos de las medidas de tendencia central Una medida de tendencia central es un valor que se encuentra en el centro o a la mitad de un conjunto de datos. significa que los datos están muy juntos o compactos. la varianza poblacional y la varianza muestral. cuartil). la mediana se obtiene promediando los dos valores centrales. El Rango. Es la suma de los datos dividida entre n. Mientras este valor sea más grande significa que los datos están muy alejados.c) ¿Qué valor sugiere como límite inferior de la primera clase? d) Organice los datos en una distribución de frecuencias LI MC LS CONTEO F FR FAA FAR e) Realice el histograma y de una conclusión acerca de la distribución de los datos. Para calcular la mediana. Es la diferencia.

Al considerar la probabilidad. Un suceso es cualquier conjunto de resultados o consecuencias de un procedimiento. en especial los que son relativamente pequeños. como 0.Probabilidad La probabilidad conforma los cimientos sobre los cuales se construyen los métodos importantes de la estadística inferencial. el espacio muestral está formado por todos los resultados que ya no pueden desglosarse más. en el sentido de que ocurra en pocas ocasiones. Por ejemplo. tratamos con procedimiento (como tirar un dado. se reconocería de manera general que los resultados indican fuertes evidencias para afirmar que la técnica de selección del género es efectiva. Esta es precisamente la forma de pensar de los especialistas en estadística: rechazan las explicaciones basadas en probabilidades muy bajas y utilizan la regla del suceso infrecuente para la estadística inferencial.001. el objetivo más importante de esta sección consiste en aprender a interpretar valores de probabilidad. En capítulos posteriores hablaremos de valores específicos llamados “valores P” y veremos que estos tienen un papel suma mente importante en diversos métodos de estadística inferencial. corresponde a un suceso que es infrecuente. Un suceso simple es un resultado o un suceso que ya no puede desglosarse en componentes más simples. Sin embargo. debemos comprender que una pequeña probabilidad. En cambio. tales valores P solo son valores de probabilidad. Suponga que los resultados de pruebas independientes con 100 parejas demuestran que su procedimiento dio por resultado 98 niñas y solos 2 niños. Instituto Tecnológico Superior de Tierra Blanca Página 19 . Como un sencillo ejemplo. como se describe en esta sección. Fundamentos Concepto clave: en esta sección se presenta el concepto básico de la probabilidad de un suceso. supongan que usted ha creado un procedimiento de selección del genero y afirma que este incrementa en gran medida la probabilidad de que un bebe sea niña. El espacio muestral de un procedimiento se compone de todos los sucesos simples posibles. la probabilidad de un suceso particular observado es extremadamente pequeña. o ser sometió a una prueba de consumo de drogas) que producen resultados. concluimos que el supuesto probablemente es incorrecto. inclusive. Aun que existe la probabilidad de que nazcan 98 niñas en 100 nacimientos sin ningún tratamiento especial. contestar una pregunta de opción múltiple en un examen. Es decir. Veremos que los valores de probabilidad se expresan en números entre 0 y 1. bajo un supuesto dado. Concéntrese en desarrollar una intuición para interpretar valores de probabilidad. Regla el suceso infrecuente para estadística inferencial Si. tal probabilidad es tan bajo que se rechazaría como una explicación razonable. Se presentarán tres métodos diferentes para calcular valores de probabilidad. Sin embargo.

000000000001 (equivalente a una en un billón). El espacio muestral consiste en dos sucesos simples: Miller anota el tiro libre o no lo hace. Pues que el espacio muestral consiste en suceso que no tienen la misma probabilidad. muy pequeña. basado en nuestro conocimiento general. pero no se recomienda el uso irreflexivo de las formulas. es mejor comprender el espíritu de la regla y utilizar esa compresión de la siguiente forma. Solución. Hay dos posibles resultados (chocar o no chocar). luego mezcle las cuatro fichas y elija uno al azar. una tachuela quede con la punta hacia arriba. Aa. ¿Cuántos intentos son necesarios para obtener un resultado que parezca ser razonablemente preciso? Regla formal de la suma P(A o B)= P(A) + P(B) -P(A y B) Donde P(A y B) denota la probabilidad de que A y B ocurran al mismo tiempo. Actividad: Estimar la probabilidad de que cuando se dejen caer. por lo que no podemos usar el método clásico de la regla 2. En cierto momento de su carrera. anoto 5915 tiros libres entre 6679 tiros (de acuerdo con datos de la NBA). de anotar un tiro libre después de recibir una falta. si no el método de las frecuencias relativas (regla 1) con sus resultados anteriores. Esto nos deja con la regla 3. empleamos el método clásico (regla 2) para obtener. En este caso todos sabemos que la probabilidad en cuestión es muy. anote cada genotipo individual en una ficha. Este estimado subjetivo. y obtenemos lo siguiente. por medio de la cual hacemos un estimado subjetivo. La regla formal de la suma se presenta como una formula.886 6679 Ejemplo: Genotipo como parte de un estudio sobre los genotipos AA. En general. puede encontrarse en el campo general de la probabilidad real. no podemos usar el método de frecuencias relativas de la regla 1. no podemos utilizar el método clásico (regla 2). pero no son igualmente probables. P(Miller anota un tiro libre) = 5915 = 0. P (Aa)=1/4 Ejemplo: choques de meteoritos ¿Cuál es la probabilidad de que su automóvil sea impactado por un meteorito este año? Solución: en ausencia de datos históricos de meteoritos que chocan con automóviles. Instituto Tecnológico Superior de Tierra Blanca Página 20 . Calcule la probabilidad que tiene el jugador de basquetbol de la NBA.Aa.Ejemplo: anotación de un tiro libre. ¿Qué probabilidad tiene de elegir el genotipo Aa? Solución puesto que el espacio muestral (AA. 0. digamos. Reggie Miller. aA y aa.aa) en este caso incluye resultados igualmente posibles. como resultado en su ensayo de un procedimiento. Estimemos que sea.Aa.

es que puede EJERCICIOS En los ejercicios del 1 al 4. ¿El conductor estaba intoxicado? Si No ¿El peatón estaba intoxicado? Si No 59 79 266 581 Instituto Tecnológico Superior de Tierra Blanca Página 21 . Sucesos complementarios Dijimos que A consiste en todos los resultados en lo que el suceso A no ocurre. existe un término especial para describirlo: Definición Los sucesos A y B son disjuntos (o mutuamente excluyentes) cuando ambos no pueden ocurrir al mismo tiempo.512 = 0. los sucesos disjuntos no se traslapan). Solución: usando la regla de los sucesos complementarios.512. sumando de tal manera que cada resultado se cuente solo una vez. tenemos P (niña) = 1 – P (niño) = 1 – 0.488 Es decir. La principal ventaja de la regla de los sucesos complementarios simplificar mucho ciertos problemas. Los sucesos A y A debe ser disjuntos. Calcule P(niña). que es la misma que la de tener una niña. la probabilidad de no tener un niño. Puesto que el traslape de sucesos es un aspecto esencial en la regla de las sumas.488.Regla intuitiva de la suma Para obtener P(A o B). utilice los datos de la siguiente tabla que resume los resultados de 985 muertes de peatones causadas por accidentes. P(niño) = 0. es de 0. P(A o B) es igual a esa suma. porque es imposible que un suceso y un complemento ocurren al mismo tiempo Regla de los sucesos complementarios P(A) + P(A) = 1 P(A) = 1 – P(A) P(A) = 1 – P(A) Ejemplo: En realidad. dividida entre número total de resultados en el espacio muestral. (Es decir. calcule la suma del numero de formas en que puede ocurrir el suceso A y el numero de formas en que puede ocurrir el suceso B. cuando nace un bebe.

4. representan teléfonos celulares sin defectos. b) Repita el inciso a para tener un total de 20 lotes simulados c) Utilice los resultados del inciso b) para estimar la probabilidad de que el numero de defectos en un lote sea exactamente 10.si se elige al azar una de las muertes de peatones. después seleccione Random Data y después seleccione integer.si se elige al azar una de las muertes de peatones. Simulación La simulación es un proceso que se comporta de la misma forma que el procedimiento sometido a consideración. El número medio de defectos en los lotes debe ser 10. ¿cree usted que esta estimación es hasta cierto punto exacta?. de manera que produce resultados semejantes.. 2. a) Utilice Minitab o Excel para simular la fabricación de teléfonos celulares y registre el número de defectos en este lote simulado.5. Introduzca 25 para el numero de renglones guarde los resultados en la columna C1 e ingrese un mínimo de 1 y un máximo de 365. Consideremos el siguiente ejemplo para comprender mejor el uso de la simulación. Los números deben generarse de forma que sean igualmente probables..…. ¿Por qué? Instituto Tecnológico Superior de Tierra Blanca Página 22 . calcule la probabilidad de que el el peatón no estuviera intoxicado o que el conductor no estuviera intoxicado. Otra opción es usar una calculadora o computadora para generar aleatoriamente 0 y 1(el 0 representa 1 niño y el 1 representa 1 niña). necesitan conocer valores de probabilidad de diferentes resultados.si se elige al azar una de las muertes de peatones. 3. la cara representa al as niñas y la cruz a los varones.. calcule la probabilidad de que el peatón estuviera intoxicado o que el conductor estuviera intoxicado. Ejercicio: Suponga que un lote consiste en 500 teléfonos celulares y que la tasa general de aparatos defectuosos es del 2%. En el cuadro de dialogo. calcule la probabilidad de que el peatón estuviera intoxicado o que el conductor no estuviera intoxicado.4.100. cada uno de ellos entre 1 y 100. calcule la probabilidad de que el conductor estuviera intoxicado o que el peatón no estuviera intoxicado. • Minitab: seleccione calc en la barra del menú principal.. la probabilidad al menos 60 niñas entre 100 niños.1. por ejemplo.si se elige al azar una de las muertes de peatones. Sin embargo algunos lotes tendrán menos o más de 10 defectos. Solución una opción es simplemente lanzar una moneda al aire 100 veces. Suponiendo que el nacimiento de un varón o de una niña es igualmente probable. Cualquier resultado de 1 y 2 representa un teléfono celular defectuoso en tanto que los resultados de 3. Ejemplo selección del genero cuando los investigadores médicos prueban técnicas de selección del genero. Realice una simulación generando 500 números. describa una simulación que de cómo resultado los géneros de 100 bebes recién nacidos.

.De entre tres hijos hay exactamente una niña 2. 5/3. ¿Este razonamiento es correcto? ¿Por qué? . el reportero de la crónica afirma que la probabilidad es de ½ .De entre tres hijos todos son niñas. Exprese el grado indicado de probabilidad como un valor de probabilidad entre 0 y 1 1.The Mars Company afirma que el 24ª % de sus dulces M&M sencillos son azules.. a. b. -1. 2. 0.520? ¿Un triunfo como este es infrecuente? .“Usted tiene la probabilidad de una bola de nieve en el infierno de casarse con mi hija” ¿Cuál de los siguientes valores no puede ser una probabilidad? 0.De los 100 dulces M&M listados estime la probabilidad de obtener un dulce azul al elegir al azar un dulce M&M sencillo.EJERCICIOS: ¿Qué significan cuando decimos que la probabilidad de ganar el premio mayor de la lotería nacional es 1/20.“como estudio a conciencia y comprendió los conceptos.De entre tres hijos hay exactamente hay exactamente dos niñas 3.“El pronóstico de mañana indica un 10% de probabilidad de lluvia” 3. √2 Calcule la probabilidad de cada suceso cuando una pareja tiene tres hijos 1. Al hablar acerca de la probabilidad de que llueva en Tierra Blanca el 28 de julio del próximo año. seguramente aprobara el examen de estadística” 2...0123.. 3/5. 1. 358. ya que lloverá o no lloverá. ¿La estimación del inciso a) coincide aproximadamente con esta afirmación o al parecer existe una gran diferencia? Instituto Tecnológico Superior de Tierra Blanca Página 23 ....

908 0.978 0.898 0.91 0.858 0.919 0.876 0.989 0.941 0.923 0.886 0.902 0.889 0.92 0.898 0.875 0.879 0.909 BLUE GREEN 0.932 0.872 0.93 0.911 0.9 0.86 0.956 0.921 0.876 0.912 0.904 0.897 0.933 0.908 0.917 0.893 0.926 0.909 0.866 0.871 0.924 0.897 0. RED ORANGE YELLOW BROWN 0.913 0.921 0.89 0.924 0.94 0.928 0.988 0.882 0.92 0.914 0.971 0.867 0.87 0.96 0.965 0.877 0.868 0.897 0.936 0.903 0.92 0. but this data set includes weights from a sample collected in 1993.861 0.033 0.888 0.914 0.879 0.902 0.911 0.949 0.875 1.886 0.924 0.942 0.902 Instituto Tecnológico Superior de Tierra Blanca Página 24 .87 0.955 0.936 0.856 0.838 0.939 1.968 0.891 0.009 0.898 0.93 0.902 0.874 0.952 0.983 0.906 0.9 0.892 0.968 0.93 0.949 0.002 0.934 0.911 0.LISTA DE LOS PESOS DE 100 M&M OLDM&M: Data Set 14 in this book includes recent weights from a sample of M&M plain candies.908 1.976 0.

Distribuciones de Probabilidad Discretas Una variable aleatoria es aquella (casi siempre representada por x) que tiene un solo valor numérico determinado por el azar, para cada resultado de un procedimiento. Una distribución de probabilidad es una distribución que indica la probabilidad de cada valor de la variable aleatoria. A menudo se expresa como grafica, tabla o formula. Las distribuciones de probabilidad binomial nos permite enfrentar circunstancias en las que los resultados pertenecen a dos categorías relevantes, tales como aceptable/defectuoso o sobrevivió/murió. En la siguiente definición se plantean otros requisitos. Definición Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos los siguientes requisitos: 1. El procedimiento tiene un número fijo de ensayos. 2. Los ensayos deben ser independientes. (el resultado de cualquier ensayo individual no afecta las probabilidades de los demás ensayos). 3. Todos los resultados de cada ensayo deben ser clasificados en dos categorías (generalmente llamadas éxito y fracasos). 4. La probabilidad de un éxito permanece igual en todos los ensayos. Ejemplo selección de jueces. En el caso de Castañeda contra partida se señalo que, aunque el 80% de población de un condado en Texas es México – estadounidenses, solo el 39% de quienes fueron llamados para integrar el jurado pertenecían a este grupo, supongamos que necesitamos seleccionar a 12 jueces de una población integrada en un 80% de por México- estadounidenses, y que deseamos calcular la probabilidad de que, de 12 jueces elegidos al azar, exactamente 7 sean México – estadounidenses. a. ¿este proceso dará por resultado una distribución binomial? b. Si este proceso da como resultado una distribución nominal, identifique los valores de n, x, p y q. Solución. a. Este procedimiento satisface los requisitos de una distribución binomial, como se indica a continuación. 1. El número de ensayos (12) es fijo. 2. Los 12 ensayos son independientes. (técnicamente los, 12 ensayos implican una selección sin reemplazo y no son independientes, pero podemos suponer independencia porque estamos seleccionando al azar solo a 12 miembros de una población muy grande. 3. Cada uno de los 12 ensayos tienen dos categorías de resultado posible: el miembro de jurado elegido es México – estadounidenses o no lo es.

Instituto Tecnológico Superior de Tierra Blanca

Página 25

4. Para cada miembro del jurado elegido, la probabilidad de que sea Méxicoestadounidenses es de 0.8 (porque el 80% de la población es Méxicoestadounidense). Esa probabilidad es de 0.8 es la misma para cada uno de los miembros del jurado. b. Una vez concluimos que el procedimiento dado así da por resultado una distribución binomial, ahora procedemos a identificar los valores de n, x. p y q. 1. Con 12 jueces elegidos, tenemos que n=12 2. Buscamos la probabilidad de exactamente 7 México- estadounidenses, entonces x=7. 3. La probabilidad de éxito (elegir a un México- estadounidense) es una selección es 0.8 por lo tanto, p= 0.8. 4. La probabilidad de fracaso (no elegir a un México – estadounidense) se 0.2 por lo tanto, q=0.2. Una vez más, es muy importante asegurarse de que tanto x como p se refieran al mismo concepto de “éxito”. En este ejemplo usamos x para contar el número de México- estadounidense, de manera que p debe ser la probabilidad de un México – estadounidense. Por siguiente por siguiente, x y p si usan aquí el mismo concepto de éxito (México – estadounidense) Distribución de probabilidad de poisson Es una distribución de probabilidad discreta importante, ya que a menudo se utiliza para describir comportamientos que ocurren en raras ocasiones (con probabilidad pequeñas). Debemos conocer los requisitos para el uso de la distribución de poisson y también debemos saber cómo calcular las probabilidades. Definición La distribución de poisson es una distribución de probabilidad discreta que se aplica a las ocurrencias de algún suceso durante un intervalo específico. La variable aleatoria x es el número de veces que ocurre un suceso en un intervalo el intervalo puede ser tiempo, distancia, área, volumen o alguna unidad similar. Requisitos de la distribución de Poisson • • • • La variable aleatoria x es el número de veces que ocurre un suceso durante un intervalo. Las ocurrencias deben ser aleatorias Las ocurrencias deben ser independientes entre si Las ocurrencias deben estar unifórmenle distribuidas dentro del intervalo empleado.

Instituto Tecnológico Superior de Tierra Blanca

Página 26

Distribución normal estándar

1.- presenta forma de campana 2.- posee una media igual a 0 3.- tiene una deviación estándar a 1 Así como existen muchas distribuciones uniformes diferentes (con distintos rangos de valores), también existen muchas distribuciones normales diferentes, las cuales dependen de dos parámetros: la medida poblacional µ y la desviación estándar poblacional σ. Cálculo de probabilidades con puntuaciones z dadas. Si utilizará la tabla A-2, es esencial que comprenda los siguientes puntos: 1.- la tabla A-2 está diseñada únicamente para la distribución normal estándar, que tiene una medida de 0 y una desviación estándar de 1. 2.- la tabla A-2 abarca dos páginas, una para las puntuaciones Z negativas y la otra para las puntuaciones z positivas. 3.- cada valor en la tabla es una área acumulativa desde la izquierda hasta un límite vertical por arriba de la puntuación z especifica. 4.- cuando construya una grafica, evite la confusión entre puntuaciones z y las áreas. Puntuación z: distancia a lo largo de la escala horizontal de la distribución normal estándar, remítase a la columna de la extrema izquierda y el renglón superior de la tabla A-2. Áreas: región bajo la curva, remítase a los valores de la tabla A-2.

Instituto Tecnológico Superior de Tierra Blanca

Página 27

Ejemplo termómetros científicos. La precisión Scientific Instrument Company fabrica termómetros que se suponen deben de dar lecturas 0°C al punto de congelación del agua. Las pruebas de una muestra grande de estos instrumentos revelaron que el punto de congelación del agua, algunos termómetros daban lecturas por debajo de 0° (denotadas con números negativos ), y otras daban lecturas por encima de 0° ( denotados con números positivos). Supóngase que la lectura media es 0°C y que la desviación estándar de las lecturas es 1.00°C. También supóngase que las lecturas se distribuyen de manera normal. Si se elige al azar un termómetro, calcule la probabilidad de que, al punto de congelación del agua, la lectura sea menor que 1.58°. Solución: La distribución de probabilidad de las lecturas es una distribución normal estándar, ya que las lecturas se distribuyen de forma normal, con µ=0 y σ= 1. Necesitamos encontrar el área que está debajo de z= 1.58, continua:

Ejemplo termómetros científicos: utilice los termómetros del ejemplo anterior y calcule la probabilidad de seleccionar al azar un termómetro con una lectura ( en el punto de congelación del agua) por arriba de -123°. Solución: nuevamente, calculemos la probabilidad deseada encontrando el área correspondiente. Buscamos el área de la región sombreada en la figura pero la tabla A-2 está diseñada para aplicarse únicamente en áreas acumulativas desde la izquierda. Si nos remitimos a la tabla A-2, en la pagina con puntuaciones negativas, encontramos que área acumulativa de la izquierda ha de ser z = -123es 0.1093, tal como se observa. Sabiendo que el área total bajo la curva es 1, podemos calcular el área sombreada si restamos 0.1093 de 1. El resultado es 0.8907. Aun cuando la tabla A-2 está diseñada únicamente para áreas acumulativas a partir de la izquierda, podemos utilizarla para calcular áreas acumulativas desde la derecha, tal como se muestra en la figura.

Instituto Tecnológico Superior de Tierra Blanca

Página 28

00 corresponde al área de 0.0228. pero podemos emplearla para encontrar que z= -2.1 z= x -µ/σ (redondear las puntuaciones z hasta dos decimales).1. Cuando calcule procedimiento: áreas en una distribución normal no estándar.9332. El ejemplo anterior puede generalizarse como una regla que establece que el área correspondiente a la región localizada entre dos puntuaciones z especificas puede obtenerse al calcular la diferencia entre las dos áreas localizadas en la tabla A-2. El área de forma directa. simplemente estandarice los valores para poder continuar utilizando los mismos procedimientos de la sección anterior Si convertimos valores en puntuaciones estándares. Aplicaciones de las distribuciones normales Para trabajar con una distribución normal que no es estándar. indique la media y los valores específicos de x.Ejemplo termómetros científicos: Una vez más. Instituto Tecnológico Superior de Tierra Blanca Página 29 . entonces los procedimientos para trabajar con todas las distribuciones normales son los mismos que los de la distribución normal estándar. como se observa en la figura. Formula 1.50°). haga una selección aleatoria de al mismas muestra de termómetros y calcule la probabilidad de el termómetro elegido tenga lecturas ( en el punto de congelación del agua entre -2.dibuje una curva normal. después sombree la región que representa la probabilidad deseada. y que z= 1.00° y 1..50 corresponde al área de 0. empleando la fórmula 1. utilice este 1.

(Esto podría ocurrir fácilmente en una ciudad donde se realizan convecciones en las personas del mismo género suelen viajar en grupos). y la región sombreada representa a los hombres con pesos menores de 174 libras. calcule la probabilidad de que pese menos de 174 lb ( el valor sugerido por National Transportation and Safety Board).07 Pasó 3: si nos remitimos a la tabla A-2 y utilicemos z = 0.. Paso 2: para usar al tabla A-2 primero debemos de aplicar al formula 1. En concordancia con los datos de la National Health and Nutrition Examination Survey.07. Supongamos “el peor de los casos”.2. Instituto Tecnológico Superior de Tierra Blanca Página 30 . El peso de 174 libras se convierte a una puntuación z de la siguiente manera: Z= x-µ/σ = 174-172/29 = 0. Si seleccionamos al azar a un hombre. utilice la formula 1. que incluye la siguiente información: los hombres tienen pesos que se distribuyen normalmente. con una media de 172 libras y una desviación estándar de 29 libras. 3.5279. El peso medio de un pasajero es de 140 libras.07 es un área de 0. área de la región sombreada que Ejemplo pesos de pasajeros de taxis acuáticos.para cada valor relevante de x que sea un límite de la región sombreada. con una media de 172 lb y una desviación estándar de 29 lb. La carga segura para un taxi acuático se calculó en 3500 libras. en el que todos los pasajeros son hombres adultos..1 para transformar la distribución normal no estándar a una distribución normal estándar.Remítase a la tabla A-2 para encontrar el constituye la probabilidad deseada. suponga que los pesos de hombres se distribuyen normalmente. Solución: Paso 1: Observe la figura .1 para convertir el valor a la puntuación z equivalente. encontramos que el área acumulativa a la izquierda de z= 0.

Se selecciona aleatoriamente un termómetro y se prueba. se requiere que las mujeres midan al menos 70 pulgadas ¿qué porcentaje de la mujeres cumple con este requisito? R= Instituto Tecnológico Superior de Tierra Blanca Página 31 . a) Menor que -1 b) Menor que 1 c) Mayor que 1. EJERCICIOS: En los siguientes ejercicios suponga que las lecturas de los termómetros se distribuyen normalmente. distribuciones de probabilidad.52 h) Mayor que 0 En los ejercicios 1 y 2 use la información que se le proporciona. normal. • La estatura de los hombres se distribuyen normalmente. distribuciones de probabilidad. registre la media y la desviación estándar. Después haga clic en el botón de constante de entrada y registre el área total que se encuentra a la izquierda del valor dado. probabilidad acumulada. En cada caso. con una media de 0 y una desviación estándar de 1ºC.00 g) Mayor que 3.45 y -2. • La estatura de las mujeres se distribuye normalmente con una media de 63. normal.En una organización para personas altas.75 e) Entre 1 y 2 f) Entre -2. seleccione calc. después seleccione probabilidad acumulada inversa e indique la media y la desviación estándar.25 d) Mayor que -1. dibuje un bosquejo y calcule la probabilidad de cada lectura.5 pulgadas. con una media de 69 pulgadas y una desviación estándar de 2.Para encontrar el área acumulativa que está a la izquierda de una puntuación Z (como en la tabla A-2). seleccione calc.. 1.8 pulgadas.6 pulgadas y una desviación estándar de 2. después haga clic en el botón de constante de entrada e ingrese el valor Para encontrar un valor correspondiente a un área conocida.

Anote los valores en una columna 2. Seleccione basic statistics 4. con excepción del 5% de los más altos. Seleccione normality test.. Para la construcción de una grafica cuantilar normal en MINITAB utilice los siguientes pasos: 1. si un hospital desea establecer condiciones especiales de observación para el 2% de los bebes menos pesados. 2. Si un especialista en estadística diseña una casa de tal manera que la entrada de la puerta tenga una altura suficiente para todos los hombres.Grafica cuantilar normal: si el histograma es básicamente simétrico y existe a lo sumo un valor extremo. 5. con una media de 3420g y una desviación estándar de 495 g. Seleccione stat 3.. Introduzca la columna en la que introdujo los datos 6.Histograma: construya un histograma.2. construya una Grafica cuantilar normal..valores extremos: rechace la normalidad si existe más de un valor extremo. Determinación de la normalidad 1.En estados unidos los pesos al nacer se distribuyen normalmente. 3. ¿Qué peso se utilizaría para establecer un punto de corte que separe al 2% de los bebes menos pesados de los demás? El teorema del límite central • La variable aleatoria x tiene una distribución (que puede o no ser normal) con media µ y desviación estándar σ.. Rechace la normalidad si el histograma difiere mucho de la forma de campana. ¿Cuál sería la altura de la entrada? 3. • Todas las muestras aleatorias del mismo tamaño n se seleccionan de la población (todas deben de tener la misma probabilidad de ser seleccionadas). Haga click en ok Instituto Tecnológico Superior de Tierra Blanca Página 32 .la altura estándar de la entrada de una puerta es de 80n pulgadas..

Estimaciones y tamaños de muestra Las dos aplicaciones principales de la estadística inferencial implican el uso de datos de muestra para 1. de manera que este ≥5 y ≥ 5 se cumplan para que la requisito es una forma de verificar distribución normal sea una aproximación adecuada para la distribución binomial. hay un número fijo de ensayo los ensayos son independientes. No está sesgado en el sentido de que la distribución de las proporciones muéstrales tiende a concentrarte al valor . Las condiciones para la distribución binomial se satisfacen. Requisitos: 1. esto es. = proporción muestral de x éxitos en una muestra de tamaño . = = proporción muestral de = 1= proporción muestrl de en una muestra e tamaño en una muestra de tamaño Definición Un estimado puntual es un valor individual (o punto) que se usa para aproximar un parámetro de población. 3. La proporción muestral es el timador más consistente en el sentido de que la desviación estándar de las proporciones muéstrales tienden a ser menor a la desviación estándar de cualquier otro estimador estándar sin sesgo. La muestra es aleatoria simple. Usamos como el estimado puntual ya que no está sesgado y es el más consistente de los estimadores que podrían usarse. Estimación de la proporción de una población. La proporción muestral es mejor estimado puntual es el mejor estimado puntual en la proporción poblaciones . Existen al menos 5 éxitos y al menos 5 fracasos (cuando y se desconocen estimamos sus valores utilizando la proporción muestral. Estimar el valor de un parámetro de población 2. Además existen procedimientos para tratar situaciones para que la distribución normal no es una aproximación adecuada). hay dos categorías de resultados y las probabilidades permaneces constantes para cada ensayo. 2. Probar alguna aseveración (o hipótesis) acerca de una población. las proporciones muéstrales no tienden sistemáticamente a subestimar ni a sobreestimar p. Instituto Tecnológico Superior de Tierra Blanca Página 33 . NOTACIÓN PARA PROPORCIONES. Esto es.

Instituto Tecnológico Superior de Tierra Blanca Página 34 . los especialistas en estadística han diseñado ingeniosamente otro tipo de estimado: el intervalo de confianza o estimado del intervalo. suponiendo que el proceso de estimación se repite un grado numérico de veces. Para un nivel de de 0.¿Por qué necesitamos intervalos de confianza? En el ejemplo anterior vimos que 0.99 (99%). Para un nivel de confianza El de valor 0.95 (95%) =0.el nivel de confianza nos da la tasa de éxitos del procedimiento que se utiliza para construir el intervalo de confianza. Definición El nivel de confianza es la probabilidad 1−∝ (a menudo expresado por el valor equivalente). Definición Un intervalo de confianza(o estimado del intervalos) es un rango (o un intervalo) de valores que se usan para estimar el valor real de un parámetro de población.9 (95%). ∝ =0. Las opciones más comunes para el nivel de confianza son 90% (con ∝= 0.01. El intervalo de confianza suele abreviarse como IC.497.5. que consiste en un rango (o un intervalo) de valores en vez de un solo valor.4 es el mejor estimado puntual de la proporción poblacional . de ∝ ∝es el complemento del confianza nivel de confianza .50).10) . La opción del 95% es la más común puesto que provee un equilibrio entre presión (reflejada en el ancho del intervalo de confianza) y confiabilidad (expresada por el nivel de confianza).95(o 95%) de la proporción poblacional p es 0. Como el estimado puntual tiene el gran defecto de no revelar nada de qué tan bueno es. Un intervalo de confianza se asocia con un nivel de confianza. Interpretación de un intervalo de confianza. pero no tenemos indicación precisa de que tan bueno es nuestro mejor estimado. A continuación se presenta un ejemplo de un intervalo de confianza basando en los datos muestrales de 280 ensayos de terapeutas de contacto. y 95%.(con ∝= 0. Debemos ser cuidadosos para interpretar los intervalos de confianza correctamente.01). El nivel de confianza suele expresarse como la probabilidad o área 1−∝ (alfa griega minúscula). y 99%(con ∝= 0. como 0.381< p<0. El nivel de confianza también se llama grado de confianza o coeficiente de confianza. que es la proporción de veces que el intervalo de confianza realmente contiene el parámetro de población. donde en el 44% de los ensayos se identifica correctamente la mano elegida: El intervalo de confianza estimado de 0.

381<p<0. Instituto Tecnológico Superior de Tierra Blanca Página 35 .Existe una interpretación correcta y muchas diferentes y creativas interpretaciones erróneas del intervalo de confianza 0.497.

el 95% de ellos incluirían realmente el valor de la proporción poblacional p. a la larga. por eso es incorrecto decir que existe un 95% de probabilidad de que p se localice entre el los valores tales como 0. Un nivel de confianza el 95% nos dice que el proceso que estamos usando. Una proporción poblacional p es como el bebe que acaba de nacer: el valor de p es fijo. dará por resultado límites del intervalo de confianza que contienen la proporción real de la población el 95% del tiempo.Correcta: “Tenemos una confianza del 95% de que el intervalo de 0. (note que en esta interpretación correcta.5. Notación para el valor critico. (El valor de – z∝⁄2 está en la frontera vertical para el área de ∝ 2 en la cola izquierda). de manera que los limites del intervalo de confianza contienen o no a p. el intervalo de confianza obtenido de los datos muéstrales no incluiría la proporción poblacional. es incorrecto decir que existe una probabilidad de 0. Suponga que la proporción real de todas las identificaciones correctas de la mano por partes de los terapeutas de contacto es p=0. Entonces.381 y 0. El valor critico z∝⁄2 es el valor z positivo que está en la frontera vertical que separa una área de ∝ 2 en la cola derecha de la distribución normal estándar.497. Esto significa que si seleccionamos muchas muestras diferentes de tamaño 280 y construimos los intervalos de confianza correspondientes. esperamos que 19 de las 20 muestras den por resultado intervalos de confianza que contienen el valor real de p.381 a 0. De manera similar.497.381 y 0. el bebe es o no una niña. ya que la proporción poblacional real de 0. Errónea: “Existe un 95% de probabilidad de que el valor real de p este entre 0.497.5 no se encuentran entre 0. El subíndice ∝ 2 es simplemente un recordatorio de que la puntuación z separa un área de cola derecha de la distribución normal estándar. y no a la proporción de la población en sí).381 y 0. propiedad de que una 7-2) área de derecha de la distribución normal (Véase lasepara figura 2 en 2 ∝ 2 en la Instituto Tecnológico Superior de Tierra Blanca Página 36 . un intervalo de confianza construido a partir de una muestra que incluye o no a p. ∝ El número 2∝ es la uncola valor crítico.5 de que sea niña. el nivel del 95% se refiere a la tasa de éxitos del proceso. utilizada para estimar la proporción. una puntuación z con laestándar.497 realmente contiene el valor verdadero de p”.” Para cualquier punto especifico en el tiempo. y no hay una probabilidad implicada. una población tiene un valor fijo y constante de p. Con un 95% de confianza. si un bebe acaba de nacer y el médico esta por anunciar su género. Definición Un valor crítico es el número en línea limítrofe que separa estadísticos muestrales que tienen mayor probabilidad de ocurrir de aquellos que no tienen probabilidad de ocurrir. Valores críticos.

podemos resumir el procedimiento para construir un estimado del intervalo de confianza de una proporción poblacional como sigue. Ahora definiremos el margen de error E como sigue. es la diferencia máxima probable (con probabilidad 1. . Cuando reunimos un conjunto de datos muéstrales. La diferencia entre la proporción muestral y la proporción de la población se considera un error. como los datos sobre la terapia de contacto de Emily Rosa en el problema del capítulo (donde el 44% de los 280 ensayos correspondieron a identificaciones correctas).Margen de error. existe una probabilidad de que una proporción muestral sea errónea por más de E. Definición Cuando se utilizan los datos de muestra aleatoria simple para estimar una proporción p.2 Formula 1. podemos calcular la proporción muestral y esta proporción muestral suele ser diferente de la población poblacional p. como se indica en la fórmula 1. Redondee los límites del intervalo de confianza para p a tres dígitos significativos. denotado por E. − < < + Donde E = z∝ 2 El intervalo de confianza suele expresar en los siguientes formatos equivalentes ± – .∝) entre la proporción muestral de observada y el valor real de la proporción poblacional p. Con base en los resultados anteriores. Intervalo de confianza (o estimado de intervalo) para la proporción poblacional p.2 E = z∝ 2 margen de error para proporciones Dada la formula en que se define el margen de error E. El margen de error E también se conoce llama error máximo del estimado y se calcula multiplicando el valor critico por la desviación estándar de las proporciones muestrales. el margen de error. + Regla de redondeo para estimados de intervalos de confianza de p.

x=200. 1. Ejercicios: Un estudiante encuesta a 100 compañeros de clase y les pregunta si tienen deudas pendientes.96). Utilizando el valor del margen de error E calculado y el valor de la proporción muestral . luego 1 proporción. el procedimiento determinado de Minitab consiste en determinar los límites de intervalo de confianza por medio de un método exacto. n=1068. + Sustituya esos valores en el formato general para el intervalo de confianza: − − <± < + . las condiciones para la distribución binomial se satisfacen y existen al menos 5 éxitos y al menos 5 fracasos). Verifique que los supuestos requeridos se cumplan (la muestra es aleatoria simple. + 5. calcule los valores – . Construya el intervalo de confianza 1. n=1200. 3. (Por ejemplo. 95% de confianza 2. los límites del intervalo de confianza resultantes a tres dígitos Uso del Minitab para determinar intervalos de confianza Seleccione estadísticas. si el nivel de confianza es del 95%. Redondee significativos. 99% de confianza 3. En el cuadro de dialogo haga clic en el botón datos resumidos. x=800. ¿su puede utilizar el método analizado anteriormente para estimar la proporción de todos los adultos que tienen deudas pendientes? ¿Por qué? . n=500. Después de calcular la proporción muestral de esta muestra de n=100 sujetos. Para usar el método de aproximación normal analizado. el valor critico es z∝ 2 =1. Evalué el margen de error E = z∝ 2 4.Procedimiento para construir un intervalo de confianza para p. En vez de utilizar una aproximación normal. x=267. ingrese el nivel de confianza deseado. Remítase a la tabla A-2 y encuentre el valor crítico z∝ 2 que corresponde al nivel de confianza deseado. 2. haga clic en opciones y luego en el cuadro de la frase “use la prueba y el intervalo basado en una distribución normal”. También haga clic en el botón de opciones. 98% de confianza . estadística básica.

Requisitos: 1. .3 y s= 12. la distribución de las medias muestrales tiende hacer más consistente (con menos variación) que la distribución de otros estadísticos muestrales. Como la media muestral es el mejor estimado puntual de la media poblacional . El valor de la desviación estándar poblacional es conocido. La muestra es aleatoria simple. la media muestral es un estimador sin sesgo de la media poblacional . por las siguientes dos Por lo general la media de la muestra razones: 1. Para muchas poblaciones.Estimación de una media de población: conocida. siempre y cuando no se alejen demasiado). EJEMPLO. los estadísticos son los siguientes: n=40.3. Si distribución exactamente normal. 2. Requisitos de normalidad.5. (Se dice que los métodos de esta sección son robustos. =76. Para los datos muestrales. Podemos considerar que el requisito de normalidad se satisface si no hay valor extremo y si un histograma de los datos muestrales no se aleja mucho de la forma de campana. concluimos que el mejor estimado puntual de los pulsos cardiacos de todas las mujeres es 76. ¿Dónde estaríamos? El conjunto de datos del archivo FHEALTH incluye pulsos cardiacos (en latidos por minutos) de mujeres seleccionadas al azar. Utilice esta muestra para calcular el mejor estimado puntual de la media poblacional de los pulsos cardiacos de todas las mujeres. las medidas muestrales no tienden sistemáticamente a sobreestimar el valor de . (todas las muestras del mismo tamaño tienen la misma probabilidad de ser seleccionadas). Cualquier o ambas de estas condiciones se satisfacen: la población esta normalmente distribuida o n>30. Pulso cardiaco de mujeres. la media muestral es el mejor estimado puntual de la media poblacional . En la sección anterior vimos que la proporción muestral es el mejor estimado puntual de la proporción poblacional p. brinda el mejor estimado. sino aproximadamente normal. [es decir. 3. Por razones similares. El pulso cardiaco de las personas es sumamente importante. se ven muy afectados si los datos se alejan de la normalidad. Sin él. lo que significa que la distribución de medias muestrales tiende a concentrarse alrededor del valor de la media poblacional .3. SOLUCIÓN. Los requisitos incluyen la propiedad de que la población se ≥ 30. La medida muestral es el mejor estimado puntual de la media de la población.] sino que tienden a coincidir con este valor. =76. la población no necesita tener una distribuya normalmente o que n>30. es decir. Para todas las poblaciones. ni tienden sistemáticamente a subestimar el valor de .

Margen de error. . siempre y cuando la población tenga una distribución normal con medida y desviación estándar . Como se describió en la sección anterior. como 0.Intervalo de confianza. no nos da ninguna indicación precisa de que tan bueno es este mejor estimado. Sin embargo. Estimación del intervalo de la medida poblacional -E< O < +E donde ±E o E = ∝ 2∙ √ (con conocida).01. =0.95 (o 95%). Utilizando y la notación que se presento en sección anterior ahora podemos usar/el de / error que √ margen 2 expresa como sigue: Formula 1. Para un nivel de∝confianza de 0. como los datos de los 40 pulsos de mujeres que se incluyen en el conjunto de datos 1 del apéndice B.3 refleja el hecho de que la distribución del muestreo de la medida muestral es exactamente una distribución normal con medida y desviación estándar /√ . Los tres formatos que suelen usarse para expresar el intervalo de confianza se presentan en el siguiente cuadro. Aunque él un estimado puntual es el mejor valor individual para estimar un parámetro poblacional. En la sección anterior vimos que la desviación √ esE ∝ estándarpoblacional de la las medidas muestrales. un intervalo de confianza nos ofrece información que nos permite comprender mejor la exactitud del estimado.E.el nivel de confianza nos da la tasa de éxito de procedimiento que se utiliza para construir el intervalo de confianza. +E) Definición Los dos valores -E y +E se llaman limites del intervalo de confianza. La diferencia entre la medida muestral y la medida es un error. 0. ( . Cuando reunimos un conjunto de datos muestrales. ∝ es ∝ el = complemento del nivel nivel de confianza. Si la población no está distribuida normalmente las muestras grandes producen medidas muestrales con una distribución que se aproxima a la normal. podemos calcular la medida muestral y esa medida muestral por lo regular es diferente de la medida poblacional . La fórmula 1.95 (o 95%). El intervalo de confianza se asocia con un nivel de confianza.3 E = ∝ 2 ∙ √ margen de error para la medida (con base en σ).99 (o99%). Para un confianza de 0. Utilizando el margen de error E ahora podemos identificar el intervalo de confianza para la medida poblacional (si se satisfacen los requisitos de esta sección).05.

4 a 85. < Regla de redondeo para intervalos de confianza utilizados para estimar . ) redondee los limites del intervalo de confianza al mismo número de espacios decimales utilizados para la media muestral Interpretación de un intervalo de confianza. +E) 5. (por ejemplo.E and +E. Verifique que los supuestos requeridos se satisfagan. el valor critico es de z∝⁄2 =1.96). 2. 2. es conocida. Utilizando el valor calculado del margen de error E y el valor de la medida muestral . (Tenemos una muestra aleatoria simple.Procedimiento para construir un intervalo de confianza para conocida) (con 1. si el nivel de confianza es de 95%.E. 3. Correcta: “tenemos una confianza del 95% de que el intervalo de 72. calcule los valores . el 95% de estos contendrían realmente el valor de . Remítase en la tabla A-2 y calcule el valor crítico z∝⁄2 correspondiente al nivel de confianza deseado. Redondee los valores resultantes usando la siguiente regla de redondeo. 4. Cuando utilice el conjunto de datos original para construir un intervalo de confianza a un decimal más del que se usa para el conjunto de datos original. . sustituya esos valores en el formato general para el intervalo de confianza: -E< +E O ±E O ( . 1. Instituto Tecnológico Superior de Tierra Blanca Página 40 . (Esta interpretación correcta se refiere a la tasa de éxito del proceso que se usa para estimar la media poblacional).2 realmente tiene el valor verdadero de ”. Cuando el conjunto de datos original se desconoce y solo se utiliza el resumen de estadísticos (n. Esto significa que si seleccionamos muchas muestras diferentes del mismo tamaño y construimos los intervalos de confianza correspondiente a la larga. y la población parece estar distribuida normalmente o n>30). Evalué el margen de error E= z∝⁄2 ∙ /√ .

. La muestra es aleatoria simple. = $688.5<µ<6.. n=70. Requisitos: la media poblacional: 1. es el mejor estimado puntual de la medida poblacional He aquí aspecto clave de esta sección: si no se conoce. (Puesto que no conocemos el valor de . entonces Gosset publico bajo el seudónimo de student. n=41.0. que desarrollo William Gosset (1876-1937). pero los requisitos anteriores se satisfacen. Gosset fue un empresario de la cervecería Guinness Brewery que necesitaba una distribución que pudiera utilizarse con muestreas pequeñas. estimamos con el valor de la desviación estándar muestral s. y se sabe que σ es $18.200. Escriba un enunciado que interprete el intervalo de confianza de manera correcta. Instituto Tecnológico Superior de Tierra Blanca Página 41 . = $67.salarios de ex docentes del ITSTB que tomaron un curso de estadística: confianza del 95%. . y se sabe que σ es $68. La cervecería irlandesa donde trabajaba no permitía la publicación de resultados de investigaciones. Calcule el intervalo de confianza 1. 2. utilizamos la distribución t de student (en vez de la distribución normal). La media muestral . 2. La muestra proviene de una población distribuida normalmente o n<30.277.Ejercicios: Con base en datos muestrales se obtiene el siguiente intervalo de confianza del 95%: 2. los cuales son más grandes que los valores críticos de2(de 2 de la distribución normal. pero esto introduce otra fuente de confiabilidad en especial o las muestras pequeñas para mantener un intervalo de confianza a un nivel deseado el 95% compensamos esta falta de confiabilidad adicional haciendo más ancho el intervalo de ∝ ∝ una confianza: utilizamos valores críticos distribución t de Student).calificaciones de crédito de solicitantes de tarjetas de crédito: confianza del 99%. Estimación de desconocida.

denotados por ∝ 2 podemos describir 2 = 2. Utilizando la tabla A-3. El valor correspondiente el renglón para 22 grados de libertad y la ∝ columna para unencontrar área de 0. Si una población tiene una distribución normal. conocida a menudo como distribución t. de manera que encontramos los valores listados en la columna para un área de 0.05 en dos colas. Un valor de ∝ 2 se puede encontrar en la tabla A-3 localizando el numero apropiado de grados de libertad en la columna izquierda y avanzando por el renglón correspondiente hasta encontrar el numero que aparece directamente a bajo del área adecuada en el parte superior. Comencemos con el valor critico denotado por ∝ 2. Definición.La distribución de t Student. Por ejemplo. el numero de grados de libertad está dado por n-1 =22. El numero de grados de libertad para un conjunto de datos muestrales recolectados es el numero de valores muestrales que pueden variar después de haber impuesto cierta restricciones a todos los valor de los datos. podemos asignar con libertad valores a las primeras 9 puntuaciones. localizamos el renglón 22 con respecto a la columna de la extrema izquierda. Pronto analizaremos algunas de las propiedades importantes de la distribución t. pero antes presentamos los componentes necesarios para la construcción de intervalos de confianza.074. pero la decima puntuación se calcula la suma de las 10 puntuaciones debe ser 800 entonces la decima puntuación debe ser a 800 menos la suma de la primeras 9 puntuaciones. entonces ahora el que sabemosde margen cómo error E de ese intervalo valores de críticos confianza. Puesto que esas 9 primeras puntuaciones pueden seleccionarse con libertad para adoptar cualquier valor.05. Puesto que n=23. la distribución t student. un nivel de confianza de 95% corresponde a ∝ = 0. entonces la distribución de: = − √ Es una distribución t de Student para todas las muestras de tamaño n. se utiliza para calcular valores críticos denotados por t ∝ 2.074 Instituto Tecnológico Superior de Tierra Blanca Página 42 . Al igual que en la sección anterior.05 en dos colas es 2. Una muestra de tamaño n=23 es una muestra aleatoria simple seleccionada de una población distribuida normalmente. si 10 estudiantes tienen puntuaciones de examen con una media de 80. Para las aplicaciones de esta sección el número de grados libertad es simplemente el tamaño muestral menos 1. Grados de libertad = n – 1. Calcule el valor crítico ∝ 2 correspondiente a un nivel de confianza del 95%. decimos que existen 9 grados de libertad disponibles.

E < < +E O ±E ( . sustituya estos valores en el formato general para el intervalo de confianza: . +E) 5. remítase a la tabla A-3 y encuentre el valor crítico ∝/ que corresponde al nivel de confianza deseado. Verifique que los requisitos se satisfacen.(tenemos una muestra aleatoria simple y la población parece estar distribuida normalmente o n>30). 2. Instituto Tecnológico Superior de Tierra Blanca Página 43 . calcula los valores de -E y +E. La distribución t de Student es diferente para distintos tamaños de muestra. remítase al “área en dos colas”). ). (con 1. 1. Utiliza n -1 grados de libertad. La tabla A-3 lista valores de (con desconocidas). ∝/ . Si utiliza el conjunto original de datos. Propiedades importantes de la distribución t de Student.El margen de error E para la estimación de Formula 1.4 = ∝/ √ Donde ∝/ (con desconocidas). Si utiliza un resumen de estadísticos ( . redondee los límites del intervalo de confianza al mismo número de lugares decimales utilizados para la medida muestral. tiene n -1 grados de libertad. . (para el nivel de confianza.E. Intervalos de confianza para la estimación de -E< +E Donde = ∝/ < √ Procedimiento para construir un intervalo de confianza para desconocidas). Ahora listamos las propiedades importantes de la distribución t que utilizamos en esta sección. Redondee los límites del intervalo de confianza resultantes. Utilizando el valor del margen de error E calculando y el valor de la media muestral . redondee a un decimal mas que se usa para el conjunto original de datos. 3. Evalué el margen de error = ∝/2 ∙ /√ 4.

La distribución t student tiene una media de t=0 (así como la distribución normal estándar tiene una medida de z=0). La distribución t de student tiene la misma forma de campana simétrica que la distribución normal estándar. Conforme el tamaño muestral n se hace más grande. se obtuvieron los siguientes datos de pesos al nacer: n= 190. s=15. =100. =2700g. pero es mayor que 1(a diferencia de la distribución normal estándar tiene =1) 5. Dis6tr. el diseño del estudio justifica el supuesto de que la muestra puede tratarse como una muestra aleatoria simple. ibución normal est7á. a) n=150. =100. Utilice los datos muestrales para construir un estimado del intervalo de confianza del 95% de µ. La desviación estándar de la distribución t de student varia con el tamaño muestral. 3. s=645g. Distribución t de Student con n =12 0 Ejercicios: Suponiendo que usted planea construir un intervalo de confianza para la media poblacional µ. y la población tiene una distribución muy sesgada Ejemplo: en un estudio de los efectos sobre los bebes del consumo de cocaína durante el embarazo. utilice los datos para determinar si el margen de error debe calcularse utilizando un valor critico de la distribución normal (z) o un valor critico de (t) o de ninguno de estos.2. y la población tiene una distribución normal c) n=8.ndar. y la población tiene una distribución sesgada b) n=8. s=15. s=15. =100. 4. la distribución t de Student se acerca más a la distribución normal estándar. el peso medio al nacer de todos los bebes hijos de Instituto Tecnológico Superior de Tierra Blanca Página 44 . pero refleja una mayor variabilidad (con distribuciones más amplias) de lo que se espera con muestras pequeñas.

Instituto Tecnológico Superior de Tierra Blanca Página 45 .madres que consumieron cocaína durante el embarazo.

972* 645/√ = 92. utilizamos las distribuciones normales y t de Student.05.4: = ∝/ √ Ahora calcularemos el intervalo de confianza: indica a continuación: -E< < +E = 2700g y E= 92. EJERCICIOS: El peso perdido por una dieta de slim fast: 95% de confianza.972. como se 2700. Requisitos: 1.El valor crítico es ∝/2= 1.92. s=4. Cuando consideramos estimados de proporciones y medias.276226 2607.7238 < µ < 2792. Cuando desarrollamos estimados de varianza o desviaciones estándar utilizamos otra distribución. Calcule el margen de error E: el margen de error E= 2. =3.0 kg. En la tabla A-3 encontramos que el valor crítico corresponde a n-1= 189 grados de libertad y un área en dos colas de 0. el requisito de tener una distribución normal es mucho más estricto. pero este requisito es mucho más importante aquí.97355 se calcula utilizando la = 1. La muestra es aleatoria simple. .276226. (Suponga que la población tiene una distribución normal) a) calcule el margen de error b) calcule el intervalo de confianza para la media poblacional Estimación de la varianza poblacional. n=40. La población debe tener valores distribuidos normalmente (aun si la muestra es grande) El supuesto de una población distribuida normalmente se menciono en secciones anteriores. conocida como la distribución chi cuadrada.2762 Con base en los datos muestrales. los alejamientos de una distribución normal pueden generar errores muy graves. En consecuencia. y debemos revisar la distribución de los datos construyendo histogramas y graficas cuantilares normales. Como la tabla A-3 no incluye gl=189. Examinaremos características importantes de esta distribución antes de proceder con el desarrollo de intervalos de confianza. 2.9 kg. tenemos una confianza del 95% de que los limites de de 2608 g y 2792 g realmente contienen el valor del peso medio al nacer.972. utilizamos el valor critico más cercano de 1.276226 <µ< 2700 + 92.276226 formula 1. Para los métodos de esta sección.

Puesto que la distribución chi cuadrada es sesgada y no simétrica. El estadístico muestral =(n-1) / tiene una distribución llamada distribución chi cuadrada. Para calcular valores críticos de la distribución chi cuadrada. el intervalo de ± confianza no se ajusta al formato de y debemos hacer cálculos se parados para los limites de confianza superior e inferior.5 Donde n= tamaño muestral = Varianza muestral = varianza poblacional Denotamos chi cuadrada por . La distribución chi cuadrada no es simétrica. 2. Si se utiliza la tabla A-4 para calcular valores críticos.1. pero no puede ser negativos. que se pronuncia “ji cuadrada”. para cada muestra calculamos la varianza muestral (que es el cuadrado de la desviación estandar muestral s). y esa área representa la re un intervalo de región acumulativa localizada a la derecha del valor critico. Los valores de chi cuadrada pueden ser cero o positivos. Formulación 1. a diferencia de las distribuciones normales y t de student. En una población distribuida normalmente. con varianza . La tabla A-2 para la distribución normal estándar proporciona área acumulativa de la = ( ) . Grados de libertad = n-1.Distribución chi cuadrada. remitida a la tabla A-4. La distribución chi cuadrada se determina por el número de grados de libertad y en este capítulo usamos n1 grados de libertad. Propiedades de la distribución del estadístico chi cuadrada 1. observe su siguiente característica: En la tabla A-4 cada valor critico de corresponde a una área que se encuentra en el renglón superior de la tabla. En capítulos posteriores encontramos situaciones en las que grados de libertad no son n-1. Distribución chi cuadrada. por lo que no debemos hacer la generalización incorrecta de que el número de grados de libertad es siempre n. suponga que seleccionamos al azar muestras independientes de tamaño n y.

izquierda pero la tabla A-4 para la distribución chi cuadrada provee áreas acumulativas de la derecha. .

Se tiene una muestra aleatoria simple de 10 monedas de 1 centavo acuñadas con el equipo nuevo. Ejemplo: En la actualidad las monedas de 1 centavo de dólar se acuñan con una desviación estándar de .Procedimientos para construir un intervalo de confianza para 1. (la muestra es aleatoria simple y un histograma o grafico cuantiar normal sugiere que la población tiene una distribución que es muy cercana a la distribución normal). Una grafica cuantilar normal y un histograma indican que los pesos provienen de una población distribuida normalmente. = . Utilizando n-1 grados de libertad. utilice los resultados muestrales para construir un estimado de un intervalo de confianza del 95% de σ. Si se utiliza la desviación estándar o varianza muestrales redondee los límites del intervalo de confianza al mismo número de espacios decimales.0086< <. 3. buscamos en la tabla A-4 el valor de los nueve grados de libertad y revisamos las columnas con áreas de . Redondee los límites del intervalo de confianza resultantes. ( ) < <( ) 4. . redondee a un decimal más del que se usa para el conjunto original del dato. < < ( ) . la desviación estándar muestral de s=. la desviación estándar de los pesos de monedas de 1 centavo fabricadas con el equipo nuevo.0228 Con base en este resultado.023 Usando los valores críticos de 2.700 y =19. y la muestra tiene una desviación entandar de 0. Si se utiliza el conjunto original de datos. 2. se prueba un nuevo equipo con la intención de mejorar la calidad al reducir la variación.700 y 19. construimos el intervalo de confianza al evaluar lo siguiente: ( ).0125 y el tamaño muestral de 10. calcule la raíz cuadrada de los límites del intervalo de confianza superior e inferior y cambie por .025 los valores críticos de son = 2. ¿parce que el equipo nuevo sirve para reducir la variación de los pesos? Solución: el tamaño muestral es n=10 de manera que hay 9 grados de libertad . Evalúa los límites del intervalo de confianza e inferior utilizando el siguiente formato para el intervalo de confianza. 5. .0228 g contienen el valor real de σ. Si se desea un estimado del intervalo de confianza de . Verifique que los requisitos se satisfagan.0125 g. remítase a la tabla A-4 y encuentre los valores críticos correspondiente al nivel de confianza deseado.0165g.0086g y . .975 y . Con base en los resultados. tenemos una confianza del 95% de que los limites de .023.

Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco pasos: . lo cual nos lleva a definir y elaborar una distribución de muestreo de medias muestrales que nos permite explicar el teorema del límite central y utilizar este teorema para encontrar las probabilidades de obtener las distintas medias maestrales de una población. En este caso es necesario hacer una estimación puntual que es un valor que se usa para estimar un valor poblacional. el cual es un rango de valores en el que se espera se encuentre el parámetro poblacional En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveración acerca de un parámetro poblacional este método es denominado Prueba de hipótesis para una muestra.Hipótesis Y Prueba De Hipótesis Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis. se plantea una hipótesis. la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad. la desviación estándar o la forma de la población. Pero es necesario tener conocimiento de ciertos datos de la población como la media.. pero a veces no se dispone de esta información. 2.Pruebas de Hipótesis para una muestra 1. se describe como se puede tomar una muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en la cual se puede emplear el método de muestreo y el teorema del valor central lo que permite explicar cómo a partir de una muestra se puede inferir algo acerca de una población. Por tanto.introducción Dentro del estudio de la inferencia estadística. Pero una estimación puntual es un solo valor y se requiere un intervalo de valores a esto se denomina intervalo de confianza y se espera que dentro de este intervalo se encuentre el parámetro poblacional buscado.. después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera. Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba. es decir. para verificar si la afirmación es razonable se usan datos. En el análisis estadístico se hace una aseveración. También se utiliza una estimación mediante un intervalo. se emplea para determinar si la hipótesis es una afirmación razonable.

La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula.Procedimiento sistemático para una prueba de hipótesis de una muestra Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro. Analizaremos cada paso en detalle Objetivo de la prueba de hipótesis. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro. Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales proporcionen evidencia convincente de que es falsa. al llegar al paso cinco se puede o no rechazar la hipótesis. Paso 2: Seleccionar el nivel de significancia. La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población. . Se le denota mediante la letra griega α. 3. no a una estadística de muestra. El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral). Se le conoce también como la hipótesis de investigación. sino hacer un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro. Por lo general hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho.Siguiendo este procedimiento sistemático. pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba más allá de una duda razonable. Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian.. también es denominada como nivel de riesgo. Es una afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. La letra H significa hipótesis y el subíndice cero no hay diferencia.

El nivel de confianza (1-α). Si suponemos que la hipótesis planteada es verdadera. Instituto Tecnológico Superior de Tierra Blanca Página 50 . el nivel de significación indicará la probabilidad de no aceptarla. puede incurrirse en error: Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser aceptada. La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. cuando en realidad es verdadera.este término es más adecuado ya que se corre el riesgo de rechazar la hipótesis nula. Por otro lado. En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las consecuencias posibles. entonces. ya sea de aceptación de la Ho o de la Ha. no se puede rechazar la hipótesis nula. La distribución de muestreo de la estadística de prueba se divide en dos regiones. es decir. Tipos de errores Cualquiera sea la decisión tomada a partir de una prueba de hipótesis. Este nivel esta bajo el control de la persona que realiza la prueba. cuando es verdadera en la población. En cualquiera de los dos casos se comete un error al tomar una decisión equivocada. estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no rechazo de la de rechazo. Si la estadística de prueba cae dentro de la región de aceptación. estén fuera de área de aceptación. La probabilidad de cometer un error tipo I se denomina con la letra alfa α Un error tipo II. indica la probabilidad de aceptar la hipótesis planteada. se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada. una región de rechazo (conocida como región crítica) y una región de no rechazo (aceptación).

β disminuye.Para que cualquier ensayo de hipótesis sea bueno. incrementar lo que se llama poder de la prueba (1. De la probabilidad con la que estemos dispuestos a asumir estos errores. La única forma de reducir ambos tipos de errores es incrementar el tamaño de la muestra. Instituto Tecnológico Superior de Tierra Blanca Página 51 . La probabilidad de cometer un error de tipo II denotada con la letra griega beta β. probablemente sea pequeña.β) La aceptación de la hipótesis planteada debe interpretarse como que la información aleatoria de la muestra disponible no permite detectar la falsedad de esta hipótesis. se habrán apoyado exclusivamente en el análisis de una parte de ésta. Lo ideal sería establecer α y β. es deseable aumentar cuando ésta es verdadera. por ejemplo. Las contrastaciones se apoyan en que los datos de partida siguen una distribución normal Existe una relación inversa entre la magnitud de los errores α y β: conforme a aumenta. o sea. El estudio y las conclusiones que obtengamos para una población cualquiera. En la práctica se establece el nivel α y para disminuir el Error β se incrementa el número de observaciones en la muestra. Esto obliga a establecer con cuidado el valor de a para las pruebas estadísticas. dependerá. depende de la diferencia entre los valores supuesto y real del parámetro de la población. debe diseñarse de forma que minimice los errores de decisión.La meta de las pruebas estadísticas es rechazar la hipótesis planteada. lo cual puede ser o no ser posible. En otras palabras. la probabilidad de cometer un error de tipo II. Como es más fácil encontrar diferencias grandes. pues así se acortan los limites de confianza respecto a la hipótesis planteada . el tamaño de la muestra requerida. si la diferencia entre la estadística de muestra y el correspondiente parámetro de población es grande. y así se tiene a conseguir poner una limitación al error de mayor importancia. En la práctica un tipo de error puede tener más importancia que el otro.

si las muestras son de la prueba son iguales a 30 o mas se utiliza el estadístico z. cuando se conoce la desviación estándar (σ) poblacional. en caso contrario se utiliza el estadístico t. el valor estadístico de prueba es z y se determina a partir de: Instituto Tecnológico Superior de Tierra Blanca Página 52 . existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos z y t. Tipos de prueba a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad Ejemplo H0 : µ = 200 H1 : µ ≠ 200 b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤ H0 : µ ≥ 200 H1 : µ < 200 H0 : µ ≤ 200 H1 : µ > 200 En las pruebas de hipótesis para la media (μ).Paso 3: Cálculo del valor estadístico de prueba Valor determinado a partir de la información muestral. o cuando el valor de la muestra es grande (30 o más).. que se utiliza para determinar si se rechaza la hipótesis nula. La elección de uno de estos depende de la cantidad de muestras que se toman.

La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños. que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera.El valor estadístico z. para muestra grande y desviación estándar poblacional desconocida se determina por la ecuación: En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacional desconocida se utiliza el valor estadístico t. con prueba de una cola a la derecha Instituto Tecnológico Superior de Tierra Blanca Página 53 . es muy remota Distribución muestral del valor estadístico z. Paso :4 Formular la regla de decisión SE establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones en que no se rechaza la hipótesis nula.

05 Datos: Día 1 2 3 4 5 6 7 8 9 10 Usuarios 356 427 387 510 288 290 320 350 403 329 Día 11 12 13 14 15 16 17 18 19 20 Usuarios Día 305 21 413 22 391 23 380 24 382 25 389 26 405 27 293 28 276 29 417 30 Usuario 429 376 328 411 397 365 405 369 429 364 Solución: Se trata de un problema con una media poblacional: muestra grande y desviación estándar poblacional desconocida.Valor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula. Paso 5: Tomar una decisión.. Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería haberse rechazado (error tipo I). Para confirmar o no este supuesto se controla la cantidad de lectores que utilizaron la biblioteca durante 30 días. Tenga presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. Se considera el nivel de significancia de 0. En este último paso de la prueba de hipótesis.Ejemplo en la cual se indica el procedimiento para la prueba de hipótesis Ejemplo El jefe de la Biblioteca Especializada de la Facultad de Ingeniería Eléctrica y Electrónica de la UNAC manifiesta que el número promedio de lectores por día es de 350. se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula. 4. se calcula el estadístico de prueba. Instituto Tecnológico Superior de Tierra Blanca Página 54 . También existe la posibilidad de que la hipótesis nula se acepte cuando debería haberse rechazado (error de tipo II).

pero la desviación estándar de la población es desconocida. conocemos la media de la población.56951578 381 405 52.04706877 234 276 510 Instituto Tecnológico Superior de Tierra Blanca Página 55 . Calculamos la desviación estándar muestral y la media de la muestra empleando Excel.4143965 Varianza de la muestra 2747.Paso 01: Seleccionamos la hipótesis nula y la hipótesis alternativa Ho: μ═350 Ha: μ≠ 350 Paso 02: Nivel de confianza o significancia 95% α═0.36687081 0. debido a que el numero de muestras es igual a 30.8 9. en este caso determinamos la desviación estándar de la muestra y la utilizamos en la formula reemplazando a la desviación estándar de la población. lo cual se muestra en el cuadro que sigue. Columna1 Media Error típico Mediana Moda Desviación estándar 372.05 Paso 03: Calculamos o determinamos el valor estadístico de prueba De los datos determinamos: que el estadístico de prueba es t.26897 Curtosis Coeficiente de asimetría Rango Mínimo Máximo 0.

Paso 05: Toma de decisión.38 0.96. Por consiguiente la regla de decisión: es rechazar la hipótesis nula y aceptar la hipótesis alternativa.96 y +1. 391.0%) 11184 30 19. el área en la que no se rechaza Ho está entre las dos colas. es por consiguiente 0. En este último paso comparamos el estadístico de prueba calculado mediante el Software Minitab que es igual a Z = 2.96. la mitad de 0.017 Instituto Tecnológico Superior de Tierra Blanca Página 56 .025. está en cada cola. si el valor Z calculado no queda en la región comprendida entre -1.044.569 (354.96.38 y lo comparamos con el valor critico de Zc = 1.Suma Cuenta Nivel de confianza (95. es decir 0.96. Como el estadístico de prueba calculado cae a la derecha del valor critico de Z. Por tanto no se confirma el supuesto del Jefe de la Biblioteca.800 9. La regla de decisión la formulamos teniendo en cuenta que esta es una prueba de dos colas. se rechaza Ho.05 da un valor de Zc = 1. One-Sample Z Test of mu = 350 vs not = 350 The assumed standard deviation = 52.556) 2.414 N Mean SE Mean 95% CI Z P 30 372. En caso contrario no se rechaza la hipótesis nula si Z queda entre -1.571868 Paso 04: Formulación de la regla de decisión.05. El valor critico para 0.96 y +1.95.

La prueba resultó ser significativa. • La evidencia estadística no permite aceptar la aceptar la hipótesis nula.Conclusiones: • Se rechaza la hipótesis nula (Ho).05. Instituto Tecnológico Superior de Tierra Blanca Página 57 . se acepta la hipótesis alterna (H1) a un nivel de significancia de α = 0.

Utilice los datos muestrales. Se satisfacen las condiciones np≥5 y nq≥ 5. Las observaciones muestrales son una muestra aleatoria simple 2.Prueba de una aseveración respecto de una proporción. Se satisfacen las condiciones para una distribución binomial 3. para probar la aseveración de que la mayoría de los empleados (más del 50%) consiguen su trabajo por medio de redes de contacto. Requisitos: 1. Las aseveraciones sobre una proporción poblacional suelen probarse utilizando una distribución normal como aproximación de la distribución binomial. con un nivel de significancia de 0. el 61% obtuvo trabajo por medio de redes de contacto. Paso 0 : Analizar si se cumplen los requisitos: Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 Instituto Tecnológico Superior de Tierra Blanca Página 58 .05. El estadístico de prueba para probar una aseveración sobre una proporción es: = − Ejemplo: De los resultados de una encuesta a 703 empleados elegidos al azar.

Para el nivel de confianza introduzca el complemento del nivel de significancia. Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 Minitab : Seleccione stat.Cuando Gregor Mendel realizó sus famosos experimentos de hibridación con chicharos. Para alternative seleccione el formarto usado para la hipótesis alternativa. Según la teoría de Mendel ¼ de los vástagos de chicharos de chicharos debían tener vainas amarillas. Utilice un nivel de significancia de 0. haga clic en el botón de options y luego en el recuadro que dice “use tests and interval based on normal distribution”. para probar la aseveración de que la proporción de vástagos de chicharos con vainas amarillas es igual a ¼. Instituto Tecnológico Superior de Tierra Blanca Página 59 . Introduzca el tamaño de muestra y el numero de éxitos y después haga clic en Options y proceda a introducir los datos en el cuadro sde dialogo.05 con el método del valor P. En vez de usar una aproximación normal. Basic statics. luego haga clic en el botón de summarized data. Para utilizar el método de aproximación normal presentado en este tema. uno de ellos dio por resultados descendencia que consistía en 428 plantas de chicharos con vainas verdes y 152 plantas de chicharos con vainas amarillas. Para el valor de test proportion. ingrese la proporción empleada en la hipótesis nula. 1 proportion. el procedimiento determinado por Minitab consiste en determinar el valor P empleando un método exacto.

de los cuales 516 afirman sentirse satisfechos con su trabajo. α=0.α=0.. 3.prueba de dos colas.. 4.EJERCICIOS: En los siguientes ejercicios examine la afirmación dada.. 1. y los estadísticos de muestra incluyen n=1018 sujetos. α=0.05 2..17 es p < 0..α=0.10. es p ≠ 0.25.prueba de cola derecha.. de los cuales 224 dicen que fumaron un cigarrillo la semana pasada. que es la desviación estándar de la población general.El peso medio de mujeres que han ganado el título de nuestra belleza México es igual 54. Instituto Tecnológico Superior de Tierra Blanca Página 60 . después exprese la hipótesis nula y la hipótesis alternativa de manera simbólica.01 3.Más del 25% de los usuarios de internet pagan sus facturas en línea.02.. Calcule los valores críticos siguientes: 1. y los estadísticos de muestra incluyen a 580 adultos empleados.Las puntuaciones del CI de los profesores universitarios tienen una desviación estándar menor que 15. 2. La aseveración es que más de 75% de los empleados están satisfechos con su trabajo.19 Calcule el valor del estadístico de prueba z La aseveración es que la proporción de adultos que fumaron un cigarrillo la semana pasada es menor que 0.8846 kg. (Asegúrese de emplear el símbolo correcto.

El resto tenia flores blancas. Use el nivel de significancia de 0.94% de ellos presentaba flores verdes. Se satisface una o ambas de las siguientes condiciones: la población se distribuye normalmente y n>30 El estadístico de prueba que se utiliza es el siguiente: = − √ Ejemplo: un fabricante de equipo deportivo desarrolla un nuevo sedal sintetico que afirma tiene una resistencia media a la tensión de ocho kilogramos con una desviación estándar de 0. Utilice los resultados de esta muestra para probar la aseveración de que más del 15% de los hogares estadunidenses emplean el correo electrónico. Utilice un nivel de significancia de 0. los valores críticos y el valor P se resumen de la siguiente manera: 1. ¿Sería válida la conclusión aun hoy? ¿Por qué? . La muestra es aleatoria simple 2.En uno de los famosos experimentos de Mendel sobre la hibridación.05. se obtuvieron 8023 vástagos de chicharos y el 24.05 para probar la aseveración de que la plantas de chicharos con flores verdes se presenta en una proporción del 25% a) b) c) d) e) ¿Cuál es el estadístico de prueba? ¿Cuál es el valor crítico? ¿Cuál es el valor P? ¿Cuál es la conclusión? Se podría utilizar una hipótesis para “probar” que el porcentaje de plantas de chicharos con flores verdes es del 25% como se aseveró? En 1997 una encuesta de 880 hogares estadunidenses revelo que 149 de ellos emplean el correo electrónico. Considere una prueba de hipótesis que utiliza un nivel de significancia de 0. Instituto Tecnológico Superior de Tierra Blanca Página 61 .01. Pruebe la hipótesis µ= 8 kilogramos contra la alternativa µ≠8 kilogramos si se prueba una muestra aleatoria de 50 sedales y se encuentra que tienen una resistencia media a la tensión de 7. el estadístico de prueba. Prueba de hipótesis respecto a una media con desviación estándar poblacional conocida Los requisitos.5 kilogramos. Se conoce el valor de la desviación estándar poblacional 3.8 kg.

.Tiene la misma forma de campana que la distribución normal estándar.Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 Prueba de hipótesis respecto a una media con desviación estándar poblacional desconocida Requisitos.Tiene una media de t=0 Instituto Tecnológico Superior de Tierra Blanca Página 62 .Difiere para tamaños de muestra distintos 2.. 1. su forma más ancha refleja una mayor variabilidad..La muestra es aleatoria simple 2.. 3..Se desconoce el valor de la desviación estándar poblacional σ El estadístico de prueba usado para este caso es: = − √ Propiedades importantes de la distribución t de Student 1. lo que se espera cuando se utiliza s para estimar σ.

elegidos al azar de una bolsa que contiene 465 m&m. los cuales tienen una media de = 0. Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 Instituto Tecnológico Superior de Tierra Blanca Página 63 .La desviación estándar de la distribución varía de acuerdo con el tamaño muestral y es mayor que 1. el conjunto de datos sobre los dulces m&m que se mostro en secciones anteriores incluye los pesos de 13 dulces m&m rojos. en el empaque se afirma que el peso neto del contenido es de 396. de manera que los consumidores están recibiendo mas que la cantidad indicada en la etiqueta.. para probar la aseveración que hizo un gerente de producción de que los m&m tienen en realidad una media mayor que 0. de manera que los m&m deben tener un peso medio de al menos 396.0576 g. 5.9 g. esta distribución (t) se acerca más a la distribución normal estándar.8535 g.05. Ejemplo: Control de calidad de los dulces m&m.4.8535g para dar la cantidad anunciada. A continuación se presentan los pesos en gramos.8635 y una desviación estándar de s= 0.9/465 = 0.Conforme aumenta el tamaño muestral n. Utilice los datos muestrales con un nivel de significancia de 0.. Utilice el método tradicional siguiendo el procedimiento descrito en el diagrama de flujo.

se calcula utilizando un nivel de significancia α particular y un valor específico del parámetro de la población que representa una alternativa al valor considerado como verdadero en la hipótesis nula. Instituto Tecnológico Superior de Tierra Blanca Página 64 . Es decir. la potencia de una prueba de hipótesis es la probabilidad de sustentar una hipótesis alternativa que es verdadera.) de rechazar una hipótesis nula falsa.Potencia de una prueba: La potencia de una prueba de hipótesis es la probabilidad (1.

el conjunto de datos 2 del apéndice B incluye 106 temperaturas corporales con una media de 98.0 Lapotenciaesunafuncióndeltamañodelamuestraydeladesviaciónestándar.042165 0. la alternativa.032162 0. el valor P. Aseveración: La puntuación media del coeficiente intelectual de profesores de industrial es mayor que 120.032162 0. 1..ustedtendríaunaprobabilid adde60%dedetectar ladiferencia.0496 55 Paraniveldesignif.9 0.049655 mayor.Suponga que se seleccionó una muestra aleatoria simple de una población distribuida en forma normal.8 0. 0.7 Pote ncia ¿Cuáleslaprobabilidaddedete ctarunadiferencia? <40% 60 % 90 % 100 % ¿Quédiferenciapuededetectarco nun tamañodemuest rade13? Diferencia Potencia 0. =132.0 90.Parad etectarunadiferenciamenorque0.0 70.considere aumentareltamañodelamuestra. 1. s=12..0 0. el estadístico de prueba.tendríauna probabilidadde90. 2. obtenga la hipótesis nula.=0. Utilice un nivel de significancia .036769 0. el valor o valores críticos y establezca la conclusión final. El nivel de significancia es α= 0. Datos muestrales: n=21.Sifuera0.0 80.032162.05.20 ºF y una desviación estándar de 0.042165.05ytamañ odelamuestra=13: Silamediaverdaderafueramayor queelobjetivopor 0.62ºF.Pruebatde1muestraparal amediadeRed Informededia gnóstico Ordendelosdatosenlahojadetrabajo Investigar valoresatípicos(marcadosenrojo).049655 60. Ejercicios.

¿Parece que la media de 98.6 ºF que suele utilizarse es errónea? .05 para probar la aseveración de que la temperatura media corporal es menor que 98.de 0.6ºF. con base en esos resultados.

95 12.07 11.Curso de Estadística Básica Prueba de hipótesis respecto a una desviación estándar Requisitos: 1.90 12.02 11. 2.01 11.93 11. con gl= n-1 para el numero de grados de libertad. Se prueba una nueva máquina embotelladora.02 11.05 Instituto Tecnológico Superior de Tierra Blanca Página 66 .05 para probar la aseveración de que las latas de bebidas de cola de la nueva máquina tienen cantidades con una desviación estándar menor que 0.99 12. La distribución chi cuadrada no es simétrica.99 11.051 onzas.93 11.00 12.96 11. pero también quieren producir artículos con una calidad consistente.99 11. Ejemplo: El mundo de la industria comparte esta meta en común: mejorar la calidad reduciendo la variación.02 12..96 11.98 12. eliminando los defectos.02 11. y una muestra aleatoria simple de 24 latas produce las cantidades en onzas que se listan a continuación.La población tiene una distribución normal El estadístico que se utiliza para este tipo de pruebas es: =( − 1) Valores P y valores críticos: Utilice la tabla A-4. pero no puede ser negativos.95 Paso 0 Paso 1 11. Los ingenieros de control de calidad desean asegurarse que un producto tenga una media aceptable.La muestra es aleatoria simple 2. (Las 24 cantidades tienen una desviación estándar de s=0.039 oz). Crown ha fabricado latas de bebidas de cola con cantidades que tienen una desviación estándar de 0. Propiedades de la distribución 1. a diferencia de las distribuciones normales y t de student.02 11.99 12.98 11. Utilice un nivel de significancia de 0.. 11.98 12. Los valores de chi cuadrada pueden ser cero o positivos.98 12.051 oz.

Curso de Estadística Básica Paso 2 Instituto Tecnológico Superior de Tierra Blanca Página 67 .

mientras que aquí se requieren 189 grados.05 para probar la aseveración de que la desviación estándar de los pesos al nacer de hijos de consumidoras de cocaína difiere de la desviación estándar de 696 g de los pesos al nacer de los hijos de las mujeres que no consumieron cocaína durante el embarazo.31g.9638) Con base en el resultado.utilice un nivel de significancia de 0. y s=645. 1.Curso de Estadística Básica Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 En los siguientes ejercicios pruebe la aseveración dada.01 para probar la aseveración de que los dulces M&M de cacahuate tienen pesos que varían mas que los pesos de los dulces M&M sencillos. una muestra de 41 dulces M&M de cacahuate tienen pesos con una desviación estándar de 0. ¿parece que la cocaína consumida por las madres afecta la variación de los pesos de sus bebés? 2. Utilice un nivel de significancia de 0. Utilice el método tradicional de prueba de hipótesis. = 2700 g.. utilice los siguientes valores críticos obtenidos por medio de software XL = 152. (como la tabla A-4 tiene un máximo de 100 grados de libertad.056 g. Suponga que se selecciona una muestra aleatoria simple de una población distribuida normalmente.Se realizó un estudio de hijos de madres que consumieron cocaína durante el embarazo y se obtuvieron los siguientes datos muestrales de pesos al nacer: n= 190.. La desviación estándar de los pesos de los dulces M&M sencillos es de 0.8222 y XR= 228. ¿Por qué los dulces de cacahuate tendrán pesos que varían mas que los pesos de los dulces sencillos? Instituto Tecnológico Superior de Tierra Blanca Página 68 .

si no que estimamos su valor común con la proporción muestral agrupada que se describe a continuación.. el número de éxitos es de al menos 5 y el número de fracasos es de al menos 5. los requisitos y la notación son los siguientes. Utilice los datos muestrales de la tabla. Instituto Tecnológico Superior de Tierra Blanca Página 69 . 2. Ejemplo: La siguiente tabla incluye los resultados de una prueba clínica en la que se dio tratamiento a pacientes con síndrome del túnel carpiano. Observe que cuando se prueba la hipótesis nula de p1=p2. Proporción muestral agrupada.Curso de Estadística Básica Inferencias a partir de dos muestras Inferencias acerca de dos proporciones Cuando se prueba una hipótesis acerca de dos proporciones poblacionales o cuando se construye un intervalo de confianza de la diferencia entre dos proporciones poblacionales.05 para probar la aseveración de que la tasa de éxito de la cirugía es mejor que la tasa de éxito del entablillado.. no hay necesidad de estimar los parámetros individuales p1 y p2.Para ambas muestras. con un nivel de significancia de 0. = + + Estadístico de prueba para dos proporciones (con Ho: p1=p2) = ( − )−( − + ) Donde p1-p2=0 (supuesto en la hipótesis nula) = = y + + = =1− Utilice la tabla A-2.tenemos proporciones de dos muestras aleatorias simples que son independientes. Requisitos: 1.

Haga clic en options e introduzca el nivel de confianza deseado. ingrese el valor aseverado de p1-p2.Curso de Estadística Básica Tabla de datos: tratamiento del síndrome del túnel carpiano Cirugía 67 73 92% Tratamien to Éxito un año después del tratamiento Número total de sujetos tratados Porcentaje de éxito Paso 0 Entablillado 60 83 72% Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 Minitab: seleccione stat de la barra del menú principal. seleccione el formato para la hipótesis alternativa y haga clic en el cuadro para utilizar el estimado agrupado de p para la prueba. Si realiza una prueba de hipótesis. luego seleccione basic statics. luego 2 proportions. Instituto Tecnológico Superior de Tierra Blanca Página 70 . Haga clic en OK dos veces. Haga clic en el botón summarize Data e ingrese los valores muestrales.

Curso de Estadística Básica EJERCICIOS: Calcule el número de éxitos x sugeridos por la afirmación dada: 1. b) El estadístico de prueba z.Grupo de tratamiento n1= 500 =100 Grupo Placebo n2=400 =50 Instituto Tecnológico Superior de Tierra Blanca Página 70 . el 7% consumió una bebida alcohólica cada día. c)los valores críticos de z y d) el valor P 1. Utilice los tamaños muestrales y los números de éxitos dados para calcular a) el estimado agrupado .De 976 sujetos encuestados.05 para probar la aseveración de que p1=p2.. Suponga que usted planea utilizar un nivel de significancia de α=0.

un término que se utiliza comúnmente en el contexto de una relación entre dos variables. que sirve para detectar patrones lineales. como una muestra de respuesta voluntaria). pero se deben satisfacer los siguientes requisitos cuando se prueban hipótesis o cuando se hacen inferencias acerca de r. Conceptos básicos de correlación Iniciamos con la definición básica de correlación. Es necesario eliminar cualquier valor extremo. 3. si se sabe que se trata de un error. 2. es importante enfocase en los conceptos de esta sección. C oefi cien te de co rrel ación lin eal Puesto que el examen visual de los diagramas de dispersión es muy subjetivo. Instituto Tecnológico Superior de Tierra Blanca Página 71 . sin entretenerse demasiado con cálculos aritméticos tediosos. Requisitos Dado cualquier conjunto de datos muestrales apareados siempre se puede calcular el coeficiente de correlación lineal r. Empleamos el coeficiente de correlación lineal r. si se sabe que se trata de un error. Los efectos de cualquier valor extremo. lo que quiere decir que cuando se grafican. necesitamos medidas más precisas y objetivas. calculamos el valor de r (generalmente con recursos tecnológicos) y luego utilizamos este valor para concluir que existe (o no) una relación entre las dos variables. los puntos se aproximan al patrón de una línea recta. la muestra de datos apareados es una muestra aleatoria de datos cuantitativos. El examen visual del diagrama de dispersión debe con firmar que los puntos se acercan al patrón de una línea recta. Los efectos de cualquier otro valor extremo deben tomarse en cuenta calculando r con y sin el valor extremo incluido. (es importante que los datos muestrales no se hayan reunido por medio de algún método inapropiado.Curso de Estadística Básica Correlación Concepto clave: en esta sección se explica el coeficiente de correlación lineal r que es una medida numérica de la fuerza de la relación entre dos variables que representan datos cuantitativos. 1. Puesto que los programas de cómputo o las calculadoras suelen emplearse para calcular el valor de r. Utilizando datos muéstrales apareados (que en ocasiones se llaman datos bivariados). Defini ció n Una correlación existe entre dos variables cuando una de ellas está relacionada con la otra de alguna manera. En esta sección solo consideramos las relaciones lineales.

se calcula su suma. inclusive. no existe evidencia suficiente para sustentar la conclusión de una correlación lineal. concluya que existe una correlación lineal significativa. denota la suma de los elementos indicados. no existe evidencia para sustentar la conclusión de una correlación lineal.6 está construida. r ρ Formula 1. todos estos productos. Si r se acerca a 0. indica que cada valor de x debe elevarse al cuadrado y después deben sumarse esos cuadrados. Interpretación de r por medio de un programa de cómputo: si el valor P calculado es menor o igual que el nivel de significancia. a 1 o a -1 son vagas. indica que los valores de x deben sumarse y el total elevarse al cuadrado. concluya que existe una correlación lineal.956 obtenido en el ejemplo anterior. denota la suma de todos los valores de x. Es sumamente importante evitar confundirse entre Σx² y (Σx)² indica que cada valor de x debe multiplicarse primero por su valor y correspondiente.6 = (∑ (∑ ) (∑ ) ) (∑ )(∑ (∑ ) ) (∑ ) Interpretación de r por medio de la tabla A-6: si el valor absoluto del valor calculado de r excede el valor de la tabla de A-6. De lo contrario. por lo que utilizamos el siguiente criterio especifico de decisión: Instituto Tecnológico Superior de Tierra Blanca Página 72 .Curso de Estadística Básica Notación para el coeficiente de correlación lineal n Σ² Σx Σx ² (Σx)² Σxy representa el numero de pares de datos presentes. la letra griega rho se usa para representar el coeficiente de correlación lineal de una población. Interpretaciones tales como “cercano a” 0. pero si r se acerca -1 o +1. Después de obtener. representa el coeficiente de correlación lineal de una muestra. De lo contrario. concluimos que hay una correlación lineal entre x y y. Interpretación del coeficiente de correlación lineal Necesitamos interpretar un valor calculado de r. el valor de r siempre debe estar entre -1 y +1. tal como el valor de -0. Dada la manera en que la formula 1. concluimos que no existe una correlación lineal entre x y y.

la tabla A-6 lista valores que son “críticos” en este sentido: separan valores comunes de r de aquellos que son poco comunes. Cuando en realidad no existe una correlación lineal entre x y y. no existe evidencia suficiente para sustentar la conclusion de una correlación lineal. no existe evidencia suficiente para sustentar la con conclusión de una correlación lineal. Uso de un programa de cómputo: si el valor P calculado es menor o igual que el nivel de significancia. se concluye que existe una correlación lineal. Instituto Tecnológico Superior de Tierra Blanca Página 73 . se concluye que existe una correlación lineal. De lo contrario.Curso de Estadística Básica Uso de la tabla A-6: Si el valor absoluto del valor calculado de r excede el valor de la tabla A-6. De lo contrario.

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 74 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 75 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 76 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 77 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 78 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 79 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 80 .