Está en la página 1de 310

Carrera: Plan de Estudios Clave de la Asignatura:

Ingeniería Ambiental IAMB-2010-206 AMF-1019


Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 1 Introducción al Minitab y Excel
Ambiental

Competencias a desarrollar: Habilidad en el uso de las tecnologías de la


información y comunicación.

Objetivo específico: Comprender las herramientas estadísticas básicas del Minitab


y Excel que le permita al estudiante apreciar el valor práctico de la estadística.

INTRODUCCIÓN

1.1 Introducción al Minitab

Minitab es un paquete estadístico que incluye funciones de la estadística descriptiva,


estadística inferencial, diseño de experimentos, series de tiempo, estadística multivariada,
confiabilidad y otras funciones especiales para facilitar los cálculos y los análisis
estadísticos.
Todas las líneas de comando tendrán el formato siguiente (> separa menús):
Datos > Cambiar tipo de datos > Numérico a texto

1.1. Pantallas y menús

Antes de comenzar su análisis, inicia Minitab y examina el diseño de las ventanas.

Al ejecutar Minitab 16 aparece la ventana de la figura 1:


Figura 1. Ventana inicial del Minitab 16 en español

Como en cualquier otra aplicación Windows, esta ventana puede modificarse en cuanto al
tamaño y a la disposición de sus elementos. Se trata de una ventana típica de una
aplicación Windows que consta de los siguientes elementos:

En la primera línea aparece

 Barra de título, que contiene el nombre de la ventana y los botones de minimizar,


maximizar y cerrar.
 Barra de menús, que consta de los 11 menús: Archivo, Editar, Datos, Calc,
Estadísticas, Gráfica, Editor, Herramientas, Ventana, Ayuda y Asistente.
 Barra de herramientas, donde, mediante botones con iconos, se representan
algunas de las operaciones más habituales. Si pasamos el puntero del ratón por
cualquiera de ellos, aparecerá en la pantalla un texto indicando la función que se
activa.
 Ventana de sesión, Es la parte donde aparecen los resultados de los análisis
realizados en formato de texto. También sirve para escribir instrucciones, como forma
alternativa al uso de los menús.
 Hoja de trabajo, Tiene el aspecto de una hoja de cálculo, con filas y columnas. Las
columnas se denominan C1,C2, C3, …… tal como está escrito, pero también se les
puede dar un nombre, escribiéndolo debajo de C1,C2,….. Cada columna es una
variable y cada fila corresponde a una observación o caso. Puede abrir varias hojas
de trabajo, cada una en una ventana Datos actual distinta.
 Ventana de proyecto (Project Manager). Organiza los componentes del proyecto
de Minitab en carpetas, incluyendo las hojas de trabajo, las gráficas, un registro de
todos los comandos utilizados, entre otros. Esta ventana aparece minimizada en la
parte inferior.

1.2 Barra de menús

A continuación se da un resumen de lo que se puede encontrar en la barra de menús:

 Archivo: Mediante este menú se pueden abrir, guardar o describir los diferentes
archivos que Minitab emplea (proyecto o de hoja de trabajo), así como Consultar base
de datos (ODBC), abrir gráfica u otros archivos. Igualmente, es posible controlar las
tareas de impresión.

 Editar: Permite realizar las tareas habituales de edición: borrar, eliminar, copiar, y
pegar celdas.
 Datos: Este menú permite realizar modificaciones en la hoja de trabajo, como es crear
subconjuntos, dividir y combinar. En las columnas te permite copiar, desapilar, apilar
o transponer. Entre otras acciones, ordenar, jerarquizar, eliminar filas, borrar
variables, codificar, cambiar tipo de datos y concatenar.
 Calc: Este es un menú es que más se va utilizar ya que aquí se encuentran todas las
opciones relativas a la modificación y generación de nuevas variables, cálculo de los
estadísticos, introducción de datos por patrón, cálculo de las distribuciones de
probabilidad, datos aleatorios, etc.
 Estadísticas: Mediante este menú se accede a los diferentes análisis estadísticos
que se pueden realizar con los datos. Entre las opciones se encuentra la estadística
básica, la cual nos va a permitir realizar los cálculos de la estadística descriptiva, las
pruebas de z, t y proporciones para una muestra o dos muestras, realizar prueba de
hipótesis. Otras opciones se encuentran regresión, ANOVA, gráficas de control,
potencia y tamaño de la muestra, entre otras.
 Gráfica: Permite la creación y edición de diversos tipos de gráficos. Algunos de ellos
son también accesibles a través de determinadas técnicas estadísticas.
 Editor: Tiene distintas opciones según esté activada la ventana de sesión o la hoja
de datos. Con la ventana de sesión activada permite, por ejemplo, que se pueda
escribir (en dicha ventana) utilizando el lenguaje de comandos.
 Herramientas: Entre otras cosas, permite personificar la barra de herramientas y la
barra de menús
 Ventana: Dispone de las funciones habituales para controlar las ventanas.
 Ayuda: Proporciona ayuda al usuario en el formato típico de Windows.
 Asistente: Es una herramienta basada en un menú diseñada para guiar incluso a los
usuarios inexpertos en sus análisis y ayudarles a interpretar sus resultados con
confianza.

1.3 Ventana sesión

La ventana de sesión se activa de dos maneras: hacer clic sobre ella o hacer clic sobre su
icono en la barra de herramientas (primer icono de la Figura 2). Para activar la hoja de
trabajo podemos hacer clic sobre ella o hacer clic sobre su icono en la barra de herramientas
(segundo icono de la Figura 2). Para activar la ventana de proyecto (Project Manager) se
puede maximizar o hacer clic sobre su icono en la barra de herramientas (tercer icono de
la Figura 2).

Figura 2. Iconos para activar la ventana de sesión, datos o proyecto

1.3 Entrada, grabación y lectura de datos

1.3.1 Entrada de datos

Cuando se va a realizar un análisis estadístico es necesario tener un conjunto de datos,


para lo cual se procede de cuatro formas:

1. Escribir a través del teclado.


2. Obtener desde un archivo.
3. Pegar.
4. Generar por patrón o de forma aleatoria.

Por lo general siempre se utiliza la primera opción.


Para introducir datos a través del teclado, se activa en primer lugar la ventana de datos
(Hoja de trabajo). En la parte superior aparece C1, C2, C3,….. y debajo un espacio en
blanco para poner el nombre de cada variable. La flechita del extremo superior izquierdo de
la hoja de datos señala hacia donde se mueve el cursor al pulsar la tecla Enter. Por defecto

apunta hacia abajo (↓); si se hace clic sobre ella, apuntará hacia la derecha ( →). Para

escribir datos por columna no hay más que situarse en la casilla del caso 1, teclear el dato
y pulsar la tecla enter. La casilla activa se moverá hacia abajo.

Minitab acepta tres tipos de datos: numéricos, de texto y de fecha/hora.

Para introducir una variable numérica se puede realizar de dos maneras; introduciendo el
valor numérico directamente sobre la celda o bien dando clic con botón derecho del mouse

sobre la celda y seleccionar formato de columna ⇒ numérico. Con esta versión, la

separación decimal de una variable numérica es a través de un punto. Si se coloca una


coma como separación decimal, entonces Minitab considera que dicha la variable es
cualitativa o de texto y, por tanto, no se puede realizar ningún cálculo matemático con los
datos de esta variable.

Al introducir variables que no son numéricas, como las de texto o fecha/hora, en la hoja de
datos aparecerá en la celda un guion y la letra T si la variable es de texto, y si, la variable
es de fecha/hora aparece el guion con la letra D como lo muestra la figura 3.

Figura 3. Hoja de trabajo con los tres tipos de datos (numérico, texto y
fecha/hora)

Si el nombre de la variable (columna) no es suficientemente explicativo, se puede escribir


una descripción de la variable para poder consultarla en cualquier momento. Para ello, dar
clic con botón derecho sobre el nombre de la variable, seguir la instrucción:
Columna>Descripción. Por ejemplo, se puede escribir etiquetas descriptivas para las
variables Nota (de 0 a 10) y Tiempo (en minutos).

Para cambiar el formato de una variable numérica, dar clic sobre el nombre de la variable
pulsar con el botón derecho del mouse y la instrucción Formato columna > numérico. Una
de las utilidades de esta opción es el cambio del número de decimales que se muestran en
la hoja de datos (figura 4).

Figura 4. Ventana para cambiar el formato de la variable numérica

1.3.2 Grabación de datos

Una vez introducidos los datos, éstos pueden guardarse en un archivo para poder ser
utilizados en cualquier otro momento.

Para guardar únicamente la hoja de datos hay que seleccionar Archivo> Guardar hoja de
trabajo actual como (si se va a grabar el archivo de datos por primera vez y, por tanto,
asentar un nombre al archivo) ó archivo guardar como hoja de trabajo actual (si el archivo
de datos ya tiene nombre pero se quiere guardar los últimos cambios realizados). Minitab
le asigna automáticamente la extensión .mtw

Para grabar toda la información (la hoja de datos, el contenido de la ventana de sesión, los
gráficos que se hayan realizado, los valores de las constantes y de las matrices que se
hayan creado, etc.) se usa la opción Archivo > Guardar proyecto como (si se va a grabar
el proyecto de Minitab por primera vez y, por tanto, dar un nombre al archivo) ó Archivo >
Guardar proyecto (si el proyecto ya tiene nombre pero se quiere guardar los últimos
cambios realizados). Es muy importante diferenciar entre archivos de datos (.mtw) y
archivos de proyectos (.mpj).

1.3.3 Lectura de datos

Un archivo sólo puede ser recuperado de la forma en que fue grabado. Si se ha grabado
como hoja de datos (.mtw) se recupera con la opción Archivo> Abrir hoja de trabajo. Si
se ha grabado como proyecto de Minitab (.mpj) se recupera con la opción Archivo> Abrir
proyecto

Minitab 16 lleva bastantes archivos de datos como muestra. Éstos se encuentran en C:

Archivos de programa > Minitab 16 > español > datos de muestra y, llevan la extensión

.mtw.

1.4 Opciones principales del menú Datos

Solo se explicarán algunas de las opciones más utilizadas del menú Datos. En el cuadro
de diálogo de cada herramienta existe un botón de ayuda.

1.4.1 Creación de un subconjunto de hoja de trabajo

Esta opción se utiliza para copiar las filas especificadas de la hoja de trabajo activa en una
nueva hoja de trabajo. Se puede especificar el subconjunto basándose en números de fila,
puntos destacados en una gráfica, o una condición. Se puede crear subconjunto de datos
de varias maneras:

 Copiar filas especificadas de la hoja de trabajo activa en una hoja de trabajo nueva,
utilizando la opción: Crear subconjunto de hoja de trabajo

 Dividir la hoja de trabajo activa en dos o más hojas de trabajo nuevas basándose en una
o más seleccionando "Por" variables.

Los datos pueden ser numéricos, de texto o de fecha/hora y se sigue el siguiente


procedimiento:

1. Elija Datos >Crear subconjunto de hoja de trabajo.


2. Si lo desea, escriba un nombre para la nueva hoja de trabajo (en lugar de utilizar el
nombre predeterminado).
3. En Incluir o excluir, realiza uno de los procedimientos siguientes:
 para copiar filas especificadas en la nueva hoja de trabajo, elija Especificar las filas
que se incluirán.
 para omitir las filas especificadas, elija Especificar las filas que se excluirán.
4. En Especificar las filas que se incluirán/excluirán, realiza uno de los procedimientos
siguientes:
 para basar su subconjunto en una expresión, elija Filas que coincidan. A continuación,
haga clic en Condición y completa el cuadro de diálogo secundario para definir la
expresión. Haga clic en Aceptar.
 para basar su subconjunto en puntos destacados en una gráfica, elija Filas
destacadas.
 para basar su subconjunto en números de fila específicos, elija Números de fila y
escriba uno o más números de fila (por ejemplo, 1:10). Si tiene columnas de diferentes
longitudes.
5. Haga clic en Aceptar.

1.4.2 Desapilar columnas

Esta opción se utiliza para dividir el contenido de una columna apilada o bloque de columnas
apilado en dos o más columnas más cortas dentro de su hoja de trabajo actual o copiar las
columnas divididas en una hoja de trabajo nueva.

Los datos pueden ser numéricos, de texto o de fecha/hora. Las columnas deben tener la
misma longitud y los elementos del cuadro de diálogo es el siguiente:

1. Desapilar los datos en: Ingresa la columna o el bloque de columnas que desea desapilar.

2. Utilizando subíndices en: Ingresa la columna que contiene los subíndices. Los valores
de esta columna determinan cómo se desapilará la columna de origen.

Incluir valor faltante como un valor de subíndice: Marca esta opción para que Minitab pueda
crear una columna para todos los valores faltantes.

3. Almacenar datos no apilados en: Especifica dónde desea almacenar las columnas o el
bloque de columnas desapilados.
 En nueva hoja de trabajo: Elija esta opción para almacenar las columnas o bloques
de columnas desapilados en una hoja de trabajo nueva. Nombre: (Opcional)
Especificar un nombre para la hoja de trabajo nueva.
 Después de última columna en uso: Elija esta opción para colocar la columna o el
bloque de columnas desapilados en la hoja de trabajo actual después de la última
columna que contiene datos.
 Nombrar las columnas que contienen los datos no apilados: Marca esta opción para
nombrar las columnas que contienen los datos no apilados.

1.4.3 Ordenar

Esta opción nos permite ordenar una o más columnas de datos de acuerdo con los valores
de las columnas asociadas que seleccione. El ordenamiento coloca en orden alfabético o
numérico los datos y lleva consigo las columnas asociadas. También se puede ordenar en
orden ascendente o descendente y especificar si los datos ordenados deberían
almacenarse en las columnas originales, en otras columnas que especifique o en una hoja
de trabajo nueva

Elementos del cuadro de diálogo son los siguientes:

1. Ordenar columna(s): Ingresa una o más columnas que desee ordenar.


2. Por columna: Ingresa hasta cuatro columnas que utilizará como criterios de
ordenamiento.
3. Descendente: Marca esta opción para ordenar de mayor a menor.
4. Almacenar datos ordenados en:
 Nueva hoja de trabajo: Elija esta opción para colocar los datos ordenados en una
nueva hoja de trabajo. Los datos se colocan a partir de C1.
 Nombre: Ingresa un nombre para la nueva hoja de trabajo.
 Columnas originales: Elija esta opción para reemplazar los datos no ordenados con
los datos ordenados.
 Columna(s) de hoja de trabajo actual: Elija esta opción para almacenar los datos
ordenados en columnas de la hoja de trabajo actual e ingresar las columnas de
almacenamiento.
1.4.4 Cambiar tipo de datos

Minitab provee seis comandos con los que puede cambiar los datos de un tipo a otro, estos
son:

 Numérico a texto
 Texto a numérico
 Fecha/hora a texto
 Fecha/hora a numérico
 Numérico a fecha/hora
 Texto a fecha/hora

Los elementos del cuadro de diálogo son:

 Cambiar columnas de numérico / texto / fecha/hora: Selecciona una o más columnas


que cambiará. Cuando el cursor se encuentra en este cuadro, la lista que muestra las
columnas disponibles muestra sólo las columnas cuyo tipo corresponde al comando
que usted seleccionó.
 Almacenar columnas de numérico / texto / fecha/hora en: Ingresa una o más columnas
donde usted desee almacenar los datos cambiados.
 Formato de columnas de texto: (Disponible sólo con el comando Texto a fecha/hora)
Ingresa el formato que describa las columnas de texto tal como se muestra
actualmente en la ventana Datos, por ejemplo, mmm-d-aa. Esto indica a Minitab el
procedimiento para traducir los caracteres de las columnas en los componentes de
fecha/hora apropiados.

Componentes de formato de fecha/hora muestra qué formatos de fecha/hora se permiten y


cómo especificar esos formatos.

Opciones> (disponible sólo con el comando Numérico a texto)

1.5 Opciones principales del menú Calc

Este es un menú que permite realizar operaciones con las celdas en la hoja de trabajo. El
menú contiene los siguientes comandos (figura 5)
Figura 5. Comandos que se utilizan en el menú Calc

A continuación se da una pequeña descripción de los comandos más utilizados en este


manual:

1.5.1 Calculadora

La Calculadora se puede utilizar para realizar operaciones aritméticas, operaciones de


comparación, operaciones lógicas, funciones y operaciones de columnas. Puede calcular
la operación una sola vez o asignarla como una fórmula a una columna o constante. Las
expresiones pueden incluir columnas, constantes almacenadas, números y texto, pero no
matrices. Tampoco se pueden utilizar expresiones abreviadas como en otras ventanas. Por
ejemplo, Minitab interpretaría C1-C4 como C1 menos C4 en lugar de interpretarlo como las
variables de C1 a C4.

Elementos del cuadro de diálogo (Figura 6):

Almacenar resultado en variable: Ingresa una columna o constante objetivo donde desea
almacenar el resultado de la expresión matemática.

Expresión: Ingresa la operación matemática que desea que ejecute el Minitab,


seleccionando variables, botones y funciones para construir la expresión, siguiendo las
Reglas de la calculadora.
Botones de la calculadora: Para la definición de los botones de la calculadora; operaciones
aritméticas (para +, -, *, /, **), operaciones de comparación (para =, <>, <, >, <=, >=),
operaciones lógicas (para Y, O, No), y corchetes/paréntesis (para [ ], ( )).

Funciones: Para las definiciones que se encuentran en el cuadro de diálogo.

Asignar como una fórmula: Marca esta opción si desea asignar la expresión como una
fórmula a la columna. Esto permite a Minitab volver a calcular valores automáticamente
cada vez que el usuario agrega, elimina o cambia datos asociados.

Figura 6. Ventana de la herramienta de calculadora

1.4.2 Estadísticas de columnas

Calcula varias estadísticas basándose en una column seleccionada. La instrucción es: Calc
> Estadísticas de columnas

1.4.3 Estadísticas de filas

Calcula varias estadísticas para cada fila de las columnas seleccionadas. Instrucción: Calc
> Estadísticas de filas

Las estadísticas de columnas se muestran en la ventana sesión y se almacenan


opcionalmente en una constante. Las estadísticas de filas se calculan a través de las filas
de las columnas especificadas y se almacenan en las filas correspondientes de una nueva
columna.

Las estadísticas que elija muestra el siguiente cuadro de dialogo (figura 7):
Figura 7. Ejemplo del cuadro de dialogo de estadísticas de filas

En Estadísticas, elija la estadística que desea calcular. En Variables de entrada, ingresa


la serie de columnas que contienen las filas para las cuales desea calcular las estadísticas
y en Almacenar resultado en, ingresa una columna en la que almacenará los resultados,
en el caso de estadísticas de columna esta es opcional y, a continuación, haga clic en
Aceptar.

2. Introducción al Microsoft Excel


Microsoft Excel es una planilla de cálculo electrónico que permite manejar en la PC toda la
información que habitualmente se maneja en una planilla con papel cuadriculado, lápiz y
calculadora.

Excel maneja planillas de muchos tipos:

 Pequeñas listas: una agenda telefónica, la lista de las compras, etc.


 Estadísticas.
 Gráficos.
 Aplicaciones varias.

Una vez ingresado a Excel aparece una ventana, tal como lo muestra la Figura 8.
Figura 8. Ventana de Excel

Los archivos creados con Excel se denominan libros, porque poseen varias hojas para que
el usuario ingrese información o cree varias planillas.

Cada hoja de un libro está formada por columnas (nombradas con las letras A, B,..., Z, AA,
AB,...) y filas (identificadas mediante números); la intersección entre una fila y una columna
se denomina celda y ésta se nombra con la letra de la columna y el número de la fila (A1,
C14, etc.).

2. 1 Administrando de libros de Excel

2.1.1 Guardar libro

En el momento de guardar un trabajo se deben realizar los siguientes pasos:

 En el menú Archivo, elija la opción Guardar o haga clic en el botón correspondiente.

 Si el archivo es nuevo y no tiene nombre, aparecerá el cuadro de Guardar como


(Figura 9).
Figura 9. Ventana de guardar como

 En el recuadro Nombre de archivo, que actualmente contiene “Libro 1”, escriba el


nombre que tendrá el documento.
 En el recuadro Guardar en, podrá elegir la unidad de disco donde desea almacenarlo.
 Haga clic en el botón Guardar.

Tener en cuenta:

• Si el archivo ya ha sido guardado anteriormente el cuadro de la Figura 8 no aparece,


en este caso el archivo se graba con el mismo nombre, el mismo disco, etc.
• Se recomienda guardar el archivo a medida que trabaja sobre la planilla para evitar
la pérdida de datos.
• Si desea regrabar el archivo pero en otro disco o con otro nombre utilice la opción
Guardar como.

2.1.2 Cerrar libro

Para cerrar un libro se utiliza la opción Cerrar, del menú Archivo o haciendo clic en el botón

de cerrar que está a la derecha de la ventana.


Si aún no grabó la planilla o la modificó luego de la última grabación, aparecerá el siguiente
cuadro (Figura 10).

Figura 10. Confirmación para guardar el archivo

2.1.3 Abrir un libro

Todos los libros creados pueden abrirse de la siguiente forma:

En el menú Archivo, elija la opción Abrir o haga un clic en el botón correspondiente.

En el recuadro Buscar en, elija la carpeta donde está almacenado el documento.

Luego verá la lista de los archivos de Excel guardados en la misma.

• Haga un clic sobre el nombre del archivo que desea abrir.

• Haga un clic en el botón Abrir. El archivo aparecerá dentro de la ventana de Excel.

2.1.4 Crear un libro de Excel

El procedimiento para crear un nuevo libro es el siguiente:

Despliegue el menú Archivo y elija la opción Nuevo y seleccionar libro en blanco con el
icono o bien selecciona el botón

Haga clic en Aceptar o pulse Enter. Se abre un nuevo libro de trabajo con un nombre
predeterminado en la barra de título.
2.1.5 Salir de Excel

Una vez finalizado el trabajo deberá salir de la aplicación. Para ello podrá utilizar la opción
Salir, del menú Archivo o utilizar el botón de cerrar la ventana que se encuentra a la
derecha de la barra de título.

2.2 Manejando información

2.2.1 Ingresando información

Dentro de cada una de las celdas que conforman las hojas de un libro, podrá ingresar:
textos, números, fechas, fórmulas y funciones.

La información de cada celda se alineará, dentro de la misma, según el tipo de dato


ingresado. Los números y fechas se alinearán a la derecha, mientras que el texto lo hará a
la izquierda (Figura 11).

Figura 11. Ingresando información en celdas

Para ingresar la información se realizan los siguientes pasos:

 Selecciona la celda en donde desea ingresar el dato haciendo clic en ella o utilizando las
teclas de movimiento.
 Tipea el dato. Mientras escribe, la información aparece en la celda y en la barra de
fórmulas.

• Finaliza el ingreso del dato, esto se puede realizar de diferentes maneras:

♦ Con la tecla Enter. Al pulsar esta tecla se está confirmando el dato ingresado.
Inmediatamente Excel lo almacenará en la celda activa y desplazará el cursor hacia la celda
que se encuentra debajo de aquella.

♦ Con las teclas de movimiento (← , ↑, →, ↓); en este caso, luego de almacenarse el dato,
el cursor se moverá a la dirección que le indique la tecla pulsada.
♦ Pulsando la tecla Tab.

♦ Utilizando la tilde verde (es equivalente a la tecla Enter).

2.2.2 Selección de rangos

Un rango o bloque es un conjunto de celdas que forman un rectángulo o un cuadrado. La


ventaja de seleccionar celdas es que muchas operaciones que normalmente actúan sobre
la celda donde estamos parados, actúan sobre más de una celda si antes la seleccionamos.
Seleccionar un rango de celdas es como pararse en todas ellas al mismo tiempo.

Normalmente el puntero del mouse en Excel tiene forma de cruz blanca y sirve para
seleccionar una celda o un rango de celdas.

• Haga clic en una celda, ésta quedará marcada.


• Arrastre el puntero por varias celdas. Observa que mientras arrastra, las celdas toman
el color negro de fondo y la primera celda continúa con el fondo blanco, pero forma parte
de la selección (Figura 12)

Figura 12. Ejemplo de seleccionar celdas

Además, se puede seleccionar múltiples rangos, es decir grupos de celdas no adyacentes.

Por ejemplo, si desea seleccionar los rangos A1:A5 y C1:D6, deberá proceder de la
siguiente forma:

• Selecciona el primer rango: A1:A5, de la forma ya indicada.

• Mantenga pulsada la tecla Control.


• Posiciona el puntero del mouse en la primera celda del segundo rango a marcar, por
ejemplo: C1.

• Arrastra el mouse hasta la última celda a seleccionar, en este caso D6.

• Suelta el mouse y luego la tecla; podrá visualizar los rangos tal como lo muestra

2.3 Manejando fórmulas o funciones

2.3.1 Las Fórmulas

Las fórmulas en una planilla de Excel se escriben como cualquier fórmula matemática,
utiliza los operadores aritméticos convencionales, los más comunes son + (suma), - (resta),
* (multiplicación), / (división), ∧ (potenciación) y permite incluir paréntesis.

Las fórmulas tienen la siguiente estructura:

• Comienzan con el signo =.

• Hacen referencia a otra celda. Siempre que sea posible, hay que evitar el uso de datos
fijos y reemplazarlos por las coordenadas de las celdas que contienen los datos que van a
intervenir en la fórmula. De esta manera, al cambiar el valor de una celda, cambiará a la
vez el resultado del cálculo automáticamente.

• Pueden contener valores constates o fijos.

• La fórmula aparece también en la barra de fórmulas.

• El rango que contiene los valores que intervienen en la fórmula se coloca entre paréntesis.
Entre la primera y la última celda del rango se colocan dos puntos que significa desde...
hasta.

Ejemplos de fórmulas: = C7 + D7 + F7 ó =SUMA (C7:F7); =0.21 * C8 + D5; etc.

2.3.1.1 Cómo escribir una formula con el teclado o mouse

• Escriba el signo = o haga clic en el botón correspondiente.


• Los datos constantes, los paréntesis y los signos aritméticos los escribe directamente.
• Para hacer referencia al valor de una celda haga clic en ella o escriba su nombre.
• Confirme el ingreso de la fórmula presionando la tecla Enter o haciendo clic en el botón
• Cancela el ingreso de la fórmula presionando la tecla Escape o haciendo clic en el botón

Las fórmulas pueden copiarse como cualquier otro dato. Si desea copiar una fórmula realiza
el mismo procedimiento que hace para copiar un dato.

 Cuando se copia una fórmula no se obtiene otra fórmula igual a la original porque Excel
toma las referencias de las celdas como relativas. Por ejemplo, si la fórmula a copiar es
= A3 * D3, entonces para la fila 4 la fórmula será = A4 * D4 y así sucesivamente.
 Si la referencia es absoluta la fórmula copiada no varía como en el caso anterior. La
referencia absoluta es una dirección de celda cuyos componentes están precedidos por
el signo $; por ejemplo la dirección $A$5 se refiere en forma absoluta a la celda A5.

2.3.2 Las funciones

Excel dispone de muchas funciones que agilizan la construcción de los cálculos.

Las funciones también deben comenzar con el signo =, continuar con el nombre y, por
último, paréntesis de apertura y cierre, donde se indicará (en algunos casos) parámetros o
rangos.

 Una de las funciones es la que permite sumar un grupo de celdas.

Para realizar la suma realiza los siguientes pasos:

• Coloca el cursor en la celda donde quiere obtener el total.

• Haga clic en el botón ∑ (Autosuma).

• Observa que aparece seleccionado el rango a sumar con líneas de puntos. Si el rango
no es el correcto, puede seleccionar otro marcándolo con el mouse o escribiéndolo en la
fórmula (Figura 13).

• Oprima Enter o haga clic en


Figura 13. Ejemplo de la función autosuma

Para ver la lista de funciones disponibles se presiona el botón fx (pegar función) o en el

menú formulas, elija Función. Aquí aparece un cuadro de diálogo con una lista de todas
las funciones disponibles, clasificadas por categoría (Figura14). En este cuadro se elige la
función que se quiere aplicar sobre un conjunto de valores.

Figura 14. Ventana de insertar función

Luego, aparece otro cuadro en el cual se ingresa el rango de celdas en las que se
encuentran los datos. Dependiendo de la función elegida el programa pedirá uno o más
parámetros.

Supongamos que se quiere calcular la Media Aritmética (Promedio) de una base de datos:

Selecciona la celda donde colocará el resultado.


En el menú Insertar, elija Función o haga clic en el botón correspondiente

En el cuadro de Pegar Función, elija la categoría Estadísticas. Aparecerá una lista con
los nombres de todas las funciones estadísticas disponibles.

En la lista con los nombres de las funciones, elija Promedio. En la parte inferior del cuadro
aparece información acerca de la función elegida (su estructura, que operación realiza,
etc.).

Haga clic en Aceptar. Aparecerá otro cuadro en el cual debemos ingresar el rango (Figura
15)

Rang

Figura 15. Ventana de función Promedio

Siga estos pasos para utilizar cualquier otra función

MATERIALES Y EQUIPO
Práctica impresa
Computadora
Software Minitab 16 versión en español
Manual de Minitab
Microsoft Excel

PROCEDIMIENTO
Utiliza el software Minitab para realizar las siguientes actividades y detallada cada uno de
los procedimientos.

Actividad 1

En la siguiente tabla se muestra el número anual de usuarios de una biblioteca determinada


y el número anual de préstamos durante los años elegidos al azar y el tiempo promedio
visitado por día.

Año Usuarios Préstamos Tiempo


2009 296 155 7:56:15
2006 798 582 6:54:13
2010 1576 1254 8:57:06
2011 915 761 6:34:11
2015 459 275 5:08:56
2016 2050 1675 9:14:11
2003 1138 1030 8:23:07
2000 602 322 5:46:00
2001 1780 1465 8:37:03
2007 1145 856 7:45:57

a) Crea un nuevo proyecto de Minitab

b) Introduzca los datos tal y como se presentan en la tabla y genera las cuatro variables
con sus etiquetas descriptivas: Año (variable de texto), Usuarios y Préstamos
(variable numérica) y Tiempo (variable de fecha/hora). Graba la hoja de datos en un
archivo denominado Prestamos.mtw

c) Ordena las cuatro variables en forma creciente y almacena los datos en una nueva
hoja de trabajo con el nombre Prestamosordenados.mtw
d) En la hoja de trabajo de prestamosordenados calcula, en una nueva columna, la
variable que indica el porcentaje anual de préstamos por usuario, resultado de
multiplicar por 100 el resultado de dividir el número anual de préstamos entre el
número anual de usuarios. Pon a la nueva variable el siguiente nombre: PPU como
una etiqueta descriptiva. Haz que los resultados aparezcan con dos decimales.
Vuelve a grabar la hoja de datos.

e) Determina el valor mínimo, el valor máximo y el rango de PPU.

f) Graba el proyecto como prestamos1.mpj

Actividad 2

En la siguiente Tabla aparece el peso promedio diario de pan producido (en Kgs) por dos
operarios (A y B) que usan las maquinas 1 y 2. Durante un periodo de 20 días se tomaron
muestras de 4 piezas de pan de cada máquina con los siguientes resultados:

Máq1 Máq Máq1 Máq1 Máq2 Máq2 Máq2 Máq2


Opera-
Día
rio _p1 _p2 _p3 _p4 _p1 _p2 _p3 _p4

1 A 209.2 209.5 210.2 212 214.3 221.8 214.6 214.4

2 B 208.5 208.7 206.2 207.8 215.3 216.7 212.3 212

3 B 204.2 210.2 210.5 205.9 215.7 213.8 215.2 202.7

4 B 204 203.3 198.2 199.9 212.5 210.2 211.3 210.4

5 A 209.6 203.7 213.2 209.6 208.4 214.9 212.8 214.8

6 A 208.1 207.9 211 206.2 212.3 216.2 208.4 210.8

7 A 205.2 204.8 198.7 205.8 208.1 211.9 212.9 209

8 B 199 197.7 202 213.1 207.5 209.9 210.6 212.3

9 B 197.2 210.6 199.5 215.3 206.9 207.1 213.6 212.2

10 A 199.1 207.2 200.8 201.2 209.6 209.5 206.8 214.2


11 B 204.6 207 200.8 204.6 212.2 209.8 207.6 212.6

12 B 214.7 207.5 205.8 200.9 211.4 211.2 214.4 212.6

13 B 204.1 196.6 204.6 199.4 209.6 209.2 206.1 207.1

14 A 200.2 205.5 208 202.7 203.5 206.9 210.6 212.3

15 A 201.1 209.2 205.5 200 209.1 206.3 209.8 211.4

16 B 201.3 203.1 196.3 205.5 208 207.9 205.3 203.6

17 B 202.2 204.4 202.1 206.6 210 209.4 209.1 207

18 A 194.1 211 208.4 202.6 215.6 211.8 205.4 209

19 A 204.8 201.3 208.4 212.3 214.5 207.5 212.9 204.3

20 A 200.6 202.3 204.3 201.4 209.1 205.8 212 204.2

a) Crea un nuevo proyecto de Minitab


b) Introduzca los datos (sin incluir, obviamente, la primera columna, que indica el número
de caso. Pon los siguientes nombres a las variables como aparecen en la tabla.
Genera la variable operarios como variable de texto .Graba la hoja de datos en un
archivo denominado Produccion.mtw
c) Crea una nueva variable, denominada Total y vuelve a grabar la hoja de
trabajo.
d) Apila las columnas que contienen las variables numéricas siguiendo el siguiente
procedimiento:
1. Datos > Apilar > Columnas
2. Apilar columnas: Selecciona todas las numéricas
3. Activa el botón de Columna hoja de trabajo actual y selecciona la columna Total
4. Almacenar subíndices dejar vacío
5. Aceptar
e) Ordena los datos de la variable total en orden creciente y vuelve a grabar la hoja de
trabajo. A partir de esta ordenación calcula el valor mínimo, valor máximo, la media,
mediana y rango. Vuelve a grabar la hoja de trabajo.
f) Genera dos nuevas variables denominadas Maquina 1 y Maquina 2. Y ahora agrupa
las columnas de la máquina 1 y posteriormente las columnas de la máquina 2. Calcula
para cada máquina el valor mínimo, valor máximo, la media, mediana y rango. Graba
el proyecto como Producción1.mpj

Utilizando el Microsoft Excel realiza la siguiente actividad realizando detalladamente


cada uno de los procedimientos.

Actividad 3

Se tiene la siguiente lista con las temperaturas diarias promedio de una cierta ciudad
durante el mes de agosto 2016.

FECHA TEMPERATURA FECHA TEMPERATURA

01-ago-16 18.63 17-ago-16 20.70


02-ago-16 20.24 18-ago-16 21.62
03-ago-16 21.39 19-ago-16 21.85
04-ago-16 20.00 20-ago-16 20.93
05-ago-16 20.47 21-ago-16 20.93
06-ago-16 22.77 22-ago-16 19.55
07-ago-16 21.85 23-ago-16 22.08
08-ago-16 19.09 24-ago-16 20.47
09-ago-16 21.85 25-ago-16 20.00
10-ago-16 20.00 26-ago-16 20.47
11-ago-16 21.16 27-ago-16 20.24
12-ago-16 21.85 28-ago-16 20.70
13-ago-16 20.00 29-ago-16 18.40
14-ago16 22.08 30-ago-16 22.31
15-ago-16 18.86 31-ago-16 19.78
16-ago-16 18.86
a) Crea un libro nuevo de Microsoft Excel

b) Introduzca los datos de la tabla y coloca en la celda A1 la variable fecha y en la celda


B1 la variable temperatura. Da formato de texto de fecha (día-mes-año) a la columna
A. La variable temperatura (columna B) con formato de número y con dos cifras
decimales. Alinear las celdas ajustándolas al texto. Guarda el archivo de Excel como
actividad 3.xls

c) En la columna F da un ancho de columna de 33.5 y genera las siguientes preguntas:

1) Temperatura máxima

2) Temperatura mínima

3) Temperatura promedio al mes

4) Número de temperaturas < promedio

5) Número de temperaturas = 20°

6) Número de temperaturas ≥ 20

En la columna G realiza las funciones estadísticas: MAX, MIN, PROMEDIO,


CONTAR.SI

d) Crea una nueva variable denominada Temperatura <promedio. Alinea la celda al


texto. Inserta en la celda C2 la función lógica SI y coloca en el cuadro de dialogo lo
siguiente:

Prueba lógica B2< al valor del resultado de la temperatura promedio del mes o la celda
$G$4 para fijar el valor al copiar la función de la temperatura promedio

Valor_si_verdadero la palabra SI

Valor_si_falso la palabra NO

Copia esta función y pégalas en las celdas C3 hasta C32

e) Guarda nuevamente el archivo

SUGERENCIAS DIDÁCTICAS
Elaborar un Diagrama de flujo de los menús Datos, Calc, Estadísticas y Editor con todas
las herramientas y las flechas de flujo de los comandos.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Práctica No. Nombre de la Práctica
Asignatura
Probabilidad y Estadística 2 Determinación de medidas de
Ambiental tendencia central y dispersión
para datos no agrupados con
MINITAB

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Interpretar y analizar los resultados de las medidas de tendencia


central, dispersión y gráficos en problemas ambientales o industriales con el uso del
Software Minitab en datos no agrupados.

INTRODUCCIÓN

La estadística se encuentra frecuentemente en nuestro lenguaje cotidiano. Por ejemplo,


cuando se hace referencia a “la media del salario de los empleados de una determinada
empresa” o “las variaciones de temperatura en la última semana”.

Así, podríamos definir la Estadística como la ciencia encargada de reunir, organizar,


presentar, analizar e interpretar datos con el fin de obtener conclusiones y tomar decisiones.
Siendo la estadística descriptiva, la encargada de extraer y organizar los datos procedentes
de un determinado conjunto de observaciones.
1. Descripción de los datos:
Cuando el tamaño de muestra es menor a 30, los datos pueden tratarse individualmente, y
en este caso se les llama datos no agrupados. Sin embargo, cuando la muestra es grande
(n  30), es laborioso hacerlo de esta forma, por lo que se lleva a cabo algún tipo de
agrupación preliminar para realizar el tratamiento adecuado a los datos. En este último
caso, se les llama Datos Agrupados.

2. Descripción de los parámetros estadísticos

2.1 Medidas de Centralización

Las medidas de centralización nos sirven para representar el valor medio de los datos, es
decir, el valor que refleja el tamaño del dato más esperado. Ello nos indica la posición en la
que se encuentra en el centro de los datos.

Las medidas de centralización más utilizadas son:

2.1.1 Media: Es la suma de un conjunto de observaciones dividido por el número total de


observaciones realizadas.
n N

 xi  Xi
Media muestral X  i 1
Media poblacional  i 1

n N

2.1.2 Mediana: Es un número tal que, si ordenamos los datos de forma creciente o
decreciente, cumple la condición de ser mayor que una mitad y menor que la otra. Es decir,
divide a la distribución en dos partes iguales.

Si el número de observaciones es impar la mediana es el valor central. En caso de que el


número de observaciones sea par la mediana será la media de los dos valores centrales.

n 1
Me  X   
2 2
Donde X es la posición y n es el total de datos ordenados crecientemente

2.1.3 Moda: Es el valor que más veces se repite en la distribución. Si los datos de la
distribución están agrupados en intervalos, la moda es el punto medio del intervalo que
contiene el mayor número de frecuencias.

Una distribución de observaciones puede no tener moda, es decir, puede que no haya
ningún valor de la distribución que aparezca con más frecuencia

2.2 Medidas de posición

Dividen un conjunto de datos en grupos con el mismo número de individuos. Para calcular
las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

2.2.1 Cuartiles: Así como la mediana divide a la distribución en mitades, los cuartiles de
una distribución son los valores que dividen la distribución en cuartos.

El primer cuartil (Q1) deja un cuarto de las observaciones por debajo del mismo, y tres
cuartos por encima. El segundo cuartil (Q2) tiene dos cuartos por debajo y dos por encima
(el segundo cuartil coincide con la mediana). El tercer cuartil (Q3) tiene tres cuartos de las
observaciones por debajo y un cuarto por encima.

 kn k 
Qk  X   
 4 4

Donde K es el cuartil a calcular y X es la posición

Los deciles separan un conjunto de datos ordenado en 10 subconjuntos iguales y los


percentiles en 100 partes, la ubicación de un percentil se encuentra en.
2.3 Medidas de dispersión

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, se necesita conocer también la dispersión que presentan los datos en su
distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la
hora de describirlos e interpretarlos.

2.3.1 Rango, recorrido o amplitud: Es la diferencia entre el valor máximo de la distribución


y el valor mínimo.

2.3.2 Varianza: Se define como la media aritmética de las desviaciones de la media


elevadas al cuadrado.

En el caso de la varianza, la expresión de la varianza poblacional y la muestral difieren


ligeramente.

 x     x  x 
2 2

Para una población  2


 Para una muestra S 2

N n 1

2.3.3 Desviación Estándar: Es la raíz cuadrada positiva de la varianza

2.3.4 Coeficiente de variación (C.V.)

Es una medida relativa de dispersión, la cual nos permite comparar dos distribuciones.
Relaciona la desviación estándar y la media al expresar la primera como un porcentaje de
la segunda.

 S
C.V .  x100 C.V .  x100
Para una población:  Para una muestra: 

x
El coeficiente de variación es muy útil cuando se desea comparar dos o más medidas de
dispersión y éstas están en unidades diferentes o bien están en las mismas unidades pero
sus medias son muy distintas.

3. Uso del Software Minitab

Una herramienta que permite calcular los estadísticos descriptivos más usuales es el
software Minitab en las siguientes opciones:

1. La opción Calc > Estadísticas de columnas o estadísticas de filas, permite calcular


algún parámetro en concreto como son la suma, media, desviación estándar,
mediana, valor máximo, valor mínimo y rango. Esta herramienta no permite crear
representaciones gráficas.

Figura 1. Cuadro de diálogo de Estadísticas de columna o filas

Al seleccionar la columna de la cual se quiere calcular el parámetro estadístico (figura 1),


se pueden guardar los resultados en una determinada columna o bien, dejar el espacio en
blanco, obteniendo el resultado en la pantalla de Sesión.

2. Estadísticas > Estadística básica > mostrar estadísticas descriptivas > Estadísticas,
esta opción genera estadísticas descriptivas para cada columna o subconjunto
dentro de una columna. Puede mostrar las estadísticas en la ventana Sesión y/o
mostrarlas en una gráfica.
3. Estadísticas > Estadística básica > almacenar estadísticas descriptivas >
Estadísticas, nos sirve para almacenar estadísticas descriptivas para cada columna
o subconjunto dentro de una columna.

Para calcular los parámetros estadísticos se pueden seguir cualquiera de las dos
instrucciones:

 Estadísticas > Estadística básica < Mostrar estadísticas descriptivas


 Estadísticas > Estadística básica < Almacenas estadísticas descriptivas

Posteriormente se selecciona la variable donde se encuentran los datos, se da clic en


estadísticas y elegir los parámetros estadísticos a calcular como se muestra en la figura 2.

Figura 2. Cuadro de diálogo de la herramienta Estadística básica y sus


estadísticos descriptivos.

4. Opciones gráficas del Software Minitab

Minitab también perrmite el uso de representaciones gráficas para un mejor análisis de los
resultados obtenidos.

Estadísticas > Estadísticas básicas > Mostrar estadísticas descriptivas > Gráficas

Otra opción es el menú de gráfica.


Esta herramienta muestra las siguientes representaciones gráficas (figura 3).

Figura 3. Opciones de gráficas de la herramienta de estadística básica

4.1 Histograma

El histograma es una gráfica de la distribución de un conjunto de datos. Es un tipo especial


de gráficas de barras. En el eje de las abscisas se construyen los rectángulos que tienen
por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo.

Se emplean para resumir e ilustrar la variación que se presenta en un conjunto de datos, si


las causas de variación son comunes, el histograma se distribuye normalmente simétrico
(en forma de campana); pero otras posibilidades es que se encuentre inclinado (sesgado)
al lado derecho o izquierdo del pico. (Figura 4). Obtener un histograma sesgado, hay un
porcentaje muy alto de no estar cumpliendo con las especificaciones y el nivel de calidad
esperado.

Un histograma funciona mejor cuando el tamaño de la muestra es al menos de 20 y en


datos agrupados. Sin embargo, un tamaño de muestra que sea mayor que 20 puede
representar mejor la distribución. Si el tamaño de la muestra es menor que 20, considere
usar en su lugar una gráfica de valores individuales.
Figura 4. Representación gráfica de un histograma

4.2 Gráfica de valores individuales

Se utiliza para evaluar y comparar distribuciones de muestras a través de valores de datos


individuales con agrupación opcional según variables categóricas. Una gráfica de valor
individual también puede ayudar a verificar errores evidentes en la codificación de valores.
(Figura 5)

Figura 5. Gráfica de valores individuales

4.3 Gráfica de caja

Es un resumen gráfico de la distribución de una muestra en la que se aprecia su forma,


tendencia central y variabilidad (Figura 6)
Figura 6. Representación de una gráfica de caja

Partes de una gráfica de caja


 A: valor atípico (*): observación que se encuentra más allá del bigote superior o
inferior

 B: bigote superior: representa el 25% superior de la distribución (excluyendo los


valores atípicos)

 C: caja de rango intercuartil: el 50% medio de los datos

 D: bigote inferior representa el 25% inferior de la distribución (excluyendo los valores


atípicos)

A diferencia de los histogramas que requieren un tamaño de muestra de al menos 30 casos.

Los diagramas de caja son especialmente útiles cuando la distribución de una variable es
asimétrica o se aleja de la distribución normal.

5. Problema práctico
Tras haber definido los parámetros estadísticos más importantes, veamos un ejemplo
haciendo uso del Minitab.

Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago,
se toman 25 muestras distintas en las que se mide la concentración en mg/l de nitrato en el
agua. Los datos obtenidos son los siguientes:
36.5 36.5 36.5 36.5 36.5
37.5 36.0 35.0 37.5 36.5
36.0 37.5 38.5 38.0 37.0
37.0 37.0 38.0 35.5 36.5
37.5 37.0 35.5 36.0 38.0

Con el apoyo del Minitab

Calcula la media, mediana, moda, tercer cuartil, rango, valor mínimo, valor máximo,
varianza, desviación estándar y coeficiente de variación.

Procedimiento:

1. Introduzca los datos en la hoja de trabajo de Minitab en la columna A, con el nombre


de la variable Concentración. Figura 7

Figura 7. Ejemplo de la Hoja de trabajo con datos y nombre


de la variable.

2. Selecciona de la barra de menús Estadísticas > Estadística básica > Mostrar


estadísticas descriptivas
3. En variables, ingresa C1
4. En Por variables, dejar el espacio vacío
5. Haga clic en estadísticas, selecciona los estadísticos a calcular y da clic en aceptar
(Figura 8).

Figura 8. Ventana de los estadísticos seleccionados para el ejemplo práctico

6. Elija el botón de gráficas y selecciona el histograma de datos con curva normal y la


gráfica de caja y da clic en aceptar y nuevamente aceptar.

En la figura 9 se muestran los resultados obtenidos en la hoja de sesión.

Figura 9. Ejemplo de resultados obtenidos mostrados en la hoja de sesión

La figura 10 muestra las representaciones gráficas. Interpreta los resultados y comenta.


Figura 10. Representación gráfica del histograma y gráfica de caja

Interpretación de los resultados

Al comparar los dos gráficos se puede concluir que existe una asimetría ligeramente
positiva, es decir hay mayor concentración de valores al lado derecho de a media (36.78).

MATERIALES Y EQUIPO
Práctica impresa

Computadora

Software Minitab versión 16 en español

Manual de Minitab versión 16

Walpole. Myers. Myers. Probabilidad y Estadística para ingeniería y ciencias. Editorial


Pearson. Novena Edición.

PROCEDIMIENTO

Resuelva las siguientes actividades con el software Minitab y expresa los resultados en dos
cifras decimales.
Actividad 1

La agencia de protección ambiental (EPA) recomienda una máxima concentración de plomo


en el agua potable de 15 partes por millón (ppm) Al analizar 10 muestras de agua potable
se obtuvieron los siguientes resultados: 13, 15, 12, 16, 15, 19, 18, 16, 18, 16 partes por
millón (ppm).

Con el uso del Minitab:

a) Calcula la media, mediana, moda, valor mínimo, valor máximo, rango, primer cuartil,
varianza, desviación estándar y el coeficiente de variación.
b) Elabora una gráfica de valores individuales
c) Interpreta los resultados
d) Guarda el archivo como una hoja de trabajo llamado Actividad1.mtw

Actividad 2

En un día cualquiera el centro de monitoreo atmosférico de cierta planta química reportó


los siguientes datos de velocidad del viento a cada 5 minutos, empleando un ananómetro
de copa.

1.543 1.001 0.089 1.547 1.001


1.020 1.005 1.235 1.984 1.768
1.894 1.546 1.675 0.978 1.543
0.981 1.473 1.023 0.978 1.110

Con el uso del Minitab:

a) Calcula la media, mediana, moda, valor mínimo, valor máximo, rango, primer cuartil,
varianza, desviación estándar y el coeficiente de variación.
b) Elabora una gráfica de caja
c) Interpreta los resultados
d) Guarda el archivo como una hoja de trabajo llamado Actividad2.mtw
Actividad 3

Se saca una muestra aleatoria de análisis químicos de compuestos de cloruros (Cl-)


expresados en unidades de mg/L procedentes de una muestra de aguas residuales. Estos
análisis se hicieron usando el método de nitrato de mercurio descrito en el texto Métodos
Estándares. La tabla con los valores de los cloruros se da abajo:

17.2, 17.1 17.0 17.1 16.9 17.0 17.1 17.0 17.3 17.2
16.9 17.0 17.1 17.3 17.2 17.4 17.1 17.1 17.0 17.1

Con el uso del software Minitab, calcular:

a) La media, mediana y moda


b) La varianza, desviación estándar y coeficiente de variación.
c) El Rango, valor máximo, Valor mínimo
d) Q1 y Q3
e) Elabora un histograma de datos y una gráfica de caja
f) Interpreta los resultados.
g) Guarda el archivo como una hoja de trabajo llamado Actividad3.mtw

Actividad 4

Encontrar las medidas de tendencia central (𝑋̅, Me y Mo) y las medidas de dispersión (S2, S
y C.V.) y medidas de posición (primer cuartil) para una muestra de análisis de aire de Pb
cuyos valores son: 3, 5, 2, 6, 5, 9, 5, 2, 7, 4, 5, 7, 8, 9, 4, 3, 5, 8, 8, 6 partes por millón (ppm).
Guarda el archivo como una hoja de trabajo denominado actividad4.mtw

Actividad 5

Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del agua
para consumo, en términos de colonias de bacterias tróficas, en un acuífero próximo a la
ciudad. Se consideran dos zonas diferentes del acuífero y se obtienen los siguientes
resultados (número de colonias por 1000 mm de agua):
Zona 1: 194 199 191 202 215 214 197 204 199 202 230 193 194 209

Zona 2: 158 161 143 174 220 156 156 156 198 161 188 139 147 116

Se pide:

Un estudio comparativo de la calidad del agua en ambas zonas utilizando medidas


estadísticas y gráficos. Para ello realiza los siguientes apartados:

1. Calcula media, varianza, moda, mediana, máximo y mínimo de ambas zonas.

2. Representa gráficamente los datos con un histograma para cada variable.

3. Representa gráficamente los datos con un diagrama de caja simple (donde los datos del
gráfico son resúmenes para distintas variables).

Guarda el archivo como una hoja de trabajo denominado actividad5.mtw.

SUGERENCIAS DIDÁCTICAS
Resolver las cinco actividades con el apoyo de Microsoft Excel y calculadora científica.
Compara los tres resultados. Envía al profesor un cuadro comparativo de los tres resultados
obtenidos.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Práctica No. Nombre de la Práctica
Asignatura
Probabilidad y Estadística 3 Tabla de frecuencias y
Ambiental determinación de medidas de
tendencia central y dispersión
para datos agrupados con
EXCEL

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Interpretar y analizar los resultados de las medidas de tendencia


central, dispersión y gráficos en problemas ambientales o industriales con el uso del Excel
para datos agrupados.

INTRODUCCIÓN

La parte más conocida de la estadística es aquella en la que se estudian una o más


características de una cierta población, generando una tabla de datos sobre la que se
realizan cálculos para obtener diversas medidas.

Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases
y a partir de estas determinar las características de la muestra y por consiguiente las de la
población de donde fue tomada. A los datos agrupados se les llama intervalos o clases y
se presentan como en una tabla de frecuencias.
Una hoja de cálculo es una de las herramientas más adecuadas para introducir tablas de
valores y obteniendo resultados y efectuando representaciones gráficas que faciliten su
representación.

1. Tabla de frecuencias
La distribución de frecuencias o tabla de frecuencias es un método para tabular que
permite organizar datos en intervalos, clases o categorías. Para construir una tabla de
frecuencias, es necesario seguir los siguientes pasos:

a) Determinar el rango (R).- También se llama recorrido o amplitud total. Es la diferencia


entre el valor mayor y el menor de los datos. Para que haya congruencia, se recomienda
que el rango contenga el mismo número de decimales que los datos de origen.

b) Determinar el número de intervalos de clase (ni).- Permite calcular el número de filas que
tendrá una tabla de frecuencias. No debe ser menor de 5 y mayor de 12, ya que un
número mayor o menor de clases podría oscurecer el comportamiento de los datos. Para
calcular el número de intervalos se aplica la regla de Sturges:

𝑛𝑖 = 1 + 3.32𝑥 log(𝑛)

En donde “n” representa el número total de datos u observaciones.

Evidentemente, el número de intervalos debe ser exacto; es decir, un número entero.

c) Calcular el Ancho del Intervalo o amplitud (i).- Se obtiene dividiendo el Rango para el
número de intervalos. El valor del rango se puede aproximar dependiendo de los datos.

Donde ni es el número de intervalos.

Es importante comentar que para el cálculo de la amplitud se tiene que considerar que
la amplitud tiene que tener, exactamente, el mismo número de decimales que manejan
los datos originales.

Para validar si los parámetros que establecimos están bien calculados, debemos
proceder a aplicar los siguientes cálculos
• Regla No. 1: No. de Intervalos de clase x Amplitud > Rango

• Regla No. 2: No. de Intervalos de clase x Amplitud - Rango ≤ Amplitud

Es indispensable que se cumplan las dos reglas a la perfección, ya que de no hacerlo,


la tabla será construida con cierto grado de error. Para ello, podemos ajustar el número
de intervalos de clase o la amplitud a la alza o a la baja, según se necesite.

En la figura 1 se muestra la estructura que debe llevar una tabla de frecuencias debe en
Excel.

Figura 1: Estructura de una tabla de frecuencias

d) Tabulación de Datos

d1) Limites de clase.- Los límites de clase definen el ancho de cada intervalo; es decir, en
qué número inicia nuestro intervalo (Límite Inferior de Clase, o L.I.C.) y hasta dónde llega
(Límite Superior de Clase, o L.S.C.).

El límite inferior de la primera clase (es decir, el inicio del primer intervalo), siempre será el
valor mínimo. La distancia entre el primer intervalo y el segundo, será siempre igual a la
amplitud, y así sucesivamente. Se sugiere determinar el L.I.C. de todos los intervalos de la
tabla, antes de proceder.

Para establecer los Límites Superiores de Clase, se recomienda seguir la siguiente tabla:

Nº de decimales de los Límite superior de clase (L.S.C)


datos originales

0 decimales (Enteros). Restar “1” al L.I.C inmediato posterior

1 decimal Restar “0.1” al L.I.C. inmediato posterior

2 decimales Restar “0.01” al L.I.C. inmediato posterior

3 decimales Restar “0.001” al L.I.C. inmediato posterior


d2) Limites exactos de clase (L.E.C).- Son creados para evitar espacios o huecos en los
datos, o bien para establecer un criterio de discriminación para que no exista duda en
cuanto al lugar que debe ocupar cada uno de los datos, al categorizarlos o tabularlos en
cada uno de los intervalos.

En su construcción se debe considerar la siguiente tabla:

Nº de decimales de los Límite exacto inferior de Límite exacto superior de


datos originales clase (L.E.I.C.) clase (L.E.S.C.)

0 decimales (Enteros). Restar “0.5” (al L.I.C del Sumar “0.5” (al L.S.C. del
mismo intervalo) mismo intervalo)

1 decimal Restar “0.05” Sumar “0.05”

2 decimales Restar “0.005” Sumar “0.005”

3 decimales Restar “0.0005” al L.I.C. Sumar “0.0005”

Proceder con el mismo procedimiento para calcular el resto de los límites exactos para los
intervalos posteriores.

d3) Marcas de Clase o puntos medio de clase (Vi).- Es el valor medio de cada clase, se
obtiene sumando los límites superior (Ls) e inferior (Li) del intervalo y dividiendo ésta suma
entre 2

d4) Frecuencia absoluta (fi).- Es el número de veces que se repite el valor de cada
variable. La suma de frecuencias absolutas es siempre al total de datos observados.

En Excel es mucho más sencillo de hacer, para lo cual se recurre a la función Frecuencia.

d5) Frecuencia Acumulada Absoluta (fa).- Esta frecuencia nos ayuda a cuantificar los
datos que se van acumulando intervalo tras intervalo.

La frecuencia acumulada del primer intervalo, siempre será igual a la frecuencia absoluta
del mismo, ya que solamente se han acumulado esos datos. A partir del posterior (intervalo
2), se debe sumar, a la frecuencia absoluta de ese intervalo, la frecuencia acumulada del
intervalo anterior; en este caso, del primero. Tras seguir el mismo procedimiento hasta
culminar con todos los intervalos, observamos que la última frecuencia acumulada es igual
al número total de datos de la distribución, pues evidentemente, se han sumado todos y
cada uno de ellos de forma acumulada.

d6) Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el cociente
entre la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas
es siempre 1.

Una vez terminada la tabla de frecuencias se procede a calcular las medidas de tendencia
central y de dispersión.

2. Medidas de tendencia central

2.1 Media

X 
 fiVi
n

fi = Frecuencia absoluta de la clase i-ésima

Vi= Punto medio de la clase i-ésima

n= sumatoria de las frecuencias absolutas

2.2 Mediana
En primer lugar es necesario determinar la clase que contiene la mediana, para después
determinar la posición de ésta dentro de la clase y poder hacerla interpolación.

La clase que contiene a la mediana es la primera, cuya frecuencia acumulada absoluta


iguala o exceda la mitad del total de observaciones.

 n 2  fa 
Me  Li  
fi 
(i )

Dónde:

Li = Límite exacto inferior de la clase que contiene la mediana

n = número total de observaciones en la distribución de frecuencias (sumatoria de las


frecuencias absolutas).

fa = Frecuencia acumulada absoluta que está antes de la clase que contiene la mediana

fi = Frecuencia de la clase que contiene a la mediana.

i = Tamaño o la anchura del intervalo de la clase.

2.3 Moda:
Se define como el punto medio de la clase cuya frecuencia absoluta tiene el mayor valor
numérico, la cual recibe el nombre de clase modal

 d1 
Mo  Li   (i )
 d1  d 2 

Dónde: Li = límite exacto inferior de la clase modal

d1= diferencia entre la frecuencia absoluta de la clase modal y la frecuencia


absoluta de la clase que está antes de la clase modal.

d2 = Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia


absoluta de la clase siguiente.

i = Tamaño o anchura del intervalo de la clase

3. Medidas de posición:

3.1 Cuartiles
Para datos agrupados la fórmula de la mediana se modifica de acuerdo con el punto de
interés, de acuerdo con las frecuencias acumuladas y después se lleva a cabo la
interpolación.

Por ejemplo para calcular el Q3


 3n  fa 
Q3  Li   4 i
 fi 
 

Dónde:

Li es el límite inferior

fa es la frecuencia acumulada absoluta que le precede

fi es la frecuencia absoluta

i es el tamaño de la anchura del intervalo de clase

4. Medidas de dispersión

4. 1 Varianza

Para datos agrupados en una distribución de frecuencias se asume que el punto medio de
cada clase representa a todas las mediciones incluidas en la clase, la formulas son:

Varianza de la población:  2

  f (x   ) 
i
2

Dónde: x es el punto medio de clase

Varianza de la muestra: S 2

  f (x  X ) 
i
2

n 1

4.2 Desviación estándar:

Desviación estándar de la población:  2  2

Desviación estándar de la muestra: S2  S2


5. Problema práctico con Excel

5.1 Elaboración de tabla de frecuencia

En la siguiente tabla se presenta el peso (en grs.) de residuos tóxicos, recogidos


aleatoriamente en 30 domicilios:

1010.5 1810.2 2110.8 600.5 950.0 875.3 2080.7 2925.3


695.3 3420.7 595.5 750.8 1250.4 1025.4 1340.2 2340.4
555.9 1650.0 1240.3 825.2 2900.1 1335.2 1350.1 725.7
785.0 2075.2 520.2 1295.0 550.2 1795.1

Excel es una hoja de cálculo, lo que quiere decir que su propósito es precisamente calcular
expresiones matemáticas. En las casillas o celdas de la ventana de Excel se pueden
introducir tanto números como expresiones. Así por ejemplo, si en la celda A1 se introduce
el número 5, y en la celda A2 el número 7 y se quiere calcular su suma, en la celda A3 se
introduce la expresión “=A1+A2” obteniendo el valor de dicha suma. El símbolo “=” indica
que el programa ha de calcular la expresión que viene a continuación. En ocasiones se
puede intercalar el símbolo “$” junto a la referencia de una celda, por ejemplo “$A$2”. Esto
indica que la referencia de la celda es absoluta; es decir, que si se copia la expresión en
otra celda, al ser absoluta la formula quedará tal cual está.

Procedimiento a seguir para la elaboración de la tabla de frecuencias en Excel:

1. En la celda A1 escriba el nombre de la variable PESO y en la demás celdas de la


columna A introduzca los 30 datos.

2. Selecciona los datos para ordenarlos de menor a mayor y siga el siguiente


procedimiento: Datos > ordenar, ordenar por selecciona PESO y en el criterio de
ordenación de menor a mayor.

3. En la celda C coloca las siguientes funciones: C2, MIN; C3, MAX; C4, RANGO; C5, ni;
C6, i.
4. En la celda siguiente de cada función D realiza la fórmula correspondiente:

D2 =MIN(A2:A31)

D3 =MAX(A2:A31)

D4 =D3-D2

D5 =1+3.32*LOG(30) expresar en una cifra decimal

D6 =D4/6

Figura 2. Tabla de Excel con las funciones y los resultados de las expresiones
matemáticas.

5. A partir de la columna F elabora la tabla de frecuencias como se muestra en la figura 3.


Da un formato a la tabla.

Figura 3. Elaboración de la tabla de frecuencias

6. Introducir los datos en cada una de las celdas de la tabla de frecuencia de acuerdo al
procedimiento que se detalla a continuación:
a) Límites de clase
• En la columna F en la primera fila en blanco (F3) inserta el límite inferior, en la
segunda fila (F4) expresa la fórmula =F3+ el rango, es decir =F3+483.5, copia la
celda F4 y pega en las demás celdas de la fila hasta obtener los valores de los
limites inferiores de cada intervalo de clase.
• En la columna G introduzca los limites superiores, coloca el primer límite superior
con la fórmula =(F3+483.5)-0.1, copia la celda G3 y pega en las demás celdas
hasta completar los limites superiores de clase.

b) Limites exactos de clase


Para introducir los límites exactos de clase y evitar así ambigüedades en cuanto a dónde
ubicar un dato cuyo valor coincida con un límite nominal, es necesario restar 0.5 al límite
inferior y sumar 0.5 al límite superior en caso de variables discretas. En el caso de las
continuas si es de un decimal sumar o restar 0.05, si es de dos decimales 0.005, así
sucesivamente.
• Introduzca en la tercera fila de la columna H (limite exacto inferior) la fórmula
=F3-0.05, copia y pega en las demás celdas de esta columna. Ahora has lo
mismo con la tercera fila de la columna I (limite exacto superior) con la fórmula
=G3+0.05.

c) Puntos medios de clase (Vi)


• En la columna correspondiente a los puntos medios de clase (columna J), inserta
la fórmula =(H3+I3)/2, copia y pea en las demás celdas de la columna. Los
resultados deben de quedar en los rangos de cada intervalo.

d) Frecuencia absoluta (fi)


• Para calcular las frecuencias absolutas seguir el procedimiento siguiente:
FORMULAS < Más funciones < Estadísticas, selecciona FRECUENCIA. En el
cuadro de diálogo en datos anotar las celdas en donde se encuentran todos los
datos, en este ejemplo sería A2:A31 y en grupos la columna donde se
encuentran el límite de clase superior y límite exacto inferior con el de cada
intervalo de clase, es decir G3:H3. La fórmula se expresa así =FRECUENCIA
(A2:A31,G3:H3).
Nota: Si se introducen las celdas de los límites exactos de clase inferior y
superior, la fórmula no va a salir, ni con los límites de clase.

e) Frecuencia acumulada absoluta (fa)


• En el primer intervalo de las frecuencias acumuladas absolutas (fa) escriba la
formula =K3, que corresponde al primer valor de la frecuencia absoluta, en el
segundo intervalo coloca la fórmula que corresponde a la suma de la frecuencia
absoluta primera con la segunda. Copia y pega para calcular los demás
intervalos de clase. El resultado del último intervalo debe ser igual al total de
datos, en este caso 30.

f) Frecuencia relativa (fr)


• La frecuencia relativa resulta de dividir la frecuencia absoluta entre el total de
datos, para ello, se inserta la formula =K3/30, copia y pega en las demás celdas.
La sumatoria de estos resultados debe de dar 1.

En la figura 4 se muestran los resultados obtenidos en la tabla de frecuencias.

Figura 4. Tabla de frecuencias con los resultados obtenidos

5.2 Cálculo de medidas de tendencia central y dispersión

Antes de realizar los cálculos, se seleccionan dos columnas en la hoja de trabajo; una para
escribir los parámetros estadísticos y la otra donde se realizaran las operaciones y que
mostrarán los resultados obtenidos (figura 5 )
Figura 5. Ejemplo de la selección de columnas para calcular los parámetros
estadísticos

5.2.1 Media

Para calcular la media es necesario que en la tabla de frecuencias se añada otra columna
para realizar la fórmula de fiVi y su sumatoria (∑fivi) como se muestra en la figura 6.

En el primer intervalo Introduzca la fórmula es =K3*J3, copia y pega en los demás intervalos
y posteriormente selecciona todos los intervalos y con el cursor elija el símbolo ∑.

Figura 6. Ejemplo de insertar columna de fivi

En la celda I12 (corresponde a la media), realiza la operación de la fórmula de la media;


=N9/30
5.2.2 Mediana

Para calcular la mediana es necesario determinar primeramente el intervalo que contiene


la mediana y es aquel cuyo valor de la frecuencia acumulada absoluta iguala o exceda la
mitad del total de las observaciones (≥15).

El segundo intervalo es el que contiene la mediana.

Para calcular la mediana se necesitan los siguientes datos:

 Límite exacto inferior que contiene el intervalo de la mediana corresponde la ceda


H4
 Frecuencia acumulada absoluta (fa) que está antes de la clase que contiene la
mediana le corresponde la celda L3
 Frecuencia absoluta (fi) de la clase que contiene la media la celda K4
 Amplitud (i) = 483.5
 Total de las observaciones= 15

En la celda I13, escriba la expresión matemática de la fórmula de la mediana; =H4+((15-


L3)/K4)*483.5

Nota: Es muy necesario el uso de los paréntesis

Comprueba que el resultado obtenido se encuentre entre los valores del intervalo que
contiene la mediana.

5.2.3 Moda

Para calcular la moda es necesario determinar primeramente el intervalo que contiene la


moda y es aquel cuyo valor de la frecuencia absoluta tenga mayor valor numérico (12).

El primer intervalo es el que contiene la moda.

Para calcular la moda se necesitan los siguientes datos:

 Límite exacto inferior que contiene el intervalo de la moda corresponde la ceda H3


 d1 es la diferencia entre la frecuencia absoluta de la clase modal (K3) y la frecuencia
absoluta de la clase que está antes de la clase modal en este caso es cero, la
expresión es K3-0.
 d2 es la diferencia entre la frecuencia absoluta de la clase modal (K3) y la frecuencia
absoluta de la clase siguiente (K). La expresión es K3-K4.
 Amplitud (i) = 483.5

En la celda I14, scriba la expresión matemática de la fórmula de la mediana; =H3+((K3-


0)/((K3-0)+(K3-K4)))*483.5

Nota: Es muy necesario el uso de los paréntesis

Comprueba que el resultado obtenido se encuentre entre los valores del intervalo que
contiene la moda

5.2.4 Varianza y desviación estándar

Para calcular la varianza es necesario que en la tabla de frecuencias se añada otra columna
para realizar la fórmula 𝑓𝑖(𝑥 − 𝑋̅)2 , donde x es el punto medio de cada intervalo. En el primer
intervalo Introduzca la fórmula es =K3*(J3-1390.45)^2, copia y pega en los demás intervalos
y posteriormente selecciona todos los intervalos y con el cursor elija el símbolo ∑ (figura ).

Figura 7. Ejemplo de la columna para calcular la varianza

En la celda I15, escriba la expresión para la varianza: =O10/29

Finalmente calcula la desviación estándar en la celda I16 con la siguiente expresión:


=RAIZ(I15)

En la figura 8 se muestran los resultados obtenidos de las medidas de tendencia central y


de dispersión.
Figura 8. Resultados obtenidos de las medidas de
tendencia central y dispersión utilizando Excel

6. Representaciones gráficas

6.1 Histograma
Para representar un histograma en Excel, coloca en cada celda el límite exacto inferior y en
otra celda las frecuencias absolutas. Selecciona las dos columnas y realiza la siguiente
instrucción:

INSERTAR > Insertar gráficos de columnas o el icono > Columna en 2-D

Selecciona las barras del gráfico y con botón derecho dar formato a la serie de datos y
reduzca el Ancho del intervalo al 0%.

En la figura 9 se muestra el Histograma de los datos.


Figura 9. Representación gráfica del Histograma

Al interpretar los resultados en el gráfico, se observa que presenta una asimetría positiva,
donde la media > mediana > moda. Es decir hay mayor concentración de valores al lado
derecho de la media (1390.45).

7.2 Ojiva

Es una gráfica de frecuencias acumuladas que permite ver cuántas observaciones están
por encima de ciertos valores, en lugar de hacer un cierto registro del número de elementos
que hay dentro de los intervalos.

Se construye graficando el límite exacto inferior en el eje horizontal y la frecuencia


acumulada de cada clase en el eje vertical (figura 10).

Utiliza el gráfico de dispersión

INSERTAR > Insertar gráficos de columnas o el icono > selecciona la opción de


líneas rectas con marcadores.

Para dar un título a la gráfica y a los ejes:

Al construir el gráfico aparece en la parte superior título del gráfico, selecciona y cambia en
nombre.

En la herramienta de INSERTAR aparece un icono que dice diseño gráfico, da clic en la


pestaña y selecciona la primera opción. En el gráfico aparecen en los dos ejes la leyenda
de “título del eje” cambia el eje vertical por la leyenda “Frecuencia acumulada” y el horizontal
por “Intervalos de clase”. Borra la leyenda de series.

Figura 10. Representación gráfica de la Ojiva

MATERIALES Y EQUIPO
Práctica impresa

Computadora

Microsoft Excel 2010

Walpole. Myers. Myers. Probabilidad y Estadística para ingeniería y ciencias. Editorial


Pearson. Novena Edición.

PROCEDIMIENTO
Resuelva las siguientes actividades con el apoyo de Microsoft Excel
Actividad 1

El departamento de limpieza de la ciudad midió en un día el peso en toneladas de la basura


recolectada por los 40 camiones que tiene el departamento en funcionamiento. Los datos
se muestran en el cuadro siguiente:

119 128 146 158 137 99 188 169 104 91


171 130 186 160 139 147 177 121 180 178
190 133 124 93 142 150 193 106 112 96
136 145 196 166 127 153 109 183 174 163

a) Captura los datos en Excel y ordena de manera ascendente


b) Calcula el número de intervalos de clase y la amplitud del mismo.
c) Construya la tabla de frecuencias con sus valores.
d) Calcula las medidas de tendencia central y dispersión
e) Construya un histograma
f) Interpreta los resultados
g) Guarda la hoja de trabajo con el siguiente nombre actividad1.xls

Actividad 2

La concentración de sólidos suspendidos en agua de un río es una característica ambiental


importante. Un artículo científico reportó sobre la concentración (en partes por millón, o
ppm) para varios ríos diferentes. Supongamos que se obtuvieron las siguientes 50
observaciones para un río en particular:

55.8 47.3 60.9 94.6 37.0 56.3 91.3 30.0 65.8 68.2
42.3 75.3 33.8 71.4 60.6 65.2 76.0 52.6 69.0 58.2
45.9 48.0 39.1 61.8 35.5 78.8 56.0 39.8 44.6 65.0
71.7 60.7 61.2 77.1 61.5 59.1 47.2 49.5 74.5 69.3
83.2 69.8 40.0 64.9 31.7 27.1 36.7 87.1 62.3 66.3
a) Captura los datos en Excel y ordena de manera ascendente
b) Si se usan 5 intervalos de clase calcula la amplitud del mismo.
c) Construya la tabla de frecuencias con sus valores.
d) Calcula las medidas de tendencia central y dispersión
e) Construya un histograma
f) Interpreta los resultados
g) Guarda la hoja de trabajo con el siguiente nombre actividad2.xls

SUGERENCIAS DIDÁCTICAS
Calcular la actividad 2 utilizando la fórmula para calcular los intervalos de clase y compara
resultados. Entrega tabla comparativa de las dos clases.

Investigar el Diagrama de Tallo y hoja y realiza el gráfico y explica su interpretación.


Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Práctica No. Nombre de la Práctica
Asignatura
Probabilidad y Estadística 4 Diagramas de Venn-Euler para
Ambiental el cálculo de probabilidades.

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Elaborar diagramas de Venn-Euler para la comprensión del cálculo


de probabilidades de distintos sucesos de un espacio muestral.

INTRODUCCIÓN

En la vida cotidiana aparecen muchas situaciones en las que los resultados observados
son diferentes aunque las condiciones iniciales en las que se produce la experiencia sean
las mismas. Por ejemplo, al lanzar una moneda unas veces resultará cara y otra cruz. Estos
fenómenos, denominados aleatorios, se ven afectados por la incertidumbre.

En el lenguaje habitual, frases como "probablemente...", "es poco probable que...", "hay
muchas posibilidades de que..." hacen referencia a esta incertidumbre.

La teoría de la probabilidad es una teoría matemática axiomatizada, sobre la cual existe un


amplio consenso. La formulación usual de la teoría de la probabilidad se hace en el
lenguaje de la teoría de conjuntos. Por otra parte, cuando aplicamos las técnicas
estadísticas a la recogida, análisis e interpretación de los datos, la teoría de la probabilidad
proporciona una base para evaluar la fiabilidad de las conclusiones alcanzadas y las
inferencias realizadas.
El objetivo del Cálculo de Probabilidades es el estudio de métodos de análisis del
comportamiento de fenómenos aleatorios.

El término probabilidad se refiere al estudio de azar y la incertidumbre en cualquier situación


en la cual varios posibles sucesos pueden ocurrir. La probabilidad es una medida numérica
de la posibilidad de que ocurra un evento. Sus valores se encuentran en una escala de 0 a
1.

1. Conceptos fundamentales

1.1 Experimento

Es definido como cualquier proceso que genere un conjunto de datos. En la mayoría de los
casos los resultados dependerán del azar, por lo tanto no se pueden predecir con certeza.
Por ejemplo si un químico realiza un análisis varias veces en las mismas condiciones,
obtendría diferentes medidas. Por lo tanto, se dice que es un experimento aleatorio.

1.2 Espacio Muestral

Al conjunto de todos los resultados posibles de un experimento estadístico y se representa


con el símbolo (𝑆 ).

A cada resultado en un espacio muestral se le llama elemento o miembro del espacio


muestral o simplemente punto muestral. Estos elementos se enlistan entre paréntesis y
separados por comas.

Ejemplo 1.1

Si un experimento aleatorio consiste en lanzar un dado y observar el número que aparece


en la cara superior, entonces claramente el espacio muestral es el conjunto S = {1,2, 3, 4,
5, 6}

1.3 Eventos o Sucesos

Es cualquier recopilación (subconjunto) de resultados contenidos en el espacio muestral S.


Un evento es simple si consiste en exactamente un resultado y compuesto si consiste en
más de un resultado.
Ejemplo 1.2

Considere un experimento en el cual cada uno de tres vehículos que toman una salida de
una autopista particular vira a la izquierda (L) o la derecha (R) al final de la rampa de salida.

S = {LLL, RLL, LRL, LLR, LRR, RLR, RRL y RRR]

Sea el evento A que dos viren a la derecha: A = {LRR, RLR, RRL}

El Evento B que exactamente uno de los tres vehículos vire a la derecha: B = {RLL, LRL,
LLR}

Evento C que cuando mucho uno de los vehículos vire a la derecha: C= {LLL, RLL, LRL,
LLR}

Evento D que los tres vehículos viren en la misma dirección: D = {LLL, RRR}

Ejemplo 1.3

En el experimento en el cual se observa el número de bombas en uso en cada una de dos


gasolineras de 6 bombas.

Para sacar el espacio muestral es necesario saber que los posibles resultados para cada
bomba son: 0 (que ninguna este en uso), 1 (que una esté en uso), 2 (que dos estén en uso),
así sucesivamente hasta que las 6 estén en uso. Por lo tanto los elementos son 0, 1, 2, 3,
4, 5, 6.

S= {(0,0); (0,1); (0,2,); (0,3); (0,4); (0,5); (0,6); (1,0); (1,1); (1,2); (1,3); (1,4); (1,5); (1,6); (2,0);
(2,1); (2,2); (2,3); (2,4); (2,5); (2,6); (3,0); (3,1); (3,2); (3,3); (3,4); (3,5); (3,6); (4,0); (4,1);
(4,2); (4,3); (4,4); (4,5); (4,6); (5,0); (5,1); (5,2); (5,3); (5,4); (5,5); (5,6); (6,0); (6,1); (6,2);
(6,3); (6,4); (6,5); (6,6)}

Sea:

El evento A está definido como el que la primera gasolinera tiene más bombas ocupadas
que la segunda

A = {(1,0), (2,0); (2,1); (3,0); (3,1); (3,2); (4,0); (4,1); (4,2); (4,3); (5,0); (5,1); (5,2); (5,3); (5,4);
(6,0); (6,1); (6,2); (6,3); (6,4); (6,5)}

El evento B definido como el que la primera gasolinera tiene la mitad de bombas ocupadas
que la segunda
B = {(1,2); (2,4); (3,6)}

El evento C en que el número de bombas en uso es el mismo en ambas gasolineras.

C = {(0,0); (1,1); (2,2); (3,3); (4,4); (5,5); (6,6)}

2. Relaciones de la teoría de conjuntos

Un evento es simplemente un conjunto, así que las relaciones y resultados de la teoría


elemental de conjuntos pueden ser utilizados para estudiar eventos.

Conjunto.- Un conjunto es la agrupación o colección de elementos con una característica


en común. Generalmente los conjuntos se designan con letras mayúsculas A, B, C, etc., los
elementos se colocan entre llaves.

Para representar que un elemento "a" pertenece al conjunto "A" se aplica el símbolo de
pertenencia  y si un elemento no pertenece a un conjunto se denota por .

Dados dos conjuntos A y B, un elemento de A es también un elemento de B, es decir que


existen conjuntos tales que todos sus elementos pertenecen a otro conjunto. En tal caso se
dice que A es un subconjunto de B o B es un subconjunto de A La notación es A  B o B
 A.

Se utilizarán las siguientes operaciones para crear eventos nuevos a partir de eventos
dados.

2.1 Complemento de un evento A, denotado por A’, es el conjunto de todos los resultados
en S que no están contenidos en A.

2.2 Unión de dos eventos A y B, denotados por A ∪ B y leídos “A o B”, es el evento que
consiste en todos los resultados que están en A o en B o en ambos eventos (de tal suerte
que la unión incluya resultados donde tanto A como B ocurren, así también resultados
donde ocurre exactamente uno), es decir, todos los resultados en por lo menos uno de los
eventos.
2. 3 Intersección de dos eventos A y B, denotada por A ∩ B y leída “A y B”, es el evento
que consiste en todos los resultados que están tanto en A como en B.

Cuando los eventos no tienen resultados en común, se denota el evento nulo (∅) y se dice
que A y B son eventos mutuamente excluyentes o disjuntos.

Las operaciones de complemento, unión e intersección pueden ser ampliadas a más de


dos eventos.

3. Operaciones con conjuntos y Diagramas de Venn-Euler


Los diagramas de Venn-Euler son figuras geométricas cerradas que se utilizan para
representar operaciones entre conjuntos.

3.1 Unión de conjuntos.- Esta operación puede representarse por medio de diagramas
de Venn-Euler, como lo muestra la siguiente figura 1:

Figura 1. Representación gráfica de


unión de conjuntos.

Se representa: A  B= x / x  A ó x  B ó a Ambos

3.2 Intersección de conjuntos.- Se denota por A  B = {(𝑥|𝑥 ∈ 𝐴 𝑦 𝑥 ∈ 𝐵). En la figura


2 se muestra el diagrama de Venn-Euler correspondiente:
Figura 2. Diagrama de Venn-Euler para representar
la intersección de conjuntos.

3.3 Complemento de conjuntos.- Formado por todos los elementos que no están en A
(sino en el conjunto universal U), se llama complemento de A.

Se representa: A'  x U / x  A.

En la figura 3 se representa la gráfica de Veen-Euler para el conjunto complemento.

Figura 3. Representación gráfica del conjunto


complemento

3.4 Diferencia de conjuntos.- A y B (en ese orden) es el conjunto de los elementos que
pertenecen a A y no pertenecen a B y se denota como A- B (A/B). Esto es:
A / B  x/x  A y x  B

Gráficamente (figura 4):

Figura 4. Gráfica de Venn- Euler para


diferencia de conjuntos

4. Principales leyes del álgebra de conjuntos

Leyes de 𝐴 ∪𝐴=𝐴 𝐴∩𝐴 = 𝐴


Idempotencia

Propiedad  A  B  C  A  ( B  C ) ( A  B)  C  A  (B  C )
asociativas

Propiedad AB  B A AB  B A


conmutativa

Propiedades A  (B  C )  ( A  B)  ( A  C ) A  (B  C )  ( A  B)  ( A  C )
distributivas

Leyes de A   A A U  A
identidad A U  U A  

Leyes de Morgan ( A  B )  A  B  ( A  B )  A  B 

Leyes de A  A  U A  A  
complemento
5. Problemas prácticos

Problema práctico 5.1

En el experimento en el cual se observa el número de bombas en uso en una sola


gasolinera de seis bombas, sea A = {0, 1, 2, 3, 4}, B = {3, 4, 5, 6} y C = {1, 3, 5}.

Encuentra A’, A ∪ C, A ∪ B, A ∩ C, A ∩ B, (A ∩ C)’, A/B, A/C y (A ∪ B ∪ C)’.

Para construir el diagrama de Venn-Euler es necesario conocer si existen intersecciones,


que es lo más importante.

En este ejemplo, hay intersección en los tres eventos, A ∩ B ∩ C = {3}; las otras
intersecciones son: A ∩ B = {3,4}, B ∩ C = {3,5) y A ∩ C = {1,3}. Estos elementos los
colocamos en su lugar correspondiente dentro del diagrama y corresponden a los
elementos 1, 3, 4, 5.

Posteriormente se colocan los elementos faltantes: 0 y 2 ∈ A, y 6 ∈ B. Ver figura 5

Figura 5. Representación gráfica de los tres


eventos del problema práctico 5.1

En la tabla siguiente se muestran los resultados obtenidos:

A’ = {5, 6} A ∪ C = {0, 1, 2, 3, 4, 5} A ∪ B = {0, 1, 2, 3, 4, 5, 6} = S

A ∩ C = {1, 3} A ∩ B = {3, 4} (A ∩ C)’ = {0, 2, 4, 5, 6}


A/B={0,1,2} A/C = {0,2,4} (A ∪ B ∪ C)’ = ∅
Problema práctico 5.2

En una unidad habitacional viven 120 familias y se sabe que 70 de ellas tienen aire
acondicionado, que 30 poseen ventilador y que 17 tienen ambas cosas. Se desea conocer:
a) ¿cuántas familias tienen exclusivamente aire acondicionado?, b) cuántas familias son
dueños exclusivamente de ventilador, c) ¿cuántas familias son propietarias de un aire
acondicionado o de ventilador?, y d) ¿cuántas familias no poseen ni aire acondicionado ni
ventilador? Construya un diagrama de Venn-Euler para representar los resultados.

En este ejemplo se tiene dos sucesos: sea el suceso A familias que tienen aire
acondicionado y el suceso B familias que tienen ventilador y A ∩ B = {17}. En el conjunto
universo deben ser 120.

a) Familias que tienen exclusivamente aire acondicionado:


En el evento A son en total 70 familias que tienen aire acondicionado, le restamos
las 17 familias que tienen ambas. A – (A ∩ B) = 70-17 = 53

b) Cuántas familias son dueños exclusivamente de ventilador:


En el evento B son en total 30 familias que tienen ventilador, le restamos las 17
familias que tienen ambas. A – (A ∩ B) = 30-17 = 13
Por lo tanto, (A ∪ B)’ =37 que corresponde al conjunto universo.
La figura 6 muestra el diagrama de Venn-Euler para calcular las demás opciones:

Figura 6. Diagrama de Venn-Euler del


problema práctico 5.2
c) Número de familias son propietarias de un aire acondicionado o de ventilador?
(A ∪ B) = 53 + 17 +13 = 83

d) Número de familias no poseen ni aire acondicionado ni ventilador?


Se calcula el (A ∪ B)’ = Conjunto universo – (A ∪ B) = 120- 83= 37

Problema práctico 5.3

Se analizan muestras de plástico de policarbonato para determinar la resistencia de


rayaduras y la resistencia a los golpes: Los resultados de 49 muestras se resumen a
continuación:

Resistencia a los golpes

alta baja
Resistencia a rayaduras
alta 40 4

baja 2 3

Sea el evento A de que una muestra tiene alta resistencia a los golpes y el evento B que la
muestra tiene alta resistencia a rayaduras. Determine el número de muestras en A ∩ B, A’
y A ∪ B. Ilustra mediante un diagrama de Venn-Euler (Figura 8).

Figura 8. Diagrama de Venn-Euler del


ejemplo 5.3

A ∩ B = 40 muestras

A’ = 7 muestras
A ∪ B = 46 muestras

MATERIALES Y EQUIPO
Práctica impresa

Calculadora

Walpole. Myers. Myers. Probabilidad y Estadística para ingeniería y ciencias. Editorial


Pearson. Novena Edición.

Montgomery. Runger. Probabilidad y Estadística aplicadas a la Ingeniería. Editorial Limusa


Wiley. Segunda Edición.

PROCEDIMIENTO

Resuelva las siguientes actividades con el uso de diagramas de Venn-Euler y calculadora.

Actividad 1

Se realizó un estudio para determinar la calidad de agua para consumo público, para ello
se analizaron algunas muestras, encontrándose la presencia de: Magnesio, Calcio,
Aluminio, Zinc, Manganeso, Fósforo y Cromo. Sean los Eventos:

A = {Magnesio, Calcio, Cromo}

B = {Calcio, Aluminio, Zinc}

C = {Fósforo}

Representa los eventos en un diagrama de Venn-Euler y lista los elementos de los


conjuntos que corresponden a los siguientes eventos:

a) A’
b) 𝐴 ∪ 𝐶
c) (𝐴 ∩ 𝐵′) ∪ 𝐶′
d) 𝐵′ ∩ 𝐶′
e) A/B
f) 𝐴 ∩ 𝐵 ∩ 𝐶
g) (𝐴′ ∪ 𝐵′ ) ∩ (𝐴′ ∩ 𝐶)

Actividad 2

Muestras de una pieza de aluminio forjado se clasifican en base en el acabado de la


superficie (en micropulgadas) y en las mediciones de la longitud. Los resultados de 100
piezas se resumen a continuación:

Longitud
Excelente Buena
Acabado de la Excelente 75 7
superficie Buena 10 8

Sea que A denote el evento de que una muestra tiene acabado en la superficie excelente y
sea que B denote el evento de que una muestra tienen una longitud excelente.

Realiza una representación gráfica del diagrama de Venn-Euler y determina el número de


muestras en:

a) B’
b) 𝐴 ∪ 𝐵
c) A/B
d) 𝐴′ ∩ 𝐵

Actividad 3

Una encuesta aplicada a 100 estudiantes de la carrera de Ingeniería Ambiental de una


universidad, sobre la consulta a las tres revistas que existen en la biblioteca reveló que, 13
estudiantes consultan la revista AIDIS pero no la revista CAS; 24 solo consultan AIDIS; 18
estudiantes consultan mínimo dos revistas; 7 estudiantes consultan CAS, pero no la revista
internacional de contaminación ambiental; 9 estudiantes consultan la revista internacional
de contaminación ambiental y AIDIS; 20 solamente consultan la revista internacional de
contaminación ambiental y 4 estudiantes consultan las tres revistas.
Elabora un Diagrama de Venn y contesta lo siguiente:

a) El número de estudiantes que al consultan una de las tres revistas.


b) El número de estudiantes que consultan una revista
c) El número de estudiantes que no consultan ninguna revista

Actividad 4

Veintidós automóviles se sacan de una línea de ensamblaje y se examinan para ver si


tienen defectos. Doce de los automóviles no tienen defectos, nueve tienen defectos de
acabado exterior, y cuatro tienen defectos en su ensamblaje. Sea A, el evento formado por
el conjunto de automóviles que tienen defectos de ensamblaje y sea B el evento formado
por el conjunto de automóviles que tienen defectos en el acabado exterior.

Elabora un diagrama de Venn para simbolizar:

a) El evento formado por los automóviles que tienen los dos tipos de defectos.

b) El evento formado por los automóviles que tienen por lo menos un tipo de defectos.

c) El evento formado por los automóviles que no tienen defectos.

d) El evento formado por los automóviles que tienen exactamente un tipo de defecto

Actividad 5

En un Congreso de Medio Ambiente participaron 82 especialistas, de los cuales: a) 64 han


trabajado en estudios de contaminación de aguas, b) 33 en estudios de contaminación
Atmosférica, c) 24 en contaminación acústica, d) 25 han trabajado en contaminación de
aguas y atmosféricas, e) 14 han trabajado en proyectos de contaminación atmosférica y
acústica, f) 23 en trabajos de contaminación de aguas y acústica, g) 14 han trabajado en
las tres áreas.

Sea el evento A: Especialista que han trabajado en Contaminación de aguas; el evento B:


Especialista que han trabajado en Contaminación atmosférica y el evento C: Especialista
que han trabajado en Contaminación acústica.

Utiliza el Diagrama de Venn-Euler para contestar lo siguiente:

1) ¿Cuántos de los participantes al congreso no han trabajado en estas áreas?


2) ¿Cuántos han trabajado en contaminación de aguas o contaminación acústica, pero
no en contaminación atmosférica?

Actividad 6

Se presentan 44 solicitudes para cubrir los puestos que ofrece una empresa. Entre los
solicitantes hay 29 Ingenieros Industriales, 19 Ingenieros Químicos y 6 Ingenieros
Industriales y Ambientales, 8 Ingenieros Químicos y Ambientales y 9 Ingenieros Industriales
y Químicos y 1 que tiene triple titulación. Es decir hay uno que es Ingeniero Industrial,
Ingeniero Químico e Ingeniero Ambiental. ¿Cuántos Ingenieros Ambiental han presentado
la solicitud? Representa el Diagrama de Venn-Euler.

SUGERENCIAS DIDÁCTICAS
Resolver los ejercicios 3.16, 3.17 y 3.18 del libro de Probabilidad y Estadística aplicadas a
la ingeniería del autor Douglas C. Montgomery y George C. Runger de la editorial Limusa
Wiley, segunda edición. Con el objetivo de elaborar diagramas de Venn-Euler y rellenar las
áreas correspondientes a operaciones entre conjuntos.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Práctica No. Nombre de la Práctica
Asignatura
Probabilidad y Estadística 5 Factorial, permutaciones y
Ambiental combinaciones con EXCEL.

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Calcular diferentes técnicas de conteo y combinatoria en resolución


de problemas con el uso del Excel.

INTRODUCCIÓN
El análisis combinatorio o combinatoria es la ciencia que estudia las reglas de conteo, es
decir, las diferentes formas en que se puede ordenar o agrupar los elementos dados
siguiendo unas determinadas reglas establecidas. Existen distintas formas de realizar estas
agrupaciones, según se repitan los elementos o no, según se puedan tomar todos los
elementos de que los cuales se dispone o no y si influye o no el orden de colocación de los
elementos, por lo que, el desarrollo de la combinatoria está fuertemente ligado con su
aplicación en la teoría de la probabilidad.

Actualmente el análisis combinatorio dispone de técnicas generales que permiten resolver


ciertos tipos de problemas, sin embargo la solución de un problema combinatorio exige casi
siempre ingeniosidad y una compresión plena de la situación descrita en el problema. Las
técnicas de conteo son aquellas que son usadas para enumerar eventos difíciles de
cuantificar.
En esta práctica se analizan algunas herramientas básicas para entender el uso de las
técnicas de conteo, y las que van a permitir calcular el número de elementos de conjuntos
formados de acuerdo a ciertas reglas, sin necesidad de enumerar sus elementos.

1. Principios fundamentales de conteo

1.1 Notación Factorial

Se define el factorial de un número n (n es un número entero y positivo), al producto indicado


de los números enteros y consecutivos desde la unidad hasta n inclusive. Esto se denota
como n!:

Donde n! = 1 x 2 x3 x 4 x …….. (n-2) x (n-1) x (n)

Por ejemplo 4! = 1 x 2 x 3 x 4

5! = 1 x 2 x 3 x 4 x5

6! = 1 x 2 x 3 x 4 x 5 x 6

Para calcular el factorial en Excel se usa la función FACT

Sintaxis de la función FACT en Excel: =FACT(número)

 número: Es el número no negativo cuyo factorial desea obtener. Si el argumento número


no es un entero, se trunca.

Otra manera es: Fórmulas > Insertar Función > Matemáticas y trigonométricas,
buscar FACT y anotar el número del que se desea obtener el factorial.
Problema práctico 1.1

Calcula el factorial de cada una de las siguientes expresiones:

3!
a) , sintaxis con Excel =FACT(3)/2
2

b) 7! , sintaxis =FACT(7)

c) (4-2)!, sintaxis =FACT(4-2)

d) (2+1)!, sintaxis =FACT(2+1)

e) (32)!, sintaxis =FACT(POTENCIA(3,2)) Nota: la potencia se encuentra en matemáticas


y trigonométricas.

f) (5-5+1)!, sintaxis =FACT(5-5+1)

g) 4!3! , sintaxis =FACT(4)*FACT(3)

8!
h) , sintaxis =FACT(8)/FACT(5)
5!

1.2 Principio de adición

Para entender el principio de la adición, se analiza el siguiente ejemplo:

Si se toma un dado y una moneda normal, ¿cuántos resultados diferentes se pueden


obtener si se lanza el dado o se lanza la moneda?

Si el evento A consiste en lazar el dado, los posibles resultados es que aparezca el 1, 2, 3,


4, 5, 6, como se muestra en la figura 1.

Figura 1. Resultados del lanzamiento de un dado


Si el evento B consiste en lanzar una moneda, los posibles resultados son dos (cara o sello)
como se muestra en la figura 2.

Figura 2. Resultados al lanzar una moneda

Luego, se aprecia que el número total de resultados distintos que se pueden obtener al
lanzar un dado o la moneda es 8. Como se muestra en la figura 3, los eventos son
mutuamente excluyentes.

Figura 3. Resultado de la realización de los dos eventos

Para hallar la respuesta se hace uso de la operación de adición, el cual se define como:

“Si un evento A puede realizarse de m maneras distintas y otro


evento B se puede realizar de n maneras diferentes y si 𝐴 ∩ 𝐵 = ∅,
(es decir, no es posible que ambos eventos se realicen juntos),
entonces el evento A o el evento B se realizarán de (m + n) maneras
distintas”
Problema práctico 1.2

Una biblioteca tiene 40 libros de contaminación ambiental y 50 libros de energía renovables.


Si un estudiante quiere aprender acerca de alguno de estos dos temas, ¿de cuantas
maneras puede elegir alguno de los temas?

Hay que comprender que el principio aditivo se presenta en eventos mutuamente


excluyentes, al elegir uno ya no puede suceder el otro.

El estudiante no quiere aprender contaminación ambiental y energía renovable, sino


contaminación ambiental o energía renovable, por la regla de la suma puede elegir 40 + 50
= 90 libros.

1.2 Principio multiplicativo

Analizando el ejemplo siguiente, nos permite entender el principio de la multiplicación.

Martha tiene en su maleta de viaje 3 blusas de colores: blanco, azul y naranja; y 4 faldas
de colores: verde, rosa, beige y negra. ¿De cuantas maneras diferentes puede hacerlo?.

Aplicando la técnica de la multiplicación se tendrán las siguientes posibilidades: (figura 4)


3 x 4 = 12

Figura 4. Resultados del principio multiplicativo


El principio multiplicativo:

“Si un evento o suceso A puede ocurrir, de m maneras diferentes y otro


suceso, de manera independiente al primero, puede ocurrir de n
maneras diferentes, entonces el número de maneras distintas en que
pueden suceder ambos sucesos es 𝑚 × 𝑛”

Problema práctico 1.3

Considere el experimento consistente en observar el resultado de la perforación de cuatro


pozos exploratorios, los cuales pueden presentarse de 2 maneras (0: seco, 1: productor).
¿De cuantas maneras pueden observarse los cuatro pozos simultáneamente?

El resultado del primer pozo puede presentarse de 2 maneras (0: seco, 1: productor), el
resultado del segundo, tercero y cuarto pozos también puede presentarse de 2 maneras.

Entonces, el número de maneras en que puede observarse el conjunto, indicando el


resultado de los cuatro pozos simultáneamente es: 2  2  2  2 = 16

1.3 Diagramas de árbol

Un diagrama de árbol es una herramienta gráfica que permite enumerar todas las posibles
maneras de realizar un conjunto de acciones secuenciales o independientes. El árbol se
construye a partir de un nodo, que representa la primera acción a efectuar; de éste se
desprenden tantas ramas como maneras diferentes se pueda realizar esa acción; en las
terminales de cada rama se dibujan otros nodos, que representan la segunda acción a
efectuar y de los que se desprenden tantas ramas como maneras lógicas diferentes pueda
realizarse esa segunda acción, considerando la manera en que se realiza la primera. Y así,
sucesivamente.

Problema práctico 1.4

En el circuito mostrado en la siguiente figura 5, la corriente fluye de la terminal 1 a la terminal


2, siempre que el interruptor X esté cerrado, o que los interruptores Y y Z, ambos estén
cerrados.
Figura 5. Circuito eléctrico

El experimento E1 consiste en observar el funcionamiento de un interruptor, que puede


presentar uno de dos estados: 0, abierto o 1, cerrado, generando el espacio muestral S1 =
{0, 1}. Sea el experimento E2 consistente en observar el funcionamiento de los tres
interruptores, simultáneamente. Construya el diagrama de árbol asociado a tal experimento.
El funcionamiento de cada interruptor es independiente del funcionamiento de los otros dos,
por lo que cada interruptor puede presentar uno de dos estados: 0, abierto o 1, cerrado.
Entonces, el diagrama de árbol (figura 6) correspondiente es:

Figura 6. Diagrama de árbol del circuito eléctrico

El número de maneras diferentes en que se pueden comportar los tres interruptores es: 2
22=8
2. Técnicas de Conteo

El principio fundamental del conteo, combinado con la definición de factorial de un número,


permite establecer una serie de fórmulas generales, que facilitan, de manera significativa,
el cálculo del cardinal asociado al espacio muestral finito correspondiente a cada caso.
Cabe señalar, sin embargo, que el uso de tales fórmulas no se debe hacer en forma
indiscriminada, tratando de adivinar cuál de todas será la que permite resolver un problema
en particular. Es esencial considerar la formulación del problema, en términos del principio
fundamental del conteo, dibujando un diagrama de árbol, identificando cuándo es aplicable
el principio multiplicativo y cuándo el aditivo, cuando importa el orden de los resultados y
cuándo no, y cuándo es permisible repetir resultados y cuándo no.

2.1 Permutaciones

Una permutación es todo arreglo de objetos en donde nos interesa el orden, lugar o posición
que ocupa cada uno de los objetos que constituyen dicho arreglo. Para calcular el número
de permutaciones se aplica la fórmula siguiente:

𝑃𝑛 = 𝑛!

Donde La expresión 𝑃𝑛 representa las permutaciones de "n" objetos, tomando todos los
objetos a la vez. Los conjuntos de objetos se diferenciaran únicamente por el orden de los
objetos. Existen dos tipos de permutaciones: Con repetición y sin repetición

2.1.1 Permutaciones sin repetición de n elementos diferentes tomados todos a la vez.

Se simbolizan:
n
Pn  n! ó P(n, n)  n!

Para calcular en Excel se hace uso de los factoriales con la función FACT

Problema práctico 2.1

Si en un librero hay 15 diferentes libros, 6 de los cuales son de cálculo diferencial, 4 son de
química orgánica y 5 son de física.

a) ¿De cuántas maneras diferentes puedes acomodarlos en el librero?


Tomando todos los elementos (figura 7) P15 = 15!

Los cálculos en Excel pueden realizarse de dos maneras:

Usando la función factorial: Sintaxis =FACT(15)

O la función permutaciones: Sintaxis =PERMUTACIONES(15,15)

15P15 = = 1.307x1012 maneras

Figura 7. Acomodo de todos los libros

Nota: como es un valor muy grande Excel lo expresa a como exponencial a la 12, si se
quiere con todas las cifras, con botón derecho seleccionar: formato de celdas > número y
marcar la opción de usar separador de miles.

b) ¿De cuántas maneras diferentes puedes acomodarlos en tu librero, si los de cada materia
deben quedar juntos?

El considerar que los libros de cada materia deben quedar juntos implica distinguir las 3
materias como 3 objetos que se pueden permutar (figura 8):

Figura 8. Acomodo de los libros por cada materia juntos


El primer objeto es el grupo de libros de cálculo diferencial, el segundo objeto es el grupo
de libros de química orgánica y el tercer objeto es el grupo de libros de física. El número de
maneras en que se pueden permutar estos 3 objetos es: P6= 6!, para los libros de cálculo
diferencial; P4= 4!, para los libros de química orgánica y P5= 5!, para los libros de física.

Para calcular el número total de maneras que se pueden colocar los 15 libros y que cada
materia queden juntos, se hace uso del principio multiplicativo. Utilizando la función FACT
en Excel:

P3(P6,P4,P5) = FACT(3)*FACT(6)*FACT(4)*FACT(5)= 12, 441, 600 maneras

O con la función de PERMUTACIONES

=PERMUTACIONES(3,3)*PERMUTACIONES(6,6)*PERMUTACIONES(4,4)*PERMUTAC
IONES(5,5)

2.1.2 Permutaciones sin repetición de n elementos diferentes tomados de r en r con


r<n

Se simbolizan:

n!
P(n, r) 
(n  r)!

La notación para permutaciones es P(n,r) que es la cantidad de permutaciones de “n”


elementos si solamente se seleccionan “r”

Problema práctico 2.2

¿De cuántas maneras diferentes se pueden sentar los 52 alumnos del grupo de
Probabilidad en un salón que dispone de 60 plazas?

En este ejemplo n = 60 plazas y r = 52, es una permutación sin repetición porque: el


primer alumno que entra al salón puede escoger su lugar de entre 60 posibles, el segundo
puede escoger lugar de entre 59 posibles,... y así, sucesivamente, hasta el alumno número
52, que puede escoger lugar de entre 9 posibles. Evidentemente, 8 de los 60 lugares
quedarán vacíos; se trata de calcular las ordenaciones de 60 objetos de orden 52.

Microsoft Excel, cuenta con la función de permutaciones

Sintaxis: PERMUTACIONES(número, tamaño)

La sintaxis de la función PERMUTACIONES tiene los siguientes argumentos:

 Número Es un número entero que describe el número de objetos.

 Tamaño Es un número entero que indica el número de objetos incluidos en cada


permutación.

Para resolver este ejemplo: =PERMUTACIONES(60,52)

El resultado P(60,52)= 2.06x1077 maneras

2.1.3 Permutaciones con repetición

Se llama permutaciones con repetición de n objetos, de orden r a las diferentes maneras


de efectuar secuencialmente r acciones, cada una de las cuales se puede presentar de n
distintas maneras. El hecho de permitir la repetición de objetos, hace que el valor de r no
esté restringido, pues el número r de acciones a efectuar puede ser mayor al número n de
maneras en que puede presentarse cada una de ellas.

n!
P(n 1 , n 2 ,..n r ) 
n1 ! n 2 !...n r !

Problema práctico 2.3

a) ¿Cuántas claves de acceso a una computadora será posible diseñar con los números 1,
1, 1, 2, 3, 3, 3, 3?, b) ¿cuántas de las claves anteriores empiezan por un número uno
seguido de un dos?, c) ¿cuántas de las claves del inciso a empiezan por el número dos y
terminan por el número tres?
a) El total de elementos con los que se cuenta para diseñar la clave de acceso son 8 (figura
9), distribuidos de la siguiente manera: n1 =3 que corresponden al número uno, n2 = 1
porque solo hay un número dos, n3= 4 ya que existen cuatro números 3.

Figura 9. Claves de accesos distribuidos todos los elementos

Excel no tiene una función para calcular permutaciones con repetición, por lo que
podemos hacer uso de la función FACT.

Sintaxis =FACT(8)/(FACT(3)*FACT(1)*FACT(4))

8P3,1,4 = 280 claves de acceso

b) Como están condicionados los dos primeros espacios que conforman la clave de acceso
(figura 10), es decir, en el primer espacio se debe colocar el número 1 y en el segundo
espacio el número dos, solamente nos restan 6 números para ocupar los siguientes
espacios, 2 números uno y 4 números tres. Por lo tanto, n1=2 y n2=4.

Figura 10. Claves de acceso condicionado los


dos primeros lugares

Como son eventos sucesivos se hace uso del principio multiplicativo:

Sintaxis en Excel =1*1*FACT(6)/(FACT(2)*FACT(4))


1 x 1 x 6P2,4 = 15 claves de acceso

c) Ahora están condicionados el primer y último espacio que conforman la clave de acceso
(figura 11), es decir, en el primer espacio se debe colocar el número 2 y en el último
espacio el número 3, solamente nos restan 6 números para ocupar los espacios libres
(intermedios), quedando 3 números uno y 3 números tres. Por lo tanto, n1=3 y n2=3.

Figura 11. claves de acceso condicionado el primer y ultimo


lugar

Como son eventos sucesivos se hace uso del principio multiplicativo:

Sintaxis en Excel =1*FACT(6)/(FACT(3)*FACT(3))*1

1 x 1 x 6P2,4 = 15 claves de acceso

2.1.4 Permutaciones con repetición de n elementos diferentes tomados de r en r


simboliza:

P(n,r)= nr

Donde r<n, r>n, r=n

Problema práctico 2.4

¿De cuántas firmas podemos contestar un examen de 12 preguntas de selección múltiple,


si cada pregunta tiene 5 alternativas de respuesta?
A veces suele suceder que se pueda confundir el valor de r con n, por eso se debe dejar
muy claro que r es el número de veces que se repiten los n elementos.

La primera pregunta se puede contestar de con cinco alternativas de respuesta, la segunda


pregunta también con cinco alternativas de respuesta, la tercera pregunta de la misma
manera y así sucesivamente. A cada una de las preguntas se pueden contestar con cinco
alternativas, por lo que:

n = 5 y r = 12

5 x 5 x 5 x ……5 = 512

12 preguntas

Con Excel se puede calcular esta permutación con la función de potencia

Sintaxis =POTENCIA(número, potencia)

La sintaxis de la función POTENCIA tiene los siguientes argumentos:

 Número Es el número base. Puede ser cualquier número real.

 Potencia Es el exponente al que desea elevar el número base.

2.1.5 Permutaciones circulares

Es un ordenamiento o arreglo de los elementos, alrededor de un punto de referencia


(formando una línea cerrada). Dado n objetos diferentes estos se pueden ordenar
circularmente y el total de ordenamientos se calcula así:

Pcirc,n= n-1!

Problema práctico 2.5

¿De cuántos modos distintos podemos ubicar las cifras del 1 al 7 en la figura 12?
Figura 12. Permutación circular para ubicar los
dígitos del 1 al 7

Se puede solucionar este problema como la conjunción de dos sucesos: En primer lugar se
ubica una cifra en el centro (7 posibilidades) y en segundo lugar las otras 6 cifras, las cuales
por ordenarse en una circunferencia podrán permutarse de (6 –1)! maneras, por lo cual:

Pcirc,7 = 7x(6-1)!

Solucionando el problema con Excel con la función factorial, la sintaxis es:

=7*FACT(6-1)!

Pcirc,7= 840 maneras

2.2 Combinaciones

Es un arreglo de elementos en donde no nos interesa el lugar o posición que ocupan los
mismos dentro del arreglo. En una combinación nos interesa formar grupos y el contenido
de los mismos.

En el caso de las combinaciones, lo importante es el número de agrupaciones diferentes


de objetos que pueden incurrir sin importar el orden. Por lo tanto se busca el número de
subgrupos diferentes que pueden tomarse a partir de n objetos.

Para calcular las combinaciones se utiliza la siguiente expresión:

o C(n, r)   
Cr 
n! n
r! (n  r)! r 
n
Si se considera que el conjunto a, b, c, d y se desean obtener subconjuntos de dos
elementos, entonces, se tienen los siguientes arreglos:

AB AC AD

BC BD

CD

El hecho de contener los mismos elementos y aunque el orden sea diferente, entonces cada
una de las anteriores ordenaciones se considera una combinación.

Aplicando la formula tenemos: n=4 r=2

n! 4! 4 x3x 2! 12
Cr     6
r! (n  r)! 2!(4  2)! 2! (2 x1)
n
2

Problema práctico 2.6

Un granjero compra 3 vacas, 2 cerdos y 4 gallinas a un hombre que tiene 6 vacas, 5 cerdos
y 8 gallinas. ¿Cuántas elecciones puede hacer el granjero?

Dado que no es importante el orden de la elección (figura 13), entonces:

Figura 13. Maneras de elegir a un grupo de animales

Para elegir 3 vacas de un grupo de seis.; 𝐶36

Para elegir 2 cerdos de un grupo de 5; 𝐶25


Para elegir 4 gallinas de un grupo de 8; 𝐶48

La manera de elegir es en forma simultánea se aplica el principio multiplicativo, así:

𝐶36 𝑥 𝐶25 𝑥 𝐶48


Para ser uso de combinaciones en Excel, utilizamos la función COMBINAT, la cual se
encuentra en: FÓRMULAS < Matemáticas y trigonométricas.

La sintaxis para la resolución de este ejemplo es:

=COMBINAT(6,3)*COMBINAT(5,2)*COMBINAT(8,)

Obteniendo como resultado: 𝐶36 𝑥 𝐶25 𝑥 𝐶48 = 14000 maneras

MATERIALES Y EQUIPO
Práctica impresa

Microsoft Excel

Walpole. Myers. Myers. Probabilidad y Estadística para ingeniería y ciencias. Editorial


Pearson. Novena Edición.

Montgomery. Runger. Probabilidad y Estadística aplicadas a la Ingeniería. Editorial Limusa


Wiley. Segunda Edición.

PROCEDIMIENTO
Utilizando el Microsoft Excel y con apoyo de las herramientas básicas para calcular las
técnicas de conteo, resuelva las siguientes actividades:

Actividad 1

Cierta sustancia química se forma mezclando cinco líquidos distintos. Se propone verter el
líquido en un estante y agregar sucesivamente los demás. Todas las combinaciones
posibles se deben probar para establecer cuál da el mejor resultado. ¿Cuántas formas se
deben hacer?

Actividad 2

Cuántas palabras diferentes de cuatro letras pueden crearse con los caracteres de la
palabra ambiental? (No se deben repetir letras)

Actividad 3

Suponga que una organización ambiental que tiene 300 miembros se van a formar dos
comités. Si un comité va a tener cinco miembros y el otro ocho, ¿De cuántas formas
distintas se pueden seleccionar estos comités?

Actividad 4

¿De cuántas maneras diferentes se pueden colocar 6 personas, para una junta de
comité?

a) En fila:
b) En fila, si dos personas deben quedar juntas:
c) Alrededor de una mesa:
d) Alrededor de una mesa, si dos personas deben quedar siempre juntas.

Actividad 5

El gobierno municipal desea controlar los ruidos molestos que se generan en la ciudad,
para ello un jefe de tránsito necesita asignar oficiales entre 10 disponibles para controlar el
tráfico en los cruceros A, B y C. ¿De cuántas maneras lo puede hacer?

Actividad 6

Una caja de cartón con 12 baterías para radio contiene una que esta defectuosa. ¿En
cuántas formas diferentes puede elegir un inspector tres de las baterías y obtener:
a) Ninguna batería defectuosa
b) Una batería defectuosa

Actividad 7

Un grupo de tres inspectores va a inspeccionar las actividades de una industria


contaminante. El grupo se va a formar seleccionando los tres agentes de un grupo de 5.
¿Cuántos grupos diferentes se pueden formar siguiendo un orden definido? ¿Siguiendo un
orden indefinido?

Actividad 8

Poco tiempo después de ser puestos en servicio, algunos autobuses fabricados por una
cierta compañía presentaron fallas en la emisión de diesel. Suponga que una ciudad
particular utiliza 25 de estos autobuses y que en 8 de ellos aparecieron las fallas.

a) ¿Cuántas maneras existen de seleccionar una muestra de 5 autobuses de entre los


25 para una inspección completa?

b) ¿De cuantas maneras puede una muestra de 5 autobuses contener exactamente 4


con fallas?

c) Si se elige una muestra de 5 autobuses al azar, ¿cuál es la probabilidad de que


exactamente 4 de los 5 tengan fallas?

Actividad 9

Una empresa de producción emplea 20 trabajadores en el turno de día, 15 en el turno de


tarde y 10 en el turno de medianoche. Un consultor de control de calidad va a seleccionar
6 de estos trabajadores para entrevistas a fondo. Suponga que la selección se hace de tal
modo que cualquier grupo particular de 6 trabajadores tiene la misma oportunidad de ser
seleccionado al igual que cualquier otro grupo (sacando 6 papelitos de entre 45 sin
reemplazarlos).
a) ¿Cuántas selecciones resultarán en que los 6 trabajadores provengan del turno de
día?

b) ¿Cuál es la probabilidad de que los 6 trabajadores seleccionados sean del mismo


turno?

Actividad 10

Una empresa necesita 14 ingenieros ambientales para hacer un trabajo sobre el impacto
ambiental en los procesos productivos, de las cuales requiere que 4 sean mujeres, 5
hombres, y los restantes pueden ser de uno u otro sexo. ¿De cuántas formas puede elegir
la empresa a las 14 personas, si hay 18 candidatos de los cuales 8 son mujeres y 10 son
hombres?

SUGERENCIAS DIDÁCTICAS
Elaborar un cuadro comparativo de las técnicas de conteo (permutaciones y
combinaciones), utilizando algunos parámetros: tipo de combinatoria, se toman todos los
elementos, importa el orden, se repiten los elementos, fórmula, con el objetivo de que pueda
construir los conceptos asociados al conteo y poder así superar una de las dificultades que
se presentan durante la resolución de las actividades.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 6 Tipos de eventos y teorema de
Ambiental Bayes.

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Resolver problemas con el uso de la calculadora para determinar


los eventos mutuamente y no mutuamente excluyentes, dependientes e independientes y
teorema de Bayes.

INTRODUCCIÓN

Cuando se realiza un experimento, la posibilidad de que se presente un resultado


determinado en el mismo, se le evalúa por medio de un conjunto de números reales llamado
probabilidades, que caen dentro del rango cero a uno. A cada uno de los posibles resultados
del experimento, se le asigna una probabilidad tal que la suma de todas las probabilidades
es uno.

Los resultados que se obtienen en un experimento, pueden ser favorables o desfavorables,


dependiendo de la expectativa que se tenga. Los resultados favorables se denominan
resultados éxito” y los resultados desfavorables se denominan “resultados fracaso”. La
probabilidad de que ocurra un evento se define como la frecuencia relativa con la que puede
esperarse que ocurra un evento.

En el desarrollo de las probabilidades se han presentado tres enfoques para definir


la probabilidad y determinar los valores.
1. Enfoque conceptuales de probabilidad

1.1 Enfoque clásico o a priori

Define la probabilidad de que ocurra un evento como:

Probabilidad de que ocurra un evento

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠


𝑃=
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠
Simbólicamente:

P(A): la probabilidad de que ocurra el evento “A”

La utilización de esta fórmula requiere de la existencia de un espacio muestral en donde


cada resultado sea igualmente posible.

Problema práctico 1.1

Un especialista en estadística recopila datos de 1000 máquinas despachadoras de


refrescos que se encuentran en una región muy calurosa y que fácilmente se descomponen
y encuentra que 200 de ellas han tenido problemas en el funcionamiento (figura 1), por ello,
la probabilidad de ocurrencias es:

Figura 1. Ejemplo calcular la probabilidad de las


máquinas despachadoras de refresco
descompuestas.

De acuerdo al enfoque clásico de probabilidad:


𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 200
𝑃(𝐴) = = = 0.2
𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 1000

1.2 enfoque de frecuencia relativa

La asignación de probabilidades mediante el enfoque frecuencial o empírica, utiliza la


frecuencia relativa obtenida al repetir el experimento aleatorio un gran número de veces.
De esta manera, surge la siguiente definición:

“Se define la probabilidad frecuentista o empírica de un suceso A, representada por P (A)


como el valor obtenido para la frecuencia relativa con que se observa A, en un número
grande de repeticiones del experimento”

La probabilidad se determina con base en la proporción de veces que ocurre un resultado


favorable en un determinado número de observaciones. No hay ninguna suposición previa
de igualdad de probabilidades. La probabilidad de que ocurra el evento A, de acuerdo al
enfoque como frecuencia relativa es:

𝑛(𝐴) 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝐴


𝑃(𝐴) = =
𝑛 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Problema práctico 1.2

Se lanzan dos veces el dado, ¿Cuál es la probabilidad que el total de los puntos obtenidos
sean 7?

Si se calcula el espacio muestral del evento de lanzar dos veces el dado, nos queda:

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)


(6,1) (6,2) (6,3) (6,4) (5,6) (6,6)

En la figura 2 se muestra la frecuencia que se obtiene al evento de sumar los puntos


obtenidos en el lanzamiento de los dos dados.

Figura 2. Frecuencia del evento de sumar los puntos


en el lanzamiento de los dos dados

𝟔 𝟏
Por lo tanto, 𝑷(𝟕) = 𝟑𝟔
=𝟔

1.3 Enfoque subjetivo

Se define la probabilidad subjetiva, como el número asignado para cuantificar la ocurrencia


de un suceso, según el grado de confianza o credibilidad que se tiene de que ese suceso
ocurra. El valor de probabilidad bajo este enfoque es un juicio personal.

2. Axiomas y teoremas de Probabilidad

2.1 Axiomas

Los axiomas de probabilidad son las condiciones mínimas que deben verificarse para que
una función definida sobre un conjunto de sucesos determine consistentemente sus
probabilidades.
Axioma 1: Si A es un evento de S, entonces la probabilidad del evento A es:

0 ≤ 𝑃(𝐴) ≤ 1

Axioma 2: Si la probabilidad del evento es uno, se trata de un evento seguro.

P(s) = 1

Axioma 3: Si dos eventos son mutuamente excluyentes, la probabilidad de


obtener A o B es igual a la probabilidad de obtener A más la probabilidad de
obtener B.

P (A  B) = P(A) + P(B)

Excluirse mutuamente quiere decir que A y B no pueden ocurrir


simultáneamente en el mismo experimento.

Si se tienen n eventos mutuamente excluyentes o exclusivos A1, A2, A3,.....An,


entonces;

P(A1A2.........An) = P(A1) + P(A2) + .......+ P(An)

Axioma 4: A y B son sucesos no mutuamente excluyentes entonces:

P (A  B) = P(A) + P(B) - P(AB)

Axioma 5: Si A es un evento cualquiera de un experimento aleatorio y A’ es el


complemento de A, entonces:

P(A’) = 1 – P(A)

Es decir, la probabilidad de que el evento A no ocurra, es igual a 1 menos la


probabilidad de que ocurra.

Problema práctico 2.1

Tres caballos, A, B, y C están siendo tratados con tres métodos experimentales distintos
para aumentar la velocidad con la que pueden correr. Después del tratamiento intervienen
en una carrera. El caballo C tiene doble probabilidad de ganar que B, y B doble que A.
Calcular las probabilidades de que gane cada uno.

Sea E = {A, B, C} P(A) = k P(B) = 2k P(C) = 4k

Si se aplica el axioma 3 y 2, entonces:


Axioma 2
Axioma 3

𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) = 𝑃(𝐸) = 1

1
𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = k + 2k + 4k = 1 por lo tanto 𝑘 = 7

1
𝑃(𝐴) =
7
2
𝑃(𝐵) =
7
4
𝑃(𝐶) =
7

2.2 Teoremas

Teorema 1. Si  es un evento nulo o vacío, entonces la probabilidad de que ocurra  debe


ser cero. p(Ø) = 0

Demostración:

Para cualquier suceso A, A = 𝐴 ∪ ∅A, por ser mutuamente excluyentes

Del axioma 3 se deduce que:

P(A) = P  A    P( A)  P()  P( A)  0  P( A)

Teorema 2. Si A es el suceso complementario de A, entonces: P(A) = 1- P(A’)

Demostración:

Se puede escribir S= 𝐴 ∪ 𝐴′ y usando los axiomas (2) y (3), se obtiene:


1 = P(A) + P(A’) por lo tanto , P(A) = 1 – P(A’)

Teorema 3. La 𝑃(𝐴/𝐵) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵)

Demostración:

Si A y B son dos eventos cualquiera, entonces el evento A se puede separar en dos eventos
mutuamente excluyentes, (𝐴/𝐵) y 𝐴 ∩ 𝐵, por tanto, 𝐴 = (𝐴/𝐵) ∪ (𝐴 ∩ 𝐵), luego 𝑃(𝐴) =
(𝐴/𝐵) + 𝑃(𝐴 ∩ 𝐵), entonces, 𝑃(𝐴/𝐵) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵).

Teorema 4. Sí A y B son dos sucesos cualesquiera no mutuamente excluyentes, entonces:

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

Demostración:

Si 𝐴 ∪ 𝐵 = (𝐴/𝐵) ∪ 𝐵, donde (𝐴/𝐵) y B son eventos mutuamente excluyentes, por lo que


𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴/𝐵) + 𝑃(𝐵) y del teorema 3 se toma que P 𝑃(𝐴/𝐵) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵), por
tanto, 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

Corolario. Sí A, B y C son tres sucesos cualesquiera entonces:

P ( A  B  C ) = P(A) + P(B) + P(C) – P(AB) – P(AC) – P(BC) + P(A B C)

Teorema 5. Si un evento A  B, entonces: P(A)  P(B)

Demostración:

Si separamos el evento B en dos eventos mutuamente excluyentes, A y 𝐵 /𝐴, por tanto,


𝐵 = 𝐴 ∪ (𝐵/𝐴) y 𝑃(𝐵) = 𝑃(𝐴) + 𝑃(𝐵/𝐴), luego, si P(𝐵/𝐴) ≥ 0 entonces se cumple
que P(A)  P(B).

Problema práctico 2.2


En la carrera de Ingeniería Ambiental, 54 estudiantes cursaron probabilidad y estadística
ambiental y 69 estudiantes álgebra lineal y 35 ambas materias. Si se gradúan 100
estudiantes y se elige uno al azar, encuentre la probabilidad de que:

a) Halla estudiado probabilidad y estadística ambiental o álgebra lineal.

b) No haya estudiado ninguna de esas materias

Si graficamos un diagrama de Venn-Euler se puede visualizar todo el espacio muestral


(figura 3)

Figura 3. Diagrama de Venn-Euler del espacio


muestral del problema práctico 2.2

a) Sea el evento E que estudie probabilidad y estadística ambiental, el evento A que estudie
álgebra lineal y por el teorema 4 (Sí E y A son dos sucesos cualesquiera no mutuamente
excluyentes), se tiene que:

54 69 35
𝑃(𝐸 ∪ 𝐴) = 𝑃(𝐸) + 𝑃(𝐴) − 𝑃(𝐸 ∩ 𝐴) = + −
100 100 100

54 + 69 − 35 88
P(E ∪ A) = = = 0.88
100 100

b) Ahora si se le llama al evento N = {no haya estudiado ninguna de esas materias}


N’ = {Haya estudiado probabilidad y estadística ambiental y álgebra lineal}

Con el teorema 2 (Si E es el suceso complementario de A, entonces: P(A) = 1- P(A’)

𝑃(𝑁) = 1 − 0.88 = 0.12

3. Eventos mutuamente excluyentes y no mutuamente excluyentes

3.1 Eventos mutuamente excluyentes

Se dice que dos eventos son mutuamente excluyentes si uno o sólo uno de ellos puede
tener lugar en un mismo tiempo, es decir, o uno o el otro, pero no pueden suceder ambos
al mismo tiempo. La figura 4 se representa gráficamente los eventos mutuamente
excluyentes.

Sea A y B dos eventos mutuamente excluyentes entonces:

𝑃(𝐴 𝑜 𝐵) = 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

Figura 4. Representación gráfica de eventos


mutuamente excluyentes

3.2 Eventos no mutuamente excluyentes

Sean los eventos A y B mutuamente no excluyentes y subconjuntos de un mismo espacio


muestral S, entonces, la probabilidad de que ocurra el evento A o el evento B es:

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)


En la figura 5 aparece el diagrama de Venn-Euler representando dos eventos mutuamente
excluyentes:

Figura 5. Diagrama de Venn-Euler para eventos


no mutuamente excluyentes

Problema práctico 3.1

Una fábrica dispone de 20 transportistas, 45 empleados de mantenimiento y 5 ingenieros


supervisores. La contratación de todo el personal se divide en fija y temporal. De los
transportistas 8 son fijos; de los empleados de mantenimiento 35 son fijos y de los
ingenieros 3 son fijos. Si elegimos una persona al azar: a) ¿Cuál es la probabilidad de que
tenga un contrato temporal? b) ¿Cuál es la probabilidad de que tenga un contrato temporal
y no sea ingeniero? c) Si elegimos una persona que tiene contrato fijo, ¿cuál es la
probabilidad de que sea un transportista?

Si se designan los eventos y las probabilidades a cada una:


8
Evento T = {contratación fija de los transportistas}, la 𝑃(𝑇) = 70 = 0.114

35
Evento M= {contratación fija de los empleados de mantenimiento}, la 𝑃(𝑀) = 70 = 0.5

3
Evento I = {contratación fija a los ingenieros supervisores}, la 𝑃(𝐼) = 70 = 0.043

Al ser eventos mutuamente excluyentes, entonces:

a) 𝑃(𝑇 ∪ 𝑀 ∪ 𝐼) = 𝑃(𝑇) + 𝑃(𝑀) + 𝑃(𝐼) = 0.114 + 0.5 + 0.043 = 0.657

Con el teorema 2, se saca el suceso complementario

Evento E = {que la contratación del personal sea temporal)


P(E) = 1 – 0.657 = 0.343

b) Que no sea ingeniero y tenga trabajo temporal, entonces:

Se puede designar al evento A = {que tenga trabajo temporal y sea transportista},


12
su probabilidad es 𝑃(𝐴) = 70
= 0.171 y el evento B = {que tenga trabajo temporal y
10
sea de mantenimiento}, la 𝑃(𝐵) = 70 = 0.143

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) = 0.171 + 0.143 = 0.314

c) Ahora la pregunta es que tenga contrato fijo y sea transportista, entonces, cambia
la manera de designar las probabilidades al estar seleccionando solamente a los de
contratación fija, el total de casos resulta de sumar 8 + 35 + 3 = 46.
8
Sea el evento C = {que tena contrato fijo y sea transportista}, la 𝑃(𝐶) = 46 = 0.174

4. Eventos dependientes, independientes y condicional

4.1 Eventos dependientes

Dos eventos son dependientes cuando la ocurrencia o no ocurrencia de uno, si afecta a la


probabilidad de ocurrencia del otro evento.

Por ejemplo, suponga que tenemos 5 letras B y 3 letras A en una bolsa (figura 6). Sacamos
una letra, que puede ser B o A. Ahora quedan 7 en la bolsa. Cuál es la probabilidad de que
la segunda letra sea B?

P(A) = 3/8

P(B) = 5/8

Figura 6. Ejemplo de 8 letras


dentro de una bolsa
Depende. Si la primera letra fue B, entonces en la bolsa quedan 3 letras A de 7 así que la
probabilidad de sacar una letra A en la segunda oportunidad es de 3/7. Pero si la primera
letra que sacamos es B, entonces todavía hay 4 letras B en la bolsa y la probabilidad de
sacar una letra B de la bolsa es de 4/7 (figura 7)

P(B) = 4/7

P(A) = 3/7

Figura 7. Espacio muestral al sacar la


primera letra B

La segunda oportunidad es un evento dependiente. Depende de lo que paso en la primera


oportunidad.

Cuando se tiene este caso se emplea entones, el concepto de probabilidad condicional para
denominar la probabilidad del evento relacionado. La expresión 𝑃(𝐵/𝐴) indica la
probabilidad de ocurrencia del evento A si el evento B ya ocurrió.

Decimos que dos sucesos A y B son dependientes entre sí si la ocurrencia de uno de ellos
modifica la probabilidad del otro, es decir, si P(B/A) ≠ P(B) o P(A/B) ≠ P(A)

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵⁄𝐴)

4.2 Eventos Independientes

Dos eventos son independientes si el resultado del segundo evento no es afectado


por el resultado del primer evento. Si A y B son eventos independientes,
la probabilidad de que ambos eventos ocurran es el producto de las probabilidades
de los eventos individuales.

Dos sucesos A y B son independientes si se cumple: P(A ∩ B) = P( A ) * P( B )

Tres sucesos A, B y C son independientes si se cumplen a la vez:

P(A ∩ B) = P( A )* P( B )
P(A ∩ C) = P( A ) * P( C )

P(B ∩ C) = P( B ) * P( C )

P( A ∩ B ∩C ) = P( A ) * P( B ) * P( C )

Problema práctico 3.2

En un pequeño pueblo se dispone de un carro de bomberos y una ambulancia para casos


de emergencia. La probabilidad de que el primero esté disponible cuando se le necesite es
de 0.98, y la de que la ambulancia lo esté cuando se le llame, de 0.92. En el caso de que
resulte un herido al quemarse un edificio la probabilidad de que tanto el carro de bomberos
como la ambulancia estén disponibles.

Teniendo en cuenta que A y B son dos eventos independientes y que sean A y B los
respectivos eventos de que ambos vehículos estén disponibles se tiene que

P(A∩B) = P (A)* P(B) = (0.98)*(0.92) = 0.9016

Problema práctico 3.3

Supóngase que se tiene una caja de fusibles que contiene 20 piezas, de las cuales 5 están
defectuosas. Sí se seleccionan 2 al azar y se sacan de la caja en sucesión, es decir, una
tras otra sin reemplazo del primero. ¿Cuál es la probabilidad de que ambos fusibles resulten
defectuosos?.

Sea A = El primer fusible está defectuoso

Sea B = El segundo fusible también está defectuoso

Ya que al sacar el primer fusible este no es reemplazado, el espacio muestral cambia. Para
el primer fusible es 20 y para el segundo es 19, por lo tanto los eventos son independientes.

Entonces se interpreta A  B como el evento de que A ocurre, y a continuación lo hace B.


La probabilidad de sacar el primero es 5/20 = ¼, entonces la probabilidad de extraer un
segundo fusible defectuoso de los restantes cuatro es 4/19, por lo tanto:

p (A  B) = (1/4)*(4/19) = 4/76 = 1/19 = 0.0526


4.3 Probabilidad condicional

A la probabilidad de que un evento B suceda, cuando se sabe que algún otro evento A se
ha presentado se llama probabilidad condicional y se escribe P(B/A). Esta expresión, por lo
común, se lee “la probabilidad de que B ocurra dado que ocurrió A”, o simplemente “la
probabilidad de B, dado A”.

Definición: La probabilidad condicional de B, dado A, que se indica P(B/A), se define como:

P A  B 
P(B/A) = sí P(A)  0
P( A)

Problema práctico 3.4

Sí la probabilidad de que un sistema de comunicación tenga alta fidelidad es 0.81 y la


probabilidad de que tenga alta fidelidad y alta selectividad es 0.18. ¿Cuál es la probabilidad
de que un sistema con alta fidelidad tenga también alta selectividad?

Se trata de un evento condicionado, ya que se desea que ocurra es que tenga alta
selectividad, puesto que ya tiene alta fidelidad. Entonces:

Evento A = {alta fidelidad}

Evento B = {alta selectividad}

P(A) = 0.81, sustituyendo en la fórmula anterior se tiene que:

P( A  B) 0.18 2
P(B/A) =  
P( A) 0.81 9

5. Teorema de Bayes

En su forma algébrica más simple, el teorema de Bayes se refiere al cálculo de la


probabilidad condicional del evento A, dado que ha ocurrido el evento B. La importancia
especial del teorema de Bayes consiste en que se aplica en el contexto de eventos
secuenciales y, además de que la versión del cálculo de la formula proporciona la base
para determinar la probabilidad condicional de un evento que ha ocurrido en la primera
posición secuencial. El teorema se enuncia de la siguiente manera:

Si B1, B2, B3……… Bn son eventos mutuamente excluyentes, de los cuales uno debe de
ocurrir, entonces:

 B 
p( Bi ) p i  
B
p( i )  n   A 
para i = 1,2,3,……., n
A   Bi  
i 1
p( Bi ) p
  A


Problema práctico 3.5

Cuatro compañías productoras de tornillos, la compañía A produce el 33% del total de


tornillos, la compañía B, produce el 25%, la C produce el 15 % y la compañía D produce
el 27 %. El proveedor A tiene una eficiencia del 80%, el B del 90%, el C del 95% y el D del
88%. Si un cliente se queja de que al escoger de una caja sacó un tornillo defectuoso.
¿Cuál es la probabilidad :

a) Que sea de la compañía A?

b) Que sea de la compañía B?

c) Que sea de la compañía C?

d) Que sea de la compañía D?

Para obtener la solución de este tipo de problemas es necesario hacer uso de los
diagramas de árbol y los eventos. Como se observa en la figura 8.

Sea E = {eficiente}
M = {mal hecho}
Figura 8. Diagrama de árbol de la probabilidad de
producción de tornillos de las tres
compañías.

En el diagrama de árbol adjunto pueden verse las distintas probabilidades de ocurrencia


de los sucesos E o M para cada una de las cuatro compañías.

La probabilidad pedida es P(A/M). Utilizando el teorema de Bayes, tenemos:

 M   M
p( A). p A
a) p A
 M  p( B). pB M  p(C ). pC M  p( D). pD M 
p( A). p A

(0.33).(0.20) 0.066
=   0.5042
(0.33).(0.20)  (0.25).(0.10)  (0.15).(0.05)  (0.27).(0.12) 0.1309

 M   M
p( B). p B
b) pB
 M  p( B). pB M  p(C ). pC M  p( D). pD M 
p( A). p A

(0.25).(0.10) 0.025
=   0.191
(0.33).(0.20)  (0.25).(0.10)  (0.15).(0.05)  (0.27).(0.12) 0.1309
c) pC  M   p( A). pA   p(B). pB  p(CM).pC  p(D). pD 
p(C ). p C

M M M M

(0.15).(0.05) 0.0075
=   0.0573
(0.33).(0.20)  (0.25).(0.10)  (0.15).(0.05)  (0.27).(0.12) 0.1309

 M   M
p( D). p D
d) pD
 M  p(B). pB M  p(C ). pC M  p(D). pD M 
p( A). p A

(0.27).(0.012) 0.324
=   0.2475
(0.33).(0.20)  (0.25).(0.10)  (0.15).(0.05)  (0.27).(0.12) 0.1309

MATERIALES Y EQUIPO
Práctica impresa

Calculadora

Montgomery. Runger. Probabilidad y Estadística aplicadas a la Ingeniería. Editorial Limusa


Wiley. Segunda Edición.

Walpole. Myers. Myers. Probabilidad y Estadística para ingeniería y ciencias. Editorial


Pearson. Novena Edición.

PROCEDIMIENTO

Actividad 1

Un lote contiene 15 de fierro fundido de un proveedor local y 25 de un proveedor de otro


estado. Se eligen dos piezas al azar, sin remplazo, del lote de 40. Sean A: el evento donde
la primera pieza seleccionada es del proveedor local, y B: el evento donde la segunda pieza
seleccionada es del proveedor local.

a) ¿Cuál es el valor de P(A)?


b) ¿Cuál es el valor de P(B/A)?
c) ¿Cuál es el valor de P(A∩B)?
d) ¿Cuál es el valor de P(A∪B)?

Actividad 2

Se sabe que en una colmena existen aproximadamente 50 abejas machos y 300 abejas
hembras. Si se eligen 3 abejas sin reposición hallar las siguientes posibilidades.

a) Que las tres sean hembras


b) Que las dos primeras sean machos y la tercera sea hembra
c) Que por lo menos una sea hembra

Actividad 3

Se toman muestras de la espuma proporcionada por dos proveedores y se clasifican de


acuerdo con la forma en que se adecuan a las especificaciones. A continuación se resumen
los resultados obtenidos con 40 muestras.

Longitud

Excelente Bueno

Acabado de Excelente 75 7

superficie Bueno 10 8

Sean

A: el evento donde la muestra tiene un acabado excelente, y B: el evento donde la


muestra tiene una longitud excelente

Determine las siguientes probabilidades.

a) P(A)
b) P(B)
Actividad 4

La probabilidad de que falle un conector eléctrico que se mantiene seco durante el periodo
de garantía, es 1%. Si el conector se humedece, la probabilidad de falla durante el periodo
de garantía es 5%. Si el 90% de los conectores se mantienen secos, y el 10% se humedece,
qué proporción de conectores fallará durante el periodo de garantía?

Actividad 5

Las muestras de vidrio de un laboratorio se colocan en empaques pequeños y ligeros o en


empaques pesados y grandes. Suponga que el 2% y el 1% de las muestras enviadas en
empaques pequeños y grandes, respectivamente, se rompen durante el trayecto a su
destino. Si el 60% de las muestras se envían en empaques grandes, y el 40% en empaques
pequeños, cuál es la proporción de muestras que se romperán durante el envío?

Actividad 6

Una agencia de protección ambiental ha decidido realizar un plan de protección para lo cual
decide analizar las especies candidatas de acuerdo a la siguiente tabla suministrada por el
Servicio de Fauna y Medio Ambiente.

Categoría En peligro Amenazada Total

Mamíferos 53 8 61

Aves 74 11 85

Peces 54 33 87

181 52 233

Suponga que se elige una especie candidata al azar. Calcular las siguientes
probabilidades

a) Que sea mamífero


b) Que sea una especie amenazada
c) Que sea un pez en peligro
d) Sabiendo que es una especie amenazada, que sea ave.

Actividad 7

El índice estándar de contaminación PSI (Pollution Standard Index) se utiliza como


indicador de la calidad del aire. Si dicho índice es superior a 200 se considera que la
concentración de contaminante es peligrosa, si está entre 100 y 200 se considera moderada
y si es menor que 100 se considera buena. En la siguiente tabla se encuentran los
resultados de un análisis de calidad de aire realizado en 500 ciudades con distinto grado
de desarrollo industrial:

Desarrollo Industrial Alto (A) Bajo (B) Total


Concentración de
contaminantes
C1: Peligrosa 93 11 104

C2: Moderada 117 98 215

C3: Buena 70 111 181

280 220 500

Calcular las siguientes probabilidades:

a) P(C2 ∩ B)
b) P(C3 ∪ A)
c) P(A∩C1)
d) P(A/C1)
e) P(C3/B)

Actividad 8

Para realizar un control en aguas subterráneas se tomaron 30 muestras en la zona urbana,


20 en la zona industrial y 25 en la zona agrícola. Se sabe que la probabilidad de que el agua
subterránea esté contaminada en zona urbana es 0.019, en la zona industrial 0.21 y en
zona agrícola 0.18.

a) Definir los sucesos y representar el espacio muestral en un diagrama de árbol.

b) ¿Cuál es la probabilidad de que una muestra escogida al azar sea de la zona industrial
y éste contaminada?

c) ¿Cuál es la probabilidad de que una muestra escogida al azar sea de zona urbana y
no esté contaminada?

d) ¿Cuál es la probabilidad de que una muestra esté contaminada?

e) Si la muestra no estaba contaminada, ¿Cuál es la probabilidad de que sea de la zona


agrícola?

f) Si la muestra está contaminada, ¿Cuál es la probabilidad de que sea de la zona


urbana?

SUGERENCIAS DIDÁCTICAS
Resolver e interpretar problemas de probabilidad para eventos mutuamente excluyentes y
no excluyentes de su entorno (como lanzamiento de dados, extracción de bolas de color de
una urna al azar, extracción de cartas de una baraja española, ganar la lotería de acuerdo
con diferentes parámetros, etc), a partir de la definición y utilizando la regla de adición a
través de problemas planteados por el docente.

Resolver e interpretar problemas de probabilidad de eventos dependientes e


independientes de su entorno, a partir de la definición y utilizando la regla de multiplicación
a través de problemas planteados por el docente.

Resolver e interpretar problemas de probabilidad de eventos condicionales de su entorno,


a partir de la definición y utilizando el teorema de Bayes a través de problemas planteados
por el docente.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 7 Distribuciones discretas con
Ambiental Minitab o Excel

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Resolver problemas con ejercicios de modelos de discretos


de probabilidad binomial, geométrica y de Poisson con el uso de Minitab o Excel.

INTRODUCCIÓN

1. Variables aleatorias discretas

Para un determinado espacio muestral S una variable aleatoria (VA) es cualquier regla que
relaciona un número con cada resultado en el espacio muestral, es decir cuando se asocia
un valor numérico a cada resultado del espacio muestral.

Se utilizan letras mayúsculas X, Y….. para designar variables aleatorias, y las respectivas
minúsculas (x, y,…) para designar valores concretos de las mismas.

Se dice que una variable aleatoria X es discreta si sólo toma valores enteros, es decir, un
número finito de valores o infinito numerable.

Las variables aleatorias proporcionan información para determinar la variabilidad de los


resultados del experimento
Notación:

(X=x) representa el suceso "la variable aleatoria X toma el valor x"

(X<x) representa el suceso "la variable aleatoria X toma un valor menor a x"

(X ≤x) representa el suceso "la variable aleatoria X toma un valor menor o igual a x"

Si x es una variable aleatoria discreta, la función dada por f(x) para cada x contenida en el
intervalo de x se denomina función de probabilidad, o distribución de probabilidad, de
x.

Una función puede fungir como la distribución de probabilidad de una variable aleatoria
discreta x si y sólo si sus valores, f(x), cumple las condiciones siguientes:

a) f( x) ≥ 0 para cada valor contenido en su dominio

b) ∑ f(x) = 1, donde la sumatoria se extiende sobre todos los valores contenidos en su


dominio.

La distribución acumulada F(x) de una variable aleatoria discreta X, cuya distribución de


probabilidad es f(x), es:

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∑ 𝑓(𝑡) 𝑝𝑎𝑟𝑎 − ∞ ≤ 𝑥 ≤ ∞


𝑡≤1

Las distribuciones probabilidad revelan un gran número de valores que pueden constituirse
como el resultado de un experimento. En otras palabras, nos ayudan a describir la
probabilidad de que un evento se realice a futuro; esto involucra el diseño de escenarios de
acontecimientos futuros posibles.

Comúnmente son utilizadas como parte de las tendencias posibles en que ocurran distintos
resultados, como en el caso de algunos fenómenos naturales, como la situación del clima
en un día, si llueve o será soleado, por ejemplo.

Las definiciones de media y varianza para una variable aleatoria discreta siguen la misma
filosofía, sustituyendo frecuencias relativas por probabilidades.

La media o valor esperado de una variable aleatoria discreta X , denotada como E(X), es:

𝜇𝑥 = 𝐸(𝑋) = ∑ 𝑥𝑓(𝑥) = ∑ 𝑥𝑃(𝑋 = 𝑥)


𝑥 𝑥

La media es el centro de la masa del rango de los valores de X.


Varianza de una distribución de probabilidad discreta

Sea Y una variable aleatoria discreta con distribución de probabilidades P(X=x). Entonces,
la varianza de Y es:

𝜎𝑥2 = 𝐸[(𝑋 − 𝜇)2 ] = ∑(𝑥 − 𝜇)2 𝑓(𝑥)


𝑥

2. Distribución binomial

Es una de las distribuciones de probabilidad de variables discretas más útiles. Sus áreas
de aplicación incluyen inspección de calidad, ventas, mercadotecnia, medicina,
investigación de opiniones entre otras.

Características de una distribución binomial

a) En los experimentos que tienen este tipo de distribución, siempre se esperan dos
tipos de resultados, ejemplo: Defectuoso, no defectuoso, pasa, no pasa, favorable,
no favorable, etc., denominados arbitrariamente “éxito” (que es lo que se espera que
ocurra) o “fracaso” (lo contrario del éxito).

b) Las probabilidades asociadas a cada uno de estos resultados son constantes, es


decir no cambian.

c) Cada uno de los ensayos o repeticiones del experimento son independientes entre
sí.

d) El número de ensayos o repeticiones del experimento (n) es constante

En un experimento en que el resultado es la ocurrencia o la no ocurrencia de un evento.


Llámese “éxito” a la ocurrencia del evento y “fracaso” a su no ocurrencia.

Además, sea P, la probabilidad de éxito cada vez que el experimento se lleva a cabo y 1 -
P la probabilidad de fracaso.

2.1 Definición de distribución binomial:

Sea X una variable aleatoria que representa el número de éxitos en n ensayos y P la


probabilidad de éxito con cualquiera de éstos. Se dice entonces que X tiene una distribución
binomial con función de probabilidad:

𝑛!
𝑃(𝑥, 𝑛, 𝑃) = { } 𝑃 𝑥 (1 − 𝑃)𝑛−𝑥
(𝑛 − 𝑥)! 𝑥!

O bien:

𝑃(𝑥, 𝑛, 𝑃) = 𝑛𝐶𝑥 𝑃 𝑥 𝑞𝑛−𝑥

Donde:

x = 0, 1, 2,.........,n

q es el complemento de P
0  P  1 para n entero
0 para cualquier otro valor

Los parámetros de la distribución binomial son n y P.

2.2 Función de distribución acumulada de la binomial

𝑭(𝒙𝒊 ) = 𝑷(𝑿 ≤ 𝒙𝒊 ) = 𝒏𝑪𝟎 𝑷𝟎 𝒒𝒏 + 𝒏𝑪𝟏 𝑷𝟏 𝒒𝒏−𝟏 + ⋯ + 𝒏𝑪𝒌 𝑷𝒌 𝒒𝒏−𝒌

2.3 Media y varianza de la Distribución Binomial

Media 𝜇 = 𝑛𝑃

Varianza 𝜎 2 = 𝑛𝑃𝑞

2.4 Calculo de distribución binomial con Minitab

Con la opción Calc > Distribuciones de probabilidad selecciona Binomial

Realiza el siguiente procedimiento:

 Elija Probabilidad para calcular la f(x) cuando P(X = x)


 Elija Probabilidad acumulada para F(x) cuando (0 ≤ x ≤ n)
 Ingresa los parámetros requeridos.
Numero de ensayos = valor de n
Probabilidad del evento = valor de P
 Columna de entrada = se deja vacía
 Elija Constante de entrada = valor de x

Nota: para F(x), si se quiere calcular la P(x ≥ 15) en la constante de entrada se escribe el
valor de 14, esto quiere decir que la F(x) calcula todos los valores acumulados que van
desde x = 0 hasta x = 14. Entonces, para calcular la probabilidad P(x ≥ 15) = 1 – P(x ≤ 14).

La figura 1 muestra el cuadro de diálogo que se presenta en una distribución binomial con
Minitab.

Figura 1. Cuadro de diálogo de la distribución binomial con Minitab

2.5 Calculo de distribución binomial con Excel

Microsoft Excel nos permite calcular la probabilidad binomial para ello, se sigue la
instrucción:

FÓRMULAS > Selecciona “insertar función fx” > en el cuadro de diálogo selecciona
“estadísticas” > busca con la barra de desplazamiento DISTR.BINOM.N y selecciona

Realiza el siguiente procedimiento:

 Núm_éxito teclea el valor de x


 Ensayos teclea el número de ensayos (n)
 Prob_éxitos teclea el valor de la probabilidad del éxito
 Acumulado escriba FALSO si es f(x) y VERDADERO si es la F(x), función de
distribución acumulada.
 Aceptar

En la figura 2 se muestra el cuadro de diálogo de la distribución de probabilidad con Excel

Figura 2. Cuadro de diálogo de la distribución binomial con Excel

Problema práctico 2.1

Se asegura que, en el 60% de todas las instalaciones fototérmicas, los gastos de servicios
se reducen al menos en una tercera parte. De acuerdo con lo anterior. ¿Cuál es la
probabilidad de que se reduzcan al menos en una tercera parte?, en:

a) Cuatro de 5 instalaciones

b) En al menos cuatro de 5 instalaciones.

Para solucionar el problema es necesario identificarlo como una distribución de probabilidad


binomial de acuerdo a sus características y sus parámetros.

Se define la variable aleatoria y se establecen los distintos valores que ella puede tomar.

Sea la variable aleatoria A = los gastos de servicios se reduzcan al menos en una tercera
parte, la cual puede tomar los valores se reduzcan al menos (≥) en una tercera parte y que
no se reduzcan cuando los valores sean menores a una tercera parte.
Para resolver el inciso a), se definen los parámetros n, P y x.

n = 5, P = 0.6 y x = 4

Ahora abrir Minitab y con la opción Calc > Distribuciones de probabilidad


selecciona Binomial

Realiza el siguiente procedimiento:

 Selecciona Probabilidad
 Ingresa los parámetros requeridos.
Numero de ensayos = valor de n que es 5
Probabilidad del evento = valor de P de 0.6
 Columna de entrada = se deja vacía
 Elija Constante de entrada = valor de x que es 4
 Da clic en Aceptar

En la pantalla de sesión del Minitab aparece el resultado de la operación expresado de la


siguiente manera:

Función de densidad de probabilidad

Binomial con n = 5 y p = 0.6

x P( X = x )
4 0.2592

Abrir el Microsoft Excel y da clic en libro en blanco, selecciona la celda donde quieras que
aparezca el resultado y sigue la siguiente instrucción:

FÓRMULAS > Insertar función fx > Estadísticas > DISTR.BINOM.N

En el cuadro de diálogo, anotar los valores que pide en cada argumento de la función:

 Núm_éxito teclea el valor de x, este es 4


 Ensayos teclea el número de ensayos, que corresponde al valor de n que es 5
 Prob_éxitos teclea el valor de la probabilidad del éxito que es igual a 0.6
 Acumulado escriba la palabra FALSO para calcular la función de probabilidad
P(X=x)
 Clic en Aceptar

Resultado se muestra en la celda es 0.2592


a) En al menos cuatro de las cinco instalaciones, esto significa que se debe de calcular la
P(x=4) y la P(x=5), por lo que se utiliza la distribución de probabilidad acumulada.
Dónde: n = 5, P = 0.6 y si se usa la F(x) la valor de la variable x = 3

Con Minitab el procedimiento es el siguiente:


 Selecciona Probabilidad acumulada
 Ingresa los parámetros requeridos.
Numero de ensayos = valor de n = 5
Probabilidad del evento = valor de P de 0.6
 Columna de entrada = se deja vacía
 Elija Constante de entrada = valor de x = 3
 Da clic en Aceptar

Resultado que se muestra en la pantalla de sesión es:

Función de densidad de probabilidad

Binomial con n = 5 y p = 0.6

x P( X = x )
3 0.66304

Este resultado corresponde a los valores de x = 0 hasta x = 3, por lo tanto, para conocer
la P(x ≥ 4) se saca su complemento por la siguiente ecuación:

P(x ≥ 4) = 1 – 0.66304 = 0.33696

Con Microsoft Excel

FÓRMULAS > Insertar función fx > Estadísticas > DISTR.BINOM.N

 Núm_éxito teclea el valor de x = 3


 Ensayos teclea el número de ensayos = 5
 Prob_éxitos teclea el valor de la probabilidad del éxito = 0.6
 Acumulado escriba VERDADERO
 Da clic en Aceptar

Resultado se muestra en la celda es de 0.66304

Para calcular la P(x ≥ 4) = 1 – 0.66304 = 0.33696


3. Distribución geométrica

El modelo geométrico surge con la misma situación básica de la binomial: Se tiene una
serie de pruebas. Con las siguientes características:

a) Consiste de un número de pruebas fijo, n, de pruebas idénticas.

b) Cada prueba tiene sólo dos posibles resultados:

Genéricamente los llamamos éxito y fracaso. Los denotamos con 1 (éxito) y 0


(fracaso).

c) Nos interesa el número de intentos hasta la cual se tiene el primer éxito.


d) El resultado de cada prueba es independiente del resultado de las demás pruebas.
e) La probabilidad de éxito no cambia de una prueba a otra, es decir, es constante en
las x-iésima pruebas.

Esta distribución es un caso especial de la Binomial, ya que se desea que ocurra un éxito
por primera y única vez en el último ensayo que se realiza del experimento, es decir la
secuencia de experimentos se termina cuando el primer éxito se presente.

3.1 Definición de distribución geométrica

Se dice que una variable aleatoria X tiene una distribución geométrica si y solo si

𝑓(𝑥) = 𝑔(𝑥, 𝑃) = 𝑃(1 − 𝑃)𝑥−1

Dónde:

P= probabilidad de éxito en cada ensayo

x= ensayos que sean necesarios para obtener un éxito, para x = 1, 2, 3,..

Lo anterior solo se cumple si y solo si:

 Las pruebas son idénticas e independientes entre sí.


 La probabilidad de éxito es P y se mantiene constante de prueba en prueba

El parámetro dela probabilidad geométrica es P


3.2 Función de distribución acumulada de la geométrica

0 𝑠𝑖 𝑥 < 0
𝑥
F(x) = P(X ≤ x) =
∑(1 − 𝑃)𝑥−1 𝑠𝑖 𝑥 ≥ 0
{ 𝑖=0

3.3 Media y Varianza de la Distribución Geométrica

1
Media E( X ) 
P

Representa el número de intentos P esperado donde ocurra el primer éxito


1 P
 
2
Varianza
P2

3.4 Calculo de distribución geométrica con Minitab

Con la opción Calc > Distribuciones de probabilidad seleccionar Geométrica

Realiza el siguiente procedimiento:

 Elija Probabilidad para calcular la f(x) cuando P(X = x)


 Elija Probabilidad acumulada para F(x) cuando (0 ≤ x ≤ n)
 Ingresa los parámetros requeridos.
Probabilidad del evento = valor de P
 Columna de entrada = se deja vacía
 Elija Constante de entrada = valor de x

Nota: para F(x), si se quiere calcular la P(x ≥ 5) en la constante de entrada se escribe el


valor de 4, esto quiere decir que la F(x) calcula todos los valores acumulados que van desde
x = 0 hasta x = 4. Entonces, para calcular la probabilidad P(x ≥ 5) = 1 – P(x ≤ 4).

La figura 3 muestra el cuadro de diálogo que se presenta en una distribución geométrica


con Minitab.
Figura 3. Cuadro de diálogo de la distribución geométrica con Minitab

Problema práctico 3.1

Sí la probabilidad de que un cierto dispositivo de medición muestre una desviación excesiva


es de 0.05, ¿cuál es la probabilidad de que; a) el sexto de estos dispositivos de medición
sometidos a prueba sea el primero en mostrar una desviación excesiva?, b) el séptimo de
estos dispositivos de medición sometidos a prueba, sea el primero que no muestre una
desviación excesiva?

Para su resolución se necesita identificar el problema como una distribución geométrica y


tomar en cuenta sus características y sus parámetros. En este caso, el parámetro es P =
0.05.

Para resolverlo con Minitab.

a) El número de pruebas es fijo y en este caso son 6.

Ahora abre Minitab y con la opción Calc > Distribuciones de probabilidad selecciona
Geométrica

Realiza el siguiente procedimiento:

 Elija Probabilidad para calcular la f(x) cuando P(X = x)


 Ingresa los parámetros requeridos.
Probabilidad del evento = el valor es de 0.05
 Columna de entrada = se deja vacía
 Elija Constante de entrada = valor de x que es 6
 Da clic en Aceptar

El resultado se muestra en la pantalla de sesión y se expresa así:

Función de densidad de probabilidad

Geométrico con p = 0.05

x P( X = x )
6 0.0386890

* NOTA * X = número total de pruebas.

b) Ahora cambia el sentido de la pregunta, que el séptimo dispositivo sometido a


prueba, sea el primero en no mostrar una desviación excesiva, por lo tanto la
probabilidad cambia, porque la probabilidad de 0.05 es para que muestre una
probabilidad excesiva, por lo tanto para que no muestre una probabilidad
excesiva es de 0.95.

El valor de x es de 7

Realiza el siguiente procedimiento:

 Elija Probabilidad para calcular la f(x) cuando P(X = x)


 Ingresa los parámetros requeridos.
Probabilidad del evento = el valor es de 0.95
 Columna de entrada = se deja vacía
 Elija Constante de entrada = valor de x que es 7
 Da clic en Aceptar

El resultado se muestra en la pantalla de sesión y se expresa así:

Función de densidad de probabilidad

Geométrico con p = 0.95

x P( X = x )
7 0.0000000

* NOTA * X = número total de pruebas.


Como la P(x=7) es un valor muy pequeño Minitab no muestra todos los dígitos. Si se
compara de manera manual queda:

P(x=7) = 1.48 x 10-8

4. Distribución de Poisson

Esta distribución es una de las más importantes distribuciones de variable discreta. Sus
principales aplicaciones hacen referencia a la modelización de situaciones en las que nos
interesa determinar el número de hechos de cierto tipo que se pueden producir en un
intervalo de tiempo o de espacio, bajo presupuestos de aleatoriedad y ciertas circunstancias
restrictivas. Otro de sus usos frecuentes es la consideración límite de procesos dicotómicos
reiterados un gran número de veces si la probabilidad de obtener un éxito es muy pequeña.

Características de la distribución Poisson


 El número medio (promedio) de eventos en el espacio temporal o región específica
de interés, por lo general esta media se representa por la lambda griega (λ).
 Sea una muestra de tamaño n bastante elevado (se suele hablar de que tiende a ∞.
 El número de resultados que ocurren en un intervalo de tiempo o región específicos
es independiente del número que ocurre en cualquier otro intervalo de tiempo o
región.
 La probabilidad de que un resultado muy pequeño ocurra en un intervalo de tiempo
muy corto o en una región pequeña es proporcional a la longitud del intervalo de
tiempo o al tamaño de la región.
 La probabilidad de que más de un resultado ocurra en un intervalo de tiempo tan
corto o en esa región tan pequeña es inapreciable, que se puede asignar el valor de
0.
 La probabilidad es constante para todos los eventos

4.1 Definición de distribución de Poisson

Sea X una variable aleatoria que representa el número de eventos aleatorios


independientes que ocurren a una rapidez constante sobre el tiempo o el espacio. Se dice
entonces que la variable aleatoria X tiene una distribución de Poisson con función de
probabilidad:

e  

 x

P( x;  )    x  0,1,2,......; 0


x! 

0 para cualquier otro valor

e = 2.7183 que es la base de los números naturales.

λ = np es una constante dada. Es el número promedio de resultados por unidad de tiempo


o región. Aquí, debido a que λ es positiva para todos los posibles valores de X.

4.2 Función de distribución acumulada de Poisson

La función de distribución acumulativa de Poisson, la cual permite determinar la


probabilidad de que una variable aleatoria de Poisson sea menor o igual a un valor
específico, tiene la siguiente forma:
𝑘
𝑒 −𝜆 𝜆𝑖
𝑃(𝑋 ≤ 𝑘) = 𝐹(𝑘, 𝜆) = ∑
𝑖!
𝑖=0

4.3 Media y Varianza de la Distribución de Poisson

Media E(X )  

Varianza  X2  

4.4 Calculo de distribución de Poisson con Minitab

Con la opción Calc > Distribuciones de probabilidad seleccionar Poisson

Realiza el siguiente procedimiento:

 Elija Probabilidad para calcular la f(x) cuando P(X = x)


 Elija Probabilidad acumulada para F(x) cuando (0 ≤ x ≤ n)
 Ingresa los parámetros requeridos.
Media = valor de λ
 Columna de entrada = se deja vacía
 Elija Constante de entrada = valor de x

Nota: para F(x), si se quiere calcular la P(x ≥ 15) en la constante de entrada se escribe el
valor de 14, esto quiere decir que la F(x) calcula todos los valores acumulados que van
desde x = 0 hasta x = 14. Entonces, para calcular la probabilidad P(x ≥ 15) = 1 – P(x ≤ 14).

La figura 4 muestra el cuadro de diálogo que se presenta en una distribución Poisson con
Minitab.

Figura 4. Cuadro de diálogo de la distribución Poisson con Minitab

4.4 Calculo de distribución de Poisson con Excel

Microsoft Excel nos permite calcular la probabilidad binomial para ello, se sigue la
instrucción:

FÓRMULAS > Selecciona “insertar función fx” > en el cuadro de diálogo selecciona
“estadísticas” > busca con la barra de desplazamiento POISSON.DIST y selecciona

Realiza el siguiente procedimiento:

 X teclea el valor de x
 Media teclea el número el valor de λ
 Acumulado escriba FALSO si es f(x) y VERDADERO si es la F(x), función de
distribución acumulada.
 Da clic en Aceptar

En la figura 5 se muestra el cuadro de diálogo de la distribución de probabilidad de Poisson


con Excel

Figura 5. Cuadro de diálogo de la distribución de Poisson con Excel

Problema práctico 4.1

Se sabe que 10 es el número promedio de camiones- tanque de aceite que llegan por día
a una cierta ciudad portuaria. Las instalaciones del puerto pueden atender cuando mucho
a 15 camiones-tanque en un día. ¿Cuál es la probabilidad de que en un determinado día
se tengan que esperar hasta el otro día los camiones tanque?

Para resolver este problema se identifica como una distribución de Poisson porque se
produce en un intervalo de tiempo y como parámetro nos da el promedio (λ).

Sea la variable aleatoria X el número de camiones tanque que llegan por día, entonces, si
se quiere calcular la probabilidad que se tengan que esperar hasta otro día el valor de x
debe ser mayor de 15, debido a que solo se pueden atender hasta quince por día.

Realiza el siguiente procedimiento:


 Elija Probabilidad acumulada para F(x) cuando (0 ≤ x ≤ n)
 Ingresa los parámetros requeridos.
Media = valor de λ = 10
 Columna de entrada = se deja vacía
 Elija Constante de entrada = valor de x =15
 Da clic en Aceptar

El resultado que nos da Minitab y la F(x) acumulados los valores que van desde x = 0
hasta x = 15, es decir, P (X ≤15).

Función de distribución acumulada

Poisson con media = 10

x P( X <= x )
15 0.951260

Para calcular la P (X > 15) se determina el complemento que es: 1 – P (X ≤ 15)

P (X > 15) = 1 – P (X ≤15) = 1 – 0.9513 = 0.0487

Por medio de Excel se realiza el siguiente procedimiento:

 X teclea el valor de x =15


 Media teclea el número el valor de λ = 10
 Acumulado escriba VERDADERO para calcular la F(x), función de distribución
acumulada.
 Da clic en Aceptar

El resultado es 0.951260 que corresponde a los valores que van de x = 0 hasta X = 15,
para sacar la P(x>16) se calcula su complemento 1 – P (X ≤15)

P (X > 15) = 1 – P (X ≤15) = 1 – 0.9513 = 0.0487

MATERIALES Y EQUIPO
Práctica impresa
Calculadora

Software Minitab 16

Microsoft Excel

Montgomery. Runger. Probabilidad y Estadística aplicadas a la Ingeniería. Editorial Limusa


Wiley. Segunda Edición.

Walpole. Myers. Myers. Probabilidad y Estadística para ingeniería y ciencias. Editorial


Pearson. Novena Edición.

PROCEDIMIENTO

Resuelva en Minitab y Excel las actividades de las distribuciones discretas de probabilidad.

Actividad 1

Un estudio de higiene industrial y seguridad hecho a largo plazo de los accidentes en una
fábrica, llevó a la gerencia a concluir que el número de accidentes por trabajador, durante
un año (X). Si el número promedio de accidentes por trabajador por año fue de 0.3,
estimar lo siguiente:

a) ¿Cuál es la probabilidad de que un trabajador seleccionado, aleatoriamente, no


tendrá un accidente durante el año siguiente?

b) ¿Cuál es la probabilidad de que un empleado seleccionado, aleatoriamente, tendrá


cuando menos 1 accidente durante el siguiente año?

c) ¿Cuál es la probabilidad de que un trabajador tendrá, exactamente, 1 accidente?

d) ¿Cuál es la probabilidad de que un trabajador seleccionado al azar de la fábrica


tendrá entre 2 y 4 accidentes, inclusivamente, el próximo año?
Actividad 2

Supóngase que el 40% de los ríos de cierta región industrial de México están contaminados
con benceno. Si tomamos una muestra aleatoria de tamaño n=30, calcular lo siguiente:

a) Exactamente 15 ríos estarán contaminados con benceno


b) Cuando menos 15 ríos estarán contaminados con este compuesto orgánico
cancerígeno, de una muestra de n=25.
c) No más de 10 ríos, pero cuando menos de 5 ríos estarán contaminados de una
muestra aleatoria de 25.

Actividad 3

En una investigación de contaminación ambiental se estudiaron cientos de industrias. Sea


X el número de industrias que no cumplen con las regulaciones ambientales de aire y del
agua de una muestra al azar de 10 industrias. Si se sabe que el valor de probabilidad es
de p=0.5, calcular las siguientes posibilidades:

a) La probabilidad de que exactamente, 5 industrias cumplan con los límites


ambientales.
b) La probabilidad de que no más de 2, cumplan con el reglamento.
c) La probabilidad de cuando menos 9, lo cumplan.
d) La probabilidad de que menos de 5 industrias cumplan, pero cuando menos 3 si lo
cumplan.

Actividad 4

En una encuesta aplicada a los habitantes de la Ciudad de México para determinar medidas
de contaminación ambiental, la cual consiste en implementar el programa de hoy no circula,
con el fin de prevenir, minimizar y controlar la emisión de contaminantes provenientes de
fuentes móviles circulantes, el 75% de los entrevistados está de acuerdo con el programa.

a) Encuentre la probabilidad que la primera persona que esté de acuerdo con el


programa de hoy no circula, se encuentre después de la quinta persona entrevistada.
b) ¿Cuántas personas se espera entrevistar hasta encontrar la primera que esté de
acuerdo con el programa de hoy no circula?
Actividad 5

Supóngase que se tiene una muestra de 20 casos de mediciones de análisis de demanda


bioquímica de oxígeno (DBO5) provenientes de un muestreo de un río, procedentes de 20
lugares diferentes a lo largo de su trayectoria. Si se sabe que, la probabilidad de que la
concentración de la demanda bioquímica de Oxígeno de 5 (DBO5) días está dentro de los
límites estipulados por las leyes ambientales es de p=0.6 (éxito), hacer los siguientes
cálculos:

a) Calcular el promedio y la desviación estándar de la variable aleatoria X binomial.


b) Calcular la probabilidad de que exactamente 10 casos de DBO estén dentro del límite
estipulado.
c) Realizar una tabla de valores de la variable aleatoria X correspondientes a x =
0,1,2,3,4……20 y calcular la probabilidad de cada una de ellas, así como la
probabilidad acumulada.

Actividad 6

Supóngase que el número X de huracanes observados en la región del Caribe, durante


los últimos 3 años tienen en promedio de λ = µ = 8. Calcular las siguientes probabilidades:

a) La probabilidad de que ocurran a lo más 8 huracanes.

b) La probabilidad de que ocurran exactamente 8 huracanes.

c) La probabilidad de que ocurran cuando menos 9 huracanes.

d) La probabilidad de que ocurran entre 5 y 8 huracanes.

e) La probabilidad de que ocurran a lo más 8 huracanes, pero más de 5.

f) La probabilidad de que ocurran más de 2 huracanes

Actividad 7

La probabilidad de que una muestra de aire contenga una molécula rara es de 0.01 si se
supone que las muestras son independientes con respecto a la molécula rara.

¿Cuál es la probabilidad que sea necesario analizar 125 muestras antes de detectar una
molécula rara?
Actividad 8

En un estudio de contaminación del aire, en las terminales camiones de carga, se sabe que
el número promedio de camiones que llegan diariamente, a una terminal de camiones
de carga es de 3. Para que los complejos habitacionales no se contaminen con los humos
de los camiones, se restringe el número de camiones que arriban y se establece un límite
de no más de 8 por día. Hacer una gráfica con los resultados y calcular lo siguiente:

a) La probabilidad de que se les niegue la entrada a los camiones cuando el


número exceda 8.

b) La probabilidad de que arriben entre 2 y 4 camiones, incluso.

c) La probabilidad de que no arribe ningún camión.

Actividad 9

Los contenedores de residuos peligrosos químicos no deben manejarse o almacenarse de


forma que se puedan derramar o romper, por tal motivo se realizó una visita a una industria
química para revisar los contenedores de polietileno (HDPE) de 5 galones, encontrando
que el 5 % de los contenedores derraman más de 500 ml de residuos peligrosos. Se define
una variable aleatoria X: “la cantidad de contenedores revisados hasta obtener el primero
que derrame residuos peligrosos”. Considere que la revisión se realiza de forma
independiente para cada contenedor.

a) Calcule la probabilidad de que el primer contenedor que derrame residuos peligrosos


se encuentre después del quinceavo contenedor revisado.
b) Que contenedor revisado se espera sea el primero que derrame residuos peligrosos.

Actividad 10

Supóngase que en un estudio de contaminación ambiental se instala una red de 3,840


sensores de alto volumen para medir las concentraciones de partículas atmosféricas,
menores que 10 micras. Si la probabilidad de que cualesquiera de estos muestreadores
falle es de 0 .00083 durante un año, entonces, determinar las probabilidades de que 0,
1, 2, 3, 4,… de los muestreadores fallen durante el año en cuestión
SUGERENCIAS DIDÁCTICAS
Realizar un cuadro sinóptico para cada distribución donde se identifiquen sus
características, parámetros y fórmulas.

Resolver cada una de las actividades con la utilización de fórmulas y a través de tablas de
distribución con el objetivo de comparar resultados.

Discutir los resultados de las actividades, argumentando alternativas de solución, errores


de aplicación de criterios, interpretación de la información y resultados, así como posibles
mejoras.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 8 Distribución normal con Minitab
Ambiental

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Resolver problemas con ejercicios de distribución normal con


el uso de Minitab.

INTRODUCCIÓN

La distribución normal es una muy importante distribución continua de probabilidad.

Una variable Aleatoria Continua es aquella que puede asumir un número infinitamente
grande de valores correspondientes a los puntos sobre un intervalo en una línea recta.

Varios matemáticos intervinieron en su desarrollo entre ellos figura el astrónomo del siglo
XVIII Karl Gauss, a veces es llamada en su honor la distribución de Gauss.

La importancia de la distribución normal se debe principalmente a que hay muchas variables


asociadas a fenómenos naturales que siguen el modelo de la normal.

 Caracteres morfológicos de individuos (personas, animales, plantas,...) de una


especie, por ejemplo: tallas, pesos, envergaduras, diámetros, perímetros,...

 Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o


de una misma cantidad de abono.
 Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo
grupo de individuos, puntuaciones de examen.

 Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un


medio, entre otros.

1. Definición de distribución normal


Una variable aleatoria X se dice que es continua si, su conjunto de valores
posibles es un intervalo completo de números, esto es, si por a < b cualquier
número X entre a y b es posible. En términos simples, la variable aleatoria X se
define, como la variable aleatoria que contiene un intervalo finito o infinito de
números reales

Características de la distribución normal de la probabilidad.

1. La curva tiene un solo pico, por consiguiente es unimodal. Presenta una forma de
campana., es asintótica al eje de las abscisas (para x =  )

2. La media de una población distribuida normalmente se encuentra en el centro de su curva


normal.

3. A causa de la simetría de la distribución normal de probabilidad, la mediana y la moda


de la distribución también se hallan en el centro, por tanto en una curva normal, la media,
la mediana y la moda poseen el mismo valor.

4. Las dos colas (extremos) de una distribución normal de probabilidad se extienden de


manera indefinida y nunca tocan el eje horizontal. Los puntos de inflexión tienen como

abscisas los valores   .


Las distribuciones que siguen una binomial o una distribución de Poisson se pueden
aproximar a una distribución normal.

Por ejemplo, en la figura 1 se muestra la gráfica de una distribución normal, dónde,


aproximadamente, el 68% de las observaciones está dentro de +/- 1 desviación estándar
de la media; el 95% está dentro de +/- 2 desviaciones estándar de la media (como muestra
el área sombreada); y el 99.7% está dentro de +/- 3 desviaciones estándar de la media.

Figura 1. Curva de la distribución normal

2. Función de densidad de la distribución normal.

Una variable aleatoria continua, X, sigue una distribución normal de media ( µ ) y desviación
típi a ( σ ), y se designa por N(µ, σ), se si cumplen las siguientes condiciones:

a) La variable puede tomar cualquier valor: (-∞, +∞)


b) La función de densidad, es la expresión en términos de ecuación matemática de la
curva de Gauss:

1 1 𝑥−𝜇 2
− ( )
𝑓(𝑥) = 𝑒 2 𝜎 𝑝𝑎𝑟𝑎 − ∞ ≤ 𝑥 ≤ +∞
𝜎√2𝜋
Donde:

 (media) y  (desviación típica) son parámetros de la distribución

e = 2.718 (base de Ln)

x = valores observados de la variable en estudio

Por lo tanto depende de dos parámetros:

Media (µ), que determina el centro de la función de densidad


Desviación típica (σ), que determina la dispersión.

3. Función de distribución acumulada para la normal.

Asimismo, la función de distribución acumulada de cualquier variable aleatoria X, se define


como:

F(x0 )= P(X < x0)

Es decir la probabilidad de que dicha variable tome un valor menor que x0.
Matemáticamente esta función de distribución coincide con la integral de la función de
densidad desde -∞ hasta el valor de x0.

La probabilidad de que X se sitúe en un intervalo [a, b] (abierto en a y cerrado en b) es:

F(b) − F(a) si a ≤ b.

4. Distribución normal estandarizada

La distribución normal que tiene de media μ=0, y σ2 =1 se denomina distribución normal


estándar, N(0,1), o tipificada. Su función de distribución se encuentra tabulada, siendo de
gran utilidad para el cálculo de probabilidades de cualquier distribución N(μ,σ2 ). Sea una
variable X que se distribuye como una normal con media μ y variancia σ2.

Dicha variable se puede transformar en una variable normal tipi!cada, N(0,1), mediante la
siguiente expresión:

x
Z

De manera que la función de densidad de esta nueva variable es:

1 𝑧2
−( )
𝑓(𝑍) = 𝑒 2
𝜎√2𝜋

A partir de dicha expresión, las tablas de la distribución normal presentan los valores de o
probabilidad de que la variable Z tome un valor inferior a z0.
𝑧0

𝐹(𝑍) = ∫ 𝑓(𝑍)𝑑
−∞

Las fórmulas más importantes para el cálculo de probabilidades de una N(0,1) son las
siguientes:

P(Z ≥ z) = 1 – F(z)

P(Z ≤ -z) = (Z ≥ z)

P(za ≤ Z ≥ zb) = F(zb) – F(za)

De forma que si se quiere obtener la probabilidad de que X se encuentre entre dos valores,
𝑥−𝜇
xa y xb, primero se tipifican dichos valores con la expresión de 𝑍 = 𝜎
, y después se

buscaría en las tablas de la distribución normal la probabilidad acumulada para esos dos
nuevos valores, za y zb . De manera que:

P(xa ≤ X ≤ xb) = P(za ≤ Z ≤ zb) = F(zb) – F(za)

5. Calculo de distribución normal con Minitab

Existen dos maneras para calcular la distribución normal, una es con la opción Calc y la
otra es a través de la opción Gráficas. En la primera opción solamente se obtiene el
resultado de la probabilidad y hacer cada operación por separado si se trata de un intervalo.
La segunda opción es más completa porque nos permite obtener la gráfica con su área
sombreada y el resultado de la probabilidad, además, hay dos procedimientos uno para
calcular los valores de x y el otro procedimiento para obtener la probabilidad.

5.1 Con la opción Calc > Distribuciones de probabilidad selecciona Normal

Realiza el siguiente procedimiento:

 Elija Probabilidad para calcular la f(x) cuando P(X = x)


 Elija Probabilidad acumulada para F(x) cuando (X ≤ x0)
 Ingresa los parámetros requeridos.
Media = valor de µ
Desviación estándar = valor de σ
 Columna de entrada = se deja vacía
 Elija Constante de entrada = valor de x

Nota: para F(x), si se quiere calcular la P(x ≥ 15) en la constante de entrada se escribe el
valor de 14, esto quiere decir que la F(x) calcula todos los valores acumulados que van
desde x = 0 hasta x = 14. Entonces, para calcular la probabilidad P(x ≥ 15) = 1 – P(x ≤ 14).

La figura 2 muestra el cuadro de diálogo que se presenta en una distribución normal con el
Minitab.

Figura 2. Cuadro de diálogo de la distribución normal con Minitab

5.2 Con la opción de Gráfica de distribución de probabilidad con región sombreada

Con esta opción podemos visualizar el área sombreada bajo la curva y así poder interpretar
nuestros resultados.

Ahora la opción es:

Gráfica > Gráfica de distribución de probabilidad

En el cuadro de gráficas nos aparecen cuatro opciones de gráficas como se muestra en la


figura 3, selecciona ver probabilidad y da clic en aceptar.
Figura 3. Cuadro de gráficas de distribución de
probabilidad.

Al dar aceptar nos muestra el siguiente cuadro de diálogo (figura 4) y realiza la siguiente
instrucción:

 En Media, escriba el valor de µ


 En Desviación estándar, escriba el valor de σ
 Haga clic en la ficha Área sombreada.

Figura 4. Cuadro de diálogo de la gráfica de probabilidad

Al seleccionar área sombreada nos aparece otro cuadro de diálogo para definir el valor
de x o el valor de probabilidad dependiendo de lo que se quiera calcular (figura 5).
Figura 5. Cuadro de diálogo para definir el valor de X

El procedimiento para calcular la probabilidad del valor de x es el siguiente:

 Selecciona el Valor X.
 Da clic en alguna de las colas dependiendo del valor de la media y el valor de X,
por ejemplo si la media es 4 y el valor de x es 6, entonces se selecciona la cola
derecha, porque el valor de x ex mayor que la media.
 En Valor X, ingrese su valor
 Haga clic en Aceptar.

El resultado se muestra en una gráfica con el área sombreada, con el valor de la


media, a desviación estándar y el valor de la probabilidad, ver figura 6.
Valor de
P

Figura 6. Gráfica de los resultados de la distribución normal de


probabilidad

El procedimiento para calcular el valor de x al conocer la probabilidad es:

 Selecciona Probabilidad.
 Da clic en alguna de las colas dependiendo del valor de probabilidad, por
ejemplo si se tiene una media de 1.5, una desviación estándar de 0.2 y se quiere
conocer el valor de x que cubra el 95%, la probabilidad es de 0.95. Aquí se
selecciona la cola izquierda, para que sombree el 95% de la gráfica.
 En Probabilidad, ingresa el valor de P.
 Haga clic en Aceptar.

El resultado se muestra en una gráfica con el área sombreada, con el valor de la


media, a desviación estándar y el valor de la probabilidad, ver figura 7.
Valor de x

Figura 7. Gráfica de los resultados del valor de x en la


distribución normal de probabilidad.

Finalmente se procede a interpretar los resultados.

6. problemas para encontrar el área bajo la curva de un distribución normal


estándar

Problema práctico 6.1

a) ¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?

b) ¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y +2.03?


c) Hallar P (0.34 < z < 2.30)

7. Problemas para calcular las probabilidades para cualquier variable normal


distribuida usando Minitab

Problema práctico 7.1

En una investigación de higiene industrial y seguridad, relacionada con un proceso industrial,


se requiere una aptitud mental muy alta. Para esto, los trabajadores se sometieron a una
prueba del coeficiente de intelecto (IQ). Si se saca una muestra al azar que da 𝑋̅ = 120
puntos y S = 20 puntos,

a) ¿Cuál es la probabilidad de que un trabajador seleccionado tendrá un valor de


coeficiente de intelecto que esté entre 80 y 140 puntos?
b) Se desea clasificar a los examinados en tres grupos (de baja intelecto, de intelecto
aceptable, de excelente intelecto) de modo que hay en el primero un 20% la
población, un 65% el segundo y un 15% en el tercero. ¿Cuáles han de ser las
puntuaciones que marcan el paso de un grupo al otro?

a) En este inciso de distribución normal se quiere calcular la probabilidad de un intervalo


que va de (80 ≤ X ≤ 140), con una 𝑋̅ = 120 puntos y S = 20 puntos. Por lo tanto, el valor
de x esta entre 80 y 140.

Para calcular con Minitab se utilizará la opción de Gráficas.

El procedimiento es el siguiente:

Abrir Minitab, selecciona Gráfica > Gráficas de distribución de probabilidad > ver
probabilidad > Aceptar

Introduzca los valores:

Media = 120

Desviación estándar = 20

Posteriormente selecciona Área sombreada

Da clic en Valor X

Selecciona el gráfico que dice centro, porque se tiene un intervalo que va de 80 a 140.

Introduzca el valor X1 = 80 y X2 = 140.

Da Aceptar

El resultado del gráfico se muestra en la figura 8, donde la P(80 ≤ x ≤ 140) = 0.8186:

Figura 8. Resultado del gráfico dónde la P( 80 ≤ x ≤ 140)


Por lo tanto, el área total o la probabilidad requerida es igual a 0.8186. Esto dice que, cerca
del 82% de la población tiene un IQ de esta prueba del intelecto que está entre 80 y 140
puntos.

b) Para clasificar a los examinados en tres grupos, se tiene que el 0.20 es de bajo intelecto,
el 0.65 aceptable y el 0.15 con un intelecto aceptable.
Para conocer el valor de x que marca el paso de un grupo a otro, se sigue el siguiente
procedimiento:
Nuevamente en Gráficas > Gráfica de distribución de probabilidad > Ver probabilidad y
Aceptar
En el cuadro de diálogo ya aparece por default el valor de media y desviación estándar
que se introdujeron al calcular el inciso a, así que:
Selecciona Área sombreada
Defina Probabilidad
Selecciona el gráfico que dice centro. En este ejercicio se toman los dos valores de P
que nos dan la marca para cada grupo, que es P = 0.20 y P = 0.15.
En la gráfica de la figura 9 se muestra el área sombreada y los valores de x, para cada
marca del grupo de intelectos.

Aceptable
Intelecto

Bajo Excelente
Intelecto Intelecto

Figura 9. Gráfica de los resultados obtenidos para definir las


marcas de cada grupo de intelectos.
La interpretación de los resultados de acuerdo a la gráfica, se pueden clasificar a los tres
grupos de la siguiente manera:

Bajo intelecto < de 103 puntos.

Intelecto aceptable entre 103 a 141 puntos

Excelente intelecto > de 141 puntos

Problema práctico 7.2

Se utilizan medidores para rechazar todos los componentes cuyas dimensiones no se


encuentren dentro de la especificación 1.50±d. Se sabe que ésta dimensión es
normalmente distribuida con una media de 1.50 y una desviación estándar de 0.2.
Determine el valor d para que la especificación “cubra” el 95% de las mediciones.

Sí las dimensiones de los medidores están dentro especificación 1.50±d, se tiene que
buscar el valor de +d y –d y que cubra el 95% de la especificación, entonces se
visualiza un gráfico de dos colas.

Abrir Minitab y realiza el siguiente procedimiento:

Gráficas > Gráfica de distribución de probabilidad > ver probabilidad y aceptar

Introduzca los valores de la media de 1.5 y de desviación estándar de 0.2

Da clic en Área sombreada

Selecciona Probabilidad

Selecciona el gráfico de Ambas colas

Introduzca el valor de probabilidad de 0.05

Da clic en Aceptar

En la figura 10 se muestran los resultados en el gráfico para su interpretación


Figura 10. Gráfica de los resultados obtenidos para cubrir el 95% de
la dimensión 1.5 ∓d

Para – d = 1.108 y para +d = 1.892, por lo tanto:

Se van a rechazar los medidores que estén por debajo de 1.108 o por encima de1.892.

MATERIALES Y EQUIPO
Calculadora

Software Minitab 16

Microsoft Excel

Montgomery. Runger. Probabilidad y Estadística aplicadas a la Ingeniería. Editorial Limusa


Wiley. Segunda Edición.

Walpole. Myers. Myers. Probabilidad y Estadística para ingeniería y ciencias. Editorial


Pearson. Novena Edición.
PROCEDIMIENTO

Resuelva en Minitab las actividades de la distribución normal de probabilidad e interpreta


los resultados mediante el gráfico.

Actividad 1

En cierta especie de aves, se ha detectado una contaminación apreciable de mercurio (Hg)


en sangre. La concentración de mercurio en sangre está distribuida normalmente con media
0.25 ppm (partes de Hg por millón, en plasma) y desviación típica 0.08 ppm.

a) ¿Cuál es la probabilidad de que un ave presente un nivel de mercurio en sangre


superior a 0.40 ppm?

b) ¿Cuál es la probabilidad de que un ave tenga un nivel de mercurio en sangre entre


0.20 y 0.50 ppm?

c) ¿Cuál es el nivel máximo de concentración de mercurio en sangre del 40% de las aves
menos contaminadas?

d) Generar una muestra de tamaño 10.

Actividad 2

Si una muestra aleatoria de una población normal de intensidades de viento, en m/segundo,


tiene un promedio de 10 m/seg y una varianza de 4:
a) ¿Qué porcentaje y/o probabilidad de las intensidades del viento caen entre 9 y 14
m/seg.?
b) ¿Entre 13 y 15?

Actividad 3

Una de las mayores contribuciones a la contaminación atmosférica es la provocada por los


hidrocarburos procedentes de los tubos de escape de los automóviles. Sea X los gramos
de hidrocarburo emitidos por un automóvil por cada dos kilómetros. Supongamos que X es
Normal con una media de 1 gr. y una desviación típica de 0.25 gr. Calcular las siguientes
probabilidades:

a) Un automóvil emita más de 1.5 gr.

b) Un automóvil emita menos de 1.2 gr.

c) Un automóvil emita entre 1.3 y 1.4 gr.

d) Un automóvil emita más de 0.65 gr.

e) Un automóvil emita entre 0.4 y 0.7 gr.

Actividad 4

Sea X la cantidad de radiación que puede ser absorbida por un individuo antes de que le
sobrevenga la muerte. Supongamos que X es Normal con una media de 500 roentgen y
una desviación típica de 150 roentgen.

a) ¿Por encima de qué nivel de dosificación sobreviviría solamente el 5% de los expuestos?


b) ¿Cuál es el porcentaje de supervivientes para un nivel de radiación de 800 roentgen?

Actividad 5

La vida promedio de cierto motor pequeño es de 10 años, con una desviación estándar de
2 años. El fabricante reemplaza gratis todos los motores que fallen dentro del periodo de
garantía. Si estuviera dispuesto a reemplazar sólo el 3% de los motores que fallen, ¿cuánto
tiempo en garantía debería ofrecer? Suponga que la duración de un motor tiene una
distribución normal.

Actividad 6

El consumo medio bimestral de energía eléctrica en una ciudad es de 59 Kwh., con una
desviación típica de 6 Kwh. Se supone que se distribuye según una distribución normal.

a) ¿Cuántos Kwh. tendría que consumir bimestralmente para pertenecer al 5% de la


población que más consume?
b) Si usted consume 45 Kwh ¿Qué porcentaje de la población consume menos que
usted?
SUGERENCIAS DIDÁCTICAS
Resolver las actividades con la utilización de fórmulas y a través de tablas de distribución
con el objetivo de comparar resultados.

Discutir los resultados de las actividades, argumentando alternativas de solución, errores


de aplicación de criterios, interpretación de la información y resultados, así como posibles
mejoras.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 9 Distribuciones continuas con
Ambiental MINITAB

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Resolver problemas con ejercicios de modelos de continuos de


probabilidad Weibull, t-Student, X2 y F con el uso de Minitab o Excel

INTRODUCCIÓN

Definición de variable aleatoria continua

“Es la que puede tomar cualquier valor fraccionario en un rango determinado de valores”

Es decir, si toma valores en un conjunto infinito no numerable. Como existe un número


infinito de posibles mediciones fraccionarias, no pueden enlistarse todos los valores
posibles con una probabilidad correspondiente.

En lugar de trabajar con la probabilidad de valores particulares de la variable, resulta más


apropiado calcular probabilidades asociadas a intervalos.

Las variables aleatorias que pueden tomar cualquier valor de un intervalo real de la forma
(a, b), (a, +∞), (- ∞, b), (- ∞, + ∞) o uniones de ellos se les denomina variables aleatorias
continuas.
La razón de utilizar intervalos, es debido a que en las variables continuas la probabilidad de
que una variable tome cualquier valor concreto es 0.

1. Distribución Weibull

La distribución de Weibull complementa a la distribución exponencial y a la normal, se usa


cuando se sabe de antemano que una de ellas es la que mejor describe la distribución de
fallos o cuando se han producido muchos fallos (al menos 10) y los tiempos
correspondientes no se ajustan a una distribución más simple.

Fue establecida por el físico suizo Weibull quien demostró que el esfuerzo al que se
someten los materiales puede modelarse de manera adecuada mediante el empleo de esta
distribución. También. Se ha usado para modelar situaciones del tipo tiempo- falla, o bien
puede indicar la vida útil de cierto artículo, planta o animal, confiabilidad de un componente,
pero uno de los grandes usos es con la descripción de las variaciones de viento. Esto es
muy importante para la industria eólica, ya que permite diseñar turbinas.

1.1 Función de densidad de distribución Weibull

Se dice que X es una variable aleatoria con distribución Weibull sí:

   1 ( x /  ) 
 x e x 0 
f ( x;  ,  )     
0 x  0 

Donde α > 0 es el parámetro de forma y β >0 es el parámetro de escala de la distribución.

1.2 Función de distribución acumulada

La ecuación para la función de distribución acumulada de Weibull es:

F x,  ,   1  e x  

Los parámetros de esta distribución permiten gran flexibilidad para modelizar sistemas en
los que el número de fallos aumenta con el tiempo (por ejemplo, el desgaste), disminuye
con el tiempo (algunos semiconductores) o permanece constante (fallos provocados por
causas externas al sistema).
1.3 Propiedades de la distribución Weibull

 Si tomamos α =1 tenemos una distribución exponencial

 Su esperanza matemática (media) es:

1
𝐸(𝑋) = 𝛼 Γ ( + 1)
𝛽

 Su varianza es:
2
2 2
2 1
𝜎 = 𝛼 {Γ ( + 1) − [Γ ( + 1)] }
𝛽 𝛽

Dónde Γ representa a la función Gamma de Euler

Problema práctico 1.1

Asuma que la vida de una lámpara fluorescente sigue una distribución Weibull con los
parámetros de forma (α) 2 horas y el parámetro de escala (β) de 10000.

a) Determine la probabilidad de que la lámpara dure al menos 8000 horas.

Para resolver el problema con el uso de Excel

Fórmulas > Insertar función fx > Estadísticas > DISTR.WEIBULL

Siga el siguiente procedimiento:

X anota el valor de X que es de 8000

Alfa anota el parámetro de forma cuyo valor es de 2

Beta anota el parámetro de escala que es 10000

Acumulado escriba VERDADERO, ya que devuelve el valor acumulado que va desde los
valores de x = 0 hasta el valor de x = 8000.

En la figura 1 muestra la introducción de los datos en Excel.


Figura 1. Cuadro de diálogo de los argumentos de la función
de distribución Weibull.

El resultado de P(x≤ 8000) = 0.4727, pero como se desea calcular que las lámparas duren
por lo menos 8000 horas se calcula el complemento.

P(x ≥ 8000) = 1 – p(x ≤ 8000) = 1 – 0.4727 = 0.5273

Con la utilización de Minitab existen dos opciones para resolverlo:

Opción 1: Calc > Distribuciones de Probabilidad > Weibull

Para la introducción de datos se realiza el siguiente procedimiento:

 Selecciona Probabilidad acumulada, ya que se va a calcular la P(x ≥ 8000)


 Parámetro de forma anotar el valor de 2
 Parámetro de escala es 10000
 Parámetro de umbral se deja igual
 Selecciona Constante de entrada y anota el valor de x que es 8000
 Da clic en Aceptar

En la figura 2 se muestra el cuadro de diálogo para la introducción de datos


Figura 2. Cuadro de diálogo para Distribución Weibull

El resultado se muestra en la hoja de sesión de la siguiente manera:

Función de distribución acumulada

Weibull con forma = 2 y escala = 10000

x P( X <= x )
8000 0.472708

Para calcular P(x ≥ 8000) = 1 – p(x ≤ 8000) = 1 – 0.4727 = 0.5273

Opción 2: Gráfica > Gráficas de distribución de probabilidad > Ver probabilidad >
Aceptar

El procedimiento a realizar es el siguiente:

Distribución: selecciona Weibull

Forma: anota el valor de este parámetro que es 2

Escala: anota el parámetro de escala, 10000

Valor umbral: Se deja igual


Selecciona Área sombreada

En el segundo cuadro de diálogo que aparece realiza lo siguiente:

 Definir área sombreada


 Selecciona el valor de x
 Selecciona cola derecha para que muestre el área sombreada para la P(x ≥ 8000)
 Valor de X introduzca el valor de 8000
 Aceptar

En la figura 3 se muestra el resultado de la probabilidad en la gráfica de distribución Weibull.

Figura 3. Gráfico de los resultados de la distribución


de Weibull

2. Distribución de probabilidad t-Student

En probabilidad y estadística, la distribución t (de Student) es una distribución de


probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño. Surge, en la mayoría de los
estudios estadísticos prácticos, cuando la desviación típica de una población se desconoce
y debe ser estimada a partir de los datos de una muestra.

Para n < 30 que son las llamadas muestras pequeñas, el estadístico t es el apropiado.

Se llama distribución t de Student, por ser su descubridor Gosset, que publicó sus trabajos
con el seudónimo de “student” a principios del siglo XX.
Cuando n ≥ 30, la distribución t se aproxima a la distribución normal.

En este tipo de distribución se necesita un nuevo concepto que son los “grados de
libertad”, que se calculan por la fórmula:

g.l. = número de mediciones -1 = n -1

2.1 Función de densidad de la distribución t-Student

Una variable aleatoria se distribuye según el modelo de probabilidad t o t-Student con k


grados de libertad, donde k es un número entero positivo.

𝜈+1 −
(𝜈+1)⁄
Γ( 2 ) 𝑡2 2
𝑓(𝑥) = (1 + ) , −∞ < 𝑡 < +∞
Γ(𝜈⁄2)√𝑘𝜋 𝜈

Esto se conoce con distribución t con 𝜈 grados de libertad

Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con
𝑥̅ − 𝜇
media (µ) y desviación estándar (σ). Entonces la variable aleatoria 𝑡 = 𝑆⁄ tiene una
√𝑛

distribución t con 𝜈 = n-1 grados de libertad.

La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra


y siempre es mayor a uno. Únicamente cuando el tamaño de la muestra tiende a infinito las
dos distribuciones serán las mismas.

Se acostumbra representar con 𝑡𝛼 el valor t por arriba del cual se encuentra un área igual
a 𝛼. Como la distribución t es simétrica alrededor de una media de cero, se tiene que 𝑡1−𝛼 =
−𝑡𝛼 ; es decir, el valor t que deja un área de 1 − 𝛼 a la derecha y por tanto un área de 𝛼 a la
izquierda, es igual al valor t negativo que deja un área de 𝛼 en la cola derecha de la
distribución. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc.

Su gráfico es (figura 4):


Figura 4. Gráfico de distribución t-Student

Características:

1. La gráfica de la función de densidad es en forma de campana (simétrica)

2. La media (μ) está en el centro de la distribución, por lo tanto es 0

3. Su varianza, n > 2

4. El área bajo la curva t es igual a 1.

5. Cuando n ≥ 30 t = Z

6. Cuando los grados de libertad son altos, los valores de t coinciden con los de la normal.

2.2 Media y varianza para la distribución t

Valor esperado: 0 para k > 1


𝜈
Varianza: 𝜈−2
para k > 2

2.3 Procedimiento para calcular de los valores críticos de t (ttabulada) con Minitab

Problema práctico 2.1


El valor t con 𝜈 = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto
un área de 0.975 a la derecha, es:

Para calcular el valor de críticos de t (ttabulada) se utiliza el siguiente procedimiento:

Gráfica > Gráficas de distribución de probabilidad > Ver probabilidad > Aceptar

El procedimiento a realizar es el siguiente:

Distribución: selecciona “t”

Grados de libertad: anota el valor de este parámetro que es 14

Selecciona Área sombreada

En el segundo cuadro de diálogo que aparece realiza lo siguiente:

 Definir área sombreada


 Selecciona Probabilidad
 Selecciona Cola izquierda, ya que se quiere calcular la parte izquierda del gráfico.
 Probabilidad introduzca el valor de P que es de 0.025
 Da Aceptar

A continuación Minitab da como resultado el gráfico con los valores críticos de t (ver figura
5)

Figura 5. Resultados de t de tablas representado


gráficamente.
Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto
que se tiene que hacer la resta de 1-.

Problema práctico 2.2

Encuentre la probabilidad de –t0.005 < t < -t0.05, con 14 grados de libertad.

Para calcular el valor de críticos de t, se utiliza el siguiente procedimiento:

Gráfica > Gráficas de distribución de probabilidad > Ver probabilidad > Aceptar

El procedimiento a realizar es el siguiente:

Distribución: selecciona “t”

Grados de libertad: anota el valor de este parámetro que es 14

Selecciona Área sombreada

En el segundo cuadro de diálogo que aparece realiza lo siguiente:

 Definir área sombreada


 Selecciona Probabilidad
 Selecciona Centro, porque los valores de  (probabilidad) es diferente, pero negativas.
 Probabilidad introduzca el valor de Probabilidad 1: el valor de  de 0.005 y en
Probabilidad 2: el valor de 1- = 1-0.05=0.95
 Da Aceptar

El resultado se muestra en la figura 6 que corresponde a la gráfica de P(-t0.005 < t <-t0.05) que
corresponden a t1 = -2.977 y t2 = -1.761
Figura 6. Resultado de los valores de t de tablas de P(-t0.025 < t
<t0.05), representado gráficamente.

Por lo tanto, P(-2.977 < t < -1.761) = 0.045

𝑥̅ − 𝜇
2.4 Procedimiento con Minitab para obtener tcalculada con la formula 𝑡 = 𝑆⁄
√𝑛

Problema práctico 2.3

En 16 recorridos de prueba de una hora cada uno, el consumo de gasolina de un motor es


de 16.4 gal, con una desviación estándar de 5.1 gal. Demuestre que la afirmación que el
consumo promedio de gasolina de este motor es 12.0 gal/hora con α=5%.

Primeramente se obtienen los valores de ttabulada con el siguiente procedimiento:

Gráfica > Gráfica de Distribución de probabilidad > Ver probabilidad >Aceptar

Distribución: Selecciona t

Grados de Libertad: Teclea 15

Selecciona Área sombreada

Definir área sombreada por selecciona Probabilidad

Da clic en cola derecha, porque el valor de la media muestral es mayor que la poblacional
Probabilidad: 0.05 que corresponde al valor de  = 5%

Aceptar

La figura 7 muestra el gráfico con el valor de ttabulada = 1.753

Figura 7. Gráfico con los valores críticos de t de  = 0.05

Posteriormente obtener tcalculada a través de la fórmula:

Sí n = 16, μ = 12.0, x 16.4 y s= 5.1 en la fórmula de t-Student, se tiene

x   16.4  12.0
t   3.45
s n 5.1 16

Comparando los valores de ttabulada (1.753)con los de tcalculada (3.45) se puede concluir que el
consumo de 12 al/ es real.

Si se desea obtener la probabilidad, se puede realizar el siguiente procedimiento con


Minitab por dos opciones:

Opción 1: Calc > Distribuciones de probabilidad > t

En el cuadro de diálogo realiza el procedimiento:

Selecciona Probabilidad acumulada

Grados de libertad: 15

Selecciona Constante de entrada: introduzca el valor de t calculada que es 3.45


Aceptar

En la hoja de sesión nos da el resultado de P(t ≤ 3.45)

Función de distribución acumulada

Distribución t de Student con 15 GL

x P( X <= x )

3.45 0.998214

Como se desea calcula la P(t ≥ 3.45), se calcula como el complemento.

P(t ≥ 3.45) = 1 - P(t ≤ 3.45) = 1 – 0.998 = 0.002

Opción 2: Gráfica > Grafica de distribución de probabilidad > ver probabilidad >
aceptar

Distribución: Selecciona t

Grados de Libertad: Teclea 15

Selecciona Área sombreada

Definir área sombreada por selecciona Valor de X

Da clic en cola derecha, porque el valor de la media muestral es mayor que la poblacional

Valor X: 3.45

Aceptar

La figura 8 muestra el gráfico con el valor de P(t ≥ 3.45)= 0.001786


Figura 8. Gráfica de distribución t con P(t ≥ 3.45)

El valor de la probabilidad es de 0.0018, por tanto se puede concluir que el consumo de 12


gal/h es real.

3. Distribución de Probabilidad Chi-cuadrada

Esta distribución es estadísticamente aplicada. Entre otros usos, sirve de base para
elaborar inferencias sobre la varianza de una población basada en una muestra.

En realidad la distribución Chi-cuadrada es la distribución muestral de s2. O sea que si se


extraen todas las muestras posibles de una población normal y a cada muestra se le calcula
su varianza, se obtendrá la distribución muestral de varianzas.

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el


estadístico X2. Si se elige una muestra de tamaño n de una población normal con varianza
σ2, el estadístico:

n  1S 2
2
Tiene una distribución muestral que es una distribución Chi-cuadrada con g..l = n - 1 grados
de libertad y se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada
está dado por:
X2 
n  1S 2
2
Donde n es el tamaño de la muestra, S2 la varianza muestral y σ2 la varianza de la población
de donde se extrajo la muestra. El estadístico Chi-cuadrada también se puede dar con la
siguiente expresión:

 x  x 
2

X 2

2
Propiedades de las distribuciones ji-cuadrada

1. Los valores de X2 son mayores o iguales que 0.

2. La forma de una distribución X2 depende del g.l. = n - 1. En consecuencia, hay un número


infinito de distribuciones X2.

3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.

4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la


derecha; esto es, están sesgadas a la derecha.

5. Cuando n > 2, la media de una distribución X2 es n - 1 y la varianza es 2(n - 1).

6. El valor modal de una distribución X2 se da en el valor (n - 3).

La figura 9 ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n - 3)
= (g.l.- 2).

Figura 9. Tres distribuciones X2 con


diferentes grados de libertad
3.1 Función de densidad de la distribución X2

La función de densidad de la distribución X2 está dada por:

 1 
 x x  0
  1e 2



f ( x)   
2  2
2  
 x 2 

 
 0 x0 

El parámetro 𝜈 se llama número de grados de libertad (g.l.) de X. El Símbolo X 2 se usa a


veces en lugar de “Chi-cuadrada”.

3.2 Cómo calcular los valores X2 en tablas

La tabla que se utilizará para esta práctica es la del libro de probabilidad y estadística de
Walpole, la cual da valores críticos 𝑋𝛼2 (g.l.) para veinte valores especiales de α. Para
denotar el valor crítico de una distribución X2 con gl grados de libertad se usa el símbolo 𝑋𝛼2
(gl); este valor crítico determina a su derecha un área de α bajo la curva X2 y sobre el eje
horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en el lado
izquierdo y   0.05 a o largo del lado superior de la misma tabla.
Problema práctico 3.1

Utilizando la tabla de Y2 y la figura 10 que a continuación se indica. Encuentre los valores


de Y2 para:

Figura 10. Gráfica de distribución Y2

a) g.l. = 10 y el área sombreada en el extremo de la derecha sea 0.05.

Buscando en tablas Y2= (g.l.,α) = 10, 0.05 = 18.307

b) g.l.= 10 y el área total sombreada sea 0.05

Para obtener los valores de Y2 cuando hay dos zonas sombreadas es : Y2 = (g.l.,  )
2
derecho y para el lado izquierdo Y2 = (g.l.,1-  )
2

Entonces:

Y2 =(10, 1 − 0.05⁄2) = (10, 0.975) = 3.247 para el extremo izquierdo

Y2 =(10, 0.05⁄2) = (10, 0.025) = 20.483 para el extremo derecho


c) g.l.=10 y el área sombreada a la izquierda sea 0.10

Cuando es una zona sombreada del lado izquierdo es: Y2=(g.l.,1-α) = (10,1 − 0.1) = (10,0.9)
= 4.865

(n  1) S 2
3.4 Procedimiento con Minitab para obtener X2calculada con la formula 𝑋 2 
2
Problema práctico 3.2

Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos
en una ciudad grande forman una distribución normal con una desviación estándar σ=1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la
varianza muestral sea mayor que 2.

Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como sigue:

(n  1) S 2 (17  1)( 2)
X 
2
  32
 2
(1) 2

Con Minitab calcular la P con la opción:

Calc > Distribuciones de probabilidad > Chi-cuadrada

En el cuadro de diálogo realiza el procedimiento:


Selecciona Probabilidad acumulada

Grados de libertad: 16

Selecciona Constante de entrada: introduzca el valor de X2 calculada que es 32

Aceptar

En la hoja de sesión nos da el resultado de P(X2 ≤ 3.2)

Función de distribución acumulada

Chi-cuadrada con 16 GL

x P( X <= x )
32 0.990000

Con esto se obtiene la probabilidad de cola izquierda de la distribución chi cuadrado por lo
que al valor se le debe restar 1 el resultado obtenido.

P(X2≥ 32) = 1 - P(X2 ≤ 0.99) = 1 – 0.99= 0.01

(n  1) S 2
3.5 Procedimiento con Excel para obtener X2calculada con la formula 𝑋 2 
2
FÓRMULAS > fx > Estadísticas > DISTR.CHICUAD

La DISTR.CHICUAD, sirve para calcular la probabilidad de la cola izquierda

En el cuadro de dialogo introduzca los siguientes datos:

X el valor X2 calculada = 32

Grados de libertad =16

Acumulado VERDADERO

En la figura 11 se muestra el procedimiento.


Figura 11. Cuadro de diálogo para calcular la distribución X2

La P(X2 ≤ 32) = 0.99, con esto se obtiene la probabilidad de cola izquierda de la distribución
chi cuadrado por lo que al valor se le debe restar 1 el resultado obtenido.

P(X2≥ 32) = 1 - P(X2 ≤ 0.99) = 1 – 0.99= 0.01

4. Distribución de Probabilidad F (Fisher)

La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos


poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se
desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad de
un proceso de manufactura con la de otro o hasta la forma en que varía el procedimiento
para calificar de un profesor universitario con la de otro.

Intuitivamente, podríamos comparar las varianzas de dos poblaciones,  12 y  22 , utilizando

la razón de las varianzas muestrales


s12 s12
2 . Si es casi igual a 1, se tendrá poca
s2 s 22
evidencia para indicar que  12 y  22 no son iguales. Por otra parte, un valor muy grande o

muy pequeño para


s12 , proporcionará evidencia de una diferencia en las varianzas de las
s 22
poblaciones.

La distribución F fue elaborada por R.A. Fischer a comienzos de 1920. El estadístico F, se


define como la relación de dos variables aleatorias Y2 independientes, cada una dividida
por su número de grados de libertad. De aquí que puede escribirse:

g.l.1 S12
F 
 S 22
g.l.2

4.1 Media y varianza de la distribución F

g.l.1
Media:  para g.l. 2  2
g.l.2  2

2 g.l.22 ( g.l.1  g.l.2  2)


Varianza: 2  para g.l. 2  4
g.l.1 ( g.l.2  2) 2 ( g.l.2  4)

Características de la distribución F

1. Cuando g.l.1 > 2, g.l.2 >2, la curva de la distribución F es un curva unimodal asimétrica a
la derecha.

2. Cuando los g.l.1 y g.l.2 aumentan, la distribución F tiende a la normalidad.

3. La amplitud de F va de 0 a α.

4. El área bajo la curva es igual a 1.

R.A. Fisher elaboró primero la distribución Z, que más tarde se transformó en la distribución
F. La relación entre F y Z es:

F = e2z donde e = 2.7183

Por ejemplo, sí Z = 1, entonces:


F= e2(1) = e2 = 7.389

Y si Z = 2, entonces:

F= e2(2) = e4 = 54.59

3.2 Uso de la tabla de F para calcular los valores críticos

Para manejar las tablas de Fisher (figura 12), se tendrá que buscar primero los grados de
libertad dos para luego localizar el área correspondiente, relacionándola con los grados de
libertad uno, para calcular el valor de F.

Figura 12. Tabla de Fischer para calcular los valores críticos.

Problema práctico 4.1

Encontrar el valor de F, en cada uno de los siguientes casos:

a) El área a la izquierda de F, es de 0.95 con g.l.1=15 y g.l.2=10.

En este caso se puede buscar el área de 0.95 directamente en la tabla con sus
respectivos grados de libertad, es decir con α=0.05 y g.l.1=15 y g.l.2 =10, y el resultado
es 2.845
b) El área a la derecha de F es de 0.95 con g.l.1=6 y g.l.2=8.

Se tiene que buscar en la tabla un área de 0.05, puesto que nos piden un área a la derecha
de F de 0.95 con g.l.1=6 y g.l.2=8. Como es de lado izquierdo se saca a la inversa g.l.2=8 en
la horizontal y g.l.1=6 en la vertical, dando un valor de 4.417. Entonces:

1 1
FI(0.95) =   0.241
F 4.417

c) El área a la izquierda de F, es de 0.10 con g.l.1=24 y g.l.2=24

Cómo se pide el área a la izquierda de F de 0.10, se busca en las tablas el área de 0.90
con ambos g.l. 24, se busca la parte inversa y el valor es 1.702.

1 1
FI(0.1) =   0.588
F 1.702
𝑆12
4.4 Procedimiento con Minitab para obtener F calculada con la formula F=
𝑆22

Problema práctico 4.2

Se quiere calcular la variabilidad de la fuerza de la corriente de dos ríos A y B. Que se


supone siguen distribuciones normales. Se realizan 16 mediciones en el río A y se obtiene
una varianza de 8.09 y 18 mediciones en el río B y se obtiene una varianza de 7. Obtener
la probabilidad de que la varianza en el río B sea como mínimo el doble de la varianza en
el río B.

Primeramente se calcula los valores de F con los siguientes datos:

g.l.1 = n1 – 1 = 16 – 1 = 15

g.l.2 = n2 – 1 = 18 – 1 = 17

Como se quiere calcular la probabilidad de que la varianza del río B sea ≥ 2, entonces:
8.09
[𝐹(15,17, 𝑔. 𝑙. ) ≥ 2 ∗ 7
] = [𝐹15,17 ≥ 2.31]

Para calcular la probabilidad se hace uso del Minitab.

Calc > Distribuciones de Probabilidad > F

En el cuadro de diálogo

Selecciona Probabilidad acumulada

Grados de libertad del numerador, el valor de los g.l. del río A = 15

Grados de libertad del denominador, el valor de los g.l. del río B = 17

Selecciona Constante de entrada, anota el valor de F calculada = 2.31

Aceptar

En la hoja de sesión nos da el resultado de P(F ≤ 2.31)

Función de distribución acumulada

Distribución F con 15 GL en el numerador y 17 GL en el denominador

x P( X <= x )
2.31 0.950197
Como se desea calcular la probabilidad de que la varianza del río B sea el doble que la
varianza del río A, entonces, se calcula el complemento:

𝑃(𝜎𝐵2 ≥ 2𝜎𝐴2 ) = 1 - P(F ≤ 2.31) = 1 – 0.95 = 0.05

Con Excel el procedimiento es el siguiente:

FÓRMULAS > fx > Estadísticas > DISTR.F.N > Aceptar

En el cuadro de diálogo registra:

X, el valor de F calculada de 2.31

Grados_de_libertad1, los g.l. del río A de 15

Grados_de_libertad2, grados de libertad del río B de 17

Acumulado, VERDADERO para calcular la probabilidad acumulativa (P ≤ 2.31)

Aceptar

En la hoja de trabajo de Excel aparece el resultado de 0.95019, figura 13.

Figura 13. Cuadro de diálogo de la Distribución F en Excel

Calcular la 𝑃(𝜎𝐵2 ≥ 2𝜎𝐴2 ) = 1 - P(F ≤ 2.31) = 1 – 0.95 = 0.05


MATERIALES Y EQUIPO
Calculadora

Software Minitab 16

Microsoft Excel

Montgomery. Runger. Probabilidad y Estadística aplicadas a la Ingeniería. Editorial Limusa


Wiley. Segunda Edición.

Walpole. Myers. Myers. Probabilidad y Estadística para ingeniería y ciencias. Editorial


Pearson. Novena Edición.

PROCEDIMIENTO
Resuelva en Minitab las actividades de la distribuciones continuas de probabilidad e
interpreta los resultados mediante el gráfico.

Actividad 1

Un fabricante de focos afirma que su producto durará un promedio de 500 horas de trabajo.
Para conservar este promedio esta persona verifica 25 focos cada mes. Si el valor “y”
calculado cae entre –t 0.05 y t 0.05, él se encuentra satisfecho con esta afirmación. ¿Qué
conclusión deberá él sacar de una muestra de 25 focos cuya duración fue?:

520 521 511 513 510

513 522 500 521 495

496 488 500 502 512

510 510 475 505 521

506 503 487 493 500


Actividad 2

Se sabe que la distribución de Weibull es ampliamente usada en problemas de estadística


relacionados con el envejecimiento y deterioro de materiales sólidos aislantes sujetos a
voltajes AC. Los valores de los parámetros dependen del voltaje y de la temperatura.
Basado en esto, supóngase que α = 2.5 y β = 200. Siendo así, calcular lo siguiente:

a) ¿Cuál es la probabilidad de que la vida de uno de estos aparatos sea a lo más de


200?
b) Menos que 200.
c) Más de 300

Actividad 3

Un fabricante de baterías para automóvil garantiza que su producto durará en promedio, 3


años con una desviación estándar de 1 año. Si cinco de estas baterías tienen duraciones
de 1.9, 2.4, 3.0, 3.5 y 4.2 años, ¿el fabricante continuará convencido de que sus baterías
tienen una desviación estándar de un año? Suponga que las duraciones de las baterías
siguen una distribución normal.

Actividad 4

El jefe de un laboratorio se encuentra con una técnica de medición fuera de control


estadístico. Para Investigar las causas decide investigar si el factor humano tiene
incidencia, y toma una muestra de suero cualquiera la divide en 20 alícuotas. Luego elige
10 de ellas al azar y se las entrega al laboratorista 1 para que haga las determinaciones;
las restantes las encomienda al laboratorista 2 para que las mida. Los resultados obtenidos
son: S12=2.4 es la varianza obtenida del laboratorista 1 y S22=0.8 para el otro. Obtener la
probabilidad de que la varianza del laboratorista 2 sea mayor o igual a la del laboratorista
1.

Actividad 5

Un ingeniero químico afirma que el rendimiento medio de la población de un cierto proceso


de lotes es 500 gramos/ml de materia prima. Para verificar dicha afirmación muestrea 25
lotes cada mes. Si el valor de t calculado cae entre –t 0.05 y t 0.05 queda satisfecho con su
afirmación. ¿Qué conclusión debería sacar de una muestra que tiene una media de 518
gramos/ml y una desviación estándar muestral de 400 gramos? Suponga que la distribución
de rendimientos es aproximadamente normal.

Actividad 6

Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una


población normal con varianza σ2 = 6, tenga una varianza muestral:

a) Mayor que 9.1

b) Entre 3.462 y 10.745

SUGERENCIAS DIDÁCTICAS
Resolver las actividades con la utilización de tablas de distribución con el objetivo de
comparar resultados.

Discutir los resultados de las actividades, argumentando alternativas de solución, errores


de aplicación de criterios, interpretación de la información y resultados, así como posibles
mejoras.

Resolver ejercicios para calcular los valores críticos de la distribución t-Student, Chi-
cuadrada y Fischer con sus respectivos gráficos.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 10 Distribución de la media
Ambiental muestral y diferencia de medias
con MINITAB

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Resolver problemas con ejercicios y/o solución de un caso


práctico calcular la distribución muestral de la media y diferencias de medias con el
uso de minitab.

INTRODUCCIÓN

A menudo se necesita estudiar las propiedades de una determinada población, pero su


inconveniente es que ésta es demasiado numerosa como para analizar a todos los
individuos que la componen. Y los estudios estadísticos normalmente se hacen con una
parte de la población, ya que realizarlos sobre la totalidad resultaría demasiado
complicado. Para que la información obtenida tenga validez es necesario que la
muestra cumpla con ciertas condiciones específicas, relacionadas con el método para
determinar el tamaño y características de la muestra y los individuos que la componen.
Las estimaciones serán válidas sólo si la muestra tomada es “representativa” de la
población.
Así, el muestreo es una técnica que se utiliza para inferir algo respecto de una población
mediante la selección de una muestra de esa población, entre otras causas, por el coste
económico y el tiempo empleado que supondría estudiar a todos los miembros de una
población.

Los métodos de muestreo pueden ser de dos: probabilístico y el no probabilístico, en el


sentido en que el muestreo probabilístico es una muestra seleccionada de tal forma que
cada elemento de la población tiene la misma probabilidad de formar parte de la muestra.

De esta manera, si se utilizan métodos no probabilísticos, no todos los elementos de la


población tienen la misma probabilidad de ser incluidos. En este caso, los resultados
estarían sesgados, lo cual quiere decir que tal vez los resultados de la muestra no sean
representativos de la población.

Existen multitud de mecanismos para seleccionar una muestra que sea representativa de
la población, y estos dependen principalmente de los recursos disponibles y de la
naturaleza de los elementos que componen la población. Hay dos preguntas fundamentales
en la selección de una muestra:

 Cuántos elementos debe tener la muestra?, es decir, Cuál debe ser el tamaño de la
misma?
 De qué forma se seleccionan esos elementos?

A la primera pregunta la mejor respuesta siempre es: cuantos más mejor. Normalmente son
los recursos disponibles para llevar a cabo el estudio o la población accesible la que limita
este tamaño. Si se quiere estudiar una población y se va a hacer a partir de una muestra,
es evidente que a mayor tamaño de la muestra más nos aproximamos a la población y por
tanto se podrá formular conclusiones más precisas acerca de la misma.

Respecto a la segunda pregunta, hay multitud de formas distintas de seleccionar la muestra,


y conocer algunos tipos particulares de muestreo.

1. Tipos de Muestreo
1.1 Muestreo aleatorio simple.

Es el tipo de muestreo más simple y en él se basan todos los demás. Para obtener los
elementos de la muestra se numeran los elementos de la población y se seleccionan al azar
los elementos que debe contener la muestra. Todos los elementos tienen la misma
probabilidad de ser elegidos (figura 1)
Figura 1. Representación gráfica de muestreo
aleatorio simple

Hay dos tipos de muestreo aleatorio simple: el muestreo con reemplazo y sin reemplazo.
En el muestreo con reemplazo, después de que un elemento ha sido seleccionado de entre
el marco de la muestra se devuelve y es elegible para ser seleccionado de nuevo. En el
muestreo sin reemplazo, después de que un elemento se selecciona del marco de la
muestra, se retira de la población y no regresa a la base del muestreo. Este tipo de muestreo
suele ser más eficiente pues no permite que el mismo elemento de la población entre a la
muestra más de una vez.

Se puede realizar o bien con ayuda de una tabla de números aleatorios o bien mediante un
generador de números aleatorios (ordenador). En cualquier caso, será necesario enumerar
a todos los elementos de la población, y en algunos casos, la población ni siquiera es
numerable (por ejemplo, en un estudio medioambiental, la selección de peces en un río).
Por este motivo, en multitud de ocasiones este muestreo es adaptado para obtener un
método que, en la medida de lo posible, se acerque a él (la selección de elementos en la
muestra sea lo más aleatoria posible).

Problema práctico 1.1

Como parte de una encuesta de contaminación del aire, un inspector decide examinar las
emisiones de 10 de los treinta camiones de una compañía, cada camión es identificado del
01 al 30.

Para solucionar el problema se puede hacer uso del Minitab para elegir a los diez camiones.

En la hoja de trabajo en la columna C1, se anotarán los números de los camiones con
formato de texto. A continuación se describe el procedimiento:
Cambiar la columna a formato de texto: Datos > Cambiar tipo de datos > Seleccionar
Numérico a texto

Escribir nombre a la columna: se le nombrará camión

Anotar en la columna C1: Número de camiones del 01 al 30.

En la Columna C2, se nombrará a la columna como camiones elegidos en la parte


sombreada.

La figura 2 muestra la hoja de trabajo con los datos

Figura 2: Hoja de Trabajo de Minitab con la


captura de datos

Para generar los 10 camiones aleatoriamente con o sin reemplazo se sigue la instrucción:

Calc > Datos aleatorios > seleccionar Muestreo por columnas

En el cuadro de diálogo se anotan los elementos:

Tamaño de la muestra (filas): Específica el número de camiones 10.

Desde las columnas: Selecciona C1 camión

Almacenar muestras en: Selecciona C2 Camiones elegidos

Muestreo con reemplazo: No marcar


Aceptar

Los camiones elegidos aleatoriamente son: 02, 22, 30, 06, 15, 26, 13, 19, 24, 16

Nota: Como son números aleatorios en cada estudiante se generará diferentes camiones.

En la figura 3 se muestran los resultados obtenidos en la columna C2 de la hoja de trabajo.

Figura 3. Hoja de trabajo con las muestras


elegidas aleatoriamente

1.2 Muestreo Sistemático.

Este procedimiento exige numerar todos los elementos de la población, pero en lugar de
extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es
un número elegido al azar, y los elementos que integran la muestra son los que ocupa los
lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamaño de la población entre el tamaño de la muestra:

k= N/n.

Donde k = tamaño del intervalo para la selección

El número i que empleamos como punto de partida será un número al azar entre 1 y k.

La figura 4 muestra un cómo realizar un muestreo sistemático.


Figura 4. Representación gráfica de muestreo
sistemático

El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la
población ya que al elegir a los miembros de la muestra con una periodicidad constante (k)
se puede introducir una homogeneidad que no se da en la población. Suponga que se
quiere testar el funcionamiento de una máquina, para lo cual se va a seleccionar una de
cada 15 piezas producidas. Si ocurriera la desgracia de que justamente 1 de cada 15 piezas
fuese defectuosa y el error de la máquina fuera defectuoso periódicamente, se tendría dos
posibles resultados muestrales: que falla siempre y que no falla nunca.

Problema práctico 1.2

En la sierra de Arteaga se desea saber cuántos pinos han sido atacados por una plaga de
un escarabajo de la corteza, se sabe que existen 1050 pinos en la zona a muestrear. La
muestra se realiza de manera sistemática caminando en una línea tratando de recorrer
todos los pinos y muestrear 21 pinos.

1050
El valor de 𝐾 = 21
= 50, por lo que se debe seleccionar uno de cada 50 pinos.

Al seleccionar cada valor k-ésimo, debe usarse una tabla de números aleatorios para
seleccionar un valor entre 1 y k, incluso como punto inicial, es decir un valor entre 1 y 50.
El segundo elemento para la muestra es el punto inicial más el valor de k.

Al seleccionar un número aleatorio entre 1 al 50 en Minitab y este sale el número 3, por lo


tanto i=3. Para seleccionar el segundo número es i+k = 3+50 = 53, el tercer número es i+2k
= 3+2(50) = 103, así sucesivamente, hasta llegara i+20k = 3+20(50) = 1003
El resultado será elegir los 21 pinos marcados con los números:

3, 53, 103, 153, 203, 253, 303, 353, 403, 453, 503, 553, 603, 653, 703, 753, 803, 853, 903,
953, 1003

1.3 Muestreo Aleatorio Estratificado.

Es un procedimiento de muestreo en el que el objetivo de la población se separa en


segmentos exclusivos, homogéneos (estratos), donde cada estrato funciona
independientemente, y luego una muestra aleatoria simple se selecciona de cada segmento
(estrato). Las muestras seleccionadas de los diversos estratos se combinan en una sola
muestra (figura 5)

Figura 5. Representación gráfica de un muestreo


estratificado

La distribución de la muestra en función de los diferentes estratos se denomina afijación, y


puede ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.

Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la


población en cada estrato.

Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de modo


que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se
suele conocer la desviación.
Problema práctico 1.3

Si se tiene que seleccionar una muestra de 40 personas, de una comunidad de 500


habitantes, con el fin de hacer una encuesta sobre los servicios de agua potable que
reciben. Los habitantes están repartidos en 5 colonias de la siguiente manera: 100
habitantes en la colonia San Miguel, 150 habitantes en la colonia San Rafael, 50 en la San
Vicente, 125 San Marcos y en San Pedro 75 habitantes. Calcular el número de personas
que debemos seleccionar en cada estrato si se realiza una afijación proporcional, así como
las elegidas a las que se les aplicará la encuesta.

Para calcular la cantidad de personas por cada estrato se designará n1 al número de


personas que se deben elegir de la colonia San Miguel, n2 a la Colonia San Rafael, n3 a
San Vicente, n4 San Marcos y n5 a la colonia San Pedro.

Para calcular el número de elementos por estrato podemos hacer uso de una regla de tres,
de este modo:
𝑛 𝑛1
−− Dónde n = tamaño de la muestra
𝑁 𝑛𝑒

N = tamaño de la población

ne = tamaño del estrato

n1 = cantidad de elementos elegidos

Entonces:

n1 = 40x100/500 = 8

n2 = 40x150/500 = 12

n3 = 40 x 50/500 = 4

n4 = 40x125/500 = 10

n5 = 40 x 75/500 = 6

En la tabla siguiente se muestra el tamaño de cada estrato


Estrato Colonia Tamaño Número de
muestras por
estrato

Estrato 1 San Miguel 100 8

Estrato 2 San Rafael 150 12

Estrato 3 San Vicente 50 4

Estrato 4 San Marcos 125 10

Estrato 5 San Pedro 75 6

Los habitantes de cada colonia están registrados y se les asignará un número, por ejemplo,
en el estrato 1 hay 100 habitantes entonces se numerará de 001 a 100, en el estrato 2 hay
150 y se numerará de 001 a 150 y así sucesivamente se hará con los de más estratos. Y
del tamaño de cada estrato se sacaran el número de muestras que se obtuvieron, por medio
del método de muestreo aleatorio simple haciendo uso del Minitab.

En la hoja de trabajo se pueden colocar en las diferentes columnas los estratos con formato
de texto y calcular los números aleatorios por separado como se explicó en el problema
práctico 1.1 del muestreo aleatorio simple. La opción es:

Calc > Datos aleatorios > Muestreo por columnas

Primeramente en la hoja de trabajo, en la parte sombreada y con formato de texto se


nombrará cada columna, por ejemplo:

En la C1 se llamará estrato 1 y se colocarán los números del 001 al 100 que representan el
tamaño de la muestra y en la columna C2 se nombrará como muestra 1 y aquí se obtendrán
las ocho muestras elegidas aleatoriamente.

En la columna C3 se le denominará estrato 2 y se colocarán los números del 001 al 150


que corresponden al tamaño de la muestra y en la columna C4 se le nombrará muestra 2 y
es aquí donde se obtendrán las doce muestras elegidas al azar del estrato 2. Y así
sucesivamente. La figura 6 se muestra el procedimiento de captura y resultados de los cinco
estratos.
Figura 6. Captura y resultados de las muestras elegidas aleatoriamente
para cada estrato con Minitab

Del estrato 1 (1 a 100) se tomarán 8 muestra, las muestras son: 096, 010, 061, 077, Del
estrato 2 (1 a 150) se tomarán 12 muestras y las muestras son: 101, 013, 054,016, 055,
079, 123, 031, 027, 033, 014, 026.

Del estrato 3 (1 a 50) se tomarán 4 muestras y son: 018, 045, 016, 037

Del estrato 4 (1 a 125) se tomarán 10 muestras y las muestras son: 042, 055, 087, 067,
031, 062, 101, 073, 085, 122.

Del estrato 5 /1 a 75) se tomarán 6 muestras y estas son: 041, 050, 036, 029, 072, 042.

1.4 Muestreo por conglomerados.

Por algunas razones naturales, los elementos muestrales se encuentran formando grupos,
como por ejemplo, las personas que viven en colonias de una ciudad, lo elementos de una
caja de una línea de producción, los clubes de personas, las áreas arboladas de un terreno,
etc.

Como el objetivo del muestreo es levantar la mayor cantidad de información al menor costo,
en este tipo de casos lo más económico el encuestar a un elemento muestral y a todos sus
vecinos, así se ahorran los costos de un traslado del encuestador. A este modelo de
muestreo se llama “por conglomerados”, ya que una vez seleccionado un elemento para la
muestra, se incluyen también a todos los elementos que estén alrededor de él. A diferencia
del muestreo estratificado, este muestreo no requiere que los elementos tengan
características homogéneas. Es decir son heterogéneos en su interior, pero diferentes entre
sí en propiedades y tamaño.

En el muestreo por conglomerados, en lugar de seleccionar a todos los sujetos de la


población inmediatamente, el investigador realiza varios pasos para reunir su muestra de
la población. En primer lugar, el investigador selecciona grupos o conglomerados y de cada
grupo selecciona a los sujetos individuales, ya sea por muestreo aleatorio simple o muestreo
aleatorio sistemático (figura 7)

Figura 7. Representación gráfica del muestreo por


conglomerados

La diferencia principal entre el muestreo por conglomerados y el muestreo estratificado es


la inclusión de conglomerados o estratos. En el muestreo aleatorio estratificado, se realiza
el muestreo en todos los estratos de la población, mientras que en el muestreo por
conglomerados el investigador sólo selecciona aleatoriamente un número de
conglomerados de la colección de conglomerados de toda la población. Por lo tanto, sólo
se realiza una muestra sobre una cantidad de conglomerados. Los demás quedan sin
representación.

Problema práctico 1.4

Si se va a realizar una encuesta sobre las políticas y leyes de la contaminación del aire en
la Ciudad de México, como se haría un muestreo por conglomerados. Si se desea
seleccionar al azar a cuatro conglomerados y seleccionar aleatoriamente 200 colonias a
visitar para realizar la entrevista.

Cada municipio de la Ciudad de México será un conglomerado.

Conglomerado 1: Álvaro Obregón Conglomerado 2: Azcapotzalco

Conglomerado 3: Benito Juárez Conglomerado 4: Coyoacán

Conglomerado 5: Cuajimalpa de Morelos Conglomerado 6: Cuauhtémoc

Conglomerado 7: Gustavo A. Madero Conglomerado 8: Iztacalco

Conglomerado 9: Iztapalapa Conglomerado 10: Magdalena Contreras

Conglomerado 11: Miguel Hidalgo Conglomerado 12: Milpa Alta

Conglomerado 13: Tláhuac Conglomerado 14: Tlalpan

Conglomerado 15: Venustiano Carranza Conglomerado 16: Xochimilco

Para elegir a la azar a los cuatro municipios (conglomerados) se capturan en la hoja de


trabajo de Minitab los 16 municipios y con la opción de Calc > Datos aleatorios > Muestreo
por columnas. El resultado se muestra en la figura 8.

Figura 8. Resultados de los municipios de la Ciudad


de México elegidos aleatoriamente.
Finalmente para seleccionar la muestra aleatoria las colonias a visitar se puede realizar un
muestreo sistemático utilizando los códigos postales de los conglomerados (municipios)
elegidos.

Si existe cada colonia identificada por un número postal, se pueden seleccionar


aleatoriamente con el uso del Minitab.

2. Error en el muestreo.

Tras entender la importancia de escoger una muestra representativa de la población, para


lograr esto, se puede seleccionar, por ejemplo, una muestra aleatoria simple de la
población, pero es muy improbable que la media de la muestra sea idéntica a la media de
la población.

De la misma manera, tal vez la desviación estándar u otra medición que se calcule con base
en la muestra no sea igual al valor correspondiente de la población. Por tanto, es posible
que existan ciertas diferencias entre los estadísticos de la muestra (como la media o la
desviación estándar), y los parámetros de población correspondientes. A dicha diferencia
se la conoce como error de muestreo.

Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamaño 25 de una
población con media µ = 15: si la media de la muestra es 𝑥̅ =12, entonces a la diferencia
observada 𝑥̅ − 𝜇 = −3 se le denomina el error muestral. Una media muestral 𝑥̅ puede
pensarse como la suma de dos cantidades, la media poblacional µ y el error muestral; si e
denota el error muestral, entonces:

𝑥̅ = 𝜇 + 𝑒

Problema práctico 2.1

Se toman muestras de tamaño 2 de una población consistente en tres valores, 2, 4 y 6,


para simular una población “grande” de manera que el muestreo pueda realizarse un gran
número de veces, se supone que éste se hace con reemplazo, es decir, el número elegido
se reemplaza antes de seleccionar el siguiente, además, se seleccionan muestras
ordenadas. En una muestra ordenada, el orden en que se seleccionan las observaciones
es importante.
Primeramente se calcula la media poblacional que es igual a µ = (2+4+6)/3 = 4

Como el muestreo es con reemplazo y se van a tomar 2 elementos de una población que
tiene tres valores (2, 4, 6), se hace uso dela siguiente formula:

𝒌 = 𝑵𝒏 donde k es el número de muestras en la distribución muestral.

Así que se tendría 9 muestras ordenadas de tamaño 2, a las cuales se calcularían sus
medias muestrales y el error muestral por medio de las formulas.

La siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2 que es
posible seleccionar con reemplazo y también contiene las medias muestrales y los
correspondientes errores muestrales.

Muestras ordenadas ̅
Media muestral 𝒙 ̅−𝝁
Error muestral 𝒆 = 𝒙

(2,2) 2 2 - 4 = -2

(2,4) 3 3 – 4 = -1

(2,6) 4 4–4=0

(4,2) 3 3 – 4 = -1

(4,4) 4 4–4=0

(4,6) 5 5–4=1

(6,2) 4 4–4=0

(6,4) 5 5–4=1

(6,6) 6 6–4=2

Si μx̅ denota la media de todas las medias muestrales entonces tenemos:

μx̅ = (2 + 3 + 4 + 3 + 4 +5 + 4 + 5 + 6)/9 = 4

La suma de los errores muestrales es cero.

e1 + e2 + e3 + . . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0

En consecuencia, si 𝑥̅ se usa para medir, estimar, la media poblacional µ, el promedio de


todos los errores muestrales es cero.
3. Distribución muestral de la media

Uno de los objetivos de la estadística es conocer acerca del comportamiento de parámetros


poblacionales tales como: la media ( μ ), la varianza (σ2) o la proporción ( p ). Para ello se
extrae una muestra aleatoria de la población y se calcula el valor de un estadístico
correspondiente, por ejemplo, la media muestral (𝑥̅ ), la varianza muestral (s2) o la
proporción muestral ( 𝑝̂ ). El valor del estadístico es aleatorio porque depende de los
elementos elegidos en la muestra seleccionada y, por lo tanto, el estadístico tiene una
distribución de probabilidad la cual es llamada la Distribución Muestral del estadístico.

La distribución muestral de la media de las muestras, consiste en una distribución de


probabilidad de todas las medias posibles de las muestras de un tamaño de muestra dado.
Así pues, dada una población (a la cual se representa por la variable aleatoria X), se puede
extraer de la misma k muestras, cada una de ellas de tamaño n. Para cada una de las k
muestras calcular un estadístico, por ejemplo, la media de las n observaciones que la
componen. Así se tendrá un total de k nuevos valores 𝑥̅𝑖 , 𝑖 = 1, … . . , 𝑘 . Se puede asociar
estos valores a una nueva variable aleatoria X, cuya distribución se llama distribución
muestral. Una de las propiedades más importantes es la siguiente:

3.1 Teorema de límite central para la distribución de las medias muestrales:

Sea X una variable aleatoria cualquiera de media µ y desviación típica σ, entonces:

 Si se considera todas las muestras aleatorias posibles, cada una de ellas de tamaño
n, se cumplirá que 𝜇𝑥̅ = 𝜇 y 𝜎𝑥̅ = 𝜎⁄ .
√𝑛
 Además, si 𝑥̅ sigue una distribución normal, X también será normal.

Si de una población se eligen muestras de tamaño n con reemplazo, entonces el error


estándar de la media es igual a la desviación estándar de la distribución de los errores
muestrales.

Para calcular el número de muestras (k) en la distribución muestral se usa la fórmula:

𝑁!
𝑘= 𝑁 𝐶𝑛 =
𝑛! (𝑁 − 𝑛)!

Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar
la formula siguiente para encontrar 𝜎𝑥̅ , como factor de corrección.
𝜎 𝑁−𝑛
𝜎𝑥̅ = √
√𝑛 𝑁 − 1

Donde σ es la desviación estándar de la población de donde se toman las muestras, n es


el tamaño de la muestra y N el de la población.

Para calcular el número de muestras (k) en la distribución muestral se usa la fórmula:

𝑘 = 𝑁𝑛

Si el muestreo se hace sin reemplazo y el tamaño de la población es al menos 20 veces el


tamaño de la muestra (N 20), entonces se puede usar la fórmula;

𝑁−𝑛
El factor de corrección √ 𝑁−1 para una población finita. Pero en la práctica este factor es

omitido a menos que la muestra sea lo suficientemente grande comparada con la población.

Cuando los tamaños muestrales se hacen más grandes, las distribuciones de media
muestral empiezan a aproximarse a una distribución normal y la variación entre las medias
disminuye, y entonces, se aplica el teorema de límite central para la distribución de la media
muestral.

Con esta distribución se puede calcular la probabilidad de algún evento relacionado con la
variable aleatoria, mediante la siguiente fórmula:
𝑥−𝜇
𝑧=
𝜎

En donde z es una variable estandarizada con media igual a cero y varianza igual a uno.
Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio,
utilizando la tabla de la distribución z.

Se sabe que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier tamaño
de una población normal, la distribución muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la fórmula de la distribución normal
con 𝜇 = 𝜇𝑥̅ y 𝜎 = 𝜎𝑥̅ , entonces la fórmula para calcular la probabilidad del comportamiento
del estadístico, en este caso la media de la muestra, quedaría de la siguiente manera:
𝑥̅ − 𝜇
𝑧=𝜎
⁄ 𝑛

y para poblaciones finitas y muestro con reemplazo:

𝑥̅ − 𝜇
𝑧=
𝜎 𝑁−𝑛
⁄ 𝑛 √𝑁 − 1

Problema práctico 3.1

Suponga que en un establo, ordeñan e veces al día a vacas de la raza Holstein, arrojando
los siguientes resultados en litros/vaca: 54, 55, 59, 63, 64, 68, 69 y 70.

Suponga que se toman todas las muestras posibles de tamaño n=2 de esta población con
reemplazo encuentre:

a) la distribución de la media

b) pruebe que x   .

Haciendo uso de Minitab, escriba los nombres a las columnas, llama a la columna C1,
“Población”, a la C2 “Muestra1, C3 “Muestra 2” y C4 “Medias Muestrales”

En la columna C1 captura los datos de la población y calcula la media poblacional (µ) con
la opción

Calc >Estadísticas columnas

En el cuadro de diálogo

Estadísticas: Selecciona la Media

Variable de entrada: Selecciona C1 Población

Almacenar resultado en: Deja en blanco

Da Aceptar

En la hoja de sesión aparece el resultado:


Media de Población

Media de Población = 62.75

El tamaño de la muestra es 2, y como es con reemplazo, para calcular todas las muestras
posibles hacemos uso de la fórmula: k= Nn = 82= 64 posibles combinaciones. Las cuales
son:

(54,54) (55,54) (59,54) (63,54) (64,54) (68,54) (69,54) (70,54)

(54,55) (55,55) (59,55) (63,55) (64,55) (68,55) (69,55) (70,55)

(54,59) (55,59) (59,59) (63,59) (64,59) (68,59) (69,59) (70,59)

(54,63) (55,63) (59,63) (63,63) (64,63) (68,63) (69,63) (70,63)

(54,64) (55,64) (59,64) (63,64) (64,64) (68,64) (69,64) (70,64)

(54,68) (55,68) (59,68) (63,68) (64,68) (68,68) (69,68) (70,68)

(54,69) (55,69) (59,69) (63,69) (64,69) (68,69) (69,69) (70,69)

(54,70) (55,70) (59,70) (63,70) (64,70) (68,70) (69,70) (70,70)

Captura en la columna C2 el primer dato de la combinación de la muestra y en la C3 el


segundo dato de la muestra como se observa en la figura 9.
Figura 9. Representación de la captura de los datos en la
hoja de trabajo de Minitab

Una vez realizado la captura, calcula las medias muestrales en la columna C4 con la opción:

Calc > Estadísticas de filas

En el cuadro de diálogo realiza lo siguiente:

Estadísticas: Selecciona la media

Variables de entrada: Selecciona C2 Muestra 1 y C3 Muestra 2

Almacenar resultado en: Selecciona C4 Medias Muestrales

Da Aceptar

En la figura 10 se muestra la pantalla del procedimiento.

Figura 10. Cuadro de diálogo del procedimiento


de estadísticas de filas.
En la columna C4 de la hoja de trabajo se muestran los resultados de las 64 medias
muestrales, como se observa en la figura 11.

Figura 11. Resultado de las medias muestrales de las 64


muestras

Finalmente se calcula la media muestral de las 64 muestras, con la opción:

Calc > Estadisticas columnas

Se sigue el mismo procedimiento para calcular la media poblacional, solo que la variable
de entrada es la columna C4 Medias Muestrales, y el resultado es el siguiente:

Media de Media Muestrales

Media de Media Muestrales = 62.75

Con este problema, se puede observar que x  


Si se grafica el histograma de las medias muestrales, se selecciona la opción de:

Gráfica > Histograma > en el cuadro de diálogo selecciona con ajuste y da Aceptar
La figura 12 se representa el gráfico del Histograma de las medias muestrales.

Figura 12. Representación gráfica del histograma


de las medias muestrales

Problema práctico 3.2

Considerar una población que consiste de 3, 4, 6, 8, 10, 11, 12, 15, 20 y se extraen 30
muestras de tamaño 4. Calcular:

a) µ, la media poblacional.

b) σ, la desviación estándar poblacional.

c) µx, la media de la distribución muestral de medias.

d) σx, la desviación estándar de la distribución muestral de medias.

Además, grafique las frecuencias para la población y para la distribución muestral de


medias

En Minitab se puede tratar de corroborar el Teorema del Límite Central a través de un


proceso de simulación.

Primeramente en la hoja de trabajo de Minitab captura los datos de la población en la


columna C1 y escriba un nombre a la columna en la parte sombreada, por ejemplo
población.
Con la opción:

Estadísticas > Estadística básica > Mostrar estadísticas descriptivas

En el cuadro de diálogo realiza el siguiente procedimiento:

Variables: Selecciona la columna C1 que se llama población

Estadísticas: Da clic y en la siguiente ventana, activa ninguna, para desactivar todos los
estadísticos y selecciona la media y la desviación estándar. Da clic en
aceptar y nuevamente aceptar, ver figura 13.

Figura 13. Procedimiento en Minitab para calcular la media y la


desviación estándar poblacional

En la ventana de sesión aparecen los resultados:

Estadísticas descriptivas: Población

Variable Media Desv.Est.


Población 9.89 5.42

Si se extraen 30 muestras de tamaño 4 de dicha población:

El segundo paso, en la hoja de trabajo de Minitab en la columna C2 se denominara


“muestra” se capturan los datos del 1 al 30 (por ser 30 muestras) y columnas, C3, C4, C5 y
C6 se denominaran “obs1”, “obs2”, “obs3” y “obs4” y posteriormente se ejecuta 4 veces la
siguiente secuencia:

Calc > Datos aleatorios > Muestreo por columnas

En el cuadro de diálogo de la secuencia anterior, seguir el siguiente procedimiento 4 veces


y guardar cada una de las 4 observaciones de las muestras en las columnas distintas: obs1,
obs2, obs3 y obs4.

Tamaño de las muestras (filas): anota 30 que es el tamaño de la muestra

Desde las columnas: Selecciona C1 Población

Almacenar muestras en: Como se va a realizar 4 veces el procedimiento, la primera vez


almacena en C3 (obs1), la segunda vez en columna C4 (obs2), y así sucesivamente hasta
la obs4. Cada vez que se efectué el procedimiento borra la opción anterior.

Muestreo con reemplazo: Selecciona esta opción.

Da Aceptar

Recuerda que los datos pueden salir diferente a los mostrados en este problema por ser
datos aleatorios.

En la figura 14 se muestran los resultados de las 30 muestras elegidas aleatoriamente de


las cuatro observaciones.

Figura 14. Resultados de las 30 muestras obtenidas


aleatoriamente de tamaño 4.
El tercer paso es nombrar a la columna C7 como “Media”, ya que ahí se van a mostrar los
resultados de calcular las medias de todas esas muestras con la siguiente opción:

Calc > Estadísticas filas

En el cuadro de diálogo realiza el procedimiento siguiente:

Estadísticas: Selecciona media

Variables de entrada: Selecciona obs1, obs2, obs3, obs4 como se muestra en la figura 15.

Almacenar el resultado en: Selecciona C7 Medias

Da Aceptar

Figura 15. Cuadro de diálogo de estadísticas de filas

A continuación muestran los resultados de las medias obtenidas de cada una de las
muestras.

Muestra obs1 obs2 obs3 obs4 Medias


3 3 6 8 12 7.25
4 8 3 3 4 4.50
5 11 10 10 10 10.25
6 10 12 8 11 10.25
7 20 3 12 8 10.75
8 12 15 10 20 14.25
9 11 8 8 10 9.25
10 6 15 11 4 9.00
11 3 10 10 6 7.25
12 8 6 4 4 5.50
13 4 20 20 8 13.00
14 20 12 8 20 15.00
15 20 15 20 10 16.25
16 6 3 20 3 8.00
17 6 11 20 8 11.25
18 15 11 15 10 12.75
19 11 12 6 12 10.25
20 15 4 20 4 10.75
21 8 8 3 3 5.50
22 11 15 11 10 11.75
23 11 20 6 4 10.25
24 4 20 11 15 12.50
25 11 15 12 20 14.50
26 6 15 20 20 15.25
27 4 11 20 20 13.75
28 6 6 15 12 9.75
29 10 15 4 11 10.00
30 15 3 3 8 7.25
3 3 6 8 12 7.25
4 8 3 3 4 4.50

El siguiente paso consiste en calcular la media muestral y la desviación muestral, con la


opción

Estadísticas > Estadísticas básica > Mostrar estadísticas descriptivas

En el cuadro de diálogo:

Variables: Selecciona C7 Medias

Estadísticas: Da clic y selecciona la media y la desviación estándar y Aceptar

Gráficas: Selecciona el Histograma de datos, con curva normal y Aceptar

Da Aceptar

Las medidas estadísticas de la media muestral son:

Estadísticas descriptivas: Medias

Variable Media Desv.Est.


Medias 10.508 3.028

En la figura 16 se muestra el histograma de la distribución de las medias muestrales y la


curva normal que más se aproxima al histograma.
Figura 16. Histograma de la distribución de las
medias muestrales

Interpretación: Notar que la media de las medias muestrales es 𝜇𝑥̅ = 10.508 que está
cerca de la media poblacional µ = 9.89. Además la desviación estándar de la media muestral
es 3.028 mientras que 𝜎⁄ es igual 5.42⁄ = 2.71 ambos valores también están
√𝑛 √4
relativamente cerca. El histograma si está un poco alejado de la normalidad. Si se
incrementa el tamaño de las muestras se puede notar una mejor aproximación a la
Normal.

4. Distribución muestral de diferencia de medias.

Suponga que se tienen dos poblaciones distintas, la primera con media µ1 y desviación
estándar σ1, y la segunda con media µ2 y desviación estándar σ2. Más aún, se elige una
muestra aleatoria de tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada
muestra y la diferencia entre dichas medias (ver figura 17)

La colección de todas esas diferencias se llama distribución muestral de las diferencias


entre medias o la distribución muestral del estadístico x1  x2 .
Figura 17. Representación gráfica de la distribución
muestral de diferencia de medias.

La distribución es aproximadamente normal para n1≥30 y n2 ≥30. Si las poblaciones son


normales, entonces la distribución muestral de medias es normal sin importar los tamaños
de las muestras.

En la distribución muestral de medias se había demostrado que   x y que x 


n

 x1   x 2  1   2 y que  12  22
, por lo que no es difícil deducir que  x1   x 2   .
n1 n2

La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de


medias es:

x1  x2   1   2 
z
 12  22

n1 n2

Problema práctico 4.1

En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una
escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe
que tanto para niños como para niñas los pesos siguen una distribución normal. El promedio
de los pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su
desviación estándar es de 14.142, mientras que el promedio de los pesos de todas las niñas
del sexto grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras.
Si x1 representa el promedio de los pesos de 20 niños y x 2 es el promedio de los pesos de
una muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los
20 niños sea al menos 20 libras más grande que el de las 25 niñas.
Sí:

μ1=100 μ2=85 n1=20

σ1=14.142 σ2 =12.247 n2=25

p( ( x1  x2  20)

x1  x2   1   2  20  100  85


z 
 12

 22 14.1422 
12.247 2
n1 n2 20 25

z=1.25

Utilizando Minitab para calcular el valor de z, se usa la opción:

Gráfica > Gráfica de distribución de probabilidad > Selecciona ver probabilidad >
Aceptar

En el cuadro de diálogo siga el procedimiento:

Selecciona: Área sombreada

Definir área sombreada por: Da clic en valor de X

Selecciona Cola derecha porque se quiere calcular un valor mayor al resultado µ1 -µ2 (>20)

Valor de X: Da el valor obtenido de z que es 1.25

Da Aceptar

En la figura 18 se muestra el resultado de la gráfica de distribución


Figura 18. Gráfica de distribución de z= 1.25

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al
menos 20 libras más grande que el de la muestra de las niñas es 0.1056.

MATERIALES Y EQUIPO
Práctica Impresa

Calculadora

Software Minitab 16

PROCEDIMIENTO
Resuelva las siguientes actividades con el uso de Minitab.

Actividad 1

En un conjunto de 1 000 conductores hay, 50 taxistas, 75 camioneros, 25 conductores de


autobús y el resto son conductores de vehículos corrientes y se reparten así: 250 con más
de 20 años de experiencia, 425 con una experiencia de entre 5 y 20 años y 175 con una
experiencia de 0 a 5 años. Para confeccionar una muestra de 40 individuos mediante
muestreo aleatorio estratificado proporcional, ¿cuántos hay que seleccionar de cada uno
delos seis estratos?

Actividad 2

Un centro comercial acaba de recibir u pedido de sintonizadores TDT para ponerlos a la


venta entre sus clientes. Dichos sintonizadores vienen marcados con códigos desde el
39456 al 48795. El gerente de dicho centro está preocupado por la calidad de dichos
sintonizadores y decide obtener una muestra sistemática de 7 aparatos y someterlos a
varias pruebas. Ayúdale a obtener la muestra.

Actividad 3

Considerando como población los número naturales impares del 1 al 40, extrae una muestra
de tamaño 15 por medio de un muestreo aleatorio simple. Utilice el Minitab para elegir a las
muestras.

Actividad 4

Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una
desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7
años con una desviación estándar de 0.7. Determine la probabilidad de que una muestra
aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos un año más
que la de una muestra aleatoria de 40 tubos de la compañía B.

Actividad 5

Los seis pozos que conforman el campo exploratorio Corocito tiene un producción de en
miles de BND de 1.0, 1.2, 2.1, 0.7, 2.6 y 0.3. A partir de estos datos se pide calcular sin
reemplazo.

a) La media de la producción del campo


b) La desviación típica de la producción
c) La media de la distribución muestral para muestras de tamaño 2
d) La desviación estándar de la distribución muestral.
e) Realice la representación gráfica a través del histograma

Actividad 6

Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación


estándar de 1.23 km/L para la primera gasolina y una desviación estándar de 1.37 km/L
para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42
autos.

a. ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio


mayor de 0.45 km/L que la segunda gasolina?

b. ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre


entre 0.65 y 0.83 km/L a favor de la gasolina 1?.

Actividad 7

Se tomaron muestras agua de cinco tuberías de agua potable para determinar la cantidad
de plomo en ppm y los resultados fueron 2, 3, 6, 8 y 11. Considere todas las muestras
posibles de tamaño 2 que pueden obtenerse con reemplazo de esta población. Encuentra:

a) La media y desviación estándar poblacional


b) La media de la distribución muestral de medias
c) La desviación estándar de la distribución muestral de medias, es decir el error
estándar de las medias
d) Realiza el histograma

Actividad 8

Una empresa de material eléctrico fabrica bombillas que tienen una duración que se
distribuye aproximadamente en forma normal, con media de 800 horas y desviación
estándar de 40 horas. Calcule la probabilidad de que una muestra aleatoria de 16 bombillas
tenga una vida promedio de menos de 775 horas.
SUGERENCIAS DIDÁCTICAS
Elaborar un caso práctico con base en la utilización de los diferentes tipos de muestreo y
obtener las muestras para calcular los parámetros de la población.

Resolver problemas con el uso de Z, si las medias muestrales están normalmente


distribuidas.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 11 Distribución de la varianza
Ambiental muestral con MINITAB

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Resolver problemas con ejercicios y/o solución de un caso


práctico calcular la distribución de la varianza muestral con el uso de minitab.

INTRODUCCIÓN

1. Distribución muestral de la varianza

Las distribuciones muestrales de estadísticos importantes nos permiten conocer


información sobre los parámetros. Por lo general, los parámetros son las contrapartes del
estadístico en cuestión. Por ejemplo, si un ingeniero se interesa en la resistencia media de
la población de cierto tipo de resistencia, sacara provecho de la distribución muestral de 𝑋̅
una vez que reúna la información de la muestra. Por otro lado, si está estudiando la
variabilidad en la resistencia, evidentemente utilizará la distribución muestral de S2 para
conocer la contraparte paramétrica, la varianza de la población σ2.

Si se extrae una muestra aleatoria de tamaño n de una población normal con media μ y
varianza σ2, y se calcula la varianza muestral, se obtiene un valor del estadístico S2.
A la distribución muestral de la varianza (S2) se le conoce también como Ji-cuadrado o Chi-
cuadrada (Χ 2). Es decir, que si se extraen todas las muestras posibles de una población
normal y a cada una se le calcula la varianza, se obtendrá la distribución muestral de las
varianzas.

Entonces el estadístico:

𝑛
2
(𝑛 − 1)𝑆 2 (𝑋𝑖 − 𝑋̅)2
𝜒 = = ∑
𝜎2 𝜎2
𝑖=1

tiene una distribución chi-cuadrada con v = n – 1 grados de libertad

Los valores de la variable aleatoria χ2 se calculan de cada muestra mediante la formula

(𝑛 − 1)𝑆 2
𝜒2 =
𝜎2

Donde:

n es el tamaño de la muestra

𝑆 2 es la varianza muestral

𝜎 2 es la varianza poblacional de donde se extrajo la muestra

La distribución de la varianza muestral no es simétrica: tiene asimetría positiva como se


muestra en la figura 1.

Figura 1. Densidad chi-cuadrada con asimetría


positiva
La probabilidad de que una muestra aleatoria produzca un valor 𝜒 2 mayor que algún valor
especifico es igual al área bajo la curva a la derecha de este valor. El valor 𝜒 2 por arriba del
cual se encuentra un área de α por lo general se representa con 𝜒𝛼2 . Esto se ilustra mediante
la región sombreada de la figura 2.

Figura 2. Distribución chi-cuadrada con


cola a la derecha

El cálculo de probabilidad de una distribución muestral de varianzas nos sirve para saber
cómo se va a comportar la varianza o desviación estándar en una muestra que proviene de
una distribución normal. También es utilizada para obtener una estimación por intervalos y
realizar pruebas de hipótesis para una varianza poblacional.

Problema práctico 1.1

Se considera una medición física realizada con un instrumento de precisión, donde el


interés se centra en la variabilidad de la lectura. Se sabe que la medición es una variable
aleatoria con distribución Normal y desviación típica 4 unidades. Se toma un muestreo
aleatorio simple de tamaño 25. Obtener la probabilidad de que el valor de la varianza
muestral sea mayor de 12.16 unidades cuadradas.

Sea una población donde se observa la variable aleatoria X . Supongamos que Xi:

“Medición”→ N ( µ, σ ), donde µ (media poblacional) es desconocida y σ (desviación

estándar poblacional) es 4 por lo tanto la varianza poblacional, 𝜎 2 = 42 = 16


Consideramos el muestreo aleatorio simple, de tamaño 25, está formado por las variables
aleatorias, X1, X2, ….X25.

Si se calcula 𝜒 2 por la ecuación:

(𝑛 − 1)𝑆 2 24 𝑥12.16
𝜒2 = = = 18.24
𝜎2 16

Con Minitab se obtiene la probabilidad de la varianza muestral por el siguiente


procedimiento:

Gráfica > Gráfica de distribución de probabilidad > selecciona Ver probabilidad >
Aceptar

En el cuadro de diálogo realiza las siguientes instrucciones:

Distribución: Selecciona Chi-cuadrada

Grados de libertad: Escribe 24

Selecciona Área sombreada

En el siguiente cuadro de diálogo

Definir área sombreada por: Selecciona Valor de X y cola derecha porque se quiere
calcular un valor mayor de la varianza muestral

Valor de X: Anotar el valor calculado de 𝜒 2 que es 18.24

Da Aceptar

El resultado se muestra en la representación gráfica de distribución chi-cuadrada ver figura


3.
Figura 3. Resultados de la probabilidad de la varianza muestral
mayor a 12.16 unidades.

2
La P(Χ 𝑛−1 ≥ 12.16) = 0.7912

Interpretación:

Sí se calcula la probabilidad en Minitab seleccionando en el área sombreada la opción


gráfica de ambas colas y la probabilidad de 0.05 los resultados caen entre 12.4 y 39.36.
Esto quiere decir:

Que como el 95% de los valores de Χ 2 con 24 grados de libertad cae entre 12.4 y 39.36, el
valor calculado con σ2 = 16 unidades es razonable y, por lo tanto, la desviación estándar de
la medición realizada con un instrumento de precisión es mayor a 4 unidades.

2. Distribución muestral en relación de la varianza

Otro método para comparar dos poblaciones es comparar sus varianzas. Surgen muchas
aplicaciones estadísticas en las que deben compararse las varianzas poblacionales. En
aplicaciones industriales referentes a dos métodos o máquinas para producir el mismo
producto, se utilizan con frecuencia las varianzas y se las compara con propósitos de control
de calidad.
La distribución F tiene una amplia aplicación en la comparación de varianzas muestrales y
también es aplicable en problemas que implican dos o más muestras.

Definición de la distribución F:

Si 𝑆12 y 𝑆22 son las varianzas de muestras aleatorias independientes de tamaño n1 y n2


tomadas de poblaciones normales con varianzas 𝜎12 y 𝜎22 , respectivamente, entonces;

𝑆12
⁄ 2 𝜎22 𝑆12
𝜎
𝐹= 2 1 = 2 2
𝑆2 𝜎1 𝑆2
⁄ 2
𝜎2

tiene una distribución F con v1 = n1– 1 y v2 = n2 – 1 grados de libertad.

A la distribución F se llama distribución de razón de varianzas.

Problema práctico 2.1

Si 𝑆12 y 𝑆22 son las varianzas muestrales de muestras aleatorias independientes de tamaños
n1=10 y n2 =20, tomadas de poblaciones normales que tienen las mismas varianzas,
𝑆2
encuentre P( 1⁄ 2 ≤ 2.42).
𝑆2

Con Minitab se obtiene la probabilidad de las varianzas muestrales por el siguiente


procedimiento:

Gráfica > Gráfica de distribución de probabilidad > selecciona Ver probabilidad >
Aceptar

En el cuadro de diálogo realiza las siguientes instrucciones:

Distribución: Selecciona F

df del numerador: Anota los grados de libertad de la muestra 1 en este caso 9

df del denominador: Anota los grados de libertad de la muestra 2 en este caso 19

Selecciona Área sombreada

En el siguiente cuadro de diálogo


Definir área sombreada por: Selecciona Valor de X y cola izquierda porque se quiere
calcular un valor menor o iguales de las varianzas
muestrales

Valor de X: Anotar el valor X que es 2.42

Da Aceptar

El resultado se muestra en la representación gráfica de distribución F ver figura 4.

Figura 4. Resultados de la probabilidad de las varianzas


muestrales ≤ a 2.42.

𝑆2
La P( 1⁄ 2 ≤ 2.42) = 0.9498
𝑆2

MATERIALES Y EQUIPO

Práctica Impresa

Calculadora
Software Minitab 16

PROCEDIMIENTO
Resuelva las siguientes actividades con el uso de Minitab.

Actividad 1

Cuando un proceso de producción está funcionando correctamente, la resistencia en


ohmios de los componentes que produce sigue una distribución normal con desviación
estándar de 3.6. Se toma una muestra aleatoria de cuatro componentes. ¿Cuál es la
probabilidad de que la varianza muestral sea mayor a 27?

Actividad 2

Las rentabilidades mensuales de cierto tipo de acciones son independientes unas de otras
y siguen una distribución normal con desviación estándar de 1.7. Se toma una muestra de
12 meses. Hallar la probabilidad de que la desviación estándar muestral sea:

a) menor que 2.5,

b) mayor que 1.

Actividad 3

Una óptica adquiere cristales, y se sabe que la varianza del índice de refracción de esta
clase de cristales es 1.36 x 10-4. Ya que se necesita que los diversos cristales tengan un
índice de refracción muy parecido, la óptica rechaza uno de los cargamentos si la varianza
muestral de 30 cristales, escogidos al azar exceda a 2.02 x10-4. Suponiendo que los valores
muestrales pueden considerarse como una muestra aleatoria de una población normal
¿Cuál es la probabilidad de que un cargamento sea rechazado a pesar que la varianza es
de 1.36 x 10-4?
Actividad 4

Una cierta empresa fabrican bombillas cuya tiempo de vida sigue una distribución normal.

Se extrae una muestra aleatoria de 6 bombillas y se mide sus tiempos de vida.

a) 0.05 es la probabilidad de que la varianza muestral sea mayor que ¿qué porcentaje
de la varianza poblacional?

b) 0.10 es la probabilidad de que la varianza muestral sea mayor que ¿qué porcentaje
de la varianza poblacional?

Actividad 5

Si 𝑆12 y 𝑆22 representan las varianzas de las muestras aleatorias independientes de tamaño
n1= 25 y n2 = 31, tomadas de poblaciones normales con varianzas 𝑆12 =10 y 𝑆22 = 15,
𝑆2
respectivamente, encuentre P( 1⁄ 2 > 1.26).
𝑆2

Actividad 6

Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de


motores respecto al tiempo en minutos. Los resultados se muestran en la siguiente tabla:

Método 1 Método 2

n1 = 31 n2 = 25

𝑆12 = 50 𝑆22 = 24

𝑆2
Encuentre la P( 1⁄ 2 ≤ 1.672) si las varianzas poblacionales son iguales.
𝑆2

Actividad 7

Una compañía fabrica propulsores para uso en motores de turbina. Alingeniero de


manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la
rugosidad de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso,
la cual tiene una desviación estándar 𝑆1 = 4.7 micropulgadas, y una muestra aleatoria de
n2=12 partes del segundo proceso, la cual tiene una desviación estándar 𝑆2 = 5.1
micropulgadas. Tomadas de poblaciones normales y tienen las mismas varianzas y una
probabilidad del 90%. Encuentre el valor de F de la relación de las dos varianzas.

SUGERENCIAS DIDÁCTICAS
Elaborar un caso práctico con base en la utilización de los diferentes tipos de muestreo y
obtener las muestras para calcular los parámetros de la población.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 12 Intervalos de confianza para
Ambiental medias con MINITAB

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Manejar los diferentes tipos de intervalos de confianza de acuerdo


a ciertos casos y hacer inferencias sobre los parámetros de una población a través de una
serie de ejercicios prácticos con el manejo de Minitab.

INTRODUCCIÓN

El objetivo más importante de la estadística es obtener una inferencia con respecto a la


población basándose en la información contenida en una muestra. Como las poblaciones
se describen mediante medidas numéricas denominadas parámetros, el objetivo de la
mayoría de las investigaciones estadísticas es deducir una inferencia con respecto a uno o
más parámetros de la población. Y para ello, se comenzará recordando algunos conceptos
básicos de la inferencia estadística y que son necesarios para la construcción y el estudio
de los estimadores:

Población: conjunto homogéneo de individuos sobre los que se estudian características


observables con el objetivo de extraer alguna conclusión. Por abuso de notación, en
ocasiones nos referimos a la distribución que sigue la variable de interés en vez de al
conjunto de individuos. Así, se dice que se está ante una población Normal indicando que
la variable que nos interesa sigue una distribución normal.

Parámetro: característica de la población, como la media y la varianza (o desviación típica)


en la distribución Normal o la probabilidad de éxito en la Binomial son parámetros. Si se
conoce su valor (o si son capaces de aproximarlo con suficiente precisión) se puede
responder a cualquier pregunta sobre la distribución.

Estadístico: cualquier función de la muestra. Por ejemplo, la media o la varianza


muestrales son estadísticos.

Estimadores: son estadísticos independientes de los parámetros de la población, y que se


utilizan para aproximarlos. Si θ es el parámetro de interés, el estimador se denotará por 𝜃̂.
En el caso de una población Normal, se puede considerar la media muestral como
estimador de la media poblacional (es decir, 𝑋̅ = 𝜇̂ ) y la varianza muestral como estimador
de la varianza poblacional (𝑆 2 = 𝜎̂ 2 ). Por tanto, 𝑋̅ 𝑦 𝑆 2 son estimadores puntuales de µ, σ2
(en distribución Normal), respectivamente.

Método de muestreo: procedimiento para seleccionar una muestra. Si en una población


se quiere obtener una muestra de un cierto tamaño n (siendo n menor que el tamaño de la
población), la manera de obtener esta muestra no es única. En este tema, se considera
muestras aleatorias simples (m.a.s.).

La estimación de parámetros es el procedimiento utilizado para conocer las características


de un parámetro poblacional, a partir del conocimiento de la muestra.

1. Estimación de parámetros.

La inferencia estadística asume que se cuenta con datos de una muestra y que se desea
conocer cuáles son las características (ya sea la media, la desviación estándar, la varianza
o cualquier otro que pueda interesar), no de esa muestra, sino de la población a la que esa
muestra pertenece. A los valores de esas características a nivel poblacional se les conoce
como parámetros y se representan simbólicamente con letras griegas (en realidad, sólo
algunos de ellos tienen tal privilegio): 𝜇𝑥 , 𝜎𝑥2 , 𝜎𝑥 , etc.

Para conocer los valores de los parámetros se pueden plantear, bien recoger datos para
todos los elementos de la población, algo que puede resultar poco viable en muchas
situaciones prácticas, o bien, realizar una estimación de los mismos a partir de los datos de
una muestra. Esta segunda vía es mucho más habitual en la práctica, si bien, supone asumir
cierto riesgo de error pues, en cuanto que estimación, el valor que se obtenga no tiene por
qué coincidir con el verdadero valor de ese parámetro.

Se pueden diferenciar dos grandes aproximaciones a la estimación de parámetros: la


estimación puntual y la estimación por intervalos. La diferencia básica entre ambas a la hora
de estimar un parámetro es que la primera proporciona una estimación consistente en un
valor concreto (puntual), mientras que la segunda ofrece como estimación un rango de
valores (intervalo).

1.1 Estimador puntual

Una estimación puntual del valor de un parámetro poblacional desconocido (como puede
ser la media µ , o la desviación estándar σ ), es un número que se utiliza para aproximar el
verdadero valor de dicho parámetro poblacional. A fin de realizar tal estimación, se tomará
una muestra de la población y se calculará el parámetro muestral asociado (𝑋̅ para la media,
𝑆 para la desviación estándar, etc.). El valor de este parámetro muestral será la estimación
puntual del parámetro poblacional.

Por ejemplo, suponga que la compañía Sonytron desea estimar la edad media de los
compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y
calculan la media de esta muestra, este valor será un estimador puntual de la media de la
población.

Las propiedades que debe cumplir para ser un buen estimador:

Insesgado: Un estimador es insesgado cuando la media de su distribución muestral


asociada coincide con la media de la población. Esto ocurre, por ejemplo, con el estimador
𝑥̅ , ya que 𝜇𝑥̅ = 𝜇.

De varianza mínima: La variabilidad de un estimador viene determinada por el cuadrado


de su desviación estándar. En el caso del estimador 𝑥̅ , su desviación estándar es 𝜎𝑥̅ =
𝜎
⁄ 𝑛, también llamada error estándar de µ.

Observar que cuanto mayor sea el tamaño de la muestra n, menor será la variabilidad del
estimador 𝑥̅ , por tanto, mejor serán nuestras estimaciones.
1.2 Estimación por Intervalo

Para que la estimación puntual pueda ser más viable se formuló la estimación por intervalos
en la que el estimador puntual se sujeta a la adición y a la sustracción de un error muestral
máximo y con ello produce una gama de valores entre los cuales se supone con una
determinada confianza que está contenido en el parámetro.

𝜇
99% ՜ 𝛼 = 0.01
𝑥1 95% ՜ 𝛼 = 0.05 𝑥2
90% ՜ 𝛼 = 0.10

Parámetros más comunes de estimación

Parámetro Estimación Razonable

Media de una población (μ). Media Muestral (𝑋̅)

Varianza de una población (σ2) o la


desviación estándar (σ). Varianza muestral (S2)

Proporción p de elementos de una


población que pertenece a una clase de 𝑥
Proporción muestral 𝑝̂ −
interés. 𝑛

Diferencia de las medias de dos


poblaciones. 𝑋̅1 − 𝑋̅2

2. Intervalos de Confianza para la Media con el uso de la Distribución Normal


( 𝒛 ) Y DISTRIBUCIÓN “ 𝒕 ”

Un intervalo de confianza para la media es un estimador de intervalo que se construye con


respecto a la media muestral y que permite especificar la probabilidad de que incluya el
valor de la media poblacional.
Por lo general se construyen los intervalos de confianza utilizando el estimador insesgado
̅ " como punto medio de intervalo. Cuando puede utilizarse la distribución normal, el
"𝒙
intervalo de confianza para la media se determina mediante las siguientes formulas.

2.1 Intervalo de confianza de una muestra con 𝝈 conocida

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒
= 𝑥̅ ± 𝑧(𝜎𝑥̅ ) 𝑠𝑖 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎 ; sabiendo que:
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎

𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑓𝑖𝑛𝑖𝑡𝑎
𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑖𝑛𝑓𝑖𝑛𝑖𝑡𝑎
𝜎 ; 𝜎 𝑁−𝑛
𝜎𝑥̅ = 𝜎𝑥̅ = (√ )
√𝑛 √𝑛 𝑁−1

2.2 Intervalo de confianza de una muestra con σ desconocida y n es grande

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒 𝑠𝑖 𝑛𝑜 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎 𝑦 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎


= 𝑥̅ ± 𝑧(𝑆𝑥̅ ) ; sabiendo que:
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 𝜇 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛 ≥ 30

𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑓𝑖𝑛𝑖𝑡𝑎
𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑖𝑛𝑓𝑖𝑛𝑖𝑡𝑎
𝑆 ; 𝑆 𝑁−𝑛
𝑆𝑥̅ = 𝑆𝑥̅ = (√ )
√𝑛 √𝑛 𝑁−1

2.3 Intervalo de confianza de una muestra con σ desconocida y n es pequeña

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒 𝑠𝑖 𝑛𝑜 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎 𝑦 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎


= 𝑥̅ ± 𝑡(𝑔. 𝑙. , 𝛼⁄2)(𝑆𝑥̅ ) ; sabiendo
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 𝜇 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛 < 30
que:

𝑔. 𝑙. = 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 = 𝑛 − 1
𝛼 = 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑠𝑒𝑎𝑑𝑜 (0.10 , 0.05 , 0.01)

𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑓𝑖𝑛𝑖𝑡𝑎
𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑖𝑛𝑓𝑖𝑛𝑖𝑡𝑎
𝑆 ; 𝑆 𝑁−𝑛
𝑆𝑥̅ = 𝑆𝑥̅ = (√ )
√𝑛 √𝑛 𝑁−1
En la siguiente tabla se muestran los valores de "𝒛" para los niveles de confianza deseado.

Nivel de confianza deseado Nivel de significancia (𝛼) Valor de "𝒛"

90 % 0.10 1.645

95 % 0.05 1.96

99 % 0.01 2.58

Problema práctico 2.1

Se encuentra que la concentración promedio de zinc de una muestra de 36 tomas de agua


del Rio Valles es de 2.6 mg/l. Encuentre un intervalo de confianza al 95% para la
concentración media en el agua. Suponga que la desviación estándar de la población es de
0.3.

Tamaño de la muestra = 36

Media muestral ( 𝑋̅) = 2.6

Nivel de Confianza = 0.95

Desviación estándar poblacional (σ) = 0.3

El intervalo de confianza para la media poblacional, σ es conocida, por lo tanto, se utiliza Z.

Para resolverlo con Minitab, elegir la siguiente opción:

Estadísticas > Estadística básica > Z de 1 muestra

En el cuadro de diálogo de la figura 1, realiza el siguiente procedimiento:

Muestras en columnas: Se deja en blanco, solo se elige esta opción si ha ingresado


datos en columnas.

Datos resumidos: Selecciona esta opción. Al elegir esta opción se activan los conceptos
siguientes:
Tamaño de la muestra: Ingresa el valor para el tamaño de la muestra que es
36

Media: Ingresa el valor para la media de la muestra, en este caso es 2.6

Desviación estándar: Ingresa el valor para la desviación estándar de la población de 0.3

Realizar prueba de hipótesis: Se deja en blanco

En la parte inferior del cuadro de diálogo, solamente selecciona la parte de opciones.

Figura 1. Cuadro de diálogo de Z de una muestra

Al dar clic en Opciones, aparece un segundo cuadro de diálogo como se muestra en la


figura 2 que nos sirve para definir el intervalo de confianza y realiza lo siguiente:
Figura 2. Cuadro de diálogo para definir los intervalos
de confianza

Nivel de confianza: Escriba el IC que se desea calcular, en este problema es el 95%

Hipótesis Alterna: Se deja por default

Aceptar y nuevamente aceptar

Los resultados obtenidos aparecen en la pantalla de sesión

Z de una muestra

La desviación estándar supuesta = 0.3

Error
estándar
de la
N Media media IC de 95%
36 2.6000 0.0500 (2.5020, 2.6980)

El resultado es 2.502 ≤ µ ≤ 2.698

Interpretación:

Con un nivel de confianza al 95% se puede afirmar que la concentración media de zinc en
agua en la población se encuentre en 2.502 mg/l y 2.698 mg/l.
Problema práctico 2.2

En una ciudad se eligieron al azar 31 muestras de las temperaturas más altas que se han
registrado en °C, las cuales fueron: 32, 31, 33, 36, 38, 32, 31, 30, 31, 31, 35, 34, 29, 30, 32,
31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

Construya un intervalo del 90% de confianza para conocer temperatura media poblacional.

Con mucha frecuencia los estadísticos recomiendan que incluso cuando no sea posible
suponer la normalidad, se desconoce σ y n ≥ 30, σ se puede reemplazar con 𝑆 para poder
utilizar el intervalo de confianza, como se presenta en este ejemplo, donde, n = 31 y se
desconoce σ.

Con el uso de Minitab se procede a realizar lo siguiente:

En la hoja de trabajo, en la columna 1 escriba el nombre de la variable “temperatura”,


posteriormente introduzca los 31 datos de las temperaturas máximas registradas, Ver figura
3.

Figura 3. Captura de datos en la hoja de trabajo en Minitab

Calcula la media y la desviación estándar muestral con la siguiente opción:

Estadísticas > Estadística básica > Mostrar estadísticas descriptivas


En el cuadro de diálogo realizar el siguiente procedimiento:

Variable: Selecciona la columna C1

Por Variables (Opcional): Deja en blanco

En la parte inferior del cuadro de diálogo selecciona estadísticas.

La figura 4 muestra el procedimiento del cuadro de diálogo.

Figura 4. Cuadro de diálogo del comando


mostrar estadísticas descriptivas.

En el siguiente cuadro de diálogo aparecen todos los elementos que contienen.

Da clic en ninguna para desactivar todos los elementos y posteriormente, selecciona la


media y desviación estándar y da aceptar, como se muestra en la figura 5. En la hoja de
sesión aparece el resultado.
Figura 5. Selección de los elementos del comando de
estadística descriptiva

Los resultados obtenidos son:

Estadísticas descriptivas: C1

Variable Media Desv.Est.


C1 31.452 2.188

Posteriormente calcula la media poblacional a un intervalo de confianza del 90% con Z de


una muestra con la siguiente instrucción:

Estadísticas > Estadística básica > Z de 1 muestra

En el cuadro de diálogo realiza el siguiente procedimiento:

Muestras en columnas: Selecciona C1

Datos resumidos: Se deja en blanco

Desviación estándar: Ingresa el valor para la desviación estándar de la muestra que se


calculó anteriormente que es de 2.188

Realizar prueba de hipótesis: Se deja en blanco

En la parte inferior del cuadro de diálogo, solamente selecciona la parte de opciones.

Nivel de confianza: Escriba 90


Hipótesis alterna: Se deja por default.

Da aceptar y nuevamente aceptar

Los resultados son los siguientes:

Z de una muestra: C1

La desviación estándar supuesta = 2.188

Error
estándar
de la
Variable N Media Desv.Est. media IC de 90%
C1 31 31.452 2.188 0.393 (30.805, 32.098)

Interpretación:

La temperatura media poblacional máxima alcanzada a un intervalo de confianza al 90%


oscila entre 30.8 y 32.1

Problema práctico 2.1

El contenido de siete contenedores similares de ácido sulfúrico son 9.8, 10.2, 10.4, 9.8,
10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos
los contenedores si se supone una distribución aproximadamente normal.

Con el uso de Minitab se procede a realizar lo siguiente:

En la hoja de trabajo de Minitab, en la columna 1 introducir los datos del contenido de ácido
sulfúrico de los siete contenedores. Si desea da un nombre a la variable aleatoria, por
ejemplo se le puede nombrar “litros”, en la parte sombreada de la columna 1, esto es
opcional.

Calcula la media y la desviación estándar de la muestra con la instrucción:

Estadísticas > Estadística básica > Mostrar estadísticas descriptivas


En el cuadro de diálogo realizar el siguiente procedimiento:

Variable: Selecciona la columna C1

Por Variables (Opcional): Deja en blanco

En la parte inferior del cuadro de diálogo selecciona estadísticas.

En el siguiente cuadro de diálogo aparecen todos los elementos que contienen.

Da clic en ninguna para desactivar todos los elementos y posteriormente, selecciona la


media y desviación estándar, da aceptar y nuevamente aceptar.

En la Hoja de sesión aparece el resultado.

Estadísticas descriptivas: C1

Variable Media Desv.Est.


C1 10.000 0.283

Posteriormente calcula la media poblacional a un intervalo de confianza del 95% con la


utilización de “t”, porque el tamaño de la muestra es pequeño (n = 7) y se desconoce σ.

La instrucción es:

Estadísticas > Estadística básica > t de 1 muestra

En el cuadro de diálogo realiza el siguiente procedimiento:

Muestras en columnas: Selecciona C1

Datos resumidos: Se deja en blanco

Realizar prueba de hipótesis: Se deja en blanco

En la parte inferior del cuadro de diálogo, solamente selecciona la parte de opciones.

Nivel de confianza: Escriba 95

Hipótesis alterna: Se deja por default.

Da aceptar

Si se quiere visualizar la representación gráfica de la distribución t, se selecciona la opción


de gráficas
Selecciona histograma de datos o la gráfica de los valores individuales.

Los resultados que aparecen en la hoja de sesión, son los siguientes:

T de una muestra: C1

Error
estándar
de la
Variable N Media Desv.Est. media IC de 95%
C1 7 10.000 0.283 0.107 (9.738, 10.262)

En la figura 6 se muestran la representación gráfica del histograma y de valores individuales

Figura 6. Representación gráfica del histograma y de valores individuales con un IC


del 95%

Interpretación.

Con un nivel de confianza del 95% se sabe que el promedio del contenido de los
contenedores está entre 9.74 y 10.26 litros.

3. Intervalo de Confianza para la diferencia de dos medias


En esta sección se verá el caso en donde se tienen dos poblaciones con varianzas
desconocidas y n es pequeña, y se desea encontrar un intervalo de confianza para la
diferencia de dos medias µ1-µ2, esto es porque Minitab cuenta solamente con la opción de
t de 2 muestras.

Si los tamaños de muestras n1 y n2 son mayores que 30, entonces, puede emplearse el
intervalo de confianza de la distribución normal. Sin embargo, cuando se toman muestras
pequeñas se supone que las poblaciones de interés están distribuidas de manera normal,
y los intervalos de confianza se basan en la distribución t.

El intervalo de confianza se construye de manera similar a como se estima el de una media,


excepto que el error estándar de la distribución muestral que corresponde en este caso al
de la diferencia entre medias.

3.1 Intervalo de confianza de la diferencia de dos muestras con 𝝈 conocida

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒 𝜎1 2 𝜎2 2
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 = (𝑥̅1 − 𝑥̅2 ) ± 𝑧(𝜎𝑥̅1 −𝑥̅ 2 ) 𝑠𝑖 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎 𝑑𝑜𝑛𝑑𝑒 𝜎𝑥̅1 −𝑥̅2 = √ +
𝜇1 − 𝜇2 𝑛1 𝑛2

3.2 Intervalo de confianza de la diferencia de dos muestras con 𝝈 desconocida y n >


30

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 = (𝑥̅1 − 𝑥̅2 ) ± 𝑧(𝑆𝑥̅1 −𝑥̅2 ) 𝑠𝑖 𝑛𝑜 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎 𝑦 𝑛 > 30
𝜇1 − 𝜇2

𝑆1 2 𝑆2 2
𝑑𝑜𝑛𝑑𝑒 𝑆𝑥̅1 −𝑥̅2 = √ +
𝑛1 𝑛2

3.2 Intervalo de confianza de la diferencia de dos muestras con 𝝈 desconocida y n <


30

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 = (𝑥̅1 − 𝑥̅2 ) ± 𝑡(𝑔. 𝑙. , 𝛼⁄2)(𝑆𝑥̅1 −𝑥̅ 2 ) 𝑠𝑖 𝑛𝑜 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎 𝑦 𝑛 < 30
𝜇1 − 𝜇2
(𝑆1 2 )(𝑛1 − 1) + (𝑆2 2 )(𝑛2 − 1)
𝑑𝑜𝑛𝑑𝑒 𝑔. 𝑙. = 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 = 𝑛1 + 𝑛2 − 2 𝜎̂ 2 =
𝑛1 + 𝑛2 − 2

𝜎̂ 2 𝜎̂ 2
𝑆𝑥̅1 −𝑥̅2 = √ +
𝑛1 𝑛2

Problema práctico 3.1

Los compuestos con base de resina se usan en odontología restauradora. El artículo


“Reduction of Polymerization Shrinkage Stress and Marginal Leakage Using Soft-Start
Polymerization” (C. Ernst, N. Brand y colaboradores, en Journal of Esthetic and Restorative
Dentistry, 2003:93-104) presenta una comparación de la dureza de la superficie de las
muestras curadas durante 40 segundos con fuerza constante con otra de 40 segundos con
la fuerza aumentando en forma exponencial. Quince muestras fueron curadas con cada
método. Las curadas con fuerza constante tuvieron promedio de dureza de superficie (en
N/mm2) de 400.9 con desviación estándar de 10.6. Las curadas con fuerza que aumenta
exponencialmente tenían una dureza de superficie promedio de 367.2 con desviación
estándar de 6.1. Determine un intervalo de confianza de 98% para la diferencia en las
medias de la dureza entre las muestras curadas por los dos métodos si las varianzas
poblacionales son iguales.

Si 𝑋̅1 = 400.9, 𝑆1 =10.6, 𝑋̅2 = 367.2 y 𝑆2 =6.1, el tamaño de ambas muestras es de n = 15,
como se desconoce σ y el tamaño de la muestra es pequeño se utiliza la expresión 3.1 con
“t”

Para resolverlo con Minitab se describe el siguiente procedimiento:

Estadísticas > Estadística básica > t de 2 muestras

En el cuadro de diálogo realiza lo siguiente de acuerdo a cada uno de los elementos que la
componen (ver figura 7)

Muestras en una columna: Elija esta opción si los datos de las muestras se encuentran
en una columna individual. Por lo tanto se deja sin seleccionar.
Muestras en diferentes columnas: Elija esta opción si los datos de las dos muestras están
en columnas separadas. Se deja sin seleccionar.

Datos resumidos (diferencias): Elija esta opción para introducir los datos. Al seleccionar
esta opción se activan los siguientes elementos e
introduzca los datos que se piden:

Tamaño de la muestra: Media: Desviación estándar:

Primero: 15 400.9 10.6

Segundo: 15 367.2 6.1

Asumir varianzas iguales: Marca esta opción cuando las varianzas poblacionales son
iguales.

Figura 7. Cuadro de diálogo de intervalo de confianza


para t de 2 muestras.

En la parte inferior del cuadro de diálogo selecciona Opciones y realiza lo siguiente (ver
figura 8):

Nivel de confianza: Ingresa el nivel de confianza que desea. El valor es 98

Diferencia de la prueba: Se deja por default, es decir no modificar.


Hipótesis alterna: Se deja por default.

Da Aceptar y nuevamente aceptar.

Figura 8. Cuadro de diálogo de la herramienta de


opciones de t de 2 muestras.

Los resultados que se muestran en la hoja de sesión son:

Prueba T de dos muestras e IC

Error
estándar
de la
Muestra N Media Desv.Est. media
1 15 400.9 10.6 2.7
2 15 367.20 6.10 1.6

Diferencia = mu (1) - mu (2)


Estimado de la diferencia: 33.70
IC de 98% para la diferencia: (25.91, 41.49)
Prueba T de diferencia = 0 (vs. no =): Valor T = 10.67 Valor P =
0.000 GL =
28
Ambos utilizan Desv.Est. agrupada = 8.6478

Interpretación:

El intervalo de confianza de 98% para la diferencia en las medias de la dureza entre las
muestras curadas por los dos métodos es de 25.91 a 41.49 con una desviación estándar
poblacional de 8.65.
MATERIALES Y EQUIPO

Práctica Impresa

Calculadora

Software Minitab 16

PROCEDIMIENTO
Resuelva las siguientes actividades con el uso de Minitab.

Actividad 1

Las concentraciones de Zinc que se sacan del agua de 7 en sitios diferentes son: 2.5, 2.4,
2.6, 2.65, 2.76, 2.8, 2.71 gramos por mililitro. Encuentra el intervalo de confianza de 95%
para la concentración media de zinc en el río.

Actividad 2

En una explotación minera, las rocas excavadas se someten a un análisis químico para
determinar su contenido porcentual de cadmio. Se puede suponer que este contenido es
una variable con distribución normal de media µ y varianza σ2. Después de analizar 25
rocas se obtiene un contenido porcentual medio de 9.77 con una desviación típica de 3.164.
Construya un intervalo de confianza de nivel 95% para el contenido porcentual medio de
cadmio en la mina.

Actividad 3

La distribución de las mediciones diarias de ácido nítrico en el ambiente es


aproximadamente normal con una media de 1.18 μg/m3 y una desviación estándar de 0.95
μg/m3. Si se considera una muestra de 10 días construya un intervalo del 98 % de confianza
para la media poblacional.

Actividad 4

Se seleccionó una muestra de 12 detectores de radón y cada uno se expuso a 100 pCi/l
(picocuries por litro) de radón. Las lecturas resultantes fueron: 105.6, 90.9, 91.2, 96.9, 91.3,
100.0, 105.0, 99.6, 107.7, 103.3, 92.4 y 96.5. Considerando que la distribución de las
lecturas es normal, construir e interpretar un intervalo del 99% de confianza para la lectura
media poblacional.

Actividad 5

Los datos que a continuación se dan son los pesos en kilogramos del contenido de 16
muestras de recolección de basura en una comunidad con el propósito de verificar el peso
promedio: 5.06, 5.08, 4.99, 5.03, 5.04, 5.10, 4.97, 5.12, 5.14, 5.05, 4.93, 4.96, 5.06, 5.02,
5.09, 4.96. Si el peso de cada muestra de basura es una variable aleatoria normal con un
desviación estándar de 0.05 kilos obtener un intervalo del 90% de confianza para la media
poblacional.

Actividad 6

Un científico interesado en vigilar contaminantes químicos en alimentos y, por lo tanto, la


acumulación de contaminantes en la dieta humana, seleccionó una muestra aleatoria de n
= 50 adultos hombres. Se encontró que el promedio de ingesta diaria de productos lácteos
fue de 𝑋̅ = 756 gramos por día, con una desviación estándar de s = 35 gramos por día. Use
esta información muestral para construir un intervalo de confianza de 95%para la ingesta
diaria media de productos lácteos para hombres.

Actividad 7

Se midió cinco veces el contenido de carbono (en partes por millón) para cada una de las
dos placas de silicio diferentes.

Las mediciones fueron:


Placa A: 1.10, 1.15, 1.16, 1.10, 1.14

Placa B: 1.20, 1.18, 1.16, 1.18, 1.15

Determine un intervalo de confianza de 99% para la diferencia en contenido de carbono


entre las dos placas si las varianzas poblacionales son diferentes.

Actividad 8

El artículo “Quality of the Fire Clay Coal Bed. Southeastern Kentuchy” (J. Hower, W.
Andrews y cols., en Journal of Coal Quality, 1994:13-26) contiene mediciones acerca de
muestras de carbón en algunos condados de Kentucky. En unidades de porcentajes de
ceniza, cinco muestras del condado de Knott tenían un promedio de dióxido de aluminio
(AlO2) de 32.17 y desviación estándar de 2.23. Seis muestras de condado de Leslie tenían
un promedio de contenido de AlO2 de 26.48 y desviación estándar de 2.02. Determine un
intervalo de confianza de 98% para la diferencia en el contenido de AlO2 contenido entre
las muestras de carbón de los dos condados.

SUGERENCIAS DIDÁCTICAS
Resolver cada uno de las actividades con el apoyo de tablas y formulas con el fin de
comparar los resultados.

Retomar el caso práctico del tema de muestreo y calcular el intervalo de confianza para la
media al 95 y al 99 %.
Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 13 Intervalos de confianza para la
Ambiental varianza con MINITAB

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Manejar los diferentes tipos de intervalos de confianza de acuerdo


a ciertos casos y hacer inferencias sobre los parámetros de una población a través de una
serie de ejercicios prácticos con el manejo de Minitab.

INTRODUCCIÓN

1. Intervalos de Confianza para una varianza poblacional (𝛔𝟐 )


En algunas ocasiones el interés de la inferencia se centra, no sobre la media de la
población, sino sobre su varianza.

Por consiguiente, es necesario que seamos capaces, no solamente de encontrar una


estimación puntual de la varianza poblacional, sino también de construir un intervalo de
confianza relativo a este parámetro.

Para construir un intervalo de confianza para la varianza de la población se toma como base
para el cálculo de probabilidades la distribución chi-cuadrada.
Los limites para un intervalo de confianza de la varianza poblacional del (1 - ) % pueden
encontrarse considerando la partición de la curva de la distribución, figura 1.

Figura 1. Representación gráfica de Chi-cuadrada

Si se tiene una población de valores con distribución normal, puede mostrarse que las
distribuciones 𝜒 2 ( 𝑗𝑖 − 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑎) son las distribuciones de probabilidad apropiadas para la
razón:

(𝑛 − 1)𝑆 2
𝜎2

Existe una distribución 𝜒 2 distinta para los diferentes valores (𝑛 − 1) que representan los
grados de libertad, asi:

(𝑛 − 1)𝑆 2
𝜒 2 𝑔. 𝑙. =
𝜎2

Como la varianza muestral es el estimador insesgado de la varianza poblacional, el valor


esperado a largo plazo del cociente anterior es igual a los grados de libertad (𝑛 − 1), sin
embargo en el caso de la mayoría de las muestras la varianza muestral no es idéntica a la
varianza poblacional.

Como se sabe que el cociente anterior tiene una distribución 𝜒 2 , puede utilizarse esta
distribución para realizar inferencias estadísticas acerca de varianzas o desviaciones
desconocidas.
Las distribuciones 𝜒 2 no son simétricas, por ello, un intervalo de confianza de dos extremos
para una varianza requiere de dos valores distintos de 𝜒 2 , en vez del método ± que se
utilizo en los intervalos de confianza que se basan en la distribución normal.

Para construir intervalos de confianza para una varianza poblacional se utiliza la siguiente
formula:

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒 (𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2


𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 = 2 2
≤ 𝜎 ≤
𝜒 (𝑔. 𝑙. , 𝛼⁄2 ) 𝜒 2 (𝑔. 𝑙. , 1 − 𝛼⁄2 )
𝜎2

Dónde: 𝑔. 𝑙. = 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 = 𝑛 − 1 ; 𝛼 = 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎

Con esta fórmula se puede encontrar el intervalo de confianza correspondiente para la


desviación estándar, σ, obteniendo las raíces cuadradas de los límites de confianza para la
varianza.

Problema práctico 1.1

En 16 recorridos de prueba, el consumo de gasolina de un motor experimental tuvo una


desviación estándar de 2.2 litros. Construir un intervalo de confianza del 99% para la
varianza y para la desviación estándar esperadas de este motor.

Si se desea construir un intervalo de confianza al 99%, se tiene que el tamaño de la muestra


(n =16) y la desviación estándar de la muestra (S = 2.2), se puede resolver haciendo uso
de Minitab con la siguiente instrucción:

Estadísticas > Estadísticas básicas > 1 varianza

El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 2)

Datos: Elija uno de los siguientes elementos de la lista desplegable de acuerdo a los datos
del problema, en este caso se conoce desviación estándar de la muestra. Al
seleccionar esta opción se activa:

Tamaño de muestra: Ingresa el tamaño de la muestra en este caso n = 16


Desviación estándar de la muestra: Ingresa la desviación estándar de la muestra que es
2.2

Realizar prueba de hipótesis: No seleccionar

En la parte inferior del cuadro de diálogo selecciona Opciones

Figura 2. Cuadro de diálogo de 1 varianza

Al dar clic en Opciones, aparece un segundo cuadro de diálogo como se muestra en la


figura 3 que sirve para definir el intervalo de confianza y realiza lo siguiente:

Nivel de confianza: Escriba el IC que se desea calcular, en este problema es el 95%

Hipótesis Alterna: Se deja por default

Aceptar y nuevamente aceptar


Figura 3. Cuadro de diálogo para definir los intervalos
de confianza

Los resultados obtenidos aparecen en la pantalla de sesión

Prueba y CI para una varianza

Método

El método de chi-cuadrada sólo se utiliza para la


distribución normal.
El método de Bonett no se puede calcular con datos
resumidos.

Estadísticas

N Desv.Est. Varianza
16 2.20 4.84

Intervalos de confianza de 99%

IC para IC para
Método Desv.Est. varianza
Chi-cuadrada (1.49, 3.97) (2.21, 15.78)

Para calcular el IC para la desviación estándar se saca raíz cuadrada a cada uno de los
valores obtenidos de la varianza, es decir √2.21 𝑦 √15.78.
Interpretación:

El consumo de gasolina que se espera obtener para el motor a un intervalo de confianza


del 99% tiene una varianza de 2.21 a 15.78 litros, y una desviación estándar de 1.49 a 3.97
litros.

Problema práctico 1.2

Se extrajo una muestra aleatoria de 16 plantas para estimar la varianza en la concentración


de cobre. Las plantas fueron quemadas, y se analizaron las cenizas. Se obtuvieron las
siguientes observaciones con respecto a x (concentración de cobre (en partes por millón)
(supóngase que x está normalmente distribuida): 5, 8, 20, 3 , 50, 70, 34, 38, 25, 18, 43, 60,
27, 35, 19, 14. Calcule un intervalo de confianza del 90% de la varianza.

Resolver con Minitab requiere realizar el siguiente procedimiento:

Primeramente, introducir los datos en la columna 1, escriba un nombre a la variable, este


paso es opcional, ver figura 4.

Figura 4. Captura de datos en la hoja de sesión


El siguiente paso es conocer el IC para la varianza al 90%, se procede a realizar la siguiente
instrucción:

Estadísticas > Estadísticas básicas > 1 varianza

El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 5)

Datos: No se modifica

Columnas: Seleccionar la columna donde realizó la captura de datos, en este problema es


C1

Realizar prueba de hipótesis: No seleccionar

En la parte inferior del cuadro de diálogo selecciona Opciones

Figura 5. Cuadro de diálogo de 1 varianza seleccionando la opción


de columnas

Al dar clic en Opciones, aparece un segundo cuadro de diálogo, que sirve para definir el
intervalo de confianza y realiza lo siguiente:

Nivel de confianza: Escriba el IC que se desea calcular, en este problema es el 90%

Hipótesis Alterna: Se deja por default

Aceptar y nuevamente aceptar


Los resultados obtenidos aparecen en la pantalla de sesión

Prueba e IC para una varianza: C1

Método

El método de chi-cuadrada sólo se utiliza para la


distribución normal.
El método de Bonett se utiliza para cualquier
distribución continua.

Estadísticas

Variable N Desv.Est. Varianza


C1 16 19.4 377

Intervalos de confianza de 90%

IC para IC para
Variable Método Desv.Est. varianza
C1 Chi-cuadrada (15.0, 27.9) (226, 779)
Bonett (14.7, 28.5) (217, 814)

Interpretación:

El intervalo de confianza al 90% para la varianza en la concentración de cobre es de 226 a


779 ppm.

𝝈𝟏 𝟐⁄
2. Intervalos de confianza la razón de dos varianzas
𝝈𝟐 𝟐

Una de las distribuciones más importantes de la estadística aplicada es la distribución 𝐹.


El estadístico 𝐹 se define como la relación de dos variables aleatorias 𝜒 2 independientes,
cada una dividida por sus números de grados de libertad. De aquí que puede escribirse
que:

𝑈⁄
𝑔. 𝑙.1
𝐹=
𝑉⁄
𝑔. 𝑙.2

Donde 𝑈 y 𝑉 son variables aleatorias 𝜒 2 con sus respectivos grados de libertad.


Si 𝑆1 2 y 𝑆2 2 son varianzas de muestras independientes de tamaños 𝑛1 y 𝑛2 respectivamente,
de poblaciones normales, entonces un intervalo de confianza para la razón de dos
𝜎1 2⁄
varianzas es:
𝜎2 2

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 𝑆1 2 1 𝜎1 2 𝑆1 2
= ( 2) ( ) ≤ 2 ≤ ( 2 ) (𝐹𝛼⁄2 (𝑔. 𝑙.2 , 𝑔. 𝑙.1 ))
𝜎1 2⁄ 𝑆2 𝐹𝛼⁄2 (𝑔. 𝑙.1 , 𝑔. 𝑙.2 ) 𝜎2 𝑆2
𝜎2 2

Para la desviación estándar

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒
𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 = (𝑆1 ) ( 1
)≤
𝜎1 𝑆1
≤ ( ) (𝐹𝛼⁄ (𝑔. 𝑙.2 , 𝑔. 𝑙.1 ))
𝜎1 𝑆2 𝐹𝛼⁄2 (𝑔. 𝑙.1 , 𝑔. 𝑙.2 ) 𝜎2 𝑆2 2
⁄𝜎2

Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se


coloca la varianza muestral mayor en el numerador del estadístico F.

Problema Práctico 2.1

Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de


motores respecto al tiempo en minutos. Los resultados se muestran en la tabla siguiente:

Método 1 Método 2

n1 = 31 n2 = 25

𝑆12 = 50 𝑆22 = 24

𝜎1 2⁄
Construya un intervalo de confianza al 90 % para
𝜎2 2
El procedimiento para resolver problemas con dos varianzas en Minitab se realiza de la
siguiente manera: instrucción:

Con la instrucción: Estadísticas > Estadísticas básicas > 2 varianzas

El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 6)

Datos: Elija uno de los siguientes elementos de la lista desplegable de acuerdo a los datos
del problema, en este caso se conoce varianzas de la muestra.

Tamaño de la muestra: Varianza:

Primero: Ingresa la columna que contiene los datos para la primera muestra.

Segundo: Ingresa la columna que contiene los datos para la segunda muestra.

En la parte inferior del cuadro de diálogo selecciona Opciones

Figura 6. Cuadro de diálogo de 2 varianzas

Al dar clic en Opciones, aparece un segundo cuadro de diálogo como se muestra en la


figura 7 que sirve para definir el intervalo de confianza y realiza lo siguiente:

Nivel de confianza: Escriba el IC que se desea calcular, en este problema es el 95%


Relación hipotética: Se deja sin modificar

Hipótesis Alterna: Se deja por default, es decir sin modificar.

Aceptar y nuevamente aceptar

Figura 7. Cuadro de diálogo para definir los intervalos de confianza

Los resultados obtenidos aparecen en la pantalla de sesión:

Prueba e IC para dos varianzas

* NOTA * Las gráficas que no sean gráficas de intervalos no se pueden crear con
datos resumidos.

Método

Hipótesis nula Sigma(1) / Sigma(2) = 1


Hipótesis alterna Sigma(1) / Sigma(2) not = 1
Nivel de significancia Alfa = 0.1

Estadísticas

Muestra N Desv.Est. Varianza


1 31 7.071 50.000
2 25 4.899 24.000

Relación de deviaciones estándar = 1.443


Relación de varianzas = 2.083

Intervalos de confianza de 90%

IC para IC para
Distribución relación de relación de
de los datos Desv.Est. varianza
Normal (1.037, 1.983) (1.074, 3.932)

Pruebas

Estadística
Método GL1 GL2 de prueba Valor P
Prueba F (normal) 30 24 2.08 0.069
Además, automáticamente Minitab genera la representación gráfica de intervalos de la
desviación estándar de las dos muestras, figura 8.

Figura 8. Representación gráfica de Intervalos de la


desviación estándar de las dos muestras

Interpretación:

El intervalo de confianza para la relación de las dos varianzas al 90% es de 1.07 a 3.93
minutos para el ensamblaje de los motores por medio de los dos métodos.

3. Determinación del tamaño de la muestra

Al iniciar cualquier investigación, la primer pregunta que surge es: ¿de qué tamaño debe
ser la o las muestras?. La respuesta a esta pregunta se verá en esta sección, con conceptos
que ya se han visto a través de este material.

Dos factores controlan el total de la información relevante en una muestra:

 El plan de muestreo o diseño experimental: el procedimiento para reunir la


información
 El tamaño de la muestra n: la cantidad de información que recolecta.

Un investigador avanza poco si planea un experimento antes de resolver el problema del


tamaño muestral. ¿Cuántas mediciones debe incluir en la muestra? ¿Cuánta información
requiere recabar el investigador? La cantidad de información en la muestra la confiabilidad;
esta confiabilidad es la que debe especificar el investigad.or. En un problema de estimación
estadística, la exactitud de la estimación se mide por el margen de error y el intervalo de
confianza

3.1 Cálculo del Tamaño de la Muestra para Estimar una Media

¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la
media poblacional?. La respuesta depende del error estándar de la media, si este fuera
cero, entonces se necesitaría una sola media que será igual necesariamente a la media
poblacional desconocida µ, porque σ=0. Este caso extremo no se encuentra en la práctica,
pero refuerza el hecho de que mientras menor sea el error estándar de la media, menor es
el tamaño de muestra necesario para lograr un cierto grado de precisión.

Se estableció antes que una forma de disminuir el error de estimación es aumentar el


tamaño de la muestra, si éste incluye el total de la población, entonces |𝑥̅ − 𝜇|, sería igual
a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible
determinar un tamaño de la muestra tal que el error de estimación sea tan pequeño como
queramos, para ser más preciso, dado un nivel de confianza y un error fijo de estimación ε,
se puede escoger un tamaño de muestra n tal que P (|𝑥̅ − 𝜇| < 𝜀)=nivel de confianza. Con
el propósito de determinar n. El error máximo de estimación está dado por:

𝑧𝜎
𝜀=
√𝑛

Si se eleva al cuadrado ambos lados de esta ecuación y se despeja n de la ecuación


resultante, obtenemos:

𝑧𝜎 2
𝑛=( )
𝜀

Como n debe de ser un número entero, redondeamos hacia arriba todos los resultados
fraccionarios.

En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de
estimación se convierte en:
𝑧𝜎𝑁−𝑛
𝜀= √
√𝑛 𝑁 − 1

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

𝑧2𝜎2𝑁
𝑛=
𝜀 2 (𝑁 − 1) + 𝑧 2 𝜎 2

Problema práctico 3.1

Un biólogo quiere estimar el peso promedio de los ciervos cazados en el estado de


Maryland. Un estudio anterior de diez ciervos cazados mostró que la desviación estándar
de sus pesos es de 12.2 libras. ¿Qué tan grande debe ser una muestra para que el biólogo
tenga el 95% de confianza de que el error de estimación es a lo más de 4 libras?

Con Minitab solo se puede determinar el tamaño de las muestras para poblaciones infinitas.

Para calcular el tamaño de la muestra para la media si la distribución es normal, se sigue


la instrucción:

Estadísticas > Potencia y tamaño de la muestra > Tamaño de la muestra para


estimación

En el cuadro de diálogo se muestran los siguientes elementos como se muestra en


la figura 9:

Parámetro: Elija el parámetro de interés, en este problema es la Media (Normal)

Valor de planificación El valor de planificación necesario depende del parámetro elegido.

Desviación estándar: Ingresa la desviación estándar que es de 12.2

Estimar tamaños de muestra: Elija esta opción para estimar los tamaños de muestra
necesarios para alcanzar los márgenes de error
especificados.

Márgenes de error para los intervalos de confianza: Ingresa los márgenes de error que
desee utilizar para estimar los tamaños de la muestra, siendo el valor de 4 para este
problema.
En la parte inferior del cuadro de diálogo se selecciona opciones:

Figura 9. Cuadro de diálogo para calcular el tamaño de la muestra para la


media con una distribución normal.

Al dar clic en Opciones, aparece un segundo cuadro de diálogo como se muestra en la


figura 10 que sirve para definir el intervalo de confianza y realiza lo siguiente:

Nivel de confianza: Ingresa el nivel de confianza. El valor es 95.

Intervalo de confianza: Elija un intervalo de confianza bilateral, unilateral inferior o


unilateral superior. Se selecciona bilateral, es decir de dos colas.

Suponer que la desviación estándar de la población se conoce: Marca esta opción si


se conoce la desviación estándar de la población (s). Esta opción
sólo está disponible cuando el parámetro de interés es la Media
(Normal). Marca esta opción.

Aceptar y nuevamente aceptar


Figura 10. Cuadro de diálogo para definir los intervalos de confianza
para calcular el tamaño de la muestra de la media normal.

Los resultados obtenidos aparecen en la pantalla de sesión:

Tamaño de la muestra para estimación

Método

Parámetro Media
Distribución Normal
Desviación estándar 12.2 (valor de población)
Nivel de confianza 95%
Intervalo de confianza Bilateral

Resultados

Tamaño
Margen de la
de error muestra
4 36

El tamaño de la muestra para la media con un intervalo de confianza al 95% con una
distribución normal es de 36.

3.2 Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Medias

Si se recuerda a la distribución muestral de diferencia de medias se tiene que error está


dado por:
𝜎12 𝜎22
𝜀=𝑧 √ +
𝑛1 𝑛2

En esta ecuación se nos pueden presentar dos casos:

 Los tamaños de muestra son iguales.


 Los tamaños de muestra son diferentes,

Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se


despeja n ya que n1 es igual a n2

𝑧 2 (𝜎12 + 𝜎22 )
𝑛=
𝜀2

“Para un problema de dos muestras cuando los tamaños son iguales, establezca n1 = n2 =
n y se resuelve la ecuación por la de una muestra”:

𝑧𝜎 2
𝑛=( )
𝜀

Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza cuando
las poblaciones son de diferente tamaño y se sabe que una es K veces mayor que la otra.

𝑧 2 (𝜎12 +𝑘𝜎22 )
n1=kn2 𝑛1 =
𝑘𝜀 2

Problema práctico 3.2

Un director de personal desea comparar la efectividad de dos métodos de capacitar


empleados industriales a realizar cierta operación de ensamble. Un número de empleados
se ha de dividir en dos grupos iguales: el primero recibiendo capacitación del método 1 y,
el segundo, el método de capacitación 2. Cada uno efectuará la operación de ensamble y
el tiempo de ensamblado se registrará. Se espera que las mediciones para ambos grupos
tendrán una variación de alrededor de 8 minutos. Para que la estimación de la diferencia
en tiempos medios de ensamble sea correcta a no más de 1 minuto de variación, con una
probabilidad igual a 0.95, ¿cuántos trabajadores deben estar incluidos en cada grupo de
capacitación?

Se sabe que el error de la estimación 𝜀 ≤ 1 𝑚𝑖𝑛𝑢𝑡𝑜

El rango de las varianzas: 𝜎12 + 𝜎22 = 8 𝑚𝑖𝑛𝑢𝑡𝑜𝑠, por lo tanto el rango de las desviaciones
estándar 𝜎1 + 𝜎2 = √8 = 2.828

n1 = n2 = n, se utiliza la ecuación para determinar el tamaño de una muestra.

Resolverlo con Minitab se sigue la instrucción igual que el problema anterior:

Estadísticas > Potencia y tamaño de la muestra > Tamaño de la muestra para


estimación

En el cuadro de diálogo se muestran los siguientes elementos:

Parámetro: Elija la Media (Normal)

Valor de planificación

Desviación estándar: Ingresa 2.828

Estimar tamaños de muestra: Elija esta opción

Márgenes de error para los intervalos de confianza: Ingresa el valor de 1.

En la parte inferior se selecciona opciones y aparecen los siguientes elementos en el


cuadro de diálogo:

Nivel de confianza: Ingresa el valor es 95.

Intervalo de confianza: Elija bilateral

Suponer que la desviación estándar de la población se conoce: Marca esta opción.

Aceptar y nuevamente aceptar

En la hoja de sesión aparece la siguiente información:


Tamaño de la muestra para estimación

Método

Parámetro Media
Distribución Normal
Desviación estándar 2.828 (valor de población)
Nivel de confianza 95%
Intervalo de confianza Bilateral

Resultados

Tamaño
Margen de la
de error muestra
1 31

Interpretación:

Para un intervalo de confianza del 95% y con un margen de error no mayor a 1 minuto el
tamaño de la muestra (n) es de 31 obreros.

Caso práctico 3.3

En una zona se desea saber el número de tubérculos mayores de 6 pulgadas de diámetro


que tiene en promedio una planta de papa. Las parcelas están repartidas en tres ranchos
con diferentes condiciones climáticas, así que se planea un muestreo estratificado. En el
primer rancho se muestrearon 10 plantas de 900, en el segundo rancho 12 plantas de 1100
y en el tercero 12 de 1050. Con los datos que se muestran a continuación encontrar la
media general con su intervalo de confianza al 95% de seguridad y con el tamaño de
muestra para tener un error máximo de 0.5

Rancho 1 4 5 4 4 5 5 6 4 4 5
Rancho 2 4 5 5 4 5 6 6 6 5 6 5 6
Rancho 3 7 6 6 7 5 6 4 4 5 5 6 6

Para Resolverlo con Minitab proceda a capturar de todos los datos en la columna 1 en la
hoja de trabajo y si se desea escriba un nombre a la variable, como se muestra en la figura
11.
Figura 11. Hoja de trabajo con datos registrados
en pulgadas en la columna 1 de los
tres ranchos.

Calcula la media, la varianza y la desviación estándar de todas las muestras con la siguiente
opción:

Estadísticas > Estadística básica > Mostrar estadísticas descriptivas.

En el cuadro de diálogo realiza el siguiente procedimiento:

Variables: Selecciona C1 “pulgadas”

Por variables (opcional): Deja en blanco

En la parte inferior del cuadro de diálogo selecciona Estadísticas:

Da clic en Ninguna para desmarcar todos los elementos.

Selecciona la Media, varianza y desviación estándar

Da Aceptar y nuevamente Aceptar

Los resultados que se muestran en la hoja de sesión son:


Estadísticas descriptivas: Pulgadas

Variable Media Desv.Est. Varianza


Pulgadas 5.176 0.904 0.816

Para calcular el intervalo de confianza al 95% para la muestra realiza lo siguiente:

Como n el tamaño de las muestras es n > 30 se calcula Z.

Estadística > Estadística básica > Z de 1 muestra

a) En el cuadro de diálogo de Z de 1 muestra realiza el procedimiento siguiente:

Muestras en columnas: Selecciona la columna C1 “pulgadas”

Datos resumidos: Se deja sin seleccionar

Desviación estándar: Escriba el valor de 0.904 que se calculo anteriormente.

Realizar prueba de hipótesis: Se deja sin seleccionar

En la parte inferior del cuadro de diálogo selecciona Opciones:

b) En el cuadro de diálogo de opciones realiza lo siguiente:

Nivel de confianza: Escriba el 95

Hipótesis alterna: No se modifica

Da Aceptar y nuevamente aceptar

En la hoja de sesión se muestran los resultados, los cuales son:

Z de una muestra: Pulgadas

La desviación estándar supuesta = 0.904

Error
estándar
de la
Variable N Media Desv.Est. media IC de 95%
Pulgadas 34 5.176 0.904 0.155 (4.873, 5.480)

El Intervalo de confianza para la media al 95 % es de 4.87 a 5.48


Para Calcular el tamaño de la muestra al 95% y con un error máximo al 0.5 realiza lo
siguiente:

Estadística > Potencia y tamaño de muestra > Tamaño de la muestra para estimación

En el cuadro de diálogo para el tamaño de la muestra realiza el procedimiento:

Parámetro: Selecciona la Media (Normal)

Valor de planeación

Desviación estándar: Anota el valor 0.904

Estimar tamaño de muestras: No modificar

Márgenes de error para los intervalos de confianza: Anota el valor del erro 0.5

Selecciona Opciones

En el cuadro de diálogo de opciones realiza lo siguiente con cada uno de los elementos:

Nivel de confianza: Escriba el 95

Intervalo de confianza: Selecciona bilateral

Suponer que la desviación estándar poblacional se conoce: Da clic para seleccionar

Da Aceptar y nuevamente Aceptar

Los resultados aparecen en la hoja de sesión y estos son:

Tamaño de la muestra para estimación

Método

Parámetro Media
Distribución Normal
Desviación estándar 0.904 (valor de población)
Nivel de confianza 95%
Intervalo de confianza Bilateral

Resultados

Tamaño
Margen de la
de error muestra
0.5 13

El tamaño de la muestra con un margen de error de 0.5 es de 13


MATERIALES Y EQUIPO

Práctica Impresa

Calculadora

Software Minitab 16

PROCEDIMIENTO
Resuelva las siguientes actividades con el uso de Minitab.

Actividad 1

El artículo “Occurrence and Distribution of Ammonium in Iowa Groundwater” (K. Schilling,


en Water Environment Research, 2002:177-186) describe las mediciones de las
concentraciones de amonio (en mg/l) para gran número de pozos en Iowa. Éstos incluían
349 pozos aluviales y 143 pozos cuaternarios. Las concentraciones en los pozos aluviales
tenían una desviación estándar de 0.40 y los pozos cuaternarios una desviación estándar
de 1.70. Determine un intervalo de confianza de 95% para la razón de las varianzas de las
concentraciones de los pozos aluviales y los cuaternarios.

Actividad 2

El administrador de una planta industrial generadora de energía desea estimar, por


intervalo, la variabilidad de la cantidad de carbón que se consumió semanalmente durante
año pasado. Para ello toma una muestra de 10 semanas. Si la desviación estándar muestral
es de 700 toneladas. Construya un intervalo de confianza del 95% para la desviación
estándar poblacional.
Actividad 3

Se midió cinco veces el contenido de carbono (en partes por millón) para cada una de las
dos placas de silicio diferentes. Las mediciones fueron:

Placa A: 1.10, 1.15, 1.16, 1.10, 1.14

Placa B: 1.20, 1.18, 1.16, 1.18, 1.15

Determine un intervalo de confianza de 99% para el coeficiente de las dos varianzas en


contenido de carbono entre las dos placas.

Actividad 4

Se toman cinco mediciones de la clasificación de octano para un tipo especial de gasolina.


Los resultados (en %) son 87.0, 86.0, 86.5, 88.0, 85.3. Encuentre un intervalo de confianza
de 99% para la varianza de la clasificación de octano para este tipo de gasolina.

Actividad 5

Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento
en la industria: Se conoce que el peso de un saco que se llena con este instrumento es una
variable aleatoria con distribución normal. Si se supone que la desviación estándar del peso
es de 0.5 Kg. Determina el tamaño de muestra aleatoria necesaria para determinar una
probabilidad igual a 0.95 de que el estimado y el estimado se diferencien mutuamente en
menos de 0.1 Kg.

Actividad 6

Se encuentra que la concentración promedio de zinc que se obtiene en una muestra de


mediciones en 36 sitios diferentes de un rio es de 2.6 gramos por mililitro. Que tan grande
debe ser la muestra si quiere tener 95% de confianza en que nuestra estimación de μ diferirá
por menos de 0.05. Suponga que la desviación estándar de la población es de 0.3 gramos
por mililitro.
Actividad 7

Suponga que se desea estimar el pH medio de lluvia en una zona que sufre de fuerte
contaminación debida a la descarga de humo de una planta generadora de electricidad. Se
sabe que σ está en la cercanía de 0.5 pH y que se desea estimar que se encuentre dentro
de 0.1 de m, con una probabilidad cercana a 0.95. ¿Aproximadamente cuántas
precipitaciones de lluvia deben incluirse en su muestra (una lectura de pH por lluvia)?

Actividad 8

Una agencia estatal tiene la responsabilidad de vigilar la calidad de agua para la cría de
peces con fines comerciales. Esta agencia se encuentra interesada en comparar la
variación de cierta sustancia tóxica en dos estuarios cuyas aguas se encuentran
contaminadas por desperdicios industriales provenientes de una zona industrial cercana.
En el primer estuario se seleccionan 11 muestras y en el segundo 8, las cuales se enviaron
a un laboratorio para su análisis. Las mediciones en ppm que se observaron en cada
muestra son las siguientes:

Niveles de sustancia tóxica (en ppm)

Estuario 10 10 12 13 9 8 12 12 10 14 8
1

Estuario 11 8 9 7 10 8 8 10
2

Si se supone que el muestreo se hizo sobre dos poblaciones independientes distribuidas


normalmente, obtener un intervalo de confianza estimado del 95% para el cociente de las
𝜎2
dos varianzas no conocidas 1⁄ 2 .
𝜎2

Actividad 9

Suponga que se desea estimar la diferencia entre la acidez media de las lluvias de dos
lugares diferentes, uno en una zona poco contaminada unto al mar y el otro en un área muy
contaminada. Si desea que su estimación sea correcta al 0.1 de pH más cercano, con una
probabilidad de 0.90, ¿cuántos valores de pH tendrían que incluirse en cada muestra?
Asuma que la varianza de las mediciones del pH es 0.25 para cada lugar y que las muestras
serán de igual tamaño.

SUGERENCIAS DIDÁCTICAS
Elaborar un caso práctico con base en la utilización de los diferentes tipos de muestreo y
obtener las muestras para calcular los tamaños de la muestra.

Resolver las actividades de manera manual con la utilización de fórmulas y tablas.


Carrera: Plan de Estudios Clave de la Asignatura:
Ingeniería Ambiental IAMB-2010-206 AMF-1019
Nombre de la Asignatura Práctica No. Nombre de la Práctica
Probabilidad y Estadística 14 Prueba de hipótesis para la
Ambiental media y diferencia de medias
con MINITAB

Competencias a desarrollar:

Solución de Problemas.

Habilidad en el uso de las tecnologías de la información y comunicación.

Capacidad de aplicar los conocimientos en la práctica.

Objetivo específico: Resolver problemas teóricos y prácticos sobre contrastes de


hipótesis, para diferentes condiciones y hacer las conclusiones correspondientes.

INTRODUCCIÓN
En una investigación no solo se requiere estimar un parámetro, sino que el investigador
puede proponer hipotéticamente un valor o valores para el parámetro; valor basado en su
propia experiencia profesional o según oriente el marco teórico, de la investigación. Por
tanto, es necesario decidir si se considera ese supuesto o se rechaza, obviamente se
efectúa en base a datos obtenidos de una muestra aleatoria, y empleando la prueba de
hipótesis estadísticas o llamado también contraste de hipótesis estadística, o simplemente
prueba de hipótesis.

En muchos aspectos, el procedimiento formal para pruebas de hipótesis es semejante al


método científico. Este observa la naturaleza, formula una teoría y la confronta con lo
observado. En nuestro contexto, el científico plantea una hipótesis respecto a uno o más
parámetros poblacionales: de que son iguales a valores especificados. En seguida toma
una muestra de la población y compara sus observaciones con la hipótesis. Si las
observaciones no concuerdan con la hipótesis, las rechaza. De lo contrario, concluye que
la hipótesis es verdadera o que la muestra no detecto la diferencia entre los valores real e
hipotético de los parámetros poblacionales. Con esta verificación de la hipótesis se decide
si se mantiene el supuesto o se rechaza, pero en condiciones de incertidumbre, para tal
efecto se emplea la probabilidad como medida de riesgo, una medida de probabilidad por
tomar equivocadamente una decisión.

Definición:

“Una prueba de hipótesis es el proceso mediante el cual, a partir de los valores de una
muestra aleatoria extraída de una población bajo estudio, se decide si mantiene el supuesto
que plantea el investigador para el parámetro, o se rechaza; con cierta probabilidad de error
(riesgo) por tomar una decisión”

En la figura 1 se sintetiza la prueba de hipótesis.

Figura 1. Proceso de la prueba de hipótesis estadística

El gráfico nos está indicando lo siguiente:

Para la población se plantea un supuesto para el parámetro, de ésta se extrae una muestra
aleatoria, los datos recolectados de ella se usan para generalizarlo en toda la población,
mediante el proceso de la prueba de hipótesis.

Previamente requerimos ciertas definiciones básicas para el estudio y aplicación de una


prueba de hipótesis estadística:
Hipótesis nula, (Ho): Siempre especifica un solo valor del parámetro de la población si la
hipótesis es simple o un conjunto de valores si es compuesta (es lo que queremos
desacreditar). Este podría ser el valor real de 𝜃. Este valor específico se llama valor nulo y
se denota 𝜃𝑜 :

𝐻0 : 𝜃 = 𝜃0 𝐻0 : 𝜃 ≤ 𝜃0 𝐻0 : 𝜃 ≥ 𝜃0

Hipótesis alternativa, (Ha): Es la que responde nuestra pregunta, la que se establece en


base a la evidencia que se tiene, es decir, lo que el investigador espera sea verdadero (bajo
Hipótesis de investigación Hi). Puede tener las siguientes formas:

𝐻0 : 𝜃 < 𝜃0 𝐻0 : 𝜃 > 𝜃0 𝐻0 : 𝜃 ≠ 𝜃0

Hipótesis Unilateral.: una prueba de cualquier hipótesis estadística, donde la alternativa


es unilateral (una sola región crítica) tal como se muestra en la figura 2:

Se rechaza 𝐻𝑜 :
Se rechaza 𝐻𝑜 :

Región Se acepta 𝐻𝑜 : Se acepta 𝐻𝑜 : Región


Zona de Zona de
aceptación aceptación
𝐻𝑜 : 𝜃 ≥ 𝜃𝑜 𝐻𝑜 : 𝜃 ≤ 𝜃𝑜
1.- 2.-
𝐻𝑎 : 𝜃 < 𝜃𝑜 𝐻𝑎 : 𝜃 > 𝜃𝑜

Figura 2. Representación gráfica de una región crítica unilateral.

Hipótesis bilateral: una prueba de cualquier hipótesis estadística, donde la alternativa es


bilateral tal como se muestra en la figura 3:
Región Región
Zona de 𝐻𝑜 : 𝜃 = 𝜃𝑜
aceptación 𝐻𝑎 : 𝜃 ≠ 𝜃𝑜

Figura 3. Representación gráfica de una región crítica bilateral.

Recibe el nombre de prueba de hipótesis bilateral de 2 extremos o de dos colas.

1. Error tipo 𝑰 y tipo 𝑰𝑰, potencia de la prueba

Error tipo 𝑰.- se comete cuando se rechaza la hipótesis nula Ho cuando es verdadera. Se
conoce como 𝛼 (nivel de significancia).

Error tipo 𝑰𝑰.- se comete cuando se acepta la hipótesis nula Ho cuando en realidad es falsa.
Se conoce como 𝛽.

Al probar cualquier hipótesis estadística, se tienen 4 posibles situaciones que determinan


que si la decisiones son correctas o equivocadas. Estas situaciones se resumen en la
siguiente tabla:

DECISIÓN 𝑯𝒐 : es verdadera 𝑯𝒐 : es falsa


No Rechazar
Decisión correcta Error tipo 𝐼𝐼 (β)
𝑯𝒐 :
Rechazar 𝑯𝒐 : Error tipo 𝐼 () Decisión correcta

Grado de Confianza o nivel de confianza: Probabilidad de no equivocarse al no rechazar


Ho verdadero generalmente es de 95%, 90% y 99%.

Nivel de Significancia (): Probabilidad de equivocarse y rechazar Ho cuando Ho es


verdadero, generalmente se usa valor de 0.05, máximo 0.1, puede ser 0.01 o menos en
casos especiales.
Grado de potencia o valor predictivo: Probabilidad de que no me equivoco al rechazar
Ho falso generalmente es de 80%.

β: Probabilidad de equivocarse al no rechazar Ho que es falso generalmente se usa el valor


de 0.2.

Pero una buena prueba estadística es aquella en donde tanto  como β son pequeñas,
porque permitirá tomar una decisión correcta, con menor riesgo para equivocarse.

El error  está bajo control del investigador y se elige o establece antes de realizar la prueba
de hipótesis, es el nivel de significancia para la prueba de hipótesis, entonces como se
puede controlar  , también 1- está controlada.

Pero el error β, es complicado, porque varía con  , esto es, el tamaño de muestra, la prueba
estadística concreta que se utiliza, el diseño elegido y la magnitud del efecto, influyen en
estos errores.

A la probabilidad 1 - β, se le llama potencia, es la probabilidad de no cometer error de tipo


II

Formulación de hipótesis estadística

Para resolver correctamente una prueba de hipótesis se sugiere seguir los siguientes
pasos:

1) Planteamiento de la hipótesis:

En un tipo de prueba bilateral se pueden presentar los siguientes casos:

𝐻𝑜 : 𝜃 = 𝜃 𝐻𝑜 : 𝜃 = 𝜃 𝐻𝑜 : 𝜃 = 𝜃
𝑎) 𝑏) 𝑐)
𝐻𝑎 : 𝜃 < 𝜃 𝐻𝑎 : 𝜃 > 𝜃 𝐻𝑎 : 𝜃 ≠ 𝜃

2) Establecimiento de los valores críticos del estadístico de prueba

Los estadísticos de prueba pueden ser: 𝑧 , 𝑡 , 𝜒 2 , 𝐹

Valores críticos de 𝑧 para pruebas de hipótesis


Nivel de Tipo de prueba Para 𝑡 , 𝜒 2 , 𝐹, dependen
significancia (𝛼) de sus grados de libertad
Unilateral Bilateral

0.1 ±1.28 ±1.645

0.05 ±1.645 ±1.96

0.01 ±2.33 ±2.58

3) Regla de decisión

Se decide si se acepta o rechaza la hipótesis nula de acuerdo con el valor crítico del
estadístico de prueba.

4) Calculo del estadístico de prueba

Se calcula el estadístico de según su distribución de probabilidad.

 Para pruebas de una sola media cuando se conoce 𝜎 2 o se desconoce 𝜎 2 pero n ≥


30

𝑋̅ − 𝜇0
𝑍= 𝜎
⁄ 𝑛

Se calcula el estadístico de según su distribución de probabilidad.

 Para pruebas de una sola media cuando se desconoce 𝜎 2 y n ≤ 30

𝑋̅ − 𝜇0
𝑡=
𝑆⁄
√𝑛

5) Conclusión

Se acepta o se rechaza la hipótesis nula, según donde caiga el valor calculado del
estadístico de prueba.

2. Pruebas de hipótesis para la media


2.1 Utilizando la distribución normal

Puede utilizarse 𝑧 para probar un valor hipotético de la media poblacional cuando:

1) 𝑛 ≥ 30 2) 𝑛 < 30 𝑠𝑖 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙 𝑦 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝜎

Problema práctico 2.1

El nivel máximo aceptable de exposición a la radiación por microondas es en promedio 𝜇𝑜 =


10 𝑚𝑖𝑐𝑟𝑜𝑤𝑎𝑡𝑡𝑠⁄ 2 . Se piensa que un transmisor de televisión contamina la atmosfera al
𝑐𝑚
desplazar el nivel de radiación de microondas por emisión del límite seguro. Se toma una
muestra aleatoria de 36 televisores y se encuentra una media 𝑥̅ = 10.3 con una desviación
estándar de 𝑆 = 2. Prueba la hipótesis con un 𝛼 = 0.01 de que los televisores han rebasado
el limite seguro de radiación de microondas.

1) Planteamiento de la hipótesis:

𝐻𝑜 : 𝜇𝑜 ≤ 10 (no se han rebasado los límites de seguridad)

𝐻𝑎 : 𝜇𝑜 > 10 (se han rebasado los límites de seguridad)

2) Establecimiento de los valores críticos del estadístico de prueba

Los valores críticos de Z para una prueba unilateral a un nivel de significancia de 0.01 es
de 2.33
Se rechaza 𝐻𝑜 :

Se acepta 𝐻𝑜 : Regió
n
Zona de
aceptación
2.33

3) Regla de decisión

Rechazo 𝐻𝑜 si 𝑧𝑐 calculada es mayor que 2.33

4) Calculo del estadístico de prueba

Resolverlo con Minitab con la siguiente instrucción:

Estadísticas > Estadísticas básicas > Z de 1 muestra

El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 4)

Datos en columnas: No seleccionar

Datos resumidos: Selecciona esta opción. Al elegir esta opción se activan los conceptos
siguientes:

Tamaño de la muestra: Ingresa el valor para el tamaño de la muestra que es


36

Media: Ingresa el valor para la media de la muestra, en este caso es 10.3

Desviación estándar: Ingresa el valor para la desviación estándar de la población de 2

Realizar prueba de hipótesis: Seleccionar esta opción y se activa el siguiente elemento:

Media hipotética: Ingresa el valor de 𝜇0 , que es de 10.

En la parte inferior del cuadro de diálogo, solamente selecciona la parte de opciones.


Al dar clic en Opciones, aparece un segundo cuadro de diálogo como se muestra en la
figura 5 que nos sirve para definir el intervalo de confianza y realiza lo siguiente:

Nivel de confianza: Escriba el nivel de confianza que se desea calcular, en este problema
es el 99%

Hipótesis Alterna: Elija menor que (de cola inferior), no es igual a (con dos colas) o mayor
que (de cola superior). En este caso Ha es mayor, elija mayor que.

Aceptar y nuevamente aceptar

Figura 5. Cuadro de diálogo para definir el nivel de


confianza y descripción de hipótesis alterna.

Los resultados obtenidos aparecen en la pantalla de sesión


Z de una muestra

Prueba de mu = 10 vs. > 10


La desviación estándar supuesta = 2

Error
estándar
de la 95% Límite
N Media media inferior Z P
36 10.300 0.333 9.752 0.90 0.184

5) Conclusión

Nota: Si P es igual o mayor que el nivel de significancia (α) con que se hace la prueba se
acepta la hipótesis nula. En caso de que P es menor que el nivel de significancia (α) se
rechaza la hipótesis nula y se acepta la alternativa.

En este caso P = 0.184 y es mayor que  (0.01) y observando en el gráfico de los valores
críticos, 𝑧𝑐 calculada cae en zona de aceptación debo aceptar 𝐻𝑜 como cierta, es decir, el
nivel de radiación que emiten los televisores están en un nivel seguro.

Por lo que se concluye que se acepta 𝐻𝑜 como cierta, es decir, el nivel de radiación que
emiten los televisores están en un nivel seguro.

2.2 Utilizando la distribución 𝒕

Sabemos que debemos utilizar la distribución 𝑡 cuando 𝑛 < 30 y no se conoce 𝜎.

Problema práctico 2.2

Se desea verificar si el contenido de nitrógeno en las hojas jóvenes de la especie


Rhizophora mangle, es menor en las plantas que viven en una zona ambientalmente
protegida con relación al de plantas que viven en una zona que está siendo afectada por la
contaminación con fertilizantes y cuyo valor promedio se cuantificó en 14.6 mg/g de
nitrógeno. El análisis de 25 hojas jóvenes provenientes de la zona protegida produjo los
resultados siguientes:
10.5, 15.0, 12.4, 6.8, 7.9, 13.1, 11.6, 8.2, 9.5, 11.7, 14.2, 13.8, 15.1, 6.9, 8.9, 9.5, 11.1,
10.3, 10.2, 9.9, 8.9, 10.8, 9.8, 7.8, 8.1

Si la concentración de nitrógeno se distribuye normalmente, ¿apoya la evidencia


proporcionada por la muestra la presunción que las plantas de la zona protegida contienen
menos nitrógeno?. Realiza una prueba de hipótesis con un nivel de significancia de 0.01.

Resolver con Minitab requiere realizar el siguiente procedimiento:

Primeramente, introducir los datos en la columna 1, escriba un nombre a la variable, este


paso es opcional, ver figura 6.

Figura 6. Captura de datos en la hoja de


trabajo para una media

El siguiente paso es conocer la media, varianza y desviación estándar:


Estadísticas > Estadísticas básicas > Mostrar estadísticas descriptivas

El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento.

En el cuadro de diálogo realizar el siguiente procedimiento:

Variable: Selecciona la columna C1

Por Variables (Opcional): Deja en blanco

En la parte inferior del cuadro de diálogo selecciona estadísticas.

La figura 7 muestra el procedimiento del cuadro de diálogo.

Figura 7. Cuadro de diálogo del comando mostrar estadísticas


descriptivas.

En el siguiente cuadro de diálogo aparecen todos los elementos que contienen.


Da clic en ninguna para desactivar todos los elementos y posteriormente, selecciona la
media y desviación estándar y da aceptar, como se muestra en la figura 8.

Figura 8. Selección de los elementos del comando de


estadística descriptiva

En la hoja de sesión aparecen los resultados.

Estadísticas descriptivas: mg/g

Variable Media Desv.Est. Varianza


mg/g 10.480 2.409 5.80

Posteriormente se sigue el procedimiento para calcular la prueba de hipótesis:

1) Planteamiento de la hipótesis:

𝐻𝑜 : 𝜇𝑜 ≥ 14.6 (la concentración de nitrógeno es igual en ambas zonas)

𝐻𝑎 : 𝜇𝑜 < 14.6 (la concentración de nitrógeno es menor en la zona protegida)

2) Establecimiento de los valores críticos del estadístico de prueba


Como el parámetro involucrado es la media poblacional y la variable se distribuye
normalmente con varianza poblacional desconocida y el tamaño de la muestra es pequeño
se utiliza la distribución t.

Buscando los valores críticos de t con una probabilidad al 0.01 y 24 g.l.

Con Minitab se calcula el valor de t con la opción:

Gráfica > Gráfica de distribución de probabilidad > Ver probabilidad da aceptar

En el cuadro de diálogo realiza lo siguiente:

Distribución: Selecciona t

Grados de libertad: Anota 24

Selecciona Área sombreada

En el siguiente cuadró de diálogo:

Selecciona Probabilidad

Selecciona cola izquierda, porque buscamos Ha menor que

Probabilidad: Anota el valor de 0.01

El resultado se muestra en el gráfico de la figura 9

Figura 9. Representación gráfica de la distribución “t”


con 24 g.l. y un nivel de confianza del 99%
El valor crítico de t es de -2.492 con 24 g.l. y  = 0.01, como se muestra en el siguiente
gráfico

3) Regla de decisión

Rechazo 𝐻𝑜 si 𝑡𝑐 calculada es menor que -2.492

4) Calculo del estadístico de prueba

Resolverlo con Minitab con la siguiente instrucción:

Estadísticas > Estadísticas básicas > t de 1 muestra

El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 10)

Datos en columnas: Seleccionar columna C1

Datos resumidos: No se selecciona

Realizar prueba de hipótesis: Seleccionar esta opción y se activa el siguiente elemento:

Media hipotética: Ingresa el valor de 𝜇0 , que es de 14.6.

En la parte inferior del cuadro de diálogo, solamente selecciona la parte de opciones.


Al dar clic en Opciones, aparece un segundo cuadro de diálogo como se muestra en la
figura 11 que nos sirve para definir el intervalo de confianza y realiza lo siguiente:

Nivel de confianza: Escriba el nivel de confianza que se desea calcular, en este problema
es el 99%

Hipótesis Alterna: Elija menor que.

Aceptar y nuevamente aceptar

Figura 11. Cuadro de diálogo para definir el nivel de


confianza y descripción de hipótesis alterna.
Los resultados obtenidos aparecen en la pantalla de sesión.

T de una muestra: mg/g

Prueba de mu = 14.6 vs. < 14.6

Error
estándar Límite
de la superior
Variable N Media Desv.Est. media 95% T P
mg/g 25 10.480 2.409 0.482 11.304 -8.55 0.000

5) Conclusión

En este caso P = 0.000 y es menor que  (0.01) y observando en el gráfico de los valores
críticos, y Como tc = - 8.55 < -t(0.99; 24) = -2.492 el valor del estadístico de prueba se encuentra
dentro de la zona de rechazo de Ho, por lo que se puede afirmar que la concentración de
nitrógeno en las hojas jóvenes de Rhizophora mangle es menor en la zona protegida.

3. Pruebas de dos medias

Ahora se tienen dos poblaciones:

Población 1 Población 2

𝜇1 𝜇2

𝜎12 𝜎22

Muestra 1 Muestra 2

𝑋̅1 𝑋̅2
𝑆12 𝑆22

n1 n2

Los supuestos son:

1. X11, X12, …….X1n es un muestra aleatoria de la población 1


2. X21, X22, …….X2n es un muestra aleatoria de la población 2
3. Las dos poblaciones representadas por X1 y X2 son independientes
4. Ambas poblaciones son normales, o si no loson, se cumplen las condiciones del
teorema del límite central.

Con base a los supuestos y resultados precedentes, puede enunciarse:

(𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )


𝑍=
2 2
√𝜎1 ⁄𝑛 + 𝜎2 ⁄𝑛
1 2

Tiene una distribución N(0,1).

3.1 Prueba de hipótesis para la diferencia de medias, varianzas poblacionales


conocidas.

Hipótesis nula: 𝐻𝑜 : 𝜇1 − 𝜇2 = ∆𝑜

(𝑋̅1 −𝑋̅2 )−∆𝑜


Estadístico de prueba: = 2 2
√𝜎1 ⁄𝑛 +𝜎2 ⁄𝑛
1 2

Hipótesis alternativas Criterios de rechazo

𝐻𝑎 : 𝜇1 − 𝜇2 ≠ ∆𝑜 𝑍0 > 𝑍𝛼⁄2 𝑜 𝑍𝑜 < 𝑍𝛼⁄2

𝐻𝑎 : 𝜇1 − 𝜇2 > ∆𝑜 𝑍0 > 𝑍𝛼

𝐻𝑎 : 𝜇1 − 𝜇2 < ∆𝑜 𝑍0 < −𝑍𝛼


3.2 Varianzas poblacionales desconocidas pero iguales y n es pequeña

Las situaciones más comunes que implican pruebas sobre dos medias son aquellas con
varianzas desconocidas. Si ambas distribuciones son normales y que 𝜎12 = 𝜎22 = 𝜎, se
puede utilizar la prueba de t de 2 muestras. El estadístico de prueba es dado por el
procedimiento de prueba.

̅𝟏 − 𝐗
(𝐗 ̅ 𝟐 ) − 𝐝𝐨
𝐭=
𝟐 𝟐
√𝐒𝟏⁄𝐧 + 𝐒𝟐⁄𝐧
𝟏 𝟐

Nota: Cuando el tamaño de muestra es grande, la diferencia entre t y z es insignificante


para fines prácticos.

Problema práctico 3.1

Para probar la afirmación de que la resistencia de un conductor eléctrico puede reducirse


en más de 0.050 ohms mediante aleaciones, 32 valores obtenidos de alambre ordinario
produjeron 𝑋̅1 = 0.136 ohms y s1 = 0.004 ohms y 32 valores obtenidos con alambre fabricado
en base a aleaciones produjeron 𝑋̅2 = 0.083 ohms y s2 = 0.005 ohms. ¿Se apoya la
afirmación con un nivel de significación de 0.05?

n1 = 32 y n2 =32, por lo tanto n1 y n2 son iguales

𝑋̅1 − 𝑋̅2 = 0.136 − 0.083 = 0.053

𝐻𝑜 : 𝜇1 − 𝜇2 = 𝑑𝑜 = 0.050

S1 = 0.004 y S2 = 0.005, por lo tanto, S1 + S2 = S = 0.009

Posteriormente se sigue el procedimiento para calcular la prueba de hipótesis:

2) Planteamiento de la hipótesis:

𝐻𝑜 : 𝜇1 − 𝜇2 ≤ 0.050

𝐻𝑎 : 𝜇1 − 𝜇2 > 0.050
2) Establecimiento de los valores críticos del estadístico de prueba

Para  =0.05. z = 1.65

3) Regla de decisión

Rechazo 𝐻𝑜 si 𝑍𝑐 calculada es mayor que 1.65

4) Calculo del estadístico de prueba

Para resolver con Minitab se toma es estadístico Z de una prueba, con la instrucción:

Estadística > Estadística básica > Z de 1 muestra

En el cuadro de diálogo de Z de 1 muestra se muestran los siguientes elementos para


realizar el procedimiento.

Muestras por columnas: No seleccionar porque no tenemos datos en columnas.

Datos resumidos: Seleccionar

Tamaño de muestra: Es el valor de n1 + n2, anota 64

Media: es la diferencia de 𝑋̅1 y 𝑋̅2 = 0.053

Desviación estándar: Anota el valor de 0.009 que es la suma de S1 yS2

Realizar prueba de hipótesis: Seleccionar

Media hipotética: anota el valor do que es 0.050

Selecciona Opciones… y aparece el siguiente cuadro de diálogo:

Nivel de confianza: 95%

Hipótesis alterna: Selecciona mayor que

Da Aceptar y nuevamente aceptar

En la hoja de sesión aparece el resultado:


Z de una muestra

Prueba de mu = 0.05 vs. > 0.05


La desviación estándar supuesta = 0.009

Error
estándar de 95% Límite
N Media la media inferior Z P
64 0.05300 0.00112 0.05115 2.67 0.004

5. Conclusión:

Dado que Zc de 2.67 > Z crítica de 1.65, se Rechaza la Hipótesis Nula (Ho), por lo tanto
se acepta la Hipótesis Alternativa (Ha), se refrenda la afirmación 12 > 0.050. Vale decir,
la aleación reduce significativamente en más de 0.050 ohms la resistencia del conductor

Problema práctico 3.2

En un estudio sobre la condición ecológica de los ríos altiandinos, se determinó la


temperatura del agua en ríos de páramo (> 2800 m.s.n.m.) y de selva nublada (1800 <
m.s.n.m. < 2800), obteniéndose los resultados siguientes:

Páramo: 10.5, 15.0, 14.5, 8.5, 7.5, 13.5, 15.0, 11.5, 17.0, 13.0, 13.5, 14.5, 13.5, 15.0,
10.5, 10.0

Selva: 19.5, 17.0, 13.5, 9.0, 12.0, 16.5, 16.5, 18.0, 18.0, 18.0, 12.0, 16.0, 12.0,
14.5, 16.5, 17.0

Conociendo que la temperatura del agua es una variable que se distribuye normalmente,
se quiere saber si los ríos de selva son más calientes a un nivel de significancia de 0.05.

Resolver con Minitab requiere realizar el siguiente procedimiento:

Primeramente, introducir los datos en la columna C1 y Columna C2, escriba un nombre a


la variable, este paso es opcional, ver figura 12.
El siguiente paso es conocer la media, varianza y desviación estándar:

Estadísticas > Estadísticas básicas > Mostrar estadísticas descriptivas

El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento.

En el cuadro de diálogo realizar el siguiente procedimiento:

Variable: Selecciona la columna C1 que se llama T1 y C2 T2

Por Variables (Opcional): Deja en blanco

En la parte inferior del cuadro de diálogo selecciona estadísticas.

La figura 13 muestra el procedimiento del cuadro de diálogo.


En el siguiente cuadro de diálogo aparecen todos los elementos que contienen.

Da clic en ninguna para desactivar todos los elementos y posteriormente, selecciona la


media y desviación estándar y da aceptar.

En la hoja de sesión aparecen los resultados.

Estadísticas descriptivas: C1, C2

Variable Media Desv.Est. Varianza


C1 12.688 2.658 7.063
C2 15.375 2.901 8.417

Posteriormente se sigue el procedimiento para calcular la prueba de hipótesis:

3) Planteamiento de la hipótesis:

𝐻𝑜 : 𝜇1 − 𝜇2 = 10

𝐻𝑎 : 𝜇1 − 𝜇2 > 0 (La temperatura del agua es mayor en los ríos de la zona de selva)

2) Establecimiento de los valores críticos del estadístico de prueba


Como el parámetro involucrado es la media poblacional y la variable se distribuye
normalmente con varianza poblacional desconocida y el tamaño de la muestra es pequeño
se utiliza la distribución t.

Buscando los valores críticos de t con una probabilidad al 0.05 y 30 g.l.

Con Minitab se calcula el valor de t con la opción:

Gráfica > Gráfica de distribución de probabilidad > Ver probabilidad da aceptar

En el cuadro de diálogo realiza lo siguiente:

Distribución: Selecciona t

Grados de libertad: Anota 30 (que corresponde n1 –n2 - 2= g.l)

Selecciona Área sombreada

En el siguiente cuadró de diálogo:

Selecciona Probabilidad

Selecciona cola izquierda, porque buscamos Ha menor que

Probabilidad: Anota el valor de 0.05

El resultado se muestra en el gráfico de la figura 14

Figura 14. Representación gráfica de la distribución “t”


con 30 g.l. y un nivel de confianza del 95%
El valor crítico de t es de 1.697 con 30 g.l. y  = 0.05.

3) Regla de decisión

Rechazo 𝐻𝑜 si 𝑡𝑐 calculada es mayor que 1.697

4) Calculo del estadístico de prueba

Resolverlo con Minitab con la siguiente instrucción:

Estadísticas > Estadísticas básicas > t de 2 muestras

El cuadro de diálogo realiza el siguiente procedimiento para cada uno de los elemento (ver
figura 15)

Datos en columnas: No Seleccionar

Muestras en columnas diferentes: Seleccionar

Primero: Seleccionar la columna que tenga mayor media, en este caso es C2

Segundo: Seleccionar C1

Datos resumidos: No seleccionar

Asumir varianzas iguales: Seleccionar

En la parte inferior del cuadro de diálogo, solamente selecciona la parte de opciones.


Al dar clic en Opciones, aparece un segundo cuadro de diálogo como se muestra en la
figura 16 que nos sirve para definir el intervalo de confianza y realiza lo siguiente:

Nivel de confianza: Escriba el nivel de confianza que se desea calcular, en este problema
es el 95%

Diferencia de la prueba: Ingresa el valor de la Ho en este caso 0

Hipótesis alterna: Elija mayor que, ya que depende de la prueba que se desee.

Aceptar y nuevamente aceptar

Figura 15. Cuadro de diálogo para definir el nivel de


confianza, valor de la prueba y Ha.
Los resultados obtenidos aparecen en la pantalla de sesión.

Prueba T e IC de dos muestras: T2, T1

T de dos muestras para T2 vs. T1

Error
estándar
de la
N Media Desv.Est. media
T2 16 15.38 2.90 0.73
T1 16 12.69 2.66 0.66

Diferencia = mu (T2) - mu (T1)


Estimado de la diferencia: 2.688
Límite inferior 95% de la diferencia: 1.018
Prueba T de diferencia = 0 (vs. >): Valor T = 2.73 Valor P = 0.005 GL = 30
Ambos utilizan Desv.Est. agrupada = 2.7820

5) Conclusión

En este caso P = 0.005 y es menor que  (0.05) y observando en el gráfico de los valores
críticos, y Como tc = 2.73< -t(0.99; 24) = 1.697 el valor del estadístico de prueba se encuentra
dentro de la zona de rechazo de Ho, Por lo tanto se concluye que la temperatura del agua
es mayor en los ríos de la zona de selva.

MATERIALES Y EQUIPO

Práctica Impresa

Calculadora

Software Minitab 16
PROCEDIMIENTO
Resuelva las siguientes actividades con el uso de Minitab.

Actividad 1

El rendimiento diario de una planta química local ha promediado 880 toneladas durante los
últimos años. A la gerente de control de calidad le gustaría saber si este promedio cambió
en los meses recientes. Ella selecciona al azar 50 días de la base de datos y calcula el
promedio y la desviación estándar de n = 50 rendimientos como 𝑋̅ = 871 toneladas y S =
21 toneladas respectivamente. Pruebe la hipótesis apropiada con  = 0.05.

Actividad 2

Se saca una muestra de 36 análisis de nitratos (NO3-) para el diseño de una planta de
tratamiento de aguas industriales. Para esto, se calcula un promedio estadístico de 𝑋̅ = 92
mg/L. Estudios previos indican una desviación estándar conocida de σ = 9 mg/L. Probar la
hipótesis de que el valor esperado de μo es 100 mg/L. Asumir α = 0.05.

Actividad 3

Antes de que una sustancia se pueda considerar segura para enterrarse como residuo se
deben caracterizar sus propiedades químicas. El artículo “Landfilling Ash/Sludge Mixtures”
(J. Benoît,T. Eighmy y B. Crannell, en Journal of Geotechnical and Geoenvironmental
Engineering

1999:877-888) notifica que en una de seis muestras de lodo de una planta de tratamiento
de agua residual de Nueva Hampshire, la media del pH era 6.68 con desviación estándar
de 0.20. ¿Se puede concluir que la media del pH es menor de 7.0? si la prueba se realizó
con  = 0.05.

Actividad 4
Los siguientes datos son las horas-hombre que se pierden semanalmente en promedio por
accidentes en 10 plantas industriales antes y después de implantar un cierto programa de
seguridad:

Antes 45 73 46 124 33 57 83 34 26 17

Después 36 60 44 119 35 51 77 29 24 11

Utilizar el nivel de significación de 0.05 para probar si el sistema de seguridad es eficaz, es


decir que las hombre se

Actividad 5

Un artículo publicado en la revista Materials Engineering describe los resultados de pruebas


de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga para la que
cada especímen falla es la siguiente en MPa:

19.8 18.5 17.6 16.7 15.8 10.1

15.4 14.1 13.6 11.9 11.4 7.9

11.4 8.8 7.5 15.4 15.4 19.5

14.9 12.7 11.9 11.4 ---- ----

¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que
la carga donde se presenta la falla tiene una distribución normal, y utilice  = 0.05. Calcule
el valor de P.

Actividad 6

En un estudio de la ingeniería ambiental atmosférica, para evitar la contaminación ambiental


producida por el consumo excesivo e innecesario de gasolina, en el diseño de un motor de
combustión interna, el departamento de ingeniería de un constructor de autos, de cierto
modelo, afirma que el rendimiento del millaje de este modelo de auto es de cuando menos
35 millas por galón. El departamento de control de calidad sugiere que el valor de la
desviación estándar es de σ = 4 millas. La Environmental Protection Agency de Estados
Unidos de América quiere probar esta afirmación para ver si la figura afirmada debería ser
más alta o más baja que 35 millas por galón. Para esto, se saca una muestra aleatoria de
50 modelos de este tipo y se prueban bajo circunstancias iguales. Los resultados dan un
promedio muestral de 33.6 millas por galón. Probar el reclamo del departamento de
ingeniería usando un nivel de significancia de 0.05. Calcular el valor de p.

Actividad 7

Se lleva a cabo un experimento para comprobar el desgaste abrasivo de dos diferentes


materiales laminados. Se prueban 12 piezas de material 1 y mediante la exposición de cada
pieza a una máquina para medir el desgaste. 10 piezas del material 2 se prueban de manera
similar. En cada caso se mide la profundidad del desgaste. Las muestras de material 1 dan
un desgaste promedio de 85 unidades con una desviación estándar muestral de 4, mientras
que las muestras de material 2 dan un promedio de 81, desviación estándar muestral de 5.
¿Se puede concluir con un nivel de significancia de 0.05 que el desgaste abrasivo del
material 1 excede el del material 2 en 2 unidades?

Actividad 8

Dos diferentes formulaciones de un combustible oxigenado para motores se prueban para


estudiar sus índices de octano en carretera. La varianza del índice de octano en carretera
para la formulación 1 es 𝜎12 = 1.5, y para la formulación 2 es 𝜎22 = 1.2. Se prueban dos
muestras aleatorias de tamaño n1 = 15 y n2 = 20, y las medias del índice de octano en
carretera observadas son 𝑋̅1 = 89.6 y 𝑋̅2 = 92.5. Suponga que la distribución es normal. Si
la formulación 2 produce un índice de octano en carretera más alto que la formulación 1, al
fabricante le gustaría detectarlo. Formule y pruebe una hipótesis apropiada usando  = .05.

SUGERENCIAS DIDÁCTICAS
Elaborar un caso práctico con base en la utilización de los diferentes tipos de muestreo y
realizar pruebas de hipótesis a un nivel de confianza del 95%
Resolver las actividades de manera manual con la utilización de fórmulas y tablas.

Realizar una tabla de pruebas relacionadas con medias para pruebas de hipótesis. Donde
se exprese Ho, valor del estadístico de prueba, Ha y la región crítica.