Está en la página 1de 80

ESTADÍSTICA

GUÍAS DE LABORATORIO

CARLOS ALBERTO MEJÍA COLINDRES


Universidad Tecnológica Centroamericana
Honduras

Prentice Hall
Datos de catalogación bibliográfica

MEJÍA COLINDRES, CARLOS ALBERTO

Estadística
Guías de laboratorio
PEARSON EDUCACIÓN, México, 2010
ISBN: 978-607-442-423-2
Área: Matemáticas

Formato: 21  27 cm Páginas: 80

Todos los derechos reservados

Editora: Ma. Elena Zahar Arellano


e-mail: maria.zahar@pearson.com
Editor de desarrollo: Alejandro Agustín Gómez Ruiz
Supervisor de producción: Rodrigo Romero Villalobos

PRIMERA EDICIÓN, 2010

D.R. © 2010 por Pearson Educación de México, S.A. de C.V.


Atlacomulco Núm. 500-5o. piso
Col. Industrial Atoto
53519, Naucalpan de Juárez, Edo. de México

Cámara Nacional de la Industria Editorial Mexicana. Reg. núm. 1031.

Custom Publishing es una marca registrada de Pearson Educación de México. S.A. de C.V.

Reservados todos los derechos. Ni la totalidad ni parte de esta publicación pueden reproducirse, registrarse o transmitirse, por un sistema de recuperación
de información, en ninguna forma ni por ningún medio, sea electrónico, mecánico, fotoquímico, magnético o electroóptico, por fotocopia, grabación o
cualquier otro, sin permiso previo por escrito del editor.

El préstamo, alquiler o cualquier otra forma de cesión de uso de este ejemplar requerirá también la autorización del editor o de sus representantes.

ISBN: 978-607-442-423-2

Impreso en México. Printed in Mexico.


1 2 3 4 5 6 7 8 9 0 - 12 11 10 09

1FBSTPO$VTUPN
1VCMJTIJOH
es una división de
Apreciados estudiantes y docentes:

La obra que hoy ponemos en sus manos es parte del Programa One to One el cual
garantiza a todos los estudiantes de nuevo ingreso a UNITEC, la dotación de sus
libros de texto y una computadora portátil, ambos recursos fundamentales durante
el proceso de formación profesional.

Nuestro modelo educativo está centrado en el aprendizaje de los estudiantes, de


ahí que enfaticemos en el uso de la tecnología y en distintos medios didácticos y
audiovisuales, entre los que destaca el libro de texto como recurso fundamental.
Como resultado de esta necesidad es que iniciamos en 2008 una alianza estratégica
con la editorial Pearson con el propósito de editar libros de texto personalizados
para mejorar la calidad del aprendizaje en UNITEC.

Consideramos que nuestra experiencia, pionera en América Latina, ha sido exitosa,


pues inició con cuatro asignaturas y actualmente hemos logrado 20 títulos distintos
para igual número de asignaturas correspondientes a distintas disciplinas y áreas
académicas. Este resultado nos entusiasma a continuar, pues además hemos
abierto otro importante espacio para estimular a los docentes a que participen en el
proceso de producción intelectual y desarrollo del conocimiento.

Sin embargo, como los anhelos no se cumplen tan sólo por desearlos, ustedes
deben mostrar cotidianamente una voluntad expresa por querer ser los profesionales
idóneos y competitivos que nuestro país requiere; por nuestra parte, como institución
educativa, habremos de mostrar que aceptamos el reto de formar a ciudadanos
competentes y a la vez sensibles para apreciar valores y tradiciones con las
particularidades de cada una de ellas.

Me entusiasma avanzar con ustedes en la consecución de nuestra filosofía


institucional, pues nos hemos empeñado en que sean los mejores ciudadanos,
profesionales innovadores, todos hombres y mujeres de bien que enaltezcan la
sociedad donde decidan desarrollarse.

Les deseo éxito en sus estudios.

Fraternalmente,

Luis Zelaya Medrano

Rector
CONTENIDO

1 GUÍA DE LABORATORIO 1

2 GUÍA DE LABORATORIO 6

3 GUÍA DE LABORATORIO 12

4 GUÍA DE LABORATORIO 15

5 GUÍA DE LABORATORIO 19

6 GUÍA DE LABORATORIO 23

7 GUÍA DE LABORATORIO 27

8 GUÍA DE LABORATORIO 34

9 GUÍA DE LABORATORIO 39

10 GUÍA DE LABORATORIO 42

11 GUÍA DE LABORATORIO 46

12 GUÍA DE LABORATORIO 49

13 GUÍA DE LABORATORIO 55

14 GUÍA DE LABORATORIO 59

15 GUÍA DE LABORATORIO 62

16 GUÍA DE LABORATORIO 67

v
P R E FA C I O

Las Guías de laboratorio de estadística surgieron como un recurso didáctico destinado a facilitar la labor
del estudiante en la descripción de datos muestrales, así como en la estimación de parámetros y en las
pruebas de hipótesis. Las guías comenzaron a escribirse en 2006 y se han mejorado con el tiempo y la
experiencia. Se ha hecho un esfuerzo por incluir problemas de la vida real a través de datos recopilados
por el autor en sus propias investigaciones, así como por los estudiantes de la UNITEC durante actividades
realizadas en clase.
Desde un inicio se decidió que las guías se basaran principalmente en el uso de Excel de Microsoft
Office. Aunque existen paquetes estadísticos más poderosos, Excel es muy popular y la mayoría de los
estudiantes lo ha utilizado alguna vez. Además, Excel produce gráficas de gran calidad y cuenta con
las herramientas de análisis necesarias para llevar a cabo trabajos estadísticos de magnitud moderada.
También se ilustra el uso del programa Winstats, creado por Rick Parris de la Phillips Exeter Academy, y
que se descarga gratuitamente de Internet.
Las guías siguen la secuencia del texto Estadística para administración, cubriendo el material
contenido en los capítulos 1 al 13. El curso de Estadística I se apoya en las primeras nueve guías de
laboratorio, mientras que el curso de Estadística II se apoya en las guías restantes. Se tomaron en cuenta
las necesidades de los estudiantes de ingeniería en la redacción de las guías de laboratorio, por lo que
pueden utilizarse perfectamente en los cursos de Estadística Matemática I y II. Los sílabos para dichas
materias sugieren qué guías utilizar y en qué secuencia.
El mejor método para la resolución de las guías dentro del aula es la organización de grupos de tres
personas que se apoyarán unas a otras y compararán los resultados. Para esto, es indispensable que todo
estudiante lleve su computadora portátil en cada ocasión, así como sus guías de laboratorio, las cuales
deberán ser llenadas y revisadas por el profesor al finalizar la sesión. La experiencia indica que la mejor
manera de afianzar los conocimientos adquiridos durante los laboratorios es a través de tareas y trabajos,
en los cuales el estudiante deba usar lo aprendido. También es posible aplicar pruebas cortas en la que se
pida al estudiante interpretar la salida de Excel o Winstats para un problema dado.
Las guías de laboratorio serán siempre un trabajo en progreso, debido a los cambios en los planes
de estudio, mejoras en la tecnología y sobre todo, por las sugerencias de estudiantes y colegas, que serán
siempre bienvenidas.
AGRADECIMIENTOS

Las guías de laboratorio se redactaron gracias a la iniciativa de la licenciada Alexandra de Guardado


en su cargo como directora de la entonces llamada Escuela de Ciencias Básicas. La implementación de
las guías en los cursos de estadística fue apoyada en forma entusiasta por la licenciada Karim Martínez,
Jefa del Área de Matemáticas durante los años 2007 y 2008. La publicación del material se llevó a cabo
finalmente gracias a la gestión de la licenciada Montserrat Amador Nuñez, actual Jefa Académica de
Ciencias Matemáticas, y también al interés mostrado por Pearson Custom Publishing, a través de su
editora, María Elena Zahar Arellano.
La guía de laboratorio sobre regresión múltiple se escribió siguiendo el método que el licenciado
Alex Tábora utiliza en sus cursos de estadística, cuya secuencia es inmejorable en el análisis de modelos
de regresión.
Agradezco también a mis estudiantes que han contribuido al recolectar muchos de los datos que se
utilizan en las guías, y a mi familia: Daisy, Eva y Todd.
1 GUÍA DE LABORATORIO

Temas

• Conteo de datos categóricos. • Gráficos circulares y de


barras.

Objetivos
Tras efectuar esta práctica de • Aplicar el concepto
laboratorio, el estudiante será de probabilidad como
capaz de: frecuencia relativa en la
• Usar Excel en la creación de resolución de problemas.
distribuciones de frecuencias
para datos categóricos.
• Usar Excel en la elaboración
de gráficos circulares
y de barras para datos
categóricos.

Herramientas a utilizar
Funciones de Excel:

Excel en inglés Excel en español


COUNTIF(rango, criterio) CONTAR.SI(rango, criterio)

INSTALACIÓN DE LA HERRAMIENTA ANÁLISIS DE DATOS


Las siguientes instrucciones de instalación son válidas para Microsoft Office Excel 2007.
Haga clic en el botón Office . A continuación siga los siguientes pasos:

Opciones de Excel Complementos Ir…


2 ESTADÍSTICA. GUÍAS DE LABORATORIO

Las últimas dos selecciones se ilustran en la siguiente figura:

Cuando el cuadro de diálogo Complementos aparezca, marque la casilla Herramientas para análisis
y luego haga clic en el botón Aceptar.

Problema 1 En un restaurante se tomó al azar una muestra de los clientes que pagaron su cuenta con tarjeta
de crédito (el restaurante sólo acepta tarjetas MasterCard, Visa, American Express y Diners Club),
detectando la siguiente muestra:
MasterCard, Visa, MasterCard, Visa, Diners Club, MasterCard, MasterCard, Visa, Diners Club,
American Express, American Express, MasterCard, MasterCard, Diners Club, Diners
Club, American Express, MasterCard, Visa, MasterCard, Visa, Visa, Visa, MasterCard,
MasterCard, MasterCard, Visa, American Express, Diners Club, American Express, American
Express, Diners Club, Diners Club, MasterCard, MasterCard, MasterCard, Diners Club, Diners
Club, MasterCard, Visa, MasterCard, Visa, MasterCard, MasterCard, Visa, Visa, American
Express, American Express, American Express, MasterCard, MasterCard, Diners Club, Visa,
MasterCard, American Express, Visa, Visa, MasterCard, MasterCard, Diners Club, Visa.
GUÍA DE LABORATORIO 1 3

Paso 1 Escriba los datos en la columna A y titule la celda A1 como TARJETA. En lugar de American
Express y Diners Club, escriba Amex y Diners, respectivamente.
Paso 2 Elabore una tabla de frecuencias en las columnas C y D de la siguiente forma:

Paso 3 Seleccione desde la celda D2 hasta la D5 y en la barra de fórmulas introduzca:

=CONTAR.SI(A2:A61, C2:C5)

Posteriormente oprima al mismo tiempo las teclas Ctrl y Shift y en seguida presione Enter.
Los valores para las frecuencias se llenarán inmediatamente. Compruebe que la suma de los valores
sea 60.
Paso 4 Con la distribución de frecuencias para las tarjetas de crédito, realice un gráfico circular
porcentual.
Haga clic en la pestaña Insertar y a continuación seleccione la celda C2 hasta la D5. Después,
en la sección Gráficos oprima el botón Circular y elija la gráfica que desee generar.
4 ESTADÍSTICA. GUÍAS DE LABORATORIO

Haga clic sobre el gráfico recién creado para que aparezca la pestaña Herramientas de gráficos en
la parte superior de la pantalla.
Al hacer clic en la pestaña Diseño, se desplegarán las opciones que le permitirán cambiar la
apariencia de su gráfica. En la sección Diseños de gráfico, seleccione Diseño 2 para obtener un
gráfico circular porcentual.

Para finalizar titule su gráfico y guarde.


En la pestaña Insertar hallará el botón Otros gráficos en el cual puede encontrar una
alternativa para el gráfico circular: el gráfico de anillo. Le recomendamos la exploración de esta
opción.
Preguntas Indique qué porcentaje de los clientes:
a) Utilizó una tarjeta Visa. ________________
b) Utilizó una tarjeta MasterCard o Diners Club. ________________
c) No usó una tarjeta American Express. ________________
d) No usó una tarjeta Visa ni MasterCard. ________________

Paso 5 Con la distribución de frecuencias para las tarjetas de crédito, elabore un gráfico de barras.
Haga clic en la pestaña Insertar y a continuación seleccione desde la celda C2 hasta la D5.
Después, en la sección Gráficos seleccione el botón Columnas y escoja la gráfica que desee
generar.

Haga clic sobre el gráfico recién creado para que aparezca una pestaña adicional (Herramienta
para gráficos). Dé clic en la pestaña Diseño para mejorar la presentación de su gráfica de barras al
combinar tanto los diseños como los estilos gráficos.

Problema 2 Con el objetivo de medir el grado de desarrollo de las competencias emprendedoras de los estudiantes
de la UNITEC, se realizó una encuesta entre 44 estudiantes del campus de Tegucigalpa durante el
mes de marzo de 2008. La composición de la muestra se detalla en la siguiente tabla:
GUÍA DE LABORATORIO 1 5

CARRERA FRECUENCIA

Administración 12
Ingeniería industrial 18
Otras ingenierías 12
Otras carreras 2
Total 44

Se midieron nueve competencias emprendedoras, una de las cuales fue planificación y organización.
Las opciones para la medición de esta competencia fueron:
a) Puedo emprender varios proyectos simultáneamente sin perder el control.
b) Establezco plazos y prioridades para el cumplimiento de mis objetivos.
c) Administro mis recursos con atención.
d) Formulo objetivos racionales para plazos determinados.
e) Me es difícil manejar adecuadamente el tiempo.
La escala descendente se diseñó para que el inciso a) mostrara un desarrollo pleno de la competencia
en cuestión, mientras que el correspondiente al inciso e) señalara una deficiencia considerable.
El estudiante seleccionaría la opción que mejor lo describiera. Las respuestas obtenidas fueron:
e, b, e, c, b, b, a, e, b, d, e, c, b, e, d, b, e, b, c, b, e, b, a, b, b, b, b, b, b, e, b, a, d, b, c, e, b, b,
b, b, c, d, d y a.
Con la información anterior, haga lo siguiente:
1. Realice un gráfico circular o de anillo porcentual para la tabla de composición de la muestra.
Después, elabore un gráfico de barras con los mismos datos.
2. Elabore una tabla de frecuencias para las letras seleccionadas siguiendo los pasos del problema 1.
3. Haga un gráfico circular o de anillo porcentual para la tabla de frecuencias.
4. Calcule el porcentaje de los estudiantes que no marcó ni el inciso a) ni el e).
2 GUÍA DE LABORATORIO

Temas

• Distribuciones de frecuencias.
• Histogramas.

Objetivos
Después de efectuar esta práctica • Utilizar Excel para la
de laboratorio, el estudiante será elaboración de gráficos de
capaz de: pareto.
• Utilizar Excel para elaborar • Utilizar Excel para la
una tabla de clases y elaboración de histogramas,
frecuencias absolutas y por medio del Asistente para
relativas. gráficos.

Problema 1 Utilice Excel para analizar los siguientes datos, los cuales corresponden al número de cerillos
encontrados dentro de 54 cajas de la marca Cóndor. Ésta asegura que las cajas contienen 40 unidades, en
promedio.
GUÍA DE LABORATORIO 2 7

Paso 1 Elabore una distribución de clases y frecuencias utilizando todos los datos. En las columnas N, O y
P realice la siguiente tabla:

Paso 2 Haga clic en la pestaña Datos y posteriormente seleccione el botón Análisis de datos. En el cuadro
de diálogo pulse la opción Histograma y haga clic en el botón Aceptar.

Al realizar lo anterior, aparecerá un nuevo cuadro de diálogo donde se indicarán la localización de


los datos, los límites superiores de clase, el lugar donde se desplegarán los resultados y los gráficos
que serán elaborados.
Llene el cuadro como se muestra a continuación:
8 ESTADÍSTICA. GUÍAS DE LABORATORIO

Al hacer clic en el botón Aceptar, se generará la siguiente tabla:

Clase Frecuencia
29 1
32 2
35 9
38 19
41 15
44 8
y mayor… 0

También se elaborará la gráfica de barras que a continuación se muestra:

Paso 3 Con el objeto de darle a la gráfica la apariencia de un histograma verdadero, haga clic en la pestaña
Diseño y escoja el diseño de gráfico 8 y luego, el estilo 35. Escriba el título de la gráfica y de los
ejes.

Un histograma verdadero debe mostrar en su eje horizontal los puntos medios de las clases,
en lugar de los límites superiores de clase. En el problema 2 se indicará cómo efectuar ese
cambio.
Si desea generar una gráfica de Pareto en lugar de un histograma, también debe elegir la casilla
Pareto en el cuadro de diálogo Histograma. Con lo anterior se elaborará una gráfica de barras
ordenada de acuerdo con las frecuencias. También se generará una gráfica del porcentaje acumulado
si se selecciona el cuadro correspondiente a Porcentaje acumulado.
GUÍA DE LABORATORIO 2 9

Debe escoger una celda adecuada para la opción Rango de salida. El gráfico generado puede verse
a continuación:

Problema 2 Se lanzan 5 monedas y se anota el número de caras obtenidas. Este proceso se repite 30 veces
consiguiendo los siguientes datos:

5 2 4 4 3
4 4 3 3 4
4 0 5 1 3
3 1 1 2 2
1 2 2 4 3
2 2 2 1 4

Paso 1 Traslade los datos anteriores a una hoja de Excel, desde la celda A1 hasta la celda E6. A continuación
elabore la siguiente tabla:

G H I
1 Clase
2 0
3 1
4 2
5 3
6 4
7 5

Paso 2 Utilice la herramienta Análisis de datos (Histograma) para crear una distribución de frecuencias y un
histograma. Debido al corto recorrido de los datos, las clases son de tamaño 1 y, por lo tanto, deben
usarse las celdas G2:G7 como el rango de clases. Establezca la celda I1 como el Rango de salida.
10 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 3 Tras analizar las calificaciones parciales de un grupo de estudiantes de la asignatura de Estadística,
se llegó a la siguiente distribución de clases y frecuencias:

Paso 1 Para obtener un histograma de la distribución de calificaciones del grupo, seleccione las celdas
E2:E6. En seguida haga clic en el botón Insertar y oprima el botón Columna. Haga clic sobre el
tipo de gráfico que desee realizar, por ejemplo en Columna agrupada 3D.

La gráfica realizada debe incluir título, nombre de las variables y puntos medios de clase en el eje
horizontal.
GUÍA DE LABORATORIO 2 11

Paso 2 Haga clic sobre el gráfico para que la pestaña Herramientas de gráficos aparezca en la parte superior
de la pantalla. Seleccione la pestaña Diseño y luego el botón Seleccionar datos.

Al hacer lo anterior se desplegará el cuadro de diálogo siguiente:

Pulse Editar en la columna Etiquetas del eje horizontal y luego seleccione las celdas D2 a D6.

Para terminar, haga clic en el botón Aceptar en ambos cuadros de diálogo.


Si desea agregar nombres a los ejes, elija la pestaña Herramientas de gráficos y a continuación
seleccione Presentación. Luego haga clic en Rótulos del eje e incorpore lo que considere necesario.
El título del gráfico puede agregarse oprimiendo el icono Título del gráfico.

Otra alternativa para agregar los títulos, es seleccionando la pestaña Diseño y escogiendo el bosquejo
predeterminado que más se acople a sus deseos. Pruebe, por ejemplo, el diseño de gráfico 8 y el
estilo 35, para darle a su gráfica la apariencia de un histograma.
3 GUÍA DE LABORATORIO

Temas

• Gráficas de datos bivariados. • Diagramas de dispersión.

Objetivos
Después de efectuar esta práctica • Determinar empíricamente
de laboratorio, el estudiante será una posible relación lineal
capaz de: entre las variables.
• Usar Excel para trazar
gráficas de barras agrupadas.
• Usar Excel para trazar el
gráfico de dispersión para
dos variables.

Problema 1 La siguiente tabla de contingencias muestra los resultados de la encuesta realizada a 50 empresas
familiares de Tegucigalpa, en junio de 2008, por la Universidad Tecnológica Centroamericana.

1a. Generación 2a. Generación 3a. Generación


Hombres 59 41 10
Mujeres 27 37 12

Se trazará una gráfica de barras agrupadas para estos datos.


Paso 1 Copie la tabla de contingencias en una hoja de Excel.
GUÍA DE LABORATORIO 3 13

Paso 2 Seleccione toda la tabla (datos y rótulos) y luego, en la barra de herramientas, haga clic en la pestaña
Insertar. Al desplegarse el menú, seleccione el botón Barra y después Barra agrupada (primer
icono a la izquierda).

De lo anterior, se generará el siguiente gráfico:

Explore otras posibilidades de color y forma para el gráfico de barras agrupadas. ¿Qué
información revela este gráfico sobre los empleados de las empresas familiares, según la generación
que las administra?

Problema 2 Para un proyecto de inversión se analizan los flujos de caja. Dicho proyecto consiste en la construcción
de una residencia para estudiantes universitarios. En él se consideran diferentes rentas posibles, las
cuales originan distintas Tasas Internas de Retorno (TIR) para el proyecto. La siguiente tabla ilustra
esta situación.

Renta TIR
$150 19
$160 20
$170 22
$180 24
$190 26
$200 27
$250 36
14 ESTADÍSTICA. GUÍAS DE LABORATORIO

Elabore un diagrama de dispersión para estas variables y así determinar una posible relación entre
ellas.
Paso 1 Introduzca los valores para las variables Renta (x) y TIR (y) en una hoja de Excel. En seguida,
seleccione los datos de la tabla (sin los rótulos), haga clic en Insertar y finalmente en el botón
Dispersión. Al hacer esto último se despliega un menú, seleccione el primer icono correspondiente
a Dispersión sólo con marcadores para elaborar el diagrama solicitado.

Paso 2 Mejore el gráfico. Haga clic sobre éste para que aparezca la pestaña Herramientas de gráficos en
la parte superior de la pantalla. En la pestaña Diseño puede cambiar el aspecto de los puntos. En la
pestaña Presentación puede agregarle un título, así como también nombre a los ejes. Asimismo en
la pestaña Formato puede cambiar el color del fondo del gráfico.
Preguntas 1. ¿Cuál es el comportamiento de los puntos?

2. ¿Podría una recta ser un buen modelo para describir la variación de la TIR?

3. ¿Cómo sería su pendiente: positiva o negativa? Explique.

Problema 3 El comportamiento del Índice de Precios al Consumidor (IPC) en Honduras durante el periodo 2003-
2007, se ilustra en la siguiente tabla. (Diciembre 1999 = 100).

Año 2003 2004 2005 2006 2007


IPC 138.3 151 162.7 171.3 186.5
Fuente: Honduras en cifras, 2003–2007.

Estos datos forman una serie de tiempo, pues describen el cambio de la variable IPC a través de
los años. Haga lo siguiente:
Use el programa Excel para elaborar un gráfico de dispersión para estos datos.
Preguntas 1. ¿Podría una recta ser un buen modelo para describir la variación del IPC?

2. ¿Cómo sería su pendiente: positiva o negativa? Explique.


4 GUÍA DE LABORATORIO

Temas

• Medidas de tendencia central


y de dispersión.

Objetivos
Después de efectuar esta práctica de dispersión usando la
de laboratorio, el estudiante será herramienta Análisis de
capaz de: Datos.
• Encontrar las medidas de • Utilizar Winstats para
tendencia central y de obtener las medidas
dispersión de datos sin de tendencia central
agrupar usando las funciones y de dispersión de datos.
adecuadas de Excel. Obtenga el programa Winstats de
• Utilizar Excel para la siguiente página electrónica:
determinar las medidas http://math.exeter.edu/rparris/
de tendencia central y winstats.html

Herramientas a utilizar

Excel en inglés Excel en español


MAX(número1, [número2]) MAX(número1, [número2])
MIN(número1, [número2]) MIN(número1, [número2])
AVERAGE(número1, [número2]) PROMEDIO(número1, [número2])
MEDIAN(número1, [número2]) MEDIANA(número1, [número2])
MODE(número1, [número2]) MODA(número1, [número2])
STDEV(número1, [número2]) DESVEST(número1, [número2])
QUARTILE(matriz, cuartil) CUARTIL(matriz, cuartil)
16 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 1 Considere los siguientes datos que corresponden al número de cerillos encontrados dentro de 54
cajas de la marca Cóndor, los cuales ya fueron estudiados en la Guía de Laboratorio 2.

Cóndor asegura que las cajas contienen, en promedio, 40 unidades.


Paso 1 Copie los datos en la hoja de trabajo de Excel tal y como se muestra en la imagen anterior. Luego
copie la siguiente tabla en la columna K.

Paso 2 Determine en la columna L los valores máximo, mínimo, media, mediana, moda, desviación
estándar, Q1 y Q3 de los datos introduciendo las funciones apropiadas de Excel:

L
1 =MAX(A1:I6)
2 =MIN(A1:I6)
3 =PROMEDIO(A1:I6)
4 =MEDIANA(A1:I6)
5 =MODA(A1:I6)
6 =DESVEST(A1:I6)
7 =CUARTIL(A1:I6,1)
8 =CUARTIL(A1:I6,3)

Note que Excel sólo devuelve un valor para la moda (la primera moda encontrada), aunque los datos
sean multimodales.
Observe también que Excel utiliza una fórmula diferente de interpolación para el cálculo de los
cuartiles, por lo que los resultados pueden variar cuando se utilice la fórmula de su texto.
Pregunta ¿Poseen estos datos una moda única?
GUÍA DE LABORATORIO 4 17

Problema 2 En esta ocasión considere el problema del lanzamiento de las 5 monedas estudiado en la Guía de
laboratorio 2. Se registra el número de caras obtenidas como consecuencia de la repetición (30 veces)
de este proceso. La siguiente tabla muestra los resultados:

5 2 4 4 3
4 4 3 3 4
4 0 5 1 3
3 1 1 2 2
1 2 2 4 3
2 2 2 1 4

Traslade los datos anteriores a una hoja de trabajo de Excel. Nombre la celda A1 Total de caras
para aludir a la variable, asimismo ubique de la celda A2 a la A31 los 30 valores conseguidos. A
continuación realice lo siguiente:
Paso 1 Oprima la pestaña Datos.
Paso 2 Seleccione la opción Análisis de datos.
Paso 3 Cuando aparezca el cuadro de diálogo Análisis de datos, elija Estadística descriptiva y haga clic en
el botón Aceptar.

Paso 4 Al aparecer el cuadro de diálogo Estadística descriptiva:


• Teclee en el cuadro Rango de entrada lo siguiente: A1:A31
• Seleccione la opción Columnas.
• Elija la opción Rótulos en la primera fila.
• Seleccione Rango de salida y anote C1 en el cuadro de diálogo.
• Dé clic en Resumen de estadísticas.
• Oprima el botón Aceptar.
18 ESTADÍSTICA. GUÍAS DE LABORATORIO

Determine el coeficiente de variación de los datos, escribiendo en la celda C16: CV=, y en la


celda D16 la fórmula =D7/D3*100. Al finalizar presione Enter. Es importante mencionar que este
programa (Excel) no posee una función específica para el cálculo del coeficiente de variación.
A continuación utilice Winstats para calcular los valores estadísticos más importantes de los datos.
Paso 1 Abra Winstats y haga clic en Window, posteriormente seleccione 1-var data.

Al desplegarse la ventana de datos, regrese a la hoja de cálculo y copie los 30 datos obtenidos de
las repeticiones. Luego, pegue los datos en Winstats haciendo clic en File y en seguida elija Paste
from clipboard.

Paso 2 Al concluir el paso anterior, seleccione Stats y luego Overall.

Los estadísticos se generarán en una ventana separada. A continuación se presentan los resultados:

items: 30 Número de datos


minimum value: 0.00000 Valor mínimo
first quartile: 2.00000 Cuartil 1
median: 3.00000 Mediana
third quartile: 4.00000 Cuartil 3
maximum value: 5.00000 Valor máximo
mean value: 2.70000 Media
midrange: 2.50000
range: 5.00000 Rango
interquartile range: 2.00000 Rango intercuartil
mean deviation: 1.12000
sample std dev (n): 1.29486
sample std dev (n-1): 1.31700 Desviación estándar
5 GUÍA DE LABORATORIO

Temas

• Gráficas de caja y bigote. • Covarianza y coeficiente de


correlación.

Objetivos
Después de efectuar esta práctica • Usar Excel para calcular la
de laboratorio, el estudiante será covarianza y el coeficiente
capaz de: de correlación de dos
• Usar el programa Winstats variables numéricas.
para trazar gráficas de caja
y bigote.

Herramientas a utilizar
1. Paquete Winstats de Peanut Software. Puede descargarse gratuitamente
de la siguiente página electrónica:

http://math.exeter.edu/rparris/winstats.html
2. Funciones de Excel:

Excel en inglés Excel en español


COVAR(matriz1, matriz2) COVAR(matriz1, matriz2)
CORREL(matriz1, matriz2) COEF.DE.CORREL(matriz1, matriz2)

Problema 1 Se tomaron muestras de dos marcas de mondadientes. Ambas aseguran que sus cajas contienen 250
unidades, en promedio. Las siguientes tablas muestran los resultados:

MONDADIENTES EMPERADOR
211 230 238 246 248 251 253
MONDADIENTES ZOTZ
240 246 250 251 253 254 255 256 259 262 277
20 ESTADÍSTICA. GUÍAS DE LABORATORIO

Elabore gráficos de caja y bigote para ambas muestras.


Paso 1 Abra una hoja de Excel y copie los datos de ambas muestras en dos columnas distintas. No es
necesario incluir rótulos.
Paso 2 Abra el programa Winstats, en seguida pulse el botón Window y luego 1-var data.

Al desplegarse la ventana de datos, regrese a la hoja de cálculo y copie los datos correspondientes a
la marca Emperador. Luego, pegue los datos en Winstats haciendo clic en File y posteriormente en
Paste from clipboard.

Los datos para la marca Emperador deben aparecer en la ventana. Antes de crear el gráfico de
caja y bigote de esta muestra, es necesario indicarle al programa (Winstats) que también se desea
formar el gráfico de la marca Zotz en la misma ventana. Para esto, oprima el botón Stats para abrir
el menú de la opción Boxplots, del cual debe elegir Multiple boxplots e Interpolated, ya que su
libro de texto utiliza la interpolación para determinar los cuartiles.

Haga clic en Stats, y en seguida en Boxplots para desplegar un segundo menú. Seleccione Boxplot
para generar el gráfico de caja y bigote correspondiente a la marca Emperador.

211.00 246 .00 253.00


25.0% 25.0%

230.00 251.00
GUÍA DE LABORATORIO 5 21

Paso 3 Vuelva a la hoja de Excel y copie la columna de los datos para la marca Zotz. Péguelos en la misma
ventana de datos de Winstats, haciendo clic en File y luego en Paste from clipboard. La nueva
información reemplazará a la anterior.
Para crear el segundo gráfico, haga clic en el botón Stats, y en el menú Boxplots seleccione
Boxplot. El resultado debe verse así:

211.00 246.00 253.00


25.0% 25.0%

230.00 251.00

240.00 254.00 262.00


25.0% 25.0%

250.00 259.00

Pregunta 1. ¿Qué similitudes y diferencias existen entre las distribuciones de los mondadientes Emperador y
Zotz?

Problema 2 El gerente de MIVACSA, una pequeña empresa dedicada a la elaboración de concentrados de fruta,
desea saber si las ventas de sus concentrados de horchata y piña colada están correlacionadas. Con
este propósito, tomó una muestra de las ventas de ambos productos durante 24 meses, teniendo
como resultado la siguiente tabla:

Horchata Piña colada Horchata Piña colada


220 212 240 302
171 158 209 414
201 332 172 427
220 282 193 407
238 398 315 514
215 302 251 474
206 459 266 471
304 501 219 474
227 337 238 262
257 421 264 487
225 330 108 267
171 356 203 340

Paso 1 En una hoja de Excel introduzca los valores para las variables HORCHATA (x) y PIÑA COLADA
(y) en las columnas A y B. Incluya los encabezados.
Paso 2 Copie la siguiente tabla:

D E
1 Covarianza
2 Coeficiente de correlación
22 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 3 Excel calcula la covarianza poblacional, cuya fórmula tiene a N en el denominador. Para obtener
covarianzas muestrales, debe multiplicarse el resultado por n y dividirlo por n – 1.
En la celda E1, anote la fórmula:
=COVAR(A2:A25,B2:B25)*24/23
Ahora calcule el coeficiente de correlación de la muestra en la celda E2, registrando la
fórmula:
=COEF.DE.CORREL(A2:A25,B2:B25)

Pregunta ¿A qué conclusión llega sobre la relación que existe entre las ventas de los concentrados para
horchata y piña colada?
6 GUÍA DE LABORATORIO

Temas

• Probabilidad como
frecuencia relativa.

Objetivos
Después de efectuar esta práctica de • Comparar el concepto de
laboratorio, el estudiante será capaz probabilidad clásica con el
de: aplicado a frecuencia relativa.
• Usar Excel en problemas básicos
de simulación para experimentos
estadísticos.

Herramientas a utilizar
Funciones de Excel:

Excel en inglés Excel en español


RANDBETWEEN(inferior, superior) ALEATORIO.ENTRE(inferior, superior)
FREQUENCY(datos, grupos) FRECUENCIA(datos, grupos)
AVERAGE(número1, [número2]) PROMEDIO(número1, [número2])
MEDIAN(número1, [número2]) MEDIANA(número1, [número2])
MODE(número1, [número2]) MODA(número1, [número2])
STDEV(número1, [número2]) DESVEST(número1, [número2])
Autosum Autosuma
Chart Assistant Asistente para gráficos
24 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 1 Considere el experimento de lanzar un par de dados 100 veces, anotando en cada ocasión la suma de
los números obtenidos. Use Excel para simular este experimento, generando 200 números aleatorios
del 1 al 6: 100 en la columna A y 100 en la columna B. Reserve las celdas A1, B1 y C1 para los
títulos DADO 1, DADO 2 y SUMA, respectivamente.
Paso 1 En la celda A2 escriba: =ALEATORIO.ENTRE(1,6). Se producirá un número aleatorio entre 1 y 6.

Paso 2 Mantenga oprimido el botón izquierdo del mouse y arrástrelo desde la esquina inferior derecha de la
celda A2 hasta la celda B2. Suelte el botón para formar un segundo número aleatorio entre 1 y 6.

Paso 3 Para crear los números restantes, arrastre el mouse sosteniendo el botón izquierdo, desde la esquina
inferior derecha de B2 hasta la esquina inferior derecha de B101, por lo que habrá generado 100
números aleatorios entre 1 y 6.
1.1: Sección Título 25

Paso 4 Debido a la volatilidad de los números aleatorios, éstos cambiarán en cada paso. Una vez creados
todos los valores deseados, cópielos y luego péguelos en la misma posición donde estaban antes, por
medio de la opción Pegar valores, para así fijarlos.

Paso 5 Sume las cantidades de las casillas A2 y B2 oprimiendo el botón 3 (Autosuma) y el resultado
ubíquelo en la celda C2.

Paso 6 Seleccione la celda C2 y arrastre el mouse, sin soltar el botón izquierdo, desde la esquina superior
izquierda hasta la esquina inferior derecha de la celda C101, con lo cual se obtienen las 100 sumas
resultantes de los lanzamientos de los dados.

Paso 7 Determine la media, mediana, moda y desviación estándar de las sumas, a partir de las celdas A103 y B103.
26 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 8 Elabore una tabla de frecuencias para las sumas obtenidas. Use las columnas E y F, como se muestra
en la siguiente imagen.

Seleccione las celdas que van de F2 a F12 e introduzca en la barra de fórmulas lo que se muestra a
continuación:
=FREQUENCY(C2:C101,E2:E12)
Presione las teclas Ctrl y Shift al mismo tiempo y oprima Enter. Los valores para las frecuencias
se crearán inmediatamente.
Paso 9 Use la tabla anterior y el Asistente de gráficos para elaborar un histograma titulado: Distribución de
la suma de dos dados en 100 lanzamientos.
Nota: Recuerde que los pasos 8 y 9 también se pueden realizar simultáneamente usando la función
Histograma de la herramienta Análisis de datos (vea la Guía de Laboratorio 1).
Preguntas 1. ¿Cómo describiría la forma de la distribución?

2. Según el concepto clásico de probabilidad, ¿cuántos sietes y nueves debieron obtenerse?

3. Si hubo una diferencia con lo que ocurrió en la simulación, ¿puede explicar por qué?

Problema 2 Un experimento consiste en lanzar 10 monedas idénticas y luego anotar el número de escudos obteni-
dos. Use Excel para simular los resultados que se pueden obtener en caso de realizar este experimento
100 veces. Represente con ceros las caras y con el número uno los escudos. Posteriormente elabore
una tabla de frecuencias para los resultados, así como un histograma de la distribución.
Preguntas 1. ¿Cómo describiría la forma de la distribución?

2. ¿Qué pasaría si se repitiera el experimento en más ocasiones?

3. Calcule la media, mediana, moda y desviación estándar usando Excel.


7 GUÍA DE LABORATORIO

Temas

• Distribuciones binomial y de • Distribución normal.


Poisson.

Objetivos
Después de efectuar esta práctica variables aleatorias discretas
de laboratorio, el estudiante será binomiales y de Poisson.
capaz de: • Utilizar Excel para calcular
• Utilizar Excel para calcular áreas bajo una curva normal
probabilidades para cualquiera.

Herramientas a utilizar
1. Funciones de Excel:

Excel en inglés Excel en español


NORMDIST(x;media;desvest;acum) DISTR.NORM(x;media;desvest;acum)
POISSON(x;media, acum) POISSON(x;media, acum)
BINOMDIST(núm_éxito;ensayos;prob_ DISTR.BINOM(núm_éxito;ensayos;prob_
éxito;acumulado) éxito;acumulado)

2. Paquete Winstats de Peanut Software. Puede descargarse gratuitamente


de la siguiente página electrónica:
http://math.exeter.edu/rparris/winstats.html
28 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 1 Elabore histogramas para tres distribuciones binomiales con valores de p distintos, pero con el
mismo número n de ensayos.
Para el parámetro p considere los valores 0.2, 0.5 y 0.8. En cada caso n = 10.
Paso 1 En una hoja de Excel elabore las tres tablas siguientes:

Paso 2 Calcule P(X = 0) cuando p = 0.2 y n = 10 de la siguiente forma:


Seleccione la celda B3 y luego haga clic en el icono (Insertar función).

Al desplegarse el cuadro de diálogo, seleccione la categoría Estadísticas y busque la función


DISTR.BINOM y a continuación pulse Aceptar.
GUÍA DE LABORATORIO 7 29

Al hacer lo anterior, se desplegará un nuevo cuadro de diálogo, el cual debe llenarse de la siguiente
manera:

En la celda correspondiente a Núm_éxito coloque la casilla donde se encuentra el cero, puesto que
se desea calcular P(X = 0). En la ventana Acumulado escriba 0 (cero) o falso, con lo que le indica al
programa que desea una probabilidad puntual.
En seguida calcule las demás probabilidades de la tabla eligiendo la celda B3 y luego arrastrando
su esquina inferior derecha hasta la celda B13. Al completarse la tabla, ésta debe verse así:

p = 0.2
x P(X = x)
0 0.10737418
1 0.26843546
2 0.30198989
3 0.20132659
4 0.08808038
5 0.02642412
6 0.00550502
7 0.00078643
8 7.3728E-05
9 4.096E-06
10 1.024E-07

Dé clic en la pestaña Insertar y elabore un histograma para la tabla anterior, tal y como se explica
en la Guía de Laboratorio 2. El gráfico se muestra a continuación.
30 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 3 Repita el paso 2 para las siguientes tablas. Compare los histogramas y concluya.

Paso 4 Se desea calcular P(x< 4) cuando p = 0.2 y n = 10. Tomando los resultados de la tabla correspondiente,
vemos que:
P(x < 4) = P (x < 3) = 0.10737418 + 0.26843546 + 0.30198989 + 0.20132659
= 0.87912612
Excel puede calcular este resultado con mayor rapidez mediante la función DISTR.BINOM. Llene
el cuadro de diálogo de la siguiente forma:

El resultado obtenido es el mismo. Si a la ventana Acumulado se le hubiera asignado el valor falso,


la salida de Excel hubiera sido 0.20132659.
Ejercicio ¿Cuál es valor de las siguientes probabilidades si se utiliza la función DISTR.BINOM?
a) P(x > 6), p = 0.5, n = 10.
b) P(x > 4), p = 0.8, n = 10.
c) P(x < 60), p = 0.75, n = 100.
d) P(x < 90) o (x > 105), p = 0.1, n = 1000.

Problema 2 En una fábrica de galletas se sabe que el número de chispas de chocolate en una galleta cualquiera
sigue un proceso de Poisson con una media de L = 3 chispas de chocolate por producto. Se considera
que una galleta con menos de dos chispas de chocolate no cumple con los estándares de calidad. Use
el programa Excel para calcular la probabilidad de que ocurra esto.
Paso 1 Seleccione una celda libre en una hoja de Excel. Oprima el icono para desplegar el cuadro de
diálogo Insertar función. En él seleccione la categoría Estadísticas y a continuación la función
POISSON. Cuando elija dicha función, se despliega el siguiente cuadro de diálogo, el cual debe
completar de esta forma:
GUÍA DE LABORATORIO 7 31

Se tiene entonces que P(x < 2) = P(x < 1) = 0.199148273.


La fábrica considera que una galleta con más de 5 chispas de chocolate no cumple con los
estándares de calidad. Si un supervisor selecciona una galleta al azar, ¿cuál es la probabilidad de que
ésta contenga demasiadas chispas de chocolate? ¿Cuál es la probabilidad
de que contenga exactamente tres chispas de chocolate?
Paso 2 Use una hoja de cálculo en Excel para elaborar una distribución de probabilidad para el número de
chispas de chocolate en una galleta cualquiera. Tome las categorías x = 0, 1, 2, 3, 4, 5, 6, 7 o más.
Genere el histograma de la distribución.
Paso 3 El programa Winstats también puede usarse para generar histogramas de probabilidad. Abra el
programa y en el botón Window seleccione Probability y luego Poisson.

Se abrirá una ventana, la cual muestra un ejemplo de una distribución de Poisson. Para cambiar el
parámetro L, seleccione Edit y luego Parameters.

Coloque el valor L = 3 en la ventana emergente como se ilustra en la figura.


32 ESTADÍSTICA. GUÍAS DE LABORATORIO

Al oprimir Ok se formará la distribución de probabilidad para el número de chispas de chocolate


en una galleta cualquiera. Posteriormente dé clic en Edit y luego en Label bars. Con lo anterior,
cada barra se ha rotulado con el número de chispas de chocolate respectivo. El gráfico debe
verse así:

Problema 3 Las estaturas de los habitantes de una población se describen muy bien por medio de una curva
normal con μ = 1.68 m y S = 0.1 m. Si se selecciona una persona al azar de dicha población, ¿cuál
es la probabilidad de que su estatura sea, a lo sumo, 1.75 m?

Solución con Excel. Si X es la estatura de la persona, se desea encontrar P(X  1.75). Seleccione
una celda libre de su hoja de Excel y posteriormente dé clic en , el cual desplegará el cuadro de
diálogo Insertar función. En éste seleccione la categoría Estadísticas y luego la función DISTR.
NORM con lo que se despliega un cuadro de diálogo que se llena de la siguiente forma:

Luego PX  1.75 – 0.758

Solución con Winstats. Abra el programa y en el botón Window seleccione Probability y


luego Normal. Cuando se despliegue el gráfico, cambie los parámetros haciendo clic en Edit y
posteriormente en Parameters. Llene el cuadro de diálogo emergente como se muestra:
GUÍA DE LABORATORIO 7 33

La gráfica presenta la curva normal con μ = 1.68 m y S = 0.1. La probabilidad buscada se


determina haciendo clic en Calc y luego en Probabilities. Llene el cuadro emergente de la
siguiente forma:

Al hacer clic en el botón Probability obtenemos 0.75804 como respuesta.


Como se deseaba calcular P(x b 1.75), se anotó 1.75 en high x (límite superior) y en low x se
colocó un valor muy lejano a 1.75 y a su izquierda. En este ejemplo se escogió cero, pero cualquier
número menor que 11.68 – 3(0.1) = 11.38 se considera lejano.
Winstats también genera la gráfica de la región, cuya área se acaba de determinar.

Ejercicio Mediante Excel y Winstats, calcule las siguientes probabilidades:


a) P(X > 1.80) =
b) P(1.65 < X b1.72) =
c) P(1.58 < X) o (X > 1.77) =
Nota: Recuerde que en las distribuciones continuas se tiene que:
P(X r a) = P(X > a)
P(X b a) = P(X < a)
Lo anterior NO es válido para las distribuciones discretas.
8 GUÍA DE LABORATORIO

Temas

• Evaluación de la normalidad.

Objetivos
Después de efectuar esta práctica las propiedades de la
de laboratorio, el estudiante será distribución normal.
capaz de: • Usar Excel para realizar
• Usar Winstats para comparar un plano de probabilidad
las características de un normal.
conjunto de datos con

Herramientas a utilizar
1. Paquete Winstats de Peanut Software. Puede descargarse gratuitamente
de la siguiente página electrónica:
http://math.exeter.edu/rparris/winstats.html
2. Funciones de Excel:

Excel en inglés Excel en español


NORMSINV(probabilidad) DISTR.NORM.ESTAND.INV(probabilidad)
GUÍA DE LABORATORIO 8 35

Problema 1 Evaluar las propiedades reales frente a las teóricas


Se tomó una muestra de 32 cajas de la marca popular de cerillos Pantera Negra. Esta marca asegura
que sus cajas contienen, en promedio, 40 unidades. Al contar el contenido de las cajas, se obtuvo lo
siguiente:

42 39 41 41
33 43 35 41
42 41 41 38
50 38 31 38
37 35 38 37
37 38 38 35
40 35 39 38
39 33 40 44

Determine si los datos parecen o no distribuirse normalmente por medio de la comparación de las
propiedades reales frente a las propiedades teóricas. Primero traslade los datos a la columna D en
una hoja de cálculo en Excel y ordénelos de menor a mayor usando la herramienta Ordenar y
filtrar. Abra el paquete Winstats y copie los datos siguiendo los pasos del problema 2 de la Guía de
Laboratorio 4, al momento en que se utilizó este programa. Determine los datos estadísticos de la
muestra. Con lo anterior obtendrá la siguiente tabla:

items: 32
minimum value: 31.00000
first quartile: 37.00000
median: 38.00000
third quartile: 41.00000
maximum value: 50.00000

mean value: 38.65625


midrange: 40.50000

range: 19.00000
interquartile range: 4.00000
mean deviation: 2.69727
sample std dev (n): 3.61083
sample std dev (n-1): 3.66861

Utilice los resultados anteriores en el análisis de normalidad.


Paso 1 Siguiendo los pasos del problema 1 de la Guía de Laboratorio 5, elabore el gráfico de caja y bigote
para los datos previos. El resultado debe ser el siguiente:

3 1 .00 3 8.0 0 4 4.0 0


25 .0%

37 .00 4 1.0 0

Pregunta Después de realizar un análisis del gráfico, conteste:


¿Qué tipo de distribución tienen los datos?
_______________________________________________________________________________
_______________________________________________________________________________
36 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 2 Compare la media con la mediana.


Pregunta ¿Son aproximadamente iguales?
_______________________________________________________________________________
_______________________________________________________________________________
Paso 3 Calcule 6s.
Pregunta ¿Este número se aproxima de igual manera al rango de los datos?
_______________________________________________________________________________
_______________________________________________________________________________
Paso 4 Calcule 1.33s.
Pregunta ¿Este número se aproxima al rango intercuartil de los datos?
_______________________________________________________________________________
_______________________________________________________________________________
Paso 5 Calcule x– s y x– s y determine el porcentaje de datos que se encuentran entre estos dos números.
Pregunta ¿Este porcentaje es cercano a 68%?
_______________________________________________________________________________
_______________________________________________________________________________
Solución: x– s = 34.99. x– + s = 42.33. Al contar el número de datos que son mayores que 34.99 pero menores
que 42.33, el resultado es 26. Esto es 81.25% de los datos, lo cual no es cercano a 68% teórico.
Paso 6 Calcule x– 2s y x– + 2s y determine el porcentaje de datos que se encuentran entre estos dos
números.
Pregunta ¿Este porcentaje es cercano a 80%?
_______________________________________________________________________________
_______________________________________________________________________________
Paso 7 Calcule x– 2s y x– + 2s y determine el porcentaje de datos que se encuentran entre estos dos
números.
Pregunta 1. ¿Este porcentaje es cercano a 95%?
_______________________________________________________________________________
_______________________________________________________________________________
Paso 8 Dados los resultados anteriores, ¿puede decirse que la cantidad de cerillos en las cajas de la marca
Pantera Negra está distribuido de forma aproximadamente normal? Explique.
_______________________________________________________________________________
_______________________________________________________________________________
GUÍA DE LABORATORIO 8 37

Problema 2 Construcción de la gráfica cuantil


Paso 1 En la hoja de Excel donde previamente se ordenaron los datos en la columna D enumere, en la
columna A, los datos del 1 al 32.

Paso 2 Los 32 datos determinan una partición de 33 partes iguales de la curva normal que los describe.
Así, el primer dato tiene un área acumulada de 1/33; el segundo, un área acumulada de 2/32 y así
sucesivamente. Estas áreas acumuladas se generan en la columna B, empezando por anotar la fórmula
=A1/33 en la celda B1. En seguida, realice automáticamente los demás resultados hasta la celda B32.
38 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 3 Ahora realice las puntuaciones Z para cada área acumulada encontrada en el paso anterior. En la
celda C1 escriba la fórmula:
=DISTR.NORM.ESTAND.INV(B1)
Después genere de manera automática los resultados hasta la celda C32.

Paso 4 Para finalizar, seleccione los datos de las columnas C y D y trace un diagrama de dispersión, como
se mostró en el problema 2 de la Guía de Laboratorio 3.
Si los puntos se trazan aproximadamente a lo largo de una línea recta, entonces los datos se
distribuyen en forma normal.

Conclusión
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
9 GUÍA DE LABORATORIO

Temas

• Muestreo aleatorio. • Distribución muestral


de la media.

Objetivos
Después de efectuar esta práctica • Utilizar Excel para comprobar
de laboratorio, el estudiante será que žx_  ž y que Sx_2 S2/n.
capaz de:
• Utilizar Excel para encontrar
una muestra aleatoria (con
reemplazo) de una población
finita.

Herramientas a utilizar

Excel en inglés Excel en español


VARP(número1, [número2]) VARP(número1, [número2])
Sampling Muestra

Problema 1 La compañía MIVACSA elabora concentrados de frutas naturales y los vende a importantes
cafeterías de Tegucigalpa. A continuación se presenta una tabla con las ventas mensuales en galones
del concentrado para el té frío, durante los dos años que la compañía lleva funcionando en esa
capital.

12 11 5 10
17 23 10 12
16 2 10 26
18 13 15 27
18 20 20 35
8 10 10 10
40 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 1 Abra una hoja de Excel y anote los datos desde la celda A1 hasta la D6. Luego, encuentre la
media y la varianza de esta población. Use en las celdas B8 y B9 las funciones PROMEDIO y
VARP respectivamente, las cuales se encuentran en el cuadro de diálogo desplegado al oprimir
el botón fx.
Paso 2 De la población de 24 valores, tome 10 muestras (con reemplazo) de tamaño n = 3 y elabore la tabla
que se muestra a continuación.

Haga clic en el icono de Office y realice los pasos señalados en la Guía de Laboratorio 1 para
desplegar el recuadro de Análisis de datos. En seguida seleccione Muestra.

Lo anterior desplegará el siguiente cuadro de diálogo:

Para obtener la muestra 1, anote los 24 datos poblacionales en el recuadro Rango de entrada. En la
sección Método de muestreo, dé clic en Aleatorio y en la ventana Número de muestras escriba el
número 3. En Rango de salida, de la sección Opciones de salida, seleccione la celda F2.
GUÍA DE LABORATORIO 9 41

Paso 3 Repita el paso 2 para crear las 10 muestras. Después, calcule la media de la muestra 1 en la celda
F5 usando la función PROMEDIO. Genere las medias de las demás muestras automáticamente
seleccionando la celda F5 y en seguida arrastre su esquina inferior derecha hasta la celda O5.
A continuación calcule las varianzas de cada muestra utilizando la función VARP.
Una vez completa la tabla, calcule la gran media y la gran varianza, así como la varianza de las
medias muestrales y el error estándar muestral. Al finalizar, coloque los resultados obtenidos en la
siguiente tabla:

Calcule los cuatro valores requeridos de la siguiente forma:

F
8 =PROMEDIO(F5:O5)
9 =PROMEDIO(F6:O6)
10 =VAR(F5:O5)
11 =B9/3

Pregunta Puede observarse que la gran media aproxima mejor a la media poblacional que las 10 medias mues-
trales individualmente, ¿a qué se debe esto?
_______________________________________________________________________________
_______________________________________________________________________________

La gran varianza aproxima mejor a la varianza poblacional que las 10 varianzas muestrales
individualmente. Existen 24*24*24 = 13 824 muestras posibles de tamaño 3 (con reemplazo).
Si calculara la media y la varianza para todas ellas, entonces la gran media y la gran varianza
coincidirían exactamente con la media y varianza poblacionales. De manera similar, la varianza de
las medias muestrales sería igual al error estándar si se calculara con base en las 13 824 muestras
posibles.

Problema 2 Considere una población que consta de los números 2, 4, 6, 8 únicamente.


1. Encuentre las 16 muestras de tamaño n = 2 posibles (con reemplazo).
2. Calcule las medias de cada muestra posible.
3. Construya una distribución de frecuencias para las medias encontradas.
4. Elabore un histograma de la distribución de frecuencias anterior.
5. Comente sobre el resultado.
10 GUÍA DE LABORATORIO

Temas

• Intervalos de confianza.

Objetivos
Después de efectuar esta práctica • Utilizar Excel para calcular
de laboratorio, el estudiante será intervalos de confianza con
capaz de: S2 desconocida y n  30.
• Utilizar Excel para calcular
intervalos de confianza con
S2 conocida o cuando n r 30.

Herramientas a utilizar

Excel en inglés Excel en español


CONFIDENCE INTERVALO.CONFIANZA

Problema 1 Muestras grandes


La fábrica de cerillos Tucán asegura que sus cajas contienen, en promedio, 40 unidades. Se tomó una
muestra de 32 cajas, obteniéndose los siguientes resultados:

40 37 38 39
35 37 37 32
39 34 37 30
43 39 36 34
40 38 35 36
39 37 39 36
40 38 38 37
38 33 36 33
GUÍA DE LABORATORIO 10 43

Paso 1 Copie los datos en una hoja de Excel y calcule lo siguiente:


1. Media (PROMEDIO).
2. Mediana (MEDIANA).
3. Moda (MODA).
4. Rango = MAX(numvar) – MIN(numvar).
5. Varianza (VAR).
6. Desviación estándar (DESVEST).
Paso 2 Determine el intervalo de confianza de 95% para μ, así como la media del contenido de todas las
cajas de cerillos que la fábrica Tucán produce en la actualidad. Debido a que la desviación estándar
poblacional se desconoce, use la desviación estándar muestral s como estimador puntual de S.
Seleccione una celda vacía. Haga clic en el icono para desplegar el cuadro de diálogo Insertar
función. Seleccione la categoría Estadísticas y luego la función INTERVALO.CONFIANZA.

Al hacer clic en el botón Aceptar, se abrirá otro cuadro de diálogo que deberá llenar.

El valor a anotar en la casilla Alfa es el nivel de significancia, el cual en este caso es 1 – 0.95 = 0.05.
En el recuadro Desviación estándar va el valor s muestral y finalmente, el Tamaño de la muestra
se escribe en la última casilla.
Una vez que el cuadro esté completo, dé clic en Aceptar. El valor obtenido es el resultado de
evaluar la fórmula:

s
z=
n

Ejercicios 1. Encuentre el intervalo de confianza al efectuar la ecuación: x– p z s


a) Límite inferior: _______ n
b) Límite superior: _______
44 ESTADÍSTICA. GUÍAS DE LABORATORIO

2. Determine el intervalo de confianza de 98% para ž.


a) Límite inferior: _______
b) Límite superior: _______
3. ¿Es válida la afirmación de la fábrica Tucán? Explique.
_______________________________________________________________________________
_______________________________________________________________________________

Problema 2 Muestras pequeñas


En un estudio realizado por la Universidad Tecnológica Centroamericana en junio de 2008, se
encuestó a 18 empresas familiares de primera generación ubicadas en Tegucigalpa, Honduras. Los
siguientes datos muestran el número de empleados que dichas empresas tienen en la actualidad:

17 40 9
10 10 10
10 20 13
10 35 18
6 20 40
25 14 5

Calcule intervalos de confianza de 95 a 98% para la media μ del número de empleados de las
empresas familiares de primera generación en Tegucigalpa encuestadas.
Usando los datos de la tabla, llame la celda A1 Número de empleados la cual representará a la
variable, y ubique los 18 valores obtenidos de la encuesta de las celdas A2 a la A19.
Paso 1 Oprima la pestaña Datos y luego el icono Análisis de datos. Cuando aparezca el cuadro de diálogo,
seleccione Estadística descriptiva.

Paso 2 Al hacer clic en el botón Aceptar, se desplegará un cuadro de diálogo. Llénelo como se muestra a
continuación:
GUÍA DE LABORATORIO 10 45

Oprima Aceptar para formar una tabla con un resumen estadístico para los datos. La media de la
muestra aparecerá en la celda D3 y el error máximo tˆ x aparecerá en la celda D16. El intervalo de
confianza de 95% se obtiene sumando y restando el error máximo a la media muestral.

a) Límite inferior: __________


b) Límite superior: __________

Pregunta 1. En seguida, determine el intervalo de confianza de 98% para μ.


a) Límite inferior: ______
b) Límite superior: ______

Problema 3 Establezca un intervalo de confianza de 96% para el contenido promedio de las cajas de cerillos de
la marca Pantera Negra, de acuerdo con la siguiente muestra:

42 39 41 41
33 43 35 41
42 41 41 38
50 38 31 38
37 35 38 37
37 38 38 35
40 35 39 38
39 33 40 44

Pantera Negra es un competidor de la marca Tucán. Ambos fabricantes aseveran que el contenido
promedio de las cajas es de 40 cerillos.
Pregunta ¿La evidencia confirma la aseveración de Pantera Negra?
_______________________________________________________________________________
_______________________________________________________________________________
11 GUÍA DE LABORATORIO

Temas
• Pruebas de hipótesis para
una media.

Objetivos
Después de efectuar esta práctica • Utilizar Excel para probar
de laboratorio, el estudiante será hipótesis para una media con
capaz de: S2 desconocida y n < 30.
• Utilizar Excel para probar
hipótesis para una media con
S2 conocida o cuando n r 30.

Herramientas a utilizar

Excel en inglés Excel en español


ZTEST PRUEBA.Z
TDIST DISTR.T
ABS ABS

Problema 1 Muestras grandes (prueba de dos colas)


La fábrica de cerillos Cóndor lucha por posicionarse en el mercado, por lo que es muy importante
comprobar si los mecanismos de control de calidad funcionan apropiadamente. La competencia por
parte de las marcas Tucán y Pantera Negra es muy fuerte, sin embargo Cóndor busca enfrentar este
reto a través de la diferenciación.
Un primer paso para alcanzar su meta fue determinar si el contenido promedio de las cajas es
de 40 cerillos. Para esto, se tomó una muestra aleatoria de 34 cajas y se contó su contenido. Los
resultados fueron los siguientes:

40 37 37 32 39
37 41 38 36 32
36 34 36 33 38
33 37 44 39 36
45 40 36 38 37
39 30 42 39 31
30 38 40 37
GUÍA DE LABORATORIO 11 47

Las hipótesis apropiadas son:

H0: ž  40 cerillos.

H1: ž x 40 cerillos.

Se tomó un nivel de significancia de A = 0.05 para esta prueba de hipótesis.


Paso 1 Usando los datos de la tabla, escriba en la celda A1 CERILLOS como nombre de la variable y anote
los 34 valores obtenidos en las celdas que van de A2 a A35. Finalmente determine el valor de P por
medio de la fórmula:

= 2*MIN(PRUEBA.Z(A2:A35,40),1-PRUEBA.Z(A2:A35,40))

Si P > A, no se rechaza que H0. Si P < A, entonces se rechaza que H0.


Pregunta ¿Debe Cóndor mejorar sus mecanismos de control de calidad?
_______________________________________________________________________________
_______________________________________________________________________________

Nota: En pruebas de una cola, el valor de P se determina por medio de las siguientes fórmulas:
a) Si es de cola derecha: =PRUEBA.Z(arreglo, ž0, S).
b) Si es de cola izquierda: =1-PRUEBA.Z(arreglo, ž0, S).

En ambos casos omita S si no se conoce. Excel usará en su lugar el valor muestral s.

Problema 2 Muestras pequeñas (prueba de una cola)


Al igual que los cerillos, los mondadientes se venden en empaques con un contenido promedio
establecido por la fábrica. El gerente del restaurante Tallarín y Soya siempre ha sospechado que las
cajas de los mondadientes Emperador contienen una cantidad, en promedio, menor a los 250 que
el fabricante ha establecido. Para cerciorarse, el gerente tomó una muestra de 16 cajas y, tras un
laborioso conteo, llegó a los siguientes resultados:

259 226 234 203


275 196 234 230
254 235 217 248
249 234 224 240

Las hipótesis son:


H0: ž = 250 mondadientes.

H1: ž < 250 mondadientes.

Se tomó un nivel de significancia de A = 0.05.


Por tratarse de una muestra pequeña, es necesario utilizar la distribución t con 15 grados de
libertad en esta prueba de hipótesis.
Paso 1 Abra una hoja de cálculo de Excel e introduzca los datos en la columna A bajo el título
Mondadientes.
48 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 2 Oprima la pestaña Datos, posteriormente Análisis de datos y finalmente elija la opción Estadística
descriptiva.
El cuadro de diálogo que aparece al realizar lo anterior, debe llenarse de la siguiente manera:

Excel calculará las estadísticas para los datos que se introdujeron, tal como se muestra a
continuación:

En la tabla anterior, el error típico es S–x . Ahora calcule el valor de prueba mediante la fórmula:

X −μ
t=
σX

Para esto, introduzca la expresión =(D3 – 250)/D4 en la celda D18.


Paso 3 A continuación, calcule el valor P introduciendo la fórmula:
=DISTR.T(ABS(D18),15,1)
Donde D18 es la celda en la que el valor de prueba t se calculó, 15 son los grados de libertad y
1 el número de colas de la prueba.
Si P > A, no se rechaza H0. Por el contrario, si P < A, se rechaza H0.
Pregunta ¿El restaurante Tallarín y Soya debe cambiar la marca de mondadientes que usa? Explique.
_______________________________________________________________________________
_______________________________________________________________________________
12 GUÍA DE LABORATORIO

Temas

• Pruebas de hipótesis para


diferencias de medias.

Objetivos
Después de efectuar esta práctica • Utilizar Excel en pruebas
de laboratorio, el estudiante será de hipótesis para ž1-ž2
capaz de: cuando las muestras son
• Utilizar Excel en pruebas de dependientes.
hipótesis para ž1-ž2 cuando
las muestras son grandes.
• Utilizar Excel en pruebas de
hipótesis para ž1-ž2 cuando
las muestras son pequeñas.

Herramientas a utilizar

Excel en inglés Excel en español


z-Test: Two Sample for Means. Prueba z para medias de dos muestras.
t-Test: Two Sample Assuming Equal Prueba t para dos muestras suponiendo
Variances. varianzas iguales.

t-Test: Paired Two Samples for Means. Prueba t para medias de dos muestras
emparejadas.

F-Test Two Sample for Variances. Prueba F para varianzas de dos muestras.
50 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 1 Muestras grandes e independientes


Las fábricas de cerillos Pantera Negra y Tucán aseguran que sus cajas contienen, en promedio, 40
unidades. Sin embargo, se sospecha que la marca Pantera Negra tiene un mejor promedio que Tucán.
Para comprobar lo anterior, se tomó una muestra de 30 cajas de cada marca. Los resultados pueden
verse a continuación:

Pantera negra
38 40 37 36 41
42 43 36 43 42
39 47 37 38 44
39 43 39 38 44
40 30 34 38 45
40 38 33 40 46

Tucán
40 40 43 40 36
39 40 38 43 36
40 38 40 34 39
40 39 41 35 40
38 41 43 35 40
39 43 39 35 41

Con un nivel de significancia de A = 0.05, se desea probar las hipótesis:


H0: μP = μT
H1: μP > μT
Paso 1 Abra una hoja de Excel y escriba en la celda A1 Pantera negra como nombre de la variable y Tucán en
la celda B1. Anote los datos para Pantera Negra en las celdas A2:A31 y los correspondientes a Tucán en
las casillas B2:B31. Determine la varianza de las muestras anteriores, como se muestra a continuación:

Paso 2 Pulse de la barra principal de Excel la pestaña Datos. Haga clic en el icono Análisis de datos
y cuando aparezca el cuadro de diálogo, seleccione Prueba z para medias de dos muestras.
Finalmente oprima Aceptar.
Cuando aparezca el cuadro de diálogo, llénelo de la siguiente forma:
GUÍA DE LABORATORIO 12 51

Al pulsar el botón Aceptar, Excel generará la siguiente tabla:

Prueba z para medias de dos muestras

PANTERA NEGRA TUCÁN


Media 39.66666667 39.16667
Varianza (conocida) 14.9195402 6.143678
Observaciones 30 30
Diferencia hipotética de las medias 0
z 0.596716802
P(Z<=z) una cola 0.275348236
Valor crítico de z (una cola) 1.644853627
Valor crítico de z (dos colas) 0.550696473
Valor crítico de z (dos colas) 1.959963985

Nota: Excel, en su versión en español, produce un error en esta prueba. El renglón señalado en rojo
corresponde en realidad al valor P para dos colas. Tome en cuenta este hecho al efectuar pruebas de
hipótesis para muestras grandes.

Al observar la tabla, se ve que el valor de P para una cola es mayor que A, por lo que no se
rechaza H0. No hay evidencia de que Pantera Negra tenga un mejor llenado por caja promedio
que Tucán.
También se pudo llegar a esta conclusión notando que el valor z = 0.5967, es menor que el valor
crítico 1.64 para la prueba de una cola.
Note que, para la prueba de dos colas, el valor de P es 0.551 y que los valores críticos
son ±1.96.

Problema 2 Muestras pequeñas e independientes


En referencia al problema 2 de la Guía de Laboratorio 10 y al estudio realizado por la Universidad
Tecnológica Centroamericana en junio de 2008, aparte de encuestarse a 18 empresas familiares de
primera generación en Tegucigalpa realizado en la Guía de Laboratorio 10, también se encuestaron 19
empresas familiares de segunda generación. Los siguientes datos muestran el número de empleados
que dichas empresas tienen en la actualidad:

1a. Generación
17 40 9 2a. Generación
10 10 10 6 4 32 18
10 20 13 13 10 6 12
10 35 18 30 8 10 1000
6 20 40 40 15 14 1
25 14 5 300 25 6

Existe evidencia de que en promedio, ambos tipos de emplean una cantidad distinta de trabajadores?
Probaremos las hipótesis:
H0: μ1 = μ2

H1: μ1 x μ2

Con un nivel de significancia de A = 0.05.


Paso 1 Abra una hoja de Excel y escriba el nombre de las variables en las celdas A1 y B1. Los valores de la
muestra 1 se anotan en las celdas A2:A19 y los de la muestra 2 en las casillas B2:B20. Calcule las
varianzas de ambas muestras.
52 ESTADÍSTICA. GUÍAS DE LABORATORIO

Paso 2 Se debe comprobar si las varianzas poblacionales se pueden considerar iguales o no. Las hipótesis
son:
H O :  22   12

H1 :  22   12

La hipótesis alternativa surge del hecho de que s22 > s12 .


Paso 3 Realice una prueba F para probar la hipótesis considerando A = 0.05. Seleccione la pestaña Datos y
luego Análisis de datos. En el cuadro de diálogo, pulse Prueba F para varianzas de dos muestras
y complételo como se muestra:

Al dar clic en Aceptar se obtiene la siguiente tabla:

Prueba F para varianzas de dos muestras

2a. Generación 1a. Generación


Media 81.57894737 17.33333333
Varianza 53841.59064 121.2941176
Observaciones 19 18
Grados de libertad 18 17
F 443.8928424
P(F<=f) una cola 3.33581E-19
Valor crítico para F (una cola) 2.256670966

Como P < A, se rechaza H0 y la varianza de la segunda generación se considera mayor que la de la


primera.
Paso 4 Continúe ahora con la prueba de hipótesis para las medidas. Haga clic en Análisis de datos. En
seguida seleccione Prueba t para dos muestras suponiendo varianzas desiguales y finalmente
oprima Aceptar.
Cuando aparezca el cuadro de diálogo, llénelo de esta manera:
GUÍA DE LABORATORIO 12 53

Haga clic en Aceptar. Cuando Excel genere la salida, compare el valor de P (dos colas) respecto al
valor A = 0.05.
Pregunta Determine si se rechaza o no se rechaza H0. ¿Qué significa esto en términos de la cantidad promedio
de trabajadores que las empresas de primera y segunda generación emplean?
_______________________________________________________________________________
_______________________________________________________________________________

Problema 3 Muestras dependientes (emparejadas)


Los siguientes datos corresponden a la producción agrícola en Honduras, durante los años 2006 y
2007 (en miles de quintales), para productos seleccionados.

Producción agrícola
seleccionada 2006 2007
Arroz en granza 487 521
Banano 11,369 11,710
Café en oro 4,396 4,805
Caña de azúcar 122,798 131,359
Frijoles 2,200 2,392
Maicillo o sorgo 1,424 1,520
Maíz 11,709 13,606
Palma africana 22,944 24,518
Plátanos 1,607 1,663
Fuente: Honduras en cifras, 2003-2007. p.5

Se desea saber si hubo un cambio significativo en la producción agrícola del año 2007 respecto al
2006. Las hipótesis apropiadas son:
H0: μD = 0
H1: μD x 0
Se hará la prueba de hipótesis con A = 0.05.
Paso 1 Abra una hoja de Excel y copie la tabla de datos en las columnas A, B y C.
Paso 2 En Análisis de datos elija Prueba t para medias de dos muestras emparejadas y oprima Aceptar.

Llene el cuadro de diálogo que se desplegará al realizar la acción anterior como se muestra a
continuación:
54 ESTADÍSTICA. GUÍAS DE LABORATORIO

Pregunta Observe la salida de Excel. Al comparar el valor P para dos colas con el nivel de significancia A,
¿a qué conclusión llega respecto a la producción agrícola en Honduras durante los años 2006 y
2007?
_______________________________________________________________________________
_______________________________________________________________________________
13 GUÍA DE LABORATORIO

Temas

• C2 como prueba de
independencia.

Objetivos
Después de efectuar esta práctica • Probar hipótesis sobre
de laboratorio, el estudiante será la independencia de dos
capaz de: variables por medio de Excel.
• Usar Excel en la elaboración
de tablas de contingencia
para valores observados y
esperados.

Herramientas a utilizar

Excel en inglés Excel en español


CHITEST(rango actual, rango esperado) PRUEBA.CHI(rango actual, rango
esperado)
CHIINV(probabilidad, grados de PRUEBA.CHI.INV(probabilidad, grados
libertad) de libertad)
Autosum Autosuma
56 ESTADÍSTICA. GUÍAS DE LABORATORIO

Problema 1 Con el objetivo de medir el grado de desarrollo de las competencias emprendedoras de los estudiantes
de la UNITEC, se realizó una encuesta entre 44 estudiantes del campus Tegucigalpa durante el
mes de marzo de 2008. Se midieron nueve competencias emprendedoras por medio de una escala
descendente, diseñada para que el inciso a) mostrara un desarrollo pleno de la competencia en
cuestión, mientras que el paréntesis e) señalara una deficiencia considerable. El estudiante debía
seleccionar el inciso que mejor lo describiera. A continuación se resumen los resultados de acuerdo
con la carrera que cursan los estudiantes.

Se obtuvieron 377 respuestas de 396 posibles. Se desea saber si existe una relación entre la carrera
que se cursa y el desarrollo de las competencias emprendedoras.
Las hipótesis son:
H0: La carrera que cursa el estudiante y el desarrollo de sus competencias emprendedoras son
independientes.
H1: La carrera que cursa el estudiante y el desarrollo de sus competencias emprendedoras son depen-
dientes.
Se tomará A = 0.05.
Paso 1 Introduzca en Excel la tabla 3 × 5 que se muestra en la imagen anterior. Los totales por filas y
columnas se dan en la fila 5 y la columna G, respectivamente. Puede corroborar estos totales
haciendo uso de la herramienta 3 (Autosuma).
Paso 2 Construya una tabla de valores esperados. Sólo será necesario teclear la fórmula en la primera casilla
de la tabla para que Excel llene los demás recuadros. El valor esperado para el valor observado 41
(en la celda B2) es:

108(102)
fe   29. 22
337

Es decir, G2*B5/G5. Para que no sea necesario escribir una fórmula para cada una de las casillas
restantes, teclee la fórmula =$G2*B$5/$G$5 en la celda J2, como se muestra en la siguiente
imagen:
GUÍA DE LABORATORIO 13 57

Al presionar Enter aparecerá el número 29.2202. Para generar los demás valores esperados, haga
clic en la celda J2 y luego, empezando por la esquina inferior derecha, arrastre el mouse hasta la
celda N2.

Al hacer esto, todos los valores esperados para la primera fila se formarán. Los valores esperados
restantes se obtienen arrastrando el mouse (siempre desde la esquina inferior derecha) hasta la
celda N4.

Agregue las sumas de las filas y columnas para comprobar que coinciden con los incluidos de la
tabla de los valores observados.

Paso 3 Construya la siguiente tabla.


58 ESTADÍSTICA. GUÍAS DE LABORATORIO

Dado que la tabla de contingencias es de tamaño 3 × 5, los grados de libertad son: v = 2(4) = 8.
En la celda R1 introduzca la fórmula
=PRUEBA.CHI(B2:F4,J2:N4)
Con lo anterior, el valor P aparecerá. Este número representa el área a la derecha del estadístico C2.
Si P < A, se rechaza la hipótesis nula (y las variables son dependientes). En cambio, si P > A, la
hipótesis nula no se rechaza y no habría evidencia de dependencia entre las variables.
También se puede llegar a la conclusión comparando el valor crítico con el valor de prueba. En
la celda R4 introduzca la fórmula:
=PRUEBA.CHI.INV(R2,R3)
y se generará el valor crítico.
En la celda R5 introduzca la fórmula
= PRUEBA.CHI.INV(R1,R3)
y se obtendrá el estadístico C2 de prueba. Al compararla con el valor crítico, se corroborará si la
hipótesis nula se rechaza o no.
Pregunta 1. ¿Existe una relación entre la carrera que se cursa y el desarrollo de las competencias
emprendedoras?
_______________________________________________________________________________
_______________________________________________________________________________

Problema 2 La siguiente tabla de contingencias muestra los resultados de la encuesta realizada por la Universidad
Tecnológica Centroamericana, en junio de 2008, a 50 empresas familiares de Tegucigalpa.

1a. Generación 2a. Generación 3a. Generación


Hombres 59 41 10
Mujeres 27 37 12

Preguntas 1. ¿Existe una relación entre el género de los empleados que trabajan para estas empresas y la
antigüedad del negocio? Plantee las hipótesis apropiadas y pruébelas usando Excel. Tome A = 0.05.
2. Si existiera una relación, establézcala y explíquela.
_______________________________________________________________________________
_______________________________________________________________________________
14 GUÍA DE LABORATORIO

Temas

• Análisis de varianza.

Objetivos
Después de efectuar esta práctica
de laboratorio, el estudiante será
capaz de:
• Usar Excel en el análisis de
varianza de un factor.

Herramientas a utilizar

Excel en inglés Excel en español


ANOVA: Single factor. Análisis de varianza de un factor.

Problema 1 Por su naturaleza, las empresas familiares tienen dificultades administrativas que conducen a
conflictos entre los diferentes miembros de la familia. Para estas empresas es difícil equilibrar los
intereses familiares, inversionistas y administrativos.
La encuesta realizada por la Universidad Tecnológica Centroamericana en junio de 2008 a
50 empresas (42 de ellas calificadas como familiares), contenía la pregunta: ¿entran los familiares
frecuentemente en conflicto y están en desacuerdo sobre las decisiones administrativas? La respuesta
se daba en una escala de Likert del uno al siete, siendo este último el valor asignado a la opinión
Totalmente de acuerdo.
60 ESTADÍSTICA. GUÍAS DE LABORATORIO

A continuación se presentan los resultados clasificados de acuerdo con las generaciones que
participan en la administración de la empresa.

Generación 1 Generación 2 Generación 3


3 1 4
3 2 5
1 1 7
3 5 1
1 3 3
3 1
2 1
2 1
1 1
4 1
2 5
4 6
4 1
2 1
2 4
2 1
2 2
2 1
1

¿Tienen las empresas familiares la misma cantidad de conflictos, independientemente de la


generación que las administre?
Con un nivel de significancia de A = 0.05, probaremos las hipótesis:

H0: ž1 = ž2 = ž3

H1: ž1, ž2, ž3 no son todas iguales.

Introduzca los datos en una hoja de Excel, en las columnas A, B y C. Haga clic en la etiqueta Datos y
luego en Análisis de Datos. Al desplegarse el cuadro de diálogo, seleccione Análisis de varianza de
un factor. Haga clic en Aceptar. Cuando aparezca el cuadro de diálogo, llénelo de la siguiente forma:

Al hacer clic en Aceptar Excel generará la siguiente salida:


GUÍA DE LABORATORIO 14 61

Se puede llegar a la conclusión de dos formas:


1. Comparando el valor P (llamado Probabilidad en la tabla) con A.
2. Comparando el valor F con el Valor crítico para F.
Paso 2 Concluya y explique las razones que provocan el problema.
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________

Problema 2 En la misma encuesta del problema 1 se hizo la pregunta: ¿la empresa emplea consultores externos,
consejeros y servicios profesionales? Ocho de las 50 empresas encuestadas se calificaron a sí mismas
como No familiares. Estos negocios contestaron la pregunta en cuestión, por lo que los resultados se
clasificaron en esta ocasión en cuatro grupos como se ve en la siguiente tabla.

Generación 1 Generación 2 Generación 3 No familiar


5 3 7 1
2 6 7 1
1 5 1 5
5 1 5 5
5 1 2 5
2 1 7
1 6 3
1 6 3
6 4
6 1
1 1
6 4
1 7
2 1
1 6
1 6
4 7
3 2
7

Pregunta ¿Son las actitudes de los cuatro grupos similares respecto a la asesoría externa? Explique las posibles
razones de su conclusión.
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
15 GUÍA DE LABORATORIO

Temas

• Regresión lineal simple.

Objetivos
Después de efectuar esta práctica • Determinar los coeficientes
de laboratorio, el estudiante será de determinación y
capaz de: correlación, así como los
• Usar Excel para encontrar errores se y sb, por medio
la gráfica y la ecuación de la de Excel.
recta de regresión para dos
variables x y y.

Problema 1 Se analiza los flujos de caja para un proyecto de inversión, el cual consiste en la construcción de
una residencia para estudiantes universitarios. Se consideran diferentes rentas posibles, que originan
distintas Tasas Internas de Retorno (TIR) para el proyecto. La siguiente tabla ilustra la situación.

Renta TIR

$150 19
$160 20
$170 22
$180 24
$190 26
$200 27
$250 36

Pregunta ¿Podrá una recta describir bien la variación de la TIR?


_______________________________________________________________________________
_______________________________________________________________________________
GUÍA DE LABORATORIO 15 63

Paso 1 Introduzca los valores para las variables Renta (x) y TIR (y) en una hoja de Excel. Luego, seleccione
los datos (sin los rótulos) y haga clic en la pestaña Insertar para después hacerlo en Dispersión. En
el menú, seleccione Dispersión sólo con marcadores.

Cuando aparezca el gráfico, pulse el botón secundario del mouse sobre un punto cualquiera.

En el menú seleccione Agregar línea de tendencia para desplegar un cuadro de diálogo, el cual
llenará así:
64 ESTADÍSTICA. GUÍAS DE LABORATORIO

Con la indicación anterior se generará el siguiente gráfico:

Preguntas 1. ¿Cuál es el aumento de la TIR por cada dólar de aumento en la renta? ¿y por cada $10.00 de aumento?
_______________________________________________________________________________
_______________________________________________________________________________
2. ¿La recta de regresión es un buen modelo para describir la variación de la TIR? ¿Por qué?
_______________________________________________________________________________
_______________________________________________________________________________
3. ¿Cuál es la TIR del proyecto cuando la renta a cobrar es de $230.00?
_______________________________________________________________________________
_______________________________________________________________________________
Paso 2 Mejore el gráfico. Dé clic sobre él para que aparezca la pestaña Herramientas de gráficos en la parte
superior de la pantalla. En la pestaña Diseño puede cambiar el aspecto de los puntos. En la pestaña
Presentación, puede agregarle un título, así como nombre a los ejes. En Formato puede cambiar el
color del fondo del gráfico, así como también el de la recta de tendencia. Un ejemplo del gráfico
mejorado se ve a continuación.

Paso 3 Determine los errores se y sb. En la pestaña Datos haga clic en Análisis de datos. Al desplegarse el
cuadro de diálogo seleccione Regresión.
GUÍA DE LABORATORIO 15 65

Llene el cuadro de diálogo así:

Al pulsar el botón Aceptar, la salida de Excel contendrá los errores buscados.

Puede observarse que se = 0.339436874 (amarillo) y sb = 0.004187252 (azul). Además, los valores
de a y b pueden verse en la columna Coeficientes (verde). Los límites del intervalo de confianza de
95% para b están encerrados en rojo.

Nota: Excel, en su versión en español, tiene un error de traducción en la tabla anterior. En lugar de Valor
crítico de F debe leerse Valor P de F.

Problema 2 El comportamiento del Índice de Precios al Consumidor (IPC) durante los años 2003 al 2007 en
Honduras, se ilustra en la siguiente tabla (diciembre 1999=100).

Año 2003 2004 2005 2006 2007


Tipc 138.3 151 162.7 171.3 186.5
Fuente: Honduras en cifras, 2003–2007.

Paso 1 Use Excel para generar el gráfico de la recta de regresión para estos datos.
66 ESTADÍSTICA. GUÍAS DE LABORATORIO

Preguntas 1. ¿Cuál es su ecuación?


_______________________________________________________________________________
_______________________________________________________________________________
2. ¿Cuánto aumenta el IPC por cada año que pasa?
_______________________________________________________________________________
_______________________________________________________________________________
3. Determine el coeficiente de determinación e interprételo.
_______________________________________________________________________________
_______________________________________________________________________________
4. Pronostique el IPC para 2008.
_______________________________________________________________________________
_______________________________________________________________________________
5. Determine los errores se y sb.
_______________________________________________________________________________
_______________________________________________________________________________

Problema 3 La siguiente tabla muestra el comportamiento del consumo de agua potable (en miles de metros
cúbicos) y el crecimiento de la población en Tegucigalpa, Honduras, desde el año 2003 al 2007.

Año 2003 2004 2005 2006 2007


Población (miles) 858.4 879.2 900.4 922.2 944.4
Consumo 50,566 46,691 46,451 48,113 49,113
Fuente: Honduras en cifras, 2003-2007.

Paso 1 Use Excel para generar un gráfico del modelo de regresión lineal, así como el valor r2 y la ecuación
de la recta para cada pareja de variables. Indique en cada caso si el modelo de regresión es explicativo
de la variación de y.
1. Año (x) y Población (y). ________________________________________________________
________________________________________________________
2. Año (x) y Consumo (y). ________________________________________________________
_________________________________________________________
3. Población (x) y Consumo (y). ____________________________________________________
____________________________________________________
16 GUÍA DE LABORATORIO

Temas

• Regresión múltiple.

Objetivos
Después de efectuar esta práctica • Usar Excel para determinar
de laboratorio, el estudiante será qué variables explicativas son
capaz de: significativas.
• Usar Excel para determinar • Usar Excel para obtener
la ecuación de regresión intervalos de confianza para
que mejor se ajuste a datos la pendiente poblacional Bi.
con múltiples variables
independientes.
• Usar Excel para determinar si
la regresión como un todo es
significativa.

Problema 1 La calificación final en un curso universitario de matemáticas básicas podría verse afectada por las
siguientes variables:

x1: El número de días que el estudiante faltó a clase.


x2: La calificación obtenida por el estudiante en el examen del I Parcial.
x3: La asistencia a un curso nivelatorio previo.
x4: El estudiante repite la clase.

Las variables x3 y x4 se han codificado de la siguiente manera:

x3 = 1 si el estudiante asistió al curso de regularización y 0 de otra manera.


x4 = 1 si el estudiante repite la clase y 0 de otra manera.
68 ESTADÍSTICA. GUÍAS DE LABORATORIO

Se tomó una muestra de 8 estudiantes que llevaron esta clase y los resultados fueron los siguientes:

Calificación Calificación Asistencia al curso Repite


final Inasistencias del I Parcial regularización la clase
y x1 x2 x3 x4
18 8 5 0 0
75 6 68 1 0
53 6 38 1 1
91 0 72 1 0
68 0 43 0 0
25 6 7 0 0
41 3 20 1 1
63 0 45 1 1

Determine un modelo de regresión lineal para la calificación final del curso básico de matemáticas
usando Excel.
Paso 1 Traslade los datos a una hoja de Excel.

Paso 2 Haga clic en la pestaña Datos, luego en Análisis de datos y elija Regresión para llenar el cuadro de
diálogo emergente de la siguiente manera:
GUÍA DE LABORATORIO 16 69

Al hacer clic en el botón Aceptar, Excel generará la siguiente tabla:

^
Paso 3 Determine la ecuación de regresión Y = a + b1 X1 + b2X2 + b3X3 + b4X4 basándose en los coeficientes
(en verde) generados por Excel.
_______________________________________________________________________________
Paso 4 Interprete ahora cada coeficiente.

• Intercepto a = 28.27. Cuando el número de días de inasistencia a clase es 0, la calificación del


I Parcial es 0, El estudiante no asistió al curso nivelatorio (valor 0) y además cursó la clase por
primera vez (valor 0), entonces la calificación final sería 28.27%.
• Pendiente b1 = 1.64. Por cada día que no se asiste a clase, la calificación final baja en 1.64 en
puntos porcentuales.
• Pendiente b2 = 0.89. __________________________________________________________
________________________________________________________________________
• Pendiente b3 = 2.97. Si la variable toma el valor 1 (el estudiante asistió al curso nivelatorio),
entonces la calificación final disminuye 2.97%.
• Pendiente b4 = 1.25. ___________________________________________________________
________________________________________________________________________

Paso 5 Pruebe el modelo de regresión como un todo.


El coeficiente de determinación R2 (en rojo) está muy cercano a 1. Sin embargo, la prueba F
indicará si en realidad x1, x2, x3 y x4 tomadas en conjunto, explican significativamente la variabilidad
de y. Las hipótesis son:

H0: B1 = B2 = B3 = B4 = 0 y no depende de x1, x2, x3 y x4.


H1: B1, B2, B3, B4 no son todas cero. y depende de al menos una xi.

Se tomará A = 0.05 en esta prueba. El valor de P (amarillo) es considerablemente menor que A,


por lo que se rechaza H0. Entonces, hay evidencia de que y depende de al menos una xi. En otras
palabras, existe por lo menos una variable explicativa significativa para la calificación final del curso
de matemática básica.
Paso 6 Pruebe cada variable independiente.
Para cada prueba se tomará un A = 0.1, permitiendo una mayor flexibilidad.
Consideremos las hipótesis:

H0: B1 = 0 y no depende de x1.


H1: B1 x 0 y depende de x1.
70 ESTADÍSTICA. GUÍAS DE LABORATORIO

El valor P para esta prueba (en azul) es 0.051, por lo que se rechaza H0. Hay evidencia de que y
depende de x1. En otras palabras, el número de días de inasistencia a clase es una variable explicativa
significativa de la calificación final del estudiante.
Realice ahora una prueba de hipótesis individual para x2, x3 y x4.
H0: ________
H1: ________
Valor de P = _____
Conclusión: _____________________________________________________________________
H0: ________
H1: ________
Valor de P = _____
Conclusión: _____________________________________________________________________
H0: ________
H1: ________
Valor de P = _____
Conclusión: _____________________________________________________________________
Paso 7 Realice un nuevo modelo de regresión usando únicamente las variables explicativas significativas.
En una nueva hoja de Excel pegue la columna Y, así como las columnas de las variables
explicativas significativas y repita el paso 3. La ecuación de regresión debe ser:
y^ = 28.93 – 1.74x + 0.85x
1 2
Note la mejoría ocurrida en el valor de P de la prueba F y en los valores P para las pruebas por
variable (marcadas en amarillo y azul respectivamente, en la tabla del paso 2).
Paso 8 Determine intervalos de confianza de 95% para B1 y B2.
Los límites inferior y superior para cada intervalo se obtienen de la tabla generada por Excel
(están en color gris en la tabla obtenida en el paso 2). Utilizando los límites generados en el modelo
depurado, se tiene que:
2.623237073 < B1 < 0.849008867

___________ < B2 < ____________


Para otros niveles de confianza, basta elegir la casilla Nivel de confianza en el cuadro de diálogo
Regresión y luego teclear la confianza deseada (vea el paso 2).

También podría gustarte