Está en la página 1de 12

Universidad Nacional del Noroeste de la Provincia de Buenos Aires

Probabilidades y Estadística Trabajo Practico 2 - Excel

PROBABILIDADES y ESTADISTICA

TRABAJO PRÁCTICO Nº 2
Ejemplos con Excel

Estadística Descriptiva

Introducción. Poblaciones, muestras y procesos. Organización y presentación de da-


tos.Descripción gráfica. Medidas numéricas descriptivas-.

Profesora: Lic.Beatriz Batesteza

Profesora: Ma. Eugenia Gallardo

-1-
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

Análisis estadísticos de datos con las Herramientas para análisis de Excel


Excel incluye las herramientas que se detallan a continuación.

 Varianza
o Varianza De un Factor
o Varianza De dos factores con replicación
o Varianza De dos factores sin replicación
 Correlación
 Covarianza
 Estadística descriptiva
 Suavización exponencial
 Prueba t para varianzas de dos muestras
 Análisis de Fourier
 Histograma
 Media móvil
 Generación de números aleatorios
 Jerarquía y percentil
 Regresión
 Muestreo
 Prueba t
o Prueba t: medias de dos muestras emparejadas
o Prueba t: dos muestras suponiendo varianzas iguales
o Prueba t homoscedástica.
o Prueba t: dos muestras suponiendo varianzas desiguales
o Prueba t heteroscedástica.
 Prueba z

Utilizaremos algunas de estas herramientas para resolver ejercicios de la práctica 2


Se encuentran en la solapa Datos y luego “Análisis de datos” ó “Data analysis” según la versión de
Excel.

Ejercicio 1

Los siguientes datos de octanaje de diversas mezclas de gasolina fueron tomados de un artículo en
la revista technometrics

88,5 87,7 83,4 86,7 87,5 91,5 88,6 100,3


95,6 93,3 94,7 91,1 91,0 94,2 87,8 89,9
88,3 87,6 84,3 86,7 88,2 90,8 88,3 98,8
94,2 92,7 93,2 91,0 90,3 93,4 88,5 90,1

-2-
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

89,2 88,3 85,3 87,9 88,6 90,9 89,0 96,1


93,3 91,8 92,3 90,4 90,1 93,0 88,7 89,9
89,8 89,6 87,4 88,9 91,2 89,3 94,4 92,7
91,8 91,6 90,4 91,1 92,6 89,8 90,6 91,1
90,4 89,3 89,7 90,3 91,6 90,5 93,7 92,7
92,2 92,2 91,2 91,0 92,2 90,0 90,7

Trace un diagrama de tallo y hojas para estos datos.


Diagrama tallo - hoja
Para elegir tallo y hoja, es necesario conocer el rango de valores que tienen los datos. Para esto una vez
cargados los datos en la planilla, todos en una fila o todos en una columna (tener en cuenta si la versión de
Excel que poseen toma como decimal la coma o el punto), vamos a “Análisis de datos” y seleccionamos la
opción “Estadística descriptiva”

Al completar obtenemos: media, error típico, mediana, moda, desviación estándar, varianza muestral, kur-
tosis, asimetría, rango, valor mínimo, valor máximo, suma de los datos y cantidad de datos.

-3-
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

Mirando el valor máximo y mínimo podemos decidir que lo “más conveniente” sería tomar la parte entera
del dato como tallo y la parte decimal como hojas.
Hacer este tipo de diagramas con Excel es un poco más trabajoso. Pero una vez realizado podemos reutili-
zarlo acomodando cosas.
Usaremos la función REPETIR y la función CONTAR.SI.
Cargamos los tallos, luego parados a la derecha del primero, elegimos la función repetir.

-4-
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

En este caso no aparece ningún 0 porque valor 83 no está dentro del conjunto de datos. Ahora debemos
hacer lo propio con el resto de las hojas. Para que los valores queden concatenados en la misma celda, va-
mos a la barra de fórmulas y usando el carácter & copiamos y pegamos la fórmula anterior 9 veces más que
luego corregiremos.

Una vez hecho para el primer tallo, en este caso 83, copiamos hacia abajo la fórmula y listo en diagrama
tallo-hoja.

-5-
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

¿Por qué es relativamente fácil identificar un valor de octanaje?


¿Revela el diagrama algunas propiedades importantes de los datos?
Dejamos al lector las respuestas a estas preguntas.

Ejercicio 4

Unos transductores de temperatura de cierto tipo se embarcan en lotes de 50. Se seleccionó una
muestra de 60 lotes y se determinó la cantidad de transductores en cada lote que no se apegaban a
las especificaciones de diseño, y resultaron los siguientes datos:

2 1 2 4 0 1 3 2 0 5 3 3 1 3 2 4 7 0 2 3
0 4 2 1 3 1 1 3 4 1 2 3 2 2 8 4 5 1 3 1
5 0 2 3 2 1 0 6 4 2 1 6 0 3 3 3 6 1 2 3

a) determine las frecuencias y frecuencias relativas para los valores observados de x = cantidad
de transductores defectuosos en un lote.
Para determinar las frecuencias absolutas utilizaremos la función Frecuencia que nos provee el Excel.
Para ello debemos determinar los posibles valores que puede tomar la variable
𝑋 = 𝑛𝑟𝑜. 𝑑𝑒 𝑡𝑟𝑎𝑛𝑠𝑑𝑢𝑐𝑡𝑜𝑟𝑒𝑠 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜𝑠. Utilizaremos las funciones MAX y MIN para determi-
narlos.

Entonces ahora determinamos que las clases que toma la variable X (notar que se trata de una variable
cuantitativa discreta) son los números del 0 al 8. Poniendo las clases en una columna, nos paramos en la
celda a la derecha de la primera clase, y buscamos la función Frecuencia.

-6-
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

Aceptamos y nos devuelve la frecuencia del 0. Ahora para completar la tabla debemos seguir los si-
guientes pasos:
Seleccionamos las celdas de la tabla en las que van las frecuencias. Apretamos F2, y luego en este or-
den las teclas “Control”; “Shift” y “Enter”. La tabla que completa.

Ahora sumamos las frecuencias absolutas para obtener N, para luego calcular las frecuencias relativas.
Observar que al elegir la celda en la que está N, ponemos los signos $ (Puede hacerse apretando F4 lue-
go de seleccionarla) para que al completar la fórmula en el resto de las celdas esa quede fija.

Lista la tabla de frecuencias relativas. Con el formato de celdas podemos elegir en formato que nos con-
venga, por ejemplo formato porcentaje o formato fracción

Calculamos la columna de las frecuencias relativas acumuladas para contestar las preguntas del inciso
b). Observar las fórmulas de las primera y segunda celdas.

-7-
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

Luego parados en la segunda celdas copiamos hacia abajo para obtener el resto de la tabla. También po-
demos elegir el formato de la celda, por ejemplo a porcentaje. Esto nos permitirá contestar más fácil-
mente las preguntas de los siguientes ítems.

b) ¿Qué proporción de lotes en la muestra tienen cuando más cinco transductores defectuosos?
91,67%
¿Qué proporción tienen menos de cinco? 86,67% ¿Qué proporción tienen cuando menos cinco
unidades defectuosas?100% − 86,67% = 13,33%

c) Trace un histograma de los datos con la frecuencia relativa en el eje vertical y comente sus
propiedades.
Para trazar el histograma, seleccionamos la columna con la frecuencia deseada (en este caso las relati-
vas), luego en la solapa insertar elegimos columna -columna en2D – columna agrupada-

-8-
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

Obtenemos el siguiente gráfico al que deberemos cambiarle las clases, pues por defecto el Excel numera
las clases.

Haciendo click con el botón derecho en cualquiera de las columnas, se abre la ventana en la que elegi-
mos modificar datos. Se abre:

Click sobre editar la etiqueta del eje horizontal, y luego seleccionar la columna de las clases.

Ya se aprecia en el gráfico que las clases tienen el nombre correcto. Aceptando luego se puede acomo-
dar el diagrama a gusto con la herramienta de gráficos, y comentar las propiedades.

-9-
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

Ejercicio 10

La concentración de sólidos suspendidos en el agua de río es una característica ambiental impor-


tante. Un artículo científico reportó sobre la concentración (partes por millón, o ppm) en varios
ríos diferentes. Supongamos que se obtuvieron las siguientes 50 observaciones para un rio en par-
ticular:
Construya un diagrama tallo y hoja. Ver ejercicio 1
¿Por qué una distribución de frecuencias no puede basarse en los intervalos de clase 0 – 10, 10 –
20, 20 – 30, 30 – 40,…, 90 – 100?
Porque no podemos realizar agrupaciones en intervalos donde el primer y último intervalo tengan frecuen-
cia 0.
Construya una distribución de frecuencias con intervalos de clase 20 - <30, 30 - <40,…, 90 -
<1000. ( La distribución resultante concuerda con la de uno de los ríos estudiado en el artículo
científico)
Para realizar esta tabla con la herramienta “Análisis de datos” los datos deben encontrarse en una fila o en
una columna. Además se le debe informar al software el límite superior de cada intervalo. En este caso y
como Excel toma intervalos de la forma (a:b] y nosotros queremos que los tome de la forma [a;b) lo “enga-
ñaremos” indicando como límite superior del intervalo:29,9; 39,9; 49,9; etc. Esto es posible porque todas
las observaciones tienen la precisión de un decimal. En otro caso habría que agregar más decimales a las
clases que le informaremos.
Escribimos las clases en una columna y en “Análisis de datos” elegimos Histograma.

La salida resultante ya queda lista para completar la tabla estadística, como hicimos en el ejercicio 4.
En las imágenes siguientes se muestra la tabla completa (La columna clase se corrigió colocando la marca
de clase) y las fórmulas utilizadas para completarla.

- 10 -
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

¿Qué proporción de las observaciones de concentración fue de menos de 50?, y ¿Por lo menos 60?
Dejamos al lector las respuestas a estas preguntas.

Ejercicio 18

Calcule e intérprete los valores de la media y la desviación estándar muestrales de las siguientes
determinaciones de la resistencia a la fractura (en MPa)

87 93 98 105 114
128 131 142 96 168
Las medidas solicitadas se pueden calcular con la herramienta “Análisis de datos”, (ver ejercicio 1)
o con las funciones que Excel también provee y que se muestran en la siguiente imagen:

- 11 -
Universidad Nacional del Noroeste de la Provincia de Buenos Aires
Probabilidades y Estadística Trabajo Practico 2 - Excel

La magnitud de 𝑠 = 25,75 comparada con 𝑥̅ = 116,2 indica que existe una cantidad importante
de varicación alrededor del centro.

Ejercicio 21

Con los datos del ejercicio anterior sobre las áreas de lámina esclerótica

2,75 2,62 2,74 3,85 2,34 2,74 3,93 4,21 3,88


4,33 3,46 4,52 2,43 3,65 2,78 3,56 3,01

a) determine los cuartiles inferior y superior.


Utilizaremos las funciones cuartil o cuartil.inc para calcularlos.

b) Calcule el valor de la cuarta dispersión fs (fs = Q3 – Q1)

c) Si los dos valores muestrales más grandes, 4,33 y 4,52 hubieran sido 5,33 y 5,52, ¿Cómo afec-
taría esto a fs? Explique.
d) ¿Cuánto se puede aumentarla observación 2,34 sin afectar fs? Explique.
e) Si la muestra se agrega una decimoctava observación, x18= 4,60 ¿Cuánto vale fs?
Dejamos al lector las respuestas a estas preguntas.

- 12 -

También podría gustarte