Está en la página 1de 5

Laboratorio de Estadística

María Camila Vásquez Parra, Santiago Alberto Ramírez, Daniel Leonardo Parada.
Universidad Tecnológica de Pereira
mariacamila.vasquez@utp.edu.co,santiago.ramirez@utp.edu.co,d.parada@utp.edu.co

Resumen- Se pretende realizar la descripción general de un 8. Basado en el resultado anterior aplique un filtro para
código hecho en Matlab donde se realizaran ecuaciones, cálculos eliminar los datos atípicos o espurios de la base de datos
y gráficos los cuales se analizaran y se responderán una serie de
preguntas.
9. Elabore un Histograma de frecuencia tanto para la base
Palabras Clave- código, desviación estándar, media, media de datos filtrada como para la original
armónica, media geométrica, media armónica.
10. Estime una distribución Gaussiana para cada uno de los
I. INTRODUCCIÓN histogramas elaborados

El presente trabajo de laboratorio se refiere al análisis de 11. Calcular la media geométrica, la mediana y la media
bases de datos, los cuales serán utilizadas para calcular la armónica para las bases de datos filtradas
media, media aritmética, media armónica, desviación
estándar, media geométrica, además gráficos 12. Calcular la media y la desviación estándar para las nuevas
correspondientes para determinar la diferencia entre cada uno bases de datos.
de estos y poder discutir los datos obtenidos.

A. Ecuaciones
II. PROCEDIMIENTO A continuación las Ecuaciones utilizadas para realizar el
Tendremos dos bases de DBase1 y DBase2, lecturas de la código
componente de ruido presente en una señal de voltaje y datos
de nivel dióxido de carbono medidos por una estación de -Media
calidad del aire respectivamente. -Variable en el código (media)

1. Calcular el valor promedio de los datos para cada una de la


base de datos.

2. Calcular la desviación estándar de los datos para cada una (Ec.1.)


de la base de datos.

3. Calcular la media geométrica, la mediana y la media -Varianza


armónica. -Variable en el código (varianza)

4. Graficar la dinámica de los datos, el valor promedio y la


respectiva desviación estándar en una misma representación.

5. Elabore un gráfico donde se enseñe la dispersión de los (Ec.2.)


datos con respecto a la media (varianza).

6. Aplique el normalizador a cada uno de los elementos que -Desviación Estándar


conforman la base de datos. -Variable en el código (des)

(Ec.3.)
7. Grafique los nuevos datos normalizados Z..
-Media Geométrica
-Variable en el código (G)
(Ec.4.)

-Media Armónica
-Variable en el código (medarmonica)

(Ec.5.)
Imagen 1. Grafico Datos-Valor promedio-Desviación
B. Resultados para DBase1- DBase2 Estándar DBase2.

1. Valor promedio DBase1: 0.7424 5. Graficas de dispersión de Datos respecto a la media:


Valor promedio DBase2: -34.2075

2. Desviación Estándar DBase1: 3.4070


Desviación Estándar DBase2: 77.6572

3. Media Geométrica DBase1: 0.6226


Media Geométrica DBase2: 1.0001
Mediana DBase1: 0.0690
Mediana DBase2: 1.5000
Media Armónica DBase1: 0.4931
Media Armónica DBase2: 1.5252

4. Grafica de los Datos-Valor promedio-Desviación Estándar:

Imagen 2. Grafico dispersión de datos respecto a la media


DBase1.

Imagen 1. Grafico Datos-Valor promedio-Desviación


Estándar DBase1.

Imagen 2. Grafico dispersión de datos respecto a la media


DBase2.
7. Gráficos Normalizados:

Imagen 4. Filtro de eliminación de datos atípicos DBase2.

Imagen 3. Grafico normalizado valores de z DBase1. 9. Gráficos de Histogramas de frecuencia bases Originales:

Imagen 3. Grafico normalizado valores de z DBase2. Imagen 5. Histograma de frecuencia base Original DBase1.

8. Filtros de Eliminación de datos atípicos:

Imagen 5. Histograma de frecuencia base Original DBase2.

Imagen 4. Filtro de eliminación de datos atípicos DBase1.


9. Gráficos de Histograma de frecuencia base de datos
filtrada:

Imagen 6. Estimación Gaussiana frecuencia base original


DBase2

Imagen 6. Histograma de frecuencia base filtrada DBase1. 11. Estimación de distribución Gaussiana para los gráficos de
Histograma de frecuencia base Filtrada:

Imagen 6. Histograma de frecuencia base filtrada DBase2.

Imagen 6. Estimación Gaussiana frecuencia base filtrada


10. Estimación de distribución Gaussiana para los gráficos de DBase1
Histograma de frecuencia base Original:

Imagen 6. Estimación Gaussiana frecuencia base filtrada


DBase2.
Imagen 6. Estimación Gaussiana frecuencia base original
DBase1
C, Resultados para DBase1- DBase2

11. Media geométrica base filtrada GN DBase1: 0.5226


Media geométrica base filtrada DBase2: 1.0002
Mediana base filtrada DBase1: 0.0069
Mediana base filtrada DBase2: 1.8000 Tabla 2. Comparación de muestras con la DBase2.
Media armónica base filtrada DBase1: 0.4692
Media armónica base filtrada DBase2: 1.2492
5. Discuta sobre el comportamiento de los datos (para estos
casos) una vez la información atípica es eliminada.
12. Media base filtrada DBase1:-0.0080
Media base filtrada DBase2: 2.1527 RTA/ Los datos que quedan están relativamente cerca a la
Desviación estándar base filtrada DBase1: 0.9780 media.
Desviación estándar base filtrada DBase2: 1.4532

6. Realice una comparación computacional (tiempo de


Preguntas computo) al calcular la desviación estándar utilizando los
siguientes modelos (anexe en el informe una tabla para
diferentes experimentos) discuta y concluya.
1. Qué se puede concluir acerca de la relación entre media
geométrica, aritmética y la armónica.

RTA/ Se concluye que la media aritmética es mayor a la (Ec.6)


media geométrica y a la media armónica, además la media
geométrica es mayor a la armónica.

2. Qué se puede decir del gráfico de dispersión normalizado (Ec.7)


obtenido a partir de la siguiente ecuación.

RTA/ Observamos en el grafico que hay menos cantidad de


datos por lo que se concluye que no hay redundancia en los Tabla 3. Tiempo de computo DBase1-DBase2
datos.
RTA/ Para ambas bases de datos se empleó la fórmula de la
3. Qué esperaría si la información atípica estuviera bastante varianza escrita de manera diferente para dichas formulas se
alejada o por el contrario cerca de la media aritmética de los calculó el tiempo de computo.
datos, concluya
De acuerdo a este tiempo se observa que con la formula de la
RTA/ Si la información atípica estuviera muy alejada la ecuación 6 se empleó menor tiempo para ambas bases
desviación estándar daría muy grande o por el contrario si
estuviera muy cercana la desviación estándar sería muy 7. Para cada una de las bases de datos calcule el coeficiente de
pequeña. sesgo y curtosis tanto para las bases de datos filtradas como
para las originales. Discuta acerca de los resultados numéricos
4. Con las mismas bases de datos realice un experimento Obtenido contra los gráficos obtenidos en el literal 9 del
extrayendo una muestra del total de datos y calcule la media y procedimiento de trabajo, concluya.
desviación estándar, repita para varias muestras, qué
comportamiento se observa.

Tabla 4. Coeficientes de curtosis y sesgo DBase1-DBase2.

Tabla 1. Comparación de muestras con la DBase1. RTA/El coeficiente de curtosis en la imagen 6 al tener en la
base de datos una gran cantidad de datos el ancho entre los
datos es menor, además se observa en la base de datos uno
(DBase1) que el coeficiente de sesgo es simétrico, mientras en
la base de datos 2 (DBase2) tiene asimetría a la derecha.

También podría gustarte