Está en la página 1de 20

Universidad Distrital Francisco José De Caldas Laboratorio N°1 Minería de datos

Informe de laboratorio Nº 1 
Análisis de BD Flor
MINERÍA DE DATOS
Angela Lizeth Luque 20191373003
alluquet@correo.udistrital.edu.co
 B rigette Paola Torres Bello 20191373027
      bptorresb@correo.udistrital.edu.co
Daniel Felipe Orjuela Florez 20191373031
   dforjuelaf@correo.udistrital.edu.co

RESUMEN: En el presente informe se


toma como base una base de datos
con tres flores, de las cuales se
analizarán los datos del largo y ancho
del pétalo como del ancho y largo del
sépalo, las tres flores son la setosa,
versicolor y virginica, estas tres flores
son muy similares físicamente, se
hace un análisis de estadística
descriptiva con el fin de compararlas y
encontrar sus diferencias.
A continuación se visualiza el largo de
PALABRAS CLAVE: estadística sépalo para la I. Versicolor.
descriptiva, varianza, desviación
estándar, media, mediana, moda.

 MARCO TEÓRICO

1. RESULTADOS
Para realizar un análisis efectivo se
visualizará en un histograma el
A continuación se visualiza el largo de
comportamiento del largo de sépalo
sépalo para la I. Virginica.
para cada una de las especies de
planta.

A continuación se visualiza el largo de


sépalo para la I. Setosa.

Para realizar un análisis efectivo se


visualizará en un histograma el
comportamiento del Ancho de sépalo
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

para cada una de las especies de


planta. A continuación se visualiza el largo de
pétalo para la I. Setosa.
A continuación se visualiza el ancho
de sépalo para la I. Setosa.

A continuación se visualiza el largo de


pétalo para la I. Versicolor.
A continuación se visualiza el ancho
de sépalo para la I. Versicolor.

A continuación se visualiza el largo de


pétalo para la I.Virginica .
A continuación se visualiza el ancho
de sépalo para la I. Virginica.

Para realizar un análisis efectivo se


visualizará en un histograma el
Para realizar un análisis efectivo se comportamiento del Ancho de pétalo
visualizará en un histograma el para cada una de las especies de
comportamiento del Largo de pétalo planta.
para cada una de las especies de
planta.

2
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

A continuación se visualiza el ancho


de pétalo para la I.Setosa.

A continuación se visualiza el ancho


de pétalo para la I.Versicolor .

Para realizar un análisis efectivo se


visualizará en sus respectivas gráficas
de caja el comportamiento del Ancho
de sépalo para cada una de las
especies de planta.

A continuación se visualiza el ancho


de pétalo para la I.Virginica .

Para realizar un análisis efectivo se


visualizará en sus respectivas gráficas Para realizar un análisis efectivo se
de caja el comportamiento del Largo visualizará en sus respectivas gráficas
de sépalo para cada una de las de caja el comportamiento del Largo
especies de planta. de pétalo para cada una de las
especies de planta.

3
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

Largo de sépalo para cada una de las


especies de planta.

Para realizar un análisis efectivo se


visualizará en sus respectivas gráficas
de dispersión el comportamiento del
Para realizar un análisis efectivo se Ancho de sépalo para cada una de las
visualizará en sus respectivas gráficas especies de planta.
de caja el comportamiento del Ancho
de pétalo para cada una de las
especies de planta.

Para realizar un análisis efectivo se


visualizará en sus respectivas gráficas
de dispersión el comportamiento del
Largo de pétalo para cada una de las
especies de planta.

Para realizar un análisis efectivo se


visualizará en sus respectivas gráficas
de dispersión el comportamiento del

4
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

Para realizar un análisis efectivo se


visualizará en sus respectivas gráficas
de dispersión el comportamiento del
Ancho de sépalo para cada una de las
especies de planta.

A continuación se visualiza Largo y


Ancho de sépalo para la I. Virginica.

Para realizar un análisis efectivo se


visualizará en el histograma 2D el
comportamiento del Largo y Ancho de
sépalo para cada una de las especies
Para realizar un análisis efectivo se
de planta.
visualizará en el histograma 2D el
comportamiento del Largo y Ancho de
A continuación se visualiza Largo y
sépalo para cada una de las especies
Ancho de sépalo para la I. Setosa.
de planta.

A continuación se visualiza Largo y


Ancho de pétalo para la I. Setosa.

A continuación se visualiza Largo y


Ancho de sépalo para la I. Versicolor.

A continuación se visualiza Largo y


Ancho de pétalo para la I. Versicolor.

5
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

encuentra entre 3.38 y 3.74, para la I.


Versicolor entre 2.6 y 2.6 y para la I.
virginica entre 2.89 y 3.13.

La longitud del largo del pétalo más


común para la I.Setosa se encuentra
en el rango 1.48 y 1.64, para la
I.Versicolor entre 4.35 y 4.8 y para la I.
Virginica entre 5.02 y 6.06.

La longitud del ancho del pétalo más


A continuación se visualiza Largo y común para la I.Setosa se encuentra
Ancho de pétalo para la I.Virginica. en el rango 0.1 y 0.2, para la
I.Versicolor entre 1.19 y 13.8 aunque
podría llegar a ser hasta 1.57 y para la
I. Virginica entre 1.66 y 1.92.

La gráfica de cajas permite visualizar


que los datos de largo de sépalo no se
organizan correctamente por encima y
por debajo de la media, lo que nos
puede indicar que los datos no están
distribuidos normalmente.

Según los datos en la gráfica de cajas


del ancho del sépalo se visualiza que
4. ANÁLISIS DE RESULTADOS
estos datos se encuentran mejor
distribuidos alrededor de la media, es
Por el histograma de una dimensión se
decir presentan una mejor distribución.
puede observar que la mayor cantidad
de plantas para la especie I. Setosa
Para el largo del pétalo la I.Setosa
tiene un largo de sépalo entre 4.96 y
presenta mayor cantidad de datos
5.29. Para la I.Versicolor la mayor
distribuidos anormalmente.
cantidad de plantas tienen un largo de
sépalo entre 5.39 y 5.88 y finalmente
Para el ancho del pétalo la I. Setosa
para la I. Virginica el largo de sépalo
presenta un mayor rango frente a las
de la mayor cantidad de plantas se
otras dos especies, pero sus datos se
encuentra entre 6.1 y 6.7. Este
encuentran dispersos correctamente
histograma también nos muestra que
por encima y por debajo de la media.
la menor cantidad de plantas para la
Es decir presenta un comportamiento
especie I. Setosa tiene un largo de
normal.
sépalo entre 5.62 y 5.95, para la
I.Versicolor es 6.86 a 7.35 y la
El gráfico de dispersión nos permite
I.Virginica está entre 7.3 a 7.9.
concluir que para el largo del sépalo
los datos más dispersos son los de la
El histograma del ancho del sépalo de
I. Virginica. Para el ancho del sépalo
las tres plantas nos indican que para la
los datos más dispersos son de la I.
I.Setosa la longitud más común se
Setosa pero las tres plantas manejan

6
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

valores muy semejantes. Para el largo


y el ancho del pétalo la menor
dispersión de datos la obtuvo la I.
Setosa como se pudo observar
también en el gráfico de cajas.

Observando los histogramas en 2D se


puede concluir que la I.Setosa puede
tener un largo de sépalo de 4.7 y
ancho de 3 y 3.5. La I. Versicolor tiene
un largo de sépalo de 5.5 y ancho de
3. La I.Setosa tiene un largo de pétalo
de 1.5 y ancho de 0.3. Los datos se
encuentran tan dispersos que es difícil
definir cuánto podría ser el largo del
pétalo de la I.Versicolor pero el ancho
está en 1.5. La mayor cantidad de
datos se encuentran muy dispersos
para la I. Virginica por tal razón no es
posible estimar los valores para el
ancho y largo del pétalo. Luego se obtienen los valores para el
largo del pétalo de la versicolor.
Utilizando el programa Microsoft Excel
y la opción de estadística descriptiva
en “Análisis de datos” se obtienen las
siguientes tablas para cada una de las
flores:

Primero se hará el análisis de los


valores del largo del pétalo para las
tres flores, la setosa, la versicolor y la
virginica las cuales son tres flores muy
similares físicamente.

Inicialmente se obtiene la estadística


para el largo del pétalo de la setosa.

De igual forma se obtienen los valores


para el largo del pétalo de la virginica.

7
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

Se tienen los siguientes valores de


error típico para el error típico en cada
flor:

● Setosa: 0,0245598
● Versicolor: 0,0664554
● Virginica: 0,0780496

Lo cual nos indica que los datos que


más se encuentran desviados de la
media son los de la virginica y los que
menos se encuentran desviados son
los de la flor versicolor.

Mediana: El valor de la mediana indica


el valor que separan la mitad superior
del conjunto de datos con la mitad
inferior, cuando el total de datos es par
como en este caso para las tres flores
Media: La media representa el es 50 la mediana se calcula ordenando
promedio de datos que se tienen del los datos de menor a mayor, se toman
largo del pétalo, la media se calcula los dos datos que se encuentran en la
sumando todos los valores del mitad y se saca el promedio entre
conjunto de datos y dividiendo entre el estos dos datos.
total de ellos, que para los tres tipos de
flor es 50. Se obtienen los siguientes valores de
mediana:
Para el largo del pétalo obtenemos los ● Setosa: 1,5
siguientes valores de promedio: ● Versicolor: 4,35
● Virginica: 5,55
● Setosa:1,462
● Versicolor: 4,26 Así como se observó con la media, la
● Virginica: 5,552 flor virginica es la que tiene los pétalos
más largos, asimismo su mediana es
De este dato podemos decir que la flor mayor que la de las otras flores.
con mayor largo de pétalos es la
virginica, sigue la versicolor y Moda: La moda es el valor que más se
finalmente la setosa es la que tiene un repite en comparación con los otros
largo menor a comparación de las datos, este valor es la moda porque es
otras dos. el que más frecuencia de ocurrencia
tiene entre los datos.
Error típico: Este dato representa
cuánto pueden desviarse los valores Se obtienen los siguientes valores de
que se tienen para el largo del pétalo moda:
con respecto a la media o promedio de
los datos. ● Setosa: 1,4
● Versicolor: 4,5
● Virginica: 5,1

8
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

que el tipo de curtosis es platicurtica y


Desviación estándar: Este valor la distribución normal de los datos es
define la dispersión en un conjunto de muy bajo, también representa una
datos. gran cantidad de valores en la región
central de distribución.
Se obtienen los siguientes valores de
desviación estándar para las tres Se obtienen los siguientes valores
flores: para las flores:

● Setosa: 0,173664 ● Setosa: 1,02157611


● Versicolor: 0,46991 ● Versicolor: 0,0479033
● Virginica: 0,551894 ● Virginica: -0,15377

Se logra observar que los datos de la En este caso podemos observar que la
virginica son los más dispersos porque setosa y la versicolor tienen una
la desviación es mayor, los datos de la curtosis mayor a cero, es decir que la
flor setosa son los menos dispersos distribución de datos es de tipo
porque su desviación estándar es leptocúrtica y la virginica tiene una
menor. curtosis platicúrtica, es decir que la
distribución de datos es más achatado.
Varianza de la muestra: Este dato
representa la variabilidad de un Coeficiente de asimetría: Esta
conjunto de datos respecto a su media medida representa si los datos se
aritmética y se calcula con la distribuyen de forma uniforme
desviación estándar. alrededor del punto central, la curva
asimétrica puede ser negativa,
Se obtienen los siguientes valores: simétrica o positiva.

● Setosa: 0,030159 Se obtienen los siguientes valores:


● Versicolor:0,220816
● Virginica: 0,3045877 ● Setosa: 0,1063939
● Versicolor: -0,60650769
La varianza es un valor directamente ● Virginica: 0,54944
proporcional a la desviación estándar,
por lo tanto el pétalo con mayor En este caso el coeficiente de la
varianza es el de la flor virginica esto setosa y la versicolor es positiva esto
se debe a que los valores en general quiere decir que los valores tienden a
son más variables con respecto a la aglomerarse hacia la izquierda de la
media. media y la curva es asimétricamente
positiva, el coeficiente de la versicolor
Curtosis: Esta medida representa el es negativo, esto indica que la curva
grado de apuntamiento o achatamiento es asimétricamente negativa y los
de la distribución normal de los datos, valores tienden a aglomerarse o
cuando es >0 significa que el tipo de reunirse hacia al lado derecho de la
curtosis es leptocúrtica, es decir, que media.
el grado de apuntamiento es alto y la
forma de la gráfica es más apuntada Rango: El rango determina el valor
que la normal, cuando es <0 significa correspondiente a la diferencia entre el

9
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

valor máximo y mínimo de un conjunto ● Versicolor: 5,1


de datos, este valor permite saber ● Virginica: 6,9
cuánto pueden variar o cambiar los
datos, cabe anotar que el rango puede La virginica es la flor que presenta un
variar en función del tiempo valor máximo mayor por lo tanto es la
dependiendo qué tipo de datos se flor con el pétalo más largo, sigue la
están analizando. versicolor y finalmente la setosa.

Los datos obtenidos son: Suma: La suma es una operación


aritmética que consiste en reunir
● Setosa: 0,9 varias cantidades en una sola y
● Versicolor: 2,1 adicionarse, este valor puede ser
● Virginica: 2,4 utilizado para calcular más fácilmente
otras medidas de estadística
En este caso se podría concluir que descriptiva.
basándonos en los datos ya
existentes, los datos futuros pueden Se obtienen los siguientes valores de
variar en un rango de 0,9 para la suma:
setosa, de 2,1 para la versicolor y de
2,4 para la virginica, también ese es el Setosa: 73,1
valor máximo de variación que han Versicolor: 213
tenido los datos, es decir que la Virginica: 277,6
virginica es la que ha presentado una
variación mayor en sus datos. Cuenta: Este valor determina la
cantidad total de datos, en este caso
Valor mínimo: El valor mínimo es el es 50 para todas las flores.
más pequeño o menor que se
encuentra en un conjunto de datos, Nivel de confianza (95%): Este dato
con este valor se puede determinar el nos permite saber que si extraemos un
rango, también se puede saber cuando número determinado de muestras del
se reciben datos atípicos o detectar un mismo tamaño de una población, el
posible error en la entrada de datos. 95% de los intervalos de confianza
construidos a partir de esas muestras
● Setosa: 1 contendrán el valor del parámetro que
● Versicolor: 3 buscamos y el 5% restante no lo
● Virginica: 4,5 tendrán.

Valor máximo: El valor máximo es el Se obtienen los siguientes valores de


más grande o mayor que se encuentra nivel de confianza:
en un conjunto de datos, con este
valor se puede determinar el rango, ● Setosa: 0,049354
también se puede saber cuando se ● Versicolor: 0,133547
reciben datos atípicos o detectar un ● Virginica: 0,1568467
posible error en la entrada de datos.
Se hace el mismo procedimiento para
Se obtienen los siguientes valores: el ancho del pétalo de las flores:

● Setosa: 1,9

10
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

Se obtienen los valores para el ancho


del pétalo de la flor setosa.

Media: La media representa el


promedio de datos que se tienen del
ancho del pétalo, la media se calcula
Luego se obtienen los valores para el sumando todos los valores del
largo del pétalo de la versicolor. conjunto de datos y dividiendo entre el
total de ellos, que para los tres tipos de
flor es 50.

Para el ancho del pétalo obtenemos


los siguientes valores de promedio:

● Setosa: 0,246
● Versicolor: 1,326
● Virginica: 2,026

De este dato podemos decir que la flor


con mayor ancho en sus pétalos es la
virginica, sigue la versicolor y
finalmente la setosa es la que tiene un
ancho menor a comparación de las
otras dos.

Error típico: Este dato representa


cuánto pueden desviarse los valores
que se tienen para el ancho del pétalo
Luego se obtienen los valores para el con respecto a la media o promedio de
largo del pétalo de la flor virginica. los datos.

11
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

Se tienen los siguientes valores de


error típico para el error típico en cada Desviación estándar: Este valor
flor: define la dispersión en un conjunto de
datos.
● Setosa: 0,0149037
● Versicolor:0,0279664 Se obtienen los siguientes valores de
● Virginica: 0,03884138 desviación estándar para las tres
flores:
Lo cual nos indica que los datos que
más se encuentran desviados de la ● Setosa: 0,1053855
media son los de la virginica y los que ● Versicolor: 0,1977526
menos se encuentran desviados son ● Virginica:0,2746500
los de la flor setosa.
Se logra observar que los datos de la
Mediana: El valor de la mediana indica virginica son los más dispersos porque
el valor que separan la mitad superior la desviación es mayor, los datos de la
del conjunto de datos con la mitad flor setosa son los menos dispersos
inferior, cuando el total de datos es par porque su desviación estándar es
como en este caso para las tres flores menor.
es 50 la mediana se calcula ordenando
los datos de menor a mayor, se toman Varianza de la muestra: Este dato
los dos datos que se encuentran en la representa la variabilidad de un
mitad y se saca el promedio entre conjunto de datos respecto a su media
estos dos datos. aritmética y se calcula con la
desviación estándar.
Se obtienen los siguientes valores de
mediana: Se obtienen los siguientes valores:
● Setosa: 0,2
● Versicolor: 1,3 ● Setosa: 0,0111061
● Virginica: 2 ● Versicolor: 0,0391061
● Virginica: 0,075432653
Así como se observó con la media, la
flor virginica es la que tiene los pétalos La varianza es un valor directamente
más anchos, asimismo su mediana es proporcional a la desviación estándar,
mayor que la de las otras flores. por lo tanto el pétalo con mayor
varianza es el de la flor virginica esto
Moda: La moda es el valor que más se se debe a que los valores en general
repite en comparación con los otros son más variables con respecto a la
datos, este valor es la moda porque es media.
el que más frecuencia de ocurrencia
tiene entre los datos. Curtosis: Esta medida representa el
grado de apuntamiento o achatamiento
Se obtienen los siguientes valores de de la distribución normal de los datos,
moda: cuando es >0 significa que el tipo de
curtosis es leptocúrtica, es decir, que
● Setosa: 0,2 el grado de apuntamiento es alto y la
● Versicolor: 1,3 forma de la gráfica es más apuntada
● Virginica: 1,8 que la normal, cuando es <0 significa

12
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

que el tipo de curtosis es platicurtica y valor máximo y mínimo de un conjunto


la distribución normal de los datos es de datos, este valor permite saber
muy bajo, también representa una cuánto pueden variar o cambiar los
gran cantidad de valores en la región datos, cabe anotar que el rango puede
central de distribución. variar en función del tiempo
dependiendo qué tipo de datos se
Se obtienen los siguientes valores están analizando.
para las flores:
Los datos obtenidos son:
● Setosa: 1,7191302
● Versicolor: -0,4100592 ● Setosa: 0,5
● Virginica: -0,602264 ● Versicolor: 0,8
● Virginica: 1,1
En este caso podemos observar que la
virginica y la versicolor tienen una En este caso se podría concluir que
curtosis menor a cero, es decir que la basándonos en los datos ya
distribución de datos es de tipo existentes, los datos futuros pueden
platicúrtica y la setosa tiene una variar en un rango de 0,5 para la
curtosis leptocúrtica, es decir que la setosa, de 0,8 para la versicolor y de
distribución de datos es menos 1,1 para la virginica, también ese es el
achatado que las otras dos flores. valor máximo de variación que han
tenido los datos, es decir que la
Coeficiente de asimetría: Esta virginica es la que ha presentado una
medida representa si los datos se variación mayor en sus datos.
distribuyen de forma uniforme
alrededor del punto central, la curva Valor mínimo: El valor mínimo es el
asimétrica puede ser negativa, más pequeño o menor que se
simétrica o positiva. encuentra en un conjunto de datos,
con este valor se puede determinar el
Se obtienen los siguientes valores: rango, también se puede saber cuando
se reciben datos atípicos o detectar un
● Setosa: 1,2538613 posible error en la entrada de datos.
● Versicolor: -0,0311795
● Virginica: -0,1294769 ● Setosa: 0,1
● Versicolor: 1
En este caso el coeficiente de la ● Virginica: 1,4
setosa es positiva esto quiere decir
que los valores tienden a aglomerarse Valor máximo: El valor máximo es el
hacia la izquierda de la media más grande o mayor que se encuentra
positiva, el coeficiente de la versicolor en un conjunto de datos, con este
y virginica es negativo, esto indica valor se puede determinar el rango,
que la curva es asimétricamente también se puede saber cuando se
negativa y los valores tienden a reciben datos atípicos o detectar un
aglomerarse o reunirse hacia al lado posible error en la entrada de datos.
derecho de la media.
Se obtienen los siguientes valores:
Rango: El rango determina el valor
correspondiente a la diferencia entre el ● Setosa: 0,6

13
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

● Versicolor: 1,8
● Virginica: 2,5

La virginica es la flor que presenta un


valor máximo mayor por lo tanto es la
flor con el pétalo más ancho, sigue la
versicolor y finalmente la setosa.

Suma: La suma es una operación


aritmética que consiste en reunir
varias cantidades en una sola y
adicionarse, este valor puede ser
utilizado para calcular más fácilmente
otras medidas de estadística
descriptiva.

Se obtienen los siguientes valores de


suma:

Setosa: 12,3
Versicolor: 66,3
Virginica: 101,3

Cuenta: Este valor determina la


cantidad total de datos, en este caso
es 50 para todas las flores.

Nivel de confianza (95%): Este dato


nos permite saber que si extraemos un
número determinado de muestras del
mismo tamaño de una población, el
95% de los intervalos de confianza
construidos a partir de esas muestras
contendrán el valor del parámetro que
buscamos y el 5% restante no lo
tendrán.

Se obtienen los siguientes valores de


nivel de confianza:

● Setosa: 0,02995
● Versicolor: 0,0562006
● Virginica: 0,0780546

Análisis de los valores de los largos


de los sépalos de las 3 flores

14
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

Media del alto de los sépalos. Según la moda del alto de las 3 flores
podemos decir que el valor que más
● Flor Setosa: 5.006 se repite es el 5 y la flor versículo y
● Flor Versicolo: 5.471 virginica también que el alto de la flor
● Flor Virginica: 5.843 Setosa es el mayor de las 3.

Análisis Media del alto. Desviación estándar del alto de los


sépalos.
Según los datos de la media de las 3
flores podemos decir que en promedio ● Flor Setosa: 0.3524
la flor Virginica tiene un alto mayor y ● Flor Versicolo: 0.6416
que la flor Setosa tiene un alto menor. ● Flor Virginica: 0.8280

Error típico del alto de los sépalos. Análisis desviación estándar de


alto.
● Flor Setosa: 0.04984
● Flor Versicolo: 0.06416 Según los valores de la desviación
● Flor Virginica: 0.06761 estándar de las 3 flores Indica que el
alto de la flor virginica tiene una mayor
Análisis error típico de alto. desviación que las demás flores y que
la flor Setosa tiene la menor
Según los valores del error típico del desviación estándar de las 3 flores.
alto de los sépalos de las 3 flores
podemos decir que la flor Virginica Varianza de la muestra del alto de
tiene el error típico más alto y que la los sépalos.
flor setosa tiene el error típico más
pequeño. ● Flor Setosa: 0.1242
● Flor Versicolo: 0.4117
Mediana del alto de los sépalos. ● Flor Virginica: 0.6856
● Flor Setosa: 5
● Flor Versicolo: 5.4
● Flor Virginica: 5.8 Análisis varianza de la muestra
estándar de alto.
Análisis Mediana de alto.
Según los valores de la varianza del
Según los datos de las medianas de alto de las 3 flores podemos decir que
las 3 flores podemos decir que la flor los datos de la flor virginica son más
Virginica tiene un alto mayor y que la dispersos que las demás flores y que
flor Setosa tiene el alto menor. los valores de la flor Setosa son los
menos dispersos.
Moda del alto de los sépalos.
Curtosis del alto de los sépalos.
● Flor Setosa: 5.1
● Flor Versicolo: 5 ● Flor Setosa: -0.2526
● Flor Virginica: 5 ● Flor Versicolo: -0.5314
● Flor Virginica: -0.5520
Análisis moda de alto.
Análisis curtosis de alto.

15
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

Según la curtosis tomada de los Análisis valor mínimo del alto.


valores de las 3 flores podemos decir
que la flor Setosa tiene un rango Según los valores mínimos de las 3
mayor entre los datos y que la flor flores podemos decir que los altos de
virginica tiene el rango más corto de las 3 flores en su valor mínimo desde
las 3 flores. el mismo.

Coeficiente de asimetría del alto de Valor máximo del alto de los


los sépalos. sépalos.

● Flor Setosa: 0.1200 ● Flor Setosa: 5.8


● Flor Versicolo: 0.4153 ● Flor Versicolo: 7
● Flor Virginica: 0.3149 ● Flor Virginica: 7.9

Análisis coeficiente de asimetría de Análisis valor máximo del alto.


alto.
Según los valores máximos de las 3
Según los valores el coeficiente de flores podemos decir que el alto de la
asimetría del alto de las 3 flores flor virginica es el mayor de todos y el
podemos decir que la flor Versicolo valor máximo de la flor cetosa es el
tiene el grado de asimetría mayor en menor.
sus datos y que la flor Setosa tiene el
menor grado de asimetría en el valor Valor suma del alto de los sépalos.
de sus datos.
● Flor Setosa: 250.3
Rango alto de los sépalos. ● Flor Versicolo: 547.1
● Flor Virginica: 876.5
● Flor Setosa: 1.5
● Flor Versicolo: 2.7 Análisis valor suma del alto.
● Flor Virginica: 3.6
Según la suma De los valores de los
altos de las 3 flores podemos decir qué
la flor virginica tiene mayor cantidad de
Análisis rango del alto. datos y que la flor Setosa tiene la
menor cantidad de datos.
Según el rango de las 3 flores
podemos decir que la flor virginica Valor cuenta del alto de los sépalos.
tiene un rango de valores más amplio
que el de las otras dos y que la flor ● Flor Setosa: 50
Setosa tiene el valor del rango más ● Flor Versicolo: 100
bajo de todas las flores. ● Flor Virginica: 150

Valor mínimo del alto de los Análisis valor cuenta del alto.
sépalos.
Según la cuenta de todos los datos
● Flor Setosa: 4.3 podemos concluir que la flor virginica
● Flor Versicolo: 4.3 tenía 150 datos siendo así la flor que
● Flor Virginica: 4.3 tenía más datos y que la flor setos a la
flor que menos datos tenía.

16
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

Análisis de los valores de los


anchos de los sépalos de las 3
flores

Media del ancho de los sépalos.

● Flor Setosa: 3.428


● Flor Versicolo: 3.099
● Flor Virginica: 3.057

Análisis Media del ancho.

Según los datos de la media de las 3


flores podemos decir que en promedio
la flor Setosa tiene un ancho mayor y
que la flor virginica tiene un ancho
menor.

Error típico del ancho de los


sépalos.

● Flor Setosa: 0.0536


● Flor Versicolo: 0.0478
● Flor Virginica: 0.0355

Análisis error típico de ancho.

Según los valores del error típico del


ancho de los sépalos de las 3 flores
podemos decir que la flor Setosa tiene
el error típico más alto y que la flor
virginica tiene el error típico más
pequeño.

Mediana del ancho de los sépalos.

● Flor Setosa: 3.4


● Flor Versicolo: 3.05

17
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

● Flor Virginica: 3 Según los valores de la varianza del


ancho de las 3 flores podemos decir
Análisis Mediana de ancho. que los datos de la flor versículo son
más dispersos que las demás flores y
Según los datos de las medianas de que los valores de la flor Setosa son
las 3 flores podemos decir que la flor los menos dispersos.
Setosa tiene un ancho mayor y que la
flor Virginica tiene un ancho menor. Curtosis del ancho de los sépalos.

Moda del ancho de los sépalos. ● Flor Setosa: 0.9547


● Flor Versicolo: 0.10
● Flor Setosa: 3.4 ● Flor Virginica: 0.22
● Flor Versicolo: 3
● Flor Virginica: 3 Análisis curtosis de ancho.

Análisis moda de ancho. Según la curtosis tomada de los


valores de las 3 flores podemos decir
Según la moda del ancho de las 3 que la flor Setosa tiene un rango
flores podemos decir que la flor Setosa mayor entre los datos y que la flor
tiene un valor más grande y que la flor versículo tiene el rango más corto de
versículo y virginica tiene un valor de las 3 flores.
moda igual.
Coeficiente de asimetría del ancho
Desviación estándar del ancho de de los sépalos.
los sépalos.
● Flor Setosa: 0.0411
● Flor Setosa: 0.3790 ● Flor Versicolo: 0.1658
● Flor Versicolo: 0.4787 ● Flor Virginica: 0.3189
● Flor Virginica: 0.4358
Análisis coeficiente de asimetría de
Análisis desviación estándar de ancho.
ancho.
Según los valores el coeficiente de
Según los valores de la desviación asimetría del ancho de las 3 flores
estándar de las 3 flores Indica que el podemos decir que la flor virginica
ancho de la flor versículo tiene una tiene el grado de asimetría mayor en
mayor desviación que las demás flores sus datos qué está haciendo y que la
y que la flor Setosa tiene la menor flor Setosa tiene el menor grado de
desviación estándar de las 3 flores. asimetría en el valor de sus datos.
Varianza de la muestra del ancho de Rango del ancho de los sépalos.
los sépalos.
● Flor Setosa: 2.1
● Flor Setosa: 0.1436 ● Flor Versicolo: 2.4
● Flor Versicolo: 0.2291 ● Flor Virginica: 2.4
● Flor Virginica: 0.1899
Análisis rango del ancho.
Análisis varianza de la muestra
estándar de ancho.

18
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

Según los valores del rango del ancho podemos decir que la flor virginica
de las 3 flores podemos decir que el tenía una mayor cantidad de datos y
rango de la flor Versículo y Virginica que la flor Setosa tenía una menor
son iguales y son los mayores y que el cantidad de datos.
rango de la flor Setosa es el menor.

Valor mínimo del ancho de los


sépalos. Valor cuenta del ancho de los
sépalos.
● Flor Setosa: 2.3
● Flor Versicolo: 2 ● Flor Setosa: 50
● Flor Virginica: 2 ● Flor Versicolo: 100
● Flor Virginica: 150
Análisis valor mínimo del ancho.
Análisis valor cuenta del ancho.
Según los valores mínimos de las 3
flores podemos decir que el valor Según la cuenta de todos los datos
mínimo de la flor versículo y virginica podemos concluir que la flor virginica
es el mismo y que por lo tanto son los tenía 150 datos siendo así la flor que
anchos más pequeños de las tres tenía más datos y que la flor setos a la
flores y que la flor Setosa tiene un flor que menos datos tenía.
ancho mínimo mayor que el de las
otras dos flores.
CONCLUSIONES
Valor máximo del ancho de los
sépalos. ● Los histogramas permiten
visualizar los datos de un BD en
● Flor Setosa: 4.4 intervalos de frecuencia y así se
● Flor Versicolo: 4.4 puede tener una breve idea de
● Flor Virginica: 4.4 cómo se encuentran distribuidos
los datos y en qué intervalo se
Análisis valor máximo del ancho. encuentra la mayor cantidad de
estos.
Según los valores máximos de los ● Los valores atípicos son aquellos
anchos de las 3 flores podemos decir valores que están muy alejados
que las 3 flores tienen un valor máximo de otros valores, estos pueden
igual para el ancho de sus pétalos. afectar fuertemente los
resultados. Frecuentemente,
Valor suma del ancho de los estos datos se pueden identificar
sépalos. más fácilmente en una gráfica de
caja.
● Flor Setosa: 171.4 ● Cuando se tienen datos atípicos
● Flor Versicolo: 309.9 es necesario corregir cualquier
● Flor Virginica: 458.6 error de entrada de datos o de
medición. Para ello se considera
Análisis valor suma del ancho. eliminar los valores de datos que
estén asociados con eventos
Según la suma de los valores del anormales y únicos.
ancho de los sépalos de las 3 flores

19
Universidad Distrital Francisco José De Caldas Laboratorio N°2 Minería de datos

● Teniendo en cuenta los valores https://www.rfmentor.com/node/60


obtenidos del largo y ancho de
los pétalos de las tres flores, así
como también teniendo en
cuenta las variables de
estadística descriptiva se puede
determinar que la flor con
pétalos más largos y anchos es
la virginica, sigue el versicolor y
finalmente la setosa.
● Debido a que la desviación
estándar del ancho y largo de la
virginica es mayor en los dos
casos con respecto a los
pétalos de las otras dos flores
se concluye que la dispersión
de datos es mayor en la
virginica que en las otras dos
flores.

BIBLIOGRAFÍA
[1] Tomado de
Serway, Raymond A.; Jewett, John W.
(2004). Physics for Scientists and
Engineers (en inglés) (6ª edición).
Brooks/Cole. ISBN 0-534-40842-7.

[2] Tomado de
Darrin Walraven, Understanding SWR
by Example, November 2006 QST ©
ARRL

[3] Tomado de
https://www.telecomfalcon.com/userfile
s/file/DX-CN-200-400-600_es.pdf

[4] Tomado de
http://www.radiomanual.info/schemi/YA
ESU_HF/FT-840_user.pdf

[5] Tomado de

20

También podría gustarte