Está en la página 1de 14

Lección 1

Análisis exploratorio de datos


Ciencia que permite reducir un conjunto de datos,
transformándolos en valores de interés para analizar, concluir y
Estadística decidir”.
Da normas para recolectar, organizar, analizar e interpretar datos,
permitiendo la toma adecuada de decisiones.

Estadísticos Observaciones de datos que dan a conocer las características de


una población.

Población Conjunto de elementos con características comunes.

Parámetros Medidas resumen obtenidas de una población.

Estadísticos Medidas resumen obtenidas de una muestra.

Signo distintivo del elemento de la población; esta puede ser


Característica
cualitativa o cuantitativa.
Características

Atributo Característica cualitativa del elemento de la población, no permite


grados de comparación: sexo. Grupos=modalidades

Variable Característica cuantitativa del elemento de la población, permite


grados comparación: estatura, peso, etc. Grupos=clases

Variables
Discreta Variable que no permite división o fraccionamiento, se presenta
como número entero: Ej. Número hijos, número estudiantes.

Si permite división o fraccionamiento. Ej. Peso, estatura, valor


Continua
saldos de cuentas, se presenta como número real.
Recolección de datos

Ejemplo: Cantidad de electrodomésticos vendidos


semanalmente ( 100 semanas )

65 36 49 84 79 56 28 43 67 36
43 78 37 40 68 72 55 62 22 82
88 50 60 56 57 46 39 57 73 65
59 48 76 74 70 51 40 75 56 45
35 62 52 63 32 80 64 53 74 34
76 60 48 55 51 54 45 44 35 51
21 35 61 45 33 61 77 60 85 68
45 53 34 67 42 69 52 68 52 47
62 65 55 71 73 50 53 59 41 54
41 74 82 58 26 35 47 50 38 70
Ordenamiento de datos: Serie

21, 22, 26, 28, 32, 33, 34, 34, 35, 35, 35, 35, 36, 36, 37, 38, 39, 40, 40, 41, 41,
42, 43, 43, 44, 45, 45, 45, 45, 46, 47, 47, 48, 48, 49, 50, 50, 50, 51, 51, 51, 52,
52, 52, 53, 53, 53, 54, 54, 55, 55, 55, 56, 56, 56, 57, 57, 58, 59, 59, 60, 60, 60,
61, 61, 62, 62, 62, 63, 64, 65, 65, 65, 67, 67, 68, 68, 68, 69, 70, 70, 71, 72, 73,
73, 74, 74, 74, 75, 76, 76, 77, 78, 79, 80, 82, 82, 84, 85, 88
Distribución de frecuencias
8.7=
Calcular amplitud de clase 9
67
R
c c
68
 8.9  9
1 3.322 log n 1  3.322 log 100

Electrodomésticos
vendidos Semanas
21 29 4
30 38 12
39 47 16
48 56 23
57 65 18
66 74 15
75 83 9
84 92 3
Total 100
Medidas descriptivas
Medidas de tendencia central
Media

• Centro de todas las distancias. Medida equidistante de los


datos.

Mediana

• Centro de todos los datos.

Moda

• Dato que más se repite.


Medidas de posición
Dividen la distribución en grupos de igual tamaño.

Cuartiles

• Dividen la distribución en 4 partes.

Deciles

• Dividen la distribución en 10 partes.

Percentiles

• Dividen la distribución en 100 partes.


Medidas de dispersión

Rango
• Dato mayor – dato menor.

Desviación Media
• Promedio de las desviaciones absolutas de los datos.

Varianza
• Promedio de las desviaciones al cuadrado de los datos.

Desviación típica
• Desviación de los datos alrededor de la media en base a la
varianza.
Coeficiente de Variación
• Medida de dispersión relativa.
Medidas de forma

Coeficiente de Mide el sesgo de los datos en relación a la


asimetría media (sobre el eje x).

Curtosis Mide el grado de apuntamiento de la


distribución. (sobre el eje “y”).
Resultados de Excel Electrodomésticos Vendidos

Media 55.34
Error típico 1.54097044
Mediana 55
Moda 35
Desviación estándar 15.4097044
Varianza de la
muestra 237.45899
Curtosis -0.6665252
Coeficiente de
asimetría 0.00218995
Rango 67
Mínimo 21
Máximo 88
Suma 5534
Cuenta 100

También podría gustarte