Está en la página 1de 11

Análisis Descriptivo

Encabezado

Datos del proyecto


RUBEN JACKSON FERNANDEZ PARADA
RESUMEN

El análisis descriptivo es una etapa preliminar del tratamiento de datos que consiste en sintetizar
los datos históricos para obtener información útil o incluso prepararlos para un análisis posterior.
Este análisis se utiliza para buscar y resumir datos históricos con el fin de identificar patrones o
significados.
El análisis descriptivo consiste en tratar de describir o resumir los datos. Aunque no hace
predicciones sobre el futuro, puede ser muy valioso en los entornos empresariales. Esto se debe
principalmente a que el análisis tipo descriptivo facilita el consumo de datos, lo que puede facilitar
la actuación de los analistas.
Otro beneficio del análisis descriptivo es que puede ayudar a filtrar los datos menos significativos.
Esto se debe a que las técnicas estadísticas utilizadas en este tipo de análisis suelen centrarse en
las pautas de los datos, y no en los valores atípicos.

¿Cómo hacer un análisis descriptivo?


Como muchos tipos de análisis de datos, el descriptivo puede ser bastante abierto. En otras
palabras, depende de ti lo que quieras buscar en tu análisis. Dicho esto, el proceso de análisis suele
consistir en:

1. Recopilar datos: El primer paso en cualquier tipo de análisis de datos es recoger los datos.
Esto puede hacerse de varias maneras, pero a menudo se utilizan encuestas.
2. Datos limpios: Otro paso importante en el análisis de tipo descriptivo y de otros tipos de
datos es la limpieza de los datos. Esto se debe a que los datos pueden estar formateados de
manera inaccesible, lo que dificultará su manipulación estadística. La limpieza de los datos
puede implicar el cambio de su formato textual, su categorización y/o la eliminación de
valores atípicos.
3. Aplicar métodos: Por último, el análisis descriptivo supone la aplicación de los métodos
estadísticos elegidos para sacar las conclusiones deseadas. Los métodos que se elijan
dependerá de los datos que se manejen y de lo que se quiera determinar.

En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva.


El objetivo es repasar algunos conceptos básicos y proporcionar una guía de
trabajo que sirva de referencia en el análisis descriptivo. A lo largo del ejemplo, se comentarán los
procedimientos propios de los alumnos encuestados y se propondrán algunas cuestiones de
interpretación de resultados.

Objetivos
✓ Realizar una descriptiva completa del conjunto de datos, justificando en cada caso el
método elegido

BASE DE DATOS
La base de datos para este ejemplo se encuentra en la ANEXO 1:

Para realizar una descriptiva completa del conjunto de datos, justificando en cada caso el método
elegido.
Ejemplo:

Las siguientes son las alturas, en centímetros, de sesenta estudiantes universitarios:

150 160 161 160 160 172 162 160 172 151 161 172 160 169 169 176 160 173 184 172 160 170
153 167 167 175 166 173 169 178 170 179 175 174 160 174 149 162 161 168 170 173 156 159
154 156 160 166 170 169 163 168 171 178 179 164 176 163 182 162

Una forma sencilla de organizar los datos se propone en la siguiente tabla: VER ANEXO 1

Muchas veces, es necesario o resulta más cómodo trabajar con los datos agrupados en intervalos
(o clases). La manera de agrupar los datos será estudiada más adelante, por ahora planteamos una
posibilidad de agrupación para ver la aplicación en nuestro ejemplo:

Estatura de sesenta estudiantes universitarios en 2021

Intervalos Punto Frecuen Frecuencia Frecuencia Frecuenci Frecuencia Frecuenci


o Medio cia simple simple a acumulada a
clases simple relativa relativa acumulad relativa acumulad
absoluta porcentual a a
absoluta relativa
xi fi fri fri% Fri porcentual
Fi
Fri%
[149 , 154) 151.5 4 0.0667 6.67% 4 0.0667 6.67%
[154 , 159) 156.5 3 0.0500 5.00% 7 0.1167 11.67%
[159 , 164) 161.5 18 0.3000 30.00% 25 0.4167 41.67%
[164 , 169) 166.5 7 0.11667 11.66% 32 0.5333 53.33%
[169 , 174) 171.5 16 0.2667 26.67% 48 0.8000 80.00%
[174 , 179) 176.5 8 0.1333 13.33% 56 0.9333 93.33%
[179 , 184] 181.5 4 0.0667 6.67% 60 1 100.00%

• Determinar el tamaño de muestra


n = 60
• Reconocer el máximo y el mínimo
xmáx = 184 xmín = 149
• Calcular el alcance o recorrido
R = xmáx - xmín = 184 - 149 = 35
• Calcular la cantidad de intervalos
k = 1 + 3,3.log n = 1 + 3,3 . log 60 ≈ 6,87 ⇒ k = 7 (El valor de k siempre debe ser redondeado
a un número entero inferior o superior. Lo usual es hacer el redondeo matemático.)
• Calcular la longitud de cada intervalo
I = R / k = 35 / 7 = 5 (Si el valor resultara ser un número decimal, hay que realizar un
redondeo por exceso, con la cantidad de posiciones decimales que se deseen. Por ejemplo,
si diera 6,270791, se puede redondear a 6,28 ó 6,3 ó 7, entre otras opciones, pero nunca 6,27
ó 6,2 ó 6.)
• Armar una tabla con los intervalos obtenidos, las marcas de clase y las frecuencias
correspondientes
Histograma

Un histograma se obtiene construyendo sobre unos ejes cartesianos rectángulos cuyas áreas son
proporcionales a las frecuencias de cada intervalo. Sobre el eje de abscisas se representan dos
intervalos, el anterior al primero y el posterior al último, que no tienen valores en ellos.

Estatura de un grupo de estudiantes


universitarios
20
cantidad de estudiantes

15

10

0
[149 , 154) [154 , 159) [159 , 164) [164 , 169)
[169 , 174) [174 , 179) [179 , 184)
Estatura en cm
Media aritmética
Como la media aritmética de las observaciones x1, x2, ..., xn es el promedio aritmético de éstas,
se denota por:

En nuestro ejemplo, indicamos la media aritmética como:

Interpretación: La estatura promedio de los estudiantes es de 167,17 cm

Mediana

Intervalo xi fi Fi
[149 , 154) 4 151.5 4
[154 , 159) 3 156.5 7
[159 , 164) 18 161.5 25
[164 , 169) 7 166.5 Clase mediana
32
[169 , 174) 16 171.5 48
[174 , 179) 8 176.5 56
[179 , 184] 4 181.5 60
n=60
Para calcular la mediana en datos agrupados seguiremos los siguientes pasos:
• Calcular el orden o posición de la mediana, usando la fórmula (n+1)/2, sin importar si n
es par o impar.
• Buscar el valor obtenido como orden de la mediana en la columna de frecuencia
acumulada (Fi), si no está, tomar el inmediato superior y llamar a la clase
correspondiente, clase mediana. Diremos que la mediana, x~ , pertenece a este intervalo,
pero es necesaria una mayor precisión. Por esto buscaremos el valor de la mediana dentro
de la clase mediana.
x~ ∈ [164 , 169)
• El valor de la mediana se obtiene mediante la fórmula:

Interpretación: El 50% de los estudiantes universitarios observados miden 167,57 cm o menos


y el otro 50% miden 167,57 cm o más.

Modo, moda o valor modal

Intervalo xi fi Fi
[149 , 154) 151.5 4 4
[154 , 159) 156.5 3 7
[159 , 164) 161.5 18 25 Clase modal
[164 , 169) 166.5 7 32
[169 , 174) 171.5 16 48
[174 , 179) 176.5 8 56
[179 , 184] 181.5 4 60
n=60

Para calcular la moda en datos agrupados seguimos los siguientes pasos:


▪ Buscar la máxima frecuencia absoluta y llamar a la clase correspondiente, clase modal.
▪ Diremos que la moda, Mo, pertenece a este intervalo, pero es necesaria una mayor
precisión. Por esto buscaremos el valor de la moda dentro de la clase modal.
Mo ∈ [159, 164)
▪ El valor de la moda se obtiene mediante la fórmula:

Interpretación: La estatura de los estudiantes universitarios observados que se presenta con


mayor frecuencia es 161,88 cm.

Rango
R = xmáx - xmín = 184 cm – 149 cm = 35 cm
Interpretación: La amplitud de la muestra es de 35 cm.
Varianza

Interpretación: El promedio de los cuadrados de las desviaciones de las estaturas respecto a la


media aritmética es de 63,11cm2.

Desviación estándar

Interpretación: Las estaturas se desvían, en promedio, respecto a la media aritmética, en 7,94 cm.

Coeficiente de variación
𝑆 7,94 𝑐𝑚
𝐶𝑉 = = = 0,0475
𝑋 167,17 𝑐𝑚

CV% = 4,75%

Interpretación: La desviación estándar representa un 4,75% de la media aritmética.

Cuartiles, Deciles y Percentiles:


Calcularemos el tercer cuartil (Q3), el segundo decil (D2) y el percentil 95 (P95) en la serie de
datos correspondiente a las estaturas de los alumnos universitarios.
Para calcular los estadísticos de orden en datos agrupados vamos a seguir los siguientes pasos:

Intervalo xi fi Fi
[149 , 154) 151.5 4 4
[154 , 159) 156.5 3 7
[159 , 164) 161.5 18 25 Clase del D2
[164 , 169) 166.5 7 32
[169 , 174) 171.5 16 48 Clase del Q3
[174 , 179) 176.5 8 56
[179 , 184] 181.5 4 60 Clase del P95
n=60

Tercer cuartil (Q3)


La posición de la clase del tercer cuartil es Q3 = 3. (n+1) /4 = 3. (60+1) /4 = 45, 75º.
Luego, buscando el valor obtenido en la columna de la frecuencia acumulada, se ve el intervalo
correspondiente a la clase del tercer cuartil.
Como el número obtenido en Q3 no existe, se toma el intervalo inmediato superior. La clase del
tercer cuartil es [169; 174).
Una vez identificada la clase del tercer cuartil, calculamos el valor del tercer cuartil dentro del
intervalo, que se halla mediante la fórmula:

3. 𝑛
− 𝐹𝑎𝑛𝑡 𝑄3 45 − 32
𝑄3 = 𝐿𝑖𝑛𝑓 𝑄3 + 𝐼. ( 4 ) = 169 + 5. ( ) = 173,06 𝑐𝑚
𝑓𝑄3 16

Interpretación: El 75% de las estaturas de los estudiantes universitarios observados son iguales
o inferiores a 173,06 cm y el otro 25% son iguales o superiores a 173,06 cm.

Segundo decil (D2)


La posición de la clase del segundo decil es D2 = 2. (n+1) /10 = 2. (60+1) /10 = 12, 2º.
Luego, buscando el valor obtenido en la columna de la frecuencia acumulada, se ve el intervalo
correspondiente a la clase del segundo decil.
Como el número obtenido en D2 no existe, se toma el intervalo inmediato superior.
La clase del segundo decil es [159; 164).
Una vez identificada la clase del segundo decil, calculamos el valor del segundo decil dentro del
intervalo, que se halla mediante la fórmula:

2. 𝑛
− 𝐹𝑎𝑛𝑡 𝐷2 12 − 7
𝐷3 = 𝐿𝑖𝑛𝑓 𝐷2 + 𝐼. ( 10 ) = 159 + 5. ( ) = 160,39 𝑐𝑚
𝑓𝐷2 18

Interpretación: El 20% de las estaturas de los estudiantes universitarios observados son iguales
o inferiores a 160,39 cm y el otro 80% son iguales o superiores a 160,39 cm.

Percentil noventa y cinco (P95)


La posición de la clase del percentil noventa y cinco es P95 = 95. (n+1) /100 = 95. (60+1) /100 =
57, 95º.
Luego, buscando el valor obtenido en la columna de la frecuencia acumulada, se ve el intervalo
correspondiente a la clase del percentil noventa y cinco.
Como el número obtenido en ºP95 no existe, se toma el intervalo inmediato superior.
La clase del percentil noventa y cinco es [179; 184].
Una vez identificada la clase del percentil noventa y cinco, calculamos el valor del percentil
noventa y cinco dentro del intervalo, que se halla mediante la fórmula:

95. 𝑛
− 𝐹𝑎𝑛𝑡 𝑃95 57 − 56
𝑃95 = 𝐿𝑖𝑛𝑓 𝑃95 + 𝐼. ( 100 ) = 179 + 5. ( ) = 180,25 𝑐𝑚
𝑓𝑃95 4

Interpretación: El 95% de las estaturas de los estudiantes universitarios observados son iguales
o inferiores a 180,25 cm y el otro 5% son iguales o superiores a 180,25 cm.
CONCLUSIONES

❖ Las variables estadísticas se pueden clasificar en cualitativas, que como su nombre


lo indica nos describen cualidades de los elementos, o en cuantitativas que resultan de
procesos de medición, y estás últimas a su vez se diferencian entre discretas o continuas.

❖ Para organizar la información se utilizó tablas de distribución de las frecuencias,


permitiendo así, poder realizar los cálculos respectivos para frecuencia absoluta,
frecuencia relativa y frecuencia absoluta y relativa acumulada.

❖ De acuerdo con los objetivos de la investigación que se plantearon al principio de este estudio se
puede concluir lo siguiente. Con los 60 encuestados se pudo detectar que las estaturas de los
estudiantes están entre los 159 y 164 cm.
RECOMENDACIONES

• En la mayoría de los casos, la investigación descriptiva obtiene datos de cantidades, no


de cualidades. Es por este motivo que se puede decir que una investigación descriptiva es
de tipo cuantitativa. Aun así, existe también la posibilidad de obtener datos cualitativos.
• Como en todos los tipos de investigaciones, los datos aportados por la investigación
descriptiva deben ser tanto precisos, como fidedignos.
• Si no se formulan bien las preguntas, es posible que las respuestas obtenidas no sean del
todo confiables, hecho que dificulta la realización de una investigación creíble.
ANEXO 1: BASE DE DATOS

OPERADOR
ESTATURA PESO INTER RAZON
N° GENERO EDAD FACULTAD QUE MODALIDAD SATISFACCION
(CM) (KG) NET OPERADOR
UTILIZA

1 Mujer 18 156 48 INGENIERIA CIVIL CLARO Post-Pago Si Llamada a bajo costo Satisfecho
2 Mujer 20 160 49 ADMINISTRACION MOVISTAR Post-Pago Si Llamada a bajo costo Satisfecho
3 Hombre 22 159 50 DERECHO CLARO Post-Pago Si Mejores planes Satisfecho
4 Hombre 19 170 55 MEDICINA CLARO Post-Pago No Llamada a bajo costo Satisfecho
5 Hombre 25 160 56 DERECHO ENTEL Post-Pago Si Llamada a bajo costo Satisfecho
6 Mujer 19 153 57 INGENIERIA CIVIL BITEL Post-Pago No Llamada a bajo costo Satisfecho
7 Hombre 18 150 49 ING. SISTEMA MOVISTAR Post-Pago No Llamada a bajo costo Media
8 Mujer 19 160 48 ING. SISTEMA CLARO Pre-Pago No Llamada a bajo costo Satisfecho
9 Hombre 20 156 62 MEDICINA CLARO Post-Pago Si Llamada a bajo costo Media
10 Mujer 21 164 68 DERECHO CLARO Post-Pago Si Mejores planes Satisfecho
11 Mujer 23 162 69 MEDICINA CLARO Post-Pago Si Mejores planes Satisfecho
12 Mujer 22 149 55 ADMINISTRACION MOVISTAR Post-Pago Si Mejores planes Satisfecho
13 Hombre 25 172 63 ADMINISTRACION MOVISTAR Post-Pago Si Llamada a bajo costo Satisfecho
14 Mujer 26 167 57 ADMINISTRACION MOVISTAR Post-Pago No Llamada a bajo costo Satisfecho
15 Hombre 22 168 70 ADMINISTRACION CLARO Post-Pago No Llamada a bajo costo Satisfecho
16 Mujer 20 170 59 INGENIERIA CIVIL ENTEL Post-Pago Si Mejores planes Satisfecho
17 Hombre 20 169 58 DERECHO ENTEL Post-Pago No Llamada a bajo costo Satisfecho
18 Hombre 20 184 56 MEDICINA ENTEL Post-Pago Si Mejores planes Satisfecho
19 Mujer 22 179 54 MEDICINA MOVISTAR Post-Pago Si Mejores planes Satisfecho
20 Hombre 21 176 62 MEDICINA MOVISTAR Post-Pago Si Mejores planes Satisfecho
21 Hombre 23 160 61 MEDICINA BITEL Post-Pago No Llamada a bajo costo Satisfecho
22 Hombre 23 162 63 DERECHO CLARO Post-Pago Si Mejores planes Media
23 Hombre 24 164 62 ING. SISTEMA CLARO Post-Pago No Llamada a bajo costo Satisfecho
24 Mujer 24 151 64 ING. SISTEMA CLARO Post-Pago Si Mejores planes Satisfecho
25 Hombre 26 167 65 ADMINISTRACION CLARO Post-Pago No Llamada a bajo costo Satisfecho
26 Hombre 2 163 49 ADMINISTRACION ENTEL Post-Pago No Llamada a bajo costo Satisfecho
27 Hombre 2 160 52 INGENIERIA CIVIL BITEL Post-Pago Si Mejores planes Satisfecho
28 Hombre 21 162 54 DERECHO MOVISTAR Post-Pago Si Mejores planes Satisfecho
29 Hombre 19 166 57 MEDICINA CLARO Post-Pago Si Mejores planes Satisfecho
30 Mujer 19 161 52 MEDICINA ENTEL Post-Pago Si Mejores planes Media
31 Hombre 19 161 50 ADMINISTRACION BITEL Post-Pago Si Mejores planes Media
32 Hombre 19 154 51 INGENIERIA CIVIL MOVISTAR Post-Pago Si Mejores planes Media
33 Mujer 18 160 56 DERECHO CLARO Post-Pago Si Mejores planes Media
34 Mujer 20 172 58 MEDICINA CLARO Post-Pago Si Mejores planes Media
35 Mujer 21 160 56 MEDICINA CLARO Post-Pago Si Mejores planes Media
36 Hombre 26 176 64 INGENIERIA CIVIL ENTEL Post-Pago Si Mejores planes Media
37 Mujer 27 178 62 ADMINISTRACION BITEL Post-Pago Si Mejores planes Media
38 Hombre 28 170 59 DERECHO MOVISTAR Post-Pago Si Mejores planes Media
39 Mujer 28 170 58 MEDICINA CLARO Post-Pago Si Mejores planes Poco o Casi nada
40 Mujer 24 173 54 DERECHO ENTEL Post-Pago Si Mayor Cobertura Satisfecho
41 Hombre 22 172 46 INGENIERIA CIVIL BITEL Post-Pago Si Mejores planes Satisfecho
42 Hombre 20 163 75 ING. SISTEMA MOVISTAR Post-Pago Si Mayor Cobertura Media
43 Hombre 26 172 62 ING. SISTEMA MOVISTAR Post-Pago Si Mejores planes Satisfecho
44 Hombre 21 174 61 MEDICINA MOVISTAR Post-Pago No Mejores planes Satisfecho
45 Hombre 19 169 58 DERECHO CLARO Post-Pago No Mejores planes Media
46 Hombre 19 166 52 ING. SISTEMA CLARO Post-Pago Si Mejores planes Poco o Casi nada
47 Mujer 20 168 59 ING. SISTEMA CLARO Post-Pago Si Mayor Cobertura Media
48 Mujer 23 171 56 ADMINISTRACION CLARO Post-Pago Si Mayor Cobertura Poco o Casi nada
49 Hombre 24 173 54 ADMINISTRACION MOVISTAR Post-Pago Si Mayor Cobertura Media
50 Hombre 25 173 58 INGENIERIA CIVIL MOVISTAR Post-Pago No Mejores planes Satisfecho
51 Mujer 21 174 57 DERECHO CLARO Post-Pago Si Mayor Cobertura Satisfecho
52 Hombre 22 160 53 MEDICINA CLARO Post-Pago No Mayor Cobertura Satisfecho
53 Mujer 20 169 52 MEDICINA CLARO Post-Pago Si Mayor Cobertura Media
54 Mujer 20 182 56 ADMINISTRACION CLARO Pre-Pago Si Mejores planes Satisfecho
55 Mujer 27 179 54 INGENIERIA CIVIL MOVISTAR Post-Pago No Llamada a bajo costo Poco o Casi nada
56 Mujer 22 161 56 DERECHO MOVISTAR Post-Pago Si Mejores planes Satisfecho
57 Mujer 21 178 52 MEDICINA CLARO Post-Pago Si Mejores planes Satisfecho
58 Mujer 19 175 52 MEDICINA CLARO Post-Pago Si Equipo a bajo costo Satisfecho
59 Hombre 19 169 50 MEDICINA CLARO Post-Pago Si Mayor Cobertura Poco o Casi nada
60 Mujer 17 160 48 INGENIERIA CIVIL CLARO Post-Pago Si Mayor Cobertura Satisfecho

También podría gustarte