Está en la página 1de 13

ANÁLISIS EXPLORATORIO DE DATOS

EJERCICIOS DE PRÁCTICA

Jonathan Chillagana
Actividad de aprendizaje semana 1
Ejercicios de Práctica - Análisis Exploratorio de Datos

Nombre del estudiante Jonathan Chillagana


Carrera Software
NRC 7454
Nombre del profesor Gustavo León

Indicaciones:
 Coloque el nombre en cada una de las hojas de su trabajo.
 Resuelva cada uno de los siguientes ejercicios de manera ordenada.
 Encierre su respuesta en un rectángulo.
 Entregar en la fecha indicada.

Jonathan Chillagana
1. La siguiente información contiene datos de una muestra de estudiantes que ingresan a la Universidad de las
Fuerzas Armadas ESPE.

Cuadro 1: Información de muestra de alumnos de primer año - ESPE


CEDULA EDAD PESO ESTAT NOTA NOTA NOTA SEXO TIPO
(kg) (m) COLEGIO ENES SNNA COLEGIO
1765612415 18 80 1,70 8,16 933 8,20 M Municipal
1766718261 19 52 1,75 9,38 933 8,40 M Fiscomisional
1769166938 17 58 1,65 9,50 883 8,85 F Fiscal
1788358332 19 75 1,88 9,08 917 8,04 M Privado
1755489105 19 65 1,81 8,67 933 8,90 M Municipal
1796571519 18 78 1,75 8,72 928 8,60 M Fiscal
1722496395 19 62 1,61 8,36 940 8,60 F Fiscal
1723147188 22 56 1,56 8,50 930 8,25 F Fiscal
1790036740 19 56 1,61 9,22 927 8,90 F Privado

Determinar:
a. ¿Cuántas variables hay en este conjunto Las variables son: Sexo y Tipo de Colegio
de datos? e. ¿Cuáles variables son cualitativas
9 variables nominales?
b. ¿Cuántas observaciones hay en este La variable sexo.
conjunto de datos? f. ¿Cuáles variables son cuantitativas?
Hay 6 observaciones. Las variables cuantitativas son: Cedula,
c. ¿Cuántas variables son cualitativas? Edad, Peso, Estatura Colegio, Nota,
Hay 2 Variables cualitativas NotaEnes,NotaSnna.
d. ¿Cuáles variables son cualitativas?

2. Con la información proporcionada en la Cuadro 1, realizar un diagrama de frecuencias y un diagrama de


pastel, de las variables:

a. Edad
b. Tipo de Colegio.

Diagrama de Frecuencia

Jonathan Chillagana
Diagrama de Pastel

Jonathan Chillagana
3. Supongamos que se dispone del siguiente conjunto de calificaciones de los estudiantes, otorgada por cierta
Universidad:

Cuadro 2: Calificaciones
C B A B F
D C C B A
C B C C F
C C D A D
a. ¿Cuáles variables son cualitativas ordinales?
La variable es: Tipo de Colegio
b. ¿Qué tipo de escala de medición se usa para la variable cedula?
La escala Nominal.
c. ¿Qué tipo de escala de medición se usa para la variable peso?

Jonathan Chillagana
La escala de Razon.
d. ¿Qué tipo de escala de medición se usa para la variable Tipo de colegio?
La escala Nominal.

4. Con los datos del cuadro 2, se pide realizar:

a. Tabla de distribución de frecuencias


b. Tabla de distribución de frecuencias relativas
c. Tabla de distribución de frecuencias relativas porcentuales
d. Tabla de distribución de frecuencias relativas acumuladas
e. Tabla de distribución de frecuencias relativas acumuladas porcentuales
f. Diagrama de Pareto
g. Diagrama de Pastel

Jonathan Chillagana
5. La siguiente tabla contiene los pesos en libras de 30 niños de un año, tomados aleatoriamente.

Cuadro 3: Peso de niños de un año de edad


15 17 22 25 21 22
18 19 21 22 20 19
24 23 20 26 19 20

Jonathan Chillagana
18 21 22 22 22 21
21 23 21 26 21 18
Con esta información encontrar:
a. media. Desviacion estándar: 2,43
g. coeficiente de variación
Media: 20.94

b. moda Coeficiente de variación: 11.63


h. error t pico
Moda: 21.06 Error típico: 0.44
c. mediana
i. El coeficiente de asimetría (sesgo).
Mediana: 20.94 El sesgo es: 0

d. desviación media j. La curtosis.


Curtosis: 0266
Desviacion media es: 1.99
e. varianza. k. Hallar el rango intercuartílico
Varianza: 5.93

f. desviación estándar Rango intercuartílico es: 3.62

6. Con la información del ejercicio anterior


a. Caja y bigotes (boxplot).

b. Histograma

Jonathan Chillagana
c. Diagrama de puntos

7. La exposición aguda al cadmio produce dificultad respiratoria y daño en riñones e h gado, además de que
puede causar la muerte. Por tal razón, se monitorearon las concentraciones atmosféricas de polvo de cadmio
y vapor de óxido de cadmio, las cuales son medidas en miligramos de cadmio por metro cubico. Una muestra
tomada de 35 observaciones ha proporcionado los siguientes datos.

Cuadro 4: Datos contaminación por cadmio


0,044 0,030 0,052 0,044 0,046
0,020 0,066 0,052 0,049 0,030
0,040 0,045 0,039 0,039 0,039
0,057 0,050 0,061 0,061 0,042
0,055 0,037 0,062 0,062 0,070

Jonathan Chillagana
0,061 0,061 0,053 0,053 0,060
0,047 0,051 0,042 0,042 0,051
Con la información proporcionada realice lo que se pide e interprete su respuesta en cada ítem:
a. Generar una tabla ordenada de datos.

Calcular la media.

Media: 0.047
b. Hallar la mediana.
Mediana: 0,064
c. Determinar la moda.
Moda: 0.41
d. Determinar los valores extremos

Valor mínimo: 0,02


Valor mínimo: 0,07

e. Determinar el rango
Rango es : 0.01
f. Calcular la desviación media

Jonathan Chillagana
Desviación media: 0.011
g. h) Calcular la varianza

Varianza: 0.000176
h. Calcular la desviación estándar.

Desviación estándar: 0.013


i. Determinar el coeficiente de variación.
Coeficiente de variación: 0.374
j. Determinar el error típico.

Error típico: 0.00625


k. Hallar el coeficiente de asimetría.

Coeficiente de asimetría: -3.863


l. Hallar la curtosis.

0.548
m. Hallar el primer y tercer cuartil.

Q1= 0,0365
Q3= 0,0593
n. Hallar el percentil 10 y percentil 90.

P10= 0,03
P90= 0,0636

o. Determine el rango intercuartílico.


Rango intercuartílico: 0,0228

p. Construya un diagrama Boxplot (Caja y bigotes)

Jonathan Chillagana
8. En una universidad de la localidad, se ha tomado una muestra aleatoria simple, para poder identificar la edad
de ingreso a la universidad, obteniendo la siguiente tabla:

Cuadro 4:
Edad Frecuencia
3. 3
4. 4
5. 8
6. 10
7. 5
8. 2
Con esta información, calcule el valor de el(la):

a. media. La desviación estándar es: 1.3228


g. coeficiente de variación
Media es igual: 5,5 El coeficiente de variación es: 24.05
h. error t pico
b. moda El error típico es: 2.091
Moda es igual a :6 i. El coeficiente de asimetría (sesgo).
El coeficiente de asimetría es : -0,98
c. mediana
j. La curtosis.
Mediana es igual: 6
d. desviación media L curtosis es: -0.509
k. hallar el rango intercuartílico
La desviación media es: 1.09
El rango intercuartílico es: 1
e. varianza.

La varianza es igual a : 1.75


f. desviación estándar

Jonathan Chillagana
9. A continuación, se dispone de los índices de solución de hierro en muestras de hojalata, destinadas a medir la
resistencia a la corrosión de la hojalata de acero.

Cuadro 5: Óxidos de solución de hierro


Límites de las clases Frecuencia
[0; 10; 0; 30) 3
[0; 30; 0; 50) 13
[0; 50; 0; 70) 23
[0; 70; 0; 90) 32
[0; 90; 1; 10) 17
[1; 10; 1; 30) 7
[1; 30; 1; 50) 5

Con esta información, calcule el valor de:


a. media.

Media: 77,6

b. moda
Coeficiente de variación: 35,57821428
Moda: 77,5 h. error típico
c. mediana Error típico: 2,760869428

Mediana: 58,695
d. desviación media i. El coeficiente de asimetría (sesgo).
Desviación media: 21,328
Coeficiente de asimetría: 0.0787
e. varianza. j. La curtosis.
Varianza: 762,24 D9=115.71
f. desviación estándar D1=40.769

Desviación estándar: 27,60869428 Curtosis: 0.266

g. coeficiente de variación
k. rango intercuartílico

Q3= 97.705
Q1=57.82

Rango intercuartílico es: 39.885


l. percentil 10

P10= 40.769

Jonathan Chillagana

También podría gustarte