Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Grupo 300046_31
Presentado por:
Darlyg Tatiana Mantilla Ortega Código: 1.102.723.265
Jerson Lancheros Código: 1.102.714.556
Manuel Sebastián Jerez Código:
Wilmer Espinosa Código: 1.102.725.851
Liceth Viviana Ortiz Código: 1.102.383.528
Presentado a:
Luis Alberto Cáceres Torres
Tutor
área de estudio que necesite la recolección de información para después procesarla y basada
en los resultados realizar la toma de decisiones. Pero todo este procesamiento no siempre es
OBJETIVO GENERAL
Identificar las diferentes variables estadísticas cuantitativas, cualitativas y su forma de
procedimiento.
OBJETIVO OBJETIVOS
Instalar el programa R y desarrollar los gráficos propuestos en la guía.
Desarrollar los ejercicios de las variables cuantitativa continua y cuantitativa discreta.
DESARROLLO DE LA ACTIVIDAD:
1. Resolver las siguientes preguntas:
a. Qué es una variable cuantitativa continua.
Son variables numéricas que toman un número infinito entre dos valores cual quiera.
b. Qué es una variable cuantitativa discreta.
Son variables numéricas que tienen un número contable de valores entre dos valores
cualesquiera.
c. Qué es una variable cualitativa nominal.
En esta variable los valores no pueden ser sometidos a un criterio de orden, como por
ejemplo los colores o el lugar de nacimiento
d. Qué es una variable cualitativa categórica.
Las variables categóricas también se denominan variables cualitativas o variables de
atributos. Los valores de una variable categórica son categorías o grupos mutuamente
excluyentes. Los datos categóricos pueden tener o no tener un orden lógico
e. Cuál es la diferencia entre media poblacional y media muestral.
Como su nombre lo indica, la media poblacional hace referencia a la media teniendo en
cuenta la población total, mientras que la media muestral, solo toma una porción de la
población total para hacer el estudio.
f. Qué es la varianza de una población.
Cuadrado de la desviación estándar poblacional.
g. Qué es desviación estándar.
Se obtiene de la raíz cuadrada de la varianza, conocida también como desviación típica. Se
utiliza para identificar valores extremos.
h. Qué es la Regla de Sturges ¿para qué sirve?
Es una regla práctica acerca del número de clases que deben considerar al elaborarse un
histograma. Este número viene dado por la siguiente expresión:
c= 1+ log2 ( M ), donde M es el tamaño de la muestra.
Que puede escribirse a partir de logaritmos base 10 de la siguiente forma:
c= 1 + log (M) / log (2), donde M es el tamaño de la muestra.
El valor de c (número de clases) es común redondearlo, si tu entero del resultado previo al
redondeo es "par" se redondea al alta y si el entero es "impar" se redondea a la baja.
i. Qué es frecuencia absoluta.
Es el número de veces que aparece un determinado valor en un estudio estadístico. La suma
de las frecuencias absolutas es igual al número total de datos, que se representa por N. Para
indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee
suma o sumatoria.
j. Qué es frecuencia relativa.
Es el cociente entre la frecuencia absoluta de un determinado valor y el número total de
datos. La frecuencia relativa se puede expresar en tantos por ciento y se representa por ni.
La suma de las frecuencias relativas es igual a 1.
k. Qué es frecuencia relativa acumulada.
Es el cociente entre la frecuencia acumulada de un determinado valor y el número total de
datos.
l. ¿Cuál es la diferencia entre una tabla de frecuencias absolutas de una variable
continua y de una discreta?
La tabla de frecuencia de una variable discreta no maneja intervalos, solo números enteros.
No se necesita agrupar datos
17 22 15 22 25
Hallar:
a. Media.
∑ ¿ 1 xi
x 1+ x 2 + x 3 + x 4 + x 5+ x 6 + x 7 + x 8 + x 9+ x 10 + x 11+ x 12+ x 13 + x 14+ x15
i
μ= =
N N
15+17+18+18.4+ 19.2+19.4 +19.6+20+20.4 +21.4+ 22+22+23+ 24+25
¿
15
304
=20,29
15
Respuesta: 20.29333
b. Mediana.
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
15 17 18 18,4 19, 19,4 19,6 20 20,4 21,4 22 22 23 24 25
2
Respuesta: 20
c. Moda.
15, 17, 18, 18.4, 19.2, 19.4, 19.6, 20, 20.4, 21.4, 22, 22, 23, 24, 25
Respuesta: 22
d. Varianza.
X (x-µ) (x-µ)2
15 -5,293333 28,01937778
17 -3,293333 10,84604444
18 -2,293333 5,259377778
18,4 -1,893333 3,584711111
19,2 -1,093333 1,195377778
19,4 -0,893333 0,798044444
19,6 -0,693333 0,480711111
20 -0,293333 0,086044444
20,4 0,106667 0,011377778
21,4 1,106667 1,224711111
22 1,706667 2,912711111
22 1,706667 2,912711111
23 2,706667 7,326044444
24 3,706667 13,73937778
25 4,706667 22,15271111
∑ ¿ ( x1 −μ )2
2 i
σ =
N−1
2 100,5493333
σ =
15−1
2
σ =7,182095
Respuesta: 7,182095
e. Desviación estándar.
σ =√ σ
2
σ =√ 7,182095
σ =2,679943
Respuesta: 2,679943
f. Rango de datos.
15-25
k ( N +1 )
Qk=
4
15, 17, 18, 18.4, 19.2, 19.4, 19.6, 20, 20.4, 21.4, 22, 22, 23, 24, 25
Q1 Q2 Q3
25% 50% 75%
quantile (edad, 0.25) # Cuantil Q1
25% 18.4
1 ( N +1 )
Q 1=
4
15+1 16
Q 1= = =4
4 4
Q 1=x 4 = 18,4
3 ( 15+1 ) 48
Q 3= = =12
4 4
Q 3=x 12= 22
2
1
0
16 18 20 22 24
edad
Hallar:
a. Media.
N
b. Mediana.
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
0 0 1 1 1 2 2 2 2 3 3 3 4 4 5
Respuesta: 2
c. Moda.
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
0 0 1 1 1 2 2 2 2 3 3 3 4 4 5
Respuesta: 2
d. Varianza.
X (x-µ) (x-µ)2
0 -2,2 4,84
0 -2,2 4,84
1 -1,2 1,44
1 -1,2 1,44
1 -1,2 1,44
2 -0,2 0,04
2 -0,2 0,04
2 -0,2 0,04
2 -0,2 0,04
3 0,8 0,64
3 0,8 0,64
3 0,8 0,64
4 1,8 3,24
4 1,8 3,24
5 2,8 7,84
∑ ¿ ( x1 −μ )2
2 i
σ =
N−1
2 30,4
σ =
15−1
2
σ =2,171428571
e. Desviación estándar.
σ =√ 2,171428571
σ =1,4735
f. Rango de datos.
0 a 15
g. Indicar el valor de los cuatro cuartiles.
25% 1
1 ( N +1 )
Q 1=
4
15+1 16
Q 1= = =4
4 4
Q 1=x 4 = 1
75% 3
3 ( N +1 )
Q 3=
4
3 ( 15+1 ) 48
Q 3= = =12
4 4
Q 3=x 12= 3
50% 2
2 ( N +1 )
Q 2=
4
2 ( 15+1 ) 32
Q 2= = =8
4 4
Q 2=x 8=2
4. Presentar los gráficos que obtenga al ejecutar el código, para ello, cuando le aparezca un
gráfico debe dar click derecho sobre este y seleccionar “copiar como metafile” para
posteriormente pegarlo en el informe. Los gráficos para presentar se deben dividir en tres
secciones:
GRAFICOS OBTENIDOS CON EL PROGRAMA R
5
4
3
Frequency
2
1
0
16 18 20 22 24
edad
Como estamos trabajando con variable continua podemos observar 5 clases que va a representar la
cantidad de personas que están en esas edades. Para el primer rango de 15 a 17 tenemos 2 personas,
Histograma de la variable continua Edad
para el rango de 17 a 19 hay 2 personas, de 19 a 21 años hay 5 personas, de 21 a 23 hay 4 personas y de
23 a 25 hay 2 personas. En total al sumar deben dar 15.
PERIODO 764 - Histograma de la variable continua Edad
5
4
Frecuencia
3
2
1
0
14 16 18 20 22 24 26
edad
Para este grafico se obtiene 6 clases diferente al anterior que solo tenia 5. Podemos ver como cada
rango tiene la cantidad de personas que fueron encuestadas por edad. Para un total de 15
20
18
16
Este grafico está divido en varias secciones. Podemos observar que las barras laterales se identifican
con el valor mínimo y máximo en que esta el rango de las edades. La barra en negrita de la mitad
correspondo al Q2 en este caso 20 que es la misma mediana. Los bloques o cajas a los lados de la barra
en negrita corresponden a los Q1 y Q3.
3
2
1
0
Para esta variable se trabaja este tipo de grafico que nos representa con sus barras laterales los valores
máximo y minimo, en este caso 0 y 5 hermanos. La barra de la mitad corresponde al Q2 que es 2
(mediana). Los Q1 y Q3, que corresponden al 25 y 75% respectivamente están ubicados en el 1 y 3
4
3
Frecuencias absolutas
2
1
0
0 1 2 3 4 5
Número de hermanos
Esta grafica nos muestra de manera individual la cantidad de datos obtenidos para cada cantidad de
hermanos. De las personas encuestadas solo 2 tiene 0 hermanos, 3 personas tienen 1 hermano, 4
personas tienen 2 hermanos (dato que más se repite, mayor frecuencia) , 3 personas tienen 3
hermanos, 2 personas tienen 4 hermanos y solo 1 persona tiene 5 hermanos. La cantidad de
personasno puede superar el #15
0.25
0.20
Frecuencias relativas
0.15
0.10
0.05
0.00
0 1 2 3 4 5
Número de hermanos
Esta es otra manera de representar los datos obtenidos en la tabla de frecuencias, en este caso la
frecuencia relativa. Se muestran 6 rangos donde el de mayor frecuencia relativa es el 2 con 0.25,
seguido del 1 y 3 con 0.20, continua el 0 y 4 con 0.13 y el 5 con 0.066
0.6
0.4
0.2
0.0
0 1 2 3 4 5
Número de hermanos
Como su nombre lo indica, la grafica representa los datos acumulados dela grafica anterior, de manera
que la suma de todos los datos deben dar máximo 1, que representa al 100%
0
2
3
2
1
0
Nivel de estudio
Como hemos visto las variables cualitativas están organizadas de manera categórica, en este caso son:
Sin estudio, estudios primaria, estudios secundarios, estudios superiores. Sin estudio tenemos 2
agricultores, con estudios de primaria hay 5 agricultores, con estudios secundarios 4 agricultores y con
estudios superiores 3 agricultores.
0.35
0.30
0.25
Frecuencias relativas
0.20
0.15
0.10
0.05
0.00
Nivel de estudio
De acá podemos ver los datos de frecuencia de manera relativa, haciendo el cociente entre
la frecuencia absoluta de un determinado valor y el número total de datos, en este caso 15. Vemos que
la categoría con mayor cantidad de datos es estudios de primaria.
CONCLUSIONES
El desarrollo de la presente actividad ha sido de gran importancia educativa, conociendo
nuevos conceptos estadísticos muy importantes para nuestra vida profesional, inicialmente
realizando una investigación teórica y luego poniéndola en práctica en el desarrollo de
ejercicios simples que nos exigían un poco de análisis para un correcto desarrollo, todo esto
se ha logrado gracias a la orientación de los tutores encargaos del curso.
El programa R tiene una gran cantidad de ventajas relacionadas con el procesamiento de los
datos, la velocidad y la calidad de los datos, gráficos y tablas que se nos arroja como
resultado; siendo una excelente herramienta informática de velocidad en los análisis de los
resultados, además considero que esta importante herramienta es el inicio de una cadena de
aprendizaje y siendo muy útil para actividades futuras
BIBLIOGRAFIA