Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Fase 2 - Identificación de Variables Estadísticas-Colaborativo
Fase 2 - Identificación de Variables Estadísticas-Colaborativo
GRUPO 300046_77
DOCENTE
FRANCISCO JOSE MONTEALEGRE TORRES
ESTUDIANTES
JUAN DAVID LOZANO
Cód. 1110262977
CAROL MARITZA CHILITO
Cód. 1083921430
PABLO EMILIO MORENO
Cód. 75104599
1. Índice. 2
2. Introducción 3
3. Objetivos 4
4. Cuerpo del trabajo 5
5. Conclusiones. 29
6. Bibliografía. 30
INTRODUCCIÓN
ESPECIFICOS:
Observar la ganancia en términos de facilidad de interpretación y de disposición de
la información original
Relacionar la información contenida en la tabla con el tipo de variable que se está
tabulando
Conocer distintas maneras de organizar y presentar información incluyendo el
cálculo de algunos indicadores estadísticos, la elaboración de tablas y gráfico
utilizando plantilla de cálculo Excel. y el programa RGui.
CONTENIDOS
g. Qué es desviación estándar. Es una medida de dispersión usada en estadística que nos
dice cuanto tienden alejarse los valores puntuales del promedio en una distribución, de hecho
específicamente la desviación estándar es el promedio de la distancia de cada punto respecto
del promedio.
¿Cómo se obtiene?
De la raíz cuadrada de la varianza.
TABLA DE FRECUENCIAS
EDAD F. ABSOLUTA F.RELATIVA FAA FRA
34,9 43,9 2 0,066666667 2 0,06666667
43,9 52,9 4 0,133333333 6 0,2
52,9 61,9 6 0,2 12 0,4
61,9 70,9 7 0,233333333 19 0,63333333
70,9 79,9 11 0,366666667 30 1
30
10 11
6 7
6
4
4
2
2
0
34,9 - 43,9 43,9- 52,9 52,9- 61,9 61,9- 70,9 70,9 79,9
Entre los rangos de 34,9 a 43,9 hay 2 habitantes, entre 43,9 a 52,9 hay 4 habitantes, entre
52,9 a 61,9 hay 6 habitantes, entre 61,9 a 70,9 hay 7 habitantes y entre 70,9 a 79,9 hay 11
habitantes.
Hallar:
a. Media muestral.
b. Mediana muestral.
c. Moda.
d. Varianza.
e. Desviación estándar.
f. Rango de datos.
g. Indicar el valor de los cuatro cuartiles.
h. Realice el gráfico de frecuencia absoluta.
Presentar en el informe el cálculo realizado para la obtención de los
resultados.
(X-
DATOS
N XPROM)^2
1 3 10,24
2 3 10,24
3 3 10,24
4 4 4,84
5 4 4,84
6 4 4,84
7 4 4,84
8 5 1,44
9 5 1,44
10 5 1,44
11 5 1,44
12 6 0,04
13 6 0,04
14 6 0,04
15 6 0,04
16 6 0,04
17 7 0,64
18 7 0,64
19 7 0,64
20 7 0,64
21 7 0,64
22 7 0,64
23 8 3,24
24 8 3,24
25 8 3,24
26 9 7,84
27 9 7,84
28 9 7,84
29 9 7,84
30 9 7,84
186 100,96
MEDIANA
(3+9)/2 6
MEDIA O
PROMEDIO
186/30 6,2
VARIANZA DE
UNA MUESTRA 3,48137931
DESVIACION
ESTANDAR DE
UNA MUESTRA
RAIZ 1,86584547
CUADRADA
DE LA
VARIANZA
RANGO 6
N°
POSICION PERSONAS
Q1( K*N)/4 7,5 5
Q2 ( K*N)/4 15 6
Q3( K*N)/4 22,5 8
Q4 ( K*N)/4 30 9
REGLA DE
STURGEN APROX
K=1+3,332+LOG
N 5,92 5
TABLA DE FRECUENCIAS
PERSONAS A
F. ABSOLUTA F.RELATIVA FAA FRA
CARGO
2 4 7 0,23333333 7 0,23333333
4 6 9 0,3 16 0,53333333
6 8 9 0,3 25 0,83333333
8 10 5 0,16666667 30 1
10 12 0 0 30 1
30 1
PERSONAS A CARGO
10
9
9 9
8
7
7
6
5
5
4
3
2
1
0
2--4 4--6 6--8 8--10
N POZO (X-XPROM)^2
1 1 1,21
2 1 1,21
3 1 1,21
4 1 1,21
5 1 1,21
6 1 1,21
7 1 1,21
8 2 0,01
9 2 0,01
10 2 0,01
11 2 0,01
12 2 0,01
13 2 0,01
14 2 0,01
15 2 0,01
16 2 0,01
17 2 0,01
18 2 0,01
19 2 0,01
20 2 0,01
21 3 0,81
22 3 0,81
23 3 0,81
24 3 0,81
25 3 0,81
26 3 0,81
27 3 0,81
28 3 0,81
29 3 0,81
30 3 0,81
63 16,7
MEDIANA (2+2)/2 2
MEDIA O PROMEDIO 186/30 2,1
VARIANZA DE UNA
0,57586207
MUESTRA
DESVIACION ESTANDAR DE
UNA MUESTRA RAIZ
0,75885576
CUADRADA DE LA
VARIANZA
RANGO 2
POSICION VIVIENDA
2= POZO
Q1( K*N)/4 7,5
SEPTICO
2= POZO
Q2 ( K*N)/4 15
SEPTICO
Q3( K*N)/4 22,5 3= NINGUNO
Q4 ( K*N)/4 30 3= NINGUNO
1= alcantarillado
2= pozo séptico
3= ninguno
25
20
13
15
10
10 7
5
0--1 1--2 2--3
0
1 2 3 4
VIVIENDA F. ABSOLUTA
Hay 7 familias que cuentan con alcantarillado, 13 familias que cuentan con pozo séptico y
10 familias que no cuentan con nada.
El diagrama de caja es una grafica de distribución la cual es útil para identificar datos
atípicos de la distribución, además de determinar si existe algún sesgo.
En el diagrama de cajas se observa que los datos se encuentran agrupados a las edades más
altas, concentrándose entre los 55 y 73 años. Además, nos se observan datos atípicos en la
distribución.
b. Gráficos de variable cuantitativa discreta
i. Boxplot o diagrama de cajas variable discreta
El diagrama de caja de la variable cuantitativa discreta, que habla del numero de personas
que conviven con los campesinos, nos arroja que los datos se encuentran sesgados al centro
de los mismos, encontrándose mayores datos por encima de la mediana. Por otro lado, no se
observan datos atípicos en la distribución.
ii. Diagrama de barras Frecuencia Absoluta
El diagrama de barras se caracteriza por indicar una cantidad especifica con la altura de la
barra. En este caso, el diagrama de barras nos muestra la frecuencia absoluta de la variable
cuantitativa discreta: personas que conviven con los campesinos. Podemos observar que los
datos se encuentran distribuidos a lo largo de todo el rango, siendo la mayor frecuencia 7
personas y la menor la comparten entre 3 y 8 personas.
iii. Diagrama de barras Frecuencia relativa
las frecuencias relativas acumuladas se hallan sumando la frecuencia relativa anterior con la
siguiente, por lo que siempre es un grafico creciente. En este caso se observa que los datos
presentan un crecimiento porcentual constante, lo que indica que los datos se encuentran
distribuidos por todo el rango de forma homogénea. Claramente la frecuencia relativa
acumulada menor, es la de 3 personas y la frecuencia relativa mayor es la de 9 personas.
iv. Diagrama de barras Frecuencias relativas acumuladas
las frecuencias relativas acumuladas se hallan sumando las frecuencias relativas con las
anteriores, por lo que siempre es un grafico creciente. En este caso se observa que los datos
presentan un crecimiento porcentual constante, lo que indica que los datos se encuentran
distribuidos por todo el rango de forma homogénea.
v. Gráfico de tarta de Hermanos
La grafica de torta indica como se distribuyen los datos dentro del total de los datos. En este
caso, se observa que los datos tienen una distribución similar, aunque se observa que las 7
personas, representadas en color azul, tienen un área mayor dentro del gráfico. Y la menor
área del gráfico es ocupada por los valores de 3 y 8 personas, cuyas áreas es igual y están
representadas de color rojo y rosado.
c. Gráficos de variable cualitativa
i. Diagrama de barras frecuencias absolutas aguas residuales
b. ¿Cuáles factores considera usted que inciden para que los jóvenes
ya no quieran dedicarse a las labores del campo? ¿en la zona
donde usted habita sucede lo mismo?
Los jóvenes han disminuido el interés a las labores de campo debido a la existencia de la
tecnología y oportunidades que estas llevan a tener una vida mas sofisticada, llenas de lujos
y en ámbitos laborales en la ciudad.
Si, en el Tolima vemos como los jóvenes se interesan más por la tecnología y nuevos
aprendizajes olvidando todo lo relacionado al campo y a nuestros antepasados.
c. Una vez evidenciados los resultados de la variable discreta y la
cualitativa, ¿cómo considera que son las condiciones de vida de
las personas que habitan en la zona rural? ¿cómo son las
condiciones de vida de los campesinos en la región donde usted
habita?
Según los resultados de las variables se observa que los campesinos tienen familias
numerosas, teniendo en promedio personas que viven con ellos de 6, por otro lado los
resultados de la variable cualitativa indican que mas del 43% de los campesinos su sistema
de aguas se trabajo con pozos sépticos, el 33% no cuentan con ningún tipo de sistema y el
23% con alcantarillado.
Las condiciones de vida de los campesinos siguen siendo de probable, pues en pleno siglo
XXI, aún falta mucha tecnología y compromiso por parte de nuestros gobernantes para
apoyar al campesino.
Podemos dividir la estadística en dos ramas; la estadística descriptiva, que se dedica a los
métodos de recolección, descripción, visualización y resumen de datos originados a partir
de los fenómenos en estudio; y la estadística inferencial, que se dedica a la generación de
los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión.