Está en la página 1de 30

FASE 2 - IDENTIFICACIÓN DE VARIABLES ESTADÍSTICAS

GRUPO 300046_77

DOCENTE
FRANCISCO JOSE MONTEALEGRE TORRES

ESTUDIANTES
JUAN DAVID LOZANO
Cód. 1110262977
CAROL MARITZA CHILITO
Cód. 1083921430
PABLO EMILIO MORENO
Cód. 75104599

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD


OCTUBRE
2021
INDICE

1. Índice. 2
2. Introducción 3
3. Objetivos 4
4. Cuerpo del trabajo 5
5. Conclusiones. 29
6. Bibliografía. 30
INTRODUCCIÓN

La estadística desde su origen y a lo largo de la historia ha mostrado un respetable prestigio


en las estrategias de hacer uso de la información recopilada con la finalidad de analizar la
información contenida en datos.
Es común sorprenderse de los resultados que predice la estadística, tan es así que en
ocasiones resulta difícil pensar en que una estadística no ha funcionado, aunque también es
importante considerar que siempre existe el error estadístico o el error humano cometido al
realizar una extracción.

En la actualidad el hombre ha hecho uso de la estadística en casos que van desde el


cálculo más sencillo hasta el más complejo. En la vida diaria se pueden observar ejemplos
del uso de la estadística; ya que el uso de ésta es tan amplio que se extiende desde un
simple cálculo hasta los métodos utilizados para el conocimiento científico y de la
sociedad.
OBJETIVOS
GENERAL:
Identificar datos estadísticos y Adquirir habilidades concretas para construir una tabla de
frecuencias.

ESPECIFICOS:
 Observar la ganancia en términos de facilidad de interpretación y de disposición de
la información original
 Relacionar la información contenida en la tabla con el tipo de variable que se está
tabulando
 Conocer distintas maneras de organizar y presentar información incluyendo el
cálculo de algunos indicadores estadísticos, la elaboración de tablas y gráfico
utilizando plantilla de cálculo Excel. y el programa RGui.
CONTENIDOS

1. Explicar en sus propias palabras:


a. Qué es una variable cuantitativa continua.
La variable cuantitativa continua Es aquella que puede asumir un número decimal de valores
cuando se define un objeto o persona. Ejemplo altura, edad.
b. Qué es una variable cuantitativa discreta.
Es aquella que puede asumir un número entero en cantidad para definir un objeto o persona.
Ejemplo: número de estudiantes, numero de grupos.
c. Qué es una variable cualitativa nominal. La variable nominal es la letra que se asocia
con un valor que no se puede ordenar. Ejemplo: grupo sanguíneo, religión.
d. Qué es una variable cualitativa categórica. La variable categórica es la letra que se
asocia con un valor que se puede ordenar. Ejemplo: la escolaridad, grado de satisfacción.
e. Cuál es la diferencia entre media poblacional y media muestral.
Que la media poblacional se saca del conjunto de datos que describe un evento, mientras la
media poblacional sale del subconjunto o una parte de la población a estudiar.
f. Qué es la varianza de una población. Es el resultado de la división de la sumatoria de
las distancias existentes entre cada dato y su media aritmética elevadas al cuadrado y el
número total de datos. Hay dos símbolos para identificar la varianza s2 para datos muestrales
y o2 para datos poblacionales.
¿Cómo se obtiene?

g. Qué es desviación estándar. Es una medida de dispersión usada en estadística que nos
dice cuanto tienden alejarse los valores puntuales del promedio en una distribución, de hecho
específicamente la desviación estándar es el promedio de la distancia de cada punto respecto
del promedio.
¿Cómo se obtiene?
De la raíz cuadrada de la varianza.

h. Qué es la Regla de Sturges


La regla de Sturges es un método empírico muy utilizado en la estadística descriptiva para
determinar el número de clases que deben existir en un histograma de frecuencias, para así
poder clasificar un conjunto de datos que representan una muestra o población.
¿para qué sirve?
Básicamente, con esta regla se determina el ancho de los contenedores gráficos, de los
histogramas de frecuencia.

i. Qué es frecuencia absoluta. Es la cantidad de datos establecidos en un problema.

j. Qué es frecuencia relativa. Es el promedio de cada uno de los datos de la frecuencia


absoluta, dividido en la cantidad de datos.
k. Qué es frecuencia relativa acumulada.
El la sumatoria del valor anterior con el valor siguiente de la frecuencia relativa, excepto el
primero valor que es el mismo valor de la frecuencia relativa, y la sumatoria de todos los
datos deben dar 1º en su defecto el 100%.
l. ¿Cuál es la diferencia entre una tabla de frecuencias absolutas
de una variable continua y de una discreta?
No hay ninguna diferencia ya que ambas se ordenan de menor a mayor y se utilizan para
luego saber la cantidad de datos que se encuentra en la frecuencia absoluta.
m. Qué es un Boxplot o diagrama de cajas. ¿Para qué sirve?
Es un método estandarizado para representar gráficamente una serie de datos numéricos a
través de sus cuartiles. De esta manera, se muestran a simple vista la mediana y los cuartiles
de los datos.

n. ¿En qué tipo de variables se usa el histograma?


Un histograma es una gráfica adecuada para representar variables continuas,
aunque también se puede usar para variables discretas. Es decir, mediante un
histograma se puede mostrar gráficamente la distribución de una variable
cuantitativa o numérica.
Los datos se deben agrupar en intervalos de igual tamaño, llamados clases.
o. ¿En qué tipo de variables se usa el gráfico de barras?
es un gráfico que se utiliza para representar datos de variables cualitativas o discretas. Está
formado por barras rectangulares cuya altura es proporcional a la frecuencia de cada uno de
los valores de la variable.

2. 2. En el municipio de Siachoque en el departamento de Boyacá, las


principales actividades agropecuarias son el cultivo de papa y la cría de
ganado criollo para la producción de leche; sin embargo, se ha
evidenciado que en las últimas décadas la población joven ya no opta
por trabajar en el campo, razón por la cual se realizó un muestreo de
30 campesinos que se dedican a la actividad agropecuaria dentro del
municipio y se les preguntó su edad:
63,4 69,6 74,7 54,9 74,5
79,4 61,8 36,5 79,3 77,8
64,6 68,3 35,9 49,3 60,5
59,1 71,8 45,8 71,9 75,4
68,6 56,3 49,6 72,8 62,3
50,4 55,9 65,4 71,2 79,2
La edad es una variable cuantitativa continua, ya que esta se puede
medir en años, meses y días, pero para analizarla se debe pasar a
números decimales; por ejemplo, una edad de 20 años y 6 meses
equivale a 20.5 años.
Hallar:
a. Media muestral.
b. Mediana muestral.
c. Varianza.
d. Desviación estándar.
e. Rango de datos.
Indicar el valor de los cuatro cuartiles.
g. Realice el gráfico de frecuencia absoluta utilizando la regla de
Sturges.
N° edad (X-XPROM)^2
1 35,9 763,9696
2 36,5 731,1616
3 45,8 314,7076 Q1
4 49,3 202,7776
5 49,6 194,3236
6 50,4 172,6596
7 54,9 74,6496
8 55,9 58,3696
9 56,3 52,4176
10 59,1 19,7136
11 60,5 9,2416 Q2
12 61,8 3,0276
13 62,3 1,5376
14 63,4 0,0196
15 64,6 1,1236
16 65,4 3,4596
17 68,3 22,6576
18 68,6 25,6036
19 69,6 36,7236
20 71,2 58,6756
21 71,8 68,2276 Q3
22 71,9 69,8896
23 72,8 85,7476
24 74,5 120,1216
25 74,7 124,5456
26 75,4 140,6596
27 77,8 203,3476
28 79,2 245,2356 Q4
29 79,3 248,3776
30 79,4 251,5396
1906,2 4304,512

MEDIANA 4304,512/ 1906,2 65,00


MEDIA O PROMEDIO 64,6/65,4 63,54
148,43144
VARIANZA DE UNA MUESTRA
8
12,183244
DESVIACION ESTANDAR DE UNA MUESTRA
6
RANGO 43,5
POSICIO VALOR DE
N EDAD
Q1( K*N)/4 7,5 55,4
Q2 ( K*N)/4 15 64,6
Q3( K*N)/4 22,5 72,8
Q4 ( K*N)/4 30 79,4

REGLA DE STURGEN APROX


K=1+3,332+LOG N 5,92 5

AMPLITUD R/K 8,7 9


NUEVO RANGO K*A 45 1,5

TABLA DE FRECUENCIAS
EDAD F. ABSOLUTA F.RELATIVA FAA FRA
34,9 43,9 2 0,066666667 2 0,06666667
43,9 52,9 4 0,133333333 6 0,2
52,9 61,9 6 0,2 12 0,4
61,9 70,9 7 0,233333333 19 0,63333333
70,9 79,9 11 0,366666667 30 1
30

EDAD DE LOS HABITANTES


12

10 11

6 7
6
4
4
2
2
0
34,9 - 43,9 43,9- 52,9 52,9- 61,9 61,9- 70,9 70,9 79,9
Entre los rangos de 34,9 a 43,9 hay 2 habitantes, entre 43,9 a 52,9 hay 4 habitantes, entre
52,9 a 61,9 hay 6 habitantes, entre 61,9 a 70,9 hay 7 habitantes y entre 70,9 a 79,9 hay 11
habitantes.

3. A los mismos campesinos se les indagó del número de personas que


convivían con ellos (variable cuantitativa discreta):

Hallar:
a. Media muestral.
b. Mediana muestral.
c. Moda.
d. Varianza.
e. Desviación estándar.
f. Rango de datos.
g. Indicar el valor de los cuatro cuartiles.
h. Realice el gráfico de frecuencia absoluta.
Presentar en el informe el cálculo realizado para la obtención de los
resultados.

(X-
DATOS
N XPROM)^2
1 3 10,24
2 3 10,24
3 3 10,24
4 4 4,84
5 4 4,84
6 4 4,84
7 4 4,84
8 5 1,44
9 5 1,44
10 5 1,44
11 5 1,44
12 6 0,04
13 6 0,04
14 6 0,04
15 6 0,04
16 6 0,04
17 7 0,64
18 7 0,64
19 7 0,64
20 7 0,64
21 7 0,64
22 7 0,64
23 8 3,24
24 8 3,24
25 8 3,24
26 9 7,84
27 9 7,84
28 9 7,84
29 9 7,84
30 9 7,84
186 100,96
MEDIANA
(3+9)/2 6
MEDIA O
PROMEDIO
186/30 6,2
VARIANZA DE
UNA MUESTRA 3,48137931
DESVIACION
ESTANDAR DE
UNA MUESTRA
RAIZ 1,86584547
CUADRADA
DE LA
VARIANZA
RANGO 6

POSICION PERSONAS
Q1( K*N)/4 7,5 5
Q2 ( K*N)/4 15 6
Q3( K*N)/4 22,5 8
Q4 ( K*N)/4 30 9

REGLA DE
STURGEN APROX
K=1+3,332+LOG
N 5,92 5

AMPLITUD R/K 0,69627586 1,2


NUEVO
RANGO K*A 6 2,51862069

TABLA DE FRECUENCIAS
PERSONAS A
F. ABSOLUTA F.RELATIVA FAA FRA
CARGO
2 4 7 0,23333333 7 0,23333333
4 6 9 0,3 16 0,53333333
6 8 9 0,3 25 0,83333333
8 10 5 0,16666667 30 1
10 12 0 0 30 1
30 1
PERSONAS A CARGO
10
9
9 9
8
7
7
6
5
5
4
3
2
1
0
2--4 4--6 6--8 8--10

De 2 a 4 personas tienen a cargo 7 familias, de 4 a 6 tienen a cargo 9 familias, de 6 a 8


personas están a cargo 9 familias y de 8 a 10 personas están a cargo 5 familias.

4. Por último, se les preguntó si contaban en sus viviendas con


alcantarillado, pozo séptico o ninguno de los anteriores:

Para poder analizar los datos e ingresarlos al software de análisis


estadístico, estos se codificaron de la siguiente manera:
1= alcantarillado
2= pozo séptico
3= ninguno.
Hallar:
a. Media muestral.
b. Mediana muestral.
c. Moda.
d. Varianza.
e. Desviación estándar.
f. Rango de datos.
g. Indicar el valor de los cuatro cuartiles.
h. Realice el gráfico de frecuencia absoluta.

N POZO (X-XPROM)^2
1 1 1,21
2 1 1,21
3 1 1,21
4 1 1,21
5 1 1,21
6 1 1,21
7 1 1,21
8 2 0,01

9 2 0,01

10 2 0,01
11 2 0,01
12 2 0,01
13 2 0,01
14 2 0,01
15 2 0,01
16 2 0,01
17 2 0,01
18 2 0,01
19 2 0,01
20 2 0,01
21 3 0,81
22 3 0,81
23 3 0,81
24 3 0,81
25 3 0,81
26 3 0,81
27 3 0,81
28 3 0,81
29 3 0,81
30 3 0,81
63 16,7

MEDIANA (2+2)/2 2
MEDIA O PROMEDIO 186/30 2,1
VARIANZA DE UNA
0,57586207
MUESTRA
DESVIACION ESTANDAR DE
UNA MUESTRA RAIZ
0,75885576
CUADRADA DE LA
VARIANZA
RANGO 2
POSICION VIVIENDA
2= POZO
Q1( K*N)/4 7,5
SEPTICO
2= POZO
Q2 ( K*N)/4 15
SEPTICO
Q3( K*N)/4 22,5 3= NINGUNO
Q4 ( K*N)/4 30 3= NINGUNO

1= alcantarillado
2= pozo séptico
3= ninguno

REGLA DE STURGEN APROX


K=1+3,332+LOG N 5,92 5

AMPLITUD R/K 0,4 1


NUEVO RANGO K*A 5 3
TABLA DE FRECUENCIAS
PERSONAS A
F. ABSOLUTA F.RELATIVA FAA FRA
CARGO
0 1 7 0,23333333 7 0,23333333
1 2 13 0,43333333 20 0,66666667
2 3 10 0,33333333 30 1
30 1
ALCANTARILLADO
30
30

25

20
13
15
10
10 7

5
0--1 1--2 2--3
0
1 2 3 4

VIVIENDA F. ABSOLUTA

Hay 7 familias que cuentan con alcantarillado, 13 familias que cuentan con pozo séptico y
10 familias que no cuentan con nada.

5. Ejecute el script de la Fase 2 en el Programa R (más adelante se explica


todo el proceso) y presente los gráficos obtenidos; para ello, cuando le
aparezca un gráfico debe dar click derecho sobre este y seleccionar
“copiar como metafile” para posteriormente pegarlo en el informe.
Los gráficos para presentar se deben dividir en tres secciones:
a. Gráficos de variable cuantitativa continua
i. Histograma de la variable continua Edad

Un histograma de frecuencia es un grafico similar al grafico de barras y es útil para graficar


frecuencias de datos cuantitativos. La altura de la barra representa la frecuencia de la clase
que se en encuentra en el eje.
En este histograma se ve representado las frecuencias absolutas continuas, es decir la edad
de los campesinos. Donde se observa que la frecuencia mayor la tienen entre las edades
comprendidas entre 70 a 80 años, mientras la menor entre las edades de 30 a 40 años.
ii. Boxplot o diagrama de cajas variable continua

El diagrama de caja es una grafica de distribución la cual es útil para identificar datos
atípicos de la distribución, además de determinar si existe algún sesgo.
En el diagrama de cajas se observa que los datos se encuentran agrupados a las edades más
altas, concentrándose entre los 55 y 73 años. Además, nos se observan datos atípicos en la
distribución.
b. Gráficos de variable cuantitativa discreta
i. Boxplot o diagrama de cajas variable discreta

El diagrama de caja de la variable cuantitativa discreta, que habla del numero de personas
que conviven con los campesinos, nos arroja que los datos se encuentran sesgados al centro
de los mismos, encontrándose mayores datos por encima de la mediana. Por otro lado, no se
observan datos atípicos en la distribución.
ii. Diagrama de barras Frecuencia Absoluta

El diagrama de barras se caracteriza por indicar una cantidad especifica con la altura de la
barra. En este caso, el diagrama de barras nos muestra la frecuencia absoluta de la variable
cuantitativa discreta: personas que conviven con los campesinos. Podemos observar que los
datos se encuentran distribuidos a lo largo de todo el rango, siendo la mayor frecuencia 7
personas y la menor la comparten entre 3 y 8 personas.
iii. Diagrama de barras Frecuencia relativa

las frecuencias relativas acumuladas se hallan sumando la frecuencia relativa anterior con la
siguiente, por lo que siempre es un grafico creciente. En este caso se observa que los datos

presentan un crecimiento porcentual constante, lo que indica que los datos se encuentran
distribuidos por todo el rango de forma homogénea. Claramente la frecuencia relativa
acumulada menor, es la de 3 personas y la frecuencia relativa mayor es la de 9 personas.
iv. Diagrama de barras Frecuencias relativas acumuladas

las frecuencias relativas acumuladas se hallan sumando las frecuencias relativas con las
anteriores, por lo que siempre es un grafico creciente. En este caso se observa que los datos
presentan un crecimiento porcentual constante, lo que indica que los datos se encuentran
distribuidos por todo el rango de forma homogénea.
v. Gráfico de tarta de Hermanos

La grafica de torta indica como se distribuyen los datos dentro del total de los datos. En este
caso, se observa que los datos tienen una distribución similar, aunque se observa que las 7
personas, representadas en color azul, tienen un área mayor dentro del gráfico. Y la menor
área del gráfico es ocupada por los valores de 3 y 8 personas, cuyas áreas es igual y están
representadas de color rojo y rosado.
c. Gráficos de variable cualitativa
i. Diagrama de barras frecuencias absolutas aguas residuales

En el diagrama de barras anterior se representa la frecuencia absoluta de la disposición de


aguas residuales de los campesinos, siendo la mayor frecuencia del pozo séptico, es decir,
13 campesinos cuentan con pozo séptico en su casa, seguido por los campesinos que no
cuentan con ningún sistema de disposición de aguas residuales con una frecuencia absoluta
de 10. Por último, la frecuencia absoluta menor es la de las personas que cuentan con
alcantarillado con una frecuencia de 7.

ii. Diagrama de barras frecuencias relativas aguas residuales


En el diagrama de barra anterior, se muestran las frecuencias relativas de la disposición de
aguas residuales de los campesinos, donde los que tienen pozo séptico representan un 40$
de los datos de la muestra y una cifra alarmante es la de los campesinos que no cuentan con
ningún método de disposición de aguas residuales con un 30% y por ultimo el menor
porcentaje lo ocupa los campesinos que cuentan con alcantarillado.

6. Responda las siguientes preguntas de reflexión:


a. Basado en la edad promedio de los campesinos encuestados y los
resultados presentados en el histograma de la variable continua,
¿qué opinión le merece estos resultados?
Se puede observar de acuerdo al histograma que la población joven no se encuentra
interesadas en los temas del agro de la región y que la edad de las personas que viven del
agro se encuentra en personas de edades avanzadas, es decir de 63,5 años en adelante.

b. ¿Cuáles factores considera usted que inciden para que los jóvenes
ya no quieran dedicarse a las labores del campo? ¿en la zona
donde usted habita sucede lo mismo?
Los jóvenes han disminuido el interés a las labores de campo debido a la existencia de la
tecnología y oportunidades que estas llevan a tener una vida mas sofisticada, llenas de lujos
y en ámbitos laborales en la ciudad.
Si, en el Tolima vemos como los jóvenes se interesan más por la tecnología y nuevos
aprendizajes olvidando todo lo relacionado al campo y a nuestros antepasados.
c. Una vez evidenciados los resultados de la variable discreta y la
cualitativa, ¿cómo considera que son las condiciones de vida de
las personas que habitan en la zona rural? ¿cómo son las
condiciones de vida de los campesinos en la región donde usted
habita?
Según los resultados de las variables se observa que los campesinos tienen familias
numerosas, teniendo en promedio personas que viven con ellos de 6, por otro lado los
resultados de la variable cualitativa indican que mas del 43% de los campesinos su sistema
de aguas se trabajo con pozos sépticos, el 33% no cuentan con ningún tipo de sistema y el
23% con alcantarillado.

Las condiciones de vida de los campesinos siguen siendo de probable, pues en pleno siglo
XXI, aún falta mucha tecnología y compromiso por parte de nuestros gobernantes para
apoyar al campesino.

d. ¿Qué elementos considera usted que debería tener un adecuado


desarrollo rural en la región que usted habita?
Debe de existir las condiciones mínimas para vivir dignamente con las implementaciones
de todos los servicios públicos. Además, es necesario que los gobiernos inviertan en
educación para el campesino y en el desarrollo de proyectos productivos que les ayude a
dar a conocer sus productos y así mismo venderlos a un precio justo.
CONCLUSIONES

La Estadística es una ciencia matemática que se utiliza para describir, analizar e


interpretar ciertas características de un conjunto de individuos llamado población. Cuando
nos referimos a muestra y población hablamos de conceptos relativos pero estrechamente
ligados. Una población es un todo y una muestra es una fracción o segmento de ese todo.

Podemos dividir la estadística en dos ramas; la estadística descriptiva, que se dedica a los
métodos de recolección, descripción, visualización y resumen de datos originados a partir
de los fenómenos en estudio; y la estadística inferencial, que se dedica a la generación de
los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión.

La estadística trata en primer lugar, de acumular la masa de datos numéricos


provenientes de la observación de multitud de fenómenos, procesándolos de forma
razonable. Mediante la teoría de la probabilidad analiza y explora la estructura matemática
subyacente al fenómeno del que estos datos provienen y, trata de sacar conclusiones y
predicciones que ayuden al mejor aprovechamiento del fenómeno.
Ahora bien, respecto al ejercicio anterior podemos decir que los campesinos del municipio
de Siaochoque son personas de edades avanzadas, en promedio de 63 años en adelante, lo
que evidencia que los jóvenes se encuentran alejados de las actividades agropecuarias de la
zona.
Los campesinos conviven en promedio con 6 personas dentro de su núcleo familiar,
adicional en una cifra alarmante del 30% no cuentan con ningún sistema de aguas
residuales, convirtiéndose en un problema de salud pública que puede llevar a muchas
enfermedades de tipo intestinal.
REFERENCIAS BIBLIOGRÁFICAS

1. CANAVOS, G. (1988) Probabilidad y Estadística. Aplicaciones y Métodos. México:


McGraw-Hill.
2. DURA PEIRó, J. M. y LóPEZ CUñAT, J.M. (1992) Fundamentos de Estadística.
Estadística Descriptiva y Modelos Probabilísticos para la Inferencia. Madrid: Ariel
Editorial.
3. ESCUDER, R. y SANTIAGO, J. (1995) Estadística aplicada. Economía y Ciencias
Sociales. Valencia: Tirant lo Blanch.
4. FERNáNDEZ CUESTA, C., y FUENTES GARCíA, F. (1995) Curso de Estadística
Descriptiva. Teoría y Práctica. Madrid: Ariel.
5. FREEDMAN, D., et al. (1991) Estadística. Barcelona: A.Bosch Ed.
6. GUJARATI, D. (1997) Econometría Básica. Bogotá: McGraw-Hill.

También podría gustarte