Está en la página 1de 9

UNIVERSIDAD DE BUENOS AIRES

FACULTAD DE FILOSOFÍA Y LETRAS

HISTORIA SOCIAL GENERAL “C”

Primer Parcial Métodos Cuantitativos


en Antropología

Estudiante: Guadalupe Ferrari

DNI:43179528

Profesor: Marcelo Cardillo

Comisión número 3
1) A partir de la información de la matriz de datos, especifique tipo de variable y
nivel de medición de cada una de ellas. Mencione dos variables más que podrían
ser de interés para el estudio y justifique. Detalle cómo podría operacionalizar las
dos nuevas variables propuestas.
- la propiedad de la tierra es una variable cualitativa cuyo nivel de medición es
nominal
- la participación en los Programas Estatales de Desarrollo Rural es una variable
cualitativa cuyo nivel de medición es nominal
- la cantidad de miembros que componen la familia es una variable cuantitativa
cuyo nivel de medición es de razón
- la productividad agrícola por hectárea es una variable cuantitativa cuyo nivel
de medición es intervalar de razón
- la contratación de trabajadores temporarios es una variable cualitativa cuyo
nivel de medición es ordinal
Podría evaluarse la adquisición de nuevas tecnologías y el aumento de los ingresos de
los productores del agro. En este primer caso, la variable “adquisición de nuevas
tecnologías” podría ser una variable cualitativa cuyo nivel de medición es nominal
indicando con un numeral 0=“si” 1= “no”.
A su vez, la variable “ ingresos” podría ser una variable cuantitativa de razón
indicando con números cuáles son los ingresos por familia, para poder evaluar si
aumenta o disminuye según la participación en el Programa de Desarrollo Estatal.
2) Con los datos presentados, realice una distribución de frecuencias absolutas y
relativas de la productividad por hectárea de aquellos productores que
participan en Programas Estatales de Desarrollo Rural. Realice el mismo tipo de
distribución para aquellos que no participan en dichos programas.

Productividad por Frecuencia Absoluta Frecuencia relativa o de


hectárea en kilogramos proporción
(son parte del programa)

menos de 1900 0 0

1901-2250 1 10

2251-2600 6 60

2601-2950 2 20

2951-3300 1 10

Total 10 100
Productividad por Frecuencia Absoluta Frecuencia relativa o de
hectárea en kilogramos proporción
(no son parte del
programa)

menos de 1900 2 20

1901-2250 6 60

2251-2600 2 20

2601-2950 0 0

2951-3300 0 0

Total 10 100

3) Represente de manera gráfica la información generada en el punto 2.


Describa ambos gráficos. En función de ellos, ¿qué podría decir sobre las
medidas de tendencia central y de dispersión de esta variable? (desarrolle esta
pregunta en no más de 600 palabras).

Gráfico A

Gráfico B
En el gráfico A, se puede observar una asimetría hacia la derecha con un solo pico. Se
puede decir que no existen casos atípicos en la muestra sino que la dispersión se
encuentra bastante cerca del centro de la distribución. En este sentido, se puede
vislumbrar que existen datos que aparecen con frecuencia allí donde se ubica el pico
de la muestra, esto sería en términos de las medidas de tendencia central, lo que se
llama la “moda o modo”. Así, este estaría representado en el gráfico como el intervalo
de “2251-2600”. A su vez, el centro de distribución se ubica aproximadamente en el
mismo intervalo que muestra la mayor cantidad de valores, “2251-2600”.
Se puede observar que no hay una gran variabilidad de datos por lo que las medidas de
tendencia central; como la media y la mediana podrían ser semejantes entre sí.
Por otro lado, con lo que respecta a las medidas de dispersión, como mencionado
previamente no existe una gran dispersión sino que los datos se mantienen bastante
cerca del 50% de la muestra, que a su vez indica cuál es el modo, aquel dato que se
repite más veces. Por último, el intervalo “2251-2600” revela el máximo de
productores que llegan a una productividad entre esos valores. En conclusión, no se
trata de un gráfico con una variabilidad notoria.

En el gráfico B, es posible dar cuenta de otras características. En principio se puede


ver un gráfico aproximadamente simétrico. Con valores que indican su pico en el
intervalo que va “1901-2250”, valores con mayor frecuencia. En este sentido es
posible describir el centro de la distribución al igual que en el gráfico A, justo en el
mismo intervalo donde se encuentra la moda.
Por otro lado, con respecto a las medidas de dispersión, ocurre algo similar que en el
gráfico A, ya que no existe una gran variabilidad en los datos y la mayoría se
encuentran cerca del centro de la distribución. De manera que podemos deducir que
los valores que arrojen el cálculo de la media y la mediana pueden ser semejantes
entre sí. Esto se puede explicar ya que no existen valores atípicos que afecten el
resultado de la media. Sin embargo, a diferencia del gráfico A se puede ver que los
valores se agrupan hacia la izquierda demostrando así que aquellxs productorxs que
no son parte del programa mantienen niveles de productividad menores que los que sí
son parte del programa.
Todos los valores presentados en ambos gráficos se mantienen entre estos intervalos y
no se alejan mucho entre sí.

4) Realice una descripción numérica (medidas de tendencia central y dispersión)


del tamaño de la familia de aquellos productores que participan en Programas de
Desarrollo. Realice el mismo tipo de descripción para aquellos que no participan
en dichos programas. Detalle el procedimiento por el cual se llega a dichos
valores numéricos (fórmulas y cálculos).

Participan en Programas de desarrollo (C1)


Para calcular la media de estos datos es necesario realizar la suma de todos ellos y
dividirlos por la cantidad de muestras. De manera que, el resultado de la suma
(3+4+4+5+5+5+7+8+8+10)/10=5.9 → valor de la media. Este es el punto de
equilibrio, me marca el centro de gravedad en la distribución. Tiene importancia el
peso de cada uno de esos valores.
Al tiempo que para calcular la mediana de estos datos, es necesario ordenarlas de
menor a mayor y localizar cual es la mitad de la muestra. En este caso al ser la
cantidad de muestras un número par (10) debo calcular el punto medio entre dos
valores, en este caso como son dos números iguales (5), es 5,5 debo hacer el promedio
de los numeros que estan a la izquierda y derecha de la posición de la mediana que es
5,5 → (5+5)/2= 5 → Esta es la posición de la mediana.
Estos son los datos ordenados de mayor a menor: 3-4-4-5-5-5-7-8-8-10
Podemos ver que la relación entre la media y la mediana es de cierta semejanza,
esto se debe a que no hay una gran dispersión de los datos, todos se mantienen en
cierto rango y no existen casos atípicos que afecten el valor de la media con respecto
al centro de la distribución.
Así, el modo, es decir aquel valor que se repite más es el valor de 5
Para calcular la dispersión de la muestra la diferencia entre el valor mínimo y el valor
máximo es de 7.
A su vez se utiliza el rango intercuartil, que es la diferencia entre el tercer cuartil y el
primer cuartil.
En este caso sería:
valor mínimo: 3
(Q1) Va a ser la mediana de los valores que están a la izquierda (3-4-4-5-5) = 4
(Q2) la mediana de la muestra = 5,5
(Q3)la mediana de los valores que están a la izquierda (5-7-8-8-10) = 8
Valor máximo: 10
El rango intercuartil es= (Q3- Q1) → (8-4) = 4

Por otro lado, para calcular la variación de la muestra podría ser a partir del cálculo de
la varianza. Esta se obtiene con el objetivo de evaluar cómo varía la muestra en
relación a su punto medio; primero viendo en qué medida cada una de las puntas se
diferencia del valor promedio (media)
(3-5.9)= -2,9
(4-5,9)= -1,9 (5-5,9)= -0,9 (7-5,9)=1,1 (8-5,9)=2,1 (10-5,9)= 4,1
Como buscamos un promedio el segundo paso es sumar todos esos resultados
(-2,9) + 2.(-1,9) + 3.(-0,9) + 1,1 + 2.(2,1) + 4,1 = 0
Pero da 0 porque tenemos valores que se diferencian de la media hacia arriba y otros
hacia abajo, por lo que se cancela. voy a tener valores positivos y negativos por lo que
da siempre 0
Para hacer el promedio a cada una de las diferencias se las eleva al cuadrado y esas
son las que se suman.

El cálculo de la varianza se realiza con la siguiente fórmula


2 2
𝑠 =∑(𝑥𝑖 − 𝑥) / (n-1)
2
(𝑥 1
− 𝑥) =
2
(-2,9) = 8,41
2
(-1,9) = 3,61
2
(-1,9) = 3,61
2
(-0,9) = 0,81
2
(-0,9) = 0,81
2
(-0,9) = 0,81
2
(1,1) = 1,21
2
(2,1) = 4,41
2
(2,1) = 4,41
2
(4,1) = 16,81
Representa las diferencias individuales de cada una de las observaciones respecto a un
punto central (media) .
2 2 2 2 2 2 2
𝑠 = [(− 2, 9) + (− 1, 9) + (− 1, 9) + (− 0, 9) + (− 0, 9) + (− 0, 9) + 1, 1 + (2, 1
/(10-1)= 4,99→ Varianza
Por lo que para hacer el cálculo de la desviación estándar en la escala original de la
variable debo hacer la raíz cuadrada de ese valor que sería aproximadamente de 2,23
marcando así el promedio de alejamiento de todos los valores de la media.

NO Participan en Programas de desarrollo (C2)


mediana: calculo el centro de la muestra, es medida de localización que parte a la
mitad una distribución de valores cuantitativos.
Ordenando los valores de mayor a menor es:
4-5-5-5-6-6-7-7-7-8
La mediana como en el caso anterior al ser la cantidad de muestras un número par (10)
debo calcular el punto medio entre dos valores, en este caso como son dos números
iguales (6) debo hacer el cálculo de la siguiente manera: (n+1)/2. Es decir (12+1)/2=
6,5 → Esta es la posición de la mediana.
Por otro lado la media, resulta del siguiente cálculo (4+5+5+5+6+6+7+7+7+8)/10= 6
Los datos de la moda, aquellos más frecuentes son 5 y 7 por lo que es una muestra
bimodal.
Para calcular la dispersión de la muestra se puede hacer mediante el cálculo de la
diferencia entre el valor mínimo y máximo. De modo que la dispersión en el
recorrido de este caso sería de 4.
A su vez se utiliza el rango intercuartil, que es la diferencia entre el tercer cuartil y el
primer cuartil. Con estos valores: 4-5-5-5-6-6-7-7-7-8 y el cálculo de la mediana que
es 6,5 que será el segundo cuartil (Q2)
Luego El primer cuartil (Q1) Va a ser la mediana de los valores que están a la
izquierda (4-5-5-5-6)
El tercer cuartil (Q3) va a ser la mediana de los 5 valores que están a la derecha de la
mediana→ (6-7-7-7-8)
De modo que los 5 valores resumen van a ser
Valor mínimo: 4
(Q1): 5
(Q2): 6,5
(Q3): 7
Valor máximo: 8
El rango intercuartil es la distancia que existe entre el tercer cuartil y el primero
(Q3-Q1), por lo que en esta caso será 2

Para el cálculo de la desviación típica


primero es necesario calcular la varianza:
2
(4-6) = 4
2
(5-6) = 1
2
(5-6) = 1
2
(5-6) = 1
2
(6-6) = 0
2
(6-6) = 0
2
(7-6) = 1
2
(7-6) = 1
2
(7-6) = 1
2
(8-6) = 4
14/10-1= 1,5→ varianza
1, 5= 1,25→ desviación típica

5) Con la información generada en los puntos 2, 3 y 4, ¿cómo puede caracterizar


a ambos tipos de productores? Desarrolle, en no más de 600 palabras,
especificando e interpretando la información generada.
En primer lugar, una de las características más notorias acerca de los productores,
sobre todo partiendo de los fines del estudio que son evaluar las consecuencias de la
participación en el programa estatal de desarrollo, tiene que ver con la variable
“productividad por hectárea en km”. Mediante estos datos es posible dilucidar que los
productores que poseen el Programa Estatal de Desarrollo Rural tienen niveles de
productividad por hectárea (km) mayores que aquellos que no lo poseen. De manera
que, las consecuencias que puede tener la posesión o no de este programa según los
datos proporcionados es que aumente la productividad por hectárea en aquellas
familias. Por otro lado, es importante resaltar el hecho de que se han evaluado
muestras de la misma magnitud para ambos, es decir, hay 10 unidades de análisis que
no poseen el Programa Estatal de Desarrollo Rural y 10 que sí lo poseen. En este
sentido, es interesante ver el modo en que las variables analizadas nos indican dos
características clave para comprender las consecuencias que genera en el agro la
participación en Programas Estatales de Desarrollo Rural o no. A partir de los gráficos
y las medidas de tendencia central vemos cual es el modo (Al dividirlo en intervalos
en un caso es el intervalo de 2251-2600; mientras en el C2 es el intervalo 1901-2250)
aquel valor más frecuente, haciendo claro que grupo tiene más productividad.
Por otro lado, las muestras sobre el tamaño de las familias nos revelan cierta
concordancia ya que en C1 tenemos un promedio de 5,9 (la media) y en C2 es de 6, es
decir el tamaño promedio de las familias de la muestra, es semejante. Sin embargo, a
partir de los datos acerca de la distribución y dispersión podemos ver que existen
diferencias en lo que respecta a cuánto varía ese tamaño. A partir de datos como el
rango intercuartil podemos ver cuánto varían los datos con respecto al 50% de la
muestra, tomando únicamente a los valores extremos (min y max)
Al tiempo que la desviación típica nos muestra cuánto varían los datos tomando en
cuenta la media, es decir el centro de gravedad en la distribución. Representa el
promedio de alejamiento de todos los valores de la media.
En ese sentido, a partir de los datos proporcionados podemos dar cuenta que existe
una mayor variabilidad en los datos expuestos sobre el tamaño de estas familias en el
C1 que en el C2. De este modo, se puede deducir que esta variabilidad de la muestra
podría indicar que (cuyos datos pueden estar sesgados, más allá de que sea mediante
una selección aleatoria) existe una gama más amplia de familias que poseen este
programa, desde aquellas que tienen 3 integrantes a 10, mientras que existe una
menor variedad de familias que no lo poseen, y se mantienen en datos similares.

También podría gustarte