Está en la página 1de 17

UNIVERSIDAD DE BUENOS AIRES

Facultad de Ciencias Sociales- Carrera de Sociología

Metodología de la Investigación I
Cátedra Gómez Rojas
ESTADISTICA E
INVESTIGACION SOCIAL.
MEDIDAS DE LAS
DISTRIBUCIONES
1er. Cuatrimestre 2023
ANALISIS CUANTITATIVO DE DATOS
•Noción de estadística
Estadística es un conjunto de métodos
para producir y analizar datos

Estadística Descriptiva Estadística inferencial


Sintetiza e interpreta la Aporta estimaciones de
información de un conjunto de una población basándose
datos en una muestra
Sus métodos refieren a:
Diseño: es la planificación sobre cómo producir datos
Descripción: es acerca de cómo resumir una masa de datos
Inferencia: establece cómo predecir valores poblacionales
a partir de datos de una muestra 2
ANALISIS CUANTITATIVO DE DATOS
•Matriz de datos y proceso de investigación
Variables
V1 V2 V3 ... Vn
Unidades U1 C11 C12 C13 C1n
de U2 C21 C22 C23 C2n
Análisis
U3 C31 C32 C33 C3n
...
Um Cm1 Cm2 Cm3 Cmn

Matriz de datos:
U: Unidades de Análisis
V: Variables
C: Categorías de Respuesta

3
MEDIDAS DE LAS DISTRIBUCIONES
•Medidas de estadística descriptiva

Para describir un conjunto de datos apelamos a


medidas resumen que pueden ser de dos tipos:

• Tendencia central: intentan reflejar una valor típico


para describir un conjunto de casos

• Variabilidad: dan cuenta de la dispersión de los


valores en referencia a aquel valor típico

4
MEDIDAS DE LAS DISTRIBUCIONES
•Medidas de tendencia central
Para reflejar el valor típico contamos con tres
medidas de tendencia central:

• Moda: es el valor que ocurre más frecuentemente

• Mediana: es el valor que corresponde al caso


mediano de una serie de observaciones ordenadas, de modo
que tiene la misma cantidad de observaciones superiores e
inferiores a aquel caso

• Media: es el punto de equilibrio de una serie de


observaciones numéricas

5
MEDIDAS DE LAS DISTRIBUCIONES
•Moda
• La moda es un valor de la variable, expresada en sus mismas
unidades de medida
• No debe confundirse el valor de la moda con la frecuencia
que le corresponde
Propiedades de la Moda:
• Bajo requerimiento: es apropiada para variables de cualquier
nivel de medición, la única que puede aplicarse a variables nominales

• Indefinición en distribuciones multimodales: dado una


distribución puede ser bimodal o tener más de dos modas, podemos
encontrarnos con más de un valor típico

• Coincidencia en distribuciones simétricas unimodales: cuando


una distribución es simétrica y unimodal, el valor de la moda coincide con
el de la media y la mediana

6
MEDIDAS DE LAS DISTRIBUCIONES
•Moda: ejemplo simple
Ejemplo:
• Si tengo cinco notas:
5, 6, 7, 8, 9 la moda será el valor más frecuente, pero como todos los
casos aparecen una vez tengo cinco modas y no hice resumen alguno, es
decir que la moda es 5, 6, 7, 8 y 9 puntos

• Si sumo una sexta nota más alta, que no repite alguna de las que
tenía, esto dejará las cosas igual: con 5, 6, 7, 8, 9, 10 la moda será el valor
más frecuente, pero como todos los casos aparecen una vez tengo seis
modas y no hice resumen alguno, es decir que la moda es 5, 6, 7, 8 ,9 y
10 puntos
• Pero si la sexta nota repite alguna de las que teníamos, esa
pasará a ser la moda: 5, 6, 7, 8, 8, 9, como ahora tengo dos veces el valor
8 este será el valor modal de la distribución, es decir moda es 8 puntos

7
MEDIDAS DE LAS DISTRIBUCIONES
•Mediana
𝑛+1
Si n es impar, valor mediano corresponde al caso mediano 𝐶𝑎𝑠𝑜 𝑚𝑒𝑑𝑖𝑎𝑛𝑜 =
2
Es decir que si son siete casos, sería el valor del cuarto caso

Si n es par, caso mediano es el promedio entre dos valores (superior e inferior) que
rodearían al caso mediano (que no es entero)
O sea que si son seis casos, sería el promedio entre el valor del tercero y del cuarto caso

Propiedades de la Mediana:
• No requiere puntuaciones numéricas: ya que no mide distancia,
sino que asume un orden, puede aplicarse a variables ordinales
• Semejanza a media: cuando se trata de distribuciones
simétricas, en cambio tiene un valor mayor cuando la distribución tiene
asimetría positiva o menor si la asimetría es negativa (se puede
cuantificar el sesgo haciendo Mediana – Media)
• Mayor estabilidad: no tiene tanta sensibilidad a casos extremos
ya que no considera las distancias relativas, resulta más apropiada que la
media cuando hay distribución con algún outlier
8
MEDIDAS DE LAS DISTRIBUCIONES
•Mediana: ejemplo simple
Ejemplo:
• Si tengo cinco notas:
5, 6, 7, 8, 9 la mediana será el valor del caso n+1/2 y dado que n=5, nos
referimos al caso tercero (5+1 /2) que en este ejemplo es el valor 7
(5_6_7_8_9), la mediana de 7 puntos

• Si sumo una sexta nota más alta, esto afectará el valor de la


medina: 5, 6, 7, 8, 9, 10, ya que ahora buscaremos el caso intermedio
entre tercero y cuarto (n=6, 6+1 /2= 3,5) y entonces el valor será el
promedio entre 7 y 8 (5_6_7_8_9_10), y el valor mediano será= 7,5
puntos
• Pero si la sexta nota no es tan alta, esto no afectará al valor de la
mediana: 5, 6, 7, 8, 8, 9, nuevamente buscaremos el caso intermedio
entre tercero y cuarto (n=6, 6+1 /2= 3,5) y entonces el valor será el
promedio entre 7 y 8 (5_6_7_8_8_9), y el valor mediano será= 7,5 puntos

9
MEDIDAS DE LAS DISTRIBUCIONES
•Media aritmética
𝑛
𝑥𝑖
𝑥=
𝑛
𝑖=1

Propiedades de la Media aritmética:


• Punto de equilibrio: la suma algebraica de las diferencias entre
las puntuaciones y el valor central es igual a cero; la suma de las
diferencias cuadráticas entre las puntuaciones y el valor central es la
menor posible con respecto a cualquier otro valor observado

• Sensibilidad a casos extremos: dado que cada caso se pondera


por su distancia relativa, si hay algún caso extremo en un sentido (un
outlier) este valor sesga el valor de la media

10
MEDIDAS DE LAS DISTRIBUCIONES
•Media aritmética: ejemplo simple
5
𝑥𝑖
𝑥=
𝑛
𝑖=1

Ejemplo:
• Si tengo cinco notas:
5, 6, 7, 8, 9 el promedio será la suma de esas calificaciones (5+6+7+8+9=
35) y dado que n=5, la media será 35/5= 7 puntos

• Si sumo una sexta nota más alta, esto afectará el valor de la


media: 5, 6, 7, 8, 9, 10, cambiará la suma 35+10= 45 y el valor de n=6,
ahora la media será 45/6= 7,5 puntos

• Pero si la sexta nota no es tan alta, esto afectará menos el valor


de la media: 5, 6, 7, 8, 9, 8, cambiará la suma 35+8= 43 y con el valor de
n=6, ahora la media será 43/6= 7,17 puntos

11
MEDIDAS DE LAS DISTRIBUCIONES
•Medidas de posición
Para reflejar el orden relativo de valores en una
distribución contamos con las medidas de posición:
• Percentil: es el valor en una distribución ordenada que
corresponde al caso por debajo del cual queda un porcentaje determinado
de casos (por ej, P.95 representa el valor del caso que tiene un 95% de
casos inferiores). Sólo puede aplicarse en distribuciones ordenadas, no es
válido para variables nominales
• Cuartil: es la medida de posición que corresponde cuando se
divide una distribución ordenada de casos en cuatro partes equivalentes
(Q1, Q2, Q3 y Q4) El Q4 coincide con el máximo.
En forma análoga, se definen Quintiles (distribución ordenada dividida en
cinco) y Deciles (dividida en diez partes)
• Mediana: es también una medida de posición ya que al distribuir
en dos mitades de casos, corresponde al percentil P.50 y coincide con el
segundo cuartil

12
MEDIDAS DE LAS DISTRIBUCIONES
•Medidas de dispersión
Para reflejar la variabilidad de una distribución
tenemos diferentes medidas:
• Rango ó Recorrido: es la diferencia entre el valor mínimo
y el máximo
• Varianza: es el promedio de las diferencias cuadráticas
entre cada puntuación y la media aritmética s2 s2= 𝑛 (𝑥𝑖−𝑥) 2

𝑖=1 𝑛

• Desvío típico: es la raíz cuadrada del promedio de las


diferencias cuadráticas o sea la raíz cuadrada de la varianza s
𝑛
(𝑥𝑖 −𝑥)2
s=
𝑖=1 𝑛

• Coeficiente de Variabilidad: es la medida de la variación


relativa estableciendo la relación numérica entre el desvío típico
𝑠
y la media CV CV = 𝑥 * 100
13
MEDIDAS DE LAS DISTRIBUCIONES
•Rango
• Rango ó Recorrido: es la diferencia entre el valor
mínimo y el máximo

RANGO = 𝑀á𝑥𝑖𝑚𝑜 − 𝑀í𝑛𝑖𝑚𝑜

Características del Rango:


• Es intuitivo: dar cuenta de la dispersión tomando la distancia
entre las dos puntuaciones extremas es una noción fácil de transmitir
• Sensibilidad a casos alejados: si la distribución es asimétrica y
tiene un caso aislado en un sentido, puede sugerir una dispersión
sobredimensionada
• Se puede ajustar: si se aplica la diferencia entre el Q1 y Q3
(rango intercuartílico) ya que es más sensible a la concentración de los
casos

14
MEDIDAS DE LAS DISTRIBUCIONES
•Varianza
• Varianza: es el promedio de las diferencias
cuadráticas entre cada puntuación y la media aritmética s2

𝑛
(𝑥𝑖 −𝑥)2
s2=
𝑖=1 𝑛

Características de la Varianza:
• No se cancela: dado que las diferencias se elevan al cuadrado,
todas las diferencias resultan positivas y por ello, la suma algebraica da
un número superior a cero (siempre que sea una variable)
• Sensibilidad a casos alejados: para compensar la centralidad que
provoca la media, pondera con mayor intensidad a los casos a medida
que se alejan de la medida de tendencia central
• Noción poco intuitiva: dado que se expresa en unidades de
medida de la variable al cuadrado (por ejemplo en años cuadrados si la
variable fuera edad, o en pesos cuadrados si la variable fuese ingresos)
15
MEDIDAS DE LAS DISTRIBUCIONES
•Desvío típico
• Desvío típico: es la raíz cuadrada del promedio de las
diferencias cuadráticas o sea la raíz cuadrada de la varianza s
𝑛
(𝑥𝑖 −𝑥)2
s=
𝑖=1 𝑛

Características del Desvío Típico:


• Está asociado con la varianza: es la raíz cuadrada de la varianza y
por ello, su valor está directamente relacionado
• Expresión más natural: al expresarse en unidades de medida de
la variable (por ejemplo en años si la variable fuera edad, o en pesos si la
variable fuese ingresos) es más fácil de comunicar
• Aplicación en estadística inferencial: tiene una aplicación muy
importante en el terreno del muestreo ya que es la medida de dispersión
que sirve para estandarizar la distribución normal y calcular el puntaje z

16
MEDIDAS DE LAS DISTRIBUCIONES
•Coeficiente de variabilidad
• Coeficiente de Variabilidad: es la medida de la
variación relativa estableciendo la relación numérica entre el
desvío típico y la media, en ocasiones expresado por cien
𝑠
CV = * 100
𝑥
Características del Coeficiente de Variabilidad:
• Es una medida relativa: sirve para comparar distintas poblaciones
(más allá del tamaño) y aún diferentes variables (con diferentes unidades de
medida), no se expresa en unidades de medida de la variable (como pesos o
dólares, como años o meses)
• No es un porcentaje: si bien es una relación con base cien, no es un
porcentaje ya que no es la relación entre una parte y el todo, en efecto el
valor del CV podría ser superior a 100 si la población observada fuese muy
heterogénea
• Aplicación en estadística inferencial: sirve para dar una idea de
precisión de los resultados independientemente de la unidad de medida de la
variable
17

También podría gustarte