Está en la página 1de 23

Disclaimer: Esta síntesis de información no reemplaza el material propuesto en el apunte de

catedra. Fue realizado como una forma de puntualizar las nociones principales a fin de acompañar
las lecturas y los recorridos de las clases prácticas y teóricas. El siguiente material fue elaborado
por las ayudantes de cátedra de EySIE, Daniela Moreno y Mariana Pino en el marco de las tutorías
de “acompañamiento a la cursada” del año 2022, a partir de conceptos del “Material didáctico de
estadística y sistemas de información educativa en ciencias de la educación”.

ESTADISTICAS Y SISTEMAS DE LA INFORMACION EDUCATIVA

Existen dos grandes ramas en la Estadística:

- La Estadística Descriptiva: se enfoca en la recopilación, organización, resumen y


presentación de datos. Su objetivo es describir las características de un conjunto de datos.
- Estadística Inferencial: Se ocupa de hacer inferencias o deducciones sobre una población
a partir de una muestra de la misma.

Capítulo 1: Variable, unidad de análisis y sistemas de


medición

¿Qué es un dato?

Los datos son una observación, es lo que deseamos conocer de algún fenómeno. A partir de ellos,
se pueden realizar análisis y cálculos que proporcionen información útil sobre el comportamiento
de las variables estudiadas. Pueden ser:

- Cualitativos: representan características o cualidades que no se pueden medir


numéricamente

- Cuantitativos: Son datos que se expresan en términos numéricos y se pueden medir.


Estos pueden ser discretos o continuos.

¿Qué es una unidad de análisis?

Es el elemento donde efectuamos la medición y por lo tanto nos provee el dato. La elección de la
unidad de análisis depende del objetivo de la investigación o análisis que se requiere y del
fenómeno que se esté estudiando. Pueden ser individuos, instituciones, etc. Es importante definir
claramente la unidad de análisis ya que esto determinará cómo se recopilan los datos y qué
conclusiones se pueden extraer de ellos.
¿Qué es una variable?
Es la “piedra angular” del análisis estadístico. Es una propiedad o característica de la unidad de
análisis que puede asumir valores diferentes en cada una de ellas y por lo tanto ser cuantificada o
categorizada.

Las variables pueden asumir categorías (valores) diferentes. Estas categorías son exhaustivas (si
todo individuo tiene alguna categoría que le corresponda, es decir, si “entra” en las categorías) y
mutuamente excluyentes (si a cada individuo le corresponde no más de una categoría). Por
ejemplo:

Si la variable es nivel de escolaridad alcanzado, pueden considerarse las


siguientes categorías: “ninguno”, “primario incompleto”, “primario
completo”, “secundario incompleto”, “secundario completo”, “terciario o
universitario incompleto”, “terciario o universitario completo” y
“postgrado”

En resumen:

Variable Que es lo que estoy midiendo

Unidad de Donde lo mido


análisis

Para poder entender el capitulo 1, es necesario prestar mucha atención a la relación entre las
nociones del siguiente cuadro.

¿Qué es el sistema de medición?


Un sistema de medición es un conjunto de procedimientos que se utilizan para asignar números u
etiquetas a objetos, fenómenos o conceptos con el fin de cuantificar características o variables de
interés. Los sistemas de medición pueden utilizar diferentes escalas de medición, como escalas
nominales, ordinales, de intervalo o de razón, dependiendo de la naturaleza de la variable que se
está midiendo y del tipo de análisis que se realizará.
Sistema nominal
Se utiliza para categorizar unidades de análisis, sin ningún tipo de orden o jerarquía entre las
categorías. En este sistema, los números y las etiquetas asignadas a las categorías son
simplemente identificadores o etiquetas sin ningún significado numérico.

Por ejemplo:

- Género (1- masculino, 2- femenino, 3- NB)


- Estado civil (1- soltero, 2- casado, 3- divorciado).

Un sistema de clasificación nominal exige casi siempre que las categorías sean exhaustivas y
mutuamente excluyentes.

Sistema ordinal
Un sistema ordinal es un tipo de escala de medición que se utiliza para clasificar unidades de
análisis en categorías jerárquicas, donde hay un orden entre las categorías, pero no es posible
establecer una distancia entre los valores. Los datos se agrupan de acuerdo con un orden
expresado con los operadores “mayor que” o “menor que”. El nivel de medición ordinal también
puede usarse para asignar rangos a las categorías (1-5 / 10-20). Por ejemplo:

- Nivel de educación (primaria, secundaria, universitaria)


- Clasificación de desempeño (excelente, bueno, regular, malo)

Escala Likert: La escala Likert es un tipo de escala de medición utilizada en encuestas y


cuestionarios para medir actitudes, opiniones, percepciones y otros estados psicológicos. Fue
desarrollada por Rensis Likert en la década de 1930 y es ampliamente utilizada en investigación
social y psicológica. En una escala Likert, los encuestados expresan su grado de acuerdo o
desacuerdo con una serie de afirmaciones o enunciados mediante una escala de respuesta que
generalmente va desde "Totalmente de acuerdo" hasta "Totalmente en desacuerdo", aunque puede
variar.

Sistema Métrico

En este sistema además de establecerse una relación de orden, se verifica que las diferencias
entre las magnitudes se corresponden puntualmente con las diferencias de los objetos de
medición. Dentro del sistema métrico, las variables se pueden clasificar en:

- Variable cuantitativa discreta son aquellos que solo


pueden tomar valores específicos y aislados, como el
número estudiantes en un aula (25, 31, etc.).
- Variables cuantitativas continuas son aquellos que
pueden tomar cualquier valor dentro de un rango, como la
altura o el peso de una persona. (1,67-1,71)

Escala Intervalar

El nivel intervalar se caracteriza por tener propiedades de orden y una unidad de medida
constante, pero no tiene un punto de cero absoluto. Es decir, una variable está medida a nivel
intervalar cuando las distancias entre las categorías son proporcionales.
Aquí tomamos un ejemplo de Eduardo Bologna (2020):

En cierto modo decimos “han transcurrido 2020 años desde el momento que se acordó usar como
inicio de este calendario”. (…) En el calendario judío, por ejemplo, el presente es el año 5780. Hay
entonces libertad para decidir la ubicación del punto desde donde empezar a contar los años. Lo
que podría llamarse el “año cero”, no es necesariamente el mismo. Sin embargo, el tiempo
transcurrido entre la Toma de la Bastilla en Paris y la Toma del Palacio de Invierno en Petrogrado es
de 128 años, que es el período entre 1789 y 1917 en el calendario gregoriano y entre 5549 y 5677
según el calendario judío. Es decir que la transformación que lleva los años de un calendario al otro
conserva las distancias. Independientemente de la escala con que hayamos medido el año, la
diferencia entre dos años, se mantiene constante. (…) Si alguien tiene 30 años en el calendario
gregoriano, también tiene 30 años con el calendario judío; porque, aunque tanto el año de
nacimiento sean diferentes en los dos calendarios, la diferencia (el tiempo transcurrido) entre las
dos fechas es la misma. Ubicar el cero en un momento (en un determinado hecho histórico) o en
otro es una elección; ese cero no indica la “ausencia de tiempo”.

Escala proporcional

Este tipo de escala posee todas las características de las escalas anteriores (nominal, ordinal e
intervalar), y además tiene un punto de cero verdadero, lo que significa que el valor de cero
representa una ausencia absoluta de la característica que se está midiendo. Una variable está
medida a nivel proporcional cuando sus valores respetan relaciones de proporcionalidad y, en
consecuencia, el cero tiene un valor absoluto.

Por ejemplo:

La cantidad de errores en el primer parcial de Estadística.

El valor cero representa que no hubo errores, es decir, es la ausencia de lo que se mide. Cometer 4
errores es el doble que cometer 2. Por eso, la variable número de errores en el primer parcial de
EySIE es de nivel proporcional.

A modo de resumen, compartimos un cuadro utilizado en las clases prácticas:

Las categorías Se pueden Se puede


Nivel de son diferentes establecer establecer Ejemplos Usos
medición entre si relaciones de distancia entre
mayor, igual o los valores
menor
Nominal Sexo, Frecuencia, fr.
X nacionalidad relativa, modo
Ordinal Nivel Mediana,
X X educativo cuartiles
Métrica Edad, Mediana,
X X X ingresos. desviación
estándar
Capítulo 2: MEDIDAS DE TENDENCIA CENTRAL

Son estadísticos que resumen un conjunto de datos. Estos datos, cuando son obtenidos de una
muestra reciben el nombre de estadísticos y cuando se calculan en una población se denominan
parámetros.

¿Cuáles son?

MODO MEDIANA MEDIA


Categoría de la Valor (teórico) de la
ARITMETICA O
variable que distribución que deja PROMEDIO
presenta mayor por encima y por
frecuencia. debajo la misma Valor equidistante de un
cantidad de casos conjunto de valores. Se
define sumando todos los
valores de la variable,
dividido por el total de los
casos.

MODO/MODA:

- Puede aplicarse a variables que no hayan sido medidas en escala métrica, porque lo
importante es identificar la categoría de la variable que concentra la mayor frecuencia.

- El modo no es la frecuencia más alta, sino la categoría donde ésta se concentra:

Nivel Educativo Cantidad de estudiantes

Nivel Inicial 141.969


Categoría
Categoría Nivel Primario 358.055 Frecuencia

Nivel Secundario 336.309

- Variación en torno al Modo: representa la manera en que se distribuyen las frecuencias


cercanas al valor modal. Cuanto mayor sea la diferencia, vamos a encontrar mayor
variación y por lo tanto más representativo será el modo.
MEDIANA:

- Es un valor posicional (divide toda la distribución en dos partes iguales).


- Se calcula sobre los valores observados (no los valores completos de la escala)

1,2,3,4,5,6,7,8,9,10 2,3,3,4,5,6,7,7,7,8,9,10,10

Valores de la Escala Valores observados

- Si el número de observaciones es IMPAR existe un valor que separa en dos mitades la


distribución, pero si la cantidad de valores es PAR la mediana se calcula como el promedio
de los valores centrales.

1,2,3,4,5,6,7,8,9,10 5 + 6 / 2: 5,5 Mediana

MEDIA ARITMÉTICA O PROMEDIO:

σ𝑛𝑖=1 𝑥
¿Cómo se lee esta fórmula?

Es la sumatoria de los valores de la variable, dividido el


𝑥ҧ = total de casos.
𝑛
Por ejemplo: El promedio de notas

10+10+9+10+10+9+10+10+10+10+10+10+10+10+8+9+10+10= 175 / 18 = 9.72

Suma de los valores de la variable


Total de casos
MEDIDAS DE DISPERSIÓN
Son valores que indican si una variable se mueve mucho, poco, más o menos que otra, a través del
cálculo de diferentes fórmulas, ofreciendo información sobre el grado de variabilidad de una
variable.

VARIANZA DESVIACIÓN COEFICIENTE DE


Expresa la dispersión ESTÁNDAR VARIACIÓN DE
(distancia) de los valores
Al igual que la varianza, es PEARSON
originales respecto del
una medida de dispersión,
promedio. Permite comparar la variabilidad
pero con la particularidad de
de diferentes conjuntos de datos
que los valores están en la
que han sido medidos por
misma unidad que la media.
diferentes escalas.

VARIANZA

¿Cómo se lee? Como el promedio de las diferencias cuadráticas entre la media y los valores
originales. Si desarmamos la fórmula, podemos leerla de la siguiente manera:

𝒏
ഥሻ𝟐
෌𝒊=𝟏ሺ𝒙 − 𝒙
𝒗𝒂𝒓 =
𝒏
𝑛
Sumatoria de las diferencias de
෍ ሺ𝑥 − 𝑥ҧ ሻ2 cada valor de X respecto a la media.
𝑖=1

Si hacés tus cálculos con calculadora Si hacés tus cálculos con Excel

x = número de cada valor original =VAR.P

ഥ = promedio
𝒙
n = cantidad de casos
Recordá que σ = sumatoria
DESVIACIÓN ESTÁNDAR

σ𝑛𝑖=1ሺ𝑥 − 𝑥ҧ ሻ2
ⅆⅇ = ඨ
𝑛

¿Cómo se lee? Como la raíz cuadrada de la varianza.

Si hacés tus cálculos con calculadora Si hacés tus cálculos con Excel

x = número de cada valor original =desvest

𝑥ҧ = promedio
n = cantidad de casos
Recordá que σ = sumatoria

COEFICIENTE DE VARIACIÓN DE PEARSON

𝜎
𝑣=
𝑥ҧ
¿Cómo se lee? Como cociente entre la desviación estándar y su media aritmética.

Si hacés tus cálculos con calculadora Si hacés tus cálculos con Excel

𝝈 = desviación estándar (se designa con la DE/promedio


letra griega SIGMA)

𝑥 = promedio

MEDIDA PORCENTUAL
Una medida general del coeficiente se logra multiplicándolo por 100 DE LA VARIACIÓN

𝜎
𝑣 = ⋅ 100
𝑥ҧ

Capítulo 3: TABLAS DE FRECUENCIA


Representan una manera sencilla de resumir información sobre una (o varias) variables.
TABLA DE FRECUENCIA: SISTEMA DE MEDICIÓN NOMINAL

Esta columna, la de Frecuencia Absoluta, se realiza un conteo de casos de cada una de las
categorías de la variable. La suma de todas las frecuencias debe ser igual al total de casos.

Variable Frecuencia

Solteros 122

Casados 107
Categoría
Separados 110

Viudos 1

Otras 5

Total 345

Frecuencia Relativa: Para calcular la Frecuencia Relativa se debe dividir el valor de la Frecuencia
absoluta de la categoría por el valor total de la muestra.

Variable Frecuencia relativa

Solteros 122/345=0.3536

Casados 107/345=0.3101

Separados 110/345=0.2898

Viudos 1/345=0,0028

Otras 5/345=0,0144

Valor de la F. Absoluta
Total de la muestra

𝐹𝑅 = 𝐹 𝐴Τ𝑛 FR= Frecuencia Relativa

FA= Frecuencia Absoluta

n= total de casos
Una vez obtenida la frecuencia relativa podemos sacar el Porcentaje, multiplicando a la frecuencia
relativa por 100.

Variable Frecuencia relativa Porcentaje

Solteros 122/345=0.3536 0.3536 x 100=35.36%

Casados 107/345=0.3101 0.3101 x 100=31.01%

Separados 110/345=0.2898 0.2898 x 100=28.98%

Viudos 1/345=0,0028 0,0028 x 100=0.28%

Otras 5/345=0,0144 0,0144 x 100=1.44%

Frecuencias acumuladas

Debes sumar de manera descendente los valores de la frecuencia en cada una de las celdas de la
categoría de la variable.

Variable Frecuencia Frecuencia absoluta acumulada


absoluta
Se suma el
Solteros 122 122 resultado a la FA
de la celda
Casados 107 122+107=229 siguiente
(229+110)
Separados 110 229+110=339

Viudos 1 339+1=340

Otras 5 340+5=345

Total 345
Porcentaje acumulados: El procedimiento para obtener los porcentajes acumulados es el mismo
que para las frecuencias acumuladas.

Variable Porcentaje Porcentaje acumulados

Solteros 35.36% 35.36%

Casados 31.01% 35.36+31.01=66.37%


¡Recordá de sumar
Separados 28.98% 66.37+28.98=95.35% de manera
descendente!
Viudos 0.28% 95.35+0.28=95.63%

Otras 1.44% 95.63+1.44=97.07%

Total 97.07% =
100%

TABLA DE FRECUENCIA: SISTEMA DE MEDICIÓN ORDINAL

Las categorías son expresadas como etiquetas, el proceso de construcción de la tabla es idéntico
al de la escala nominal.

Grado de cohesión del grupo n=55


Antes Después

Escala de Frecuencia Porcentaje Frecuencia Porcentaje

medición Absoluta Absoluta

1 1 1.81% 0 0

2 3 5.45 % 2 3.63%

3 2 3.63 % 3 5.45%

4 8 14.54 % 5 9.09%

5 14 25.45 % 12 21.81%

6 12 21.81 % 11 20%

7 10 18.18 % 19 34.54%

8 2 3.63 % 1 1.81%

9 2 3.63 % 1 1.81%

10 1 1.81 % 1 1.81%

Total 55 99,94 55 99,95


TABLA DE FRECUENCIA PARA VARIABLES MÉTRICAS

Las tablas de frecuencia de estas variables suelen agruparse en intervalos, dado que, entre dos
valores cualesquiera, pueden encontrarse otros tantos valores fraccionarios o pueden tener un
rango de valores muy amplios aun siendo discretas.

Valor Real Valor Frecuencia Frecuencia Porcentaje Porcentaje


del Intervalo Aparente
acumulada acumulado
del
Intervalo

66,0<x<=68,0 66 – 68 5 5 6,66 % 6,66%

69,0<x<=71,0 69 – 71 8 13 10,66 % 17.32%

72,0<x<=74,0 72 – 74 10 23 13,33 % 30,65%

75,0<x<=77,0 75 – 77 11 34 14,66 % 45,31%

78,0<x<=80,0 78 – 80 15 49 20 % 65,31%

81,0<x<=83,0 81 – 83 19 68 25,33 % 90,64%

84,0<x<=86,0 84 – 86 7 75 9.33 % 99,97≃100%

75

Representaciones graficas de las tablas de frecuencia

Diagrama de Barras
Las barras representan la relación entre la categoría y la frecuencia. Este gráfico se utiliza para
variables de tipo nominal, por tal motivo es que las barras están separadas entre sí denotando
que no existe continuidad entre las categorías.
Diagrama de sectores o gráfico de torta
Este gráfico es una alternativa al gráfico de sectores, utilizando los porcentajes de la tabla de
frecuencia. El área total de la circunferencia representa el 100% de población y cada categoría
será representada por una porción de dicha circunferencia.

Diagrama de barras agrupadas


Este gráfico posee las mismas propiedades del gráfico de barras, pero permite agrupar barras que
representen distintas mediciones de una misma variable.

Histograma
Se utiliza en una variable de tipo métrica, se representa con gráficos similares a los anteriores, en
ellos se evidencia que los intervalos de la variable son categorías de un conjunto de datos
continuos o discretos. Las barras deben ser del mismo ancho dado que los intervalos deben
contener la misma cantidad de datos, reflejando así la tendencia general de la distribución de la
frecuencia.
Polígono de frecuencia
Así como el gráfico de barras agrupadas nos permite comparar 2 variables de sistema ordinal o
nominal, para el sistema métrico se utiliza el polígono de frecuencia, reemplazando la altura de la
barra por un punto y luego los puntos obtenidos pueden unirse para generar un polígono. Al
reemplazar el histograma por el polígono, es posible comparar la distribución de frecuencia de dos
o más grupos en una misma variable métrica.

Box plot o Diagrama de cajas.

Es una sencilla representación de la dispersión de los datos para una variable que permite
comparar fácilmente el comportamiento de dicha variable en uno o más grupos. Generalmente
estos puntos representan la posición de los cuartiles de la distribución de datos. La interpretación
de un diagrama de cajas depende de la posición de los puntos de referencia del diagrama de la
distribución de datos observada, es por ello que el diagrama siempre se representa en el marco de
la intersección de ejes cartesianos.
Box plot - Cuartiles

Valor máximo

100% de los
casos Bigote

Q3

75% de los casos

Mediana (Q2)

50% de los casos

Q1

25% de los casos Bigote

Valor mínimo

VALORES ATÍPICOS O EXTREMOS

Para determinar que una distribución de datos contiene valores extremos, se toma en
consideración una medida proporcional del rango intercuartil, mediante la cual se determina la
extensión de los máximos y mínimos, es decir, la extensión de los bigotes no es azarosa, se
determina a través de los cálculos RI y RSI.

Rango intercuartil (RI): Q3-Q1


Rango semi intercuartil (RSI): Q3-Q1/2
Capítulo 4: MUESTREO
Es un sistema de medición que nos brinda información acerca de un conjunto de individuos, según
determinadas condiciones y para un conjunto de variables que estamos estudiando.

POBLACIÓN Y MUESTRA
- Población: cualquier entidad que pueda formar un conjunto
- La definición de la población determinará el tipo de muestreo posible
- Una muestra es una porción representativa de la población con características
equivalentes a esta.

En Estadística la definición
Población de estudiantes de la licenciatura en ciencias de la educación de la población se define
acorde a los objetivos de la
investigación, por ende, es
necesario saber si se podrá
acceder a dicha población
definida teóricamente.

Muestra

INFERENCIA

- Es un procedimiento donde se extraen conclusiones de una población.


- Será siempre inexacta, dado que toma una parte (muestra) para reconocer al todo
(población)

POBLACIÓN
MUESTRA

Inferencia

Estimador/ estadístico Parámetro


Los parámetros son medidas descriptivas de toda una población. En una población donde
desconocemos algún parámetro, podemos estimar dicho parámetro a partir de una muestra
representativa.

Un estimador o estadístico es un valor que puede calcularse a partir de los datos muestrales y
que proporciona información sobre el valor del parámetro

MUESTREO PROBABILÍSTICO

POBLACIÓN:

a) Acotada

MUESTRA

INFERENCIA

La muestra contiene las principales características de la población, por tanto, es representativa


de ella.

MUESTREO ALEATORIO SIMPLE

- La población no es muy grande.


- Se tiene acceso a todxs lxs sujetxs.
- Cada unx de los miembrxs de la población tienen la misma posibilidad de ser
seleccionados.
- Se puede repetir el proceso de muestreo cuantas veces sea necesario.
- Las unidades de muestreo están listadas y ese listado debe ser exhaustivo.
- Se debe reponer la unidad a la población.
MUESTREO ALEATORIO SISTEMÁTICO

- La población es grande.
- Las unidades se eligen a intervalos del listado completo de la población.
- Se escoge el valor de arranque para la selección de participantes mediante la siguiente
fórmula N/n (N = población – n = muestra)

MUESTREO POR CONGLOMERADOS

- No puede definirse el límite de la población.


- No hay listado de las unidades de muestreo.
- Es necesario trasladarse hasta donde están las unidades.
- Los conglomerados son heterogéneos en su interior y homogéneos entre si.

Sondeo de opinión sobre la


preferencia de candidatos
al ejecutivo nacional.
MUESTREO MIXTO

Cuando la población es compleja, cualquiera de los métodos descritos puede ser difícil de aplicar,
en estos casos se aplica un muestreo mixto que combina dos o más de los anteriores sobre
distintas unidades de la muestra.

Ejemplo: se pretende determinar la prevalencia de una determinada infección en una ciudad: se la


divide en tres grupos en función de su tamaño y se realiza un muestreo estratificado, en los barrios
que forman la muestra se realiza un muestreo sistemático para elegir los individuos que se
analizarán.

MUESTREO POR ETAPAS

El muestreo por etapas es un método para obtener una muestra de una población dividiendo dicha
población en grupos cada vez más pequeños y tomando muestras de unidades de los grupos
resultantes.

Por ejemplo, suponga que estamos interesados en estimar el ingreso familiar promedio en los
Argentina. Para simplificar, supongamos que hay 100 millones de hogares. Esto representa a toda
la población que nos interesa. Sin embargo, sería demasiado costoso y llevaría mucho tiempo
recopilar datos sobre los ingresos de cada hogar, por lo que en su lugar podríamos tomar una
muestra aleatoria simple de 12 provincias. Luego, dentro de cada provincia, podemos tomar una
muestra aleatoria simple de 10 departamentos. Luego, dentro de cada departamento, podemos
tomar una muestra aleatoria simple de 100 hogares.

MUESTREO NO PROBABILÍSTICO
POBLACIÓN:

a) Acotada
MUESTRA
No se garantiza la inferencia, la muestra no es representativa de la población, y solo asume que
cualquier conclusión queda restringida a ella.

MUESTREO ACCIDENTAL

Consiste en tomar una muestra de la población que está disponible y desea participar del estudio,
en lugar de determinarla y obtenerla a través de un procedimiento más cuidadoso. Este método
permite recoger opiniones, sugerencias, críticas y comentarios de forma fácil y sencilla.

MUESTREO POR CUOTAS

Es similar al muestreo accidental con la particularidad de que se debe cumplir con una cuota en
las unidades de muestreo. Este tipo de muestreo permite conocer las características específicas
de un grupo e investigar sobre un rasgo especifico de la muestra.

MUESTREO INTENCIONAL

En este tipo de muestreo, importa la unidad ya que nos aporta información valiosa para el estudio,
más que el proceso.

BOLA DE NIEVE

Se realiza sobre poblaciones en las que no se conoce a sus individuos o es muy difícil acceder a
ellos. Se llama muestreo de bola de nieve porque cada individuo estudiado propone a otros,
produciendo un efecto acumulativo parecido al de la bola de nieve.

Muestreo RDS (Respondent Driven Sample)

El RDS es una variante mejorada del muestreo de Bola de Nieve orientada al estudio de
poblaciones ocultas, aunque también es útil para ser utilizado con aquellas poblaciones que no
están registradas en marcos muestrales pero que, sin embargo, no ofrecen especiales dificultades
para ser contactadas. Esta muestra asume la existencia de una población que puede abordarse en
los términos de una organización, es decir, que ofrece una estructura de red: sus miembros están
conectados entre sí.

Aclaración importante: Tanto el muestreo RDS, como el


Mixto y el muestreo por Etapas, no se encuentran incluidos
en el apunte de catedra, pero son conceptualizaciones que
se vieron en los espacios de teóricos.
Capítulo 5: DISTRIBUCIÓN NORMAL
La distribución normal es una distribución con forma de campana donde las desviaciones
estándar sucesivas con respecto a la media establecen valores de referencia para estimar el
porcentaje de observaciones de los datos. Puesto que la distribución de estos datos es normal,
se puede determinar qué porcentaje de los valores está dentro de cualquier rango específico.

𝜎 = desviación estándar
𝛭= media

“3 desviaciones estándar”

La distribución normal es unimodal y simétrica, lo cual significa que la media, la


mediana y el modo coinciden en el mismo valor, que es el centro de la distribución

La distribución normal es continua y asintótica (esto es, que se extiende indefinidamente en sus extremos),
esto quiere decir que cualquier valor de la variable estaría contenido dentro de la distribución normal
estandarizada

En una distribución normal los casos se distribuyen de la siguiente manera:

El porcentaje de área bajo la


distribución normal puede ser
interpretado como distribución de
probabilidades. En este ejemplo,
el 95% de casos está dentro de la
distribución, y se deja por fuera el
5% de los restantes casos.
DESVIACIÓN ESTÁNDAR

La forma de la distribución normal (la característica curva con forma de campana) se define por
una función que tiene solamente dos parámetros: la media y la desviación estándar. La media es
el valor que con mayor probabilidad aparecerá en una medida.

La desviación estándar refleja lo abierta o cerrada que es la campana de Gauss correspondiente.


Una distribución muy cerrada se corresponde con una serie de medidas muy poco dispersas. Por
el contrario, si la distribución es abierta, la desviación estándar es grande.

PUNTUACIÓN Z

En una distribución normal, los valores de la media y de la desviación estándar están expresados
en puntuación Z.

Porque cualquier distribución empírica puede ser


¿Por qué?
estandarizada siempre y cuando transformemos los valores
originales en puntuación Z.

¿Cómo hacemos eso? Con la siguiente fórmula:

Valor empírico u promedio


original 𝒙−𝒙ഥ
𝒁=
𝑫𝑬
Desviación estándar

¡Algo importante a tener en cuenta! La estandarización no cambia la distribución original, solo la


expresa en valores diferentes (valores Z) que nos facilitan comparar variables.
También se puede trabajar a la inversa, es decir, podemos transformar los valores de la puntuación
Z en los valores originales, mediante la formula:

ഥ + ሺ𝒁 ∗ ⅆⅇሻ
𝑷0 = 𝒙
Desviación estándar
Puntuación Original

Promedio Valor Z

También podría gustarte