Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TIPOS DE VARIABLES
1. Cualitativas: Las características no son cuantificables .
2. Cuantitativas: Características cuantificables o numéricas
- Discretas: Numéricas que toman valores enteros
- Continuas: Numéricas que toman valores en un intervalo continuo o si influyen, lo hacen de
modo homogéneo en todos los grupos
MATRIZ DE DATOS
Una Matriz de Datos es una cuadrícula compuesta por filas y columnas, donde cada celda es la
intersección de una fila (casos) y una columna (variables). La forma misma de la Matriz y la definición,
conducen a los 3 Principios de la recolección de datos establecidos por Galtung, J.:
1. Principio de Comparabilidad: Cada combinación de Unidad de Análisis/Variable debe tener
sentido, esto es, debe ser verdadero o falso que dicha combinación brinde un determinado
valor.
Principio de Clasificación: Implica que el sistema de categorías de una variable debe cumplir
con dos requisitos lógicos: debe ser exhaustivo (en el sentido que ninguna unidad quede fuera
del sistema de categorías) y excluyente (de manera que cada unidad asuma un valor y sólo
uno en cada variable).
2. Principio de Integridad: No dejar ninguna celda vacía. Lo que antecede significa que hay que
intentar que la cantidad de celdas sin información, es decir, "No sabe"/"No contesta", se
mantenga lo más baja posible.
Luego de confeccionar la matriz de datos, se procede a la tabulación de los mismos. La tabulación es
el proceso mediante el cual los datos recopilados se organizan y concentran, en base a determinadas
ideas o hipótesis, en tablas o cuadros para su tratamiento estadístico. Determinar qué resultados de
las variables se van a presentar y que relaciones entre las mismas se van analizar, porque den
respuesta al problema y los objetivos formulados.
Ejemplos:
➔ Población total por intervalos de edad según sexo
➔ Población por intervalos de edad según lugar de nacimiento
➔ Nivel de instrucción de la población encuestada según edad y sexo
➔ Meses de vida y número de controles.
DISTRIBUCIÓN DE FRECUENCIAS
Una distribución de frecuencias es un conjunto de puntuaciones ordenadas en sus respectivas
categorías y generalmente se presenta como una tabla. Una distribución de frecuencias puede
contener:
➔ Frecuencia Absoluta: Define la cantidad de veces en la que se repite cada categoría
➔ Frecuencia Relativa: Representa el cociente entre la frecuencia Absoluta y la cantidad de
datos. Ésta puede ser representada en forma de fracción, decimal y porcentaje.
➔ Frecuencia Acumulada: Constituye lo que aumenta en cada categoría en la frecuencia
absoluta. La última categoría contiene el número total de la muestra.
En variables discretas:
ni Frecuencias absolutas
Ni Frecuencias acumuladas
fi Frecuencias relativas
Fi F. Relativas Acumuladas
Fi= f1 + f2 +...+ fi
Ejemplo: Preguntamos a 30 deportistas en un gimnasio el número de lesiones que han tenido en los
últimos 5 años. X es el número de lesiones y Xi es el valor de la variable número de lesiones X1= 1,
X2= 2, X3= 3, X4= 4. El Rango es 4-1=3
ni Frecuencias absolutas
Ni Frecuencias acumuladas
fi % Frecuencias relativas
Fi % F. Relativas Acumuladas
Fi= f1 + f2 +...+ fi
En variables continuas:
Ejemplo:
PRESENTACIONES GRÁFICAS
Con variables cualitativas:
Moda: Mo
N/2 = 35/2 = 17.5 entonces Me = x18 = 7 (para identificar que valor tiene
x18 nos fijamos en la frecuencia acumulada) Educational Research Me
Fórmula diapos:
Media Aritmética: X
➔ Si tenemos una muestra de datos discretos:
Propiedades:
- El cálculo incluye todos los datos/valores de la muestra
- Es sensible a los valores extremos
- Se localiza en el centro de la distribución
CUANTILES
Puntos tomados a intervalos regulares de la distribución de una variable aleatoria. Se hace una
división de datos ordenados en k datos esencialmente de igual tamaño (subconjuntos) formando
k-cuantiles. Los cuantiles son los valores de los datos que marcan los límites entre subconjuntos
consecutivos.
Cuartiles: Son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro
partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de
los datos. Q2 coincide con la mediana. Se calcula la posición del dato mediante la expresión: k ·N/4.
Numeros de datos par
Impar
Paso 3 Buscamos el intervalo del tercer cuartil: k " N/4 = 3"65/4= 48.75 La clase de Q3 es
Deciles: Son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan
los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana.
Percentiles: Son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles
dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana.
Ejemplo: ¿Qué significa que un niño esté en en el percentil 10 de peso? Si lo comparamos con 100
niños de su misma edad, habrá́ solo 10 que pesen menos, mientras que los otros 90 pesarán más
que él.
Rango o recorrido (R): Está determinado por los dos valores extremos de los datos muestrales, es la
diferencia entre la mayor y menor observación. Es una medida de dispersión absoluta, ya que
depende solamente de los datos y permite conocer la máxima dispersión.
R = xmax – xmin
Varianza (S2): El objetivo de este parámetro es el mismo que el de la desviación media, detectar las
variaciones de cada valor respecto a la media aritmética. Para el cálculo se elevan esas diferencias al
cuadrado, así se evita posibles compensaciones y se "exagera" estas diferencias (un número menor
que uno al elevarlo al cuadrado se hace menor y uno mayor que uno se hace mayor). El promedio de
dichas diferencias se denomina varianza.
Varianza:
Desviación estándar (S): La desviación típica o estándar se define como la raíz cuadrada positiva de
la varianza. La ventaja es que las unidades en las que se mide son las mismas que las de los datos
de la distribución. Puede considerarse la medida de dispersión por excelencia y aparece como tecla o
función directa en cualquier calculadora o programa estadístico.
Distribución normal o campana de Gauss: Ciertos datos, cuando se representan gráficamente como
un histograma (datos en el eje horizontal, cantidad de datos en el eje vertical), crean una curva en
forma de campana conocida como curva normal o distribución normal.
Propiedades:
- Las distribuciones normales son simétricas (media, mediana y moda coinciden) con un solo
pico central en la media (promedio) de los datos.
- La forma de la curva se describe como en forma de campana con el gráfico cayendo
uniformemente a ambos lados de la media y depende de la desviación estándar (o de la
varianza).
Distribución normal:
La medida de tendencia central más representativa para datos distribuidos normalmente es la media
aritmética. La medida de dispersión estadística más representativa para los datos distribuidos
normalmente es la desviación estándar (o la varianza).
Dispersión
Los polígonos de frecuencia suelen representarse como curva, para que puedan analizarse en
términos de probabilidad y visualizar su grado de dispersión.
La asimetría y la curtosis es una estadística necesaria para conocer cuanto se parece nuestra
distribución a una distribución teórica llamada curva normal (definida por la media y varianza).