Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPITULO 1
VARIABLES
Es una característica de las unidades de análisis que puede asumir diferentes valores cada una
de ellas.
CATEGORIAS
Son los valores que puede asumir una variable determinada. Requisitos: exclusión mutua;
exhaustividad.
NIVELES DE MEDICION
Determinado por el significado que tengan los símbolos numéricos que se asignan a las
categorías en una variable.
NOMINAL: si los números que representan cada categoría son asignados de manera
arbitraria y solo cumplen con la función de designar y distinguir categorías diferentes.
Operación, igual/diferentes
ORDINAL: si los numero que representan cada categoría son asignados de manera que
respeten el orden según aumenta o disminuye la característica que la variable mide.
Operación, menor o mayor
INTERVALAR: cuando las distancias entre las categorías son proporcionales.
PROPORCIONAL: cuando sus valores respetan las relaciones de proporcionalidad y, en
consecuencia, el cero tiene un valor absoluto.
o DISCRETA: números enteros
o CONTINUA: admite números decimales
CAPITULO 2
El numero de casos que asume un valor determinado de cada variable. Se indica con f.
La proporción de casos que asumen un valor determinado de cada variable. Se indica f´. (Es
decir sobre 1 o 100%).
Es la proporción de casos que asumen ese valor y todos los valores menores a él. Se indica F´.
RECATEGORIZACION
CLASE 3
CAPITULO 3 (103)
o NOMINALES
o Proporción: es la frecuencia relativa correspondiente a una categoría
particular. Se expresa como porcentaje. Se indica como p.
o Tasas: frecuencia relativa de un fenómeno en referencia a una población total,
con la característica de tener en cuenta un periodo de tiempo. Se suele
expresar cada 100/1.000/10.000, en lugar de porcentaje.
o Razones: son cocientes calculados entre conjuntos que no tienen elementos
en común. Se obtiene dividiendo el total de una frecuencia por el total de la
otra y multiplicándolo por 100.
o Modo: es el valor de la variable (categoría) que tiene la mayor frecuencia. El
valor de la variable más frecuentemente observado. (puede ser bimodal).
o ORDINALES
o Cuantiles: son los valores de la variable que dejan por debajo una determinada
proporción de las observaciones. Cuando las proporciones se expresan como
porcentajes, se los denomina percentiles.
o Mediana: es el valor de la variable que deja por debajo a la mitad o mas de las
observaciones y que deja por encima a la mitad o mas de las observaciones.
Corresponde al cuantil 0.50. Si es continua, deja la misma cantidad de casos
por debajo que por encima. Si es discreta es maso menos.
o Cuartiles: (primero y tercero) son los valores que dejan por debajo un cuarto
25% y tres cuartos 75% por debajo, respectivamente.
o Percentiles: la fracción que se requiera
o Quintiles: se fracciona en 5
o METRICAS
o Media: es un valor de la variable obtenido sumando todas las observaciones
multiplicadas por su frecuencia absoluta y dividiendo el resultado en el
numero total de casos.
ASIMETRIA
Indica hacia donde se sitúan los valores extremos. Si estos son mayores que la mayor parte de
los datos, la asimetría es hacia la derecha. Si hay observaciones particularmente pequeñas, la
asimetría es hacia la izquierda.
COEFICIENTE DE ASIMETRIA
Miden hacia que lado sucede y cuan acentuada es. Su signo positivo indica asimetría hacia la
derecha y negativo hacia la izquierda. El valor absoluto del coeficiente indica si es muy
asimétrica o poco. Cuando es simétrica el coeficiente vale 0; pero se considera simétrico un
coeficiente entre -0.5 y 0.5.
CURTOSIS
Mide cuan puntiaguda es la curva, distingue distribuciones con forma estrecha y elevada de las
de forma amplia y baja. Leptocúrtica (muy puntiaguda); mesocúrtica (normal); platicúrtica
(nada puntiaguda).
COEFICIENTE DE CURTOSIS
Vale 0 para distribuciones mesocúrticas, es negativo para las platicúrticas y positivo para las
leptocúrticas. Se toma como mesocúrtica a una distribución cuyo coeficiente se encuentre
entre -0.5 y 0.5.
BOX-PLOTS
El diagrama de caja representa sobre el eje vertical los valores de la variable y muestra una
caja delimitada por los cuartiles 1 y 3, contiene el 50% central de los casos. La línea horizontal
es la mediana. Y se puede apreciar la concentración de casos en los diferentes valores de la
variable. Los bigotes dependen de una característica de la distribución que es la dispersión.
CLASE 4
RECORRIDO
AMPLITUD INTERCUANTILICA
Es la diferencia entre los cuartiles tercero y primero. Se indica AIQ. También se puede informar
el semi recorrido intercuartilar SRIC, que es la mitad de la AIQ.
La media es el valor de la variable que anula la suma de desvíos en torno suyo. Por ende, los
desvíos son la distancia de cada observación con respecto a la media. Se calcula restando a
cada valor la media. Las distancias positivas corresponden a valores superiores a la media, las
negativas, valores inferiores.
VARIANZA
Es la suma de los cuadrados de los desvíos alrededor de la media, dividida por el total de
observaciones menos uno. Se indica s2. No puede ser negativa, porque es una suma de
cuadrados y solo es cero si todos los desvíos son cero. Cuanto se desvía y cual es el grado de
variabilidad que tiene.
Sus inconvenientes es que sus unidades están elevadas al cuadrado y que no tiene límite
superior, puede ser muy grande y no tenemos con qué compararla para saber si indica gran
variabilidad.
DESVIACIÓN ESTANDAR
COEFICIENTE DE VARIACIÓN
BOX-PLOTS Y DISPERSION
Cuando la caja es larga las distribuciones son dispersas en la parte central, los cuartiles están
alejados, hay mucha amplitud intercuartilar. La longitud de los bigotes señala la mayor o
menor concentración de los datos en zonas extremas. Para un mejor entendimiento revisar
pág. 156
Son para nominales u ordinales. En estos casos la variabilidad se entiende como más dispersa
cuanto más equitativamente se distribuya el total de observaciones entre las distintas
categorías. Ahora habrá más dispersión cuanto más parecidas sean las frecuencias entre sí.
Calculo en la 158.
EL INDIVIDUO EN RELACION A SU GRUPO Cuanto se aleja un individuo de la media,
independientemente de que estemos midiendo.
ESTANDARIZACION (Es una medida estandarizada del alejamiento de cada observación del
promedio) (se independiza de su medida)
Graficado 1 hora 10min: en los gráficos simétricos donde la mediana parte los casos a la mitad,
se sabe empíricamente que: en el intervalo de una desviación estándar de la media se
encuentra aproximadamente el 68% de los casos, a dos desviaciones el 95 y a tres, el 99%.
(hacia ambos lados) (1 hora, 13min).
CLASE 5