Está en la página 1de 6

CLASE 2

CAPITULO 1

VARIABLES

Es una característica de las unidades de análisis que puede asumir diferentes valores cada una
de ellas.

CATEGORIAS

Son los valores que puede asumir una variable determinada. Requisitos: exclusión mutua;
exhaustividad.

NIVELES DE MEDICION

Determinado por el significado que tengan los símbolos numéricos que se asignan a las
categorías en una variable.

 NOMINAL: si los números que representan cada categoría son asignados de manera
arbitraria y solo cumplen con la función de designar y distinguir categorías diferentes.
Operación, igual/diferentes
 ORDINAL: si los numero que representan cada categoría son asignados de manera que
respeten el orden según aumenta o disminuye la característica que la variable mide.
Operación, menor o mayor
 INTERVALAR: cuando las distancias entre las categorías son proporcionales.
 PROPORCIONAL: cuando sus valores respetan las relaciones de proporcionalidad y, en
consecuencia, el cero tiene un valor absoluto.
o DISCRETA: números enteros
o CONTINUA: admite números decimales

CAPITULO 2

FRECUENCIA ABSOLUTA SIMPLE

El numero de casos que asume un valor determinado de cada variable. Se indica con f.

FRECUENCIA RELATIVA SIMPLE

La proporción de casos que asumen un valor determinado de cada variable. Se indica f´. (Es
decir sobre 1 o 100%).

FRECUENCIA ABSOLUTA ACUMULADA


Es la cantidad de casus que asumen ese valor y todos los valores menores a él. Se indica F

FRECUENCIA RELATIVA ACUMULADA

Es la proporción de casos que asumen ese valor y todos los valores menores a él. Se indica F´.

RECATEGORIZACION

o Intervalos de amplitud igual: Categorías del mismo tamaño.


o Intervalos de amplitud proporcional: Cantidad de casos homogénea en las categorías.
o Intervalos de amplitud teórica: Como sea conveniente a la investigación.

CLASE 2 HASTA ACÁ

CLASE 3

LA PRESENTACION GRAFICA DE LOS RESULTADOS (se encuentra en la pág. 87).

NOMINALES: Graficamos frecuencias absolutas y relativas.

CUANTITATIVAS: Histograma (forma de graficar, de acuerdo a su forma, su tipo de análisis)

Graficar frecuencias relativas acumuladas (tienen un punto de corte, que


señala la cantidad que hay por debajo y por encima)

CAPITULO 3 (103)

MEDIDAS DE POSICION (de tendencia central)

o NOMINALES
o Proporción: es la frecuencia relativa correspondiente a una categoría
particular. Se expresa como porcentaje. Se indica como p.
o Tasas: frecuencia relativa de un fenómeno en referencia a una población total,
con la característica de tener en cuenta un periodo de tiempo. Se suele
expresar cada 100/1.000/10.000, en lugar de porcentaje.
o Razones: son cocientes calculados entre conjuntos que no tienen elementos
en común. Se obtiene dividiendo el total de una frecuencia por el total de la
otra y multiplicándolo por 100.
o Modo: es el valor de la variable (categoría) que tiene la mayor frecuencia. El
valor de la variable más frecuentemente observado. (puede ser bimodal).
o ORDINALES
o Cuantiles: son los valores de la variable que dejan por debajo una determinada
proporción de las observaciones. Cuando las proporciones se expresan como
porcentajes, se los denomina percentiles.
o Mediana: es el valor de la variable que deja por debajo a la mitad o mas de las
observaciones y que deja por encima a la mitad o mas de las observaciones.
Corresponde al cuantil 0.50. Si es continua, deja la misma cantidad de casos
por debajo que por encima. Si es discreta es maso menos.
o Cuartiles: (primero y tercero) son los valores que dejan por debajo un cuarto
25% y tres cuartos 75% por debajo, respectivamente.
o Percentiles: la fracción que se requiera
o Quintiles: se fracciona en 5
o METRICAS
o Media: es un valor de la variable obtenido sumando todas las observaciones
multiplicadas por su frecuencia absoluta y dividiendo el resultado en el
numero total de casos.

LA FORMA DE LA DISTRIBUCION (135)

ASIMETRIA

Indica hacia donde se sitúan los valores extremos. Si estos son mayores que la mayor parte de
los datos, la asimetría es hacia la derecha. Si hay observaciones particularmente pequeñas, la
asimetría es hacia la izquierda.

UNA DISTRIBUCION ES SIMETRICA SI LA MEDIA COINCIDE CON LA MEDIANA. LA DISTRIBUCION


SE LLAMA ASIMETRICA A LA DERECHA SI LA MEDIA ES MAYOR QUE LA MEDIANA, Y
ASIMETRICA HACIA LA IZQUIERDA SI LA MEDIA ES MENOR QUE LA MEDIANA.

COEFICIENTE DE ASIMETRIA

Miden hacia que lado sucede y cuan acentuada es. Su signo positivo indica asimetría hacia la
derecha y negativo hacia la izquierda. El valor absoluto del coeficiente indica si es muy
asimétrica o poco. Cuando es simétrica el coeficiente vale 0; pero se considera simétrico un
coeficiente entre -0.5 y 0.5.

CURTOSIS
Mide cuan puntiaguda es la curva, distingue distribuciones con forma estrecha y elevada de las
de forma amplia y baja. Leptocúrtica (muy puntiaguda); mesocúrtica (normal); platicúrtica
(nada puntiaguda).

COEFICIENTE DE CURTOSIS

Vale 0 para distribuciones mesocúrticas, es negativo para las platicúrticas y positivo para las
leptocúrticas. Se toma como mesocúrtica a una distribución cuyo coeficiente se encuentre
entre -0.5 y 0.5.

BOX-PLOTS

El diagrama de caja representa sobre el eje vertical los valores de la variable y muestra una
caja delimitada por los cuartiles 1 y 3, contiene el 50% central de los casos. La línea horizontal
es la mediana. Y se puede apreciar la concentración de casos en los diferentes valores de la
variable. Los bigotes dependen de una característica de la distribución que es la dispersión.

CLASE 3 HASTA ACA

CLASE 4

MEDIDAS DE DISPERSION Describir la variabilidad de los datos.

RECORRIDO

Es la diferencia entre los valores máximo y mínimo de la variable. Se indica R

AMPLITUD INTERCUANTILICA

Es la diferencia entre los cuartiles tercero y primero. Se indica AIQ. También se puede informar
el semi recorrido intercuartilar SRIC, que es la mitad de la AIQ.

HASTA AQUÍ SON SENSIBLES A VALORES ATIPICOS

MEDIDAS DE DISPERSION BASADAS EN LA MEDIA

La media es el valor de la variable que anula la suma de desvíos en torno suyo. Por ende, los
desvíos son la distancia de cada observación con respecto a la media. Se calcula restando a
cada valor la media. Las distancias positivas corresponden a valores superiores a la media, las
negativas, valores inferiores.

VARIANZA
Es la suma de los cuadrados de los desvíos alrededor de la media, dividida por el total de
observaciones menos uno. Se indica s2. No puede ser negativa, porque es una suma de
cuadrados y solo es cero si todos los desvíos son cero. Cuanto se desvía y cual es el grado de
variabilidad que tiene.

(ver propiedades en pág. 152)

Sus inconvenientes es que sus unidades están elevadas al cuadrado y que no tiene límite
superior, puede ser muy grande y no tenemos con qué compararla para saber si indica gran
variabilidad.

DESVIACIÓN ESTANDAR

Es la raíz cuadrada de la varianza. Se indica s. Esto resuelve el primer problema, ya que


compara diferentes unidades de medida.

COEFICIENTE DE VARIACIÓN

Expresa de manera relativa la dispersión, midiendo el peso de la desviación estándar


comparado con la media. Se indica CV. Resuelve el segundo problema de la varianza. Es
desviación estándar, dividido por la media multiplicado por 100. Esta medida carece de
unidades por lo que se trata de una medida relativa de la dispersión.

Se considera que si el CV es menor al 10% la distribución tiene poca dispersión, entonces se


puede confiar en la media como medida de centralidad. Si el CV es mayor, se necesitan otras
medidas, como la mediana, cuartiles, mínimo y máximo.

BOX-PLOTS Y DISPERSION

Cuando la caja es larga las distribuciones son dispersas en la parte central, los cuartiles están
alejados, hay mucha amplitud intercuartilar. La longitud de los bigotes señala la mayor o
menor concentración de los datos en zonas extremas. Para un mejor entendimiento revisar
pág. 156

MEDIDA DE LA DISPERSION CUANDO NO HAY DISTANCIAS

Son para nominales u ordinales. En estos casos la variabilidad se entiende como más dispersa
cuanto más equitativamente se distribuya el total de observaciones entre las distintas
categorías. Ahora habrá más dispersión cuanto más parecidas sean las frecuencias entre sí.

Calculo en la 158.
EL INDIVIDUO EN RELACION A SU GRUPO Cuanto se aleja un individuo de la media,
independientemente de que estemos midiendo.

ESTANDARIZACION (Es una medida estandarizada del alejamiento de cada observación del
promedio) (se independiza de su medida)

Tomamos el valor individual, se lo restamos a la media y lo dividimos por la desviación


estándar. Se calcula a cuantos desvíos estándar se encuentra un valor con respecto a la media.

PUNTAJE Z es el nombre con el que se conoce al desvío estándar expresado en cantidades de


desviaciones estándar.

Graficado 1 hora 10min: en los gráficos simétricos donde la mediana parte los casos a la mitad,
se sabe empíricamente que: en el intervalo de una desviación estándar de la media se
encuentra aproximadamente el 68% de los casos, a dos desviaciones el 95 y a tres, el 99%.
(hacia ambos lados) (1 hora, 13min).

CLASE 4 HASTA ACA

CLASE 5

También podría gustarte