Está en la página 1de 7

TEMA 3:

Estadístico: función matemática de los datos que queremos definir

Distintos tipos

- Posición de los datos


Muestran en que posición se encuentra un dato concreto en relación al conjunto de
datos que tenemos
Ej.: Los sujetos que tienen en una grafica una mayor medida de inteligencia estarán por
encima de los que tienen menos.

o Tendencia central de los datos (más usado, la media)

Nos muestran en torno a que valor se encuentra el conjunto de los datos. Para saber
esto hay 3 medidas que sintetizan el conjunto de datos, es decir 3 promedios.

Ej.: En las graficas se puede ver fácilmente en las graficas que están muy unidas (se
vera en torno a que valor están), pero si están muy distribuidos costara determinar el
valor.

 El punto que consigue equilibrar el conjunto de los datos (el peso de los datos sea
similar) = Media (cuanti) / (le corresponde la DV/varianza). Calculo: suma consecutiva
de todos los valores de la variable entre el tamaño muestral (total de sujetos)

No puede calcular variables cualitativas (no tienen un orden), ni casi-cuantitativa


Puede cuantitativa

- Propiedades:
o Si una medida se somete a una transformación lineal, su media experimentara
la misma transformación
o La media de las diferencias entre cada valor y la media es 0

(su utilización será útil en el caso de que los datos sean simétricos, en caso contrario se
utilizaría la mediana, por ello en ocasiones se calculara la asimetría; cuya formula expresa que
conforme mas cercano este del 0,5 o 0 sera simétrico, y podrá ser positiva -la mayoría de datos
estará a la izda e ira disminuyendo- o negativa- se pasa de pocos datos a una mayoría-)

 El valor que deja por debajo suya el 50% de los datos = Mediana (cuasi) /(le
corresponde el rango). Calculo:
1º. Ordenar de menor a mayor
2º. Calcular el tamaño de la muestra (num de sujetos)
n+1
3º. Sumale 1 al tamaño muestral y dividelo entre 2 ( ¿
2
4º Dos opciones:
o Si es un num entero, ese será la posición donde se encuentra la mediana
o Si es un decimal, se coge la parte entera, se le suma a su suma +1 y se le divide
entre 2. Obteniendo asi el valor de la mediana (
' X 10+ X 11
en el caso de tener 10 5 →10+ 11, es decir ¿
2

No se puede calcular variables cualitativas/nominal (porque las modalidades no


tienen un orden).
Puede calcular variables casi-cuantitativas y cuantitativas

 Moda (cuali) = valor más frecuente (no le corresponde ninguna medida de dispersión)
(puede ser unimodal si hay una moda, u bimodal si tiene dos modas)
Se puede calcular variables cualitativas, casi-cuantitativa (dice poco, por ello es mejor
la mediana), y cuantitativas (en intervalos si hay dos que tienen igual máxima
frecuencia, entonces la moda será la marca de clase/punto medio de los dos
intervalos).

o Cuantiles (3 tipos que dividen los datos en partes con la misma cantidad de
datos, por tanto se puede ver la posición del valor de una variable
comparándola con el resto de valores)  utilizados en psicología para
construir escalas facilmente

- Cuartil: Organiza los datos en grupos del 25% de los datos del total, es decir, 4 grupos
con el mismo conjunto de datos (el cuartil 1, dejara por debajo suya el 25% de los
datos -es el más bajo-, el 2 el 50%, el 3 el 75% ,y el 4 el 100%)
(estos se calcularían en caso que no se sepa como dividir en cuatro grupos una variable
desconocida)
(Q3= mediana)

- Decil: se divide el conjunto de datos en 10 grupos, es decir, se tendrá 9 deciles y entre


cada uno habrá un 10% -el 1 dejara el 10% y el 2 el 20%...

- Percentil/Centil: divide el conjunto de datos en 100 grupos, por lo que se tendrá 99


centiles de un 1% cada uno – el 1 dejara el 1%, el 2 el 2%...-

(esta por encima de un porcentaje determinado)

Esto se utiliza mucho en la interpretación de los test de cara a la población, y no se pueden


calcular con ninguna variable nominal ya que para ello se requiere seguir un orden de los
datos, por lo tanto se puede con variables cuasi y cuantitativas.

Interpretación: centil 37% -> el 37% de la población esta por debajo de la puntuación de ese
individuo, es decir, es más extrovertido que el 37% de la población

Para calcular los cuantiles:

1. Ordenar los datos de menos a más


2. Calculamos la posición que estamos buscando

Mediana: k=50
Cuartiles: Q1 K=25
Q2 K=50 (es lo mismo que la mediana)
Q3 K=75

Deciles: D1 K=10
D2 K=20

Centiles: P1 K=1
P33 K=33

Una vez calculado se encuentra el valor que le corresponde al cuantil que se desea buscar (ej.:
el cuartil 1 podría ser el valor 23)

(en tabla de frecuencias, el porcentaje acumulado establece el porcentaje que determinado


valor deja por debajo suya; ej.: si deja un 30% correspondería con el cuartil 1 que es 25%,
dando igual a que 4 se refiera si hay varios)

- Dispersión de los datos


Nos indican si los datos están muy concentrados en torno a un valor (homogéneos), o
muy distribuidos (heterogéneos) =grado de concentración
“Se llama dispersión de los datos a la variabilidad que existe entre ellos”

Medidas de dispersión:

No hay ninguna variable nominal/cualitativa (no tiene ni min ni max) que pueda
utilizar alguna medida de dispersión.

En las variables cuasi cuantitativas/ordinales: se puede calcular el rango, pero no la


desviación típica (sino se puede la media no se puede la varianza), ni el coeficiente
variación.
Y con las variables cuantitativas se puede calcular tanto el rango, varianza, y
coeficiente de variación.

o Rango
Distancia que hay entre dos valores del conjunto de datos. El rango total será la
distancia entre el valor máximo y el valor mínimo.
(si el rango es muy grande quiere decir que los datos no están muy
concentrados)

 Rango intercuartílico /amplitud intercuartílica (distancia entre el valor


del cuartil 1 y el 3), es utilizado pq el rango es muy sensible a las
fluctuaciones
En cambio, la diferencia entre el valor máx. y min es la amplitud total,
hay q saber diferenciarla de esta.
Ej.: personas de 10 y de 80 años, en este caso la AIQ(amplitud
intercuartilica) seria de 40 a 50 por lo que si esto es alto los datos
estarán muy concentrado

o Desviación típica/Varianza (mas importante) (invariables a los cambios de


origen -suma o resta por igual-, pero variable proporcionalmente con los
cambios de escala -multiplicacion o división-

Calcular la distancia que tiene cada uno de los datos a la media, y


posteriormente se hace una media de todas esas distancias.
(si el valor es muy bajo quiere decir que los datos están muy concentrados y
son homogéneos, pero si el valor es grande indica que están más dispersos y
son heterogéneos) / (siempre será positivo y tendrá valores hasta el infinito,
aunque la desviación típica se tendera a tener como máximo 3) / (se
interpretan en conjunto, no por separado, y siempre se compara cuando
tienen una media mas o menos parecida y están midiendo lo mismo)

o Cuasi-desviación típica/Cuasi-varianza (igual que la desviación típica/varianza)

o Coeficiente de variación

Ayuda a eliminar la unidad de medida para poder comparar la dispersión de


dos conjuntos de datos con unidades de medida distintas (se calcula siempre
en valores enteros, y se interpreta de manera que cuanto mayor sea mayor
será la dispersión; cuando este es superior a 80 quiere decir que esta muy
dispersodispersa y en función de esto se sabrá si se puede usar la media, es
decir, a partir de 80 no se usa la media y sí la mediana)

- Forma que tiene la grafica que representa los datos


o Curtosis: Indican si la grafica es muy apuntada o muy aplanada, es decir, el
grado de apuntamiento que presentan los valores alrededor de la zona central.
Si está muy aplanada, todos los valores de la variables tienen valores similares,
y en caso de la frecuencia nos indicarían la frecuencia.

Medida de apuntamiento o curtosis (cuando la distribución es mas o menos


asimétrica, la forma que tiene la grafica es mas o menos parecida a la
distribución normal -la distribucion es todos los posibles datos de una variable
mas el numero de veces que ocurre-, cuando no coincide y es más por arriba
será una distribucion leptucurtica y cuando si mesocurtica, pero cuando es mas
por debajo de la distribucion normal será platicurtica)
(leptocúrtica, positivo) (platicurtica, negativo)

o A su vez expresan la simetría: grado en que los datos tienden a repartirse de


manera similar por encima y por debajo de los valores centrales. Cuando se da
lugar a la asimetría puede ser positiva (puntuaciones por debajo de la media,
empieza alto y luego bajo), o negativa (puntuaciones por encima de la media,
empieza bajo y luego alto)
Todos tienen en común que en función del tipo de variable que se tenga la forma de calcular
los datos será distinta.

COMO INTERPRETAR LAS VARIABLES

(siempre que sea posible usar la media, es decir, cuando sean cuantitativas ya que de esta
manera se proporciona más información; sin embargo, no es recomendable en aquellos casos
donde la distribución no es simétrica)

Por otra parte, cuando se describe una variable estadística, dependiendo de esta se usa
distintos estadísticos:

- Cualitativa (tabla de frecuencias únicamente; se suele usar un grafico de sectores)


- Cuasi-cuantitativa (moda/mediana, y medida de dispersión rango total o intercaurtilico,
pero no se puede de forma; por lo tanto lo típico es calcular una tabla de frecuencias y
presentar la mediana y los rangos; se puede usar un grafico de barras por lo q es
necesario calcular la tabla de frecuencias)
- Cuantitativa (para esta no se utiliza una tabla de frecuencias habitualmete, por lo que
se usa los estadísticos usando siempre la media y la desviación típica ya que son los q
mas info dan; sin embargo, la media no siempre es usada cuando la variable no esta
distribuida simétricamente por lo que se calcula el coeficiente de simetría o se mira la
grafica para comprobarlo, por tanto si no es simétrica es mejor utilizar mediana y
rango; y de grafico se usa un histograma en general pero solo si es continua, y si es
discreta un grafico de barras aunque al final serán tantas que usaremos para todas el
histograma)

 Medidas de simetría y apuntamiento (generalmente no se usan para describir una


variable). Se usan mas las otras

 Nuevo grafico: diagrama de caja-bigotes

Este grafico se puede ver dibujado tanto en vertical como en horizontal.

- Horizontal (solo eje de abcisas, si se trata de edades hay aparecerían): aparecería un


rectángulo dividido en dos por una raya (su tamaño esta definido por el cuartil 1 y el
cuartil 3, lo que indica que incluye el 50% de datos centrales que hay; y la rayita es el
cuartil 2= mediana), y los segmentos q salen de el son el max y min del conjunto de
datos.

Del mismo modo, si hay datos distintos del conjunto de datos (casos atípicos) se
presentan como puntos a parte (representa que ese valor es especialmente distinto al
resto de los demás, lo que indica que esos dos sujetos no ayudan a la hora de estudiar
el conjunto y que requiere que se estudien a parte porque sino la idea que se tiene del
grupo seria equivocada).

Cuanto más largo sea dicho grafico mayor dispersión hay, por lo que el rectángulo
indica la dispersión del 50% de los datos centrales (si es muy pequeño estarán centrados y el
resto dispersos, pero si es grande habrá menos dispersión); del mismo modo, si los bigotes son
muy largos indican que hay grupos de datos muy dispersos a diferencia de los concentrados del
rectángulo.

Y si la línea que lo divide esta en medio indica simetría, y si esta en un lado asimetría; y del
mismo la longitud de ambos bigotes pueden indicar dicha simetría.

Por lo tanto este grafico nos indica dispersión y simetría, siendo así mas preciso que un
histograma ya que tiene en cuenta los valores independientes del conjunto.

Para construir los bigotes hay que calcular el limite superior (Q3+1.5AIQ) y el limite inferior
(Q1-1.5AIQ) -calculando el AIQ restando entre Q3-Q2)-. Si dichos valores son superados por los
min y max, se pone un puntito en donde se situen. El limite superior e inferior son los limites
que tienen los bigotes, si son superados se tienen casos atípicos representados con un punto.

(AIQ= amplitud intercuartílica, diferencia en Q3 y Q1)

(Y el rectángulo solo se pone entre el Q1 y el Q3, y se le coloca )

- Con un suavizado de datos se consigue un grafico de violín (muestra la densidad de los


puntos)

 Puntuaciones directas (x)

Como interpretar un test a veces es muy difícil, es decir, no se tiene un criterio para dividir los
datos se tiende a usar las puntuaciones directas (x), diferenciales o típicas (no relacionadas con
un grupo externo, sino por el interno).

Las puntuaciones directas del test = X


Puntuaciones diferencial = x (x=X-media) /indica la distancia de una puntuación a la media del
grupo, no dice que distancia por encima o por debajo se está. Por tanto, sirve para comparar
a los sujetos del mismo grupo. No están medidas en unidades interpretables (puede estar 4
puntos por debajo o 8 por encima de la media un sujeto).

X−media
Puntuación típica = z (z= ) / como la desviación típica indica si los datos
desviacion tipiuca
están mas o menos concentrados, dice cuanto por debajo o cuanto por encima de la media
esta dicha puntuación (puede ser negativo o positivo, el numero indica el número de
desviaciones típicas que se esta por encima o por debajo de la media = el hecho de que este
3 desviaciones típicas por encima implica sumar la desviación típica 3 veces) Tienen de media
0 y desviación típica 1 en todas las pruebas.

Del mismo modo si en su formula despejamos las puntuaciones directas, podremos calcularlas
a partir de las típicas.

 La distribución normal suele oscilar entre -3 y +3

Sin embargo, estas desviaciones requieren ciertas dificultades por lo que se usan puntuaciones
estándar (tienen una media y desviación típica fijada de antemano para compararla con los
sujetos). Para calcularlas se necesitan las puntuaciones típicas.

También podría gustarte