Está en la página 1de 21

Estadística

Es la ciencia que se ocupa de la ordenación y análisis de datos procedentes de


muestras y de la realización de inferencias acerca de las poblaciones de las que
estas proceden.
 Estadística descriptiva
 Estadística inferencial
 Estadística teórica: se dedica al estudio de métodos validos para realizarse inferencias
 Estadística aplicada: es la aplicación de los métodos y modelos de actuación

Cualquier trabajo en el que se aplica la estadística se refiere a un conjunto de entidades,


conocido con el nombre de:

Poblacion estadistica: es el conjunto de todos los elementos que


cumplen una o varias características o propiedades.

A los elementos que componen una población se les denomina entidades estadísticas o
individuos. Dependiendo del numero que la componga, la población puede ser finita o infinita.
Cuando un investigador aborda un trabajo empírico claramente la población sobre la cual se
interesa. La población ha de ser el marco o conjunto de referencias sobre el cual van a recaer las
conclusiones e interpretaciones.
El hecho de que las poblaciones sean muy numerosas, suele hacer inaccesible la descripción de
sus propiedades. Por eso, se debe trabajar con:

Muestras: es un subconjunto de los elementos de una población.


Nos va a ofrecer una serie de datos que podemos ordenar, simplificar
y describir.

Para poder extraer conclusiones de las muestras, lo mas importante es que las observaciones
sean representativas.
Las poblaciones pueden caracterizarse a partir de unas constantes denominadas parámetros. Los
parámetros son desconocidos, unas de las tareas de la estadística es la de hacer conjeturas lo
mas acertadas posibles acerca de esas cantidades.

Parametro: es una propiedad descriptiva de una población.


Estaidistico: es una propiedad descriptiva de una muestra.
2
Los parámetros y estadísticos no solo son medidas, sino que pueden ser otros tipos de
cantidades, como porcentajes.
Es fundamental que la muestra sea representativa de la población y que el estadístico calculado
reúna la información necesaria y suficiente para que a partir de el podamos decir algo acerca de
la verdadera eficacia del tratamiento, el verdadero porcentaje de los que se rehabilitarían con ese
nuevo método, es decir, el parámetro.
 Los parámetros se suelen representar por letras griegas.
 Los estadísticos se suelen simbolizar por letras latinas (X, S, P, etc.)
Cuando estudiamos las entidades que conforman una población nos interesamos por alguna de
las propiedades de sus elementos y esas propiedades adoptan distintas variedades.

Caracteristica: es una propiedad o cualidad de un individuo.


Modalidad: es cada una de las maneras como se presentan una
característica.

Medición
La estadística no realiza sus funciones directamente sobre las modalidades observadas, sino que
estas se representan por números y la estadística realiza sus funciones sobre esos números.

Medicion: proceso de atribuir números a las


características.

El objetivo de la medición de una característica es conectar un sistema relacional empírico y un


sistema relacional numérico, de tal forma que las relaciones entre las entidades se reflejen en las
relaciones entre los numero que los simbolizan. Si se consigue este objetico podrán hacerse
inferencias validas acerca de las relaciones entre las entidades.
La medición estudia las condiciones de construcción de representaciones numéricas y los
modelos desarrollados por la medición se llama ESCALAS.
El científico se centra en aquellas características que considera relevantes para su trabajo de
investigación y a ellas aplica un esquema de clasificación, en el cual registra, ordena y comunica
lo observado.

En su forma más simple, un esquema no es mas que una regla que permite organizar las
observaciones en clases de equivalencias, de manera que las observaciones que son incluidas
en la misma clase son consideradas como cualitativamente iguales y las que son incluidas en
clase diferentes son consideradas como cualitativamente diferentes. Se utiliza una clase diferente

2
por cada una de las modalidades que adopta la característica que se esta estudiando. Las clases
son mutuamente exclusivas y exhaustivas, es decir, cada observación es incluida en una y solo
una clase.

Al sencillo tipo de medición que cumple estas condiciones se le llama escalamiento


cualitativo o nominal y al conjunto de clases que la integran se le llama escala
nominal.
Características que se miden a nivel nominal son:
 Los diagnósticos psicopatológicos
 El estado civil
 La comunidad autónoma donde han nacido los miembros de una muestra
 El tipo de sangre
 La asignatura preferida por los estudiantes
La clave de estas escalas de medida es que solo informan de la igualdad o desigualdad de los
individuos en una característica, pero no de posibles ordenaciones, puesto que la característica
que se refieren no se tiene en mayor o menor medida, sino que simplemente adoptan formas
cualitativamente distintas.

Un concepto íntimamente ligado al concepto de escala, es el de transformacion


admisible que hace referencia al problema de la unicidad de la medida. De un conjunto de
valores correctamente atribuidos se puede pasar a otro también correctamente atribuido mediante
una transformación admisible; se dice que una transformación de los números asignados en una
escala es una transformación admisible si preserva las características que definen a esa escala.
El conjunto de transformaciones admisibles determina el tipo de escala o grado de unicidad de la
medida.

A aquellas escalas que cumplen las siguientes características se les llama escalas
ordinales. Dos objetos con el mismo numero asignado podemos concluir que presentan la
misma modalidad, pero de dos objetos a los que se han asignado números diferentes no solo
pueden decirse que son diferentes en esa característica, sino que pueden establecerse relaciones
del tipo “mayor que” o “menor que”. Es decir, que os objetos pueden ORDENARSE.

2
La limitación de las escalas ordinales es que, aunque nos informa de que un objeto presenta la
característica en cuestión en una mayor magnitud que otro objeto, no nos dice en cuanto más.
Para poder extraer conclusiones mas precisas, como las de en cuento mas presenta la
característica un objeto sobre otro, hay que contar con una unidad de medida.

Escala de intervalo: esta impone que el numero asignado al objeto Oi y que


representamos por N (Oi), sea una función lineal. En esta se cuenta con una UNIDAD DE
MEDIDA, sin importar que tanto esta medida como el ORIGEN de la escala sean arbitrarios. Y
entonces podemos extraer consecuencias acerca de la igualdad o desigualdad de diferencias.

La limitación de esta escala es que


no cuenta con un cero absoluto; el numero cero no se corresponde con una ausencia real de esa
característica.

Escalas de razon: esta condición cumple la función de preservar el significado del


valor cero, de forma que siempre represente la ausencia de esa característica.

La consecuencia fundamental de la presencia de un origen absoluto y no arbitrario, es que


además de poder extraer conclusiones acerca de la igualdad o desigualdad de diferencias,
también puede hablarse de la igualdad o desigualdad de razones.

2
Variables
El proceso de medición se asignan números a los objetos según unas reglas y el conjunto de
valores numéricos atribuidos a las modalidades de una característica constituyendo lo que
llamamos variable estadística.

Variable: es una representación numérica de una característica

En el caso de la psicología, esta se centra en el estudio de las variables que le son propias y que
constituyen su objeto de estudio. Por el contrario, hay veces en que una característica tiene una
única modalidad, en ese caso todas las entidades estudiadas adoptarían el mismo valor numérico
y decimos que se trata de una CONSTANTE.
Las variables cuantitativas (sean de intervalo o de razón) pueden a su vez clasificarse en
VARIABLES DISCRETAS Y VARIABLES CONTINUAS, en función del numero de valores
asumibles por ellas.

Variable discreta: es aquella que adopta valores aislados (1-2-3-4…)


Variable continua: es aquella que, entre dos valores cualesquiera, por
próximos que sean, siempre pueden encontrarse valores intermedios (1,5-
1,55- 1,56- 1,60 …)

En las practica las variables continuas no pueden representarse numéricamente como tales. Los
instrumentos de medida son imprecisos y solo permiten atribuir números discretos. La medición
en la práctica supone una discretización artificial de las variables.
Las variables estadísticas se simbolizan por letras mayúsculas latinas: U, V, X, Y …,
generalmente con un subíndice, para distinguirlas de las constantes. En consecuencia, el
subíndice es un numero que nada tiene que ver con la magnitud del valor al que se esta
refiriendo, sino simplemente al lugar que dicho valor ocupa dentro de una serie de valores

Links de los videos de la catedra unidad 1:


https://www.youtube.com/watch?v=37XoZUVYCOE&feature=youtu.be

https://www.youtube.com/watch?v=V5_wmR4udzs&feature=youtu.be

https://www.youtube.com/watch?v=HfeHE1TUoB4&feature=youtu.be

https://www.youtube.com/watch?v=snS-8PapBMg&feature=youtu.be

2
> > > > > > > > Unidad 2 < < <
<<<<<
Organización y representación de datos
Bibliografía: capítulo 2, “organización y representación de datos”- libro botella.
Cuando la cantidad de números recolectados es demasiado grande, se hace difícil hacer una
inspección directo que sea realmente comprensiva. Por eso el primer paso suele consistir en
reorganizar los datos utilizados un formato mas inteligible que la simple yuxtaposición de
números. Un instrumento para conseguir esa ordenación es la denominada distribución de
frecuencias y a partir de ella se puede construir representaciones graficas.

Distribucion de frecuencias:
Son agrupaciones de los datos en tablas o gráficos, para de esta forma mostrarlos en forma
resumida y organizada, obteniendo conclusiones acerca de ellos más rápida y certeramente.
Es un instrumento diseñado para cumplir tres funciones:
a) Proporcionar una reorganización y ordenación racional de los datos recogidos.
b) Ofrecer la información necesaria para hacer representaciones graficas.
c) Facilitar los cálculos necesarios para obtener los estadísticos muestrales.
Simbología:
 X : es la variables con la que trabajamos y puede adoptar distintos valores X1, X2, X3, etc.

Frecuencia absoluta: es un valor de Xi y se simboliza por Ni. Es la cantidad de


veces que se repite una determina modalidad o valor de variable. La suma de todas las
frecuencias absolutas de una determinada distribución de frecuencias siempre debe ser
igual al total de observaciones.

Frecuencia relativa: se simboliza por Pi, es la frecuencia absoluta dividida por el N.


es decir, frecuencia relativa = frecuencia absoluta / N. informa el peso de cada valor de la
variable en el conjunto de observaciones. La suma de todas las frecuencias relativas de
una determinada distribución de frecuencias siempre es igual a 1.

Frecuencia absoluta acumulada: se simboliza Na, es la cantidad de


observaciones acumuladas hasta determinadas modalidades de la variables. Se usan
cuando queremos determinar cuantas observaciones o que porcentaje de observaciones
son menores o iguales a cierto valor. Solo tiene sentido en los niveles de medición ordinal,
intervalar y de razón.

Frecuencia relativa acumulada: se simboliza por Pa, al cociente entre su


frecuencia absoluta acumulada y el tamaño de la muestra. Pa = Na/n

2
Las frecuencias relativa se expresan en términos porcentuales para obtenerlas basta con
multiplicar por 100 las frecuencias relativas.

Una distribución de frecuencia se organiza


en forma de tabla. En una distribución de frecuencias completa aparece, una columna con los
valores que adopta la variable, creciendo de abajo hacia arriba.
Para construir la distribución de frecuencias seguimos estos pasos:
1) Ponemos en la primera columna los valores de la variable. (Xi)
2) Luego ponemos una columna de frecuencias absolutas, contamos la cantidad de veces
que se repite cada valor. (Ni)
3) Luego la columna de frecuencias relativas, para esta dividimos cada frecuencia absoluta
por N. (Pi)
4) Luego la columna de las frecuencias absolutas acumuladas, sumando para cada valor su
frecuencia absoluta mas la absoluta acumulada del valor anterior. (Na)
5) Y por ultima la columna de frecuencias relativas acumuladas, en donde dividimos cada
frecuencia absoluta acumulada por N. (Pa)

A veces no surgen ciertas complicaciones a la hora de distribuir las frecuencias. Una primera
dificultad, es el excesivo número de valores distintos. Una segunda dificultad, es que hay valores
intermedios que no aparecen. El resultado en los dos casos, seria una tabla excesivamente
grande e inmanejable que difícilmente ayudaría a los objetivos para los que ha sido diseñada. En
estos casos, se aplicará lo que se denomina agrupación en intervalos, que consiste en formar
grupos de valores consecutivos, llamados intervalos y poner uno de estos grupos en cada fila. En
la distribución de frecuencias con valores agrupados en intervalos aparecen algunos elementos
nuevos:

 Intervalo: se lo llama a cada uno de los grupos de valores que ocupan una fila en una
distribución de frecuencias. También pueden ser llamados clases.
 Limites aparentes o informados: es un intervalo de valores mayor y menos que
puede adoptar la variable dentro de ese intervalo, según el instrumento de medida
utilizado.
 Limites exactos: se lo llama a un intervalo a los valores máximos y mínimos incluidos
en el intervalo y que podrían medirse si se contara con un instrumento de precisión
perfecta.
 Punto medio: es la suma de sus limites exactos partidos por dos. Se puede llamar
“marca de clase”

2
 Amplitud: es la diferencia entre su limite exacto superior y su limite exacto inferior.
Suele representarse por la letra I.
Para hacer una distribución de frecuencias no hay unas normas muy rigurosas. Pero
plantearemos tres:
a) El intervalo superior debe incluir al mayor valor observado.
b) El intervalo inferior debe incluir al menor valor observado.
c) Cada intervalo debe incluir el mismo numero de valores.
Y también algunas directrices:
1) Dado que el objetivo de una distribución de frecuencias es conseguir una ordenación
manejable que ayude a comprender el significado de los datos, no es conveniente que el
numero de intervalos sea demasiado grande.
2) Como consecuencia de lo anterior, podemos sentirnos inclinados a reducir al máximo el
número de intervalos, pero los intervalos tendrían una excesiva amplitud.
Lo que podemos decir es que el numero apropiado de intervalos debe ser tal que, con ellas se
consiga una agrupación operativa y que cumpla los objetivos para los que ha sido diseñada la
distribución de frecuencias.

Supuestos de distribución intraintervalo


Una vez confeccionada una distribución de frecuencias con datos agrupados en intervalos, se
puede utilizar para hacer representaciones graficas y para facilitar los cálculos de estadísticos.
Dado que de cada puntuación solo sabemos el intervalo al que pertenece, un procedimiento que
a veces resultara útil consiste en asumir el supuesto de concentración en el punto medio. Pero
no resulta apropiado porque interesa la adopción de un criterio que asigne valores distintos a los
elementos de un mismo intervalo. Un criterio de este tipo se sigue cuando se asume el supuesto
de distribución homogénea.

Representaciones graficas:

Graficos: son las posibilidades mas elementales de presentar las distribuciones de


frecuencias de manera que puedan ser aprehendidas visualmente para un primer análisis de los
datos. La ventaja con respecto de las tablas de distribuciones de frecuencias es que se permite
una más fácil interpretaciones y análisis de los datos, al mostrar las frecuencias mediante
símbolos, barras, polígonos y sectores

Para variables cualitativas medidas a nivel nominal, suele usarse el diagrama


circular o diagrama de sectores circulares o llamado pictograma. Y para nivel
tanto nominal como ordinal el grafico de barras.

2
A partir de las distribuciones de frecuencias se pueden construir representaciones graficas. La
función, es dar informaciones globales mediante un solo golpe de vista.

 Diagrama de rectangulos: este tipo de


representaciones se suele utilizar para variables
nominales, pero también para variables ordinales.

 Perfil ortogonal: se utiliza mucho en informes psicopedagógicos o de rendimiento.

 Pictograma: son representaciones en


forma de círculos en las que estos son
divididos en secciones cuy superficie es
proporcional a la frecuencia de la
modalidad correspondiente.

 Diagrama de barras: se utiliza para variables cuantitativas discretas. Ene el eje de abscisas
distintos valores de la variable y en el eje de ordenadas
las frecuencias.

 Histograma: se utiliza para variables


cuantitativas continuas con datos agrupados en
intervalos.

2
 Poligono de frecuencias: se utiliza para variables discretas. Es una figura que
resulta de unir los extremos superiores de las que hubiera sido las barras.

 Diagrama de barras acumulativo: se


utiliza en variables discretas.

 Poligono de frecuencias acumuladas:


se utiliza para variables continuas.

Convenciones sobre las representaciones graficas


a) En el eje de abscisas colocamos los valores de la variable y en el de ordenadas las
frecuencias.
b) La intersección es el origen.
c) Conviene incluir en cada grafico toda la información posible para evitar ambigüedades y
facilitar su interpretación

Tendenciosidad en las representaciones graficas


Las representaciones graficas pueden utilizarse de manera tendenciosa para inducir impresiones
engañosas e interesadas.
Un primero método consiste en recortar el eje de ordenadas, eliminando los menores valores de
frecuencia con la excusa de que no hay ninguna observación que las adopte. Esto tiene como
consecuencias que pequeñas diferencias parezcan mayores.
Un segundo tipo, se utilizan en figuras representativas de aquello que se esta midiendo. Como
consecuencia, la superficie de las figuras no guarda relación con las frecuencias observadas,
dado la impresión de que la diferencia es mayor que la realmente registrada.

Propiedades de las distribuciones de frecuencias


Vamos a describir cuales son las características o propiedades y utilizaremos curvas suavizadas
que son polígonos de frecuencias.

2
 Tendencia central: se refiere a la
magnitud general de las observaciones
hechas. Pueden cuantificarse mediante
INDICES DE TENDENCIA CENTRAL O
PROMEDIOS.

 Variabilidad: se refiere al grado


de concentración de las
observaciones en torno al promedio.
Será homogénea o poco variable si
los datos difieren poco entre si y se
agolpan en torno a su promedio. Será
heterogénea o muy variable si los
datos se dispersan mucho con respecto al promedio.

 Asimetria o sesgo: esta


propiedad se refiere, al grado en que
los datos tienden a concentrarse en
los valores centrales, en los valores
inferiores al promedio o en los
valores superiores a este.

 Curtosis: se refiere al grado


de apuntamiento de la
distribución de frecuencias. Si
es muy apuntada, se llama
leptocúrtica y si es muy
aplastada, se llama platicúrtica.
Respecto a la curtosis es una
distribución normal y se la llama
mesocúrtica.

2
Links de los videos de la catedra unidad 2:
https://www.youtube.com/watch?v=sJX0KBMaSMk&feature=youtu.be
https://www.youtube.com/watch?v=2gj3MLW0vlY&feature=youtu.be
https://www.youtube.com/watch?v=hcC7Cw3e2vg&feature=youtu.be

unidad 3:
https://www.youtube.com/watch?v=t9saRunwPoQ&feature=youtu.be
https://www.youtube.com/watch?v=gDfmcWvTNw8&feature=youtu.be
https://www.youtube.com/watch?v=qS9ulvsRtzo&feature=youtu.be
https://www.youtube.com/watch?v=bAjAjxdoHd8&feature=youtu.be
https://www.youtube.com/watch?v=TzrPkF1izGU&feature=youtu.be
https://www.youtube.com/watch?v=HKlzfKMRWMY&feature=youtu.be
https://www.youtube.com/watch?v=TRjGzSNERFc&feature=youtu.be

> > > > > > > > Unidad 3 < < < <
<<<<
Resúmenes estadísticos en los distintos niveles de medición
Bibliografía:
 Capítulo 3 de Botella (Hasta punto 3.3.3 inclusive).
 Capítulo 4 de Botella (Hasta punto 4.5 inclusive).
 Capítulo 5 de Botella (Hasta punto 5.2.3 inclusive).
 Capítulo 6 de Botella (Puntos 6.1 y 6.2).
 Capítulo 7 de Botella (Hasta punto 7.3 inclusive).
 Coeficiente de Variación según Botella.

resumenes estadisticos: sirve para describir lo que paso en la muestra con respecto a la
variable que nos interesa estudiar.
 La distribución de los casos de una muestra con respecto a los valores de una variable
(distribución de frecuencias de una variable) tiene distintas propiedades o características
que vamos a querer describir.
 Los resúmenes estadísticos describen casa una de estas características de las muestras.

La tendencia central de los datos: resume en un solo valor de la variable la tendencia


general que se observa en la distribución de frecuencias de una variable. Son una síntesis de
como se presento una variable en un conjunto de datos. Se cuantifica con: moda, mediana y
media.

La variabilidad del conjunto de datos: esta propiedad nos indica cuanto difiere los
valores entre si. Y refiere al grado de concentración de las observaciones.
 Menos variabilidad: mayor concentración de los casos en uno o unos pocos calores de la
variable. Los casos son más homogéneos o parecidos entre si con respecto a la variable
estudiada.

2
 Mas variabilidad: mayor dispersión de los casos en el recorrido de los valores de la
variable. Los casos son más homogéneos o diferentes entre si con respecto a la variable
estudiada.

Medidas de tendencia central: estas medidas son de resumen de nuestros datos.


Hacen referencia a la magnitud general de observaciones. Nos permiten sintetizar los valores de
las variables.
 Media aritmética: es la suma de los valores
observados dividido por el numero de ellos.

 Mediana: representa a la puntuación que es superada por la mitad de las observaciones,


pero no por la otra mitad. Se calculo de mismo modo que el centil 50.
 Moda: representa al valor mas frecuentemente observado.

¿Cuándo usar cada una?


Media aritmética: cuando se trate de una variable con al menos nivel de medición intervalar
o nivel de cocientes o razones.
Mediana: cuando existan puntuaciones extremas no compensadas. Y se trate de una
variable con nivel de medición ordinal.
Moda: cuando se trate de una variable con nivel de medición nominal.

Propiedades de la media aritmetica:


1. La suma de las diferencias de n puntuaciones con respecto a su media, o puntuaciones
diferenciales es igual a cero. La razón es
que unas son positivas y otras negativas
(las que superan la media, positivas y las
que quedan por debajo de ella, negativas)
y se compensan unas con otras.
Esta propiedad es la que permite
interpretar a la media como “el centro de equilibrio de la distribución”.
En efecto si imaginamos los valores de la variable como los puntos de una barra rígida y
sus frecuencias como sus pesos, la media representa el punto sobre el que habría que
apoyar tal barra para mantenerla equilibrada; es decir, su centro de gravedad.

2. La suma de los cuadrados de las desviaciones de unas puntuaciones con respecto a su


media (puntuaciones diferenciales con respecto a la media) es menor que con respecto a
cualquier otro valor.

2
3. Si sumamos una constante a un conjunto de puntuaciones, la media quedara aumentada
en esa misma constante.

4. Si multiplicamos por una constante a un conjunto de puntuaciones, la media aritmética


quedara multiplicada por esa misma constante.

5. Otro método, nos permite calcular la media del grupo total, a partir del conocimiento de las
media de cada uno de los grupos parciales y de sus tamaños. La formula puede
denominarse media ponderada: la media de un grupo de puntuaciones, cuando se
conocen los tamaños y medias de varios subgrupos hechos a partir del total, mutuamente
exclusivos y exhaustivos, pueden obtenerse ponderando las medias parciales a partir de
los tamaños de los subgrupos en que han sido calculadas.

6. Una variable definida como la combinación lineal de otras variables, tiene como media la
misma combinación lineal de las medias de las variables intervinientes en su definición.

Comparacion entre medidas de tendencia central:


¿con que criterios elegimos uno sobre los demás para representar la magnitud general
observada en unos valores o para comparar la de dos o mas grupos de valores?
Se preferirá siempre la media, ya que es el mejor estimador de su parámetro que la
mediana y la moda. Significa que, las medidas halladas sobre muestras representativas se
parecen mas a la media poblaciones que lo que se parecen las medianas y modas muestrales a
la mediana y la moda poblacional.
¿Qué razones pueden hacernos preferir otro índice, como la mediana?

2
Hay tres situaciones en las que se preferirá la mediana a la media:
 Cuando la variable esta medida en una escala ordinal
 Cuando haya valores extremos que distorsionen la interpretación de la media. La
media es extremadamente sensible a la puntuación y un cambio en solo una de
ellas supone un cambio en la media aritmética.
 Cunado haya intervalos abiertos. Se refiere a situaciones en las que el intervalo
superior carece de limite superior, el intervalo inferior carece de limite inferior o
ambas cosas a la vez.
Pero no siempre se puede utilizar la mediana. A veces se presenta casos en los que es mas
apropiado utilizar la moda. Se puede decir en regla general, que la mediana será la segunda
candidata para representar la tendencia central.
¿Qué razones pueden hacernos preferir la moda sobre la mediana?
a) Cuando se trate de una variable medida en una escala nominal.
b) Cuando haya intervalos abiertos y la mediana pertenezca a uno de ellos. La formula de los
centiles supone un distribución homogénea de los valores dentro del intervalo. Esto puede
hacerse solo si el intervalo esta cerrado.

Medidas de variabilidad:
Una de las propiedades mas importantes de los conjuntos de datos es el grado en que
estos se parecen o se diferencian entre sí. Esta propiedad se denomina variabilidad,
dispersión u homogeneidad.
La tendencia central y la variabilidad son propiedades diferentes y puede haber grupos de
datos con la misma tendencia central y diferente variabilidad y viceversa. Se trata de medir
el grado de variación que hay en un conjunto de datos.
Al estudiante de psicología, la variabilidad de los datos esta reflejando el hecho
incuestionable de las diferencias individuales y estas con uno de los objetos primordiales.
Procedimientos para cuantificar la variabilidad:

 Varianza: Una solución al problema de que las distancias con respecto a la


media sumen cero consiste en elevar al cuadrado esas distancias antes de hallar su
promedio, dado que los cuadrados son siempre positivos.

La varianza sirve sobre todo para comparar el grado de dispersión de dos o mas
conjuntos de valores en una misma variable. No tiene sentido comparar varianzas
halladas sobre variables distintas.
 Desviacion tipica: se calcula la raíz cuadrada de la cantidad obtenida y se
define sencillamente como la raíz cuadrada de la varianza.

2
La desviación típica en un mejor descriptor de la variabilidad.

Algunas caracteristicas de la varianza y la desviacion tipica


 Primera propiedad: Un conjunto de valores puede mostrar un mayor y menor grado
de homogeneidad, pero el grado mas pequeño posible de homogeneidad se
produce cuando todos los valores son idénticos. Se enuncia asi:

 Segunda propiedad:

 Tercera propiedad:

 Cuarta propiedad:

2
Otras medidas de variacion:
Una forma de sencilla de indicar el grado de dispersión consiste en calcular la distancia entre el
mayor y el menor de los valores observados. Este índice se llama amplitud total, rango o
recorrido y se obtiene sencillamente hallando la diferencia entre los valores extremos.

Otra medida, consiste en tomar las desviaciones con respecto a la meida o puntuaciones
diferenciales, en valor absoluto. Este índice se llama desviación media (DM):

Cuando en las puntuaciones hay algún valor extremo que pudiera distorsionar la
representatividad de la varianza, se puede utilizar otro índice, basado solo en las puntuaciones
correspondientes a los cuartiles primero y tercero. Se denomina Amplitud semi-intercuartil:

A veces se desea comparar la variabilidad de grupos cuya media es distinta. Entonces, se


propuso relativizar la desviación típica con respecto a la media. Se denomina coeficiente de
variación (CV), es expresado como un porcentaje:

Este coeficiente puede considerarse también como un índice de la representividad de la media.


Cuanto mayor es el coeficiente de variación, menos representativa es la media.

Medidas de posicion o cuantiles:


2
Son índices diseñados para revelar la situación con respecto a su grupo de referencia. Una
puntuación por si sola no nos da información si no se la pone en relación a otras puntuaciones
que son tomadas como grupo de referencia.
Indican que porcentaje de caos de la muestra quedan por debajo de un valor determinado de la
variable.

 Centiles: son 99 valores de la variable que dividen a la distribución en 100


secciones, cada una conteniendo a la centésima parte de las observaciones (1%).
Por ejemplo: el centil 25 supera al 25% de las observaciones y es superado por el
75% de las mismas.

 Deciles: son 9 valores de la variable que dividen a la distribución en 10


secciones, cada una conteniendo a la decime parte de las observaciones.
Por ejemplo: el decil 2 supera al 20% de las observaciones y es superado por el
80% de las mismas.
 Cuartiles: dividen el recorrido de la variable en cuatro subconjuntos tales que la
frecuencia de cada uno no supera a la cuarta parte del tamaño de muestra. Los
cuartiles son 3. El segundo cuartil coincide con el centil 50 y la mediana.
Las medidas de posición también pueden ser utilizadas para caracterizar a las distribuciones de
frecuencias. Además, para comparar la posición relativa de la puntuación en dos conjuntos de
datos diferentes.

2
Medidas de Asimetría y Curtosis
Tal como lo plantea Botella, además de la tendencia central y la variabilidad, hay otras dos características
con las que se pueden describir y comparar las distribuciones de frecuencias.
Estas dos medidas se refieren a la forma que toma la representación gráfica de la distribución de frecuencias.

Asimetria:
El grado de asimetría de una distribución hace referencia al grado en que los datos se reparten
equilibradamente por encima y por debajo de la tendencia central.
Es importante tener en cuenta que el índice de asimetría se basa en la relación entre la media y la moda y se
define como la distancia entre la media y la moda medida en desviaciones típicas. Es decir:
AS=(media-moda)/desviación típica.
Como ejemplo de dos distribuciones asimétricas podríamos pensar que:
Si un examen (evaluado con calificaciones del 1 al 10) resultó muy fácil abundarán las notas altas y la
representación gráfica quedará inclinada hacia la derecha. En este caso, el índice de asimetría es negativo,
ya que la media es inferior a la moda. Por lo tanto, en esta distribución, los valores de la variable
“calificaciones obtenidas en el examen” tienden a agruparse por encima de la media.
Si, por el contrario, el examen resultó difícil abundarán las notas bajas y la representación gráfica quedará
inclinada hacia la izquierda. En este caso, el índice de asimetría será positivo, ya que la media será mayor
que la moda. Por lo tanto, en esta distribución, los valores de la variable “calificaciones obtenidas en el
examen” tienden a agruparse por debajo de la media.
Por otra parte, si una distribución es simétrica sus frecuencias se reparten equitativamente alrededor de la
media. En una distribución simétrica coinciden la media y la moda y el índice de asimetría es igual a 0.
Una distribución simétrica sólo es posible en distribuciones unimodales (con una sola moda). En este tipo de
distribuciones, los valores de la variable tienden a agruparse en torno de la media

Curtosis
La curtosis expresa el grado de apuntamiento de la curva que representa gráficamente a la distribución de
frecuencias.
A mayor curtosis, mayor apuntamiento de la curva que representa gráficamente la distribución de
frecuencias. Por lo tanto, en la medida que una distribución presente un grado de apuntamiento mayor,
mayor será la homogeneidad entre los valores de la variable y menor será la variabilidad entre los
mismos.
A menor curtosis, menor apuntamiento de la curva que representa gráficamente la distribución de
frecuencias. Por lo tanto, en la medida en que una distribución presente un grado de apuntamiento menor,
menor será la homogeneidad, los valores de la variable serán más heterogéneos y habrá mayor variabilidad
entre los mismos.

2
Si el índice de curtosis es igual a 0, la curva tendrá un grado de curtosis similar al de la distribución normal
y, según la terminología de Pearson, se dice que es mesocúrtica.
Si este índice es positivo, el apuntamiento de la curva es mayor que el de una distribución normal y se
dice que es una distribución leptocúrtica.
Por último, si este índice es negativo, el apuntamiento de la curva que representa la distribución de
frecuencia es menor que el de la distribución normal y se trata de una distribución platicúrtica.

CAPÍTULO 6: Puntuaciones típicas y escalas derivadas.


Comparar las magnitudes mediante la comparación de los valores asociales a ellas. Otras
soluciones, que se basan en la transformación de las puntuaciones observadas en otras
que, sin perder o distorsionar la información contenida en las puntuaciones originales,
permitan una comparación directa de las mismas.
 PUNTUACIÓN TÍPICA
Un sujeto obtuvo una puntuación 43 al medir sobre él la variable X, y queremos hacer una
valoración de este dato, hay una dificultad de carecer de referencias apropiadas para hacer
esa valoración. Una forma es calcular lo que definimos como puntuación diferencial, que es
la distancia o diferencia entre esa puntuación y la media del grupo de puntuaciones. Las
puntuaciones diferenciales nos indican si la puntuación es superior o inferior a la
media o si coincide con ella. Sin embargo estas son informaciones insuficientes para
comparar puntuaciones de sujetos pertenecientes a distintos grupos o a distintas variables.
Una solución consiste en no medir las distancias a la media en términos absolutos, sino
con relación a la variabilidad del grupo de referencia. Se trataría de indicar
como de grande es una distancia en términos de las distancias observadas en general en
esas puntuaciones. Se la denominan como puntuaciones típicas, se representa por letra z.
Al proceso de obtención de las puntuaciones típicas se llama tipificación. La formula de z
es: zi =Xi - X/ Sx
Las puntuaciones típicas permiten, por tanto, hacer comparaciones entre unidades de
distintos grupos, entre variables medidas de distintas formas, o incluso entre variables
diferentes. En cualquier caso, las puntuaciones típicas siempre nos indicarán el número de
desviaciones típicas (de las de ese grupo y variable) que se separan de la
media (de ese grupo y variable) y si esa desviación es por encima o por debajo de la media
(según el signo de la puntuación típica).
Las características de las puntuaciones típicas son universales, no dependen del tipo de
puntuaciones ni de su dispersión, ni de su número.
Las puntuaciones típicas reflejan las relaciones esenciales entre las puntuaciones, con
independencia de la unidad de medida que se haya utilizado en la medición. Cuando en
dos conjuntos de puntuaciones, emparejadas con algún criterio, a los elementos de cada
para les corresponde la misma puntuación típica dentro de su conjunto, puede decirse que
mantienen la misma estructura interna, y se dice entonces que son puntuaciones
equivalentes.
 ESCALAS DERIVADAS
La puntuación típica de una observación indica el número de desviaciones típicas que esa
observación se separa de la media del grupo de observaciones
La media de las puntuaciones típicas es cero, mientras que su varianza y desviación típica
son iguales a uno
Inconvenientes que surgen de las desviaciones típicas. En concreto y dado que la media
de las típicas es cero y su desviación típica uno, buena parte de las puntuaciones suelen
ser negativas, y casi todas decimales. Esto hace que resulte incómodo su tratamiento y
que muchas veces se busquen procedimientos que permitan superar esta dificultad. Un

2
procedimiento consiste en transformar las puntuaciones típicas en otras que retengan
todas las relaciones que manifiestan las puntuaciones originales, por tanto que sean
puntuaciones equivalentes, pero evitando la dificultad operativa, y que constituyen lo que
se denomina una escala derivada. Estas transformaciones se basan en una propiedad de
las puntuaciones típicas.
En resumen la construcción de una escala derivada parte de unas puntuaciones directas,
éstas se tipifican, y después se transforman linealmente en otras puntuaciones.
La cuestión fundamental de las escalas derivadas consiste en transformar las
puntuaciones originales, Xi, en otras puntuaciones transformadas, Ti, tales que sean más
cómodas de tratar e interpretar, pero que a la vez retengan las relaciones comerciales
entre los valores, es decir, que sean puntuaciones equivalentes.

También podría gustarte