Está en la página 1de 23

ANLISIS DE DATOS EN PSICOLOGA 1

1. CONCEPTOS GENERALES
1.1 Introduccin
La estadstica actual no slo es un conjunto de tcnicas para resumir y
transmitir informacin cuantitativa, sino que sirve tambin, y fundamentalmente,
para hacer inferencias, generalizaciones y extrapolaciones de un conjunto
relativamente pequeo de datos a un conjunto mayor
!stadstica es la ciencia que se ocupa de la ordenacin y an"lisis de datos
procedentes de muestras, y de la realizacin de inferencias acerca de las
poblaciones de las que stas proceden
1.2 Conceptos ener!"es
#e llama poblacin estadstica al conjunto de todos los elementos que cumplen
una o varias caractersticas o propiedades
$na muestra es un subconjunto de los elementos de una poblacin
$n par"metro es una propiedad descriptiva de una poblacin
$n estadstico es una propiedad descriptiva de una muestra
$na caracterstica es una propiedad o cualidad de un individuo
$na modalidad es cada una de las maneras como se presenta una
caracterstica
1.# $edicin
La estadstica no realiza sus funciones directamente sobre las modalidades
observadas, sino que stas se representan por n%meros, y la estadstica realiza
sus funciones sobre esos n%meros
#e llama medicin al proceso de atribuir n%meros a las caractersticas
La asignacin de n%meros a las caractersticas se hace siguiendo unas reglas,
del estudio de los modelos mediante los cuales conocemos las reglas para una
correcta atribucin de los n%meros se ocupa la &eora de la 'edida
( partir de una caracterstica se puede establecer un sistema relacional
emprico )emprico, porque se refiere a entidades y relaciones reales* !l
sistema numrico est" formado por un conjunto de entidades )n%meros* y unas
relaciones entre ellos #e trata de un sistema relacional numrico
!l objetivo de la medicin de una caracterstica es conectar un sistema
relacional emprico y un sistema relacional numrico, de tal forma que las
relaciones entre las entidades se reflejen en las relaciones entre los n%meros
1
que los simbolizan #lo si se consigue este objetivo ocurrir" que de las
relaciones entre los n%meros podr"n hacerse inferencias v"lidas acerca de las
relaciones entre las entidades
La medicin estudia las condiciones de construccin de representaciones
numricas, y los modelos desarrollados para la medicin se llaman escalas
&enemos las escalas nominales, ordinales, cuantitativas de intervalo y
cuantitativas de razn
!scalas nominales+ la clave de estas escalas de medida es que slo informan
de la igualdad o desigualdad de los individuos en una caracterstica, pero no de
posibles ordenaciones, puesto que la caracterstica a la que se refieren no se
tiene en mayor o menor medida, sino que simplemente adopta formas
cualitativamente distintas
$n concepto ntimamente ligado al concepto de escala, y que de hecho las
caracteriza, es el de transformacin admisible, que hace referencia al problema
de la unicidad de la medida La cuestin de la unicidad puede plantearse de la
siguiente forma+ ,es la representacin numrica que hemos construido la %nica
posible- !n general la respuesta ser" negativa
#e dice que una transformacin de los n%meros asignados en una escala es
una transformacin admisible si preserva las caractersticas que definen a esa
escala, es decir, si los n%meros transformados tambin representan al sistema
emprico
!sta transformacin de los valores originales es una transformacin admisible
porque los valores obtenidos mediante su aplicacin siguen cumpliendo las
condiciones especificadas anteriormente para toda escala nominal !n trminos
m"s tcnicos diramos que en una escala nominal son admisibles todas las
transformaciones que supongan aplicaciones inyectivas
La aplicacin de una regla de asignacin de n%meros a las diferentes
cantidades de tal forma que los n%meros asignados a los objetos reflejen esos
distintos grados en los que se presenta la caracterstica Los n%meros
asignados nos permitir"n extraer conclusiones acerca de las magnitudes (
veces lo %nico que esos n%meros nos permiten inferir son relaciones de tipo
.mayor que/ o .menor que/
( aquellas escalas de medida que cumplen estas caractersticas se les llama
escalas ordinales &ambin se dice que se est" haciendo una medicin a nivel
ordinal Los objetos pueden ordenarse, y de ah el nombre de la escala
!n psicologa son muchas las caractersticas cuya medicin se considera que
est" a nivel ordinal, pues son muchos los casos en los que lo %nico que puede
decirse es que un individuo es m"s extravertido que otro, que un nio es m"s
hiperactivo que otro, o que el aprendizaje es m"s r"pido con el mtodo ( que
con el mtodo 0
2
(pliquemos de nuevo el concepto de transformacin admisible a este tipo de
escalas 1o todas las transformaciones que eran admisibles en las escalas
nominales lo son para las escalas ordinales
(l igual que en las escalas nominales, las ordinales tienen unas
transformaciones admisibles, que lgicamente ser"n todas aquellas que
preserven las caractersticas de la escala ordinal #e puede demostrar que esto
ocurre con todas aquellas transformaciones que cumplan la condicin de ser
transformaciones crecientes
#e dice que la transformacin es creciente si para todo par de objetos a y b se
cumple la siguiente condicin+
#i n )a* > n )b*, entonces t[ n )a* ] > t[n)b*]
La limitacin de las escalas ordinales es que aunque nos informa de que un
objeto presenta la caracterstica en cuestin en una mayor magnitud que otro
objeto, no nos dice en cu"nto m"s 2ara poder extraer conclusiones m"s
precisas, como la de en cu"nto m"s presenta la caracterstica un objeto sobre
otro, hay que contar con una unidad de medida, y para ello hay que pasar al
siguiente tipo de escala
!scala de intervalo, la tercera condicin aadida a las exigidas para una escala
ordinal impone que el n%mero asignado al objeto y que representamos por
n)o
i
*, sea una funcin lineal de la magnitud real que ese objeto representa en la
caracterstica en cuestin 3uenta con una unidad de medida, si se cumple
esta tercera condicin podemos extraer consecuencias acerca de la igualdad o
desigualdad de diferencias
#i la diferencia entre los n%meros asignados a dos objetos es igual a la
diferencia entre los n%meros asignados a otros dos, tambin son iguales las
diferencias en magnitudes entre estos dos pares $na mayor diferencia entre
los n%meros asignados implica una mayor diferencia entre las magnitudes
representadas
!l ejemplo cl"sico de este tipo de escalas es el de las temperaturas
Las transformaciones admisibles para las escalas de intervalo no significan
m"s que un cambio en la unidad de medida y en el origen asignado a la escala,
valores ambos arbitrarios en este tipo de escalas
La principal limitacin de este tipo de escalas es que no tiene un cero absoluto
!l n%mero cero no representa realmente la ausencia de esta caracterstica
Las escalas de razn
!sta tercera condicin cumple la funcin de preservar el significado del valor
cero, de forma que siempre representa la ausencia de esa caracterstica La
consecuencia fundamental de la presencia de un origen absoluto, y no
arbitrario, es que adem"s de poder extraer conclusiones acerca de la igualdad
3
o desigualdad de diferencias, tambin puede hablarse de la igualdad o
desigualdad de razones
14'51(L
!l sexo de los individuos se clasifica simbolizando con un 6 .hembra/ y con un
7 .varn/ 2osteriormente se hace una transformacin admisible, 6 8 y 7
9
4:;51(L
La dureza de los elementos se ordena, asign"ndoles n%meros que representen
esa ordenacin 2osteriormente se hace una transformacin admisible, es
decir, una que respeta esa ordenacin
51&!:<(L4
Las cantidades de calor, pueden representarse por distintos conjuntos de
n%meros, en tanto en cuanto en ellos se mantenga la diferencia de temperatura
entre los objetos 7 y = sea la misma que la diferencia entre los objetos 9 y >, y
ambas sean mayores que la diferencia entre los objetos = y 9 !stas
condiciones las cumplen tanto la escala centgrada como la escala ?ahrenheit
(dem"s, de cualquiera de ellas puede pasarse a la otra, pues cada una es una
transformacin admisible para la otra 3ada una tiene su propia unidad de
medida y su origen propio
:(@A1
Las longitudes, pueden representarse tambin por distintos conjuntos de
n%meros, en tanto en cuanto en ellos se mantenga que le objeto = tenga el
doble que le objeto 7, y que el cociente entre los n%meros asignados a los
objetos 9 y 7 sea mayor que el cociente entre los n%meros asignados a los
objetos = y 7 !stas condiciones se cumplen tanto al medir en metros como al
medir en yardas #e puede pasar de una a otra, son transformaciones
mutuamente admisibles, ya que aunque cada una tiene su unidad de medida,
ambas respetan el cero absoluto, que coincide con las dos, y representa la
ausencia de esta caracterstica
Tipo
In%or&!cin
deduci'"e
Tr!ns%or&.
!d&isi'"es
E(e&p"os
Nominal
:elaciones .igual
que/ o .distinto que/
(plicaciones
inyectivas
#exo, estado civil,
diagnstico clnico
Ordinal
:elaciones .mayor
que/ o .igual que/
?unciones
crecientes
;ureza, nivel
socioeconmico, grado de
asertividad
Interval
o
5gualdad o
desigualdad de
diferencias
( B b x )b 6*
&emperatura, calendario,
inteligencia
4
Razn
5gualdad o
desigualdad de
razones
0 x )b 6* Longitud, peso
1.#.1 L!s )!ri!'"es* c"!si%ic!cin + not!cin
$na variable es una representacin numrica de una caracterstica
E(e&p"o
Tipo de
estudio
,!ri!'"es Tipo de esc!"!
7 ;escriptivo Crado de patrn ( 5ntervalo
= 5nferencial
Crupo, 1ivel cultural,
5nteligencia, estrs
1ominal, 4rdinal,
5ntervalo, 5ntervalo
9 5nferencial &iempo de reaccin :azn
> 5nferencial 5ntencin de voto 1ominal
Est!d-stic! descripti)! con un! )!ri!'"e
2 ORGANI.ACI/N 0 REPRESENTACI/N DE DATOS
2.2 Distri'ucin de %recuenci!s
La distribucin de frecuencias es un instrumento diseado para cumplir tres
funciones+
2roporcionar una reorganizacin y ordenacin racional de los datos
recogidos
4frecer la informacin necesaria para hacer representaciones gr"ficas
?acilitar los c"lculos necesarios para obtener los estadsticos muestrales
#e llama frecuencia absoluta de un valor D
i
, y se simboliza por n
i
, al
n%mero de veces que se repite el valor D
i
, en la muestra
#e llama frecuencia relativa de un valor D
i
, y se simboliza por p
i
, al
cociente entre la frecuencia absoluta de ese valor y el tamao de la
muestra !s decir+ p
i
E n
i
F n
#e llama frecuencia absoluta acumulada de un valor D
i
, y se simboliza
por n
a
, al n%mero de veces que se repite en la muestra ese valor D
i
, o
cualquier otro valor inferior
#e llama frecuencia relativa acumulada de un valor D
i
, y se simboliza por
p
a
, al cociente entre su frecuencia absoluta acumulada y el tamao de la
muestra !s decir+ p
a
E n
a
F n
5
Las frecuencias relativas, se expresan en trminos porcentuales #uelen
representarse con may%sculas, para obtenerlas basta con multiplicar por 766
las frecuencias relativas 2ara cualquier valor de la variable, D
i
tenemos que+
2
i
E p
i
G 766 y 2
a
E p
a
G 766
$na distribucin de frecuencias se organiza en forma de tabla !n una
distribucin de frecuencias completa aparece, una columna con los valores que
adopta la variable, creciendo de abajo hacia arriba
3onstruimos la distribucin de frecuencias siguiendo los pasos descritos+
7 2onemos en la primera columna esos valores, creciendo de abajo hacia
arriba
= 2ara la columna de frecuencias absolutas contamos el n%mero de veces
que se repite cada valor, si el n%mero de valores es muy grande
conviene ir haciendo marcas por cada valor, para contarlas al final
9 2ara la columna de frecuencias relativas dividimos cada frecuencia
absoluta por n
> 2ara obtener las frecuencias absolutas acumuladas sumamos para cada
valor su frecuencia absoluta m"s la absoluta acumulada del valor
anterior
8 2ara las frecuencias relativas acumuladas dividimos cada frecuencia
absoluta acumulada por n La frecuencia relativa acumulada del valor
mayor debe ser igual a 7
;istribucin de frecuencias construida sobre el ejemplo del n%mero de hijos
)texto*
1
i
n
i
p
i
n
!
p
!
> 7 668
=
6
766
9 9 678
7
H
6H8
= I 698
7
J
6K6
7 J 696 H 6>8
6 9 678 9 678
=
6
766
(grupacin en intervalos+ consisten en formar grupos de valores consecutivos,
llamados intervalos, y poner uno de estos grupos en cada fila, en lugar de
poner cada valor individual por separado 3ada uno de estos grupos suele
indicarse en la distribucin de frecuencias poniendo los valores mayor y menos
incluidos en l
6
( continuacin se calculan las frecuencias absolutas conjuntas de los valores
incluidos en el intervalo, haciendo lo mismo despus con las frecuencias
relativas, las absolutas acumuladas y las relativas acumuladas
#e llama intervalo a cada uno de los grupos de valores que ocupan una
fila en una distribucin de frecuencias !n algunos textos se llaman
clases
#e llaman lmites aparentes o informados de un intervalo a los valores
mayor y menor que puede adoptar la variable dentro de ese intervalo,
seg%n el instrumento de medida utilizado
#e llaman lmites exactos de un intervalo a los valores m"ximo y mnimo
incluidos en el intervalo y que podran medirse si se contara con un
instrumento de precisin perfecta
#e llama punto medio de un intervalo a la suma de sus lmites exactos
partido por dos !n algunos libros se llama marca de clase
#e llama amplitud de un intervalo a la diferencia entre su lmite exacto
superior y su lmite exacto inferior #uele representarse por la letra 5
2ara hacer una distribucin de frecuencias+
7 !l intervalo superior debe incluir al mayor valor observado
= el intervalo inferior debe incluir al menor valor observado
9 3ada intervalo debe incluir el mismo n%mero de valores
;ado que el objetivo de una distribucin de frecuencias es conseguir una
ordenacin manejable que ayude a comprender el significado de los datos, no
es conveniente que el n%mero de intervalos sea demasiado grande
3omo consecuencia de lo anterior, podemos sentirnos inclinados a reducir al
m"ximo el n%mero de intervalos, pero lo cierto es que esto traera consigo una
consecuencia negativa, los intervalos tendran una excesiva amplitud y
acabaramos teniendo a sujetos con puntuaciones muy distintas en el mismo
intervalo
!l n%mero apropiado de intervalos debe ser tal que, con ella se consiga una
agrupacin operativa y que cumpla los objetivos para los que ha sido diseada
la distribucin de frecuencias, pero sin distorsionar excesivamente los valores
con el error de agrupamiento
( veces hay casos en los que hacer un n%mero de intervalos siguiendo las
directrices que acabamos de plantear distorsionaran demasiado los datos
2ara evitar eso se utilizan lo que se denomina intervalos abiertos, en los cuales
no se pone el lmite inferior del intervalo que incluye los valores menores, el
lmite superior del intervalo que incluye los valores mayores o no se pone
ninguno de estos dos !j B de
7
2roblema de los bordes
#upongamos que vamos a construir una agrupacin en intervalos, siendo los
valores mayor y menor observados iguales a IH y >9, respectivamente 3omo
el n%mero de valores distintos sera igual a 9I, que es un n%mero primo, no
pueden hacerse intervalos de amplitud constante tales que el mayor tenga al
IH como lmite aparente superior y al >9 como lmite aparente inferior !n estos
casos suele aadirse al listado de valores distintos observados algunos otros
valores no observados en la muestra
!stos valores tendr"n frecuencias absolutas iguales a cero, pero nos permitir"n
conseguir un n%mero de valores distinto que sea m%ltiplo del n%mero de
intervalos que queremos hacer
2ara no distorsionar demasiado ninguno de los intervalos extremos es
preferible repartirlos lo m"s homogneamente posible entre los dos
2.2.1 Supuestos de distri'ucin intr!inter)!"o
$na vez confeccionada una distribucin de frecuencias con datos agrupados
en intervalos, sta se puede utilizar para hacer representaciones gr"ficas y
para facilitar los c"lculos de estadsticos que iremos explicando
;ado que de cada puntuacin slo sabemos el intervalo al que pertenece, un
procedimiento que a veces resultar" %til consiste en asumir el supuesto de
concentracin en el punto medio #eg%n este supuesto, trataramos a esos dos
datos como si fueran dos valores iguales !ntonces este es el punto medio de
su intervalo
!l supuesto de distribucin homognea, los valores incluidos en un intervalo se
reparte con absoluta conformidad en su interior, si en un intervalo hay cinco
observaciones, aceptaremos que sus valores son los que tendramos si
partiramos al intervalo en cinco subintervalos de igual amplitud y asign"ramos
a cada individuo el punto medio de un subintervalo
2.# Represent!ciones r2%ic!s
( partir de las distribuciones de frecuencias se pueden construir
representaciones gr"ficas La funcin de stas es dar informaciones globales
mediante un solo golpe de vista
2.#.1 Represent!ciones r2%ic!s de uso %recuente
;iagrama de rect"ngulos+ 2ara hacer un diagrama de rect"ngulos se
colocan en el eje de abscisas las modalidades )o los n%meros que las
representan* y en el eje de ordenadas las frecuencias #obre cada
modalidad se levanta un rect"ngulo cuya altura es la frecuencia
correspondiente !ste tipo de representaciones se suele utilizar para
8
variables nominales, pero tambin se utiliza para variables ordinales,
como el nivel cultural
2erfil ortogonal+ #e utiliza mucho en informes psicopedaggicos o de
rendimiento 3alificaciones obtenidas por un alumno a lo largo de >
ex"menes
2ictograma+ #on representaciones en forma de crculos en las que
stos son divididos en secciones cuya superficie es proporcional a la
frecuencia de la modalidad correspondiente
;iagrama de barras+ #e utiliza para variables cuantitativas discretas !n
el eje de abscisas se colocan los distintos valores de la variable y en el
eje de ordenadas las frecuencias #obre cada valor de la variable se
traza una lnea o barra perpendicular cuya altura debe ser igual a la
frecuencia
Listograma+ #e utiliza para variables cuantitativas continuas con datos
agrupados en intervalos !n el eje de abscisas se colocan los lmites
exactos de los intervalos, y en el eje de ordenadas las frecuencias
2olgono de frecuencias+ 2ara variables discretas, el polgono de
frecuencias es la figura que resulta de unir los extremos superiores de
las que hubieran sido las barras #i se trata de las bases superiores de
los rect"ngulos correspondientes a un hipottico histograma construido
con esos mismos datos
;iagrama de barras acumulativo+ #e utiliza en variables discretas !n el
eje de abscisas se colocan los valores de la variable, y en el de
ordenadas las frecuencias acumuladas, ya sean absolutas o relativas
#obre cada valor se traza una perpendicular cuya longitud sea igual a la
frecuencia acumulada ;esde el extremo superior de cada una de estas
barras se traza una lnea horizontal que se une con la barra situada a su
derecha
2olgono de frecuencias acumuladas+ #e utilizan en variables continuas
!l eje de abscisas se construye igual que en los histogramas, pero en el
de ordenadas se incluyen las frecuencias acumuladas, ya sean
absolutas o relativas #obre cada lmite se levanta una perpendicular
cuya longitud sea idntica a la frecuencia acumulada y se unen los
extremos superiores de dichas perpendiculares
2.#.2 Con)enciones so're "!s represent!ciones r2%ic!s
7 !n el eje de abscisas colocamos los valores de la variable, y en el de
ordenadas las frecuencias )absolutas o relativas, simples o
acumuladas*
9
= La interseccin de los dos ejes es el origen , de modo que en el eje de
abscisas las puntuaciones m"s bajas estar"n a la izquierda, y las m"s
altas a la derechaM en el de ordenadas los valores los valores pequeos
estar"n abajo y los altos arriba
9 #i el valor mnimo del eje de abscisas fuera excesivamente grande, se
debe cortar la lnea
> 3onviene incluir en cada gr"fico toda la informacin posible para evitar
ambigNedades y facilitar su interpretacin por otras personas o por
nosotros mismos al cabo del tiempo
8 3uando un mismo gr"fico se representan dos o m"s grupos
simult"neamente y stos son de tamaos considerablemente distintos
se deben utilizar frecuencias relativas
Las representaciones sirven para comunicar informacin de un solo golpe de
vista, y por ello en su construccin debe tenerse en cuenta el p%blico al que va
dirigida, sus necesidades de informaciones m"s bien globales y generales o
especficas y precisas, y cualquier otra consideracin que pueda mejorar la
transmisin de informacin "gil y precisa
2.#.# Tendenciosid!d en "!s represent!ciones r2%ic!s
$n primer mtodo consiste en recortar el eje de ordenadas, eliminando los
menores valores de frecuencias con la excusa de que no hay ninguna
observacin que las adopte !sto tiene como consecuencia que pequeas
diferencias parezcan mayores
$n segundo tipo de distorsin se produce cuando se utilizan figuras
representativas de aquello que se est" midiendo #uelen hacerse
proporcionando sus alturas a las frecuencias correspondientes, el incremento
en la altura conlleva tambin un incremento en la anchura 3omo consecuencia
de ello, la superficie de las figuras no guarda relacin con las frecuencias
observadas, dando la impresin de que la diferencia es mayor que la realmente
registrada
2.#.3 Propied!des de "!s distri'uciones de %recuenci!s
Los polgonos de frecuencias dependen demasiado de la unidad de medida
utilizada, de la agrupacin en intervalos hecha y de las fluctuaciones
particulares esperables en una muestra concreta Las curvas suavizadas
suelen ser representaciones m"s apropiadas que los polgonos de frecuencias
simples #on cuatro las propiedades con las que describiremos las
distribuciones de frecuencias+
7 &endencia central + $na primera propiedad es la que se refiere a la
magnitud general de las observaciones hechas !sta magnitud general
puede cuantificarse mediante unos ndices conocidos como ndices de
10
tendencia central o promedios, y que reciben ese nombre porque
pretenden ser sntesis de los valores de la variable
= <ariabilidad+ Crado de concentracin de las observaciones en torno al
promedio $na distribucin de frecuencias ser" homogneo o poco
variable si los datos difieren poco entre s, y por tanto, se agolpan en
torno a su promedio #era heterognea o muy variable si los datos se
dispersan mucho con respecto al promedio
9 (simetra o sesgo+ !sta propiedad se refiere al grado en que los datos
tienden a concentrarse en los valores centrales, en los valores inferiores
al promedio, o en los valores supriores a ste !xiste simetra perfecta
cuando en caso de doblar la representacin gr"fica por una vertical
trazada sobre la media, las dos mitades se superponen perfectamente
Las distribuciones con asimetra negativa son propias de las pruebas,
tareas o tests f"ciles, en las que la mayora de los sujetos punt%an alto
Las distribuciones asimtricas positivas son tpicas de pruebas, tareas o
tests difciles en las que la mayora de los sujetos punt%an bajo
> 3urtosi+ #e refiere al grado de apuntamiento de la distribucin de
frecuencias #i es muy apuntada se llama leptoc%rtica y si es muy
aplastada, se llama platic%rtica
2.3 Di!r!&! de t!""o + 4o(!s
Las distribuciones de frecuencias no son el %nico medio para resumir y exponer
conjuntos de datosM una alternativa a ellas son los llamados diagramas de tallo
y hojas
#u obtencin requiere separar cada puntuacin en dos partes !l primer o
primeros dgitos, que reciben el nombre de tallo, y el dgito o dgitos restantes,
que reciben el nombre de hojasM por ejemplo, D E 8J se puede separar en 8
)tallo* y J hoja !stos diagramas tienen la suficiente flexibilidad como para
admitir otras posibilidades
7 #e identifican los valores m"ximo y mnimo observados
= #e toma una decisin acerca del n%mero m"s apropiado de tallos
distintos
9 #e listan todos los tallos distintos en una columna, ordenados de forma
creciente de arriba abajo
> #e escribe cada hoja junto al tallo que le corresponda, preferiblemente
ordenados seg%n su valor
!n general, un n%mero de tallos superior a cinco y que no pase de =6 suele ser
apropiado (parte de ser m"s f"cil de construir, el diagrama de tallo y hojas
tiene varias ventajas sobre la distribucin de frecuencias, y tambin alg%n
inconveniente+
11
7 <entaja+ permite identificar cada puntuacin individual !n las
distribuciones tradicionales slo conocemos la frecuencia del intervalo y
nos obliga a tratar los datos de ciertas maneras distorsionantes La
ventaja de retener cada valor individual viene acompaada del
inconveniente de que le diagrama de tallo y hojas no facilita, como la
distribucin de frecuencias cl"sica, el c"lculo de los estadsticos que
estudiaremos m"s adelante
= 4frece simult"neamente tanto un listado de las puntuaciones como un
dibujo de distribucin, si tumbamos el diagrama obtenemos una especie
de histograma
9 (l contener los valores de cada observacin, es m"s f"cil de modificar
para obtener un dibujo con un nivel de detalle distinto, mayor o menor,
de la distribucin
> 2ueden presentarse dos conjuntos de datos simult"neamente en el
mismo diagrama, con lo que se facilita la comparacin
# $EDIDAS DE POSICI/N
#.2 Centi"es o percenti"es
#on HH valores de la variable que dividen a la distribucin en 766 secciones,
cada una conteniendo a la centsima parte de las observaciones #e pueden
representar por la inicial de cada uno de los dos trminos que los designan m"s
el subndice correspondiente, 3
O
o 2
O
)O E 7,=,HH* #e simboliza por 3
=K
a
aquella puntuacin que deja por debajo de s al =K por 766 de las
observaciones y que es superada por el I= por 766
(unque por definicin son slo HH valores, por extensin a veces se utilizan
posiciones intermedias, como, por ejemplo, el centil KK,8 o 3
KK,8
, que sera
aquel valor de la variable por debajo del cual se encuentra el KK,8 por 766 de
las observaciones
;ado que los valores correspondientes a los centiles se determinan en funcin
de los porcentajes de observaciones, normalmente las distancias entre ellos,
en trminos de puntuacin, no ser"n constantes Ceneralmente las distancias
entre los centiles intermedios ser"n menores que las distancias entre centiles
extremos
Las puntuaciones correspondientes a los centiles 88 y 8J ser"n m"s cercanas
entre s que las puntuaciones correspondientes a los centiles HK y HH, o las de
los centiles = y 9 !sto se dar", en distribuciones simtricas, mientras que a
medida que las distribuciones se van haciendo m"s asimtricas esta relacin
hay que matizarla algo m"s
Los centiles no suelen calcularse con cantidades pequeas de datos y cuando
es necesario hacerlo se obtienen sencillamente ordenando las puntuaciones y
12
calculando la proporcin de stas que superan al valor que se quiere comparar
1ormalmente los centiles se obtienen sobre datos agrupados en intervalos, y
en su c"lculo se asume el supuesto de distribucin homognea intraintervalo
!stamos buscando la puntuacin que deja por debajo de s a 7>6, que es una
cantidad intermedia entre H6 y 786 !l procedimiento que se utiliza para
calcular ese valor, y que se recoge en la frmula que veremos a continuacin,
consiste en adoptar como representacin del 3
I6
un valor perteneciente al
intervalo 77 P 7> que mantenga una relacin de proporcionalidad con respecto
a la frecuencia buscada #e trata de buscar una puntuacin de ese intervalo
que divida a las observaciones pertenecientes a l en dos grupos, uno que
incluya a las 86 observaciones inferiores y otro que incluya a las 76 restantes
;e esta forma, ese valor dejar" por debajo de s a 86 observaciones
pertenecientes al intervalo, m"s las H6 que quedaban por debajo de su lmite
exacto inferior, totalizando las 7>6 buscadas ;ado que esa puntuacin debe
dejar a 86 por debajo y 76 por encima, debe ser una puntuacin m"s cercana
al lmite superior del intervalo que al lmite inferior !l procedimiento se resume
en la siguiente frmula+
3
O
E L
i
B 5 G O G n Q n
a
n
i
766
3
O
es la puntuacin correspondiente al centil O
L
i
es el lmite exacto inferior del intervalo crtico
5 es la amplitud de los intervalos
n
i
es la frecuencia absoluta del intervalo crtico
O es el porcentaje de observaciones inferiores a 3
O
n es el n%mero de observaciones hechas
n
a
es la frecuencia absoluta acumulada hasta L
i
#.# Otros cu!nti"es
#.#.1 Deci"es
#on nueve puntuaciones que dividen a la distribucin en 76 partes, cada una
conteniendo al 76 por 766 de las observaciones #e representan por ;
O
, donde
O indica el n%mero del decil al que se refiere
#.#.2 Cu!rti"es
#on tres puntuaciones que dividen a la distribucin en cuatro partes, cada una
conteniendo al =8 por 766 de las observaciones #e representan por R
O
, donde
O indica el n%mero del cuartil al que se refiere
3 $EDIDAS DE TENDENCIA CENTRAL
3.2 L! &edi! !rit&5tic!
13
!l ndice de tendencia central m"s utilizado es la media #e define como l
asuma de los valores observados, dividida por el n%mero de ellas #e
representa con la misma letra que representa la variable, en may%sculas , con
una barra horizontal encima 2or tanto, si recogemos n observaciones de la
variable D, entonces la medida de los valores observados es+
D E D
i
F n
;e donde se deduce que+
D
i
E n G D
3.2.1 C2"cu"o en un! distri'ucin de %recuenci!s
3uando se tiene un conjunto grande de observaciones, stas tradicionalmente
se han agrupado en distribuciones de frecuencias, para luego hacer los
c"lculos sobre la distribucin
<amos a describir el procedimiento para hacer los c"lculos de la media con
datos agrupados en una distribucin de frecuencias
2ara hacer los c"lculos se asume el supuesto de concentracin en el punto
medio del intervalo
2ara hallar la media se asume el supuesto de concentracin en el punto medio
del intervalo
D E n
i
G D
i
n
#e diferencia de la frmula anterior en que+ el sumatorio no tiene n sumandos,
como en la frmula anterior sino tantos como intervalos tenga la distribucin y
las D
i
no son los datos directos, sino los puntos medios de los intervalos
3.2.2 Propied!des de "! &edi! !rit&5tic!
2untuaciones directas+ valores brutos y los representamos por la letra de la
variable en may%sculas
2untuaciones diferenciales+ diferencias de cada sujeto con respecto a la media
grupal, las representamos por la letra min%scula
D
i
E D
i
Q D
La suma de las diferencias de n puntuaciones con respecto a su media,
o puntuaciones diferenciales, es igual a cero+ x
i
E 6
14
La razn por la que la suma de las diferenciales es igual a cero es que unas
son positivas y otras negativas y se compensan unas con otras
La suma de los cuadrados de las desviaciones de unas puntuaciones
con respecto a su media es menor que con respecto a cualquier otro
valor
#i sumamos una constante a un conjunto de puntuaciones, la media
aritmtica quedar" aumentada en esa misma constante
#i multiplicamos por una constante a un conjunto de puntuaciones, la
media aritmtica quedar" multiplicada por esa misma constante
La media total de un grupo de puntuaciones, cuando se conocen los
tamaos y las medias de varios subgrupos hechos a partir del grupo
total, mutuamente exclusivos y exhaustivos, puede obtenerse
ponderando las medias parciales a partir de los tamaos de los
subgrupos en que han sido calculadas
D
&
E n
7
G D
7
B n
=
G D
=
B S B n
O
G D
O

n
7
B n
=
B n
9
B S B n
O
$na variable definida como la combinacin lineal de otras variables tiene
como media la misma combinacin lineal de las medias de las variables
intervinientes en su definicin
3.# L! &edi!n!
'ediana+ aquella puntuacin que fuera superada por la mitad de las
observaciones, pero no por la otra mitad, se suele representar por 'dn
2ara su c"lculo podemos encontrarnos en dos casos generales, aquel en el
que contamos con un n%mero impar de observaciones y aquel que nos
encontramos con un n%mero par de ellas !n el primero se toma como mediana
el valor central+ en el segundo se da la circunstancia de que cualquier valor
comprendido entre los dos centrales cumple con la definicin de la mediana
?echner propuso tomar la media aritmtica de los dos valores centrales
3.3 L! &od!
$na tercera va para representar la tendencia central de un conjunto de valores
consiste en informar del valor m"s frecuentemente observado #e presenta por
'o, y se define sencillamente como el valor de la variable con mayor
frecuencia absoluta
3omo norma, para obtener la moda ordenaremos los valores de menor a
mayor para as facilitar la identificacin del de mayor frecuencia
15
3uando todos los valores tienen la misma frecuencia, es un caso en el
que la moda no se puede calcular, decimos que es una distribucin
amodal
3uando hay dos valores con la misma y m"xima frecuencia en este caso
se dice que la distribucin tiene dos modas o que es una distribucin
bimodal
3uando disponemos de una distribucin de frecuencias, se toma como
moda el punto medio del intervalo con mayor frecuencia &ambin en
distribuciones de frecuencias pueden darse los casos anteriores !n
ellos se utilizaran las mismas reglas que acabamos de exponer, pero
aplicadas a los puntos medios de sus intervalos
3.6 Co&p!r!cin entre &edid!s de tendenci! centr!"
#i no hay ning%n argumento de peso en contra, se preferir" siempre la media
Lay dos razones para apoyar esta norma general La primera es que en ella se
basan otros estadsticos y la segunda es que es mejor estimador de su
par"metro que la mediana y la moda
Lay al menos 9 situaciones en las que se preferir" la mediana a la media+
7 3uando la variable est medida en escala ordinal
= 3uando haya valores extremos que distorsionen la interpretacin de la
media
9 3uando haya intervalos abiertos, situaciones en las que el intervalo
superior carece de lmite superior, el intervalo inferior carece de lmite
inferior o ambos
La media es extremadamente sensible a las puntuaciones y un cambio en slo
una de ellas supone un cambio en la media aritmtica, mientras que la mediana
slo se vera alterada por cambios en los valores centrales
La mediana ser" la segunda candidata para representar la tendencia central y
si no hay argumentos de peso en contra se preferir" la mediana a la moda+
7 3uando se trate de una variable medida en escala nominal
= 3uando haya intervalos abiertos y la mediana pertenezca a uno de ellos
6 $EDIDAS DE ,ARIACI/N
6.2 $edid!s de )!ri!cin
6.2.1 ,!ri!n7! + des)i!cin t-pic!
$na idea que se ha demostrado %til a la hora de cuantificar la variabilidad es la
de trabajar con las distancias desde los valores hasta alg%n poste centra, que
16
podra ser la media aritmtica y basar la medicin de la dispersin en alg%n tipo
de .separacin promedio/ hasta ese poste
$na solucin al problema de que las distancias con respecto a la media sumen
cero consiste en elevar al cuadrado esas distancias antes de hallar su
promedio, dado que los cuadrados son siempre positivos !l ndice basado en
esta idea se llama varianza y se representa por la expresin #
=
x
, donde el
subndice recoge la letra con la que se representa la variable (l c"lculo del
promedio de las desviaciones cuadr"ticas con respecto a la media+
#
=
x
E ) D Q D *
=
n
#
=
x
E x
=
n
La cuestin que puede surgir es la de cmo valorar el grado de dispersin
cuantificado mediante este ndice !n realidad no tiene mucho sentido hablar
de niveles altos o bajos de dispersin en trminos absolutos, sino, en todo
caso, en trminos comparativos
La varianza sirve sobre todo para comparar el grado de dispersin de dos o
m"s conjuntos de valores en una misma variable, llegando a conclusiones
como la siguiente+ .La poblacin de hombres presenta una mayor variabilidad
en su estatura que la poblacin de mujeres, que son m"s homogneas en esa
caracterstica/
!l valor =I,= no parece un n%mero claramente relacionado con lo que se
pretenda medir Las mayores distancias que presentan esos valores con
respecto a la media son de K puntos y parece que una representacin numrica
de la magnitud general de esas distancias estara bastante alejada de =I,= La
razn de esta discrepancia es que las distancias no se han tratado como tales,
sino que para evitar el problema de que las diferenciales sumen cero se han
elevado stas al cuadrado 2or ello es frecuente que, con objeto de retornar las
unidades originales de esas distancias, se calcule la raz cuadrada de la
cantidad obtenida (l ndice as hallado se le llama desviacin tpica, se
representa por #
x
y se define sencillamente como la raz cuadrada de la
varianza+
#
x
E ) D
i
Q D*
=
n
La desviacin tpica es un mejor descriptor de la variabilidad, aunque la
varianza tenga algunas notables propiedades que la hacen idnea para basar
en ella los an"lisis estadsticos complejos
La variabilidad de los datos est" reflejando el hecho incuestionable de las
diferencias individuales y stas son uno de los objetos de estudio primordiales
de la psicologa
17
3uasivarianza+ dividiendo por n P 7, representamos por #T
=
x
n G #
=
x
E )n P 7* G #T
=
x
6.2.2 C2"cu"o + propied!des de "! )!ri!n7!
La varianza y la desviacin tpica como medidas de dispersin, son
valores esencialmente positivos
#i sumamos una constante a un conjunto de puntuaciones, su varianza
no se altera
#i multiplicamos por una constante a un conjunto de puntuaciones, la
varianza quedar" multiplicada por el cuadrado de la constante, y la
desviacin tpica por el valor absoluto de esa constante
La varianza total de un grupo de puntuaciones, cuando se conocen los
tamaos )n
i
*, las medidas )D
i
* y las varianzas )#
=
i
* de varios subgrupos
hechos a partir del grupo total, mutuamente exclusivos y exhaustivos,
puede obtenerse sumando la media )ponderada* de las varianzas y la
varianza )ponderada* de las medias+
#
=
&
E n
i
G #
=
i
B n
i
)D
i
Q D
&
*
=
n
i
n
i
La desigualdad de &chebychev recoge el hecho de que las distancias
menores hasta la media son m"s frecuentes que las distancias mayores
(s, entre las puntuaciones correspondientes a la media BQ una
desviacin tpica se encontrar"n menos observaciones que entre las
puntuaciones correspondientes a la media BQ una dos desviaciones
tpicas #eg%n la desigualdad de &chebychev, el porcentaje de
puntuaciones que quedan entre las correspondientes a la media BQ O
desviaciones tpicas es, como mnimo, el+
) 7 P 7 por 766 de las observaciones
O
=
6.2.# Otr!s &edid!s de )!ri!cin
$na forma muy sencilla de indicar el grado de dispersin consiste en calcular la
distancia entre el mayor y el menor de los valores observados !ste ndice se
llama amplitud total, rango o recorrido, y se obtiene sencillamente hallando la
diferencia entre los valores extremos+
(
&
E D
m"x
P D
min
La principal desventaja de este ndice es que es muy sensible a los valores
extremos, y nada sensible a los intermedios, pudiendo carecer de toda
representatividad
18
4tro inconveniente de este ndice es que est" ligado al tamao de la muestra
utilizada, #i se quiere comparar la variabilidad de la dispersin de dos
conjuntos de datos de tamao marcadamente distinto, es probable que la
muestra de mayor tamao presente una mayor amplitud aunque las
poblaciones de referencia tengan la misma variabilidad
;esviacin media+ tomar las desviaciones con respecto a la media, o
puntuaciones diferenciales, en valor absoluto #e representa por sus iniciales
);'*+
;' o #& E | D
i
Q D|
n
La desviacin media representa un promedio de distancias tomadas en valor
absoluto y representa bien el concepto de dispersin y su cuantificacin,
aunque no es muy utilizado en psicologa debido a la dificultad que supone el
trabajo con valores absolutos, y que hace que no haya muchas tcnicas de
an"lisis estadstico basadas en ella
3uando en las puntuaciones hay alg%n valor extremo que pudiera distorsionar
la representatividad de la varianza se puede utilizar otro ndice, basado slo en
las puntuaciones correspondientes a los cuartiles primero y tercero #e
denomina amplitud semi P intercuartil, se representa por la letra R
R E R
9
P R
7
=
!sta medida de variabilidad elimina del cmputo las puntuaciones extremas
que no le afectan
3oeficiente de variacin+ 3omparar la variabilidad de grupos cuya media es
claramente distinta, relativizar la desviacin tpica con respecto a la media,
expresado como un porcentaje, se representa por 3<
3< E #
x
G 766
D
3uanto mayor es el coeficiente de variacin, menos representativa es la media
6.# Represent!cin r2%ic! de "! )!ri!'i"id!d
0ox and UhiusOers, que significa literalmente caja y bigotes 2ara su
construccin se marcan seales de tal forma que las distancias entre ellas sean
proporcionales a las distancias entre la puntuacin m"xima y mnima y los 9
cuartiles 3on los 9 cuartiles se forma una especie de ficha de domin,
mientras que las puntuaciones m"xima y mnima se unen mediante lneas
rectas a los bordes de esta forma geomtrica #e puede comparar la
variabilidad de dos distribuciones haciendo representaciones paralelas de caja
y bigotes
19
!n otros casos se quiere representar la evolucin de los valores medios, se
pueden unir mediante un trazo los puntos correspondientes y aadir unos
bigotes verticales que indiquen los valores correspondientes a una desviacin
tpica
8 P9NT9ACIONES TPICAS 0 ESCALAS DERI,ADAS
8.1 Puntu!ciones t-pic!s
2untuacin diferencial la distancia o diferencia, entre esa puntuacin y la
media del grupo de puntuaciones
Las puntuaciones diferenciales son m"s informativas e interesantes que las
directas, pues al menos nos indican si la puntuacin es superior o inferior a la
media o si coincide con ella !sta informacin es insuficiente para comparar
puntuaciones de sujetos pertenecientes a distintos grupos o a distintas
variables
<ariabilidad del grupo de referencia+ se tratara de indicar cmo de grande es
una distancia en trminos de las distancias observadas en general en esas
puntuaciones !sa distancia general es la desviacin tpica Las puntuaciones
as conseguidas se denominan, puntuaciones tpicas, se representan por letras
z min%sculas y su frmula es+
z
i
E D
i
Q D
#
x
!s idntica al cociente entre la puntuacin diferencial y la desviacin tpica+
z
i
E x
i
#
x
(l proceso de obtencin de las puntuaciones tpicas se le llama tipificacin La
definicin de las puntuaciones tpicas puede basarse en esta idea y expresarse
como sigue+
La puntuacin tpica de una observacin indica el n%mero de
desviaciones tpicas que esa observacin se separa de la media del
grupo de observaciones
Las puntuaciones tpicas permiten hacer comparaciones entre unidades de
distintos grupos, entre variables medidas de distintas formas o incluso entre
variables diferentes #iempre nos indican el n%mero de desviaciones tpicas
que se separan de la media y si esa desviacin es por encima o por debajo de
la media
Las tpicas no son m"s que una transformacin lineal que consiste en
multiplicar las directas por una constante )el inverso de la desviacin tpica* y
20
luego sumar a esos productos otra constante )el cociente entre la media y la
desviacin tpica, con signo negativo*
@
i
E D
i
Q D E 7 D
i
B Q D
#
x
#
x
#
x

!stas caractersticas de las puntuaciones tpicas son universales, no dependen
del tipo de puntuaciones, ni de su dispersin, ni de su n%mero
La media de las puntuaciones tpicas es cero, mientras que su varianza
y desviacin tpica son iguales a uno
Las puntuaciones tpicas reflejan las relaciones esenciales entre las
puntuaciones con independencia de la unidad de medida que se haya utilizado
en la medicin
8.2 Esc!"!s deri)!d!s
5nconveniente La medida de las tpicas es cero y su desviacin tpica uno,
buena parte de las puntuaciones suelen ser negativas y casi todas decimales
$n procedimiento consiste en transformar las puntuaciones tpicas en otras que
retengan todas las relaciones que manifiestan las puntuaciones originales, que
sean puntuaciones equivalentes pero evitando la dificultad operativa y que
constituyen lo que se denomina una escala derivada
Las puntuaciones transformadas tienen como media y desviacin tpica las
constantes utilizadas para la transformacin, podemos conseguir que las
puntuaciones en una escala derivada tengan las caractersticas que nos
resulten m"s cmodas, sencillamente haciendo la transformacin con las
constantes que deseamos como media y desviacin tpica
#i transformamos linealmente las puntuaciones tpicas, multiplic"ndolas
por una constante a, y sumando una constante b, entonces las
puntuaciones transformadas tendr"n como media la constante sumada,
b, como desviacin tpica el valor absoluto de la constante multiplicada
)a* y como varianza el cuadrado de esta constante, a
=
La construccin de una escala derivada parte de unas puntuaciones directas,
stas se tipifican y despus se transforman linealmente en otras puntuaciones
!squema de la transformacin en una escala derivada+
21
Puntuaciones
directas (X
i
)
Media: X
Varianza: S
2

Puntuaciones
t!"icas (z
i
)
Media: 0
Varianza: 1
Puntuaciones
trans#or$adas
(%
i
)
Media: &
Varianza: a
2
%i"i#icaci'n
%rans#or$aci'n en esca(a deri)ada:
%
i
* a + z
i
, &
La cuestin fundamental de las escalas derivadas consiste en transformar las
puntuaciones originales, D
i
, en otras puntuaciones transformadas, &
i
, tales que
sean m"s cmodas de tratar e interpretar, pero que a la vez retengan las
relaciones esenciales entre los valores, que sean puntuaciones equivalentes
3ualquier transformacin lineal en la que la constante multiplicadora sea
positiva da lugar a unas puntuaciones equivalentes
: $EDIDAS DE ASI$ETRA 0 C9RTOSI
:.2 ndices de !si&etr-!
!l grado de asimetra de una distribucin hace referencia al grado en que los
datos se reparten equilibradamente por encima y por debajo de la tendencia
central Lay diferentes ndices con los que cuantificar esta propiedad+
!l primero de ellos se basa en la relacin entre la media y la moda, y se define
como la distancia entre la media y la moda, medida en desviaciones tpicas
La media es inferior a la moda, y por tanto este ndice dar" un valor negativo,
mientras que en la figura c la media es superior y el ndice dar" positivo !n la
distribucin de la figura b coinciden los dos ndices de tendencia central, y por
tanto el ndice de asimetra dar" cero
Las distribuciones del tipo de la figura a se dice que tienen asimetra negativa y
el ndice da valores menores que cero Las del tipo de la figura c se dice que
tienen asimetra positiva y este ndice da valores mayores que cero Las del
tipo de la figura b se dice que son distribuciones simtricas, puesto que no
est"n inclinadas hacia ning%n ladoM este ndice da en ellas valores en torno a
cero y si la simetra es perfecta entonces da exactamente cero !ste ndice
tiene la dificultad de que slo se puede calcular en distribuciones unimodales
22
Vndice de asimetra de 2earson, es igual al promedio de las puntuaciones
tpicas elevadas al cubo+
(s E )z
9
* E [) D
i
Q D*
9
F #
x
9
] E 7 )D
i
Q D*
9
n n #
9
x
Los valores menores que cero indican asimetra negativa, los mayores de cero
asimetra positiva y los valores en torno a cero indican distribuciones
aproximadamente simtricas !s el ndice de asimetra m"s utilizado
!l ndice de asimetra intercuartlico se basa, en los cuartiles #u frmula es+
(s E )R
9
P R
=
* P )R
=
P R
7
*
R
9
P R
7
Los valores mayores de cero indican asimetra positiva, los menores indican
asimetra negativa y los valores en torno a cero reflejan distribuciones
aproximadamente simtricas &iene una ventaja sobre los ndices anteriores y
es que tiene un valor m"ximo y mnimo con lo que se facilita su interpretacin
en trminos relativos
:.# ndice de curtosis
#lo vamos a estudiar el que se basa en el promedio de las tpicas elevadas a
la cuarta potencia #u frmula es+
3r E )z
>
* E [)D
i
Q D*
>
F #
>
x
] Q 9 E 7 )D
i
Q D*
>
Q 9
n n #
>
x
(l restar un tres al ndice lo que se consigue es utilizar ese modelo como
patrn de comparacin $na distribucin en la que el ndice sea igual a cero
tiene un grado de curtosis similar al de la distribucin normal y, siguiendo la
terminologa propuesta por 2earson, se dice que es mesoc%rtica, mientras que
si es positivo su grado de apuntamiento es mayor que el de la distribucin
normal y se dice que es una distribucin leptoc%rtica y si es negativo su
apuntamiento es menor que el de la distribucin normal y se dice que es
platic%rtica
23

También podría gustarte