Está en la página 1de 9

1

BOTELLA , LEON SAN MARTIN.

ANALISIS DE DATOS EN PSICOLOGIA

Captulo 1
La estadstica actual no solo es un conjunto de tcnicas para resumir y transmitir informacin cuantitativa, sino
que sirve tambin, para hacer inferencias y generalizaciones de un conjunto relativamente pequeo de datos
a un conjunto mayor.
La estadstica cumple con dos grandes funciones: descripcin y realizacin de inferencias. Por su funcin se
diferencian en estadstica descriptiva y estadstica inferencial.
La estadstica descriptiva se agota en la descripcin, mientras que uno inferencial comienza por la descripcin
y luego aborda la inferencia. La estadstica descriptiva puede abordarse sin conocimientos tcnicos previos,
mientras que para la estadstica inferencial, es imprescindible adquirir unas nociones bsicas de probabilidad.
Estadstica: es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes de muestras, y de la
realizacin de inferencias acerca de las poblaciones de las que estas proceden.
Otra diferencia que puede darse en la estadstica es la distincin entre estadstica teorica, que se dedica al
estudio de los mtodos formalmente validos para las inferencias. Y la estadstica aplicada que se dedica a la
aplicacin de esos mtodos y modelos de actuacin.
1.2 Conceptos generales.
POBLACION ESTADISTICA: Conjunto de todas las unidades-individuos que cumplen una determinada
propiedad o caracterstica. El investigador debe definir claramente la poblacin sobre la cual se interesa.
INDIVIDUO: Elementos que componen la poblacin (personas, objetos, animales, nmeros). Son las
entidades sobre las que se realiza una observacin y se extrae un dato. Segn el N de elementos puede ser
finita o infinita.
MUESTRA: Al ser la poblacin muy numerosa, se extrae una muestra, que es un subconjunto de los
elementos de una poblacin. Las muestras deben ser represetativas.
PARAMETROS: Propiedad descriptiva de una poblacin, normalmente desconocidos por lo cual se hace
conjeturas lo mas acertadas posibles.
ESTADISTICO: propiedad descriptiva de una muestra, caracterstica observable en los grupos muestrales.
Ejemplo:
Un investigador estudia la eficacia de un mtodo teraputico en la reabilitacion de alcoholicos (POBLACION).
Para ello decide tomar 100 individuos que vienen a su consulta a lo largo de un mes (MUESTRA
REPRESENTATIVA). Utiliza el mtodo teraputico con c/u de los 100 y observa que no reinciden 60. Esto
significa que se han rehabilitado 60 de los 100 de los alcoholicos. El valor 60 es un estadstico.
Es necesario repetir sucesivamente la experiencia para poder sacar conjeturas acerca del verdadero
PARAMETRO. Pero esto no es necesario si la muestra es representativa de la poblacin y de esa manera el
estadstico calculado reuna la informacin necesaria y suficiente para de all sacar el parmetro.

2
CARACTERISTICA: propiedad de un individuo.
MODALIDAD/VALORES es cada una de las maneras como se presentan las caractersticas. Los valores
deben ser exhaustivos y mutuamente excluyentes: todas las respuestas posibles a una variable.
Ejemplo: variable sexo, modalidad varon y hembra.
1.3 Medicion.
MEDICION: la estadistica no realiza sus funciones directamente sobre las modalidades observadas sino que
estas se representan por nmeros. Se llama medicin al proceso de atribuir nmeros a las caractersticas.
Puede asignarse los valores 0 y 1 a las variables como el sexo pero en ningn caso 1 representa una
superioridad sobre 0.
ESCALA: modelos desarrollados para la medicin.
El cientfico se centra en aquellas caractersticas que considera relevantes para su trabajo de investigacin, y
a ellas le aplica un esquema de clasificacin sin el cual no podra realizar su trabajo.
CLASIFICACION POR NIVEL DE MEDICION
NIVEL NOMINAL: solo informal la igualdad o desigualdad de los individuos en una determinada
caracterstica, pero no de posibles ordenaciones puesto que la caracterstica a la que se refiere no se tiene en
mayor o menor medida, sino que simplemente adopta formas CUALITATIVAMENTE distintas. Ejemplo: sexos,
estado civil, tipo de sangre. ntimamente relacionado con transformacin admisible: de un conjunto de valores
correctamente atribuidos se puede pasar a otro tambin correctamente atribuido, si preserva las
caractersticas que definen esa escala. Ejemplo: podra utilizarse 5 y 10 para representar los dos sexos en
lugar de 1 y 0.
NIVEL ORDINAL: forman parte los conjuntos de obejtos que difieren en una caracterstica que cada uno
posee en una cierta CANTIDAD. Los nmeros asignados a los objetos reflejan los distintos grados en los que
se presenta X caracterstica, pero estos nmeros solo nos permite inferir sobre la relacin del tipo mayor que
o menor que. El proceso de medicin, o asignacin de N debe reflejar estas distintas magnitudes. Tienen
transformaciones admisibles pero que preserven la caracterstica de escala ordinal, es decir que cumplan la
condicin de ser transformaciones crecientes. Los objetos pueden ordenarse CUASITATIVAMENTE.
NIVEL DE INTERVALO: adems de las dos condiciones expresadas para las escalas ordinales (cualitativa,
cuasitativa) se cumple una tercera: cuantitativa (nmeros). Esta tercera condicin exige que el numero
asignado al objeto, debe ser transformaciones lineales de las magnitudes reales que ese objeto presenta en la
caracterstica en cuestin. Este nivel cuenta con una unidad de medida, se pueden extraer por que diferencia
uno es mayor que otro. Solo son admisibles transformaciones lineales.
Ejemplo: puede decirse que el tiempo transcurrido entre 1960 hasta 1966 es el mismo que desde 1984 hasta
1990, porque el ao es una unidad de medida constante. Pero no puede decirse que hasta el ao 1000 haya
pasado el doble de tiempo que hasta el ao 500, porque el valor cero no representa el comienzo del tiempo,
sino que es un orden arbitrario.
La limitacin de esta escala es que no cuenta con un cero absoluto; el numero cero no se corresponde a una
ausencia real de esa caracterstica.
NIVEL DE RAZON: En ellas se sustituye la tercera condicin de la escala de intervalo por otra ams
descriptiva, que cumple con la funcin de preservar el significado del valor cero, de forma que siempre

3
represente la ausencia de esa caracterstica. Por ejemplo: en la medicin de distancias, cuando se dice que
algo mide cero significa cero absoluto.
La consecuencia funtamental de la presencia de un origen absoluto y no arbitrario, es que adems de poder
extraer con conclusiones acerca de igualdad o desigualdad de diferencias, tambin puede hablarse de
igualdad desigualdad de razones: si al medir distancias decimos que el objeto 1 mide 10 y el objeto 2 mide 5
podemos decir que el objeto 1 mide el doble que el objeto 2.
La nica transformacin admisible en esta escala es la multiplicacin por una constante positiva, puesto que
solo estas transforaciones preservan el cero, mientras que permiten un cambio en la unidad de medida.
1.3.1 Las variables: clasificacin.
VARIABLE: Conjunto de valores numricos atribuidos a las modalidades de una caracterstica. Es la
representacin numrica de una caracterstica. Los valores atribuidos a las modalidades de una caracterstica
permiten diferenciar a los objetos, que varian entre si en esa caracterstica. Cuando una caracterstica tiene
una nica modalidad, todas las entidades adoptan el mismo valor, es una variable constante.

CLASIFICACION DE VARIABLES
VARIABLE CUANTITATIVA: Variable cuyos valores son nmeros. Pueden casificarse en discretas, que
adoptan valores consecutivos, que no admiten ningn intermedio (hijos, dientes, libros), y en continuas en la
cual dos valores cualesquiera, siempre pueden encontrar intermedios (longitud, duracin de sucesos, peso).
En la practica, las variables continuas no pueden representarse numricamente como tales, la medicin en la
practica supone una discretizacion artificial de estas variables (ejemplo:tiempo).
VARIABLE CUASICUANTITATIVA: variables que se pueden acomodar: medio, bajo alto.
VARIABLE CUALITATIVA: variables relacionadas con cualidades o caractersticas.
1.4 Estadistica e informtica.
Casi todos los anlisis estadsticos se hacen por ordenador, mediante programas especficamente diseados
para ello llamados paquetes estadsticos.los paquetes incluyen muchos programas aplicables para muy
distintos usos. Lo primer que hay que hacer es proporcionar los datos al ordenador, en el SPSS/PC
(programa que utiliza la materia) hay varias formas de hacerlo, una de ellas es la matriz de sujetos por
variable: que es una disposicin rectangular de nmeros que incluye los datos recogidos en el estudio. En
cada fila aparece un sujeto y en cada columna una variable.

Captulo 2
Luego de obtener un conjunto de valores tomados en una o varias variables hay que empezar por inspeccionar los
datos. Cuando la cantidad de nmeros recolectados es demasiado grande, se hace difcil hacer una inspeccin
directa que sea realmente comprensiva. Por eso el primer paso suele consistir en reorganizar los datos. Un
instrumento para conseguir esa ordenacin es la denominada distribucin de frecuencias, y a partir de ella es
frecuente tambin construir representaciones grficas.

DISTRIBUCIN DE FRECUENCIAS.
La distribucin de frecuencias es un instrumento diseado para cumplir tres funciones:
a) proporcionar una reorganizacin y ordenacin racional de los datos recogidos,

4
b) ofrecer la informacin necesaria para hacer representaciones grficas y
c) facilitar los clculos necesarios para obtener los estadsticos muestrales. Representaremos por X a la variable
con la que trabajamos, y que puede adoptar distintos valores (X1, X2, X3) pero cada uno de esos valores puede
aparecer repetido ms de una vez en los n elementos que componen la muestra.

Se llama frecuencia absoluta de un valor Xi, y se simboliza por ni al nmero de veces que se repite el valor Xi
en la muestra.
Se llama frecuencia relativa de un valor xi, y se simboliza por pi al cociente entre la frecuencia absoluta de ese
valor y el tamao de la muestra. Pi= ni/n
Se llama frecuencia absoluta acumulada de un valor xi y se simboliza por na al nmero de veces que se
repite en la muestra ese valor Xi o cualquier otro valor inferior.
La frecuencia relativa acumulada de un valor Xi, se simboliza por pa, al cociente entre su frecuencia absoluta
acumulada y el tamao de la muestra. Es decir, pa= na/n
A veces las frecuencias relativas, ya sean simples o acumuladas, se expresan en trminos porcentuales. En esos
casos suelen representarse con maysculas; para obtenerlas basta con multiplicar por 100 las frecuencias
relativas. Construimos la distribucin de frecuencias siguiendo los pasos descritos:
a) Se ponen los valores que toma la variable en la primera columna de abajo hacia arriba.
b) Para la columna de f. absolutas contamos el nmero de veces que se repite cada valor. La suma de ellos es
igual al tamao de la muestra.
c) Para la columna de f. relativas dividimos cada f. absoluta por n. Las suma de ellas debe dar 1.
d) Para obtener las f. absolutas acumuladas sumamos para cada valor su f. absoluta ms la absoluta acumulada
del valor anterior. Su suma debe dar tambin n.
e) Para las f. relativas acumuladas dividimos cada f. absoluta acumulada por n. La frecuencia relativa de valor
mayor debe ser igual a 1.
En muestras en donde se tienen muchsimos valores que toma la variable, suele aplicarse lo que se denomina una
agrupacin en intervalos, y que consiste en formar grupos de valores consecutivos, llamados intervalos, y poner
uno de estos grupos en cada fila, en lugar de poner cada valor individual por separado.
A continuacin se calculan las f. absolutas conjuntas de los valores incluidos en el intervalo haciendo lo mismo
despus con las f. relativas, las absolutas acumuladas y las relativas acumuladas.

En las distribuciones de frecuencias con valores agrupados en intervalos aparecen algunos elementos nuevos:
Se llama intervalo a cada uno de los grupos de valores que ocupan una fila en una distribucin de frecuencias.
Se llaman lmites aparentes o informados de un intervalo a los valores mayor y menor que puede adoptar la
variable dentro de ese intervalo.
Se llaman lmites exactos de un intervalo a los valores mximo y mnimo incluidos en el intervalo.
Se llama punto medio de un intervalo a la suma de sus lmites exactos partido por dos.
Se llama amplitud de un intervalo a la diferencia entre su lmite exacto superior y su lmite exacto inferior. Se
representa por la letra I.
Hay tres reglas y algunas directrices para hacer una distribucin:
a) el intervalo superior debe incluir al mayor valor observado,
b) el intervalo inferior debe incluir al menor valor observado,

5
c) cada intervalo debe incluir el mismo nmero de valores.
Pero al ser muchas las agrupaciones diferentes que se pueden realizar, para decidir entre ellas hay que tener
presentes algunas directrices basadas en dos guas principales:
a) dado que el objetivo de una distribucin es conseguir una ordenacin manejable que ayude a comprender el
significado de los datos, no es conveniente que el nmero de intervalos sea demasiado grande,
b) el nmero apropiado de intervalos debe ser tal que, simultneamente, con ella se consiga una agrupacin
operativa y que cumpla los objetivos para los que ha sido diseada la distribucin, p ero sin distorsionar los valores
con el error de agrupamiento.
Intervalos abiertos: en los cuales no se pone el limite inferior del intervalo que incluye los valores menores, el lmite
superior del intervalo que incluye los valores mayores, o no se pone ninguno de estos dos.
Problema de los bordes: cuando no pueden hacerse intervalos de amplitud constante tales que el mayor tenga al
79 como lmite aparente superior y al 43 como limite aparente inferior. En estos casos suele aadirse al listado
distintos observados algunos otros valores no observados en la muestra. Estos valores, tendrn frecuencias
absolutas iguales a cero, pero nos premitiran conseguir un numero de valores distintos que sea mltiplo del numero
de intervalos que queremos hacer.
2.2.1 Supuestos de distribucin intraintervalo
2.3 representaciones graficas:
Dar informaciones desde un solo golpe de vista.
2.3.2 convenciones sobre las representaciones grficas,
2.3.3 tendenciosidad de las representaciones grficas.
REPRESENTACIONES GRFICAS.

GRFICO
6
Diagrama de
rectngulos

Perfil
octogonal

PARA QU VARIABLE SE
USAN

GRFICO

VARIABLES NOMINALES y
ORDINLAES (ejemplo: nivel
cultural) CUALITATIVAS O
CUASICUANTATIVAS

Se utiliza en informes
psicopedaggicos o de
rendimientos.

VARIABLES ORDINALES Y
NOMINALES
Pictogramas

CUALITATIVAS Y
CUASICUANTITATIVAS
INTERVALAR O DE RAZN

Diagrama de
barras

VARIABLES CUANTITATIVAS
DISCRETAS (en el eje de
abscisas se colocan los
distintos valores de la variable
y en el eje de las coordenadas
las frecuencias).

INTERVALAR O DE RAZN
Histograma

VARIABLES CUANTITATIVAS
DISCRETAS
(datos agrupados en
intervalos)

INTERVALAR O DE RAZN
Polgono de
frecuencias

VARIABLES CUANTITATIVAS
DISCRETAS O CONTINUAS
(resulta unir los extremos
superiores de las que hubieran
sido las barras)

Diagrama de
barras

INTERVALAR O DE RAZN
VARIABLES CUANTITATIVAS

A partir de las distribuciones de


frecuencias se pueden construir
representaciones grficas. La
funcin de stas es dar
informaciones globales mediante
un solo golpe de vista.

a) Diagrama de rectngulos:
para hacer un diagrama de
rectngulos se colocan en el eje
de abscisas las modalidades (o
los nmeros que las representan),
y en el eje de ordenadas las
frecuencias (puede ser absolutas
o relativas simples o
acumuladas). Sobre cada
modalidad se levanta un
rectngulo cuya altura es la
frecuencia correspondiente. Para
variables nominales u ordinales.

b) Perfil octogonal: se utiliza


mucho en informes
psicopedaggicos o de
rendimiento.

7
c) Pictograma: son representaciones en forma de crculos en los que stos son divididos en secciones cuya
superficie es proporcional a la frecuencia de la modalidad correspondiente.

d) Diagrama de barras: se utiliza en variables cuantitativas discretas. En el eje de abscisas se colocan los distintos
valores de la variable y en el eje de ordenadas las frecuencias. Sobre cada valor de la variable se traza una lnea o
barra perpendicular cuya altura debe ser igual a la frecuencia.

e) Histograma: se utiliza para variables cuantitativas continuas con datos agrupados en intervalos. En el eje de
abscisas se colocan los lmites exactos de los intervalos, y en el eje de ordenadas las frecuencias. Sobre cada
intervalo se levanta un rectngulo cuya altura sea igual a la frecuencia correspondiente.

f) Polgono de frecuencias: para variables discretas, el polgono es la figura que resulta de unir los extremos
superiores de las que hubieran sido las barras.

g) Diagrama de barras acumuladas: se utiliza en variables discretas. En el eje de abscisas se colocan los valores
de la variable y en el de ordenadas las frecuencias acumuladas, ya sean absolutas o relativas. Sobre cada valor se
traza una perpendicular cuya longitud sea igual a la f. acumulada. Desde el extremo superior de cada una de estas
barras se traza una lnea horizontal que se une con la barra situada a su derecha.

h) Polgono de frecuencias acumuladas: se utiliza en variables continuas. El eje de abscisas se construye igual
que en los histogramas, pero en el de ordenadas se incluyen las f. acumuladas, ya sean absolutas o relativas.
Sobre cada lmite se levanta una perpendicular cuya longitud sea idntica a la f. acumulada y se une con los
extremos superiores de dichas perpendiculares.

i) Otros dibujos: muchas veces se utilizan otras representaciones figuritas, en las que se incluyen lo s objetos de
los que se estn haciendo recuentos de frecuencias, a algn smbolo que los identifique de forma muy expresiva.

PROPIEDADES.
Los conjuntos de datos de variables cuantitativas obtenidos en muestras, tienen algunas caractersticas. Son
cuatro:

a) Tendencia central: se refiere a la magnitud general de las observaciones hechas. Esta magnitud general puede
cuantificarse mediante unos ndices conocidos como ndices de tendencia central o promedios y que reciben ese
nombre porque pretenden ser sntesis de los valores de la variable.
b) Variabilidad: esta propiedad se refiere al grado de concentracin de las observaciones en torno al promedio.
Una distribucin ser homognea o poco variable si los datos difieren poco entre si, y por tanto, se agolpan en
trono a su promedio. Ser heterognea o muy variable si los datos se dispersan mucho con respecto al promedio.
Esta propiedad es independiente de la anterior, es decir, dos grupos que tengan distinta variabilidad pueden tener
tendencias centrales muy distintas o similares.

8
c) Asimetra o sesgo: esta propiedad se refiere, por tanto, al grado en que los datos tienden a concentrarse en los
valores centrales, en los valores inferiores al promedio, o en los valores superiores a ste. Existe simetra perfecta
cuando en caso de doblar la representacin grfica por una vertical trazada sobre la media, las dos mitades se
superponen perfectamente.
d) Curtosis: se refiere al grado de apuntamiento de la distribucin. Si es muy apuntada, se llama leptocrtica, y si
es muy aplastada, se llama platicrtica. Generalmente el grado de curtosis de una distribucin se compara con un
modelo de distribucin llamado distribucin normal, y que respecto a la curtosis se llama distribucin mesocrtica.

DIAGRAMA DE TALLOS Y HOJAS.


Las distribuciones de frecuencias no son el nico medio para resumir y exponer conjuntos de datos; una alternativa
a ellas son los llamados diagramas de tallo y hojas. Su obtencin requiere separar cada puntuacin en dos partes:
el primer o primeros dgitos, que reciben el nombre de tallo y el dgito o dgitos restantes, que reciben el nombre de
hojas. (x=56, 5 (tallo) y 6 (hoja). Pasos:
a) Se identifican los valores mximo y mnimo observados.
b) Se toma una decisin acerca del nmero ms apropiado de tallos distintos.
c) Se listan todos los tallos distintos en una columna, ordenados de forma creciente de arriba hacia abajo.
d) Se escribe cada hoja, junto al tallo que le corresponda, preferiblemente ordenados segn su valor.

El diagrama de tallo y hojas tiene varias ventajas sobre la distribucin e inconvenientes: una primera ventaja es que
permite identificar cada puntuacin individual. En las distribuciones tradicionales slo conocemos las frecuencias
del intervalo, y eso nos obliga a tratar los datos de ciertas maneras distorcionadas; no facilita, como la distribucin
clsica, el clculo de estadsticos; ofrece tanto un listado de las puntuaciones como un dibujo de la distribucin; al
contener los valores de cada observacin es ms fcil de modificar para obtener un dibujo con un nivel de detalle
distinto; pueden representarse dos conjuntos de datos en el mismo diagrama, con lo que facilita la comparacin.

Captulo 3: Medidas de posicin


Para hacer estas valoraciones relativas se pueden utilizar las llamadas medidas de tendencia central, que son
ndices diseados especialmente para revelar la situacin de una puntuacin con respecto a un grupo, utilizando a
ste como marco de referencia. Un tipo concreto de medida de posicin son las llamadas medidas de tendencia
central.
Centiles o percentiles: son 99 valores de la variable que dividen a la distribucin en 100 secciones, cada una
conteniendo a la centsima parte de las observaciones. Se simboliza por C28 a aquella puntuacin que deja por
debajo de si al 28 por 100 de las observaciones y que es superada por el 72 por 100. Los centiles no suelen
calcularse con cantidades de pequeos datos, y cuando es necesario hacerlo se obtienen sencillamente ordenando
las puntuaciones y calculando la proporcin de stas que superan al valor que se quiere comparar. Normalmente
los centiles se obtienen sobre datos agrupados en intervalos, y en su clculo se asume el supuesto de distribucin
homognea intraintervalo. Frmula:

Deciles: son nueve puntuaciones que dividen a la distribucin en 10 partes, cada una conteniendo al 10 por 100 de
las observaciones. Se representa por Dk, donde k indica el nmero del decil al que se refiere. As, el decil cuarto,
es la puntuacin que deja por debajo de si al 40 por 100 de las observaciones y por encima de si al 60 por 100.

9
Cuartiles: son tres puntuaciones que dividen a la distribucin en cuatro partes, cada una conteniendo al 25 por 100
de las observaciones. Se representan por Qk donde k indica el nmero del cuartil al que se refiere
Existe una equivalencia directa entre los distintos cuantiles. Gracias a esta equivalencia, las frmulas de clculo de
los cuantiles se resumen en la de los centiles correspondientes al cuantil que se quiera.