Está en la página 1de 33

MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 1

UNIDAD IV.

ANÁLISIS DESCRIPTIVO DE LOS


PROCESOS SOCIOCULTURALES INTRODUCCIÓN .................................................................................. 2
Reglas del redondeo de datos .............................................................. 2
El símbolo de sumatoria y sus reglas .................................................. 3
Técnicas de organización de datos ...................................................... 6
Lectura 1
Organización conforme a la posición ordinal...................................... 8
Silva, R, Arturo (1992) La medidas de tendencia Distribución de frecuencias ................................................................. 8
central y de dispersión en la Medidas de tendencia central ............................................................ 14
Cuartiles, quintiles, deciles y percentiles .......................................... 23
psicología. En A. Silva, (Ed.). Métodos
Medidas de dispersión ....................................................................... 25
cuantitativos en psicología. Un
enfoque metodológicos. México,
Trillas. Cap. 6. pp 165-209.

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 2

INTRODUCCIÓN decimales que permanecerá para obtener el último digito deben considerarse
tres reglas.
Primera regla. Si en el residuo que se va a eliminar el primer digito es
Toda investigación esta constituida por un conjunto de fases que se
menor que cinco, el último digito que ha de permanecer no debe sufrir ningún
interrelacionan estrechamente con el propósito de obtener información acerca
cambio. Por ejemplo:
del fenómeno estudiado. En este capitulo se presentaran los conceptos y las
técnicas cuantitativas fundamentales de cualquier análisis estadístico, por lo
que la comprensión cabal del mismo es de suma importancia para que los
capítulos subsiguientes, en los que se presentan técnicas estadísticas más
complejas, se aprovechen en mayor medida.
En este capitulo se abordara única y exclusivamente la etapa cuantitativa
descriptiva, la cual puede utilizar el investigador como una primera instancia Como la división es de dos números enteros, debemos aproximar hasta
para interpretar la factibilidad de sus hipótesis y la generalidad de los dos decimales, y como el primer digito del residuo que se va a eliminar es menor
resultados de su estudio. de cinco (3.4615385), entonces el ultimo digito que permanece no sufre ningún
Las técnicas cuantitativas descriptivas pueden definirse como el cálculo de cambio. Así pues:
una medida numérica de un conjunto de datos, que describe un aspecto
particular o característico de esos datos. Los índices estadísticos descriptivos
mas comunes son las medidas de centralidad y variabilidad; sin embargo,
3.4615385 = 3.46
antes de revisar estas técnicas examinaremos el redondeo de datos y algunas
reglas de la sumatoria, que son dos elementos básicos que debe conocer Segunda regla. Si el residuo que aparece después del último digito que
toda persona que se interne en el estudio de los métodos cuantitativos. habrá de conservar la serie es mayor que cinco o cinco seguido por otros
dígitos no iguales a cero, se aumentara el digito hasta el número superior. Por
ejemplo:
Reglas del redondeo de datos

Al realizar un calculo estadístico es muy frecuente encontrar un numero


decimal con muchas cifras, en ocasiones tantos decimales con]o caracteres
tenga la calculadora; es obvio que en este caso debemos decidir con cuantos
decimales trabajaremos durante todo el proceso de calculo del índice
estadístico. De acuerdo con Holguin (1979), hay tres razones para presentar Como la división es de dos números que tienen un decimal debemos
los datos con un menor número de cifras: se evitan errores en la redondear hasta tres decimales; por lo tanto, como el primer digito del residuo
que va a desaparecer es mayor que cinco (3.4422481), el ultimo digito que
contabilización, se simplifica la lectura de las cifras y se facilitan los cálculos
numéricos. permanece debe aumentar al numero inmediato superior; esto es:
Cuando se va a redondear es necesario decidir que número de decimales
se mantendrá y como obtener el ultimo numero de la serie que va a
permanecer. Para el primer caso, Haber y Runyon (1973) establecen que
cuando nuestros datos originales sean unidades enteras debemos mantener
dos decimales; si se trata de un número con un decimal, aproximaremos
hasta el tercero de ellos, y así sucesivamente. Una vez decidido el número de Veamos otro ejemplo. Supóngase que deseamos aproximar las siguientes

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 3

cifras a dos decimales: tres o hasta cuatro decimales, independientemente de la forma en que
estuvieran los datos originales.

2.88500001 = 2.89 En la tabla 6.1 se presentan ejemplos de redondeo de cifras.

Tabla 6.1. Redondeo de cifras.


Tercera regla. Se aplica cuando el primer digito del residuo que ha de
eliminarse es cinco seguido por ceros. En este caso, si el último digito que Nurnero por redondear Redondeo a dos
debe redondearse es impar, se aumenta al numero superior: por el contrario,
se es par o cero, no se hace ningún cambio. Por ejemplo: 17.434779 17.43
21.84659 21.85
23.36500 23.36
23.43500 28.44
15.995 16.00
Como el residuo que desaparece es cinco seguido de ceros y el ultimo 18.36501 18.37
digito que permanece es par, no se hace ningún cambio. Así pues:

0.125 a 0.12 El símbolo de sumatoria y sus reglas

Por otro lado, cuando se tiene: El símbolo de sumatoria es el signo más frecuente en la estadística, de
aquí que su conocimiento es de gran importancia para entender cualquier
0.415 = 0.42 procedimiento cuantitativo.
Cuando se quiere representar un conjunto de datos sin especificar ninguno
en particular se hace a través de Yi, que se lee Y subíndice i, en donde Y
El cero se considera dentro del grupo de los pares no porque lo sea sino reemplaza al dato y el subíndice i indica el lugar del dato en una serie de n
para equilibrar a estos con el grupo de los impares, puesto que existen cinco datos, sin que esto tenga ninguna implicación de magnitud. Así, Y, indica el
impares (1, 3, 5, 7 y 9) y solo cuatro pares (2, 4, 6 y 8). De tal manera, dato numero cuatro de la serie n; por consiguiente, i tomara valores desde 1
cuando el ultimo digito de la cifra que permanece es cero y el primer valor del hasta el total de datos del conjunto; es decir, hasta n. Por ejemplo, supongamos
residuo que desaparecerá es cinco seguido de ceros, el ultimo digito no sufre que en una investigación se estuvo registrando durante seis sesiones la
ningún cambio; por ejemplo: duración total por sesión de los periodos de aislamiento de un niño autista (los
datos hipotéticos se muestran en la tabla 6.2). Entonces, el número de datos
4.605 = 4.60 obtenidos en esa serie de observaciones es 6, por lo que n = 6. Y 1 será el
tiempo de aislamiento del niño en la sesión uno (50 min.), Y2 en la sesión dos
Es importante aclarar que si bien estas reglas de redondeo acerca de (49 min.), y así hasta Y6 (60 min.). En conclusión, Yl = 50, Y2 = 49, Y3 =59,
como obtener el ultimo digito que ha de permanecer son universalmente Y4=57, Y5=61 y Y6=60.
aceptadas, no ocurre lo mismo con el numero de dígitos a los cuales se debe
aproximar la cifra, puesto que existen casos en que la cifra se aproxima a dos,

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 4

50 + 49 + 5 9 + 5 7 + 6 1 + 6 0 = 3 3 6 .
Tabla 6.2. Resultados hipotéticos de la conducta de aislamiento de un
niño autista. Se puede dar el caso de que no se este interesado en sumar todos los
datos de una serie, por ejemplo:
Duración de los periodos
Sesion de
1 50
2 49
3 59
4 57
5 61
6 60
con lo que se estaría efectuado la siguiente adición: Y2 + Y3 + Y4 + Y5.
En ocasiones se esta interesado en sumar algunos valores de Y,, como en Sustituyendo con los datos del ejemplo, quedaría: 49 + 59 + 57 + 61 = 226.
el caso de Y2 + Y3, que señala la suma del segundo y tercer valores. Si se Hay cuatro reglas de la sumatoria que es importante tener siempre
desean sumar todos los datos hasta n, en este caso la suma seria Y1 + Y2-+ presentes:
... + Yn,. A menudo se emplea una abreviatura de Y1 + Y2 + ... + Yn, que es : Primera regla. Es el caso en que se multiplica cada Yp por una constante;
esto es:

Factorizando el polinomio anterior, tenemos que:


en donde es la letra mayúscula griega sigma e indica el procedimiento de
sumar; por ejemplo:

Al sustituir el símbolo de sumatoria por (Y1 + Y2 + … + Yn)


tenemos que:

se lee "la sumatoria de Y. desde i igual a 1 hasta 6", e indica la operación Y1 +


Y2 + + Y6; si retomamos los datos de la tabla 6.2 tendremos que la suma es

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 5

Si se hace otra agrupación, se tendrá:

En conclusión, cuando cada valor de la sumatoria se multiplica por una


constan-te, la suma de los n productos será igual a:
En el segundo miembro de la igualdad, la suma entre paréntesis es

por otro lado, el paréntesis de la derecha del mismo miembro contiene a


C, que se suma tantas veces como n datos existan en el conjunto. Así pues,
este término es igual a nC y, por consiguiente:
Con los datos de la tabla 6.2 supongamos que todos los valores se
multiplican por la constante 4 y después se suman esos productos; es decir:

4(50) + 4(49) + 4(59) + 4(57) + 4(61) + 4(60) = 1 344

Esto sería idéntico a:


En conclusión, cuando a cada valor se le agrega una constante, la suma
de éstos será igual a:

Segunda regla. Cuando se añade una constante a cada valor de la


sumatoria, la suma de los valores será:

En nuestro ejemplo, si a cada valor le sumamos la constante 4, tenemos


que:

(50+4)+(49+4)+(59+4)+(57+4)+(61 +4)+(60+4)=360

Esto es idéntico a:

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 6

Tercera regla. Cuando se obtiene la suma de n números elevados al Es muy frecuente confundir estas dos expresiones; sin embargo, son
cuadrado por separado, esto es: muy diferentes. Retomando los datos de la tabla 6.2 se tiene que, por
ejemplo:

se representa así: Por otro lado:

Cuarta regla. Otra expresión de gran importancia es cuando el


resultado de la suma de un conjunto de valores se multiplica por sí mismo, En conclusión:
es decir:

(Y1+Y2+...+Yn) (Y1+Y2+...+Yn)

puede escribirse también como:


Técnicas de organización de datos

Una vez vistos dos prerrequisitos importantes para estudiar los métodos
cuantitativos -el redondeo de datos y las reglas de sumatoria, se abordarán

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 7

algunos procedimientos estadísticos para organizar los datos.


En la mayoría de las investigaciones, los instrumentos de medición
proporcionan los datos sin organización, ya que éstos se recogen a medida
que se observan, por lo que es necesario disponerlos conforme a una
estructura que permita descubrir, a partir de esa primera recolección,
contenidos relevantes acordes con el objetivo de investigación, con la
finalidad de proporcionar conclusiones importantes para el estudio.
De este modo, una de las primeras opciones para comprender e interpretar
los datos es presentarlos en una tabla, puesto que proporciona un panorama
general de los resultados obtenidos.
En la tabla 6.3 se muestran los resultados de una investigación de Ávila,
Ramos y Zárate (1986), en la cual en 60 niños de primaria se midió el
porcentaje de tiempo que tardaban en realizar la tarea, para lo que se colocó
a los sujetos en la situación experimental (utilizando como estimulo distractor
las caricaturas programadas en la televisión) y se les dieron las siguientes
instrucciones: "Mira, aquí hay unas hojas con una tarea (15 sumas y 15
restas) que debes realizar; tienes 15 minutos para hacerla".
Los resultados aparecen en la tabla 6.3 en el orden en que los sujetos se
expusieron a la condición experimental; sin embargo, a partir de esa primera
presentación es muy difícil tener una idea de la forma en que se distribuyeron
los niños.

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 8

Organización conforme a la posición ordinal quincuagésimo séptima posición. Es frecuente encontrar puntuaciones iguales
en series de datos de 15 o más; nótese, por ejemplo, que cinco niños tuvieron
Un primer paso es ordenar los datos de acuerdo con el porcentaje de 97% por lo que se les asigna la misma posición. Cuando existen puntuaciones
tiempo realizando la tarea, del más alto al más bajo, con lo que se tendrá idénticas, la posición se obtiene calculando el promedio de éstas. Por ejemplo,
información de la posición que guarda cada puntuación. Este primer tipo de cinco niños obtuvieron una puntuación de 97% y solamente una se encuentra
organización se muestra en la tabla 6.4. por encima de la misma. El promedio de las cinco siguientes posiciones (2, 3, 4,
5 y 6) es 4, que se asigna a todas las puntuaciones de 97%.
Sin embargo, esta primera forma de organización insume demasiado
tiempo; además, la lista es muy extensa, debido a lo cual en ocasiones esta
técnica no es recomendable.

Distribución de frecuencias

Es posible acortar la lista de puntuaciones si éstas se arreglan conforme a


una distribución de frecuencias. En la tabla 6.5 se muestra la puntuación o
porcentaje de tiempo realizando la tarea, y a la derecha de cada una de ellas
el número de veces que se observó, Llamado frecuencia (f). El total de
frecuencias es n.

Distribución de frecuencias agrupadas

Otra forma de organizar los datos consiste en seleccionar un conjunto de


intervalos contiguos, que no se traslapen, de modo que cada puntuación se
coloque en uno y sólo uno de los' intervalos; es decir, deben ser mutuamente
excluyentes.
Estos intervalos se conocen como intervalos d e clase, y la distribución
completa de los mismos por lo común se denomina distribución de frecuencias
agrupadas. Según Haber y Rungyon (1973), existen razones para agrupar los
datos de esta manera, a saber: a ) trabajar con un gran número de datos resulta
poco práctico, a menos que se disponga de un buen aparato de cómputo, y b)
hay algunas puntuaciones que tienen una frecuencia muy baja, que no justifica
conservarlas como entidades distintas. No obstante estas razones, es
importante reconocer que al optar por esta forma de organización,
inevitablemente se pierde parte de información.

De este modo, resulta fácil ver que en la muestra de 60 sujetos, un niño


cuyo porcentaje de tiempo realizando la tarea sea de 36%, obtiene la

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 9

k es el número de intervalos de clase, y


n es el total de puntuaciones consideradas.
Daniel concluye que la regla de Sturgen no debe considerarse como final
sino como una guía. Ice este modo, todos los autores terminan por señalar
que no existe una regla fija para determinar el número adecuado de intervalos
de clase, sino que éstos, en última instancia, serán determinados por el
interés del investigador.
Otra cuestión que debe decidirse se refiere a la amplitud del intervalo de
clase, para lo cual es importante encontrar primero el rango de variación de
las puntuaciones, que es la diferencia entre la mayor y la menor de éstas,
más la sensibilidad del instrumento de medida; es decir:

donde
Pa es la puntuación más alta,
Pb es la puntuación más baja, y
S es la sensibilidad del instrumento, que la mayoría de las veces es 1. Sin
embargo, en ocasiones el instrumento es tan sensible que arroja datos en
décimas o centésimas, por lo que S será 0.1 o 0.01, respectivamente; tal es el
caso cuando se miden tiempos entre respuestas.
Una de las primeras cuestiones que deben considerarse en esta forma
Una vez encontrado el rango y decidido el número de intervalos que
de organización es cuántos intervalos de clases han de utilizarse. Algunos
contendrá la distribución de frecuencias, es muy sencillo determinar la amplitud
autores (Glass y Stanley, 1974) señalan que no deben ser menos de 12 ni
de cada intervalo, dividiendo el rango por el número de intervalos (K).
más de 15, mientras que otros (Haber y Runyon, 1973) sostienen que buena
Simbólicamente, la amplitud del intervalo de clase está dada por:
parte de los datos obtenidos en las ciencias del comportamiento puede ser
agrupada de 10 a 20 intervalos de clase. Sin embargo, para determinar el
número de intervalos de clase Daniel ( 1 9 7 9 ) recomienda la fórmula de
Sturgen:

Cuando se ha determinado la amplitud del intervalo de clase (C) es posible


comenzar a construir la distribución de frecuencias, tomando la puntuación
más baja de los datos originales como el límite inferior del primer intervalo de
donde: clase; el límite superior de ese intervalo se obtiene agregando C - 1 al límite

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 10

inferior. El límite inferior del intervalo de clase siguiente es el número entero


consecutivo a la puntuación superior del intervalo de clase inferior. Este
mismo procedimiento se sigue hasta que todas las puntuaciones se hayan
incluido en los intervalos de clase apropiados.
Para ejemplificar el procedimiento tomemos los datos de la tabla 6.5, que
contiene el porcentaje de tiempo de 60 niños realizando la tarea. Para obtener
el número de intervalos se aplica la regla de Sturees. con lo aue se obtiene:

Para obtener la amplitud del intervalo el rango se divide por 7. La


puntuación más alta es 98 y la más baja 20, por lo que el rango es:
Al redondear la amplitud del intervalo al número entero más cercano en
este caso 11 se observa que el número de intervalos dado por Sturges en
este ejemplo 7 no abarca todas las calificaciones originales, puesto que el límite
superior del séptimo intervalo es 96, mientras que en los datos originales se
tienen puntuaciones mayores (cinco con 97 y uno con 98). De este modo, es
Entonces, la amplitud de los intervalos de clase será: necesario agregar un intervalo más que abarque de 97 a 107, con la finalidad
de que comprenda las seis puntuaciones extremas. Una vez establecidos los
intervalos de clase con los que se ha de trabajar se determina el número de
valores que caen en cada intervalo, observando los valores originales uno a
uno y colocando una marca a un lado del intervalo apropiado, como se
muestra en la tabla 6.6.
Es obvio que resulta más conveniente utilizar una amplitud de 11 para el
intervalo de clase, ya que no se comete ningún error si se redondea al número
más cercano.
Como el menor valor en la tabla 6.5 es 20 y el mayor es 98, pueden
comenzarse los intervalos en 20, que corresponde a límite inferior del primer
intervalo. Para obtener el limite superior del primer intervalo se agrega C - 1,
que en este caso es 11 - 1 = 10 y, como se comenzó en 20, el límite superior
de este intervalo de clase es 30. El límite inferior del intervalo siguiente será el
número entero consecutivo del límite superior del intervalo anterior (en este
caso 31).
Los demás intervalos se determinan de la misma manera:

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 11

Tabla 6.6. Distribución del porcentaje de tiempo realizando la tarea en una Frecuencias acumulada, relativa y relativa acumulada
muestra de 60 niños de primaria.
A menudo es conveniente obtener también la distribución de
frecuencias acumuladas, que se encuentra al sumar las frecuencias
anteriores al intervalo de clase correspondiente, como se muestra en la
tabla 6.7.

Los límites verdaderos de un intervalo de clase

En el capítulo 4 se señaló que el valor verdadero o exacto de un número


se obtiene sumando y restando la mitad de la sensibilidad del instrumento al
valor informado. Por ejemplo, en el porcentaje de tiempo real realizando la
tarea, el porcentaje informado de 20% está realmente entero 20% más menos Otra información que puede ser útil es la proporción de casos que caen
0.5%; es decir, 19.5 y 20.5%. Por supuesto, tal razonamiento también es dentro de un intervalo de clase particular, la cual recibe el nombre de
válido para estos valores, aunque se hayan agrupado en intervalos de clase. frecuencia relativa por ocurrencia. En la columna cuatro de la misma tabla
Así, no obstante que el limite de clase menor se represente como 20 - 30, los 6.7 se observa la frecuencia relativa para este ejemplo, que se obtuvo al dividir
límites verdaderos serán 19.5 - 30.5. Esta aclaración es importante en el la frecuencia de cada intervalo de clase por el total de niños (60). Por ejemplo,
cálculo de la mediana y de los percentiles, como veremos más adelante. la proporción de valores entre 75 y 85 es 0.25; es decir 0.25 de los valores
están entre 75 y 85. Algunas veces esta proporción se multiplica por cien para
obtener la distribución porcentual. Entonces, al multiplicar 0.25 por 100, puede
decirse que el 25% de los 60 niños realizan su tarea entre 75 y 85% del

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 12

tiempo total asignado.


Al igual que las frecuencias, las frecuencias relativas pueden acumularse
para facilitar la obtención de información referente a la frecuencia relativa de
los valores
dentro de dos o más intervalos de clase. En la tabla 6.7 se muestran los
intervalos de clase, las frecuencias, las frecuencias acumuladas, las
frecuencias relativas y las frecuencias relativas acumuladas.
La distribución de frecuencias generalmente no es suficiente para tener
una visión clara de la forma en que se distribuyeron los datos, debido a lo
cual es recomendable representar gráficamente dicha distribución. Existen
tres métodos, que son los más comunes: el histograma o diagrama de
columnas, el polígono de frecuencias o diagrama de líneas, y la curva de
percentiles u ojiva.

Histograma

El histograma es un conjunto de barras en el que los valores de la


variable que ha de considerarse se representan en el eje de las abscisas,
mientras que el eje de las ordenadas tiene como escala la frecuencia de En la figura 6.1 a) se representa el histograma de la tabla 6.8. Puesto que
ocurrencia; de tal modo, la base de la barra es el intervalo de clase en tanto en el intervalo 85.5 - 96.5 la frecuencia más alta es 22, no es necesario
que la altura es el número de casos por intervalo. Las barras deben estar extender la escala de la ordenada por encima del 22, y ya que las
unidas y para lograrlo se utilizan los límites reales de los intervalos de clase puntuaciones van del intervalo 19.5 - 30.5 al 96.5 - 107.5, la escala de las
que se muestran en la tabla 6.8. abscisas se representa sólo hasta esa distancia.

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 13

Polígono de frecuencias
La forma de obtener un polígono de frecuencias es muy semejante a la
del histograma. En el polígono de frecuencias los intervalos de clase se
sustituyen por los puntos medios, sobre los cuales se localiza un punto que
corresponde a la frecuencia de dicha clase, y posteriormente esos puntos se
unen por rectas. Con la finalidad de unir el polígono a la abscisa, es necesario
agregar otros dos puntos medios, uno para cada extremo. En la figura 6.1 b)
se muestra el polígono de frecuencias para la tabla 6.8. La forma de obtener
los puntos medios es

Ojiva

La ojiva corresponde a la representación gráfica de la frecuencia


acumulada o de la distribución porcentual acumulada; cuando se presenta esta
última distribución, la gráfica resultante se denomina curva de percentiles.
Para el proceso de construcción se toma la columna de las frecuencias
acumuladas o los porcentajes acumulados y se representa por un punto en el
límite superior del intervalo de clase, o sea el limite que separa dos clases
consecutivas. Esta gráfica es de gran utilidad en el cálculo de los percentiles,
los cuartiles y la mediana, como veremos más adelante. En la figura 6.2 se
aprecia la ojiva que se obtiene a partir de los datos de la tabla 6.8.

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 14

resumir los datos de una investigación. Las medidas de tendencia central más
comunes son la media, la moda, la mediana, los percentiles y los cuarteles.

La moda

La moda es el valor que se repite mayor número de veces en un conjunto


de datos. Por ejemplo, en el siguiente conjunto de datos: 1, 4, 4, 5, 7, 9 y 10, la
moda es 4, ya que es la puntuación más frecuente. Nótese que la moda es la
puntuación más frecuente (en este caso 4) y no la frecuencia de esa
puntuación (en este caso 2). La moda también puede usarse para describir
datos cualitativos; por ejemplo, en el área de Educación Especial y
Rehabilitación de la ENEP Iztacala se trabaja con problemas de aprendizaje,
ceguera, sordera, parálisis cerebral, retraso generalizado, etc.; entonces la
clase modal seria aquella que contara con un mayor número de niños para su
atención.
Cuando todos los valores son diferentes se dice que no existe moda; así,
el ejemplo de los datos de la tabla 6.2 no tiene moda, puesto que en las seis
sesiones de observación de la conducta de aislamiento no se repitió ningún
valor. Por otra parte, cuando dos puntuaciones adyacentes tienen la misma
frecuencia y ésta es la mayor, la moda es el promedio de las dos
puntuaciones. Por ejemplo, en un grupo de puntuaciones: 1, 4, 4, 4, 5, 5, 5, 6,
6 y 7, la moda es 4.5, ya que tanto el 4 como el 5 se repiten tres veces y son
Medidas de tendencia central puntuaciones adyacentes.
En algunos conjuntos de datos puede haber dos o más puntuaciones no
En la sección anterior se vio cómo un grupo de datos pueden ser adyacentes cuya frecuencia sea la misma, y esta frecuencia común sea mayor
organizados gráficamente o en forma de tablas. Este tipo de organización que la de cualquiera otra puntuación; entonces se dice que existen varias
puede variar de un investigador a otro: por ejemplo, uno puede agrupar los modas; que en caso de ser sólo dos puntuaciones no adyacentes que
datos en 12 intervalos de clase mientras otro los reúne en 15, y esto dará comparten la misma frecuencia máxima, se denomina bimodal; cuando son
como resultado diferentes distribuciones de frecuencia, así como también tres o más se llama multimodal. Por ejemplo, en el conjunto de puntuaciones;
distintas gráficas. Así, la mayoría de las veces es necesario resumir los datos 18, 19, 19, 19, 19, 20, 21, 21, 22, 22, 22, 22, 23 y 24, tanto 19 como 22 son
en unas cuantas medidas descriptivas, llamadas medidas de tendencia modas, ya que ambas aparecen cuatro veces, siendo el grupo de datos
central, que evalúan cuantitativamente la agrupación de los datos alrededor bimodal.
de un valor central. La ventaja de estos índices estadísticos es que permiten Autores como Spiegel (1970) han puesto una fórmula para obtener la
tener un conocimiento cuantitativo de la distribución de los datos, en moda de datos agrupados en distribuciones de frecuencia; sin embargo, como
c
ontraposición con las distribuciones de frecuencia, que no proporcionan esta mencionan Haber y Runyon (1973), la moda se obtiene por inspección y no por
información; además, el hecho de que estas medidas permitan reducir un cómputo, de manera que para ellos la moda se designa como el punto medio
conjunto de datos a un valor cuantitativo, las hace más aconsejables para del intervalo de clase que contiene la mayor frecuencia. Conforme al punto de

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 15

vista de estos últimos autores, la moda de los datos de la tabla 6.8 es la


calificación de 91, puesto que el punto medio del intervalo 85.5 - 96.5, al cual
corresponde la mayor frecuencia.

La mediana

En un conjunto finito de valores, la mediana es el valor que divide la


distribución en dos partes iguales, de tal forma que la mitad de las
puntuaciones son mayores que la mediana y las de la otra mitad son menores
que ella, esto es, la mediana divide la distribución en dos mitades, siendo Por ejemplo, al colocar los datos de una conducta de aislamiento a lo largo
igual el número de casos o puntuaciones en cada mitad. Si el número de de la recta numérica que aparece en la figura 6.3, es posible tener una idea
puntuaciones en un conjunto de datos es impar, la mediana será la más clara del significado de la propiedad de la mediana que se ha
puntuación que está en medio, cuando todas las puntuaciones se han mencionado.
arreglado en orden de magnitud. Es decir, cuando el conjunto de datos es un En la figura 6.3, Md indica la mediana de las seis sesiones de observación:
número impar, por ejemplo: 12, 14, 25,31 y 40, la mediana es la puntuación 58. La diferencia absoluta entre 58 y 49 es de 9 unidades; entre 58 y 50, de 8
de la mitad, en este caso Md = 25. Por otro lado, si los datos son un número unidades; entre 58 y 57, de 1 unidad entre 58 y 59, de 1 unidad; entre 58 y 60,
par, como en el caso del registro de la conducta de aislamiento que se de 2 unidades y entre 58 y 61, de 3 unidades. La suma de estas distancias es:
muestra en la tabla 6.2, la mediana es el punto medio entre los valores 9 + 8 + 1 + 1 + 2 +3 = 24, que es menor de lo que seria la suma de las
centrales cuando las puntuaciones han sido ordenadas. lo datos ordenados distancias de los seis datos desde cualquier otro punto de la recta. Para ilustrar
de la conducta de aislamiento son: 49, 50, 57, 59, 60 y 61, porque la mediana esta característica de la mediana, en la tabla 6.9 se muestran las diferencias
es: absolutas y la suma de tales diferencias, cuando estas se toman respecto a la
median y a otras puntuaciones del conjunto de datos.
Puede verse que la suma es más pequeña en la columna 2, cuando las
diferencias se toman respecto a la mediana

Una de las propiedades fundamentales es de la mediana es que hace que


las sumas de las diferencias absolutas de cada puntuación del grupo con
respecto a la mediana sea menor que la suma de las diferencias absolutas de
cualquier otro punto.
Es decir,

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 16

puntuaciones en dos partes iguales, y la mediana es el promedio de esas


dos puntuaciones.

Tabla 6.9. Diferencias absolutas y suma de esas diferencias tomadas


Cálculo de la mediana en distribuciones de frecuencia
respecto a varias puntuaciones de la conducta de aislamiento.
Este cálculo presenta algunas variantes respecto de las técnicas vistas
anterior-mente. Por ejemplo, supongamos que las participaciones en clase de
26 alumnos de la carrera de psicología tienen una distribución de frecuencias
no agrupadas como se muestra en la tabla 6.10.

Tabla 6.10. Número de participaciones de 26 alumnos en la asignatura métodos


cuantitativos.

Participación Frecuencia Porcentaje


en clase Frecuencia acumulada acumulado
1 1 1 3.85
2 1 2 7.69
4 1 3 11.54
5 3 6 23.08
6 3 9 34.62
7 1 10 38.46
8 4 14 53.85
9 5 19 73.08
10 4 23 84.46
11 3 26 100.00
En la tabla 6.9 se observa que hay tres puntos que tienen la misma
suma de diferencias absolutas, y ésta es la más pequeña si se la compara
con las otras sumas: uno es el valor de la mediana y los otros el 59 y el 57, La fórmula de la mediana para distribuciones de frecuencia no agrupadas
que son precisamente las dos puntuaciones centrales a partir de las que está dada por:
se obtuvo la mediana. En caso de que el conjunto de valores sea un
número impar, la suma mínima de las diferencias absolutas no aparecerá en
otra puntuación diferente de la mediana, porque ésta es exactamente el
valor que divide a las puntuaciones en dos partes iguales, mientras que
cuando se trata de un número par, hay dos valores que separan las

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 17

en donde
donde:
L es el límite real inferior del valor que contiene a la mediana, fa la frecuencia
acumulada por debajo del número mediano, f la frecuencia del número
L es el límite real inferior del intervalo de clase que contiene a la mediana,
mediano, y n el total de observaciones.
fa es la frecuencia acumulada de todos los intervalos de clase por debajo
En el ejemplo, la mediana sería 26 = 13 puntuaciones; si se parte desde el
de la clase mediana,
extremo inferior se observa que la decimotercera puntuación se sitúa en el
f es la frecuencia del intervalo de clase que contiene a la
número 8, y como la sensibilidad de la medida es de una participación, sus
mediana, a es el total de observaciones, y C es la amplitud del
límites reales inferior y superior serán 7.5 y 8.5, respectivamente. La
intervalo de la clase mediana.
frecuencia acumulada por debajo del número 8 es 10 y la frecuencia del valor
Nótese que esta fórmula es similar a la de las distribuciones de frecuencia
mediano es 4. Con todos los datos anteriores es posible sustituir en la fórmula
no agrupadas, cuando C = 1.
para obtener la mediana. Así:
En la tabla 6.7 se muestra la distribución de frecuencias agrupadas del
porcentaje de tiempo de 60 niños realizando la tarea. Para el cálculo de la mediana
se divide 60 / 2= 30 que representa la frecuencia acumulada de una calificación
en la mitad de la distribución; la trigésima puntuación está situada en el
intervalo 75-85, cuyos límites reales son 74.5 - 85.5, y la frecuencia acumulada
por abajo del intervalo mediano es 17, con una amplitud del intervalo de 11;
entonces tenemos que:

De este modo, la mediana de participación de ese grupo de alumnos es


de 8.25; es decir, el 50% de los alumnos tuvieron menos de 8.25
participaciones en el curso.

Cálculo de la mediana en distribuciones de frecuencias agrupadas


De este modo, el 50% de los niños estuvieron realizando su tarea menos
Este cálculo es casi el mismo que el que se hace para una distribución no
del 84.03% del tiempo de observación.
agrupada; de hecho, esta última es un caso especial en la cual la amplitud del
intervalo es de una unidad. La fórmula que se emplea es la siguiente:
Calculo de la Cálculo de la mediana por el método gráfico

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 18

Es posible calcular la mediana a través de la gráfica de la ojiva, puesto que


como señala Spiegel (1970), geométricamente la mediana es el valor de la
abscisa que corresponde a la vertical que divide a una gráfica en dos partes
iguales.
En la figura 6.4 se muestra de forma gráfica la frecuencia acumulada (a)
y el porcentaje acumulado (b) de Ios datos de la tabla 6.7. La determinación de
la mediana por el método gráfico puede hacerse tanto con la ojiva de
frecuencias acumuladas como con la ojiva porcentual acumulada. Como ya se
ha señalado, la mediana es la puntuación que divide a un conjunto de datos
en dos partes iguales, de manera que para obtenerla se divide el total de
puntajes por dos 2 (n / 2) . En este caso se tienen 60 niños, entonces 20 = 30,
que corresponde al 50% del porcentaje acumulado; una vez hecha esta
operación, situaremos en la ordenada la frecuencia acumulada de 30, y a
partir de ese punto se traza una línea paralela al eje de las abscisas hasta que
intersecte con la curva; posteriormente se construye una perpendicular a las
abscisas. El punto en donde la perpendicular intersecte con la abscisa es el
valor de la mediana.
En las gráficas a) y b) de la figura 6.4 se observa que la mediana cae en
el intervalo 74.5 - 85.5, dentro del cual hay 11 unidades de calificaciones;
supongamos que gráficamente esas 11 unidades están representadas por 10
Mm. Para obtener el valor preciso de la mediana, se mide la distancias que
hay entre el límite inferior de ese intervalo y el punto que representa a la
mediana, (supuestamente 8.5 Mm.); como sabemos que 10 Mm. representan
11 unidades y el punto se desplazó 8.5 Mm. respecto al límite inferior del
intervalo mediano, entonces el valor de la mediana se obtiene fácilmente
aplicando una regla de tres:

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 19

Por consiguiente, a la mediana le corresponden 9.35 de las 11 unidades


de ese intervalo, de aquí que su valor sea esta proporción más el límite
inferior real del intervalo mediano; es decir:
Este resultado indica que, en promedio, durante las seis sesiones de
observación el niño pasó 56 minutos aislado.

que es muy semejante al valor obtenido por el método numérico, que fue de Cálculo de la Media en distribuciones de frecuencia
84.03. Para el cálculo de la media en una distribución de frecuencias se utiliza la
siguiente fórmula:

La media
La media constituye el índice de tendencia central más importante, puesto
que es el más sensible y figura en la mayor parte de los procedimientos
estadísticos que se utilizan en las investigaciones psicológicas. El símbolo
que generalmente se emplea para representar la media de un conjunto de
puntuaciones es Y que se define como la suma de las puntuaciones o de los donde:
valores de una variable, dividida por el número de casos que componen el
conjunto. Expresado de forma algebraica: Y1, es la puntuación i, y
f1, es el número de veces que aparece la puntuación i.

Así, en la tabla 6.5, por la columna encabezada por fi, sabemos que la
calificación 97 se presentó 5 veces. Como se recordará, la multiplicación es
una suma repetida; por ejemplo, 97 + 97 + 97 + 97 + 97 = 5 (97). En
consecuencia, la suma de todas las puntuaciones en un grupo se obtiene
multiplicando cada puntuación Y, por su frecuencia f,i, para formar Yi, fi, y
En donde Y es la media, y se llama Y barra o testada, n es después se obtiene la suma de los productos resultantes (ΣYi fi). De acuerdo
número de valores en el conjunto, y Y1, es el elemento i del con lo anterior, la media de la tabla 6.5 es:
conjunto.

Así, la media aritmética de los datos de la duración de la conducta de


aislamiento de un niño autista, representados en la tabla 6.2, es:

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 20

por lo que los 60 niños estuvieron realizando la tarea, en promedio, el 77.75%


del tiempo de observación.
El mismo procedimiento se utiliza para obtener la media de participación
de los 26 alumnos presentada en la tabla 6.10:

Este valor se interpreta de la siguiente forma: el grupo de 26 alumnos


tuvo en promedio una participación de 7.58 en la clase de Métodos
cuantitativos.

Cálculo de la media en distribuciones de frecuencias agrupadas

Cuando se calcula la media a partir de una distribución de frecuencias


agrupadas se supone que los puntajes a lo largo de cualquier intervalo se
distribuyen de manera uniforme. Sin embargo, en la realidad usualmente esto
no sucede, por lo que el valor que se calcula es bastante aproximado a la
media de los datos no agrupados. Con la anterior suposición, la suma de las
puntuaciones fi, en cualquier intervalo es igual al producto de fi y el punto
medio del intervalo, y de tal manera que el procedimiento es esencialmente
el mismo utilizado para la distribución de frecuencias. El procedimiento de
cálculo de la media a partir de distribuciones de frecuencias agrupadas se Como se observa, el valor de la media no es igual cuando los datos están
aprecia en la tabla 6.11, que presenta el porcentaje de tiempo realizando la agrupados que cuando no lo están, aunque los valores sean los mismos; no
tarea en una muestra de 60 niños. obstante, este último valor es una muy buena aproximación de la media de
datos no agrupados.

Media ponderada

Cuando se desea obtener la media de varios conjuntos de datos, un error


muy frecuente es el de suma de las medias parciales de cada conjunto y
dividirla por el numero de conjuntos. Por ejemplo, supongamos que un
investigador desea obtener la media de aprovechamiento de los alumnos de
segundo año de una determinada escuela secundaria, para lo cual pide a cada
asesor que obtenga la media de aprovechamiento del grupo que tiene a su

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 21

cargo. Al final de la recopilación de datos, el investigador tendrá tantas medias


como grupos de segundo alto existan. Si para obtener la media de
aprovechamiento por alumno suma todas las medias y las divide por el
numero total de medias, este procedimiento será correcto siempre que el
numero de alumnos sea igual en cada grupo; si, por el contrario, hay un
numero diferente de sujetos por grupo, el procedimiento de calculo será y no 7.95, como se había obtenido.
incorrecto, puesto que no se esta considerando el peso relativo con el que Nótese que si n1, = n2 = ... _ =nj , tenemos que n, + n2 + ... + nj= J(n), por lo que:
contribuye cada grupo en la determinación de la media global de
aprovechamiento. Ilustremos este ejemplo: Las medias por grupo son:

en donde J será el número de medias. Esta operación muestra que la media


de J grupos combinados es igual al promedio no ponderado de las j medias,
siempre que los j grupos sean del mismo tamaño.
Si la media de aprovechamiento se obtiene simplemente, sumado la
media de los cuatro grupos, se encuentra que: Propiedades de la media

La media tiene dos propiedades fundamentales: una que se desprende de


la suma de las desviaciones de las puntuaciones respecto a ella y otra que
comprende el cuadrado de estas desviaciones. Tales propiedades
constituyen dos consideraciones sumamente importantes en ciertos
Sin embargo, esta no es la media global verdadera, puesto que las n son
procedimientos estadísticos que se analizaran en otros capítulos de este
diferentes para cada grupo. La formula que se debe aplicar para obtener la
libro.
media de los grupos combinados es:
Primera propiedad. La media es el punto de un conjunto de datos en la
cual la suma de las desviaciones es igual a cero. Es decir, la suma de la
desviación de cada puntuación respecto a la media es exactamente cero. La
ilustración de esta propiedad, con dos datos de, la conducta de aislamiento, se
presenta en la tabla 6.12.
de aquí que la media de aprovechamiento de los cuatro grupos de secundaria
será:

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 22

Consideraciones finales de la moda, la mediana y la media

De las medidas de tendencia central examinadas hasta aquí, la media es


el índice más estable, por lo que proporciona una mejor estimación del
En conclusión, (Yi - Y) = 0, puesto que la media es un valor que
correspondiente parámetro en la población. Respecto a la forma de la curva,
equilibra todas las puntuaciones colocadas a uno y a otro lado de
cuando ésta es simétrica; es decir, si los puntuajes que equidistan del
ella (Williams, 1982). Al respecto, Haber y Runyon (1973) afirman que la
máximo central tienen la misma frecuencia, la media, la mediana y la moda
media se asemeja a un balancín, ya que balancea los puntuajes extremos
son idénticas.
situándose más lejos o más cerca del punto de apoyo, según sea el caso.
Es importante considerar que la media siempre resulta afectada por las
Segunda propiedad. La media hace la suma de los cuadrados de las
puntuaciones individuales, mientras que la mediana y la moda pueden no
desviaciones de las puntuaciones respecto a la media menor que la suma de
serlo por todos los valores; en otras palabras, la media es muy sensible a
los cuadrados de las desviaciones respecto a cualquier otro punto que no sea
puntuaciones extremas cuando el conjunto de datos no está equilibrado en
la media. Esta propiedad se conoce como mínimos cuadrados.
ambos lados de la misma. Por ejemplo, al triplicar el último valor de un
Esto es, ( Y , - Y )2 + (Y 2 - Y ) 2 + ... + (Yn - Y)2 es menor que (Y, - a)2 + (Y2 -
conjunto de datos, el único valor que se altera es la media:
a) +… + (Yn - a)2, siempre que a sea cualquier valor distinto de la media.
2

En la tabla 6.13 se observa que la suma mínima del cuadrado de las


desviaciones se obtuvo precisamente cuando se calculó a partir del cuadrado
de las diferencias respecto a la media (en este caso, 136).
El método de mínimos cuadrados es de considerable valor en estadística,
tanto en la descriptiva como en la inferencial. De tal modo, se recomienda
tener siempre presente, a lo largo de este libro, la propiedad de mínimos
cuadrados de la media. Nótese que en ambos conjuntos de datos las puntuaciones son las
mismas, excepto por la puntuación máxima de 48 en el conjunto 2. Esta

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 23

puntuación basta para alterar en gran medida el tamaño de la media; esta


sensibilidad a las puntuaciones situadas lejos del centro del grupo tiene
importantes implicaciones que rigen el uso de la media.

Cuartiles, quintiles, deciles y percentiles


Al estudiar la mediana se mencionó que ésta es el valor medio que divide
al conjunto de datos en dos partes iguales; análogamente, se establece que
aquellos valores que dividen en cuatro, cinco, diez y cien partes iguales
serán los cuartiles, quintiles, deciles y percentiles, respectivamente. De estos
cuatro índices estadísticos, los cuartiles y los percentiles son los que más
frecuentemente se utilizan en el ámbito educativo; sin embargo, aquí sólo se
explicarán los cuartiles, ya que el cálculo de todos los demás índices sigue la
misma lógica.
Un cuartil es un punto en una escala numérica que divide una serie de
observaciones-en cuatro porciones, por lo que al dividir el total de
observaciones en cuatro partes se obtendrán cuatro cuartiles: Q 2 , Q 3 , y Q 4 .
Q5 es el punto tal que el 25% de las observaciones se halla por debajo de él.
En ámbitos educativos, a las puntuaciones por debajo del Q1 se las conoce
como valores deficientes. La mitad de las observaciones están por debajo de
Q2, de aquí que Q2 = Md, y el 75% restantes por debajo de Q3. Las
puntuaciones comprendidas entre Q1 y Q3 se consideran valores normales, y
excedentes a las puntuaciones que están más allá de Q3. Lo anterior se
ilustra en la figura 6.5.

La fórmula que se aplica para obtener cualquier partición de una


distribución de frecuencias agrupadas es:

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 24

donde

Zk es la partición particular que se quiera obtener, ya sean cuartiles,


quintiles, deciles y percentiles,
L es el límite real inferior de la clase que contiene a la partición que se
desea, C es la amplitud del intervalo,
i toma diferentes valores, dependiendo de la partición deseada; si se va a
obtener un cuartil, i = 4; para un quintil, i = 5; para un decil, i = 10 y para un
percentil, i=100;
fa es la frecuencia acumulada por debajo de la partición deseada,
f es la frecuencia del intervalo de clase de la partición, y
n es el número total de observaciones.

Para distribuciones de frecuencias no agrupadas, la fórmula es la misma,


sólo que sin la constante C; es decir:

Obsérvese que el valor de Q 2 y de la Md son idénticos, puesto que


ambos dividen el conjunto de datos en dos partes iguales.
El Q3 es:

Para ejemplificar la partición, se calcularán Q1, Q2 y Q3 para la distribución


de frecuencias agrupadas de la tabla 6.7, que muestra el porcentaje de tiempo
de 60 niños realizando la tarea: Tenemos entonces que como los cuartiles
dividen el conjunto de datos en cuatro partes, i= 4; además, como primero se En conclusión, de acuerdo con la interpretación de los cuartiles, en este
calculará el Ql, entonces k = 1. Una vez determinado cuánto vale i y k, es caso se consideran niños con "dificultades" de atención a todos aquellos que
relativamente fácil calcular el Q1; por tanto: hayan estado menos del 70.1% del tiempo de observación realizando la tarea.
Los porcentajes "normales" son l o s mayores de 70.1 y menores de 92, y
excedentes todos aquellos mayores de 92. Otra denominación de las
puntuaciones obtenidas entre el Q 1 y el Q2 es normodeficientes, que
comprenden el rango entre Q 1 y Md, mientras que normoexcedentes son las
puntuaciones Md y Q 3.
Como se ha mencionado, es posible separar esta misma distribución de
frecuencias agrupadas en otro tipo de divisiones, tales como los deciles,

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 25

quintiles y percentiles; con fines de explicación se calculará el decil ocho. Los cualesquiera que éstos sean, nunca será mayor que el valor del rango. Hay dos
deciles dividen el conjunto de datos en diez partes, por lo que i = 10, y como tipos de rangos: el excluyente y el incluyente.
se va a calcular el decil ocho, entonces k = 8. El rango excluyente es la diferencia entre la puntuación mayor y la
puntuación menor. El rango incluyente se refiere a la diferencia entre el límite
real superior del intervalo que abarca la mayor puntuación y el límite real
inferior del intervalo que abarca la puntuación más pequeña.
Por ejemplo, en las seis sesiones de observación de la duración de la
conducta de aislamiento se obtuvieron los siguientes datos: 50, 49, 59, 57, 61
y 60. La persistencia real del episodio de mayor duración se encuentra
comprendido en el intervalo de 60.5 a 61.5, siendo el limite real inferior 60.5
Medidas de dispersión minutos y el real superior 61.5 minutos; por otro lado, la persistencia real del
episodio de menor duración se encuentra entre 48.5 y 49.5. Es así como el
Las medias de tendencia central proporcionan una información limitada rango incluyente es igual a 61.5 - 48.3 = 13, y el excluyente es 61 - 49 = 12,
acerca del conjunto de datos, puesto que pasan por alto la variabilidad entre las que es una unidad menor que el incluyente. Lo anterior se observa claramente
puntuaciones. Resulta evidente que para tener una información más completa en la figura 6.6.
se necesita disponer de medidas acerca de la forma en que difieren los
individuos en esa medición; es decir "... debemos hallar una información
auxiliar que acompañe a la media o a la mediana. Esta información adicional
debe, de cierta forma, indicar el grado de dispersión de las calificaciones
alrededor de la medida de tendencia central" (Haber y Runyon, 1973, pág.
89).
El concepto de dispersión se refiere a la variabilidad entre un conjunto de
observaciones. Si las puntuaciones en un conjunto son diferentes y estas
diferencias son considerables, la magnitud de la dispersión también será
grande; por el contrario, cuando las diferencias son muy pequeñas, la
dispersión es mínima. Por último, si todas las puntuaciones son las mismas,
no existe dispersión.
Así como hay índices que describen la forma en que las puntuaciones
tienden a agruparse respecto a un valor central, existen otros que miden la
dispersión, heterogeneidad o esparcimiento de los mismos. Los más comunes
son el rango, el rango semiintercuartilar, la desviación media, la varianza, la
desviación estándar y el coeficiente de variabilidad.
En los métodos cuantitativos, independientemente del tipo, la utilidad del
El rango rango es muy limitada debido al hecho de ser una medida muy pobre, ya que
sólo tiene en cuenta dos valores del conjunto de datos; además, su
inestabilidad dificulta aún más su uso.
El rango mide la distancia total a lo largo de la cual varían las
puntuaciones, de tal forma que la diferencia entre dos puntuaciones,

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 26

El rango semiintercuartilar se obtiene sumando todas las desviaciones y dividiendo el resultado por n.
En el ejemplo de la duración de la conducta de aislamiento, la desviación
Cuando calculamos los cuartiles y señalamos que las puntuaciones inedia es:
comprendidas en el intervalo entre el Q1 y el Q3 se conocían como
puntuaciones normales, lo que realmente se estaba obteniendo era el rango
intercuartilar, que es la distancia entre el primer y el tercer cuartiles (Q3 –Q1 ,),
y precisamente a la mitad de dicha distancia se le denomina rango
semiintercuartilar. Tenemos entonces que:

Como se advierte, en algunos casos las diferencias son negativas (dos


donde primeras), mientras que en los otros resultan positivas (cuatro últimas), de
manera que la suma de dichas desviaciones es cero. Esto se deriva, como se
Q es el rango semiintercuartilar recordará, de la primera propiedad de la media, que, establece que:
Q3 es el tercer cuartil; y
Q1 es el primer cuartil

Por ejemplo, con los datos de la tabla 6.7 se encontró que Q1 = 70.1 y Q3
= 92; el rango semiintercuartilar es, entonces:
Por consiguiente, si se respetan los signos, la desviación media resulta un
promedio de desviación siempre igual a cero.
Ahora bien, si sumamos todas las desviaciones sin considerar el signo, el
estadístico resultante estaría basado en las desviaciones absolutas, eliminando
por lo tanto la dificultad de tener el numerador igual a cero. El valor absoluto de
una desviación positiva es el valor mismo; el valor absoluto de un número
El cálculo de Q es muy útil cuando se desean comparar dos conjuntos de negativo se obtiene cambiándole el signo negativo a positivo. El símbolo que
datos, Si ambos conjuntos tienen un mismo valor de Q es muy probable que se utiliza para representar una valor absoluto consiste en dos líneas verticales
los patrones de heterogeneidad de los mismos se asemejen entre sí. 1. Por consiguiente, en nuestro ejemplo:
La desviación media

La desviación media es un estadístico que evalúa la desviación de las


puntuaciones individuales respecto a la media, con la finalidad de obtener una
estimación de la variación promedio de las puntuaciones. La desviación media

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 27

puntuaciones de un conjunto de datos. Una vez más, la varianza considera las


desviaciones de las puntuaciones respecto a la media, pero cada una de ellas
elevada al cuadrado, con la finalidad de evitar el obstáculo de que su suma sea
igual a cero. Por lo tanto, para un conjunto de datos, una medida del tipo de

Esto significa que en promedio, la variación entre las puntuaciones y la


media es de 4.33.
En conclusión, la desviación media de un conjunto de datos se expresa será alta cuando haya gran heterogeneidad en las puntuaciones y baja si hay
simbólicamente como: homogeneidad. No obstante, la magnitud de la suma del cuadrado de las
desviaciones (llamada también suma de cuadrados) está en función del total
de datos en el conjunto, de tal modo que si se desea comparar dos grupos de
datos y éstos difieren en cuanto al número de puntuaciones, la suma de
cuadrados no es un estimador adecuado de la dispersión de las puntuaciones;
la forma de evitarlo es dividir la suma de cuadrados por el total de datos. De
aquí que, al igual que la desviación media, la varianza es un promedio, sólo que
Para datos agrupados en distribuciones de frecuencia, la fórmula es: a diferencia de aquélla, la varianza es un promedio cuadrático de dispersión;
simbólicamente se representa así:

La desviación media es un índice estadístico muy fácil de calcular; sin


embargo, su uso como medida de variabilidad es muy raro debido a que su Antes de continuar avanzando es importante aclarar que esta definición de
teoría no está tan estructurada como la de la varianza; además, el hecho de varianza es cierta, si y sólo si el único interés del investigador es describir la
usar valores absolutos propicia la aparición de dificultades muy grandes para varianza de una muestra, sin hacer absolutamente ninguna inferencia acerca de
derivar algunas fórmulas. la varianza de la población de donde proviene dicha muestra, ya que si su
propósito es estimar la varianza de la población a partir de la varianza de la
La varianza muestra, la suma de cuadrados debe dividirse por n - 1. Sin embargo, como
todavía no se han desarrollado los conceptos necesarios para una explicación
La varianza es el índice cuantitativo que con mayor frecuencia se emplea adecuada, esta consideración se habrá de abordar con mayor profundidad en el
en estadística debido a su propiedad de ser altamente sensible a todas las capítulo 14, en la sección correspondiente a la media de cuadrados.

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 28

En el cálculo de la varianza a partir de las puntuaciones originales se


utiliza la fórmula:

Método de puntuaciones originales:

En la tabla 6.14 se presentan todos los cálculos para determinar la varianza,


tanto con el método de desviaciones como por el de puntuaciones originales.

Cálculo de la varianza en distribuciones de frecuencias de datos agrupados y no agrupados

El cálculo de la varianza para datos agrupados y no agrupados es la misma


y se obtiene mediante. la fórmula:

en donde Y, es la puntuación original cuando los datos no se han agrupado; en


Método de desviaciones: caso de que lo estén, Y, representa el punto medio del intervalo de clase.
Para el cálculo de la varianza conforme a las puntuaciones originales, la
fórmula es:

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 29

En las tablas 6.15 y 6.16 se exponen los procedimientos para determinar la


varianza en datos no agrupados y agrupados por medio de ambos métodos.

Sustituyendo en la fórmula de desviaciones, se obtiene:

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 30

Para la fórmula de datos originales: La desviación típica o estándar

La desviación típica es la medida estrechamente relacionada con la


varianza. Cuando se desea expresar la dispersión en términos de las unidades
originales en las que se encuentran los datos, la varianza no es una medida
adecuada puesto que está expresada en unidades cuadráticas; es necesario,
pues, obtener la raíz cuadrada positiva de la varianza para tener una
estimación de la variabilidad de los datos en sus unidades originales. El
resultado se conoce como desviación típica y se denota por s. Esto es:

El cálculo de la varianza para los datos agrupados de la tabla 6.16, por


medio de las desviaciones, es:

Así, la desviación típica para la conducta de aislamiento es:


Por el método de datos originales:

Para la participación (tabla 6.15), es:

Para el porcentaje de tiempo realizando la tarea (tabla 6.16), es:

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 31

El coeficiente de variabilidad

Todos los índices de dispersión anteriores son medidas de variabilidad


absoluta; es decir, representan la variación de las puntuaciones en la misma
unidad de medición. Por ejemplo, la desviación estándar de la conducta de
aislamiento es de 4.76, por lo que el promedio cuadrático de Variación es
4.76 minutos; en otras palabras, la duración de los periodos de aislamiento
varió 4.76 minutos en promedio. Para la participación en clase, el promedio de
variación fue de 2.66 participaciones. El hecho de que las dos variables se
midan en unidades diferentes representa gran dificultad cuando se desea
compararlas, puesto que no ,es posible confrontar dos variables medidas en En la tabla 6.17 se observa claramente que los tres estudios utilizaron
unidades diferentes (tiempo de duración y número de participaciones). unidades diferentes para medir la variable de interés. En lo que toca a la
En situaciones como ésta, la medida que se necesita es un índice que comparación de la variabilidad, a simple vista es factible afirmar que hubo mayor
evalúe la variación relativa. Este índice es el coeficiente de variabilidad, el dispersión de los datos en la investigación en que se estudió el porcentaje del
cual expresa la variación como un porcentaje, por medio de la transformación tiempo que los niños permanecían haciendo la tarea, posteriormente en la
de la desviación típica como porcentaje de la media. Así pues, el coeficiente investigación de la conducta de aislamiento y, por último, en el trabajo de
de variabilidad se representa simbólicamente de la siguiente forma: participación en clase. Sín embargo, esto es erróneo, puesto que si se calculan
los coeficientes de variación para los tres estudios se tiene:
Conducta de aislamiento:

De esta manera, como la desviación típica y la media se expresan en la Número de participaciones:


misma unidad de medición, dicha unidad se elimina al calcular el coeficiente
de variación, y resulta en un índice cuantitativo independiente de la unidad de
medida.
Por ejemplo, en la conducta de aislamiento, el coeficiente de variación es:
Realización de tarea

por lo que el porcentaje de variabilidad en este conjunto de datos es el 8.5%.


Ahora bien, tratar de comparar los tres estudios con base en la desviación
estándar puede conducir a errores de interpretación. En la tabla 6.17 se Por consiguiente, si bien es cierto que la variable número de participaciones
resumen los resultados obtenidos en los tres estudios. tiene una desviación típica más pequeña, ello no significa que la dispersión
entre las puntuaciones haya sido menor en comparación con los otros

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 32

estudios. Por el contrario, a pesar de tener la desviación estándar más


pequeña de los tres, su porcentaje de variabilidad es mucho mayor, lo que
permite concluir que en los datos de esta investigación hubo mayor
heterogeneidad que en los dos restantes.

Interpretación conceptual de las medidas de variabilidad

Como los conceptos de desviación media, varianza y desviación típica son


esenciales para comprender muchos modelos estadísticos, es importante
efectuar una interpretación conceptual más clara de dichas medidas, a partir
de una concepción geométrica de las mismas. Consideremos los datos de la
duración total por sesión de los periodos de aislamiento de un niño autista por
espacio de seis días. Los datos, que fueron: 50, 49, 59, 57, 61 y 60, se
representan en una recta numérica que aparece en la figura 6.7 a).
En la figura 6.7 a) la Y indica la media de las seis sesiones de observación,
que fue 56, y la línea gruesa representa las desviaciones de las puntuaciones
respecto a la media. Imaginemos esas desviaciones como distancias lineales
(es decir, menos 7 unidades lineales de longitud, menos 6 unidades lineales
de longitud, 5 unidades lineales de longitud, etc.). Si sumamos esas unidades
lineales con la finalidad de obtener una medida de variabilidad, el resultado
será que la suma de las desviaciones positivas son iguales a la suma de las
desviaciones negativas, de modo que el resultado final será igual a cero. Esto
es así porque la media es el punto de equilibrio de todos las puntuaciones. Sin
embargo, para eliminar esta dificultad y obtener un índice de dispersión, estas
desviaciones pueden considerarse como distancias lineales absolutas, de tal
manera que la suma de las mismas informará acerca de la variabilidad
absoluta de las puntuaciones respecto a la media (figura 6.7 b). Si dividimos
esta variabilidad absoluta por el número de distancias lineales que la
conforman obtenemos el promedio de variabilidad, y su magnitud final es igual
a la desviación media.

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES


MÓDULO 2205- METODOLOGÍA EN EL ESTUDIO DE LOS PROCESOS SOCIOCULTURALES 33

Otra forma de evitar que la suma de las desviaciones de las puntuaciones


respecto a la media sea igual a cero, es elevar cada una de éstas al cuadrado,
como se muestra en la figura 6.8 a).
El área total de todos los cuadrados es igual a lo que se llama suma de
cuadrados, que al ser dividida por el número de cuadrados que existen (en
este caso, seis) permite obtener el cuadrado medio, cuya área es igual a la
varianza de los datos. Por otro lado, si se extrae la raíz cuadrada del cuadrado
medio, se obtiene la desviación típica. El área del cuadrado medio (varianza)
aparece en la figura 6.8 b); al extraerle la raíz cuadrada se obtiene la
desviación estándar; así, lo que realmente se está considerando es sólo la
longitud de un lado del cuadrado medio. La relación entre la varianza y la
desviación típica, de acuerdo con una concepción geométrica, es claramente
representada por este cuadrado.

Para profundizar en este tipo de contenidos consulte la obra:


Silva, R, Arturo (1992) Métodos cuantitativos en psicología.
Un enfoque metodológicos. México, Trillas.

UNIDAD IV. ANÁLISIS DESCRIPTIVO DE LOS PROCESOS SOCIOCULTURALES