Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD IV.
INTRODUCCIÓN decimales que permanecerá para obtener el último digito deben considerarse
tres reglas.
Primera regla. Si en el residuo que se va a eliminar el primer digito es
Toda investigación esta constituida por un conjunto de fases que se
menor que cinco, el último digito que ha de permanecer no debe sufrir ningún
interrelacionan estrechamente con el propósito de obtener información acerca
cambio. Por ejemplo:
del fenómeno estudiado. En este capitulo se presentaran los conceptos y las
técnicas cuantitativas fundamentales de cualquier análisis estadístico, por lo
que la comprensión cabal del mismo es de suma importancia para que los
capítulos subsiguientes, en los que se presentan técnicas estadísticas más
complejas, se aprovechen en mayor medida.
En este capitulo se abordara única y exclusivamente la etapa cuantitativa
descriptiva, la cual puede utilizar el investigador como una primera instancia Como la división es de dos números enteros, debemos aproximar hasta
para interpretar la factibilidad de sus hipótesis y la generalidad de los dos decimales, y como el primer digito del residuo que se va a eliminar es menor
resultados de su estudio. de cinco (3.4615385), entonces el ultimo digito que permanece no sufre ningún
Las técnicas cuantitativas descriptivas pueden definirse como el cálculo de cambio. Así pues:
una medida numérica de un conjunto de datos, que describe un aspecto
particular o característico de esos datos. Los índices estadísticos descriptivos
mas comunes son las medidas de centralidad y variabilidad; sin embargo,
3.4615385 = 3.46
antes de revisar estas técnicas examinaremos el redondeo de datos y algunas
reglas de la sumatoria, que son dos elementos básicos que debe conocer Segunda regla. Si el residuo que aparece después del último digito que
toda persona que se interne en el estudio de los métodos cuantitativos. habrá de conservar la serie es mayor que cinco o cinco seguido por otros
dígitos no iguales a cero, se aumentara el digito hasta el número superior. Por
ejemplo:
Reglas del redondeo de datos
cifras a dos decimales: tres o hasta cuatro decimales, independientemente de la forma en que
estuvieran los datos originales.
Por otro lado, cuando se tiene: El símbolo de sumatoria es el signo más frecuente en la estadística, de
aquí que su conocimiento es de gran importancia para entender cualquier
0.415 = 0.42 procedimiento cuantitativo.
Cuando se quiere representar un conjunto de datos sin especificar ninguno
en particular se hace a través de Yi, que se lee Y subíndice i, en donde Y
El cero se considera dentro del grupo de los pares no porque lo sea sino reemplaza al dato y el subíndice i indica el lugar del dato en una serie de n
para equilibrar a estos con el grupo de los impares, puesto que existen cinco datos, sin que esto tenga ninguna implicación de magnitud. Así, Y, indica el
impares (1, 3, 5, 7 y 9) y solo cuatro pares (2, 4, 6 y 8). De tal manera, dato numero cuatro de la serie n; por consiguiente, i tomara valores desde 1
cuando el ultimo digito de la cifra que permanece es cero y el primer valor del hasta el total de datos del conjunto; es decir, hasta n. Por ejemplo, supongamos
residuo que desaparecerá es cinco seguido de ceros, el ultimo digito no sufre que en una investigación se estuvo registrando durante seis sesiones la
ningún cambio; por ejemplo: duración total por sesión de los periodos de aislamiento de un niño autista (los
datos hipotéticos se muestran en la tabla 6.2). Entonces, el número de datos
4.605 = 4.60 obtenidos en esa serie de observaciones es 6, por lo que n = 6. Y 1 será el
tiempo de aislamiento del niño en la sesión uno (50 min.), Y2 en la sesión dos
Es importante aclarar que si bien estas reglas de redondeo acerca de (49 min.), y así hasta Y6 (60 min.). En conclusión, Yl = 50, Y2 = 49, Y3 =59,
como obtener el ultimo digito que ha de permanecer son universalmente Y4=57, Y5=61 y Y6=60.
aceptadas, no ocurre lo mismo con el numero de dígitos a los cuales se debe
aproximar la cifra, puesto que existen casos en que la cifra se aproxima a dos,
50 + 49 + 5 9 + 5 7 + 6 1 + 6 0 = 3 3 6 .
Tabla 6.2. Resultados hipotéticos de la conducta de aislamiento de un
niño autista. Se puede dar el caso de que no se este interesado en sumar todos los
datos de una serie, por ejemplo:
Duración de los periodos
Sesion de
1 50
2 49
3 59
4 57
5 61
6 60
con lo que se estaría efectuado la siguiente adición: Y2 + Y3 + Y4 + Y5.
En ocasiones se esta interesado en sumar algunos valores de Y,, como en Sustituyendo con los datos del ejemplo, quedaría: 49 + 59 + 57 + 61 = 226.
el caso de Y2 + Y3, que señala la suma del segundo y tercer valores. Si se Hay cuatro reglas de la sumatoria que es importante tener siempre
desean sumar todos los datos hasta n, en este caso la suma seria Y1 + Y2-+ presentes:
... + Yn,. A menudo se emplea una abreviatura de Y1 + Y2 + ... + Yn, que es : Primera regla. Es el caso en que se multiplica cada Yp por una constante;
esto es:
(50+4)+(49+4)+(59+4)+(57+4)+(61 +4)+(60+4)=360
Esto es idéntico a:
Tercera regla. Cuando se obtiene la suma de n números elevados al Es muy frecuente confundir estas dos expresiones; sin embargo, son
cuadrado por separado, esto es: muy diferentes. Retomando los datos de la tabla 6.2 se tiene que, por
ejemplo:
(Y1+Y2+...+Yn) (Y1+Y2+...+Yn)
Una vez vistos dos prerrequisitos importantes para estudiar los métodos
cuantitativos -el redondeo de datos y las reglas de sumatoria, se abordarán
Organización conforme a la posición ordinal quincuagésimo séptima posición. Es frecuente encontrar puntuaciones iguales
en series de datos de 15 o más; nótese, por ejemplo, que cinco niños tuvieron
Un primer paso es ordenar los datos de acuerdo con el porcentaje de 97% por lo que se les asigna la misma posición. Cuando existen puntuaciones
tiempo realizando la tarea, del más alto al más bajo, con lo que se tendrá idénticas, la posición se obtiene calculando el promedio de éstas. Por ejemplo,
información de la posición que guarda cada puntuación. Este primer tipo de cinco niños obtuvieron una puntuación de 97% y solamente una se encuentra
organización se muestra en la tabla 6.4. por encima de la misma. El promedio de las cinco siguientes posiciones (2, 3, 4,
5 y 6) es 4, que se asigna a todas las puntuaciones de 97%.
Sin embargo, esta primera forma de organización insume demasiado
tiempo; además, la lista es muy extensa, debido a lo cual en ocasiones esta
técnica no es recomendable.
Distribución de frecuencias
donde
Pa es la puntuación más alta,
Pb es la puntuación más baja, y
S es la sensibilidad del instrumento, que la mayoría de las veces es 1. Sin
embargo, en ocasiones el instrumento es tan sensible que arroja datos en
décimas o centésimas, por lo que S será 0.1 o 0.01, respectivamente; tal es el
caso cuando se miden tiempos entre respuestas.
Una de las primeras cuestiones que deben considerarse en esta forma
Una vez encontrado el rango y decidido el número de intervalos que
de organización es cuántos intervalos de clases han de utilizarse. Algunos
contendrá la distribución de frecuencias, es muy sencillo determinar la amplitud
autores (Glass y Stanley, 1974) señalan que no deben ser menos de 12 ni
de cada intervalo, dividiendo el rango por el número de intervalos (K).
más de 15, mientras que otros (Haber y Runyon, 1973) sostienen que buena
Simbólicamente, la amplitud del intervalo de clase está dada por:
parte de los datos obtenidos en las ciencias del comportamiento puede ser
agrupada de 10 a 20 intervalos de clase. Sin embargo, para determinar el
número de intervalos de clase Daniel ( 1 9 7 9 ) recomienda la fórmula de
Sturgen:
Tabla 6.6. Distribución del porcentaje de tiempo realizando la tarea en una Frecuencias acumulada, relativa y relativa acumulada
muestra de 60 niños de primaria.
A menudo es conveniente obtener también la distribución de
frecuencias acumuladas, que se encuentra al sumar las frecuencias
anteriores al intervalo de clase correspondiente, como se muestra en la
tabla 6.7.
Histograma
Polígono de frecuencias
La forma de obtener un polígono de frecuencias es muy semejante a la
del histograma. En el polígono de frecuencias los intervalos de clase se
sustituyen por los puntos medios, sobre los cuales se localiza un punto que
corresponde a la frecuencia de dicha clase, y posteriormente esos puntos se
unen por rectas. Con la finalidad de unir el polígono a la abscisa, es necesario
agregar otros dos puntos medios, uno para cada extremo. En la figura 6.1 b)
se muestra el polígono de frecuencias para la tabla 6.8. La forma de obtener
los puntos medios es
Ojiva
resumir los datos de una investigación. Las medidas de tendencia central más
comunes son la media, la moda, la mediana, los percentiles y los cuarteles.
La moda
La mediana
en donde
donde:
L es el límite real inferior del valor que contiene a la mediana, fa la frecuencia
acumulada por debajo del número mediano, f la frecuencia del número
L es el límite real inferior del intervalo de clase que contiene a la mediana,
mediano, y n el total de observaciones.
fa es la frecuencia acumulada de todos los intervalos de clase por debajo
En el ejemplo, la mediana sería 26 = 13 puntuaciones; si se parte desde el
de la clase mediana,
extremo inferior se observa que la decimotercera puntuación se sitúa en el
f es la frecuencia del intervalo de clase que contiene a la
número 8, y como la sensibilidad de la medida es de una participación, sus
mediana, a es el total de observaciones, y C es la amplitud del
límites reales inferior y superior serán 7.5 y 8.5, respectivamente. La
intervalo de la clase mediana.
frecuencia acumulada por debajo del número 8 es 10 y la frecuencia del valor
Nótese que esta fórmula es similar a la de las distribuciones de frecuencia
mediano es 4. Con todos los datos anteriores es posible sustituir en la fórmula
no agrupadas, cuando C = 1.
para obtener la mediana. Así:
En la tabla 6.7 se muestra la distribución de frecuencias agrupadas del
porcentaje de tiempo de 60 niños realizando la tarea. Para el cálculo de la mediana
se divide 60 / 2= 30 que representa la frecuencia acumulada de una calificación
en la mitad de la distribución; la trigésima puntuación está situada en el
intervalo 75-85, cuyos límites reales son 74.5 - 85.5, y la frecuencia acumulada
por abajo del intervalo mediano es 17, con una amplitud del intervalo de 11;
entonces tenemos que:
que es muy semejante al valor obtenido por el método numérico, que fue de Cálculo de la Media en distribuciones de frecuencia
84.03. Para el cálculo de la media en una distribución de frecuencias se utiliza la
siguiente fórmula:
La media
La media constituye el índice de tendencia central más importante, puesto
que es el más sensible y figura en la mayor parte de los procedimientos
estadísticos que se utilizan en las investigaciones psicológicas. El símbolo
que generalmente se emplea para representar la media de un conjunto de
puntuaciones es Y que se define como la suma de las puntuaciones o de los donde:
valores de una variable, dividida por el número de casos que componen el
conjunto. Expresado de forma algebraica: Y1, es la puntuación i, y
f1, es el número de veces que aparece la puntuación i.
Así, en la tabla 6.5, por la columna encabezada por fi, sabemos que la
calificación 97 se presentó 5 veces. Como se recordará, la multiplicación es
una suma repetida; por ejemplo, 97 + 97 + 97 + 97 + 97 = 5 (97). En
consecuencia, la suma de todas las puntuaciones en un grupo se obtiene
multiplicando cada puntuación Y, por su frecuencia f,i, para formar Yi, fi, y
En donde Y es la media, y se llama Y barra o testada, n es después se obtiene la suma de los productos resultantes (ΣYi fi). De acuerdo
número de valores en el conjunto, y Y1, es el elemento i del con lo anterior, la media de la tabla 6.5 es:
conjunto.
Media ponderada
donde
quintiles y percentiles; con fines de explicación se calculará el decil ocho. Los cualesquiera que éstos sean, nunca será mayor que el valor del rango. Hay dos
deciles dividen el conjunto de datos en diez partes, por lo que i = 10, y como tipos de rangos: el excluyente y el incluyente.
se va a calcular el decil ocho, entonces k = 8. El rango excluyente es la diferencia entre la puntuación mayor y la
puntuación menor. El rango incluyente se refiere a la diferencia entre el límite
real superior del intervalo que abarca la mayor puntuación y el límite real
inferior del intervalo que abarca la puntuación más pequeña.
Por ejemplo, en las seis sesiones de observación de la duración de la
conducta de aislamiento se obtuvieron los siguientes datos: 50, 49, 59, 57, 61
y 60. La persistencia real del episodio de mayor duración se encuentra
comprendido en el intervalo de 60.5 a 61.5, siendo el limite real inferior 60.5
Medidas de dispersión minutos y el real superior 61.5 minutos; por otro lado, la persistencia real del
episodio de menor duración se encuentra entre 48.5 y 49.5. Es así como el
Las medias de tendencia central proporcionan una información limitada rango incluyente es igual a 61.5 - 48.3 = 13, y el excluyente es 61 - 49 = 12,
acerca del conjunto de datos, puesto que pasan por alto la variabilidad entre las que es una unidad menor que el incluyente. Lo anterior se observa claramente
puntuaciones. Resulta evidente que para tener una información más completa en la figura 6.6.
se necesita disponer de medidas acerca de la forma en que difieren los
individuos en esa medición; es decir "... debemos hallar una información
auxiliar que acompañe a la media o a la mediana. Esta información adicional
debe, de cierta forma, indicar el grado de dispersión de las calificaciones
alrededor de la medida de tendencia central" (Haber y Runyon, 1973, pág.
89).
El concepto de dispersión se refiere a la variabilidad entre un conjunto de
observaciones. Si las puntuaciones en un conjunto son diferentes y estas
diferencias son considerables, la magnitud de la dispersión también será
grande; por el contrario, cuando las diferencias son muy pequeñas, la
dispersión es mínima. Por último, si todas las puntuaciones son las mismas,
no existe dispersión.
Así como hay índices que describen la forma en que las puntuaciones
tienden a agruparse respecto a un valor central, existen otros que miden la
dispersión, heterogeneidad o esparcimiento de los mismos. Los más comunes
son el rango, el rango semiintercuartilar, la desviación media, la varianza, la
desviación estándar y el coeficiente de variabilidad.
En los métodos cuantitativos, independientemente del tipo, la utilidad del
El rango rango es muy limitada debido al hecho de ser una medida muy pobre, ya que
sólo tiene en cuenta dos valores del conjunto de datos; además, su
inestabilidad dificulta aún más su uso.
El rango mide la distancia total a lo largo de la cual varían las
puntuaciones, de tal forma que la diferencia entre dos puntuaciones,
El rango semiintercuartilar se obtiene sumando todas las desviaciones y dividiendo el resultado por n.
En el ejemplo de la duración de la conducta de aislamiento, la desviación
Cuando calculamos los cuartiles y señalamos que las puntuaciones inedia es:
comprendidas en el intervalo entre el Q1 y el Q3 se conocían como
puntuaciones normales, lo que realmente se estaba obteniendo era el rango
intercuartilar, que es la distancia entre el primer y el tercer cuartiles (Q3 –Q1 ,),
y precisamente a la mitad de dicha distancia se le denomina rango
semiintercuartilar. Tenemos entonces que:
Por ejemplo, con los datos de la tabla 6.7 se encontró que Q1 = 70.1 y Q3
= 92; el rango semiintercuartilar es, entonces:
Por consiguiente, si se respetan los signos, la desviación media resulta un
promedio de desviación siempre igual a cero.
Ahora bien, si sumamos todas las desviaciones sin considerar el signo, el
estadístico resultante estaría basado en las desviaciones absolutas, eliminando
por lo tanto la dificultad de tener el numerador igual a cero. El valor absoluto de
una desviación positiva es el valor mismo; el valor absoluto de un número
El cálculo de Q es muy útil cuando se desean comparar dos conjuntos de negativo se obtiene cambiándole el signo negativo a positivo. El símbolo que
datos, Si ambos conjuntos tienen un mismo valor de Q es muy probable que se utiliza para representar una valor absoluto consiste en dos líneas verticales
los patrones de heterogeneidad de los mismos se asemejen entre sí. 1. Por consiguiente, en nuestro ejemplo:
La desviación media
El coeficiente de variabilidad