Está en la página 1de 9

INTRODUCCIÓN AL ANÁLISIS DE DATOS

Preguntas más Frecuentes: Tema 2

Pulse sobre la pregunta para acceder directamente a la respuesta

1. ¿Se puede calcular la media a partir de las frecuencias absolutas acumuladas?

2. Al calcular la media aritmética, ¿qué representa Xi cuando los datos están


agrupados en intervalos?, ¿y en distribuciones en las que no hemos agrupado en
intervalos?

3. ¿Qué es una transformación lineal y cuándo se utiliza? ¿Por qué es importante es ta


propiedad de la media aritmética?

4. ¿Es necesario conocer la explicación sobre el origen de la fórmula de la mediana


mediante la representación gráfica que se ofrece en la Figura 2.1 del Tema 2?

5. ¿Qué son los valores extremos? ¿Qué relación tienen con la asimetría? ¿Y con la
no utilización de la media como índice de tendencia central?

6. ¿Es el percentil un porcentaje?

7. Cuando calculo un percentil, encuentro resultados diferentes en las frecuencias


acumuladas en función del orden (creciente o decreciente) de la distribución de
frecuencias. ¿Qué hago mal?

8. ¿Cómo se determina el intervalo crítico en el cálculo de la mediana y el resto de


percentiles?

9. ¿Qué dos cuestiones se pueden plantear en relación a los percentiles?

10. ¿Cómo se calculan los percentiles si tenemos pocos datos y están sin agrupar en
intervalos? Me ayudaría ver un ejemplo.

11. ¿Cómo calcular un percentil a partir de un histograma?

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS

1. ¿Se puede calcular la media a partir de las frecuencias absolutas acumuladas?

Respuesta

Con las frecuencias absolutas acumuladas no se puede calcular la media. Si tenemos


una distribución de frecuencias en las que sólo disponemos de las frecuencias
absolutas acumuladas (na) y no de las frecuencias absolutas (ni), debemos obtener las
frecuencias absolutas a partir de las frecuencias absolutas acumuladas para poder
calcular la media.

[ Arriba ]

2. Al calcular la media aritmética, ¿qué representa Xi cuando los datos están


agrupados en intervalos?, ¿y en distribuciones en las que no hemos agrupado en
intervalos?

Respuesta

Cuando estamos trabajando con los datos agrupados en intervalos, Xi representa el


punto medio (o marca de clase) de cada uno de los intervalos. El punto medio del
intervalo es sólo una aproximación que es útil cuando no disponemos de todos los
datos, sólo de los datos agrupados en intervalos. O bien, aún disponiendo de todos
los datos nos interesa agruparlos en intervalos.

Precisamente porque el punto medio del intervalo es una aproximación, siempre que
se pueda trabajaremos con los datos sin agrupar.

Por otra parte, cuando los datos no están agrupados en intervalos, Xi representa los
valores que toma la variable y ni la frecuencia, o número de veces, que se repite cada
uno de esos valores

En el Tema 2 del libro de texto puedes consultar varios ejemplos y ejercicios resueltos
en los que se ilustra el cálculo de la media con datos sin agrupar y con datos
agrupados en intervalos.

[ Arriba ]

3. ¿Qué es una transformación lineal y cuándo se utiliza? ¿Por qué es importante esta
propiedad de la media aritmética?

Respuesta

Una transformación lineal es una forma de transformar las puntuaciones de una


variable basada en la ecuación de una recta Yi = bXi + a. Consiste en multiplicar cada
puntuación de una variable X por un valor determinado (denominado b) y a
continuación sumarle una constante (a), obteniendo una nueva variable Yi.

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Obviamente, dependiendo de para qué utilicemos la transformación en cada caso


conviene elegir unos valores en concreto. En cuanto a su utilización, es muy amplia en
Psicología, ya que en la aplicación de todo tipo de test se utilizan las transformaciones
lineales, y también en investigación básica para evitar valores negativos de las
variables.

Un ejemplo que te resultará cercano es el caso de los exámenes. Imagina el caso de


un examen de 20 preguntas (una escala de 0 a 20) en el que interesa pasar las
puntuaciones de los alumnos a una escala de 0 a 10. Para hacerlo tenemos que
aplicar la siguiente transformación lineal a las puntuaciones X:

Y = 0,5X + 0

En este caso basta multiplicar las puntuaciones por 0,5 para cambiar de una escala de
0 a 20 a otra de 0 a 10; por eso, b = 0,5 y a = 0.

Supongamos que tenemos 10 estudiantes en el examen con puntuaciones X: 14, 20,


0, 17, 10, 16, 18, 19, 16, 15.

Aplicando la transformación lineal Yi = 0,5Xi+0 a todas las puntuaciones, obtendríamos


las calificaciones en una escala de 0 a 10:

Xi = 14 Yi = 14 × 0,5 + 0 = 7
Xi = 20 Yi = 20 × 0,5 + 0 = 10
Xi = 0 Yi = 0 × 0,5 + 0 = 0
Xi = 17 Yi = 17 × 0,5 + 0 = 8,5
Xi = 10 Yi = 10 × 0,5 + 0 = 5
Xi = 16 Yi = 16 × 0,5 + 0 = 8
Xi = 18 Yi = 18 × 0,5 + 0 = 9
Xi = 19 Yi = 19 × 0,5 + 0 = 9,5
Xi = 16 Yi = 16 × 0,5 + 0 = 8
Xi = 15 Yi = 15 × 0,5 + 0 = 7,5

Por último, con respecto a la media, la importancia de esta propiedad es que la media
de la nueva variable Y se puede calcular directamente aplicando la misma
transformación lineal que se ha aplicado a los valores de la variable original.
[ Arriba ]

4. ¿Es necesario conocer la explicación sobre el origen de la fórmula de la mediana


mediante la representación gráfica que se ofrece en la Figura 2.1 del Tema 2?

Respuesta

No, no es imprescindible hacer la representación gráfica para calcular la mediana. Sin


embargo, conocer la representación gráfica ayuda a entender el concepto de Mediana
y a entender la fórmula que se utiliza para calcularla porque todos los términos que
intervienen en ella están representados en la figura.
[ Arriba ]

3
INTRODUCCIÓN AL ANÁLISIS DE DATOS

5. ¿Qué son los valores extremos? ¿Qué relación tienen con la asimetría? ¿Y con la
no utilización de la media como índice de tendencia central?

Respuesta

Un valor extremo es un valor muy superior o inferior al resto de valores. El cálculo de


la media se desaconseja cuando la distribución es asimétrica con unos pocos valores
extremos que pueden afectar a su representatividad como medida de tendencia
central.

Eso se debe a que el valor de la media es muy sensible a la presencia de unos pocos
valores extremos. Por ese motivo, en estos casos la mediana puede ser una mejor
alternativa para resumir la tendencia central de los datos, ya que no se ve afectada por
estos valores.

Veamos un ejemplo sencillo en el que se aprecia la sensibilidad de la media. Tenemos


el siguiente conjunto de puntuaciones:

5, 7, 10, 16, 17

La mediana es igual a 10 y la media es 11.

Si ahora sustituimos el valor más alto por un valor extremo, por ejemplo 100, el
resultado es el siguiente:

5,7,10,16,100

Ahora la media aumenta mucho su valor y es igual a 27,6, pero la mediana no se ve


afectada y sigue siendo igual a 10.

En una distribución simétrica los valores de media, mediana y moda coinciden. Una
distribución es simétrica cuando al dividirla en dos a la altura de la media, las dos
mitades se superponen, por lo que visualmente se aprecia un número de datos similar
en ambos extremos de la distribución. Si existe algún valor extremo no puede haber
esta simetría distribuyéndose los datos de forma desigual en los extremos de la
distribución.
[ Arriba ]

6. ¿Es el percentil un porcentaje?

Respuesta

No, el percentil no es un porcentaje o tanto por cien. El Percentil es un valor de la


variable que deja por debajo de sí un determinado tanto por cien o porcentaje de las
observaciones o casos. En general, el percentil k (Pk ) es el valor que deja por debajo
de sí el k% de las observaciones (y por tanto el (100-k)% por encima de sí).

La mediana, Md, es el P50. Es decir, deja por debajo de sí el 50% de las


observaciones.

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Veámoslo con un ejemplo: imaginemos que 110 es el valor del Cociente Intelectual
que deja por debajo de sí al 65% de los alumnos de una muestra determinada. Según
la notación habitual, en este ejemplo tenemos que k = 65 y P k = 110. Esto quiere decir
que P65 = 110, por tanto 110 es la puntuación que deja por debajo de sí al 65% de los
alumnos.
[ Arriba ]

7. Cuando calculo un percentil, encuentro resultados diferentes en las frecuencias


acumuladas en función del orden (creciente o decreciente) de la distribución de
frecuencias. ¿Qué hago mal?

Respuesta

Para calcular la frecuencia acumulada hay que empezar desde el valor más bajo de la
variable hasta el más alto, porque se define como el número de veces que se
repite cada valor o cualquiera de los valores inferiores. Siempre que se tenga en
cuenta acumular desde el valor más bajo de la variable hasta el valor más alto se hará
de manera correcta, con independencia de cómo esté ordenada la tabla (empezando
por el valor más bajo de la variable hasta el más alto o viceversa).

Veamos un ejemplo del cálculo de las frecuencias acumuladas:

El número de aciertos (X) de 30 estudiantes en un examen de 10 preguntas es:

X: 0,0,0,1,1,2,3,3,3,4,4,4,4,5,5,5,5,5,5,6,6,6,6,7,7,7,8,8,9,10

La distribución de frecuencias en orden creciente es:

X ni na
0 3 3
1 2 5
2 1 6
3 3 9
4 4 13
5 6 19
6 4 23
7 3 26
8 2 28
9 1 29
10 1 30

Como se aprecia, se ha calculado con el orden creciente de la variable X. Para


calcularlo en orden decreciente en la primera fila de la tabla se pone el valor más alto
de X (el 10) y en la última el más bajo (el 0) pero las frecuencias acumuladas se
siguen calculando desde el valor más bajo de X hasta el más alto (solo que ahora el
valor más bajo está en la última línea).

5
INTRODUCCIÓN AL ANÁLISIS DE DATOS

X ni na
10 1 30
9 1 29
8 2 28
7 3 26
6 4 23
5 6 19
4 4 13
3 3 9
2 1 6
1 2 5
0 3 3
[ Arriba ]

8. ¿Cómo se determina el intervalo crítico en el cálculo de la mediana y el resto de


percentiles?

Respuesta

El intervalo crítico es el intervalo que contiene el índice de posición que se desea


obtener con datos agrupados en intervalos. Por ejemplo, para el cálculo de la
mediana, el primer paso es determinar en qué intervalo se encontrará. A este intervalo
se le denomina intervalo crítico y para determinarlo se requiere obtener las frecuencias
acumuladas o proporciones acumuladas. Hecho esto, el intervalo crítico es el primer
intervalo cuya frecuencia acumulada sea mayor o igual al 50% de n o cuya proporción
acumulada sea mayor o igual a 0,50.

Si en lugar de la mediana, es cualquier otro percentil, por ejemplo el percentil 70,


entonces el intervalo crítico es el primer intervalo cuya frecuencia acumulada sea
mayor o igual al 70% de n o cuya proporción acumulada sea mayor o igual a 0,70.

[ Arriba ]

9. ¿Qué dos cuestiones se pueden plantear en relación a los percentiles?

Respuesta

En los percentiles, nos podemos encontrar con dos casos:

(1) se pide directamente el valor del percentil, P k , y

(2) se pregunta a qué percentil corresponde un determinado valor de la variable.

En el primer caso (1), utilizamos la fórmula:

6
INTRODUCCIÓN AL ANÁLISIS DE DATOS

n k
nd
Pk Li 100 I
nc

En el segundo caso (2) podemos utilizar la fórmula:

(Pk L i ) nc
nd
k I 100
n

Esta segunda fórmula ha sido obtenida despejando k en la primera fórmula.


[ Arriba ]

10. ¿Cómo se calculan los percentiles si tenemos pocos datos y están sin agrupar en
intervalos? Me ayudaría ver un ejemplo.

Respuesta

Cuando se tienen muy pocos datos no es habitual calcular percentiles, porque


tienen poca utilidad. Para realizar el cálculo hay que proceder de la misma manera,
considerando que los intervalos tienen amplitud igual a uno.

Ejemplo:

Con los datos: 3, 5, 2, 7, 6, 4, 9, calcular el D 2, D7, P32 y P85

Lo primero que hay que hacer es ordenarlos, disponerlos en una tabla (con su
correspondiente frecuencia), calcular las frecuencias acumuladas y aplicar la misma
fórmula que para datos agrupados en intervalos. Es decir:

Aplicando la fórmula tenemos que:

7
INTRODUCCIÓN AL ANÁLISIS DE DATOS

7·20
1
D2 P20 2,5 100 ·1 2,5 0,4 2,9
1

7·70
4
D7 P70 5,5 100 ·1 5,5 0,9 6,4
1

7·32
2
P32 3,5 100 ·1 3,5 0,24 3,74
1

7·85
5
P85 6,5 100 ·1 6,5 0,95 7,45
1

[ Arriba ]

11. ¿Cómo calcular un percentil a partir de un histograma?

Respuesta

Veamos un ejemplo:

Representación gráfica de las calificaciones de 150 alumnos en una


asignatura (X)

El Percentil 30, para los datos de la figura, es: A) 3; B) 4,7; C) 7,5.

Solución:

Para construir la tabla de distribución de frecuencias a partir de los datos de la figura,


hay que tener en cuenta que se trata de un histograma y que en el eje de abcisas (el
horizontal) se sitúan los intervalos exactos de la variable. En este caso, para convertir

8
INTRODUCCIÓN AL ANÁLISIS DE DATOS

los límites exactos en aparentes basta con sumar 0,5 al límite inferior exacto y restar
0,5 al límite superior exacto.

Según el histograma, el primer intervalo tiene como límites exactos 0,5 – 2,5 por lo que
los límites aparentes son 1 – 2. El segundo tiene como límites exactos 2,5 – 4,5 por lo
que sus límites aparentes son 3–4. Y así sucesivamente con el resto de los intervalos,
hasta completar todos los intervalos de la distribución de frecuencias. Para saber las
frecuencias absolutas tienes que fijarte en la altura de cada uno de los rectángulos del
histograma hasta llegar a la siguiente distribución de frecuencias.

X ni na
9 -10 20 150
7-8 40 130
5-6 50 90
3-4 30 40
1-2 10 10
150

El intervalo crítico es el primero cuya frecuencia absoluta acumulada sea superior a


nk/100 =150x30/100= 45, por tanto el intervalo es [5-6]. Sustituyendo en la fórmula de
los percentiles tenemos que:

150·30
40
100 5
P30 4,5 ·2 4,5 ·2 4,5 0,2 4,7
50 50

[ Arriba ]

También podría gustarte