Documentos de Académico
Documentos de Profesional
Documentos de Cultura
5. ¿Qué son los valores extremos? ¿Qué relación tienen con la asimetría? ¿Y con la
no utilización de la media como índice de tendencia central?
10. ¿Cómo se calculan los percentiles si tenemos pocos datos y están sin agrupar en
intervalos? Me ayudaría ver un ejemplo.
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Respuesta
[ Arriba ]
Respuesta
Precisamente porque el punto medio del intervalo es una aproximación, siempre que
se pueda trabajaremos con los datos sin agrupar.
Por otra parte, cuando los datos no están agrupados en intervalos, Xi representa los
valores que toma la variable y ni la frecuencia, o número de veces, que se repite cada
uno de esos valores
En el Tema 2 del libro de texto puedes consultar varios ejemplos y ejercicios resueltos
en los que se ilustra el cálculo de la media con datos sin agrupar y con datos
agrupados en intervalos.
[ Arriba ]
3. ¿Qué es una transformación lineal y cuándo se utiliza? ¿Por qué es importante esta
propiedad de la media aritmética?
Respuesta
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Y = 0,5X + 0
En este caso basta multiplicar las puntuaciones por 0,5 para cambiar de una escala de
0 a 20 a otra de 0 a 10; por eso, b = 0,5 y a = 0.
Xi = 14 Yi = 14 × 0,5 + 0 = 7
Xi = 20 Yi = 20 × 0,5 + 0 = 10
Xi = 0 Yi = 0 × 0,5 + 0 = 0
Xi = 17 Yi = 17 × 0,5 + 0 = 8,5
Xi = 10 Yi = 10 × 0,5 + 0 = 5
Xi = 16 Yi = 16 × 0,5 + 0 = 8
Xi = 18 Yi = 18 × 0,5 + 0 = 9
Xi = 19 Yi = 19 × 0,5 + 0 = 9,5
Xi = 16 Yi = 16 × 0,5 + 0 = 8
Xi = 15 Yi = 15 × 0,5 + 0 = 7,5
Por último, con respecto a la media, la importancia de esta propiedad es que la media
de la nueva variable Y se puede calcular directamente aplicando la misma
transformación lineal que se ha aplicado a los valores de la variable original.
[ Arriba ]
Respuesta
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
5. ¿Qué son los valores extremos? ¿Qué relación tienen con la asimetría? ¿Y con la
no utilización de la media como índice de tendencia central?
Respuesta
Eso se debe a que el valor de la media es muy sensible a la presencia de unos pocos
valores extremos. Por ese motivo, en estos casos la mediana puede ser una mejor
alternativa para resumir la tendencia central de los datos, ya que no se ve afectada por
estos valores.
5, 7, 10, 16, 17
Si ahora sustituimos el valor más alto por un valor extremo, por ejemplo 100, el
resultado es el siguiente:
5,7,10,16,100
En una distribución simétrica los valores de media, mediana y moda coinciden. Una
distribución es simétrica cuando al dividirla en dos a la altura de la media, las dos
mitades se superponen, por lo que visualmente se aprecia un número de datos similar
en ambos extremos de la distribución. Si existe algún valor extremo no puede haber
esta simetría distribuyéndose los datos de forma desigual en los extremos de la
distribución.
[ Arriba ]
Respuesta
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Veámoslo con un ejemplo: imaginemos que 110 es el valor del Cociente Intelectual
que deja por debajo de sí al 65% de los alumnos de una muestra determinada. Según
la notación habitual, en este ejemplo tenemos que k = 65 y P k = 110. Esto quiere decir
que P65 = 110, por tanto 110 es la puntuación que deja por debajo de sí al 65% de los
alumnos.
[ Arriba ]
Respuesta
Para calcular la frecuencia acumulada hay que empezar desde el valor más bajo de la
variable hasta el más alto, porque se define como el número de veces que se
repite cada valor o cualquiera de los valores inferiores. Siempre que se tenga en
cuenta acumular desde el valor más bajo de la variable hasta el valor más alto se hará
de manera correcta, con independencia de cómo esté ordenada la tabla (empezando
por el valor más bajo de la variable hasta el más alto o viceversa).
X: 0,0,0,1,1,2,3,3,3,4,4,4,4,5,5,5,5,5,5,6,6,6,6,7,7,7,8,8,9,10
X ni na
0 3 3
1 2 5
2 1 6
3 3 9
4 4 13
5 6 19
6 4 23
7 3 26
8 2 28
9 1 29
10 1 30
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
X ni na
10 1 30
9 1 29
8 2 28
7 3 26
6 4 23
5 6 19
4 4 13
3 3 9
2 1 6
1 2 5
0 3 3
[ Arriba ]
Respuesta
[ Arriba ]
Respuesta
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
n k
nd
Pk Li 100 I
nc
(Pk L i ) nc
nd
k I 100
n
10. ¿Cómo se calculan los percentiles si tenemos pocos datos y están sin agrupar en
intervalos? Me ayudaría ver un ejemplo.
Respuesta
Ejemplo:
Lo primero que hay que hacer es ordenarlos, disponerlos en una tabla (con su
correspondiente frecuencia), calcular las frecuencias acumuladas y aplicar la misma
fórmula que para datos agrupados en intervalos. Es decir:
7
INTRODUCCIÓN AL ANÁLISIS DE DATOS
7·20
1
D2 P20 2,5 100 ·1 2,5 0,4 2,9
1
7·70
4
D7 P70 5,5 100 ·1 5,5 0,9 6,4
1
7·32
2
P32 3,5 100 ·1 3,5 0,24 3,74
1
7·85
5
P85 6,5 100 ·1 6,5 0,95 7,45
1
[ Arriba ]
Respuesta
Veamos un ejemplo:
Solución:
8
INTRODUCCIÓN AL ANÁLISIS DE DATOS
los límites exactos en aparentes basta con sumar 0,5 al límite inferior exacto y restar
0,5 al límite superior exacto.
Según el histograma, el primer intervalo tiene como límites exactos 0,5 – 2,5 por lo que
los límites aparentes son 1 – 2. El segundo tiene como límites exactos 2,5 – 4,5 por lo
que sus límites aparentes son 3–4. Y así sucesivamente con el resto de los intervalos,
hasta completar todos los intervalos de la distribución de frecuencias. Para saber las
frecuencias absolutas tienes que fijarte en la altura de cada uno de los rectángulos del
histograma hasta llegar a la siguiente distribución de frecuencias.
X ni na
9 -10 20 150
7-8 40 130
5-6 50 90
3-4 30 40
1-2 10 10
150
150·30
40
100 5
P30 4,5 ·2 4,5 ·2 4,5 0,2 4,7
50 50
[ Arriba ]