Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Concepto de estadística
1.1. De acuerdo con el fin del análisis: estadística descriptiva vs. inferencial
1.2. De acuerdo con la metodología aplicada: estadística paramétrica vs. no
paramétrica
1.3. Según el número de variables que atiende el análisis: estadística univariada,
bivariada y multivariada
2. Conceptos básicos
6. La curva normal
Bibliografía
1. CONCEPTO DE ESTADÍSTICA
La Estadística Inferencial tiene como fin hacer inferencias a partir de una muestra
sobre una población. Es decir, cómo se tiene que realizar el proceso de extrapolación de
los resultados.
Por lo tanto, es muy importante realizar un análisis previo de los datos, de qué
clase son, cómo se distribuyen y qué tipo de estadísticos se pueden aplicar.
2
1.3. Según el número de variables que atiende el análisis: Estadística Univariada,
Bivariada y Multivariada.
La Estadística Bivariada incluye todas las técnicas que hacen referencia a la descripción
de dos variables
2. CONCEPTOS BÁSICOS
A) Población: Todo el conjunto de elementos, finito o infinito, que tiene una o varias
características que satisfacen el objeto de estudio de una investigación. Ej. Universidad
de Alicante.
Censo: Está directamente relacionado con la población. Es un listado de los
elementos que componen una población.
Muestra: Es cualquier subconjunto de una población y, para que sea válida, ha de ser
representativa de la población porque se va a trabajar con ella y las conclusiones se van
a extrapolar a la población. Ej. 300 alumnos de la Universidad de Alicante.
3
Estadístico: Es cualquier función calculada sobre los valores numéricos de una muestra
(media, moda, mediana, varianza...). Todos ellos permiten describir en forma
simplificada al conjunto de datos obtenidos en la muestra.
X , M = media
S, DT = desviación típica
Frecuencia relativa (Fr ): es igual al cociente entre las frecuencias absolutas y el número
total de datos.
f
Fr
N
% = Fr * 100
4
F Fr %
Bomberos 30 0’3 30
Médicos 20 0’2 20
Albañiles 40 0’4 40
Psicopedagogos 10 0’1 10
100 1’00 100%
CI F Fa
121 - 130 5 24
111 - 120 7 19
101 - 110 9 12
91 - 100 3 3
1. Distribución categórica
Se utiliza con variables cualitativas en escala nominal. Lo único que puede
determinarse con estos datos es la frecuencia de aparición de sus modalidades (n = 110,
40 son de modalidad 1-hombre- y 70 de la modalidad 2 –mujeres-).
ESTUDIOS F Fr %
Alumnos de Psicopedagogía 92 0’47 47%
Alumnos de Derecho 41 0’21 21%
Alumnos de Magisterio 62 0’32 32%
N = 195
5
Generalmente, la representación gráfica de este tipo de datos se realiza mediante
el diagrama de barras y el ciclograma.
MEJORÍA F Fr % Fa Fra %a
Máxima (4) 134 0’2154 21’54 622 1’0000 100’00
Moderada (3) 212 0’3408 34’08 488 0’7846 78’46
Leve (2) 129 0’2074 20’74 276 0’4437 44’37
Nula (1) 147 0’2363 23’63 147 0’2363 23’63
622 1’0000 100’00
6
a) Conceptos básicos de las distribuciones de intervalos
Intervalo: Distancia entre dos valores. Cualquier intervalo viene definido por dos
valores llamados límites de intervalo. Uno es el límite inferior y el otro el superior.
7
X F
10 2
9 2
8 3
7 4
6 5
5 La amplitud
8 en este caso sería 1.
106-110
101-105
96-100
91-95
Cálculo:
A = Lim. Real sup. – lím. Real inferior...................A = 95’5 – 90’5 = 5
Tipos de intervalos
111 – 130
86 - 95
8
Construcción de tablas de intervalos
2. Ver el número óptimo de intervalos. La precisión será mayor cuando mayor sea el
número de intervalos. Sin embargo, es una decisión del investigador.
A= ATi
Nº de intervalos
Ejemplo:
14,10,13,8,8,7,4,5,14,13,10,11,5,8,9,13,11,11,11,10
1) ATi = 14 – 4 + 1 = 11
2) Nº de intervalos aproximado: Aunque 20 = 4’7 tomaremos 6.
3) A = 11/6 = 1’83 ≈ 2
9
4)
14 - 15 2
12 – 13 3
10 – 11 7
8–9 4
6–7 1
4-5 3
20
Tablas estadísticas múltiples: Son las que se utilizan cuando queremos estudiar
la distribución conjunta de dos o más variables. Se trata de variables cruzadas y
sirve tanto para variables cualitativas como cuantitativas.
Ejemplo:
V1 = Profesión
V2 = Sexo
V3 = Edad
10
Diagrama de barras: Es un gráfico formado por un conjunto de barras o rectángulos,
que se dibujan sobre unos ejes de coordenadas. Cada una de las barras representa una
categoría y deben estar separadas entre ellas por espacios en blanco. La anchura de las
barras es elegida arbitrariamente. Normalmente debe guardar una relación 3/5, es decir,
que si el eje de ordenadas mide 9 cm., el eje de abcisas debe medir 15 cm.
Para el cálculo del número de grados que ocupa cada sector se aplica una regla de tres:
F 360
X N (para los datos directos)
% 360
x 100 (para los porcentajes)
11
Histograma: Se trata de una serie de rectángulos que tienen sus bases sobre el eje
horizontal, con centros en los puntos medios de los intervalos y anchura igual a la
amplitud de los intervalos. En el eje vertical se colocan las frecuencias, proporciones o
porcentajes, siempre especificándolo. Si tomamos las frecuencias, proporciones o
porcentajes acumulados se denomina histograma de frecuencias acumuladas..
12
acumuladas y la línea que une los distintos intervalos pasa por el límite superior de cada
uno de ellos, en vez de hacer por sus puntos medios. El polígono de frecuencias es una
representación gráfica más sencilla que su correspondiente histograma.
Los estadísticos de tendencia central buscan un valor que sirva par representar a
los sujetos de la muestra.
Ejemplo: 1,1,5,5,6,7,7,7,8,9,.................Mo = 7
13
Distribución unimodal 2,4,6,6,8,10...............Mo = 6
Distribución multimodal 1,1,1,5,6,6,6,7,8,8 ....Mo = 1 y Mo = 6
Distribución amodal 2,4,6,8,10
Cuando los dos valores que se repiten igual número de veces son contiguos, sólo
habrá una moda:
Ejemplo: 1,1,5,5,6,6,6,7,7,7 ...................Mo = 6 + 7 = 6’5
2
En el caso de que la variable medida se agrupe en intervalos, hay que referirse al
“intervalo modal” que es el intervalo que tiene mayor frecuencia. La Mo será la marca
de clase de dicho intervalo.
130 - 136 6
123 -129 5
116 - 122 10
109 - 115 8
102 - 108 9
95 - 101 6
Puede que en una distribución haya más de una moda, pero que no todas tengan la
misma altura. La más alta sería la moda mayor y la/s otra/s sería la moda menor.
14
Propiedades de la moda
Cálculo
15
Cuando los datos están agrupados en una distribución de frecuencias se utiliza la
siguiente fórmula:
N
2 F ai
Md Li A
F
Donde:
Li = límite real inferior del intervalo en el cual caiga la mediana (1ª frecuencia que sea
mayor que N / 2).
N = número total de observaciones
Fai = frecuencia acumulada del intervalo anterior a aquel en que cae la mediana.
F = frecuencia absoluta del intervalo en el que cae la mediana.
A = Tamaño del intervalo (amplitud) en el que cae la mediana.
Ejemplo:
INTERVALOS F Fa
128 - 134 15 88
121 – 127 21 73
114 - 120 23 52
107 - 113 17 29
100 - 106 12 12
16
Propiedades de la Mediana
Ejemplo:
A = 7,7,8...........MdA = 7
B = 5,6,6,7,7 .....MdB = 6 2 ≤ MdTOTAL = 6 ≤ 7
C = 1,1,2,3,4......MdC = 2
17
4.3. Media aritmética ( X )
Cáculo
x
X N i (cuando la frecuencia de xi = 1) ó x F
x Ni i
Xi F Fa Xi F i
35 2 34 70
30 3 32 90
25 5 29 125
20 7 24 140
15 9 17 135
10 5 8 50
5 3 3 15
= 34 625
xi Fi 625
x 18,38
N 34
(xm Fi )
X N
Donde:
= Sumatorio
xi = puntuaciones
18
Fi = frecuencia de cada puntuación
N = nº de observaciones de la muestra
Xm = marca de clase de cada intervalo
Ejemplo:
xi F xm Xm Fi
15 – 25 378 20 7560
25 – 45 324 35 11340
45 - 75 108 60 6480
= 810 25380
(xm Fi ) 25.380
X N 810 = 31’33
y = 14,6,4,8................y 2 4 8
Si sumamos o restamos una constante a todas las puntuaciones de una
distribución, la x de los nuevos datos será igual a la x original más o menos
la constante.
19
yxc Ej. x = 7,3,2,4...............= 4
c=2
y = 9,5,4,6.............y 4 2 6
- Distribución simétrica: Mo = Md = x
- Distribución asimétrica positiva: Mo < Md < x
- Distribución asimétrica negativa: Mo > Md > x
20
5. MEDIDAS DE VARIABILIDAD O DISPERSIÓN
Los estadísticos de variabilidad son los que nos permiten tener una idea de la
dispersión de los datos respecto a algún valor promedio. Se refiere a la extensión de los
datos de una distribución.
21
Ejemplo: x = 2,5,7,4,2,1,3,10,9,11,12,9
ATE = 12 – 1 = 11
ATI = 12 – 1 + 1 = 12
En el caso de intervalos:
Cuartiles (Q)
Son las puntuaciones que dividen a una distribución en cuatro partes iguales:
Q1 = Es el que deja por debajo de sí una cuarta parte de las puntuaciones, y por encima
las tres cuartas partes restantes. Es decir, deja por debajo el 25% y por encima el 75%
de las observaciones.
Q2 = Se encuentra en el punto medio, dejando por debajo el 50% de los datos y por
encima el otro 50%.
Q3 = Deja el 75 % de las observaciones por debajo, y el 25% por encima.
22
Q4 = Deja el 100% de los datos por debajo. Este cuartil no se suele utilizar.
Deciles (D)
Dividen el conjunto de datos en diez partes iguales. De esta manera,
D1 = Dejaría el 10% o 1/10 parte de los datos por debajo y el 90% por encima.
D5 = Deja el 50% de las observaciones tanto por debajo como por encima.
Y así sucesivamente.
1) pn p
N donde p es la posición del percentil que queremos conocer.
100
P60…p=60
23
2) Pp = Li + ( pn - Fai ) A
F
5.3. La Varianza (s ) y la desviación típica (s)
2
2
Varianza s2 (x x)
N
Debido a que las unidades de la varianza son las de la variable pero al cuadrado,
se define la desviación típica o estándar como la raíz cuadrada de la varianza.
(x x)2 F N
Desviación típica s ó s s2
i F xi xi F (x – x)2 F
25 – 27 3 26 78 147
22 – 24 5 23 115 80
19 – 21 10 20 200 10
16 – 18 8 17 136 32
13 - 15 4 14 56 100
10 - 12 2 11 22 128
32 607 497
x 607 / 32 18,9 19
2
s 497 / 32 15,53
s 15,53 3,94
24
Propiedades de la varianza y la desviación típica
s
CV 100
x
26
6. LA CURVA NORMAL
Propiedades
Todas las distribuciones normales son simétricas por la media y, cuando
tenemos un curva normal “perfecta”, coincide con la mediana y la moda:
Ventajas y utilidad
En las variables que tienen en la población una distribución gaussiana o normal
se puede predecir su comportamiento en la población. Es decir, desde los valores
de la muestra se pueden inferir los resultados para la población, ya que el
27
modelo gaussiano permite aplicar teoremas matemáticos que facilitan estas
inferencias.
A partir de un punto o valor en el eje de abcisas, se puede calcular la proporción
de valores que quedan por debajo o por encima. Dado que los valores o
puntuaciones directas se pueden convertir en puntuaciones típicas, algunos
autores han elaborado tablas que determinan tales proporciones a partir de un
punto de la curva normal.
Se dice que una distribución es simétrica si al dividir en dos partes, con igual
superficie, mediante la Md, una parte es imagen de la otra. Una distribución será
asimétrica cuando presenta algún sesgo.
Tipos de asimetría
Positiva: cuando presenta un sesgo positivo, es decir, hacia la derecha.
Negativa: cuando el sesgo es negativo, es decir, hacia la izquierda.
28
conveniente transformar los datos en otro tipo de puntuaciones en escala de intervalo,
como son las puntuaciones típicas.
Características:
- x 0...................(x x) 0
- La
x ............. f / N 0
0
- La
sx sX
29
x XX
z S Sx
x
Características:
x 1
z .......................... x 0.....................z 0
s s
La media de z es igual a 0...............z 0
z 2 N........................................... z 2 F N
( z z)2 z 2 N
S Z 1.............................................. sz N N N 1
Ejemplo:
Xi = 90
X 70
90 70 20
z 10 10 2
S = 10
Para conocer el porcentaje de sujetos que se quedarían por encima o por debajo
de una determinada puntuación, se utilizan unas tablas para distribuciones normales, en
las que, una vez conocida la puntuación z, podemos conocer el porcentaje (fotocopia).
30
BIBLIOGRAFIA
Amón, J. (1999): Estadística para psicólogos I. Estadística descriptiva. Madrid,
España: Pirámide.
Botella, J., León, O. G., San Martín, R. y Barriopedro, M. I. (2001). Análisis de datos en
psicología I. Teoría y ejercicios. Madrid, España: Pirámide.
Pérez Juste, R., García Llamas, J. L., Gil Pascual, J. A. y Galán González, A. (2009).
Estadística aplicada a la educación. Madrid, España: UNED/Pearson-Prentice
Hall.
Selva, J., Cervera, T., Dasí, C., Ruiz, J. C. y Meliá, J. L. (1991). Problemas de
psicoestadística descriptiva. Valencia, España: Cristóbal Serrano.
31