Está en la página 1de 10

Conceptos estadísticos básicos

Medidas de tendencia central:


-Media: Suma de las puntuaciones dividida por su número. Ejemplo: La
media de 4,3, y 5 es (4+3+5)/3= 4.
-Mediana: Puntuación que ocupa el lugar central; ej: En 1,2,3,5,8,9,12,
la mediana es: 5.
-Moda: La puntuación que tiene más frecuencia; en 5,4,7,6,6,6,5, es 6.

Medidas de dispersión:
-Rango: Distancia entre la puntuación menor y mayor.
-Varianza (s2): Suma de los cuadrados de las desviaciones de cada
puntuación respecto a la media, dividida por n; por ejemplo, de 4,3 y 5,
(media= 4) la varianza es:
(4-4)2+(3-4)2+(5-4)2 0+1+1 2
s2 = ------------------------------ = ------------- = ---- = 1.
n-1 3-1 2
Algunos conceptos estadísticos (Cont.)

Desviación estándar o típica (s): es la raíz cuadrada de la varianza.


Indica la desviación de las puntuaciones con respecto a la media.

Puntuaciones típicas o z: Se obtiene calculando la desviación de una


puntuación respecto a la media y dividiéndola por la desviación
estándar. zi = Xi - X
Sx
Cada z representa la desviación de una puntuación con respecto a la
media expresada en unidades de desviación estándar.

Si la distribución de las puntuaciones es normal, al trasformar las


puntuaciones de una variable en puntuaciones z, estas puntuaciones
se expresan en unidades de la curva normal estándar, con media 0 y
desviación 1.
Algunos conceptos estadísticos (Cont.)

Esto posibilita: a) expresar cualquier puntuación como un rango


percentil, refiriendo la z a la distribución normal estándar; b)
comparar la posición de un mismo individuo en dos o más variables,
con igual o distinta escala de medida (0-10 y 20-60).
Algunos conceptos estadísticos (Cont.)
Frecuencias y porcentajes

Con variables nominales u ordinales categóricas, en vez de medidas


de tendencia central, se emplean frecuencias. La frecuencia es el
número de veces que aparece cada valor de una variable en la
muestra. Ej.: 2, 2, 3, 2, 4, 5, 2, 3; f(2)= 4, f(3)= 2; etc.

El porcentaje resulta de dividir la frecuencia entre el número total de


casos de la muestra, n y multiplicarlo x 100. Ejemplo: En una muestra
de 200 personas, la frecuencia de mujeres es de 120 y la de hombres
de 80; y en términos de porcentaje, 120/200= .60 x 100= 60% y de
hombres, 80/200= .40 x 100= 40%.
Algunos conceptos estadísticos (Cont.)
Percentiles
Son cada uno de los 99 valores P1, P2, P3,……..P99 que dividen la distribución de los datos
en 100 partes iguales.
Un percentil indica el porcentaje de sujetos que caen por debajo del mismo; esto es el
porcentaje de sujetos que tiene una puntuación menor que la puntuación obtenida por ese
individuo.
Por ejemplo: Si un individuo alcanza una puntuación de 25 en una prueba, que corresponde
con el percentil 90, indica que el 90% de los sujetos tienen una puntuación menor que ese
individuo en la variable considerada.
Los percentiles por lo tanto indican la posición relativa de un sujeto en su grupo, sin referencia
a niveles absolutos. Los baremos se establecen en términos de percentiles, en una muestra.
Entre dos percentiles contiguos no hay la misma distancia en lo que estamos midiendo. Así si
un sujeto en un examen está en el Percentil 80, no podemos decir que sabe el doble del que
esté en el Percentil 40, sino que tiene por debajo el doble número de sujetos.
Algunos percentiles tienen nombres y símbolos específicos: Así, los cuartiles (Q) son los
percentiles que dividen al grupo en cuatro partes con idéntico número de sujetos; al percentil
25 se le denomina primer cuartil Q1; al percentil 50 segundo cuartil Q2 y al 75 tercer cuartil
(Q3).
Existen distintos métodos para el cálculo de percentiles, que se incluyen en todos los
programas de análisis estadístico.
Coeficiente de correlación r de Pearson
-El coeficiente de correlación “r” de Pearson, es un estadístico para el cálculo del grado
de covariación o correlación, entre dos variables cuantitativas, medidas en una escala
mínima de intervalo, que están relacionadas linealmente.
-El valor del coeficiente de correlación de Pearson oscila en términos absolutos entre 0 y
1. Esto es, si se contempla el signo, oscila entre –1 y +1.
-La formula, para puntuaciones típicas o estandarizadas, es:

-En esta fórmula el coeficiente de correlación de Pearson hace referencia a la media de


los productos cruzados de las puntuaciones estandarizadas (Z) de X y de Y.
-Existen otras formulas para el cálculo cuando se tienen puntuaciones diferenciales o
centradas (expresadas como desviaciones respecto a la media), puntuaciones directas,
o cuando se conocen las medias y las desviaciones típicas de cada variable.
-Por ejemplo, para los siguientes valores de 5 sujetos en las variables X (edad) e Y
(altura); la correlación rxy = 1.
X 10 9 11 12 13
------------------------------------------------------------------------------------------------------------------------------------------------

Y 150 145 155 160 165


-Una correlación positiva perfecta indica que conforme una variable aumenta la otra
aumenta en la misma medida o proporción, a más edad más altura. Una correlación
negativa (ej., rxy = -.80) indica que conforme una variable aumenta la otra disminuye, a
más de una menos de la otra. Y una correlación de 0.00 indica que no hay relación entre
las variables. A partir de un valor de +/- .50 se considera que al grado de relación es
moderadamente alto.
Prueba t de Student para muestras independientes
Se emplea para comparar dos grupos independientes de observaciones con
respecto a una variable numérica. Ej. hombres y mujeres en altura. Las
calificaciones de dos grupos de alumnos. El grado de enfermedad de un
grupo tratado y otro no tratado, etc.

Requisitos: Normalidad de la distribución de las variables (prueba K-S,


Kolmogorov-Smirnov, o Shapiro-Wilk) y homogeneidad de las varianzas
(prueba de Levene).

Se calcula mediante la fórmula:

Donde:

Pueden verse ejemplos de cálculo en:


http://www.conexionismo.com/leer_articulo.php?ref=prueba_t_de_student_p
ara_la_comparacion_de_dos_muestras_independientes-j960497l
http://www.youtube.com/watch?v=jCiDrxH1GYM
Regresión y predicción (I)
• La técnica de regresión se emplea para: a) averiguar en qué medida la VD
puede estar explicada por la(s) VI; y b) predecir una variable dependiente o
variable criterio, a partir de una o más variables independientes o predictivas.
• Para el caso de la regresión simple (una única variable predictora) la ecuación
toma la siguiente forma:

• Y= a + b1x1 + e

• Donde:
• a es el punto intercepto o intersección. El punto donde la recta de regresión
corta el eje de la variable Y. Es la media de la variable Y para el nivel 0 de x.
• b1, es la pendiente de la recta de regresión, el coeficiente de regresión, e indica
el peso o la importancia de la variable predictiva sobre el criterio. Esta relación
se conoce como la regresión de Y sobre X. Se calcula por el método de
mínimos cuadrados, que hace minima la distancias verticales entre cualquier
puntuación y la línea de regresión, b.
• x1, es la puntuación de cada individuo en la variable predictora.
• e, es el error de predicción, residuo o varianza residual. Constituye la variación
en la variable criterio o variable dependiente (Yij) que queda sin explicar por el
modelo. Se calcula como la diferencia entre el valor real obtenido por cada
alumno (Y) y el predicho Y’ por la ecuación (e= Y-Y’).
Regresión y predicción (II)

10
+

b +
+
Y +
+
a

0
0 20
X

• Figura 1. Representación gráfica de la regresión del rendimiento


académico sobre la motivación de los estudiantes.
Regresión y predicción (III)
• El punto intercepto “a” representa el rendimiento medio esperado cuando la
motivación de los estudiantes es 0; en el ejemplo está alrededor de 2. Por
otra parte vemos que conforme aumenta la motivación, el rendimiento es
mayor. Esto viene definido por la pendiente “b” de la línea de regresión. En
este caso el valor de la pendiente estaría alrededor de 0.5, lo que quiere
decir que Y cambia por un factor de 0.5 por cada cambio en x. O lo que es
lo mismo, por cada 2 puntos que un estudiante aumenta en la motivación
obtiene un punto más en el rendimiento. Cuanto mayor es la pendiente,
mayor es el coeficiente b, y por tanto la relación de la variable predictiva (X)
y el criterio (Y).
• Para una muestra de estudiantes se puede establecer una ecuación de
regresión común que ponga en relación la variable predictiva con el criterio.
Esta ecuación sirve además para predecir el resultado en la variable criterio
de cada estudiante individual (i), Y’i = a + b1xi + ei. Así, si a= 2 y b1 = 0.5,
para un estudiante que obtiene una puntuación de 10 en la motivación, su
puntuación estimada en el rendimiento al final de curso sería de:
• Y’i = 2 + 0.5*10 + ei; y’ = 2+5 = 7.
• El error de predicción, si hubiera obtenido realmente un 8 en el rendimiento,
sería e = 8-7 = 1 (esto es, 1 punto más de lo esperado).
• Las fórmulas para el cálculo se encuentran en cualquier manual de
estadística y en los programas informáticos al uso, como el SPSS.

También podría gustarte