Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. INTRODUCCIN:
Son muchas las razones que justifican la presencia de la Estadstica en la Educacin:
Comprender los trabajos que se publican en revistas cientficas, libros, informes, etc.
Entender los procesos implicados en la investigacin operativa que hacen posible la inferencia desde la
muestra a la poblacin, y conocer qu garantas nos ofrecen estas decisiones.
Facilitar el propio desarrollo de la investigacin socio-educativa.
2. CONCEPTO Y FUNCIONES DE ESTADSTICA:
Estadstica como Conjunto de Nmeros: Conjunto de datos numricos (p.ej. Censos)
Estadstica como Ciencia:
o Estudio de los fenmenos aleatorios
o Mtodos, tcnicas y modelos que ayudan en la resolucin de problemas pedaggicos y en la toma
de decisiones
Definicin de Estadstica: Kerlinger (1985): teora y mtodo de analizar datos cuantitativos obtenidos de muestras de
observaciones, para estudiar y comparar fuentes de varianza de fenmenos, ayudar a tomar decisiones sobre aceptar
o rechazar hiptesis entre los fenmenos y ayudar a hacer inferencias fidedignas de observaciones empricas.
Ofrece las siguientes posibilidades:
Calcular la media de los grupos.
Establecer el grado de variabilidad de las observaciones.
Representar grficamente, mediante tablas y figuras, los grupos o los sujetos individuales.
Transformar los datos para compararlos (centiles, puntuaciones tpicas,)
Calcular fiabilidades y valideces de los instrumentos de recogida de datos.
Extrapolar los resultados de muestras representativas a grupos ms amplios (poblaciones)
Comparar dos o ms grupos y establecer la existencia o no de diferencias significativas.
Funciones de la Estadstica:
Facilitar el manejo de datos amplios y dispersos: reducir un conjunto de datos a ndices o estadsticos
(media, mediana, desviacin tpica, correlacin, etc...) E. Descriptiva
Inferir desde la muestra a la poblacin: desde los estadsticos (procedentes de muestras suficientes y
representativas) se pueden estimar los parmetros (medidas de poblacin) E. Inferencial
Ayudar en la toma de decisiones: existen diferencias significativas entre los grupos de tratamiento?
3. TIPOS DE ESTADSTICA:
Estadstica Descriptiva:
Descripcin grfica y numrica de los conjuntos de datos: Transforma un conjunto de nmeros u
observaciones en ndices que sirven para describir o caracterizar esos datos dentro de los grupos de sujeto.
Ofrece una visin global del grupo de sujetos objeto de estudio.
No aporta suficientes argumentos cientficos en la toma de decisiones sobre los grupos.
Fox (1981) seala cinco funciones principales:
o Conocer los estadsticos de un conjunto de datos.
o Interpretar lo que nos dicen los estadsticos muestrales sobre los parmetros de la poblacin.
o Conocer la existencia, el sentido y la magnitud de la relacin entre dos variables.
o Explorar la relacin entre dos variables.
o Predecir las tendencias en el comportamiento de nuevos grupos.
1
Estadstica Inferencial:
Finalidad: la obtencin de una serie de conclusiones sobre algn aspecto o variable presente en una
poblacin a partir de las observaciones de comportamientos en una o varias muestras
Interviene y decide sobre aquellas cuestiones no resueltas por la E. Descriptiva
Trata de extrapolar los resultados que se han obtenido en muestras a las poblaciones respectivas de las que
proceden.
Se ocupa de los mtodos estadsticos que nos sirven para realizar inferencias objetivas sobre los datos
disponibles y trasladarlos a grupos ms amplios.
Nivel de confianza las decisiones que se adoptan en la investigacin socioeducativa no se pueden realizar en
trminos de certeza, sino de probabilidad. Por ello:
La existencia de una Laguna Notoria en los resultados de otras investigaciones que hace que las
aportaciones no sean suficientes.
La no constancia entre los resultados aportados por diferentes trabajos, pues las soluciones parecen no
coincidir cuando existen muestras de sujetos diferentes.
La existencia de un hecho para el que no tenemos una adecuada explicacin y resulta difcil su comprensin
en el contexto de actuacin.
La caracterstica fundamental de los problemas que nos podemos platear en el campo socioeducativo consiste en la
posibilidad de su resolucin, es decir: Evitar los problemas de ndole moral y espiritual que entran dentro del ser de
la persona y formular problemas sobre los cuales podamos estudiar comportamientos, analizar hechos y evaluar
resultados.
Definicin y eleccin del tema de investigacin: Segn Garca de la Fuente (1994), en el momento de elegir el tema
sobre el que se va a trabajar, influyen dos tipos de elementos:
1. Subjetivos: es necesario que el tema sea elegido de forma libre por el investigador y que se sienta
identificado con el mismo. Es interesante que el problema mantenga vnculos con la actitud personal actual
o de futuro y tener un buen manejo de las tecnologas as como de lenguajes.
2. Objetivos: el investigador debe tener la posibilidad de acceso a las fuentes documentales con posibilidad de
traslado a la zona donde ocurren los hechos.
La caracterstica bsica de todo problema es la posibilidad de resolucin. Conseguir una buena formulacin supone
tener muy avanzada su posible solucin, por eso:
Kerlinger (1985) indica que una gran parte de la solucin reside en saber qu es lo que se intenta hacer. Un
buen planteamiento es la mitad de la solucin.
Fox (1981) seala que de la existencia de la idea original o impulsora del problema se debe pasar a realizar
una primera revisin de la bibliografa relacionada con el mismo y as, con estos datos, definir de forma ms
precisa el problema de investigacin.
Estructura y caractersticas del problema: Para completar la visin del problema hemos de indicar una serie de
caractersticas, siguiendo las directrices de Hernndez Pina (1998), se pueden concretar en las siguientes:
Factible: indica que existen medios apropiados para investigar y que puedan ser empleados por el
investigador.
Claro: se entiende que todos los trminos incluidos en la formulacin estn perfectamente definidos y son
comprensibles, tanto para el investigador como para el sujeto, que es el objeto de investigacin.
Significativo: nos indica el nivel de importancia del problema para la comunidad educativa en la que se lleva
a cabo, supone la valoracin del problema en un contexto determinado.
La formulacin de la pregunta: debe reflejar la descripcin, la asociacin o la intervencin.
Este ltimo punto ya nos orienta sobre el tipo de investigacin para resolverlo:
Investigacin Descriptiva: descripcin.
Investigacin Correlacional: asociacin entre variables.
Investigacin Experimental o Cuasiexperimental: intervencin.
5
Una vez formulado el problema, podemos evaluarlo siguiendo los siguientes criterios: viabilidad, inters, relevancia
terica y prctica, coherencia y adecuacin al contexto.
2. LA REVISIN DE FUENTES Y EL ESTADO DE LA CUESTIN:
Una vez planteado el problema objeto de investigacin, es necesario efectuar una serie de consultas a diferentes
fuentes para conocer qu se ha dicho y cmo, sobre ese tema; necesitamos saber si ya se ha solucionado en otras
investigaciones y con qu resultados o, por el contrario, debemos abordarlo desde la novedad.
Para Fox debemos diferenciar entre la bibliografa de la investigacin (informes sobre trabajos ya realizados, con
aportaciones de datos empricos, orientaciones y sugerencias, recomendaciones) y la bibliografa de tipo
conceptual (referida a los textos, artculos, informes).
Fuentes y Bases de Documentacin: Podemos clasificarlas en dos grupos:
1. Fuentes bibliogrficas: centradas en los textos escritos.
Obras generales: enciclopedias, diccionarios
Publicaciones bibliogrficas peridicas: anuarios, informes
Revistas de investigacin especializadas.
2. Fuentes no bibliogrficas:
Recursos informticos: correos, buscadores, revistas electrnicas
Centros de investigacin en educacin: el IBE recoge una lista de estos centros.
Centros de documentacin: especializados en un mbito determinado.
Asociaciones de investigacin en educacin: difusin con revistas digitales.
3. HIPTESIS Y OBJETIVOS DE LA INVESTIGACIN:
Una vez concretado el problema y revisadas las fuentes, el investigador est en condiciones de aventurar posibles
soluciones al mismo: la HIPTESIS.
Se emplean en el mbito experimental y cuasiexperimental, para probar el establecimiento de relaciones
causales entre las variables.
En las investigaciones descriptivas o correlacionales se emplean objetivos de investigacin, ya que son los
datos los que establecen a posteriori las relaciones y dependencias entre las variables.
Concepto y Naturaleza de las Hiptesis: La hiptesis es una proposicin o conjunto de proposiciones no
demostradas, cuyo anlisis puede llevar a una conclusin lgica, que debe ser sometida a comprobacin emprica.
Bunge (1981) marca tres requisitos en la formulacin de hiptesis:
1. Tiene que ser bien formada y significativa.
2. Fundamentada en los conocimientos previos.
3. Empricamente contrastable.
4. Aadimos un cuarto requisito para completar el concepto, que se establezcan relaciones causales entre las
variables: antecedentes (que manipula el experimentador) y consecuentes (que reciben los efectos de la
manipulacin).
Caractersticas de una hiptesis bien formulada:
Conclusin: las hiptesis son los elementos directivos de la investigacin cientfica, pues nos indican qu buscamos,
qu variables se deben observar, medir y manipular; as como sobre la realizacin de la observacin, la
experimentacin y el anlisis de datos.
En algunas investigaciones nos encontramos con los trminos:
Datos y sus niveles de medida: Debemos procurar una buena calidad de los datos. Los niveles de medida vienen a
reflejar de una forma ntida la gradacin existente en la informacin recogida, hay varios niveles:
NIVEL NOMINAL:
Nivel de medida muy pobre, asigna nmeros o smbolos.
El n no tiene valor operativo, seala la pertenencia o no a esa categora.
Operaciones de =; y de equivalencia.
No se trabaja con los nmeros, sino con sus frecuencias de aparicin.
Moda, frecuencia, coeficiente de asociacin (C) o de contingencia, la prueba .
NIVEL ORDINAL:
Utiliza valores de > o < con los que puede establecerse una escala ordenada de las categoras en
forma decreciente o creciente.
La distancia entre dos posiciones o rangos sucesivos no es comparable, por no disponer de una
unidad de medida.
Es el nivel de medida de ms amplio uso en ciencias sociales.
No nos interesa el nmero en s, sino la posicin (rango) que ocupa el grupo.
Todos los datos procedentes de la observacin, de variables de tipo cualitativo y aquellos
conseguidos con instrumentos poco precisos, se consideran datos ordinales.
Mediana, correlacin de Spearman, las pruebas estadsticas no paramtricas.
NIVEL DE INTERVALO:
Adems de las caractersticas de la ordinal, se aade la igualdad de distancia o intervalo entre dos
valores cualesquiera consecutivos; es decir, existe una unidad constante de medida.
Nivel cuantitativo de datos, por lo que usamos directamente las puntuaciones alcanzadas por los
sujetos en la Vi.
X; s; correlacin de Pearson y todas las pruebas estadsticas denominadas paramtricas, siempre que
cumplan las condiciones para ello.
Programa
N de partes
Clima Escolar
Sujeto 1
Sujeto 2
1A
2A
1
1
2
0
70
60
Sujeto 3
1B
50
Sujeto 4
3B
40
En la investigacin emprica siempre tenemos que trabajar con datos empricos, es decir, transformar en nmeros
la realidad observada, para ello necesitamos instrumentos de medida vlidos y fiables. La precisin (fiabilidad) de
los instrumentos podr tener distintos grados (por ej. en variables como la edad, el cociente intelectual, el
rendimiento acadmico, la altura, la presin arterial, etc.) y eso afectar a la validez de los resultados. En este
10
sentido, la eleccin de los instrumentos de medida o el proceso de construccin de los mismos es una parte
fundamental de la investigacin.
Una vez realizado el diseo de investigacin y elegidos los instrumentos de medida, se puede realizar el trabajo de
campo, aplicar los instrumentos, recoger los datos.
3. PERMISOS Y TICA EN LA INVESTIGACIN Y RECOGIDA DE DATOS:
Todava no hay un consenso completamente claro sobre cmo debe procederse ticamente en la investigacin. Lo
que s parece claro es que no se caer en uno de estos dos extremos:
- Proteger contra la experimentacin humana a toda costa
frente a
- Permitir a cualquiera ser objeto de experimentacin
En la investigacin educativa los Principios ticos que deben seguirse son:
Participacin voluntaria de los sujetos.
Informe consentido = los sujetos conocen la naturaleza de la investigacin.
Evitacin de riesgo de dao fsico o psquico.
Confidencialidad y anonimato.
Respetar el lugar, causando las menos alteraciones posibles.
No manipular los datos obtenidos y reflejar fielmente los resultados aunque contradigan su hiptesis
inicial.
Citar adecuadamente los autores y las fuentes de informacin durante la revisin del estado de la cuestin.
PRCTICAS TICAS = DEONTOLOGA PROFESIONAL
4. DE LOS DISTINTOS INTRUMENTOS A LOS DATOS: ELECCIN DEL PROGRAMA, LA MATRIZ DE DATOS Y EL LIBRO
DE CDIGOS.
Una vez que hemos aplicado los instrumentos, debemos trasladar los datos a algn programa que nos permita
trabajar con ellos.
Las puntuaciones que vamos a introducir se llaman puntuaciones directas (Xi), que es la puntuacin que obtiene el
sujeto tras aplicarle un instrumento de medida (una pregunta, un test, una escala, etc.). La codificacin de datos
consiste en la asignacin de nmeros o caracteres a los valores de variables.
Antes de empezar a tabular o introducir datos, es conveniente
escribir el libro de cdigos. Se trata de un documento en el que
se especifican todas las variables del estudio en el orden en el
que sern introducidas en la matriz de datos. La utilidad de dicho
libro es decisiva para evitar errores de tabulacin.
Es importante definir el valor que asignemos a los datos perdidos o Missing data. Por ejemplo, cuando estamos
tabulando un cuestionario y nos encontramos que un sujeto no ha contestado a una pregunta, tenemos dos
opciones:
1. Se deja en blanco en la matriz de datos, de modo que no se contabilice a la hora de calcular los estadsticos.
Un error muy comn es poner ceros, pero esto puede distorsionar el clculo de los estadsticos ya que puede
estar incluido como un valor vlido.
2. Definir un valor perdido por el usuario, como por ejemplo 99 (siempre que no sea un valor admisible dentro
de la escala de medida de la variable). En este caso, debemos programar dicho valor en el programa que
utilicemos, de modo que el programa no utilice ese valor para los clculos.
La matriz de datos es simplemente una tabla de doble entrada en la que las filas representan sujetos y las columnas
a las distintas variables medidas. Debemos ordenar y categorizar los datos, para poder apreciar mejor las
caractersticas del grupo en cada una de las variables. A este primer anlisis se le denomina Estadstica Descriptiva.
5. ORGANIZACIN DE LOS DATOS: DEPURACIN DE DATOS Y DISTRIBUCIONES DE FRECUENCIA.
Antes de empezar a realizar los anlisis estadsticos, debemos hacer lo que entendemos como depuracin de datos
y exige dos fases:
1. El control de calidad de la tabulacin1 que consiste en comprobar la fidelidad de la tabulacin.
2. La depuracin de datos que consiste en verificar si hay valores fuera de rango segn se haba definido en
el libro de cdigos.
Hay distintas maneras de hacerlo:
Realizar un Anlisis Descriptivo solicitando los valores mnimo y mximo
Con el libro de cdigos debemos ir comprobando que los valores estn dentro del rango definido.
Realizar una Distribucin de Frecuencias. Aparecen todas las puntuaciones obtenidas en una variable
(puntuaciones directas) y el nmero de veces que se repite cada puntuacin (frecuencia absoluta). Tambin
son utilizadas la frecuencia relativa (frecuencia absoluta entre el nmero total de puntuaciones: fa/N) que,
multiplicado por 100 indica el porcentaje de aparicin de una puntuacin respecto del total y, la frecuencia
acumulada, que muestra el nmero de sujetos a los que supera una puntuacin determinada.
Distribuciones de frecuencia y aproximacin al concepto de percentil. Una distribucin de frecuencia suele incluir:
Puntuaciones directas obtenidas (Xi).
Frecuencias absolutas nmero de veces que se repite cada Xi (fi)
Porcentaje relativo o frecuencias relativas fi/N x100. Es el % de aparicin.
Frecuencia acumulada muestra el n de sujetos a los que supera una puntuacin determinada. Se calcula
sumando las frecuencias relativas que queden por debajo del lmite superior de cada puntuacin.
Puntuacin directa
Frecuencia absoluta
1
2
3
4
5
6
7
Total
179
93
107
128
108
131
266
N= 1012
Frecuencia relativa
x 100
17,7
9,2
10,6
12,6
10,7
12,9
26,3
100,0
Tabular los datos es trasladar los datos de los instrumentos de medida a la matriz de datos.
12
Los porcentajes acumulados (sin decimales) se utilizan mucho en la construccin de baremos para interpretar las
puntuaciones en los test, donde reciben el nombre de Percentiles. El percentil indica el porcentaje de sujetos que
deja por debajo de si una puntuacin determinada.
Una distribucin de frecuencia suele incluir:
1 Columna: el nmero de sujetos o casos que corresponde a cada puntuacin directa: Frecuencia Absoluta.
2 Columna: el Porcentaje Relativo (o frecuencia relativa multiplicada por 100) para cdigo, incluidos los valores
perdidos.
3 Columna: el Porcentaje Vlido, que es el porcentaje relativo de cada valor excluidos los valores perdidos.
4 Columna: el Porcentaje Acumulado, indica el porcentaje de casos que deja por debajo de s el lmite superior
de cada puntuacin.
= Md = Mo
13
vs.
(5, 5, 5, 5, 5, 5)
=5
=5
Valor alto
2. MEDIDAS DE TENDENCIA CENTRAL: MEDIA, MEDIANA Y MODA. USOS E INTERPRETACIN.
MEDIA ARITMTICA: la Tendencia Central del grupo indica hacia qu
valor tiende ir el grupo. Es el ndice o medida ms conocida.
Interpretar una media aritmtica suele ser muy sencillo. Para
interpretarla correctamente, es conveniente conocer la puntuacin mnima y mxima de la escala de medida de la
variable y situar la media aritmtica dentro de ese recorrido.
14
2
5
Md
14,5
Md
1 ,5
4
-
En puntuaciones pares:
25 26
MEDIANA (Md) es aquel valor que
25
25
deja por encima y por debajo de s al 50% de los sujetos de la muestra,
el valor central de la distribucin de frecuencias. Si ordenamos las puntuaciones de los
50
sujetos de menor a mayor la Md es la que est en el medio. En puntuaciones pares se cogen las dos puntuaciones y
se realiza la media, en el caso de los impares es la que se queda en el medio.
La medida ms precisa de Tendencia Central es la Media porque tiene en cuenta todas las puntuaciones, aunque
siempre que sea posible, se deben calcular Md y Mo porque hay que tener en cuenta que la media aritmtica es
sensible a las puntuaciones extremas, no as la mediana ni la moda. La mediana puede ser una medida preferible a
la media cuando las puntuaciones extremas puedan distorsionar la verdadera
1, 1 , 3, 5, 8, 10, 42
tendencia central del grupo.
=7
Md = 5
Podremos utilizar:
Mo = 1
En Variables de Intervalo o Razn: media, mediana y moda.
Valor Aberrante = 42
En Variables de Tipo Ordinal: mediana y moda.
En Variables de Tipo Nominal: moda.
(3, 3, 4, 4, 4, 5, 5)
=4
Md = 4
vs.
(3, 3, 4, 4, 4, 5, 10)
= 4,7
Md = 45
El Valor Aberrante, Atpico o Extremo, es aquella puntuacin que queda muy lejos del grupo.
3. MEDIDAS DE VARIACIN:
Las medidas de tendencia central por s solas no nos proporcionan suficiente informacin como para hacernos una
idea de las caractersticas del grupo. Nos podemos preguntar si el grupo es homogneo en torno a la media
aritmtica (la mayora de las puntuaciones estn cerca de la media) o heterogneo (muchas puntuaciones distan
considerablemente de la media, tanto por arriba como por abajo). Por esta razn, el ndice de tendencia central
debe ir acompaado por un ndice de dispersin o variabilidad que indique en qu medida las puntuaciones de los
sujetos se dispersan o varan en torno a la media aritmtica.
15
DESVIACIN MEDIA (DM): Es una medida que implica la media aritmtica de las
desviaciones de las puntuaciones directas respecto de la media aritmtica
DM
Las puntuaciones se desvan
Las puntuaciones se alejan de la del grupo
Grupo Heterogneo
DM
Las puntuaciones del grupo estn prximas
Las puntuaciones son prximas a la del grupo
Grupo Homogneo
Los ndices de variabilidad ms conocidos y utilizados son la DESVIACIN TPICA (S) y la VARIANZA (S2). El
numerador expresa las distancias de cada puntuacin directa a la media aritmtica. Dichas distancias se elevan al
cuadrado para evitar que el valor siempre fuera 0.
SESGADA
INSESGADA
DESVIACIN TPICA
VARIANZA
La Desviacin Tpica Sesgada, se utiliza frecuentemente al trabajar con muestras aunque, es igualmente frecuente
trabajar con la Desviacin Tpica Insesgada, que es la estimacin de la desviacin tpica de la poblacin a la que
pertenece la muestra. Por lgica, se entiende que la Desviacin Tpica en una poblacin ser ms elevada que en
una muestra (al haber ms sujetos, ser ms probable encontrar mayores diferencias interindividuales), por lo que
si disminuimos el denominador, el cociente ser mayor, por ello para calcular la Desviacin Tpica Insesgada,
simplemente se le resta una unidad al denominador:
Al elaborar un informe descriptivo, lo usual es incluir la Desviacin Tpica como medida de dispersin. No siempre
es fcil interpretar una desviacin tpica, decir si es grande o pequea. En muchas ocasiones se utiliza para
comparar la dispersin entre grupos distintos:
Si tenemos un solo grupo, los valores que podemos tomar de referencia son:
o Desviacin Tpica Mnima siempre cero
o Desviacin Tpica Mxima la puntuacin mayor menos puntuacin menor entre dos.
Para obtener la Mnima Desviacin Tpica todos los sujetos deben obtener la misma puntuacin.
Para obtener la Desviacin Tpica Mxima la mitad de los sujetos deberan obtener la puntuacin
mxima de la escala y la otra mitad la puntuacin mnima (as se conseguiran las distancias mximas
respecto de la media y, en este sentido, la mxima heterogeneidad).
Sin embargo, si bien esto es posible en Variables Dicotmicas, cuanto ms grande es la amplitud de la
variable, ms improbable es que se d esta situacin. En consecuencia, tendremos que ver en estos casos
cunto se aleja de cero la desviacin tpica.
Ejemplo: En una Escala de CI que va de 70 a 130:
= 110
S= 8
0
8
Smnimo = 0
Homogneo
Smximo =
= 30
30
Heterogneo
AMPLITUD O RECORRIDO: Existen otras medidas de dispersin. La ms bsica es la amplitud o recorrido de una
variable. Se calcula como la diferencia entre la puntuacin mayor y menor ms uno:
Esta medida se utiliza, sobre todo, para organizar los datos de una distribucin de frecuencias en intervalos y
realizar grficos. La amplitud se utiliza como media de dispersin nicamente cuando no es posible calcular otra o
como complemento de la moda (cuando el nivel de medida de la variable es nominal). Al igual que suceda con la
moda como ndice de tendencia central, es un ndice muy simple, basado en tan slo dos puntuaciones, lo que
puede dar lugar a malas interpretaciones si no se valora con precaucin, sobre todo cuando existen puntuaciones
extremas.
DESVIACIN SEMI-INTERCUARTLICA (Q): Es una medida que indica la dispersin en el 50% central de la
distribucin, es adecuada cuando el nivel de medida de la variable es ordinal como complemento de la mediana.
Tambin es adecuado su uso cuando la existencia de puntuaciones extremas pueda distorsionar en
exceso la desviacin tpica, ya que las ignora centrndose en la parte central de la muestra.
La Q prescinde del 25% inferior y del 25% superior de las puntuaciones, calculando la dispersin en el 50% central,
entre los percentiles 25 y 75 o, lo que es lo mismo, entre los cuartiles Q1 y Q3.
25 %
25%
25 %
25 %
Q1
Q2
Q3
25%
50%
75%
2 , 5 , 9 , 14 , 16 , 24 , 35
Percentil 25 y Quartil 1 = 5
Percentil 50, Mediana y Quartil 2 = 14
Percentil 75 y Quartil 3 = 24
EL COEFICIENTE DE VARIACIN (V): permite comparar la variabilidad entre
variables que tienen distinta amplitud. Dos desviaciones tpicas procedentes de
instrumentos con distinto recorrido o distinta escala de medida no son directamente
comparables. Se expresa en trminos porcentuales.
Ejemplo: Quiero saber cul es ms heterognea:
Escala de Medida
Media
Desviacin tpica
Coeficiente de Variacin
Variable CI
Escala de 0-100
= 100
S = 15
V=
x 100 = 15 %
Variable Rendimiento
Escala de 0-10
=6
S=2
V=
x 100 = 33 %
17
= Media () p =
q=
p=
= 0,60
= 0,40
El 60% de la muestra ha respondido que s, al 60% le gustan las matemticas y al 40% no le gustan.
De esta manera q= 1 p en este caso 1 0,6 = 0,4.
La Varianza se calcula S2 = p q
La Desviacin Tpica es S=
Casos Extremos:
Todo
Correcto
Aciertos
Errores
p=1
S2 = 0
q=0
S =0
p = 0,5
S2 = 0, 25
q = 0,5
S = 0,50
HOMOGENEIDAD
ABSOLUTA
MXIMA
VARIABILIDAD
Varianza ir de 0 a 0,25
Desviacin Tpica ir de 0 (ausencia variabilidad) a 0,5 (
Aciertos y Errores)
No hay sesgada ni insesgada.
Las medias con variables dicotmicas son muy usadas en pruebas objetivas con preguntas de acierto/error. En este
caso, la media nos dir la proporcin de sujetos que ha contestado correctamente a la pregunta, que viene a
denominarse ndice de Dificultad del tem.
5. ASIMETRA Y APUNTAMIENTO: RELACIN CON LA CURVA NORMAL.
La asimetra y el apuntamiento son dos caractersticas relativas a la forma grfica de la distribucin de frecuencias.
Muchas variables educativas, psicolgicas y biolgicas se distribuyen segn la llamada distribucin normal = curva
normal = campana de Gauss (rendimiento acadmico, inteligencia, aptitud, motivacin, peso, altura). La
distribucin viene a indicar cmo la mayora de las personas nos encontramos en torno a los valores medios de la
distribucin y segn nos alejamos hacia valores extremos el nmero de sujetos disminuye progresivamente.
Ms
casos
Menos
casos
Menos
casos
18
Asimetra
Positiva
As = +
Cola de la
Distribucin
1,40
1,70
= Mo
Parte
Baja
2,00
Si
aadimos
chicas
muy bajas
Asimetra
Negativa
As = -
Cola de la
Distribucin
Parte
Baja
Mo
Parte
Alta
Mo
Parte
Alta
Apuntamiento o la Curtosis: indica el grado en el que la distribucin es ms o menos picuda, es decir, el grado en
el que la distribucin resulta ms abierta o dispersa respecto a la media (las puntuaciones estn poco concentradas
respecto a la media).
Mesocrtica: la curva normal. Curtosis = 0
Leptocrtica: ms apuntada. Concentracin de las puntuaciones
alrededor de la media. Curtosis > 0
Platicrtica: ms achatada. Dispersin de las puntuaciones
alrededor de la media. Curtosis < 0
Para el clculo de la curtosis, puede utilizarse la siguiente frmula:
6. REPRESENTACIONES GRFICAS:
1er trim.
2do trim.
Grfico de sectores o ciclograma o grfico de tarta: variables con nivel de medida nominal.
3er trim.
4to trim.
Dicotmicas. Cada porcin representa la proporcional de cada uno de los niveles de la
variable.
100
Grfico de barras: variables con nivel de medida ordinal, aunque se puede utilizar
cuando el nivel de medida es nominal y para realizar comparaciones de variables
50
Este
clasificatorias o categricas. Histograma: es muy parecido al de barras, pero se utiliza
Oeste
0
para variables cuantitativas continuas, con nivel de medida de intervalo o de razn.
1er trim. 3er trim.
Norte
Agrupa las puntuaciones en intervalos.
Grfico de caja, caja y patillas o caja y bigotes: para hacerse una idea rpida de la
distribucin de las puntuaciones en la zona central (Comprende desde Q1 al Q3, del
percentil 25 al 75) Es til para comparar visualmente grupos medidos en distintas variables.
No son adecuados para un nivel nominal, se usa en variables de intervalo o razn. Las
patillas son los extremos, representan las puntuaciones hasta los extremos de la
distribucin. Outlier, se llama al valor extremo, puntuacin rara o atpica. Se considera
outlier a partir de Md 1,5 (Q1 Q3).
19
Matemticas
X2 = 18
n = 20
18/20 = 0,9
Puntuacin proporcional
90 %
Puntuacin porcentual
x 100
Un sujeto que obtiene un 45% de respuestas correctas en una prueba objetiva se corresponde con un resultado
medio-bajo pero dicha afirmacin es discutible. Podra ocurrir que el test hubiese sido tan difcil, que el sujeto que
obtuvo un 45% de aciertos fue el mejor de su grupo. Entonces, quizs podramos interpretar que esta puntuacin no
fue tan mala.
3. PUNTUACIONES DIFERENCIALES
Una puntuacin diferencial (x) es una puntuacin individual relativa a la media aritmtica del grupo de referencia.
Por tanto, para calcular una puntuacin diferencial es necesario haber aplicado un instrumento de medida a un
grupo de sujetos. Para calcularla, simplemente se le resta a la puntuacin directa del sujeto la media aritmtica del
grupo al que pertenece.
Lengua
= 13
X1 = 18
x= 18- 13 = +5
n = 40
Matemticas
= 19
X2 = 18
x= 18-19 = -1
n = 20
Una puntuacin diferencial slo nos permite saber si una puntuacin est por encima o por debajo de la media
aritmtica. Es evidente que no es lo mismo separarse dos puntos de la media cuando tenemos un recorrido de 5
puntos que cuando el recorrido es de 100. Necesitamos, por tanto, una puntuacin que permita situar a un sujeto
con respecto a su grupo de referencia y hacer comparaciones independientemente de la amplitud del instrumento
del que procedan las puntuaciones directas que deseamos comparar.
4. PUNTUACIONES TPICAS:
Una puntuacin tpica (z) indica el nmero de desviaciones tpicas que se desva una puntuacin directa de la media
aritmtica. Las dos propiedades ms importantes de las puntuaciones tpicas son que la media de
dichas puntuaciones es igual a 0 y la desviacin tpica igual a 1.
Ejemplo: Un grupo de sujetos tiene una en CI = 100 puntos y una desviacin tpica s = 10
Xi = 110 z=
Xi = 120 z=
Lengua
= 23
S=5
Xi = 18
z= 18-23/5 = -1
Matemticas
=9
S= 3
Xi= 18
z= 18-9/3 = 3
Las puntuaciones tpicas son muy utilizadas porque nos permiten comparar cualquier puntuacin entre s,
independientemente del instrumento de medida o de la amplitud de la escala utilizada. A toda puntuacin directa
superior a la media le corresponder una puntuacin tpica positiva, y si es inferior a la media, negativa. La media
aritmtica siempre coincide con una z = 0.
Debe entenderse que una puntuacin tpica (z), como hemos dicho, es una puntuacin que depende tanto de la
media como de la variabilidad del grupo. En consecuencia, las puntuaciones tpicas variarn dependiendo de la
homogeneidad o heterogeneidad del grupo. Si un grupo es muy homogneo, su desviacin tpica ser pequea y,
por tanto, a una puntuacin que no se aleje mucho de la media le puede corresponder una puntuacin tpica mucho
mayor que la que le correspondera si el grupo fuese heterogneo.
Por ejemplo: Examen de estadstica, donde tienen la misma media y la misma puntuacin directa (Xi) tendrn una z
diferente por las caractersticas del grupo.
Grupo A
Grupo B
En el Grupo A, el alumno destaca mucho porque el grupo es muy
= 5,5
= 5,5
homogneo encontrndose su puntuacin en el extremo.
S = 0.4 - Homogneo
S= 2,5 Heterogneo
En el Grupo B, la Z es positiva porque su puntuacin supera la
Xi = 7
Xi= 7
media pero no destaca porque pertenece a un grupo
z= 7-5,5/0,4 = 3,75
z= 7-5,5/2,5 = 0,6
heterogneo.
5. PUNTUACIONES TIPIFICADAS O ESCALAS DERIVADAS: (Marcos no importante)
Las puntuaciones tipificadas consisten en una simple transformacin de las puntuaciones tpicas, creadas con el
nimo de evitar las puntuaciones decimales y las negativas. La transformacin se reduce a multiplicar por una
constante a la puntuacin tpica, valor que se convertir en la nueva desviacin tpica y sumarle otra constante,
valor que se convertir en la nueva media de las puntuaciones tipificadas: T = a z + b (b = ; a = S ; z = puntuacin
tpica) Entre las puntuaciones tipificadas ms usadas, se encuentran las siguientes: T= 10z + 50 // S = 2z + 5.
Entonces, un sujeto con una puntuacin directa igual a la media tendr una puntuacin T 50 y una S = 5.
21
z=1
En casi todos los textos de Estadstica se pueden encontrar las tablas de la curva normal con las probabilidades
asociadas a cada puntuacin tpica. La interpretacin de las tablas es muy sencilla. Tenemos que pensar que una
puntuacin tpica divide la curva normal en dos partes:
una grande y otra pequea (excepto z = 0 que la divide
en dos partes iguales). En este caso, hemos utilizado la
puntuacin tpica 1,25. Si trazamos una lnea vertical a
partir de dicha z, el rea de la curva normal queda
dividida en dos partes. El rea mayor, es el rea ms
grande que queda al realizar dicha divisin. Por tanto,
una puntuacin tpica igual a 1,25 tiene una
probabilidad acumulada de aparicin de p = 0,8944 (ver
tablas de la curva normal), esto es, el 89,44% de los sujetos obtienen una puntuacin z 1,25. Consecuentemente, en
este caso, el rea menor indica la probabilidad de obtener una puntuacin z 1,25 (p = 0,1056).
1 Columna A
Puntuacin Tipificada (z)
1,25
4 Columna D
rea parte menor
0,1056 11%
Problema: Seleccionar a los 12 mejores alumnos: donde N= 150 ; La puntuacin Global va de 25 -150 ; Distribucin
normal = 81 y S =16,8
Puntuacin Directa para ser seleccionado ?
Seleccionan a los 12 mejores de 150 12/150 100 = 8 % 0,08
El punto de corte ser el 8 % el que deje el 8% tanto por debajo como por arriba.
Busco la z que corresponde al rea menor 0,08
La z = 1,40 deja el 8 % por arriba y el 92 % por abajo.
Convierto la puntuacin Tpica en Puntuacin Directa
o
z=
Xi = (z+)S
Xi = (1,40+81) 16,8 = 104,52 A partir de esta puntuacin se encuentran los alumnos que
buscamos.
Percentil al que corresponde esta puntuacin ? Pertenece al percentil 92% ya que supera al 92 % de los alumnos.
Probabilidad de encontrar una puntuacin > 140 ? Xi = 140
z=
z=
= 3,51 esta puntuacin deja el 0,0002 0,02% la puntuacin de 140 la supera el 0,02% es
23
Interpretacin
Correlacin baja
Entre 0,91 y + o 1
Total 55
X
Y
7
8
5
4
=5,5 60 = 6
Puntuaciones diferenciales:
X2
47
25
331
Y2
64
16
386
X*Y
56
20
351
x
1,5
x2
2,25
...
28,5
y
2
y2
4
26
x*y
3
21
25
4.2 El coeficiente de correlacin ordinal de Spearman ( ): En muchas de las variables que utilizamos con frecuencia
en el campo educativo no es posible alcanzar unos niveles precisos de medida. Al no disponer de informacin precisa
se suelen emplear los puestos que ocupan las puntuaciones en una serie ordenada: Nos interesa conocer la posicin,
orden o rango que ocupan en una serie ordenada de valores (1, 2, 3, 4). Ante esos casos en que las dos
variables tienen la misma naturaleza, y adems con esos datos, solamente podemos garantizar que alcanza un nivel
de medida ordinal, importa el lugar que ocupa no la puntuacin obtenida, debemos recurrir al coeficiente de
correlacin de Spearman.
Para proceder a la transformacin de las puntuaciones obtenidas de la aplicacin directa del instrumento de recogida
de datos en rangos se suele comenzar asignando el rango o posicin 1 a la puntuacin ms alta, la siguiente tendr
el rango 2 y as sucesivamente de tal forma que el ltimo rango que se asigne debe coincidir con el nmero de
sujetos de la muestra.
n nos indica el nmero de sujetos o de pares de puntuaciones
D diferencia, de rangos o posiciones que ocupa un mismo sujeto en dos variables distintas.
En aquellos casos en que existan varias puntuaciones directas coincidentes, la asignacin del rango se realiza
calculando el promedio de las posiciones que ocupan. El criterio de asignacin de rangos debe ser el mismo para
ambas variables.
4.3 El coeficiente de contingencia (C): En el caso de variables nominales o atributos, se suele hablar de grado de
asociacin (no de grado de correlacin). Se utiliza aquellos supuestos en que se recogen datos de variables
clasificadas en categoras.
o
CC. SOCIALES
Y JURDICAS
BAJO
MEDIO
ALTO
=20
120 100
=
=37,5
320
40
CIENCIAS
=40
=37,5
40
HUMANIDADES
=60
=45
40
120
120
40
20
20
80
100
100
120
320
26
27
b) La fiabilidad como equivalencia: Tambin denominado de formas paralelas; consiste en aplicar dos pruebas
diferentes pero que miden el mismo rasgo o caracterstica, de tal forma que los resultados de la aplicacin de la
primera prueba se correlacionan con los de la segunda, lo que nos permite calcular el coeficiente de correlacin o
equivalencia entre ambas puntuaciones. Este procedimiento es difcil y complicado, sobre todo por los problemas
que plantea encontrar pruebas equivalentes, que tengan los mismos objetivos y que los contenidos y las condiciones
de aplicacin sean similares. Tambin se utiliza el coeficiente de correlacin de Pearson. Si transcurren ms de 20
das entre la aplicacin de la prueba y la forma paralela, el coeficiente encontrado puede ser considerado como de
equivalencia y de estabilidad.
c) La fiabilidad como consistencia interna: Los instrumentos de medida estn representados por una serie de
elementos o tems bastante amplio; por ello cabe esperar que cada uno de ellos medir una parte de ese rasgo o
caracterstica que mide la prueba en su conjunto; en consecuencia, es lgico suponer que existir una coherencia o
consistencia en las respuestas que ofrecern un conjunto de sujetos a los diferentes elementos que integran tal
instrumento.
Este procedimiento tambin conocido de las mitades nos permite dividir la puntuacin total del sujeto en una
prueba en dos partes (mitades), bien eligiendo como criterio los tems pares y los impares o bien la primera y la
segunda mitad. En realidad obtenemos dos puntuaciones para cada sujeto. En efecto: por un lado est la puntuacin
que corresponde a los tems impares y por otro la de los impares; de tal forma que estableciendo una relacin entre
ambas partes nos dar el coeficiente de fiabilidad como consistencia interna, si bien de un instrumento cuya longitud
es la mitad. Somos partidarios de utilizar este criterio de mitades, pues en muchas pruebas, y con el fin de estimular
las respuestas de los estudiantes, los tems ms fciles se colocan al comienzo de la prueba y los ms difciles al final,
por ello la divisin impares/pares recoger tems del comienzo y del final y ser ms equilibrada que la primera y la
segunda mitad. Existen varios procedimientos para determinar la fiabilidad de una prueba por medio de la
consistencia interna:
28
Proedimiento de Guttan: Este procedimiento se basa en la varianza de las mitades, de tal forma que a
menor valor las de varianzas ms elevada ser la fiabilidad de la prueba. As pues la frmula de clculo es la
siguiente:
3. EL ESTUDIO DE LA VALIDEZ:
Podemos afirmar que un instrumento es vlido cuando mide lo que dice medir y no otra cosa distinta. Debemos
indicar que ningn instrumento va a ser absolutamente vlido, sino que tendremos que matizar el grado y la
naturaleza de la validez.
En la investigacin socioeducativa existen diferentes enfoques o tipos de validez de los instrumentos de medida y
recogida de datos, en cada caso debemos recurrir a aquella validez que guarda una relacin ms estrecha con el
propio instrumento y la forma en que est configurado, as como la informacin que nos suministra. Seguidamente
pasamos a analizar de forma ms detallada las principales.
3.1 Tipos de validez:
a) La validez de contenido: La muestra ha de ser suficiente y representativa. La suficiencia se relaciona con el
nmero mnimo de elementos que debe incluir el instrumento, para tener garantas de que comprende aquellos
aspectos que son esenciales para el estudio. La representatividad, exige un conocimiento profundo sobre el tema,
de tal forma que esas tareas sean definidas con precisin y claridad, en ese caso ser ms sencillo proceder a la
seleccin de los tems. En el caso de que la relacin entre las tareas no sea tan directa, es conveniente elaborar una
tabla de especificaciones y juicios de expertos. A este proceso se le denomina validacin.
b) La validez predictiva: Nos permite conocer la capacidad que tiene la prueba para avanzar las expectativas sobre
futuros hechos o fenmenos; se pretende establecer predicciones sobre la variable que se mide o bien sobre los
diversos aspectos relacionados con ella. Su clculo se realiza estableciendo una correlacin entre las puntuaciones
alcanzadas en la prueba a validar por un determinado nmero de sujetos y los obtenidos en otra prueba
denominada criterio. Es preciso que todos los sujetos que responden estn previamente identificados, pues se trata
de relacionar las puntuaciones de cada sujeto en las dos pruebas. En la gran mayora de los casos, recurriremos al
coeficiente de correlacin de Pearson.
c) La validez concurrente: Este tipo de validez es una modalidad de la predictiva, pues se calcula mediante una
correlacin entre las puntuaciones de los sujetos en la prueba a validar y el criterio externo. La diferencia estriba en
que ambas mediciones se llevan a cabo en el mismo tiempo, adems los resultados permiten realizar pronsticos a
corto plazo, es decir, de utilizacin inmediata. Mientras que en la predictiva no coinciden la aplicacin de la prueba y
la recogida de datos. En cada caso el investigador tendr que revisar y definir con claridad el objetivo del
instrumento de medida para as elegir aqul tipo de validez que es el ms apropiado en cada situacin.
d) La validez de constructo: Tambin se denomina de elaboracin o de construccin, se refiere al objeto mismo de
la medicin, acude a la base del problema de la validez. Se trata de analizar la conexin que se manifiesta entre la
teora en la que se basa la prueba y los tems que la componen. Ello implica que se deben establecer una serie de
hiptesis iniciales, que, una vez comprobadas empricamente, nos ofrecer tanto la validez del instrumento como la
teora subyacente al instrumento. Cuando las hiptesis no sean confirmadas, se puede deber a que la prueba carece
29
de validez o a que es insuficiente, tambin puede ocurrir que la hiptesis no est bien planteada o que la propia
investigacin no permita validar la hiptesis.
e) La validez aparente: Validez didctica o validez superficial: son aspectos externos cuya influencia puede ser
relevante para alcanzar participacin y respuestas vlidas. Que no haya nada que lo invalide.
4. EL ESTUDIO DE LOS ELEMENTOS O TEMS DE UNA PRUEBA:
Para tener las suficientes garantas cientficas de que la prueba que vamos a aplicar a un grupo de sujetos es la ms
adecuada, es preciso conocer el comportamiento de cada uno de los tems que la componen. As se podrn eliminar
aqullos que no pasen el control o aadir otros que s cumplan esos requisitos. Estos ndices no son aplicables a las
pruebas de medida de actitudes.
a) El ndice de dificultad (ID): La dificultad de los elementos depende del grupo de sujetos que lo conteste y se
expresa numricamente por el nmero de ellos que los resuelven satisfactoriamente, de tal forma que cuando es
contestado bien por un nmero pequeo de sujetos ese tem ser muy difcil y, a la inversa, si prcticamente todos
lo responden acertadamente ese elemento ser muy fcil. El ndice de dificultad (ID) de un elemento o tem nos
indica la proporcin de los sujetos que lo resuelven de forma correcta en relacin con el total de los que lo
contestan.
Cuando se pretende evocar una respuesta, la calificacin final ser igual al nmero de aciertos de cada sujeto, en
este caso los errores no penalizan, por ello el ndice de dificultad se calcula de la siguiente forma:
A nos indica el nmero de sujetos que aciertan el tem.
n el nmero de sujetos que lo intentan.
En el supuesto de que la prueba est compuesta por tems es decir (entre varias opciones) elegir la correcta, los
errores penalizan, pues se deben corregir las respuestas ofrecidas al azar. Puntuacin de un sujeto:
E se refiere al nmero de errores
na es el nmero de alternativas de respuesta que se ofrecen.
Para este caso de elementos de varias alternativas de respuesta la frmula es:
Para proceder a la interpretacin de los ndices de dificultad de los tems hay cinco categoras:
Muy fciles (ID >0,75)
10%
20%
40%
20%
10%
0 = muy difcil
1 = muy fcil
Lo ms pedaggico es que los tems fciles se siten al principio de la prueba, y los difciles al final.
b) El ndice de homogeneidad (IH): La homogeneidad de los elementos pone de manifiesto la coherencia de cada
uno de ellos con el total de la prueba: si esta mide un rasgo o caracterstica es lgico que cada uno de los tems
mida hasta cierto punto lo mismo. Se calcula a partir del valor de la correccin entre cada elemento y el conjunto
de los dems, as pues, cuanto mayor es el coeficiente entre ambas puntuaciones, mayor ser la homogeneidad.
c) El ndice de validez (IV): Los elementos de una prueba se consideran vlidos cuando realmente miden lo que dicen
medir y no otra cosa distinta. Ello exige la existencia de una clara relacin entre las puntuaciones obtenidas por los
sujetos de la muestra en cada uno de los tems y las alcanzadas en el criterio de validez: cuanto mayor sea esa
relacin mayor ser el ndice de validez (IV).
30
Poblacin: conjunto de todos los elementos que cumplen una o varias caractersticas o propiedades. Los
valores numricos que describen a la poblacin se llaman parmetros (PP).
Muestra: es un subconjunto de los elementos de una poblacin. Los ndices numricos que describen a las
muestras se denominan estadsticos.
La tcnica para seleccionar a los sujetos que entrarn a formar parte de la muestra se denomina muestreo. Siempre
que sea posible debe utilizarse el muestreo aleatorio porque nos da mayores garantas de que la muestra sea
representativa de la poblacin. Lo ms fcil es seleccionar una muestra suficiente en nmero (existen
procedimientos para calcular el nmero de sujetos necesarios) y representativa de la poblacin, que no est
sesgada.
La medicin, es uno de los problemas ms graves en Educacin y en Psicologa. Pensamos que nos estamos
enfrentando en muchas ocasiones a la medida de lo que se denominan constructos, es decir, caractersticas del ser
humano que no son directamente mensurables. Lo que medimos son las manifestaciones observables que
atribuimos a dichos constructos. As, por ejemplo, cuando medimos la inteligencia a travs de un test, lo que
medimos son las manifestaciones observables que tericamente atribuimos a la inteligencia, como la capacidad
verbal, numrica, abstracta, etc., que son ms fcilmente mensurables. Se sigue el mismo procedimiento para
medir el rendimiento acadmico, la memoria, la capacidad de resolucin de problemas, las aptitudes, las actitudes.
La Estadstica inferencial o inferencia estadstica pretende sacar conclusiones sobre el conjunto de datos a travs
de observaciones de parte de esos datos. Mediante ella, se pueden estimar parmetros y realizar contraste de
hiptesis. Es importante notar que se habla de estimacin y no de clculo de parmetros.
Dentro del marco de la Estadstica inferencial suelen distinguirse dos objetos de estudio: la estimacin de
parmetros y el contraste de hiptesis. Un parmetro se estima siempre a partir de un estadstico calculado en una
muestra. Hay dos tipos de estimacin: estimacin puntual y estimacin por intervalos. Bsicamente, en la
estimacin puntual se hace coincidir el estadstico con el parmetro, es decir, se escoge un solo punto (el
estadstico) para estimar el valor del parmetro. Por su parte, en la estimacin por intervalo se ofrece un intervalo
de puntuaciones en el cual es ms probable que se encuentre el valor del parmetro.
31
Por tanto, confiamos en que la muestra elegida sea una de las que el valor de su estadstico est cercano al valor de
, pero no lo podemos asegurar. Por esta razn, en inferencia siempre hablamos de nivel de confianza (porcentaje
de confianza al hacer la estimacin; tambin puede darse en probabilidad y se denomina 1- ) y del nivel de
significacin (probabilidad de error que estamos dispuestos a asumir en la estimacin). Obviamente, se trata de
conceptos complementarios que se refieren a lo mismo.
Al sacar la media de las muestras de 100 sujetos infinitas veces, su
distribucin muestral de la media ser la Campana de Gaus
La S de una distribucin muestral es el Error Tpico
Con muestras de 800 sujetos el disminuye A > muestra ser ms
pequeo.
4.2 Intervalo Confidencial: Para hallar el Intervalo Confidencial, es decir, los valores entre los cuales es ms
probable que se encuentre el verdadero valor del parmetro, necesitaremos calcular la , a la que sumaremos y
restaremos el Error Muestral; es decir, la diferencia ms probable entre el estadstico y el parmetro.
El Error Muestral nos da una idea de la precisin de nuestra inferencia estadstica. Cuanto ms grande sea el Error
Muestral, menor ser la precisin en la estimacin y menor ser la utilidad de la estimacin, para calcularlo
previamente hemos tenido que definir el Nivel de Significacin con el que vamos a realizar la estimacin, calcular
la puntuacin z correspondiente a ese nivel (porque la distribucin es normal) y aplicamos la frmula.
Una distribucin muestral tiene variabilidad, por tanto tendr su
propia Desviacin Tpica , que recibe el nombre de Error Tpico. Es
una medida de dispersin con respecto al parmetro, es decir, nos
indica la dispersin de las infinitas muestras aleatorias extradas
respecto a la . A > muestra disminuye por ello tambin
disminuye el E.M. As mismo en el EM hay que tener en cuenta el nivel de significacin escogido por el investigador
(normalmente = 0,05, que se corresponde a un nivel de confianza del 95%).
Ejemplo 1: Supongamos que hemos aplicado un test de cociente intelectual a una muestra aleatoria de 1.000 adolescentes, para estimar el
cociente intelectual medio de la poblacin de adolescentes.
N=1.000 ; =105; S=10.
Estimar el valor del parmetro (intervalo confidencial) con un nivel de confianza del 99%. IC = EM
Nivel de confianza 1 - = 99% 0,99
Nivel de significacin = 0,01 (error que asumimos) Por tanto, /2 = 0,005.
E.M. = Z(/2) al tener dos colas dejamos la mitad del error en cada lado de la campana
En la media = 105 se encontrara la puntuacin Z=0
Error Tpico = =
Buscamos el valor de Z (Columna C) que deja un rea de la parte menor de 0,005 (/2 ) de tal forma que Z/2 = 2,57
E.M. = Z(/2) = 2,57 0.32 = 0,82
El I.C. ser IC = EM = 105 0,82 dando dos lmites el lmite inferior de 104,18 y el superior de 105,82
Hay que tener en cuenta que si la Desviacin es sesgada la frmula de Error Tpico que se aplicar ser
=
en cambio si es insesgada (N-1 en la S) se coger =
0,32
33
4.3 Estimacin del parmetro media aritmtica para muestras pequeas: Cuando contamos con muestras
pequeas (N < 30), la distribucin muestral de la media sigue la distribucin t de Student. La distribucin t vara en
funcin del nmero de sujetos (y, en consecuencia, de los grados de libertad), aunque se trata tambin de una
distribucin simtrica y asinttica. Cuando N tiende a infinito, la distribucin t tiende a la distribucin z. Solo nos
cambia en este caso el estadstico para calcular el error muestral trabajaremos con t (/2), en lugar de trabajar
con z (/2), (ver tablas).
Ejemplo 2: Supongamos que hemos aplicado un test de cociente intelectual a una muestra aleatoria de 25 adolescentes, para estimar el
cociente intelectual medio de la poblacin de adolescentes.
N=25 ; =105; S=10.
Estimar el valor del parmetro (intervalo confidencial) con un nivel de confianza del 99%. IC = EM
E.M. = t(/2) al tener dos colas dejamos la mitad del error en cada lado de la campana
Error Tpico = =
Buscamos el valor de t en las tablas de distribucin de t de Student, debemos mirar en dos colas el valor de , buscamos en la 1
columna y al valor de N le restamos 1 (N-1 =24) es el grado de libertad. Obtenemos que t(/2) = 2,797
El I.C. ser IC = EM = 105 5,71 dando dos lmites el lmite inferior de 99,29 y el superior de 110,71
4.4. Estimacin del parmetro proporcin (): Es un caso particular del anterior, en el que la media oscila entre 0 y
1. En las variables dicotmicas ya vimos que p corresponde a la proporcin de unos y q a la
proporcin de ceros (q = 1-p). En este caso, la p viene dada por la frmula:
El intervalo de confianza se establece igual que en el
caso de la , pero ahora partiendo de una
proporcin. Se emplea el valor de z /2, al nivel de
confianza correspondiente.
El 68,8% y el 61,2 % de la poblacin estn de acuerdo con la
dacin al pago.
34
Para
muestras
pequeas
7.1 Significacin o significatividad estadstica: Hablamos de significacin estadstica cuando nos referimos al
significado de la diferencia entre dos medidas. Decimos tambin que un coeficiente de correlacin es
estadsticamente significativo cuando es distinto de cero, es decir, cuando el coeficiente de correlacin (estadstico)
es lo suficientemente grande como para decir que la correlacin en la poblacin (parmetro) de referencia es
distinta de cero. Si queremos conocer cul es su magnitud en la poblacin, entonces calcularemos el Intervalo de
Confianza.
Cuando estimamos el Intervalo de Confianza en el cual es probable que se encuentre la verdadera correlacin en la
poblacin, y este intervalo contiene el valor cero (ausencia absoluta de correlacin) diremos que dicha correlacin
NO es estadsticamente significativa. Hay que ser cuidadosos en
la interpretacin, cuando decimos que una correlacin no es
estadsticamente significativa:
Una correlacin no significativa simplemente es una
correlacin que no podemos generalizar.
Una correlacin no significativa no es prueba de no
relacin.
(NO PROBAR QUE HAY RELACIN PROBAR QUE NO HAY RELACIN)
35
8.
Si una universidad encuentra que el CI medio de sus estudiantes es de 110, y otra universidad lo tiene de 105, cmo
es la diferencia entre estas dos puntuaciones en la poblacin de referencia? La diferencia entre estas dos
puntuaciones es estadsticamente igual a cero? Si dicha diferencia es compatible con una diferencia igual a cero,
concluimos que ambas muestras tienen el mismo CI, al nivel de confianza fijado, y que la diferencia encontrada es
aleatoria.
Si establecemos el Intervalo de Confianza a partir del estadstico diferencia de medias, obtendremos los lmites
confidenciales entre los cuales es ms probable que se encuentre la diferencia de medias en la poblacin. Si este
intervalo incluye la puntuacin cero, entonces dicha diferencia es compatible con una diferencia de medias igual a
cero, y en consecuencia, podremos interpretar que dicha diferencia es estadsticamente igual a cero.
Al ser el intervalo
incompatible con el valor
cero, concluimos que la diferencia marcada es estadsticamente significativa, es decir, que las
diferencias de medias en CI entre ambos grupos no son aleatorias. Otra explicacin diferente del
ejemplo:
8.1 Estimacin del parmetro diferencia de proporciones (1 2): Lo nico que vara en este caso es el error tpico.
Al igual que en el contraste de medias, lo ms interesante suele ser la diferencia entre dos proporciones. El error
tpico de la diferencia de proporciones es:
Y la estimacin del intervalo de confianza y su interpretacin ser la misma que en el caso anterior, pero con
medias en trminos de proporcin, que frecuentemente se multiplican por 100 para convertirlos en porcentajes.
36
37
valor muestral y el hipotetizado segn H0, dicho de otra forma, el valor muestral obtenido una vez estandarizado
(Convertido en Z) y situado en una distribucin muestral que incluye infinitos valores de est cerca o lejos del
valor hipotetizado conforme H0? Cuanto ms lejos est el valor de del valor hipotetizado, ms grande ser el valor
de Z y en consecuencia, menor ser su probabilidad de aparicin si H0 es verdadera. El valor de Z nos indica dicha
distancia en nmero de errores tpicos.
La idea bsica de la PSHN es que el investigador asume un valor para la media pobacional desconocida hipotetizado,
despus obtiene una media muestral , y la evalua conforme a la distribucin de valores de que cabra esperar si
la H0 es verdadera. El investigador decidir si rechazar o no rechazar la H0 como inadmisible, dado el valor obtenido
de :
Cuando el valor de la es un valor que puede ocurrir probablemente por casualidad cuando la H0 es
verdadera entonces la decisin es No Rechazar la H0.
Si es improbable que ocurra por casualidad o azar cuando H0 es verdadera, el investigador puede decidir
rechazar la H0
Se estima que es improbable que ocurra por azar, dependiendo del valor de que hayamos establecido a priori, la
condicin de rechazo es: Rechazamos la H0 si p (t,Z, F)
Esta forma de actuar ha sido criticada especialmente porque en la investigacin real no se cumplen los supuestos
que rigen la lgica de la PSHN, en especial la ausencia de una poblacin claramente definida, la seleccin de una
muestra aleatoria y la realizacin de una nica prueba de significacin. En el campo de la Educacin conviene
plantearse los resultados obtenidos ms como evidencia acumulativa que como prueba irrefutable, ser de gran
ayuda recurrir a ndices complementarios como la magnitud del efecto.
3. NIVEL DE SIGNIFICACIN ESTADSTICA ERRORES TIPO I Y TIPO II.
El nivel de significacin , se conoce como error Tipo I: probabilidad de rechazar la H0 cuando es verdadera. Al
decidir si rechazamos o no la H0 puede ocurrir:
Decisin del
investigador
Rechazar H0
No Rechazar H0
Error Tipo I Rechazar la H0 cuando es verdadera Falso Positivo. Nos lleva a afirmar que un mtodo de
enseanza de matemticas es mejor que otro cuando lo cierto es que no hay diferencias en los resultados de
aprendizaje que producen. Estaramos afirmando que la diferencia de medias en el grupo experimental y el grupo de
control es lo suficientemente grande como para considerar que los grupos provienen de poblaciones con el
parmetro diferente, cuando la realidad es que la diferencia obtenida entre las medias es aleatoria, debida a
errores de muestreo y ambas muestras pertenecen a la misma poblacin.
Error Tipo II () No Rechazar la H0 cuando es falsa Falso negativo. Nos lleva a concluir que el nuevo mtodo de
enseanza de matemticas no eleva significativamente el rendimiento en matemticas de los alumnos cuando en
realidad produce mejores resultados que el tradicional. El error tipo II coincide con la probabilidad de no rechazar H 0
cuando esta es realmente falsa. El riesgo de cometer un error tipo II depende de: la muestra, el ms importante,
junto con el verdadero tamao de efecto en la poblacin y el propio valor de . Cuanto ms grandes sean cada uno
de estos tres valores, ms pequeo ser el error tipo II.
La potencia estadstica (1-) o Potencia de una prueba Probabilidad de rechazar la H0 cuando esta es realmente
falsa (Decisin Correcta). La potencia de la prueba se utiliza para conocer el tamao que tendra que tener nuestra
39
muestra si queremos alcanzar un determinado valor de , dado y un valor previsto para el tamao del efecto. Los
factores que reducen el error tipo II permiten elevar la potencia estadstica. Ejemplo: Si la potencia de una prueba
deseable es 0,80 = 0,20
Los investigadores desean mantener ambos errores tan bajos como sea posible, el valor terico del Error Tipo I lo
establece el investigador, entre 0,01 y 0,05. Al obtener un valor de nuestro estadstico de contraste (t,Z,F) que
estandariza las diferencias empricas encontradas podemos saber la probabilidad de obtener por efecto del azar una
diferencia tan grande como la obtenida, una probabilidad pequea o inferior a nos indica que sera muy
improbable que dicha diferencia sea aleatoria (podra darse el caso es un error posible pero improbable). Esto es
cierto mientras se cumplan los rigurosos supuestos para aplicar la PSHN. Si se violan el valor del error tipo I puede
ser mayor que el definido por el investigador.
La decisin sobre el valor que debemos dar a no es fcil, depender del tipo de variables que estn en juego,
aunque es poco frecuente utilizar valores superiores a 0,05, siendo una prctica comn utilizar el valor exacto de p.
4. LOS PASOS DEL CONTRASTE DE HIPTESIS
El proceso y la lgica de la investigacin cientfica parte de la definicin de un problema cientfico, tras la revisin del
estado de la cuestin, el investigador formula una hiptesis como solucin tentativa al problema. El paso decisivo
consiste en validar la hiptesis, realizando el contraste estadstico de hiptesis, un proceso bsico que deberemos
seguir para llegar a unos resultados fiables e interpretables.
4.1 Seleccin de una muestra aleatoria: para estudiar el efecto de un programa para la mejora en el rendimiento
lecto-escritor podemos realizar un diseo de dos grupos:
Se espera que la media en rendimiento del grupo sometido al tratamiento experimental sea superior a
la de control. El contraste unilateral puede ser:
o Derecho, cuando la diferencia esperada sea positiva llamada hiptesis unilateral derecha, ya que
la regin de rechazo de la H1 estar en el extremo derecho en torno a los valores altos.
o Izquierdo, cuando la diferencia esperada sea negativa llamada hiptesis unilateral izquierda (la
regin de rechazo estar en el extremo izquierdo de la distribucin muestral en torno a los
valores bajos.)
Bilateral (bidireccional o de dos colas): cuando esperamos que haya diferencias entre los dos grupos
pero no sabemos a favor de cual. Se podra formular: Existen diferencias estadsticamente significativas
entre las medias aritmticas de los grupos en rendimiento lecto-escritor en funcin del programa
utilizado. Este contraste es ms exigente porque implica repartir la probabilidad de error entre las dos
colas de la distribucin, haciendo dividir por dos el valor de .
H1 : Exp - control 0
H1 : Exp control
4.3 Eleccin del valor de alfa () o nivel de significacin: se habla de valor nominal de alfa porque es el investigador
el que lo nomina, establece este valor como umbral para permitir un juicio sobre la significacin estadstica de las
diferencias. Los ms utilizados son 0,05 y 0,01, el investigador por las caractersticas de su estudio y sus
repercusiones, puede necesitar reducir al mximo el error tipo I y establecer valores inferiores como = 0,001 o
tambin en investigaciones con muestras pequeas puede decidir utilizar un =0.1.
4.4 Determinacin de la distribucin muestral y la regin de rechazo: Punto clave en la comprensin y acierto en la
decisin estadstica. En un paso previo al contraste estadstico, habremos apuntado el diseo de investigacin, que
puede tratarse de un diseo experimental de dos grupos. En este tipo de diseo para muestra grande la prueba
estadstica de contraste es la z o la t de Student.
Si elegimos la Z (muestras de ms de 30 sujetos) responde a una distribucin normal, en un contraste de dos grupos
el estadstico Z nos estandariza las diferencias entre las medias de los grupos con respecto a una diferencia igual a 0,
respecto a la diferencia hipotetizada en la H0 (H0 : Exp - control = 0). Si dibujramos la distribucin normal conforme a
H0 estara formada por los infinitos valores de exp - control obtenidos en infinitas muestras aleatorias extradas de la
misma poblacin que toma la forma de la curva normal.
Si la H0 es verdadera, la mayora de las diferencias seran igual o prximas a 0, disminuyendo la altura de la curva
segn nos alejamos del cero. Esta distribucin muestral indicara la No Existencia de Diferencias Estadsticamente
Significativas. Es una distribucin muestral que indica que todas las diferencias encontradas entre dos sucesos se
deben al azar.
La distribucin muestral tiene una desviacin tpica que se denomina Error Tpico , podemos saber cuntas
desviaciones tpicas se alejan nuestra puntuacin emprica de la media de la distribucin. El estadstico de contraste
Z nos indica cuantos errores tpicos se desva nuestra diferencia de medias de una diferencia de medias igual a 0 o
menor que el definido por el investigador, diremos que es lo suficientemente improbable para considerar que
dicha diferencia no es aleatoria sino que se debe a otro factor distinto del azar y que atribuimos generalmente a la
variable Independiente.
La regin de rechazo de H0 estar formada por todos los valores del estadstico de contraste cuya probabilidad de
aparicin asociada sea menor o igual que o /2 si es contraste bilateral. Rechazamos la H0 si p (t,Z, F) . Esta es
la esencia del contraste estadstico de hiptesis, algunos autores para tomar la decisin estadstica comparan el
valor del estadstico emprico de contraste (el que obtienes al aplicar la formula de Z, t o F) con el llamado valor
crtico del estadstico que es el valor correspondiente al nivel de significacin. Ejemplo: para un contraste bilateral
con = 0,05 y /2 = 0,025 le corresponde un valor crtico de Z de 1,96, quiere decir que si nuestro estadstico es
mayor que 1,96 rechazaremos la H0.
41
4.5 Utilizacin del valor exacto de p: El valor de se establece a priori, antes de calcular la probabilidad asociada al
estadstico de contraste, p es la probabilidad exacta asociada al estadstico de contraste obtenido a posterior. Indica
la probabilidad de obtener un valor tan extremo o ms que el valor observado obtenido al calcular el estadstico de
contraste (Z, t, F) asumiendo que la H0 es verdadera.
Mediante el nivel de significacin, llegamos a una decisin binaria, rechazamos o no la H0. Con el valor exacto de p
damos una informacin ms precisa, nos dice si es mayor o menor que el nivel de significacin y adems la
probabilidad exacta de obtener un valor igual o superior al observado si la H0 es verdadera. Nos permite juzgar si
hubiramos podido rechazar H0 en caso de que se hubiera elegido un ms exigente. Muchas revistas de
investigacin de educacin exigen a los autores informar del valor exacto de p en sus artculos.
5. ERRORES FRECUENTES EN LA UTILIZACIN E INTERPRETACIN DE RESULTADOS DE LA PRUEBA DE
SIGNIFICACIN DE LA HIPOTESIS NULA.
La PSHN se basa en la asuncin de una serie de condiciones:
Se ha realizado un muestreo aleatorio de N observaciones.
Las puntuaciones de la variable dependiente son cuantitativas y su nivel de medida es al menos de intervalo.
La distribucin de la variable dependiente es normal
El investigador debe seguir rigurosamente los pasos definidos para la comprobacin de la hiptesis.
El investigador debe realizar solo uno o un nmero limitado de contrastes en el mismo estudio.
En la prctica de la investigacin educativa los investigadores violan dichos supuestos afectando gravemente al error
tipo I elevndolo por encima del alfa nominal. El investigador educativo debe conocer los supuestos que se deben
cumplir para contrastar la H0 as como lo que de hecho se hace en la prctica de la investigacin educativa y los
efectos de dicha prctica a la hora de interpretar los resultados. Las investigaciones en educacin raramente
pueden obtener una muestra aleatoria de una poblacin bien definida, as se incumple una de las condiciones
fundamentales para tomar de referencia la distribucin muestral conforme a H0. Esta limitacin debe estar reflejada
en los artculos, su incumplimiento puede invalidar el proceso de contraste de hiptesis, debemos definir la
poblacin de referencia y procurar que la muestra sea representativa de dicha poblacin, si queremos realizar
inferencias posteriores. Se habla de una hipottica poblacin de referencia de sujetos similares a los de la muestra
de investigacin, muestra que es incidental o de conveniencia.
Otro error frecuente es no tener en cuenta la repercusin de realizar un gran nmero de contrastes en un mismo
estudio. Por ejemplo, hemos aplicado una escala de actitudes de 100 tems y queremos ver si en cada uno de ellos
hay diferencias, entre las medias obtenidas entre hombres y mujeres, solo por error de muestreo sera esperable,
supuesto un = 0,05 (que en 5 de esos 100 contrastes obtuviramos una diferencia de medias significativas cuando
en realidad no la hay), tendramos un riesgo inflado de error tipo I. Existen procedimientos para estimar el nuevo
que deberamos considerar al aumentar el nmero de contrastes como el de Bonferroni.
Para reducir algunas de las complicaciones se realizan diversas prcticas como la Replicacin del Estudio, que est
dirigida a conseguir mayor grado de certeza en las evidencias obtenidas en una lnea de investigacin, es necesario
que otros grupos de investigacin utilizando nuevas muestras y repitiendo el estudio lleguen a la misma decisin
estadstica, produciendo as evidencias ms conclusivas y reduciendo la posibilidad de error tipo I. El mtodo de la
Validacin cruzada supone obtener de nuestra muestra de estudio una submuestra utilizando un porcentaje
determinado de la muestra inicial.
Es necesario ser conscientes de las graves implicaciones del no cumplimiento de los supuestos para realizar el
contraste estadstico de hiptesis, debemos ser ticos a la hora de hacer nuestros estudios y comunicar los
resultados de los mismos, y saber ser crticos con los resultados.
42
43
Otra interpretacin, si consideramos: La menor como el valor que representa al sujeto medio del grupo 1 y la
mayor como el valor que representa a un sujeto medio del grupo 2. Suponiendo que ambos sujetos medios
pertenecen a grupos que se distribuyen segn la curva normal, si el valor de d = 0,5, podemos decir que el sujeto
medio del Grupo 2 esta media desviacin tpica (0,5) por encima que el sujeto medio del grupo 1. En las tablas de
la curva normal, vemos que una z= 0.5 le corresponde un rea hasta la media de p=0,1915 lo que puede
interpretarse: un sujeto medio del grupo 2 supera en 19 percentiles (19,15%) al sujeto medio del grupo 1.
Otra forma de interpretar es mediante una Correlacin Biserial Puntual, la variable X sera dicotmica, pertenecer a
uno de los dos grupos, la Y sera continua, la media de la VD. La interpretacin es la misma que un coeficiente de
correlacin rbp, transformamos la t de student en otro valor que nos da la idea de la fuerza de la relacin entre la VI y
la VD y nos permite comparar tambin los resultados en distintos estudios.
Es importante combinar los resultados de la significacin estadstica y el tamao del efecto, de esta forma
valoraremos con ms precisin los resultados, adems ser consciente de que pueden obtenerse resultados
contradictorios, rechazar la H0 y un obtener un tamao del efecto poco relevante (sucede en muestras muy grandes)
o aceptar la H0 y obtener un tamao del efecto muy relevante (muestras pequeas).
7. CONTRASTE DE HIPTESIS EN LOS DISEOS DE DOS GRUPOS
En la investigacin, puede interesar conocer los efectos de una variable, la independiente en otra que recibe su
influjo, dependiente.
Variable Independiente: Caracterstica que el investigador observa o manipula deliberadamente para
conocer su relacin o influencia sobre la VD, en una relacin causal la VI es la causa y la VD el efecto. La VI
es el estmulo, el tratamiento o la situacin experimental.
Variable Dependiente: Caracterstica cuyas variaciones se espera que se produzcan por efecto de la VI, son
observables y medibles, tambin llamada variable de medida.
Variable de control, Moderadoras o Controladas: aquellas que sabemos que tienen influencia en la VD y
controlamos para que los cambios que se produzcan en la VD los podamos atribuir en la VI.
Variable Extraa: Las que intervienen en el experimento pero se escapan al control del investigador.
Se busca saber si es cierta la relacin Causa - Efecto VI VD.
Ejemplo: Conocer si un mtodo de enseanza (VI) es eficaz para conseguir mejor rendimiento en matemticas
(VD).
Para resolver este problema es mediante el diseo de dos grupos uno experimental (aplico el tratamiento) y
otro de control (no se le aplica, se usa como comparacin).
Despus de aplicar el tratamiento, controladas el resto de variables intervinientes se comparan los grupos en
la VD para ver si la VI produce o no efectos en la VD.
Entendemos por el Diseo: el plan (Esbozo del proyecto), estructura (esquema) y estrategia (recogida y anlisis de
datos) de investigacin concebidos para obtener respuesta a las preguntas de investigacin y controlar la varianza
de la VD, que causas producen las variaciones. Hay dos tipos Bsicos:
Experimental: aquellos en los que existe manipulacin y control de la VI, cuando se aplica un tratamiento
que el investigador ha establecido sus caractersticas y condiciones. Hay una seleccin aleatoria de sujetos a
partir de los sujetos de la poblacin y seleccin aleatoria en la asignacin de los tratamientos a los grupos.
(Trabajo)
No Experimentales, ExPost-Facto o Correlacionales: los que no tienen manipulacin ni control de las VI
porque ya acontecieron sus manifestaciones o por ser intrnsecamente no manipulables. No puede haber
grupo Experimental y Grupo de control, solo se comparan las medias en funcin de una variable de
clasificacin que ya ha acontecido. Las variables son no manipulables. En estos casos las inferencias sobre
las relaciones entre la VI y la VD se hacen a partir de la variacin comn de las mismas por lo que no se
puede hablar de causa efecto (Ejemplo: Diferencias entre Repetidores y Nuevos alumnos)
44
Plan: Esbozo general del proyecto incluye la formulacin de la hiptesis hasta el anlisis de los datos.
45
Al tener un I.C. = +0,89 - +3,79 es todo positivo, no tiene el 0, por tanto la diferencia de medias es estadsticamente significativa.
Rechazamos la H0 si t emprica > t crtica 4,33 > 2,82
t emprica =
= 4,33
p (t emprica) 0,001 0.01 (para buscar la p (t emprica) miro la columna de puntuacin tipificada 4,33 y veo que alfa vale 0,001)
46