Está en la página 1de 46

TEMA 1: LA ESTADSTICA EN EL PROCESO DE INVESTIGACIN PEDAGGICA EMPRICA.

1. INTRODUCCIN:
Son muchas las razones que justifican la presencia de la Estadstica en la Educacin:
Comprender los trabajos que se publican en revistas cientficas, libros, informes, etc.
Entender los procesos implicados en la investigacin operativa que hacen posible la inferencia desde la
muestra a la poblacin, y conocer qu garantas nos ofrecen estas decisiones.
Facilitar el propio desarrollo de la investigacin socio-educativa.
2. CONCEPTO Y FUNCIONES DE ESTADSTICA:
Estadstica como Conjunto de Nmeros: Conjunto de datos numricos (p.ej. Censos)
Estadstica como Ciencia:
o Estudio de los fenmenos aleatorios
o Mtodos, tcnicas y modelos que ayudan en la resolucin de problemas pedaggicos y en la toma
de decisiones
Definicin de Estadstica: Kerlinger (1985): teora y mtodo de analizar datos cuantitativos obtenidos de muestras de
observaciones, para estudiar y comparar fuentes de varianza de fenmenos, ayudar a tomar decisiones sobre aceptar
o rechazar hiptesis entre los fenmenos y ayudar a hacer inferencias fidedignas de observaciones empricas.
Ofrece las siguientes posibilidades:
Calcular la media de los grupos.
Establecer el grado de variabilidad de las observaciones.
Representar grficamente, mediante tablas y figuras, los grupos o los sujetos individuales.
Transformar los datos para compararlos (centiles, puntuaciones tpicas,)
Calcular fiabilidades y valideces de los instrumentos de recogida de datos.
Extrapolar los resultados de muestras representativas a grupos ms amplios (poblaciones)
Comparar dos o ms grupos y establecer la existencia o no de diferencias significativas.
Funciones de la Estadstica:
Facilitar el manejo de datos amplios y dispersos: reducir un conjunto de datos a ndices o estadsticos
(media, mediana, desviacin tpica, correlacin, etc...) E. Descriptiva
Inferir desde la muestra a la poblacin: desde los estadsticos (procedentes de muestras suficientes y
representativas) se pueden estimar los parmetros (medidas de poblacin) E. Inferencial
Ayudar en la toma de decisiones: existen diferencias significativas entre los grupos de tratamiento?
3. TIPOS DE ESTADSTICA:
Estadstica Descriptiva:
Descripcin grfica y numrica de los conjuntos de datos: Transforma un conjunto de nmeros u
observaciones en ndices que sirven para describir o caracterizar esos datos dentro de los grupos de sujeto.
Ofrece una visin global del grupo de sujetos objeto de estudio.
No aporta suficientes argumentos cientficos en la toma de decisiones sobre los grupos.
Fox (1981) seala cinco funciones principales:
o Conocer los estadsticos de un conjunto de datos.
o Interpretar lo que nos dicen los estadsticos muestrales sobre los parmetros de la poblacin.
o Conocer la existencia, el sentido y la magnitud de la relacin entre dos variables.
o Explorar la relacin entre dos variables.
o Predecir las tendencias en el comportamiento de nuevos grupos.
1

Por la naturaleza de la muestra y los datos:


o Estadstica descriptiva Univariada (una sola variable) media, mediana, varianza.
o Estadstica descriptiva Bivariada (correlacin de dos variables)
o Estadstica descriptiva Multivariada (ms de dos variables)

Estadstica Inferencial:
Finalidad: la obtencin de una serie de conclusiones sobre algn aspecto o variable presente en una
poblacin a partir de las observaciones de comportamientos en una o varias muestras
Interviene y decide sobre aquellas cuestiones no resueltas por la E. Descriptiva
Trata de extrapolar los resultados que se han obtenido en muestras a las poblaciones respectivas de las que
proceden.
Se ocupa de los mtodos estadsticos que nos sirven para realizar inferencias objetivas sobre los datos
disponibles y trasladarlos a grupos ms amplios.

Nivel de confianza las decisiones que se adoptan en la investigacin socioeducativa no se pueden realizar en
trminos de certeza, sino de probabilidad. Por ello:

Campos de la Estadstica inferencial:


o Estimacin de parmetros:
Puntual un solo valor de la muestra pasa a ser parmetro de la poblacin.
Por intervalos entre unos lmites entre los cuales se espera que se encuentre el verdadero
valor del parmetro. Los lmites son determinados por los errores sistemticos y aleatorios.
Contraste de hiptesis: mediante datos empricos se aprueban o descartan las hiptesis
planteadas en la investigacin. Toma de decisiones a partir de los datos empricos sobre la
aceptacin o rechazo de las relaciones previstas en la hiptesis (=tentativa de solucin) 1 se
formula la hiptesis y 2 se somete a prueba.
2

4. EL PAPEL DE LA ESTADSTICA EN EL PROCESO DE INVESTIGACIN:


1. En el problema de la investigacin
Identificacin y seleccin del problema como garanta de poder establecer
relaciones entre las variables que se analizan.
La Estadstica nos permite afirmar que el problema sea resoluble (que se
puedan recoger datos para alcanzar las respuestas esperadas).
2. En la formulacin de hiptesis y objetivos
Las hiptesis han de ser contrastables y los objetivos comprobables.
Nos permite conocer qu estadsticos deben ser calculados.
Determinar si la hiptesis ha de ser unilateral bilateral:
o Bilateral: existen diferencias entre los grupos
o Unilateral: un grupo es ms que el otro (una sola opcin)
3. En el control de variables extraas
Seleccionar sujetos de la muestra en funcin de las caractersticas del control.
Garantizar el control supone minimizar los efectos de las covariaciones y la
influencia de variables extraas que pudieran ofrecer explicaciones alternativas.
4. En la definicin de las variables. Como ejemplo: la motivacin que reciben los estudiantes influir de forma
positiva sobre el rendimiento alcanzado en una determinada asignatura: Vi la motivacin (la manipula el
experimentador) y Vd el rendimiento (se mide en el experimento mediante test):
La estadstica nos ayuda a definir de forma operativa las Vi y nos indica la forma en que deben medirse y
valorarse.
Determinar la fiabilidad y validez de los instrumentos de recogida de datos y de medida.
Expresar y valorar los errores de medida que cometemos al medir y estimar indirectamente las variables,
para tenerlos en cuenta y desecharlos de los resultados.
5. En el contraste de hiptesis o comprobacin de los objetivos.
Tenemos una amplia gama de pruebas estadsticas a eleccin del investigador. Su idoneidad y validez
quedan sujetas al rigor y la veracidad de los datos.
o Paramtricas medidas precisas y curva normal en la poblacin
o No paramtricas resto de casos
6. En la decisin estadstica:
La decisin estadstica es tratar de utilizar los datos obtenidos a partir de una muestra para tomar decisiones
sobre la poblacin.
Se obtiene un determinado valor emprico del estadstico empleado, que ser diferente segn la prueba
estadstica que hayamos empleado.
Se interpreta este valor en el sentido de si las diferencias entre los grupos son reales y debidas a la situacin
experimental y por tanto, no son aleatorias; o si son debidas al azar, esto consiste en decidir si la Ho se
rechaza y se acepta la H1.
o Ho hiptesis nula no hay diferencias significativas entre los grupos
o H1 hiptesis alternativa si hay diferencias significativas entre los grupos y no son debidas al
azar. Regla general :
Si (valor emprico) que el (valor terico crtico) rechazo Ho
Valor emprico se mide en la muestra.
Valor terico en las tablas, con el % de nivel de confianza.

5. LA ESTADSTICA Y SU RELACIN CON LAS CIENCIAS SOCIALES.

6. POSIBILIDADES Y LIMITACIONES DE LA ESTADSTICA


As, la Estadstica nos ayudar en la decisin de rechazar las hiptesis de nulidad (H0), pero las garantas que han
conducido a este punto deben ser revisadas y controladas, es decir, no podemos olvidar que sin un buen control
sobre las variables extraas, podemos estar considerando que los cambios generados son achacables a una variable
independiente (Vi), cuando en realidad han sido otros factores o variables no controladas las que han generado los
cambios

TEMA 2: PROBLEMA, HIPTESIS/OBJETIVOS, VARIABLES Y DATOS. NIVELES DE MEDIDA.


1. EL PROBLEMA DE INVESTIGACIN:
En la gran mayora de los casos se parte de una idea general que despus se va perfilando hasta llegar a configurar el
problema concreto de investigacin. La aparicin de un problema, para el que no encontramos una respuesta
satisfactoria, viene condiciono por:

La existencia de una Laguna Notoria en los resultados de otras investigaciones que hace que las
aportaciones no sean suficientes.

La no constancia entre los resultados aportados por diferentes trabajos, pues las soluciones parecen no
coincidir cuando existen muestras de sujetos diferentes.

La existencia de un hecho para el que no tenemos una adecuada explicacin y resulta difcil su comprensin
en el contexto de actuacin.

La caracterstica fundamental de los problemas que nos podemos platear en el campo socioeducativo consiste en la
posibilidad de su resolucin, es decir: Evitar los problemas de ndole moral y espiritual que entran dentro del ser de
la persona y formular problemas sobre los cuales podamos estudiar comportamientos, analizar hechos y evaluar
resultados.
Definicin y eleccin del tema de investigacin: Segn Garca de la Fuente (1994), en el momento de elegir el tema
sobre el que se va a trabajar, influyen dos tipos de elementos:
1. Subjetivos: es necesario que el tema sea elegido de forma libre por el investigador y que se sienta
identificado con el mismo. Es interesante que el problema mantenga vnculos con la actitud personal actual
o de futuro y tener un buen manejo de las tecnologas as como de lenguajes.
2. Objetivos: el investigador debe tener la posibilidad de acceso a las fuentes documentales con posibilidad de
traslado a la zona donde ocurren los hechos.
La caracterstica bsica de todo problema es la posibilidad de resolucin. Conseguir una buena formulacin supone
tener muy avanzada su posible solucin, por eso:
Kerlinger (1985) indica que una gran parte de la solucin reside en saber qu es lo que se intenta hacer. Un
buen planteamiento es la mitad de la solucin.
Fox (1981) seala que de la existencia de la idea original o impulsora del problema se debe pasar a realizar
una primera revisin de la bibliografa relacionada con el mismo y as, con estos datos, definir de forma ms
precisa el problema de investigacin.
Estructura y caractersticas del problema: Para completar la visin del problema hemos de indicar una serie de
caractersticas, siguiendo las directrices de Hernndez Pina (1998), se pueden concretar en las siguientes:
Factible: indica que existen medios apropiados para investigar y que puedan ser empleados por el
investigador.
Claro: se entiende que todos los trminos incluidos en la formulacin estn perfectamente definidos y son
comprensibles, tanto para el investigador como para el sujeto, que es el objeto de investigacin.
Significativo: nos indica el nivel de importancia del problema para la comunidad educativa en la que se lleva
a cabo, supone la valoracin del problema en un contexto determinado.
La formulacin de la pregunta: debe reflejar la descripcin, la asociacin o la intervencin.
Este ltimo punto ya nos orienta sobre el tipo de investigacin para resolverlo:
Investigacin Descriptiva: descripcin.
Investigacin Correlacional: asociacin entre variables.
Investigacin Experimental o Cuasiexperimental: intervencin.
5

Una vez formulado el problema, podemos evaluarlo siguiendo los siguientes criterios: viabilidad, inters, relevancia
terica y prctica, coherencia y adecuacin al contexto.
2. LA REVISIN DE FUENTES Y EL ESTADO DE LA CUESTIN:
Una vez planteado el problema objeto de investigacin, es necesario efectuar una serie de consultas a diferentes
fuentes para conocer qu se ha dicho y cmo, sobre ese tema; necesitamos saber si ya se ha solucionado en otras
investigaciones y con qu resultados o, por el contrario, debemos abordarlo desde la novedad.
Para Fox debemos diferenciar entre la bibliografa de la investigacin (informes sobre trabajos ya realizados, con
aportaciones de datos empricos, orientaciones y sugerencias, recomendaciones) y la bibliografa de tipo
conceptual (referida a los textos, artculos, informes).
Fuentes y Bases de Documentacin: Podemos clasificarlas en dos grupos:
1. Fuentes bibliogrficas: centradas en los textos escritos.
Obras generales: enciclopedias, diccionarios
Publicaciones bibliogrficas peridicas: anuarios, informes
Revistas de investigacin especializadas.
2. Fuentes no bibliogrficas:
Recursos informticos: correos, buscadores, revistas electrnicas
Centros de investigacin en educacin: el IBE recoge una lista de estos centros.
Centros de documentacin: especializados en un mbito determinado.
Asociaciones de investigacin en educacin: difusin con revistas digitales.
3. HIPTESIS Y OBJETIVOS DE LA INVESTIGACIN:
Una vez concretado el problema y revisadas las fuentes, el investigador est en condiciones de aventurar posibles
soluciones al mismo: la HIPTESIS.
Se emplean en el mbito experimental y cuasiexperimental, para probar el establecimiento de relaciones
causales entre las variables.
En las investigaciones descriptivas o correlacionales se emplean objetivos de investigacin, ya que son los
datos los que establecen a posteriori las relaciones y dependencias entre las variables.
Concepto y Naturaleza de las Hiptesis: La hiptesis es una proposicin o conjunto de proposiciones no
demostradas, cuyo anlisis puede llevar a una conclusin lgica, que debe ser sometida a comprobacin emprica.
Bunge (1981) marca tres requisitos en la formulacin de hiptesis:
1. Tiene que ser bien formada y significativa.
2. Fundamentada en los conocimientos previos.
3. Empricamente contrastable.
4. Aadimos un cuarto requisito para completar el concepto, que se establezcan relaciones causales entre las
variables: antecedentes (que manipula el experimentador) y consecuentes (que reciben los efectos de la
manipulacin).
Caractersticas de una hiptesis bien formulada:

Bien fundamentada: proviene de una profunda revisin de fuentes.


Contrastable: susceptible de ser sometida a una prueba emprica; y a un juicio pblico e intersubjetivo.
Establece relaciones causales entre las variables.

Conclusin: las hiptesis son los elementos directivos de la investigacin cientfica, pues nos indican qu buscamos,
qu variables se deben observar, medir y manipular; as como sobre la realizacin de la observacin, la
experimentacin y el anlisis de datos.
En algunas investigaciones nos encontramos con los trminos:

Objetivo o propsito general: el marco general de la investigacin, lo fundamental del trabajo.


Objetivos operativos: se recogen de forma ms concisa los puntos principales, de tal forma que se expresan
las tareas que debe realizar el investigador.

Diferentes Tipos de Hiptesis:


Segn la Posibilidad de Generalizacin:
Existenciales: al menos un caso.
Universales: vlidas para todos los casos.
Probables: determinados casos.
Segn su forma de Expresin Cuantitativa:
Sustantiva ( cientfica). Puede ser:
o Inductiva: derivada de la observacin y la experiencia.
o Deductiva: derivando de la teora, se constata sta en la prctica.
Estadstica: se establece una diferencia o relacin entre los parmetros poblacionales, que debe ser
comprobada empricamente:
o Ho (hiptesis nula): no hay diferencias.
o H1 (hiptesis alternativa): s hay diferencias significativas.
En forma genrica (bidireccional).
En una de las opciones (unidireccional).
Segn el nivel de aproximacin a la realidad.
Operacional (en trminos observables).
Conceptual.
Segn el nmero de variables y sus relaciones.
Hiptesis Descriptiva de una sola variable.
Hiptesis Descriptiva con dos o ms variables y relacin de asociacin.
Hiptesis con 2 o ms variables y relacin de dependencia.
4. DEFINICIN OPERATIVA DE LAS VARIABLES:
Variable, es aquella caracterstica que admite diversos valores, es decir, dos o ms modalidades; mientras que
constante es un valor numrico que no cambia en un contexto determinado.
Tipos de Variables:
Segn el Nivel de Medida:
1. CATEGRICAS O ATRIBUTIVAS: Hacen referencia a caractersticas de los sujetos que no se pueden
cuantificar.
Cuando la variable solo admite dos categoras, se la denomina DICOTMICA (sexo, si/no,
verdadero/falso).
Cuando la variable admite ms de dos categoras, se la denomina POLITMICA.
2. CUALITATIVAS: Son aquellas que permiten establecer rangos o posiciones en las medidas, pero no ser
posible establecer diferencias numricas. (Escala observacional).
3. CUANTITATIVAS: Admiten medida numrica en la cuantificacin de una determinada cualidad. Pueden ser:
DISCRETAS: solo admiten nmeros enteros en su definicin. (N sillas).
CONTINUAS: pueden admitir un nmero infinito de valores de la caracterstica que medimos, entre
dos valores dados cualesquiera. (Peso).
7

Segn el Enfoque Metodolgico:


1. DEPENDIENTES (Vd): Reciben los efectos de la intervencin sobre la variable independiente (Vi). Los valores
que alcance la Vd dependern de la Vi, por ello refleja la consecuencia de los cambios que se han producido
2. INDEPENDIENTES (Vi): Son aquellas en las que interviene o acta el investigador, con el fin de analizar su
influencia sobre la Vd. Debe ser una variable experimental y controlada.
3. EXTRAAS O INTERVINIETES (Ve): Variables que estn presentes en el experimento y que deben ser
controladas para evitar la contaminacin de los resultados finales.
Segn el contexto Terico Explicativo:
1. ESTMULO: Engloban dentro de si todas aquellas condiciones externas al sujeto que pueden ser objeto de
intervencin por parte del investigador, afectan al comportamiento del individuo.
2. RESPUESTA: Reflejan el comportamiento manifiesto de los sujetos ante determinadas intervenciones.
3. INTERMEDIARIAS: Conjunto de variables que no son objeto de investigacin si bien estn presentes y
pueden hacer variar los resultados previsibles.
Definicin operativa de variables: implica que el concepto analizado debe ser definido en funcin de las acciones u
operaciones que son precisas para poder medirlo y actuar sobre l. Es la traduccin de los conceptos tericos al
lenguaje emprico, en otras palabras, la sustitucin de lo que no se puede observar por aquello accesible a la
observacin y los instrumentos de medida. Por ejemplo: La autoestima influye en la creatividad.
5. LA RECOGIDA DE DATOS Y SU CALIDAD:
Fox nos recuerda que la calidad de la investigacin viene condicionada expresamente por la calidad de los mtodos
utilizados para recoger y analizar los datos. El investigador puede optar por la modificacin parcial, la eleccin de
otro distinto o la construccin de uno nuevo. A veces es preciso recurrir, en una misma investigacin, a varios
instrumentos complementarios: de medida, de evaluacin o de observacin entre otros.
Criterios para la seleccin y elaboracin de los instrumentos de recogida: Para recoger los datos necesarios
necesitamos aplicar las tcnicas e instrumentos adecuados. La calidad de la investigacin viene condicionada por la
calidad de los instrumentos y la calidad de los datos.
Para tomar la decisin en la Seleccin de Instrumentos tendremos en cuenta:
Identificacin del rasgo o caracterstica: qu evaluar.
Tipo de validez empleado: usar el instrumento de medicin correcto.
Tcnica de fiabilidad: identificada con la precisin de la medida.
Caractersticas de la muestra: con qu se valid la prueba.
Niveles de fiabilidad y validez: se exigen niveles altos.
Otros criterios secundarios: como el tiempo, comprensin, tems, coste econmico...
Aquellos casos en los que se deba proceder a la Elaboracin de Instrumentos, la tarea es ms exigente que la
seleccin, por ello tendremos en cuenta:
Identificacin clara y concisa: nos conduce a una definicin operativa de ste en forma de conductas o
manifestaciones observables y evaluables.
Conocer los objetivos a conseguir.
Seleccionar los tems o elementos ms apropiados.
Formular los tems o elementos con precisin.
Ordenar los tems de forma apropiada.
El tiempo preciso para responder: duracin.
Respuestas que debe dar el sujeto: unvocas y registrarse con facilidad.
Aplicacin piloto: ensayo de prueba para delimitar los posibles fallos o errores.

Datos y sus niveles de medida: Debemos procurar una buena calidad de los datos. Los niveles de medida vienen a
reflejar de una forma ntida la gradacin existente en la informacin recogida, hay varios niveles:

NIVEL NOMINAL:
Nivel de medida muy pobre, asigna nmeros o smbolos.
El n no tiene valor operativo, seala la pertenencia o no a esa categora.
Operaciones de =; y de equivalencia.
No se trabaja con los nmeros, sino con sus frecuencias de aparicin.
Moda, frecuencia, coeficiente de asociacin (C) o de contingencia, la prueba .

NIVEL ORDINAL:
Utiliza valores de > o < con los que puede establecerse una escala ordenada de las categoras en
forma decreciente o creciente.
La distancia entre dos posiciones o rangos sucesivos no es comparable, por no disponer de una
unidad de medida.
Es el nivel de medida de ms amplio uso en ciencias sociales.
No nos interesa el nmero en s, sino la posicin (rango) que ocupa el grupo.
Todos los datos procedentes de la observacin, de variables de tipo cualitativo y aquellos
conseguidos con instrumentos poco precisos, se consideran datos ordinales.
Mediana, correlacin de Spearman, las pruebas estadsticas no paramtricas.

NIVEL DE INTERVALO:
Adems de las caractersticas de la ordinal, se aade la igualdad de distancia o intervalo entre dos
valores cualesquiera consecutivos; es decir, existe una unidad constante de medida.
Nivel cuantitativo de datos, por lo que usamos directamente las puntuaciones alcanzadas por los
sujetos en la Vi.
X; s; correlacin de Pearson y todas las pruebas estadsticas denominadas paramtricas, siempre que
cumplan las condiciones para ello.

NIVEL DE RAZN O PROPORCIN:


A todas las caractersticas descritas aadimos la existencia de cero absoluto; es decir, la no presencia
del atributo o propiedad medida.
En esta escala podemos ordenar elementos, establecer diferencias entre los mismos y emplear
razones matemticas.
Solo aparece en variables fsicas como el peso, la longitud, la temperatura, etc.
Media geomtrica y el coeficiente de variacin.

TEMA 4: ORGANIZACIN DE DATOS. ANLISIS EXPLORATORIO DE DATOS:


1. INTRODUCCIN:
En esta parte pasamos ya de los grandes principios conceptuales a la prctica, a la parte emprica: la recogida de
datos y su primera ordenacin.
Cmo proceder a la organizacin de los datos recogidos con nuestros instrumentos de medida? Entramos en el
terreno de la Estadstica Descriptiva.
La Estadstica Descriptiva comienza con un conjunto de datos: el investigador intenta trasladar las caractersticas
esenciales de los datos a formas ms interpretables: distribuciones de frecuencia, grficos; y calcula ndices
numricos como promedios, percentiles y medidas de variabilidad. Johnson y Christensen (2008: 465).
Adems de organizacin de datos, hablaremos de anlisis exploratorio de datos: el investigador observa y describe lo
que sucede en la realidad; sin entrar en ningn contraste de hiptesis.
2. DE LA DEFINICIN DEL PROBLEMA Y LAS VARIABLES A LA OBSERVACIN Y RECOGIDA DE DATOS:
Uno de los errores ms frecuentes de los investigadores es recoger datos sin seguir adecuadamente los pasos del
proceso de investigacin. Por eso es fundamental, antes de iniciar cualquier estudio, tratar de dar respuesta a todas
las fases del proceso de investigacin.
Una vez hecho esto, se procede a realizar la recogida datos - de la informacin, es decir, atribuir valores a las
variables que son objeto del estudio. Para ello necesitamos algn procedimiento que nos permita asignar dichos
valores (nmeros, rangos, categoras) a las variables conceptuales: necesitamos un instrumento de medida
adecuado y una regla de medida bien definida.
Ejemplo: Estudiar si un problema de mejora de la convivencia consigue disminuir el nmero de partes de
amonestacin en institutos de educacin secundaria y si mejora el clima escolar.
Variables:
1. El programa. (V.I.) Categrica Dicotmica Nominal (0= no hay programa; 1= si hay programa)
2. Partes. (V.D.) Cuantitativa Discreta (0 - )
3. Clima Escolar. (V.D.) Cuantitativa Intervalo. Se podra utilizar un cuestionario estandarizado, donde la
puntuacin de 25 para abajo es el peor clima y de 75 para arriba es el mejor clima.
Recogida de datos: Toda la ESO. Los grupos A reciben el programa, los grupos B no.
Clase

Programa

N de partes

Clima Escolar

Sujeto 1
Sujeto 2

1A
2A

1
1

2
0

70
60

Sujeto 3

1B

50

Sujeto 4

3B

40

En la investigacin emprica siempre tenemos que trabajar con datos empricos, es decir, transformar en nmeros
la realidad observada, para ello necesitamos instrumentos de medida vlidos y fiables. La precisin (fiabilidad) de
los instrumentos podr tener distintos grados (por ej. en variables como la edad, el cociente intelectual, el
rendimiento acadmico, la altura, la presin arterial, etc.) y eso afectar a la validez de los resultados. En este
10

sentido, la eleccin de los instrumentos de medida o el proceso de construccin de los mismos es una parte
fundamental de la investigacin.
Una vez realizado el diseo de investigacin y elegidos los instrumentos de medida, se puede realizar el trabajo de
campo, aplicar los instrumentos, recoger los datos.
3. PERMISOS Y TICA EN LA INVESTIGACIN Y RECOGIDA DE DATOS:
Todava no hay un consenso completamente claro sobre cmo debe procederse ticamente en la investigacin. Lo
que s parece claro es que no se caer en uno de estos dos extremos:
- Proteger contra la experimentacin humana a toda costa
frente a
- Permitir a cualquiera ser objeto de experimentacin
En la investigacin educativa los Principios ticos que deben seguirse son:
Participacin voluntaria de los sujetos.
Informe consentido = los sujetos conocen la naturaleza de la investigacin.
Evitacin de riesgo de dao fsico o psquico.
Confidencialidad y anonimato.
Respetar el lugar, causando las menos alteraciones posibles.
No manipular los datos obtenidos y reflejar fielmente los resultados aunque contradigan su hiptesis
inicial.
Citar adecuadamente los autores y las fuentes de informacin durante la revisin del estado de la cuestin.
PRCTICAS TICAS = DEONTOLOGA PROFESIONAL
4. DE LOS DISTINTOS INTRUMENTOS A LOS DATOS: ELECCIN DEL PROGRAMA, LA MATRIZ DE DATOS Y EL LIBRO
DE CDIGOS.
Una vez que hemos aplicado los instrumentos, debemos trasladar los datos a algn programa que nos permita
trabajar con ellos.
Las puntuaciones que vamos a introducir se llaman puntuaciones directas (Xi), que es la puntuacin que obtiene el
sujeto tras aplicarle un instrumento de medida (una pregunta, un test, una escala, etc.). La codificacin de datos
consiste en la asignacin de nmeros o caracteres a los valores de variables.
Antes de empezar a tabular o introducir datos, es conveniente
escribir el libro de cdigos. Se trata de un documento en el que
se especifican todas las variables del estudio en el orden en el
que sern introducidas en la matriz de datos. La utilidad de dicho
libro es decisiva para evitar errores de tabulacin.

Ejemplo de libro de cdigos:


11

Es importante definir el valor que asignemos a los datos perdidos o Missing data. Por ejemplo, cuando estamos
tabulando un cuestionario y nos encontramos que un sujeto no ha contestado a una pregunta, tenemos dos
opciones:
1. Se deja en blanco en la matriz de datos, de modo que no se contabilice a la hora de calcular los estadsticos.
Un error muy comn es poner ceros, pero esto puede distorsionar el clculo de los estadsticos ya que puede
estar incluido como un valor vlido.
2. Definir un valor perdido por el usuario, como por ejemplo 99 (siempre que no sea un valor admisible dentro
de la escala de medida de la variable). En este caso, debemos programar dicho valor en el programa que
utilicemos, de modo que el programa no utilice ese valor para los clculos.
La matriz de datos es simplemente una tabla de doble entrada en la que las filas representan sujetos y las columnas
a las distintas variables medidas. Debemos ordenar y categorizar los datos, para poder apreciar mejor las
caractersticas del grupo en cada una de las variables. A este primer anlisis se le denomina Estadstica Descriptiva.
5. ORGANIZACIN DE LOS DATOS: DEPURACIN DE DATOS Y DISTRIBUCIONES DE FRECUENCIA.
Antes de empezar a realizar los anlisis estadsticos, debemos hacer lo que entendemos como depuracin de datos
y exige dos fases:
1. El control de calidad de la tabulacin1 que consiste en comprobar la fidelidad de la tabulacin.
2. La depuracin de datos que consiste en verificar si hay valores fuera de rango segn se haba definido en
el libro de cdigos.
Hay distintas maneras de hacerlo:
Realizar un Anlisis Descriptivo solicitando los valores mnimo y mximo
Con el libro de cdigos debemos ir comprobando que los valores estn dentro del rango definido.
Realizar una Distribucin de Frecuencias. Aparecen todas las puntuaciones obtenidas en una variable
(puntuaciones directas) y el nmero de veces que se repite cada puntuacin (frecuencia absoluta). Tambin
son utilizadas la frecuencia relativa (frecuencia absoluta entre el nmero total de puntuaciones: fa/N) que,
multiplicado por 100 indica el porcentaje de aparicin de una puntuacin respecto del total y, la frecuencia
acumulada, que muestra el nmero de sujetos a los que supera una puntuacin determinada.
Distribuciones de frecuencia y aproximacin al concepto de percentil. Una distribucin de frecuencia suele incluir:
Puntuaciones directas obtenidas (Xi).
Frecuencias absolutas nmero de veces que se repite cada Xi (fi)
Porcentaje relativo o frecuencias relativas fi/N x100. Es el % de aparicin.
Frecuencia acumulada muestra el n de sujetos a los que supera una puntuacin determinada. Se calcula
sumando las frecuencias relativas que queden por debajo del lmite superior de cada puntuacin.

Puntuacin directa

Frecuencia absoluta

1
2
3
4
5
6
7
Total

179
93
107
128
108
131
266
N= 1012

Frecuencia relativa
x 100
17,7
9,2
10,6
12,6
10,7
12,9
26,3
100,0

Frecuencia acumulada x 100


(porcentaje acumulado)
17,7
26,9
37,5
50,1
60,8
73,7
100,0

Tabular los datos es trasladar los datos de los instrumentos de medida a la matriz de datos.

12

Los porcentajes acumulados (sin decimales) se utilizan mucho en la construccin de baremos para interpretar las
puntuaciones en los test, donde reciben el nombre de Percentiles. El percentil indica el porcentaje de sujetos que
deja por debajo de si una puntuacin determinada.
Una distribucin de frecuencia suele incluir:
1 Columna: el nmero de sujetos o casos que corresponde a cada puntuacin directa: Frecuencia Absoluta.
2 Columna: el Porcentaje Relativo (o frecuencia relativa multiplicada por 100) para cdigo, incluidos los valores
perdidos.
3 Columna: el Porcentaje Vlido, que es el porcentaje relativo de cada valor excluidos los valores perdidos.
4 Columna: el Porcentaje Acumulado, indica el porcentaje de casos que deja por debajo de s el lmite superior
de cada puntuacin.

6. APROXIMACIN INTUITIVA A LAS REPRESENTACIONES GRFICAS Y LA CURVA NORMAL.


Una Representacin Grfica es una
forma de ordenar informacin disponible
en la matriz de datos y comprendida con
un simple golpe de vista. Para realizar un
grfico necesitamos una distribucin de
frecuencias. Hay distintas formas de
representar los datos, dependiendo de la
naturaleza de las variables: sectores,
barras, polgonos de frecuencia, tallo y
hojas, etc.
En muchas variables biolgicas y psicoeducativas (peso, altura, cociente
intelectual, rendimiento), cuando realizamos una distribucin de
frecuencias, observamos que esta distribucin adopta unas caractersticas
especiales. Entre las distintas formas que pueden adoptar las distribuciones
de frecuencias en diferentes variables se descubri que muchas de ellas
adoptan un tipo de distribucin caracterstica que se denomina Distribucin
Normal o Campana de Gauss.
La curva normal es una distribucin terica simtrica, donde la media la
mediana y la moda coinciden. La distribucin viene a indicar cmo la mayora
de las personas nos encontramos en torno a los valores medios.

= Md = Mo
13

TEMA 5: REDUCCIN DE DATOS. MEDIDAS DESCRIPTIVAS BSICAS Y REPRESENTACIONES GRFICAS.


1. INTRODUCCIN. DE LA ORGANIZACIN A LA DESCRIPCIN DE DATOS:
Normalmente, antes de realizar anlisis ms complejos, se parte de la Estadstica Descriptiva para hacerse una
primera idea del comportamiento de cada una de las variables contenidas en nuestra matriz de datos.
La VARIABILIDAD, es el estudio de la dispersin de las puntuaciones, contribuyendo a explicar la magnitud y
naturaleza de las mismas. Lo contrario a una variable es una Constante, es decir, cuando todos los sujetos u objetos
tienen la misma puntuacin, cuando no hay diferencias y, por tanto, no hay variabilidad.
Generalmente, primero se estudia la tendencia central del grupo, es decir, hacia qu puntuacin tiende el grupo. El
ndice ms conocido es la Media Aritmtica. Sin embargo, este ndice por s solo no nos proporciona suficiente
informacin como para hacernos una idea del grupo. La mayora de los sujetos tiene unas puntuaciones cercanas a
la media o hay sujetos con puntuaciones muy altas y muy bajas? En otras palabras, nos estamos preguntando si el
grupo es homogneo en torno a la media o heterogneo (muchas puntuaciones distan considerablemente de la
media, tanto por arriba como por abajo). Dicho de otra forma, hay o no hay dispersin de las puntuaciones en
torno a la media aritmtica? Para comprobarlo, nos referiremos a las Medidas de Variabilidad o Dispersin, como
la Desviacin Tpica.
Una vez tabulados los datos, comenzamos a trabajar con la matriz de datos y a realizar los anlisis pertinente,
normalmente se parte de la Estadstica Descriptiva para hacerse una primera idea del comportamiento de cada una
de las variables contenidas en nuestra matriz de datos. La Estadstica Descriptiva consiste en una serie de
procedimientos para organizar, clasificar y resumir conjuntos de datos a travs de ndices Numricos y por medio
de Representaciones Grficas:
ndices Numricos: medidas de tendencia central: Media, Mediana y Moda
Medidas de Variabilidad: Amplitud, Varianza y Desviacin Tpica
Representaciones Grficas: grfico de sectores, grficos de barras, histograma, grfico de caja...
Para caracterizar un grupo, necesitamos tanto Medidas de Tendencia Central como Medidas de Variabilidad.
(0, 0, 0, 10, 10, 10)
=

vs.

(5, 5, 5, 5, 5, 5)

=5

=5

Valor alto
2. MEDIDAS DE TENDENCIA CENTRAL: MEDIA, MEDIANA Y MODA. USOS E INTERPRETACIN.
MEDIA ARITMTICA: la Tendencia Central del grupo indica hacia qu
valor tiende ir el grupo. Es el ndice o medida ms conocida.
Interpretar una media aritmtica suele ser muy sencillo. Para
interpretarla correctamente, es conveniente conocer la puntuacin mnima y mxima de la escala de medida de la
variable y situar la media aritmtica dentro de ese recorrido.

14

MODA (Mo): es el valor con


frecuencia absoluta ms alta, la
puntuacin que ms se repite. Por
tanto, la moda no necesita ningn
clculo. Cuando tenemos dos
puntuaciones
con
la
misma
frecuencia,
diremos
que
la
distribucin es Bimodal, y entonces M
diremos que las modas son, por o
ejemplo, 4 y 5. Tambin podemos
encontrarnos
distribuciones
de
frecuencias en las que ms de dos
puntuaciones tienen la misma, en
este caso hablaremos de
distribuciones Plurimodales.

2
5
Md
14,5

Md
1 ,5
4
-

En puntuaciones pares:

N = 50 Md =14.5se realiza la media


5, 8, 8, 8, 9, 14, 14, 14, 15, 15, 16,
22

25 26
MEDIANA (Md) es aquel valor que
25
25
deja por encima y por debajo de s al 50% de los sujetos de la muestra,
el valor central de la distribucin de frecuencias. Si ordenamos las puntuaciones de los
50
sujetos de menor a mayor la Md es la que est en el medio. En puntuaciones pares se cogen las dos puntuaciones y
se realiza la media, en el caso de los impares es la que se queda en el medio.
La medida ms precisa de Tendencia Central es la Media porque tiene en cuenta todas las puntuaciones, aunque
siempre que sea posible, se deben calcular Md y Mo porque hay que tener en cuenta que la media aritmtica es
sensible a las puntuaciones extremas, no as la mediana ni la moda. La mediana puede ser una medida preferible a
la media cuando las puntuaciones extremas puedan distorsionar la verdadera
1, 1 , 3, 5, 8, 10, 42
tendencia central del grupo.
=7
Md = 5
Podremos utilizar:
Mo = 1
En Variables de Intervalo o Razn: media, mediana y moda.
Valor Aberrante = 42
En Variables de Tipo Ordinal: mediana y moda.
En Variables de Tipo Nominal: moda.
(3, 3, 4, 4, 4, 5, 5)
=4
Md = 4

vs.

(3, 3, 4, 4, 4, 5, 10)
= 4,7
Md = 45

Cuando la media se ve arrastrada por puntuaciones extremas, la


mediana puede ser una medida preferible cuando existen
puntuaciones extremas que distorsionan la verdadera tendencia
central del grupo.

El Valor Aberrante, Atpico o Extremo, es aquella puntuacin que queda muy lejos del grupo.
3. MEDIDAS DE VARIACIN:
Las medidas de tendencia central por s solas no nos proporcionan suficiente informacin como para hacernos una
idea de las caractersticas del grupo. Nos podemos preguntar si el grupo es homogneo en torno a la media
aritmtica (la mayora de las puntuaciones estn cerca de la media) o heterogneo (muchas puntuaciones distan
considerablemente de la media, tanto por arriba como por abajo). Por esta razn, el ndice de tendencia central
debe ir acompaado por un ndice de dispersin o variabilidad que indique en qu medida las puntuaciones de los
sujetos se dispersan o varan en torno a la media aritmtica.

15

DESVIACIN MEDIA (DM): Es una medida que implica la media aritmtica de las
desviaciones de las puntuaciones directas respecto de la media aritmtica
DM
Las puntuaciones se desvan
Las puntuaciones se alejan de la del grupo
Grupo Heterogneo

DM
Las puntuaciones del grupo estn prximas
Las puntuaciones son prximas a la del grupo
Grupo Homogneo

Los ndices de variabilidad ms conocidos y utilizados son la DESVIACIN TPICA (S) y la VARIANZA (S2). El
numerador expresa las distancias de cada puntuacin directa a la media aritmtica. Dichas distancias se elevan al
cuadrado para evitar que el valor siempre fuera 0.
SESGADA

INSESGADA

DESVIACIN TPICA

VARIANZA

La Desviacin Tpica Sesgada, se utiliza frecuentemente al trabajar con muestras aunque, es igualmente frecuente
trabajar con la Desviacin Tpica Insesgada, que es la estimacin de la desviacin tpica de la poblacin a la que
pertenece la muestra. Por lgica, se entiende que la Desviacin Tpica en una poblacin ser ms elevada que en
una muestra (al haber ms sujetos, ser ms probable encontrar mayores diferencias interindividuales), por lo que
si disminuimos el denominador, el cociente ser mayor, por ello para calcular la Desviacin Tpica Insesgada,
simplemente se le resta una unidad al denominador:
Al elaborar un informe descriptivo, lo usual es incluir la Desviacin Tpica como medida de dispersin. No siempre
es fcil interpretar una desviacin tpica, decir si es grande o pequea. En muchas ocasiones se utiliza para
comparar la dispersin entre grupos distintos:
Si tenemos un solo grupo, los valores que podemos tomar de referencia son:
o Desviacin Tpica Mnima siempre cero
o Desviacin Tpica Mxima la puntuacin mayor menos puntuacin menor entre dos.
Para obtener la Mnima Desviacin Tpica todos los sujetos deben obtener la misma puntuacin.
Para obtener la Desviacin Tpica Mxima la mitad de los sujetos deberan obtener la puntuacin
mxima de la escala y la otra mitad la puntuacin mnima (as se conseguiran las distancias mximas
respecto de la media y, en este sentido, la mxima heterogeneidad).
Sin embargo, si bien esto es posible en Variables Dicotmicas, cuanto ms grande es la amplitud de la
variable, ms improbable es que se d esta situacin. En consecuencia, tendremos que ver en estos casos
cunto se aleja de cero la desviacin tpica.
Ejemplo: En una Escala de CI que va de 70 a 130:
= 110
S= 8
0
8
Smnimo = 0
Homogneo
Smximo =

= 30

30
Heterogneo

Con una desviacin tpica de S=8 es un grupo homogneo.


16

AMPLITUD O RECORRIDO: Existen otras medidas de dispersin. La ms bsica es la amplitud o recorrido de una
variable. Se calcula como la diferencia entre la puntuacin mayor y menor ms uno:

Esta medida se utiliza, sobre todo, para organizar los datos de una distribucin de frecuencias en intervalos y
realizar grficos. La amplitud se utiliza como media de dispersin nicamente cuando no es posible calcular otra o
como complemento de la moda (cuando el nivel de medida de la variable es nominal). Al igual que suceda con la
moda como ndice de tendencia central, es un ndice muy simple, basado en tan slo dos puntuaciones, lo que
puede dar lugar a malas interpretaciones si no se valora con precaucin, sobre todo cuando existen puntuaciones
extremas.
DESVIACIN SEMI-INTERCUARTLICA (Q): Es una medida que indica la dispersin en el 50% central de la
distribucin, es adecuada cuando el nivel de medida de la variable es ordinal como complemento de la mediana.
Tambin es adecuado su uso cuando la existencia de puntuaciones extremas pueda distorsionar en
exceso la desviacin tpica, ya que las ignora centrndose en la parte central de la muestra.
La Q prescinde del 25% inferior y del 25% superior de las puntuaciones, calculando la dispersin en el 50% central,
entre los percentiles 25 y 75 o, lo que es lo mismo, entre los cuartiles Q1 y Q3.

25 %

25%

25 %

25 %

Q1

Q2

Q3

25%

50%

75%

2 , 5 , 9 , 14 , 16 , 24 , 35

Percentil 25 y Quartil 1 = 5
Percentil 50, Mediana y Quartil 2 = 14
Percentil 75 y Quartil 3 = 24
EL COEFICIENTE DE VARIACIN (V): permite comparar la variabilidad entre
variables que tienen distinta amplitud. Dos desviaciones tpicas procedentes de
instrumentos con distinto recorrido o distinta escala de medida no son directamente
comparables. Se expresa en trminos porcentuales.
Ejemplo: Quiero saber cul es ms heterognea:
Escala de Medida
Media

Desviacin tpica

Coeficiente de Variacin

Variable CI

Escala de 0-100

= 100

S = 15

V=

x 100 = 15 %

Variable Rendimiento

Escala de 0-10

=6

S=2

V=

x 100 = 33 %

El Coeficiente de Variacin es ms Heterogneo en Rendimiento que en la Variable Coeficiente Intelectual


A % en el Coeficiente de Variacin El grupo es heterogneo / homogneo
A % en el Coeficiente de Variacin El grupo es heterogneo / homogneo

17

4. MEDIA Y DESVIACIN TPICA PARA VARIABLES DICOTMICAS:


Las Variables Dicotmicas son las que slo pueden tomar dos valores. Sus dos posibles valores, se codifican con
ceros y unos (0 = NOES o respuestas incorrectas y 1 = SES o respuestas correctas). La media aritmtica representa la
proporcin de unos.
Ejemplo, En la encuesta: Te gustan las matemticas? S NO . N= 50, han contestado 30
P=

= Media () p =

q=

p=

= 0,60

= 0,40

p + q = 1 (siempre debe de dar uno)


0,60 + 0,40 = 1 100%

El 60% de la muestra ha respondido que s, al 60% le gustan las matemticas y al 40% no le gustan.
De esta manera q= 1 p en este caso 1 0,6 = 0,4.
La Varianza se calcula S2 = p q

La Desviacin Tpica es S=

Casos Extremos:
Todo
Correcto
Aciertos
Errores

p=1

S2 = 0

q=0

S =0

p = 0,5

S2 = 0, 25

q = 0,5

S = 0,50

HOMOGENEIDAD
ABSOLUTA
MXIMA
VARIABILIDAD

Varianza ir de 0 a 0,25
Desviacin Tpica ir de 0 (ausencia variabilidad) a 0,5 (
Aciertos y Errores)
No hay sesgada ni insesgada.

Las medias con variables dicotmicas son muy usadas en pruebas objetivas con preguntas de acierto/error. En este
caso, la media nos dir la proporcin de sujetos que ha contestado correctamente a la pregunta, que viene a
denominarse ndice de Dificultad del tem.
5. ASIMETRA Y APUNTAMIENTO: RELACIN CON LA CURVA NORMAL.
La asimetra y el apuntamiento son dos caractersticas relativas a la forma grfica de la distribucin de frecuencias.
Muchas variables educativas, psicolgicas y biolgicas se distribuyen segn la llamada distribucin normal = curva
normal = campana de Gauss (rendimiento acadmico, inteligencia, aptitud, motivacin, peso, altura). La
distribucin viene a indicar cmo la mayora de las personas nos encontramos en torno a los valores medios de la
distribucin y segn nos alejamos hacia valores extremos el nmero de sujetos disminuye progresivamente.
Ms
casos

Curva normal = Distribucin Normal = Campana de Gauss = Md = Mo


Las representaciones grficas de las variables, sobre todo cuando trabajamos con
muestras grandes, tienden a ser curvas que, por su Grado de Asimetra, pueden
asemejarse a una de estas tres.

Menos
casos

Menos
casos

18

Ejemplo: Grfico de estatura de chicas adultas

Asimetra
Positiva
As = +
Cola de la
Distribucin

Si aadimos chicas muy Altas

1,40

1,70
= Mo

Parte
Baja

2,00

Moda sigue en el mismo sitio


Media se desplazar a la derecha
Cola de la Distribucin a la derecha
La mayora de los casos estn en la parte baja.

Si
aadimos
chicas
muy bajas
Asimetra
Negativa
As = -

Cola de la
Distribucin

Parte
Baja

Mo

Parte
Alta

Mo

Moda sigue en el mismo sitio


Media se desplazar a la izquierda
Cola de la Distribucin a la izquierda
La mayora de los casos estn en la parte alta o superior.

Parte
Alta

Apuntamiento o la Curtosis: indica el grado en el que la distribucin es ms o menos picuda, es decir, el grado en
el que la distribucin resulta ms abierta o dispersa respecto a la media (las puntuaciones estn poco concentradas
respecto a la media).
Mesocrtica: la curva normal. Curtosis = 0
Leptocrtica: ms apuntada. Concentracin de las puntuaciones
alrededor de la media. Curtosis > 0
Platicrtica: ms achatada. Dispersin de las puntuaciones
alrededor de la media. Curtosis < 0
Para el clculo de la curtosis, puede utilizarse la siguiente frmula:
6. REPRESENTACIONES GRFICAS:
1er trim.
2do trim.
Grfico de sectores o ciclograma o grfico de tarta: variables con nivel de medida nominal.
3er trim.
4to trim.
Dicotmicas. Cada porcin representa la proporcional de cada uno de los niveles de la
variable.
100
Grfico de barras: variables con nivel de medida ordinal, aunque se puede utilizar
cuando el nivel de medida es nominal y para realizar comparaciones de variables
50
Este
clasificatorias o categricas. Histograma: es muy parecido al de barras, pero se utiliza
Oeste
0
para variables cuantitativas continuas, con nivel de medida de intervalo o de razn.
1er trim. 3er trim.
Norte
Agrupa las puntuaciones en intervalos.

Grfico de caja, caja y patillas o caja y bigotes: para hacerse una idea rpida de la
distribucin de las puntuaciones en la zona central (Comprende desde Q1 al Q3, del
percentil 25 al 75) Es til para comparar visualmente grupos medidos en distintas variables.
No son adecuados para un nivel nominal, se usa en variables de intervalo o razn. Las
patillas son los extremos, representan las puntuaciones hasta los extremos de la
distribucin. Outlier, se llama al valor extremo, puntuacin rara o atpica. Se considera
outlier a partir de Md 1,5 (Q1 Q3).
19

TEMA 6: MEDIDAS INDIVIDUALES.


1. INTRODUCCIN:
Habitualmente la estadstica se ocupa de estudiar conjuntos de datos ms que los datos particulares, pero en el
campo educativo, las puntuaciones individuales de sujetos concretos son de vital importancia puesto que la persona
es el objeto fundamental de la educacin. El conocimiento de las puntuaciones individuales de cada persona y su
correcta interpretacin resultan esenciales para la intervencin educativa.
El conocimiento de las puntuaciones individuales, de su interpretacin y de la necesidad de su transformacin,
para su mejor comprensin, son esenciales en la intervencin educativa.
2. PUNTUACIONES DIRECTAS: Problemas de interpretacin y transformaciones permisibles:
Una puntuacin directa (X1) es la puntuacin que obtiene un sujeto al realizar una prueba o aplicarle un instrumento
de medida.
Estas dos puntuaciones NO son comparables directamente ya que
no significan lo mismo, para poder compararlas necesitamos
transformar X1 y X2 en Puntuaciones proporcionales o en
puntuaciones porcentuales

Puntuaciones proporcionales convertir la Xi en proporcin de respuestas correctas


Puntuacin porcentual Puntuacin proporcional por 100
Lengua
X1 = 18
n = 40
18/40 = 0,45
Puntuacin proporcional
45%
Puntuacin porcentual

Matemticas
X2 = 18
n = 20
18/20 = 0,9
Puntuacin proporcional
90 %
Puntuacin porcentual

x 100

Sin embargo, no siempre es posible ni pertinente hacer esta


transformacin, no sirven para cuestionarios (de opinin,
estimacin ya que no hay respuestas correctas e incorrectas) ni
tienen en cuenta el rendimiento del resto del grupo.

Si tenemos una escala de actitud hacia el estudio con un recorrido


de O a 50 puntos (cuyos tems indican el grado de acuerdo o
desacuerdo con distintas afirmaciones), una Xi de 30 puntos manifiesta cierta actitud positiva hacia el estudio, pero
no es transformable en un porcentaje de respuestas correctas.

Un sujeto que obtiene un 45% de respuestas correctas en una prueba objetiva se corresponde con un resultado
medio-bajo pero dicha afirmacin es discutible. Podra ocurrir que el test hubiese sido tan difcil, que el sujeto que
obtuvo un 45% de aciertos fue el mejor de su grupo. Entonces, quizs podramos interpretar que esta puntuacin no
fue tan mala.
3. PUNTUACIONES DIFERENCIALES
Una puntuacin diferencial (x) es una puntuacin individual relativa a la media aritmtica del grupo de referencia.
Por tanto, para calcular una puntuacin diferencial es necesario haber aplicado un instrumento de medida a un
grupo de sujetos. Para calcularla, simplemente se le resta a la puntuacin directa del sujeto la media aritmtica del
grupo al que pertenece.
Lengua
= 13
X1 = 18
x= 18- 13 = +5
n = 40

Matemticas
= 19
X2 = 18
x= 18-19 = -1
n = 20

Es importante respetar el signo + o ya que en el caso de lengua


se desva 5 por encima de la media y en matemticas se desva
uno por debajo de la media.
20

Una puntuacin diferencial slo nos permite saber si una puntuacin est por encima o por debajo de la media
aritmtica. Es evidente que no es lo mismo separarse dos puntos de la media cuando tenemos un recorrido de 5
puntos que cuando el recorrido es de 100. Necesitamos, por tanto, una puntuacin que permita situar a un sujeto
con respecto a su grupo de referencia y hacer comparaciones independientemente de la amplitud del instrumento
del que procedan las puntuaciones directas que deseamos comparar.
4. PUNTUACIONES TPICAS:
Una puntuacin tpica (z) indica el nmero de desviaciones tpicas que se desva una puntuacin directa de la media
aritmtica. Las dos propiedades ms importantes de las puntuaciones tpicas son que la media de
dichas puntuaciones es igual a 0 y la desviacin tpica igual a 1.
Ejemplo: Un grupo de sujetos tiene una en CI = 100 puntos y una desviacin tpica s = 10
Xi = 110 z=

= 1 Desviacin tpica por encima, se aparta 1 desviacin tpica de la media.

Xi = 120 z=

= 2 Desviacin tpica por encima, se aparta 2 desviaciones tpicas de la media.

Lengua
= 23
S=5
Xi = 18
z= 18-23/5 = -1

Matemticas
=9
S= 3
Xi= 18
z= 18-9/3 = 3

Ahora s podemos comparar la puntuacin en lengua con la de


matemticas, en funcin de la desviacin Tpica del grupo, sale una
puntuacin tpica diferente

Las puntuaciones tpicas son muy utilizadas porque nos permiten comparar cualquier puntuacin entre s,
independientemente del instrumento de medida o de la amplitud de la escala utilizada. A toda puntuacin directa
superior a la media le corresponder una puntuacin tpica positiva, y si es inferior a la media, negativa. La media
aritmtica siempre coincide con una z = 0.
Debe entenderse que una puntuacin tpica (z), como hemos dicho, es una puntuacin que depende tanto de la
media como de la variabilidad del grupo. En consecuencia, las puntuaciones tpicas variarn dependiendo de la
homogeneidad o heterogeneidad del grupo. Si un grupo es muy homogneo, su desviacin tpica ser pequea y,
por tanto, a una puntuacin que no se aleje mucho de la media le puede corresponder una puntuacin tpica mucho
mayor que la que le correspondera si el grupo fuese heterogneo.
Por ejemplo: Examen de estadstica, donde tienen la misma media y la misma puntuacin directa (Xi) tendrn una z
diferente por las caractersticas del grupo.
Grupo A
Grupo B
En el Grupo A, el alumno destaca mucho porque el grupo es muy
= 5,5
= 5,5
homogneo encontrndose su puntuacin en el extremo.
S = 0.4 - Homogneo
S= 2,5 Heterogneo
En el Grupo B, la Z es positiva porque su puntuacin supera la
Xi = 7
Xi= 7
media pero no destaca porque pertenece a un grupo
z= 7-5,5/0,4 = 3,75
z= 7-5,5/2,5 = 0,6
heterogneo.
5. PUNTUACIONES TIPIFICADAS O ESCALAS DERIVADAS: (Marcos no importante)
Las puntuaciones tipificadas consisten en una simple transformacin de las puntuaciones tpicas, creadas con el
nimo de evitar las puntuaciones decimales y las negativas. La transformacin se reduce a multiplicar por una
constante a la puntuacin tpica, valor que se convertir en la nueva desviacin tpica y sumarle otra constante,
valor que se convertir en la nueva media de las puntuaciones tipificadas: T = a z + b (b = ; a = S ; z = puntuacin
tpica) Entre las puntuaciones tipificadas ms usadas, se encuentran las siguientes: T= 10z + 50 // S = 2z + 5.
Entonces, un sujeto con una puntuacin directa igual a la media tendr una puntuacin T 50 y una S = 5.
21

6. LAS PUNTUACIONES CUANTILES:


Cuantil indica el porcentaje de sujetos que deja por debajo de s una puntuacin determinada.
Percentil puntuacin cuantil ms utilizada, dividen una distribucin de frecuencias en 100 partes. (Por ejemplo,
P85 = puntuacin directa que deja por debajo de s al 85% de los sujetos de su grupo).
Otros cuantiles utilizados son los deciles (D, diez divisiones) y los cuartiles (Q, cuatro divisiones).
Los percentiles son utilizados para construir los baremos de los tests estandarizados.
7. LAS PUNTUACIONES INDIVIDUALES EN LA CURVA NORMAL:
Cuando la distribucin se parece a la curva normal, donde la =Md=Mo y tiene un ndice de asimetra =0 y un
apuntamiento = 0.
Entre z=-1 y z=1 se encuentra el grueso de la distribucin.
Al tener una puntuacin que se ajusta a la curva normal se puede usar las tablas de la
curva normal
z=-1 z=0

z=1

En casi todos los textos de Estadstica se pueden encontrar las tablas de la curva normal con las probabilidades
asociadas a cada puntuacin tpica. La interpretacin de las tablas es muy sencilla. Tenemos que pensar que una
puntuacin tpica divide la curva normal en dos partes:
una grande y otra pequea (excepto z = 0 que la divide
en dos partes iguales). En este caso, hemos utilizado la
puntuacin tpica 1,25. Si trazamos una lnea vertical a
partir de dicha z, el rea de la curva normal queda
dividida en dos partes. El rea mayor, es el rea ms
grande que queda al realizar dicha divisin. Por tanto,
una puntuacin tpica igual a 1,25 tiene una
probabilidad acumulada de aparicin de p = 0,8944 (ver
tablas de la curva normal), esto es, el 89,44% de los sujetos obtienen una puntuacin z 1,25. Consecuentemente, en
este caso, el rea menor indica la probabilidad de obtener una puntuacin z 1,25 (p = 0,1056).
1 Columna A
Puntuacin Tipificada (z)
1,25

TABLAS DE LA CURVA NORMAL


2 Columna B
3 Columna C
rea desde la media
rea parte mayor
0,3944 39%
0,8944 89%

4 Columna D
rea parte menor
0,1056 11%

8. LAS PUNTUACIONES INDIVIDUALES NORMALIZADAS:


La puntuacin normalizada es la puntuacin individual que le corresponde a un sujeto si la distribucin de
frecuencias original es una distribucin normal. Concretamente suelen utilizarse cuando en un test conocemos la
media y la desviacin tpica, pero carecemos de los baremos.
Ejemplo: qu puntuacin corresponde a una z? Sabemos que se trata del percentil P10, con una = 100 y S = 15.
Deja por debajo al 10 % de los sujetos, es decir, una proporcin del 0,01. Buscamos en el formulario el valor de p =
0,01 en la columna C y encontramos que corresponde a una z = -2,33 (es negativa porque estamos trabajando en la
parte izquierda de la curva, por debajo de la ). Ahora aplicamos la frmula y despejamos:
22

Problema: Seleccionar a los 12 mejores alumnos: donde N= 150 ; La puntuacin Global va de 25 -150 ; Distribucin
normal = 81 y S =16,8
Puntuacin Directa para ser seleccionado ?
Seleccionan a los 12 mejores de 150 12/150 100 = 8 % 0,08
El punto de corte ser el 8 % el que deje el 8% tanto por debajo como por arriba.
Busco la z que corresponde al rea menor 0,08
La z = 1,40 deja el 8 % por arriba y el 92 % por abajo.
Convierto la puntuacin Tpica en Puntuacin Directa
o

z=

Xi = (z+)S

Xi = (1,40+81) 16,8 = 104,52 A partir de esta puntuacin se encuentran los alumnos que
buscamos.
Percentil al que corresponde esta puntuacin ? Pertenece al percentil 92% ya que supera al 92 % de los alumnos.
Probabilidad de encontrar una puntuacin > 140 ? Xi = 140
z=

z=

= 3,51 esta puntuacin deja el 0,0002 0,02% la puntuacin de 140 la supera el 0,02% es

decir dos alumnos por cada 10.000 sujetos.


Entre que puntuaciones tpicas y directas est el 50% central ?
Buscamos la puntuacin tpica que se aleje de la media un 0,25 (25%) Xi = 0,68
Por tanto el 50% central estar entre la z= -0,68 y la z=0,68
Xi = (z+)S
o Xi(-0,68+81)16,8=69,57
Entre las puntuaciones directas 69,57 y 92, 47 se encuentra el 50%
o Xi(0,68+81)16,8=92,47
de los alumnos.

23

TEMA 7: RELACIN ENTRE VARIABLES. LAS CORRELACIONES Y LA REGRESIN:


1. INTRODUCCIN: La estadstica descriptiva estudia variable por variable de manera independiente. En la
investigacin educativa interesa conocer la posible relacin entre dos o ms variables.
Correlacin Relacin entre las variables, estudio de como varian conjuntamente dos variables en el mismo grupo
de sujetos. A + tiempo de estudio > Rendimiento Acadmico.
Regresin Como predecir una variable en funcin de la otra. En dos variables correlacionadas se puede predecir
una en funcin de la otra. Podemos predecir cuantas horas de estudio se necesitan para tener un rendimiento
determinado.
2. EL CONCEPTO DE CORRELACIN:
Correlacin, indica la tendencia de dos o ms conjuntos de datos a variar de forma conjunta. Para cuantificar la
intensidad de la correlacin se expresa con un nmero que es el coeficiente de correlacin que mide el ndice de
covariacin o variacin conjunta de dos, o ms, series de datos. Va de -1 a +1.
Por ejemplo: conocer qu variables pueden influir sobre el rendimiento acadmico y cul en su peso relativo en la
prediccin, como pueden ser: tiempo de estudio, tcnicas de trabajo, recursos materiales disponibles, motivacin.
Situaciones susceptibles de analizar de manera correlacinalas situaciones que se pueden analizar son diversas:
Estudiar la relacin entre dos o ms variables en un mismo grupo de sujetos.
Relacin entre dos o ms individuos en una sola variable.
Estudiar una misma variable en dos momentos distintos en el mismo grupo de sujetos. Ejemplo, se mide una
vez el CI y al mes otra vez, se usa para ver si el instrumento es fiable como estable, si es estable debe de dar
una medida correlacional.
Una relacin simple entre dos series de datos, se identificar con la correlacin entre dos variables. En el anlisis de
la correlacin entre dos variables, teniendo en cuenta la intensidad y el sentido de la relacin,
se presentan diferentes posibilidades que se expresan mediante un diagrama de dispersin:
A) Relacin perfecta positiva funcin: supuestos en que al aumentar los valores de una de
las variables los valores de la otra lo hacen siempre en la misma proporcin. No se da en casos
humanos. Expresin cuantitativa +1.
B) Relacin imperfecta positiva habitual en el campo educativo: relacin directa
de variables, a valores elevados en una variable le corresponden valores altos en la
otra; de tal forma que si se mide un grupo en dos variables distintas el sujeto que
punta alto lo hace en las dos variables y a la inversa. Expresin cuantitativa se sita
entre los valores 0 y +1.
C) Relacin perfecta negativa funcin: se manifiesta una relacin inversa entre las
variables, al aumentar los valores en una de ella, los de la otra disminuyen y lo hacen en la
misma proporcin. Expresin cuantitativa es -1.
D) Relacin imperfecta negativa: La identificamos con la
relacin inversa entre variables, lo que supone que las puntuaciones altas en una variable
se corresponden con las bajas en la otra; o bien cuando los sujetos que puntan alto en
un momento lo hacen de forma baja en otro momento o prueba distinta. Expresin
cuantitativa se sita entre los valores 0 y -1.
E) Relacin nula o ausencia de relacin: Esta ausencia de relacin se da cuando dos variables
son independientes una de la otra (ello implica que no existe una tendencia definida en los
valores alcanzados por los sujetos). Expresin cuantitativa sera 0 (ausencia de relacin).
24

3. EL COEFICIENTE DE CORRELACIN SIMPLE Y SU INTERPRETACIN:


El coeficiente de correlacin, como ya hemos indicado, nos mide el valor de la covariacin o variacin conjunta de
dos series de datos. El valor de ese coeficiente nos marca la existencia de una relacin directa de variables (valores
positivos) o inversa (valores negativos), es decir, los valores cuantitativos del coeficiente se sitan entre + 1 y - 1.
Aunque existen diversas directrices en su interpretacin, en general, la mayor parte de los investigadores tienden a
identificar tres aspectos:
1. El tipo de variables que se relacionan: cuando se da una similitud entre el valor del coeficiente encontrado
en el estudio emprico y el encontrado en el mismo grupo en trabajos previos, tambin cuando se han
encontrado unos valores elevados en anteriores estudios y se repite en la actualidad la misma tendencia en
los datos.
2. La variabilidad del grupo: cuanto mayor es la variabilidad del grupo mayor ser el valor del coeficiente de
correlacin. As cuando tenemos dos coeficientes de 0,70; el que se haya alcanzado en el grupo ms
homogneo (el de menor variabilidad) se identifica con una mayor intensidad de la correlacin.
3. La finalidad a la que se destina el coeficiente: as cuando el coeficiente se emplea para determinar la
fiabilidad de un instrumento de medida debe tener unos valores por encima de 0,85; en cambio para
determinar la validez con 0,60 puede ser aceptable, tambin se debe exigir un valor ms alto en la prediccin
que en la prueba de hiptesis.
Aunque no existe acuerdo entre los diferentes
autores consultados se pueden establecer unos
intervalos para categorizar y valorar los coeficientes
de correlacin. En la mayora de las ocasiones se
suelen aceptar las interpretaciones que se
muestran en la tabla siguiente:

Valor del coeficiente

Interpretacin

Entre 0,00 y + o 0,20

Correlacin muy baja, indiferente, despreciable

Entre 0,21 y + o 0,40

Correlacin baja

Entre 0,41 y + o 0,70

Correlacin media, marcada, notable

Entre 0,71 y + o 0,90

Correlacin alta, elevada, fuerte

Entre 0,91 y + o 1

Correlacin muy alta, muy elevada

Coeficiente de Determinacin (d) = Coeficiente de correlacin (r) al cuadrado por 100. d =


.100 Se interpreta
como el porcentaje de la varianza de una variable explicada por la otra. La interpretacin de los coeficientes de
correlacin se suele completar con su significacin estadstica. Se trata de poder afirmar que la correlacin entre 2
variables es real y no se puede explicar por efecto del azar.
4. TIPOS DE COEFICIENTE DE CORRELACIN:
El coeficiente de correlacin de Pearson (r): las dos variables son cuantitativas y medidas a nivel de intervalo
y adems se atribuyen normalmente.
El coeficiente de correlacin ordinal de Spearman ( ): variables cuantitativas pero slo puede garantizarse
un nivel de medida ordinal.
El coeficiente de contingencia (C): hallar el grado de asociacin entre 2 variables nominales (categricas).
El coeficiente de correlacin biserial-puntual ( ): entre una variable cuantitativa (continua o discreta) y
una autnticamente dicotmica.
4.1 El coeficiente de correlacin de Pearson (r): tambin recibe la denominacin de correlacin producto-momento
y es uno de los ms exigentes en su empleo. Se utiliza cuando las dos variables que se relacionan tienen una
naturaleza cuantitativa (nmeros). Para llevar a cabo su clculo emprico existen diferentes frmulas, segn el tipo
de puntuaciones con el que se trabaje: puntuaciones directas, diferenciales y tpicas.
Puntuaciones directas:
Suj.
1
2

Total 55

X
Y
7
8
5
4

=5,5 60 = 6

Puntuaciones diferenciales:
X2
47
25

331

Y2
64
16

386

X*Y
56
20

351

x
1,5

x2
2,25
...

28,5

y
2

y2
4

26

x*y
3

21
25

4.2 El coeficiente de correlacin ordinal de Spearman ( ): En muchas de las variables que utilizamos con frecuencia
en el campo educativo no es posible alcanzar unos niveles precisos de medida. Al no disponer de informacin precisa
se suelen emplear los puestos que ocupan las puntuaciones en una serie ordenada: Nos interesa conocer la posicin,
orden o rango que ocupan en una serie ordenada de valores (1, 2, 3, 4). Ante esos casos en que las dos
variables tienen la misma naturaleza, y adems con esos datos, solamente podemos garantizar que alcanza un nivel
de medida ordinal, importa el lugar que ocupa no la puntuacin obtenida, debemos recurrir al coeficiente de
correlacin de Spearman.
Para proceder a la transformacin de las puntuaciones obtenidas de la aplicacin directa del instrumento de recogida
de datos en rangos se suele comenzar asignando el rango o posicin 1 a la puntuacin ms alta, la siguiente tendr
el rango 2 y as sucesivamente de tal forma que el ltimo rango que se asigne debe coincidir con el nmero de
sujetos de la muestra.
n nos indica el nmero de sujetos o de pares de puntuaciones
D diferencia, de rangos o posiciones que ocupa un mismo sujeto en dos variables distintas.
En aquellos casos en que existan varias puntuaciones directas coincidentes, la asignacin del rango se realiza
calculando el promedio de las posiciones que ocupan. El criterio de asignacin de rangos debe ser el mismo para
ambas variables.
4.3 El coeficiente de contingencia (C): En el caso de variables nominales o atributos, se suele hablar de grado de
asociacin (no de grado de correlacin). Se utiliza aquellos supuestos en que se recogen datos de variables
clasificadas en categoras.
o

CC. SOCIALES
Y JURDICAS

BAJO

MEDIO
ALTO

=20
120 100
=
=37,5
320
40

CIENCIAS

=40
=37,5
40

As, las tablas de contingencia reflejan una asignacin de


sujetos a grupos y categoras en cada una de las variables.

HUMANIDADES

=60
=45
40

120

Ejemplo: Grado de asociacin entre tipo de estudios y nivel


socioeconmico para 320 sujetos.

120

40

20

20

80

100

100

120

320

4.4 El coeficiente de correlacin biserial-puntual ( ):


Cuando buscamos el grado de relacin que se manifiesta entre una variable
cuantitativa, continua o discreta, y otra autnticamente dicotmica, debemos
recurrir al coeficiente biserial-puntual.
4.5 La regresin lineal simple: Elevando al cuadrado el coeficiente de correlacin obtenemos el coeficiente de
determinacin, que permite conocer el porcentaje de varianza compartida. Esto hace posible
que se puedan estimar los valores de una variable conociendo los valores en la otra: regresin
lineal simple. La recta de regresin (Y = a + bX) nos permite llevar a cabo la prediccin o
estimacin de los valores en una variable (variable criterio) a partir del conocimiento de los
valores en la otra variable (variable predictora), con la que mantiene una alta correlacin.

26

TEMA 8: APLICACIONES DE LA CORRELACIN: FIABILIDAD Y VALIDEZ DE LAS MEDIDAS.


1. INTRODUCCIN:
Caractersticas tcnicas de los instrumentos de medida. Es fundamental que los instrumentos sean precisos en sus
apreciaciones (fiabilidad) y sirva para lo que realmente se disearon (validez). En este tema se abordan 3 cuestiones:
Fiabilidad de los instrumentos.
Validez de los instrumentos (especialmente la validez predictiva).
Anlisis de elementos/tems de una prueba: ndice de Dificultad, ndice de Homogeneidad e ndice de
Validez.
Ojo! No se exigir en el examen el desarrollo paso a paso de los procedimientos de Rulon, KuderRichardson y
Cronbach. Los epgrafes 8.2.2, 8.3.6, 8.3.7 y 8.3.8 quedan eliminados como material obligatorio de estudio.
2. EL ESTUDIO DE LA FIABILIDAD:
La fiabilidad de las medidas se identifica con la precisin, de tal forma que decimos que un instrumento es fiable
cuando mide algo con precisin, independiente de lo que se est midiendo. Aceptar esta definicin lleva consigo
contemplar la posibilidad de error en el momento de medir. Por ello, una puntuacin observada en un sujeto podr
descomponerse en dos partes: la que se corresponde con la puntuacin verdadera y el posible error que se comete.
Se acepta que esos errores los podemos dividir en:
Sistemticos, asociados a las caractersticas internas del instrumento que afectara a todo lo que se mida con
l.
Aleatorios, el error de tipo aleatorio, es debido a aquellas variables cuyos efectos nos resultan desconocidos,
se rigen por la ley del azar: la magnitud de los errores viene condicionada por el margen de error o nivel de
confianza con que el investigador realiza sus apreciaciones.
Cuanto menor sea el error ms fiable es el instrumento. Tambin podemos expresar la fiabilidad como la constancia
en las puntuaciones de los sujetos o bien la concordancia entre varias mediciones sucesivas de una misma realidad;
en cada uno de los casos nos vamos a enfrentar a diferentes procedimientos de clculo de la fiabilidad, aunque en
todos ellos se procede a la obtencin de dos conjuntos de datos a partir de los cuales se puede determinar el
coeficiente de correlacin que estime la fiabilidad del instrumento.
2.1 Procedimientos para determinar la fiabilidad:
a) La fiabilidad como estabilidad: Tambin se la identifica como procedimiento de la repeticin o del test-retest,
dado que se busca la correlacin que existe entre las puntuaciones obtenidas por un mismo grupo de sujetos,
debidamente identificados, en dos aplicaciones sucesivas de una misma prueba en dos momentos diferentes, entre
ambas aplicaciones debe transcurrir un tiempo, que no sea muy corto ni muy largo. Si transcurre poco tiempo los
sujetos pueden recordar las respuestas anteriores. Si transcurre mucho pueden influir los efectos de la maduracin,
la prctica del aula. Se suelen fijar entre 20-25 das de la primera a la segunda aplicacin.
Ejemplo: Prueba de 20 tems. 2 aplicaciones sucesivas a 10 sujetos.

Puntuaciones directas: (se calcula como correlacin)

Muy buena fiabilidad

27

b) La fiabilidad como equivalencia: Tambin denominado de formas paralelas; consiste en aplicar dos pruebas
diferentes pero que miden el mismo rasgo o caracterstica, de tal forma que los resultados de la aplicacin de la
primera prueba se correlacionan con los de la segunda, lo que nos permite calcular el coeficiente de correlacin o
equivalencia entre ambas puntuaciones. Este procedimiento es difcil y complicado, sobre todo por los problemas
que plantea encontrar pruebas equivalentes, que tengan los mismos objetivos y que los contenidos y las condiciones
de aplicacin sean similares. Tambin se utiliza el coeficiente de correlacin de Pearson. Si transcurren ms de 20
das entre la aplicacin de la prueba y la forma paralela, el coeficiente encontrado puede ser considerado como de
equivalencia y de estabilidad.
c) La fiabilidad como consistencia interna: Los instrumentos de medida estn representados por una serie de
elementos o tems bastante amplio; por ello cabe esperar que cada uno de ellos medir una parte de ese rasgo o
caracterstica que mide la prueba en su conjunto; en consecuencia, es lgico suponer que existir una coherencia o
consistencia en las respuestas que ofrecern un conjunto de sujetos a los diferentes elementos que integran tal
instrumento.
Este procedimiento tambin conocido de las mitades nos permite dividir la puntuacin total del sujeto en una
prueba en dos partes (mitades), bien eligiendo como criterio los tems pares y los impares o bien la primera y la
segunda mitad. En realidad obtenemos dos puntuaciones para cada sujeto. En efecto: por un lado est la puntuacin
que corresponde a los tems impares y por otro la de los impares; de tal forma que estableciendo una relacin entre
ambas partes nos dar el coeficiente de fiabilidad como consistencia interna, si bien de un instrumento cuya longitud
es la mitad. Somos partidarios de utilizar este criterio de mitades, pues en muchas pruebas, y con el fin de estimular
las respuestas de los estudiantes, los tems ms fciles se colocan al comienzo de la prueba y los ms difciles al final,
por ello la divisin impares/pares recoger tems del comienzo y del final y ser ms equilibrada que la primera y la
segunda mitad. Existen varios procedimientos para determinar la fiabilidad de una prueba por medio de la
consistencia interna:

Procedimiento de Spearman-Brown: se basa en la correlacin entre las mitades, generalmente mediante el


coeficiente de Pearson, si bien esta correlacin referida a las mitades ha de ser corregida mediante una
frmula sencilla para calcular la fiabilidad de la prueba en su conjunto.
Los subndices son iguales, pues se trata de una correlacin interna, dado que se establece una
relacin entre dos partes de la misma variable.
Adems rxx se calcula mediante el coeficiente de correlacin de Pearson entre las mitades, as llamamos X1 a
las puntuaciones de los tems impares (1.a mitad) y X2 a la suma de los tems pares (2 mitad). Siendo:
Ejemplo: Prueba de 30 tems para una muestra de 12 sujetos. (Pg.
156)

28

Proedimiento de Guttan: Este procedimiento se basa en la varianza de las mitades, de tal forma que a
menor valor las de varianzas ms elevada ser la fiabilidad de la prueba. As pues la frmula de clculo es la
siguiente:

3. EL ESTUDIO DE LA VALIDEZ:
Podemos afirmar que un instrumento es vlido cuando mide lo que dice medir y no otra cosa distinta. Debemos
indicar que ningn instrumento va a ser absolutamente vlido, sino que tendremos que matizar el grado y la
naturaleza de la validez.
En la investigacin socioeducativa existen diferentes enfoques o tipos de validez de los instrumentos de medida y
recogida de datos, en cada caso debemos recurrir a aquella validez que guarda una relacin ms estrecha con el
propio instrumento y la forma en que est configurado, as como la informacin que nos suministra. Seguidamente
pasamos a analizar de forma ms detallada las principales.
3.1 Tipos de validez:
a) La validez de contenido: La muestra ha de ser suficiente y representativa. La suficiencia se relaciona con el
nmero mnimo de elementos que debe incluir el instrumento, para tener garantas de que comprende aquellos
aspectos que son esenciales para el estudio. La representatividad, exige un conocimiento profundo sobre el tema,
de tal forma que esas tareas sean definidas con precisin y claridad, en ese caso ser ms sencillo proceder a la
seleccin de los tems. En el caso de que la relacin entre las tareas no sea tan directa, es conveniente elaborar una
tabla de especificaciones y juicios de expertos. A este proceso se le denomina validacin.
b) La validez predictiva: Nos permite conocer la capacidad que tiene la prueba para avanzar las expectativas sobre
futuros hechos o fenmenos; se pretende establecer predicciones sobre la variable que se mide o bien sobre los
diversos aspectos relacionados con ella. Su clculo se realiza estableciendo una correlacin entre las puntuaciones
alcanzadas en la prueba a validar por un determinado nmero de sujetos y los obtenidos en otra prueba
denominada criterio. Es preciso que todos los sujetos que responden estn previamente identificados, pues se trata
de relacionar las puntuaciones de cada sujeto en las dos pruebas. En la gran mayora de los casos, recurriremos al
coeficiente de correlacin de Pearson.
c) La validez concurrente: Este tipo de validez es una modalidad de la predictiva, pues se calcula mediante una
correlacin entre las puntuaciones de los sujetos en la prueba a validar y el criterio externo. La diferencia estriba en
que ambas mediciones se llevan a cabo en el mismo tiempo, adems los resultados permiten realizar pronsticos a
corto plazo, es decir, de utilizacin inmediata. Mientras que en la predictiva no coinciden la aplicacin de la prueba y
la recogida de datos. En cada caso el investigador tendr que revisar y definir con claridad el objetivo del
instrumento de medida para as elegir aqul tipo de validez que es el ms apropiado en cada situacin.
d) La validez de constructo: Tambin se denomina de elaboracin o de construccin, se refiere al objeto mismo de
la medicin, acude a la base del problema de la validez. Se trata de analizar la conexin que se manifiesta entre la
teora en la que se basa la prueba y los tems que la componen. Ello implica que se deben establecer una serie de
hiptesis iniciales, que, una vez comprobadas empricamente, nos ofrecer tanto la validez del instrumento como la
teora subyacente al instrumento. Cuando las hiptesis no sean confirmadas, se puede deber a que la prueba carece
29

de validez o a que es insuficiente, tambin puede ocurrir que la hiptesis no est bien planteada o que la propia
investigacin no permita validar la hiptesis.
e) La validez aparente: Validez didctica o validez superficial: son aspectos externos cuya influencia puede ser
relevante para alcanzar participacin y respuestas vlidas. Que no haya nada que lo invalide.
4. EL ESTUDIO DE LOS ELEMENTOS O TEMS DE UNA PRUEBA:
Para tener las suficientes garantas cientficas de que la prueba que vamos a aplicar a un grupo de sujetos es la ms
adecuada, es preciso conocer el comportamiento de cada uno de los tems que la componen. As se podrn eliminar
aqullos que no pasen el control o aadir otros que s cumplan esos requisitos. Estos ndices no son aplicables a las
pruebas de medida de actitudes.
a) El ndice de dificultad (ID): La dificultad de los elementos depende del grupo de sujetos que lo conteste y se
expresa numricamente por el nmero de ellos que los resuelven satisfactoriamente, de tal forma que cuando es
contestado bien por un nmero pequeo de sujetos ese tem ser muy difcil y, a la inversa, si prcticamente todos
lo responden acertadamente ese elemento ser muy fcil. El ndice de dificultad (ID) de un elemento o tem nos
indica la proporcin de los sujetos que lo resuelven de forma correcta en relacin con el total de los que lo
contestan.
Cuando se pretende evocar una respuesta, la calificacin final ser igual al nmero de aciertos de cada sujeto, en
este caso los errores no penalizan, por ello el ndice de dificultad se calcula de la siguiente forma:
A nos indica el nmero de sujetos que aciertan el tem.
n el nmero de sujetos que lo intentan.
En el supuesto de que la prueba est compuesta por tems es decir (entre varias opciones) elegir la correcta, los
errores penalizan, pues se deben corregir las respuestas ofrecidas al azar. Puntuacin de un sujeto:
E se refiere al nmero de errores
na es el nmero de alternativas de respuesta que se ofrecen.
Para este caso de elementos de varias alternativas de respuesta la frmula es:
Para proceder a la interpretacin de los ndices de dificultad de los tems hay cinco categoras:
Muy fciles (ID >0,75)

10%

Fciles ( 0,55 < ID < 0,75)

20%

Normales (0,45 < ID < 0,55)

40%

Difciles (0,25 < ID < 0,45)


Muy difciles (ID < 0,25)

20%
10%

0 = muy difcil
1 = muy fcil

Lo ms pedaggico es que los tems fciles se siten al principio de la prueba, y los difciles al final.
b) El ndice de homogeneidad (IH): La homogeneidad de los elementos pone de manifiesto la coherencia de cada
uno de ellos con el total de la prueba: si esta mide un rasgo o caracterstica es lgico que cada uno de los tems
mida hasta cierto punto lo mismo. Se calcula a partir del valor de la correccin entre cada elemento y el conjunto
de los dems, as pues, cuanto mayor es el coeficiente entre ambas puntuaciones, mayor ser la homogeneidad.
c) El ndice de validez (IV): Los elementos de una prueba se consideran vlidos cuando realmente miden lo que dicen
medir y no otra cosa distinta. Ello exige la existencia de una clara relacin entre las puntuaciones obtenidas por los
sujetos de la muestra en cada uno de los tems y las alcanzadas en el criterio de validez: cuanto mayor sea esa
relacin mayor ser el ndice de validez (IV).
30

TEMA 11: ESTIMACIN DE PARMETROS. ERRORES DE ESTIMACIN.


1. INTRODUCCIN:
En este tema comenzamos con la extrapolacin de los resultados obtenidos en nuestras muestras a las grandes
poblaciones a las que pertenece, se hace para sacar una ley sobre lo que se ha conseguido. La Inferencia Estadstica
va ms all de los datos, tiene 2 aplicaciones bsicas:
Estimacin de parmetros.
Contraste de hiptesis.
La Inferencia Estadstica se aplica con frecuencia en nuestra vida cotidiana: encuestas de opinin, encuestas
electorales, estudios de mercado, etc Partiendo de los valores obtenidos en nuestras muestras (estadsticos, media
= ), se estiman esos mismos valores en la poblacin a la que pertenecen (parmetros, media = ).
Ejemplo: Intencin de voto en unas elecciones: El E.M. nos da un 3,1 % y va a asociado a un nivel de confianza
(siempre se da entre 95% y 99%), al pasar los parmetros tendremos que tener en cuenta la horquilla de error.
2. APROXIMACIN INTUITIVA A LA INFERENCIA ESTADSTICA:
La Estadstica es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes de muestras, y de la
realizacin de inferencias acerca de las poblaciones de las que stas proceden.
-

Poblacin: conjunto de todos los elementos que cumplen una o varias caractersticas o propiedades. Los
valores numricos que describen a la poblacin se llaman parmetros (PP).

Muestra: es un subconjunto de los elementos de una poblacin. Los ndices numricos que describen a las
muestras se denominan estadsticos.

La tcnica para seleccionar a los sujetos que entrarn a formar parte de la muestra se denomina muestreo. Siempre
que sea posible debe utilizarse el muestreo aleatorio porque nos da mayores garantas de que la muestra sea
representativa de la poblacin. Lo ms fcil es seleccionar una muestra suficiente en nmero (existen
procedimientos para calcular el nmero de sujetos necesarios) y representativa de la poblacin, que no est
sesgada.
La medicin, es uno de los problemas ms graves en Educacin y en Psicologa. Pensamos que nos estamos
enfrentando en muchas ocasiones a la medida de lo que se denominan constructos, es decir, caractersticas del ser
humano que no son directamente mensurables. Lo que medimos son las manifestaciones observables que
atribuimos a dichos constructos. As, por ejemplo, cuando medimos la inteligencia a travs de un test, lo que
medimos son las manifestaciones observables que tericamente atribuimos a la inteligencia, como la capacidad
verbal, numrica, abstracta, etc., que son ms fcilmente mensurables. Se sigue el mismo procedimiento para
medir el rendimiento acadmico, la memoria, la capacidad de resolucin de problemas, las aptitudes, las actitudes.
La Estadstica inferencial o inferencia estadstica pretende sacar conclusiones sobre el conjunto de datos a travs
de observaciones de parte de esos datos. Mediante ella, se pueden estimar parmetros y realizar contraste de
hiptesis. Es importante notar que se habla de estimacin y no de clculo de parmetros.
Dentro del marco de la Estadstica inferencial suelen distinguirse dos objetos de estudio: la estimacin de
parmetros y el contraste de hiptesis. Un parmetro se estima siempre a partir de un estadstico calculado en una
muestra. Hay dos tipos de estimacin: estimacin puntual y estimacin por intervalos. Bsicamente, en la
estimacin puntual se hace coincidir el estadstico con el parmetro, es decir, se escoge un solo punto (el
estadstico) para estimar el valor del parmetro. Por su parte, en la estimacin por intervalo se ofrece un intervalo
de puntuaciones en el cual es ms probable que se encuentre el valor del parmetro.
31

Ejemplo: Estudiantes de Ed. Social en Espaa aproximadamente N=50.000 CI=107.


Cogemos un subconjunto (de manera aleatoria sera lo ideal) de n=1.000 alumnos.
La muestra tiene que cumplir dos condiciones: tener un tamao suficiente que represente
bien al total de la poblacin y ser representativa (reuna las caractersticas de la poblacin)
Hacemos la medicin de la muestra con los test o escalas que deben ser fiables y vlidos
Sacamos los estadsticos de la muestra ( y S) los anlisis y las representaciones la = 104
Cuanto ms grande y ms representativa sea la muestra, el estdistico estar ms cerca del
parmetro.
Para pasar de la muestra a la poblacin se utiliza la inferencia.
o Estimacin puntual el parmetro es = al estadstico
o Estimacin por intervalo el parmetro es = a lo que ha salido con el nivel de
error como intervalo
= 104 = nivel de error (6) = 104 6 = al intervalo 98 110

3. PROPIEDADES DE LOS ESTIMADORES:


La estimacin consiste en la tcnica que permite conocer el valor aproximado de un parmetro de una poblacin con
una determinada probabilidad a partir de los datos proporcionados por una muestra. Un estimador es un estadstico
muestral que permitir la estimacin de un parmetro poblacional. Estas son las caractersticas que debe poseer un
buen estimador:
Carencia de sesgo: (debe ser simtrico ), podemos decir que un estimador insesgado es aqul que tiene
sesgo igual a cero. La propiedad del insesgamiento nos garantiza que las estimaciones que hagamos con el
estimador se encuentran alrededor del parmetro en cuestin, de forma simtrica, es decir; que el
promedio de los estadsticos coincide con el verdadero valor del parmetro.
Eficiencia: un estimador es tanto ms eficiente cuanto menor es su desviacin tpica. Cuanto ms
estrecha sea, cuanto menor sea su error tpico, ms cercanos estarn los estadsticos al valor del
parmetro.
Consistencia: (A > muestra el estadstico se acercar ms al parmetro) un estimador es consistente si a
medida que aumenta el tamao de la muestra, la probabilidad de que el valor del estadstico se acerque al
valor del parmetro va siendo mayor. Si el valor de N tiende a infinito, un estimador consistente es, a la vez,
insesgado.
Suficiencia: un estimador es suficiente cuando es capaz de obtener de la muestra toda la informacin que
sta contenga acerca del parmetro.
4. DISTRIBUCIN MUESTRAL, ERROR MUESTRAL Y ERROR TPICO: ESTIMACIN DEL PARMETRO MEDIA
ARITMTICA:
Ya nos hemos referido a un tipo de distribucin caracterstica que se denomina distribucin normal o campana de
Gauss. Pues bien, al igual que la distribucin normal, hay otra serie de distribuciones tericas como la binomial, la t
de Student, la multinomial, la F, etc., en las que se conoce la probabilidad de aparicin asociada a todos los posibles
valores.
4.1 Distribucin muestral: Existe un concepto terico de distribucin (funcin de densidad de probabilidad) que es
la distribucin muestral y que puede definirse como la distribucin de un estadstico en el muestreo. Est formada
por los infinitos valores de un estadstico obtenidos de infinitas muestras aleatorias del mismo tamao extradas de
la misma poblacin.
Si nos remitimos a la distribucin muestral de la media aritmtica ( ), est demostrado segn el teorema central
del lmite y para muestras grandes (N > 30), que la distribucin se asemeja a una distribucin normal. Si el
parmetro fuese conocido, comprobaramos como la mayora de las muestras se encontraran cerca del valor del
parmetro, pero precisamente por ser muestras aleatorias, algunas se alejan un poco y otras, muy pocas, se alejan
mucho de ese valor.
32

Por tanto, confiamos en que la muestra elegida sea una de las que el valor de su estadstico est cercano al valor de
, pero no lo podemos asegurar. Por esta razn, en inferencia siempre hablamos de nivel de confianza (porcentaje
de confianza al hacer la estimacin; tambin puede darse en probabilidad y se denomina 1- ) y del nivel de
significacin (probabilidad de error que estamos dispuestos a asumir en la estimacin). Obviamente, se trata de
conceptos complementarios que se refieren a lo mismo.
Al sacar la media de las muestras de 100 sujetos infinitas veces, su
distribucin muestral de la media ser la Campana de Gaus
La S de una distribucin muestral es el Error Tpico
Con muestras de 800 sujetos el disminuye A > muestra ser ms
pequeo.

4.2 Intervalo Confidencial: Para hallar el Intervalo Confidencial, es decir, los valores entre los cuales es ms
probable que se encuentre el verdadero valor del parmetro, necesitaremos calcular la , a la que sumaremos y
restaremos el Error Muestral; es decir, la diferencia ms probable entre el estadstico y el parmetro.

El Error Muestral nos da una idea de la precisin de nuestra inferencia estadstica. Cuanto ms grande sea el Error
Muestral, menor ser la precisin en la estimacin y menor ser la utilidad de la estimacin, para calcularlo
previamente hemos tenido que definir el Nivel de Significacin con el que vamos a realizar la estimacin, calcular
la puntuacin z correspondiente a ese nivel (porque la distribucin es normal) y aplicamos la frmula.
Una distribucin muestral tiene variabilidad, por tanto tendr su
propia Desviacin Tpica , que recibe el nombre de Error Tpico. Es
una medida de dispersin con respecto al parmetro, es decir, nos
indica la dispersin de las infinitas muestras aleatorias extradas
respecto a la . A > muestra disminuye por ello tambin
disminuye el E.M. As mismo en el EM hay que tener en cuenta el nivel de significacin escogido por el investigador
(normalmente = 0,05, que se corresponde a un nivel de confianza del 95%).
Ejemplo 1: Supongamos que hemos aplicado un test de cociente intelectual a una muestra aleatoria de 1.000 adolescentes, para estimar el
cociente intelectual medio de la poblacin de adolescentes.
N=1.000 ; =105; S=10.

Estimar el valor del parmetro (intervalo confidencial) con un nivel de confianza del 99%. IC = EM
Nivel de confianza 1 - = 99% 0,99
Nivel de significacin = 0,01 (error que asumimos) Por tanto, /2 = 0,005.
E.M. = Z(/2) al tener dos colas dejamos la mitad del error en cada lado de la campana
En la media = 105 se encontrara la puntuacin Z=0

Error Tpico = =

Buscamos el valor de Z (Columna C) que deja un rea de la parte menor de 0,005 (/2 ) de tal forma que Z/2 = 2,57
E.M. = Z(/2) = 2,57 0.32 = 0,82

El I.C. ser IC = EM = 105 0,82 dando dos lmites el lmite inferior de 104,18 y el superior de 105,82

= al intervalo 104,18 105,82

Hay que tener en cuenta que si la Desviacin es sesgada la frmula de Error Tpico que se aplicar ser
=
en cambio si es insesgada (N-1 en la S) se coger =

0,32

33

4.3 Estimacin del parmetro media aritmtica para muestras pequeas: Cuando contamos con muestras
pequeas (N < 30), la distribucin muestral de la media sigue la distribucin t de Student. La distribucin t vara en
funcin del nmero de sujetos (y, en consecuencia, de los grados de libertad), aunque se trata tambin de una
distribucin simtrica y asinttica. Cuando N tiende a infinito, la distribucin t tiende a la distribucin z. Solo nos
cambia en este caso el estadstico para calcular el error muestral trabajaremos con t (/2), en lugar de trabajar
con z (/2), (ver tablas).
Ejemplo 2: Supongamos que hemos aplicado un test de cociente intelectual a una muestra aleatoria de 25 adolescentes, para estimar el
cociente intelectual medio de la poblacin de adolescentes.
N=25 ; =105; S=10.

Como la muestra es ms pequea usaremos la t en vez de la Z

Estimar el valor del parmetro (intervalo confidencial) con un nivel de confianza del 99%. IC = EM

Nivel de confianza 1 - = 99% 0,99

Nivel de significacin = 0,01 (error que asumimos) Por tanto, /2 = 0,005.

E.M. = t(/2) al tener dos colas dejamos la mitad del error en cada lado de la campana

En la media = 105 se encontrara la puntuacin t=0

Error Tpico = =

2,04 es un error tpico ms grande que en la anterior muestra

Buscamos el valor de t en las tablas de distribucin de t de Student, debemos mirar en dos colas el valor de , buscamos en la 1
columna y al valor de N le restamos 1 (N-1 =24) es el grado de libertad. Obtenemos que t(/2) = 2,797

E.M. = t(/2) = 2,797 2,04 = 5,71

El I.C. ser IC = EM = 105 5,71 dando dos lmites el lmite inferior de 99,29 y el superior de 110,71

= al intervalo 99,29 110,71


Hemos comprobado que para el mismo nivel de confianza al variar la muestra el intervalo de es ms grande, a muestra ms
pequea (error tpico) se dispara, cuanto ms pequea es S (poblacin muy homogrea) el disminuye.

4.4. Estimacin del parmetro proporcin (): Es un caso particular del anterior, en el que la media oscila entre 0 y
1. En las variables dicotmicas ya vimos que p corresponde a la proporcin de unos y q a la
proporcin de ceros (q = 1-p). En este caso, la p viene dada por la frmula:
El intervalo de confianza se establece igual que en el
caso de la , pero ahora partiendo de una
proporcin. Se emplea el valor de z /2, al nivel de
confianza correspondiente.
El 68,8% y el 61,2 % de la poblacin estn de acuerdo con la
dacin al pago.

5. ESTIMACIN DE LA PUNTUACIN VERDADERA EN UNA PRUEBA:


Anteriormente hemos hablado de la Fiabilidad Absoluta, que es la que est ms directamente relacionada con lo
que conocemos como Error Tpico de Medida y, en consecuencia, con la teora de la inferencia estadstica. Su
utilidad fundamental es la estimacin de la Puntuacin Verdadera de un sujeto en un instrumento o, dicho de otra
forma, entre qu puntuaciones es ms probable que se encuentre su verdadera puntuacin, ya que toda medida
tiene algn margen de error. De nuevo se trata de hallar el intervalo de confianza en el que es probable que se
encuentre la verdadera puntuacin del sujeto en la prueba. Sabiendo que la distribucin muestral es normal,
necesitamos conocer el error tpico de medida:

34

6. INTERVALO DE CONFIANZA DE LA PUNTUACIN ESTIMADA EN LA REGRESIN LINEAL SIMPLE:


Se trata de estimar las puntuaciones en el criterio, conociendo las puntuaciones alcanzadas en la prueba predictora
o antecedente, una vez determinado el coeficiente de validez. Esta prediccin es ms segura y precisa a medida que
aumenta el coeficiente de correlacin (validez predictiva o concurrente) entre las variables. Cuando estimamos las
puntuaciones en el criterio (Y) a partir de las puntuaciones en la prueba (X), no tenemos la seguridad total de que la
puntuacin predicha sea nica y siempre la misma. Es decir estamos haciendo una estimacin (Y) que conlleva un
error: Error de estimacin = Y Y. As, cada prediccin lleva asociado un error de estimacin.
La desviacin tpica de los errores de estimacin es lo que recibe el nombre de Error Tpico
de Estimacin ( est).
7. ESTIMACIN DEL PARMETRO CORRELACIN DE PEARSON:
En muchas ocasiones, cuando calculamos una correlacin, en realidad estamos ms interesados en la relacin que
existe entre esas variables en la poblacin que en la muestra. Se trata de calcular el intervalo de confianza para la
correlacin de Pearson, de modo que podamos estimar entre qu valores se encuentra dicho coeficiente entre la
poblacin. Sabemos que la distribucin muestral de la correlacin de Pearson se asemeja a la distribucin normal
con el siguiente error tpico:
Para muestras grandes (N > 100)

Para

muestras

pequeas

Y como ya es habitual donde

7.1 Significacin o significatividad estadstica: Hablamos de significacin estadstica cuando nos referimos al
significado de la diferencia entre dos medidas. Decimos tambin que un coeficiente de correlacin es
estadsticamente significativo cuando es distinto de cero, es decir, cuando el coeficiente de correlacin (estadstico)
es lo suficientemente grande como para decir que la correlacin en la poblacin (parmetro) de referencia es
distinta de cero. Si queremos conocer cul es su magnitud en la poblacin, entonces calcularemos el Intervalo de
Confianza.
Cuando estimamos el Intervalo de Confianza en el cual es probable que se encuentre la verdadera correlacin en la
poblacin, y este intervalo contiene el valor cero (ausencia absoluta de correlacin) diremos que dicha correlacin
NO es estadsticamente significativa. Hay que ser cuidadosos en
la interpretacin, cuando decimos que una correlacin no es
estadsticamente significativa:
Una correlacin no significativa simplemente es una
correlacin que no podemos generalizar.
Una correlacin no significativa no es prueba de no
relacin.
(NO PROBAR QUE HAY RELACIN PROBAR QUE NO HAY RELACIN)

35

8.

ESTIMACIN DEL PARMETRO DIFERENCIA DE MEDIAS (1 2):

Si una universidad encuentra que el CI medio de sus estudiantes es de 110, y otra universidad lo tiene de 105, cmo
es la diferencia entre estas dos puntuaciones en la poblacin de referencia? La diferencia entre estas dos
puntuaciones es estadsticamente igual a cero? Si dicha diferencia es compatible con una diferencia igual a cero,
concluimos que ambas muestras tienen el mismo CI, al nivel de confianza fijado, y que la diferencia encontrada es
aleatoria.
Si establecemos el Intervalo de Confianza a partir del estadstico diferencia de medias, obtendremos los lmites
confidenciales entre los cuales es ms probable que se encuentre la diferencia de medias en la poblacin. Si este
intervalo incluye la puntuacin cero, entonces dicha diferencia es compatible con una diferencia de medias igual a
cero, y en consecuencia, podremos interpretar que dicha diferencia es estadsticamente igual a cero.

Al ser el intervalo
incompatible con el valor
cero, concluimos que la diferencia marcada es estadsticamente significativa, es decir, que las
diferencias de medias en CI entre ambos grupos no son aleatorias. Otra explicacin diferente del
ejemplo:

8.1 Estimacin del parmetro diferencia de proporciones (1 2): Lo nico que vara en este caso es el error tpico.
Al igual que en el contraste de medias, lo ms interesante suele ser la diferencia entre dos proporciones. El error
tpico de la diferencia de proporciones es:
Y la estimacin del intervalo de confianza y su interpretacin ser la misma que en el caso anterior, pero con
medias en trminos de proporcin, que frecuentemente se multiplican por 100 para convertirlos en porcentajes.

36

9. ESTIMACIN DE PARMETROS Y CONSTRASTE DE HIPTESIS: INTERPRETACIN INTUITIVA:


Todo se reduce al contraste de una hiptesis estadstica,
denominada hiptesis nula (Ho), segn la cual NO existen
diferencias estadsticamente significativas. Se afirma en ella que no
hay efecto presente de la variable independiente sobre la variable
dependiente.
Se establece una zona central alrededor de la media en la curva
normal, en la que es ms probable que las diferencias encontradas
entre las medias de las muestras se deban efectivamente a los efectos del azar. Es la zona de aceptacin ( de no
rechazo) de Ho. Por tanto, al no poder rechazar la Ho, decimos que no es falsa.
Queda de forma inmediata otra zona (bilateral o unilateralmente) en la que las diferencias entre las medias resulta
muy improbable (al nivel de confianza establecido) que sean aleatorias, por lo que dichas diferencias se atribuyen a
los efectos de la VI.
La H0 se expresa as:
Hiptesis nula H0: 1 - 2 = 0 las diferencias entre las de los grupos o muestras son estadsticamente
iguales a cero; o bien, que las diferencias empricas que existen entre las de las muestras se deben al azar; o
bien, que los valores paramtricos son iguales; o bien, que ambas muestras pertenecen a la misma poblacin.
Las frmulas para hallar el intervalo de confianza son las mismas que el epgrafe anterior, para muestras grandes y
pequeas.
Si resulta que nuestra diferencia emprica de medias se encuentra dentro del intervalo de confianza de la
distribucin muestral conforme a H0, diremos que nuestra diferencia de medias es compatible con una diferencia de
medias igual a cero, y por tanto, que se trata de una diferencia estadsticamente no significativa o igual a cero. Lo
que haremos despus ser calcular un estadstico (t, z, etc.) que nos dir cuntas desviaciones tpicas (errores
tpicos) se aleja nuestra diferencia de medias de una diferencia de medias igual a cero.

37

TEMA 12: INTRODUCCIN AL CONTRASTE DE HIPTESIS


1. INTRODUCCIN:
La media muestral puede ser utilizada para hacer inferencias sobre los valores probables de una media poblacional
desconocida . Los valores de la media muestral , pueden ser usados para probar hiptesis sobre un valor
especfico a travs del uso de la prueba de significacin de la hiptesis nula (PSHN). El proceso de seleccin de la
muestra y sus condicionantes es decisivo en las decisiones e interpretacin de los resultados tras el contraste de
hiptesis.
2. LOGICA DE LA PRUEBA DE SIGNIFICACIN DE LA HIPTESIS NULA (PSHN):
La H0 representa la no relacin entre las variables que estamos estudiando (VI y VD), es la hiptesis de las no
diferencias, no hay diferencias en los niveles de la VD en funcin de la VI, en un diseo experimental significando que
la VI no produce ningn resultado efecto en la VD. La H0 tiene dos propsitos bsicos:
Sirve como punto de partida cuando no tenemos conocimiento o no hay razones para no creer que existen
diferencias entre los grupos que estamos comparando, debemos asumir como punto de partida que no las
hay, adems asumimos que las diferencias que encontramos son casuales, se obtuvo por casualidad o azar.
El azar explica lo que no tiene otra explicacin razonable.
Es un punto de referencia para comparar los resultados obtenidos y deducir si las diferencias observadas
pueden atribuirse a algn factor distinto a la casualidad. La H0 ayuda a definir un intervalo en el que
cualquier diferencia observada entre los grupos se puede atribuir al azar o casualidad, y otro intervalo de
valores en el que dicha diferencia quizs se deba a otro factor distinto del azar, pudiendo ser la manipulacin
de la VI que ejerce sobre la VD.
Los valores de la Media Muestral pueden usarse para probar las hiptesis sobre un valor especfico de una media
poblacional desconocida a travs del uso de PSHN, segn los siguientes pasos:
1. El investigador hace una conjetura sobre un valor especfico de un parmetro (digamos ) para una
poblacin de inters. El efecto que el investigador trata de detectar es la diferencia entre la media
poblacional desconocida () y la media poblacional hipotetizada.
2. Se selecciona una muestra aleatoria de la poblacin.
3. El investigador compara la media observada , con la media hipotetizada de la poblacin . El intervalo de
valores establecidos como improbables viene dado por el nivel elegido de significacin , y por la eleccin
del tipo de contraste, una cola o de dos colas. De modo general podr decir que los valores cuya
probabilidad de aparicin es igual o menor de 0,05 (es decir aparecen 5 veces de cada 100 sucesos), cuando
la H0 es verdadera son considerados improbables.
4. Evaluacin de la probabilidad asociada al valor emprico obtenido, supuesta H0 verdadera. Basandonos en la
Distribucin muestral terica del estadstico, la media, sabemos que su distribucin muestral puede ser la
distribucin normal, para evaluar que lejos esta del valor hipotetizado nos basamos en el error tpico,
medimos dicha distancia en unidades de error tpico. La distancia entre y hipotetizado es llamada puntuacin
tpica estandarizada (t, Z) cuya distribucin muestral es la distribucin normal, de modo que podemos
conocer las reas o la probabilidad de obtener cualquier valor de Z o t usando las tablas.
En los diseos de dos grupos, ser la Diferencia de medias de los dos grupos sometidos a contraste, mientras que
hipotetizado ser la medida hipotetizada segn la distribucin muestral de diferencias de medias que no es otra que
H0: 1 - 2 = 0. El Error Tpico a su vez ser sustituido por el Error Tpico de Diferencias de Medias.
Ejemplo: Comparar la media en rendimiento lector obtenida con un mtodo experimental con la media obtenida con
el mtodo tradicional.
Cuando obtenemos el valor de Z o de t es fcil responder a la pregunta puede considerarse la media obtenida en la
muestra como un resultado probable o improbable? El valor emprico de Z que estandariza la distancia entre nuestro
38

valor muestral y el hipotetizado segn H0, dicho de otra forma, el valor muestral obtenido una vez estandarizado
(Convertido en Z) y situado en una distribucin muestral que incluye infinitos valores de est cerca o lejos del
valor hipotetizado conforme H0? Cuanto ms lejos est el valor de del valor hipotetizado, ms grande ser el valor
de Z y en consecuencia, menor ser su probabilidad de aparicin si H0 es verdadera. El valor de Z nos indica dicha
distancia en nmero de errores tpicos.
La idea bsica de la PSHN es que el investigador asume un valor para la media pobacional desconocida hipotetizado,
despus obtiene una media muestral , y la evalua conforme a la distribucin de valores de que cabra esperar si
la H0 es verdadera. El investigador decidir si rechazar o no rechazar la H0 como inadmisible, dado el valor obtenido
de :
Cuando el valor de la es un valor que puede ocurrir probablemente por casualidad cuando la H0 es
verdadera entonces la decisin es No Rechazar la H0.
Si es improbable que ocurra por casualidad o azar cuando H0 es verdadera, el investigador puede decidir
rechazar la H0
Se estima que es improbable que ocurra por azar, dependiendo del valor de que hayamos establecido a priori, la
condicin de rechazo es: Rechazamos la H0 si p (t,Z, F)
Esta forma de actuar ha sido criticada especialmente porque en la investigacin real no se cumplen los supuestos
que rigen la lgica de la PSHN, en especial la ausencia de una poblacin claramente definida, la seleccin de una
muestra aleatoria y la realizacin de una nica prueba de significacin. En el campo de la Educacin conviene
plantearse los resultados obtenidos ms como evidencia acumulativa que como prueba irrefutable, ser de gran
ayuda recurrir a ndices complementarios como la magnitud del efecto.
3. NIVEL DE SIGNIFICACIN ESTADSTICA ERRORES TIPO I Y TIPO II.
El nivel de significacin , se conoce como error Tipo I: probabilidad de rechazar la H0 cuando es verdadera. Al
decidir si rechazamos o no la H0 puede ocurrir:

Decisin del
investigador

Rechazar H0
No Rechazar H0

Lo que de hecho sucede en la investigacin


H0 es verdadera
H0 es falsa
Error Tipo I nivel de Decisin correcta (1-) potencia
significacin
estadstica
Decisin correcta (1-)
Error Tipo II ()

Error Tipo I Rechazar la H0 cuando es verdadera Falso Positivo. Nos lleva a afirmar que un mtodo de
enseanza de matemticas es mejor que otro cuando lo cierto es que no hay diferencias en los resultados de
aprendizaje que producen. Estaramos afirmando que la diferencia de medias en el grupo experimental y el grupo de
control es lo suficientemente grande como para considerar que los grupos provienen de poblaciones con el
parmetro diferente, cuando la realidad es que la diferencia obtenida entre las medias es aleatoria, debida a
errores de muestreo y ambas muestras pertenecen a la misma poblacin.
Error Tipo II () No Rechazar la H0 cuando es falsa Falso negativo. Nos lleva a concluir que el nuevo mtodo de
enseanza de matemticas no eleva significativamente el rendimiento en matemticas de los alumnos cuando en
realidad produce mejores resultados que el tradicional. El error tipo II coincide con la probabilidad de no rechazar H 0
cuando esta es realmente falsa. El riesgo de cometer un error tipo II depende de: la muestra, el ms importante,
junto con el verdadero tamao de efecto en la poblacin y el propio valor de . Cuanto ms grandes sean cada uno
de estos tres valores, ms pequeo ser el error tipo II.
La potencia estadstica (1-) o Potencia de una prueba Probabilidad de rechazar la H0 cuando esta es realmente
falsa (Decisin Correcta). La potencia de la prueba se utiliza para conocer el tamao que tendra que tener nuestra
39

muestra si queremos alcanzar un determinado valor de , dado y un valor previsto para el tamao del efecto. Los
factores que reducen el error tipo II permiten elevar la potencia estadstica. Ejemplo: Si la potencia de una prueba
deseable es 0,80 = 0,20
Los investigadores desean mantener ambos errores tan bajos como sea posible, el valor terico del Error Tipo I lo
establece el investigador, entre 0,01 y 0,05. Al obtener un valor de nuestro estadstico de contraste (t,Z,F) que
estandariza las diferencias empricas encontradas podemos saber la probabilidad de obtener por efecto del azar una
diferencia tan grande como la obtenida, una probabilidad pequea o inferior a nos indica que sera muy
improbable que dicha diferencia sea aleatoria (podra darse el caso es un error posible pero improbable). Esto es
cierto mientras se cumplan los rigurosos supuestos para aplicar la PSHN. Si se violan el valor del error tipo I puede
ser mayor que el definido por el investigador.
La decisin sobre el valor que debemos dar a no es fcil, depender del tipo de variables que estn en juego,
aunque es poco frecuente utilizar valores superiores a 0,05, siendo una prctica comn utilizar el valor exacto de p.
4. LOS PASOS DEL CONTRASTE DE HIPTESIS
El proceso y la lgica de la investigacin cientfica parte de la definicin de un problema cientfico, tras la revisin del
estado de la cuestin, el investigador formula una hiptesis como solucin tentativa al problema. El paso decisivo
consiste en validar la hiptesis, realizando el contraste estadstico de hiptesis, un proceso bsico que deberemos
seguir para llegar a unos resultados fiables e interpretables.
4.1 Seleccin de una muestra aleatoria: para estudiar el efecto de un programa para la mejora en el rendimiento
lecto-escritor podemos realizar un diseo de dos grupos:

Grupo Experimental: Aplicamos el programa y despus le pasamos una prueba.


Grupo de control: no se le pasa el programa pero si se le aplica la prueba.
La poblacin de referencia supongamos que es los alumnos espaoles de tercer curso de educacin primaria,
seleccionaremos una muestra aleatoria dos muestras de tamao n y asignaremos aleatoriamente los tratamientos a
los grupos. Una vez aplicado los programas a comparar, obtendramos las puntuaciones a partir de las cuales se
calcularn las medias aritmticas de cada grupo.
4.2 Formulacin de las hiptesis Estadsticas: ahora el investigador trasladar su hiptesis sustantiva o textual a
hiptesis estadsticas.
4.2.1 Formulacin de la H0: formulamos la hiptesis que se somete a contraste. La H0 afirma: no hay efecto
presente (efecto entre la variable independiente sobre la variable dependiente). Plantea la NO existencia de
diferencias entre los grupos sometidos. Podra ser: No existen diferencias estadsticamente significativas
entre las medias aritmticas de los grupos en rendimiento lecto-escritor en funcin del programa utilizado.
H0 : Exp - control = 0
H0 : Exp = control
Las diferencias entre las medias de los grupos experimental y control son estadsticamente igual a 0, las
diferencias empricas que existan entre las medias se deben al azar, los valores paramtricos son iguales o las
dos muestras pertenecen a la misma poblacin.
4.2.2 Formulacin de la Hiptesis Alternativa H1: llamada la hiptesis del investigador, dependiendo de la
formulacin de la hiptesis sustantiva la H1 puede ser:
Unilateral (unidireccional o de una cola) el investigador la plantear cuando tiene evidencias para
hipotetizar qu grupo de los que estamos comparando, obtendr una media superior. Se formular:
H1 : Exp - control > 0
H1 : Exp > control
40

Se espera que la media en rendimiento del grupo sometido al tratamiento experimental sea superior a
la de control. El contraste unilateral puede ser:
o Derecho, cuando la diferencia esperada sea positiva llamada hiptesis unilateral derecha, ya que
la regin de rechazo de la H1 estar en el extremo derecho en torno a los valores altos.
o Izquierdo, cuando la diferencia esperada sea negativa llamada hiptesis unilateral izquierda (la
regin de rechazo estar en el extremo izquierdo de la distribucin muestral en torno a los
valores bajos.)
Bilateral (bidireccional o de dos colas): cuando esperamos que haya diferencias entre los dos grupos
pero no sabemos a favor de cual. Se podra formular: Existen diferencias estadsticamente significativas
entre las medias aritmticas de los grupos en rendimiento lecto-escritor en funcin del programa
utilizado. Este contraste es ms exigente porque implica repartir la probabilidad de error entre las dos
colas de la distribucin, haciendo dividir por dos el valor de .
H1 : Exp - control 0
H1 : Exp control
4.3 Eleccin del valor de alfa () o nivel de significacin: se habla de valor nominal de alfa porque es el investigador
el que lo nomina, establece este valor como umbral para permitir un juicio sobre la significacin estadstica de las
diferencias. Los ms utilizados son 0,05 y 0,01, el investigador por las caractersticas de su estudio y sus
repercusiones, puede necesitar reducir al mximo el error tipo I y establecer valores inferiores como = 0,001 o
tambin en investigaciones con muestras pequeas puede decidir utilizar un =0.1.
4.4 Determinacin de la distribucin muestral y la regin de rechazo: Punto clave en la comprensin y acierto en la
decisin estadstica. En un paso previo al contraste estadstico, habremos apuntado el diseo de investigacin, que
puede tratarse de un diseo experimental de dos grupos. En este tipo de diseo para muestra grande la prueba
estadstica de contraste es la z o la t de Student.
Si elegimos la Z (muestras de ms de 30 sujetos) responde a una distribucin normal, en un contraste de dos grupos
el estadstico Z nos estandariza las diferencias entre las medias de los grupos con respecto a una diferencia igual a 0,
respecto a la diferencia hipotetizada en la H0 (H0 : Exp - control = 0). Si dibujramos la distribucin normal conforme a
H0 estara formada por los infinitos valores de exp - control obtenidos en infinitas muestras aleatorias extradas de la
misma poblacin que toma la forma de la curva normal.
Si la H0 es verdadera, la mayora de las diferencias seran igual o prximas a 0, disminuyendo la altura de la curva
segn nos alejamos del cero. Esta distribucin muestral indicara la No Existencia de Diferencias Estadsticamente
Significativas. Es una distribucin muestral que indica que todas las diferencias encontradas entre dos sucesos se
deben al azar.
La distribucin muestral tiene una desviacin tpica que se denomina Error Tpico , podemos saber cuntas
desviaciones tpicas se alejan nuestra puntuacin emprica de la media de la distribucin. El estadstico de contraste
Z nos indica cuantos errores tpicos se desva nuestra diferencia de medias de una diferencia de medias igual a 0 o
menor que el definido por el investigador, diremos que es lo suficientemente improbable para considerar que
dicha diferencia no es aleatoria sino que se debe a otro factor distinto del azar y que atribuimos generalmente a la
variable Independiente.
La regin de rechazo de H0 estar formada por todos los valores del estadstico de contraste cuya probabilidad de
aparicin asociada sea menor o igual que o /2 si es contraste bilateral. Rechazamos la H0 si p (t,Z, F) . Esta es
la esencia del contraste estadstico de hiptesis, algunos autores para tomar la decisin estadstica comparan el
valor del estadstico emprico de contraste (el que obtienes al aplicar la formula de Z, t o F) con el llamado valor
crtico del estadstico que es el valor correspondiente al nivel de significacin. Ejemplo: para un contraste bilateral
con = 0,05 y /2 = 0,025 le corresponde un valor crtico de Z de 1,96, quiere decir que si nuestro estadstico es
mayor que 1,96 rechazaremos la H0.
41

4.5 Utilizacin del valor exacto de p: El valor de se establece a priori, antes de calcular la probabilidad asociada al
estadstico de contraste, p es la probabilidad exacta asociada al estadstico de contraste obtenido a posterior. Indica
la probabilidad de obtener un valor tan extremo o ms que el valor observado obtenido al calcular el estadstico de
contraste (Z, t, F) asumiendo que la H0 es verdadera.
Mediante el nivel de significacin, llegamos a una decisin binaria, rechazamos o no la H0. Con el valor exacto de p
damos una informacin ms precisa, nos dice si es mayor o menor que el nivel de significacin y adems la
probabilidad exacta de obtener un valor igual o superior al observado si la H0 es verdadera. Nos permite juzgar si
hubiramos podido rechazar H0 en caso de que se hubiera elegido un ms exigente. Muchas revistas de
investigacin de educacin exigen a los autores informar del valor exacto de p en sus artculos.
5. ERRORES FRECUENTES EN LA UTILIZACIN E INTERPRETACIN DE RESULTADOS DE LA PRUEBA DE
SIGNIFICACIN DE LA HIPOTESIS NULA.
La PSHN se basa en la asuncin de una serie de condiciones:
Se ha realizado un muestreo aleatorio de N observaciones.
Las puntuaciones de la variable dependiente son cuantitativas y su nivel de medida es al menos de intervalo.
La distribucin de la variable dependiente es normal
El investigador debe seguir rigurosamente los pasos definidos para la comprobacin de la hiptesis.
El investigador debe realizar solo uno o un nmero limitado de contrastes en el mismo estudio.
En la prctica de la investigacin educativa los investigadores violan dichos supuestos afectando gravemente al error
tipo I elevndolo por encima del alfa nominal. El investigador educativo debe conocer los supuestos que se deben
cumplir para contrastar la H0 as como lo que de hecho se hace en la prctica de la investigacin educativa y los
efectos de dicha prctica a la hora de interpretar los resultados. Las investigaciones en educacin raramente
pueden obtener una muestra aleatoria de una poblacin bien definida, as se incumple una de las condiciones
fundamentales para tomar de referencia la distribucin muestral conforme a H0. Esta limitacin debe estar reflejada
en los artculos, su incumplimiento puede invalidar el proceso de contraste de hiptesis, debemos definir la
poblacin de referencia y procurar que la muestra sea representativa de dicha poblacin, si queremos realizar
inferencias posteriores. Se habla de una hipottica poblacin de referencia de sujetos similares a los de la muestra
de investigacin, muestra que es incidental o de conveniencia.
Otro error frecuente es no tener en cuenta la repercusin de realizar un gran nmero de contrastes en un mismo
estudio. Por ejemplo, hemos aplicado una escala de actitudes de 100 tems y queremos ver si en cada uno de ellos
hay diferencias, entre las medias obtenidas entre hombres y mujeres, solo por error de muestreo sera esperable,
supuesto un = 0,05 (que en 5 de esos 100 contrastes obtuviramos una diferencia de medias significativas cuando
en realidad no la hay), tendramos un riesgo inflado de error tipo I. Existen procedimientos para estimar el nuevo
que deberamos considerar al aumentar el nmero de contrastes como el de Bonferroni.
Para reducir algunas de las complicaciones se realizan diversas prcticas como la Replicacin del Estudio, que est
dirigida a conseguir mayor grado de certeza en las evidencias obtenidas en una lnea de investigacin, es necesario
que otros grupos de investigacin utilizando nuevas muestras y repitiendo el estudio lleguen a la misma decisin
estadstica, produciendo as evidencias ms conclusivas y reduciendo la posibilidad de error tipo I. El mtodo de la
Validacin cruzada supone obtener de nuestra muestra de estudio una submuestra utilizando un porcentaje
determinado de la muestra inicial.
Es necesario ser conscientes de las graves implicaciones del no cumplimiento de los supuestos para realizar el
contraste estadstico de hiptesis, debemos ser ticos a la hora de hacer nuestros estudios y comunicar los
resultados de los mismos, y saber ser crticos con los resultados.
42

La interpretacin de resultados, habitualmente habla de aceptar o rechazar la H0 en realidad se debe hablar de


Rechazar o de No Rechazar la H0 , podemos rechazarla si cumple dicha condicin pero si no se cumple, simplemente
no la rechazamos, esta es la distincin entre aceptar y no rechazar, es importante porque puede haber razones que
expliquen que un resultado ha sido estadsticamente no significativo cuando en realidad si lo es (cuando concluimos
que no hay diferencias entre dos grupos, puede ser que si las haya en la poblacin. Adems del error de muestreo
tambin influye el tamao de la muestra. Cuando es demasiado pequea resta potencia estadstica a la prueba de
contraste y entonces necesitamos diferencias muy grandes para concluir que rechazamos la H0 (cuanto ms pequea
la muestra ms fcil es que la muestra est sesgada, que no sea representativa de la poblacin y por tanto habr que
encontrar diferencias muy grandes para poder generalizar que en la poblacin de referencia tambin hay
diferencias. En muchas ocasiones que no hemos rechazado la H0, bastara haber tenido una muestra ms grande
para haberla rechazado. Cuanto ms grande es el tamao muestral, ms fcil es obtener una diferencia
estadsticamente significativa, aunque las diferencias entre las muestras sean pequeas.
Otra explicacin es que no se eligieron o no se manipularon bien los niveles de la variable independiente (Ejemplo,
que los programas de enseanza son tan parecidos que no permiten mostrar las diferencias). Tambin que estemos
midiendo inadecuadamente la VD (poca fiabilidad y validez) o que sea insensible a los efectos de la VI. Concluimos
que en las condiciones que hemos realizado la investigacin no podemos rechazar la H0, no quiere decir que no sea
cierta o aceptemos la hiptesis nula porque en otras condiciones podramos haber llegado a rechazarla.
La interpretacin de un resultado estadsticamente significativo tambin se debe hacer con cautela. Debe tenerse en
cuenta todos los supuestos comentados para aplicar la PSHN. Ademas tener en cuenta algunos efectos indeseados
que afectan a la validez interna, como la expectativa del investigador a probar su hiptesis o que tenga xito el
tratamiento experimental. Debe considerarse a posibilidad de que nuestra VI correlacione altamente con otra VI no
tenida en cuenta y que esta ltima en realidad sea la que produce efectos en la VD. Para evaluar si un valor de p
aporta una informacin precisa acerca de la magnitud del riesgo de cometer un Error Tipo I, los investigadores
necesitan:
Comprender la lgica de los condicionantes de la PSHN
Reconocer los procesos que pueden violar dichos condicionantes en sus estudios
Darse cuenta de cmo dichas violaciones pueden hacer que los valores nominales de p sean estimaciones
imprecisas del verdadero riesgo de Error Tipo I.
Los Anlisis Alternativos a las pruebas de significacin: Intervalo de Confianza, Tamao del Efecto, Anlisis de la
Potencia, Metanlisis e Inferencia Bayesiana.
6. EL TAMAO DEL EFECTO
La significatividad estadstica no dice nada acerca de la magnitud o relevancia prctica o clnica de las diferencias
encontradas. Una diferencia estadsticamente significativa no dice que la importancia sea importante sino que
existen diferencias en la poblacin de referencia aunque en la prctica sea irrelevante.
La significacin estadstica sola no dice gran cosa para tomar decisiones en la prctica, tampoco
permite comparar decisiones entre distintas investigaciones cuando la unidad de medida vara.
Por ello se usa como indicador complementario a la significacin estadstica el Tamao del
Efecto, siendo la d de Cohen el ndice ms utilizado, que muestra el tamao del efecto como
una diferencia tipificada (t, Z, F) donde el numerador es la diferencia de las medias entre los dos
grupos y el denominador es una desviacin tpica combinada (la combinacin de las desviaciones tpicas de los
grupos a comparar). d indica cuantas desviaciones tpicas se aparta una media aritmtica de la otra. Los valores
sugeridos para interpretar el valor de d son:

43

Otra interpretacin, si consideramos: La menor como el valor que representa al sujeto medio del grupo 1 y la
mayor como el valor que representa a un sujeto medio del grupo 2. Suponiendo que ambos sujetos medios
pertenecen a grupos que se distribuyen segn la curva normal, si el valor de d = 0,5, podemos decir que el sujeto
medio del Grupo 2 esta media desviacin tpica (0,5) por encima que el sujeto medio del grupo 1. En las tablas de
la curva normal, vemos que una z= 0.5 le corresponde un rea hasta la media de p=0,1915 lo que puede
interpretarse: un sujeto medio del grupo 2 supera en 19 percentiles (19,15%) al sujeto medio del grupo 1.
Otra forma de interpretar es mediante una Correlacin Biserial Puntual, la variable X sera dicotmica, pertenecer a
uno de los dos grupos, la Y sera continua, la media de la VD. La interpretacin es la misma que un coeficiente de
correlacin rbp, transformamos la t de student en otro valor que nos da la idea de la fuerza de la relacin entre la VI y
la VD y nos permite comparar tambin los resultados en distintos estudios.
Es importante combinar los resultados de la significacin estadstica y el tamao del efecto, de esta forma
valoraremos con ms precisin los resultados, adems ser consciente de que pueden obtenerse resultados
contradictorios, rechazar la H0 y un obtener un tamao del efecto poco relevante (sucede en muestras muy grandes)
o aceptar la H0 y obtener un tamao del efecto muy relevante (muestras pequeas).
7. CONTRASTE DE HIPTESIS EN LOS DISEOS DE DOS GRUPOS
En la investigacin, puede interesar conocer los efectos de una variable, la independiente en otra que recibe su
influjo, dependiente.
Variable Independiente: Caracterstica que el investigador observa o manipula deliberadamente para
conocer su relacin o influencia sobre la VD, en una relacin causal la VI es la causa y la VD el efecto. La VI
es el estmulo, el tratamiento o la situacin experimental.
Variable Dependiente: Caracterstica cuyas variaciones se espera que se produzcan por efecto de la VI, son
observables y medibles, tambin llamada variable de medida.
Variable de control, Moderadoras o Controladas: aquellas que sabemos que tienen influencia en la VD y
controlamos para que los cambios que se produzcan en la VD los podamos atribuir en la VI.
Variable Extraa: Las que intervienen en el experimento pero se escapan al control del investigador.
Se busca saber si es cierta la relacin Causa - Efecto VI VD.
Ejemplo: Conocer si un mtodo de enseanza (VI) es eficaz para conseguir mejor rendimiento en matemticas
(VD).
Para resolver este problema es mediante el diseo de dos grupos uno experimental (aplico el tratamiento) y
otro de control (no se le aplica, se usa como comparacin).
Despus de aplicar el tratamiento, controladas el resto de variables intervinientes se comparan los grupos en
la VD para ver si la VI produce o no efectos en la VD.
Entendemos por el Diseo: el plan (Esbozo del proyecto), estructura (esquema) y estrategia (recogida y anlisis de
datos) de investigacin concebidos para obtener respuesta a las preguntas de investigacin y controlar la varianza
de la VD, que causas producen las variaciones. Hay dos tipos Bsicos:
Experimental: aquellos en los que existe manipulacin y control de la VI, cuando se aplica un tratamiento
que el investigador ha establecido sus caractersticas y condiciones. Hay una seleccin aleatoria de sujetos a
partir de los sujetos de la poblacin y seleccin aleatoria en la asignacin de los tratamientos a los grupos.
(Trabajo)
No Experimentales, ExPost-Facto o Correlacionales: los que no tienen manipulacin ni control de las VI
porque ya acontecieron sus manifestaciones o por ser intrnsecamente no manipulables. No puede haber
grupo Experimental y Grupo de control, solo se comparan las medias en funcin de una variable de
clasificacin que ya ha acontecido. Las variables son no manipulables. En estos casos las inferencias sobre
las relaciones entre la VI y la VD se hacen a partir de la variacin comn de las mismas por lo que no se
puede hablar de causa efecto (Ejemplo: Diferencias entre Repetidores y Nuevos alumnos)
44

PASOS DEL PROCESOS DE INVESTIGACIN


Formulacin del problema: La investigacin se inicia con el planteamiento de un problema al que queremos dar respuesta
(problema que pueda resolverse).
Revisin de la bibliografa del estado de la cuestin: Lo que se ha analizado para aplicar los hallazgos a los que han llegado
otros.
Definicin de las Variables: Se definirn cules son las variables que intervienen
Formulacin de Hiptesis: Se formula la hiptesis con la solucin ms probable al problema planteado, si puede hacer de
manera sustantiva pero es conveniente transformarla a hiptesis estadstica para poder contrastarla mediante la PSHN
Diseo de la investigacin: Es el plan, estructura y estrategia de investigacin concebida para dar respuesta a preguntas de
investigacin y controlar la varianza.

Plan: Esbozo general del proyecto incluye la formulacin de la hiptesis hasta el anlisis de los datos.

Estructura: es el esquema de lo que se har con las variables.

Estrategia: los mtodos de recogida y anlisis de datos.


El diseo se refiere al procedimiento ms adecuado para contrastar nuestra hiptesis. Los diseos no experimentales no
hay grupo experimental porque no hay posibilidad de manipular la VI
Contraste estadstico de hiptesis:
- Formulacin de las hiptesis estadsticas: H0 y H1
- Eleccin de la prueba estadstica adecuada: depender del tipo de diseo, en el de dos grupos independientes
establecidos por la variable de clasificacin que es la VI (son independientes porque pertenecer a un grupo es
independiente de pertenecer a otro, a diferencia de los correlacionados mismo grupo con pre test y post test.).
Existen dos tipos de pruebas: Paramtricas y no paramtricas. Las paramtricas, son las ms potentes para rechazar la
H0, por ello son preferibles, para usarlas se debe cumplir:
1. Nivel de medida de la VD debe ser de Intervalo o Razn.
2. Normalidad de la distribucin en la poblacin, la distribucin de la VD en la poblacin se distribuye a
2
travs de la curva normal, se comprueba con el test de X o el de Kolmogorov-Smirnov.
3. Homocedasticidad de las varianzas poblacionales: Igualdad en las varianzas, los dos grupos que
comparamos tienen varianzas estadsticamente iguales o pertenecen a la misma poblacin de varianza
2
. Se prueba con el test F de Snedecor o con la F de Levene.
Siendo puristas, si no se cumplen estas condiciones no se puede utilizar una prueba paramtrica, en la mayora de las
investigaciones es complicado cumplir estas condiciones sobre todo por los problemas en la seleccin de muestras.
Una vez establecido debemos elegir la prueba adecuada, que depender de: el nmero de VI, el nmero de grupos o
muestras, el tipo de muestras (independientes o correlacionadas) y el tamao de la muestra. Estudiaremos las
pruebas para una VI con dos niveles (dos grupos) siendo independientes y para cualquier tamao muestral:
Muestras Grandes (N>30) Prueba z Razn Crtica y Muestras Grandes o Pequeas Prueba t de Student.
- Establecimiento del nivel de significacin (): lo establece el investigador, los valores usuales son =0,05; = 0,01;
=0,001.
- Definicin de la distribucin muestral respecto de H0: estara formada por los infinitos valores del estadstico de
contraste obtenido en infinitas muestras aleatorias de tamao N extradas de la misma poblacin.
- Establecimiento de la regin de rechazo de la H0: parte de la distribucin muestral formada por todos los valores
del estadstico de contraste cuya probabilidad de aparicin sea menor o igual que (o /2 si es bilateral)
- Decisin estadstica (rechazo o no rechazo de la H0): Rechazar o no la H0: Rechazamos la H0 si p (t,Z, F) , se
calcula el estadstico emprico segn la frmula elegida y compararemos la probabilidad asociada a este valor con el
valor de . En pruebas Z y t si comparamos el valor del estadstico emprico con el valor crtico, podemos concluir:
Rechazamos la H0 si t emprica > t crtica
Decisin prctica (magnitud del Efecto y conclusiones Generales): terminado el contraste estadstico de hiptesis
independientemente de la decisin estadstica, debemos calcular el tamao del efecto para indicar la relevancia prctica
de las diferencias. Es un clculo complementario que ayuda a interpretar la importancia que debemos atribuir a las
diferencias desde un punto de vista educativo, ms alla de lo que se pueda generalizar a la poblacin e
independientemente del tamao de la muestra. Usar la d de Cohen.

45

Muestras Grandes (N>30) Prueba z Razn Crtica


-0 es a efectos didcticos para entender que lo que se compara es nuestra diferencia
emprica de medias aritmticas con la diferencia hipotetizada en la hiptesis nula (H0 : Exp control = 0). Al dividirla por el error tpico de diferencia de medias, el estadstico de contraste
nos indica cuantos errores tpicos () se aleja nuestra diferencia de una diferencia igual a 0 y cul es la probabilidad
de obtener tal valor por azar.
Muestras Grandes o Pequeas Prueba t de Student
Ejemplo: Prueba t en contraste bilateral Nivel de confianza 99%
Grupo 1: Veteranos - = 7,5 S= 1.2 N= 12
Grupo 2: Novatos - = 5,2 S= 1.3 N= 12
= 0,01 (en dos colas) asumimos un 1% de riesgo /2 = 0,005
Intervalo de Confianza: I.C. = (X1 X2) E.M. I.C. = (7.5-5.2) 1,49 I.C. = +0,89 - +3,79
Error Muestral: E.M. = t (/2) (X1 X2) = 2,821,53 = 1,49 E.M. = 1,49
t (/2) = busco en la columna para dos colas con un alfa de valor 0,01, la fila es= N1 + N2 -2 (Grados de Libertad siempre)= 12+12-2 = 22 t (/2) =2,82 (t
crtica)
Error Tpico de las Diferencias de Medias: (X1 - X2)=

) = 1,53 (X1 X2)= 1,53

Al tener un I.C. = +0,89 - +3,79 es todo positivo, no tiene el 0, por tanto la diferencia de medias es estadsticamente significativa.
Rechazamos la H0 si t emprica > t crtica 4,33 > 2,82
t emprica =

= 4,33

p (t emprica) 0,001 0.01 (para buscar la p (t emprica) miro la columna de puntuacin tipificada 4,33 y veo que alfa vale 0,001)

46

También podría gustarte