Está en la página 1de 54

CURSO DE INICIACIÓN A LA ESTADÍSTICA

JOSÉ LUIS DIEGO MARTÍN.-


ANTES DE EMPEZAR...

Por favor apaguen


sus móviles o
pónganlos en modo
silencio. Gracias.
Me lo contaron y lo olvidé,
lo vi y lo entendí,
lo hice y lo aprendí.
Í N D I C E:
1ª PARTE:

1. PARADIGMAS DE INVESTIGACIÓN.

2. LA ESTADÍSTICA: CONCEPTO, FUNCIONES, TIPOS, SU PAPEL EN EL


PROCESO DE INVESTIGACIÓN Y OTRAS CONSIDERACIONES.

3. LA MEDIDA EN CIENCIAS SOCIALES: ESCALAS DE MEDIDA.

4. ORGANIZACIÓN DE LOS DATOS: ANÁLISIS EXPLORATORIO.

5. REDUCCIÓN DE LOS DATOS. DISTRIBUCIONES DE FRECUENCIA.

6. REPRESENTACIONES GRÁFICAS DE DATOS.

2ª PARTE: 3ª PARTE: 4ª PARTE: 5ª PARTE:


TIPOS DE RELACIONES ENTRE SIGNIFICACIÓN E.,
MEDIDAS PARA UNA
PUNTUACIONES Y VARIABLES: CONTRASTE DE H. Y
VARIABLE
CURVA NORMAL CORRELACIONES OTRAS APLICAC.
1. PARADIGMAS DE INVESTIGACIÓN:

¿Qué es un paradigma?
‒ Conjunto de supuestos, valores, creencias, sobre una
disciplina o una parcela de la realidad que sirven como
referencia para observar dicha disciplina o realidad.

‒ Visión del mundo compartida por un grupo de científicos.

‒ Marco dentro del cual se desarrolla la ciencia, y consta de


conceptos, valores y técnicas que dirigen la actividad de los
investigadores (Kuhn,1962).

Características:
‒ Temporalidad: vigencia mientras no aparezca un nuevo
paradigma que deje obsoleto el anterior. Se adscriben a
movimientos históricos concretos.

‒ Compartido: no es un posicionamiento personal sino algo


compartido por un grupo.

‒ Cada uno posee una concepción diferente de qué es la


investigación, cómo investigar, qué investigar y para qué
investigar.
SOCIO-CRÍTICO
CUANTITATIVO CONSTRUCTIVISTA
CUALITATIVO
POSITIVISTA EMERGENTE
INTERPRETATIVO
EMANCIPADOR

-Finalidad: verificar, controlar -Finalidad: comprender, describir


ASUME, EN GENERAL, LAS CARACTERÍSTICAS
-Énfasis en lo observable y lo medible (escasa -Énfasis en la comprensión del fenómeno DEL PARADIGMA CUALITATIVO Y, ADEMÁS:
atención a estados subjetivos) educativo
La educación es una actividad social
-Modelo hipotético-deductivo (experimental) -Existen distintos métodos que posibilitan llegar a
(orientado a la verificación confirmatoria) la comprensión (orientado al descubrimiento La perspectiva histórica consitutuye una visión
exploratorio, descriptivo e inductivo) básica. La realidad es de naturaleza no
fragmentable, contextual, histórica, compartida,
-Observación objetiva (laboratorio). Observador -Observación en situaciones reales. Observador dialéctica, construida
ajeno, neutral implicado
 Considera que la función principal de la escuela
-Datos fiables, objetivos y replicables -Datos válidos, reales, ricos y profundos es la conservación y reproducción del orden social

-Centrado en los resultados -No sólo resultados también interesan los El objetivo prioritario es el cambio, la
procesos transformación de la realidad educativa como
base de la mejora social. La finalidad de la
-Control riguroso de variables o factores que -Se puede reorientar el proceso, introducir investigación es transformar, criticar,
pueden influir en los resultados cambios reconstruir, emancipar

-Información cuantitativa -Información cualitativa (no se rechaza lo Concede gran importancia a la autoevaluación y
subjetivo, anecdótico o particular) la crítica reflexiva. Desarrollar en los miembros de
la comunidad la capacidad de autoevaluación
-Preocupado por la explicación y generalización -Preocupado por responder a los problemas (necesaria en una sociedad cambiante)
de resultados concretos en un contexto dado
Evaluación externa como apoyo al proceso
-Educación como proceso tecnológico -No se centra sólo en los objetivos planificados evaluador (impulsa, orienta). Autoevaluación del
(comprobar si se han alcanzado los objetivos) (pueden lograrse objetivos no planificados) propio evaluador

-Presupone una realidad estable -Presupone una realidad dinámica Cuestiones básicas: acordadas por el grupo

-Dieseños: experimentales y no experimentales -Diseños etnográficos, historias de vida, grupo Tiene en cuenta el contexto (tanto de la
(descriptivos, correlacionales, longitudinales). focal, investigación-acción organización como el histórico, político y social)

LA ESTADÍSTICA JUEGA UN PAPEL BÁSICO. LA ESTADÍSTICA PUEDE UTILIZARSE, PERO


NO ES NECESARIA (LOS DATOS SE
FUNDAMENTAN MÁS EN PALABRAS QUE EN
Distintas posturas´:
‒ Idea de que los paradigmas son incompatibles, por lo que
hemos de situarnos en uno o en otro.

‒ Consideración de los mismos como complementarios,


entendiendo que la dicotomía es innecesaria y que pueden
utilizarse conjuntamente con objeto de lograr una investigación
más eficaz. Desde esta perspectiva se suele señalar que el
paradigma cuantitativo parece más aconsejable para investigar
productos y el cualitativo para la investigación de procesos
(otros autores señalan que tanto uno como el otro son válidos
tanto para la investigación de productos como de procesos).

‒ La tercera perspectiva es la denominada “unidad


epistemológica”, que trata de conciliar desde el punto de vista
filosófico y epistemológico los distintos paradigmas,
atribuyéndole una raíz cognoscitiva común. Esta postura, que es
la más reciente y que pudiera considerarse como la más
avanzada, está todavía poco desarrollada, careciendo de una
suficiente concreción teórica.

De las tres posturas expuestas la segunda (complementariedad)


parece la más extendida en la actualidad.
2. EL PROCESO DE INVESTIGACIÓN:

1. PLANTEAMIENTO DEL PROBLEMA.

2. REVISIÓN DE LA LITERATURA (REVISIÓN DE FUENTES).

3. FORMULACIÓN DE HIPÓTESIS.

4. VALIDACIÓN DE HIPÓTESIS O COMPROBACIÓN EMPÍRICA.

a) Definición operativa de las variables.

b) Población y muestra.

c) Diseño (control de variables).

d) Selección/elaboración de instrumentos de recogida de datos.

e) Recogida y análisis de datos (*).

f) Decisión estadística.

5. CONCLUSIONES, RECOMENDACIONES Y SUGERENCIAS.


1. PLANTEAMIENTO DEL PROBLEMA:
Dificultad que no puede solucionarse de manera inmediata. Debe
estar bien formulado (operativamente, en forma de pregunta, etc.) y
ser resoluble.

2. REVISIÓN DE LA LITERATURA (REVISIÓN DE FUENTES):


Una vez formulado el problema debemos comprobar el «estado de la
cuestión» o momento en el que se encuentra (si está solucionado,
si...).

3. FORMULACIÓN DE HIPÓTESIS:
Se trata de adelantar posibles soluciones que puede tener el
problema. Podemos definir las hipótesis como tentativas de solución
a un problema, con la determinación de un grado de probabilidad
de certeza o falsedad. Deben estar bien fundamentadas
(insertas en una teoría, congruentes con los conocimientos
actuales,...) y ser contrastables (operativizables).
4. VALIDACIÓN DE HIPÓTESIS O COMPROBACIÓN EMPÍRICA:

a) Definición operativa de las variables.


Una variable es una propiedad o característica que adopta
diferentes valores. Definiciones más precisas de “variable” son:
«todo fenómeno considerado en función de una de sus
características que al manifestarse puede tomar distintos valores,
de acuerdo con un sistema definido de clasificación» (Arturo de la
Orden); «un símbolo al que se le asignan numerales o valores»
(Kerlinger).

La clave está en la definición operativa que hagamos de esas


variables y en decir cómo las vamos a evaluar en la
investigación,... Los objetivos básicos de la investigación
experimental son el control y la manipulación: control de las V.I.
extrañas, para neutralizar sus efectos sobre la V.D. y,
manipulación de la V.I. experimental activa, para poder atribuirle
los resultados obtenidos en la V.D.

V. I. V. D.

V. extrañas controlar
Pero,… ¿qué es “operativizar” una variable?
‒ Se trata de definirla de forma que sea medible (proceso para
llevar una variable del plano abstracto a uno más concreto u
observable).

‒ EJEMPLO: En la variable “nivel socioeconómico” podemos


establecer distintas dimensiones (bajo, medio, alto; muy bajo, bajo,
etc.), siendo indicadores posibles: el nivel de ingresos, el nivel de
estudios, el lugar de residencia, la actividad laboral, etc., que
podemos medir con diferentes instrumentos (encuestas, datos de la
declaración de la renta, etc.).

‒ Puede omitirse cuando la definición es obvia y compartida (ej.: sexo


de las personas, colores de los semáforos, etc.
b) Población y muestra.
Población es todo conjunto de elementos que cumplen, cada
uno de ellos, unas características claramente definidas. Muestra
es una parte de la población que cumple sus características
básicas, siendo la fundamental la representatividad, es decir,
que reúna las características más relevantes de la población (de
no ser así hablaríamos de muestra sesgada). Conviene
distinguir entre distintos tipos de muestra: invitada, aceptante y
real o productora de datos.

Cualquier característica medible de la población se denomina


parámetro (se representa con letras griegas) y de una muestra
estadístico (representado con letras latinas). A partir del estudio
de muestras nos interesa, en la medida de lo posible, conocer
determinados parámetros de la población (este es el objetivo de
la estadística inferencial). Un estimador es un estadístico que
nos permite inferir algo acerca de una propiedad o
parámetro que nos interesa conocer. Los estimadores deben
reunir una serie de características, como son: carencia de sesgo
(un estimador es insesgado si el promedio de todos sus valores
posibles es igual al valor del parámetro), consistencia (un
estimador es consistente si a medida que el tamaño de la
muestra se aproxima al tamaño de la población, la probabilidad
de que su valor sea próximo al parámetro tiende a 1) y eficiencia
relativa (se deben preferir los estimadores que tengan la mínima
varianza).
Población:
Conjunto de personas, eventos o cosas de las cuales se desea hacer
un estudio, y tienen una o varias características en común.
Cualquier medida que realicemos en una población se denomina
PARÁMETRO (se representan por letras griegas).

POBRLACIÓN M

Muestra:
Subconjunto de la población que reúne sus características básicas.
Puede elegirse de distintas formas (muestreo) siendo una de las más
típicas la aleatoria (al azar). Lo importante es que la muestra sea
representativa de la población y nos permita obtener conclusiones más
afines acerca de las características de la población.

Cualquier medida que realicemos en una muestra se denomina


ESTADÍSTICO (se representan por letras latinas).

MEDIDA PARÁMETRO ESTADÍSTICO


MEDIA μ x
DESVIACIÓN TÍPICA σ s
CORRELACIÓN ρ r
POBLACIÓN Y MUESTRA
POBLACIÓN MUESTRA
Conjunto de todos los individuos Subconjunto de individuos

Inferencia estadística

Media (m) Media x 


Desviación Típica (s) Desviación Típica (s)
c) Diseño (control de variables):
Podemos definir el diseño como «un esquema o estructura lógica
de acción que permite mantener constante el influjo de las
variables experimentales pertinentes y controlar así la influencia
de las V.I. sobre las V.D.». Los objetivos básicos del diseño son
resumidos por Kerlinger en lo que denomina principio max-min-
con: maximizar la varianza sistemática primaria o
experimental (la de la V.D. influida por la V.I.), minimizar la
varianza de error (la que no interesa o no es posible controlar,
que puede ser debida a fluctuaciones aleatorias o a errores de
medida) y controlar la varianza sistemática secundaria (control de
variables extrañas ajenas a objetivos del estudio pero que
pueden actuar como V.I.). Existen diferentes técnicas para
conseguir dichos objetivos (aumentar la diferencia de los valores
de la V.I. o seleccionar sus valores óptimos; control de las
condiciones experimentales y aumento de la fidelidad de la
medida de la V.D.; distribución al azar, no sólo en la selección de
muestras sino, también, al asignar estas a grupos, tratamientos,
etc.).

Una cuestión básica a tener en cuenta en cuanto al diseño es la


validez. La validez interna de un diseño se preocupa por saber
si los cambios observados en la V.D. se deben a la manipulación
de la(s) V.I. Es, según Campbell y Stanley, la validez mínima
imprescindible para poder interpretar el modelo. La validez
externa se refiere a la representatividad o generalización de
los resultados.
c) Selección/elaboración de instrumentos de recogida de datos.:
La investigación humana de tipo empírico intenta medir algo de
manera objetiva. Medir significa aplicar un instrumento para poder
asignar números (numerales) a hechos, de acuerdo con unas
reglas. Dichos números (numerales) en sí no nos dicen nada, sino
que hay que ponerlos en relación con las propiedades, rasgos,
características, ... que estemos midiendo. Si la medida es ya de por
sí problemática en el mundo físico (se necesitan instrumentos muy
precisos), lo es aún más en el ámbito educativo. Si existen
instrumentos adecuados para recoger los datos será necesario
seleccionarlos y si no existen, construirlos. A la hora de seleccionar
un instrumento, habremos de tener en cuenta sus características:
factor que mide, edades a las que va dirigido, tipo de aplicación
(individual o colectiva), fiabilidad y validez, etc. Existen diferentes
obras que nos proporcionan todo este tipo de datos (no tenemos,
por tanto, que ir analizando instrumento por instrumento). Si lo que
pretendemos es construir un instrumento, habremos de analizar,
fundamentalmente, su fiabilidad (un instrumento es fiable si
utilizado dos o más veces, en circunstancias similares, ofrece
los mismos resultados) y validez (un instrumento es válido si
mide lo que desea medir, y no otra cosa)..
d) Recogida y análisis de datos:
Una vez recogidos los datos (con los instrumentos previamente
elegidos o elaborados) se aplicarán las pruebas estadísticas
más adecuadas al diseño planteado. Para seleccionar dicha
prueba hay que tener en cuenta el modelo estadístico (cada
modelo tiene sus exigencias), la potencia de la prueba
(capacidad de la prueba para rechazar la hipótesis nula cuando
es falsa), la potencia-eficiencia (incremento del tamaño de la
muestra necesario para que una prueba estadística B sea tan
poderosa como otra A) y el nivel de medida (como norma
general y en igualdad de condiciones, debe preferirse el nivel de
medida más alto).

e) Decisión estadística.
Si la hipótesis no queda validada volveríamos a la tercera fase y
si queda validada pasaríamos a la fase siguiente. La decisión
estadística que tomemos no es algo definitivo, sino que
trabajamos con unos determinados niveles de probabilidad, por
lo que podemos encontrarnos con las siguientes posibilidades:
DECISIÓN H0 ES VERDADERA H0 ES FALSA

NO HAY ERROR
ERROR TIPO I
(DECISIÓN CORRECTA)
RECHAZO H0 Probabilidad = α
Probabilidad = 1 - β
Nivel de significación
(ACEPTO H1 ) Potencia de la prueba o
(se fija a priori)
poder de contraste

NO HAY ERROR ERROR TIPO II


RECHAZO H1 (DECISIÓN CORRECTA) Pobabilidad = β
Probabilidad = 1 - α desconocido si no
(ACEPTO H0 )
Nivel de confianza conocemos el
parámetro
5. CONCLUSIONES, RECOMENDACIONES Y SUGERENCIAS
(PARTE AUTÉNTICAMENTE PEDAGÓGICA):
No podemos concluir la investigación diciendo, simplemente, que se
acepta o se rechaza la hipótesis nula, sino que tendremos que
analizar las implicaciones que ello lleva consigo desde el punto de
vista pedagógico. Desde esta perspectiva habría que analizar, entre
otros aspectos, los cambios que son necesarios introducir en
nuestra práctica educativa (si este fuera el caso), el coste que ello
conlleva, las posibilidades reales de ponerlo en funcionamiento, el
tiempo que se estima conveniente para hacerlo (téngase en cuenta
que, en la mayoría de los casos, los cambios educativos son lentos),
los problemas con los que se prevé podemos encontrarnos, etc.
2. LA ESTADÍSTICA: CONCEPTO, FUNCIONES, TIPOS, SU PAPEL EN EL
PROCESO DE INVESTIGACIÓN Y OTRAS CONSIDERACIONES:

¿Qué es la estadística? (concepto):

Diversas acepciones:

‒ Conjuntos de números (alumnado de ESO, inmigrantes que


acceden a estudios superiores, etc.).

‒ Método de trabajo propio del campo empírico.

‒ Como una ciencia: ciencia que se ocupa de recoger,


organizar, presentar, analizar e interpretar datos con el
propósito de ayudar a un mejor conocimiento y a una toma de
decisiones más efectiva.

‒ “La teoría y el método de analizar datos cuantitativos


obtenidos de muestras de observaciones, para estudiar y
comparar fuentes de varianza de fenómenos, ayudar a tomar
decisiones sobre aceptar o rechazar relaciones hipotéticas
entre los fenómenos y ayudar a hacer inferencias fidedignas
de observaciones empíricas” (Kerlinger, 1985).
Funciones de la estadística en el ámbito educativo:

‒ Entender y criticar artículos profesionales.

‒ Mejorar la evaluación del aprendizaje de los estudiantes.

‒ Dirigir trabajos sencillos de investigación.

‒ Entender las propuestas de evaluación de programas socioeducativos


(del profesorado, instituciones, etc.).

‒ Ayudar en la toma de decisiones bien fundamentada (como ciudadano,


consumidor, etc.).

‒ Mejorar la profesión socioeducativa desarrollando habilidades de


comunicación, debate, etc.

A modo de síntesis, las funciones básicas de la estadística en el ámbito


educativo se pueden agrupar en tres grandes apartados:

a) Facilitar el manejo de datos amplios y dispersos (reduciéndolos a


índices de distintos tipos, gráficos, calculando relaciones entre
ellos, etc.).

b) Inferir desde la muestra a la población (generalización de


resultados de muestras significativas y representativas a la
población).

c) Ayuda en la toma de decisiones (determinando si las diferencias


son o no significativas).
Tipos de estadística:

‒ DESCRIPTIVA:

Organización, resumen y presentación de conjuntos de


observaciones procedentes de una muestra o de la población
mediante tablas, gráficos valores numéricos de distinto tipo
(tendencia central, variabilidad, asimetría y curtosis, relación entre
variables…), etc.

‒ INFERENCIAL:

Trata de extrapolar los resultados obtenidos en muestras a las


poblaciones respectivas de las que proceden. Establece
conclusiones sobre una población a partir de una muestra de la
misma.

La estadística inferencial abarca dos grandes campos:

La estimación de parámetros, que puede ser de dos tipos:


puntual (de un valor de la muestra estimo un valor de la
población) y por intervalos (estimamos los límites entre los
que se espera se encuentre el valor del parámetro,
influenciada por errores aleatorios y sistemáticos).

El contraste de hipótesis, que nos permite probar mediante


datos empíricos las hipótesis que se plantean en la
investigación.
Papel de la estadística en el proceso de investigación:

1. PLANTEAMIENTO DEL PROBLEMA.

2. REVISIÓN DE LA LITERATURA (REVISIÓN DE FUENTES).

3. FORMULACIÓN DE HIPÓTESIS.

4. VALIDACIÓN DE HIPÓTESIS O COMPROBACIÓN EMPÍRICA.

a) Definición operativa de las variables.

b) Población y muestra.

c) Diseño (control de variables).

d) Selección/elaboración de instrumentos de recogida de datos.

e) Recogida y análisis de datos (*).

f) Decisión estadística.

5. CONCLUSIONES, RECOMENDACIONES Y SUGERENCIAS.


Papel de la estadística en el proceso de investigación:

1. PLANTEAMIENTO DEL PROBLEMA.


Permite afirmar que el problema sea resoluble (condición
inexcusable en su formulación), recogiendo los datos necesarios
para alcanzar las respuestas esperadas.

2. REVISIÓN DE LA LITERATURA (REVISIÓN DE FUENTES).

3. FORMULACIÓN DE HIPÓTESIS Y OBJETIVOS:


Las hipótesis deben ser contrastables y los objetivos
comprobables, jugando la estadística un importante papel al
respecto al darnos argumentos sobre el análisis estadístico más
adecuado para la validación o comprobación empírica de la
hipótesis (media, varianza, etc.) y las pruebas que nos permiten
decidir la existencia o no de diferencias significativas entre los
grupos.

2. VALIDACIÓN DE HIPÓTESIS O COMPROBACIÓN EMPÍRICA.

a) Definición operativa de las variables.


La estadística se manifiesta en la medición de las variables que
intervienen en el proceso, definiéndolas de forma operativa
(indicando la forma en que se debe proceder para su medida y
valoración).
b) Población y muestra (cálculo de su tamaño).

c) Diseño (control de variables):


Entre las diversas formas de control que tenemos de las variables
extrañas en la investigación educativa, las hay que no tienen nada
que ver con la estadística (ej.: elegir sujetos de un solo sexo) y otras
que son de naturaleza estadística (ej.: formar parejas o bloques de
sujetos que puntúan igual en una variable). En estas últimas la
estadística nos aporta los análisis pertinentes para seleccionar a los
sujetos en función de esas características control o para cuantificar
los pesos de determinadas relaciones.

d) Selección/elaboración de instrumentos de recogida de datos:


Interviene en el proceso y en la determinación de la fiabilidad y la
validez de los instrumentos de medida, así como en otros análisis de
interés de los mismos (análisis de ítems, distractores, etc.).

e) Recogida y análisis de datos (*).

f) Decisión estadística.
Aporta diferentes pruebas estadísticas, en función de la calidad de
los datos, para el contraste de hipótesis y facilita la decisión
estadística, que se lleva a cabo fijando unos márgenes de error o
niveles de confianza (la investigación no puede hacer afirmaciones
en términos de certeza).
La estadística: otras consideraciones de interés:

La estadística y su relación con las ciencias sociales:


‒ Educación (vinculada con la investigación educativa en materias como
“métodos de investigación”, “diseños”, así como con la evaluación, el
diagnóstico, la orientación, etc.).
‒ Psicología (estudios de comportamientos, aptitudes, rasgos de
personalidad, factores de inteligencia, etc.).
‒ Sociología (estudio de fenómenos y relaciones sociales,
comportamientos colectivos, comparaciones, etc.).
‒ Economía (índices de precios al consumo, análisis de mercados,
estimación de la demanda, etc.).
‒ Demografía (censos, distribución de edades o sexo, tasas de nacimiento
o defunción, etc.).
‒ Administración Pública (censos, fuentes de riqueza, temas laborales,
etc.).
‒ Humanidades (métodos rigurosos y contrastables de estudio en
distintos campos).
‒ Ciencias jurídicas (prevención de delitos y otros datos de interés para
la justicia).
Justificación de la necesidad de la estadística en el ámbito
pedagógico:
‒ Comprender una gran cantidad de trabajos que se publican en el ámbito
educativo.
‒ Entender los procesos implicados en la investigación educativa que hacen
posible la inferencia de la muestra a la población.
‒ Facilitar el propio diseño y desarrollo de la investigación socioeducativa.

Aportaciones destacadas de la estadística:


‒ Contribuir a la calidad de la información.
‒ Validación de instrumentos de recogida de información o datos.
‒ Establecimiento de la fiabilidad de dichos instrumentos.
‒ Organización de datos (especialmente relevante si son muy numerosos)
‒ Reducción de la información para hacerla manejable y comprensible o para
captar sus características de modo intuitivo (como ocurre con las
representaciones gráficas).
‒ Apreciar la existencia o no de relaciones entre variables.
‒ Establecer leyes o principios generales.
‒ Hacer afirmaciones en términos de probabilidad de valores de una población
a partir de los de una muestra.
‒ Herramienta transversal en cualquier tipo de saber.
‒ Potente instrumento al servicio de la investigación empírica.
Posibilidades y limitaciones de la estadística:

CIENCIA INSTRUMENTAL
ESTADÍSTICA
(APOYO EN LA INVESTIGACIÓN)

No resuelve todos los Facilita el análisis e


problemas educativos interpretación de dichos
problemas

Requiere que la calidad de los datos sea la adecuada (sino se


puede cuestionar la validez de las conclusiones obtenidas).

Precisa de un buen control de las variables extrañas.

Permite utilizar diferentes pruebas, siendo el investigador el


que determina cuál es la más adecuada en función de los
datos y los objetivos de la investigación.
3. LA MEDIDA EN CIENCIAS SOCIALES: ESCALAS DE MEDIDA

ALGUNOS CONCEPTOS BÁSICOS:


‒ VARIABLE: característica, propiedad o fenómeno que
interesa estudiar en una población y que puede tomar al
menos dos modalidades. Ejemplo: sexo (hombre – mujer).

‒ CONSTANTE: valor que no cambia, propiedad o


característica que siempre asume el mismo valor. Ejemplo:
número pi (3,1416).

‒ MEDICIÓN: asignación de números a las características


objeto de estudio, de acuerdo con ciertas reglas.

‒ DATO: Número o valoración que se obtiene de un proceso


de medición. Pueden ser cuantitativos (números) o
cualitativos (categorías).
Existen deferentes clasificaciones de las variables, siendo una
de ellas la que a continuación se presenta:
‒ VARIABLES CATEGÓRICAS O ATRIBUTIVAS: establecen distintas
categorías o modalidades. Si el número de categorías es de dos, como por
ejemplo el sexo (hombres y mujeres) se denominan dicotómicas y si es
más de dos, por ejemplo el grupo sanguíneo (A, B, AB y O) politómicas.
Algunos autores denominan a estas variables como cualitativas.

‒ VARIABLES CUALITATIVAS: expresan la posesión de una determinada


cualidad con cierta intensidad, siendo posible establecer rangos o
posiciones con las medidas pero no diferencias numéricas precisas. Por
tanto, se trata de variables medidas en una escala ordinal. Algunos
autores se refieren a ellas con el nombre de variables cuasicuantitativas.

‒ VARIABLES CUANTITATIVAS: reflejan las características de la población


admitiendo medida numérica, cuantificable. Dichas medidas pueden ser
discretas, si llega un momento que entre dos categorías no cabe ninguna
otra, o lo que es lo mismo, si sólo admite números enteros, y contínuas, si
entre dos categorías siempre se puede introducir otra, o dicho en otras
palabras, si admite números decimales. Son variables discretas el número
de hijos, el número de alumnos de un aula, etc., y son variables continuas
la edad, la altura, etc. Una variable continua se puede dicotomizar, es
decir, dividirla en dos categorías. Por ejemplo, la variable calificaciones,
que es continua, se puede dicotomizar en “aprobados” y “suspensos”
(reducirla a dos categorías).
‒ VARIABLE INDEPENDIENTE: es la que manipula o sobre la que actúa el
investigador con la intención de ver sus efectos en la variable dependiente. Por
ejemplo, si queremos ver cómo influye la asistencia a tutoría en la calificación
de una asignatura, la asistencia a tutoría sería la variable independiente.

‒ VARIABLE DEPENDIENTE: la que se mide para comprobar los efectos de la


variable independiente. En el ejemplo anterior sería la calificación en la
asignatura. Una misma variable puede ser en ocasiones dependiente o
independiente, según el papel que desempeñe en la investigación.

‒ VARIABLES EXTRAÑAS: aquellas que pudieran estar influyendo en la


variable dependiente de forma que los resultados que se observan en ella se
deban a dicha variable y no a la variable independiente. Por ejemplo, el
profesor, el horario de las tutorías, etc., pueden actuar como variables extrañas
en el ejemplo anterior.

‒ VARIABLES ESTÍMULO: aquellas condiciones externas que pueden afectar al


comportamiento del individuo, como por ejemplo recibir un premio, valorar la
participación en clase, etc.

‒ VARIABLES RESPUESTA: reflejan el comportamiento del sujeto ante


determinadas situaciones o estímulos, como sería el caso de la mejora en el
rendimiento por un programa determinado.

‒ VARIABLES INTERMEDIARIAS: variables que no son objeto de investigación


pero que pueden estar influyendo en las respuestas, por lo que deberían ser
tenidas en cuenta, como sería el caso de la influencia del ambiente familiar en
los resultados escolares.
ESCALA CARACTERÍSTICAS EJEMPLOS

• Sólo puedo afirmar que dos cosas • Sexo.


son iguales o son diferentes.
• Los números son únicamente
• Estado civil.
NOMINAL
etiquetas (no se establecen rangos • Religión.
ni jerarquías entre ellos).
• DNI.

• Además de afirmar que dos cosas • Nivel de felicidad.


son iguales o diferentes, podemos
establecer un orden. • Grado de satisfacción.
ORDINAL
• Los valores no son cuantitativos, • Opiniones sobre el
sólo simbolizan una posición.
profesorado.
• Las diferencias numéricas no
tienen una categoría de igualdad. • Actitudes.
• Además de igualdad y diferencia y • Aptitudes.
de la posibilidad de ordenar, existe • C.I.
la misma distancia entre
INTERVALO categorías. • Temperatura en ºC.
• El cero es relativo, no indica
• Datos de pruebas
ausencia de propiedad.
• Operaciones de suma y resta. objetivas.

• Velocidad.
• Además de las propiedades
anteriores, tiene cero absoluto (el • Nª de hojas de un libro.
RAZÓN cero indica ausencia de propiedad).
• Alumnado en clase.
(PROPORCIÓN) • Operaciones de suma, resta,
multiplicación y división. • Tiempo.
“Quien hace puede equivocarse,
quien no hace ya está equivocado”.

“Los peores errores de la vida


son los que no cometemos”.
VARIABLES ESCALA
Número de teléfono. Nominal.
Edad en años. Razón.
Intensidad del dolor. Ordinal.
Carrera a estudiar. Nominal.
Sexo. Nominal.
Aptitudes. Intervalo.
Grado de satisfacción. Ordinal.
Estado civil. Nominal.
Puntuaciones en un test. Intervalo.
Grupo sanguíneo. Nominal.
Religión. Nominal.
Clase social. Nominal.
Calificaciones. Ordinal o de Intervalos.
Peso. Razón.
Nacionalidad. Nominal.
Código postal. Nominal.
Nivel de felicidad. Ordinal.
Pruebas objetivas. Intervalo.
Lugar de llegada en una carrera. Ordinal.
Nº de pacientes atendidos. Razón.
Ingresos en euros. Razón.
Inteligencia. Intervalo.
ESCALA ESTADÍSTICOS GRÁFICOS
• DIAGRAMA DE
• FRECUENCIAS (CONTEO). BARRAS.
• PORCENTAJE, TASAS,
NOMINAL PROPORCIONES. • DIAGRAMA DE
• MODA. SECTORES.
• C DE CONTINGENCIA. • PICTOGRAMA.

• DIAGRAMAS DE
ADEMÁS DE LO ANTERIOR:
CAJA Y PATILLAS.
ORDINAL • PERCENTILES, MEDIANA.

• CORRELACIÓN DE SPEARMAN.

• HISTOGRAMA.
ADEMÁS DE LO ANTERIOR:
• PROMEDIOS. • DIAGRAMA DE
INTERVALO • VARIANZA, DESVIACIÓN TÍPICA. TALLO Y HOJAS.
• ASIMETRÍA, CURTOSIS.
• CORRELACIÓN DE PEARSON.

ADEMÁS DE LO ANTERIOR:
• MEDIA GEOMÉTRICA.
RAZÓN • MEDIA ARMÓNICA.
(PROPORCIÓN) • COEFICIENTE DE VARIACIÓN.
• CUALQUIER MEDIDA .
4. ORGANIZACIÓN DE LOS DATOS: ANÁLISIS EXPLORATORIO
‒ El análisis exploratorio de datos (Tukey) es, básicamente, el tratamiento
estadístico al que se someten las muestras recogidas durante un proceso
de investigación en cualquier campo científico. Para mayor rapidez y
precisión, todo el proceso suele realizarse utilizando medios informáticos,
como los programas SPSS y R.

‒ No se trata de la utilización del método confirmatorio, en el que el


experimentador parte de una hipótesis, basada en la teoría, y recoge datos
para contrastar dicha hipótesis y concluir sobre su aceptación o rechazo,
sino de comenzar por la observación de la realidad, estudiar las
observaciones recogidas y tratar de encontrar algún patrón o modelo que
explique el comportamiento de dichas observaciones. Por tanto, se explora,
se observa lo que sucede y se concluye al respecto.

‒ Dicho análisis se basa en gráficos y estadísticos que permiten explorar la


distribución identificando características tales como: valores atípicos o
outliers, saltos o discontinuidades, concentraciones de valores, forma de la
distribución, etc. También permite comprobar, mediante técnicas gráficas y
contrastes no paramétricos, si los datos han sido extraídos de una población
con distribución aproximadamente normal.

‒ Para realizar dicho análisis es necesario organizar los datos, lo que se hace
construyendo la matriz de datos, en la que los sujetos o casos se sitúan
en las filas y las variables en las columnas.
EL LIBRO DE CÓDIGOS:

‒ Antes de elaborar la matriz de datos conviene construir el libro de


códigos, que es un documento en el que se especifican todas las
variables del estudio, en el orden que serán introducidas en la matriz
de datos, señalando junto a su nombre el ítem en el que se recoge y su
etiqueta (descripción), además de los posibles valores (códigos) y, si
procede, una etiqueta de los mismos. Ejemplo:
DEPURACIÓN DE DATOS:

‒ Uno de los primeros pasos a realizar cuando disponemos de la matriz


de datos es proceder a su depuración, es decir, verificar si los valores
que hemos introducido son correctos. Para ello podemos solicitar al
programa estadístico los valores mínimo y máximo y comprobar si
responden a lo que tenemos recogido en nuestro libro de códigos.

‒ Por ejemplo, supongamos que hemos codificado el sexo con los


valores 1 y 2 y los valores máximo y mínimo que nos da para esta
variable son 1 y 3, lo que significaría que hemos cometido algún error
al introducir los datos, lo que exigiría que procedamos a su revisión.

CASOS EDAD SEXO ESTUDIOS


Sujeto 1 20 1 ESO
Sujeto 2 18 1 BACHILLER
Sujeto 3 22 2 UNIVERSIDAD
. . . .
. . 3 .
. . . .
Sujeto n 16 2 PRIMARIOS
OTROS CONCEPTOS BÁSICOS:

‒ VALORES PERDIDOS. Son aquellos que corresponden a variables en las que no


disponemos de información. Por ejemplo, un sujeto que de todas las preguntas que le
hacemos se niega a darnos su edad, o una persona a la que le pasamos distintas
pruebas en días sucesivos y uno de esos días no asiste. Se recomienda que el número
de dichos valores no sea superior al 5%. Conviene analizar dichos valores, porque
pueden ser significativos (por ejemplo, una pregunta que no es respondida por un
número importante de sujetos). Si su pérdida no es significativa podemos optar por
sustituirlos por la media (o darle cualquier otro tratamiento).

‒ AGRUPACIÓN EN INTERVALOS. Muy útil en el pasado y menos en el presente con la


existencia de programas informáticos (al agrupar por intervalos se pierde información ya
que los cálculos otorgan el valor de la media del intervalo a todas sus puntuaciones,
que pueden ser muy diferentes). Los criterios generales para realizar la agrupación son:

 Se recomienda entre 5 y 15 intervalos (el número dependerá de la amplitud de


la escala). Por tanteo: A/i (siendo “A” la amplitud de la distribución e “i” la del
intervalo).

 Se comienza partiendo de la puntuación más baja múltiplo del valor del


intervalo. El último intervalo debe incluir la puntuación más alta.

 Ejemplo: supongamos que la amplitud de la distribución es de 71


(puntuaciones que van de 30 a 100). Si la amplitud del intervalo es 4,
tendríamos 71 / 4 = 17,75, es decir, 18 intervalos. Son muchos, por lo que
probamos con una amplitud de intervalo mayor: 71 /5 = 14,2, valora más
adecuado. Si trabajamos con una amplitud de 10 tendríamos
aproximadamente 7 intervalos. El primer intervalo debe incluir la puntuación
más baja (suponiendo que la puntuación más baja sea 31 y la amplitud del
intervalo sea 10, el primer intervalo podría ser 30-39, el siguiente 40-49, etc.).
5. REDUCCIÓN DE LOS DATOS: DISTRIBUCIONES DE FRECUENCIA
‒ Una forma sencilla de presentar la información es a través del polígono de
frecuencias, en el que la frecuencia absoluta es el número de veces que se
repite cada puntuación y la frecuencia relativa la anterior (frecuencia
absoluta) dividida por el número de puntuaciones. La frecuencia relativa
multiplicada por 100 nos da el porcentaje.

‒ En estas tablas también podemos incluir los porcentajes. La diferencia entre


porcentaje y porcentaje válido está en función de que consideremos todos
los sujetos o sólo aquellos de los que disponemos de datos (eliminando los
denominados “valores perdidos” o casos missing).
FRECUENCIA ABSOLUTA, RELATIVA Y ACUMULADA:
‒ FRECUENCIA ABSOLUTA de una clase: número de datos que forma dicha
clase (número de puntuaciones con un valor determinado).

‒ FRECUENCIA RELATIVA: razón (cociente) entre la frecuencia absoluta y el


total de datos (si la multiplicamos por 100 se expresa en porcentajes).

‒ FRECUENCIA ACUMULADA: suma de la frecuencia correspondiente a cada


clase más las anteriores a ella (si las categorías son puntuaciones o
intervalos empezamos por el menor).

Frecuencia
Frecuencia
Calificaciones Frecuencia Frecuencia relativa
acumulada
en Lengua Absoluta (f i) Relativa (h i) porcentual
(Fa)
(%)
3 1 1/24 4.2 1
4 4 4/24 16.7 5
5 3 3/24 12.5 8
6 5 5/24 20.8 13
7 4 4/24 16.7 17
8 3 3/24 12.5 20
9 4 4/24 16.7 24
TOTAL… 24 1 100
5. REPRESENTACIONES GRÁFICAS DE DATOS:
‒ Ayudan a comprender rápidamente la información descriptiva.
Permiten visualizar de forma global y rápida el comportamiento de
los datos.

‒ Son un complemento importante de los estadísticos o parámetros


calculados.

‒ Se recomienda elegir el tipo de gráfico más adecuado en función


del nivel o escala de medida de las variables.

‒ El Gráfico debe contener un Título General y la identificación de


cada eje (variable en estudio y frecuencia).

‒ En ocasiones resulta más ilustrativo un gráfico que una tabla de


frecuencia. Otras veces es aconsejable que tabla y gráfico se
presenten conjuntamente.

‒ Al igual que las tablas, los gráficos deben ser auto-explicativos.

‒ No debe abusarse de la redundancia texto-gráficos


DIAGRAMA DE SECTORES:

‒ También denominado ciclograma, diagrama circular o diagrama de


tarta o de torta.

‒ Nivel de medida: nominal.

‒ Es un círculo dividido en proporciones que representan cada uno


de los niveles de la variable.

ASISTENCIA
40;
22% 1er
80; trim.
45% 2º trim.
60;
33% 3er
trim. ASISTENCIA 80;
40; 45%
22%
1er trim.
2º trim.
3er trim.
60;
33%
PICTOGRAMA:

‒ Nivel de medida: nominal.

‒ Se utilizan imágenes o símbolos para representar una cantidad


específica y su tamaño o cantidad es proporcional a la frecuencia
que representa o al tamaño del dibujo representado.
GRÁFICO DE BARRAS:

‒ Nivel de medida: nominal u ordinal.

‒ La altura de las barras puede indicar número, porcentaje,


frecuencia, etc.

Barras
HISTOGRAMA:

‒ Para variables cuantitativas continuas (intervalo o razón).

‒ Las puntuaciones se agrupan por intervalos, dado que sería


complejo representar un número muy elevado de barras.

‒ Cada intervalo comprende un número de puntuaciones, pudiendo


representar en las barras los extremos del intervalo (por ejemplo:
30 – 40 – 50 – 60 – 70 – 80 – 90 – 100), o bien el punto medio del
intervalo, denominado marca de clase (35 – 45 – 55 – 65 – 75 – 85 –
95).
POLÍGONO DE FRECUENCIAS:

‒ Similar al histograma, para las mismas variables, se realiza


uniendo el punto superior central de cada barra y, generalmente,
cerrando el eje de abcisas (con el punto medio del intervalo
anterior y siguiente).

Histograma y
Polígono de Frecuencias
GRÁFICO DE CAJA:

‒ También denominado diagrama de caja y patillas o de caja y


bigotes.

‒ Nos proporciona una idea rápida de la distribución de las


puntuaciones centrales de la distribución (comprendidas entre el
percentil 25 o cuartil 1 y el percentil 75 o cualtil 3, situando entre
ellos la mediana, cuartil dos o percentil 50).

‒ Los bigotes o patillas se extienden desde la caja hasta 1,5 veces


las distancia entre los cuartiles 3 y 1, salvo que ésta vaya más allá
de las puntuaciones máxima y mínima, en cuyo caso coincidirían
con dichas puntuaciones.

‒ Los valores que se sitúan fuera de las patillas son casos outlier o
atípicos (valores extraños o fuera de rango).
GRÁFICO DE TALLO Y HOJAS:

‒ Combina la representación numérica y gráfica.

‒ Para construirlo basta separar en cada dato el último dígito de la


derecha (que sería la hoja) del bloque de cifras restantes (que
forman el tallo).
‒ En la anterior salida de ordenador se indica que comienza con una
puntuación atípica, después hay una puntuación con frecuencia 1,
que es el 47, después se observan 6 puntuaciones con tallo 5 (52,
53, 53, 53, 55 y 56), etc. Si giramos el conjunto de números 90
grados a la izquierda podríamos observar cómo el grafico se
convierte en un histograma, que podríamos analizar.
…hasta aquí hemos llegado…

Esto no se queda aquí. Continuaremos.


Esto no se queda aquí. Continuaremos.
Esto no se queda aquí. Continuaremos.
Esto no se queda aquí. Continuaremos.
Esto no se queda aquí. Continuaremos.
Esto no se queda aquí. Continuaremos.
Esto no se queda aquí. Continuaremos.

También podría gustarte