Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GRADO EN FISIOTERAPIA.
PRÁCTICAS
Bloque 1
Tema 1. EL MÉTODO ESTADÍSTICO
Tema 3. LA INVESTIGACIÓN CIENTIFICA Y EL MÉTODO CIENTÍFICO
Con la investigación científica tenemos que ser críticos y selectivos, es decir, todo lo que podemos leer
no tiene porqué ser válido o puede no ser aplicable a mis pacientes o el estudio puede no estar bien
realizado, por lo que tenemos que identificar la literatura científica de calidad y que puede valer o que
no.
Debe haber una forma sistemática de investigar, es decir, tiene que haber un procedimiento estándar,
así, si alguien quiere replicar lo que hemos hecho para ver si es efectivo en otro tipo de población.
El procedimiento básico es: la OBSERVACION en base a algo, tras ello nos vamos a plantear una
PREGUNTA de investigación sobre algo que yo quiero conocer. Hay que plantear una HIPÓTESIS en
base a lo que ya sabemos, después vamos a tener que aplicar un EXPERIMENTO. Este nos va a dar
unos RESULTADOS (la comprobamos si es correcta o la rechazamos si no lo es). Si es correcta, en base
a ellos vamos a FORMULAR UNA TEORÍA Y UN MODELO (una conclusión).
ELABORACIÓN
OBSERVACIÓN PREGUNTA HIPÓTESIS EXPERIMENTO RESULTADOS DE MODELOS
Y TEORIAS
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Francisco se planteó este problema, el observó un fenómeno de que, al dejar la carne al aire, al cabo
de un tiempo aparecen los gusanos y él se plantea ¿cómo surgen los gusanos? → En base a la
observación nos plantamos un problema.
1.2. HIPÓTESIS.
Tras la observación y la pregunta, recogemos los datos y nos planteamos una hipótesis, es decir,
formulamos posibles explicaciones al fenómeno que observamos.
La hipótesis de Francisco Redi fue: La carne en descomposición expuesta al aire atrae seres como
moscas las cuales dejan sus huevos, posteriormente se desarrollan las larvas que generan los gusanos
que ayudan en la descomposición de la carne. → La ‘VERDAD’ se plantea como una hipótesis de
trabajo.
Vemos nuestra hipótesis, es decir, vamos a comprobar si dejando la carne al aire se van a atraer las
moscas y van a llegar los gusanos. Para ellos se plantea un proceso metodológico que sea replicable,
dirigido para confirmar o refutar la veracidad de la hipótesis (para confirmarla y para reforzarla
también, porque puede que no pase lo que creemos.)
1.3. EXPERIMENTACIÓN.
El objetivo de la experimentación es comprobar nuestra hipótesis.
Francisco Redi se planteó 2 experimentos: con 2 envases (de misma materia, tamaño, etc) con un
trozo de carne (de igual peso y tipo de carne) cada uno, es decir, todo estandarizado. Dejamos en
condiciones normales uno de los envases tapado y el otro al aire (sin tapar).
En los experimentos de artículos científicos, los grupos iniciales deben ser homogéneos, por ello
hay que ser crítico al leer un artículo y ver que si los grupos iniciales no son homogéneos los
resultados se pueden influir mucho y no ser los reales.
1.5. CONCLUSIONES.
En base a los resultados tenemos que extraer una conclusión:
En resumen:
El científico deduce a partir de su hipótesis unas consecuencias que son testadas con datos empíricos
y luego induce a partir de los resultados una conclusión con intención de generalizarla.
2. Método científico.
A todos estos pasos anteriores se les conoce como método científico.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
El método científico es el conjunto de pasos, técnicas y procedimientos que se emplean para formular
y resolver problemas de investigación mediante la prueba o verificación de hipótesis (para confirmarla
o rechazarla).
➢ SISTEMÁTICO: tiene que tener siempre una secuencia según un plan preestablecido.
LA INVESTIGACIÓN SIEMPRE SE TIENE QUE PLANEAR.
➢ RIGUROSO: tenemos que usar los mismos criterios a todas las unidades.
En el ejemplo antes: que la carne sea igual, que pese lo mismo, etc; los envases del mismo
material, de la misma medida, etc).
Una vez planificado lo tenemos que EJECUTAR, lo llevamos a cabo. Vamos a recoger los datos (si
tenemos que comprobar si una técnica es mejor que otra, aplicamos la intervención), recogemos los
resultados y los analizamos.
Una vez analizados, lo último que tenemos que hacer es DIFUNDIRLO: lo difundimos en diferentes
medios para aportar nuevo conocimiento.
- Artículos
- Conferencias (mediante comunicaciones orales que es como un breve resumen del articulo
pero un poco más extenso)
- Poster (con las partes claves del artículo)
- Docencia
- Redes sociales
Estadística y métodos de investigación en fisioterapia
Bloque1. Tema 1.
Las variables estadísticas, datos y medición.
1. Introducción.
La estadística es un método que se puede emplear en múltiples factores, se podría usar
para la realización de meta-análisis, la valoración de la eficiencia y eficacia de una técnica
fisioterapéutica, el reclamo de los pacientes al conocer el porcentaje de efectividad de
la clínica…
2. Variables.
En primer lugar, cuando un paciente acude a una clínica debemos realizar una valoración
para a partir de esos datos, poder saber posteriormente si evoluciona, empeora o cómo
avanza en sí la lesión. Para ello, se comienza con una anamnesis mediante un
interrogatorio al paciente para conocer:
1
Estadística y métodos de investigación en fisioterapia
3º Medidas de evaluación.
Si nos centramos en el dolor, en primer lugar, es importante registrar la zona donde este
se presenta. Posteriormente se evaluará, para ello, se pueden emplear diferentes
escalas, entre ellas la escala EVA o la escala de dolor de Wong-Baker. Esta última es
muy empleada en pediatría ya que se basa en unas caras de colores que representan los
diferentes sentimientos desde no dolor hasta dolor máximo, va asociada también a una
escala numérica. Es muy importante también evaluar y anotar esta sensación en cada
sesión, para ver cómo se evoluciona la sintomatología.
Además de este, podemos valorar gran cantidad de signos importantes para determinar
la presencia o no de alteración en la función del individuo. Ejemplos de ello son:
2
Estadística y métodos de investigación en fisioterapia
Esta imagen es del SPS que es donde nosotros trabajaremos más adelante los datos en
prácticas.
Ejemplo para comprender la diferencia entre valor o dato y variable:
3
Estadística y métodos de investigación en fisioterapia
4. Tipos de variables.
Podemos distinguir dos tipos de variables según la naturaleza de sus modalidades:
Cualitativas, también llamadas categóricas, son las que indican cualidades, clases o
modalidades, pero nunca indican números. A su vez, encontramos:
Cualitativas nominales, los valores son categorías (hacen referencia a una
cualidad) y no existe orden en su asignación.
Ej: al hablar del sexo da igual que sea hombre o mujer, por ello uno no va
antes que el otro, nosotros podemos elegir cuál es su orden. El estado civil,
la situación laboral, situación de estudio…
Cualitativas ordinales, si existe un orden en su asignación, pero no una distancia
o intervalo definido entre los valores. Cada valor posible es menor o mayor que
otro valor, siempre.
Ej: en la escala EVA no es lo mismo el valor 1 que el 6, sí que siguen un orden.
Cuantitativas o medibles, indican valores respecto a una unidad: son aquellas que
podemos medir y obtenemos un número, y cada valor posible es menor o mayor que
otro valor. Dentro de estas, distinguimos:
Cuantitativas discretas, si son números enteros y el número de valores posibles
es finito, es decir, al ser números enteros es más probable que coincida entre
los pacientes.
Ej; 5, 10, 21, 38… Cuando hablamos de la edad de una persona, número de
personas, etc.
Cuantitativas continuas, si toman cualquier valor de la recta real o de un
intervalo (número de valores posibles infinito, muy amplio, pueden no coincidir
ningún valor entre los pacientes), es decir, poseen decimales.
Ej: 5’2, 10’3, 0’1, 85’95… Altura, fuerza muscular (escala cuantitativa de
kendall), peso…
Ejercicio realizado en clase para comprender todo esto mejor:
4
Estadística y métodos de investigación en fisioterapia
5. Medición.
Es un proceso de asignar números (valores) a los datos de las variables o categorías
mediante unas determinadas reglas, aplicable a todo tipo de investigación, ya sea
cualitativa o cuantitativa.
Para las variables cualitativas las reglas de medición determinan el procedimiento de
asignación de números a las modalidades de la variable, a las categorías. Esa asignación
es lo que se denomina como codificación, lo que nos va a permitir poder analizar datos
y que disminuya el error al trabajar con números y no con palabras, ya que siempre se
deberían escribir igual para que no hubiese error.
Ej: hombre=0 y mujer=1 o viceversa, no es importante cual sea el 1 y cual el 0 mientras
se tenga claro cuál es cual y esto no varíe a lo largo de todo el estudio. Es decir, siempre
que nosotros identifiquemos una variable, da igual el número que le asignemos, pero si
o si debemos cuantificar esa variable cualitativa y ese número es inamovible durante
todo el estudio ya que si no, se altera el resultado.
Los elementos básicos que se requieren para realizar una medición son 3 para las
variables cuantitativas: instrumento de medición, escala de medición y sistema de
unidades de medición.
5
Estadística y métodos de investigación en fisioterapia
Ejemplos
Amplitud articular Instrumento de medición: goniómetro/ Escala de medición: …/
Sistema de unidades de medición: grados (º).
Velocidad de la marcha Instrumento de medición: tapiz rodante/ Escala de medición:
…/ Sistema de unidades de medición: distancia/tiempo (m/s).
Mientras que para las variables cualitativas serían 2: instrumento de medición y escala
de medición.
Ejemplos
Tope articular Instrumento de medición: manos del fisioterapeuta/ Escala de
medición: duro, blando…
Obesidad Instrumento de medición: índice de masa corporal (IMC)/ Escala de
medición: IMC
Hay que tener en cuenta que una variable cuantitativa puede ser también cualitativa
pero una cualitativa no puede ser cuantitativa. Ya lo explicaremos más adelante en este
tema.
Ejercicio de repaso para distinguir la clasificación de las variables:
N= Cualitativa nominal C= Cuantitativa continua D= Cuantitativa discreta O= Cualitativa ordinal
6
Estadística y métodos de investigación en fisioterapia
Categóricas: escala nominal y escala ordinal. Por consiguiente, coinciden con el tipo
de variable que sea.
Cuantitativas: escala de razón y escala de intervalo.
7
Estadística y métodos de investigación en fisioterapia
8
Estadística y métodos de investigación en fisioterapia
Ejercicio para determinar cuál es el tipo de variable (es el mismo que ya se vio
anteriormente) y la escala de medición:
9
Estadística y métodos de investigación en fisioterapia
10
Estadística y métodos de investigación en fisioterapia
Por consiguiente, al realizar esa división planteada anteriormente a partir de los datos
que se encuentran en la 1ª y 2ª columnas, obtenemos el IMC. De esta forma, podemos
clasificar a la persona en la escala de obesidad. Es por ello que, pasamos de una variable
cuantitativa a una cualitativa.
Por tanto, es importante aprender a manipular, analizar, estudiar y explotar los datos
obtenidos en nuestro estudio. El proceso de definir y medir las variables es crucial. Si
definimos las variables de forma incorrecta o medimos mal, los resultados estadísticos
no serán válidos, como es el caso de la primera variable de la tabla de arriba que no da
ese resultado de IMC, sería 23’11 y sería aceptable (aunque a mí no me daba eso, pero
bueno). Si nos confundimos en los resultados y por consiguiente los falseamos, puede
tener unas grandes repercusiones negativas en nuestro estudio.
11
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Bloque 2. Tema 1.
DESCRIPCIÓN DE DATOS UNIVARIANTE: TABLAS Y GRÁFICOS.
En las columnas están las variables (edad, sexo, estado civil, etc) y en las filas los casos.
Esta tabla (base de datos) nos permite trabajar con los datos, pero NO es útil, por lo que tendremos
que aplicar una serie de análisis para ordenar o describir lo que tenemos en la tabla.
Por ejemplo, al cabo de 6 meses quiero saber como son los pacientes que tenemos en la clínica, si la
mayoría son ancianos quizá nos interesa meter x técnica específica para esa población más que un
aparato de fisioterapia deportiva o de fisioterapia respiratoria. El hecho de conocer a nuestros
pacientes nos va a permitir encontrar necesidades. También nos sirve para ver si hemos obtenido
buenos resultados, es decir, conocer si estamos avanzado en la recuperación de los pacientes (puede
que con unos si estemos avanzando y con otros no).
Para transformar la base de datos en datos que nos sean más útiles empleamos tablas, gráficas, etc.,
lo hacemos para simplificar los datos y poder visualizarlos y trabajarlos de forma más fácil.
Por ejemplo, con el estado civil de nuestros 30 sujetos:
- En forma de tabla podemos ver los casos agrupados en determinadas categorías, por
ejemplo, quiero saber cuántos viudos tenemos entre nuestras pacientes y en la tabla de
forma rápida podemos saber que tenemos 6 viudos de los 30 pacientes que hay en total.
- En forma de gráfica podemos visualizar fácil y rápido cuantos pacientes hay en cada
categoría (en porcentajes), por ejemplo, podemos observar que la mayoría de los pacientes
son casados.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Por lo tanto: de nuestra hoja de registro obtenemos nuestra base de datos y a la hora de gestionar
los datos (de ver como son nuestros pacientes) tenemos que hacer un Informe de resultados, por
ello es importante saber simplificar los datos (esto también ocurre en un proyecto de investigación
al final los resultados hay que publicarlos sea en formato artículo, formato informe…).
La estadística descriptiva es hacer una descripción de los pacientes (no vamos a saber si una técnica es
mejor que otra, simplemente voy a conocer como son los pacientes).
La frecuencia acumulada sirve para si tenemos varias categorías como por ejemplo de velocidad de
la marcha, y quiero saber cuantas personas tengo que No Andan o que Andan Muy Lentas podemos
saberlo de manera rápida con la frecuencia acumulada ya que sabemos el porcentaje de esa
categoría y de la anterior, ya que quizá podemos aplicar el mismo tipo de técnica a ambos.
La construcción de las tablas nos va a permitir obtener datos de forma ordenada, así como su
representación gráfica mediante gráficos estadísticos.
2.1.2. GRÁFICOS ESTADÍSTIOS: una vez obtenidas las tablas, puede ser mucho más fácil visualizar un
gráfico. También nos interesan los gráficos de cara a publicitar los resultados de nuestra clínica
(atrae más un gráfico que una tabla). Podemos ver que categoría es la más predominante:
GRÁFICOS DE DISPERSIÓN: Vemos cada uno de los casos agrupados y en que categoría está (nos
indica si el caso 10 por ejemplo es mujer o si el caso 22 es hombre, en los otros gráficos eso no lo
podemos saber). Estos gráficos dan mucha información, pero nos quedamos principalmente con los
gráficos de barras y los de sectores.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
DIAGRAMA DE BARRAS: Se puede emplear para frecuencia absoluta, frecuencia relativa y frecuencia
acumulada. Puede representarse vertical u horizontal.
Por ejemplo: en la variable estado civil tenemos 5 categorías, en el gráfico de diagrama de barras
tenemos en el eje y (VERTICAL): el número de casos (frecuencia absoluta) y en el eje x (HORIZONTAL):
tenemos las diferentes categorías.
Si trabajamos con frecuencias absolutas y con frecuencias absolutas acumuladas (vemos cuantos
pacientes vamos acumulando, por ejemplo, quiero ver que pacientes tienen un dolor menor a 3
[categoría], asique me voy a la frecuencia absoluta acumulada y puedo ver cuántos pacientes están
por debajo de esa categoría de nivel de dolor):
Si trabajamos con frecuencias relativas (es muy parecido a la frecuencia absoluta, simplemente en el
eje y ponemos porcentajes [la aplicación es la misma]) y con frecuencias relativas acumuladas (la
barra final será el 100% de nuestros pacientes):
Estadística y métodos de investigación en fisioterapia
Loli Martínez
DIAGRAMA DE SECTORES: Se puede emplearen frecuencia absoluta (fi) y relativa. Se trata de dividir
el número de pacientes, pero en forma de círculo y el ángulo de cada sector en el que se divide el
círculo lo vamos a obtener en base a la frecuencia absoluta (el ángulo es proporcional a la frecuencia
absoluta).
N = número total de la muestra (población)
360º fi = frecuencia absoluta
∝= × 𝑓𝑖
N
α = ángulo en el diagrama
Estadística y métodos de investigación en fisioterapia
Loli Martínez
También se puede calcular con frecuencias relativas (aunque para calcular el ángulo se sigue
empleando la frecuencia absoluta), pudiéndolo expresar como forma de porcentaje:
Ejercicio: calcula los ángulos de cada caso (¡¡¡ESTE TIPO DE EJERCICIOS PUEDEN CAER EN EL EXAMEN!!!)
360º
∝= × 𝑓𝑖
N
0: α = 360/30 x 3 = 36º
1: α = 360/30 x 5 = 60º
2: α = 360/30 x 15 = 180º
3: α = 360/30 x 4 = 48º
4: α = 360/30 x 2 = 24º
5: α = 360/30 x 1 =12º
En un intervalo tenemos que tener en cuenta que cada categoría se va a denominar clase (los
valores se van a agrupar en intervalos de una misma amplitud). Cada clase va a tener:
→ Límites de la clase: cada clase está delimitada por un
límite inferior y otro límite superior. Para el intervalo
semiabierto [42-52[ el lim inferior es 42 y el lim superior
es 52 (aunque sea semiabierto se incluye b, en este caso
52).
→ Amplitud de la clase: diferencia entre el límite superior y
el inferior. Para el intervalo semiabierto [42-52[ la
amplitud seria 52-42 = 10 (distancia entre un valor y
otro).
→ Marca de la clase: punto medio de cada intervalo y es el
valor que representa a todo el intervalo para el cálculo
de algunos parámetros. La marca de la clase se saca con
una media, Para el intervalo semiabierto [42-52[ la media seria (42+52) /2 = 47 y por tanto la
marca de la clase seria 47. Para el intervalo semiabierto [52-62[ la marca de la clase sería 57.
1º. Localizar el valor menor (seria el límite inferior) y el mayor (el límite superior).
Ej: valor menor: 42 y el valor mayor: 95.
2º. Se restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible.
Ej: 95-42 = 53
EJERCICIO RESUELTO →
Estadística y métodos de investigación en fisioterapia
Loli Martínez
- 2.2.2. GRÁFICOS ESTADÍSTIOS: Una vez que tenemos la tablas, al igual que las variables
cualitativas, las podemos representar con gráficos. Se pueden emplear también diagramas
de barras, pero lo que más utilizaremos son los histogramas
En este caso el histograma es con frecuencia absoluta, por eso en el eje y el máximo es 8 porque la
frecuencia absoluta mayor que tenemos en nuestros intervalos es 7. En el eje x se construyen los
rectángulos y en el centro estaría la marca de la clase.
Con la frecuencia relativa, lo único que cambia es en el eje y, que tenemos el %, en este caso el
máximo es de 23,3 por lo que en la gráfica solo tenemos de máxima hasta 25.
Con la frecuencia relativa acumulada podemos saber cuantos de mis pacientes tienen una velocidad
de la marcha específica. Por ejemplo: una velocidad de la marcha por debajo de 62 (porque esos son
que están muy mal y les cuesta andar mucho), con esta gráfica nos vamos a la frecuencia acumulada
y observamos que el 33,3 % están muy mal y a lo mejor hay que incidir mas en otro tipo de técnicas.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Sobre los histogramas también se pueden construir polígonos de frecuencias, se construye cogiendo
la marca de clase de cada intervalo, que coincide con el centro de cada rectángulo, y los unimos
trazando una línea. El polígono de frecuencia nos puede dar una idea de la tendencia que hay, por
ejemplo, en el intervalo de 52 a 72 tenemos un porcentaje similar de sujetos, en el siguiente
intervalo (de 72 a 82) tenemos menor proporción y ya en el siguiente aumenta.
DIAGRAMAS DE SECTORES:
Se calcula igual que en las variables cualitativas:
Los histogramas, las barras, o los diagramas nos puede dar una idea de que está pasando con
nuestra muestra y nos pueden dar diferente información:
DIAGRAMA SIMÉTRICA / NORMAL: cuando la muestra es igual, por ej: si partimos por la mitad
nuestro histograma, la izquierda seria igual que la derecha. Los datos indican una distribución
normal, se puede concluir que es estable. Por ejemplo: talla, peso.
FORMA U / BIMODAL: Los datos pueden venir de dos procesos diferentes. Por ejemplo: peso de n
club deportivo (hombre y mujeres). ¡¡Lo veremos en seminarios y practicas!!
Los picos nos pueden dar una idea de que al introducir los datos en la base nos hemos equivocado
(por ejemplo: hemos puesto un 100 cuando esa variable era 10) o si estamos trabajando con
pacientes que no están bien (por ej: que hayan sufrido un Ictus y tenemos uno que lo ha sufrido pero
que está bastante bien).
- Pico aislado: hay una separación entre un conjunto de barras y otro conjunto
- Pico extremo: hay una barra con un poco muy diferente al resto
3. Estadística.
La estadística descriptiva es un grupo de métodos
empleados para organizar, mostrar y describir
nuestros datos utilizando tablas, gráficas y medidas,
es decir, para decir como son nuestros pacientes.
Con la estadística descriptiva NO podemos decir si
una técnica es mejor que otra, simplemente podemos
decir como es la muestra/pacientes.
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Bloque 2. Tema 2.
Síntesis de datos Univariante
1. Introducción.
Ya sabemos cómo son nuestros pacientes y cuáles son los resultados. Esta vez, nos toca
determinar si realmente estos resultados que estamos obteniendo son beneficiosos
para nuestra clínica o no. Por ello, es importante sintetizar todos los datos obtenidos
para que, mediante un único dato sepamos varias cosas.
Importante: todas las fórmulas matemáticas que aparecen en el tema no es necesario
aprenderlas de memoria, pero si debemos saber cómo emplearlas. Ejemplo: no tenemos
que saber la fórmula matemática de la media, pero si saber cómo se realiza esta.
1
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
A todos estos valores de los que estamos hablando los vamos a denominar valores
estadísticos, entendiendo por ello, cualquier resultado calculado a partir de los valores
de una muestra. Además, el concepto de muestra hace relación con el número total de
casos, en esta ocasión pacientes, que nosotros estamos considerando para nuestro
estudio.
Hay que tener en cuenta que, en cualquier gráfica, no solo de dispersión, la parte central
donde se encuentran reunidos un mayor número de puntos, haría relación o
correspondería a la media del estudio, son los que se conocen como valores centrales y
son los más comunes. Mientras que, aquellos puntos que se alejan del centro de la
gráfica serían los valores de dispersión.
Como resultado, podremos decir que la centralización son los valores centrales de la
variable, los cuales nos permiten sintetizar los datos para que sea más sencillo. Es decir,
nos deja resumir una variable en un dato interpretable. Por otro lado, la dispersión, los
valores más alejados, nos permitirían conocer o medir la distancia entre los datos
respecto al centro.
En los siguientes tipos de gráficas, las flechas de color rojo indican los valores centrales,
mientras que las amarillas señalan los valores de dispersión.
Si poseen mayor dispersión, los valores se van a encontrar más separos del centro. En
estas gráficas, diagrama de normalidad, debemos tener en cuenta que el centro es la
parte más apical, donde más casos se concentran. Por ello, en la gráfica 2, la línea de
color rojo posee mayor dispersión que la negra ya que se encuentra más plana y esto
indica que el mayor número de casos estaría en los lados. Sin embargo, en la línea negra,
la dispersión en menor ya que su anchura en menor y mayor su verticalidad. En la gráfica
1, la línea verde sería la de mayor dispersión, mientras que la roja la de menor o mayor
número de valores centrales.
1 2
2
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Conocer esto mediante la representación de la media, nos sirve para poder diferenciar
si ha habido una mejora significativa o no en nuestros pacientes al cabo del tiempo. Si
nos fijamos en la media, podremos saber esto ya que, si en un primer momento eran 69
3
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
y ahora se encuentra en 132, se ha producido una clara mejoría en estos. Mientras que,
con la tabla de datos únicamente (tabla verde de arriba), no seriamos capaces de
conocerlo.
X= (165+100+130+170+150+135+153+145+147+145) / 10=
=144
4
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
3.2. Mediana.
Cuando se producen esos valores extremos, la media no es 100% efectiva ya que deja
variables fuera. Por ello, es necesario emplear la mediana (Me). Esta es el valor de la
variable que deja al 50% de los sujetos por debajo (y el restante 50% por encima), es
decir, nos divide la variable en 2, justo la mitad de la población. Como es el valor que
parte la muestra en dos partes exactamente iguales, no influyen esos extremos.
Para calcular esta, debemos ordenar todos los datos de menor a mayor, si se repiten las
variables se ponen, aun así, ya que el objetivo es sumar los dos valores centrales (en el
caso de que el número sea par) y dividirlo entre 2 (el 50%). Si es impar, la mediana sería
justo el valor que deja por debajo y por encima de este el mismo número, sin contar
este.
Ejemplo casos pares:
Los valores situados en la tabla azul se han ordenado de menor a mayor desde el 68 al
110. Una vez así, se han cogido los que corresponden al valor 5º y 6º, una vez ordenados,
ya que son la mitad de la ordenación. De tal forma que se han sumado estos valores
90+90 y se dividen entre 2 para obtener cual es el número que corresponde a la media.
En este caso, la media es 90 ya que los dos valores que hemos sumado eran los mismos.
total de casos que poseemos para que así sea par; como tenemos 11 casos, hacemos
11+1=12 y a este número que obtenemos calculamos su mitad, 12/2=6. Por
consiguiente, buscamos el 6º número que hemos ordenado y este posee 5 números por
debajo y 5 por arriba, por consiguiente, la media corresponde a 90 puesto que era el 6º
número al ordenarlos.
La mediana solo se puede emplear en variables cuantitativas, pero nos puede ser útil en
alguna cualitativa, ej: en el dolor, y para esta tenemos en cuenta la posición de los
números al ordenarlos, no su valor. La vamos a representar mediante el Gráfico de cajas
y bigotes, en la que el centro de la caja corresponde a la mediana ya que divide en 2
esta de manera exacta.
6
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
7
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Para la realización de nuestro estudio, y que nos sea favorable, nos interesa que las
variables no estén ni muy alejados ni muy cercanos, es decir, que la dispersión no sea
muy grande pero tampoco muy pequeña.
Principalmente, podemos destacar 3 tipos de variables de dispersión que son, el rango,
la varianza y la desviación típica. A continuación, vamos a ir desarrollando cada uno de
ellos más detalladamente.
En esta gráfica podemos ver como la media
coincide en ambas (la línea de puntos), pero,
sin embargo, la dispersión es diferente ya que
una posee una baja dispersión y la otra la
presenta más elevada.
8
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
La desventaja que posee el rango, es que no tiene en cuenta la distribución de los datos,
es decir, le da igual el número de veces que poseamos un mismo valor. Solamente tiene
en cuenta cual es la consecución de los números. Por ello, el siguiente ejemplo, en el
que se observa que no poseemos ningún dato con el valor 8 o 9 y si poseemos 3 datos
con el valor 12, no varían cual es el rango. Esto se debe a que entre el 12 y el 7 sigue
habiendo 5 datos, estén o no. Además de ello, va a ser muy sensible a la presencia de
datos extremos, por lo que el rango varía mucho. Si poseemos, por ejemplo, 5 paciente
de los cuales, 4 de ellos poseen una edad de entre 1-4 y resulta que, el 5º paciente posee
50 años. A consecuencia un único dato, nuestro rango cambia mucho.
Hay que tener en cuenta que, debido a esto, no nos sería muy útil cuando existen valores
muy extremos, por ello, empleamos la varianza en estos casos.
4.2. Varianza (s2).
La varianza si nos permite calcular la distancia entre dos datos, aunque estos sean
extremos. Por ello, se define como la medida o distancia de los datos respecto a la línea
media. Además, es el promedio de la distancia de cada uno de los datos con respecto a
la media, elevado al cuadrado, entre el número de casos menos 1.
9
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
La razón por la que se elevan al cuadrado los valores de la distancia entre los puntos y
la línea media es para evitar que se obtenga un valor de cero, ya que si no estaríamos
sumando un valor positivo (si se encuentra en el lado derecho de la línea) y uno negativo
(si se encuentra en el lado izquierdo) y habría altas probabilidades de obtener números
negativos o 0 al anularse las medidas. Es por ello por lo que la varianza viene expresada
en unidades al cuadrado s2, o bien, σ2 .
S2= varianza ∑= sumatorio
X= variable n= Número total de casos
Ejercicio. Calcula la media y la varianza a partir de la siguiente tabla:
En el examen seguramente caiga un ejercicio como este, en el que habrá que calcular la
media y la varianza.
Recordemos que para sacar la media únicamente tenemos que sumar todas las variables
y dividirlo entre el número total de casos, en este caso 10. De esta forma, se obtiene
88.5
Para la varianza vamos a hallar los valores que salen en la 3ª columna. ¿De dónde salen
estos valores? Es muy fácil, únicamente debemos coger la variable que tenemos y
restarle la media y recordemos que debíamos elevarlo al cuadrado (ejemplo: (90-
88.5)2=2.25). Realizaríamos esa operación en todos los casos y obtendríamos los
números de la columna. Posteriormente sumamos todos y así obtenemos 1728’5 para
posteriormente dividirlo entre el número total de casos-1. Al realizar esa operación
obtenemos el resultado.
Al obtener la varianza, realmente no obtenemos nada, ósea, me explico. Nosotros
obtenemos un número que lo vemos y pues bueno, ahí está, pero realmente si vemos
ese valor por sí solo no sabemos qué hacer con él ni para que nos sirve. Es por ello por
lo que, a partir de la varianza, podemos sacar la desviación típica.
4.3. Desviación típica (s).
La desviación típica es la raíz cuadrada de la varianza S= √s2 . De esta forma nos
quedamos con la distancia media final que será lo misma tanto en los valores
positivos como negativos.
10
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Estos 3 casos poseen la misma media de 15.5, por lo que si únicamente tuviésemos ese
valor nosotros podríamos pensar que los casos serían iguales. Sin embargo, si
observamos la representación gráfica vamos que son completamente diferentes. Esto
se debe a la presencia de casos aislados u extremos en cada caso, por ello, si hayamos
la desviación típica de cada caso, vemos que estos ya si varían y no coinciden. De esta
forma, podemos ver como el caso C es la que mayor s presenta puesto que en los
gráficos se ve que sus datos están más alejados y, por eso, mayor distancia entre ellos y
mayor s.
A continuación, se muestran diferentes formas de representar la dispersión. Tener en
cuenta que en las 3 gráficas se representa la misma y la media está sobre los 70-75.
11
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Aquí la profesora dejó tiempo para que hiciésemos un ejercicio exactamente igual
que el anterior que he explicado cómo se hacía, el de hallar la media y la desviación
típica que he dicho que saldrá uno por el estilo en el examen. No voy a resolverlo
entero, voy a volver a explicar cómo se haría el 1er caso por si acaso no se ha
entendido antes muy bien y directamente pongo los resultados y explico cómo
calcular la desviación típica.
En 1er lugar, ordenamos todos los casos de menor a mayor, de 100-170 y calculamos
la media, la resta del valor más alto menos el pequeño (170-100=70). A partir de
aquí, vamos a calcular la desviación de cada caso; el caso 1 sería: (165-70)2=9025, y
haríamos lo mismo con los demás casos. Luego los sumamos todos y dividimos entre
9, ya que son 10 casos (10-1) y así sacamos la s2. Una vez tenemos que s2= 384’2,
para hallar la desviación típica solo tenemos que hacer la raíz cuadrada de eso;
S=√384’2 =19’6.
12
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Algo importante es que no tiene por qué tener siempre moda una distribución, como es
el caso E de las siguientes gráficas, ya que todas las materias se repiten más o menos el
mismo número de veces. Por otro lado, existen también casos en los que podemos estar
ante variables bimodales como es el caso B o F, puesto que más de 1 categoría se repite
un número elevado de veces. La A sería simétrica, la C distribución asimétrica positiva y
la D distribución asimétrica negativa (ya explicado antes).
La moda puede ser muy parecida a la mediana, aunque no necesariamente tiene porque
ser igual ya que, recordemos que, la mediana nos dividía la muestra en 2 partes
13
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
exactamente iguales (50%). La gráfica izquierda sería asimétrica negativa, la del centro
simétrica (los 3 datos coinciden) y, la derecha, asimétrica positiva.
Importante: Hay que fijarse que, en las asimétricas, la moda siempre coincide con la
parte más alta de la gráfica, la mediana es la parte que divide en los partes iguales (de
anchura, 50%) la gráfica, y la media, en donde la gráfica comienza a ascender o
descender (recordar que la gráfica va de izquierda a derecha de menor a mayor).
Edad: cuantitativa
Nivel de educación: cualitativa, ordinal.
Características clínicas (FEV1 y FVC):
cuantitativas.
Historia de fumador (actual, antiguo, nunca
ha fumado): cualitativa, ordinal
Grupo Old: cualitativa, ordinal.
CAT (estado de salud): cuantitativa que se
transforma en cualitativa.
Escala MRC, similar a la EVA: cualitativa,
ordinal.
14
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Resumen:
Hay valores centrales que para variables cuantitativas son la media y la mediana.
Para la cualitativa nos vale la mediana y la moda.
Luego tenemos las medias de dispersión que nos valen para las cuantitativas, no
a las cualitativas.
La desviación típica nos es más práctica al ser válida si existen valores extremos,
mientras que el rango no lo es.
La mediana y la moda son variables más robustas que la media, ya que si se
pueden emplear cuando existen valores extremos.
15
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Bloque 2. Tema 3.
LA POSICIÓN EN LA DISTRIBUCIÓN EN LA DISTRIBUCIÓN Y EL
MODELO NORMAL.
1. Introducción.
Continuando con el hilo (como se distribuyen las variables, como se distribuyen los datos y como los podemos
resumir), ya sabemos como son nuestros pacientes y podemos observar a simple vista (nos podemos guiar por
la media) si estamos teniendo buenos resultados, pero no podemos saber si los cambios que estamos viendo en
nuestra población son relevantes o no (eso se ve con la estadística inferencial). Con la estadística descriptiva
simplemente describimos la población.
Se estudian los datos con las tablas de frecuencias o mediante gráficos, después se sintetizan los datos sobre
todo para variables cuantitativas en las que tenemos muchísimos datos.
Podemos saber cuál es el valor que nos va a dividir la muestra en dos, pero ¿y si quiero saber donde se encuentra
el 25% de mis sujetos?, porque quiero comparar con respecto al 75% (no se emplearían las mismas técnicas en
una patología de rodilla en un paciente por debajo del 25% que en uno que esté por encima del 75% de capacidad
de andar, ya que los pacientes por debajo del 25% se encuentran mucho peor). Esto nos ayuda a saber que
pacientes están por debajo del 25%, del 50%, etc a la hora de por ejemplo aplicar una técnica o de medir. Esto
lo vamos a conseguir con las medidas de posición.
2. Medidas de posición.
Las medidas de posición son indicadores usados para señalar una determinada posición dentro de una
distribución de frecuencias (esto es: el valor que tiene cada caso, y lo situamos en un gráfico/tabla para ver
cómo se comporta), es decir, las medidas de posiciones es ver en qué lugar se encuentran. Una medida
de posición puede ser la mediana (Me), que nos divide nuestra muestra en dos, es decir, es el valor
que me va a dejar el 50% de los sujetos por debajo y el 50% restante por encima. Como medidas de
posición también tenemos: Cuartiles, Deciles y Percentiles.
CUARTILES
Dividimos nuestra muestra en 4 porciones de un 25% cada una. Tenemos 3 cuartiles (Q1, Q2, Q3).
• Cuartil 1 (Q1). El Q1 deja la cuarta ( ¼ ) parte (25%) de los datos por debajo de él.
𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑸𝟏 =
4
• Cuartil 2 (Q2). El Q2 deja las dos cuartas ( 2 /4 ) partes (50%) de los datos por debajo de él. Se
corresponde con la MEDIANA.
2 𝑥 𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑸𝟐 =
4
• Cuartil 3 (Q3). El Q deja las tres cuartas ( 3 /4 ) partes (75%) de los datos por debajo de él.
3 𝑥 𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑸𝟑 =
4
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Ejemplo: que valor de la velocidad de la marcha me deja el 25% de mis sujetos por debajo, es
decir el valor que utilizo como punto de corte para ver que sujetos están peor:
1º. Ordenar los valores de menor a mayor
DECILES
Dividimos nuestra muestra en 10 porciones de un 10% cada una. Tenemos 9 deciles (D1, D2, …, D9).
Es para ir más al detalle. Se calcula igual que los cuartiles:
• Decil 1 (D1). El D1 deja la décima ( 1/10 ) parte (10%) de los datos por debajo de él.
𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑫𝟏 =
10
• Decil 2 (D1). El D2 deja las dos décimas ( 2/10 ) partes (20%) de los datos por debajo de él.
2 𝑥 𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑫𝟐 =
10
• Decil 5 (D5). El D5 deja las cinco décimas ( 5/10 ) partes (50%) de los datos por debajo de él.
Se corresponde con la MEDIANA (dividiría la muestra en 2).
5𝑥 𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑫𝟓 =
10
Estadística y métodos de investigación en fisioterapia
Loli Martínez
PERCENTILES
Dividimos nuestra muestra en 100 partes de 1% cada una. Son útiles para ser muy muy precisos. A los
niños cuando son pequeños se les sitúa en un percentil en base al peso y a la altura. Se calcula igual
que los anteriores.
• Percentil 1 (P1). El P1 deja la 1/100 parte (1%) de los datos por debajo de él.
𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑷𝟏 =
100
• Percentil K (PK). El PK deja la K/100 parte (K%) de los datos por debajo de él.
𝐾 𝑥 𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑷𝑲 =
100
• Percentil 50 (P50). El P50 deja la 50/100 parte (50%) de los datos por debajo de él. Se
corresponde con la MEDIANA (dividiría la muestra en 2).
50 𝑥 𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑷𝟓𝟎 =
100
2º. Fórmulas:
Q1= 10/4 = 2,5 ; (130 + 135) / 2 = 132,5 (la media entre el 2º y el 3º valor)
Q2= (2 x 10) /4 = 5 ; (145 + 147) / 2 = 146 (la media entre el 5º y el 6º valor)
Q3= (3 x 10) /4 = 7,5 ; (150 + 153) / 2 = 151,5 (la media entre el 7º y el 8º valor)
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Q1 = 132,5
Q2 = 146 (MEDIANA)
Q3 = 151,5
En una distribución normal simétrica, la Media, la Mediana y la Moda van a estar en el centro de la
distribución.
Si tenemos una distribución sesgada (positiva o negativa), ya no coinciden en el centro la media, la
mediana y la moda y ya no seria una distribución normal (en esa distribución está pasando algo, están
puntuando o muy por debajo o muy por encima).
El punto de inflexión (hay que tenerlo muy en cuenta) es la distancia a la desviación típica desde la media.
Nuestro punto inicial siempre va a ser la media y podemos ir por arriba o por debajo a desviaciones
típicas, es decir, estoy en mi punto inicial y puedo dar un paso hacia delante o un paso hacia atrás (ese
paso sería una desviación típica y puedo dar uno, dos o tres que sería el máximo) podemos tener 3
desviaciones típicas por arriba y 3 desviaciones típicas por debajo.
La Regla Empírica (68-95-99), es muy importante. El 68% de la población de mi muestra se concentra
a ± 1σ, es decir si parto de la media puedo ir ‘un paso’ hacia arriba y tenemos un 34,1 % de la población
y si voy un paso por debajo también tenemos un 34,1 % de la población, en total tendríamos un 68%
(a nuestra media le sumamos o le restamos una desviación típica). Si nos vamos ahora a 2 desviaciones
típicas por arriba y por abajo (± 2σ), ahí encontramos el 95% de nuestra población. A 3 desviaciones
típicas por arriba y por abajo (± 3σ) tendríamos al 99% de nuestra población (tenemos prácticamente
a toda la población de nuestra muestra dentro de ese rango desde - 3σ hasta + 3σ).
Estadística y métodos de investigación en fisioterapia
Loli Martínez
▪ El 95% de los valores se concentra entorno a ± 2σ (en los artículos pone intervalo de confianza (IC)
95%), es decir, existe un 95% de posibilidades de observar un valor comprendido entre el
intervalo. Nosotros vamos a dar un dato de media y también un rango donde puedan ‘bailar’
los valores, donde se sitúen la mayoría de nuestra población (si nuestra media es 8 y tengo un
paciente que tenga 7,5 no es raro, aunque no coincida exactamente con la media, por lo que
tenemos que da un rango donde los valores los podemos considerar como aceptables).
También se puede coger el 99%. Es el rango de erros que estemos dispuestos a asumir, ya
que si cogemos un intervalo mas pequeño el rango de error posiblemente sea más grande ya
que nos estamos dejando a muchos pacientes fuera.
▪ La forma de la campana va a depender de la media (μ) y de la
desviación típica (σ). La media va a indicar el punto más alto de la
campana y la desviación típica el grado de apuntamiento. Si σ es muy
grande la curva va a ser muy aplanada (la azul) y es porque tenemos
muchos valores dispersos con respecto a la media. Si tenemos una σ
pequeña, la curva va a ser muy apuntalada/estrecha (roja). No existe
una única distribución normal, nosotros tenemos una base, pero
existe una amplia variedad de distribuciones normales con una
forma común que van a estar determinadas y diferenciadas por su
media y su desviación típica.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Ejercicio: Altura media de los hombres = 184 cm y la σ = 8cm → N (184, 8). Teniendo en cuenta esto
y que el modelo normal es apropiado para esta distribución, entre que valores se encuentra el 68,26%
es la población? ¿y el 95%?
Ejercicio: μ = 100 y σ =16, ¿entre que valores se encuentra el 68%, el 95% y el 99%?
Para sacar el 68% → 100 - 16 = 84 = -1σ
100 + 16 = 116 = +1σ
Para sacar el 95% → 100 - 32 = 68 = -2σ
100 + 32 = 132 = +2σ
Para sacar el 99% → 100 – 48 = 52 = -3σ
100 + 48 = 148 = +3σ
¿Si el intervalo de normalidad corresponde al 95% centra, de los sujetos, identifica el intervalo
en el que se encontrará ese %. Entre el 68 y el 132, los valores que estén por el centro es lo normal.
¿Qué % de personas tendrá entre 116 y 132 puntos? Hay 13,6 % (entre +1σ y +2σ). ¿Y entre
68 y 84 puntos? Hay lo mismo, 13,6 % (entre -2σ y -1σ)
ser positivo (buen resultado) o negativo (no hemos tenido buenos resultados). Ana tenia la misma media que
Antonio, pero el resultado es totalmente diferente.
Queremos saber de 80 cm/s (velocidad de la marcha), donde se sitúa y a que distancia se sitúa de la
media de nuestro modelo de distribución. Para este modelo, la media es 69 y la DT es 13 → para
averiguar 80 sustituimos en la fórmula (X=80, μ= 69, σ=13): Z = 80-
69/13 = 0,84 , vemos que se encuentra a 0,84 de la media, por lo que
a simple vista podemos considerar que esta dentro de nuestro rango
de normalidad (dentro de ese 95%) ya que no está más allá de 2 DT.
Para 50 cm/s sería igual: Z = 50-69/13 = -1,46 (también podemos
tener valores negativos), el valor 50 se encuentra a 1,46 pero por
debajo de la media. Sigue estando dentro de nuestro rango de
normalidad (está dentro de las ±2 DT).
El modelo de distribución normal tipificado nos permite comparar valores, aunque su distribución sea
diferente (nos va a permitir comparar sujetos con distinta distribución):
Velocidad media inicial: Quiero averiguar 59 y su media es 69 y la DT=13; Z = 59-69/13 = -0,76
Velocidad media a los 6 meses: Z= 128-132/29 = -0,13 (ha mejorado y está casi en la media).
Otro ejemplo: en una distribución normal con una media de 69 y DT de 13 [ N(69, 13)]cuando
estandarizamos, su media en el modelo normal tipificado va a ser 0 y su DT 1 (por arriba o por abajo).
Si usamos el valor 69 (Z = 69-69/13= 0), ese valor nos va a indicar que está en la media. Por lo tanto,
nos permite ver a que distancia se encuentra de la media para saber si una persona va bien, si va mal
o si se encuentra dentro de unos valores normales.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
A valores más pequeños, es decir, cuanto mas cercano esté a las medias, menor es la probabilidad
porque abarcamos un menor rango de población.
Para datos mayores a un determinado valor Z: la amplitud articular de rodilla sigue una distribución
aproximadamente normal (si en un problema pusiera que sigue una distribución no normal NO podríamos
aplicar esto y tendríamos que poner que no es aplicable porque no sigue una distribución normal) con una
media de 96º y una DT de 10, ¿probabilidad de que una persona tenga una amplitud articular mayor
a 100º (la tabla Z solo nos da probabilidades iguales o menores).
En estos casos tenemos nuestra interpretación de la distribución normal con la media y la desviación
típica: N (96, 10) y tipificamos. Tenemos que el valor tipificado es 0,4 ( Z = 100-96/10 = 0,4) y yo quiero
una probabilidad mayor, lo que tenemos que hacer, como el área bajo la curva es 1 para obtener el
valor mayor, tendremos que restarle ese 1.
P (X>100) = P (Z>100-96/10) = P (Z>0,4)
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Nos vamos a la tabla Z y vemos que el valor de 0,4 es 0,6554, para obtener la parte de arriba (la tabla
Z es hacia abajo) tendremos que restarlo → 1 – 0,6554 = 0,3446. Si esto lo multiplicamos x100
obtendremos el % → 34,46% de probabilidad de obtener un valor mayor a 100.
P (Z > 0,4) = 1 – P (Z≤0,4) → P (Z≤0,4) = 0,6554 → P = 1 – 0,6554 = 0,3446 x 100 = 34,46%
Ejercicio: Utilizando la tabla Z, indica el % de casos que se encuentra en cada una de las siguientes
regiones en un modelo normal estandarizado.
a) Z >1,5. Al ser mayor, para representarlo hay que dibujar un circulo alrededor de la zona que
es (imagen, circulo verde).
P (Z > 1,5) = 1 – P (Z≤1,5) = 1 – 0,9332 = 0,0668 → 0,0668 x 100 = 6,68%
b) Z < -2,25 (el signo negativo solo nos interesa a la hora de representar, para buscar en la tabla
Z nos da igual). Como es un valor menor o igual, buscamos directamente en la Tabla Z:
Tabla Z: 0,9878 x 100 = 98,78 %
c) -1 < Z < 1,15. Hay que buscar los 2 valores y sacar la diferencia:
0,8413 y 0,8749, para encontrar el % y la probabilidad que hay en medio restamos → 0,8749-
8413 = 0,0336 x 100 = 3,36%
Para representarlo tendríamos que ir a -1 y a 1,15 y señalarlo haciendo un circulo.
También se puede utilizar un 99% y tendríamos que es raro fuera de ±3 DT, pero en la literatura
científica esta estandarizado que se utilice el 95% del valor centrar, porque si obtenemos el 99%
prácticamente estamos tomando todos los sujetos, no podemos considerar ninguno raro porque muy
pocos (a no ser que sea un valor típico muy extremo) van a estar fuera de ese rango, por lo que no nos
es útil. Pasa algo parecido si cogemos solo el 68%, y es que nos estamos quedando cortos (dejamos a
mucha muestra fuera) considerando que una persona no es normal sobre todo cuando lo valores son
muy pequeños, cuando en realidad si se encuentra dentro de unos rangos de normalidad. Por tanto,
cuando los valores estén más allá de esas 2 DT va a ser raro, el 95%.
Si por ejemplo tenemos una distribución: N (90,10), cuando los valores estén más lejos de 110 (por
ejemplo 111; Z= 2,1) o si el valor es inferior a 80 (por ejemplo 63; Z=2,7) se considerarían valores raros,
es decir, fuera de la ‘normalidad’.
La distribución anterior,
aunque la transformemos
sigue sin ser normal (tiene
varias modas) (la
distribución normal es
simétrica y con una única
moda, media y mediana).
Cuando una distribución no es normal se van a utilizar otros análisis como los métodos no
paramétricos de análisis (lo veremos en otros temas).
Por todo esto, las CONDICIONES PARA QUE UNA DISTRIBUCIÓN SE APROXIME A LA NORMAL:
- Que sea unimodal y simétrica (porque si no, no podemos aplicar la tabla Z), la media la moda
y la mediana deben coincidir y debe ser igual por arriba y por abajo.
Estas condiciones las comprobamos mediante gráficos y mediante test específicos de normalidad.
MÉTODOS PARA COMPROBAR LA NORMALIDAD:
1. Exploración visual:
1.1. HISTOGRAMA
Es una prueba subjetiva a simple vista nos puede dar información del nº de modas, y si es
simétrica (tiene que ser aproximadamente normal, no tiene por qué ser 100% normal, sino
tener un comportamiento parecido a la normal).
Tenemos:
- GRÁFICOS P-P: se confrontan las frecuencias acumuladas de la variable a analizar con las de
una distribución normal. (F1 obtenidas vs. F1 distribución normal).
- GRÁFICOS Q-Q (Q-Q plot): se confrontan los cuantiles obtenidos (cuartiles, deciles y
percentiles) con los cuantiles de la distribución normal. En lugar de utilizar todos los sujetos,
va comparando puntos exactos. (Cuantiles obtenidos vs. cuantiles distribución normal).
En términos generales los gráficos de probabilidad normal se tienen que aproximar a la línea diagonal:
si se aproximan a la línea diagonal es que siguen la normalidad (los puntos se superponen a la
diagonal), si se va mucho ya no sigue la normalidad (gráfica derecha)
También tenemos una serie de coeficientes que nos van a dar una intuición de la normalidad (para ver
la forma de la distribución):
3. Coeficiente de asimetría de Fisher (g1):
Nos dice si una distribución es simetría o asimétrica (por arriba o por debajo) de la media. Se
calcula con el SPSS.
- Si este coeficiente es 0 o si está cerca de 0 (±0,5) la distribución es simétrica. Existe la misma
concentración de valores a la derecha y a la izquierda de la media. g1 = 0
- Es asimétrica hacia la izquierda cuando el valor sea inferior a 0 (por debajo de 0,5). Existe
mayor concentración de valores a la derecha de la media que a la izquierda. g1 < 0
- Es asimétrica hacia la derecha cuando el valor sea mayor a 0 (por encima de 0,5). Existe mayor
concentración de valores a la izquierda de la media que a su derecha. g1 > 0
Este coeficiente nos sirve si no tenemos la oportunidad de ver un gráfico, si veo que es 0 ya se que
va a ser simétrica y por tanto sigue la normalidad. Y si es diferente de 0 y está bastante alejado
por arriba o por abajo ya sé que es asimétrica por lo que no podremos aplicar las condiciones de
normalidad.
Vemos que el estadístico de asimetría para la amplitud articular es -0,333, esto lo consideramos
como No Normal, sería una asimetría izquierda (hay más % de pacientes que puntúan por debajo
de la media que por arriba):
Estadística y métodos de investigación en fisioterapia
Loli Martínez
El estadístico de asimetría para la velocidad de la marcha es de 0,075, está muy cerca de 0 (no
sobrepasa los 0,5) por lo que es más o menos simétrica, es decir, la consideramos normal.
Cuando son valores más lejanos como 0,128 o 0,230 ya consideramos que es asimétrica.
Esto es para darnos una idea, tampoco es determinante
Si en la curtosis el estadístico es -1,512 (gráfica izquierda) quiere decir que la forma es una
asimetría izquierda, es paticúrtica. Si en la curtosis el estadístico es -0,75 (gráfica derecha),
también va a ser leptocúrtica
Se acepta que la distribución es normal cuando los 2 cocientes son 0 (g1=0 y g2=0), pero es muy
difícil determinar en una distribución que los 2 cocientes sean 0 porque ninguno sigue una
Estadística y métodos de investigación en fisioterapia
Loli Martínez
distribución normal tipificada perfecta, siempre hay una cierta variación. Por ello vamos a considerar
normal los valores que son cercanos ya sean positivos o negativos cuando se encuentren a ±0,5.
Para que una distribución siga la normalidad ese valor tiene que ser mayor a 0,05 , p > 0,05
(si es más bajo no es normal y no podríamos emplear los análisis estadísticos paramétricos
[ya lo veremos]). En este caso aceptaremos la Hipótesis 1. Esto se plantea por un contraste de
hipótesis.
Esta salida del SPSS la veremos en practicas
- Test de shapiro-wilk: para muestras de hasta 50 sujetos. Cuando tenemos mas de 50 sujetos
utilizamos Test Kolmogorov-Smirnov. Es un test muy potente.
Con los test específicos de normalidad es con lo que menos nos vamos a equivocar y siempre hay que
hacerlos para ver si se aplican o no determinados procedimientos
Cristina Torres Pérez
Estadística y métodos de investigación
Bloque 2. Tema 4
Descripción y síntesis de datos bivariante.
1. Introducción.
Hasta ahora solo hemos visto la descripción y síntesis de datos univariantes, un solo dato
(ej: la edad, la amplitud articular, el sexo…), en los temas anteriores. En este tema vamos
a ver los datos bivariantes, dos datos (ej: la edad y la amplitud articular o la edad y el
sexo o…).
Vamos a determinar cómo comprobar ciertos supuestos, por lo que debemos
plantearnos diferentes preguntas que pueden ser importantes. Para ello, como
queremos ver si existe relación entre las variables, podemos plantearnos preguntas
como:
¿La edad puede influir en la amplitud articular de rodilla? Cuantitativa/cualitativa.
¿El sexo está relacionado con tener o no tener una patología cardíaca?
Cualitativa/cualitativa.
¿El sexo puede estar relacionado con que un paciente tenga más o menos
velocidad de la marcha? Cualitativa/cuantitativa.
Si cogemos como ejemplo el sexo, podemos determinar si esto (ser hombre o mujer)
influye en la velocidad de la marcha. Por lo que buscamos como una variable X (sexo),
1
Cristina Torres Pérez
Estadística y métodos de investigación
influye en una variable Y (velocidad de la marcha). Para ello, dividimos nuestra población
en dos, hombre y mujer, y determinamos la media de la velocidad de la marcha de cada
variable X puesto que estamos trabajando con variables cuantitativas.
Una vez calculadas las medias es necesario compararlas entre ellas ya que así podremos
conocer si el hecho de ser hombre va a hacer que tu velocidad de la marcha sea mayor
o menor que si fueses mujer o, incluso, a partir de la variable X (sexo) podríamos
predecir si tu velocidad de la marcha va a ser mayor o menor dependiendo de si eres
hombre o mujer.
Importante: Siempre vamos a tener una variable X y otra Y cuando trabajemos con
variables bivariantes.
2
Cristina Torres Pérez
Estadística y métodos de investigación
3.1. Gráficos.
Para realizar la comparación a simple vista podemos emplear los gráficos de cajas y, los
diagramas de dispersión o gráficos de líneas y puntos.
Si nosotros observamos el siguiente gráfico de cajas, podemos intuir a simple vista que
el grupo 2 (derecha), es más joven que el de la izquierda, ya que tiene mayor rango
articular ≥ 70º y si nos fijamos en el eje Y (edad), vemos como es inferior al de la
izquierda. De esta forma solo estamos describiendo, viendo cómo se comporta la edad
en base a la amplitud.
También podemos verlo mediante los gráficos de líneas y puntos cuando tenemos más
de un grupo. De esta forma, calcularíamos la media de cada grupo y haríamos un punto
donde corresponda y luego se unirían todos los puntos.
3
Cristina Torres Pérez
Estadística y métodos de investigación
3.2. Estadísticos.
Cuando ya queremos comparar entre sí los valores entre unos grupos determinados,
debemos recurrir a los estadísticos, es decir, diferencias de medias. No podríamos
emplear esto si trabajásemos con toda una población ya que no podemos abarcar todo
el mundo, tenemos que seleccionar unos grupos.
Para los estadísticos, únicamente tenemos que realizar una resta de la media (DM) de
un grupo y la del otro. En el ejemplo siguiente podemos ver como la media del grupo de
la izquierda es 76 años y el de la derecha es 60 años, por lo que si restamos 76-60= 16
años. Con ello, podemos concluir que los que tienen <70º de amplitud poseen un
promedio de 16 años más que los que tienen ≥ 70º. El termino promedio es similar a la
media, a nivel estadístico, promedio queda mejor que decir media pero no pasa nada si
se emplea esta.
Es muy importante la interpretación de los estadísticos ya que, si nosotros sabemos
calcularlo pero no sabemos a qué hace referencia, no vamos a ningún lado.
Es importante saber que, aunque las medias fuesen iguales en ambos grupos, esto no
influiría en la amplitud articular, ya que lo que nosotros hemos calculado con el
estadístico ha sido la influencia de la amplitud articular respecto a la edad en función de
4
Cristina Torres Pérez
Estadística y métodos de investigación
los datos que teníamos. Para intentar describir si a mayor edad hay mayor o menor
amplitud. Si hay diferencia de media, puede haber una asunción o relación.
Hay que tener en cuenta que cuanto mayor es la diferencia entre los grupos, mayor será
la intensidad de la relación, es decir, si las medias fuesen muy diferentes, estos valores
van a depender mucho más el uno del otro. Si por ejemplo nuestra media de edad fuese
mucho más alta en el grupo 1 (el que tiene media de 76 años) daría lugar a que ese grupo
tendría mucha menos amplitud articular.
Las tablas de contingencia funcionan de tal forma que, si nos vamos por ejemplo para
explicarlo en los que no poseen patología cardiaca, sacaríamos que el total (n) se
obtiene de sumar los hombres y mujeres que no poseen esta (9+11=20) y así con todas
las columnas. A la hora de calcular el % deberíamos realizar la variable que queremos
hallar/n, por ejemplo, hay 9 hombres que no tienen esa patología cardiaca y el total que
no la posee (tanto hombres como mujeres) es de 20, por lo que 9/20= 45%.
También es importante que recordemos lo que es la frecuencia absoluta (n) y la relativa
(%), por lo que en el ejemplo anterior la absoluta sería 9 y la relativa 45%.
Dentro de la tabla podemos diferenciar 2 tipos de distribuciones:
5
Cristina Torres Pérez
Estadística y métodos de investigación
Distribuciones marginales: Se hallan en los laterales de las filas y las columnas y
son la suma de valores de X e Y de forma independiente. Es decir, son los valores
del lateral, las que están fuera del cuadrado.
4.2. Gráficos.
Para representar estas variables podemos emplear los gráficos de barras agrupadas,
ya que nos representan los datos de dos o más series de un conjunto de datos. Cada
serie se representa en un mismo color y las barras se colocan una al lado de la otra
por categoría de la variable para comparar las series de datos.
6
Cristina Torres Pérez
Estadística y métodos de investigación
Si tuviésemos más de dos grupos o variables se realizaría todo igual solo que
tendíamos más filas en nuestras tablas descriptivas pero lo demás no cambiaría. En
este caso tenemos 4 variables en cuanto a situación laboral. Los porcentajes los
podemos obtener en función de las columnas o de las filas, lo veremos en prácticas
y en los seminarios.
7
Cristina Torres Pérez
Estadística y métodos de investigación
Como n corresponde al número total, sabemos que este % marginal va a ser el 100% ya
que es el valor máximo que se puede obtener (7/7).
2. Calcular los porcentajes de la d. condicional para X e Y (en relación a las filas).
Para calcular estos solo habría que dividir el valor de la velocidad de la marcha respecto
a la edad que nos interesa, entre el valor de n de esa fila. Ejemplo, en la velocidad de la
marcha baja para edad 60, habría que dividir 0/7= 0%, para 61-75 años sería 2/7= 28’6%
y en el caso de >75 años, sería 5/7=71’4%.
Ejercicio resuelto entero y corregido en lo que estaba mal en la diapositiva:
4.3. Estadísticos.
¿Cómo podemos saber si existen diferencias entre las variables X en relación a la
presencia o no de Y? Para conocer esto vamos a emplear las proporciones, más
concretamente, las diferencias de proporciones (DP).
Para calcular esto tenemos que hallar el porcentaje (%), como ya se ha explicado
anteriormente haciendo el valor de la variable/n. Una vez calculado este, solamente
tenemos que restar los porcentajes ente ellos.
Ejemplo: ¿Existe diferencia entre hombres y mujeres en relación a la a SI tiene patología
cardíaca?
8
Cristina Torres Pérez
Estadística y métodos de investigación
Después de ello, podemos determinar cómo expresar cada uno de nuestros valores en
función de si están o no presentes, de su probabilidad… lo importante siempre es
interpretar los valores.
Esto ya lo veremos desarrollado en los seminarios con forme lo vayamos haciendo
nosotros.
9
Cristina Torres Pérez
Estadística y métodos de investigación
5.2. ¿Cómo lo reflejamos en artículos científicos?
Existen formas muy estandarizadas que podemos ir amoldando a lo que más nos
beneficie pero cuando tenemos que comparar, como en este ejemplo las proporciones,
nos interesa más hacerlo de una forma concreta.
Tenemos 5 variables cualitativas en el primer bloque. En el 1er mes, tenemos que 23/80
personas, un 29% se beneficiaron de la operación mientras que con una férula se
beneficiaron un 37/88 personas, un 42%. Lo que nos determina que la diferencia de
medias es de -13% por lo que a simple vista nosotros podemos decir que nos
quedaríamos con la férula ya que da un mayor resultado que la operación al 1er mes.
Por otro lado, en un segundo bloque donde se habla del número de veces que se
despierta una persona por la noche, tenemos también 5 variables cualitativas. Podemos
determinar que, en el 1er mes, las personas que tienen férula se despierta más que las
que no, las de férula se despiertan una media de 2 noches/ mes y las de operación una
media de 0’8 noches/mes.
Ejercicio 2. Identificar las variables de la tabla representadas con la media (DT), las
variables cualitativas y decir: ¿Cuál es el nº de noches que se despertaban los pacientes
de cirugía?
10
Cristina Torres Pérez
Estadística y métodos de investigación
Variables de la tabla representadas con la media: edad
Variables cualitativas: ser mujer, síntomas bilaterales del síndrome del túnel
carpiano, lado dominante afectado.
¿Cuál es el nº de noches que se despertaban los pacientes de cirugía?: 4, esto se ve
en la primera fila de los valores intercuarticules (IQR).
6. Explorar relaciones entre variables.
Vamos a explorar si existe relación entre una variable y otra. Hay que tener en cuenta
que la existencia o no de relación entre variables puede condicionarnos incluso la forma
de realizar un tratamiento, por ejemplo, la afectación de una movilidad de rodilla en un
anciano no es lo mismo que si fuese en un joven. Debido a ello, la edad va a influir en el
tipo de tratamiento que podamos aplicarle a la persona.
11
Cristina Torres Pérez
Estadística y métodos de investigación
Ejercicio 3:
12
Cristina Torres Pérez
Estadística y métodos de investigación
La profesora ha dicho que estos dos términos son liosos así que se me ha ocurrido una
regla para distinguirlos, os la escribo por si os puede ayudar a diferenciarlos:
Variable dependiente: Cuando una persona es dependiente de otra se deja llevar por
los demás y acaba cambiando su forma de ser. Por ello, cambia en función de la otra
variable.
Variable independiente: Cuando eres una persona libre, independiente, haces lo que
quieres y no te dejas influenciar por el resto. Por ello, no cambias en función de otra
variable.
Si observamos este gráfico podemos ver que existe asociación ya que hay diferencia
entre los grupos (la línea negra que divide cada caja está en un valor diferente del eje
Y). En general:
Cuanto mayor sea el solapamiento (menos distancia), menor será la intensidad
de la asociación entre las dos variables.
Cuanto menor sea el solapamiento (más distancia), mayor será el tamaño del
efecto de la relación o asociación.
(Con solapamiento nos referimos a la distancia que hay entre ambas líneas horizontales
de la caja, la media).
En este caso, si nos
fijamos en la mediana
(línea de puntos
suspensivos), podemos
ver que no todas las
medias de los grupos
coinciden con la
mediana. Por ello, no
existe asociación, ya
que no hay diferencia
entre los grupos.
Ejercicio 4. Determina cuál de las siguientes gráficas indica asociación.
13
Cristina Torres Pérez
Estadística y métodos de investigación
1er gráfico: Si hay asociación ya que podemos ver como la medina de ambas cajas se
encuentra distanciada, hay diferencia entre ambas. Por ello, podemos ver como el plan
de estudios (x) influye en la nota (y).
2º gráfico: Si hay asociación ya que podemos ver como la medina de ambas cajas se
encuentra distanciada, hay diferencia entre ambas. Por ello, podemos ver como el turno
de estudio (x) influye en la nota (y).
3er gráfico: No hay asociación ya que como podemos ver, ambas medianas se
encuentran alineadas, están a la misma altura. Por ello, ser hombre o mujer (x) no
influye en la nota (y).
Importante: Estamos viendo si hay asociación o no, no si esta es fuerte, débil...
- Magnitud de la asociación.
La calculamos mediante la diferencia media (DM). Es decir, restamos la media entre los
grupos y cuanto mayor es la diferencia de medias entre los grupos, mayor será la intensidad
de la relación.
Esto ya lo hemos explicado en el apartado 3.2. de este tema y con el mismo ejemplo que la
profesora ha planteado, aquí solo se dice que esta es la forma de calcular la magnitud de la
asociación.
14
Cristina Torres Pérez
Estadística y métodos de investigación
Cuando tengamos una representación de los 20 casos en función de la edad (x) y la
velocidad de la marcha (y) obtenemos un diagrama de dispersión. Así, podemos
observar todos los valores en una misma visión y establecer nuestras propias ideas;
además, nos permite apreciar si existe o no una posible relación entre las variables.
Si observamos bien el gráfico podemos ver como presenta una tendencia descendente.
De tal forma que, a mayor edad, menor velocidad de la marcha.
Aclaración:
Gráfico A: Cuando aumenta X, aumenta Y. Son proporcionales.
Gráfico B: Cuando aumenta X, disminuye Y. Son inversamente proporcionales.
Gráfico C: No existen relación entre los datos, no hay ni un aumento ni un descenso.
Gráfico D: es muy muy importante ver que estas no son lineales ya que nuestra
variable aumenta pero llega un punto en el que esta desciende, por ello, debido a su
forma reciben el nombre de parabólicas. NO LAS VAMOS A ESTUDIAR, NOS INTERESAN
LAS LINEALES (A,B,C)
15
Cristina Torres Pérez
Estadística y métodos de investigación
Ejercicio 5. ¿Qué forma y dirección de asociación esperarías ver en el gráfico de
dispersión entre X e Y? (todas son cuantitativas)
7.2. Magnitud.
Uno de los índices más utilizados para analizar la intensidad de la relación entre dos
variables es el Coeficiente de correlación de Pearson. Solo se emplea para cuantitativas
y en relaciones lineales (gráficos A, B y C de antes). Tenemos que tener en cuenta que
los valores extremos pueden distorsionar o modificar el valor de la relación (r).
Se va a caracterizar porque toma valores entre -1 y 1, siendo empleado el -1 en las
lineales inversas y el +1 en las lineales directas. Por ello, gracias al signo sabemos si es
positiva o negativa.
Si obsérvanos esta asociación podemos ver que en la gráfica 1 es más intensa ya que se
ve como asciende mientras que la 2ª asciende pero no se ve tan claro. Si los valores son
proporcionales, vamos a poder determinar a qué valor de X corresponde un valor de Y
a pesar de no haberlo calculado aún (ya lo veremos).
(No tener en cuenta lo que pone en el eje x e y porque está mal).
Respecto a la relación (r) del Coeficiente de correlación de Pearson:
16
Cristina Torres Pérez
Estadística y métodos de investigación
En este
caso es
a la
17
Cristina Torres Pérez
Estadística y métodos de investigación
inversa, cuanto más se aleja de -0’5, se va formando una línea descendente ya que es
una relación inversa fuerte.
18
Cristina Torres Pérez
Estadística y métodos de investigación
En el seminario nos explicará bien como se realiza este ejercicio pero dice que
únicamente es sustituir en la formula y es fácil.
Como la relación es de 0’94 en el ejemplo, sabemos que la relación es lineal y fuerte. Es
positiva y superior a 0’5.
Si únicamente leemos la primera parte, podemos pensar que la causa de padecer cáncer
de pulmón sí que es el consumo de café. Sin embargo, al leer todo vemos como existe
otra variable que estaba siendo ocultada que es más probable que sea la causante de
esto. Si empleamos la lógica podemos determinar cuáles son las variables X e Y de
nuestros estudios.
Esto es lo que se conoce como relación causa-efecto, una variable (fumar) me genera la
otra (cáncer de pulmón). Ya que la variable consumir café podemos determinar que no
tiene sentido para generar el cáncer, es una mera coincidencia en este caso.
Esta variable que nosotros podemos determinar que es la causante de la patología y que
se encontraba oculta en un primer momento, es lo que se conoce como variable
19
Cristina Torres Pérez
Estadística y métodos de investigación
confundidora. Esta va a falsear una asociación, pudiendo aumentarla, disminuirla o
anularla.
Tenemos que quedarnos con que no todo es lo que parece e investigar más.
20
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Bloque 3. Tema 1.
Elementos básicos del plan de investigación.
1. Introducción.
Hay que tener en cuenta que existen diferentes bases de datos y revistar científicas
donde podemos encontrar artículos de gran calidad metodológica y con poco riesgo de
sesgo. Entre estas bases de datos podemos destacar Pubmed, Scielo o Research gate
entre otras, también podemos emplear google académico, aunque hay que saber que
aquí podemos encontrar artículos algo más pobres.
1
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
3. Nivel conceptual.
Como se ha dicho antes, los dos primeros principios (Conocimiento científico y Método
científico) ya que se han explicado en el tema 2 del 1er bloque (lo hemos dado justo
antes de esta clase, aunque este sea el bloque 3). Por ello, vamos a empezar por el
problema científico.
3.1. Problema científico.
Este se define como la pregunta sobre algo que no se sabe o se desconoce y nosotros
queremos conocer. En la literatura, probablemente no lo encontremos, por lo que
tendremos que hacer nuestra búsqueda ya que si estuviese resuelto no tendría sentido
realizar el estudio.
Los principios en los que nos vamos a basar es en la observación, resultados previos que
conocemos o hay en la literatura (para este también vale lo que nosotros conocemos de
2
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
nuestros propios pacientes) y las teorías formalizadas a cerca de lo que nos planteamos.
También es importante la propia curiosidad de si va a ser efectivo lo que queremos
estudiar o si una técnica es efectiva o no, para así estudiar sobre ella.
Un ejemplo de problema científico a partir del cual podríamos hacer un estudio de
investigación sería: Ortesis vs cirugía para el síndrome del túnel carpiano.
A la hora de plantear la pregunta de investigación es necesario ser muy concreto, no
nos podemos ir por las ramas ya que no sería efectivo. Esta pregunta se va a definir como
la concreción del planteamiento en una pregunta precisa y delimitada, teniendo en
cuenta el espacio, tiempo y población (cuando sea posible). Para poder desarrollarla,
podemos seguir la estrategia PICO, aunque no siempre tienen porque aparecer los 4
principios (es lo que vimos en fuentes documentales solo que la S no la añadimos ya que es el
tipo de estudio que se realiza y por ello no nos influye en si en nuestro planteamiento de la
pregunta).
En el ejemplo anterior: Ortesis vs cirugía para el síndrome del túnel carpiano. Podemos
determinar que está constituido este enunciado mediante la estrategia PICO:
P: Síndrome del túnel carpiano C: Tratamiento quirúrgico
I: Ortesis O: no hay.
Posteriormente al planteamiento del problema. Tenemos que justificar por qué
queremos estudiar esto, si es por un vacío literario, porque hay pocos estudios, para
conocer la efectividad… Por ello, hay que darle importancia al problema, determinar el
entorno teórico de referencia (hospital, clínica…) y conocer los posibles beneficios del
tratamiento.
3
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
4
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Si seguimos con el ejemplo del estudio donde nuestra pregunta de investigación era:
Ortesis vs cirugía para el síndrome del túnel carpiano, podemos ver que su objetivo es
muy claro y sencillo.
(El objetivo del estudio fue comparar, a
corto y largo plazo, la eficacia de la
ortesis y la cirugía para disminuir los
síntomas del síndrome del túnel
carpiano.)
Sin embargo, hay otros estudios donde los objetivos no son tan sencillos como en este,
puesto que aparecen los dos tipos de objetivos anteriormente planteados. En este caso,
es en el objetivo principal donde planteamos nuestra hipótesis que va a inducir al
desarrollo del estudio y los específicos son más irrelevantes:
(Objetivos principales: comparar los efectos agudos del
ejercicio isométrico vs dinámico durante la provocación
de dolor activo en participantes con tendinopatia
patelar. Objetivos específicos secundarios: efecto de
comparar los resultados de los ejercicios dinámicos e
isométricos sobre la sensibilidad al dolor localizado, así
como la distancia y el sitio. Objetivos específicos
terciarios: evaluar los cambios en la estructura del
tendón tras un ejercicio.)
Estudio no experimental como puede ser el descriptivo. Todo lo que hemos visto
durante los temas anteriores.
Estudio experimental, en este ya tenemos dos grupos donde vamos a poder
comparar entre dos estudios, vamos, los ensayos clínicos.
No existen unos tipos de diseños de estudio mejores que otros: todos son relevantes y
tienen su valor propio en función de las características y la naturaleza del objeto de
estudio. Vamos a elegir el diseño empleado en función de nuestros objetivos, por eso es
tan importante saber qué es lo que quiero hacer desde el principio.
Ahora se va a explicar un concepto que la profesora ha dicho que es muy importante.
6
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Una vez sabemos cómo seleccionar los pacientes a los que queremos estudiar debemos
preguntarnos…
4.3.2. ¿Cómo obtenemos la muestra?
Para esto podemos realizar dos tipos de muestreos, el probabilístico y el no
probabilístico.
7
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
Un ejemplo de variable de confusión sería la edad, el sexo, el IMC si nos referimos por
ejemplo a la capacidad de correr, ya que estos factores varían de una persona a otra.
8
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
5. Nivel analítico.
Una vez realizamos la recogida de datos es necesario introducir estos en la base de
datos.
5.1. Análisis de datos empíricos.
Tras introducir todos los datos obtenidos en la base de datos, hay que depurar estos.
Con esto se quiere decir que si encontramos algún dato perdido (cuando sale – en el
SPSS) podemos eliminar estos, transformar los datos (si tengo peso y altura puedo
transformarlos al IMC) o también puedo seleccionar los casos que me interesan.
Una vez hagamos esto, accedemos al SPSS y analizamos estos datos. Podemos calcular
la media, la frecuencia, n, la desviación típica…
Ahora tenemos que tener presente que nuestras sólo son dos de las muchas posibles y
que nuestras conclusiones finales son a nivel de la población elegible, no a nivel de la
muestra.
5.2. Concepto de validez.
Grado en que los resultados (estimación del parámetro o una asociación) pueden ser
generalizados a la población diana. Es decir, tenemos que generar nuestro estudio de
tal forma que los resultados obtenidos se puedan inferencia a la verdad en el universo,
a todo el mundo, no solo a la muestra. Esto se conoce como validez externa.
Grado en que resultados se corresponden con la verdad en la población de estudio, es
decir, si los resultados se pueden inferir a nuestra muestra validez interna.
5.3. Concepto de sesgo y confusión.
5.3.1. Sesgo.
Sesgo o error sistemático: Es un error que conduce a una estimación incorrecta del
parámetro o la asociación en estudio. Se produce cuando no empleamos de manera
correcta un instrumento de medida porque no se ha calibrado al principio, no se coloca
bien… De tal forma que podemos obtener resultados de más o de menos en función de
9
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
5.3.2. Confusión.
Es una distorsión de la magnitud de la asociación entre variable predictora-resultado
generada por la distribución de otra variable predictora.
Un ejemplo sería, si poseemos la variable fuerza como explicativa y la variable velocidad
como resultado, la variable confundidora podría ser atleta. Esto se debe a que no es lo
mismo tener toda una población atleta que hacer las mediciones en población corriente
que poseería menor velocidad y fuerza.
10
Estadística y métodos de investigación en fisioterapia
Cristina Torres Pérez
En temas anteriores vimos esto mismo con el ejemplo de que el café producía cáncer
según un estudio. Sin embargo, si se leía a fondo el estudio, se veía que esto realmente
se asociaba a las personas fumadoras. En este caso, fumar, sería la variable
confundidora.
11
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Bloque 3. Tema 2.
PRINCIPIOS METODOLÓGICOS DE LOS DISEÑOS NO EXPERIMENTALES
Una vez que tenemos un objetivo muy claro, hay que decidir cómo vamos a llegar a él. Si nos
equivocamos desde el inicio en cómo vamos a llegar a ese objetivo, el plan de investigación no va a
valer, va a ser un plan con poca validez interna y si no tiene validez interna no la vamos a poder
extrapolar al resto de la población (que este es nuestro objetivo, poder aportar nuevo conocimiento).
Si yo solo quiero valorar una asociación, voy a recoger datos, pero no voy a aplicar una intervención
(no quiero probar si algo es mejor que otra cosa). Simplemente observo y recojo los datos → esto es
un ESTUDIO NO EXPERIMENTAL (nosotros no controlamos lo que vamos a estudiar, nosotros no
decimos si un paciente recibe un tratamiento u otro, solo vamos a observar).
En el momento en el que nosotros controlamos ese factor de estudio (decidimos que paciente va a
recibir qué cosa) ya va a ser un DISEÑO EXPERIMENTAL, estamos probando (es como la investigación
que vimos de la carne, el científico determinaba/controlaba que bote era el que tapaba o no, en ese
momento ya estamos controlando el factor de estudio).
Existen muchos tipos de diseño de estudio y uno NO es mejor que otro. El mejor diseño de estudio va
a ser el que mejor se adecue a nuestro objetivo de investigación.
Por ello, el Plan de Investigación puede definirse como el plan o estrategia que se desarrolla para
obtener la información que se requiere en una investigación.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
▪ Describir una situación: es importante probar diferentes tipos de tratamientos, pero también
es importante conocer el problema, porque si no lo conocemos no sabemos que le puede
venir mejor, por eso son importante este tipo de estudios.
▪ También nos va a servir para establecer relaciones entre variables: lo hemos visto con la
estadística descriptiva, cuando veíamos la asociación y la correlación entre 2 variables, por lo
que ese tipo de análisis sería un estudio observacional.
▪ Son estudios más fáciles, rápidos y baratos puesto que simplemente recogemos datos, no es
lo mismo aplicar una intervención en lo que se necesitan instrumentos específicos con un
coste económico importante, estamos gastando material, etc y que requiere más tiempo.
▪ Podemos ver que pueden ser descriptivos (describimos) o analíticos (se corresponde con la
asociación entre 2 variables).
Por ejemplo, un estudio observacional seria en pacientes que manifiestan un dolor en la zona
posterolateral del raquis cervical, realizamos una valoración para conocer cuántos de ellos presentan
puntos gatillo miofasciales del angular de la escápula activo. Estamos recogiendo simplemente
información y después vamos a analizar si en este tipo de pacientes presentan los puntos gatillo, ya
que puede ser que no y que se estén aplicando terapias para PG que no son necesarias algunas veces.
Otro ejemplo es el estudio de la epidemiologia en jugadores de futbol, tenemos que conocer cuál es
la lesión más prevalente en este tipo de sujetos, ya que de esa forma nos podremos centrar en dicha
lesión. En este ejemplo era la musculatura de isquiosurales, por lo que nos centraremos en programas
de prevención de lesiones de isquiosurales, pero si no sabemos cuál es el tipo de lesión más
prevalente, podemos estar haciendo un programa de prevención por ejemplo para gemelos y en
futbolistas este tipo de lesión no es predominante.
- ANALITCOS: van a analizar esa relación causa-efecto, esa asociación causal entre un factor y
un efecto: un factor que será una exposición (un grupo de población está expuesta a un
determinado factor) y su efecto. Por ejemplo: en un estudio de relación entre el
entrenamiento antes de la temporada (tenemos unos biomarcadores durante la sesión) y el
rendimiento y las lesiones en jugadores de futbol. Estamos analizando si el entrenamiento
antes de la liga (antes de empezar la temporada), está más relacionado con lesiones y
rendimiento en el futbol profesional.
- RETROSPECTIVO: vamos hacia atrás. Los datos se recogieron en el pasado, pero los voy a
analizar en el presente (su inicio es posterior a los hechos estudiados). Un tipo de estudio
retrospectivo podría ser una revisión de historias clínicas (yo tengo mi base de datos de
pacientes que ya traté en el pasado y ahora voy a analizarlo). Me planteo la investigación una
vez con los datos ya recogidos (realizo el estudio una vez ya tengo mis datos).
o Los ESTUDIOS ANALÍTICOS ya estamos analizando 2 factores, pueden ser los estudios de caso
control y los estudios de cohortes.
4. Informe de casos.
Los informes de casos son simplemente para describir una experiencia clínica que se sale fuera de lo
normal, es un caso anecdótico o que no esperamos y que llama la atención, organizado de manera
ordenada y sistemática que puede sustentar el abordaje de un paciente con la misma patología en un
futuro cuando sea la única o la más pertinente evidencia disponible. A partir de estos casos se hacen
informes de casos.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Los informes de casos no podemos aplicarlos a toda la población. Los estudios de casos tienen una
evidencia científica muy limitada y son aplicables a pacientes que tengan esas mismas características
que el informe de casos, entonces es simplemente para mostrar casos complejos o diferentes que se
salen de lo normal. Se suele presentar de manera ordenada, sistemática, como todo proceso de
investigación (con su introducción, material y métodos, resultados, etc) pero aplicado a uno o dos
sujetos.
5. Estudios de prevalencia.
Los estudios de prevalencia aportan mucha información, pero no permiten determinar la causalidad
entre factor y enfermedad (simplemente describimos). Son transversales: se mide en un momento
determinado. Son estudios previos destinados a la búsqueda de factores que se presentan asociados
a un fenómeno: estamos recopilando información y vemos que, por ejemplo, ahora con el covid que
se hacen estudios de prevalencia a diario, sabemos a diario cuantos casos hay, esto nos da información
sobre la prevalencia y la incidencia, que serían los nuevos casos que hay. Dentro de esos pacientes se
estudia la sintomatología y en base a la sintomatología más prevalente se pueden generar ciertas
hipótesis para probar luego en un futuro con estudios de asociación (estudios analíticos) o con
estudios experimentales. Por ejemplo, si sabemos que los síntomas más prevalentes son la tos, la
expectoración, la pérdida del gusto y el olfato, etc, estamos conociendo que en esos pacientes tienen
eso, pero no sabemos si existe una asociación, esto luego lo determinamos con estudios analíticos.
VENTAJAS:
- Son fáciles de realizar: recogemos información, no hay que aplicar procedimientos, etc.
- Son baratos (poco costosos económicamente hablando).
- Necesitan poco tiempo.
- Permiten estudiar más de 1 una enfermedad/factor de riesgo a la vez.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
DESVENTAJAS:
- No podemos estudiar causalidad (una causa con su efecto).
- No son útiles para enfermedades raras o con poca gente, ni para aquellos de corta duración
(necesitamos bastante tiempo para recoger información).
- Se pueden producir sesgos al recoger la información y a la hora de seleccionar los casos (el
sesgo de la selección de sujetos al final es aplicable a todos los estudios). Si no establecemos
unos criterios de selección adecuados al tipo de estudios, al final tendremos sesgos que
afectan a la validez interna (afectara a los resultados de nuestro estudio, estamos sesgando
nuestros resultados, ya sea por encima sobrevalorando o por debajo infravalorando).
Por ejemplo: un estudio de prevalencia de la discapacidad entre adultos con EPOC (en el eje x vemos
las diferentes discapacidades en relación a la audición, a la visión, a la movilidad, al autocuidado, a la
vida independiente etc o ninguna discapacidad. Cada barra es un grupo de edad). Yo quiero conocer
en pacientes con EPOC cual es la discapacidad más prevalente: quitando ninguna discapacidad, la
discapacidad más prevalente es la movilidad (los pacientes con EPOC, un alto % presenta una
discapacidad en relación a la movilidad). A los pacientes con EPOC se les suele tratar la mayoría de las
veces con terapia farmacológica pero se olvida la parte de discapacidad y no se suele tratar en un
servicio de rehabilitación para mejorar su movilidad, su capacidad pulmonar desde el punto de vista
de la fisioterapia. Por ello es muy importante conocer que este tipo de discapacidad es muy prevalente
en este tipo de pacientes para poder trabajarlos porque va a mejorar su calidad de vida (la enfermedad
no se la podemos curar porque es crónica). Estos tipos de pacientes dejan de hacer ciertos tipos de
actividades porque se ahogan y eso va llevando a una discapacidad, a una pérdida de fuerza, que se
puede prevenir con fisioterapia.
En este tipo de estudios vemos la Odds Ratio que es una razón de probabilidad.
VENTAJAS:
- Son cortos y cuestan poco dinero (porque tenemos dos grupos y observamos).
- Permiten analizar varios factores de riesgo para una misma enfermedad.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
DESVENTAJAS:
- Secuencias temporales entre la exposición y la enfermedad, no siempre es fácil de establecer.
Por ejemplo, ¿Qué va antes, el huevo o la gallina? Muchas veces no es fácil determinar que va
antes de que, o si la enfermedad va en paralelo con el factor de exposición.
Por ejemplo: tenemos un grupo con la enfermedad, en este caso con Neumonía, y un grupo sin
enfermedad. Quiero ver si la hipertensión arterial (HTA) es un factor de riesgo de la neumonía.
Recogemos datos en uno y otro grupo de la HTA y vemos la frecuencia, tenemos que 4 de los que
tienen neumonía tienen HTA y 15 no; mientras que de los que NO tienen neumonía tenemos 6 que si
tienen HTA y 110 que no. La Odds Ratio se calcula haciendo una multiplicación cruzada:
(a x d) / (b x c), si el resultado es por encima de 1 nos dice que aumenta la probabilidad y si es por
debajo de 1 se reduce la probabilidad.
En este caso sería (4 x 110) / (6 x 15) = 4,89, esto quiere decir que entre los grupos que tienen
neumonía hay 4,89 veces más de probabilidad de que tenga HTA con respecto al grupo que no tiene
neumonía (esto nos dice la probabilidad de que un factor se de más en el grupo con la enfermedad
que en el grupo sin ella).
Otro ejemplo: queremos ver si la vibración de los músculos del cuello puede mejorar la función
sensoriomotora en pacientes con dolor de cuello, tenemos 2 grupos, un grupo con dolor de cuello
(grupo enfermo) y un grupo sano. Tenemos una medida previbracion y otra postvibración. Si las
medidas pre- y postvibración fueran igual, la vibración no sería efectiva. A simple vista podemos ver
con los gráficos que la medida previbracion en el grupo enfermo es mayor y que después disminuye,
mientras que en los sanos para lo contrario; por lo que la vibración produce efectos en los sujetos
enfermos y en los sujetos sanos. Los pacientes con dolor de cuello muestran una mejora y una
reducción de la dinámica postural después de la vibración, pero que no fue significativa el hecho de
que apliquemos la vibración en sujetos sanos, es decir, no tuvo resultados y da igual que aplique o que
no vibración en sujetos sanos, pero sí en los pacientes con dolor de cuello). Esto nos dice que la mejora
en el resultado se debe al efecto de la vibración.
7. Estudio de cohortes.
Partimos de una población sana y la estudiamos a lo largo del tiempo (son estudios de seguimiento
de una población) para ver si se desarrolla el factor (la variable de resultados), se subdividen en 2:
una parte que va a estar expuesta al factor de estudio y otra parte que no va a estar expuesta. De
los que están expuestos algunos pueden desarrollar la enfermedad y otros no; y de los que no están
expuestos igual, unos pueden desarrollar la enfermedad y otros no. Al finalizar el tipo del estudio se
compara la incidencia de enfermedad en ambos grupos. Este tipo de estudios estiman el Riesgo
Relativo.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
VENTAJAS:
- Nos permite estimar un riesgo relativo de que algo se produzca, es decir, la incidencia.
- Nos permite seguir una enfermedad.
DESVENTAJA:
- Son muy caros: partimos de una persona sana y para que se desarrolle una enfermedad
pueden pasar muchos años y hay que seguirlos todos los años.
- Precisamos de muestras de muestras muy grandes porque si cogemos una muestra de 10
pacientes, puede que de esos 10 pacientes no se desarrolle la variable de resultados.
Es muy típico en los estudios de mortalidad, por ejemplo: quiero ver si la dieta vegetariana está
relacionada con la mortalidad. Para ello se coge una muestra de pacientes que algunos van a seguir
una dieta vegetariana y otros no, y vamos a estudiar su relación con la muerte. Siguiendo la misma
filosofía del Odds Ratio: si es por encima de 1 nos dice que
aumenta la probabilidad (sería un factor de riesgo), si es por
debajo de uno se reduce (sería un factor protector). Por ello, al
ver la tabla, en el modelo 1 (ser vegetariano, el sexo y la edad)
ser vegetariano es un factor protector, pero en el modelo 2, al
añadir otras variables como la educación, pasa a ser un factor de
riesgo (por el hecho de ser vegetariano tienes 1,03 más
posibilidades de morir que una persona no vegetariana).
Recordamos que partimos de una población sana, unos son
vegetarianos (unos mueren y otros no) y otros no son
vegetarianos (unos mueren y otros no)
En estos estudios tenemos un gran número de población, por lo que el coste de valorar a 1523
personas vegetarianas y a 241573 no vegetarianas implica un coste muy elevado.
Actualmente hay un estudio del cáncer muy importante que se lleva haciendo durante muchos años,
en él se va valorando gente, pero la inversión económica es enorme y el esfuerzo también, pero son
estudios con una evidencia científica muy importante.
EN RESUMEN:
Hay que quedarse con los conceptos de para que vamos a utilizar cada tipo de estudio, las ventajas y
las desventajas a nivel general, pero teniendo muy claro cuál es nuestro objetivo del estudio y que
tipo de estudio aplicaríamos. Por ejemplo: si voy a estudiar mortalidad: estudios de cohortes, si vamos
a estudiar la asociación entre un factor de exposición y una enfermedad un caso control seria lo mejor.
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Bloque 3. Tema 3.
Principios metodológicos de los diseños
experimentales
1. Introducción.
En esta ocasión, al tratarse de casos experimentales, el factor de estudio va a ser
controlado por nosotros. Es decir, nosotros vamos a decidir que paciente recibe cada
tratamiento.
2. Diseños experimentales.
Es un estudio en el cual el experimentador intencionadamente ofrece diferentes
tratamientos (pruebas de evaluación o cualquier procedimiento que nos permita
valorar) a 2 o más grupos y observa/mide sus respuestas para compararlas.
Si recordamos lo que dimos unos temas más atrás, podemos diferenciar dos tipos de
variables. Por un lado está la variable dependiente, la que se modifica o varía en función
de la variable principal, y luego está la variable independiente, la que no varía en función
de otras.
Estas 2 variables se pueden definir de la siguiente manera:
Variable dependiente La o las variable sobre las que se evalúa el efecto, es decir,
es nuestra variable de resultado.
Variable independiente Variable manipulada, es decir, es la causa que va a
producir ese efecto o resultado.
Por consiguiente, tenemos que entender que la variable independiente es la causante
de que se produzca, o la que genera, la variable dependiente. Tenemos que quedarnos
sobre todo con que la variable dependiente es la variable de resultado.
1
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
con cuál se obtienen unos mejores resultados. Para realizar el ejercicio isométrico vamos
a realizar una extensión de cuádriceps mantenida y en el ejercicio dinámico incluimos
movimiento mediante la realización de sentadillas. Por ello, se puede decir que se van a
realizar 2 tipos de intervenciones.
En este caso, nuestra variable dependiente va a ser el efecto agudo del ejercicio, ya que
nuestro resultado/objetivo es ver que ocurre en el paciente al realizar esto. Mientras
tanto, nuestra variable independiente va a ser el ejercicio dinámico e isométrico (tipo
de ejercicio), ya que estas son las variables que empleamos para obtener ese dolor
agudo.
3. Ensayo clínico.
El ensayo clínico aleatorio es el estudio experimental por excelencia. Después existen
otros estudios experimentales que ahora veremos, pero este es el más importante de
todos y el que mejor debemos conocer.
Los ECA (ensayos clínicos controlados aleatorizados) son los estudios que mayor nivel
de evidencia presentan, por encima de los no aleatorios.
2
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
poder realizarlo. En este se explicará el tipo de estudio a realizar, los efectos beneficiosos
que se buscan, si hay efectos secundarios, si reciben remuneración… Hay que realizar
esto ya que puede darse el caso que nosotros seleccionemos a un paciente, pero sin
embargo que este no quiera participar y no nos del consentimiento informado y a
consecuencia este deberá contar como caso de estudio perdido. Nosotros no podemos
obligar a nadie a participar en el estudio por lo que en cualquier momento pueden
revocar este consentimiento firmado.
Otro principio muy importante a tener en cuenta es que nuestro estudio debe ser,
siempre en la medida de lo posible, totalmente aleatorio. Es decir, a la hora de
seleccionar a los pacientes y decidir quién va en el grupo control y quién en el
experimental esto se debe realizar aleatoriamente. Gracias a esto habrá la misma
variabilidad y probabilidad de caer en un grupo que en otro y se disminuirá el riesgo de
sesgo en el estudio.
Mientras se está desarrollando el estudio pueden darse miles de razones por las que
una persona deje de participar en el estudio (hospitalización, caída, fractura,
defunción…), en estos casos es muy importante notificarlo y registrarlo en el estudio.
Además, hay que dejar constancia de cuál es la causa por la que la persona ya no
participa y se nombrarán como casos perdidos. Hay que intentar que en la medida de lo
posible estas pérdidas sean pequeñas.
Una vez se ha realizado la intervención del tratamiento, vamos a obtener los resultados
de grupo control y experimental y debemos comparar estas entre sí, para ver si el
tratamiento es o no efectivo.
Esquema resumen del procedimiento:
3
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Por consiguiente, podemos determinar que el ECA presenta una serie de ventajas
respecto a otros estudios, pero también posee desventajas (debajo están explicadas
las más complejas de entender):
Ventajas:
Al realizar esta asignación aleatoria vamos a obtener una población homogénea y
estándar en ambos grupos que nos va a permitir realizar el estudio con un menor riesgo
de sesgo. Esto va a permitir obtener una mayor evidencia causa-efecto al determinar
que, si se obtienen resultados positivos en el grupo experimental pero no en el placebo,
es debido a que el tratamiento es beneficioso.
Desventajas:
Las restricciones éticas hacen referencia a la incapacidad moral y ética de desarrollar un
estudio con un tratamiento que ya sabemos que no va a tener efectos beneficiosos
sobre nuestros pacientes, además, esto está muy regulado y desde la comisión ética van
a impedir que este proyecto se desarrollase.
Al realizar esa selección tan exhaustiva con tantos criterios de inclusión y de exclusión
no se pueden extrapolar posteriormente a la clínica. Es decir, no podríamos aplicar estos
resultados obtenidos en la población elegible a la población diana.
Respecto a que poseen un coste elevado, es debido a que se requiere de una gran
inversión para determinar los resultados beneficiosos o negativos que estos estudios
tienen sobre los pacientes, además que son estudios de elevada duración.
3.1. Aleatorización.
La aleatorización permite distribuir equilibradamente factores que pueden influir en
resultados (grupos comparables). De esta forma, al ser grupos homogéneos desde un
principio, obtenemos grupos comparables sin ningún riesgo de sesgo a consecuencia de
este factor.
En los ECA siempre vamos a encontrar el siguiente diagrama, donde se determina el
número de pacientes totales, los excluidos y por qué se excluyen (es muy poco común
4
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
que en un estudio no se produzca ninguna pérdida), el seguimiento y el análisis de los
resultados.
5
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
encontrarnos un grupo control o placebo que será el que se compare con el
experimental.
En este grupo, lo que haremos será desarrollar todo el procedimiento de la misma forma
que en el experimental, salvo que no se llevará acabo el tratamiento. Es muy importante
que los pacientes no sepan a qué grupo pertenecen ya que esto podría influir en los
resultados.
En este ejemplo podemos ver como poseemos dos grupos homogéneos, el mismo tipo
de planta. Sin embargo, al grupo experimental sí que se le echa agua, es decir, se realiza
el tratamiento. Mientras que, al control, no se le echa agua, si se realiza la acción de
echar agua, pero la regadera está vacía. De esta forma, se podría determinar cuál es el
efecto del agua en las plantas respecto a crecer, tras comparar los resultados obtenidos
en ambos grupos. Así sabremos si el hecho de regar la planta aumenta su crecimiento o
esta iba a crecer igualmente, aunque no se regase.
6
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
3.4. Enmascaramiento.
El enmascaramiento son procedimientos realizados con el fin de que algunos de los
sujetos no conozcan algunos hechos u observaciones que pudieran ejercer un cambio
en sus acciones o decisiones y sesgar los resultados. Esto se debe a que las propias
expectativas tanto de los pacientes como de los investigadores pueden influir en la
evaluación de la respuesta que se obtiene.
Si el paciente sabe que él va al grupo experimental y que realmente está recibiendo la
intervención, puede sugestionarse y mejorar más que el paciente que sabe que está en
el grupo control y que no está recibiendo ninguna intervención. Por ello, es importante
que tanto el paciente como el investigador no conozcan en que grupo se encuentra para
no influir en este.
Podemos distinguir varios tipos de enmascaramiento:
3.5. Seguimiento.
Este debe ser lo suficientemente prolongado para que se obtenga un resultado, una
respuesta. Para saber qué tiempo se debe emplear para realizar este es muy importante
leer la literatura y contextualizar lo que queremos estudiar.
7
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
El número en color rojo es el número de pacientes que finalizan el estudio en cada grupo
y el número en negro es el nº de pacientes que abandonan.
Si poseemos muchas pérdidas en nuestro estudio, estén o no explicadas, va a aumentar
el riesgo de sesgo y, por ello, va a disminuir la calidad metodológica del estudio y no va
a ser válido puesto que no se podrá comparar.
8
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Bloque 3. Tema 4.
DISEÑO DE UN PROTOCOLO DE ESTUDIO
En él tenemos que detallar todo el plan, desde la aprobación ética (todo proyecto de investigación tiene
que pasar por una comisión ética, en el TFG seria por ejemplo es la comisión ética de la universidad, que nos
piden: la protección de datos de los pacientes, como vamos a elaborar el plan de investigación, el consentimiento
informado, etc. Si la comisión ética no aprueba nuestro proyecto de investigación, la investigación no es viable,
ninguna revista nos publicará los resultados), hasta la diseminación de los resultados.
El protocolo tiene que estar bien redactado, con lenguaje científico, en inglés si lo vamos a presentar a
nivel internacional (incluso a nivel nacional también nos lo piden en inglés). Por ello hay que cuidar
todos los aspectos científicos, éticos y la seguridad del paciente (esto en caso de que realicemos un
ensayo clínico), ya que esto facilita una evaluación adecuada antes de que comienza un ensayo. En un
estudio observacional donde simplemente vamos a recoger datos (no vamos a aplicar ninguna
intervención), la aprobación ética no es tan exigente en comparación a un ensayo clínico donde vamos a
probar un tipo de intervención de terapia.
La generación de ideas va a ser plantearme que quiero estudiar, es decir, plantear la pregunta de
investigación, por ejemplo: el artículo del síndrome del túnel carpiano, la pregunta sería: ¿Es mejor la
cirugía o las férulas de mano para el síndrome del túnel carpiano?
El objetivo va a ser lo que conteste a dicha pregunta de investigación, tiene que ser una afirmación de
lo que se va a hacer para responder. Los objetivos suelen comenzar por un verbo en infinitivo. Por
ejemplo: el artículo del STC, el objetivo sería comprar la efectividad de una y otra terapia para pacientes
con STC. Los objetivos pueden ser primarios (objetivo principal, el más importante de nuestro estudio.
Siempre hay objetivo primario) o secundarios (para explorar cosas más específicas, no siempre hay
objetivos secundarios).
Estadística y métodos de investigación en fisioterapia
Loli Martínez
En base al objetivo y a lo que conocemos del problema, es decir, a la contextualización del problema
previo del objetivo, tenemos que plantear la hipótesis. La hipótesis son los resultados que esperamos
en el estudio en base a lo que conocemos y al objetivo que planteamos. Por ejemplo, en el artículo del
STC podría ser: los pacientes tratados con cirugía tendrán mejores resultados que los tratados con
férulas; también podría ser: se despertaran menos veces por la noche los que llevan la férula de mano.
Una vez que sabemos lo que queremos estudiar (fase 1) planteamos nuestro diseño de estudio, es decir,
como lo vamos a hacer. Para ello primero se realiza un primer esbozo, que es una aproximación inicial, y
después se plantea un protocolo de estudio (plan de estudio): el tipo de diseño, los sujetos, etc.
Un esbozo es como un pequeño esquema con los puntos clave que no pueden faltar en mi diseño de
estudio. Es como un esquema inicial, pero que se puede ir modificando durante el desarrollo del
estudio, aun así, hay que tener en cuenta los principales puntos a la hora de planificarlo. Por ejemplo: en
el artículo del STC se plantea este esquema:
Estadística y métodos de investigación en fisioterapia
Loli Martínez
En este esquema podemos ver las preguntas de investigación y objetivos, pero estos objetivos son
principalmente los que responden a la pregunta ‘¿cómo comparar la efectividad a corto plazo, a medio
plazo, etc?’. Estos no tienen por qué ser los objetivos finales de nuestro estudio ni lo que va a estar ya
en el artículo final o en la forma de discusión final, pero si lo que pretendemos estudiar. Algunos
objetivos pueden prosperar y otros los podemos eliminar durante el desarrollo del estudio, pero
tenemos que tener varias vías abiertas antes de hacer el estudio.
Debemos conocer la importancia de lo que queremos estudiar, tenemos que plantearlo ya que al final
habrá que hacer una pequeña introducción de porque es importante lo que estamos estudiado.
Siguiendo el esquema tenemos los resultados esperados de lo que pretendemos estudiar, esto sería
nuestra hipótesis.
Tenemos que plantearnos el marco temporal, si va a ser un estudio transversal (si vamos a medir una
vez) o longitudinal (si lo vamos a hacer varias veces en el tiempo). Es importante plantearnos el marco
temporal porque después, a la hora de planificar el desarrollo del estudio, necesitamos una cierta
cantidad de dinero y en función del tipo de diseño de estudio vamos a necesitar realizar una mediación
o varias mediciones a lo largo del tiempo. Por tanto, el dinero necesario no va a ser el mismo si va a ser
una vez la recogida de datos, que si va a ser 4 veces (si recogemos los datos 4 veces los gastos
probablemente se van a cuadruplicar, hay que pagar a la persona que este recogiendo los datos, el
material que se va a gastar, las instalaciones, etc, pero sobre todo por el tipo de diseño). Por tanto, eso
tiene que estar previsto. En las mediciones hay que indicar cuando se mide la variable, normalmente se
hace al inicio, pero algunas veces una vez ya empezado el estudio se considera que es importante medir
otra cosa y hay que indicar que fue a las x semanas.
También tenemos que conocer el tipo de diseño del estudio, ya que no va a ser lo mismo un ensayo
clínico aleatorio (ECA), que un estudio observacional, tampoco tardaríamos el mismo tiempo ni los
costes serian igual, ni los análisis estadísticos van a ser los mismos.
Hay que centrar muy bien a que sujetos/participantes queremos estudiar, no podemos poner hombres
con patología cardiaca en general, tenemos que centrarnos en un determinado tipo de patología
cardiaca, o en un rango de edad, etc, porque si no al final estaríamos cogiendo poblaciones muy grandes
que se nos iría de las manos y no podríamos estudiar a cierto tipo de pacientes. Para ello tenemos los
criterios de selección (la exclusión y la inclusión) en el reclutamiento de los participantes, y mediante el
diseño de muestreo.
Las variables que vamos a medir son las variables de resultado que serían variables dependientes (la
variable de la que espero resultados) y las variables predictoras que serían variables independientes
que pueden variar mi resultado.
Tenemos que idear un planteamiento inicial, en el que después pueden variar el análisis estadístico y el
tamaño de muestra. En función de la potencia del análisis estadístico que queramos realizar,
necesitamos un tamaño de muestra específico, por ejemplo, si tenemos 10 sujetos no va a ser un buen
Estadística y métodos de investigación en fisioterapia
Loli Martínez
estudio porque faltaría más gente. Los estudios para ciertos análisis estadísticos van a necesitar muchas
veces tener 10 sujetos por cada variable a estudiar (para calcular el tamaño de la muestra existe una
fórmula), por lo tanto, algunos estudios que requieren 100-200 sujetos para poder esos análisis. Por ello
es importante calcular el tamaño de muestra al inicio del estudio, más vale que sobre a que falte porque
llegado el momento haciendo el análisis estadístico si no tenemos sujetos el estudio se pierde.
También tenemos que plantearnos y tener en cuenta los recursos disponibles que tenemos, el dinero, la
gente que tenemos para evaluar, los recursos clínicos, si necesitamos un ecógrafo, donde vamos a poder
realizar el estudio (por ejemplo, en un hospital solo o en varios como el Morales Messeguer, el Reina Sofía o la
Arrixaca). Todo esto lo tenemos que plantear y prever antes de la realización del estudio.
Después tenemos que presentar el tipo de estudio, el tipo de proyecto de investigación. Consta de:
1. Título
2. Resumen
3. Objetivos
4. Antecedentes
5. Método
6. Consideraciones éticas
7. Referencias
8. Apéndices
Hay que prever un título, que puede modificarse conforme pase el tiempo y de unos resultados. Tiene
que ser conciso y concreto (cuanto más simple mejor, máximo 20 palabras), y también descriptivo, es
decir, que sea fácil de entender el contenido que va a tener y el tipo de estudio. Se suele poner el tipo
de estudio que se va a realizar (pero no siempre). Debe ser así porque la persona que vaya a leer
nuestro proyecto de investigación y evalúe si va a ser viable o no, no va a saber si nuestro proyecto es de
patología cardiaca, si es de niños, si es de respiratorio, de neurología, etc, esa persona sabe que tienen
que haber unos puntos clave y en función de cómo lo vendamos (y si se entiende bien), va a dar
viabilidad o no a nuestro proyecto. Por ello todo el mundo que lo lea lo va a entender.
Hay que hacer un resumen donde se recogen los principales hallazgos que se esperan. El resumen tiene
que ser conciso, pueden ser 250-300 palabras (esto siempre lo va a poner en las normas de la revista a la que
vayamos a enviar nuestro articulo). Tiene que tener una estructura en donde suele haber una pregunta u
objetivo y los antecedentes, y métodos que vamos a utilizar.
Los objetivos se ponen a parte. Se ponen los objetivos primarios primero y si también tenemos objetivos
secundarios los ponemos después.
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Antecedentes e importancia: hay que explicar porque es importante nuestro proyecto de investigación.
Debe ser comprensible, para quien no sea experto en el tema tratado. Respecto a la estructura:
- El estado de conocimiento seria como una pequeña introducción, ¿qué se sabe acerca de mi
problema? ¿Qué se sabe hasta ahora de lo que yo voy a estudiar?
- En la estructura se debe reflejar la calidad de los estudios realizados.
- La importancia del trabajo a realizar: hay que explicar porque es importante mi trabajo y porque
tienen que coger mi proyecto de investigación y no el del compañero.
- Si hemos hecho un estudio preliminar con un equipo (pilotaje) (no siempre tiene porque
haberlo), que trayectoria tiene nuestro grupo de investigación, que artículos hemos publicado
antes.
El objetivo es vender nuestro proyecto de investigación, tenemos que hacerlo atractivo y mostrar que
dominamos el tema y que nadie sabe más que yo del tema, hay que convencer al lector. También hay
que plantear el problema de la investigación y los vacíos/déficits existentes; el objetivo también es la
justificación.
En definitiva, es justificar porque es importante nuestro estudio.
Este apartado lo podemos comparar con una pequeña introducción
Método: una vez planteado porque es importante lo que voy a estudiar, nos tenemos que plantear el
método, es decir:
- Los sujetos/población de estudio. Tenemos la población diana (para generalizar) y accesible; son
muy importantes los criterios de selección (criterios de inclusión y de exclusión). Debemos
especificar como se van a reclutar a los pacientes, es decir, como voy a realizar el método de
muestreo (si va a ser aleatorio, si va a ser consecutivo), también hay que explicar el plan de
reclutamiento de los pacientes, es decir, conforme van llegando al hospital o a mi consulta y los
voy reclutando. El método de muestreo y el plan de reclutamiento suelen ir de la mano, son
muy parecidos por no decir igual.
Loli Martínez
- Aleatorización y cegamiento: se hace la aleatorización (se puede hacer simple o por bloques) a
cada uno de los grupos si estamos en un ensayo clínico (el método de asignación lo suele hacer
un programa, aunque hay varios métodos de aleatorización). El cegamiento/enmascaramiento
puede ser: simple, doble o triple ciego (RECORDAMOS: el mejor tipo es el triple ciego, en el cual
estaba cegada la muestra, el que proporciona la intervención y el que analiza los datos). El tipo
de cegamiento hay que planificarlo previamente porque tenemos
que saber si vamos a cegar solo al paciente, al investigador o
también al analista de datos. Mínimo tenemos que tener un
enmascaramiento simple, un simple ciego, ya que si el paciente,
el terapeuta, quien mide o el analista es consciente de quien sí y
quien no recibe el tratamiento puede facilitar una respuesta y
sesgar los datos.
- Mediciones: tenemos las variables predictoras, las variables de confusión y las variables de
resultado.
Las variables de resultado son las describen los fenómenos asociados al resultado del desenlace
clínico en los sujetos investigados o su entorno (por ejemplo la muerte, el sobrevivir, la necesidad de
ventilación mecánica en pacientes con neumonía, la aparición de cáncer gástrico, etc ).
Las variables predictoras son la edad, sexo, etc. y pueden determinar cuál puede ser mi
resultado. Por ejemplo, con respecto a la edad y la velocidad de la marcha, si tienes menos edad
(más joven) nos indica que tendrá una velocidad de la marcha mayor. Otro ejemplo es si yo
tengo un paciente que ha sufrido un ACV/Ictus (tienen una discapacidad muy importante
después del ictus), esto es un problema en la limitación de la marcha; planteo un resultado en
base a la velocidad que tengan después del ictus (puedo saber cuál va a ser su velocidad final,
los 10 meses, puedo saber si su velocidad va a ser buena, si va a ser un paciente que camina de
forma independiente, si va a necesitar ayuda o si no a poder caminar). Por eso puede ser muy
interesante las variables predictoras porque a partir de una medida inicial podemos predecir un
resultado en el tiempo e incluso predecir la mortalidad (por ejemplo, si tiene una velocidad
menor a 0,04 en este tipo de pacientes tienen una mayor probabilidad de morir que un paciente
con una velocidad de 0,8).
Las variables de confusión distorsionan la medida de la asociación entre otras dos variables, son,
por ejemplo: si tenemos la velocidad de la marcha y la mortalidad, algo que me puede estar
confundiendo ese tipo de relación (la variable de confusión) sería la edad (suele ser una variable
de confusión importante); la variable predictora seria la velocidad de la marcha y variable de
resultado la mortalidad (el hecho de que tenga mayor o menor edad, puede determinar que
mueras antes o después, independientemente de la velocidad que tengas, por eso ajustamos
por esa variable).
Hay que tener en cuenta que una forma de poder ajustar entre variables (de poder
estandarizar), es utilizar las variables de confusión (esto lo vemos en la estadística interferencial).
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Las consideraciones éticas hay que tenerlas presentes y tienen que ser aprobadas.
Referencias: hay que referenciar los artículos, cada revista tiene una forma específica de referenciar (en
ciencias de la salud se usa el estilo Vancouver).
En el caso de que haya apéndices también hay que ponerlos. Los apéndices son información extra que
no ponemos dentro del artículo.
Bloque 4. Tema 1.
Elementos de la Estadística Inferencial.
1. Introducción.
En clases anteriores se ha nombrado en algunas ocasiones diferentes términos como
extrapolar, bivariante… entre otras. Hasta ahora, hemos hablado de muestras y
poblaciones pero no hemos hecho distinción entre ellas, ya que hemos trabajado sobre
una base de datos de 30 casos a partir de la cual queremos aprender y sacar información.
Por consiguiente, ya sabemos cómo son nuestros pacientes y los hemos descrito,
podemos conocer si nuestros resultados son o no favorables y hemos analizado su hay
asociaciones o correlaciones entre diferentes variables.
2. Estadística descriptiva.
El objetivo de la estadística descriptiva es valorar si los resultados o las diferencias entre
ellos son importantes o son mínimas. Por ello, se conoce como la parte relacionada con
la descripción y síntesis de datos para lograr una visión global.
Mediante esta, vamos a poder presentar los datos a partir de tablas de frecuencias o
gráficos (como vimos ya anteriormente en otros temas) y para sintetizar estos datos
mediante un único valor como puede ser la media, mediana, desviación típica… Gracias
a esto, vamos a poder comparar grupos o establecer relaciones entre ellos, sin
embargo, hasta ahora no sabemos si esta diferencia es importante o no, es decir, no
sabemos si es estadísticamente significativo.
Si nosotros tenemos 30 casos y realizamos un estudio de investigación sobre ellos, nos
interesaría saber si posteriormente podemos extrapolar esta aplicación de una muestra
elegible a una muestra diana. Estos términos ya los vimos anteriormente, en este tema
veremos cómo se realiza esta extrapolación desde una muestra pequeña a toda una población.
1
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
A la hora de representar estos dos conceptos tenemos que saber que la población se va
a representar como ‘N’ y la muestra como ‘n’. Por consiguiente, en los artículos
científicos nos vamos a encontrar siempre una ‘n’ puesto que emplean muestras para
realizarlos, no toda la población.
2
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
’Aquella en la que todos los elementos de la población tienen las mismas oportunidades
de ser seleccionados (misma probabilidad de ser seleccionados). La aleatorización
permite que ningún elemento de la población se vea favorecido o excluido en el proceso
de selección.’
Para investigar una población tomamos un subconjunto de elementos a los que
estudiamos y de los cuales extraemos conclusiones sobre toda la población. La selección
de la muestra determinará la diferencia entre obtener resultados válidos o no.
Ejemplo:
Nosotros podríamos emplear una muestra aleatoria para saber que opinan los
fisioterapeutas españoles sobre la acupuntura enviamos un cuestionario por redes
sociales. Para realizar esto, podemos enviar un cuestionario por redes sociales sin
realizar ningún tipo de selección. De esta forma, obtendremos resultados de
fisioterapeutas muy diferentes.
La profesora ha dicho que los siguientes conceptos son muy importantes.
3.3 Estadístico.
Medida usada para describir alguna característica de una MUESTRA: porcentaje, media,
mediana, desviación típica…
Un ejemplo sería: Uso de Ortesis (si/no) y fuerza prensora en una muestra de 10
pacientes, como el número de pacientes está limitado, es una muestra lo que hemos
cogido a partir de toda una población. Podemos ver como en este ejemplo observamos
la media y desviación típica de esa muestra.
3.4 Parámetro.
Medida usada para describir las mismas características, pero de la POBLACIÓN:
porcentaje, media, mediana, desviación típica…
Un ejemplo sería: Altura media de los alemanes. Aquí estamos empleando la altura de
TODOS los alemanes, por ello, es una población.
Hasta ahora para describir nuestros 30 casos hemos estado empleando estadísticos ya
que trabajábamos con muestras. En investigación intentamos estimar parámetros a
partir de estadísticos, a partir de una muestra vamos a intentar obtener conclusiones
para toda la población. Esto se realiza mediante los análisis estadísticos.
3
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
4. Distribución muestral.
Una distribución es una lista, gráfico o función de todos los resultados posibles de una
variable aleatoria y la frecuencia con la que ocurre cada resultado concreto o conjunto
de resultados. Es decir, es la representación de todas las muestras posibles de una
misma variable para ver su distribución en una gráfica.
Mediante el siguiente gráfico nosotros podemos entender que la distribución es normal,
puesto que es simétrico. Este se podría emplear para representar diferentes parámetros
como puede ser la altura, el peso… dentro de una población. A partir de esta población,
sacamos muestras pequeñas hasta que nos quedamos sin más gente y, de cada muestra,
sacamos la media. A partir de esta media, podemos construir la gráfica para ver cómo
se comporta la distribución ya que tendremos grupos con menor media y otros con
mayor que permitirá ordenarlas.
4
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
b. ¿Y si σ = 7 y n = 20?
Esta vez, sustituimos estos valores en la misma fórmula: x̄= 7/ (√20) = 1,5652
Por consiguiente, el error de muestreo es de 1,5652
Resultado de aprendizaje: Cuando disminuimos el tamaño de la muestra, el error de
muestreo es mayor (el resultado del b tiene mayor error que el del a). Esto se debe a
6
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
que estamos cogiendo un mayor número de gente para nuestro estudio, por lo que la
probabilidad de que nuestros datos coincidan con la población es menor. Por
consiguiente, cuanto mayor es el número de datos, menor es la variación y más
precisos son los resultados. El tamaño de la muestra siempre debe ser lo más grande
posible.
7
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
8
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Si sustituimos en esta fórmula los valores que poseemos obtendremos una posición:
Esto nos indica que aproximadamente se encuentra a ±1σ
Ahora bien, lo que nosotros queremos es conocer la posición exacta donde encontramos
el 119. Por lo que, si ya hemos determinado que p(µ≥119) =p(z=≥1,27) vamos a la tabla
Z (nos la darán en el examen) y buscamos el valor que corresponda a 1,27 que en este
caso es 0,8980. Sin embargo, tenemos que tener en cuenta que nos está pidiendo un
valor que sea> a 1,27 no que sea igual. Por ello, si recordamos bien, debemos restarle a
1 el valor que obtengamos en la tabla, es decir, debemos hacer 1-0,8980= 0,102= 10%.
Por consiguiente, podemos concluir que p(µ≥119) = 10%. Poseemos una probabilidad
del 10% de hallar una media de 119. Al poseer una probabilidad del 10% (0,102), como
es un valor >0,05, no sería un cambio significativo ya que estaría dentro de lo ‘esperable’.
Poco a poco vamos a ir viendo cómo llegamos al valor de 0,05, esto es solo el principio.
9
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Sin embargo, a partir de ahora, vamos a trabajar con parámetros desconocidos donde
podremos asociar la muestra al error típico de la media. El error típico va a ser parecido
a la desviación típica, solo que se tiene en cuenta el tamaño muestral respecto a una
muestra concreta. Un ejemplo de esto sería el siguiente enunciado:
La distribución de tallas de una MUESTRA aleatoria de 100 neonatos presenta
media=51cm. y una desviación típica=2 cm. ¿Cuál es el ERROR TÍPICO DE LA MEDIA en
la distribución muestral?
Al igual que para el error de muestreo tenemos una determinada fórmula, poseemos
otra para el error típico de la media. Hay que tener en cuenta que las fórmulas son las
mismas pero fáciles de distinguir ya que lo único que cambia de una a otra es la forma
de expresar esta. En el error de muestreo se aplica con los símbolos pertenecientes a la
población y en el error típico de la media, los pertenecientes a la muestra.
Por consiguiente, podríamos decir que el error típico de la media es una estimación del
error de muestreo a partir de muestra. Es decir, nos da una idea de cuál puede ser la
distribución de la muestra, pero no nos dice exactamente si esta sigue una distribución
normal o no. Mediante esta obtendremos información acerca de la dispersión que posee
la muestra, nos da información similar a la desviación típica: cuanto mayor valor tenga,
mayor dispersión.
Si resolviésemos el ejemplo anterior planteado (justo al inicio de esta hoja) para el error
típico de la media, únicamente tendríamos que sustituir los datos que poseemos en la
fórmula. Como el valor es pequeño, podemos decir que no hay una gran dispersión, pero
no podemos indicar la forma de la distribución.
10
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Cola
11
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Uso de la tabla T
Recordar que la vamos a emplear cuando no sabemos si nuestra muestra sigue una
distribución normal o no poseemos los parámetros de la población.
Pasamos de emplear la tabla Z usada hasta ahora a emplear la tabla T. En esta, en las
filas vamos a tener los grados de libertad (n-1) y en las columnas tendremos la
probabilidad (por un lado o por ambos). Si solo observamos una cola, un lado, sí o sí va
a ser un valor ≥ que… Mientras que, si observamos ambos lados o colas, pueden ser
valores tanto ≥ o ≤ que...
Diferencias entre la tabla T y la tabla Z:
Tabla Z Hay que tener en cuenta que nuestro valor 0 en la tabla Z corresponde a la
media, por lo que, cuanto más nos alejamos de esta posición mayor es la probabilidad
de encontrarnos dentro de estos valores de normalidad estandarizados. En la imagen
siguiente se muestra una parte de la tabla Z. Todos los números que vemos en ella en
función de las filas y columnas, representan la probabilidad de caer en una posición
determinada o en una posición menor a esta. Por ejemplo, la probabilidad de obtener
un número o posición igual o inferior a 1,23 es de 0,8907 (subrayado en la imagen).
12
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
13
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
derecho (cola derecha de la distribución t). Esto ocurre cuando solo nos basamos
en una cola, si miramos las dos colas podríamos obtener valores tanto “mayor
que” como “menor que”.
Ejercicio 4. Distribución muestral con parámetros desconocidos (T de Student).
¿Cuál es el valor crítico tipificado que deja el 5% en un lado (unilateral) de distribución
muestral de medias con muestras n=51?
Nos iríamos a la tabla T y miraríamos donde pone una cola o unilateral y nos
colocaríamos en la columna del 5% (0,05). Una vez ahí, calcularíamos los grados de
libertad (n-1) a partir de la muestra que nos da de 51. Por lo que para hallar estos
haríamos 51-1=50. De tal forma que miramos en la columna de 0,05 unilateral y la fila
de 50 y obtenemos que el valor crítico tipificado es 1,67.
Por consiguiente, si nosotros obtuviéramos una posición >1,67 sería raro ya que hemos
obtenido que lo habitual o fácil de obtener probabilísticamente, es que sea igual o
inferior a 1,67.
14
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Nuevo concepto: la zona de la cola o el valor situado por encima del tipificado obtenido,
se va a denominar Alfa. Es decir, los valores que hemos estado llamando raros hasta
ahora, pasan a denominarse valores alfa.
15
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
b) ¿Y si π = 0,06 y n= 175?
0,06.(1−0,06)
Volvemos a sustituir en la misma fórmula estos valores.𝑆𝐷(𝑝) = √ = 0,018
175
16
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
17
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
0,569−0,517
Debemos sustituir en la fórmula de antes Z= =2,44 A partir de este valor,
0,0213
nos vamos a la tabla Z y localizamos 2,4 en la fila y 0,4 en la columna y vemos que la
probabilidad de obtener este valor es de 0,9927 99%.
0,6(1 − 0,6)
𝑆𝐸 (𝑃) = √ = 0,24
40
18
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Bloque 4.
Tema 2: ESTIMACIÓN DE PARÁMETROS
1 Conceptos preliminares.
1.1 ESTADÍSTICA INFERENCIAL Y ESTIMACIÓN DE PARÁMETROS
Los ESTADÍSTICOS son las medidas que usamos para describir alguna característica de la
muestra: porcentaje, media, mediana, desviación típica, etc. Es el número que resume los
datos recopilados de una MUESTRA.
Por ejemplo: el uso de ortesis (si/no) y nuestra fuerza prensora en nuestra muestra,
podemos ver la media de un grupo con intervención y otro grupo control, obteniendo los
datos de una muestra.
Los PARÁMETROS son las medidas que usamos para describirlas mismas características,
pero de la población: porcentaje, media, mediana, desviación típica, etc. Es el número que
resume los datos recopilados de una POBLACIÓN.
Por ejemplo: la altura media de los alemanes, obteniendo los datos de la población.
1
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Recuerdo:
El tamaño de una población se representaba N
2
Estadística y métodos de investigación en fisioterapia
Loli Martínez
ESTIMACIÓN PUNTUAL: asumimos que el parámetro va a ser igual al estadístico, van a tener
el mismo valor (sabemos que esto no va a ocurrir en la mayoría de los casos).
Características: Es un valor numérico simple y es la estimación de un parámetro
desconocido.
Cuando obtenemos un rango, nosotros decimos que, en ese rango, nuestra proporción se va
a aproximar a la de la población.
Por ejemplo: tenemos una estimación puntual del 19%, y es muy poco probable coincidir
con el centro de la distribución, pero si ahora digo que mi estadístico ( muestra) se va a hallar
entre estos valores del rango, tengo mayor probabilidad de que mi estadístico coincida con
el parámetro de la población.
Por eso se utiliza un intervalo de confianza (IC). Todos los estudios van con su IC porque es
muy poco probable que nuestro estadístico coincida con el de la población, pero si damos
un rango tenemos mas probabilidad de que coincidamos con la población (el IMC de María
va a ser diferente al de Mireya, etc, así con cada uno, pero si yo digo un rango,
probablemente dentro de este nos encontremos la mayoría de los alumnos, a eso se le
denomina intervalo de confianza).
IC = p ± ME
El intervalo de confianza va a ser el estadístico (proporción o media) ± un margen de error
(tenemos que dar un valor negativo y otro positivo [por encima o por debajo de la media o de la
proporción] porque no todo el mundo se va a situar entorno a la media, sino que siempre
vamos a tener sujetos alrededor de nuestro estadístico, ya sea por abajo o por arriba, por
eso el intervalo de confianza va a tener un valor negativo y uno positivo (±), como hacíamos
con la desviación típica).
3
Estadística y métodos de investigación en fisioterapia
Loli Martínez
El nivel de seguridad o confianza es lo que vemos en los estudios el 90%, el 95%, el 99% (en
la mayoría el IC que se utiliza es el del 95%, ya que es el que esta aceptado por la comunidad
científica). En la mayoría los artículos científicos vamos a encontrar su intervalo de confianza,
porque los pacientes varían mucho y tenemos que dar un rango de valores posibles donde se puede
hallar ese valor, ese estadístico parámetro . El IC nos da una información de si un valor puede
ser muy atípico dentro de lo que es nuestra muestra.
4
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Si nos dicen que el % de alumnas con un IMC>25 es 19, ¿es una estimación puntual o por
intervalos de confianza? Ya sabemos que es puntual porque nos esta dando un solo
número y el intervalo de confianza siempre va a tener uno inferior y uno superior. Como
vemos, esto es poco preciso ya que es poco probable que coincida con el verdadero
parámetro, mientras que con el intervalo de confianza realizamos una estimación que
abarca varios valores donde probablemente se encuentre el parámetro (AHORA VEREMOS
EL NIVEL DE CONFIANZA: con que probabilidad voy a tener yo la certeza de que el
parámetro de la población se encuentra dentro de ese rango que yo digo).
TABLA 1: Tabla de estadística descriptiva de las características de la muestra. Esta tabla está
en todos los estudios, tenemos que conocer como son los sujetos para poder comparar con
otros estudios, o con el resto de mi población. En la última columna encontramos el IC.
5
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Ahora vamos a ver como se construye un intervalo de confianza. El IC depende del margen
de error (ME), puede ser muy grande, medio, pequeño…
Si tenemos mayor certeza de que no nos vamos a equivocar, es decir, yo te digo x rango y
dentro de este rango se que no me voy a equivocar vamos a ser menos precisos (‘voy a ser
menos fino con el parámetro’). Por ejemplo: la temperatura máxima de mañana será entre
10 y 40º ¿Tendré alta probabilidad de certeza? Sí, probablemente no me equivoque. Pero
si afirmo que será entre 24 y 24º voy a ser más preciso, pero puede que me equivoque.
El objetivo final de una estimación por IC es que el intervalo sea estrecho porque significará
que estaremos cerca del parámetro de la población ( tendremos la certeza de que se va a
encontrar el parámetro dentro de ese rango ). Pero no siempre es deseable que sea estrecho,
ya que habría que aumentar la muestra para reducir el margen de error. Por ejemplo: si
queremos aumentar la precisión y tener la probabilidad de que no nos vamos a equivocar,
una solución es tener una muestra muy amplia porque si tenemos pocos sujetos tenemos
poca variabilidad y eso hace que seamos menos precisos.
6
Estadística y métodos de investigación en fisioterapia
Loli Martínez
El nivel de confianza se designa mediante 1- α, y se suele tomar en tanto por ciento (la resta
nos va a decir el % que tenemos que buscar en la tabla).
Alfa (α) va a ser el nivel de confianza.
Por ejemplo, si nuestro nivel de confianza es 95% 1 - 0,95 = 0,05 unilateral (si tenemos
en cuenta solo una cola), pero se suele usar el bilateral que es 0,05/2 = 0,025 (por cada
lado).
Para hallar el 2,5 % en la tabla Z tendríamos que buscar el porcentaje 97,5 para saber cuál es
ese valor Z. A partir de ese valor calculamos el margen de error.
Este número de errores estándares se denomina VALOR CRÍTICO. El llamado valor crítico, es
aquel punto Zα/2 (¡¡al tener las 2 colas hay que dividir entre 2!!) siempre y cuando utilicemos
una distribución Z de una variable normal N (0,1). (El valor critico va a ser importante para luego
decir si el valor que nosotros obtenemos se va fuera de lo normal o no ).
7
Estadística y métodos de investigación en fisioterapia
Loli Martínez
* Si cogiéramos un IC90%, tenemos que buscar en la tabla Z: 1 - 0,9 = 0,1 0,1/2 = 0,05.
En la tabla Z buscamos el 0,9500 (1-0,05) o lo más próximo, para saber el valor a partir del
cual me puede decir si nuestros datos van a estar cercanos a la población o son diferentes.
Para el 90% el valor de Z va a ser 1,645
8
Estadística y métodos de investigación en fisioterapia
Loli Martínez
9
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Lo más importante que debemos saber el tamaño de la muestra es: ¿QUÉ INFLUYE EN EL
TAMAÑO MUESTRAL?:
Cuanto más alto sea el nivel de confianza (1-α), el valor de Zα/2 aumenta y por tanto
el tamaño de la muestra n debe ser mayor.
Cuanto mayor es la dispersión de la muestra, es decir, cuanto mayor variabilidad ,
mayor debe ser el tamaño de la muestra n para obtener una representación más real
de lo que es la población.
Por ejemplo, si queremos obtener el porcentaje de fisios españoles que utilizan la punción
seca lo que tenemos que hacer es dividir los que usan punción seca entre toda la población
de fisioterapeutas para obtener la proporción poblacional (p).
Una vez que tenemos nuestra proporción, hemos determinado nuestro nivel de confianza
(el que nosotros elijamos). En función de ese nivel de confianza utilizamos el valor Z.
Ahora nos queda unirlo todo IC = Proporción ± margen de error
MÉTODO DE CONSTRUCCIÓN:
10
Estadística y métodos de investigación en fisioterapia
Loli Martínez
SE () =
√ 0,6 x (1 − 0,6 )
40
= 0,077
c ¿Cuál es el margen de error para z95% = 1,96? Tenemos que sustituir en la fórmula
(multiplicar el error típico por el Z).
d ¿Cuál es el intervalo de confianza con z95% (IC95%)? Al intervalo hay que sumarle y
restarle el margen de error a la proporción. IC95% va a estar entre 45%-75%
11
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Una vez obtenido el intervalo de confianza hay que interpretarlo (¡¡SI NO SABEMOS
INTERPRETAR NO SABEMOS QUE ESTAMOS HACIENDO!!).
- Nuestra muestra debe ser obtenida de forma aleatoria, hay que controlar que no
tengamos una muestra sesgada, por ejemplo, coger solo chicas o solo chicos, coger
personas delgadas, etc (¡¡esto es importante y tenerlo en cuenta para el examen!!).
- Hay que tener una muestra de tamaño suficientemente grande, para ello hay que
multiplicar el tamaño de la muestra y la proporción: np tiene que ser mayor de 5 y
n(1-p) tiene que ser mayor a 10 (la muestra tiene que ser muy muy pequeña para
NO cumplir estas condiciones).
* Esto es mejor que sea el primer paso (si no se cumple las condiciones de aplicación no
hace falta realizar todo lo demás).
12
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Para estimar una media poblacional (μ) se empleará la media muestral () ± el margen de
error (ME). A ello lo vamos a denominar IC para la media poblacional.
El primer paso es obtener la media muestral para poder estimar la media poblacional, esto
es la estimación puntual. Por ejemplo: la edad media de los fisioterapeutas de la región de
Murcia y después si yo lo quiero extrapolar a todos los fisioterapeutas españoles.
13
Estadística y métodos de investigación en fisioterapia
Loli Martínez
La desviación estándar o error típico (SE) divide la desviación típica de la muestra (s) entre el
tamaño de la muestra (n): SE () = s/ √ n
Niveles de confianza
Esto sería (con la misma filosofía que la tabla Z) 1 – α 1-0,95= 0,05 si es una cola o 0,025 si
son dos (α/2). Lo más habitual es tener dos colas.
14
Estadística y métodos de investigación en fisioterapia
Loli Martínez
a Calcula el error típico de media. Al darnos la media, hay que calcular el margen de
error. Podemos buscar el valor t o el error típico.
SE () = s/ √ n = 2 / √ 101 = 0,19
c ¿Cuál es el margen de error para IC al 95%? → Hay que multiplicar el valor de t por el
error típico para obtener el margen de error.
ME = t α; n-1 x SE = 1,984 x 0,19 = 0,376
- ESTO LO PONÍA EN EL PWP, PERO COMO SOLO ES PARA EL TLC TENEMOS QUE TENER EN
CUENTA UNICAMENTE LO DE LA ALEATORIZACION DE LA MUESTRA → Muestra de tamaño
‘suficientemente’ grande ≥ 30 (esto solo se aplica si usamos el TCL teorema central del limite y este
decía que si la muestra era obtenida de forma aleatoria y si el tamaño es suficientemente grande
podemos decir que la muestra es aproximadamente normal por lo que utilizaríamos la Tabla Z (ya que
es aproximadamente normal). La tabla T la empleamos cuando no sabemos nada, que es
lo que suele ocurrir.
15
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Cuando queremos comparar dos medias (tenemos 2 grupos diferentes) por ejemplo:
- La edad media entre hombre y mujeres, tenemos 2 poblaciones y por tanto podemos
obtener dos muestras.
- Si tenemos un grupo experimental y otro control donde aplicamos por ejemplo una terapia
con electrolisis y otro con intervención, simplemente un placebo.
Para estimar la diferencia de dos medidas poblacionales (μ1-μ2) tendremos que tomar una
muestra de cada una de las poblaciones de las cuales obtendremos sus medias muestrales ±
margen de error (ME). A ello lo vamos a denominar IC para la diferencia entre dos medias
poblacionales.
Lo 1º es obtener el estimador puntual (δ), al igual que antes solo que ahora hay que restar
para obtener la diferencia entre un grupo y otro. Cada uno tiene su tamaño muestral (no
necesariamente tiene que ser el mismo, pero si estamos realizando un estudio experimental
riguroso y bien hecho es preferible que tenga un número aproximado). Cuando tenemos un
tamaño muestral pequeño lo conveniente es que sean, en la medida de lo posible, el mismo
número de sujetos (para que no sean grupos desequilibrados). Cada grupo tiene su
desviación típica.
4,66
Una vez que tenemos la diferencia de medias y el valor de t, solo queda obtener la
desviación estándar o típica de la diferencia de medias: SE(1-2): raíz cuadrada de una
desviación + la desviación del otro grupo.
16
Estadística y métodos de investigación en fisioterapia
Loli Martínez
El tamaño de las muestras son pequeños (n<30) y no estamos seguros que los datos
provienen de una distribución normal.
Teniendo en cuenta estas 2 situaciones no podremos utilizar el valor Z α/2 de la distribución
normal. En este caso utilizaremos los valores tα/2.
17
Estadística y métodos de investigación en fisioterapia
Loli Martínez
IC95% δ = d ± tgl x SE (1-2) = 4,55 ± 2,101 x 1,714 → 4,55 + 3,6 = 8,15 (límite superior)
Una vez que tenemos nuestro intervalo de confianza, con nuestro estimador puntual y su
margen de error, nos queda la INTERPRETACIÓN: Basándonos en los resultados de la
muestra y con un nivel de confianza del 95%, el grosor del tendón en el grupo control es
en promedio mayor que en el grupo experimental, hallándose esta diferencia entre 0,95 y
8,15. (tenemos que saber cual es la media de cada grupo para después poder extrapolarlos
en la interpretación). Si fuera muy amplio en intervalo de confianza quiere decir que
tenemos mucha variabilidad y a lo mejor esta medida no es del todo útil porque no nos da
mucha información.
18
Estadística y métodos de investigación en fisioterapia
Loli Martínez
La última variable (es la única cuantitativa y la única media): la intensidad del dolor
será un diferencia de medias → Prueba T de Student, que se basa en el modelo T.
Cuando tenemos más de 2 grupos, es decir, 3, 4 o 5 grupos, nos tenemos que ir a un análisis de la
varianza (es el ultimo TEMA) → nos va a permitir comparar un grupo con respecto al otro y una
comparación general entro todos los grupos, pero las diferencias de medias (la prueba t de Student
que nosotros usamos en el SPSS solo sirven para 2 GRUPOS!)
19
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Para una VARIABLE CON DOS O MÁS GRUPOS tenemos los Gráficos de Barras
para las proporciones y los Gráficos de Medias para las medias.
DIFERENCIA DE 2 GRUPOS:
Si las barras se superponen, NO hay asociación, es que no hay diferencia entre los
grupos por tanto en esa variable da igual que midamos en un grupo o en otro porque
va a ser lo mismo, es decir, no es relevante (están asociadas esa variable que
estamos examinando en cada uno de los grupos esta asociada).
20
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Bloque 4. Tema 3.
Contraste de hipótesis estadísticas.
Planteamiento general.
1. Introducción.
En este tema vamos a ver, aplicando la estadística, todo lo que hemos visto
anteriormente ya que hasta ahora sabemos que a partir de una muestra aleatoria de
una población podíamos obtener una serie de estadísticos. Gracias a estos, podíamos
inferenciar (estimar) cuáles eran los parámetros de nuestra población y, de estos,
podíamos obtener de nuevo una muestra. Así generamos un continuo círculo que puede
no llegar a terminar.
2. Hipótesis estadísticas.
Si nosotros vamos a un juicio y estamos viendo como juzgan a alguien por un delito que
supuestamente ha cometido, tenemos que tener claro que siempre se dice que una
persona es inocente hasta que se demuestre lo contrario. Por ello, se contratan a los
abogados para que por parte del acusado lo defiendan y busquen pruebas que no lo
incriminen y al revés.
A partir de esto podemos entender que existen dos tipos de hipótesis:
Hipótesis nula (H0) → Esta va a ser el punto de partido, lo que ya se conoce (verdad
universal). En este caso, podríamos decir que esta hipótesis sería que el acusado es
inocente a consecuencia de la frase ‘’ Todo el mundo es inocente hasta que se
demuestre lo contrario’’. Por ello, podemos entenderla como: partida del supuesto
de que las diferencias entre el valor verdadero del parámetro (población) y su valor
1
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
hipotético (muestra), en realidad no son tales sino debidas al azar, es decir no hay
diferencia o dicho de otra forma la diferencia es nula.
Hipótesis alternativa (H1) → En este caso, esta hipótesis será lo que nosotros
queremos demostrar o comprobar, es decir, que el acusado es culpable. Por ello,
podemos definirla como: aquello que queremos demostrar y es la hipótesis contraria
a H0. Se acepta cuando se rechaza H0. Todas las hipótesis planteadas en los estudios
científicos son de este tipo.
Para explicar que es un contraste de hipótesis podemos seguir con el ejemplo del juicio,
lo primero que se hace es asumir la hipótesis nula, asumimos que el acusado es
inocente y, después, vamos a buscar pruebas o evidencias para refutar esta hipótesis
nula. A partir de esto generaremos nuestra hipótesis alternativa que sería que el
acusado sea culpable y cada prueba que encontremos que desmienta la hipótesis nula,
aumentará las probabilidades de que la H1 sea la correcta.
En el momento en que las pruebas que encontremos generen una duda más allá de lo
razonable en un primer momento y demuestren lo contrario de lo que pensábamos,
rechazaremos la H0 y aceptaremos la H1.
Si las pruebas no llegan a generar esa duda razonable, aceptamos H0 y rechazamos H1.
Ejemplo de cómo extrapolaríamos el contraste de hipótesis a nivel estadístico
Nuestro objetivo va a ser determinar el coeficiente intelectual de los estudiantes de
la Universidad de Murcia. A partir de este, nosotros vamos a plantear una hipótesis
nula en base a la literatura científica que ya existe. En este caso, encontramos que
el coeficiente intelectual de los estudiantes de la Universidad de Murcia es de 100
(tenemos que entender que esto hace referencia a la media de esta población).
A partir de esto, podemos instaurar que nuestra hiótesis alternativa (H1) defiende
que los estudiantes de FT de la UMU tienen un coeficiente intelectual MAYOR al de
la población general de universitarios de UMU.
Es decir, tenemos que 𝑯𝒐: 𝝁 = 𝟏𝟎𝟎 y 𝑯𝟏: 𝝁 > 𝟏𝟎𝟎. Nuestra
hipótesis alternativa la estamos planteando en términos de
superioridad.
2
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Otro ejemplo más para entenderlo sería: H0→ El 25% de las mujeres españolas tienen
varices. H1 → Menos del 25% de las mujeres españolas tienen varices. Entendiendo que nuestra
población son las mujeres españolas con varices y nuestro parámetro es el 25% (la proporción).
Si lo que queremos demostrar es que menos del 25% presentan varices, tendríamos que realizar
un estudio descriptivo u observacional.
3
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
aceptación, el intervalo de confianza, sería el área que deja a su izquierda el valor crítico
que previamente determina el nivel de significación.
Obtenemos una posición de 1,72 y lo colocamos en nuestra posición para saber si este
cambio es o no significativo. De momento, se encuentra dentro de la normalidad por lo
que aceptaríamos la H0.
Recordemos que el P-valor es la probabilidad de hallar un estadístico igual o superior
asumiendo una determinada distribución muestral. Si hayamos un valor <0,05 tenemos
una baja probabilidad de encontrar nuestro valor y podemos rechazar la hipótesis nula.
Si tenemos una probabilidad de 0’97, sería una probabilidad muy alta que si estaría
dentro de lo considerado normal.
A toda esta estandarización es a lo que se conoce como estadístico de contraste ya que
representa la divergencia entre los resultados muestrales y el valor del parámetro
poblacional.
4
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
5
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Contraste unilateral derecho Esto sería como el ejemplo que hemos visto
anteriormente, el 10% de la región crítica se va a situar únicamente en el lado
derecho, dejando todo lo demás (90%) como región de aceptación. Tenemos en
cuenta lo dicho anteriormente, que esta región de aceptación va a ir desde - ∞
hasta 1,6451, si el valor obtenido es mayor de esto, rechazaríamos la H0 ya que
estaría en la región crítica.
Contraste unilateral izquierdo En este caso ya a ser justo al revés del anterior,
el 10% de la región crítica se va a situar únicamente en el lado izquierdo, dejando
todo lo demás (90%) como región de aceptación. Esta región de aceptación va a ir
desde - 1,6451 hasta +∞, si el valor obtenido es menor de -1,6451, rechazaríamos
la H0 ya que estaría en la región crítica.
6
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
3.4.2. Bilateral.
En esta gráfica nos encontramos con una bilateral ya que presentamos dos zonas críticas
(donde rechazamos H0) y una zona central que es la región
de aceptación. Por ello, tenemos que entender que, en un
contraste bilateral, tenemos el 95% de aceptación y una
región crítica del 5% (2,5% en cada lado que equivaldría a
±2 errores estándares de la afirmación).
Si vemos esto en terminología de números, de la tabla Z, podemos ver que nuestro valor
de α en un contraste bilateral es partido de 2 (α/2) para poder obtener ese 2,5% a cada
lado que en total constituirían el 5% de la región crítica. Por consiguiente, nuestra región
de aceptación va a ir de -1,9605 a +1,9605, todos los valores hallados entre estos dos
van a producir que sí que aceptemos la hipótesis nula. Si hallamos valores más bajos o
altos de estos, rechazamos la hipótesis nula.
3.6. Comprender que la conclusión alcanzada podría ser errónea por puro
azar.
(De aquí no ha dicho nada, aparecía en el esquema general del principio, pero luego no aparecía
ni en las diapos).
7
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Por consiguiente, sabemos que el P-valor es importante porque decir sólo “hay una
Diferencia Estadísticamente Significativa” no permite conocer lo poco probable que fue
haber hallado el estadístico. Sin embargo, el P-valor nos permite hallar directamente esa
probabilidad.
En términos simples, el valor p ayuda a diferenciar resultados que son producto del azar
del muestreo, de resultados que son estadísticamente significativos. Contraste de
hipótesis. Bloque 4. Estadística inferencial uni y bivariante. Valor p Nos va a ayudar en
la toma de decisiones con respecto a H0.
La profesora ha dicho que en el examen puede caer algún ejercicio donde nos pida
determinar el contraste de hipótesis, en ese caso, nos tendremos que fijar si la
hipótesis alternativa es diferente (será contraste bilateral), si es menor (unilateral
izquierda) o si es mayor (unilateral derecha)
A continuación, se adjunta una tabla resumen con todo lo que se ha explicado hasta
ahora en este tema. Conforme se ha ido explicando se han puesto los gráficos y los valores
dentro de los que está la región de aceptación, pero os pongo esta tabla por si os ayuda a
recordarlo:
5. Significación estadística.
Si la probabilidad de hallar un estadístico de contraste es < 0,001, nuestra muestra es
estadísticamente inferente a la población y tenemos pruebas que lo demuestran, lo que
genera una significación estadística elevada.
Si la probabilidad de hallar un estadístico de contraste está entre 0,05 y 0,001, hay una
diferencia significativa, no tan grande como en el caso anterior, pero lo es.
8
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Si la probabilidad de hallar un estadístico está muy cerca de 0,05 hay poca significación
estadística. En este caso, queda a juicio del investigador si considera que esa prueba o
test es o no relevante.
Si la probabilidad de hallar un estadístico es >0,05, no hay diferencia estadísticamente
significativa y por ello, aceptamos la hipótesis nula.
9
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
la media del billete era de 128 euros y una desviación típica de 40 €. Esto sería nuestra
hipótesis alternativa, lo que nosotros queremos comprobar.
Pregunta de investigación: ¿Se puede considerar con un nivel de significación del 1% que
la información de la ACA es correcta? Tener en cuenta que nuestro P-valor debe ser
<0,01 para decir que si existe una diferencia estadísticamente significativa, ya que
hablamos del 1%.
Nuestra región de aceptación sería del 99% ya que si hacemos 1- α, obtenemos que 1-
0,01= 0,99x100=99%. Además, como sabemos que nuestros valores críticos van a variar,
instauramos las dos hipótesis:
10
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Bloque 4.
Tema 4: CONTRASTE DE HIPÓTESIS DE DOS MEDIAS
Los pasos son los mismos, lo único que cambia es la especificación del modelo y como vamos a
compartir los datos después, pero el resto es igual. Para las proporciones también es igual.
Las medias las vamos a ver conociendo los parámetros de la población. En este caso , al
conocer los parámetros de la población se usa el modelo Z.
Como hemos visto en el tema anterior, lo 1º cuando acusamos a una persona, la verdad
universal y lo que tenemos que asumir es que una persona es inocente hasta que se
demuestre lo contrario → Eso seria nuestra hipótesis nula (H0). Lo que yo quiero
comprobar/demostrar es la hipótesis alternativa (H1): yo quiero demostrar que una persona
es culpable (para ello tenemos que buscar pruebas que lo confirmen y aumente la
probabilidad de que la H0 sea falsa, como el ejemplo: una persona que se había comido la
tarta de chocolate → si estaba el plato vacío, si estaba manchada la cara de chocolate, etc.
Esto son pruebas, por lo que ya tenemos un indicio de que esa persona se ha comido la tarta
y es culpable).
Si tenemos pruebas suficientes para demostrarlo (se crea una duda razonable), vamos a
rechazar la hipótesis nula, ya que confirmaríamos la hipótesis alternativa de lo que yo
pretendo demostrar.
En el caso contrario de que no tengamos pruebas suficientes (no hemos podido demostrar
que esa persona se ha comido la tarta), aceptaríamos nuestra hipótesis nula y
rechazaríamos la hipótesis alternativa.
El aceptar o rechazar una hipótesis se hace siempre en referencia a la hipótesis nula y hay
que buscar pruebas para intentar demostrar la hipótesis alternativa.
1
Estadística y métodos de investigación en fisioterapia
Loli Martínez
EJEMPLO DE CONTRASTE DE HIPÓTESIS: Yo quiero demostrar que una terapia es mejor que
otra terapia ya conocida y demostrada que es eficiente (que es válida):
La hipótesis nula sería la terapia que ya se conoce (verdad universal), lo que yo
pretendo demostrar que no es así o confirmar.
La hipótesis alternativa siempre va a ser lo nuevo, lo que yo pretendo demostrar.
Podemos confiar o desmentir o probar cosas nuevas.
Lo 1º que tenemos que hacer es determinar que es cada cosa, es decir, cual es la hipótesis nula
y cual va a ser la hipótesis alternativa.
La hipótesis nula (H0) es la verdad universal que ya se conoce. Fijaremos la hipótesis nula en
referencia a la población (al parámetro de la población) o a mi referencia (lo que yo quiero
confirmar o desmentir). Partimos del supuesto de que las diferencias entre el valor verdadero
del parámetro (población) y su valor hipotético (muestra), en realidad no son tales sino debidas
al azar, es decir, no hay diferencia o dicho de otra forma la diferencia es nula.
La hipótesis alternativa (H1) es lo que yo quiero demostrar (confirmar o desmentir; es como lo
‘contrario’ de la hipótesis nula).
Al contrastar una con otra es el CONTRASTE DE HIPÓTESIS (nos vamos a centrar en el de una
media).
2
Estadística y métodos de investigación en fisioterapia
Loli Martínez
TIPOS DE CONTRASTE (podemos plantear 3 tipos, y el que vayamos a plantear depende de lo que
nos digan en el enunciado):
Bilateral: la hipótesis nula se formula en término de igualdad y la hipótesis
alternativa en términos de distinta.
H0 = µ
H1 ≠ µ
Hay una región de aceptación (nuestro estadístico está dentro de lo normal, dentro
de lo que es nuestra hipótesis nula), que seria el área central determinada por los
valores críticos (estos se determinan previamente por el nivel de significación). La
región de aceptación es de un 95%.
Hay dos regiones de rechazo (las colas, ya que es bilateral) que se determinan por
los valores críticos. En este caso tenemos pocas probabilidades de encontrar la
hipótesis alternativa, es decir, de encontrar el estadístico de contraste (lo que yo
estoy comprobando es relevante/significativo). La región de rechazo es del 5% (2,5%
por lado).
3
Estadística y métodos de investigación en fisioterapia
Loli Martínez
POR EJEMPLO: la edad de los jugadores de baloncestos en España la edad media (µ) de
los jugadores es de 31 y la desviación típica (σ) es de 10. Me surge la duda de que eso sea
verdad, pero lo que yo pienso en mi experiencia es que la edad es mayor. Por tanto, me
puedo plantear un contraste unilateral derecho (estaría más por la zona derecha en el
modelo de distribución normal).
Hipótesis nula: la media va a ser igual o menor a 31 (parámetro de referencia)→ H0 ≤ µ (31)
Hipótesis alternativa (lo que yo quiero comprobar/demostrar): que la edad media sea mayor de
31, esto seria lo PLAUSIBLE (lo esperable) si rechazamos la hipótesis nula → H1 > µ (31)
4
Estadística y métodos de investigación en fisioterapia
Loli Martínez
σ
SD () =
√n
Podemos hallar la proporción de 38 dentro de nuestra distribución, la podemos comprobar
con nuestro estadístico de contraste, que va a ser la diferencia entre los resultados
muestrales y el valor del parámetro poblacional.
5
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Lo que acabamos de hacer es ponderar los indicios y ahora vamos a tomar la decisión.
1.1.2.3. TOMA LA DECISIÓN DE RECHAZAR O NO LA H0
Una vez hallado el estadístico de contraste lo vamos a emplear para decidir si debemos
aceptar o rechazar la H 0. ¿Que probabilidad hay de que el estadístico de contraste haya
ocurrido siendo verdadera la afirmación?
Para ello también tenemos que saber: el nivel de significación (si decimos un nivel de
significación del 10 % es porque estamos cogiendo un intervalo del 90% por tanto lo valores
críticos van a variar), los valores críticos si no conocemos la probabilidad y la región critica.
La Opc1 y la Opc3 es lo mismo pero a veces lo vamos a ver expresado como p<0,05 (Opc 1) o nos dan
directamente el P-valor: p=0,00001 (Opc 3). Simplemente son diferentes formas de verlo.
La zona central entre los valores críticos ( entre -1,9605 y 1,9605) es la ZONA DE
ACEPTACIÓN DE LA HIPÓTESIS NULA (H0).
Los extremos (de -1,9605 a menos infinito y de 1,9605 a más infinito ) son la REGIÓN
DE RECHAZO para un nivel de significación del 5% o 0,05 (esto puede variar en
función del intervalo de confianza y del nivel de significación). ( ZONA NARANJA DE
LA GRÁFICA)
6
Estadística y métodos de investigación en fisioterapia
Loli Martínez
7
Estadística y métodos de investigación en fisioterapia
Loli Martínez
8
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Si P-valor < 0,01 la significación va a ser elevada, por lo que rechazamos la hipótesis nula.
Si P-Valor va de 0,05 a 0,01 ya tenemos significación estadística ( es significativo, no es una gran
significación pero lo es).
Si P-Valor está próximo a 0,05 (es decir 0,49-0,51) tenemos cierta significación estadística y
queda en juicio del lector si lo considera importante (significativo) o no, porque estamos
muy cerca.
Si P-Valor > 0,05 NO es significativo y rechazamos la hipótesis alternativa.
Si voy a usar un nivel de significación del 10%, para decir que es significativo tendríamos que
coger un P-valor de 0,1, por lo que elevamos el nivel de significación.
9
Estadística y métodos de investigación en fisioterapia
Loli Martínez
4,25
En nuestro ejemplo seria: SE ( X̄ )= =0,886
√ 23
31−30
En nuestro ejemplo sería: t= = 1,13
0,886
Si yo quiero saber si la media es mayor de 30 , utilizo 31 (también podríamos usar 32 o 33,
etc); aplicaos el error típico de la media SE (x̄ ) = 0,886, que lo hemos calculado antes. Nos da
una valor t, una posición de 1,13 (el 1,13 sale de estandarizar y puesto que la Tabla T nos da
posiciones tenemos que buscar entre que valores intermedios está).
10
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Lo primero es determinar en que fila nos vamos a mover: Si el tamaño de la muestra es 23,
los grados de libertad son 22 (n-1), por tanto nos tenemos que fijar en la fila 22 (lo de arriba:
0,25 ; 0,1 ; 0,05 ; 0,025 etc son probabilidades, en este caso probabilidades unilaterales) :
El valor de 1,13 está entre 0,25 y 0,1 → 0,25 > p −value > 0,10
Para obtener de forma manual el p-valor para la Tabla T no podemos decirlo exactamente
porque no tenemos una probabilidad especifica para cada valor, sino que tenemos que decir
que va a oscilar entre esos valores, en este caso va a ser menor de 0,25 y mayor de 0,10 (el
1,13 estaría entre 0,6858 y 1,3212).
INTERPRETACIÓN: (seria la misma) El valor P hallado indica que si la verdadera media fuera
de 30, entonces la probabilidad de haber encontrado la media de 31 o superiores va a estar
entre 0,15 y 0,10.
11
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Siguiendo el ejemplo: IC90% el 1,71 seria el valor critico y estando en un contraste unilateral
el 1,13 estaría dentro de la región de aceptación.
Como esta dentro de la región de aceptación no
rechazamos la hipótesis nula, sino que la aceptamos
(esto es otra forma de verlo, teniendo en cuenta el
valor critico, que en este caso de la tabla T es lo
más valido y sencillo para aceptar o rechazar).
1,13 < 1,71
Se puede coger tanto el 170 como el 185 por ejemplo, porque estamos viendo si es
diferente a 174. La resta está en valor absoluto para que no salga negativo.
Si el valor que estamos probando es inferior a la media va a estar por la parte inferior en el
contraste bilateral, puesto que la distribución es simétrica, lo que nos salga por arriba nos va
a salir por abajo igual.
Sustituimos y calculamos nuestra desviación típica, que nos la dan (Ѕ).
En el pwp la profesora tiene que la raíz cuadrada se hace con n-1, pero NO HAY QUE RESTAR, se coge
solo n= 25
12
Estadística y métodos de investigación en fisioterapia
Loli Martínez
EJERCICIO 2:
Se desea contrastar con un nivel de significación del 5% la hipótesis de que la talla media de
los hombres de 18 o más años de un país es igual o mayor a 175. Suponiendo que la
desviación típica de las tallas en la población vale 4, contraste dicha hipótesis frente a la
alternativa de que es menor, con una muestra de n=15 hombres seleccionados al azar,
cuyas alturas son las del apartado anterior:
Va a ser un intervalo de confianza del 95%. Vamos a emplear el Modelo Z (conocemos los
parámetros de la población). Tenemos un contraste unilateral izquierdo.
Lo 1º hay que plantear es el contraste de hipótesis:
- H0: µ ≥ 175 cm (la media de altura es ≥ 175 cm)
- H1: µ < 175 cm (lo que yo quiero demostrar, que es menor a 175cm)
Nivel de significación del 5% → Valor crítico -1,64 (lo tenemos que saber directamente)
13
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Una pista para saber si uso un modelo u otro es fijarnos en la desviación típica de la
población o de la muestra.
14
Estadística y métodos de investigación en fisioterapia
Loli Martínez
- Para 1 solo grupo → MUESTRAS RELACIONADAS (lo que hemos echo con las Pruebas T de
Student). Por ejemplo: cuando tenemos una muestra y dos medias al medir dos veces en el
tiempo (por ejemplo: una al inicio del estudio y otra al final), y queremos ver si un
tratamiento tiene efecto y si es relevante. Con el ejemplo de la artritis reumatoide, en este
caso cada sujeto va a portar 2 medias, una al inicio y otra al final (los datos de la 2º medida
están condicionados).
15
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Dicotómica es que tenemos 2 grupos y para comparar medias es con 2 grupos, cuando
tenemos 3 grupos ya sería otro tipo de análisis (seria una ANOVA, lo veremos en el tema 6).
TIPOS DE CONTRASTE:
Contraste bilateral: En la hipótesis nula la diferencia de medias no existe (no hay
diferencias entre uno y otro grupo) y en la hipótesis alternativa si existen diferencias
entre ellas.
H0: µ1 - µ2 = 0
H1: µ1 - µ2 ≠ 0
16
Estadística y métodos de investigación en fisioterapia
Loli Martínez
H0: µ1 - µ2 ≥ 0
H1: µ1 - µ2 < 0
Ahora tenemos una distribución y dos grupos: al que queramos lo llamamos intervención y
al otro control o grupo nuevo / grupo habitual, etc.
17
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Si no hay diferencia entre los 2 grupos da igual que se utilice un tratamiento u otro. Si hay
diferencia entre los 2 grupos y la diferencia es significativa vamos a tener un cambio
significativo en un tratamiento (en el ejemplo anterior: el uso de la férula o la cirugía
tendrán diferencias por el hecho de que se utilice uno u otro tratamiento y va a condicionar
de manera significativa que el paciente tenga una mejor o peor evolución).
2º SE ESPECIFICA EL MODELO DE DM PARA TESTAR LA H0
Ya hemos fijado las hipótesis. Ahora tenemos que determinar el modelo que vamos a
utilizar → el Modelo T (no conocemos datos de la población, tenemos dos muestras, etc).
En el contraste/comparación de 2 medias siempre vamos a usar el Modelo T porque
tenemos 2 muestras (y no vamos a conocer si viene de una distribución normal o no, la
mayoría de veces), y vamos a tener parámetros de la población de origen.
Tenemos el grupo experimental y el control con sus 3 datos: con su media (x̄ ), su tamaño
2
muestral (n) y la varianza ( s1 porque está al cuadrado; la desviación típica seria la raíz
cuadrada de ese valor).
El estadístico de contraste va a ser la diferencia de medias (la fórmula ahora se complica un
poco más porque vamos a tener 2 grupos).
SD (x̄ ): error de muestreo → si tuviéramos parámetros de la población
SE (x̄ ): error típico de la media (nos quedamos solo con este)
√
2 2
Sc Sc
SE (1 - 2)= +
n1 n 2
2
El valor de la varianza del contraste ( S c) lo vamos a calcular a partir de la siguiente fórmula:
2 2
2
(n 1 −1 ) S 1 +( n2 −1 ) S 2 (n 1 −1 ) S 21 +( n2 −1 ) S 22
S =
c =
( n1 −1 ) +( n2 −1 ) n1 +n2 − 2
Tenemos que tener en cuenta a la hora de calcular los grados de libertad cuando utilicemos
el valor de t que tenemos 2n: n1 + n2 - 2 (se suman los 2 tamaños muestrales y se le resta 2)
En este caso, los gl seria: 10+10-2 = 18
( 10 −1 × 13,81 )+ ( 10 − 1 ×15,58 )
S2c = = 14,69
10+10 −2
SE (1 - 2)=
10
+
√
14,69 14,69
10
= 1,714
18
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Nuestro “parámetro” de referencia (no hay que tomarlo como parámentro, simplemente es
para que nos entendamos) va a ser 0, ya que yo quiero ver si hay diferencias o no hay
diferencias.
( x¯0 − x̄ 1 ) − 0
t=
SE ( x̄ 0 − x̄ 1 )
10,11−5,45
En nuestro ejemplo: t= =2,718 (estadístico de contraste de 2,718)
1,714
Si usamos un intervalo de confianza del 95% unilateral → Hay que fijarse en la fila de los
grados de libertad y el intervalo (mirando abajo de la tabla) entre que P-valores se
encuentra.
Sabiendo que nuestros gl=18, nos vamos a la fila del 18 y al fijar un IC95% unilateral
(miramos 0,05) tenemos un valor crítico de 1,734.
Por lo tanto podemos utilizar el valor critico para determinar si algo es significativo o no, o
bien podemos buscar el nivel de significación, el p-valor (entre que valores puede estar).
19
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Estos niveles de p-valor van a variar si variamos el nivel de la significación, pero por norma
utilizamos un nivel de significación del 5%.
Este tipo de pruebas son PRUEBAS PARAMÉTRICAS (las variables tienen que cumplir una
serie de condiciones):
Que la muestra sea aleatoria
Que haya mas de 30 sujetos en cada uno de los grupos, si son menos de 30 por
grupo, que por lo menos se aproxime a la distribución normal (lo podemos ver con
prueba de normalidad de Shapiro-Wilk).
Que las muestras sean independientes (cada sujeto da datos a una media).
Comprobar si las varianzas son homogéneas o no (lo podemos saber con prueba de
Levene para la igualdad de varianzas).
Por tanto para poder aplicar las pruebas T Student (el método para resolver el contraste de
dos medias sobre muestras independiente) dependerá de:
- La variable cuantitativa sigue una distribución normal → NORMALIDAD.
- Las varianzas poblacionales son iguales o diferentes → HOMOCEDASTICIDAD
20
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Planteamiento de la normalidad:
H0: la muestra proviene de una distribución normal. La variable fuerza sigue la distribución
normal, estamos aceptando la hipótesis nula.
H1: la muestra no proviene de una distribución normal
21
Estadística y métodos de investigación en fisioterapia
Loli Martínez
22
Estadística y métodos de investigación en fisioterapia
Loli Martínez
( x¯0 − x̄ 1 ) − 0 10,11−5,45
t= = = 2,718
SE ( x̄ 0 − x̄ 1 ) 1,714
5º EXTRAEMOS CONCLUSIONES:
Con todo esto podemos rechazamos la hipótesis nula porque nuestro estadístico de
contraste esta más allá de 2,10 (nuestro valor critico). Por tanto, podemos afirmar que al
tener pruebas suficientes con un un nivel de confianza del 95%, que existen diferencias en la
aplicación de una órtesis nueva y una tradicional sobre la musculatura extensora del codo
en pacientes con patología de codo de tenis (no decimos de que sea en términos de
superioridad o de inferioridad, porque el contraste inicial es bilateral, solo podemos decir
que existen diferencias).
23
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Observando los datos que nos dan podemos intuir que las diferencias van a ser hacia el
grupo experimental, es decir, los resultados son mejores que los del grupo control (); y que
las diferencias son significativas entre uno y otro grupo. Puesto que es bilateral, podemos
encontrar diferencias por arriba o por abajo, pero dado que los resultados son mejores en el
experimental la aplicación de la órtesis nueva va a proporcionar resultados más relevantes,
mejores, que los del grupo control que era la órtesis tradicional.
24
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Ejemplos:
1. Supongamos que queremos evaluar el efecto de una dieta para reducir el colesterol.
Administramos la dieta a cada uno de los individuos de una muestra y al cabo de un tiempo
volvemos a medir su nivel de colesterol. ¿Habrá variado dicho nivel de colesterol de modo
significativo al cabo de ese tiempo?
2.Supongamos que queremos comparar dos métodos de medida de la tiroxina libre.
Tomamos una muestra de 10 pacientes y se les mide la tiroxina con los dos métodos.
Queremos saber si los dos métodos nos darán los mismo resultados, o por el contrario
ofrecerán resultados significativamente distintos.
25
Estadística y métodos de investigación en fisioterapia
Loli Martínez
26
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Quiero ver los efectos de la dieta sobre el colesterol y tenemos una muestra de 10 sujetos.
Tenemos una medida del colesterol (M) antes de la dieta (preintervencion) y después de la
dieta (postintervencion). DT es la desviación típica y p* es el p-valor. Con el p-valor podemos
decir si la dieta tiene efecto sobre el colesterol.
Su diferencia de medias seria: pre-post (si yo digo por ejemplo que la dieta va a tener un
efecto que va a reducir el colesterol, si yo hago la post – la pre → 210-241 = - 31, por lo
tanto la dieta tiene un efecto negativo, es decir, la dieta reduce el colesterol).
Da igual como lo pongamos, pero tiene que estar bien redactado y expresado a la hora de
redactar los resultados, el p-valor va a ser similar sea pre-post o post-pre.
27
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Tenemos todas las medias antes y todas la medidas después para cada uno de los sujetos
1º PLANTEAMOS EL CONTRASTE DE HIPÓTESIS (Planteamiento del problema):
Las mediciones se realizan sobre las mismas personas y queremos ver si existen diferencias
entre el colesterol antes del tratamiento y después del mismo (esto es lo que nos interesa).
Encontrar evidencia a favor de que el tratamiento surgen el efecto deseado (baja el
colesterol) es lo mismo que encontrar evidencia estadísticamente significativa en el
contraste unilateral:
Hipótesis nula: no hay diferencia de medias, es = 0, es decir, no existen diferencias.
H0 : µpre = µpost
Hipótesis alternativa: la diferencia de medias va a ser mayor, menor o diferente. La medida
pre va a ser mayor que la post, es decir, que antes de la dieta las personas tienen más colesterol que
después (contraste unilateral).
H1 : µpre > µpost
3º CONCLUSIÓN:
Existen diferencias significativas, es decir, el colesterol ha bajado tras el tratamiento.
Podemos afirmar que el tratamiento es efectivo y reduce el colesterol de manera
significativa.
28
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Bloque 4. Tema 5.
Contraste de dos proporciones.
1. Introducción.
Recordemos que con proporciones siempre vamos a emplear el modelo Z, el T
únicamente se empleaba para medias. Nuestro principal objetivo en un contraste de
hipótesis va a residir en comprobar si el estadístico de nuestra muestra (media o
proporción) es igual o diferente al parámetro de referencia que puede ser o no la
población, no tiene por qué ser necesariamente esta.
Es importante recordar que lo que nosotros queremos comprobar, lo que ya sabemos
desde un primer momento, nos lo va a dar la hipótesis nula H0. A partir de esta, nosotros
demostramos si se cumple o no la hipótesis alternativa (H1) que planteemos.
1.1. Pasos a seguir en un contraste de hipótesis.
Estos van a seguir siendo los mismos que llevamos viendo durante estos últimos temas.
Sea un contraste de una o dos proporciones no influye en los pasos. Estos son:
Se van a desarrollar cada uno en los siguientes apartados para una proporción.
2. Fijar la H0 y la H1.
Esto realmente es un resumencillo de todo lo visto hasta ahora de las hipótesis
¿Qué es una proporción?: Es un valor central o característica determinada que presenta
un grupo de sujetos en función del resto de la población. Nos permiten estudiar una
característica de interés dentro de una población o muestra.
H0: Valor de referencia, lo que nosotros ya sabemos.
H1: Lo que nosotros queremos comprobar y que será cierto si rechazamos H0.
Recordemos que los contrastes pueden ser unilateral derecho (>), unilateral izquierdo
(<) o bilateral (≠).
1
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Sé que esto ya lo hemos dado antes, pero la profesora ha vuelto a decir que es muy importante
y que cae si o si en el examen. Ahora se van a explicar los contrastes que vimos en el tema 3 de
este bloque, he de decir que en el otro tema está mejor explicado porque la profesora aquí no se
paró mucho ya que la única diferencia es que aquí hablamos de proporción.
2
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
3
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
4
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
5
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Ejemplo:
6
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Tenemos una muestra de 80 alumnos de los cuales 30 fuman ((30/80) x100= 37,5%) y
50 no ((50/80) x100= 62,5%). Para hallar cuantos fumadores y no fumadores son chicos
o chicas observamos la siguiente tabla cruzada donde tenemos en las columnas la
variable sexo y en las filas la variable fumador:
De esta forma podemos observar que, de los 20 chicos, 5 no fuman y 15 sí. Mientras
que, de las 60 chicas, 45 no fuman y 15 sí. Así podemos saber que el 75% de los chicos
fuman y un25% de las chicas, por lo que a simple vista podemos pensar que los chicos
fuman más que las chicas.
Por tanto, nuestro objetivo va a ser determinar si realmente los chicos fuman más que
las chicas.
Para ello, podemos ver que existen tres tipos de contrastes al igual que pasaba con las
medias y el planteamiento es igual: unilateral derecho (>), unilateral izquierdo (<) o
bilateral (≠).
Para este ejemplo vamos a coger un contraste unilateral derecho ya que nuestra H0:
los chicos fuman más que las chicas. H1: las chicas fuman más que los chicos.
En primer lugar, vamos a calcular las proporciones de fumadores en función del sexo:
7
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
8
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
En esta tabla cruzada nos faltaría añadir la diferencia de proporciones entre un grupo
y otro.
Tenemos que tener en cuenta que esta vez estamos comparando grupos.
Esto se lo ha saltado, pero estaba en las diapositivas:
El resultado del contraste (regla de decisión) vendrá dado por:
9
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Bloque 4.
Tema 6: ANÁLISIS DE LA VARIANZA
En el SPSS lo vamos a encontrar como: ANOVA de un factor → se usa cuando las medias de
una variable cuantitativa son diferentes o iguales en relación a una variable cualitativa.
1
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Llamamos factor o variable independiente a la variable cualitativa que define los grupos
que deseamos comparar y variable dependiente a la variable cuantitativa (en función del
grupo en el que esté el paciente va a tener una media u otra o incluso igual).
OBJETIVO PRINCIPAL:
Determinar si las medias son iguales o difieren, es decir, si existen diferencias significativas
al comparar las medias de la variable cuantitativa entre los diferentes grupos de la variable
cualitativa, o si por el contrario, puede establecerse que sus medias no difieren (son
prácticamente iguales, o sus diferencias no son significativas).
La intervención va a ser efectiva cuando las medias difieren entre grupos, eso quiere decir
que existe una relación entre las variables. Por ejemplo, entre la fuerza del bíceps y el tipo
de ejercicio que haga el paciente; si la media fuera igual en todos los grupos da igual que el
paciente haga un ejercicio excéntrico, que concéntrico que isométrico que va a tener la
misma fuerza de bíceps. Por lo tanto, algo va a ser efectivo/relevante cuando las medias
sean diferentes entre los grupos.
La complejidad está un poco más en esto, que tenemos que ver las diferencias en general y
las diferencias entre un grupo y otro.
2
Estadística y métodos de investigación en fisioterapia
Loli Martínez
3
Estadística y métodos de investigación en fisioterapia
Loli Martínez
En nuestro ejemplo: A la hora de tener en cuenta si van a haber diferencias de medias entre
los grupos, es decir, si va a variar la fuerza del bíceps braquial en relación a los diferentes
grupos, tenemos que ver la variabilidad total, ya que tenemos que tener en cuenta la
intragrupo con la intergrupo.
Cuando comparamos buscamos que los grupos sean iguales para que sean comparables, por
ello lo que esperamos/queremos es tener variabilidad intragrupo (que los grupos sean
homogéneos dentro de ellos, es decir,que no tengan muchos valores atípicos). Pero si
queremos ver si una intervención es efectiva o no buscamos que los grupos sean diferentes
porque nuestro objetivo para ver si la intervención es efectiva o no es que la variabilidad
intergrupos sea diferente.
Por tanto lo ideal para ver si una intervención es efectiva es que la variabilidad intragrupos
sea pequeña y la variabilidad intergrupos sea grande (eso va a significar que siguen
diferencias entre los grupos, es decir, el echo de que tu hagas un ejercicio u otro si va a estar
relacionado con que tenga más o menos fuerza).
** Si la variabilidad intragrupos es muy grande, al ser tan diferentes no debería ser un buen
estudio, por tanto, tenemos que controlar eso con una muestra aleatoria (va a ser una
condición de aplicación) (además si tenemos valores muy parecidos, no vamos a tener esa
variabilidad que buscamos; SIEMPRE HAY QUE TENER CIERTA VARIABILIDAD PARA PODER
COMPARAR, PORQUE SI LOS VALORES SON MUY IGUALES A LA MEDIA NO VAMOS A
OBTENER NADA).**
Seguimos los pasos del contraste de hipótesis (como hemos echo anteriormente):
1º. Fijamos la hipótesis nula y la alternativa, pero en este caso vamos a tener varios grupos.
3º. Fijamos nuestra hipótesis y calculamos el estadístico de contraste a partir de los datos
6º. Comprender que la conclusión alcanzada podría ser errónea por puro azar
4
Estadística y métodos de investigación en fisioterapia
Loli Martínez
El ANOVA es una prueba paramétrica y cuando es paramétrica los supuestos que tiene que
cumplir son que nuestra variable cuantitativa:
- que siga la normalidad,
- que sea independiente (que la muestra se obtiene de forma aleatoria) y
- que siga la homocedasticidad (que los grupos se parezcan, que la varianza entre los grupos
sean parecidos).
1.3.1 NORMALIDAD
Tenemos que ver que la variable cuantitativa en todos los grupos/poblaciones siga la
normalidad (en el ejemplo anterior la variable cuantitativa es la fuerza del bíceps y tenemos
que ver que esta siga la normalidad dentro de cada uno de los grupos).
Los métodos de comprobación pueden ser:
Los gráficos de probabilidad normal: los Q-Q plot (eran
normales cuando seguían la recta central, aunque los
extremos pueden variar un poco, el 95% central debe
aproximarse a la recta).
5
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Planteamiento de la normalidad:
H0: La muestra NO proviene de una distribución normal
H1: La muestra proviene de una distribución normal
1.3.2 INDEPENDENCIA
1.3.3 HOMOCEDASTICIDAD
6
Estadística y métodos de investigación en fisioterapia
Loli Martínez
2 Estadístico de contraste
Ya hemos comprobado nuestro supuesto. Ahora vamos a ver nuestro estadístico → como
interpretar nuestro ANOVA.
En este caso el estadístico que se emplea es: F de Snedecor (es el estadístico que veíamos
con la comparación de medias y de proporciones pero aquí se llama así). Con este
estadístico de contraste vemos si existe o no diferencia de medias.
Si las medias entre los grupos varían mucho y la media dentro de un grupo varía poco, es
decir, los grupos son heterogéneos entre ellos y similares internamente, el valor de F será
más alto, y por tanto, las variables estarán relacionadas. Lo que queremos es que la del
denominador (intragrupo) sea pequeño y la del numerador (intergrupo) sea grande.
¡¡NO HACE FALTA SABER CALCULAR LA F DE SNEDECOR SOLO TENEMOS QUE SABER
INTERPRETARLO!!
Por lo tanto lo que nos interesa y queremos es que el valor de F sea mayor y lejano de 1:
cuanto mayor F de Snedecor (dependerá de la variabilidad que tengamos), más
relacionadas están las variables, lo que significa que las medias de la variable dependiente
difieren o varían mucho entre los grupos de la variable independiente.
Esto lo vamos a confirmar con el p-valor (nos va a decir si es relevante o no). Porque
podemos tener: una F de Snedecor de 2,5 y pensar que eso esta cercano a 1, pero si el
p-valor es menor a 0,05 SÍ es relevante; o una F de Snedecor de 1,15 (a lo mejor es que las
7
Estadística y métodos de investigación en fisioterapia
Loli Martínez
medias dentro de mi grupo son muy pequeñas o estoy midiendo una variable que son
números pequeños, mientras que nos digan que el p-valor es relevante es porque van a
existir diferencias entre los grupos (no dentro del grupo)).
Por tanto, esto nos va a confirmar si existen o no diferencia de medias entre los grupos.
En un software estadístico y siguiendo un nivel de confianza del 95% (el más utilizado
habitualmente), la regla de decisión vendrá dada por:
- Si p > 0,05 No existen diferencias significativas entre la medias. No podemos afirmar
que existan diferencias en la media de las variable (y por tanto en la variable) en cada uno
de los grupos.
- Si p ≤ 0,05 Existen diferencias significativas entre las medias. La media y por tanto los
valores de la variable son distintos al menos en un grupo.
El software estadístico: SPSS, Matlab , etc (hay muchos), va a calcular el P-valor (al igual que
la F de Snedecor).
Nuestro objetivo es conocer si el método de enseñanza influye en los resultados del examen
(es decir, ¿existen diferencias en los resultados del examen para cada uno de los grupos( en
función del método de enseñanza empleado?).
8
Estadística y métodos de investigación en fisioterapia
Loli Martínez
3º: Regla de decisión: el p-Valor es de 0,019 (≤0,05), por lo que esto nos confirma que SÍ
existen diferencias significativas entre las medias de los 3 grupos, por tanto rechazamos la
hipótesis nula de que las medias son iguales, y aceptamos la alternativa.
9
Estadística y métodos de investigación en fisioterapia
Loli Martínez
Nosotros siempre que hacemos un estudio realizamos una descripción de como son los
sujetos y tenemos la media (M) y la desviación típica (DT). Nosotros sin ver el intervalo de
confianza y el P-Valor, al ver las medias ya nos podemos hacer una idea de que no son
iguales, es decir, nos podemos imaginar con el estadístico descriptivo de como se va a
comportar nuestra variable dependiente (de la que varia), por lo tanto estamos
confirmando lo que a simple vista parece que es verdad, que existen diferencias en el
método de enseñanza en relación a los resultados que se han visto.
4º: Conclusión: Podemos asegurar que existen diferencias en las calificaciones para cada
uno de los grupos con un nivel de confianza del 95%.
El método más utilizado consiste en realizar todas las comparaciones por parejas. El
contraste que debemos realizar, para cada par de grupos, será:
H0: µi = µj
H1: µi ≠ µj
Existen varios tipos de Post Hoc, pero el que más se utiliza en el SPSS son, dependiendo de si
se cumplen o no una serie de supuestos:
- Tukey o Duncan si tenemos homogeneidad de varianzas, la variabilidad intragrupo tiene
que ser mayor de 0,05 para poder aplicar los dos test. Son dos tipos de Test.
- Games-Howeel y Dunnet cuando los grupos son diferentes, las varianzas son desiguales.
10
Estadística y métodos de investigación en fisioterapia
Loli Martínez
En la comparación Post Hoc, en la tabla vemos que el p-valor es el general, pero yo quiero
saber a que se debe ese p-valor, es decir, que grupo difiere con respecto a otro. Los dos
asteriscos (**) nos dice que ‘las diferencias significativas se encuentran entre la enseñanza
presencial y la autodidacta’. Es decir que cuando se hace las comparaciones entre los grupos
los que son diferentes realmente son el presencial con respecto a la autodidacta y no el
presencial con respecto internet, ni internet con respecto al autodidacta.
Lo que hace que tengamos mejor o peor resultado es que sea presencial o autodidacta, el
internet no es relevante con respecto a este tipo de métodos (autodidacta o presencial).
Simplemente nos dice cual es el significativo con respecto al otro y excluye a los que no
son significativos.
Podemos concluir (pero esto es ir un pasito más adelante) que la autodidacta vamos
obtener peores resultados que con la presencial porque estamos viendo la media.
RECUERDO: Con Post Hoc vemos que grupos son diferentes de manera específica (que
grupo con que grupo), mientras que ANOVA es de forma global (entre los 3 grupos).
11
Estadística y métodos de investigación en fisioterapia
Loli Martínez
En este ejemplo vemos: N- tamaño de la muestra; Media de tiempo que se tarda en llegar
de un lugar a otro; la Desviación típica de ese grupo; y el Intervalo de confianza del 95%.
El IC95% de metro se encuentra entre 36,03 y 43,86, el de bus entre 28,50 y 43,85, etc.
4º. Conclusión: puesto que en el cuadro de resultados del ANOVA, el valor del estadístico
de prueba: la F de Snedecor = 6,450 (es distinta de 1), y tenemos un P-Valor < 0,05,
podemos afirmar con un 95% de confianza que el tipo de transporte si que influye en el
tiempo que se tarda en llegar de Murcia a Molina.
12
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
2. Proceso de investigación.
Lo que es un proceso de investigación lo vimos al principio del todo, en el tema 1 del
bloque 1. Pongo aquí de nuevo en que se basa para recordar: La investigación científica
es un proceso dirigido a la adquisición de conocimiento y que usa el método científico.
Esta está constituida por las siguientes fases:
ELABORACIÓN
OBSERVACIÓN PREGUNTA HIPÓTESIS EXPERIMENTO RESULTADOS DE MODELOS
Y TEORIAS
Una vez que ya sabemos lo que es este proceso, lo llevamos a cabo mediante una
planificación del proyecto de investigación (esto lo hemos hecho con el trabajo grupal
que nos ha mandado). Esta parte es muy importante ya que permite a los fisioterapeutas
ir actualizándose día a día a cerca de las técnicas más empleadas; nosotros en la carrea
estamos aprendiendo técnicas que, en un futuro cuando ejerzamos, puede que ya no se
empleen y tengamos que investigar y actualizarnos para que los pacientes vuelvan a
nuestra clínica. Por tanto, es muy importante la parte de investigación.
Posteriormente, se ejecutará, recogeremos nuestros datos y los analizaremos para
poder obtener una conclusión. Una vez que tenemos esos datos, los difundimos al resto
para así poder generar nuevo conocimiento. La gran pregunta aquí es… ¿Cómo
difundimos este conocimiento?
1
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
La presentación de la información.
Como la difundamos (el medio de entrega).
Recepción de la información por la comunidad científica.
2
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
4. Publicaciones científicas.
Son el punto de partida de cualquier investigación, pues aportan el estado del
conocimiento en un tema determinado y son el canal por el que se dará a conocer la
investigación concluida. Facilitan la difusión de nuevo conocimiento que será la base
para futuras investigaciones que harán posible el crecimiento de la ciencia y, en última
instancia, el progreso científico.
3
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
4
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
5
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
información, es más económica, permite acceder más rápido a lo que nos interesa… Sin
embargo, también presentan una serie de problemas y es que:
A veces se desconoce el origen y veracidad de la información.
Profusión de información dispersa en la red.
El usuario debe emplear una gran cantidad de tiempo aprendiendo las
particularidades de cada portal.
La edición electrónica debe someterse a controles de calidad rigurosos, similares o más
severos a los de la edición impresa. Es decir, debe pasar también por ese comité de
expertos y superar ese ‘filtro’.
6
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
7
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
para valorar las guías de práctica clínica. En función del tipo de estudio que realicemos
usaremos una u otra guía de recomendación.
Parte de la guía CONSORT (la vimos en fuentes documentales) No hay que saberlo, lo ha
puesto de ejemplo.
Clara definición de los objetivos. Si no conozco cual es el objetivo del estudio no voy
a conseguir obtener unos resultados. Ejemplo:
9
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Asignación aleatoria de los grupos para que no aparezca riesgo de sesgo. Ejemplo:
Seguimiento completo, es decir, que no haya una gran pérdida de pacientes ya que,
si no, no vamos a poder extrapolar. Diagrama de flujo de la guía de recomendación
consort para un ECA (tiene que aparecer si o si):
10
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Consideraciones sobre errores y sesgos, así como maneras en las que el estudio
podría haberse mejorado.
Conclusión acorde con los resultados del análisis, que sea acorde a los objetivos que
hemos planteado desde un principio en el estudio.
2.2. Valoración de la validez externa.
Se basa en la capacidad para poder extrapolar los resultados a otras poblaciones. Es
decir, si yo estoy trabajando con una población diana de pacientes con EPOC, que pueda
aplicar a todos los pacientes con EPOC del mundo las conclusiones que yo obtenga.
Si los resultados del estudio pueden ser generalizados a otras poblaciones de personas,
ambientes, resultados, tiempos y variaciones de tratamiento, entonces se considera que
el estudio tiene buena validez externa.
Algo muy importante es que para que exista validad externa debe haber interna, si no,
es imposible que esta se de.
Existen ciertos factores que pueden amenazar la validez externa, como la forma en que
son seleccionados los sujetos. Si estos no son seleccionados al azar, entonces los
resultados no pueden ser generalizados, ya que los resultados sólo se referirán a
personas de un grupo selecto (estarían sesgados ya que no serían homogéneos).
11
Estadística y métodos de investigación en Fisioterapia
Cristina Torres Pérez
Dentro del grupo experimental, podemos ver que dentro del grupo si existe diferencia
estadísticamente significativa (<0,05) entre el dolor pre y el dolor post por lo que si nos
valdría la técnica. Sin embargo, dentro del grupo control no existe diferencia
estadísticamente significativa ya que el valor de P= 0,27 (>0,05) y, por ello, no podríamos
aplicar la técnica. Si ahora nos basamos entre ambos grupos, tampoco existe una
diferencia estadísticamente significativa ya que es 0,96, muy superior a 0,05. En
conclusión, podríamos decir que no usamos la prueba ya que no hay diferencias
estadísticamente significativas al comparar control y experimental.
Precisión de los resultados (considerar el IC 95%).
Lo más importante es saber interpretar los resultados.
12