Untitled

ESTADISTICA Y METODOS DE INVESTIGACION EN FISIOTERAPIA.
GRADO EN FISIOTERAPIA.
Bloque 1: Introducción a la Estadística e Investigación en Fisioterapia
TEMA 1. El método estadístico.
TEMA 2. Variables estadísticas, datos y medición
TEMA 3. La investigación científica y el método científico
Bloque 2: Estadística descriptiva
TEMA 1. Descripción de datos univariante: tablas y gráficos
TEMA 2. Síntesis de datos univariante
TEMA 3. La posición en la distribución y el modelo Normal
TEMA 4. Descripción y síntesis de datos bivariante
Bloque 3: Planificación de la Investigación
TEMA 1. Elementos básicos del plan de investigación
TEMA 2. Principios metodológicos de los diseños experimentales
TEMA 3. Diseño de un protocolo de estudio
TEMA 4. Principios metodológicos de los diseños no experimentales
Bloque 4: Estadística inferencial uni y bivariante.
TEMA 1. Elementos de la estadística inferencial
TEMA 2. Estimación de parámetros
TEMA 3. Contraste de hipótesis estadísticas. Planteamiento general
TEMA 4. Contraste de dos medias
TEMA 5. Contraste de dos proporciones
TEMA 6. Análisis de la varianza
Bloque 5: Difusión y evaluación del conocimiento
TEMA 1. Difusión del conocimiento científico
TEMA 2. Lectura crítica
PRÁCTICAS
Práctica 1. Descripción y síntesis de datos de una variable.
Práctica 2. Descripción y síntesis de datos de dos variables.
Práctica 3. Pruebas inferenciales: contraste de 2 medias de muestras independientes y

apareadas.
Práctica 4. Pruebas inferenciales: análisis de la varianza y contraste de proporciones
Práctica 5. Gestión de datos e integración.

Estadística y métodos de investigación en fisioterapia
Loli Martínez
Bloque 1
Tema 1. EL MÉTODO ESTADÍSTICO
Tema 3. LA INVESTIGACIÓN CIENTIFICA Y EL MÉTODO CIENTÍFICO
1. ¿Qué es la investigación científica?

La investigación científica es un proceso dirigido a la adquisición de conocimiento y que usa el método
científico.
Tenemos la pirámide invertida, en la base está la

tradición que es lo que siempre se ha utilizado, pero MÉTODO CIENTIFICO
puede resultar que sea lo menos útil (lo que se
empleaba hace 10-20 años, es posible que ya no se RAZONAMIENTO DEDUCTIVO
utilice). Seguidamente tenemos la autoridad, es - RAZONAMIENTO INDUCTIVO
decir, lo que no imponen. Después está el ensayo y
error (aplico una técnica, no me vale y no la vuelvo a ENSAYO Y ERROR
aplicar y uso otra técnica). Se sigue de la inducción y
la deducción, es decir, el racionamiento clínico y por AUTORIDAD
último está el método científico que es la parte más
importante porque es lo que nutre el nuevo
TRADICIÓN
conocimiento (hay estudios de ahora, 2021, que nos
indica que una técnica antigua ya no vale o que no
hay suficiente evidencia científica sobre esta).
Con la investigación científica tenemos que ser críticos y selectivos, es decir, todo lo que podemos leer
no tiene porqué ser válido o puede no ser aplicable a mis pacientes o el estudio puede no estar bien
realizado, por lo que tenemos que identificar la literatura científica de calidad y que puede valer o que
no.
La investigación científica no es el único modo de adquirir conocimiento, por ejemplo, el ensayo y

error es una buena y efectiva forma de adquirir conocimiento.
Debe haber una forma sistemática de investigar, es decir, tiene que haber un procedimiento estándar,
así, si alguien quiere replicar lo que hemos hecho para ver si es efectivo en otro tipo de población.
El procedimiento básico es: la OBSERVACION en base a algo, tras ello nos vamos a plantear una
PREGUNTA de investigación sobre algo que yo quiero conocer. Hay que plantear una HIPÓTESIS en
base a lo que ya sabemos, después vamos a tener que aplicar un EXPERIMENTO. Este nos va a dar
unos RESULTADOS (la comprobamos si es correcta o la rechazamos si no lo es). Si es correcta, en base
a ellos vamos a FORMULAR UNA TEORÍA Y UN MODELO (una conclusión).
ELABORACIÓN
OBSERVACIÓN PREGUNTA HIPÓTESIS EXPERIMENTO RESULTADOS DE MODELOS
Y TEORIAS
Loli Martínez
1.1. PLANTEAMIENTO DEL PROBLEMA.

Francisco Redi (uno de los padres de la microbiología) en el Siglo XVII trató de comprobar si la Teoría
de la Generación Espontánea, era válida o no. Esta teoría planteaba que de la materia inerte se
generaban los seres vivos simples, ya que hasta ese momento se creía que de la nada (materia inerte
como un trozo de carne) se generaba la vida (gusanos), ¿cómo salían de ahí los gusanos?
Francisco se planteó este problema, el observó un fenómeno de que, al dejar la carne al aire, al cabo
de un tiempo aparecen los gusanos y él se plantea ¿cómo surgen los gusanos? → En base a la
observación nos plantamos un problema.
1.2. HIPÓTESIS.
Tras la observación y la pregunta, recogemos los datos y nos planteamos una hipótesis, es decir,
formulamos posibles explicaciones al fenómeno que observamos.
La hipótesis de Francisco Redi fue: La carne en descomposición expuesta al aire atrae seres como
moscas las cuales dejan sus huevos, posteriormente se desarrollan las larvas que generan los gusanos
que ayudan en la descomposición de la carne. → La ‘VERDAD’ se plantea como una hipótesis de
trabajo.
Vemos nuestra hipótesis, es decir, vamos a comprobar si dejando la carne al aire se van a atraer las
moscas y van a llegar los gusanos. Para ellos se plantea un proceso metodológico que sea replicable,
dirigido para confirmar o refutar la veracidad de la hipótesis (para confirmarla y para reforzarla
también, porque puede que no pase lo que creemos.)
1.3. EXPERIMENTACIÓN.
El objetivo de la experimentación es comprobar nuestra hipótesis.
Francisco Redi se planteó 2 experimentos: con 2 envases (de misma materia, tamaño, etc) con un
trozo de carne (de igual peso y tipo de carne) cada uno, es decir, todo estandarizado. Dejamos en
condiciones normales uno de los envases tapado y el otro al aire (sin tapar).
En los experimentos de artículos científicos, los grupos iniciales deben ser homogéneos, por ello
hay que ser crítico al leer un artículo y ver que si los grupos iniciales no son homogéneos los
resultados se pueden influir mucho y no ser los reales.
1.4. ANÁLISIS DE LOS RESULTADOS.

Tras un tiempo podemos comprobar que:
- En el envase tapado la carne se descompone, pero no aparecen gusanos.
- En el envase sin tapar la carne se descompone y sí aparecen gusanos.
Por ello estamos confirmando nuestra hipótesis.

Loli Martínez
1.5. CONCLUSIONES.
En base a los resultados tenemos que extraer una conclusión:
1. La vida no se genera de la nada, no existe la generación espontánea (de la materia inerte no

surge la vida), sino que todo ser vivo procede de otro ser vivo.
2. La presencia de gusanos en la carne descompuesta se debe a las larvas de las moscas.
3. La carne expuesta a la intemperie es más propensa a desarrollar gusanos y la carne cubierta
se va descomponiendo, pero no se llena de nuevas vidas.
En resumen:
El científico deduce a partir de su hipótesis unas consecuencias que son testadas con datos empíricos
y luego induce a partir de los resultados una conclusión con intención de generalizarla.
2. Método científico.
A todos estos pasos anteriores se les conoce como método científico.
Loli Martínez
El método científico es el conjunto de pasos, técnicas y procedimientos que se emplean para formular
y resolver problemas de investigación mediante la prueba o verificación de hipótesis (para confirmarla
o rechazarla).
El método científico tiene que ser:
➢ SISTEMÁTICO: tiene que tener siempre una secuencia según un plan preestablecido.
LA INVESTIGACIÓN SIEMPRE SE TIENE QUE PLANEAR.
➢ EMPÍRICO: se debe basar en la experiencia de nuestros resultados y en lo que ya se conoce

(siempre hay que partir de un conocimiento previo).
➢ RIGUROSO: tenemos que usar los mismos criterios a todas las unidades.
En el ejemplo antes: que la carne sea igual, que pese lo mismo, etc; los envases del mismo
material, de la misma medida, etc).
➢ CONTROLADO: tenemos que controlar todas las variables.

En el ejemplo antes: la temperatura a la que se encontraban los envases, la humedad, el aire,
etc. Hay que controlar en la medida de lo posible todo, para que el estudio sea perfecto.
3. Proceso de investigación científica.

El punto inicial va a ser la PLANIFICACIÓN: que quiero hacer, como lo voy a hacer, etc.
Una vez planificado lo tenemos que EJECUTAR, lo llevamos a cabo. Vamos a recoger los datos (si
tenemos que comprobar si una técnica es mejor que otra, aplicamos la intervención), recogemos los
resultados y los analizamos.
Una vez analizados, lo último que tenemos que hacer es DIFUNDIRLO: lo difundimos en diferentes
medios para aportar nuevo conocimiento.
PLANIFICACIÓN EJECUCIÓN DIFUSIÓN
Formas de difusión de conocimiento:
- Artículos
- Conferencias (mediante comunicaciones orales que es como un breve resumen del articulo
pero un poco más extenso)
- Poster (con las partes claves del artículo)
- Docencia
- Redes sociales
Cristina Torres Pérez
Bloque1. Tema 1.
Las variables estadísticas, datos y medición.
1. Introducción.
La estadística es un método que se puede emplear en múltiples factores, se podría usar
para la realización de meta-análisis, la valoración de la eficiencia y eficacia de una técnica
fisioterapéutica, el reclamo de los pacientes al conocer el porcentaje de efectividad de
la clínica…
2. Variables.
En primer lugar, cuando un paciente acude a una clínica debemos realizar una valoración
para a partir de esos datos, poder saber posteriormente si evoluciona, empeora o cómo
avanza en sí la lesión. Para ello, se comienza con una anamnesis mediante un
interrogatorio al paciente para conocer:
 Nombre  Antecedentes personales  Tipo de dolor y de tope

y familiares articular
 Edad  Nivel de estudio  Amplitud de movimiento
 Situación laboral  Desviación angular  Dolor
 Estado civil  Tipo de marcha  Fuerza
Tener en cuenta que todos estos datos son importantes conocerlos, pero siempre
podemos preguntar más cosas que nos van a ser útiles conocer. Para realizar las
diferentes mediciones podemos emplear varias escalas como la EVA, para el dolor.
Todas estas características es lo que nosotros vamos a llamar VARIABLES, ya que son
características que vamos a observar o medir en un sujeto (persona, animal u objeto), y
que puede tener diferentes modalidades. Se denominan así porque varían de un sujeto
a otro, no son siempre constantes, cada sujeto posee un valor/dato para cada variable.
Ej: Estado civil: soltero, casado, viudo, pareja de hecho, divorciado. La edad no tendría
categoría.
Estas variables se van a ir anotando en una hoja de recogida de datos o de registro, se
pueden realizar tanto a ordenador como en papel, aunque en la actualidad es muy
común lo primero, siempre se recomienda que haya registros a papel ante cualquier
equivocación en el ordenador o por si se pierde la base de datos.
En esta vamos a recoger: 2º Antecedentes personales: cuales son las patologías
más relevantes a tener en cuenta, que haya podido
1º Datos sociodemográficos.
padecer el paciente.
1
3º Medidas de evaluación.
Si nos centramos en el dolor, en primer lugar, es importante registrar la zona donde este
se presenta. Posteriormente se evaluará, para ello, se pueden emplear diferentes
escalas, entre ellas la escala EVA o la escala de dolor de Wong-Baker. Esta última es
muy empleada en pediatría ya que se basa en unas caras de colores que representan los
diferentes sentimientos desde no dolor hasta dolor máximo, va asociada también a una
escala numérica. Es muy importante también evaluar y anotar esta sensación en cada
sesión, para ver cómo se evoluciona la sintomatología.
Además de este, podemos valorar gran cantidad de signos importantes para determinar
la presencia o no de alteración en la función del individuo. Ejemplos de ello son:
4º Diagnóstico de fisioterapia: el fisioterapeuta debe establecer cuál es el diagnóstico

establecido tras haber realizado toda la valoración completa del paciente.
2
3. Datos (Tablas o Matriz de datos).

Los datos son los valores que toman una característica de un caso determinado
(persona, animal u objeto) y que pueden ser registrados en un soporte físico o simbólico
(base de datos). Estos se pueden obtener de dos formas, verbalmente mediante una
entrevista, o bien, numéricamente.
Además, se caracterizan porque todos quedan registrados en una matriz de datos; es
una forma de sistematizar la información recogida para investigar un problema y tratar
de obtener un conocimiento científico a través del método de investigación científica.
Así, los podemos ordenar de manera simple y nos permite establecer un porcentaje en
función de los datos que nosotros planteemos.
Los datos en blanco se denominan ‘missing values’ que son datos perdidos, cuando se
nos olvida meter algún dato en la tabla o no lo poseemos.
Importante: Están formados por 3 elementos que son:

o Unidades de análisis cada uno de los casos que se plantea, se sitúan en las filas.
o Variables es la característica que observamos y se encuentran en las columnas.
o Valores serían los datos, los números que se obtienen.
Esta imagen es del SPS que es donde nosotros trabajaremos más adelante los datos en
prácticas.
Ejemplo para comprender la diferencia entre valor o dato y variable:
3
4. Tipos de variables.
Podemos distinguir dos tipos de variables según la naturaleza de sus modalidades:
 Cualitativas, también llamadas categóricas, son las que indican cualidades, clases o
modalidades, pero nunca indican números. A su vez, encontramos:
 Cualitativas nominales, los valores son categorías (hacen referencia a una
cualidad) y no existe orden en su asignación.
Ej: al hablar del sexo da igual que sea hombre o mujer, por ello uno no va
antes que el otro, nosotros podemos elegir cuál es su orden. El estado civil,
la situación laboral, situación de estudio…
 Cualitativas ordinales, si existe un orden en su asignación, pero no una distancia
o intervalo definido entre los valores. Cada valor posible es menor o mayor que
otro valor, siempre.
Ej: en la escala EVA no es lo mismo el valor 1 que el 6, sí que siguen un orden.
 Cuantitativas o medibles, indican valores respecto a una unidad: son aquellas que
podemos medir y obtenemos un número, y cada valor posible es menor o mayor que
otro valor. Dentro de estas, distinguimos:
 Cuantitativas discretas, si son números enteros y el número de valores posibles
es finito, es decir, al ser números enteros es más probable que coincida entre
los pacientes.
Ej; 5, 10, 21, 38… Cuando hablamos de la edad de una persona, número de
personas, etc.
 Cuantitativas continuas, si toman cualquier valor de la recta real o de un
intervalo (número de valores posibles infinito, muy amplio, pueden no coincidir
ningún valor entre los pacientes), es decir, poseen decimales.
Ej: 5’2, 10’3, 0’1, 85’95… Altura, fuerza muscular (escala cuantitativa de
kendall), peso…
Ejercicio realizado en clase para comprender todo esto mejor:
4
5. Medición.
Es un proceso de asignar números (valores) a los datos de las variables o categorías
mediante unas determinadas reglas, aplicable a todo tipo de investigación, ya sea
cualitativa o cuantitativa.
Para las variables cualitativas las reglas de medición determinan el procedimiento de
asignación de números a las modalidades de la variable, a las categorías. Esa asignación
es lo que se denomina como codificación, lo que nos va a permitir poder analizar datos
y que disminuya el error al trabajar con números y no con palabras, ya que siempre se
deberían escribir igual para que no hubiese error.
Ej: hombre=0 y mujer=1 o viceversa, no es importante cual sea el 1 y cual el 0 mientras
se tenga claro cuál es cual y esto no varíe a lo largo de todo el estudio. Es decir, siempre
que nosotros identifiquemos una variable, da igual el número que le asignemos, pero si
o si debemos cuantificar esa variable cualitativa y ese número es inamovible durante
todo el estudio ya que si no, se altera el resultado.
Los elementos básicos que se requieren para realizar una medición son 3 para las
variables cuantitativas: instrumento de medición, escala de medición y sistema de
unidades de medición.
5
Ejemplos
Amplitud articular Instrumento de medición: goniómetro/ Escala de medición: …/
Sistema de unidades de medición: grados (º).
Velocidad de la marcha Instrumento de medición: tapiz rodante/ Escala de medición:
…/ Sistema de unidades de medición: distancia/tiempo (m/s).
Mientras que para las variables cualitativas serían 2: instrumento de medición y escala
de medición.
Ejemplos
Tope articular Instrumento de medición: manos del fisioterapeuta/ Escala de
medición: duro, blando…
Obesidad Instrumento de medición: índice de masa corporal (IMC)/ Escala de
medición: IMC
Hay que tener en cuenta que una variable cuantitativa puede ser también cualitativa
pero una cualitativa no puede ser cuantitativa. Ya lo explicaremos más adelante en este
tema.
Ejercicio de repaso para distinguir la clasificación de las variables:
N= Cualitativa nominal C= Cuantitativa continua D= Cuantitativa discreta O= Cualitativa ordinal
6. Escalas de Medición: Propiedades, tipos e importancia.

Una escala es el conjunto de valores que puede tomar una variable. Es un continuo de
valores ordenados correlativamente que admite un punto inicial u otro final. Sin
embargo, no siempre se cumple la parte de que sigan un orden, como en las escalas
nominales.
Es importante conocer la existencia de 4 escalas de medición que a su vez se agrupan
en dos escalas:
6
 Categóricas: escala nominal y escala ordinal. Por consiguiente, coinciden con el tipo
de variable que sea.
 Cuantitativas: escala de razón y escala de intervalo.
6.1. Propiedades de medición.

El hecho de cuál sea la escala empleada va a depender de las propiedades de medición.
Estas son el nivel en que una variable puede ser medida, determinan las propiedades de
medición de esa variable, el tipo de operaciones matemáticas, las fórmulas y los
procedimientos estadísticos.
Existen 4 propiedades de medición:
Identidad→ Cada número tiene un significado particular. Es decir, un número nos
indica una cantidad o un valor nos indica una característica determinada.
Magnitud→ Los números tienen un orden.
Equidistancia→ La diferencia entre números es la misma en toda la escala. Por
ejemplo, de 73 a 74 tenemos la misma distancia que de 78 a 79, es decir, hay el
mismo número de números entre uno y otro.
Cero absoluto→ El valor de 0 representa ausencia de lo medido. Es decir, que no

existe ya que, si tenemos 0 caramelos, eso significa que no tenemos ninguno, por
tanto, no existen.
Para poder comprender estos conceptos correctamente, es necesario entender cómo
funcionan las escalas comentadas anteriormente.
6.1.1. Escala de razón. (Categóricas)

Se va a caracterizar por presentar las 4 características de medición (identidad, magnitud,
equidistancia y 0 absoluto).
Esta, se aplica a las variables cuantitativas en las que el número 0 representa la ausencia
de la característica o atributo. El 0 es real y no es arbitrario, esto quiere decir que no
podemos atribuirlo a cualquier variable cualitativa como hasta ahora. Esta vez solo
puede ser dado a aquellos valores agentes. Ejemplo: si hablamos de edad y atribuimos
el valor 0 a ello, significa que una persona no ha nacido porque tiene 0 años, lo mismo
que con el número de hermanos, por ejemplo, si tienes 0 hermanos es una ausencia de
característica o con la altura. Sin embargo, si hablamos de sexo y atribuimos el 0,
realmente este no tiene relación por lo que aquí 0 podría ser hombre o mujer (este
ejemplo del sexo no corresponde a la escala de razón, pero es para que se entienda la
diferencia). Además, esta condiciona las operaciones matemáticas (nos posibilita sumar,
restar, multiplicar y dividir), lo que constituye la realización de cualquier aplicación
estadística que ya veremos en un futuro.
7
6.1.2. Escala de Intervalo (distancia entre valores). (Categóricas)

Se va a caracterizar por presentar 3 características de medición (identidad, magnitud,
equidistancia). Sin embargo, en esta escala, el 0 absoluto no se cumple puesto que
podemos atribuirlo a un valor que realmente vale 0 y existe, lo que ocurre cuando
hablamos de temperatura, los 0º existen e incluso -10º y se pueden medir; por ello, el 0
es arbitrario y podemos redondear los valores obtenidos (2’95≈3).
Se caracteriza porque es una escala cuantitativa en la que existe un orden o jerarquía en
sus valores. Por ejemplo, en la temperatura existe un orden, el valor 36º es menor que
40º pero mayor que 20º, y hay que respetar y mantener esa jerarquía. Además, las
distancias entre categorías son las mismas en toda la escala, es decir cumple el principio
de equidistancia explicado anteriormente.
Según el parámetro que midamos se expresa con una unidad de medida determinada,
si seguimos con el ejemplo de temperatura, podemos emplear los ºC (0ºC) o bien,
Fahrenheit (200ºF). Además, nos va a permitir realizar diferentes operaciones
matemáticas (suma, resta, multiplicación, división), lo que nos va a permitir realizar un
mayor número de procedimientos estadísticos.
Importante: Se diferencia de la escala de razón porque aquí el 0 no significa ausencia
6.1.3. Escala Ordinal. (Cuantitativa)

En esta escala se cumplen dos propiedades de la medición, la identidad y la magnitud,
pero no se cumplen la equidistancia ni el 0 absoluto. Va a ser categórica de tal forma
que, como bien dice su nombre, categoriza variables ordinales por lo que se sigue
siempre una jerarquía y por ello, cada valor es ‘mayor que’ o ‘menor que’ los demás
valores.
Los datos en esta escala son mutuamente excluyentes, esto quiere decir que, si una
persona posee un valor, no puede presentar otro en esa misma categoría. Un ejemplo
para ver esto sería en la valoración del dolor, si yo padezco un nivel 3 en la escala EVA,
no puedo presentar también un nivel 0 puesto que he dicho que mi sensación es dolor
severo y no podría ser otra sensación más ya que sería contradictorio. Por esto mismo,
el máximo valor de la etiqueta, que nosotros podamos atribuir, no tiene por qué
coincidir con el de mayor rango jerárquico. Si seguimos con el dolor, esto lo podríamos
explicar cómo que yo puedo atribuir el valor 0 a indoloro y 5 a máximo dolor o al revés,
de tal forma que la escala en este caso se conformará en función de los parámetros que
yo elija.
Por último, nos va a permitir realizar diferentes operaciones matemáticas (suma, resta),
que nos van a permitir ordenar los valores. Esto nos va a limitar a la hora de realizar los
procedimientos estadísticos.
¿Por qué no se dice que es equidistante esta escala? Porque si nos centramos en el dolor,
por ejemplo, en la escala EVA mi nivel de dolor 4 y mi valor 3 no tiene por qué
8
corresponder con el mismo nivel de dolor 4 y 3 que el de mi hermano. Una persona

puede tener un umbral doloroso más alto que otro y por ello este no coincide.
6.1.4. Escala nominal. (Cuantitativa)

Esta escala es la más sencilla, solo presenta la característica de medición de identidad.
Se aplica a variables categórica de tal forma que cada valor/categoría/etiqueta es
excluyente, es decir si estás soltero no puedes estar también casado o si tienes 20 años
no puedes tener también 18 años.
Los valores de esta escala se diferencian por sus cualidades, no por su cantidad y
únicamente nos permite clasificar y no ordenar. Ninguna de las categorías tiene mayor
jerarquía que otra ya que solo se posee un valor. Son dicotómica (2 categorías, por
ejemplo, el sexo de la persona) o policotómicas (más de 2 categorías, por ejemplo, la
situación laboral o el estado civil) y nos permiten realizar operaciones matemáticas
(suma, resta), lo que nos va a dejar contar el total de variables en una categoría, pero
limita mucho las acciones estadísticas.
Resumen de las propiedades de medición que poseen las 4 escalas explicadas
anteriormente:
Ejercicio para determinar cuál es el tipo de variable (es el mismo que ya se vio
anteriormente) y la escala de medición:
9
El método estadístico va a depender del tipo de variable (cualitativa o cuantitativa).

Para variables cualitativas empleamos porcentajes (%) mientras que en variables
cuantitativas empleamos medias.
A la hora de trabajar con variables cuantitativas si podemos hacer una media, por
ejemplo, si trabajamos con edades y quisiéramos conocer la media de edad de todo
Fisioterapia de la UMU, sumariamos todas las edades de los estudiantes y lo dividiríamos
entre el número total de estudiantes. Así sabríamos la media de edad. Sin embargo, si
trabajamos con variables cualitativas, no podemos hacer una media, trabajaríamos en
porcentajes. En este caso, podríamos hallar el porcentaje de estudiantes hombres y
mujeres en Fisioterapia.
A las variables cualitativas no podemos asignarles métodos para variables cuantitativas.
Sin embargo, una variable cuantitativa sí que puede transformarse en cualitativa, lo que
nos permite realizar una mayor organización de nuestros valores.
Ejemplo: al paciente 096 se le clasifica en rápido ya que supera los 0’81m/s, de esta
forma podemos saber cuántos pacientes van en cada categoría de una forma más
sencilla que si fuese cuantitativamente ya que sería un jaleo de nueros. Por ello, las
variables cuantitativas si pueden ser cualitativas, pero, si lo pensamos al revés, no
podríamos transformar una variable cualitativa en cuantitativa. Es decir, si yo sé que mi
paciente anda rápido, puedo saber que supera los 0’81m/s, pero no puedo saber
exactamente cuál es su velocidad, debido a ello no podríamos pasarlo a cualitativo.
Ejercicio transformación de variables:

Para calcular el IMC se debe realizar una fórmula matemática muy sencilla como es
Peso/Altura y, a partir de ello, podemos clasificarlo en 2 escalas:
10
Por consiguiente, al realizar esa división planteada anteriormente a partir de los datos
que se encuentran en la 1ª y 2ª columnas, obtenemos el IMC. De esta forma, podemos
clasificar a la persona en la escala de obesidad. Es por ello que, pasamos de una variable
cuantitativa a una cualitativa.
Por tanto, es importante aprender a manipular, analizar, estudiar y explotar los datos
obtenidos en nuestro estudio. El proceso de definir y medir las variables es crucial. Si
definimos las variables de forma incorrecta o medimos mal, los resultados estadísticos
no serán válidos, como es el caso de la primera variable de la tabla de arriba que no da
ese resultado de IMC, sería 23’11 y sería aceptable (aunque a mí no me daba eso, pero
bueno). Si nos confundimos en los resultados y por consiguiente los falseamos, puede
tener unas grandes repercusiones negativas en nuestro estudio.
11
Loli Martínez
Bloque 2. Tema 1.
DESCRIPCIÓN DE DATOS UNIVARIANTE: TABLAS Y GRÁFICOS.
1. Fases de la estadística descriptiva.

En el tema anterior vimos como en un paciente que llega a la clínica se le realiza una valoración, una
anamnesis, etc., para recoger determinadas variables (datos). Ahora imaginad que tenemos unos 30
pacientes que llegan a la clínica. A estos le tomamos los datos y lo plasmamos en la hoja de recogida
de datos o de registro (al igual que en el tema anterior). Todos los datos obtenidos lo volcamos en
nuestra base de datos:
En las columnas están las variables (edad, sexo, estado civil, etc) y en las filas los casos.
Esta tabla (base de datos) nos permite trabajar con los datos, pero NO es útil, por lo que tendremos
que aplicar una serie de análisis para ordenar o describir lo que tenemos en la tabla.
Por ejemplo, al cabo de 6 meses quiero saber como son los pacientes que tenemos en la clínica, si la
mayoría son ancianos quizá nos interesa meter x técnica específica para esa población más que un
aparato de fisioterapia deportiva o de fisioterapia respiratoria. El hecho de conocer a nuestros
pacientes nos va a permitir encontrar necesidades. También nos sirve para ver si hemos obtenido
buenos resultados, es decir, conocer si estamos avanzado en la recuperación de los pacientes (puede
que con unos si estemos avanzando y con otros no).
Para transformar la base de datos en datos que nos sean más útiles empleamos tablas, gráficas, etc.,
lo hacemos para simplificar los datos y poder visualizarlos y trabajarlos de forma más fácil.
Por ejemplo, con el estado civil de nuestros 30 sujetos:
- En forma de tabla podemos ver los casos agrupados en determinadas categorías, por
ejemplo, quiero saber cuántos viudos tenemos entre nuestras pacientes y en la tabla de
forma rápida podemos saber que tenemos 6 viudos de los 30 pacientes que hay en total.
- En forma de gráfica podemos visualizar fácil y rápido cuantos pacientes hay en cada
categoría (en porcentajes), por ejemplo, podemos observar que la mayoría de los pacientes
son casados.
Loli Martínez
BASE DE DATOS TABLA GRÁFICA
Por lo tanto: de nuestra hoja de registro obtenemos nuestra base de datos y a la hora de gestionar
los datos (de ver como son nuestros pacientes) tenemos que hacer un Informe de resultados, por
ello es importante saber simplificar los datos (esto también ocurre en un proyecto de investigación
al final los resultados hay que publicarlos sea en formato artículo, formato informe…).
La estadística descriptiva es hacer una descripción de los pacientes (no vamos a saber si una técnica es
mejor que otra, simplemente voy a conocer como son los pacientes).
PROCEDIMIENTO/FASES DE LA ESTADÍSTICA DESCRIPTIVA

1. RECOGIDA DE DATOS
2. ORGANIZACIÓN DE LOS DATOS. Lo haremos mediante las tablas/gráficas.
3. INTERPRETACION DE LOS DATOS. Gráficos estadísticos o cálculo de parámetros estadísticos
(valores que resumen nuestros datos).
2. Estadística descriptiva univariante.

Nuestros datos vamos a organizarlos principalmente en tablas estadísticas de datos simples o
gráficos estadísticos, estos van a depender de si es una variable cualitativa o es cuantitativa.
Por ejemplo, para la variable edad (cuantitativa) tendríamos una tabla muy grande y seria lioso. Nos
interesaría más utilizar los gráficos ya que sería más sencillo.
Las tablas estadísticas de datos las vamos a emplear para agrupar datos
2.1. VARIABLES CUALITATIVAS

- 2.1.1. TABLAS DE FRECUENCIAS:
TABLAS ESTADISTICAS DE DATOS SIMPLES: Con la variable sexo la vamos a agrupar en una tabla en
la que vamos a tener dos categorías porque solo hay hombre o mujer (pero, por ejemplo: en la
variable de situación laboral tendríamos más categorías: activo, parado, jubilado, otros, etc).
Frecuencia absoluta: número de veces que se repite un caso
(Ej: FRECUENCIA: 15 Mujeres; 15 Hombres, de los 30 totales que tenemos en la clínica)
Frecuencia relativa/Porcentajes: frecuencia absoluta de una categoría dividida por el número total
de casos. Con lo que más vamos a trabajar es con los porcentajes.
(Ej: PORCENTAJE: 50% Mujeres; 50% Hombres → 15⁄30 = 0,5 ; 15⁄30 𝑋 100 = 50%)
Frecuencia absoluta de ‘x’ categoría

= 𝑇𝑎𝑛𝑡𝑜 𝑝𝑜𝑟 𝑢𝑛𝑜
Número total de casos
Loli Martínez
Frecuencia absoluta de ‘x’ categoría

× 100 = 𝑇𝑎𝑛𝑡𝑜 𝑝𝑜𝑟 𝑐𝑖𝑒𝑛𝑡𝑜
Número total de casos
Frecuencia acumulada: frecuencia absoluta/frecuencia relativa de una categoría más la suma de la

categoría o categorías anteriores, es decir, sumamos la categoría anterior (categoría ‘x’ más las que
le preceden). Sirve principalmente para clasificar pacientes (es una aplicación práctica).
(Ej: PORCENTAJE/FRECUENCIA RELATIVA ACUMULADO: 50% Mujeres; 50% Hombres →
PORCENTAJE ACUMULADO DE MUJERES seria 50% de Mujeres + 50% de Hombres (categoría
anterior) = 100%).
(Ej: FRACUENCIA ABSOLUTA ACUMULADA: sumamos la frecuencia absoluta de la categoría de
mujeres (15) + la frecuencia absoluta de hombre (15) = FRECUENCIA ACUMULADA DE 30).
Sexo FRECUENCIA PORCENTAJE PORCENTAJE PORCENTAJE

VÁLIDO ACUMULADO
HOMBRE 15 50,0 50,0 50,0
MUJER 15 50,0 50,0 100,0
TOTAL 30 100,0 100,0
Si tuviéramos más categorías:
La frecuencia absoluta acumulada de f3

seria: f3 + f2 + f1 (la categoría que
elegimos, en este caso f3, mas las 2 que le
preceden en este caso f2 y f1).
La frecuencia acumulada sirve para si tenemos varias categorías como por ejemplo de velocidad de
la marcha, y quiero saber cuantas personas tengo que No Andan o que Andan Muy Lentas podemos
saberlo de manera rápida con la frecuencia acumulada ya que sabemos el porcentaje de esa
categoría y de la anterior, ya que quizá podemos aplicar el mismo tipo de técnica a ambos.
La construcción de las tablas nos va a permitir obtener datos de forma ordenada, así como su
representación gráfica mediante gráficos estadísticos.
2.1.2. GRÁFICOS ESTADÍSTIOS: una vez obtenidas las tablas, puede ser mucho más fácil visualizar un
gráfico. También nos interesan los gráficos de cara a publicitar los resultados de nuestra clínica
(atrae más un gráfico que una tabla). Podemos ver que categoría es la más predominante:
GRÁFICOS DE DISPERSIÓN: Vemos cada uno de los casos agrupados y en que categoría está (nos
indica si el caso 10 por ejemplo es mujer o si el caso 22 es hombre, en los otros gráficos eso no lo
podemos saber). Estos gráficos dan mucha información, pero nos quedamos principalmente con los
gráficos de barras y los de sectores.
Loli Martínez
DIAGRAMA DE BARRAS: Se puede emplear para frecuencia absoluta, frecuencia relativa y frecuencia
acumulada. Puede representarse vertical u horizontal.
Por ejemplo: en la variable estado civil tenemos 5 categorías, en el gráfico de diagrama de barras
tenemos en el eje y (VERTICAL): el número de casos (frecuencia absoluta) y en el eje x (HORIZONTAL):
tenemos las diferentes categorías.
Si trabajamos con frecuencias absolutas y con frecuencias absolutas acumuladas (vemos cuantos
pacientes vamos acumulando, por ejemplo, quiero ver que pacientes tienen un dolor menor a 3
[categoría], asique me voy a la frecuencia absoluta acumulada y puedo ver cuántos pacientes están
por debajo de esa categoría de nivel de dolor):
FRECUENCIA ABSOLUTA FRECUENCIA ABSOLUTA ACUMULADA
Si trabajamos con frecuencias relativas (es muy parecido a la frecuencia absoluta, simplemente en el
eje y ponemos porcentajes [la aplicación es la misma]) y con frecuencias relativas acumuladas (la
barra final será el 100% de nuestros pacientes):
Loli Martínez
FRECUENCIA RELATIVA FRECUENCIA RELATIVA ABSOLUTA
→ Diagrama de barras horizontal (podemos

ver que la mayor proporción de los pacientes
tienen estudios primarios)
DIAGRAMA DE SECTORES: Se puede emplearen frecuencia absoluta (fi) y relativa. Se trata de dividir
el número de pacientes, pero en forma de círculo y el ángulo de cada sector en el que se divide el
círculo lo vamos a obtener en base a la frecuencia absoluta (el ángulo es proporcional a la frecuencia
absoluta).
N = número total de la muestra (población)
360º fi = frecuencia absoluta
∝= × 𝑓𝑖
N
α = ángulo en el diagrama
Loli Martínez
También se puede calcular con frecuencias relativas (aunque para calcular el ángulo se sigue
empleando la frecuencia absoluta), pudiéndolo expresar como forma de porcentaje:
Ejercicio: calcula los ángulos de cada caso (¡¡¡ESTE TIPO DE EJERCICIOS PUEDEN CAER EN EL EXAMEN!!!)
360º
∝= × 𝑓𝑖
N
0: α = 360/30 x 3 = 36º
1: α = 360/30 x 5 = 60º
2: α = 360/30 x 15 = 180º
3: α = 360/30 x 4 = 48º
4: α = 360/30 x 2 = 24º
5: α = 360/30 x 1 =12º
La comorbilidad son las enfermedades que puede presentar un paciente; si tenemos 0

comorbilidades, tenemos 0 enfermedades.
2.2. VARIABLES CUANTITATIVAS

Tenemos una tabla de frecuencias, pero no es funcional a la hora de trabajar al tener bastantes
variables (30), por lo que vamos a agruparlos por intervalos obteniendo x categorías (Ej: 5
categorías), siendo mucho más visual una tabla de x categorías para las variables cualitativas.
Loli Martínez
VARIABLES ESTADÍSTICAS CONTINUAS: pueden obtener cualquier valor real en un intervalo.

VARIABLES ESTADÍSTICAS DISCRETAS: número finito de datos (frecuencias absolutas, fi,
bajas o gran dispersión de datos).
- 2.2.1. TABLAS DE FRECUENCIAS:
TABLAS ESTADISTICAS DE DATOS AGRUPADOS EN INTERVALOS:

▪ Intervalo Semi-abierto: números desde a (incluido) hasta b (sin incluir) → [a,b[
▪ Intervalo Cerrado: números desde a (incluido) hasta b (incluido) → [a,b]
Para el intervalo semiabierto [42-52[ se incluye

desde 42 (a), hasta 51 (ya que b, 52, no se incluye
en este intervalo, sino que se incluye en el
siguiente).
* Si el intervalo fuera cerrado [42-52] se incluye
desde 42 (a) hasta 52 (b). *
Vamos a trabajar con intervalos semiabiertos.
En un intervalo tenemos que tener en cuenta que cada categoría se va a denominar clase (los
valores se van a agrupar en intervalos de una misma amplitud). Cada clase va a tener:
→ Límites de la clase: cada clase está delimitada por un
límite inferior y otro límite superior. Para el intervalo
semiabierto [42-52[ el lim inferior es 42 y el lim superior
es 52 (aunque sea semiabierto se incluye b, en este caso
52).
→ Amplitud de la clase: diferencia entre el límite superior y
el inferior. Para el intervalo semiabierto [42-52[ la
amplitud seria 52-42 = 10 (distancia entre un valor y
otro).
→ Marca de la clase: punto medio de cada intervalo y es el
valor que representa a todo el intervalo para el cálculo
de algunos parámetros. La marca de la clase se saca con
una media, Para el intervalo semiabierto [42-52[ la media seria (42+52) /2 = 47 y por tanto la
marca de la clase seria 47. Para el intervalo semiabierto [52-62[ la marca de la clase sería 57.
¿Cómo calcular un intervalo?

Partiendo de una tabla de frecuencias (Ej: velocidad de la marcha 1ª medida (m/s)):
1º. Localizar el valor menor (seria el límite inferior) y el mayor (el límite superior).
Ej: valor menor: 42 y el valor mayor: 95.
2º. Se restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible.
Ej: 95-42 = 53
3º. El resultado de la resta se divide por el número de intervalos que queremos

hacer, es decir entre el nº de grupos que deseamos (lo habitual entre 5 y 12).
Ej: 53/5 = 10,6 ~ 10 (AMPLITUD DE LA CLASE).
Loli Martínez
Tendremos 5 clases de amplitud 10 → [42-52[; [52-62[; [62-72[; [72-82[; y >82

- De [42-52[ tenemos una frecuencia absoluta de 3, una
frecuencia relativa/porcentaje de 10.
frecuencia relativa/porcentaje de 23,3.
frecuencia relativa/porcentaje de 20.
- >82 tenemos una frecuencia absoluta de 7, una
La tabla de frecuencias de las variables cuantitativas se diferencia de las de las variables

cualitativas en que incluimos la marca de la clase:
Ejercicio: calcular los intervalos: Vamos a hacer 5 grupos (clases).
1º. Límite inferior: 70; límite superior: 180

2º. Lim superior - Lim inferior → 180-70 = 110
3º. Resultado resta / nº intervalos que queremos hacer → 110 / 5 =22
(AMPLITUD)
El primer intervalo va de 70 a 92 ( [70-92[ ), como en nuestra muestra no

tenemos 92 tenemos una frecuencia absoluta de 2, el 70 y el 85. La marca de
la clase seria (70+92) / 2 = 81.
El segundo intervalo va de 92 a 114 ( [92-114[ ), desde ese rango (92) hasta el
120 (sin incluirlo), tenemos una frecuencia absoluta de 6 (93, 94, 95, 100, 101,
103). La marca de la clase seria (92+114) / 2 = 103.
Y así sucesivamente hasta los 30 casos.
EJERCICIO RESUELTO →
Loli Martínez
- 2.2.2. GRÁFICOS ESTADÍSTIOS: Una vez que tenemos la tablas, al igual que las variables
cualitativas, las podemos representar con gráficos. Se pueden emplear también diagramas
de barras, pero lo que más utilizaremos son los histogramas
HISTOGRAMAS (fi o Fi):

Los histogramas cogen el intervalo y la marca de la clase sería el centro de la barra (puntos rojos en
la imagen de abajo). En el intervalo semiabierto [42-52[, la marca de la clase es 47.
El histograma lo podemos hacer con la frecuencia absoluta (fi), con la frecuencia relativa y con la
frecuencia acumulada (Fi). Se utilizan para variables continuas o discretas, con un gran número de
datos y que se han agrupado en clases. En el eje de abscisas/ eje x se construyen rectángulos que
tienen como base la amplitud del intervalo, y por altura (eje de ordenadas/ eje y), la frecuencia
absoluta o relativa de cada intervalo
En este caso el histograma es con frecuencia absoluta, por eso en el eje y el máximo es 8 porque la
frecuencia absoluta mayor que tenemos en nuestros intervalos es 7. En el eje x se construyen los
rectángulos y en el centro estaría la marca de la clase.
Con la frecuencia relativa, lo único que cambia es en el eje y, que tenemos el %, en este caso el
máximo es de 23,3 por lo que en la gráfica solo tenemos de máxima hasta 25.
Con la frecuencia relativa acumulada podemos saber cuantos de mis pacientes tienen una velocidad
de la marcha específica. Por ejemplo: una velocidad de la marcha por debajo de 62 (porque esos son
que están muy mal y les cuesta andar mucho), con esta gráfica nos vamos a la frecuencia acumulada
y observamos que el 33,3 % están muy mal y a lo mejor hay que incidir mas en otro tipo de técnicas.
Loli Martínez
Sobre los histogramas también se pueden construir polígonos de frecuencias, se construye cogiendo
la marca de clase de cada intervalo, que coincide con el centro de cada rectángulo, y los unimos
trazando una línea. El polígono de frecuencia nos puede dar una idea de la tendencia que hay, por
ejemplo, en el intervalo de 52 a 72 tenemos un porcentaje similar de sujetos, en el siguiente
intervalo (de 72 a 82) tenemos menor proporción y ya en el siguiente aumenta.
¿Cómo se construye un histograma? (¡¡Haremos alguno en los seminarios!!)

1º. La base va a ser la amplitud del intervalo
2º. La altura va a depender si es una frecuencia absoluta, relativa o acumulada
3º. En el centro está la marca de la clase
4º. Si unimos las marcas de la clase de cada intervalo obtendremos el polígono de frecuencias.
DIAGRAMAS DE SECTORES:
Se calcula igual que en las variables cualitativas:
N = número total de la muestra (población)

360º
∝= × 𝑓𝑖 fi = frecuencia absoluta
N
α = ángulo en el diagrama
OBJETIVOS DE LOS GRÁFICOS EN INVESTIGACIÓN:

- Presentar la distribución de los datos
- Explorar la condición de aplicación de algunos estadísticos
Loli Martínez
Los histogramas, las barras, o los diagramas nos puede dar una idea de que está pasando con
nuestra muestra y nos pueden dar diferente información:
DIAGRAMA SIMÉTRICA / NORMAL: cuando la muestra es igual, por ej: si partimos por la mitad
nuestro histograma, la izquierda seria igual que la derecha. Los datos indican una distribución
normal, se puede concluir que es estable. Por ejemplo: talla, peso.
DIAGRAMA IZQUIERDA / ASIMÉTRICA NEGATIVA: La mayor proporción de nuestros pacientes se

concentran en la derecha por lo que puede indicar que nuestra muestra no es igual (si partimos por
la mitad el histograma no es igual). Podemos observar que hay gente que tiene una muy buena
velocidad de la marcha (parte derecha) y gente que tiene muy baja (parte izquierda), es decir, no
tenemos una muestra compensada y la distribución no es normal. La cola de los datos hacia la
izquierda de la media. Por ejemplo: tiempo que tarda en averiarse un ordenador.
DIAGRAMA DERECHA / ASIMÉTRICA POSITIVA: es lo contrario que el diagrama izquierda:

tendríamos mucha gente muy mal (parte izquierda) y poca gente bien (parte derecha), es decir, no
tenemos una muestra compensada y la distribución no es normal. La cola de los datos hacia la
derecha de la media. Por ejemplo: número de ingresos o tiempo de espera.
FORMA U / BIMODAL: Los datos pueden venir de dos procesos diferentes. Por ejemplo: peso de n
club deportivo (hombre y mujeres). ¡¡Lo veremos en seminarios y practicas!!
Los picos nos pueden dar una idea de que al introducir los datos en la base nos hemos equivocado
(por ejemplo: hemos puesto un 100 cuando esa variable era 10) o si estamos trabajando con
pacientes que no están bien (por ej: que hayan sufrido un Ictus y tenemos uno que lo ha sufrido pero
que está bastante bien).
- Pico aislado: hay una separación entre un conjunto de barras y otro conjunto
- Pico extremo: hay una barra con un poco muy diferente al resto
3. Estadística.
La estadística descriptiva es un grupo de métodos
empleados para organizar, mostrar y describir
nuestros datos utilizando tablas, gráficas y medidas,
es decir, para decir como son nuestros pacientes.
Con la estadística descriptiva NO podemos decir si
una técnica es mejor que otra, simplemente podemos
decir como es la muestra/pacientes.
Bloque 2. Tema 2.
Síntesis de datos Univariante
1. Introducción.
Ya sabemos cómo son nuestros pacientes y cuáles son los resultados. Esta vez, nos toca
determinar si realmente estos resultados que estamos obteniendo son beneficiosos
para nuestra clínica o no. Por ello, es importante sintetizar todos los datos obtenidos
para que, mediante un único dato sepamos varias cosas.
Importante: todas las fórmulas matemáticas que aparecen en el tema no es necesario
aprenderlas de memoria, pero si debemos saber cómo emplearlas. Ejemplo: no tenemos
que saber la fórmula matemática de la media, pero si saber cómo se realiza esta.
2. Estadística descriptiva univariante.

Para favorecer que acudan más pacientes a nuestra clínica es necesario dar datos que
muestren la fiabilidad de esta y los resultados que se obtienen. De esta forma, la
transmisión de la información boca a boca y el propio patrocinio que nosotros hagamos,
dará lugar a que un mayor número de pacientes acudan.
Así, la elaboración de una tabla de datos donde todos ellos estén recogidos, junto a sus
medias y porcentajes, no nos es del todo útil a la hora de comparar las medidas iniciales
de los pacientes con sus medidas finales. De esta forma, podríamos valorar la evolución
de manera general pero no específicamente en cada paciente. Para estos casos se
emplean los gráficos de dispersión.
En el siguiente ejemplo vamos a observar un gráfico de dispersión donde se recogen
todos los casos (representados como puntos) de los datos relacionados con la velocidad
de marcha de los pacientes que estamos evaluando. Gracias a este, de un simple vistazo
somos capaces de ver la variación generalizada de los valores entre el 1er mes (gráfico
superior) y el 6º mes (gráfico inferior), podemos ver como mejoran ya que los puntos se
dispersan y se desplazan a la derecha. Por ende, mayor es su velocidad al sexto mes
respecto al primero.
1
A todos estos valores de los que estamos hablando los vamos a denominar valores
estadísticos, entendiendo por ello, cualquier resultado calculado a partir de los valores
de una muestra. Además, el concepto de muestra hace relación con el número total de
casos, en esta ocasión pacientes, que nosotros estamos considerando para nuestro
estudio.
Hay que tener en cuenta que, en cualquier gráfica, no solo de dispersión, la parte central
donde se encuentran reunidos un mayor número de puntos, haría relación o
correspondería a la media del estudio, son los que se conocen como valores centrales y
son los más comunes. Mientras que, aquellos puntos que se alejan del centro de la
gráfica serían los valores de dispersión.
Como resultado, podremos decir que la centralización son los valores centrales de la
variable, los cuales nos permiten sintetizar los datos para que sea más sencillo. Es decir,
nos deja resumir una variable en un dato interpretable. Por otro lado, la dispersión, los
valores más alejados, nos permitirían conocer o medir la distancia entre los datos
respecto al centro.
En los siguientes tipos de gráficas, las flechas de color rojo indican los valores centrales,
mientras que las amarillas señalan los valores de dispersión.
Si poseen mayor dispersión, los valores se van a encontrar más separos del centro. En
estas gráficas, diagrama de normalidad, debemos tener en cuenta que el centro es la
parte más apical, donde más casos se concentran. Por ello, en la gráfica 2, la línea de
color rojo posee mayor dispersión que la negra ya que se encuentra más plana y esto
indica que el mayor número de casos estaría en los lados. Sin embargo, en la línea negra,
la dispersión en menor ya que su anchura en menor y mayor su verticalidad. En la gráfica
1, la línea verde sería la de mayor dispersión, mientras que la roja la de menor o mayor
número de valores centrales.
1 2
2
3. Valores centrales más típicos.

Estos hacen relación con la zona central, donde mayor número de valores se juntan.
3.1. Media.
En el caso de las variables cuantitativas, estos coinciden con la media, entendiendo
como tal la suma de todos los datos con sus repeticiones y dividido por el número total
de datos.
Ejemplo con el mismo caso de la marcha de antes:
Si sabemos que la fórmula matemática es:
La solución será la suma de todas las velocidades entre 30
ya que es el número total de casos:
Cuando realicemos las prácticas trabajaremos con el

programa SPS y deberemos sacar una tabla estadística como
la siguiente y fijarnos en el valor de la media obtenida:
Si representamos todos los datos en un diagrama de dispersión, veremos que la mayor

concentración de puntos está en torno a los 70. Mientras que, en un diagrama de barras,
esta se encontrará en la más alta o alrededor.
Conocer esto mediante la representación de la media, nos sirve para poder diferenciar
si ha habido una mejora significativa o no en nuestros pacientes al cabo del tiempo. Si
nos fijamos en la media, podremos saber esto ya que, si en un primer momento eran 69
3
y ahora se encuentra en 132, se ha producido una clara mejoría en estos. Mientras que,
con la tabla de datos únicamente (tabla verde de arriba), no seriamos capaces de
conocerlo.
La media se caracteriza porque es la medida de centralización más empleada, que

únicamente se emplea en variables cuantitativas (ya que no tiene sentido obtenerla en
las cualitativas, hay obtendríamos el porcentaje) y que puede verse muy influenciada
por valores extremos (ya sea aumentándola o disminuyéndola drásticamente), de tal
forma que se va a producir un sesgo al falsear los datos. Ejemplos de estas influencias
serian:
EJERCICIO. Obtener la media de los 10 primeros casos de la velocidad de la marcha 4º

media.
X= (165+100+130+170+150+135+153+145+147+145) / 10=
=144
4
3.2. Mediana.
Cuando se producen esos valores extremos, la media no es 100% efectiva ya que deja
variables fuera. Por ello, es necesario emplear la mediana (Me). Esta es el valor de la
variable que deja al 50% de los sujetos por debajo (y el restante 50% por encima), es
decir, nos divide la variable en 2, justo la mitad de la población. Como es el valor que
parte la muestra en dos partes exactamente iguales, no influyen esos extremos.
Para calcular esta, debemos ordenar todos los datos de menor a mayor, si se repiten las
variables se ponen, aun así, ya que el objetivo es sumar los dos valores centrales (en el
caso de que el número sea par) y dividirlo entre 2 (el 50%). Si es impar, la mediana sería
justo el valor que deja por debajo y por encima de este el mismo número, sin contar
este.
Ejemplo casos pares:
Los valores situados en la tabla azul se han ordenado de menor a mayor desde el 68 al
110. Una vez así, se han cogido los que corresponden al valor 5º y 6º, una vez ordenados,
ya que son la mitad de la ordenación. De tal forma que se han sumado estos valores
90+90 y se dividen entre 2 para obtener cual es el número que corresponde a la media.
En este caso, la media es 90 ya que los dos valores que hemos sumado eran los mismos.
Ejemplo cosas impares:

Los valores situados en la tabla azul se han ordenado de menor a mayor desde el 61 al
110. Una vez así, se ha buscado el número en el cual, por debajo y por encima de él se
obtenga el mismo número de casos. Para ello, lo que hacemos es sumar 1 al número
5
total de casos que poseemos para que así sea par; como tenemos 11 casos, hacemos
11+1=12 y a este número que obtenemos calculamos su mitad, 12/2=6. Por
consiguiente, buscamos el 6º número que hemos ordenado y este posee 5 números por
debajo y 5 por arriba, por consiguiente, la media corresponde a 90 puesto que era el 6º
número al ordenarlos.
La mediana solo se puede emplear en variables cuantitativas, pero nos puede ser útil en
alguna cualitativa, ej: en el dolor, y para esta tenemos en cuenta la posición de los
números al ordenarlos, no su valor. La vamos a representar mediante el Gráfico de cajas
y bigotes, en la que el centro de la caja corresponde a la mediana ya que divide en 2
esta de manera exacta.
EJERCICIO. Obtener la mediana de los 10 primeros casos de la velocidad de la marcha 4º

media.
En primer lugar, ordenamos los números de la tabla azul de menor a mayor valor y
observamos que son 10 casos, por lo que es par. Por consiguiente, sabemos que
debemos hallar los dos valores céntricos y sumarlos entre sí. Estos son el 145 y 147, por
lo que obtenemos un valor de 292 que, al dividirlo entre 2 como ya se ha explicado,
obtenemos 146. En este caso, como eran dos números correlativos en los que faltaba el
número que los separa, intuitivamente también lo podríamos haber hallado (145-(146)-
147).
6
Entonces… ¿Cuál es la mejor medida de centralización?
La media es la medida de centralización más usual, pero es poco informativa si existen

datos atípicos o extremos (outliers). En ese caso se usa la mediana, que no es sensible a
la presencia de datos atípicos. Por ello, debemos conocer y entender cuál es la relación
que se establece entre ambas en función de la distribución:
 Si la distribución es asimétrica a la izquierda, la media es inferior a la mediana.
 Si la distribución es simétrica, la media y la mediana coinciden →NORMALIDAD.
 Si la distribución es asimétrica a la derecha, la media es superior a la mediana.
Si nos encontramos frente a un histograma, estos también pueden indicarnos la relación

entre la media y la mediana mediante 4 tipos de gráficas (estas siguen también unos
principios similares a la anterior):
 La gráfica simétrica indica que los datos poseen una distribución normal, estable.
Ejemplos de esto serian el peso o la talla.
 Si la gráfica es asimétrica negativa, la distribución es anormal y hay que investigar
el porqué de ello. Estas se denominan Diagrama izquierda debido a que los
valores inferiores a la media se encuentran escalonados en el lado izquierdo a
esta. Un ejemplo de ello sería el tiempo que tarda un ordenador en averiarse, a
mayor tiempo, mayor probabilidad de que este se rompa.
 Si la gráfica es asimétrica positiva, al igual que en el caso anterior, la distribución
es anormal y hay que investigar el porqué de ello. Estas se denominan Diagrama
derecha debido a que los valores inferiores a la media se encuentran
escalonados en el lado derecho a esta. Un ejemplo de ello sería el tiempo de
espera (a mayor tiempo de espera, menor tiempo queda para que nos llamen) o
7
el número de ingresos (a mayor tiempo, con forme más va envejeciendo la

persona y deja de trabajar, menos ingresos tiene).
 Las gráficas en Forma de U se denominan así debido a la similitud de su forma
con una U ya que posee 2 valores elevados y entre ellos otros más bajos. Es una
gráfica bimodal en la que los datos pueden venir de dos procesos diferentes. P.ej.
Peso de un club deportivo (hombres y mujeres).
4. Dispersión (donde se sitúan los valores alrededor).

Recordemos que la dispersión nos permite medir la distancia entre los datos de una
variable estadística, ya que son los valores más alejados de la zona céntrica, por lo que
podremos medir la distancia entre estos.
En este caso, la gráfica izquierda posee valores más cercanos a la línea media mientras
que la derecha, posee valores más alejados a la línea media.
Para la realización de nuestro estudio, y que nos sea favorable, nos interesa que las
variables no estén ni muy alejados ni muy cercanos, es decir, que la dispersión no sea
muy grande pero tampoco muy pequeña.
Principalmente, podemos destacar 3 tipos de variables de dispersión que son, el rango,
la varianza y la desviación típica. A continuación, vamos a ir desarrollando cada uno de
ellos más detalladamente.
En esta gráfica podemos ver como la media
coincide en ambas (la línea de puntos), pero,
sin embargo, la dispersión es diferente ya que
una posee una baja dispersión y la otra la
presenta más elevada.
8
4.1. Rango o amplitud (R).

Esta se define como la diferencia entre el valor máximo y mínimo, es decir, se
corresponde con los valores que determinan la anchura de las variables. Esto se ve más
fácil en una gráfica o en las variables una vez las hayamos ordenado de menor a mayor.
Nos va a permitir tener una idea de la dispersión, sabiendo que, cuanto mayor es el
rango, más dispersión hay entre los datos.
Para calcularla restaríamos el valor más grande menos el más pequeño. Por ejemplo, si
poseemos valores que van del 7 al 12, el rango lo obtendríamos determinando cuantos
números hay de uno a otro. Por ello realizaríamos una resta.
La desventaja que posee el rango, es que no tiene en cuenta la distribución de los datos,
es decir, le da igual el número de veces que poseamos un mismo valor. Solamente tiene
en cuenta cual es la consecución de los números. Por ello, el siguiente ejemplo, en el
que se observa que no poseemos ningún dato con el valor 8 o 9 y si poseemos 3 datos
con el valor 12, no varían cual es el rango. Esto se debe a que entre el 12 y el 7 sigue
habiendo 5 datos, estén o no. Además de ello, va a ser muy sensible a la presencia de
datos extremos, por lo que el rango varía mucho. Si poseemos, por ejemplo, 5 paciente
de los cuales, 4 de ellos poseen una edad de entre 1-4 y resulta que, el 5º paciente posee
50 años. A consecuencia un único dato, nuestro rango cambia mucho.
Hay que tener en cuenta que, debido a esto, no nos sería muy útil cuando existen valores
muy extremos, por ello, empleamos la varianza en estos casos.
4.2. Varianza (s2).
La varianza si nos permite calcular la distancia entre dos datos, aunque estos sean
extremos. Por ello, se define como la medida o distancia de los datos respecto a la línea
media. Además, es el promedio de la distancia de cada uno de los datos con respecto a
la media, elevado al cuadrado, entre el número de casos menos 1.
9
La razón por la que se elevan al cuadrado los valores de la distancia entre los puntos y
la línea media es para evitar que se obtenga un valor de cero, ya que si no estaríamos
sumando un valor positivo (si se encuentra en el lado derecho de la línea) y uno negativo
(si se encuentra en el lado izquierdo) y habría altas probabilidades de obtener números
negativos o 0 al anularse las medidas. Es por ello por lo que la varianza viene expresada
en unidades al cuadrado s2, o bien, σ2 .
S2= varianza ∑= sumatorio
X= variable n= Número total de casos
Ejercicio. Calcula la media y la varianza a partir de la siguiente tabla:
En el examen seguramente caiga un ejercicio como este, en el que habrá que calcular la
media y la varianza.
Recordemos que para sacar la media únicamente tenemos que sumar todas las variables
y dividirlo entre el número total de casos, en este caso 10. De esta forma, se obtiene
88.5
Para la varianza vamos a hallar los valores que salen en la 3ª columna. ¿De dónde salen
estos valores? Es muy fácil, únicamente debemos coger la variable que tenemos y
restarle la media y recordemos que debíamos elevarlo al cuadrado (ejemplo: (90-
88.5)2=2.25). Realizaríamos esa operación en todos los casos y obtendríamos los
números de la columna. Posteriormente sumamos todos y así obtenemos 1728’5 para
posteriormente dividirlo entre el número total de casos-1. Al realizar esa operación
obtenemos el resultado.
Al obtener la varianza, realmente no obtenemos nada, ósea, me explico. Nosotros
obtenemos un número que lo vemos y pues bueno, ahí está, pero realmente si vemos
ese valor por sí solo no sabemos qué hacer con él ni para que nos sirve. Es por ello por
lo que, a partir de la varianza, podemos sacar la desviación típica.
4.3. Desviación típica (s).
La desviación típica es la raíz cuadrada de la varianza S= √s2 . De esta forma nos
quedamos con la distancia media final que será lo misma tanto en los valores
positivos como negativos.
10
Si seguimos con el ejemplo de antes, en el que s 2 =192 y hallamos s=√192= 13’85.

De esta forma, tenemos una distancia media de 13’85 hacia la derecha de la
gráfica y de -13’85 hacia la izquierda de la línea media.
Al final siempre vamos a trabajar con la media y la desviación típica, teniendo en
cuenta que la varianza es el camino para llegar a la desviación típica. Por ello, si
la varianza es mayor, la desviación típica será mayor y por ello los datos estarán
más alejados del centro (lo mismo si fuesen menor, pero al revés, estarían más
juntos).
Para entender completamente para que sirve esta vamos a ver el siguiente ejemplo:
Estos 3 casos poseen la misma media de 15.5, por lo que si únicamente tuviésemos ese
valor nosotros podríamos pensar que los casos serían iguales. Sin embargo, si
observamos la representación gráfica vamos que son completamente diferentes. Esto
se debe a la presencia de casos aislados u extremos en cada caso, por ello, si hayamos
la desviación típica de cada caso, vemos que estos ya si varían y no coinciden. De esta
forma, podemos ver como el caso C es la que mayor s presenta puesto que en los
gráficos se ve que sus datos están más alejados y, por eso, mayor distancia entre ellos y
mayor s.
A continuación, se muestran diferentes formas de representar la dispersión. Tener en
cuenta que en las 3 gráficas se representa la misma y la media está sobre los 70-75.
11
Si observamos estas 3 gráficas, podemos determinar que la del centro es la que

posee mayor dispersión. Esto se debe a que es en la que la barra vertical (desviación
típica), la que se encuentra situada justo en la mitad de la línea horizontal del
diagrama (lo que sería la media), es mucho más alargada que la de los otros dos
diagramas. Esta línea por consiguiente representa la anchura, la distancia entre los
valores.
Aquí la profesora dejó tiempo para que hiciésemos un ejercicio exactamente igual
que el anterior que he explicado cómo se hacía, el de hallar la media y la desviación
típica que he dicho que saldrá uno por el estilo en el examen. No voy a resolverlo
entero, voy a volver a explicar cómo se haría el 1er caso por si acaso no se ha
entendido antes muy bien y directamente pongo los resultados y explico cómo
calcular la desviación típica.
En 1er lugar, ordenamos todos los casos de menor a mayor, de 100-170 y calculamos
la media, la resta del valor más alto menos el pequeño (170-100=70). A partir de
aquí, vamos a calcular la desviación de cada caso; el caso 1 sería: (165-70)2=9025, y
haríamos lo mismo con los demás casos. Luego los sumamos todos y dividimos entre
9, ya que son 10 casos (10-1) y así sacamos la s2. Una vez tenemos que s2= 384’2,
para hallar la desviación típica solo tenemos que hacer la raíz cuadrada de eso;
S=√384’2 =19’6.
12
En prácticas, trabajaremos con un

programa que nos calculará directamente
todos estos valores y nos ahorraremos
nosotros el hacerlo. En este, directamente
obtendremos una tabla como la siguiente:
5. Valores de centralización para variables cualitativas.

Cuando estamos con variables cualitativas, no podemos calcular la media, calcularemos
la moda (Mo), entendiendo como tal el dato o datos con mayor frecuencia absoluta. Es
decir, la categoría que aparece un mayor número de veces, que más se repite. Se
relaciona entonces con la frecuencia absoluta.
Por consiguiente, la moda también se puede emplear en variables cuantitativas para
determinar cuál es la que más se repite, aunque sobretodo la vamos a emplear para las
cualitativas. Además, esta no se ve afectada por los valores extremos o aislados, ya que
no tiene en cuenta ni el valor mínimo ni máximo, no se fija en la variable en sí si no en
el número de veces que se da (es una medida robusta).
Algo importante es que no tiene por qué tener siempre moda una distribución, como es
el caso E de las siguientes gráficas, ya que todas las materias se repiten más o menos el
mismo número de veces. Por otro lado, existen también casos en los que podemos estar
ante variables bimodales como es el caso B o F, puesto que más de 1 categoría se repite
un número elevado de veces. La A sería simétrica, la C distribución asimétrica positiva y
la D distribución asimétrica negativa (ya explicado antes).
La moda puede ser muy parecida a la mediana, aunque no necesariamente tiene porque
ser igual ya que, recordemos que, la mediana nos dividía la muestra en 2 partes
13
exactamente iguales (50%). La gráfica izquierda sería asimétrica negativa, la del centro
simétrica (los 3 datos coinciden) y, la derecha, asimétrica positiva.
Importante: Hay que fijarse que, en las asimétricas, la moda siempre coincide con la
parte más alta de la gráfica, la mediana es la parte que divide en los partes iguales (de
anchura, 50%) la gráfica, y la media, en donde la gráfica comienza a ascender o
descender (recordar que la gráfica va de izquierda a derecha de menor a mayor).
Ejercicio. Calcular la moda:

La moda es jubilado ya que es la categoría
que mayor número de veces se repite
respecto a las demás.
A la hora de presentar en los artículos los
datos obtenidos, se realizan las tablas
descriptivas. En estas, se recogen variables
tanto cuantitativas como cualitativas del
estudio, con sus correspondientes datos.
En el siguiente ejemplo se ha analizado el
caso de un estudio de pacientes con EPOC.
Edad: cuantitativa
Nivel de educación: cualitativa, ordinal.
Características clínicas (FEV1 y FVC):
cuantitativas.
Historia de fumador (actual, antiguo, nunca
ha fumado): cualitativa, ordinal
Grupo Old: cualitativa, ordinal.
CAT (estado de salud): cuantitativa que se
transforma en cualitativa.
Escala MRC, similar a la EVA: cualitativa,
ordinal.
14
Resumen:
 Hay valores centrales que para variables cuantitativas son la media y la mediana.
 Para la cualitativa nos vale la mediana y la moda.
 Luego tenemos las medias de dispersión que nos valen para las cuantitativas, no
a las cualitativas.
 La desviación típica nos es más práctica al ser válida si existen valores extremos,
mientras que el rango no lo es.
 La mediana y la moda son variables más robustas que la media, ya que si se
pueden emplear cuando existen valores extremos.
15
Loli Martínez
Bloque 2. Tema 3.
LA POSICIÓN EN LA DISTRIBUCIÓN EN LA DISTRIBUCIÓN Y EL
MODELO NORMAL.
1. Introducción.
Continuando con el hilo (como se distribuyen las variables, como se distribuyen los datos y como los podemos
resumir), ya sabemos como son nuestros pacientes y podemos observar a simple vista (nos podemos guiar por
la media) si estamos teniendo buenos resultados, pero no podemos saber si los cambios que estamos viendo en
nuestra población son relevantes o no (eso se ve con la estadística inferencial). Con la estadística descriptiva
simplemente describimos la población.
Se estudian los datos con las tablas de frecuencias o mediante gráficos, después se sintetizan los datos sobre
todo para variables cuantitativas en las que tenemos muchísimos datos.
Podemos saber cuál es el valor que nos va a dividir la muestra en dos, pero ¿y si quiero saber donde se encuentra
el 25% de mis sujetos?, porque quiero comparar con respecto al 75% (no se emplearían las mismas técnicas en
una patología de rodilla en un paciente por debajo del 25% que en uno que esté por encima del 75% de capacidad
de andar, ya que los pacientes por debajo del 25% se encuentran mucho peor). Esto nos ayuda a saber que
pacientes están por debajo del 25%, del 50%, etc a la hora de por ejemplo aplicar una técnica o de medir. Esto
lo vamos a conseguir con las medidas de posición.
2. Medidas de posición.
Las medidas de posición son indicadores usados para señalar una determinada posición dentro de una
distribución de frecuencias (esto es: el valor que tiene cada caso, y lo situamos en un gráfico/tabla para ver
cómo se comporta), es decir, las medidas de posiciones es ver en qué lugar se encuentran. Una medida
de posición puede ser la mediana (Me), que nos divide nuestra muestra en dos, es decir, es el valor
que me va a dejar el 50% de los sujetos por debajo y el 50% restante por encima. Como medidas de
posición también tenemos: Cuartiles, Deciles y Percentiles.
CUARTILES
Dividimos nuestra muestra en 4 porciones de un 25% cada una. Tenemos 3 cuartiles (Q1, Q2, Q3).
• Cuartil 1 (Q1). El Q1 deja la cuarta ( ¼ ) parte (25%) de los datos por debajo de él.
𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑸𝟏 =
4
• Cuartil 2 (Q2). El Q2 deja las dos cuartas ( 2 /4 ) partes (50%) de los datos por debajo de él. Se
corresponde con la MEDIANA.
2 𝑥 𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑸𝟐 =
4
• Cuartil 3 (Q3). El Q deja las tres cuartas ( 3 /4 ) partes (75%) de los datos por debajo de él.
𝑸𝟑 =
4
Loli Martínez
Ejemplo: que valor de la velocidad de la marcha me deja el 25% de mis sujetos por debajo, es
decir el valor que utilizo como punto de corte para ver que sujetos están peor:
1º. Ordenar los valores de menor a mayor
2º. Aplicamos la fórmula:

𝑄1 = 4
Como es una muestra PAR vamos a utilizar la MEDIA, de los valores 2º y 3º.
Ejemplo: 70 (2º) + 76 (3º) / 2 = 73 (Q1)
Por debajo de este valor, por ejemplo, quien tenga 70 va a estar dentro de ese 25% de pacientes que están peor
𝑄2 = 4
Como es PAR hacemos la MEDIA entre el valor 5º y 6º (Si fuera IMPAR si
cogiésemos el valor que este en la posición 5º). Ejemplo: 90 (5º) + 90 (6º) = 90 (Q2)
𝑄3 = 4
Como es una muestra PAR hacemos la MEDIA con los valores 7º y 8º.
Ejemplo: 95 (7º) + 100 (8º) = 97,5 (Q3)
DIAGRAMA DE CAJAS Y BIGOTES

Se basa en los cuartiles. La línea de en medio, que es la mediana, se
corresponde con el Q 2. El pico de la caja inferior se corresponde al Q1, y
el pico superior al Q3. Los bigotes con los valores mayor y menor. Si
tenemos valores muy externos ‘Outlayers’ se señala fuera del diagrama
como un caso aislado (el bigote no llega hasta esos valores).
RANGO INTERCUARTÍLICO (RIQ)

Es otra medida de dispersión, que se calcula con los cuartiles. El RIQ nos va a compensar las carencias
del rango o amplitud (R) (intervalo entre el valor máximo y el mínimo, su diferencia). En este rango
vamos a encontrar a la mayor parte de nuestra población.
El RIQ es la diferencia entre Q3 y Q1, por lo que no toma los valores más externos, sino que toma los
valores que concentran el 50% de la muestra (la caja del diagrama de cajas y bigotes, desde el pico
inferior al superior). El RIQ tiene en cuenta la distribución de la variable, por ello va a ser una medida
robusta y es poco sensible a los datos atípicos. El RIQ se utiliza con MEDIANA, va del 25% al 75%, en
el ejemplo anterior seria:
RIQ = Q3 – Q1 = 97,5 – 73 = 24,5
Loli Martínez
La distribución 1 (curva desplazada a la derecha), es una asimetría negativa / izquierda, sesgo

negativo (porque vamos a tener más gente en el lado negativo).
La distribución 2 son simétricos
La muestra con la distribución 3 (curva desplazada a la izquierda), es una asimetría positiva /
derecha, sesgo positivo (porque vamos a tener mas gente en el lado positivo).
El RIQ es una buena medida de dispersión en estos casos, es decir, para distribuciones sesgadas, ya
que no tiene en cuenta la mediana sino la diferencia entre Q3 y Q1.
DECILES
Dividimos nuestra muestra en 10 porciones de un 10% cada una. Tenemos 9 deciles (D1, D2, …, D9).
Es para ir más al detalle. Se calcula igual que los cuartiles:
• Decil 1 (D1). El D1 deja la décima ( 1/10 ) parte (10%) de los datos por debajo de él.
𝑫𝟏 =
10
• Decil 2 (D1). El D2 deja las dos décimas ( 2/10 ) partes (20%) de los datos por debajo de él.
𝑫𝟐 =
10
• Decil 5 (D5). El D5 deja las cinco décimas ( 5/10 ) partes (50%) de los datos por debajo de él.
Se corresponde con la MEDIANA (dividiría la muestra en 2).
5𝑥 𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑫𝟓 =
10
Loli Martínez
PERCENTILES
Dividimos nuestra muestra en 100 partes de 1% cada una. Son útiles para ser muy muy precisos. A los
niños cuando son pequeños se les sitúa en un percentil en base al peso y a la altura. Se calcula igual
que los anteriores.
• Percentil 1 (P1). El P1 deja la 1/100 parte (1%) de los datos por debajo de él.
𝑷𝟏 =
100
• Percentil K (PK). El PK deja la K/100 parte (K%) de los datos por debajo de él.
𝐾 𝑥 𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠
𝑷𝑲 =
100
• Percentil 50 (P50). El P50 deja la 50/100 parte (50%) de los datos por debajo de él. Se
corresponde con la MEDIANA (dividiría la muestra en 2).
𝑷𝟓𝟎 =
100
→ RESUMEN CUARTILES, DECILES Y PERCENTILES
Ejercicio: calcular los cuartiles para la muestra de la velocidad de la marcha en la 4º medida.
1º. Ordenar los valores de menor a mayor:
2º. Fórmulas:
Q1= 10/4 = 2,5 ; (130 + 135) / 2 = 132,5 (la media entre el 2º y el 3º valor)
Q2= (2 x 10) /4 = 5 ; (145 + 147) / 2 = 146 (la media entre el 5º y el 6º valor)
Q3= (3 x 10) /4 = 7,5 ; (150 + 153) / 2 = 151,5 (la media entre el 7º y el 8º valor)
Loli Martínez
Q1 = 132,5
Q2 = 146 (MEDIANA)
Q3 = 151,5
3. Posición en la distribución y el modelo normal

¿Es relevante la posición en la distribución? → Sí
Tenemos 2 pacientes: Antonio (60 años), que es una persona mayor, y tiene una velocidad de la
marcha a los 6 meses (ya está mas o menos recuperado) de 120 cm/s, y también tenemos a Ana (20
años), que es una chica joven cuya velocidad de la marcha a los 6 meses es de 120 cm/s. Aunque
tengan la misma velocidad de la marcha, LA RECUPERACIÓN DE AMBOS NO ES IGUAL.
¿Ana está mal con respecto a Antonio? ¿Los resultados han sido buenos o malos?
Para Antonio la velocidad media de la marcha para su
edad es de 70 y él tiene una velocidad de 120, por lo
tanto, hemos tenido buenos resultados con él.
Para Ana la media de la velocidad de la para su edad
es de 150 y ella tiene 120, por lo que los resultados
no son buenos.
Por ello es importante la posición dentro de la distribución de la frecuencia.
Tenemos que estandarizar, pero NO podemos tener una media o una distribución para cada paciente
de un rango de edad, de una edad característica, de un sexo … es imposible, por tanto, vamos a tener
que transformar los valores para que sean comparables.
4. Modelo teórico de distribución normal

Para estandarizar los valores lo vamos a hacer a través del MODELO DE DISTRIBUCIÓN NORMAL O
DISTRIBUCIÓN GAUSSIANA.
En la imagen vemos una distribución normal/Gaussiana también
llamada campana de Gauss, ya que fue desarrollada por Carl
Friedrich Gauss. La distribución de la gráfica tiene forma de
campana.
En la mayoría de las variables aleatorias continuas como por
ejemplo la altura, o también el peso: no va a ser para todo el
mundo el mismo porque una persona come más, otra come
menos o hace más deporte, etc. Por ello vamos a tener que el
Loli Martínez
peso va a variar según la persona, pero sí que se pueden concentrar en

torno a una media (en la variable peso hay que tener en cuenta el sexo), por lo
que en la distribución normal vamos a tener pacientes que pesen menos,
una media donde se van a concentrar la mayoría de los casos y pacientes
que van a pesar más.
Siempre van a seguir mas o menos esta distribución si se comportan de
manera normal las variables y no son casos muy raros.
4.1. Modelo de distribución normal

En esta distribución normal, está determinada por la media (μ, ), que está en el centro y por la
desviación típica (s, σ). Se designa por N (μ, s).
En una distribución normal simétrica, la Media, la Mediana y la Moda van a estar en el centro de la
distribución.
Si tenemos una distribución sesgada (positiva o negativa), ya no coinciden en el centro la media, la
mediana y la moda y ya no seria una distribución normal (en esa distribución está pasando algo, están
puntuando o muy por debajo o muy por encima).
El punto de inflexión (hay que tenerlo muy en cuenta) es la distancia a la desviación típica desde la media.
Nuestro punto inicial siempre va a ser la media y podemos ir por arriba o por debajo a desviaciones
típicas, es decir, estoy en mi punto inicial y puedo dar un paso hacia delante o un paso hacia atrás (ese
paso sería una desviación típica y puedo dar uno, dos o tres que sería el máximo) podemos tener 3
desviaciones típicas por arriba y 3 desviaciones típicas por debajo.
La Regla Empírica (68-95-99), es muy importante. El 68% de la población de mi muestra se concentra
a ± 1σ, es decir si parto de la media puedo ir ‘un paso’ hacia arriba y tenemos un 34,1 % de la población
y si voy un paso por debajo también tenemos un 34,1 % de la población, en total tendríamos un 68%
(a nuestra media le sumamos o le restamos una desviación típica). Si nos vamos ahora a 2 desviaciones
típicas por arriba y por abajo (± 2σ), ahí encontramos el 95% de nuestra población. A 3 desviaciones
típicas por arriba y por abajo (± 3σ) tendríamos al 99% de nuestra población (tenemos prácticamente
a toda la población de nuestra muestra dentro de ese rango desde - 3σ hasta + 3σ).
Loli Martínez
4.2. Propiedades de la distribución normal

La distribución normal tiene unas propiedades características (en una distribución sesgada hay ciertos
análisis que no podemos utilizar porque nos va a falsear los resultados).
▪ El campo de existencia o dominio, es decir, el rango que puede abarcar, puede ser cualquier
valor real de la recta desde - ∞ a + ∞ porque la línea de la gráfica nunca tiene fin, se pega
mucho al eje X pero NUCA llega a ser 0.
▪ El eje de abscisas es una asíntota de la curva, la ‘cola’ de la distribución es una línea de la curva
que se acerca progresivamente a la línea pero que nunca llega a tocar.
▪ El área total bajo la curva es igual a la unidad (1).
▪ Tiene una única moda (no va a tener 2 ‘picos’) y tiene que coincidir con su media y con su
mediana (si tiene una única moda, media y mediana tiene que ser simétrica).
▪ Es simétrica respecto a su media (μ): tenemos la misma probabilidad (50%) de un dato menor
respecto a la media y el 50% de observar un dato mayor respecto a la media.
▪ La curva va a crecer hasta la media y a partir de esta decrece (vamos a tener personas con valores
bajos, la mayoría se va a concentrar en el centro y después personas con valores más altos ).
▪ Los puntos de inflexión de la curva se corresponden a la desviación típica(σ). Si la desviación
típica es mas grande (si los valores están mas alejados/dispersos del centro) la curva va a ser
mas plana por lo que los puntos de inflexión se sitúan a ± σ de la media.
▪ El 95% de los valores se concentra entorno a ± 2σ (en los artículos pone intervalo de confianza (IC)
95%), es decir, existe un 95% de posibilidades de observar un valor comprendido entre el
intervalo. Nosotros vamos a dar un dato de media y también un rango donde puedan ‘bailar’
los valores, donde se sitúen la mayoría de nuestra población (si nuestra media es 8 y tengo un
paciente que tenga 7,5 no es raro, aunque no coincida exactamente con la media, por lo que
tenemos que da un rango donde los valores los podemos considerar como aceptables).
También se puede coger el 99%. Es el rango de erros que estemos dispuestos a asumir, ya
que si cogemos un intervalo mas pequeño el rango de error posiblemente sea más grande ya
que nos estamos dejando a muchos pacientes fuera.
▪ La forma de la campana va a depender de la media (μ) y de la
desviación típica (σ). La media va a indicar el punto más alto de la
campana y la desviación típica el grado de apuntamiento. Si σ es muy
grande la curva va a ser muy aplanada (la azul) y es porque tenemos
muchos valores dispersos con respecto a la media. Si tenemos una σ
pequeña, la curva va a ser muy apuntalada/estrecha (roja). No existe
una única distribución normal, nosotros tenemos una base, pero
existe una amplia variedad de distribuciones normales con una
forma común que van a estar determinadas y diferenciadas por su
media y su desviación típica.
Loli Martínez
Ejercicio: Altura media de los hombres = 184 cm y la σ = 8cm → N (184, 8). Teniendo en cuenta esto
y que el modelo normal es apropiado para esta distribución, entre que valores se encuentra el 68,26%
es la población? ¿y el 95%?
Para sacar el 68% → 184 - 8 = 176 = -1σ

184 + 8 = 192 = +1σ
Para sacar el 95% → 184 - 16 = 168 = -2σ

184 + 16 = 200 = +2σ
Ejercicio: μ = 100 y σ =16, ¿entre que valores se encuentra el 68%, el 95% y el 99%?
Para sacar el 68% → 100 - 16 = 84 = -1σ
100 + 16 = 116 = +1σ
Para sacar el 95% → 100 - 32 = 68 = -2σ
100 + 32 = 132 = +2σ
Para sacar el 99% → 100 – 48 = 52 = -3σ
100 + 48 = 148 = +3σ
¿Si el intervalo de normalidad corresponde al 95% centra, de los sujetos, identifica el intervalo
en el que se encontrará ese %. Entre el 68 y el 132, los valores que estén por el centro es lo normal.
¿Qué % de personas tendrá entre 116 y 132 puntos? Hay 13,6 % (entre +1σ y +2σ). ¿Y entre
68 y 84 puntos? Hay lo mismo, 13,6 % (entre -2σ y -1σ)
5. Modelo de distribución normal Tipificado (Z)

Este modelo es diferente del modelo de distribución normal.
Un modelo de distribución normal estándar o tipificada es la más utilizada y es aquel en el que su

media es 0 y su desviación típica es 1 → N (0, 1). Para este modelo se ha estudiado todo su
comportamiento, por lo que a partir de un estándar podemos estandarizar nuestros valores. Los
valores que vamos a obtener a través de este modelo se llaman Valores Z (es un valor tipificado) y va
a ser nuestro modelo de referencia al resto de distribuciones normales. A partir de este modelo
también vamos a poder encontrar probabilidades y percentiles para el resto de las distribuciones
normales.
Como hemos visto la media del hombre no es igual al resultado de la mujer, por lo que cuando
tenemos muchos sujetos tenemos que estandarizar para poder comparar y más si son de
distribuciones diferentes
5.1. Cálculo e interpretación de valores tipificados

𝑋−μ
Para estandarizar utilizamos la fórmula: 𝑍 = , donde el valor que queramos estandarizar (X) se
σ
resta a la media de nuestro modelo (μ) y se divide entre la desviación típica (σ).
A partir de cualquier variable X que siga una distribución N (μ, σ), se puede obtener otra variable Z con
una distribución normal estándar N (0, 1).
Los valores Z nos va a servir para averiguar si un valor determinado se encuentra por arriba, por debajo
o es igual a la media (μ: positivo, negativo o igual) y a que distancia se encuentra de esta. En el caso de
antes de Antonio y Ana. Los valores Z nos van a servir para averiguar si este valor de 120 es un valor que puede
Loli Martínez
ser positivo (buen resultado) o negativo (no hemos tenido buenos resultados). Ana tenia la misma media que
Antonio, pero el resultado es totalmente diferente.
Queremos saber de 80 cm/s (velocidad de la marcha), donde se sitúa y a que distancia se sitúa de la
media de nuestro modelo de distribución. Para este modelo, la media es 69 y la DT es 13 → para
averiguar 80 sustituimos en la fórmula (X=80, μ= 69, σ=13): Z = 80-
69/13 = 0,84 , vemos que se encuentra a 0,84 de la media, por lo que
a simple vista podemos considerar que esta dentro de nuestro rango
de normalidad (dentro de ese 95%) ya que no está más allá de 2 DT.
Para 50 cm/s sería igual: Z = 50-69/13 = -1,46 (también podemos
tener valores negativos), el valor 50 se encuentra a 1,46 pero por
debajo de la media. Sigue estando dentro de nuestro rango de
normalidad (está dentro de las ±2 DT).
El modelo de distribución normal tipificado nos permite comparar valores, aunque su distribución sea
diferente (nos va a permitir comparar sujetos con distinta distribución):
Velocidad media inicial: Quiero averiguar 59 y su media es 69 y la DT=13; Z = 59-69/13 = -0,76
Velocidad media a los 6 meses: Z= 128-132/29 = -0,13 (ha mejorado y está casi en la media).
Otro ejemplo: en una distribución normal con una media de 69 y DT de 13 [ N(69, 13)]cuando
estandarizamos, su media en el modelo normal tipificado va a ser 0 y su DT 1 (por arriba o por abajo).
Si usamos el valor 69 (Z = 69-69/13= 0), ese valor nos va a indicar que está en la media. Por lo tanto,
nos permite ver a que distancia se encuentra de la media para saber si una persona va bien, si va mal
o si se encuentra dentro de unos valores normales.
Loli Martínez
5.2. Encontrar probabilidades para Z con la tabla Z

¿Qué probabilidad hay de que Juan a los 6 meses tenga una velocidad de la marcha de 150 cm/s?, a
partir del modelo normal tipificado vamos a saber que probabilidad tenemos. Quizá la probabilidad
es tan baja que sea imposible alcanzar los 150 cm/s por tanto nuestro objetivo tiene que ser más bajo,
tiene que ser un objetivo realista.
Esto lo vamos a ver con la Tabla Z, que es una tabla de probabilidad. Para este modelo normal
tipificado con media = 0 y su DT = 1 [N(0,1)], se han estudiado todas sus probabilidades, es decir, todos
sus valores hasta prácticamente el 99,7 % de la población. Por lo que, a partir del modelo normal
tipificado si estandarizamos nuestros valores vamos a poder determinar la probabilidad que hay en
ese valor.
A la hora de calcular las probabilidades, la tabla Z nos da solo probabilidades para datos menores o
iguales a un determinado valor Z (si tenemos un valor ≤ podemos mirar directamente en la tabla Z). Cuando
queremos obtener la probabilidad de un valor mayor que Z, tendremos que aplicar un criterio que
veremos más adelante. La Tabla Z solo es aplicable si una distribución sigue un comportamiento
aproximadamente normal, si tenemos una distribución con valores atípicos o con asimetrías positivas
o negativas no lo vamos a poder aplicar.
Siguiendo con el Ejemplo de Juan, queremos saber la probabilidad de encontrar un valor de 150 cm/s
dentro de una distribución cuya media es 132 y DT es 29 [ N(132,29)]. Nos piden: P(X≤150) →
probabilidad para hallar un valor menor o igual de 150. Vamos a tipificarlo (estandarizarlo) con nuestra
formula, obteniendo que:
Z = 150 -132/29 = 0,62 (este es nuestro valor tipificado)
P (X≤150) = P (150-132/29) = P (Z≤0,62)
Como sigue una distribución normal vamos a la tabla Z y buscamos a cuál correspondería el 0,62 →
tenemos que buscar en las filas la unidad (si llega) y el primer decimal (va de 0,0 a 3,9) que hemos
obtenido al tipificar y en las columnas el 2º decimal (va de ,00 a ,09), en nuestro caso correspondería
al 0,7324, esto al multiplicarlo x100 obtenemos el %, que es en este caso es 73,24%.
Esto nos indica que tenemos la probabilidad de que Juan tenga un valor inferior o igual (de la
velocidad de la marcha a 150 cm/s a los 6 meses) es del 73,24% (esto es la forma de interpretarlo).
La Tabla Z nos la dan en el examen
A valores más pequeños, es decir, cuanto mas cercano esté a las medias, menor es la probabilidad
porque abarcamos un menor rango de población.
Para datos mayores a un determinado valor Z: la amplitud articular de rodilla sigue una distribución
aproximadamente normal (si en un problema pusiera que sigue una distribución no normal NO podríamos
aplicar esto y tendríamos que poner que no es aplicable porque no sigue una distribución normal) con una
media de 96º y una DT de 10, ¿probabilidad de que una persona tenga una amplitud articular mayor
a 100º (la tabla Z solo nos da probabilidades iguales o menores).
En estos casos tenemos nuestra interpretación de la distribución normal con la media y la desviación
típica: N (96, 10) y tipificamos. Tenemos que el valor tipificado es 0,4 ( Z = 100-96/10 = 0,4) y yo quiero
una probabilidad mayor, lo que tenemos que hacer, como el área bajo la curva es 1 para obtener el
valor mayor, tendremos que restarle ese 1.
P (X>100) = P (Z>100-96/10) = P (Z>0,4)
Loli Martínez
Nos vamos a la tabla Z y vemos que el valor de 0,4 es 0,6554, para obtener la parte de arriba (la tabla
Z es hacia abajo) tendremos que restarlo → 1 – 0,6554 = 0,3446. Si esto lo multiplicamos x100
obtendremos el % → 34,46% de probabilidad de obtener un valor mayor a 100.
P (Z > 0,4) = 1 – P (Z≤0,4) → P (Z≤0,4) = 0,6554 → P = 1 – 0,6554 = 0,3446 x 100 = 34,46%
Ejercicio: Velocidad después de 6 meses de tratamiento en una población con distribución

aproximadamente normal. μ = 132 cm/s, σ =29 cm/s. ¿Probabilidad de que una personal tenga una
velocidad menor a 180cm/s? ¡¡¡Ejercicio tipo EXAMEN!!!
1º. Tipificar: Z = 180-132 / 29 = 1,65 (valor tipificado)
Tabla Z (buscamos en la fila 1,6 y en la columna ,05)→ 0,9505 x 100 = 95,05%
Ejercicio: Utilizando la tabla Z, indica el % de casos que se encuentra en cada una de las siguientes
regiones en un modelo normal estandarizado.
a) Z >1,5. Al ser mayor, para representarlo hay que dibujar un circulo alrededor de la zona que
es (imagen, circulo verde).
P (Z > 1,5) = 1 – P (Z≤1,5) = 1 – 0,9332 = 0,0668 → 0,0668 x 100 = 6,68%
b) Z < -2,25 (el signo negativo solo nos interesa a la hora de representar, para buscar en la tabla
Z nos da igual). Como es un valor menor o igual, buscamos directamente en la Tabla Z:
Tabla Z: 0,9878 x 100 = 98,78 %
c) -1 < Z < 1,15. Hay que buscar los 2 valores y sacar la diferencia:
0,8413 y 0,8749, para encontrar el % y la probabilidad que hay en medio restamos → 0,8749-
8413 = 0,0336 x 100 = 3,36%
Para representarlo tendríamos que ir a -1 y a 1,15 y señalarlo haciendo un circulo.
d) Z < 0,5. Como es un valor menor o igual, buscamos directamente en la Tabla Z:

Tabla Z: 0,6915 x 100 = 69,15%
¿CUÁNDO SE PUEDE CONSIDERAR QUE UN VALOR Z ES “RARO”?

¿A partir de donde es raro encontrar un valor? Está estandarizado que es a partir de más allá del 95%
de los valores (más allá del intervalo de normalidad), es decir, a ±2 DT, los valores que estén por fuera
(por encima de +2 DT o por debajo de -2 DT es raro).
Loli Martínez
También se puede utilizar un 99% y tendríamos que es raro fuera de ±3 DT, pero en la literatura
científica esta estandarizado que se utilice el 95% del valor centrar, porque si obtenemos el 99%
prácticamente estamos tomando todos los sujetos, no podemos considerar ninguno raro porque muy
pocos (a no ser que sea un valor típico muy extremo) van a estar fuera de ese rango, por lo que no nos
es útil. Pasa algo parecido si cogemos solo el 68%, y es que nos estamos quedando cortos (dejamos a
mucha muestra fuera) considerando que una persona no es normal sobre todo cuando lo valores son
muy pequeños, cuando en realidad si se encuentra dentro de unos rangos de normalidad. Por tanto,
cuando los valores estén más allá de esas 2 DT va a ser raro, el 95%.
Si por ejemplo tenemos una distribución: N (90,10), cuando los valores estén más lejos de 110 (por
ejemplo 111; Z= 2,1) o si el valor es inferior a 80 (por ejemplo 63; Z=2,7) se considerarían valores raros,
es decir, fuera de la ‘normalidad’.
5.3. Condiciones para el uso del modelo

Hay unas condiciones para utilizar este modelo, ya que no podemos utilizarlo para todas las
distribuciones porque no todas siguen la normalidad.
¿Cómo sabemos si siguen la normalidad? → Necesitamos unas pruebas para comprobarlo. La simple
exploración visual de los datos nos puede dar una idea inicial rápida de la distribución.
Este histograma de la variable “amplitud articular” no sigue la

normalidad.
El modelo tipificado por tanto no lo podemos aplicar, se utilizarán otras pruebas.

Cuando los datos no siguen la normalidad podemos transfórmalos (mediante un logaritmo, un
logaritmo neperiano, etc para ver si se comportan de forma normal) o bien emplear métodos
estadísticos que exijan que la muestra a analizar no provenga de una distribución normal (métodos
no paramétricos).
Loli Martínez
La distribución anterior,
aunque la transformemos
sigue sin ser normal (tiene
varias modas) (la
distribución normal es
simétrica y con una única
moda, media y mediana).
Cuando una distribución no es normal se van a utilizar otros análisis como los métodos no
paramétricos de análisis (lo veremos en otros temas).
Por todo esto, las CONDICIONES PARA QUE UNA DISTRIBUCIÓN SE APROXIME A LA NORMAL:
- Que sea unimodal y simétrica (porque si no, no podemos aplicar la tabla Z), la media la moda
y la mediana deben coincidir y debe ser igual por arriba y por abajo.
Estas condiciones las comprobamos mediante gráficos y mediante test específicos de normalidad.
MÉTODOS PARA COMPROBAR LA NORMALIDAD:
1. Exploración visual:
1.1. HISTOGRAMA
Es una prueba subjetiva a simple vista nos puede dar información del nº de modas, y si es
simétrica (tiene que ser aproximadamente normal, no tiene por qué ser 100% normal, sino
tener un comportamiento parecido a la normal).
Gráfica izquierda: asimetría

derecha (no sigue la normalidad)
1.2. DIAGRAMA DE CAJAS

Es una prueba subjetiva. Esto cuesta más de ver a la hora de comprobar la normalidad, tienen
que ser muy extremos para ver rápido si son o si no son normales.
Gráfica de la izquierda: bigotes
más o menos nivelados por
arriba y por abajo.
Gráfica del centro: distribución
asimétrica negativa, el bigote de
abajo es bastante más largo.
Gráfica de la derecha:
asimétrica positiva el bigote de
arriba es bastante más largo.
Loli Martínez
En este ejemplo, la normalidad a simple vista sería el gráfico de

la derecha (parece que sigue la normalidad), el gráfico de la
izquierda parece que no sigue la normalidad (es muy subjetivo).
Se puede ver a simple vista, aunque despues hay que comprobar
con un test de normalidad.
2. Gráficos de probabilidad normalidad (datos observados vs d.gaussiana)/ de normalidad:

Estos son los más adecuados para explorar la normalidad porque su función es esa. A la hora de
comprobar si sigue una distribución normal son de mayor utilidad que los histogramas o los
diagramas de cajas.
Estos gráficos contrastan/enfrentan, en un mismo gráfico, el valor observado en nuestra muestra
frente a los datos teóricos que se obtendrían de una distribución gaussiana, es decir, superponen
nuestros valores a la distribución normal tipificada.
La gráfica sería una línea diagonal tontamente recta y los puntitos serian nuestros sujetos (los
datos que vamos recogiendo).
En la imagen vemos que nuestros sujetos están pegados
a la línea por lo que seguiría una distribución normal,
aunque los extremos siempre van a estar un poco más
despegados (pueden diferir un poco).
Tenemos:
- GRÁFICOS P-P: se confrontan las frecuencias acumuladas de la variable a analizar con las de
una distribución normal. (F1 obtenidas vs. F1 distribución normal).
- GRÁFICOS Q-Q (Q-Q plot): se confrontan los cuantiles obtenidos (cuartiles, deciles y
percentiles) con los cuantiles de la distribución normal. En lugar de utilizar todos los sujetos,
va comparando puntos exactos. (Cuantiles obtenidos vs. cuantiles distribución normal).
En términos generales los gráficos de probabilidad normal se tienen que aproximar a la línea diagonal:
si se aproximan a la línea diagonal es que siguen la normalidad (los puntos se superponen a la
diagonal), si se va mucho ya no sigue la normalidad (gráfica derecha)
Distribución normal. Esta gráfica es mesocúrtica
Cuando se despega de la línea teórica por arriba la

distribución es asimétrica positiva (tenemos más
sujetos que puntúan por arriba de la media que por
debajo).
Cuando se despega de la línea teórica por abajo la

distribución es asimétrica negativa (tenemos más
sujetos que puntúan por debajo de la media que
por arriba).
Loli Martínez
En este caso sí que sigue la normalidad, lo que

pasa es que es más estrecha (su desviación típica
es más pequeña), no se separa mucho y es
simétrica por arriba y por abajo (la difusión de los
casos por arriba y por abajo es igual). Esta gráfica
sería leptocúrtica.
Distribución normal, las DT están más alejadas y

la curva es más plana. Esta gráfica sería
paticúrtica.
Es una distribución bimodal (no es normal), tiene

dos modas. Se daría en variables como por
ejemplo el peso de hombres (gráfica derecha) y
de mujeres (gráfica izquierda).
También tenemos una serie de coeficientes que nos van a dar una intuición de la normalidad (para ver
la forma de la distribución):
3. Coeficiente de asimetría de Fisher (g1):
Nos dice si una distribución es simetría o asimétrica (por arriba o por debajo) de la media. Se
calcula con el SPSS.
- Si este coeficiente es 0 o si está cerca de 0 (±0,5) la distribución es simétrica. Existe la misma
concentración de valores a la derecha y a la izquierda de la media. g1 = 0
- Es asimétrica hacia la izquierda cuando el valor sea inferior a 0 (por debajo de 0,5). Existe
mayor concentración de valores a la derecha de la media que a la izquierda. g1 < 0
- Es asimétrica hacia la derecha cuando el valor sea mayor a 0 (por encima de 0,5). Existe mayor
concentración de valores a la izquierda de la media que a su derecha. g1 > 0
Este coeficiente nos sirve si no tenemos la oportunidad de ver un gráfico, si veo que es 0 ya se que
va a ser simétrica y por tanto sigue la normalidad. Y si es diferente de 0 y está bastante alejado
por arriba o por abajo ya sé que es asimétrica por lo que no podremos aplicar las condiciones de
normalidad.
Vemos que el estadístico de asimetría para la amplitud articular es -0,333, esto lo consideramos
como No Normal, sería una asimetría izquierda (hay más % de pacientes que puntúan por debajo
de la media que por arriba):
Loli Martínez
El estadístico de asimetría para la velocidad de la marcha es de 0,075, está muy cerca de 0 (no
sobrepasa los 0,5) por lo que es más o menos simétrica, es decir, la consideramos normal.
Cuando son valores más lejanos como 0,128 o 0,230 ya consideramos que es asimétrica.
Esto es para darnos una idea, tampoco es determinante
4. Coeficiente de aplastamiento o curtosis de Fisher (g2):

Nos dice si la curva está más o menos aplanada en relación con el grado de apuntamiento de la
distribución normal. Esto solo nos da una idea de la forma.
- La mesocúrtica sería una distribución simétrica normal y su coeficiente es de 0 (±0,5). g2 = 0
- La paticúrtica el coeficiente es menor de 0. Es más aplanada, la DT es grande por lo que los
valores están mas dispersos/más alejados de la media. En sus colas hay más casos acumulados
que en una cola de distribución normal. g2 < 0
- La leptocurtica el coeficiente es mayor de 0. Es más apuntada, es decir, los valores están más
proximos a la media, es decir, están más cerca, la DT es mas pequeña. En sus colas vamos a
tener menos casos acumulados que en la de una distribución normal. g2 > 0
Si en la curtosis el estadístico es -1,512 (gráfica izquierda) quiere decir que la forma es una
asimetría izquierda, es paticúrtica. Si en la curtosis el estadístico es -0,75 (gráfica derecha),
también va a ser leptocúrtica
Se acepta que la distribución es normal cuando los 2 cocientes son 0 (g1=0 y g2=0), pero es muy
difícil determinar en una distribución que los 2 cocientes sean 0 porque ninguno sigue una
Loli Martínez
distribución normal tipificada perfecta, siempre hay una cierta variación. Por ello vamos a considerar
normal los valores que son cercanos ya sean positivos o negativos cuando se encuentren a ±0,5.
5. Test estadísticos de bondad de ajustes:

Estos análisis cuantifican de un modo más exacto las desviaciones de la variable a analizar con
respecto a la distribución normal (al final de lo que más nos podemos fiar es de un test estadístico
que me va a decir si una distribución va a seguir o no la normalidad, ya que la curtosis y el
coeficiente de asimetría Fisher, nos puede dar una idea de la forma y podemos considerar si se
considera normal la distribución si se encuentran a ±0,5).
- Test de Kolmogorov-Smirnov: es el test mas utilizado y va a comparar las puntuaciones de los
sujetos de nuestra muestra con el estándar (la distribución normal tipificada), pero ya
compara datos, es decir, los números. Con este no me equivoco si una distribución es normal
o no normal. Es para las muestras en general.
Se plantean 2 hipótesis:
1- Que la distribución sigue la normalidad (Hipótesis nula (H0), con H0 se considera
que la distribución proviene de una distribución normal). Esta hipótesis es
aceptada si el grado de significancia p > 0,05.
2- Que la distribución no sigue la normalidad.
Ahora quiero comprobar cuál es de las 2, es decir, si sigue o si no sigue la normalidad.
Cuando ‘Sig.’ es menor de 0,05 no sigue la normalidad, por lo que rechazamos la hipótesis 1
porque p < 0,05 (pero aceptamos la Hipótesis 2).
Para que una distribución siga la normalidad ese valor tiene que ser mayor a 0,05 , p > 0,05
(si es más bajo no es normal y no podríamos emplear los análisis estadísticos paramétricos
[ya lo veremos]). En este caso aceptaremos la Hipótesis 1. Esto se plantea por un contraste de
hipótesis.
Esta salida del SPSS la veremos en practicas
- Test de shapiro-wilk: para muestras de hasta 50 sujetos. Cuando tenemos mas de 50 sujetos
utilizamos Test Kolmogorov-Smirnov. Es un test muy potente.
- Test chi-cuadrado: es para variables categóricas.
Con los test específicos de normalidad es con lo que menos nos vamos a equivocar y siempre hay que
hacerlos para ver si se aplican o no determinados procedimientos
Estadística y métodos de investigación
Bloque 2. Tema 4
Descripción y síntesis de datos bivariante.
1. Introducción.
Hasta ahora solo hemos visto la descripción y síntesis de datos univariantes, un solo dato
(ej: la edad, la amplitud articular, el sexo…), en los temas anteriores. En este tema vamos
a ver los datos bivariantes, dos datos (ej: la edad y la amplitud articular o la edad y el
sexo o…).
Vamos a determinar cómo comprobar ciertos supuestos, por lo que debemos
plantearnos diferentes preguntas que pueden ser importantes. Para ello, como
queremos ver si existe relación entre las variables, podemos plantearnos preguntas
como:
 ¿La edad puede influir en la amplitud articular de rodilla? Cuantitativa/cualitativa.
 ¿El sexo está relacionado con tener o no tener una patología cardíaca?
Cualitativa/cualitativa.
 ¿El sexo puede estar relacionado con que un paciente tenga más o menos
velocidad de la marcha? Cualitativa/cuantitativa.
2. Estadística descriptiva bivariante.

Se usan para describir las 2 variables (X, Y) de forma conjunta o una variable en función
de la otra. Además, nos van a permitir conocer si existe una relación directa entre esas
variables o incluso si a partir de una de ellas, podemos predecir la otra.
De nuestra base de datos obtenemos los siguientes valores, a partir de los cuales vamos
a determinar cuál es la relación que existe entre ellos.
Si cogemos como ejemplo el sexo, podemos determinar si esto (ser hombre o mujer)
influye en la velocidad de la marcha. Por lo que buscamos como una variable X (sexo),
1
influye en una variable Y (velocidad de la marcha). Para ello, dividimos nuestra población
en dos, hombre y mujer, y determinamos la media de la velocidad de la marcha de cada
variable X puesto que estamos trabajando con variables cuantitativas.
Una vez calculadas las medias es necesario compararlas entre ellas ya que así podremos
conocer si el hecho de ser hombre va a hacer que tu velocidad de la marcha sea mayor
o menor que si fueses mujer o, incluso, a partir de la variable X (sexo) podríamos
predecir si tu velocidad de la marcha va a ser mayor o menor dependiendo de si eres
hombre o mujer.
Importante: Siempre vamos a tener una variable X y otra Y cuando trabajemos con
variables bivariantes.
3. Comparando datos cuantitativos: gráficos y estadísticos.

Como ya dijimos en temas pasados, cuando tenemos variables cuantitativas es más
difícil comparar entre sí, ya que son medias los valores que tenemos. Por ello, si
transformamos estas variables a cualitativas, nos será más sencillo comparar las
variables entre sí.
Por ello, en el ejemplo con el que vamos a estar trabajando todo el rato, la tabla azul de
la 1ª página, vamos a cambiar las variables cuantitativas de amplitud articular (AA_3s)
por cualitativas. De esta forma es más sencillo ya que comparamos una media en
relación a 2 grupos.
Para comparar podemos emplear gráficos o tablas y estadísticos.
2
3.1. Gráficos.
Para realizar la comparación a simple vista podemos emplear los gráficos de cajas y, los
diagramas de dispersión o gráficos de líneas y puntos.
Si nosotros observamos el siguiente gráfico de cajas, podemos intuir a simple vista que
el grupo 2 (derecha), es más joven que el de la izquierda, ya que tiene mayor rango
articular ≥ 70º y si nos fijamos en el eje Y (edad), vemos como es inferior al de la
izquierda. De esta forma solo estamos describiendo, viendo cómo se comporta la edad
en base a la amplitud.
Como podemos ver, mediante un gráfico de dispersión también podemos describir lo

mismo. Además, este se diferencia del anterior porque aquí si podemos observar caso
por caso ya que cada punto es un caso diferente. Así podemos destacar la existencia de
un valor extremo en el grupo de la izquierda.
También podemos verlo mediante los gráficos de líneas y puntos cuando tenemos más
de un grupo. De esta forma, calcularíamos la media de cada grupo y haríamos un punto
donde corresponda y luego se unirían todos los puntos.
3
3.2. Estadísticos.
Cuando ya queremos comparar entre sí los valores entre unos grupos determinados,
debemos recurrir a los estadísticos, es decir, diferencias de medias. No podríamos
emplear esto si trabajásemos con toda una población ya que no podemos abarcar todo
el mundo, tenemos que seleccionar unos grupos.
Para los estadísticos, únicamente tenemos que realizar una resta de la media (DM) de
un grupo y la del otro. En el ejemplo siguiente podemos ver como la media del grupo de
la izquierda es 76 años y el de la derecha es 60 años, por lo que si restamos 76-60= 16
años. Con ello, podemos concluir que los que tienen <70º de amplitud poseen un
promedio de 16 años más que los que tienen ≥ 70º. El termino promedio es similar a la
media, a nivel estadístico, promedio queda mejor que decir media pero no pasa nada si
se emplea esta.
Es muy importante la interpretación de los estadísticos ya que, si nosotros sabemos
calcularlo pero no sabemos a qué hace referencia, no vamos a ningún lado.
Es importante saber que, aunque las medias fuesen iguales en ambos grupos, esto no
influiría en la amplitud articular, ya que lo que nosotros hemos calculado con el
estadístico ha sido la influencia de la amplitud articular respecto a la edad en función de
4
los datos que teníamos. Para intentar describir si a mayor edad hay mayor o menor
amplitud. Si hay diferencia de media, puede haber una asunción o relación.
Hay que tener en cuenta que cuanto mayor es la diferencia entre los grupos, mayor será
la intensidad de la relación, es decir, si las medias fuesen muy diferentes, estos valores
van a depender mucho más el uno del otro. Si por ejemplo nuestra media de edad fuese
mucho más alta en el grupo 1 (el que tiene media de 76 años) daría lugar a que ese grupo
tendría mucha menos amplitud articular.
4. Comparando datos cualitativos: tablas, gráficos y estadísticos.

4.1. Tablas.
Vamos a ver esta vez sí una variable cualitativa está relacionada con que se produzca
otra variable cualitativa. Por ejemplo, que ser hombre o mujer se relacione con padecer
o no una patología cardiaca. Para ello, vamos a emplear las tablas de contingencia (ya
las haremos en prácticas con el SPSS , aquí se llaman tablas cruzadas), en estas
tenemos la variable X en las columnas, la que nosotros queremos saber si a partir de
estas se puede desencadenar otra patología, y la variable Y en las filas. Estas nos
permiten estudiar la distribución de las filas (Y), en cada grupo (X).
Las tablas de contingencia funcionan de tal forma que, si nos vamos por ejemplo para
explicarlo en los que no poseen patología cardiaca, sacaríamos que el total (n) se
obtiene de sumar los hombres y mujeres que no poseen esta (9+11=20) y así con todas
las columnas. A la hora de calcular el % deberíamos realizar la variable que queremos
hallar/n, por ejemplo, hay 9 hombres que no tienen esa patología cardiaca y el total que
no la posee (tanto hombres como mujeres) es de 20, por lo que 9/20= 45%.
También es importante que recordemos lo que es la frecuencia absoluta (n) y la relativa
(%), por lo que en el ejemplo anterior la absoluta sería 9 y la relativa 45%.
Dentro de la tabla podemos diferenciar 2 tipos de distribuciones:
 Distribuciones condicionales: Se corresponde con el interior de las filas y las

columnas, sin tener en cuenta las marginales. Es decir, son los valores del centro.
5
 Distribuciones marginales: Se hallan en los laterales de las filas y las columnas y
son la suma de valores de X e Y de forma independiente. Es decir, son los valores
del lateral, las que están fuera del cuadrado.
4.2. Gráficos.
Para representar estas variables podemos emplear los gráficos de barras agrupadas,
ya que nos representan los datos de dos o más series de un conjunto de datos. Cada
serie se representa en un mismo color y las barras se colocan una al lado de la otra
por categoría de la variable para comparar las series de datos.
Lo que nos interesa es saber interpretar el gráfico, lo otro es meramente informativo

según la profesora.
También se pueden usar los diagrámas de
sectores que representan los datos de dos o más
series de un conjunto de datos. Cada serie se
representa en un mismo color y los datos se
representan en un círculo, de modo que el ángulo
de cada sector representa cada una de las series
de datos.
6
Si tuviésemos más de dos grupos o variables se realizaría todo igual solo que
tendíamos más filas en nuestras tablas descriptivas pero lo demás no cambiaría. En
este caso tenemos 4 variables en cuanto a situación laboral. Los porcentajes los
podemos obtener en función de las columnas o de las filas, lo veremos en prácticas
y en los seminarios.
EJERCICIO 1. En nuestra clínica medimos la velocidad de la marcha. Los resultados

están expuestos en la tabla siguiente por grupos de edad y nivel de velocidad de la
marcha.
1. Indica los n y % marginales de la velocidad de la marcha.
Los valores totales se obtienen sumando los números de cada fila. Ejemplo, en la
velocidad de la marcha baja, habría que sumar 0+2+2 ya que son los valores en cada
rango de edad. Esta suma nos da n=7 y se realizaría igual para la velocidad normal, alta
y total.
7
Como n corresponde al número total, sabemos que este % marginal va a ser el 100% ya
que es el valor máximo que se puede obtener (7/7).
2. Calcular los porcentajes de la d. condicional para X e Y (en relación a las filas).
Para calcular estos solo habría que dividir el valor de la velocidad de la marcha respecto
a la edad que nos interesa, entre el valor de n de esa fila. Ejemplo, en la velocidad de la
marcha baja para edad 60, habría que dividir 0/7= 0%, para 61-75 años sería 2/7= 28’6%
y en el caso de >75 años, sería 5/7=71’4%.
Ejercicio resuelto entero y corregido en lo que estaba mal en la diapositiva:
4.3. Estadísticos.
¿Cómo podemos saber si existen diferencias entre las variables X en relación a la
presencia o no de Y? Para conocer esto vamos a emplear las proporciones, más
concretamente, las diferencias de proporciones (DP).
Para calcular esto tenemos que hallar el porcentaje (%), como ya se ha explicado
anteriormente haciendo el valor de la variable/n. Una vez calculado este, solamente
tenemos que restar los porcentajes ente ellos.
Ejemplo: ¿Existe diferencia entre hombres y mujeres en relación a la a SI tiene patología
cardíaca?
8
Esto se halla porque 6 corresponde al número de hombres que presentan patología

cardiaca entre 9+6 que es n (el número total de hombres). Por otro lado, 4 es el número
de mujeres que presentan patología cardiaca entre 11+4 que es n (el número total de
mujeres). Por lo que sería lo mismo que si nosotros directamente cogemos los
porcentajes que hay en la tabla 40% y 26’7% y los restamos entre ellos.
Por un camino u otro llegamos a que DP= 14% lo que quiere decir que hay un 14% más
de hombres que presentan patología cardiaca respecto a el de mujeres.
Aun no podemos hablar de probabilidad ni de si realmente esta diferencia es relevante
o no, hasta ahora solo podemos describir.
5. Presentación de estadísticos en tablas.

5.1. ¿Cómo lo presentamos en nuestro informe?
En los seminarios iremos haciendo
nuestro propio informe de resultados.
En estos se plantea en primer lugar que
es lo que estamos haciendo mediante
una tabla descriptiva de datos
univariantes. En el podemos obtener
diferentes datos como que el nivel de
estudio más alto es el de estudios
primarios o que la mediana (valor que
divide la muestra en 2 partes iguales)
del dolor es 7 por lo que el rango
intercuartil iría de 6-8 (sumamos una
por arriba y por abajo).
Después de ello, podemos determinar cómo expresar cada uno de nuestros valores en
función de si están o no presentes, de su probabilidad… lo importante siempre es
interpretar los valores.
Esto ya lo veremos desarrollado en los seminarios con forme lo vayamos haciendo
nosotros.
9
5.2. ¿Cómo lo reflejamos en artículos científicos?
Existen formas muy estandarizadas que podemos ir amoldando a lo que más nos
beneficie pero cuando tenemos que comparar, como en este ejemplo las proporciones,
nos interesa más hacerlo de una forma concreta.
Tenemos 5 variables cualitativas en el primer bloque. En el 1er mes, tenemos que 23/80
personas, un 29% se beneficiaron de la operación mientras que con una férula se
beneficiaron un 37/88 personas, un 42%. Lo que nos determina que la diferencia de
medias es de -13% por lo que a simple vista nosotros podemos decir que nos
quedaríamos con la férula ya que da un mayor resultado que la operación al 1er mes.
Por otro lado, en un segundo bloque donde se habla del número de veces que se
despierta una persona por la noche, tenemos también 5 variables cualitativas. Podemos
determinar que, en el 1er mes, las personas que tienen férula se despierta más que las
que no, las de férula se despiertan una media de 2 noches/ mes y las de operación una
media de 0’8 noches/mes.
Ejercicio 2. Identificar las variables de la tabla representadas con la media (DT), las
variables cualitativas y decir: ¿Cuál es el nº de noches que se despertaban los pacientes
de cirugía?
10
 Variables de la tabla representadas con la media: edad
 Variables cualitativas: ser mujer, síntomas bilaterales del síndrome del túnel
carpiano, lado dominante afectado.
 ¿Cuál es el nº de noches que se despertaban los pacientes de cirugía?: 4, esto se ve
en la primera fila de los valores intercuarticules (IQR).
6. Explorar relaciones entre variables.
Vamos a explorar si existe relación entre una variable y otra. Hay que tener en cuenta
que la existencia o no de relación entre variables puede condicionarnos incluso la forma
de realizar un tratamiento, por ejemplo, la afectación de una movilidad de rodilla en un
anciano no es lo mismo que si fuese en un joven. Debido a ello, la edad va a influir en el
tipo de tratamiento que podamos aplicarle a la persona.
6.1. Método de exploración y concepto de asociación.

Vamos a empezar viendo cómo se realizaría esta comparación entre 2 variables
cualitativas ya que es la forma más sencilla. Para realizar esto, empleamos nuestras
tablas de contingencia, con la variable X e Y, para ver cómo estas se distribuyen los datos
en función de las variables. Es decir, tenemos que seguir tres pasos:
1. Identificar con qué tipo de variables vamos a trabajar (si ambas son cualitativas
o cuantitativas, si una es cuantitativa y la otra cualitativa)
2. Estudiar la distribución de Y en cada una de las modalidades de X.
3. Interpretar los resultados obtenidos. Esto lo determinaremos teniendo en
cuenta si una variable cambia en función de la otra:
 Se determinan variables asociadas si una se modifica al cambiar la otra,
es decir, si encontramos diferencia entre los grupos.
 Se determinan variables no asociadas si no se influye la variable al
modificar la otra, es decir, si no encontramos diferencia entre los grupos.
Es importante saber que no podemos hacer comparaciones generales, siempre se va a

comparar una categoría con respecto a la otra. Si no lo hacemos así, no vamos a poder
comparar.
11
Ejercicio 3:
Solución: Si se encuentran asociadas ya que, como podemos observar en las columnas,

la proporción de color rojo (sí hay patología cardiaca) y de color azul (no hay patología
cardiaca) no son proporcionales. Existen diferencia entre los grupos por lo que a simple
vista sí que podemos ver que, al modificar la actividad que realice la persona en cuanto
a situación laboral, se influye la probabilidad de padecer patología cardiaca.
Resumen:
La asociación o correlación→ La existencia de asociación entre dos variables indicaría
que la distribución de los valores de una de las dos variables difiere en función de los
valores de la otra.
Dos o más variables están ASOCIADAS si:
 Si la distribución de una variable (Y) varía con la de otra variable (X).

 Si el conocimiento de una nos puede ayudar a conocer la otra.
6.2. Explorando relación entre 2 variables CUALITATIVAS.

Para determinar la asociación vamos a emplear las tablas de contingencia y la diferencia
de proporciones. Antes a simple vista veíamos si podía haber o no diferencia pero ahora,
mediante las diferencias de proporciones, vamos a confirmar si hay asociación.
Si retomamos el ejemplo explicado anteriormente (apartado 4.3), podemos ver que los
hombres poseen un 14% más de probabilidades de padecer patología cardiaca. Por ello,
se puede creer que esas dos variables se encuentran asociadas.
6.3. Explorando relación entre 1 CUALITATIVA y una CUANTITATIVA.

- Relación entre variables cualitativa-cuantitativa.
Para determinar la existencia o no de esta asociación, es muy útil la realización de
gráficos de cajas y bigotes. Gracias a estos se puede ver fácilmente y a simple vista si
existe o no asociación en función de la diferencia intergrupal o la igualdad, ya que nos
permiten comparar el grado de solapamiento (coincidencia). En estos, normalmente se
suele tomar como variable dependiente (Y) a la cuantitativa y como independiente a la
categórica.
12
La profesora ha dicho que estos dos términos son liosos así que se me ha ocurrido una
regla para distinguirlos, os la escribo por si os puede ayudar a diferenciarlos:
Variable dependiente: Cuando una persona es dependiente de otra se deja llevar por
los demás y acaba cambiando su forma de ser. Por ello, cambia en función de la otra
variable.
Variable independiente: Cuando eres una persona libre, independiente, haces lo que
quieres y no te dejas influenciar por el resto. Por ello, no cambias en función de otra
variable.
Si observamos este gráfico podemos ver que existe asociación ya que hay diferencia
entre los grupos (la línea negra que divide cada caja está en un valor diferente del eje
Y). En general:
 Cuanto mayor sea el solapamiento (menos distancia), menor será la intensidad
de la asociación entre las dos variables.
 Cuanto menor sea el solapamiento (más distancia), mayor será el tamaño del
efecto de la relación o asociación.
(Con solapamiento nos referimos a la distancia que hay entre ambas líneas horizontales
de la caja, la media).
En este caso, si nos
fijamos en la mediana
(línea de puntos
suspensivos), podemos
ver que no todas las
medias de los grupos
coinciden con la
mediana. Por ello, no
existe asociación, ya
que no hay diferencia
entre los grupos.
Ejercicio 4. Determina cuál de las siguientes gráficas indica asociación.
13
1er gráfico: Si hay asociación ya que podemos ver como la medina de ambas cajas se
encuentra distanciada, hay diferencia entre ambas. Por ello, podemos ver como el plan
de estudios (x) influye en la nota (y).
2º gráfico: Si hay asociación ya que podemos ver como la medina de ambas cajas se
encuentra distanciada, hay diferencia entre ambas. Por ello, podemos ver como el turno
de estudio (x) influye en la nota (y).
3er gráfico: No hay asociación ya que como podemos ver, ambas medianas se
encuentran alineadas, están a la misma altura. Por ello, ser hombre o mujer (x) no
influye en la nota (y).
Importante: Estamos viendo si hay asociación o no, no si esta es fuerte, débil...
- Magnitud de la asociación.
La calculamos mediante la diferencia media (DM). Es decir, restamos la media entre los
grupos y cuanto mayor es la diferencia de medias entre los grupos, mayor será la intensidad
de la relación.
Esto ya lo hemos explicado en el apartado 3.2. de este tema y con el mismo ejemplo que la
profesora ha planteado, aquí solo se dice que esta es la forma de calcular la magnitud de la
asociación.
7. Explorando relación entre 2 CUANTITATIVAS.

Para explicar esto se va a plantear con un ejemplo:
¿La edad puede influir en la velocidad de la marcha? (Edad (Cuantitativa) – Velocidad de
la marcha(Cuantitativa))
Tenemos que el caso 1

posee una edad de 50
años y una velocidad de
80, mientras el caso 3
tiene 60 años y una
velocidad de 50. De tal
forma que podemos
observar la descripción
gráfica de ambos casos.
14
Cuando tengamos una representación de los 20 casos en función de la edad (x) y la
velocidad de la marcha (y) obtenemos un diagrama de dispersión. Así, podemos
observar todos los valores en una misma visión y establecer nuestras propias ideas;
además, nos permite apreciar si existe o no una posible relación entre las variables.
Si observamos bien el gráfico podemos ver como presenta una tendencia descendente.
De tal forma que, a mayor edad, menor velocidad de la marcha.
7.1. Patrón de la asociación.

Existen diferentes formas de resultados que podemos encontrarnos en los diagramas
de dispersión en función de la valoración de la asociación. Nosotros hemos visto en el
caso anterior la relación inversa.
Aclaración:
Gráfico A: Cuando aumenta X, aumenta Y. Son proporcionales.
Gráfico B: Cuando aumenta X, disminuye Y. Son inversamente proporcionales.
Gráfico C: No existen relación entre los datos, no hay ni un aumento ni un descenso.
Gráfico D: es muy muy importante ver que estas no son lineales ya que nuestra
variable aumenta pero llega un punto en el que esta desciende, por ello, debido a su
forma reciben el nombre de parabólicas. NO LAS VAMOS A ESTUDIAR, NOS INTERESAN
LAS LINEALES (A,B,C)
15
Ejercicio 5. ¿Qué forma y dirección de asociación esperarías ver en el gráfico de
dispersión entre X e Y? (todas son cuantitativas)
a. X= velocidad de la marcha; Y=amplitud

articular
A mayor amplitud de la marcha, mayor velocidad

de la marcha Relación lineal directa.
b. X= edad; Y=fuerza de cuádriceps

A mayor edad, menor fuerza de cuádriceps
Relación lineal inversa.
c. X= edad; Y= IMC (peso(cm2)

¿A mayor edad, menor o mayor IMC? No, no
influye, esto puede variar por lo que no hay
relación Ausencia de relación.
7.2. Magnitud.
Uno de los índices más utilizados para analizar la intensidad de la relación entre dos
variables es el Coeficiente de correlación de Pearson. Solo se emplea para cuantitativas
y en relaciones lineales (gráficos A, B y C de antes). Tenemos que tener en cuenta que
los valores extremos pueden distorsionar o modificar el valor de la relación (r).
Se va a caracterizar porque toma valores entre -1 y 1, siendo empleado el -1 en las
lineales inversas y el +1 en las lineales directas. Por ello, gracias al signo sabemos si es
positiva o negativa.
Si obsérvanos esta asociación podemos ver que en la gráfica 1 es más intensa ya que se
ve como asciende mientras que la 2ª asciende pero no se ve tan claro. Si los valores son
proporcionales, vamos a poder determinar a qué valor de X corresponde un valor de Y
a pesar de no haberlo calculado aún (ya lo veremos).
(No tener en cuenta lo que pone en el eje x e y porque está mal).
Respecto a la relación (r) del Coeficiente de correlación de Pearson:
16
Ha leído lo que ponía en la diapo asique la pongo aquí, sorry.
¿Cómo podemos saber que una relación es lo suficientemente intensa?

Siempre que el valor sea >0’5 o <-0’5 se determina que hay una relación fuerte.
Ejemplo: si la relación es de 0’8 (>0’5) es fuerte y si es -0’8 (<-0’5), también lo es.
Mientras que si la relación es de 0’2 o -0’2 es débil ya que son valores que están por
encima de -0’5 y por debajo de 0’5.
En los siguientes gráficos podemos entender esto mejor. Se ve como en la relación de

0’1 está muy dispersa, no se forma ningún ascenso ya que es menor a 0’5. Sin embargo,
cuanto más se aproxima a 0’9, más se va formando la resta ya que es una relación directa
fuerte.
En este
caso es
a la
17
inversa, cuanto más se aleja de -0’5, se va formando una línea descendente ya que es
una relación inversa fuerte.
Ejercicio 6. ¿Cuál de los siguientes coeficientes de correlación representa la asociación

más débil entre dos variables?
- 0,59 + 0,10 - 1,00 + 0,76
Es 0’10 ya que se encuentra por debajo de 0’5 y es mucho mayor que -0’5 entonces al
estar en ese intervalo de -0’5 a 0’5 es débil.
El -1’00 sería el más fuerte.
Ejercicio 7. ¿Por qué un r = 0,00 o cercano a 0 puede esconder una asociación positiva
entre dos variables?
Al ser una relación parabólica los + y – se anulan entre ellos
lo que supone que se falsean los resultados. Por ello, no es
aplicable su realización y solo lo hacemos con las lineales.
¿Cómo calculamos el coeficiente de acomodación de Pearson?

Se emplea una fórmula matemática (en los seminarios la aplicaremos, pero nunca más
en nuestra vida xd) que está escrita en el siguiente ejemplo. Ejercicio que ha puesto de
ejemplo la profesora pero que no se ha explicado en sí:
18
En el seminario nos explicará bien como se realiza este ejercicio pero dice que
únicamente es sustituir en la formula y es fácil.
Como la relación es de 0’94 en el ejemplo, sabemos que la relación es lineal y fuerte. Es
positiva y superior a 0’5.
8. Malinterpretaciones→Relación y causalidad (variable de

confusión).
Se basa en determinar si realmente la linealidad depende de las variables planteadas.
Ejemplo:
Si únicamente leemos la primera parte, podemos pensar que la causa de padecer cáncer
de pulmón sí que es el consumo de café. Sin embargo, al leer todo vemos como existe
otra variable que estaba siendo ocultada que es más probable que sea la causante de
esto. Si empleamos la lógica podemos determinar cuáles son las variables X e Y de
nuestros estudios.
Esto es lo que se conoce como relación causa-efecto, una variable (fumar) me genera la
otra (cáncer de pulmón). Ya que la variable consumir café podemos determinar que no
tiene sentido para generar el cáncer, es una mera coincidencia en este caso.
Esta variable que nosotros podemos determinar que es la causante de la patología y que
se encontraba oculta en un primer momento, es lo que se conoce como variable
19
confundidora. Esta va a falsear una asociación, pudiendo aumentarla, disminuirla o
anularla.
Tenemos que quedarnos con que no todo es lo que parece e investigar más.
20
Bloque 3. Tema 1.
Elementos básicos del plan de investigación.
1. Introducción.
Hay que tener en cuenta que existen diferentes bases de datos y revistar científicas
donde podemos encontrar artículos de gran calidad metodológica y con poco riesgo de
sesgo. Entre estas bases de datos podemos destacar Pubmed, Scielo o Research gate
entre otras, también podemos emplear google académico, aunque hay que saber que
aquí podemos encontrar artículos algo más pobres.
2. Modelo general de investigación: niveles.

Podemos destacar la existencia de 3 niveles:
2.1. Nivel conceptual:
Antes de determinar qué es lo que queremos investigar, tenemos que saber que se
conoce en la actualidad a cerca de nuestros principales planteamientos para investigar.
Es decir, tenemos que conocer la existencia de la literatura científica para poder
plantearme que problema hay de investigación o si falta conocimiento dentro de algún
campo. Por ello, dentro de este nivel nos tenemos que plantear los siguientes puntos:
 Conocimiento científico.
Es lo que hemos dado en el Tema 2 del bloque 1.
 Método científico.
 Problema de investigación (es un vacío de conocimiento científico).
 Concepto de hipótesis.
 Objetivos de investigación. Es importante que estos sean muy claros y que vayan
detrás del planteamiento de nuestro trabajo.
Es importante que todos ellos se realicen en orden, ya que no tendría sentido, por
ejemplo, que nos planteásemos una hipótesis antes incluso de saber cuál es el problema
que queremos resolver o de informarnos a cerca de ello.
2.2. Nivel metodológico:
Se va a basar en como yo redacto mi trabajo, la estructura y forma que le doy a mi
trabajo. Tan importante es saber cuál es mi objetivo en este, como saber cómo
plantearlo y llegar a resolverlo para así hacerlo bien. Si por ejemplo quisiésemos medir
la fuerza del cuádriceps, no tendría ningún sentido que tomásemos estos valores en el
codo, nadie haría eso ya que primero se plantearía que es lo que quiere medir y donde
se encuentra esa estructura.
Dentro de este nivel nos tenemos que plantear los siguientes puntos:
 Plan de investigación.
1
 Estrategias de recogida de datos. Esta va a depender de que sea lo que estamos

valorando, si seguimos con la fuerza de cuádriceps, sería plantear y realizar la
valoración con dinamómetro).
Importante: no podríamos emplear la escala Kendall o el RM (recordar que se basa en
el esfuerzo percibido, lo dimos en cinesiterapia) aquí ya que esta es algo más ‘subjetiva’,
es decir, depende de cada paciente. El nivel de fuerza 4 mío puede ser diferente al de
mi madre o mi hermano. Por ello, se requiere de otras formas de valoración que nos den
el mismo valor en personas diferentes o en una misma persona tras una primera
mediación, es decir, que sean fiables (dinamómetro).
 Concepto de población y muestra. Se basa en determinar cuáles son nuestros
sujetos de estudio. Ejemplo: deportistas de futbol, vóley, baloncesto…ancianos,
jóvenes, recién nacidos...
 Variables y sistema de medición. Si vamos a realizar el estudio recogiendo los
datos a mano con una hoja de registro, grabando con un móvil, en un ordenador…
2.3. Nivel analítico:

Una vez que tenemos nuestros datos, tenemos que saber cómo los vamos a analizar.
Aquí es cuando en nuestro trabajo entra en juego la estadística. Por eso, se plantean los
siguientes puntos:
 Análisis de los datos empíricos.
 Concepto de validez. Debemos valorar si realmente los datos que estoy
obteniendo o los estudios que he encontrado son válidos, si estos me dan
información fiable y efectiva. Vamos a estudiar dos tipos de validez, la interna y
la externa.
 Concepto de sesgo y confusión.
A partir de aquí vamos a desarrollar cada apartado de los diferentes niveles.
3. Nivel conceptual.
Como se ha dicho antes, los dos primeros principios (Conocimiento científico y Método
científico) ya que se han explicado en el tema 2 del 1er bloque (lo hemos dado justo
antes de esta clase, aunque este sea el bloque 3). Por ello, vamos a empezar por el
problema científico.
3.1. Problema científico.
Este se define como la pregunta sobre algo que no se sabe o se desconoce y nosotros
queremos conocer. En la literatura, probablemente no lo encontremos, por lo que
tendremos que hacer nuestra búsqueda ya que si estuviese resuelto no tendría sentido
realizar el estudio.
Los principios en los que nos vamos a basar es en la observación, resultados previos que
conocemos o hay en la literatura (para este también vale lo que nosotros conocemos de
2
nuestros propios pacientes) y las teorías formalizadas a cerca de lo que nos planteamos.
También es importante la propia curiosidad de si va a ser efectivo lo que queremos
estudiar o si una técnica es efectiva o no, para así estudiar sobre ella.
Un ejemplo de problema científico a partir del cual podríamos hacer un estudio de
investigación sería: Ortesis vs cirugía para el síndrome del túnel carpiano.
A la hora de plantear la pregunta de investigación es necesario ser muy concreto, no
nos podemos ir por las ramas ya que no sería efectivo. Esta pregunta se va a definir como
la concreción del planteamiento en una pregunta precisa y delimitada, teniendo en
cuenta el espacio, tiempo y población (cuando sea posible). Para poder desarrollarla,
podemos seguir la estrategia PICO, aunque no siempre tienen porque aparecer los 4
principios (es lo que vimos en fuentes documentales solo que la S no la añadimos ya que es el
tipo de estudio que se realiza y por ello no nos influye en si en nuestro planteamiento de la
pregunta).
Paciente, Intervención, Comparación y Objetivos (PICO)
En el ejemplo anterior: Ortesis vs cirugía para el síndrome del túnel carpiano. Podemos
determinar que está constituido este enunciado mediante la estrategia PICO:
P: Síndrome del túnel carpiano C: Tratamiento quirúrgico
I: Ortesis O: no hay.
Posteriormente al planteamiento del problema. Tenemos que justificar por qué
queremos estudiar esto, si es por un vacío literario, porque hay pocos estudios, para
conocer la efectividad… Por ello, hay que darle importancia al problema, determinar el
entorno teórico de referencia (hospital, clínica…) y conocer los posibles beneficios del
tratamiento.
3
3.2. Concepto de hipótesis.

Se define como la conjetura conceptual con la que se pretende resolver un problema
científico planteado. Para ello, previo a la realización de la hipótesis, es necesario tener
conocimientos sobre el tema que vamos a tratar y plantear la pregunta de investigación.
Una vez tengamos esto, podemos plantear una hipótesis, que creemos que va a pasar
en nuestro estudio. Por ejemplo, Ejercicio excéntrico vs electrosis en tendinopatía
rotuliana en jugadores de baloncesto. Nuestra hipótesis podría ser que la electrosis
percutánea va a tener mejor resultado que el ejercicio excéntrico para tratar esta
patología, siempre en base a información previa que hemos buscado. Posteriormente
tendremos que contrastar si tenemos o no razón.
Es muy importante que, a la hora de generar una hipótesis, esta siga los siguientes
principios:
 Sea clara y precisa, que no deje confusión.

 Se pueda comprobar que esta es verdad o mentira.
 Sea novedosa, es decir, que no esté ya descubierto lo que estamos investigando
si no que sea algo completamente nuevo que nadie ha determinado antes.
 Debe ser ética, cuando trabajamos con investigación esto es muy importante. Si
nosotros vamos a trabajar con un paciente no podemos aplicarle una técnica que
nosotros ya sabemos que no va a obtener buenos resultados o que va a ser
nocivo, no sería ético.
 Debe ser un conocimiento relevante, si no nos va a dar información realmente
útil o beneficiosa no le van a dar la importancia que requeriría.
Es posible que dadas las características del estudio no sea necesario formular hipótesis.
En general los estudios descriptivos pueden formularse sin necesidad de establecer
hipótesis, mientras que los estudios experimentales deben poseer hipótesis.
3.3. Objetivos de investigación.
Es un enunciado que expresa lo que se desea conocer para responder a un problema
planteado. Es decir, se basa en transformar nuestra pregunta de investigación en un
objetivo realista, claro y preciso. Suelen comenzar con un verbo en infinitivo.
Los objetivos que nos planteemos pueden ser de dos tipos:
Objetivo principal o general: Deben aparecer si o si en nuestro estudio ya que van a
determinar lo que se pretende conocer con la realización del estudio. Además, este
se obtiene a partir de la pregunta de investigación, por lo que un ejemplo de este
podría ser si poseer más fuerza de cuádriceps está asociado a correr más rápido.
Objetivos específicos: Estos pueden estar o no y se caracterizan porque enuncian
qué variables van a ser utilizadas, cómo van a ser medidas y especifican más la
población de estudio. Van a ser variables más concretas que en los objetivos
principales, un ejemplo sería determinar si una escala para medir la fuerza de
cuádriceps es útil para ver la asociación entre la fuerza muscular de cuádriceps y
correr más rápido.
4
Si seguimos con el ejemplo del estudio donde nuestra pregunta de investigación era:
Ortesis vs cirugía para el síndrome del túnel carpiano, podemos ver que su objetivo es
muy claro y sencillo.
(El objetivo del estudio fue comparar, a
corto y largo plazo, la eficacia de la
ortesis y la cirugía para disminuir los
síntomas del síndrome del túnel
carpiano.)
Sin embargo, hay otros estudios donde los objetivos no son tan sencillos como en este,
puesto que aparecen los dos tipos de objetivos anteriormente planteados. En este caso,
es en el objetivo principal donde planteamos nuestra hipótesis que va a inducir al
desarrollo del estudio y los específicos son más irrelevantes:
(Objetivos principales: comparar los efectos agudos del
ejercicio isométrico vs dinámico durante la provocación
de dolor activo en participantes con tendinopatia
patelar. Objetivos específicos secundarios: efecto de
comparar los resultados de los ejercicios dinámicos e
isométricos sobre la sensibilidad al dolor localizado, así
como la distancia y el sitio. Objetivos específicos
terciarios: evaluar los cambios en la estructura del
tendón tras un ejercicio.)
Información a tener en cuenta: en muchos estudios nos pueden hablar sobre

prevalencia e incidencia. La diferencia entre ambas reside en que la prevalencia es el
número total de casos en un momento determinado y la incidencia es el número de
casos nuevos en un período de tiempo.
Resumen del apartado de Nivel conceptual:
• ¿Qué se desconoce? (PROBLEMA)
• ¿Qué se cree que vamos a encontrar? (HIPÓTESIS)
• ¿Qué se pretende con la investigación? (OBJETIVO)
• ¿Por qué realizar la investigación? (JUSTIFICACIÓN)
• ¿Para qué? (JUSTIFICACIÓN)
4. Nivel metodológico.
4.1. Plan de investigación.
Es necesario generar este para poder continuar con nuestro estudio ya que mediante el
plan de investigación vamos a poder demostrar si nuestra hipótesis era o no cierta. Por
ello, este lo podemos definir como el plan o estrategia que se desarrolla para obtener
la información que se requiere en una investigación.
4.2. Estrategia de recogida de datos.
A la hora de diseñar el tipo de estudio que vamos a generar podemos seleccionar entre
dos tipos:
5
 Estudio no experimental como puede ser el descriptivo. Todo lo que hemos visto
durante los temas anteriores.
 Estudio experimental, en este ya tenemos dos grupos donde vamos a poder
comparar entre dos estudios, vamos, los ensayos clínicos.
No existen unos tipos de diseños de estudio mejores que otros: todos son relevantes y
tienen su valor propio en función de las características y la naturaleza del objeto de
estudio. Vamos a elegir el diseño empleado en función de nuestros objetivos, por eso es
tan importante saber qué es lo que quiero hacer desde el principio.
Ahora se va a explicar un concepto que la profesora ha dicho que es muy importante.
4.3. Concepto de población y muestra.

4.3.1. ¿A quién se quiere estudiar?
Nuestra población diana va a ser aquella a la que queremos que se apliquen nuestros
resultados. Si estamos realizando un estudio sobre cómo tratar una patología muy
común en futbol, nuestra población diana van a ser todos los futbolistas del mundo. Que
ocurre con esto, que nosotros no podemos trabajar con una población a nivel mundial
como en el ejemplo. Por ello, se requiere de una población accesible para poder llevar
a cabo la ejecución de los resultados en estos, si seguimos con el ejemplo de los
futbolistas, nuestra población accesible sería todos los equipos de la Región de Murcia.
Sin embargo, sigue siendo una población muy grande lo que se pretende tratar ya que
hay jugadores de muchas edades y categorías diferentes dentro de la región. A
consecuencia de esto, se selecciona una población elegible mediante la creación de
unos criterios de elegibilidad.
En función de los criterios de elegibilidad escogeremos cual será la muestra
representativa de nuestra población y tras seleccionarlos, los reclutaremos. Dentro de
estos criterios podemos destacar dos:
 Criterios de inclusión: Características demográficas, criterios clínicos,

características geográficas…
 Criterios de exclusión: Probabilidad de ser pérdida de seguimiento,
aceptabilidad, riesgo de efecto adverso…
Realmente los criterios de inclusión y de exclusión varían en función de cuáles son
nuestros objetivos, los anteriores son ejemplos. Algo que si hay que tener en cuenta es
que para elegir a los pacientes se deben seguir ambos criterios.
Resumen: La población diana es el conjunto de elementos con características comunes y sobre
la que queremos generalizar los resultados, que va a ser infinita (toda la población). Mientras
que la población accesible es la porción finita de la población diana a la que realmente se tiene
acceso y de la cual se extrae una muestra representativa. A partir de este se obtiene la población
elegible que son aquellos sujetos de la población accesible que cumplen con los criterios de
elegibilidad/inclusión.
A consecuencia de estos términos podemos decir que existen 2 verdades:
6
 Verdad en el universo: Se corresponde con la población diana a la que queremos

extrapolar los resultados de nuestro estudio. Esto se conoce como inferencia, pero
ya lo veremos en el bloque siguiente.
 Verdad en el estudio: Se corresponde a la población elegible.
Una vez sabemos cómo seleccionar los pacientes a los que queremos estudiar debemos
preguntarnos…
4.3.2. ¿Cómo obtenemos la muestra?
Para esto podemos realizar dos tipos de muestreos, el probabilístico y el no
probabilístico.
 Muestreo probabilístico: Cuando los sujetos son seleccionados aleatoriamente y

todos tienen la misma oportunidad de ser seleccionados. Esto nos permite poseer
una mayor variabilidad. Existen diferentes tipos:
 Aleatorio simple Se seleccionan las unidades del estudio AL AZAR. Dentro de
una determinada población homogénea se establece una aleatorización que
permite que todos los sujetos posean la misma probabilidad de ser
seleccionados.
 Aleatorio Sistemático Se selecciona los sujetos de forma sistemática a lo largo
del marco muestral. Por ejemplo, si tenemos 9 pacientes, les asignamos un
número de forma aleatoria a cada uno y se va a seleccionar un paciente cada 3.
De esta forma, se obtienen solo 3 pacientes de 9 pero de una forma aleatoria,
en este caso los que tenían el número 3,6 y 9.
 Aleatorio Estratificado Se realiza cuando en una misma población se cree que

pueden existir subpoblaciones. Por ello, la población es dividida en
subpoblaciones o estratos y la muestra se obtiene aleatoriamente en cada uno
de estos grupos.
7
 Por Conglomerados Se realiza cuando la muestra está muy dispersa y no se

puede (o es costoso) llegar a todos los seleccionados. Se parece al muestreo
aleatorio estratificado pero es diferente. Un ejemplo de esto sería el siguiente:
entrevistar a una muestra de futbolistas no profesionales de la región, en este,
los conglomerados serían los equipos de fútbol y dentro de estos, tenemos que
seleccionar aleatoriamente a los futbolistas de zonas geográficas determinadas.
 Muestreo no probabilístico: Cuando los sujetos NO son seleccionados

aleatoriamente. Podemos distinguir 4 tipos:
 Muestreo por conveniencia Seleccionamos una muestra de fácil acceso a
ella. Por ejemplo, soy fisioterapeuta y trabajo con pacientes con EPOC y
selecciono a algunos de ellos para mi estudio con forme me interesa,
selecciono a dedo por lo que aquí si podemos descartar algunos.
 Muestreo por bola de nieve Su importancia radica en que la muestra de
estudio recomienda a otras personas de entre su círculo de interacción. Por
ejemplo, queremos hacer un muestreo entre alumnos de fisioterapia y
decimos a un alumno de primero que se lo comunique a todos. De esta
forma, creamos un efecto de llamada.
 Muestreo por cuotas División porcentual de la población total a estudiar
a través de criterios establecidos y es directamente proporcional y equitativa
a ella.
 Muestreo consecutivo Se basaría en seleccionar a los pacientes en el
orden de llegada a nuestra clínica y así los vamos reclutando. Por ejemplo,
soy fisioterapeuta y trabajo con pacientes con EPOC y selecciono a todos los
pacientes que vienen en un día a la clínica y en el mismo orden que llegan.
4.4. Variables y sistema de medición.

Una vez que sabemos cuáles son nuestros pacientes, nuestra muestra, tenemos que
saber qué queremos medir. Para ello, debemos plantearnos qué tenemos que medir y
cómo lo medimos.
4.4.1. ¿Qué mido?
Un ejemplo de variable de confusión sería la edad, el sexo, el IMC si nos referimos por
ejemplo a la capacidad de correr, ya que estos factores varían de una persona a otra.
8
4.4.2. ¿Cómo lo mido?

Vamos a plantear dos tipos de medidas. Por un lado, estarían las medidas objetivas, que
son aquellas invariables, están estandarizadas para ese protocolo de medición. Por otro
lado, las medidas subjetivas, son aquellas que varían dependiendo de qué persona lo
realice, pueden ser escalas de esfuerzo percibido, por ejemplo.
Las dos formas de medir son completamente válidas para un estudio. Tened en cuenta
que existen muchas escalas diferentes para medir. Se pueden emplear cuestionarios,
entrevistas, diarios, observaciones directas… Lo importante es elegir la fuente que
refleje mejor lo que se quiere medir (siempre que sea factible durante la fase de
recogida de información).
5. Nivel analítico.
Una vez realizamos la recogida de datos es necesario introducir estos en la base de
datos.
5.1. Análisis de datos empíricos.
Tras introducir todos los datos obtenidos en la base de datos, hay que depurar estos.
Con esto se quiere decir que si encontramos algún dato perdido (cuando sale – en el
SPSS) podemos eliminar estos, transformar los datos (si tengo peso y altura puedo
transformarlos al IMC) o también puedo seleccionar los casos que me interesan.
Una vez hagamos esto, accedemos al SPSS y analizamos estos datos. Podemos calcular
la media, la frecuencia, n, la desviación típica…
Ahora tenemos que tener presente que nuestras sólo son dos de las muchas posibles y
que nuestras conclusiones finales son a nivel de la población elegible, no a nivel de la
muestra.
5.2. Concepto de validez.
Grado en que los resultados (estimación del parámetro o una asociación) pueden ser
generalizados a la población diana. Es decir, tenemos que generar nuestro estudio de
tal forma que los resultados obtenidos se puedan inferencia a la verdad en el universo,
a todo el mundo, no solo a la muestra. Esto se conoce como validez externa.
Grado en que resultados se corresponden con la verdad en la población de estudio, es
decir, si los resultados se pueden inferir a nuestra muestra validez interna.
5.3. Concepto de sesgo y confusión.
5.3.1. Sesgo.
Sesgo o error sistemático: Es un error que conduce a una estimación incorrecta del
parámetro o la asociación en estudio. Se produce cuando no empleamos de manera
correcta un instrumento de medida porque no se ha calibrado al principio, no se coloca
bien… De tal forma que podemos obtener resultados de más o de menos en función de
9
la normalidad. No confundirlo con el error aleatorio, este se produce en función de

factores externos como el cansancio, la inestabilidad…
Tipos de SESGO que amenaza nuestra validez interna:
 Sesgo de medición → Errores en la medición o registro de los datos que conducen

a una estimación incorrecta. Se produce en base al examinador si está cansado u
otros factores como el instrumento de medida.
 Sesgo de selección → Errores en los procedimientos utilizados para seleccionar los

sujetos que conducen a una muestra no representativa y así a una estimación
incorrecta.
Un ejemplo de esto sería si llenamos una pecera con la misma cantidad de bolas
rojas y verdes. Sin embargo, al extraer las bolas de la pecera, sacamos todas de
color rojo y solo una verde. De esta forma, estamos generando un falseo, un sesgo
en nuestros resultados.
Esto puede suceder en la realización de nuestro plan del estudio, la generar un plan
de muestreo inadecuado.
Estos tipos de sesgo nos pueden generar asimetrías negativas o izquierdas, si medimos
de menos, o positivas o derechas, si medimos de más. Si obtenemos una gráfica
simétrica significa que nuestro estudio no posee sesgo ninguno.
5.3.2. Confusión.
Es una distorsión de la magnitud de la asociación entre variable predictora-resultado
generada por la distribución de otra variable predictora.
Un ejemplo sería, si poseemos la variable fuerza como explicativa y la variable velocidad
como resultado, la variable confundidora podría ser atleta. Esto se debe a que no es lo
mismo tener toda una población atleta que hacer las mediciones en población corriente
que poseería menor velocidad y fuerza.
10
En temas anteriores vimos esto mismo con el ejemplo de que el café producía cáncer
según un estudio. Sin embargo, si se leía a fondo el estudio, se veía que esto realmente
se asociaba a las personas fumadoras. En este caso, fumar, sería la variable
confundidora.
11
Loli Martínez
Bloque 3. Tema 2.
PRINCIPIOS METODOLÓGICOS DE LOS DISEÑOS NO EXPERIMENTALES
1. Elementos básicos del plan de investigación.

1.1. CONCEPTUALIZACION PREGUNTA DE INVESTIGACIÓN.
Lo primero que tenemos que hacer es decidir a donde queremos ir, que queremos conocer.
Mi objetivo viendo el mapa es la plaza circular. Para llegar

ahí tenemos muchos caminos: por Juan Carlos I, por la
Avenida de los Pinos, por Juan de Borbón, etc; pero hay que
decidir cómo queremos ir: en tranvía, en bici, andando, en
moto, etc.
Si esto lo extrapolamos a la investigación tenemos que

decidir qué sujeto y que métodos vamos a utilizar, porque
la finalidad/objetivo va a ser el mismo, pero yo quiero saber
cómo voy a llegar a ese objetivo, ya que podemos utilizar diferentes estudios: estudios
observacionales si quiero describir (dentro hay muchos tipos), o si queremos probar si un tratamiento
es más efectivo que otro aplicaremos un diseño experimental (hay varios tipos).
Una vez que tenemos un objetivo muy claro, hay que decidir cómo vamos a llegar a él. Si nos
equivocamos desde el inicio en cómo vamos a llegar a ese objetivo, el plan de investigación no va a
valer, va a ser un plan con poca validez interna y si no tiene validez interna no la vamos a poder
extrapolar al resto de la población (que este es nuestro objetivo, poder aportar nuevo conocimiento).
1.2. SELECCIÓN DEL DISEÑO DE INVESTIGACIÓN.

Una vez CONTEXTUALIZADA la pregunta de investigación tenemos que seleccionar el diseño de
estudio. Tenemos muchos tipos de diseño de estudio, no existen unos tipos de estudio mejores que
otros: todos son relevantes y tienen su valor propio que se va a basar en función de las características,
en la estrategia de recogida de datos y en la naturaleza de nuestro objetivo.
Si yo solo quiero valorar una asociación, voy a recoger datos, pero no voy a aplicar una intervención
(no quiero probar si algo es mejor que otra cosa). Simplemente observo y recojo los datos → esto es
un ESTUDIO NO EXPERIMENTAL (nosotros no controlamos lo que vamos a estudiar, nosotros no
decimos si un paciente recibe un tratamiento u otro, solo vamos a observar).
En el momento en el que nosotros controlamos ese factor de estudio (decidimos que paciente va a
recibir qué cosa) ya va a ser un DISEÑO EXPERIMENTAL, estamos probando (es como la investigación
que vimos de la carne, el científico determinaba/controlaba que bote era el que tapaba o no, en ese
momento ya estamos controlando el factor de estudio).
Existen muchos tipos de diseño de estudio y uno NO es mejor que otro. El mejor diseño de estudio va
a ser el que mejor se adecue a nuestro objetivo de investigación.
Por ello, el Plan de Investigación puede definirse como el plan o estrategia que se desarrolla para
obtener la información que se requiere en una investigación.
Loli Martínez
2. Concepto de estudios observacionales.

Para los ESTUDIOS NO EXPERIMENTALES tenemos los ESTUDIOS OBSERVACIONALES donde
observamos simplemente, describimos y recogemos datos; nosotros no aplicamos una intervención,
no controlamos el factor de estudio.
El objetivo de este tipo de estudios va a ser:
▪ Describir una situación: es importante probar diferentes tipos de tratamientos, pero también
es importante conocer el problema, porque si no lo conocemos no sabemos que le puede
venir mejor, por eso son importante este tipo de estudios.
▪ También nos va a servir para establecer relaciones entre variables: lo hemos visto con la
estadística descriptiva, cuando veíamos la asociación y la correlación entre 2 variables, por lo
que ese tipo de análisis sería un estudio observacional.
▪ Son estudios más fáciles, rápidos y baratos puesto que simplemente recogemos datos, no es
lo mismo aplicar una intervención en lo que se necesitan instrumentos específicos con un
coste económico importante, estamos gastando material, etc y que requiere más tiempo.
▪ Podemos ver que pueden ser descriptivos (describimos) o analíticos (se corresponde con la
asociación entre 2 variables).
Por ejemplo, un estudio observacional seria en pacientes que manifiestan un dolor en la zona
posterolateral del raquis cervical, realizamos una valoración para conocer cuántos de ellos presentan
puntos gatillo miofasciales del angular de la escápula activo. Estamos recogiendo simplemente
información y después vamos a analizar si en este tipo de pacientes presentan los puntos gatillo, ya
que puede ser que no y que se estén aplicando terapias para PG que no son necesarias algunas veces.
Otro ejemplo es el estudio de la epidemiologia en jugadores de futbol, tenemos que conocer cuál es
la lesión más prevalente en este tipo de sujetos, ya que de esa forma nos podremos centrar en dicha
lesión. En este ejemplo era la musculatura de isquiosurales, por lo que nos centraremos en programas
de prevención de lesiones de isquiosurales, pero si no sabemos cuál es el tipo de lesión más
prevalente, podemos estar haciendo un programa de prevención por ejemplo para gemelos y en
futbolistas este tipo de lesión no es predominante.
3. Tipos de estudios observacionales.

Los estudios observacionales pueden ser de diferente tipo, se van a clasificar en función de su finalidad
en analíticos o descriptivos; según su direccionalidad en prospectivos o retrospectivos; y según el nº
de mediciones en transversales (en un momento dado) o longitudinales (a lo largo del tiempo).
Loli Martínez
3.1. SEGÚN LA FINALIDAD

- DESCRIPTIVOS: no busca analizar la relación causa-efecto, sino que su finalidad es puramente
descriptiva, es decir, describir como son los estudios epidemiológicos. Es útil para generar
hipótesis. Seria por ejemplo el estudio epidemiológico de lesiones en futbol. Este tipo de
estudios nos va a permitir describir la frecuencia de un problema, es decir, cuanto se produce.
También nos va a permitir identificar grupos de poblaciones más vulnerables, por ejemplo:
entre mujeres de 60-70 años, la epidemiologia de las enfermedades, es más prevalente la
osteoporosis. Si conozco que en este grupo de población este problema de salud es más
frecuente, voy a incidir más en ese problema. Se suele ajustar a un tipo de muestra (de
población determinada, no comparamos diferentes tipos de población).
- ANALITCOS: van a analizar esa relación causa-efecto, esa asociación causal entre un factor y
un efecto: un factor que será una exposición (un grupo de población está expuesta a un
determinado factor) y su efecto. Por ejemplo: en un estudio de relación entre el
entrenamiento antes de la temporada (tenemos unos biomarcadores durante la sesión) y el
rendimiento y las lesiones en jugadores de futbol. Estamos analizando si el entrenamiento
antes de la liga (antes de empezar la temporada), está más relacionado con lesiones y
rendimiento en el futbol profesional.
3.2. SEGÚN LA DIRECCIONALIDAD: ambos van a ser estudios longitudinales.

- PROSPECTIVO: va hacia delante, yo tomo una medida inicial (en un punto temporal concreto),
y vuelvo a medir en el futuro otra vez (a lo largo del tiempo). Recojo los datos hoy y dentro de
un mes vuelvo a recoger datos y analizo. En la mayoría de los casos lo dicen.
- RETROSPECTIVO: vamos hacia atrás. Los datos se recogieron en el pasado, pero los voy a
analizar en el presente (su inicio es posterior a los hechos estudiados). Un tipo de estudio
retrospectivo podría ser una revisión de historias clínicas (yo tengo mi base de datos de
pacientes que ya traté en el pasado y ahora voy a analizarlo). Me planteo la investigación una
vez con los datos ya recogidos (realizo el estudio una vez ya tengo mis datos).
3.3. SEGÚN EL Nº DE MEDICIONES/TEMPORALIDAD.

- TRANSVERSALES: medimos en un momento concreto del tiempo y una sola medición.
Podemos realizar varias mediaciones en un sujeto, pero de diferentes variables (una única
variable en un momento determinado). Este tipo de estudios no permiten establecer
relaciones causales, es decir, si yo mido en un momento determinado, yo no puedo saber si
un factor es causa y efecto, ya que estamos midiendo a la vez en un momento determinado.
Por ejemplo: se realiza un estudio en pacientes intervenidos de prótesis de rodilla con edades
comprendidas entre los 65 y 75 años, para conocer cuál es su grado de movilidad y el balance
funcional a los quince días de la cirugía, simplemente vamos a describir el grado de movilidad
y el balance funcional después de 15 días, pero no voy a establecer una relación entre las dos
cosas. Otro ejemplo de estudio sería: el rendimiento en el sprint de jugadores de futbol con y
Loli Martínez
sin lesión de isquiosurales, un estudio transversal exploratorio; medimos en un momento

determinado.
- LONGITUDINALES: son aquellos en los que, medidos en varios momentos temporales, es

decir, 2 o más mediciones en el tiempo. Si me permiten establecer relaciones causales: si por
ejemplo mido hoy y dentro de dos semanas la fuerza, y la variable de resultados es la velocidad
de la marcha podemos establecer una relación causal si la fuerza de hoy esta
correlacionada/asociada a una mayor velocidad de la marcha en un futuro. Por ejemplo:
estudio en pacientes intervenidos de prótesis de rodilla con edades comprendidas entre los
65 y 75 años, para conocer su evolución a lo largo de un programa de fisioterapia orientada a
la mejora de la movilidad y el balance funcional. Las mediciones se llevan a cabo a los 15, 30
y 45 días después de la cirugía, ya tenemos 3 mediciones en 3 momentos temporales
diferentes. Otro ejemplo: en un estudio que mide la relación entre el entrenamiento presesión
y el riesgo de lesión; miden a la 1º, 2º y 3º semana. Este tipo de estudio pueden ser tanto
analíticos como descriptivos. Todo esto siempre lo dicen en el procedimiento del estudio:
estudio no intervencional -es lo mismo que estudio observacional- durante 5 semanas → estudio
longitudinal (aunque muchas veces ya nos lo dicen directamente en el titulo).
En los ESTUDIOS OBSERVACIONALES, como ya hemos visto:

o Los ESTUDIOS DESCRIPTIVOS simplemente describen y pueden ser: un informe de casos y los
estudios de prevalencia (estos, la mayoría son estudios epidemiológicos).
o Los ESTUDIOS ANALÍTICOS ya estamos analizando 2 factores, pueden ser los estudios de caso
control y los estudios de cohortes.
4. Informe de casos.
Los informes de casos son simplemente para describir una experiencia clínica que se sale fuera de lo
normal, es un caso anecdótico o que no esperamos y que llama la atención, organizado de manera
ordenada y sistemática que puede sustentar el abordaje de un paciente con la misma patología en un
futuro cuando sea la única o la más pertinente evidencia disponible. A partir de estos casos se hacen
informes de casos.
Loli Martínez
Los informes de casos no podemos aplicarlos a toda la población. Los estudios de casos tienen una
evidencia científica muy limitada y son aplicables a pacientes que tengan esas mismas características
que el informe de casos, entonces es simplemente para mostrar casos complejos o diferentes que se
salen de lo normal. Se suele presentar de manera ordenada, sistemática, como todo proceso de
investigación (con su introducción, material y métodos, resultados, etc) pero aplicado a uno o dos
sujetos.
¿QUÉ CASOS SUELEN SER INTERESANTES?:

• En relación con el diagnóstico:
o Nuevas técnicas/procedimientos.
o Combinación de eventos que crean confusión: siempre van a llegar pacientes que no
cumplen con el criterio diagnostico que nosotros esperamos, puede presentar un
dolor cuya causa/origen se sale fuera de lo normal, se puede ver por ejemplo una
ciática con problema en la vejiga.
o También en hallazgos poco habituales (enfermedades más raras).
• En relación con las intervenciones:

o Nuevos procedimientos o nuevas aplicaciones.
o Efectos adversos de ciertas intervenciones que hasta el momento se pensaban que
eran seguras.
o Resultados inesperados.
Por ejemplo, tenemos un informe de casos: estimulación de un nervio determinado para el

tratamiento del dolor crónico de espalda. Tenemos 2 casos en la tabla de resultados y simplemente
nos exponen las variables de ellos. Este tipo de informe de casos va a ser aplicable, por ejemplo, la
estimulación en pacientes que presenten unas características parecidas a las que se muestran en este
caso, si no se parece ya no lo aplicaría. Por ello los estudios/informes de casos son los que menos
evidencia tienen y es para mostrar cosas fuera de lo normal.
5. Estudios de prevalencia.
Los estudios de prevalencia aportan mucha información, pero no permiten determinar la causalidad
entre factor y enfermedad (simplemente describimos). Son transversales: se mide en un momento
determinado. Son estudios previos destinados a la búsqueda de factores que se presentan asociados
a un fenómeno: estamos recopilando información y vemos que, por ejemplo, ahora con el covid que
se hacen estudios de prevalencia a diario, sabemos a diario cuantos casos hay, esto nos da información
sobre la prevalencia y la incidencia, que serían los nuevos casos que hay. Dentro de esos pacientes se
estudia la sintomatología y en base a la sintomatología más prevalente se pueden generar ciertas
hipótesis para probar luego en un futuro con estudios de asociación (estudios analíticos) o con
estudios experimentales. Por ejemplo, si sabemos que los síntomas más prevalentes son la tos, la
expectoración, la pérdida del gusto y el olfato, etc, estamos conociendo que en esos pacientes tienen
eso, pero no sabemos si existe una asociación, esto luego lo determinamos con estudios analíticos.
VENTAJAS:
- Son fáciles de realizar: recogemos información, no hay que aplicar procedimientos, etc.
- Son baratos (poco costosos económicamente hablando).
- Necesitan poco tiempo.
- Permiten estudiar más de 1 una enfermedad/factor de riesgo a la vez.
Loli Martínez
DESVENTAJAS:
- No podemos estudiar causalidad (una causa con su efecto).
- No son útiles para enfermedades raras o con poca gente, ni para aquellos de corta duración
(necesitamos bastante tiempo para recoger información).
- Se pueden producir sesgos al recoger la información y a la hora de seleccionar los casos (el
sesgo de la selección de sujetos al final es aplicable a todos los estudios). Si no establecemos
unos criterios de selección adecuados al tipo de estudios, al final tendremos sesgos que
afectan a la validez interna (afectara a los resultados de nuestro estudio, estamos sesgando
nuestros resultados, ya sea por encima sobrevalorando o por debajo infravalorando).
¡RECUERDO Tema Anterior!

Prevalencia: número de casos en un momento determinado, es decir, 3 casos hoy, que sería el nº
de casos entre el total de la población en un momento determinado. Sirve en general.
Incidencia: nuevos casos en un momento determinado, es decir, de lunes a viernes cuantos nuevos
casos se han producido con respecto al total de la población.
Dependiendo de nuestros intereses nos puede valer la prevalencia o la incidencia.
Por ejemplo: un estudio de prevalencia de la discapacidad entre adultos con EPOC (en el eje x vemos
las diferentes discapacidades en relación a la audición, a la visión, a la movilidad, al autocuidado, a la
vida independiente etc o ninguna discapacidad. Cada barra es un grupo de edad). Yo quiero conocer
en pacientes con EPOC cual es la discapacidad más prevalente: quitando ninguna discapacidad, la
discapacidad más prevalente es la movilidad (los pacientes con EPOC, un alto % presenta una
discapacidad en relación a la movilidad). A los pacientes con EPOC se les suele tratar la mayoría de las
veces con terapia farmacológica pero se olvida la parte de discapacidad y no se suele tratar en un
servicio de rehabilitación para mejorar su movilidad, su capacidad pulmonar desde el punto de vista
de la fisioterapia. Por ello es muy importante conocer que este tipo de discapacidad es muy prevalente
en este tipo de pacientes para poder trabajarlos porque va a mejorar su calidad de vida (la enfermedad
no se la podemos curar porque es crónica). Estos tipos de pacientes dejan de hacer ciertos tipos de
actividades porque se ahogan y eso va llevando a una discapacidad, a una pérdida de fuerza, que se
puede prevenir con fisioterapia.
6. Estudio de casos y controles.

En los estudios de casos y controles tenemos dos grupos, son parecidos a los experimentales, pero en
los casos controles no controlamos el factor de estudio, simplemente observamos lo que pasa en un
grupo (con enfermedad) y en otro (sano), para ver qué factores de riesgo están asociados a la
enfermedad. En pacientes con EPOC se puede ver que un posible factor de riesgo es fumar: la mayoría
de los sujetos del grupo con enfermedad fuma y los sanos no, por lo que un factor de riesgo va a ser
fumar.
En este tipo de estudios vemos la Odds Ratio que es una razón de probabilidad.
VENTAJAS:
- Son cortos y cuestan poco dinero (porque tenemos dos grupos y observamos).
- Permiten analizar varios factores de riesgo para una misma enfermedad.
Loli Martínez
DESVENTAJAS:
- Secuencias temporales entre la exposición y la enfermedad, no siempre es fácil de establecer.
Por ejemplo, ¿Qué va antes, el huevo o la gallina? Muchas veces no es fácil determinar que va
antes de que, o si la enfermedad va en paralelo con el factor de exposición.
Por ejemplo: tenemos un grupo con la enfermedad, en este caso con Neumonía, y un grupo sin
enfermedad. Quiero ver si la hipertensión arterial (HTA) es un factor de riesgo de la neumonía.
Recogemos datos en uno y otro grupo de la HTA y vemos la frecuencia, tenemos que 4 de los que
tienen neumonía tienen HTA y 15 no; mientras que de los que NO tienen neumonía tenemos 6 que si
tienen HTA y 110 que no. La Odds Ratio se calcula haciendo una multiplicación cruzada:
(a x d) / (b x c), si el resultado es por encima de 1 nos dice que aumenta la probabilidad y si es por
debajo de 1 se reduce la probabilidad.
En este caso sería (4 x 110) / (6 x 15) = 4,89, esto quiere decir que entre los grupos que tienen
neumonía hay 4,89 veces más de probabilidad de que tenga HTA con respecto al grupo que no tiene
neumonía (esto nos dice la probabilidad de que un factor se de más en el grupo con la enfermedad
que en el grupo sin ella).
Otro ejemplo: queremos ver si la vibración de los músculos del cuello puede mejorar la función
sensoriomotora en pacientes con dolor de cuello, tenemos 2 grupos, un grupo con dolor de cuello
(grupo enfermo) y un grupo sano. Tenemos una medida previbracion y otra postvibración. Si las
medidas pre- y postvibración fueran igual, la vibración no sería efectiva. A simple vista podemos ver
con los gráficos que la medida previbracion en el grupo enfermo es mayor y que después disminuye,
mientras que en los sanos para lo contrario; por lo que la vibración produce efectos en los sujetos
enfermos y en los sujetos sanos. Los pacientes con dolor de cuello muestran una mejora y una
reducción de la dinámica postural después de la vibración, pero que no fue significativa el hecho de
que apliquemos la vibración en sujetos sanos, es decir, no tuvo resultados y da igual que aplique o que
no vibración en sujetos sanos, pero sí en los pacientes con dolor de cuello). Esto nos dice que la mejora
en el resultado se debe al efecto de la vibración.
7. Estudio de cohortes.
Partimos de una población sana y la estudiamos a lo largo del tiempo (son estudios de seguimiento
de una población) para ver si se desarrolla el factor (la variable de resultados), se subdividen en 2:
una parte que va a estar expuesta al factor de estudio y otra parte que no va a estar expuesta. De
los que están expuestos algunos pueden desarrollar la enfermedad y otros no; y de los que no están
expuestos igual, unos pueden desarrollar la enfermedad y otros no. Al finalizar el tipo del estudio se
compara la incidencia de enfermedad en ambos grupos. Este tipo de estudios estiman el Riesgo
Relativo.
Loli Martínez
VENTAJAS:
- Nos permite estimar un riesgo relativo de que algo se produzca, es decir, la incidencia.
- Nos permite seguir una enfermedad.
DESVENTAJA:
- Son muy caros: partimos de una persona sana y para que se desarrolle una enfermedad
pueden pasar muchos años y hay que seguirlos todos los años.
- Precisamos de muestras de muestras muy grandes porque si cogemos una muestra de 10
pacientes, puede que de esos 10 pacientes no se desarrolle la variable de resultados.
Es muy típico en los estudios de mortalidad, por ejemplo: quiero ver si la dieta vegetariana está
relacionada con la mortalidad. Para ello se coge una muestra de pacientes que algunos van a seguir
una dieta vegetariana y otros no, y vamos a estudiar su relación con la muerte. Siguiendo la misma
filosofía del Odds Ratio: si es por encima de 1 nos dice que
aumenta la probabilidad (sería un factor de riesgo), si es por
debajo de uno se reduce (sería un factor protector). Por ello, al
ver la tabla, en el modelo 1 (ser vegetariano, el sexo y la edad)
ser vegetariano es un factor protector, pero en el modelo 2, al
añadir otras variables como la educación, pasa a ser un factor de
riesgo (por el hecho de ser vegetariano tienes 1,03 más
posibilidades de morir que una persona no vegetariana).
Recordamos que partimos de una población sana, unos son
vegetarianos (unos mueren y otros no) y otros no son
vegetarianos (unos mueren y otros no)
En estos estudios tenemos un gran número de población, por lo que el coste de valorar a 1523
personas vegetarianas y a 241573 no vegetarianas implica un coste muy elevado.
Este tipo de estudios suelen ser entrevistas telefónicas.
Actualmente hay un estudio del cáncer muy importante que se lleva haciendo durante muchos años,
en él se va valorando gente, pero la inversión económica es enorme y el esfuerzo también, pero son
estudios con una evidencia científica muy importante.
EN RESUMEN:
Hay que quedarse con los conceptos de para que vamos a utilizar cada tipo de estudio, las ventajas y
las desventajas a nivel general, pero teniendo muy claro cuál es nuestro objetivo del estudio y que
tipo de estudio aplicaríamos. Por ejemplo: si voy a estudiar mortalidad: estudios de cohortes, si vamos
a estudiar la asociación entre un factor de exposición y una enfermedad un caso control seria lo mejor.
Estadística y métodos de investigación en Fisioterapia
Bloque 3. Tema 3.
Principios metodológicos de los diseños
experimentales
1. Introducción.
En esta ocasión, al tratarse de casos experimentales, el factor de estudio va a ser
controlado por nosotros. Es decir, nosotros vamos a decidir que paciente recibe cada
tratamiento.
2. Diseños experimentales.
Es un estudio en el cual el experimentador intencionadamente ofrece diferentes
tratamientos (pruebas de evaluación o cualquier procedimiento que nos permita
valorar) a 2 o más grupos y observa/mide sus respuestas para compararlas.
Si recordamos lo que dimos unos temas más atrás, podemos diferenciar dos tipos de
variables. Por un lado está la variable dependiente, la que se modifica o varía en función
de la variable principal, y luego está la variable independiente, la que no varía en función
de otras.
Estas 2 variables se pueden definir de la siguiente manera:
 Variable dependiente La o las variable sobre las que se evalúa el efecto, es decir,
es nuestra variable de resultado.
 Variable independiente Variable manipulada, es decir, es la causa que va a
producir ese efecto o resultado.
Por consiguiente, tenemos que entender que la variable independiente es la causante
de que se produzca, o la que genera, la variable dependiente. Tenemos que quedarnos
sobre todo con que la variable dependiente es la variable de resultado.
Ejemplo para comprender esto mejor:

Si nos encontramos frente a un paciente que padece una tendinopatía rotuliana tenemos
que tener en cuenta que uno de los tratamientos más empleados y eficaces para estas
patologías son los programas de ejercicio. Sin embargo, desconocemos a corto plazo
cuáles son sus efectos en estos pacientes; es importe saber que esta afectación va a
requerir un tratamiento a largo plazo ya que en algunos casos puede llegar a
complicarse.
En este caso, nosotros queremos comparar los efectos agudos del ejercicio isométrico vs
ejercicio dinámico durante una actividad que genera dolor en estos pacientes para saber
1
con cuál se obtienen unos mejores resultados. Para realizar el ejercicio isométrico vamos
a realizar una extensión de cuádriceps mantenida y en el ejercicio dinámico incluimos
movimiento mediante la realización de sentadillas. Por ello, se puede decir que se van a
realizar 2 tipos de intervenciones.
En este caso, nuestra variable dependiente va a ser el efecto agudo del ejercicio, ya que
nuestro resultado/objetivo es ver que ocurre en el paciente al realizar esto. Mientras
tanto, nuestra variable independiente va a ser el ejercicio dinámico e isométrico (tipo
de ejercicio), ya que estas son las variables que empleamos para obtener ese dolor
agudo.
3. Ensayo clínico.
El ensayo clínico aleatorio es el estudio experimental por excelencia. Después existen
otros estudios experimentales que ahora veremos, pero este es el más importante de
todos y el que mejor debemos conocer.
Los ECA (ensayos clínicos controlados aleatorizados) son los estudios que mayor nivel
de evidencia presentan, por encima de los no aleatorios.
Cuando nosotros queremos llevar a cabo un estudio o una investigación científica,

tenemos que tener en cuenta que vamos a partir de una población estudio o población
accesible (Esto ya lo vimos en el tema 1 de este bloque). Posteriormente, en base a los
criterios de selección (de inclusión y exclusión) vamos a seleccionar a nuestra muestra o
población elegible.
Es importante tener en cuenta que, al realizar estos estudios (ECA), tenemos que
obtener un permiso de consentimiento informado firmado por los pacientes para
2
poder realizarlo. En este se explicará el tipo de estudio a realizar, los efectos beneficiosos
que se buscan, si hay efectos secundarios, si reciben remuneración… Hay que realizar
esto ya que puede darse el caso que nosotros seleccionemos a un paciente, pero sin
embargo que este no quiera participar y no nos del consentimiento informado y a
consecuencia este deberá contar como caso de estudio perdido. Nosotros no podemos
obligar a nadie a participar en el estudio por lo que en cualquier momento pueden
revocar este consentimiento firmado.
Otro principio muy importante a tener en cuenta es que nuestro estudio debe ser,
siempre en la medida de lo posible, totalmente aleatorio. Es decir, a la hora de
seleccionar a los pacientes y decidir quién va en el grupo control y quién en el
experimental esto se debe realizar aleatoriamente. Gracias a esto habrá la misma
variabilidad y probabilidad de caer en un grupo que en otro y se disminuirá el riesgo de
sesgo en el estudio.
Mientras se está desarrollando el estudio pueden darse miles de razones por las que
una persona deje de participar en el estudio (hospitalización, caída, fractura,
defunción…), en estos casos es muy importante notificarlo y registrarlo en el estudio.
Además, hay que dejar constancia de cuál es la causa por la que la persona ya no
participa y se nombrarán como casos perdidos. Hay que intentar que en la medida de lo
posible estas pérdidas sean pequeñas.
Una vez se ha realizado la intervención del tratamiento, vamos a obtener los resultados
de grupo control y experimental y debemos comparar estas entre sí, para ver si el
tratamiento es o no efectivo.
Esquema resumen del procedimiento:
3
Por consiguiente, podemos determinar que el ECA presenta una serie de ventajas
respecto a otros estudios, pero también posee desventajas (debajo están explicadas
las más complejas de entender):
Ventajas:
Al realizar esta asignación aleatoria vamos a obtener una población homogénea y
estándar en ambos grupos que nos va a permitir realizar el estudio con un menor riesgo
de sesgo. Esto va a permitir obtener una mayor evidencia causa-efecto al determinar
que, si se obtienen resultados positivos en el grupo experimental pero no en el placebo,
es debido a que el tratamiento es beneficioso.
Desventajas:
Las restricciones éticas hacen referencia a la incapacidad moral y ética de desarrollar un
estudio con un tratamiento que ya sabemos que no va a tener efectos beneficiosos
sobre nuestros pacientes, además, esto está muy regulado y desde la comisión ética van
a impedir que este proyecto se desarrollase.
Al realizar esa selección tan exhaustiva con tantos criterios de inclusión y de exclusión
no se pueden extrapolar posteriormente a la clínica. Es decir, no podríamos aplicar estos
resultados obtenidos en la población elegible a la población diana.
Respecto a que poseen un coste elevado, es debido a que se requiere de una gran
inversión para determinar los resultados beneficiosos o negativos que estos estudios
tienen sobre los pacientes, además que son estudios de elevada duración.
3.1. Aleatorización.
La aleatorización permite distribuir equilibradamente factores que pueden influir en
resultados (grupos comparables). De esta forma, al ser grupos homogéneos desde un
principio, obtenemos grupos comparables sin ningún riesgo de sesgo a consecuencia de
este factor.
En los ECA siempre vamos a encontrar el siguiente diagrama, donde se determina el
número de pacientes totales, los excluidos y por qué se excluyen (es muy poco común
4
que en un estudio no se produzca ninguna pérdida), el seguimiento y el análisis de los
resultados.
3.2. Asignación aleatoria.

Es la técnica que permite distribuir a los sujetos en los grupos de estudio de forma que
sean comparables. Es decir, todos los pacientes presentan la misma probabilidad de ser
asignados a un grupo o a otro. La decisión de qué intervención recibirá cada sujeto la
realiza el azar, por lo que la mayoría de las veces, se tiende a producir una distribución
equilibrada tanto de las variables conocidas como las desconocidas. No podemos
realizar una comparación si los grupos son desequilibrados, por ejemplo, si un grupo
está compuesto solo por mujeres y otro solo por hombres, no podríamos desarrollar
este.
Hay que tener en cuenta que la mayoría de veces al hacerlo al azar sale más o menos
equilibrado, en el caso de que saliese completamente desequilibrado se podría repetir
la aleatorización.
3.3. Grupo control.

Si no se utiliza un grupo control es difícil saber si el efecto producido es debido a la
variable independiente o a otras. En todos los ensayos clínicos aleatorizados vamos a
5
encontrarnos un grupo control o placebo que será el que se compare con el
experimental.
En este grupo, lo que haremos será desarrollar todo el procedimiento de la misma forma
que en el experimental, salvo que no se llevará acabo el tratamiento. Es muy importante
que los pacientes no sepan a qué grupo pertenecen ya que esto podría influir en los
resultados.
En este ejemplo podemos ver como poseemos dos grupos homogéneos, el mismo tipo
de planta. Sin embargo, al grupo experimental sí que se le echa agua, es decir, se realiza
el tratamiento. Mientras que, al control, no se le echa agua, si se realiza la acción de
echar agua, pero la regadera está vacía. De esta forma, se podría determinar cuál es el
efecto del agua en las plantas respecto a crecer, tras comparar los resultados obtenidos
en ambos grupos. Así sabremos si el hecho de regar la planta aumenta su crecimiento o
esta iba a crecer igualmente, aunque no se regase.
Por consiguiente, podemos determinar que el objetivo de la creación de un grupo

control es intentar asegurar que el cambio en la variable resultado fue solamente
debido a la variable independiente.
Los efectos que puede controlar en el grupo control son:
 Otros eventos específicos (ej. otra intervención paralela).

 Efecto Placebo (producido por un tratamiento sin efecto). Hay veces en las que la
propia sugestión que posee la persona genera cambios de mejoría en el individuo a
pesar de que realmente no está tomando ningún tratamiento. Esto se ha visto sobre
todo con el uso de los ultrasonidos, es más placebo que fisiológico.
 Efecto de participación en estudio. Con esto nos referimos al control de si el
paciente se mantiene siempre en el mismo grupo o va variando. Lo correcto es que
se mantenga en el mismo durante todo el tratamiento.
 Evolución natural del problema de salud. Mediante el grupo control podemos saber
si el cambio en el individuo se produce gracias al tratamiento o porque debía
producirse si o sí.
6
3.4. Enmascaramiento.
El enmascaramiento son procedimientos realizados con el fin de que algunos de los
sujetos no conozcan algunos hechos u observaciones que pudieran ejercer un cambio
en sus acciones o decisiones y sesgar los resultados. Esto se debe a que las propias
expectativas tanto de los pacientes como de los investigadores pueden influir en la
evaluación de la respuesta que se obtiene.
Si el paciente sabe que él va al grupo experimental y que realmente está recibiendo la
intervención, puede sugestionarse y mejorar más que el paciente que sabe que está en
el grupo control y que no está recibiendo ninguna intervención. Por ello, es importante
que tanto el paciente como el investigador no conozcan en que grupo se encuentra para
no influir en este.
Podemos distinguir varios tipos de enmascaramiento:
 Simple ciego: Participantes (más frecuente) o investigadores que administran el

tratamiento desconocen qué intervención recibe cada individuo. Es decir, si el
paciente no sabe a qué grupo pertenece, el investigador si sabe a quién está
tratando o viceversa.
 Doble ciego: Tanto los participantes como los investigadores que administran el
tratamiento desconocen el tratamiento administrado. Es decir, ni paciente ni
investigador sabe a qué grupo pertenece el paciente.
 Triple ciego: Además de los participantes y los investigadores, otras personas como
el profesional estadístico que analizará los resultados desconocen qué intervención
recibe cada uno. Es el mejor ciego de todos.
3.5. Seguimiento.
Este debe ser lo suficientemente prolongado para que se obtenga un resultado, una
respuesta. Para saber qué tiempo se debe emplear para realizar este es muy importante
leer la literatura y contextualizar lo que queremos estudiar.
La comparabilidad inicial debe mantenerse en el tiempo y el seguimiento debe ser

uniforme salvo en la intervención. Por lo que hay que realizar un correcto seguimiento
que evite y controle las pérdidas (N.º y motivos, decir por qué se van del estudio):
 Abandonos ( Drops out) por enfermedad.

 Retiradas ( Withdrawals) de forma voluntaria.
 Pérdida de seguimiento ( Lost to follow up) defunción.
Ejemplo de pérdidas de seguimiento:
7
El número en color rojo es el número de pacientes que finalizan el estudio en cada grupo
y el número en negro es el nº de pacientes que abandonan.
Si poseemos muchas pérdidas en nuestro estudio, estén o no explicadas, va a aumentar
el riesgo de sesgo y, por ello, va a disminuir la calidad metodológica del estudio y no va
a ser válido puesto que no se podrá comparar.
Importante a tener en cuenta de los estudios experimentales: nosotros controlamos lo

que queremos estudiar y debemos realizar un correcto enmascaramiento y seguimiento
del estudio.
8
Loli Martínez
Bloque 3. Tema 4.
DISEÑO DE UN PROTOCOLO DE ESTUDIO
1. Concepto de protocolo de estudio.

Un protocolo de estudio va a ser una forma de planificar/organizar cómo vamos a realizar nuestra
investigación y como vamos a ejecutarla para poder publicar en un futuro los resultados y evaluar cada
fase del proceso de investigación para ver si la estamos haciendo bien y de forma adecuada.
En él tenemos que detallar todo el plan, desde la aprobación ética (todo proyecto de investigación tiene
que pasar por una comisión ética, en el TFG seria por ejemplo es la comisión ética de la universidad, que nos
piden: la protección de datos de los pacientes, como vamos a elaborar el plan de investigación, el consentimiento
informado, etc. Si la comisión ética no aprueba nuestro proyecto de investigación, la investigación no es viable,
ninguna revista nos publicará los resultados), hasta la diseminación de los resultados.
El protocolo tiene que estar bien redactado, con lenguaje científico, en inglés si lo vamos a presentar a
nivel internacional (incluso a nivel nacional también nos lo piden en inglés). Por ello hay que cuidar
todos los aspectos científicos, éticos y la seguridad del paciente (esto en caso de que realicemos un
ensayo clínico), ya que esto facilita una evaluación adecuada antes de que comienza un ensayo. En un
estudio observacional donde simplemente vamos a recoger datos (no vamos a aplicar ninguna
intervención), la aprobación ética no es tan exigente en comparación a un ensayo clínico donde vamos a
probar un tipo de intervención de terapia.
2. Esbozo de un protocolo de estudio

Un protocolo de estudio va a tener diferentes fases:
2.1. FASE 1: GENERALIZACIÓN DE LA IDEA DEL ESTUDIO.
La generación de ideas va a ser plantearme que quiero estudiar, es decir, plantear la pregunta de
investigación, por ejemplo: el artículo del síndrome del túnel carpiano, la pregunta sería: ¿Es mejor la
cirugía o las férulas de mano para el síndrome del túnel carpiano?
El objetivo va a ser lo que conteste a dicha pregunta de investigación, tiene que ser una afirmación de
lo que se va a hacer para responder. Los objetivos suelen comenzar por un verbo en infinitivo. Por
ejemplo: el artículo del STC, el objetivo sería comprar la efectividad de una y otra terapia para pacientes
con STC. Los objetivos pueden ser primarios (objetivo principal, el más importante de nuestro estudio.
Siempre hay objetivo primario) o secundarios (para explorar cosas más específicas, no siempre hay
objetivos secundarios).
Loli Martínez
En base al objetivo y a lo que conocemos del problema, es decir, a la contextualización del problema
previo del objetivo, tenemos que plantear la hipótesis. La hipótesis son los resultados que esperamos
en el estudio en base a lo que conocemos y al objetivo que planteamos. Por ejemplo, en el artículo del
STC podría ser: los pacientes tratados con cirugía tendrán mejores resultados que los tratados con
férulas; también podría ser: se despertaran menos veces por la noche los que llevan la férula de mano.
2.2. FASE 2: DISEÑO DEL ESTUDIO.
Una vez que sabemos lo que queremos estudiar (fase 1) planteamos nuestro diseño de estudio, es decir,
como lo vamos a hacer. Para ello primero se realiza un primer esbozo, que es una aproximación inicial, y
después se plantea un protocolo de estudio (plan de estudio): el tipo de diseño, los sujetos, etc.
Un esbozo es como un pequeño esquema con los puntos clave que no pueden faltar en mi diseño de
estudio. Es como un esquema inicial, pero que se puede ir modificando durante el desarrollo del
estudio, aun así, hay que tener en cuenta los principales puntos a la hora de planificarlo. Por ejemplo: en
el artículo del STC se plantea este esquema:
Loli Martínez
En este esquema podemos ver las preguntas de investigación y objetivos, pero estos objetivos son
principalmente los que responden a la pregunta ‘¿cómo comparar la efectividad a corto plazo, a medio
plazo, etc?’. Estos no tienen por qué ser los objetivos finales de nuestro estudio ni lo que va a estar ya
en el artículo final o en la forma de discusión final, pero si lo que pretendemos estudiar. Algunos
objetivos pueden prosperar y otros los podemos eliminar durante el desarrollo del estudio, pero
tenemos que tener varias vías abiertas antes de hacer el estudio.
Debemos conocer la importancia de lo que queremos estudiar, tenemos que plantearlo ya que al final
habrá que hacer una pequeña introducción de porque es importante lo que estamos estudiado.
Siguiendo el esquema tenemos los resultados esperados de lo que pretendemos estudiar, esto sería
nuestra hipótesis.
Tenemos que plantearnos el marco temporal, si va a ser un estudio transversal (si vamos a medir una
vez) o longitudinal (si lo vamos a hacer varias veces en el tiempo). Es importante plantearnos el marco
temporal porque después, a la hora de planificar el desarrollo del estudio, necesitamos una cierta
cantidad de dinero y en función del tipo de diseño de estudio vamos a necesitar realizar una mediación
o varias mediciones a lo largo del tiempo. Por tanto, el dinero necesario no va a ser el mismo si va a ser
una vez la recogida de datos, que si va a ser 4 veces (si recogemos los datos 4 veces los gastos
probablemente se van a cuadruplicar, hay que pagar a la persona que este recogiendo los datos, el
material que se va a gastar, las instalaciones, etc, pero sobre todo por el tipo de diseño). Por tanto, eso
tiene que estar previsto. En las mediciones hay que indicar cuando se mide la variable, normalmente se
hace al inicio, pero algunas veces una vez ya empezado el estudio se considera que es importante medir
otra cosa y hay que indicar que fue a las x semanas.
También tenemos que conocer el tipo de diseño del estudio, ya que no va a ser lo mismo un ensayo
clínico aleatorio (ECA), que un estudio observacional, tampoco tardaríamos el mismo tiempo ni los
costes serian igual, ni los análisis estadísticos van a ser los mismos.
Hay que centrar muy bien a que sujetos/participantes queremos estudiar, no podemos poner hombres
con patología cardiaca en general, tenemos que centrarnos en un determinado tipo de patología
cardiaca, o en un rango de edad, etc, porque si no al final estaríamos cogiendo poblaciones muy grandes
que se nos iría de las manos y no podríamos estudiar a cierto tipo de pacientes. Para ello tenemos los
criterios de selección (la exclusión y la inclusión) en el reclutamiento de los participantes, y mediante el
diseño de muestreo.
Las variables que vamos a medir son las variables de resultado que serían variables dependientes (la
variable de la que espero resultados) y las variables predictoras que serían variables independientes
que pueden variar mi resultado.
Tenemos que idear un planteamiento inicial, en el que después pueden variar el análisis estadístico y el
tamaño de muestra. En función de la potencia del análisis estadístico que queramos realizar,
necesitamos un tamaño de muestra específico, por ejemplo, si tenemos 10 sujetos no va a ser un buen
Loli Martínez
estudio porque faltaría más gente. Los estudios para ciertos análisis estadísticos van a necesitar muchas
veces tener 10 sujetos por cada variable a estudiar (para calcular el tamaño de la muestra existe una
fórmula), por lo tanto, algunos estudios que requieren 100-200 sujetos para poder esos análisis. Por ello
es importante calcular el tamaño de muestra al inicio del estudio, más vale que sobre a que falte porque
llegado el momento haciendo el análisis estadístico si no tenemos sujetos el estudio se pierde.
También tenemos que plantearnos y tener en cuenta los recursos disponibles que tenemos, el dinero, la
gente que tenemos para evaluar, los recursos clínicos, si necesitamos un ecógrafo, donde vamos a poder
realizar el estudio (por ejemplo, en un hospital solo o en varios como el Morales Messeguer, el Reina Sofía o la
Arrixaca). Todo esto lo tenemos que plantear y prever antes de la realización del estudio.
2.3. FASE 3: IMPLEMENTACIÓN DEL ESTUDIO
Después tenemos que presentar el tipo de estudio, el tipo de proyecto de investigación. Consta de:
1. Título
2. Resumen
3. Objetivos
4. Antecedentes
5. Método
6. Consideraciones éticas
7. Referencias
8. Apéndices
Hay que prever un título, que puede modificarse conforme pase el tiempo y de unos resultados. Tiene
que ser conciso y concreto (cuanto más simple mejor, máximo 20 palabras), y también descriptivo, es
decir, que sea fácil de entender el contenido que va a tener y el tipo de estudio. Se suele poner el tipo
de estudio que se va a realizar (pero no siempre). Debe ser así porque la persona que vaya a leer
nuestro proyecto de investigación y evalúe si va a ser viable o no, no va a saber si nuestro proyecto es de
patología cardiaca, si es de niños, si es de respiratorio, de neurología, etc, esa persona sabe que tienen
que haber unos puntos clave y en función de cómo lo vendamos (y si se entiende bien), va a dar
viabilidad o no a nuestro proyecto. Por ello todo el mundo que lo lea lo va a entender.
Hay que hacer un resumen donde se recogen los principales hallazgos que se esperan. El resumen tiene
que ser conciso, pueden ser 250-300 palabras (esto siempre lo va a poner en las normas de la revista a la que
vayamos a enviar nuestro articulo). Tiene que tener una estructura en donde suele haber una pregunta u
objetivo y los antecedentes, y métodos que vamos a utilizar.
Los objetivos se ponen a parte. Se ponen los objetivos primarios primero y si también tenemos objetivos
secundarios los ponemos después.
Loli Martínez
Antecedentes e importancia: hay que explicar porque es importante nuestro proyecto de investigación.
Debe ser comprensible, para quien no sea experto en el tema tratado. Respecto a la estructura:
- El estado de conocimiento seria como una pequeña introducción, ¿qué se sabe acerca de mi
problema? ¿Qué se sabe hasta ahora de lo que yo voy a estudiar?
- En la estructura se debe reflejar la calidad de los estudios realizados.
- La importancia del trabajo a realizar: hay que explicar porque es importante mi trabajo y porque
tienen que coger mi proyecto de investigación y no el del compañero.
- Si hemos hecho un estudio preliminar con un equipo (pilotaje) (no siempre tiene porque
haberlo), que trayectoria tiene nuestro grupo de investigación, que artículos hemos publicado
antes.
El objetivo es vender nuestro proyecto de investigación, tenemos que hacerlo atractivo y mostrar que
dominamos el tema y que nadie sabe más que yo del tema, hay que convencer al lector. También hay
que plantear el problema de la investigación y los vacíos/déficits existentes; el objetivo también es la
justificación.
En definitiva, es justificar porque es importante nuestro estudio.
Este apartado lo podemos comparar con una pequeña introducción
Método: una vez planteado porque es importante lo que voy a estudiar, nos tenemos que plantear el
método, es decir:
- El diseño proporciona una idea global de la estrategia de recogida de datos.

Hay que especificar el tipo de diseño que voy a emplear: si voy a utilizar un ECA, un estudio
observacional (si voy a describir), etc (RECORDAMOS QUE: ambos son importantes, solo
depende del objetivo). Sin embargo, el nombre de un tipo de estudio no suele ser suficiente
para dar una idea global y precisa, se debe acompañar de intervenciones, seguimiento, etc.
- Los sujetos/población de estudio. Tenemos la población diana (para generalizar) y accesible; son
muy importantes los criterios de selección (criterios de inclusión y de exclusión). Debemos
especificar como se van a reclutar a los pacientes, es decir, como voy a realizar el método de
muestreo (si va a ser aleatorio, si va a ser consecutivo), también hay que explicar el plan de
reclutamiento de los pacientes, es decir, conforme van llegando al hospital o a mi consulta y los
voy reclutando. El método de muestreo y el plan de reclutamiento suelen ir de la mano, son
muy parecidos por no decir igual.
- Intervenciones: Que vamos a aplicar según el tipo de estudio. El objetivo es estandarizar la

intervención y procesos pre y post. En este apartado hay que determinar los procedimientos, los
aparatos empleados y las estrategias de manejo del paciente. Es elemental cuando las
intervenciones son realizadas por más de un clínico o son multicéntricas.
Si vamos a aplicar un estudio experimental (ECA), hay que describir muy bien el tipo de
intervención que vamos a utilizar y habrá que utilizar intervenciones válidas o habrá que validar
nuestra intervención (podemos probar nuevas intervenciones, pero siempre hay que comparar
con algo que se sepa que vale, porque no podemos comparar con la nada ni con 2
Loli Martínez
intervenciones nuevas porque no vamos a saber si los resultados se producen por la

intervención nueva o no).
- Aleatorización y cegamiento: se hace la aleatorización (se puede hacer simple o por bloques) a
cada uno de los grupos si estamos en un ensayo clínico (el método de asignación lo suele hacer
un programa, aunque hay varios métodos de aleatorización). El cegamiento/enmascaramiento
puede ser: simple, doble o triple ciego (RECORDAMOS: el mejor tipo es el triple ciego, en el cual
estaba cegada la muestra, el que proporciona la intervención y el que analiza los datos). El tipo
de cegamiento hay que planificarlo previamente porque tenemos
que saber si vamos a cegar solo al paciente, al investigador o
también al analista de datos. Mínimo tenemos que tener un
enmascaramiento simple, un simple ciego, ya que si el paciente,
el terapeuta, quien mide o el analista es consciente de quien sí y
quien no recibe el tratamiento puede facilitar una respuesta y
sesgar los datos.
- Mediciones: tenemos las variables predictoras, las variables de confusión y las variables de
resultado.
Las variables de resultado son las describen los fenómenos asociados al resultado del desenlace
clínico en los sujetos investigados o su entorno (por ejemplo la muerte, el sobrevivir, la necesidad de
ventilación mecánica en pacientes con neumonía, la aparición de cáncer gástrico, etc ).
Las variables predictoras son la edad, sexo, etc. y pueden determinar cuál puede ser mi
resultado. Por ejemplo, con respecto a la edad y la velocidad de la marcha, si tienes menos edad
(más joven) nos indica que tendrá una velocidad de la marcha mayor. Otro ejemplo es si yo
tengo un paciente que ha sufrido un ACV/Ictus (tienen una discapacidad muy importante
después del ictus), esto es un problema en la limitación de la marcha; planteo un resultado en
base a la velocidad que tengan después del ictus (puedo saber cuál va a ser su velocidad final,
los 10 meses, puedo saber si su velocidad va a ser buena, si va a ser un paciente que camina de
forma independiente, si va a necesitar ayuda o si no a poder caminar). Por eso puede ser muy
interesante las variables predictoras porque a partir de una medida inicial podemos predecir un
resultado en el tiempo e incluso predecir la mortalidad (por ejemplo, si tiene una velocidad
menor a 0,04 en este tipo de pacientes tienen una mayor probabilidad de morir que un paciente
con una velocidad de 0,8).
Las variables de confusión distorsionan la medida de la asociación entre otras dos variables, son,
por ejemplo: si tenemos la velocidad de la marcha y la mortalidad, algo que me puede estar
confundiendo ese tipo de relación (la variable de confusión) sería la edad (suele ser una variable
de confusión importante); la variable predictora seria la velocidad de la marcha y variable de
resultado la mortalidad (el hecho de que tenga mayor o menor edad, puede determinar que
mueras antes o después, independientemente de la velocidad que tengas, por eso ajustamos
por esa variable).
Hay que tener en cuenta que una forma de poder ajustar entre variables (de poder
estandarizar), es utilizar las variables de confusión (esto lo vemos en la estadística interferencial).
Loli Martínez
- Es importante determinar el contenido y la temporalidad de las mediciones, es decir, saber

cuándo vamos a medir. Por ejemplo, no podemos decir que vamos a medir cada 6 meses, si en
los 6 meses que ha transcurrido desde que hemos aplicado la intervención o desde que hemos
medido no se han desarrollado los cambios, y en la literatura científica dice que la variable de
resultado los cambios se obtienen a partir de los 7 meses. No tiene sentido que midamos a los 6
meses, si hasta los 7 no vamos a obtener resultado. Por ello es importante conocer cómo se
comporta lo que queremos medir para saber cuándo debemos medir, si no se van a producir
cambios en ese tiempo, me voy a esperar a que se produzcan los cambios funcionales y
entonces medir.
Debemos tener un control en el seguimiento de las actividades y de las variables (pérdidas,
abandonos, etc)
- El análisis estadístico es importante determinar un plan de análisis y el tamaño de la muestra al

inicio (un pequeño esbozo de los posibles análisis). Los análisis de estadísticos se pueden ir
modificando conforme la marcha.
Todo lo anterior se redacta conforme se va desarrollando el estudio.
Las consideraciones éticas hay que tenerlas presentes y tienen que ser aprobadas.
Referencias: hay que referenciar los artículos, cada revista tiene una forma específica de referenciar (en
ciencias de la salud se usa el estilo Vancouver).
En el caso de que haya apéndices también hay que ponerlos. Los apéndices son información extra que
no ponemos dentro del artículo.
2.4. FASE 4: ANÁLISIS, INTERPRETACIÓN Y DIFUSIÓN DE LOS RESULTADOS.

Bloque 4. Tema 1.
Elementos de la Estadística Inferencial.
1. Introducción.
En clases anteriores se ha nombrado en algunas ocasiones diferentes términos como
extrapolar, bivariante… entre otras. Hasta ahora, hemos hablado de muestras y
poblaciones pero no hemos hecho distinción entre ellas, ya que hemos trabajado sobre
una base de datos de 30 casos a partir de la cual queremos aprender y sacar información.
Por consiguiente, ya sabemos cómo son nuestros pacientes y los hemos descrito,
podemos conocer si nuestros resultados son o no favorables y hemos analizado su hay
asociaciones o correlaciones entre diferentes variables.
2. Estadística descriptiva.
El objetivo de la estadística descriptiva es valorar si los resultados o las diferencias entre
ellos son importantes o son mínimas. Por ello, se conoce como la parte relacionada con
la descripción y síntesis de datos para lograr una visión global.
Mediante esta, vamos a poder presentar los datos a partir de tablas de frecuencias o
gráficos (como vimos ya anteriormente en otros temas) y para sintetizar estos datos
mediante un único valor como puede ser la media, mediana, desviación típica… Gracias
a esto, vamos a poder comparar grupos o establecer relaciones entre ellos, sin
embargo, hasta ahora no sabemos si esta diferencia es importante o no, es decir, no
sabemos si es estadísticamente significativo.
Si nosotros tenemos 30 casos y realizamos un estudio de investigación sobre ellos, nos
interesaría saber si posteriormente podemos extrapolar esta aplicación de una muestra
elegible a una muestra diana. Estos términos ya los vimos anteriormente, en este tema
veremos cómo se realiza esta extrapolación desde una muestra pequeña a toda una población.
3. Estadística inferencial (inferencia estadística).

Este es el procedimiento por el cual, a partir de una muestra pequeña, se obtienen
conclusiones que puedan ser aplicables a toda una población.
Un ejemplo de esto sería que, cuando nosotros hacemos una comida (paella,
macarrones, lo que sea) para ver si está buena o no, no nos la comemos entera. Lo que
hacemos es coger un poco y probarla para ver si está buena o no. Es lo mismo que
hacemos con la inferencial, vamos a coger una pequeña parte (muestra) para ver si
podemos aplicar este procedimiento a nivel general (población).
Algo muy importante a tener en cuenta es que, para poder inferir nuestra muestra a una
población, esta tiene q poseer validez interna y externa para que así presente un bajo
riesgo de sesgo. De esta forma, no limitaremos nuestro estudio.
1
A la hora de representar estos dos conceptos tenemos que saber que la población se va
a representar como ‘N’ y la muestra como ‘n’. Por consiguiente, en los artículos
científicos nos vamos a encontrar siempre una ‘n’ puesto que emplean muestras para
realizarlos, no toda la población.
3.1. Población de estudio (N).

Es el conjunto de referencia del que extraemos las observaciones, es decir, el conjunto
de todas las posibles unidades experimentales. Este conjunto de unidades
experimentales, no tiene que ser necesariamente un grupo de personas o animales,
también puede ser una revisión de historias clínicas.
3.2. Muestra (n).

Subconjunto de elementos de la población que habitualmente utilizaremos para realizar
un estudio estadístico. Se toman muestras cuando es difícil, imposible o costosa la
observación de todos los elementos de la población estadística.
El número de elementos que componen la muestra es a lo que llamamos tamaño
muestral y se representa por la letra minúscula n.
Nuestro objetivo será llegar a conocer ciertas características
de la población a partir de la muestra que dispongamos. Es
decir, obtener datos aplicables a la población a partir de la
muestra. A este proceso le llamamos inferencia.
Para que la estadística inferencial proporcione buenos resultados debe:
1. Basarse en una técnica estadístico-matemática adecuada al problema y
suficientemente validada.
2. Utilizar una muestra que realmente sea representativa de la población y de un
tamaño suficiente. Si trabajásemos con una muestra muy pequeña y sin variabilidad
no podríamos realizar análisis estadísticos ya que no podríamos saber por qué se
producen los cambios. Para poder obtener esta variabilidad hay que obtener una
muestra de manera aleatoria, al azar, para que sea heterogénea en cuanto a
diferencias, pero dentro de una población que en sí ya es homogénea. De esta forma,
sí podremos extrapolar.
Por consiguiente, es muy importante la selección de una muestra aleatoria en la que la
selección se realice con una igualdad de oportunidades de ser seleccionado para todos
los pacientes. De una forma más científica, esta se define de la siguiente forma:
2
’Aquella en la que todos los elementos de la población tienen las mismas oportunidades
de ser seleccionados (misma probabilidad de ser seleccionados). La aleatorización
permite que ningún elemento de la población se vea favorecido o excluido en el proceso
de selección.’
Para investigar una población tomamos un subconjunto de elementos a los que
estudiamos y de los cuales extraemos conclusiones sobre toda la población. La selección
de la muestra determinará la diferencia entre obtener resultados válidos o no.
Ejemplo:
Nosotros podríamos emplear una muestra aleatoria para saber que opinan los
fisioterapeutas españoles sobre la acupuntura enviamos un cuestionario por redes
sociales. Para realizar esto, podemos enviar un cuestionario por redes sociales sin
realizar ningún tipo de selección. De esta forma, obtendremos resultados de
fisioterapeutas muy diferentes.
La profesora ha dicho que los siguientes conceptos son muy importantes.
3.3 Estadístico.
Medida usada para describir alguna característica de una MUESTRA: porcentaje, media,
mediana, desviación típica…
Un ejemplo sería: Uso de Ortesis (si/no) y fuerza prensora en una muestra de 10
pacientes, como el número de pacientes está limitado, es una muestra lo que hemos
cogido a partir de toda una población. Podemos ver como en este ejemplo observamos
la media y desviación típica de esa muestra.
3.4 Parámetro.
Medida usada para describir las mismas características, pero de la POBLACIÓN:
porcentaje, media, mediana, desviación típica…
Un ejemplo sería: Altura media de los alemanes. Aquí estamos empleando la altura de
TODOS los alemanes, por ello, es una población.
Hasta ahora para describir nuestros 30 casos hemos estado empleando estadísticos ya
que trabajábamos con muestras. En investigación intentamos estimar parámetros a
partir de estadísticos, a partir de una muestra vamos a intentar obtener conclusiones
para toda la población. Esto se realiza mediante los análisis estadísticos.
3
Resumen: La diferencia entre estadístico y parámetro reside en que un estadístico se

aplica a la muestra y un parámetro se aplica a la población.
¿Cómo podemos saber si estamos ante un estadístico o un parámetro?
La representación de la media, desviación típica, varianza y porcentaje va a tener una
forma de representación en función de que se hable de estadístico o parámetro. ES MUY
IMPORTANTE SABER ESTO PARA PODER UBICARNOS CUANDO LEEMOS UN ESTUDIO.
4. Distribución muestral.
Una distribución es una lista, gráfico o función de todos los resultados posibles de una
variable aleatoria y la frecuencia con la que ocurre cada resultado concreto o conjunto
de resultados. Es decir, es la representación de todas las muestras posibles de una
misma variable para ver su distribución en una gráfica.
Mediante el siguiente gráfico nosotros podemos entender que la distribución es normal,
puesto que es simétrico. Este se podría emplear para representar diferentes parámetros
como puede ser la altura, el peso… dentro de una población. A partir de esta población,
sacamos muestras pequeñas hasta que nos quedamos sin más gente y, de cada muestra,
sacamos la media. A partir de esta media, podemos construir la gráfica para ver cómo
se comporta la distribución ya que tendremos grupos con menor media y otros con
mayor que permitirá ordenarlas.
4
Consideremos todas las posibles muestras de tamaño n en una población, entonces,

para cada muestra podemos calcular un estadístico (media, desviación típica,
proporción...) que variará de una a otra. Así obtenemos una distribución de ese
estadístico que se llamará distribución muestral.
Esto nos sirve para saber si otra muestra se encuentra por encima o por debajo de la
media. A partir de una muestra aleatoria que se calcule, vamos a poder saber por dónde
se sitúa en la distribución. Por ello, estudiando el comportamiento de todas las muestras
posibles podemos saber en qué lugar se encuentran los resultados de nuestra muestra
y comprender que significan estos cuando se alejan de nuestras expectativas.
Para esto deberíamos aplicar la fórmula matemática que ya sabemos ((n-media)
/desviación típica) y así obtendríamos la posición en la distribución.
Condiciones que deben cumplirse para poder aplicar esto:
1. Que la variable siga una distribución normal o aproximadamente normal
(p>0,05). De esta forma, nuestra media estadística será igual a la media
poblacional.
2. Si se cumple la anterior, obtendremos que el centro del modelo es el parámetro,
es decir, el centro de la gráfica corresponde a la media.
De esta forma, obtendremos dos gráficas de forma similar que nos permitirá comprarlas
ya que si estas son diferentes no podríamos, nosotros no podemos comparar un circulo
con un cuadrado.
Esta distribución muestral nos permite calcular la probabilidad, dada una muestra, de
acercarse al parámetro de la población. Es decir, si yo sé que mi variable sigue una
distribución simétrica, que probabilidad tengo de que la media corresponda con la de la
otra variable con la que la comparo (esto lo veremos en el siguiente tema).
4.1. Teorema central del límite.

Ahora bien, si la muestro o la población no sigue una distribución normal (una de las dos
no va a presentar la distribución normal, aunque nosotros nos vamos a centrar en la
muestra) o no sabemos cómo se distribuye la población, emplearemos el teorema
central del límite.
Este, es aplicable cuando la población no sigue una distribución normal o no se conoce
su distribución, pero el tamaño de la muestra es suficientemente grande (n ≥ 30). Sí o sí
debe tener este tamaño ya que indicaría que presenta una distribución
aproximadamente normal, si no, no se puede aplicar.
Si una población tiene media (μ) y desviación típica (σ), y tomamos muestras de tamaño
n (n ≥ 30 o cualquier tamaño si la población es "normal"), las medias de estas muestras
siguen aproximadamente la distribución:
Además, nos va a permitir inferir la media de la población a partir de una muestra,

aunque no siga una distribución normal o no se conozca la misma.
5
4.2. Error de muestreo.

Los valores de cualquier población se van a desviar en mayor o menor medida de su
media. Junto con las muestras halladas a partir de la población, vamos a calcular
también la desviación típica correspondiente a cada muestra. Hay que tener en cuenta
que la media en cada muestra va a variar levemente, a consecuencia de esto, la
variabilidad entre las medias (x̄) es lo que se conoce como error de muestreo.
La denotación de este es la desviación típica de la población partido de la raíz cuadrada
del tamaño muestral:
Por consiguiente, el error de muestreo sería la desviación típica resultante de la

obtención de las medias de distintas muestras aleatorias de la población.
Importante no confundirlo con el error típico de la media que vamos a ver más adelante.
Esto es un parámetro, aún estamos con POBLACIÓN, por lo que el error de muestreo
nos determina la diferencia entre la media de la muestra y la de la población.
Ejercicio 1. Error de muestreo.
a. ¿Cuál es el error de muestreo del modelo de distribución muestral de medias

cuando se extraen muestras de tamaño 200 de una población con una desviación
típica σ = 10?
Tenemos que aplicar la fórmula anteriormente planteada:
Por lo que si sustituimos los valores en esta fórmula obtenemos: x̄= 10/ (√200) = 0,7071
Por consiguiente, el error de muestreo es de 0,7071
b. ¿Y si σ = 7 y n = 20?
Esta vez, sustituimos estos valores en la misma fórmula: x̄= 7/ (√20) = 1,5652
Por consiguiente, el error de muestreo es de 1,5652
Resultado de aprendizaje: Cuando disminuimos el tamaño de la muestra, el error de
muestreo es mayor (el resultado del b tiene mayor error que el del a). Esto se debe a
6
que estamos cogiendo un mayor número de gente para nuestro estudio, por lo que la
probabilidad de que nuestros datos coincidan con la población es menor. Por
consiguiente, cuanto mayor es el número de datos, menor es la variación y más
precisos son los resultados. El tamaño de la muestra siempre debe ser lo más grande
posible.
RESUMEN DEL TEMA HASTA AQUÍ:

-Condiciones de empleo de la distribución muestral de medias muestrales:
1. Muestras obtenidas por aleatorización.
2. Que la población de procedencia u origen sea normal.
Si se cumplen las dos podremos realizar una comparación entre las poblaciones.
-Si la distribución no es normal:

Cuando la distribución original de X no es normal o se desconoce, aplicamos el Teorema
del Límite Central, siempre que n ≥ 30, si no, no se puede aplicar.
Para ello, debemos tener en cuenta el siguiente cuadrado
Ejercicio 2. Distribución muestral de medias muestrales.

La distribución de tallas de los neonatos de una población sigue una ley normal con
media de 50cm y σ= 1,5cm.
a) ¿Se cumplen las condiciones si se saca una muestra aleatoria de 100?
Como no sabemos si sigue la normalidad o no esta distribución puesto que no sabemos
los datos necesarios, aplicando el teorema central del límite (recuerdo que se usaba
cuando desconocíamos la distribución o cuando esta no es normal) si podríamos
aplicarlo.
IMPORTANTE: Aunque partamos de una distribución sesgada, como los tamaños
muestrales son grandes los resultados de la distribución muestral estarán próximos a
una distribución normal. Es decir, la distribución será aproximadamente normal.
5. Probabilidades asociadas (el P-Valor o P-Value)

Nosotros sabemos que el número que nos determina la normalidad es 0,05 ya que a
partir de él podemos indicar si hay un cambio significativo (<0,05) o no (>0,05). Por ello,
podemos decir que una variable es normal si su valor de P-value es >0,05, ya que no
habría cambio significativo. Sin embargo, no sabemos el por qué es este número y no
otro.
7
Ya sabemos que, si una distribución se

aproxima a un modelo normal, podemos
estimar que el 68% se encuentra a ±1σ
(esto lo dimos en temas anteriores
cuando nos dijo que era muy importante
recordar el tip de 68-95-99). Para ello,
tenemos que reconocer que este gráfico
corresponde al modelo de distribución
normal, cuyo centro es igual a la media, lo que nos divide en 2 partes iguales nuestra
población (50/50), ya que al ser normal la media y mediana coinciden.
Debido a esto, podemos calcular cual es la probabilidad de obtener una determinada
muestra en función de conocer dos parámetros: media y desviación típica.
Ejemplo: Teniendo en cuenta media μ y desviación típica σ de la distribución, existe
una PROBABILIDAD del …
a) …50% de obtener una muestra con una media
Explicación: Si sabemos que nuestra media es 20, a partir de esta vamos a tener el 50%
de probabilidades de determinar que la mitad de la población se encuentra por debajo
de 20, ya que la otra mitad se encuentra por encima de este valor.
b) …68,2% de obtener una muestra con media
Explicación: Si sabemos que el 68% de la población se encuentra a ±1σ, podemos
determinar que presentamos un 68,2% de probabilidades de encontrar medias
muestrales entre 17,5 y 22,5. (Para poder calcular esto, tenemos que emplear la fórmula
de media±1σ, lo que pasa es que la profesora nos ha dado directamente el resultado, no
sabemos cuál es la desviación típica).
c)… 2,2% de obtener una muestra con una media
Explicación: Si sabemos que el 97% se encuentra a ±3σ, tenemos un 2% de
probabilidades de encontrar medias muestrales atribuibles a números superiores de 25
o 15.
A partir de esto, podemos plantearnos la siguiente pregunta: ¿Qué es el P-Valor?
8
Probabilidad de hallar un estadístico igual o superior (≥) asumiendo una determinada

distribución muestral determinada. Es decir, es la probabilidad de conocer el lugar
exacto en el que se encuentra un estadístico en una distribución muestral.
Ejercicio 3. P-Valor.
Si sabemos que en la distribución muestral (con muestras n=30) nuestra media es 100
y la desviación típica (σ)= 15 ¿cuál es el p-value de una media 119 en una muestra de
30 sujetos?
Como nos piden calcular el P-valor de 119, ya sabemos que tenemos que encontrar
µ≥119 (al observar que la media se nombra como µ y la desviación típica con σ, debemos
saber que estamos trabajando con población). Para poder determinar esta, debemos
tipificar y conocer así la posición en la que se encuentra 119; para ello, recordemos que
hay que emplear una fórmula sencilla ya explicada en otro tema anterior:
Si sustituimos en esta fórmula los valores que poseemos obtendremos una posición:
Esto nos indica que aproximadamente se encuentra a ±1σ
Ahora bien, lo que nosotros queremos es conocer la posición exacta donde encontramos
el 119. Por lo que, si ya hemos determinado que p(µ≥119) =p(z=≥1,27) vamos a la tabla
Z (nos la darán en el examen) y buscamos el valor que corresponda a 1,27 que en este
caso es 0,8980. Sin embargo, tenemos que tener en cuenta que nos está pidiendo un
valor que sea> a 1,27 no que sea igual. Por ello, si recordamos bien, debemos restarle a
1 el valor que obtengamos en la tabla, es decir, debemos hacer 1-0,8980= 0,102= 10%.
Por consiguiente, podemos concluir que p(µ≥119) = 10%. Poseemos una probabilidad
del 10% de hallar una media de 119. Al poseer una probabilidad del 10% (0,102), como
es un valor >0,05, no sería un cambio significativo ya que estaría dentro de lo ‘esperable’.
Poco a poco vamos a ir viendo cómo llegamos al valor de 0,05, esto es solo el principio.
6. Distribución muestral con parámetros desconocidos (Modelos T

de Student).
6.1.Error típico de la media.
Hasta ahora conocíamos los parámetros que teníamos para poder resolver el ejercicio y
podíamos relacionar la población con el error de muestreo. Un ejemplo de este tipo
sería el ejercicio que hemos hecho antes o el siguiente enunciado:
La distribución de tallas de los neonatos de una POBLACIÓN sigue una ley normal de
media=50cm y desviación típica=1,5 cm. ¿Cuál es el ERROR DE MUESTREO de la media
de muestras aleatorias de n=100? (Recordar la fórmula matemática para el error de
muestreo )
9
Sin embargo, a partir de ahora, vamos a trabajar con parámetros desconocidos donde
podremos asociar la muestra al error típico de la media. El error típico va a ser parecido
a la desviación típica, solo que se tiene en cuenta el tamaño muestral respecto a una
muestra concreta. Un ejemplo de esto sería el siguiente enunciado:
La distribución de tallas de una MUESTRA aleatoria de 100 neonatos presenta
media=51cm. y una desviación típica=2 cm. ¿Cuál es el ERROR TÍPICO DE LA MEDIA en
la distribución muestral?
Al igual que para el error de muestreo tenemos una determinada fórmula, poseemos
otra para el error típico de la media. Hay que tener en cuenta que las fórmulas son las
mismas pero fáciles de distinguir ya que lo único que cambia de una a otra es la forma
de expresar esta. En el error de muestreo se aplica con los símbolos pertenecientes a la
población y en el error típico de la media, los pertenecientes a la muestra.
Muchas veces, se necesita ESTIMAR cómo es la distribución muestral con datos de la

muestra ya que lo normal es que solo poseamos datos de nuestra muestra ya que no es
posible obtener todos los datos de una población. Al final, las poblaciones son modelos
teóricos y no prácticos, por eso necesitamos desde un punto de vista práctico, algo que
nos permita inferior o suponer en lo referente a la población.
Lo que más nos interesa ahora mismos es tener claro los conceptos de asociación para
poder calcular un error u otro en función de los datos que nos faciliten:
 Población error de muestreo

 Muestra error típico de la media
Por consiguiente, podríamos decir que el error típico de la media es una estimación del
error de muestreo a partir de muestra. Es decir, nos da una idea de cuál puede ser la
distribución de la muestra, pero no nos dice exactamente si esta sigue una distribución
normal o no. Mediante esta obtendremos información acerca de la dispersión que posee
la muestra, nos da información similar a la desviación típica: cuanto mayor valor tenga,
mayor dispersión.
Si resolviésemos el ejemplo anterior planteado (justo al inicio de esta hoja) para el error
típico de la media, únicamente tendríamos que sustituir los datos que poseemos en la
fórmula. Como el valor es pequeño, podemos decir que no hay una gran dispersión, pero
no podemos indicar la forma de la distribución.
10
6.2. Modelo de distribución T de Student.

Como el modelo de distribución normal donde empleamos los valores Z pocas veces los
vamos a poder conocer, requerimos del uso de otros modelos. Aquí es donde entra en
juego el modelo de distribución T de Student.
Este modelo lo vamos a emplear cuando no sabemos si nuestra muestra sigue una
distribución normal o no poseemos los parámetros de la población.
Cola
Los modelos T student y el de distribución normal se caracterizan porque son muy

parecidos, la única diferencia que presentan es que uno posee mayor dispersión que el
otro. Como se puede ver en la imagen de arriba, el modelo T tiene valores más dispersos
que el modelo de distribución normal. Ambos modelos se caracterizan por:
Ambas presentan como centro el valor 0 y tienen forma de campana.
Se diferencian en que la distribución T es más corta y plana y su desviación
estándar en proporcionalmente mayor, por lo que las colas son más gruesas y
altas. (La cola de la distribución es la parte más extrema, la que delimita el final).
La distribución T se emplea para estudiar la media de una población no los elementos
de la población. Hay que conocer que se recurre a ellas para estimar la media
poblacional o cuando se utilizan datos para verificar una afirmación referente a la media
poblacional.
No existe una sola distribución T, sino que hay muchas que varían en función del
tamaño muestral ya que cada una se caracteriza por los grados de libertad. Esto último
es lo que corresponde al número total de la muestra menos 1, es decir, n-1. Un ejemplo
de esto sería: n=10 → distribución t con 10-1=9 grados de libertad → t9. La forma de
denotar los grados de libertad siempre es igual se coloca tX y, por consiguiente, para
cada tamaño muestral existe un grado de libertad diferente.
Cosas a tener en cuenta de la distribución T:
 Las distribuciones t con tamaños muestrales pequeños tendrán una desviación

estándar mayor (mayor dispersión) que las basadas en tamaños muestrales grandes.
 Cuanto más grande sea el tamaño de la muestra, mayor será el número de grados
de libertad y más se acercará (se parecerá) la distribución t a la distribución normal
estándar (distribución Z).
11
 Un punto de corte aproximado donde la distribución t y la Z son similares es

alrededor de n=30. Al coger un número de muestras≥30, se disminuye la dispersión
y se genera una distribución T similar a Z. Es decir, es aproximadamente normal ya
que no llega a ser una distribución Z pero sus valores son cercanos.
En esta gráfica presentamos diferentes
distribuciones con sus grados de
libertad correspondientes. Si nos
fijamos, la gráfica azul posee un tamaño
muestral de 30 (grado de libertad) y, a
diferencia de la verde con un tamaño
muestral de 3, es prácticamente similar
a la distribución normal estándar. Por
tanto, a mayor tamaño muestral, más
similar es a la distribución Z o normal. A
consecuencia de eso, se establece ese
punto que obliga a coger muestras ≥30.
Uso de la tabla T
Recordar que la vamos a emplear cuando no sabemos si nuestra muestra sigue una
distribución normal o no poseemos los parámetros de la población.
Pasamos de emplear la tabla Z usada hasta ahora a emplear la tabla T. En esta, en las
filas vamos a tener los grados de libertad (n-1) y en las columnas tendremos la
probabilidad (por un lado o por ambos). Si solo observamos una cola, un lado, sí o sí va
a ser un valor ≥ que… Mientras que, si observamos ambos lados o colas, pueden ser
valores tanto ≥ o ≤ que...
Diferencias entre la tabla T y la tabla Z:
Tabla Z Hay que tener en cuenta que nuestro valor 0 en la tabla Z corresponde a la
media, por lo que, cuanto más nos alejamos de esta posición mayor es la probabilidad
de encontrarnos dentro de estos valores de normalidad estandarizados. En la imagen
siguiente se muestra una parte de la tabla Z. Todos los números que vemos en ella en
función de las filas y columnas, representan la probabilidad de caer en una posición
determinada o en una posición menor a esta. Por ejemplo, la probabilidad de obtener
un número o posición igual o inferior a 1,23 es de 0,8907 (subrayado en la imagen).
12
Tabla T Mediante esta no vamos a obtener una probabilidad exacta, vamos a

determinar la posición en la distribución en donde se encuentra una muestra y a partir
de ahí ver si un valor es importante o no. En ella encontramos el tamaño muestral y
probabilidades a partir de las cuales vamos a ser capaces de determinar una posición
exacta. Por ejemplo, para un tamaño muestral de 10 y una probabilidad de una cola de
0,10, si nuestro número es mayor a 1,372 significa que es raro ya que solo pertenece al
10%, es decir, se encuentra en una población muy pequeña (subrayado en la imagen).
Resumen: La tabla T es inversa a la tabla Z. En la tabla Z calculamos la probabilidad de

caer en una determinada posición y en la tabla T calculamos una posición a partir de la
probabilidad.
A consecuencia de ello, podemos decir que la tabla T se caracteriza por (todo esto ya se
ha comentado anteriormente pero aquí está de manera más específica y detallada por
si os ayuda):
 El tamaño de la muestra, no por su media y desviación típica. Se encuentra

construida a partir de unos tamaños prefijados cuando se realiza de forma
manual, mediante el SPSS existen valores diferentes, pero de forma manual solo
hay unos específicos (no hay que saberlos, nos dejan la hoja. Nosotros tenemos
que saber interpretarla para poder obtenerlos).
 Solo muestra ciertos valores de distribuciones t para algunos grados de libertad
y algunas probabilidades.
 Cada fila representa una distribución t diferente, caracterizada por los grados de
libertad (gl/df).
 Las columnas representan diversas probabilidades del tipo “mayor que”
(onetall)→ 0.20; 0.10; 0.05… Esto nos va a ayudar a determinar si los hallazgos
encontrados en nuestro estudio son relevantes o no.
 Los números dispuestos a lo largo de una fila son los valores de la distribución t
correspondiente a las probabilidades “mayor que” y/o “menor que” de las
columnas.
 La probabilidad “mayor que” también es conocida como “cola derecha” →
Indican que estas probabilidades representan áreas situadas en el extremo
13
derecho (cola derecha de la distribución t). Esto ocurre cuando solo nos basamos
en una cola, si miramos las dos colas podríamos obtener valores tanto “mayor
que” como “menor que”.
Ejercicio 4. Distribución muestral con parámetros desconocidos (T de Student).
¿Cuál es el valor crítico tipificado que deja el 5% en un lado (unilateral) de distribución
muestral de medias con muestras n=51?
Nos iríamos a la tabla T y miraríamos donde pone una cola o unilateral y nos
colocaríamos en la columna del 5% (0,05). Una vez ahí, calcularíamos los grados de
libertad (n-1) a partir de la muestra que nos da de 51. Por lo que para hallar estos
haríamos 51-1=50. De tal forma que miramos en la columna de 0,05 unilateral y la fila
de 50 y obtenemos que el valor crítico tipificado es 1,67.
Por consiguiente, si nosotros obtuviéramos una posición >1,67 sería raro ya que hemos
obtenido que lo habitual o fácil de obtener probabilísticamente, es que sea igual o
inferior a 1,67.
¿Varía si se considera el hecho de dejar el 5% bilateralmente?

Si varía, ya que en el caso anterior estábamos dejando sin coger un 95% de la población
ya que solo teníamos en cuenta un 5%. Sin embargo, ahora no cogemos un 90% puesto
que al ser bilateralmente estamos teniendo en cuenta un 10%. Por lo que en este caso
deberíamos observar la columna de 0,05 bilateral y la fila de 50 ya que los grados de
libertad si son iguales. A consecuencia de este cambio, podemos ver como el valor crítico
aumenta, ha pasado de ser 1,67 en el caso anterior a ser 2 ahora. Esto se debe a que
estamos reduciendo la probabilidad, dejamos menos valores que podemos coger.
Por consiguiente, a menor tamaño muestral o menor probabilidad, mayor es el valor
crítico tipificado que obtenemos. La mayoría de veces la probabilidad va a ser del 95%.
14
Ejercicio 5. Distribución muestral con parámetros desconocidos (T de Student).

Si sabemos que en la distribución muestral (con muestras n=23): - Media (μ) = 30;
- ¿Cuál es el error típico?;
A partir de la fórmula del error típico sustituimos y obtenemos este valor:
- ¿Cuál es el p-value de una media ( ) = 31 y desviación típica (S) = 4,25 en una n =

23 sujetos?
Una vez tenemos el error típico, podemos hallar cual es el P-Valor mediante tipificación.
Esto se debe a que mediante la tabla T no podemos calcular directamente el P-Value,
cosa que si podíamos hacer mediante la tabla Z. Para ello, empelamos la siguiente
fórmula a partir de la cual sustituimos los valores que ya tenemos:
Más usos de la tabla T

Esta también puede emplearse para obtener percentiles. Uno para el que se emplea
mucho es para hallar el percentil 95 de la distribución t con n-1 grados de libertad. Este,
es el valor de tn-1 cuya probabilidad de cola izquierda (“menor que”) es 0.95 y de cola
derecha es 0.05
El percentil 90 correspondería a 0,10 en la cola derecha.
Un ejemplo sería hallar el percentil 95 para una muestra 10 con 9 grados de libertad
Para ello, buscaríamos en la tabla en la fila 9 (gl=9) y en la columna de 0,05 para una
cola y obtendríamos que P95 de t9= 1,883. Por ello, determinaríamos que obtener un
valor superior a 1,883 sería raro y lo llamaríamos alfa.
Nuevo concepto: la zona de la cola o el valor situado por encima del tipificado obtenido,
se va a denominar Alfa. Es decir, los valores que hemos estado llamando raros hasta
ahora, pasan a denominarse valores alfa.
15
7. Distribución muestral de proporciones muestrales.

La proporción muestral es el número de elementos de una muestra que tienen una
característica de interés partido por el tamaño total de la muestra. A partir de la
proporción muestral podemos denotar la poblacional.
(Antes que nada, recordar que la
proporción muestral se representa con
el símbolo p y la poblacional con el
símbolo pi).
La forma de calcular esto es muy
sencillo; si nos pidiesen la proporción de
fumadores de una muestra y sabemos
que n=100 y fumadores son
40,unicamnete realizamos una
división 40/100=0,4 y tenemos la
proporción de fumadores.
Vamos a destacar que estas proporciones se aproximan al modelo NORMAL y que el
centro del modelo va a coincidir con el parámetro. Lo único que varía o que es diferente
a lo que hemos visto hasta ahora, es el error de muestreo de la población. En este caso,
la fórmula matemática de este es la siguiente:
Ejercicio 6. Distribución muestral de proporciones muestrales.

a) ¿Cuál es el error muestreo del MODELO de distribución muestral de proporciones
cuando se extraen muestras de tamaño 200 de una población con una proporción
π=0,25?
Lo único que debemos hacer aquí para obtener la solución es sustituir los valores que
0,25.(1−0,25)
nos dan en la fórmula que hay arriba. 𝑆𝐷(𝑝) = √ = 0,030
200
b) ¿Y si π = 0,06 y n= 175?
0,06.(1−0,06)
Volvemos a sustituir en la misma fórmula estos valores.𝑆𝐷(𝑝) = √ = 0,018
175
c) ¿Qué valor tendría el centro del MODELO del ejercicio a)?

Esto siempre corresponde a la proporción del parámetro poblacional que nos den o
tengamos que hallar nosotros, es decir, corresponde al valor de π. En este caso, sería
0,25.
16
7.1. Condiciones de aplicación.

 Muestra obtenida por aleatorización siempre.
 Muestra de tamaño “suficientemente” grande. Esto es cuando el tamaño de la
muestra (n) por la proporción (p) y n(1-p) son mayores de 5 o 10. Es decir, se cumple
esto si np>5 y n(1-p)>5.
Por ejemplo: Si p=0,45 en una muestra de 808 personas
np= 808x0,45=364 n(1-p) = 808x0,55=444
Por consiguiente, como ambos valores son mayores de 5 y 10, si se cumple.
Ejercicio 7. Condiciones de aplicación.
En una región se toma una muestra aleatoria de 550 nacimientos de los cuales el 56,9%
fueron varones. ¿Se cumplen las condiciones para aplicar el TCL a la distribución
muestral de proporciones de varones a partir de esa muestra?
np= 550x0,569= 312,95 n(1-p) = 550x (1-0,569) = 237,05
Se cumplen ambos requisitos ya que las muestras son aleatorias y ambos valores son
mayores de 5 o 10.
7.2. Probabilidades para la proporción muestral (p-valor / p-value).

Recordemos que el P-Valor es la probabilidad de hallar un estadístico igual o superior
asumiendo una determinada distribución muestral.
Como esta se aproxima al modelo de distribución normal, podemos estimar la
probabilidad de obtener muestras en un intervalo estadístico convirtiendo p en un valor
Z y buscando estas probabilidades en la tabla Z.
En este caso, el centro de la distribución no corresponde a la media, es el parámetro de
la distribución.
Con las proporciones vamos a utilizar el valor Z, tipificamos empleando la proporción de
la población- la proporción de la muestra partido del error de muestreo. Es decir,
empleamos la fórmula:
Ejercicio 8. Probabilidades para la proporción muestral (p-valor / p-value).

En un hospital se detecta en un año 550 nacimientos de los cuales el 56,9% fueron
varones. ¿Cuál es el P-value de esa proporción si asumimos que el centro de la
distribución muestral se sitúa en 51,7% y SD(p)=2,13%?
Es muy importante que los porcentajes los pasemos a números naturales.
17
0,569−0,517
Debemos sustituir en la fórmula de antes Z= =2,44 A partir de este valor,
0,0213
nos vamos a la tabla Z y localizamos 2,4 en la fila y 0,4 en la columna y vemos que la
probabilidad de obtener este valor es de 0,9927 99%.
7.3. Distribución muestral con parámetros desconocidos.

En muchas ocasiones vamos a tener acceso a la muestra y vamos a desconocer los
valores de la población. Por ello, vamos a tener que estimar el error típico de la
proporción para la población. Es decir, muchas veces, se necesita estimar cómo es la
distribución muestral con datos de la muestra.
En función de que los valores a los que tengamos acceso sean los de la muestra o de la
población, vamos a emplear una fórmula u otra. Esta información siempre la vamos a
encontrar en los ejercicios cuando nos hablen del centro de la distribución muestral.
Ejercicio 9. Distribución muestral con parámetros desconocidos.

En una muestra aleatoria de 40 sujetos hay 24 fumadores. ¿Cuál es error típico de la
proporción de fumadores?
En primer lugar, hallamos la proporción 24/40= 0,6 y como estamos hablando de error
típico, empleamos la fórmula que hay a la derecha y sustituimos en esta.
0,6(1 − 0,6)
𝑆𝐸 (𝑃) = √ = 0,24
40
18
Loli Martínez
Bloque 4.
Tema 2: ESTIMACIÓN DE PARÁMETROS
1 Conceptos preliminares.
1.1 ESTADÍSTICA INFERENCIAL Y ESTIMACIÓN DE PARÁMETROS
La estadística inferencial es que a partir de nuestra muestra extrapolamos todos nuestros

resultados a toda la población (lo que hacemos con la paella: para probarla cogemos solo
una parte, una muestra, para ver como está, ya que no podemos cogerla toda para saber si
está buena o no). Ya hemos visto que elementos participan en la inferencia.
No nos sirve quedarnos en nuestra muestra si después no le puede servir a otro tipo de
pacientes de características similares (si estamos realizando un estudio con pacientes de
patología cardiaca nuestros resultados no son aplicables a pacientes con esguinces de
tobillo, pero si debiesen ser aplicables a pacientes con patología cardiaca). El objetivo va a
ser estimar a partir de nuestra muestra datos que podemos extrapolar a una población
(tienen que ser características representativas de nuestra muestra y de la población).
La estadística descriptiva describía como es nuestra población, no podemos decir si nuestros

resultados son extrapolables, y podemos ver si hay alguna diferencia a simple vista, pero no
podemos decir si es una diferencia significativa (si eso es importante/relevante).
Los ESTADÍSTICOS son las medidas que usamos para describir alguna característica de la
muestra: porcentaje, media, mediana, desviación típica, etc. Es el número que resume los
datos recopilados de una MUESTRA.
Por ejemplo: el uso de ortesis (si/no) y nuestra fuerza prensora en nuestra muestra,
podemos ver la media de un grupo con intervención y otro grupo control, obteniendo los
datos de una muestra.
Los PARÁMETROS son las medidas que usamos para describirlas mismas características,
pero de la población: porcentaje, media, mediana, desviación típica, etc. Es el número que
resume los datos recopilados de una POBLACIÓN.
Por ejemplo: la altura media de los alemanes, obteniendo los datos de la población.
Los estadísticos y los parámetros son similares en porcentaje, media y mediana.
Vamos a tener la media y el porcentaje con su desviación típica.
1
Loli Martínez
A partir de los estadísticos de nuestra

muestra inferimos a toda la
población mediante los parámetros,
es decir, intentamos estimar
parámetros a partir de estadísticos.
Esto al final es un círculo vicioso

porque extraemos la muestra a partir
de la población, y a partir de la
muestra obtenemos los estadísticos,
inferenciamos y obtenemos los
parámetros (población).
Para estimar el valor de un parámetro se toma una muestra de la población.

Los estadísticos de la muestra nos van a permitir obtener una estimación válida.
Recuerdo:
El tamaño de una población se representaba  N
El tamaño de una muestra  n
Casi siempre vamos a trabajar con estadísticos
1.2 ESTIMACIÓN PUNTUAL
Podemos tener diferentes tipos de estimaciones.
Por ejemplo: para conocer el porcentaje de alumnas con un IMC>25, el fisioterapeuta de

una red de centros educativos de esa región midió el peso y la altura a una MUESTRA
aleatoria de 200 alumnas. Con el peso y la altura obtenemos el IMC de una muestra
aleatoria de 200 alumnas, solo 28 de las estudiantes tuvieron un IMC>25.
Si obtenemos nuestro porcentaje  p= 38/200 = 0,19 x 100 = 19% TIPO EXAMEN (CALCULAR EL
%). Un 19 % de las alumnas tienen un IMC>25.
Tenemos un número determinado que puede coincidir o no con la población, es poco

probable que coincida con el verdadero parámetro. Este tipo de estimación es una
ESTIMACION PUNTUAL: obtenemos un % que comparamos con nuestro parámetro.
2
Loli Martínez
ESTIMACIÓN PUNTUAL: asumimos que el parámetro va a ser igual al estadístico, van a tener
el mismo valor (sabemos que esto no va a ocurrir en la mayoría de los casos).
Características:  Es un valor numérico simple y es la estimación de un parámetro
desconocido.
 Carece de precisión ya que es poco probable coincidir con el

verdadero parámetro.
1.3 LA ESTIMACIÓN MEDIANTE INTERVALOS DE CONFIANZA
Cuando obtenemos un rango, nosotros decimos que, en ese rango, nuestra proporción se va
a aproximar a la de la población.
Por ejemplo: tenemos una estimación puntual del 19%, y es muy poco probable coincidir
con el centro de la distribución, pero si ahora digo que mi estadístico ( muestra) se va a hallar
entre estos valores del rango, tengo mayor probabilidad de que mi estadístico coincida con
el parámetro de la población.
Por eso se utiliza un intervalo de confianza (IC). Todos los estudios van con su IC porque es
muy poco probable que nuestro estadístico coincida con el de la población, pero si damos
un rango tenemos mas probabilidad de que coincidamos con la población (el IMC de María
va a ser diferente al de Mireya, etc, así con cada uno, pero si yo digo un rango,
probablemente dentro de este nos encontremos la mayoría de los alumnos, a eso se le
denomina intervalo de confianza).
IC = p ± ME
El intervalo de confianza va a ser el estadístico (proporción o media) ± un margen de error
(tenemos que dar un valor negativo y otro positivo [por encima o por debajo de la media o de la
proporción] porque no todo el mundo se va a situar entorno a la media, sino que siempre
vamos a tener sujetos alrededor de nuestro estadístico, ya sea por abajo o por arriba, por
eso el intervalo de confianza va a tener un valor negativo y uno positivo (±), como hacíamos
con la desviación típica).
3
Loli Martínez
Un valor negativo NO es que sea un valor de ‘-5’, sino que al

estadístico le vamos a restar su margen de error y ese va a ser el
límite inferior. Se representa: límite inferior – límite superior.
Por ejemplo: si tomamos 7 como estadístico y su ME=3, 4 va a
ser el límite inferior, y el 10 va a ser su límite superior; por lo que el IC para 7±3 sería de 4-
10.
Muchas veces vemos el estadístico y entre paréntesis el intervalo de confianza (esto es en el

caso de la estadística inferencial, en la estadística descriptiva tenemos la desviación).
La amplitud del intervalo de confianza es 2 veces el margen de error (2 veces porque

tenemos uno por arriba [positivo] y otro por abajo [negativo]).
El nivel de seguridad o confianza es lo que vemos en los estudios el 90%, el 95%, el 99% (en
la mayoría el IC que se utiliza es el del 95%, ya que es el que esta aceptado por la comunidad
científica). En la mayoría los artículos científicos vamos a encontrar su intervalo de confianza,
porque los pacientes varían mucho y tenemos que dar un rango de valores posibles donde se puede
hallar ese valor, ese estadístico parámetro . El IC nos da una información de si un valor puede
ser muy atípico dentro de lo que es nuestra muestra.
El IC de nuestro ejemplo de las alumnas

con IMC>25 está entre 14 y 24.
ESTIMACIÓN POR INTERVALOS DE CONFIANZA: vamos a asignar al parámetro un conjunto

de posibles valores que están comprendidos en un intervalo asociado a una cierta
probabilidad de ocurrencia, es decir, damos un rango de valores donde podamos hallar ese
parámetro.
Características:  Desarrolla la estimación sobre toda la población.
 Nos ofrece información de qué tan precisa es la estimación.
 El IC nos indica el rango donde puede estar el parámetro con

cierto nivel de seguridad o confianza.
4
Loli Martínez
LA ESTIMACIÓN DE PARÁMETROS y TIPOS
Es el procedimiento que se utiliza para conocer las características de un parámetro de la

población a partir del conocimiento de la muestra. Con una muestra aleatoria de tamaño n,
podemos efectuar una estimación de un valor de un parámetro de la población.
Tipos: tenemos la estimación puntual y la estimación por intervalos de confianza.
Si nos dicen que el % de alumnas con un IMC>25 es 19, ¿es una estimación puntual o por
intervalos de confianza?  Ya sabemos que es puntual porque nos esta dando un solo
número y el intervalo de confianza siempre va a tener uno inferior y uno superior. Como
vemos, esto es poco preciso ya que es poco probable que coincida con el verdadero
parámetro, mientras que con el intervalo de confianza realizamos una estimación que
abarca varios valores donde probablemente se encuentre el parámetro (AHORA VEREMOS
EL NIVEL DE CONFIANZA: con que probabilidad voy a tener yo la certeza de que el
parámetro de la población se encuentra dentro de ese rango que yo digo).
TABLA 1: Tabla de estadística descriptiva de las características de la muestra. Esta tabla está
en todos los estudios, tenemos que conocer como son los sujetos para poder comparar con
otros estudios, o con el resto de mi población. En la última columna encontramos el IC.
La velocidad de la marcha el 0,79 (2º

columna) es una media con su
desviación estándar o típica
(estadístico).
Vemos que el IC95% de su muestra
se encuentra entre 0,76 y 0,82; esto
lo obtenemos simplemente restando
a la media el margen de error por
abajo y por arriba (el ME no coincide
exactamente con lo que es la
desviación típica).
Si tenemos un valor de velocidad de
la marcha de 0,50: es un valor raro
porque el 95% se encuentra entre
0,76 y 0,82; por lo que es un valor
extraño o atípico y esto nos tiene que
hacer pensar que pasa algo: con ese
paciente pasa algo, hemos recogido
algo mal o es muy diferente al resto
de pacientes.
5
Loli Martínez
2 Intervalos de confianza para proporciones.

2.1 MÉTODO DE CONSTRUCCIÓN
Ahora vamos a ver como se construye un intervalo de confianza. El IC depende del margen
de error (ME), puede ser muy grande, medio, pequeño…
Si tenemos mayor certeza de que no nos vamos a equivocar, es decir, yo te digo x rango y
dentro de este rango se que no me voy a equivocar vamos a ser menos precisos (‘voy a ser
menos fino con el parámetro’). Por ejemplo: la temperatura máxima de mañana será entre
10 y 40º ¿Tendré alta probabilidad de certeza?  Sí, probablemente no me equivoque. Pero
si afirmo que será entre 24 y 24º voy a ser más preciso, pero puede que me equivoque.
Hay que encontrar un equilibrio entre esa certeza y esa precisión.
El objetivo final de una estimación por IC es que el intervalo sea estrecho porque significará
que estaremos cerca del parámetro de la población ( tendremos la certeza de que se va a
encontrar el parámetro dentro de ese rango ). Pero no siempre es deseable que sea estrecho,
ya que habría que aumentar la muestra para reducir el margen de error. Por ejemplo: si
queremos aumentar la precisión y tener la probabilidad de que no nos vamos a equivocar,
una solución es tener una muestra muy amplia porque si tenemos pocos sujetos tenemos
poca variabilidad y eso hace que seamos menos precisos.
FACTORES QUE VAN A DETERMINAR LA AMPLITUD DEL INTERVALO DE CONFIANZA (que

determina que yo coja un intervalo u otro): Nivel de confianza, Variabilidad de la
población y Tamaño de la muestra.
NIVEL DE CONFIANZA: es el porcentaje en el cual se va a encontrar el parámetro de la

población (son las desviaciones típicas a las que se encuentra de cuanto estamos alejados de lo que
es el parámetro). Va a depender del error estándar de medida.
Si el nivel de confianza es 1 va a tener una determinada

amplitud.
Si reduzco el error estándar vamos a reducir la amplitud de

ese intervalo. Si el nivel de confianza es 0,5 la estoy
reduciendo.
Si el nivel de confianza es 1,96 la estoy aumentando.
Si sigue una distribución normal, a ±1DT el porcentaje de la población es 68.
6
Loli Martínez
A cada intervalo de confianza le corresponde un % que representa el grado de confianza en

que los resultados capturan el valor real del parámetro poblacional, es decir, la seguridad
que yo tengo de que mi estadístico va a coincidir con el parámetro de la población.
El nivel de confianza se designa mediante 1- α, y se suele tomar en tanto por ciento (la resta
nos va a decir el % que tenemos que buscar en la tabla).
Alfa (α) va a ser el nivel de confianza.
Por ejemplo, si nuestro nivel de confianza es 95%  1 - 0,95 = 0,05 unilateral (si tenemos
en cuenta solo una cola), pero se suele usar el bilateral que es 0,05/2 = 0,025 (por cada
lado).
Para hallar el 2,5 % en la tabla Z tendríamos que buscar el porcentaje 97,5 para saber cuál es
ese valor Z. A partir de ese valor calculamos el margen de error.
El nivel de confianza más empleado es el 95%, y en menor medida se

usa el 90% y el 99%. Con el 95% vamos a abarcar un % de la muestra
que es suficientemente amplio (para que abarque un número
importante y representativo de pacientes, pero no tan amplio que no
nos de información), donde no nos vamos a equivocar, pero no lo
vamos a coger todo porque al final vamos a ser muy poco precisos. Con
el 90%, seremos más precisos, pero tendremos menor certeza. Con el
99% tendremos una mayor certeza, pero vamos a ser mucho menos
precisos (estamos cogiendo casi toda la población y eso tampoco no es útil). El 95% el nivel
de confianza es 1- α si tuviéramos una sola cola. Si tuviéramos las 2 seria 1- (α/2) para
obtener el margen de error.
Siguiendo con el ejemplo: Si queremos un nivel

de confianza del 95% vamos a la tabla Z y
buscamos el 97,5%, es decir, 0,9750, porque nos
da valores inferiores a Z y el valor critico va a ser
1,96. Va a ser 1,96 por arriba y su homólogo por
debajo -1,96 puesto que es una distribución
simétrica.
A partir de estos valores Z vamos a calcular el

margen de error.
A cada nivel de confianza le corresponde un número de errores estándares que deben

sumarse y restarse al estadístico.
Este número de errores estándares se denomina VALOR CRÍTICO. El llamado valor crítico, es
aquel punto Zα/2 (¡¡al tener las 2 colas hay que dividir entre 2!!) siempre y cuando utilicemos
una distribución Z de una variable normal N (0,1). (El valor critico va a ser importante para luego
decir si el valor que nosotros obtenemos se va fuera de lo normal o no ).
7
Loli Martínez
A medida que aumenta el nivel de confianza, aumenta el número de errores estándares y

por tanto el margen de error. Los más usados son para el 90% 1,645; para el 95% 1,96 y para
el 99% 2,575 (aquí cogemos prácticamente todo).
* Si cogiéramos un IC90%, tenemos que buscar en la tabla Z: 1 - 0,9 = 0,1  0,1/2 = 0,05.
En la tabla Z buscamos el 0,9500 (1-0,05) o lo más próximo, para saber el valor a partir del
cual me puede decir si nuestros datos van a estar cercanos a la población o son diferentes.
Para el 90% el valor de Z va a ser 1,645
* Si cogiéramos un IC95%, tenemos que buscar en la tabla Z: 1 - 0,95 = 0,05  0,05/2 =

0,025.
En la tabla Z buscamos el 0,9750 (1-0,025) o lo más próximo. Para el 95% el valor de Z va a
ser 1,645.
* Si cogiéramos un IC99%, tenemos que buscar en la tabla Z: 1 - 0,99 = 0,01  0,01/2 =

0,005.
En la tabla Z buscamos el 0,9950 (1-0,005) o lo más próximo. Para el 99% el valor de Z va a
ser mucho mayor: 2,575 porque estamos cogiendo prácticamente toda la población y por
tanto el valor de Z va a estar más hacia la derecha (más hacia arriba, por la parte superior) o
más hacia la izquierda ya casi pegado a la cola.
8
Loli Martínez
VARIABILIDAD DE LA POBLACIÓN: también determina como obtenemos el intervalo de

confianza. De todas las muestras que podemos sacar de la población, el 95% de las que
saquemos, su estadístico va a estar dentro de ese intervalo de confianza.
La variabilidad de los resultados muestrales se mide por el número de errores estándares

del estimador (media/proporción). El error estándar del estimador es el elemento básico de
todo IC. A mayor variabilidad mayor será la amplitud del IC. Recordamos que el IC = p ± ME
Cada raya horizontal gris representa como de variable es

una población. La raya señalada con la flecha verde
representa mucha variabilidad y la señalada con la flecha
amarilla (la raya es más pequeña), representa menos
variabilidad.
Si cogemos el rango que hay entre las líneas de puntitos

rojos vamos que el 95% (la mayoría) va a oscilar entre esas
2 líneas de puntitos, siempre hay alguno que se sale, pero
la mayoría oscila entre esas dos líneas.
Por tanto, el 95% de la muestra incluirá en su intervalo de

confianza el parámetro (línea negra central).
TAMAÑO DE LA MUESTRA: Si aumentamos el tamaño de la muestra vamos a reducir el

margen de error (siempre que tenemos mucha muestra vamos a tener muchos más datos [y
va a ser una muestra más real] y por tanto vamos a tener menor probabilidad de
equivocarnos), por ello siempre se intenta coger tamaños muestrales muy grandes para que
sea un buen estudio (en estudios que emplean 10-12 pacientes por grupo hay que ser
críticos y valorar si eso lo podemos extrapolar a la población¡, ya que con tan pocos
pacientes eso es difícil inferenciarlo a toda una población).
Formula para calcular el tamaño muestral no es necesario aprenderla
(¡LAS FÓRMULAS NOS LAS DAN EN EL EXAMEN!)
9
Loli Martínez
Lo más importante que debemos saber el tamaño de la muestra es: ¿QUÉ INFLUYE EN EL
TAMAÑO MUESTRAL?:
 Cuanto más alto sea el nivel de confianza (1-α), el valor de Zα/2 aumenta y por tanto
el tamaño de la muestra n debe ser mayor.
 Cuanto mayor es la dispersión de la muestra, es decir, cuanto mayor variabilidad ,
mayor debe ser el tamaño de la muestra n para obtener una representación más real
de lo que es la población.
2.2 CÁLCULO E INTERPRETACIÓN DEL INTERVALO DE CONFIANZA
La proporción es una característica que queremos estudiar de una población entre el

número total. Cuando tenemos una variable cualitativa a menudo nos interesa saber en qué
proporción de casos, p está presente en una determinada modalidad.
Por ejemplo, si queremos obtener el porcentaje de fisios españoles que utilizan la punción
seca lo que tenemos que hacer es dividir los que usan punción seca entre toda la población
de fisioterapeutas para obtener la proporción poblacional (p).
Una vez que tenemos nuestra proporción, hemos determinado nuestro nivel de confianza
(el que nosotros elijamos). En función de ese nivel de confianza utilizamos el valor Z.
Ahora nos queda unirlo todo IC = Proporción ± margen de error
MÉTODO DE CONSTRUCCIÓN:
- 1º Obtener es el estadístico (ya sea la proporción o la media). La proporción puede salir

que la calculemos nosotros o directamente nos la da la profe . Calculamos la proporción
muestral , dividiendo el nº de personas de la muestra que posea la característica de
interés entre el total de la muestra. El valor debe ser entre 0 y 1.
- 2º Determinar el nivel de confianza y encontrar el valor Zα adecuado.
- 3º Construir el IC =  ± ME (Lim. Inferior =  - ME ; Lim. Superior =  + ME)
El margen de error (ME) va a ser el valor de Z por

la desviación estándar. Una vez tenemos el
margen de error tenemos que restarlo a la
proporción o sumarlo.
La desviación estándar/típica de la proporción

SE(P) (estimación del error de muestreo de la
población) es: la raíz cuadrada de la proporción
en nuestra muestra por (1 – proporción) partido
del tamaño de nuestra muestra.
10
Loli Martínez
El 1,96, que corresponde al 95% de confianza, es el más

aceptado, pero no se emplea siempre.
Si cogemos el 90% de confianza, el margen de error va a ser

menor (estamos más cerca del centro).
Si el valor de Z es mayor (99% de confianza) al multiplicar por

la desviación estándar, el margen de error va a ser mayor
(porque estamos cogiendo casi toda la población).
¡EJERCICIO TIPICO DE EXAMEN!: En una muestra aleatoria de 40 sujetos hay 24 fumadores.
a ¿Cuál es la estimación puntual de fumadores?  Buscamos un porcentaje exacto:

sacamos la proporción.
 = 24/40 = 0,6 ; 0,6 x 100 = 60%
El 60% de la muestra son fumadores
b ¿Cuál es el error típico de la proporción de fumadores?  Simplemente sustituimos

en la formula.
SE () =
√ 0,6 x (1 − 0,6 )
40
= 0,077
c ¿Cuál es el margen de error para z95% = 1,96?  Tenemos que sustituir en la fórmula
(multiplicar el error típico por el Z).
ME = Zα/2 x SE() = 1,96 x 0,077 = 0,15 ; 0,15 x 100= 15%
Nuestro margen de error es de 15%
d ¿Cuál es el intervalo de confianza con z95% (IC95%)?  Al intervalo hay que sumarle y
restarle el margen de error a la proporción. IC95% va a estar entre 45%-75%
IC=  ± ME = 0,6 - 0,15 = 0,45 o 60 - 15 = 45% (límite inferior)
= 0,6 + 0,15 = 0,75 o 60 + 15 =75% (límite superior)
e y f)  lo vemos en el apartado 2.3.
11
Loli Martínez
INTERPRETACIÓN (Esto es la penúltima parte de la construcción de nuestro intervalo de confianza)
Una vez obtenido el intervalo de confianza hay que interpretarlo (¡¡SI NO SABEMOS
INTERPRETAR NO SABEMOS QUE ESTAMOS HACIENDO!!).
¿Son apropiadas todas las afirmaciones?:
1 La proporción de mujeres de 18 años con un IMC mayor a 25 es del 19%  Esta es

una interpretación para una estimación puntual por lo que no es apropiada.
2 En el intervalo ente 14 y 24% probablemente contiene la verdadera proporción 

esta interpretación aún se queda coja porque siempre que indicamos el intervalo de
confianza tenemos que decir el nivel de confianza que estamos utilizando (90% ,95%,
99%, etc). Sería verdad si afináramos lo que significa “probablemente”.
3 Tenemos un 95% de confianza de que la proporción de mujeres (o la verdadera
proporción de mujeres) de 18 años que tienen un IMC mayor a 25 se sitúa entre 14 y
24% (también es válido poner 0,14 y 0,24, en los artículos se pone así)  Este es la
forma más adecuada de interpretar el intervalo de confianza:
2.3 CONDICIONES DE APLICACIONES.
¿Podemos aplicar el intervalo de confianza a todo?  NO, hay unas condiciones de

aplicación para la proporción (hay una común a la proporción y a la media):
- Nuestra muestra debe ser obtenida de forma aleatoria, hay que controlar que no
tengamos una muestra sesgada, por ejemplo, coger solo chicas o solo chicos, coger
personas delgadas, etc (¡¡esto es importante y tenerlo en cuenta para el examen!!).
- Hay que tener una muestra de tamaño suficientemente grande, para ello hay que
multiplicar el tamaño de la muestra y la proporción: np tiene que ser mayor de 5 y
n(1-p) tiene que ser mayor a 10 (la muestra tiene que ser muy muy pequeña para
NO cumplir estas condiciones).
* Esto es mejor que sea el primer paso (si no se cumple las condiciones de aplicación no
hace falta realizar todo lo demás).
EJEMPLO: Si p = 0,45 y la muestra es de 808 personas:
np= 808 x 0,45 = 364
n(1-p) = 808 x (1-0,45) = 808 x 0,55 = 444
Es superior a 5 y a 10 por lo que sí es aplicable
12
Loli Martínez
CONTINUACIÓN EJERCICIO ANTERIOR: Muestra aleatoria de 40 sujetos y 24 fumadores:
e ¿Cumple las condiciones de aplicación?  Sí porque la muestra se ha obtenido de

forma aleatoria y el tamaño de la muestra es suficientemente grande:
nxp = 40 x 0,6 = 24 (es mayor a 5)
n x (1-p) = 40 x (1 – 0,6) = 40 x 0,4 = 16 (es mayor a 10)
f Frase interpretativa del intervalo de confianza
Basándonos en los datos de la muestra y con un 95% de confianza podemos afirmar

que la verdadera proporción de fumadores se encuentra entre un 45 y un 75% (0,45
y 0,75).
3 Intervalos de confianza para medias

Ahora vamos a ver una construcción para el intervalo de confianza para las medias. La base
es la misma, pero van a cambiar las condiciones de aplicación y el uso de la tabla.
3.1 MÉTODO DE CONSTRUCCIÓN
Para estimar una media poblacional (μ) se empleará la media muestral () ± el margen de
error (ME). A ello lo vamos a denominar IC para la media poblacional.
El primer paso es obtener la media muestral para poder estimar la media poblacional, esto
es la estimación puntual. Por ejemplo: la edad media de los fisioterapeutas de la región de
Murcia y después si yo lo quiero extrapolar a todos los fisioterapeutas españoles.
Este es el intervalo de confianza para las medias, es

muy similar al IC para las proporciones, pero en vez
de proporción tenemos media ± el margen de error
(ME).
El ME es lo que cambia, en puesto del valor de Z

tenemos el valor de t (la mayoría de las veces para
nuestras muestras no vamos a conocer si la población de
origen sigue una distribución normal o si el tamaño de la
muestra es suficientemente grande como para poder aplicar
los valores normales de la tabla Z). Por tanto, ME = t x SE ().
13
Loli Martínez
La desviación estándar o error típico (SE) divide la desviación típica de la muestra (s) entre el
tamaño de la muestra (n): SE () = s/ √ n
RECUERDO: en la Tabla t teníamos en la columna de la izquierda (1º columna) los grados de

libertad (gl) que se calculaban restado 1 a la muestra: gl = n-1 (ejemplo: muestra de 50, los
gl son 49). Al final de la Tabla t tenemos los niveles de confianza establecidos que seria 1-α
(están estipulados los más utilizados).
Niveles de confianza
Nosotros nos vamos a centrar en la 3º columna, la del 95%.
Esto sería (con la misma filosofía que la tabla Z) 1 – α 1-0,95= 0,05 si es una cola o 0,025 si
son dos (α/2). Lo más habitual es tener dos colas.
En base al tamaño de la muestra buscamos los grados de libertad

primero y en esa fila nos vamos a la 3º columna, la del 95%.
Simplemente tenemos que buscar para ese nivel de confianza el

tamaño de la muestra y ya nos va a dar el valor de t.
3.2 CALCULO E INTERPRETACIÓN DEL INTERVALO DE CONFIANZA
Simplemente hay que sustituir en la formula. Si ya tenemos el valor de t calculamos el error

típico (SE) y ya vamos a poder construir nuestro intervalo de confianza.
Si nuestra muestra es de 12, los grados de libertad serian 11.

Por lo que buscamos 11 en la 1º columna y en esa fila en el intervalo de confianza del 95%
(3º columna)  su valor de t seria 2,201. Ahora habría que multiplicar eso por el error típico
para obtener el margen de error.
14
Loli Martínez
EJERCICIO de MÉTODO DE CONSTRUCCIÓN, CÁLCULO E INTERPRETACIÓN: La distribución

de tallas de una muestra aleatoria de 101 neonatos presenta media de 51cm y una
desviación típica = 2 cm.
a Calcula el error típico de media.  Al darnos la media, hay que calcular el margen de
error. Podemos buscar el valor t o el error típico.
SE () = s/ √ n = 2 / √ 101 = 0,19
b ¿Cuál es valor tα para un IC al 95%?  Como la muestra es de 101, buscamos los gl =

100 en la tabla t y en la columna del 95%  1,984
c ¿Cuál es el margen de error para IC al 95%? → Hay que multiplicar el valor de t por el
error típico para obtener el margen de error.
ME = t α; n-1 x SE = 1,984 x 0,19 = 0,376
d ¿Cuál es el IC al 95%? → Media = 51; ME = 0,376

IC = Media () ± ME = 51 ± 0,376 = 50,624 – 51,376
El limite inferior seria: 50,624 y el limite superior: 51,376
e Frase interpretativa del IC95%

Basándonos en los datos de la muestra y con un 95% de confianza podemos afirmar
que la verdadera media de la distribución de tallas en neonatos se encuentra entre
50,624 y 51,376 cm.
f ¿Cumple las condiciones de aplicación?

Si sabemos que es una muestra que es obtenida de forma aleatoria podemos aplicar
la tabla t y por tanto construir el intervalo de confianza.
3.3 CONDICIONES DE APLICACIÓN
- Muestra obtenida por aleatorización.
- ESTO LO PONÍA EN EL PWP, PERO COMO SOLO ES PARA EL TLC TENEMOS QUE TENER EN
CUENTA UNICAMENTE LO DE LA ALEATORIZACION DE LA MUESTRA → Muestra de tamaño
‘suficientemente’ grande ≥ 30 (esto solo se aplica si usamos el TCL teorema central del limite y este
decía que si la muestra era obtenida de forma aleatoria y si el tamaño es suficientemente grande
podemos decir que la muestra es aproximadamente normal por lo que utilizaríamos la Tabla Z (ya que
es aproximadamente normal). La tabla T la empleamos cuando no sabemos nada, que es
lo que suele ocurrir.
15
Loli Martínez
4 Intervalos de confianza para la diferencia de medias.

Este es el nivel más difícil.
Cuando queremos comparar dos medias (tenemos 2 grupos diferentes) por ejemplo:
- La edad media entre hombre y mujeres, tenemos 2 poblaciones y por tanto podemos
obtener dos muestras.
- Si tenemos un grupo experimental y otro control donde aplicamos por ejemplo una terapia
con electrolisis y otro con intervención, simplemente un placebo.
Para estimar la diferencia de dos medidas poblacionales (μ1-μ2) tendremos que tomar una
muestra de cada una de las poblaciones de las cuales obtendremos sus medias muestrales ±
margen de error (ME). A ello lo vamos a denominar IC para la diferencia entre dos medias
poblacionales.
Lo 1º es obtener el estimador puntual (δ), al igual que antes solo que ahora hay que restar
para obtener la diferencia entre un grupo y otro. Cada uno tiene su tamaño muestral (no
necesariamente tiene que ser el mismo, pero si estamos realizando un estudio experimental
riguroso y bien hecho es preferible que tenga un número aproximado). Cuando tenemos un
tamaño muestral pequeño lo conveniente es que sean, en la medida de lo posible, el mismo
número de sujetos (para que no sean grupos desequilibrados). Cada grupo tiene su
desviación típica.
Las diferencias de medias lo sacamos restando una menos la otra.
4,66
Los grados de libertad los obtenemos ahora al tener dos muestras:

sumando el tamaño de las 2 muestras – 2 (IMPORTANTE!). En el
ejemplo anterior de 2 muestras de 10 personas  los grados de
libertad seria: (10+10) – 2 = 18
Una vez que tenemos la diferencia de medias y el valor de t, solo queda obtener la
desviación estándar o típica de la diferencia de medias: SE(1-2): raíz cuadrada de una
desviación + la desviación del otro grupo.
16
Loli Martínez
Para construir el MARGEN DE ERROR: Multiplicamos el valor de t x la desviación estándar:

ME = tgl x SE (1-2)
Para obtener el IC95% δ = d ± ME → IC95% δ = d ± tgl x SE (1-2): lo sumamos para

obtener el límite superior y lo restamos para el limite inferior.
Si desconocemos las desviaciones estándar de la población (σ) y/o n<30.
 En este caso desconocemos σ1 y σ2 por lo que los estimadores serán S1 y S2.
 El tamaño de las muestras son pequeños (n<30) y no estamos seguros que los datos
provienen de una distribución normal.
Teniendo en cuenta estas 2 situaciones no podremos utilizar el valor Z α/2 de la distribución
normal. En este caso utilizaremos los valores tα/2.
Con la distribución t y la distribución Z, cuanto mayor es el tamaño de la muestra en t, más

se aproximaba a la forma de la curva Z. Por eso a tamaños de muestras más grades, los
valores de la distribución t van a ser más parecidos a los de la distribución z.
Siguiendo el ejemplo anterior ¿Como calculamos el intervalo de confianza del 95%

( (IC)95%δ )?: si n1=10 y n2 =10 ; t10+10-2; t18 = 2,101.
d = 1 - 2 = 10,11 – 5,45 = 4,55
- 1º Diferencia de medias, buscamos el valor de t con sus grados de libertad y su

desviación típica.  1,714
17
Loli Martínez
- Todo esto nos lo da el SPSS. En él en la columna de diferencia de medias nos da

directamente la diferencia de medias, pero si queremos, le pedimos que saque los
descriptivos y nos va a dar la media para cada uno de los grupos.
Error típico (SE) = 1,714
En la prueba de Levene mirábamos en la columna de Sig. (significativo) y si era <0,05 se

cogía los valores de la fila de abajo.
IC95% δ = d ± tgl x SE (1-2) = 4,55 ± 2,101 x 1,714 → 4,55 + 3,6 = 8,15 (límite superior)
→ 4,55 – 3,6 = 0,95 (límite inferior)
IC95% 0,95 - 8,15
Una vez que tenemos nuestro intervalo de confianza, con nuestro estimador puntual y su
margen de error, nos queda la INTERPRETACIÓN: Basándonos en los resultados de la
muestra y con un nivel de confianza del 95%, el grosor del tendón en el grupo control es
en promedio mayor que en el grupo experimental, hallándose esta diferencia entre 0,95 y
8,15. (tenemos que saber cual es la media de cada grupo para después poder extrapolarlos
en la interpretación). Si fuera muy amplio en intervalo de confianza quiere decir que
tenemos mucha variabilidad y a lo mejor esta medida no es del todo útil porque no nos da
mucha información.
18
Loli Martínez
Cuando estamos en un estudio científico se representa así:
Tenemos en función del tipo de variable porcentajes (variable cualitativas) o medias

(variables cuantitativas).
En la tabla de ejemplo (la que tenemos arriba):
 Desde la primera variables (Sexo-hombre) hasta la penúltima variable (discapacidad

por dolor) son diferencias de proporciones  Prueba de Chi-cuadrado (se
representa con su diferencia de medias y su intervalo de confianza).
 La última variable (es la única cuantitativa y la única media): la intensidad del dolor
será un diferencia de medias → Prueba T de Student, que se basa en el modelo T.
Cuando tenemos más de 2 grupos, es decir, 3, 4 o 5 grupos, nos tenemos que ir a un análisis de la
varianza (es el ultimo TEMA) → nos va a permitir comparar un grupo con respecto al otro y una
comparación general entro todos los grupos, pero las diferencias de medias (la prueba t de Student
que nosotros usamos en el SPSS solo sirven para 2 GRUPOS!)
19
Loli Martínez
5 Aplicaciones de los intervalos de confianza para diferencias.

5.1 GRÁFICOS CON BARRAS DE ERROR:
 Para una VARIABLE CON DOS O MÁS GRUPOS tenemos los Gráficos de Barras
para las proporciones y los Gráficos de Medias para las medias.
En el centro de las Barras tenemos la Media y el bigote es su desviación estándar:
 DIFERENCIA DE 2 GRUPOS:
Si las barras se superponen, NO hay asociación, es que no hay diferencia entre los
grupos por tanto en esa variable da igual que midamos en un grupo o en otro porque
va a ser lo mismo, es decir, no es relevante (están asociadas esa variable que
estamos examinando en cada uno de los grupos esta asociada).
Si las barras no se superponen es que SÍ hay asociación.
20
Bloque 4. Tema 3.
Contraste de hipótesis estadísticas.
Planteamiento general.
1. Introducción.
En este tema vamos a ver, aplicando la estadística, todo lo que hemos visto
anteriormente ya que hasta ahora sabemos que a partir de una muestra aleatoria de
una población podíamos obtener una serie de estadísticos. Gracias a estos, podíamos
inferenciar (estimar) cuáles eran los parámetros de nuestra población y, de estos,
podíamos obtener de nuevo una muestra. Así generamos un continuo círculo que puede
no llegar a terminar.
El objetivo de nuestro trabajo de investigación siempre va a ser responder a la pregunta

de investigación que hayamos planteado. Para poder responder esta, debemos generar
una hipótesis que luego, a partir de los resultados, refutaremos o confirmaremos (esto
ya lo hemos visto en temas anteriores).
2. Hipótesis estadísticas.
Si nosotros vamos a un juicio y estamos viendo como juzgan a alguien por un delito que
supuestamente ha cometido, tenemos que tener claro que siempre se dice que una
persona es inocente hasta que se demuestre lo contrario. Por ello, se contratan a los
abogados para que por parte del acusado lo defiendan y busquen pruebas que no lo
incriminen y al revés.
A partir de esto podemos entender que existen dos tipos de hipótesis:
 Hipótesis nula (H0) → Esta va a ser el punto de partido, lo que ya se conoce (verdad
universal). En este caso, podríamos decir que esta hipótesis sería que el acusado es
inocente a consecuencia de la frase ‘’ Todo el mundo es inocente hasta que se
demuestre lo contrario’’. Por ello, podemos entenderla como: partida del supuesto
de que las diferencias entre el valor verdadero del parámetro (población) y su valor
1
hipotético (muestra), en realidad no son tales sino debidas al azar, es decir no hay
diferencia o dicho de otra forma la diferencia es nula.
 Hipótesis alternativa (H1) → En este caso, esta hipótesis será lo que nosotros
queremos demostrar o comprobar, es decir, que el acusado es culpable. Por ello,
podemos definirla como: aquello que queremos demostrar y es la hipótesis contraria
a H0. Se acepta cuando se rechaza H0. Todas las hipótesis planteadas en los estudios
científicos son de este tipo.
Para explicar que es un contraste de hipótesis podemos seguir con el ejemplo del juicio,
lo primero que se hace es asumir la hipótesis nula, asumimos que el acusado es
inocente y, después, vamos a buscar pruebas o evidencias para refutar esta hipótesis
nula. A partir de esto generaremos nuestra hipótesis alternativa que sería que el
acusado sea culpable y cada prueba que encontremos que desmienta la hipótesis nula,
aumentará las probabilidades de que la H1 sea la correcta.
En el momento en que las pruebas que encontremos generen una duda más allá de lo
razonable en un primer momento y demuestren lo contrario de lo que pensábamos,
rechazaremos la H0 y aceptaremos la H1.
Si las pruebas no llegan a generar esa duda razonable, aceptamos H0 y rechazamos H1.
Ejemplo de cómo extrapolaríamos el contraste de hipótesis a nivel estadístico
Nuestro objetivo va a ser determinar el coeficiente intelectual de los estudiantes de
la Universidad de Murcia. A partir de este, nosotros vamos a plantear una hipótesis
nula en base a la literatura científica que ya existe. En este caso, encontramos que
el coeficiente intelectual de los estudiantes de la Universidad de Murcia es de 100
(tenemos que entender que esto hace referencia a la media de esta población).
A partir de esto, podemos instaurar que nuestra hiótesis alternativa (H1) defiende
que los estudiantes de FT de la UMU tienen un coeficiente intelectual MAYOR al de
la población general de universitarios de UMU.
Es decir, tenemos que 𝑯𝒐: 𝝁 = 𝟏𝟎𝟎 y 𝑯𝟏: 𝝁 > 𝟏𝟎𝟎. Nuestra
hipótesis alternativa la estamos planteando en términos de
superioridad.
3. Razonamiento en los contrastes de hipótesis.

En términos generales, una hipótesis estadística es una afirmación o proposición
respecto a alguna característica de una población, generalmente fundamentada sobre
un parámetro de la misma (la nula en función de la población y la alternativa en función
de la muestra).
El contraste de hipótesis se puede definir como el proceso por el que se averiguan si los
datos observados en las muestras respaldan las hipótesis sobre las poblaciones
(procedimiento estadístico diseñado para verificar una afirmación).
Por tanto, a partir de nuestra hipótesis vamos a poder plantear una serie de objetivos:
2
 Verificar las afirmaciones de otras investigaciones.

 Utilizar contrastes de hipótesis para proporcionar pruebas y así poder tomar decisiones.
 Comprender que las conclusiones que hemos obtenido pueden ser o no erróneas con
respecto al planteamiento inicial.
 Comprobar afirmaciones, contrastar información o descubrir nuevos datos.
Vamos a ir viendo cada paso a

continuación.
3.1. Fijar la hipótesis nula (H0) y la alternativa (H1).

Tenemos que tener en cuenta que la hipótesis nula siempre va a ser el parámetro de
referencia y la alternativa son los valores posibles que nosotros consideramos sólo si
rechazamos la H0.
Otro ejemplo más para entenderlo sería: H0→ El 25% de las mujeres españolas tienen
varices. H1 → Menos del 25% de las mujeres españolas tienen varices. Entendiendo que nuestra
población son las mujeres españolas con varices y nuestro parámetro es el 25% (la proporción).
Si lo que queremos demostrar es que menos del 25% presentan varices, tendríamos que realizar
un estudio descriptivo u observacional.
A partir de esto, vamos a plantear la existencia de 3 tipos de contraste (aunque generalmente

se plantea en términos de igualdad):
 El parámetro poblacional es distinto al valor propuesto.H1 ≠ 25%.

Al ser distinto, ya sabemos podemos obtener valores mayores o
menores a la hipótesis nula. por ello, se conoce como contraste
bilateral. Llamamos contraste bilateral a aquél en el que la hipótesis nula
se formula en términos de igual y la alternativa en términos de distinto.
En estos casos la región de aceptación sería el área central determinada
por los valores críticos que previamente son determinados por el nivel de significación.
La zona céntrica (lo que está en blanco entre las partes naranjas), corresponde al
intervalo de confianza que recordemos que es del 95% y esto es lo normal. Por ello, aquí
estará nuestra hipótesis nula.
 El parámetro poblacional es mayor que el valor propuesto. H1 = >25%.

Llamamos contraste unilateral derecho a aquél en el que la
hipótesis nula se formula en términos de menor o igual y la
alternativa en términos de mayor. En estos casos la región de
3
aceptación, el intervalo de confianza, sería el área que deja a su izquierda el valor crítico
que previamente determina el nivel de significación.
 El parámetro poblacional es menor que el valor propuesto. H1 = <25%.

Llamamos contraste unilateral izquierdo a aquél en el que la
hipótesis nula se formula en términos de mayor o igual y la
alternativa en términos de menor. En estos casos la región de
aceptación, el intervalo de confianza, sería el área que deja a su
derecha el valor crítico que previamente determina el nivel de
significación.
3.2. Especificar el modelo de DM para testar la H0.

Recordemos que hasta ahora hemos visto 2 modelos de distribución muestral, el Z y el
T. Para saber cuál de los dos vamos a emplear seguimos basándonos en lo mismo que
anteriormente.
Modelo Z Conocemos la muestra, se ha seleccionado aleatoriamente, es normal,
grande y conocemos los parámetros de la población. Se emplea siempre para
proporciones.
Modelo T La muestra es pequeña o desconocemos si la distribución es normal. Para
medias empleamos este.
3.3. Calcular el estadístico de contraste a partir de los datos.

Una vez que tenemos nuestra hipótesis y nuestro modelo elegido, vamos a calcular en
que posición se encuentra la divergencia entre una hipótesis y otra.
Si sabemos que tenemos que emplear el modelo Z y tenemos que µ=100; σ=15,
podemos emplear la fórmula para tipificar y buscar en la tabla. Hay que tener en cuenta
que si nuestra muestra es de 100 y nosotros queremos ver si puede ser mayor, cogemos,
por ejemplo, 105 y realizamos la fórmula.
Obtenemos una posición de 1,72 y lo colocamos en nuestra posición para saber si este
cambio es o no significativo. De momento, se encuentra dentro de la normalidad por lo
que aceptaríamos la H0.
Recordemos que el P-valor es la probabilidad de hallar un estadístico igual o superior
asumiendo una determinada distribución muestral. Si hayamos un valor <0,05 tenemos
una baja probabilidad de encontrar nuestro valor y podemos rechazar la hipótesis nula.
Si tenemos una probabilidad de 0’97, sería una probabilidad muy alta que si estaría
dentro de lo considerado normal.
A toda esta estandarización es a lo que se conoce como estadístico de contraste ya que
representa la divergencia entre los resultados muestrales y el valor del parámetro
poblacional.
4
 Tipos de estadísticos de contraste:

Ya conocemos la media, la diferencia de medias y diferencias de proporciones. En base
a cada tipo de estadístico general, tenemos su estadístico de contraste:
 Contrastar una media poblacional Estadístico de contraste para el caso de una

media con desviación típica poblacional conocida: tabla Z. Para emplearlo se debe
cumplir: 1. Conocer la desviación estándar (σ). 2. Distribución normal. 3. Muestra
suficientemente grande TLC (teorema central del límite) (n≥30).
Por otro lado, si el estadístico de contraste para el caso es de muestras pequeñas y
desviaciones estándar desconocidas: la prueba t.
Las fórmulas realmente son iguales, solo tenemos que ver el tamaño muestral para
conocer cual emplear. (lo veremos más detallado en otros temas).
 Contrastar una proporción poblacional Lo único que cambia respecto a los

anteriores es la desviación típica.
3.4. Hallar el valor crítico para el estadístico de contraste.

Para poder determinar si el estadístico que tenemos es raro o normal, tenemos que
determinar a partir de qué valor si va a considerar la normalidad.
3.4.1. Unilateral.
Si es verdad que lo hallado es muy raro y, por tanto, no es atribuible a la aleatoriedad
del muestreo, tendremos que buscar qué valor se considera normal. Una vez hallado el
estadístico de contraste lo vamos a emplear para decidir si debemos rechazar o no H0.
Para ello, tenemos que determinar el nivel de significación (α) a partir de nuestro
intervalo de confianza (recordar que este es α-1) por lo que, si nuestro intervalo es del
90%, α=0,1, el 95% será α=0,05 y el 97% será α=0,01. Es decir, a partir de α vamos a
poder hallar el umbral crítico (0,1-0,05-0,01) y así determinar el valor crítico (valor
tipificado que corresponde a α) al buscar en la tabla Z a α y obtener el valor en función
de que sea unilateral o bilateral.
En el ejemplo que viene a continuación se puede ver que está cogiendo un valor de 1,72
para un contraste derecho unilateral. Esto va a ser raro ya que se determina que la
probabilidad de hallar este es de un 5% unilateralmente. Además, es muy importante
que tener en cuenta que en estos casos siempre vamos a hablar de si se rechaza o no la
hipótesis nula y, como se puede ver en las flechas que hay encima de la gráfica, se
5
rechaza H0 en la región derecha (esto se conoce como región crítica) y se acepta en la

izquierda.
Resumen: Gracias a esto vamos a ser capaces de determinar si aceptamos o rechazamos

la hipótesis nula en función del valor crítico obtenido a partir de α. Una vez que
tengamos este valor crítico, lo situamos en la gráfica y si se encuentra a la derecha de
1,6451 rechazamos H0 ya que se situaría en la región crítica (conjunto de valores
estadísticos (tipificados o no) que nos llevan a rechazar la hipótesis). Sin embargo, si se
encuentra a la izquierda, es decir, si el valor crítico es menor de 1,6451 se encuentra en
la región de aceptación, por lo que si aceptamos H0.
Nosotros solamente aceptamos o rechazamos la hipótesis nula, en función de lo que
hagamos con esta, se determinará la hipótesis alternativa.
 Contraste unilateral derecho Esto sería como el ejemplo que hemos visto
anteriormente, el 10% de la región crítica se va a situar únicamente en el lado
derecho, dejando todo lo demás (90%) como región de aceptación. Tenemos en
cuenta lo dicho anteriormente, que esta región de aceptación va a ir desde - ∞
hasta 1,6451, si el valor obtenido es mayor de esto, rechazaríamos la H0 ya que
estaría en la región crítica.
 Contraste unilateral izquierdo En este caso ya a ser justo al revés del anterior,
el 10% de la región crítica se va a situar únicamente en el lado izquierdo, dejando
todo lo demás (90%) como región de aceptación. Esta región de aceptación va a ir
desde - 1,6451 hasta +∞, si el valor obtenido es menor de -1,6451, rechazaríamos
la H0 ya que estaría en la región crítica.
6
3.4.2. Bilateral.
En esta gráfica nos encontramos con una bilateral ya que presentamos dos zonas críticas
(donde rechazamos H0) y una zona central que es la región
de aceptación. Por ello, tenemos que entender que, en un
contraste bilateral, tenemos el 95% de aceptación y una
región crítica del 5% (2,5% en cada lado que equivaldría a
±2 errores estándares de la afirmación).
Si vemos esto en terminología de números, de la tabla Z, podemos ver que nuestro valor
de α en un contraste bilateral es partido de 2 (α/2) para poder obtener ese 2,5% a cada
lado que en total constituirían el 5% de la región crítica. Por consiguiente, nuestra región
de aceptación va a ir de -1,9605 a +1,9605, todos los valores hallados entre estos dos
van a producir que sí que aceptemos la hipótesis nula. Si hallamos valores más bajos o
altos de estos, rechazamos la hipótesis nula.
3.5. Decidir si se rechaza o no la H0 en función del valor p.

Lo único que nos queda es saber si aceptamos o rechazamos nuestra hipótesis nula para
ello, nos vamos a basar en lo dicho anteriormente. Si nuestro valor Z obtenido en la tabla
se encuentra dentro del 5% raro (de la región crítica), rechazamos H0 y aceptamos H1 la
hipótesis alternativa.
Tenemos que tener en cuenta que en estadística no se puede demostrar que una
hipótesis nula es verdadera, sólo que ella es probablemente falsa. Recordemos que el
P-valor que obtengamos, es la probabilidad de que nos de ese valor.
3.6. Comprender que la conclusión alcanzada podría ser errónea por puro
azar.
(De aquí no ha dicho nada, aparecía en el esquema general del principio, pero luego no aparecía
ni en las diapos).
4. Relevancia del P-value o P-valor.

Sabemos que en función de donde se encuentre un valor en la gráfica, tenemos X% de
probabilidad de encontrarlo.
En este ejemplo, si tenemos un valor de 1,72, sabemos que tenemos un 5% de
probabilidad de encontrarlo. Sin embargo, si nosotros bajamos nuestra región de
confianza, es decir, la región de aceptación, tendríamos una región critica más grande y
7
una de aceptación menor. A consecuencia de eso, seríamos menos rigurosos por el

aumento de la región crítica, disminuyendo así las probabilidades de aceptar la H0.
Por consiguiente, sabemos que el P-valor es importante porque decir sólo “hay una
Diferencia Estadísticamente Significativa” no permite conocer lo poco probable que fue
haber hallado el estadístico. Sin embargo, el P-valor nos permite hallar directamente esa
probabilidad.
En términos simples, el valor p ayuda a diferenciar resultados que son producto del azar
del muestreo, de resultados que son estadísticamente significativos. Contraste de
hipótesis. Bloque 4. Estadística inferencial uni y bivariante. Valor p Nos va a ayudar en
la toma de decisiones con respecto a H0.
La profesora ha dicho que en el examen puede caer algún ejercicio donde nos pida
determinar el contraste de hipótesis, en ese caso, nos tendremos que fijar si la
hipótesis alternativa es diferente (será contraste bilateral), si es menor (unilateral
izquierda) o si es mayor (unilateral derecha)
A continuación, se adjunta una tabla resumen con todo lo que se ha explicado hasta
ahora en este tema. Conforme se ha ido explicando se han puesto los gráficos y los valores
dentro de los que está la región de aceptación, pero os pongo esta tabla por si os ayuda a
recordarlo:
5. Significación estadística.
Si la probabilidad de hallar un estadístico de contraste es < 0,001, nuestra muestra es
estadísticamente inferente a la población y tenemos pruebas que lo demuestran, lo que
genera una significación estadística elevada.
Si la probabilidad de hallar un estadístico de contraste está entre 0,05 y 0,001, hay una
diferencia significativa, no tan grande como en el caso anterior, pero lo es.
8
Si la probabilidad de hallar un estadístico está muy cerca de 0,05 hay poca significación
estadística. En este caso, queda a juicio del investigador si considera que esa prueba o
test es o no relevante.
Si la probabilidad de hallar un estadístico es >0,05, no hay diferencia estadísticamente
significativa y por ello, aceptamos la hipótesis nula.
6. Redacción de los resultados.

Para instaurar cuales son nuestros resultados es importante, por no decir obligatorio,
saber redactar una conclusión de forma correcta. Esto se debe a que cuando una
persona lee un artículo, a lo primero que va es a la conclusión para ver que se ha
determinado.
Podemos guiarnos para redactarlas en los siguientes ejemplos:
 Para el caso de aceptación de la hipótesis nula

Opción a) "A partir de los datos estadísticos obtenidos en la muestra, se acepta con
un nivel de significación (...) aquello que diga la hipótesis nula".
Opción b) "A partir de los datos estadísticos obtenidos en la muestra no existen
evidencias estadísticamente significativas a nivel (...) que permitan afirmar o
demostrar aquello que diga la hipótesis alternativa".
 Para el caso de rechazo de la hipótesis nula 

"A partir de los datos estadísticos obtenidos en la muestra existen evidencias
estadísticamente significativas a nivel (...) que permiten afirmar o demostrar aquello
que dice la hipótesis alternativa, con riesgo de equivocarnos igual al nivel de
significación’’.
7. Ejemplo de cómo se realiza un contraste de hipótesis completo.

Un informe de la Asociación de Compañías Aéreas (ACA) indica que el precio medio del
billete de avión desde la ciudad A a la ciudad B es de 120 euros. Esto sería nuestra
hipótesis nula ya que es lo que nos dicen que es la verdad.
Para contrastar esta información se considera una muestra aleatoria de 100 viajeros
entre estas dos ciudades que volaron en distintas compañías, en la que se observó que
9
la media del billete era de 128 euros y una desviación típica de 40 €. Esto sería nuestra
hipótesis alternativa, lo que nosotros queremos comprobar.
Pregunta de investigación: ¿Se puede considerar con un nivel de significación del 1% que
la información de la ACA es correcta? Tener en cuenta que nuestro P-valor debe ser
<0,01 para decir que si existe una diferencia estadísticamente significativa, ya que
hablamos del 1%.
Nuestra región de aceptación sería del 99% ya que si hacemos 1- α, obtenemos que 1-
0,01= 0,99x100=99%. Además, como sabemos que nuestros valores críticos van a variar,
instauramos las dos hipótesis:
Como lo que queremos comprobar es si el precio es diferente de 120 euros, instauramos

un contraste bilateral.
Esto lo encontramos yendo a la

tabla Z al buscar 0,99 (intervalo
de confianza)
10
Loli Martínez
Bloque 4.
Tema 4: CONTRASTE DE HIPÓTESIS DE DOS MEDIAS
Cuando no conocemos nada y no tenemos datos de la población de origen (nuestra muestra)

usamos el Modelo T. Esta es la principal diferencia de las medias con respecto a las proporciones y
en función de tener unos datos u otros el contraste de medias varia un poco.
Los pasos son los mismos, lo único que cambia es la especificación del modelo y como vamos a
compartir los datos después, pero el resto es igual. Para las proporciones también es igual.
1. Contrastes relativos a una media poblacional.

1.1. CASO DE LA VARIANZA POBLACIONAL CONOCIDA
Las medias las vamos a ver conociendo los parámetros de la población. En este caso , al
conocer los parámetros de la población se usa el modelo Z.
Como hemos visto en el tema anterior, lo 1º cuando acusamos a una persona, la verdad
universal y lo que tenemos que asumir es que una persona es inocente hasta que se
demuestre lo contrario → Eso seria nuestra hipótesis nula (H0). Lo que yo quiero
comprobar/demostrar es la hipótesis alternativa (H1): yo quiero demostrar que una persona
es culpable (para ello tenemos que buscar pruebas que lo confirmen y aumente la
probabilidad de que la H0 sea falsa, como el ejemplo: una persona que se había comido la
tarta de chocolate → si estaba el plato vacío, si estaba manchada la cara de chocolate, etc.
Esto son pruebas, por lo que ya tenemos un indicio de que esa persona se ha comido la tarta
y es culpable).
Si tenemos pruebas suficientes para demostrarlo (se crea una duda razonable), vamos a
rechazar la hipótesis nula, ya que confirmaríamos la hipótesis alternativa de lo que yo
pretendo demostrar.
En el caso contrario de que no tengamos pruebas suficientes (no hemos podido demostrar
que esa persona se ha comido la tarta), aceptaríamos nuestra hipótesis nula y
rechazaríamos la hipótesis alternativa.
El aceptar o rechazar una hipótesis se hace siempre en referencia a la hipótesis nula y hay
que buscar pruebas para intentar demostrar la hipótesis alternativa.
1
Loli Martínez
EJEMPLO DE CONTRASTE DE HIPÓTESIS: Yo quiero demostrar que una terapia es mejor que
otra terapia ya conocida y demostrada que es eficiente (que es válida):
 La hipótesis nula sería la terapia que ya se conoce (verdad universal), lo que yo
pretendo demostrar que no es así o confirmar.
 La hipótesis alternativa siempre va a ser lo nuevo, lo que yo pretendo demostrar.
Podemos confiar o desmentir o probar cosas nuevas.
El OBJETIVO PRINCIPAL es comprobar si el estadístico de contraste de nuestra muestra

(media o proporción) coincide con el parámetro de la población o es distinto. El enunciado
de la hipótesis nula se hace siempre en referencia a la verdad universal (a la población o al
parámetro de la población.
PASOS A SEGUIR PARA UN CONTRASTE DE HIPÓTESIS:

1.1.1. Fijar la hipótesis nula (H0) y la alternativa (H1).
1.1.2. Especificar el modelo de DM para testar la H 0.
1.1.3. Calcular el estadístico de contraste a partir de los datos.
1.1.4. Hallar el valor crítico para el estadístico de contraste.
1.1.5. Decidir si se rechaza o no la H0 en función del valor p.
1.1.6. Comprender que la conclusión alcanzada podría ser errónea por puro azar.
Lo 1º que tenemos que hacer es determinar que es cada cosa, es decir, cual es la hipótesis nula
y cual va a ser la hipótesis alternativa.
La hipótesis nula (H0) es la verdad universal que ya se conoce. Fijaremos la hipótesis nula en
referencia a la población (al parámetro de la población) o a mi referencia (lo que yo quiero
confirmar o desmentir). Partimos del supuesto de que las diferencias entre el valor verdadero
del parámetro (población) y su valor hipotético (muestra), en realidad no son tales sino debidas
al azar, es decir, no hay diferencia o dicho de otra forma la diferencia es nula.
La hipótesis alternativa (H1) es lo que yo quiero demostrar (confirmar o desmentir; es como lo
‘contrario’ de la hipótesis nula).
Al contrastar una con otra es el CONTRASTE DE HIPÓTESIS (nos vamos a centrar en el de una
media).
2
Loli Martínez
CONTRASTE DE HIPÓTESIS PARA UNA MEDIA

El planteamiento de la hipótesis es igual, ya sea con una varianza conocida o desconocida
(varianza = parámetros de la población), va ser el mismo; lo que cambia es a partir del punto
2 (de la distribución muestral).
TIPOS DE CONTRASTE (podemos plantear 3 tipos, y el que vayamos a plantear depende de lo que
nos digan en el enunciado):
Bilateral: la hipótesis nula se formula en término de igualdad y la hipótesis
alternativa en términos de distinta.
H0 = µ
H1 ≠ µ
Hay una región de aceptación (nuestro estadístico está dentro de lo normal, dentro
de lo que es nuestra hipótesis nula), que seria el área central determinada por los
valores críticos (estos se determinan previamente por el nivel de significación). La
región de aceptación es de un 95%.
Hay dos regiones de rechazo (las colas, ya que es bilateral) que se determinan por
los valores críticos. En este caso tenemos pocas probabilidades de encontrar la
hipótesis alternativa, es decir, de encontrar el estadístico de contraste (lo que yo
estoy comprobando es relevante/significativo). La región de rechazo es del 5% (2,5%
por lado).
Unilateral derecho: La hipótesis nula se formula en términos de igualdad o inferior

porque cogemos desde un valor critico determinado, desde el punto de corte que
nosotros estipulemos, hacia abajo y quiero comprobar si el estadístico de contraste,
que se formula en términos de mayor puede ser diferente (tendrá que estar en la
parte superior).
H0 ≤ µ
H1 > µ
La región de aceptación es el área que deja a su izquierda el valor crítico que
previamente determina el nivel de significación. En la región de rechazo tendríamos
un 5%.
3
Loli Martínez
Unilateral izquierdo: es al contrario que el contraste unilateral derecho, la hipótesis

nula se formula en términos de mayor o igual y la alternativa en términos de menor.
H0 ≥ µ
H1 < µ
La región de aceptación es el área que deja a su derecha el valor crítico que
previamente determina el nivel de significación. En la región de rechazo tendríamos
un 5%.
1.1.1. FIJAMOS LA HIPÓTESIS NULA (H0) Y LA ALTERNATIVA (H1)
Si conocemos los parámetros de la población y nos dicen que es normal directamente

dibujamos nuestro modelo de distribución normal ( el dibujarlo nos ayuda a situarnos cuando
nos perdemos). Tenemos la media de la población (va a ser el centro del modelo) y también
la desviación típica.
POR EJEMPLO: la edad de los jugadores de baloncestos en España  la edad media (µ) de
los jugadores es de 31 y la desviación típica (σ) es de 10. Me surge la duda de que eso sea
verdad, pero lo que yo pienso en mi experiencia es que la edad es mayor. Por tanto, me
puedo plantear un contraste unilateral derecho (estaría más por la zona derecha en el
modelo de distribución normal).
Hipótesis nula: la media va a ser igual o menor a 31 (parámetro de referencia)→ H0 ≤ µ (31)
Hipótesis alternativa (lo que yo quiero comprobar/demostrar): que la edad media sea mayor de
31, esto seria lo PLAUSIBLE (lo esperable) si rechazamos la hipótesis nula → H1 > µ (31)
1.1.2. DA LA OPORTUNIDAD A QUE LOS DATOS DESAPRUEBEN LA H0

1.1.2.1. ESPECIFICA EL MODELO DE DM PARA TESTAR LA H0
Como la distribución procede de una población normal, vamos a emplear el Modelo Z.
Yo quiero comprobar si la media de edad () es 38 y tenemos una muestra de 36 personas.
Para calcular el error de muestreo relativo a la población (la varianza de la población)
4
Loli Martínez
[SD ()] se divide la desviación típica entre la raíz cuadrada de la muestra:
σ
SD () =
√n
Podemos hallar la proporción de 38 dentro de nuestra distribución, la podemos comprobar
con nuestro estadístico de contraste, que va a ser la diferencia entre los resultados
muestrales y el valor del parámetro poblacional.
1.1.2.2. CALCULA EL ESTADÍSTICO DE CONTRASTE Y SU P-VALOR

Aplicamos la formula del valor Z  μ= 31 y σ (desviación estándar) = 10;  (media) = 38; n = 36
Estadístico de contraste para el caso de una media con desviación típica poblacional
conocida:
X̄ − μ0
Z=
σ /√n
¿Podemos aplicar la formula? → SÍ ; Condiciones de aplicación:
1. Conocer la desviación estándar de la población ( σ )
2. Distribución normal.
3. Que la muestra sea suficientemente grade: mayor a 30 (si no supiéramos si procede de
una distribución normal, puesto que la muestra es mayor de 30 podemos aplicar el TLC).
Aplicamos la formula Z y calculamos el estadístico de contraste:

X̄ − μ0 38− 31
Z= → = 4,2
SD ( x̄ ) 1,66
Obtenemos una posición de 4,2.
Ahora  nos vamos a la tabla Z y buscamos la probabilidad de obtener una media o un
valor Z superior a 4,2: estamos en términos de superioridad y la tabla Z nos da
probabilidades iguales o inferiores, por lo que hay que restar 1 menos el valor de 4,2 en la
tabla Z. Tenemos una probabilidad de 0,00001. Esta probabilidad es relevante, es
significativa, la probabilidad de obtener una media de edad de 38 es de 0,00001 %.
OTRA FORMA: Si yo no conozco la probabilidad y me dan en un IC95% seria significativo (al

estar en un contraste unilateral el valor critico para un IC95% seria 1,64. Como nuestra
posición es de 4,2 podemos decir que es significativo (estaría dentro de esa zona de rechazo
de la hipótesis nula). A pesar de no conocer la probabilidad, si sabemos el valor critico
podemos también determinar si un valor es significativo o no.
INTERPRETACIÓN: el valor de P indica que si la verdadera media fuera de 31 entonces la

probabilidad de haber encontrado la media de 38 seria superior del 0,00001% (o la
probabilidad de que haya una media de 38 es de 0,00001%).
5
Loli Martínez
Lo que acabamos de hacer es ponderar los indicios y ahora vamos a tomar la decisión.
1.1.2.3. TOMA LA DECISIÓN DE RECHAZAR O NO LA H0
Una vez hallado el estadístico de contraste lo vamos a emplear para decidir si debemos
aceptar o rechazar la H 0. ¿Que probabilidad hay de que el estadístico de contraste haya
ocurrido siendo verdadera la afirmación?
Para ello también tenemos que saber: el nivel de significación (si decimos un nivel de
significación del 10 % es porque estamos cogiendo un intervalo del 90% por tanto lo valores
críticos van a variar), los valores críticos si no conocemos la probabilidad y la región critica.
Por tanto tenemos varias opciones para la decisión:
OPCIÓN 1: Si conocemos la probabilidad y es p<0,05 rechazamos la hipótesis nula y

se acepa la alternativa, lo que hayamos es importante (es significativo).
OPCIÓN 2: Si el valor de Z obtenido (Z obtenido) es mayor al valor de Z del valor critico
(Zvc) [Zobtenido > Zvc] también podemos rechazar la hipótesis nula y aceptar la
alternativa.
En la imagen Zvc es aproximadamente el 1,64
(lo señala la flecha azul con borde rojo). El
Zobtenido = 4,2 , por lo que: Zobtenido > Zvc
OPCIÓN 3: Si sabemos el valor exacto de p (En nuestro ejemplo es 0,00001 esto

indica un nivel del significación elevado).
La Opc1 y la Opc3 es lo mismo pero a veces lo vamos a ver expresado como p<0,05 (Opc 1) o nos dan
directamente el P-valor: p=0,00001 (Opc 3). Simplemente son diferentes formas de verlo.
DISTINTAS REGIONES DE ACEPTACIÓN Y DE RECHAZO:

 Para un contraste bilateral:
Los valores críticos serían -1,9605 y 1,9605.
La zona central entre los valores críticos ( entre -1,9605 y 1,9605) es la ZONA DE
ACEPTACIÓN DE LA HIPÓTESIS NULA (H0).
Los extremos (de -1,9605 a menos infinito y de 1,9605 a más infinito ) son la REGIÓN
DE RECHAZO para un nivel de significación del 5% o 0,05 (esto puede variar en
función del intervalo de confianza y del nivel de significación). ( ZONA NARANJA DE
LA GRÁFICA)
6
Loli Martínez
 Para un contraste unilateral derecho:

El valore crítico (en este caso) es 1,6451
La REGIÓN DE ACEPTACIÓN DE LA HIPÓTESIS NULA (H 0) es desde menos infinito
hasta el valor crítico (1,6451).
La REGIÓN DE RECHAZO DE LA HIPÓTESIS NULA (H0) es desde el valor crítico
(1,6451) hasta más infinito. (ZONA NARANJA DE LA GRÁFICA)
7
Loli Martínez
 Para un contraste unilateral izquierdo:

El valore crítico (en este caso) es – 1,6446.
La REGIÓN DE ACEPTACIÓN DE LA HIPÓTESIS NULA (H 0) es desde el valor crítico
(- 1,6446) hasta más infinito.
La REGIÓN DE RECHAZO DE LA HIPÓTESIS NULA (H0) es desde menos infinito
hasta el valor crítico (- 1,6446).
*En este caso si nuestro estadístico de contraste se encuentra por debajo de -1,64
rechazaríamos H0 y aceptaríamos H1*
CÁLCULO DEL VALOR P:

Tabla resumen de aceptación o rechazo (siempre relativa a la hipótesis nula): La aceptación
o rechazo de la hipótesis nula (H0) depende de si el valor del estadístico de contraste
calculado en nuestra muestra está dentro o fuera de la zona de aceptación.
8
Loli Martínez
1.1.2.4. EXTRAER CONCLUSIONES
Si P-valor < 0,01 la significación va a ser elevada, por lo que rechazamos la hipótesis nula.
Si P-Valor va de 0,05 a 0,01 ya tenemos significación estadística ( es significativo, no es una gran
significación pero lo es).
Si P-Valor está próximo a 0,05 (es decir 0,49-0,51) tenemos cierta significación estadística y
queda en juicio del lector si lo considera importante (significativo) o no, porque estamos
muy cerca.
Si P-Valor > 0,05 NO es significativo y rechazamos la hipótesis alternativa.
Si voy a usar un nivel de significación del 10%, para decir que es significativo tendríamos que
coger un P-valor de 0,1, por lo que elevamos el nivel de significación.
1.2. CASO DE LA VARIANZA POBLACIONAL DESCONOCIDA

Cuando no conocemos los parámetros de la población o si desconocemos si procede de una
distribución normal usamos el Modelo T.
1.2.1. FIJA LA HIPÓTESIS NULA Y LA ALTERNATIVA

POR EJEMPLO: En las calles señalizadas con la señal de máxima velocidad 30, la velocidad de
los coches es exactamente esa y me surge la duda de que esto sea verdad, pienso que va a
ser mayor. El parámetro central del modelo (µ) va a ser 30 km/h.
Nos planteamos las hipótesis estadísticas:
Hipótesis nula: la media va a ser igual a 30 (verdad universal) → H0: µ = 30
Hipótesis alternativa: la media va a ser mayor a 30 (lo que quiero demostrar) → H1: µ > 30
Hasta aquí todo es igual.
9
Loli Martínez
1.2.2. DA LA OPORTUNIDAD A QUE LOS DATOS DESAPRUEBEN LA H0

1.2.2.1. ESPECIFICA EL MODELO DE DM PARA TESTAR LA H0
Lo que cambia (con respecto si conocemos la varianza de la población ) es el modelo de
distribución muestral, usamos el Modelo T de STUDENT (tenemos varios modelos T de
student que van a variar en función del tamaño de la muestra).
Conocemos la media de la población (µ = 30), pero no conocemos su desviación típica (σ)

(su varianza), por lo tanto no podemos calcular el error de muestreo relativo a la población
SD (x̄ ). También conocemos los datos de la muestra de 23 personas: la media de la muestra
( = 31) y la desviación típica de la muestra (s = 4,25).
Por lo tanto no podemos aplicar el SD (x̄ ) ni el TCL (nuestra muestra es de 23 (<30)).
Sin embargo, vamos a poder calcular el Error típico de la media (SE (x̄)), que es una
estimación del error de muestreo.
s
SE ( X̄ )=
√n
4,25
En nuestro ejemplo seria: SE ( X̄ )= =0,886
√ 23
1.2.2.2. CALCULA EL ESTADÍSTICO DE CONTRASTE Y SU P-VALOR

La fórmula para encontrar la posición dentro de nuestra distribución va a ser igual porque la
Tabla T nos da posiciones y nos establece unas probabilidades de hallar esa posición, pero
no nos va a dar probabilidades especificas para una posición como si lo hace la Tabla Z.
El estadístico de contraste para el caso de muestras pequeñas y desviaciones estándar
desconocidas: Prueba T.
Si conocemos el error típico de la media, SE (x̄), (lo podemos calcular: SE (x̄ ) = s/ √ n)
conocemos la media poblacional.
Conocemos µ0, que es la media (la verdad universal) y x̄ (lo que yo quiero demostrar).
Vamos a aplicarlo:
x̄ − μ 0 x̄ − μ 0
tn-1 = =
SE ( x̄ ) s / √ n
31−30
En nuestro ejemplo sería: t= = 1,13
0,886
Si yo quiero saber si la media es mayor de 30 , utilizo 31 (también podríamos usar 32 o 33,
etc); aplicaos el error típico de la media SE (x̄ ) = 0,886, que lo hemos calculado antes. Nos da
una valor t, una posición de 1,13 (el 1,13 sale de estandarizar y puesto que la Tabla T nos da
posiciones tenemos que buscar entre que valores intermedios está).
10
Loli Martínez
Se calcula el P-Valor: Tenemos la Tabla T de STUDENT, ¿como obtenemos la probabilidad

de hallar el valor 1,13 (t22>1,13), teniendo en cuenta el tamaño de la muestra (n = 23).
AQUÍ ES DONDE CAMBIA:
Lo primero es determinar en que fila nos vamos a mover: Si el tamaño de la muestra es 23,
los grados de libertad son 22 (n-1), por tanto nos tenemos que fijar en la fila 22 (lo de arriba:
0,25 ; 0,1 ; 0,05 ; 0,025 etc son probabilidades, en este caso probabilidades unilaterales) :
El valor de 1,13 está entre 0,25 y 0,1 → 0,25 > p −value > 0,10
Para obtener de forma manual el p-valor para la Tabla T no podemos decirlo exactamente
porque no tenemos una probabilidad especifica para cada valor, sino que tenemos que decir
que va a oscilar entre esos valores, en este caso va a ser menor de 0,25 y mayor de 0,10 (el
1,13 estaría entre 0,6858 y 1,3212).
INTERPRETACIÓN: (seria la misma) El valor P hallado indica que si la verdadera media fuera
de 30, entonces la probabilidad de haber encontrado la media de 31 o superiores va a estar
entre 0,15 y 0,10.
1.2.2.3. TOMA LA DECISIÓN DE RECHAZAR O NO LA H0

También podemos establecer valores críticos porque la Tabla T sabemos que tiene unos
valores de confianza estipulados que están al final, por ejemplo: para un 90% de confianza y
una muestra de tamaño 22 en un contraste unilateral,
¿cual seria el valor critico? → Seria 1,71.
11
Loli Martínez
Siguiendo el ejemplo: IC90% el 1,71 seria el valor critico y estando en un contraste unilateral
el 1,13 estaría dentro de la región de aceptación.
Como esta dentro de la región de aceptación no
rechazamos la hipótesis nula, sino que la aceptamos
(esto es otra forma de verlo, teniendo en cuenta el
valor critico, que en este caso de la tabla T es lo
más valido y sencillo para aceptar o rechazar).
1,13 < 1,71
Si t < t valor crítico se acepta la Hipótesis nula (no se puede rechazar).
EJEMPLO DE CONTRASTE DE HIPÓTESIS (¡¡EJERCICIO TÍPICO EXAMEN!!)

Queremos conocer si la altura media de los habitantes de la Región de Murcia difiere de la
de España, cuya media poblacional es de 174 cm. Deseamos contrastar con un nivel de
significación de α = 0,05 (Nivel de confianza de 95%) si la altura media es diferente de 174
cm (contraste bilateral). Para ello obtenemos una muestra de n = 25 habitantes de la Región
de Murcia, cuyos datos son: x̄ = 170cm y Ѕ = 10cm.
Nos dan la altura media poblacional, pero como no nos dan la desviación, vamos a tener
que utilizar el modelo T.
Lo 1º hay que plantear es el contraste de hipótesis:
- H0: µ = 174 cm (igual al parámetro poblacional de referencia)
- H1: µ ≠ 174 cm (lo que pretendemos probar)
2º Una vez estipulado que va a ser el Modelo T, calculamos el estadístico de contraste:
|x̄ − μ0| |170 −174|

t= = =2
SE ( x̄ ) 10/ √ 25
Se puede coger tanto el 170 como el 185 por ejemplo, porque estamos viendo si es
diferente a 174. La resta está en valor absoluto para que no salga negativo.
Si el valor que estamos probando es inferior a la media va a estar por la parte inferior en el
contraste bilateral, puesto que la distribución es simétrica, lo que nos salga por arriba nos va
a salir por abajo igual.
Sustituimos y calculamos nuestra desviación típica, que nos la dan (Ѕ).
En el pwp la profesora tiene que la raíz cuadrada se hace con n-1, pero NO HAY QUE RESTAR, se coge
solo n= 25
12
Loli Martínez
Nos da una posición de 2 en nuestra distribución → Ahora buscamos en la Tabla T para

α = 0,05, pero hay que tener en cuenta que es bilateral y el tamaño de la muestra es 25, por
lo que los grados de libertad es 24 (tenemos que buscar en la fila 24). Ya tenemos nuestro
estadístico de contrastante 2 y el valor de t para 24 con un nivel de significación de 0,025
puesto que es un contraste bilateral (0,05/2 = 0,025).
tα/2;gl → t0,025;24 = 2,064
3º Extraemos conclusiones: Con estos datos aceptaríamos la hipótesis nula, es decir,

nuestros valores están dentro de la región de aceptación (va de -2,064 a 2,064), por lo que
el 2 está dentro y no es significativo (no podemos rechazar la hipótesis nula).
CONCLUSIÓN: No hay evidencia suficiente en contra de la hipótesis nula con un nivel de
confianza del 95%, con lo que no podemos afirmar que la altura media de esta población
sea distinta de 174cm con un nivel de confianza del 95%. La diferencia entre la media de la
población y 174cm es debido al azar (cuando cogemos diferentes muestras, cada una nos va
a dar un valor diferente). No existen diferencias significativas entre la media de la población
y 174 cm.
EJERCICIO 2:
Se desea contrastar con un nivel de significación del 5% la hipótesis de que la talla media de
los hombres de 18 o más años de un país es igual o mayor a 175. Suponiendo que la
desviación típica de las tallas en la población vale 4, contraste dicha hipótesis frente a la
alternativa de que es menor, con una muestra de n=15 hombres seleccionados al azar,
cuyas alturas son las del apartado anterior:
Va a ser un intervalo de confianza del 95%. Vamos a emplear el Modelo Z (conocemos los
parámetros de la población). Tenemos un contraste unilateral izquierdo.
Lo 1º hay que plantear es el contraste de hipótesis:
- H0: µ ≥ 175 cm (la media de altura es ≥ 175 cm)
- H1: µ < 175 cm (lo que yo quiero demostrar, que es menor a 175cm)
2º Una vez estipulado que va a ser el Modelo Z vamos a tipificar:

x̄ − μ 173,47 − 175
Z= = = -1,48
SD ( x̄ ) 4 / √15
* RECORDAMOS: SD (x̄): error de muestreo/raiz cuadrada del tamaño muestral
Nivel de significación del 5% → Valor crítico -1,64 (lo tenemos que saber directamente)
13
Loli Martínez
3º Extraemos conclusiones: El valor Z = -1,48 esta más cerca de la

media, por lo que está dentro de la región de aceptación de la
hipótesis nula (a partir de -1,64 ya estaría en la región de rechazo
de la hipótesis nula). Por tanto vamos a aceptar la hipótesis nula y
a rechazar la alternativa.
CONCLUSIÓN: No hay evidencia suficiente en contra de esta
hipótesis nula con un nivel de confianza del 95%, no podemos
afirmar que la altura media de esta población sea menor a 175 cm.
La media la hemos obtenido al azar, no hay una diferencia
significativa entre la media de la población y una altura media
menos a 175cm.
Una pista para saber si uso un modelo u otro es fijarnos en la desviación típica de la
población o de la muestra.
2. Contraste de hipótesis para dos medias.

Ahora vamos a contrastar hipótesis para dos medias. Esto es útil para:
- Para 2 grupos → MUESTRAS INDEPENDIENTES. Por ejemplo se puede aplicar a un ensayo
clínico aleatorio: hay un grupo control y otro experimental, y quiero probar 2 tratamientos/
terapias. Como en el articulo del Sd. Tunel Carpiano: quiero ver si la intervención quirúrgica
proporciona mejores o peores resultados (dependiendo de la hipótesis que establezcamos)
que la utilización de una ortesis. Medimos en un grupo y medimos en el otro, obteniendo 2
medidas, por lo tanto tenemos que comparar→ MUESTRAS INDEPENDIENTES DE UN GRUPO
14
Loli Martínez
Otro ejemplo seria en la artritis reumatoide que se emplean adicionalmente férulas de

inmovilización, esto puede incrementar la fuerza y reducir el dolor. Hay un solo grupo con
pacientes con artritis reumatoide y yo quiero ver si la férula va a incrementar la fuerza → En
el caso de muestras independientes cada sujeto aporta datos a una de las medias
compardas.
- Para 1 solo grupo → MUESTRAS RELACIONADAS (lo que hemos echo con las Pruebas T de
Student). Por ejemplo: cuando tenemos una muestra y dos medias al medir dos veces en el
tiempo (por ejemplo: una al inicio del estudio y otra al final), y queremos ver si un
tratamiento tiene efecto y si es relevante. Con el ejemplo de la artritis reumatoide, en este
caso cada sujeto va a portar 2 medias, una al inicio y otra al final (los datos de la 2º medida
están condicionados).
2.1. CONTRASTE DE HIPÓTESIS PARA 2 MEDIAS PARA MUESTRAS

INDEPENDIENTES
Son mas complicadas, ya que tenemos 2 grupos y tenemos que trabajar con varianzas de
dos grupos diferentes.
2.1.1. PLANTEAMIENTO DEL PROBLEMA.

En nuestra hipótesis vamos a tener 2 tipos de variables: una cuantitativa que va a ser la
media (por ejemplo quiero comparar la edad) y otra cualitativa dicotómica (comparamos la
relación entre una variable cuantitativa en base a una cualitativa). En el ejemplo del Sd del
túnel carpiano estamos comparando dos medias y la variable cualitativa dicotomica seria los
grupos de intervención; también vamos a ver la media de edad en cada uno de los grupos y
si difiere.
PLANTEAMIENTO DEL PROBLEMA:

1. Nuestra pregunta de investigación o hipótesis consiste en comprobar si existe alguna
relación entre dos características o variables de una población. Una de ellas es cuantitativa y
la otra es cualitativa.
15
Loli Martínez
2. Comparamos la variable cuantitativa (media) en dos grupos independientes, ya que

observamos que una variable dicotómica divide la población total en dos poblaciones.
3. Por tanto, a partir de una muestra inicial de tamaño n, tendremos dos muestras
independientes de tamaño n1 y n2 (n = n1 + n2) en cada una de las cuales se dispone de
información relativa a la media de la variable cuantitativa.
Pregunta de investigación → existe diferencias de edad (variable cuantitativa) entre sexo
(hombre/mujer variable cualitativa dicotómica) en los fisioterapeutas de la Región de
Murcia.
Dicotómica es que tenemos 2 grupos y para comparar medias es con 2 grupos, cuando
tenemos 3 grupos ya sería otro tipo de análisis (seria una ANOVA, lo veremos en el tema 6).
OBJETIVO: ver si las medias de la variable cuantitativa (µ1 en el primer grupo y µ2 en el

segundo grupo) son iguales (o diferentes) dependiendo del grupo (definido por la variable
cualitativa dicotómica) en que nos encontremos, y por tanto, si existe relación entre la
característica cualitativa dicotómica y la cuantitativa. Es decir, yo lo que pretendo ver es si
la edad es diferente entre hombres y mujeres. Lo que veíamos al principio de si a simple vista
había diferencia, pero no teníamos aún pruebas suficientes para decir que esa diferencia es
significativa. Con lo que vamos a ver ahora vamos a proporcionar pruebas para decir que esa
diferencia que nosotros veíamos al inicio es significativa (existe una diferencia realmente) .
TIPOS DE CONTRASTE:
 Contraste bilateral: En la hipótesis nula la diferencia de medias no existe (no hay
diferencias entre uno y otro grupo) y en la hipótesis alternativa si existen diferencias
entre ellas.
H0: µ1 - µ2 = 0
H1: µ1 - µ2 ≠ 0
 Contraste unilateral derecho: la diferencias de medias se expresan en términos de

superioridad (estaremos con el lado derecho de la grafica).
H0: µ1 - µ2 ≤ 0
H1: µ1 - µ2 > 0
 Contraste unilateral izquierdo: la diferencias de medias se expresan en términos de

inferioridad (estaremos con el lado izquierdo de la grafica).
16
Loli Martínez
H0: µ1 - µ2 ≥ 0
H1: µ1 - µ2 < 0
2.1.2. GRUPO EXPERIMENTAL VS CONTROL:

Aquí tenemos nuestros 2 grupos:
2
 Grupo experimental: x̄=10,11, n1 = 10 , S1 =13,81
2
 Grupo control: x̄=5,45, n2 = 10 , S1 =15,58
Ahora tenemos una distribución y dos grupos: al que queramos lo llamamos intervención y
al otro control o grupo nuevo / grupo habitual, etc.
1º SE FIJAN LAS HIPÓTESIS ESTADÍSTICAS

Es un contraste unilateral derecho (estamos con una media). El objetivo es comprobar si la
efectividad de la nueva terapia es superior a la ya conocida.
Contraste con una media Contraste con dos medias

H0: µnueva = µhabitual H0: µnueva - µhabitual = 0
H1: µnueva > µhabitual H1: µnueva - µhabitual > 0
La hipótesis nula (o la de referencia) es lo que se conoce hasta ese momento y siempre la

vamos a plantear en términos de igualdad.
Mientras que la hipótesis alternativa yo quiero comprobar si es diferente (mayor o menor).
** El orden de la resta siempre es el mismo, siempre el experimental – el control → lo que
vamos a querer ver es si la no intervención produce cambios con respecto a una de referencia (a una
control), por ejemplo: una intervención que se aplicaba toda la vida, que puede ser un control, un
placebo, o la férula que es el tratamiento conservador que se ha aplicado toda la vida; con respecto
a la cirugía o a la aplicación de la electrolisis percutánea. Quiero ver si tiene mejores resultados las
nuevas técnicas que el tratamiento que se ha aplicado toda la vida. **
En puesto de comparar medias puras, vamos a comparar diferencias de medias. La

hipótesis nula se expresa en términos de igualdad igual pero en vez de decir que la media va
a ser igual a 0 (a la población), ahora decimos que la diferencia de medias entre los 2
grupos va a ser 0. No hay que tomar que la diferencia tiene que ser 0, sino que 0 significa
que no hay diferencias.
Cuando esa diferencia de medias es mayor de 0 o cuando es mayor al planteado en la
hipótesis nula, eso seria la hipótesis alternativa,es decir, que esta diferencia me la planteo
también en términos de superioridad.
17
Loli Martínez
Si no hay diferencia entre los 2 grupos da igual que se utilice un tratamiento u otro. Si hay
diferencia entre los 2 grupos y la diferencia es significativa vamos a tener un cambio
significativo en un tratamiento (en el ejemplo anterior: el uso de la férula o la cirugía
tendrán diferencias por el hecho de que se utilice uno u otro tratamiento y va a condicionar
de manera significativa que el paciente tenga una mejor o peor evolución).
2º SE ESPECIFICA EL MODELO DE DM PARA TESTAR LA H0
Ya hemos fijado las hipótesis. Ahora tenemos que determinar el modelo que vamos a
utilizar → el Modelo T (no conocemos datos de la población, tenemos dos muestras, etc).
En el contraste/comparación de 2 medias siempre vamos a usar el Modelo T porque
tenemos 2 muestras (y no vamos a conocer si viene de una distribución normal o no, la
mayoría de veces), y vamos a tener parámetros de la población de origen.
Tenemos el grupo experimental y el control con sus 3 datos: con su media (x̄ ), su tamaño
2
muestral (n) y la varianza ( s1 porque está al cuadrado; la desviación típica seria la raíz
cuadrada de ese valor).
El estadístico de contraste va a ser la diferencia de medias (la fórmula ahora se complica un
poco más porque vamos a tener 2 grupos).
SD (x̄ ): error de muestreo → si tuviéramos parámetros de la población
SE (x̄ ): error típico de la media (nos quedamos solo con este)
√
2 2
Sc Sc
SE (1 - 2)= +
n1 n 2
2
El valor de la varianza del contraste ( S c) lo vamos a calcular a partir de la siguiente fórmula:
2 2
2
(n 1 −1 ) S 1 +( n2 −1 ) S 2 (n 1 −1 ) S 21 +( n2 −1 ) S 22
S =
c =
( n1 −1 ) +( n2 −1 ) n1 +n2 − 2
Tenemos que tener en cuenta a la hora de calcular los grados de libertad cuando utilicemos
el valor de t que tenemos 2n: n1 + n2 - 2 (se suman los 2 tamaños muestrales y se le resta 2)
En este caso, los gl seria: 10+10-2 = 18
( 10 −1 × 13,81 )+ ( 10 − 1 ×15,58 )
S2c = = 14,69
10+10 −2
SE (1 - 2)=
10
+
√
14,69 14,69
10
= 1,714
La desviación estándar o típica es de 1,714, con esto ya podemos calcular el estadístico de

contraste.
18
Loli Martínez
Nuestro “parámetro” de referencia (no hay que tomarlo como parámentro, simplemente es
para que nos entendamos) va a ser 0, ya que yo quiero ver si hay diferencias o no hay
diferencias.
3º SE CALCULA EL ESTADÍSTICO CONTRASTE Y SU P-VALOR

Fórmula para calcular el estadístico de contraste:
( x¯0 − x̄ 1 ) − 0
t=
SE ( x̄ 0 − x̄ 1 )
* Antes en el 0 se ponía la media de la población o la media de nuestra muestra de

referencia pero ahora ponemos 0 (en el contraste bilateral usamos el 0 para decir si hay
diferencia o no, o en los contrastes unilaterales si las diferencias son mayores o menores),
por lo tanto en el numerador solo nos va a quedar la diferencia de medias porque no tiene
sentido restarle 0.
10,11−5,45
En nuestro ejemplo: t= =2,718 (estadístico de contraste de 2,718)
1,714
Si usamos un intervalo de confianza del 95% unilateral → Hay que fijarse en la fila de los
grados de libertad y el intervalo (mirando abajo de la tabla) entre que P-valores se
encuentra.
Sabiendo que nuestros gl=18, nos vamos a la fila del 18 y al fijar un IC95% unilateral
(miramos 0,05) tenemos un valor crítico de 1,734.
Nuestra diferencia de medias (estadístico de contraste) ha sido de 2,718 por lo que lo si es

significativo y seria un contraste unilateral derecho (si nos hubiera salido un valor negativo
seria un contraste unilateral izquierdo). Si fuera bilateral nos lo diría el enunciado.
Por lo tanto podemos utilizar el valor critico para determinar si algo es significativo o no, o
bien podemos buscar el nivel de significación, el p-valor (entre que valores puede estar).
4º SE TOMA LA DECISIÓN DE RECHAZAR O NO HA H0.

Con todo lo anterior podemos rechazar la hipótesis nula y aceptar la alternativa (t > tvc),
puesto que lo que hemos encontrado en nuestro estudio (en nuestro proyecto de
investigación) es relevante y los resultados con la intervención son significativamente
mayores a los del grupo control. Por lo que la nueva terapia que estamos analizando es
importante, tiene resultados relevantes.
19
Loli Martínez
Ya hemos determinado si aceptamos o rechazamos y ahora vamos a ver el p-valor

(RECORDAMOS QUE: la dificultad de la Tabla T es que el valor está entre 2 probabilidades ).
Nuestro estadístico de contraste es 2,718, se encuentra entre 2,552 y 2,878,

por lo tanto la probabilidad de hallar este valor está entre 0,01 y 0,005.
Este resultado con esta probabilidad no nos ha salido de casualidad,
la probabilidad de obtener ese valor es muy muy pequeño entre el 1%
y el 0,5%, eso no es casualidad. Esto es significativo y la probabilidad
de encontrar este valor es muy pequeña por tanto va a ser relevante.
2,552 < 2,718 < 2,878 → 0,005 < p-valor < 0,01
En base al p-Valor (igual que antes) ya podemos decir el tipo de significación:
- Si es < 0,01 es muy relevante, muy significativo.
- Entre 0,05 y 0,01 es relevante.
- Cuando están cerca al 0,05 queda a juicio del lector.
- Cuando es > 0,05 no es relevante, da igual que
apliques una u otra técnica, que los resultados
probablemente sean los mismos.
Estos niveles de p-valor van a variar si variamos el nivel de la significación, pero por norma
utilizamos un nivel de significación del 5%.
2.1.3. CONDICIONES DE APLICACIÓN PARA APLICAR LA TÉCNICA DE T STUDENT

PARA MUESTRAS INDEPENDIENTES.
Este tipo de pruebas son PRUEBAS PARAMÉTRICAS (las variables tienen que cumplir una
serie de condiciones):
 Que la muestra sea aleatoria
 Que haya mas de 30 sujetos en cada uno de los grupos, si son menos de 30 por
grupo, que por lo menos se aproxime a la distribución normal (lo podemos ver con
prueba de normalidad de Shapiro-Wilk).
 Que las muestras sean independientes (cada sujeto da datos a una media).
 Comprobar si las varianzas son homogéneas o no (lo podemos saber con prueba de
Levene para la igualdad de varianzas).
Por tanto para poder aplicar las pruebas T Student (el método para resolver el contraste de
dos medias sobre muestras independiente) dependerá de:
- La variable cuantitativa sigue una distribución normal → NORMALIDAD.
- Las varianzas poblacionales son iguales o diferentes → HOMOCEDASTICIDAD
20
Loli Martínez
Cuando esto no se cumple se emplean las PRUEBAS NO PARAMÉTRICAS: U de Mann

Whitney, Wilconson, etc.
PARA EXPLORAR LA NORMALIDAD DE LA MUESTRA (especialmente cuando < 30sujetos en

algún grupo) pero siempre hay que comprobarla. Vamos a usar:
 GRÁFICOS DE CAJA: permiten una orientación si hay si hay más o menos simetría,
también se aconseja si >30. Con el gráfico de cajas se ve si es normal o no (mirando los
bigotes, si la caja esta muy desplazada hacia arriba y tenemos el bigote de abajo muy largo la
muestra está distribuida hacia la derecha, tendríamos un sesgo positivo. Y al contrario, si la caja
está muy desplazada hacia abajo, el bigote de arriba es muy largo vana estar los valores muy
desplazados hacia la izquierda, que seria un sesgo negativo.
 PRUEBA DE COMPROBACIÓN DE LA NORMALIDAD ( Si la muestra es justo de 30 sujetos, se
pueden usar ambas pruebas, pero principalmente Kolmogorov!!!!).
 Shapiro-Wilk (n < 30): tenemos los test que es de lo que mas nos podemos fiar
100%, lo que nos va a dar la información específica→ con los gráficos de cajas nos
podemos hacer una idea pero solo nos pueden orientar, no nos van a decir de
manera exacta si son normales o no.
 Kolmogorov-Smirnov (n > 30): Si miramos el nivel de significación si sigue la
distribución normal: sig=0,200 (no es
normal cuando el p-valor es inferior a 0,05)
Planteamiento de la normalidad:
H0: la muestra proviene de una distribución normal. La variable fuerza sigue la distribución
normal, estamos aceptando la hipótesis nula.
H1: la muestra no proviene de una distribución normal
REGLA DE DECISIÓN: a partir de este contraste, y suponiendo el cálculo mediante un

software estadístico, la regla de decisión (en función del p-valor) sería la siguiente:
Si p > 0,05 → La variable cuantitativa sigue una distribución normal. En nuestro
ejemplo: como no rechazamos el P-valor, es decir, aceptamos la hipótesis nula.
Si p ≤ 0,05 → La variable cuantitativa NO sigue una distribución normal.
PARA EXPLORAR LA HOMOCEDASTICIDAD (la homogeneidad de varianzas): vemos si las

varianzas son homogéneas o son diferentes. Si tenemos 2 grupos muy diferentes no son
comparables por tanto no podríamos utilizar este tipo de pruebas. La prueba más conocida
para la verificación de la homocedasticidad es la prueba de Levene.
21
Loli Martínez
Planteamiento de la prueba de Levene → Contraste de hipótesis: la nula es que las varianzas

son iguales y la alternativa: es que son distintas.
H0: σ 21=σ 22
H1: σ 21 ≠σ 22
REGLA DE DECISIÓN: al igual que en el caso de la normalidad, mediante un software

estadístico y basándonos en el contraste planteado, la regla de decisión sería la siguiente:
Si p > 0,05 → Las diferencias apreciadas no son significativas. Las varianzas son
iguales.
Si p ≤ 0,05 → Existen diferencias significativas. Las varianzas poblacionales son
distintas.
En el ejemplo si hay homogeneidad, con Levene lo que buscamos es siempre igualdad, que
sea mayor a 0,05 (miraríamos la fila de arriba); si no tendríamos que mirar la fila de abajo (si
hay o no igualdad de varianzas miramos una fila u otra.)
La prueba T de Student siempre va con la prueba de Levene porque el programa (SPSS)

corrige si hay varianzas iguales o si no hay varianzas. Por tanto lo que buscamos es que esta
también sea mayor a 0,05.
MÉTODOS QUE SE APLICAN SEGÚN EL CUMPLIMIENTO DE LOS SUPUESTOS:

- Si se cumple la normalidad de la variable cuantitativa y la homocedasticidad aplicamos los
test paramétricos → T de STUDENT
- Si no se cumple la normalidad de la variable cuantitativa aplicamos los test NO
paramétricos → Test de Mann-Whitney
22
Loli Martínez
EJEMPLO (Estadístico de contraste para el caso de 2 medias poblacionales independientes

con desviaciones estándares desconocidas): Se quiere comprobar si en pacientes con
patología de codo de tenis, la aplicación de una órtesis nueva mejoraría la fuerza de la
musculatura extensora del codo. Para comprobar dicho supuesto se realizan dos grupos
[experimental (órtesis nueva) y control (órtesis tradicional, el que se conoce ya)]. ¿Se podría
decir que existen diferencias entre ambos grupos con un nivel de significación del 0,05?
IC95%. Tenemos un contraste bilateral (quiero ver si existen diferencias), por ello:
2
 Grupo experimental: x̄=10,11, n1 = 10 , S1 =13,81
2
 Grupo control: x̄=5,45, n2 = 10 , S1 =15,58
1º PLANTEAMOS EL CONTRASTE DE HIPÓTESIS:

Hipótesis nula: la diferencia entre grupo experimental y control no existe (da igual que te
pongas una órtesis que otra, el resultado va ser el mismo. H0: µe – µc = 0
Hipótesis alternativa: la diferencia entre el grupo experimental y el control si existe. Sí es
relevante que el paciente se ponga una órtesis u otra, puede ser en términos de
superioridad o de inferioridad, pero va a ser diferente!. H1: µe – µc ≠ 0
2º COMPROBAR SUPUESTOS DE APLICACIÓN:Tenemos que comprobar:

- La normalidad: usaremos el Test de Shapiro-Wilk (porque la muestra es menor de 30 en
cada grupo, tenemos 10 en cada grupo).
- Si hay homocedasticidad: con la Prueba de Levene (si es mayor a 0,05 miramos la fila de
arriba y si es menor miramos la fila de abajo).
3º OBTENEMOS EL ESTADÑISTICO DE CONTRASTE:
( x¯0 − x̄ 1 ) − 0 10,11−5,45
t= = = 2,718
SE ( x̄ 0 − x̄ 1 ) 1,714
4º BUSCAMOS EN LA TABLA T (α=0.05 ):

Miramos los grados de libertad: gl=10+10-2 = 18
Valor critico t18 = 2,10
Estadístico de contraste 2,72
5º EXTRAEMOS CONCLUSIONES:
Con todo esto podemos rechazamos la hipótesis nula porque nuestro estadístico de
contraste esta más allá de 2,10 (nuestro valor critico). Por tanto, podemos afirmar que al
tener pruebas suficientes con un un nivel de confianza del 95%, que existen diferencias en la
aplicación de una órtesis nueva y una tradicional sobre la musculatura extensora del codo
en pacientes con patología de codo de tenis (no decimos de que sea en términos de
superioridad o de inferioridad, porque el contraste inicial es bilateral, solo podemos decir
que existen diferencias).
23
Loli Martínez
Observando los datos que nos dan podemos intuir que las diferencias van a ser hacia el
grupo experimental, es decir, los resultados son mejores que los del grupo control (); y que
las diferencias son significativas entre uno y otro grupo. Puesto que es bilateral, podemos
encontrar diferencias por arriba o por abajo, pero dado que los resultados son mejores en el
experimental la aplicación de la órtesis nueva va a proporcionar resultados más relevantes,
mejores, que los del grupo control que era la órtesis tradicional.
2.1.4. PRESENTACIÓN DE LOS RESULTADOS

En el caso de los CONTRASTES PARAMÉTRICOS, es conveniente presentar las medias y las
desviaciones típicas, junto con el p-valor obtenido. Incluso puede ser conveniente incluir el
intervalo de confianza al 95% para la media y el tamaño de muestra.
Para los CONTRASTES NO PARAMÉTRICOS, la presentación debe incluir la mediana, el rango
intercuartílico y el p-valor.
2.2. CONTRASTE DE HIPÓTESIS PARA 2 MEDIAS PARA MUESTRAS

RELACIONADAS.
2.2.1. PLANTEAMIENTO DEL PROBLEMA.
Lo que cambia es que se relaciona con la diferencia de ambas medias, en lugar de utilizar
sola una media en concreto, vamos a utilizar la diferencia.
Para comparar 2 medias siempre se usa el Modelo T.
Ahora tenemos una única muestra de n individuos de una misma población. Se recogen
observaciones de la variable cuantitativa sobre los mismos individuos tenemos 2 medidas:
- En dos momentos temporales diferentes: una antes de la intervención y otra después.
- También a un mismo paciente que lo mido para dos pruebas diferentes: le mido una cosa y
le mido otra y veo si hay diferencias.
Por este motivo, los datos ya no son independientes, ya que disponemos de 2 muestras
sobre los mismo individuos, a esto se le conoce como muestras relacionada o apareadas.
24
Loli Martínez
Ejemplos:
1. Supongamos que queremos evaluar el efecto de una dieta para reducir el colesterol.
Administramos la dieta a cada uno de los individuos de una muestra y al cabo de un tiempo
volvemos a medir su nivel de colesterol. ¿Habrá variado dicho nivel de colesterol de modo
significativo al cabo de ese tiempo?
2.Supongamos que queremos comparar dos métodos de medida de la tiroxina libre.
Tomamos una muestra de 10 pacientes y se les mide la tiroxina con los dos métodos.
Queremos saber si los dos métodos nos darán los mismo resultados, o por el contrario
ofrecerán resultados significativamente distintos.
TIPOS DE CONTRASTE (el contraste de hipótesis seria similar):

 Contraste bilateral: En la hipótesis nula la diferencia de medias no existe (no hay
diferencias entre uno y otro grupo) y en la hipótesis alternativa si existen diferencias
entre ellas.
H0: µpre - µpost = 0
H1: µpre- µpost ≠ 0
 Contraste unilateral derecho: la diferencia de medias se expresan en términos de

superioridad (estaremos con el lado derecho de la gráfica)
H0: µpre - µpost ≤ 0
H1: µpre- µpost > 0
 Contraste unilateral izquierdo: la diferencia de medias se expresan en términos de

inferioridad (estaremos con el lado izquierdo de la gráfica)
H0: µpre - µpost ≥ 0
H1: µpre- µpost < 0
25
Loli Martínez
2.2.2. ESTADÍSTICO DE CONTRASTE

Lo único que a a cambiar es el estadístico de contraste que es la diferencia pre y post
intervención (diferencia de medias del mismo individuo).
En la tabla que vamos a representar vamos a tener: 1 a n individuos con una medida
preintervencion y otra postintervención y su diferencia de medias (lo que nosotros vamos a
usar es esa diferencia de medias).
PASOS A SEGUIR PARA EL CÁLCULO DEL ESTADÍSTICO DE CONTRASTE (t):

1º. Vamos a crear una variable que consiste en la diferencia entre las observaciones antes y
después del tratamiento: dn = xn - yn
Se hace la medida preintervencion – la postintervención (a la 1º medida le quitamos la 2º
medida.
*La diferencia de medias es lo mismo que el cambio absoluto*
Si no hay diferencias en el tratamiento, la diferencia entre los valores de la variable antes

(pre) y después (post) serán igual o muy próxima a 0 (no habrá cambio).
dn
t=
s /√n
Si se cumple la normalidad de la variable cuantitativa → TEST PARAMÉTRICOS
No se cumple la normalidad de la variable cuantitativa → TEST NO PARAMÉTRICOS
2.2.3. CONSIDERACIONES GENERALES Y CONDICIONES DE APLICACIÓN

Las condiciones de aplicación son similares, tenemos que comprobar si sigue la normalidad
(aquí no tenemos que comprobar la homocedasticidad porque tenemos una sola muestra,
las varianzas van a ser iguales, por eso SOLO TENEMOS QUE COMPROBAR LA NORMALIDAD
para ver si usamos los test paramétricos o los no paramétricos)
26
Loli Martínez
2.2.4. EXTRAER CONCLUSIONES

La toma de decisiones es similar a cuando tenemos una media, con la Distribución T:
- Si es < 0,01 es muy relevante, muy significativo.
- Entre 0,05 y 0,01 es relevante.
- Cuando están cerca al 0,05 queda a juicio del lector.
- Cuando es > 0,05 no es relevante, da igual que apliques una u otra técnica, que los
resultados probablemente sean los mismos.
2.2.5. PRESENTACIÓN DE RESULTADOS

Al igual que en el caso anterior, en el caso de los CONTRASTES PARAMÉTRICOS, es
conveniente presentar las medias (además del IC95%) y las desviaciones típicas, junto con el
p-valor obtenido.
Para los CONTRASTES NO PARAMÉTRICOS, la presentación debe incluir la mediana, el rango
intercuartílico y el p-valor.
Quiero ver los efectos de la dieta sobre el colesterol y tenemos una muestra de 10 sujetos.
Tenemos una medida del colesterol (M) antes de la dieta (preintervencion) y después de la
dieta (postintervencion). DT es la desviación típica y p* es el p-valor. Con el p-valor podemos
decir si la dieta tiene efecto sobre el colesterol.
Su diferencia de medias seria: pre-post (si yo digo por ejemplo que la dieta va a tener un
efecto que va a reducir el colesterol, si yo hago la post – la pre → 210-241 = - 31, por lo
tanto la dieta tiene un efecto negativo, es decir, la dieta reduce el colesterol).
Da igual como lo pongamos, pero tiene que estar bien redactado y expresado a la hora de
redactar los resultados, el p-valor va a ser similar sea pre-post o post-pre.
27
Loli Martínez
EJEMPLO (Estadístico de contraste para el caso de 2 medias para muestras relacionadas):

Se pretende demostrar que cierto tratamiento practicado durante un mes ayuda a reducir el
colesterol. Para ello se realiza un estudio con una muestra aleatoria simple de 10 personas.
Los resultados se muestran a continuación:
Tenemos todas las medias antes y todas la medidas después para cada uno de los sujetos
1º PLANTEAMOS EL CONTRASTE DE HIPÓTESIS (Planteamiento del problema):
Las mediciones se realizan sobre las mismas personas y queremos ver si existen diferencias
entre el colesterol antes del tratamiento y después del mismo (esto es lo que nos interesa).
Encontrar evidencia a favor de que el tratamiento surgen el efecto deseado (baja el
colesterol) es lo mismo que encontrar evidencia estadísticamente significativa en el
contraste unilateral:
Hipótesis nula: no hay diferencia de medias, es = 0, es decir, no existen diferencias.
H0 : µpre = µpost
Hipótesis alternativa: la diferencia de medias va a ser mayor, menor o diferente. La medida
pre va a ser mayor que la post, es decir, que antes de la dieta las personas tienen más colesterol que
después (contraste unilateral).
H1 : µpre > µpost
2º COMPROBAMOS LOS SUPUESTOS DE APLICACIÓN Y DESARROLLO DE LOS CÁLCULOS:

Tenemos que comprobar si sigue la normalidad → Aplicamos Shapiro-Wilk y se comprueba
que se cumple la hipótesis de normalidad para la variable nivel de colesterol.
En base a los resultados podemos determinar si aceptamos o no la hipótesis. En este caso
rechazamos la hipótesis nula y aceptamos la alternativa, ya que el tratamiento es efectivo y
reduce el colesterol.
3º CONCLUSIÓN:
Existen diferencias significativas, es decir, el colesterol ha bajado tras el tratamiento.
Podemos afirmar que el tratamiento es efectivo y reduce el colesterol de manera
significativa.
En el examen tenemos que saber principalmente: PLANTEAR EL CONTRASTE DE HIPÓTESIS, EL

ESTADÍSTICO DE CONTRASTE (diferencia de medias) Y SI SE ACEPTA O SE RECHAZA (hay que saber
interpretar).
Al final el p-valor (nos lo va a decir el programa estadístico), sabiendo que es < 0,05 es suficiente.
28
Bloque 4. Tema 5.
Contraste de dos proporciones.
1. Introducción.
Recordemos que con proporciones siempre vamos a emplear el modelo Z, el T
únicamente se empleaba para medias. Nuestro principal objetivo en un contraste de
hipótesis va a residir en comprobar si el estadístico de nuestra muestra (media o
proporción) es igual o diferente al parámetro de referencia que puede ser o no la
población, no tiene por qué ser necesariamente esta.
Es importante recordar que lo que nosotros queremos comprobar, lo que ya sabemos
desde un primer momento, nos lo va a dar la hipótesis nula H0. A partir de esta, nosotros
demostramos si se cumple o no la hipótesis alternativa (H1) que planteemos.
1.1. Pasos a seguir en un contraste de hipótesis.
Estos van a seguir siendo los mismos que llevamos viendo durante estos últimos temas.
Sea un contraste de una o dos proporciones no influye en los pasos. Estos son:
Se van a desarrollar cada uno en los siguientes apartados para una proporción.
2. Fijar la H0 y la H1.
Esto realmente es un resumencillo de todo lo visto hasta ahora de las hipótesis
¿Qué es una proporción?: Es un valor central o característica determinada que presenta
un grupo de sujetos en función del resto de la población. Nos permiten estudiar una
característica de interés dentro de una población o muestra.
H0: Valor de referencia, lo que nosotros ya sabemos.
H1: Lo que nosotros queremos comprobar y que será cierto si rechazamos H0.
Recordemos que los contrastes pueden ser unilateral derecho (>), unilateral izquierdo
(<) o bilateral (≠).
1
Sé que esto ya lo hemos dado antes, pero la profesora ha vuelto a decir que es muy importante
y que cae si o si en el examen. Ahora se van a explicar los contrastes que vimos en el tema 3 de
este bloque, he de decir que en el otro tema está mejor explicado porque la profesora aquí no se
paró mucho ya que la única diferencia es que aquí hablamos de proporción.
 Contraste bilateral: En la región de aceptación tenemos el intervalo de confianza

que vamos a fijarlo a partir del nivel de significación (𝛼). Recordemos que lo más
normal es trabajar con un 95% de confianza, teniendo un 0,25 a cada lado, de tal
forma que un 0,5 sería la región de rechazo o crítica.
La representación de este sería H0 : π = p
H1: π ≠ P
 Contraste unilateral derecho: Podemos tener valores iguales o menores al valor

crítico. Como ya sabemos la región de aceptación iría desde el - ∞ hasta el valor
crítico. Si es superior a este, estaríamos en la región de rechazo o crítica de la H0.
La representación de este sería H0 : π ≤ p
H1: π > P
 Contraste unilateral izquierdo: Podemos tener

valores iguales o mayores al valor crítico. Como ya sabemos la región de aceptación
iría desde el valor crítico hasta ∞. Si es inferior a este valor crítico, estaríamos en la
región de rechazo de la H0.
La representación de este sería H0 : π ≥ p
H1: π < P
Plantear las hipótesis de manera correcta es imprescindible ya que, si estas están

mal, todo lo que hagamos después va a ser incorrecto.
3. Especificar el modelo de DM para testar la H0.

Una vez tenemos las hipótesis planteadas, debemos elegir qué modelo empleamos para
elegir o rechazar la hipótesis nula. Vamos a elegir el modelo Z, el modelo de normalidad.
Recordamos que la diferencia entre el T y el Z es:
2
Modelo Z Conocemos la muestra, se ha seleccionado aleatoriamente, es normal,

grande y conocemos los parámetros de la población. Se emplea siempre para
proporciones.
Modelo T La muestra es pequeña o desconocemos si la distribución es normal. Para
medias empleamos este.
Por consiguiente, el modelo que vamos a emplear siempre en este caso es el Modelo
Z, puesto que estamos viendo en este tema las proporciones.
4. Calcular el estadístico de contraste a partir de los datos.

En las proporciones, el error de muestreo siempre lo vamos a calcular con el dato que
nos de el enunciado de la hipótesis nula. Es decir, cuando tengamos que calcular un
estadístico de contraste en una proporción, en el denominador vamos a poner el error
típico de la población o de muestreo. Muy importante emplear la proporción que nos
da el enunciado de la H0, si no lo hacemos así, está mal.
La fórmula empleada es:
Recordemos que un estadístico de contraste es la representación de la divergencia o

diferencia entre los resultados muestrales y el valor del parámetro poblacional en
número de errores estándares.
Ejemplo:
H0 → El 25% de las mujeres españolas tienen varices.
H1 → Más del 25% de las mujeres españolas tienen varices.
Me planteo que en mi muestra hay un 28% de las mujeres con varices de una muestra
de 60 mujeres. 𝑷 = 𝟐8% n=60
A partir de estos datos, sustituimos los valores en la fórmula:
El valor que obtenemos corresponde al valor de Z. Por ello, Z=0,53 y lo buscamos en la

tabla para ver la probabilidad, es decir, buscamos el P-Valor. Recordemos que este es la
probabilidad de hallar un estadístico igual o superior asumiendo una determinada
distribución muestral.
Por consiguiente, en base a nuestro valor de Z podemos empezar a tomar una decisión,
que sería ver la probabilidad de hallar ese valor.
3
5. Hallar el valor crítico para el estadístico de contraste.

Una vez hallado el estadístico de contraste lo vamos a emplear para decidir si debemos
rechazar o no H0. ¿Qué probabilidad hay de que el estadístico de contraste haya
ocurrido siendo verdadera la afirmación? Para saber esto tenemos que hallar el P-Valor.
Para ello, debemos buscar en la tabla Z el valor obtenido mediante el estadístico de
contraste. En el ejemplo anterior, era de 0,53 por lo que al buscar (Z>0,53) se ha
obtenido 0,7019 y como hemos buscado una probabilidad mayor a Z, tenemos que
restarle 1 al resultado 1-0,7019=0,2981. Restamos uno ya que, como sabemos, en la
tabla Z solo podemos buscar valores ≤.
En este caso, hemos obtenido un P-valor de 0,2981 y en el ejemplo, el valor crítico era
de 1,64 en un contraste unilateral derecho. Esto supone que no sea un valor
estadísticamente significativo y por ello, aceptamos H0 y rechazamos la alternativa.
A partir del nivel de significación previamente fijado se establece el intervalo de
aceptación de la hipótesis nula, que constituirán la zona de aceptación y rechazo según
si el estadístico de contraste esté dentro o fuera de dicha zona.
Región de aceptación y región de rechazo en un contraste bilateral
A partir del nivel de significación fijado buscamos el valor de z que deja por arriba y por
abajo la probabilidad de α/2. Y ese será el valor del estadístico crítico dentro de un
intervalo de significación del 95%.
La zona que queda entre los estadísticos críticos,
es la zona de aceptación de Ho, es decir, si mi
estadístico de contraste se encuentra en esa
zona, acepto Ho, pero si cae en las zonas rojas,
rechazo Ho y acepto alternativa.
Importante recordar que en el 95%, siempre va
a ir de -1,96 a +1,96 el intervalo de aceptacion.
Región de aceptación y región de rechazo en un contraste unilateral derecho 
A partir del nivel de significación fijado buscamos el valor de
z que deja por arriba la probabilidad de α. Y ese será el valor
del estadístico crítico.
La zona que queda por debajo del estadístico crítico, es la
zona de aceptación de Ho, es decir, si mi estadístico de
contraste está ahí, acepto Ho, pero si cae en la zona gris,
rechazo Ho y acepto alternativa.
Importante recordar que en el 95%, siempre va a ir de - ∞ a +1,64 el intervalo de
aceptacion.
4
Región de aceptación y región de rechazo en un contraste unilateral izquierdo

A partir del nivel de significación fijado buscamos el valor de z que
deja por abajo la probabilidad de α. Y ese será el valor del estadístico
crítica. La zona que queda por encima del estadístico crítico, es la
zona de aceptación de Ho, es decir, si mi estadístico de contraste está
ahí, acepto Ho, pero si cae en la zona gris, rechazo Ho y acepto
alternativa.
Importante recordar que en el 95%, siempre va a ir de -1,64 a +∞ el intervalo de

aceptacion. Por lo que, si nuestro estadístico de contraste se encontrará por debajo de
-1.64, rechazaríamos la H0 y aceptaríamos la H1.
Nos ha vuelto a poner la tabla resumen que puso también en los otros temas. Recuerdo
que es lo explicado anteriormente pero aquí a modo de resumen general.
6. Decidir si se rechaza o no la H0 en función del valor p.

7. Comprender que la conclusión alcanzada podría ser errónea por
puro azar.
Ejemplo de todo lo visto hasta aquí:
5
A partir de aquí vamos a realizar el contraste para dos proporciones (hasta

ahora ha sido para una)
8. Contraste de hipótesis para dos proporciones.
En primer lugar, tenemos que realizar una tabla cruzada para ver la relación que existe
entre las 2 proporciones y, a partir de ella, podemos ver si existe asociación a simple
vista. Además, mediante el contraste de proporciones vamos a poder ver si esa
asociación es realmente significativa o no.
8.1. Planteamiento del problema.

De esto ha remarcado sobre todo el primer punto, lo que he puesto en negrita, de los otros 3
puntos realmente ha pasado y ha dicho que nos lo leamos.
 Nuestra pregunta de investigación o hipótesis consiste en comprobar si existe alguna

relación entre dos características o variables cualitativas dicotómicas de una
población.
 Comparamos la proporción de casos de una modalidad que sea objeto de estudio de
una variable cualitativa, que llamaremos “1”, en dos grupos independientes de la
otra variable cualitativa, que llamaremos “2”.
 De este modo, podremos calcular la proporción de cada una de las dos modalidades
de la característica (1) en cada uno de los dos grupos determinados por la
característica (2).
 Por tanto, podemos hacernos la siguiente pregunta: ¿Es la proporción de esta
modalidad la misma (o no) en ambos grupos? Pregunta de Investigación →
Supongamos
Ejemplo:
6
Pregunta de Investigación → Supongamos que queremos saber si la proporción de

fumadores es mayor entre los chicos de la clase o entre las chicas.
1. Debemos medir dos características dicotómicas en la clase (Sexo y fumador (Si/No)).
2. Para la variable “Fumador (S/N)” tenemos una proporción para cada modalidad en
la población.
Tenemos una muestra de 80 alumnos de los cuales 30 fuman ((30/80) x100= 37,5%) y
50 no ((50/80) x100= 62,5%). Para hallar cuantos fumadores y no fumadores son chicos
o chicas observamos la siguiente tabla cruzada donde tenemos en las columnas la
variable sexo y en las filas la variable fumador:
De esta forma podemos observar que, de los 20 chicos, 5 no fuman y 15 sí. Mientras
que, de las 60 chicas, 45 no fuman y 15 sí. Así podemos saber que el 75% de los chicos
fuman y un25% de las chicas, por lo que a simple vista podemos pensar que los chicos
fuman más que las chicas.
Por tanto, nuestro objetivo va a ser determinar si realmente los chicos fuman más que
las chicas.
Para ello, podemos ver que existen tres tipos de contrastes al igual que pasaba con las
medias y el planteamiento es igual: unilateral derecho (>), unilateral izquierdo (<) o
bilateral (≠).
Para este ejemplo vamos a coger un contraste unilateral derecho ya que nuestra H0:
los chicos fuman más que las chicas. H1: las chicas fuman más que los chicos.
En primer lugar, vamos a calcular las proporciones de fumadores en función del sexo:
7
Para calcular este cogemos el número de fumadores/total de la muestra.
 Proporción de fumadores en el grupo de chicos →15/20 =0.75 (75%)

 Proporción de fumadores en el grupo de chicas →15/60 =0.25 (25%)
Posteriormente, calculamos el estadístico de contraste para dos proporciones; en este
caso, la P del denominador es la del total de fumadores, se hace en función de esta y no
del sexo. La del numerador (donde pone la diferencia) sí que sería en función del sexo.
Es la única diferencia respecto a la de una proporción. Únicamente hay que sustituir en
la formula.
Es decir, para hallar el valor de P: (sumamos

los fumadores y las fumadoras) / (el valor
muestral de la suma de ambos grupos)
Los valores del numerador (15/20 y 15/60)

hacen referencia a las proporciones del 25%
y 75% halladas antes.
Por otro lado, el valor que se encuentra

dentro de la raíz cuadrada es la proporción
total. Como ya he dicho antes, se halla al
sumar las muestras, en este caso 15+15
(fuman)=30 y dividirlo entre la suma de las
variables del sexo 60+20=80 30/80= 0,375
Como nos ha salido un valor de Z= 4 y estamos en un contraste unilateral derecho (de -

∞ a +1,64), rechazamos la H0 puesto que el valor es raro, está en la región de rechazo.
Por ello, aceptamos H1.
Si buscamos este valor de Z en la tabla, vamos a obtener una probabilidad de 1 y como
estábamos en unilateral derecho, estamos buscando un valor mayor (>), tenemos que
restar 1 a la probabilidad encontrada P-valor=1-1=0,000. Al ser un valor menor a 0,05
si hay un cambio estadísticamente significativo lo que nos confirma que vamos a
rechazar la H0 y aceptamos H1.
De esta forma estaríamos diciendo que hay una gran diferencia de fumadores entre
chicos y chicas, siendo los chicos más fumadores que ellas.
Para poder presentar los resultados empleamos una tabla de contingencia: Lo habitual
es presentar la tabla de doble entrada con la frecuencia absoluta (Casos) en cada celda
y entre paréntesis el porcentaje (por fila o columna según convenga), junto con el p-
valor que indique la asociación (o no) entre las variables.
8
En esta tabla cruzada nos faltaría añadir la diferencia de proporciones entre un grupo
y otro.
Tenemos que tener en cuenta que esta vez estamos comparando grupos.
Esto se lo ha saltado, pero estaba en las diapositivas:
El resultado del contraste (regla de decisión) vendrá dado por:
 Si Z (estadístico de contraste) es inferior o igual al nivel de significación (valor

crítico Zα) → No hay evidencia en contra de H0, es decir, no encontramos
diferencias significativas en ambas proporciones. Aceptamos H0
 Si Z (estadístico de contraste) es mayor al nivel de significación (valor crítico Zα)
→ Aceptamos H1, es decir, las proporciones son significativamente distintas.
Esto es igual a lo explicado para una proporción en los temas anteriores.
9
Loli Martínez
Bloque 4.
Tema 6: ANÁLISIS DE LA VARIANZA
¿Que pasa si tenemos más de 2 grupos? Porque la prueba de T Student es la comparación

de medias y nos sirve solo cuando tenemos dos grupos. Comparaciones de medias que
podemos hacer: para muestras independientes cuando tenemos 2 grupos por ejemplo a uno
aplicamos intervención y al otro no, o para muestras relacionadas cuando en un mismo grupo
queremos ver la diferencia entre una medida inicial y una final para ver un cambio, a ver si algo ha
sido efectivo en un grupo de personas. Si no hay cambio esa intervención no es útil.
Si yo me planteo un estudio en el que haya 3 grupos de intervención (uno control y otros 2
donde a uno de ellos le aplico por ejemplo electroestimulación y al otro ejercicios
isométricos), en este caso la prueba T Student no nos valdría, sino que tendremos que usar
el ANÁLISIS DE VARIANZA (ANOVA).
1 Análisis de la varianza (ANOVA).

Ahora vamos a ver que pasa con 3 grupos diferentes. Siempre partimos de una muestra que
aleatorizamos y a cada uno le aplicamos un tratamiento/intervención (ya sea A, B o C), una
medida que queramos probar si es válida o no, etc.
Los grupos, si perteneces a uno u otro,

van a ser una variable cualitativa, pero
NO seria dicotomica porque serían
más de 2 grupos.
Voy a ver como se comporta una

variable cuantitativa (una media), en
relación a una variable cualitativa (es
el tipo de grupo donde cae nuestro
paciente o los grupos que queramos
valorar). Seria una comparación de muestras independientes pero con 3 grupos. Esto se
realiza con el Análisis de la Varianza (ANOVA).
En el SPSS lo vamos a encontrar como: ANOVA de un factor → se usa cuando las medias de
una variable cuantitativa son diferentes o iguales en relación a una variable cualitativa.
POR EJEMPLO: Me planteo la efectividad de los ejercicios isométricos, concéntricos o

excéntricos en relación con la fuerza del bíceps braquial. O que tipo de ejercicio es mejor
por ejemplo para la patología de tendón, es decir, como se comportaría, cual elegiríamos si
tuviéramos una tendinopatia, etc.
En este caso vemos la media del bíceps

braquial, esta seria la variable cuantitativa, en
relación al tipo de ejercicio, que sería la
variable cualitativa.
1
Loli Martínez
En este tema nos vamos a centrar en el análisis de varianza simple o de un factor.
Llamamos factor o variable independiente a la variable cualitativa que define los grupos
que deseamos comparar y variable dependiente a la variable cuantitativa (en función del
grupo en el que esté el paciente va a tener una media u otra o incluso igual).
EN EL EJEMPLO: la variable dependiente va a ser la que varia: es la fuerza del bíceps;

y la variable independiente va a ser: el tipo de ejercicio. Lo que va a variar es la
fuerza en función del tipo de ejercicio.
En base a este tipo de análisis, definiremos un nuevo contraste de hipótesis aplicable a la

comparación de medias en más de 2 grupos.
OBJETIVO PRINCIPAL:
Determinar si las medias son iguales o difieren, es decir, si existen diferencias significativas
al comparar las medias de la variable cuantitativa entre los diferentes grupos de la variable
cualitativa, o si por el contrario, puede establecerse que sus medias no difieren (son
prácticamente iguales, o sus diferencias no son significativas).
La intervención va a ser efectiva cuando las medias difieren entre grupos, eso quiere decir
que existe una relación entre las variables. Por ejemplo, entre la fuerza del bíceps y el tipo
de ejercicio que haga el paciente; si la media fuera igual en todos los grupos da igual que el
paciente haga un ejercicio excéntrico, que concéntrico que isométrico que va a tener la
misma fuerza de bíceps. Por lo tanto, algo va a ser efectivo/relevante cuando las medias
sean diferentes entre los grupos.
Los gráficos de cajas los usábamos para ver

las medias.
En este gráfico las medias están
relacionadas (en principio sí existen
diferencias). Las diferencias no son iguales
entre todos los grupos, el 2º y 3º grupo se
comportan más o menos iguales; pero el 2º
grupo en relación al 1º si difieren, existen
mayores diferencias.
Esto también tenemos que tenerlo en cuenta, tenemos que ver las diferencias a nivel
general entre los 3 grupos y también las diferencias entre un grupo con otro, porque a lo
mejor dentro de las 3 intervenciones puede que una sea relevante con respecto a un grupo
control pero que otra no lo sea.
La complejidad está un poco más en esto, que tenemos que ver las diferencias en general y
las diferencias entre un grupo y otro.
2
Loli Martínez
El ANOVA, el Análisis de la Varianza, va a implicar un análisis de la variabilidad total con

respecto a la media global, es decir, como varían los sujetos dentro de un grupo y como
varían los sujetos dentro de la muestra en general.
Por lo tanto, la variabilidad total va a depender de 2 tipos de varianzas:
 VARIABILIDAD INTRA-GRUPO / VARIANZA O VARIABILIDAD DENTRO DE CADA UNO
DE LOS GRUPOS (SCD). Mis grupos son homogéneos (más o menos son iguales →
están entorno a la misma zona; si tuviera mucha dispersión dentro del cuadrado
estaría cada punto en un lado, por el centro por las esquinas, etc). Esta variabilidad
es la diferencia entre la media de un sujeto con la media del grupo, cuantifica la
dispersión dentro de cada uno de los grupos.
Esta considera cada grupo de manera independiente y dentro del grupo vemos como
de disperso está, si está muy cerca de la media o si está muy alejado. En la imagen
podemos ver que los puntos están entorno a la media del grupo. También podemos
ver que el comportamiento es mas o menos parecido dentro del grupo (siempre
tiene que haber algo de variabilidad, RECORDAMOS QUE: es muy difícil caer JUSTO
en la media, siempre vamos a caer en torno a la media, es decir, al rededor).
 LA VARIABILIDAD INTER-GRUPOS / VARIANZA O VARIABILIDAD ENTRE MUESTRAS

(SCE). Compara cada uno de los grupos en relación a la media total de la muestra
(consideramos toda la muestra). En esta imagen existe variabilidad intergrupo (NO
se comportan igual entorno a la media, cada grupo va por un lado): el A está mas
disperso, el C están más en la zona central, etc. Esta variabilidad es la diferencia
entre la media del grupo y la media total de toda la muestra.
Aquí lo consideramos en general, vemos la media dentro de cada uno de los grupos
en relación a la media general de la muestra. Tenemos por ejemplo, que el grupo A
se comporta de una manera que es totalmente diferente al comportamiento del
grupo B.
3
Loli Martínez
La VARIABILIDAD TOTAL no va a ser la suma, pero viene considerada por la variabilidad

intra-grupo y la inter-grupo.
En nuestro ejemplo: A la hora de tener en cuenta si van a haber diferencias de medias entre
los grupos, es decir, si va a variar la fuerza del bíceps braquial en relación a los diferentes
grupos, tenemos que ver la variabilidad total, ya que tenemos que tener en cuenta la
intragrupo con la intergrupo.
Cuando comparamos buscamos que los grupos sean iguales para que sean comparables, por
ello lo que esperamos/queremos es tener variabilidad intragrupo (que los grupos sean
homogéneos dentro de ellos, es decir,que no tengan muchos valores atípicos). Pero si
queremos ver si una intervención es efectiva o no buscamos que los grupos sean diferentes
porque nuestro objetivo para ver si la intervención es efectiva o no es que la variabilidad
intergrupos sea diferente.
Por tanto lo ideal para ver si una intervención es efectiva es que la variabilidad intragrupos
sea pequeña y la variabilidad intergrupos sea grande (eso va a significar que siguen
diferencias entre los grupos, es decir, el echo de que tu hagas un ejercicio u otro si va a estar
relacionado con que tenga más o menos fuerza).
** Si la variabilidad intragrupos es muy grande, al ser tan diferentes no debería ser un buen
estudio, por tanto, tenemos que controlar eso con una muestra aleatoria (va a ser una
condición de aplicación) (además si tenemos valores muy parecidos, no vamos a tener esa
variabilidad que buscamos; SIEMPRE HAY QUE TENER CIERTA VARIABILIDAD PARA PODER
COMPARAR, PORQUE SI LOS VALORES SON MUY IGUALES A LA MEDIA NO VAMOS A
OBTENER NADA).**
1.1 PASOS A SEGUIR EN UN CONTRASTE DE HIPÓTESIS
Seguimos los pasos del contraste de hipótesis (como hemos echo anteriormente):
1º. Fijamos la hipótesis nula y la alternativa, pero en este caso vamos a tener varios grupos.
2º. Especificamos el modelo de DM (para testar la hipótesis nula
3º. Fijamos nuestra hipótesis y calculamos el estadístico de contraste a partir de los datos
4º. Hallamos el valor crítico para el estadístico de contraste
5º. Decidimos si se rechaza o no la hipótesis nula en función del p-valor
6º. Comprender que la conclusión alcanzada podría ser errónea por puro azar
4
Loli Martínez
1.2 PLANTEAMIENTO DEL CONTRASTE PARA ANOVA
El planteamiento del contraste va a ser igual →

La hipótesis nula es que no hay diferencias entre los grupos, es decir, que las medias de K
poblaciones (K>2) van a ser iguales.
La hipótesis alternativa es que al menos una de las medias de las poblaciones va a ser
distinta a las demás en cuanto a su valor esperado (lo ponemos así tal cual, porque no
vamos a liarlo más ).
H0: µ1 = µ2 = … = µK
H1: Al menos una media es distinta
Lo IMPORTANTE es saber lo de la VARIANZA, lo de la VARIABILIDAD INTRA E INTERGRUPO Y

como vamos a INTERPRETARLO.
1.3 CONSIDERACIONES GENERALES Y CONDICIONES DE APLICACIÓN
El ANOVA es una prueba paramétrica y cuando es paramétrica los supuestos que tiene que
cumplir son que nuestra variable cuantitativa:
- que siga la normalidad,
- que sea independiente (que la muestra se obtiene de forma aleatoria) y
- que siga la homocedasticidad (que los grupos se parezcan, que la varianza entre los grupos
sean parecidos).
Si se cumple la normalidad y la homocedasticidad de la variable cuantitativa vamos a usar

los Test Paramétricos → ANOVA
Si NO se cumple la normalidad de la variable cuantitativa utilizamos Test NO Paramétricos

→ Test de Kruskal-Wallis (cuando no se cumplía la normalidad en la comparación de medias se
usaba el test U de Mann Whitney )
1.3.1 NORMALIDAD
Tenemos que ver que la variable cuantitativa en todos los grupos/poblaciones siga la
normalidad (en el ejemplo anterior la variable cuantitativa es la fuerza del bíceps y tenemos
que ver que esta siga la normalidad dentro de cada uno de los grupos).
Los métodos de comprobación pueden ser:
 Los gráficos de probabilidad normal: los Q-Q plot (eran
normales cuando seguían la recta central, aunque los
extremos pueden variar un poco, el 95% central debe
aproximarse a la recta).
5
Loli Martínez
 La prueba de Shapiro-Wilk cuando la muestra es menor a 30 (muestras ‘pequeñas’).
 La prueba de Kolmogorov-Smirnov cuando son más de 30 (muestras ‘grandes’).
Planteamiento de la normalidad:
H0: La muestra NO proviene de una distribución normal
H1: La muestra proviene de una distribución normal
A partir de este contraste, y suponiendo el cálculo mediante un software estadístico, la regla

de decisión (en función del p-valor) sería:
- Si p-valor > 0,05 → si es mayor, la variable cuantitativa sigue una distribución normal (la
hipótesis nula es que la muestra proviene de una distribución normal).
- Si p-valor ≤ 0,05 → si es menor, la variable cuantitativa NO sigue una distribución normal
1.3.2 INDEPENDENCIA
Esto es que no tengamos la muestra sesgada.

Si la independencia nos dice que la muestra se obtiene de un muestreo aletatorio,
es así y es independiente. Es la mejor manera de asegurar la homogeneidad dentro
de los grupos con cierta variabilidad.
1.3.3 HOMOCEDASTICIDAD
Es igualdad de varianzas de las subpoblaciones, es decir, buscamos que sean grupos

homogéneos (una variabilidad intragrupo homogénea), que sean igual.
La varianza es un estadístico de variabilidad y dispersión, y aumenta cuanto mayor sea la
variabilidad o dispersión de las puntuaciones.
Lo hacemos con la prueba de Levene: RECORDAMOS QUE el p-valor tenia que ser mayor de
0,05 → las varianzas dentro de X grupos son iguales.
Planteamiento de la homocedasticidad:
2 2
H0: σ 1=σ 2
2 2
H1 : σ 1 ≠ σ 2
A partir de este contraste, y suponiendo el cálculo mediante un software estadístico, la regla

de decisión (en función del p-valor) sería:
- Si p-valor > 0,05 → si es mayor, las diferencias apreciadas no son significativas. Las
varianzas son iguales.
- Si p-valor ≤ 0,05 → si es menor, existen diferencias significativas. Las varianzas
poblacionales son distintas.
6
Loli Martínez
2 Estadístico de contraste
Ya hemos comprobado nuestro supuesto. Ahora vamos a ver nuestro estadístico → como
interpretar nuestro ANOVA.
En este caso el estadístico que se emplea es: F de Snedecor (es el estadístico que veíamos
con la comparación de medias y de proporciones pero aquí se llama así). Con este
estadístico de contraste vemos si existe o no diferencia de medias.
La F de Snedecor lo obtenemos al dividir la variabilidad intergrupo (la variación de las

medias entre los grupos de la variable independiente . Tiene que ser grande si nuestra
intervención que aplicamos es relevante), entre la variabilidad intragrupo (la
estimación de la variación de las medias dentro de los grupos . Tiene que ser pequeña
porque yo quiero obtener grupos homogeneos, comparables).
Por ello, la variabilidad intragrupo tenia que ser pequeña, mientras que la de intergrupo
tenia que ser grande.
Si las medias entre los grupos varían mucho y la media dentro de un grupo varía poco, es
decir, los grupos son heterogéneos entre ellos y similares internamente, el valor de F será
más alto, y por tanto, las variables estarán relacionadas. Lo que queremos es que la del
denominador (intragrupo) sea pequeño y la del numerador (intergrupo) sea grande.
Si la F de Snedecor está próxima a 1, no va a haber relación entre las variables dependiente

e independiente, porque la variabilidad intragrupo puede ser pequeña pero la intergrupo
también esta siendo pequeña (las variabilidades son muy próximas: las variabilidades son
pequeñas o grandes las dos grupos). Por ello cuanto más cercano sea al 1 menor relación va
a haber.
¡¡NO HACE FALTA SABER CALCULAR LA F DE SNEDECOR SOLO TENEMOS QUE SABER
INTERPRETARLO!!
Por lo tanto lo que nos interesa y queremos es que el valor de F sea mayor y lejano de 1:
cuanto mayor F de Snedecor (dependerá de la variabilidad que tengamos), más
relacionadas están las variables, lo que significa que las medias de la variable dependiente
difieren o varían mucho entre los grupos de la variable independiente.
Esto lo vamos a confirmar con el p-valor (nos va a decir si es relevante o no). Porque
podemos tener: una F de Snedecor de 2,5 y pensar que eso esta cercano a 1, pero si el
p-valor es menor a 0,05 SÍ es relevante; o una F de Snedecor de 1,15 (a lo mejor es que las
7
Loli Martínez
medias dentro de mi grupo son muy pequeñas o estoy midiendo una variable que son
números pequeños, mientras que nos digan que el p-valor es relevante es porque van a
existir diferencias entre los grupos (no dentro del grupo)).
3 Tomar decisiones / Extraer conclusiones

La significación estadística del estadístico de F se interpretará como la probabilidad de que
este valor de F se deba al azar.
Al final donde nos fijamos es en la F de Snedecor, pero lo que realmente nos va a
determinar si algo es relevante o no es el p-valor.
Lo que nos interesa para que una intervención sea relevante es que el p-valor sea menor a
0,05 cuando el nivel de significación (α) es de 0,05 y el IC95%, porque si estipulamos un
IC90% el p-valor va a ser 0,1. Pero cuando no ponga nada, lo más habitual es el 95%.
Por tanto, esto nos va a confirmar si existen o no diferencia de medias entre los grupos.
En un software estadístico y siguiendo un nivel de confianza del 95% (el más utilizado
habitualmente), la regla de decisión vendrá dada por:
- Si p > 0,05  No existen diferencias significativas entre la medias. No podemos afirmar
que existan diferencias en la media de las variable (y por tanto en la variable) en cada uno
de los grupos.
- Si p ≤ 0,05  Existen diferencias significativas entre las medias. La media y por tanto los
valores de la variable son distintos al menos en un grupo.
El software estadístico: SPSS, Matlab , etc (hay muchos), va a calcular el P-valor (al igual que
la F de Snedecor).
EJEMPLO CONTRASTE DE HIPÓTESIS: Se forman 3 grupos de 6 alumnos y a cada uno se

le aplica un método de enseñanza (VARIABLE INDEPENDIENTE) diferente (presencial, online
o autodidacta). Obteniéndose los siguientes resultados en el examen de estadística (medias)
(VARIABLE DEPENDIENTE):
Nuestro objetivo es conocer si el método de enseñanza influye en los resultados del examen
(es decir, ¿existen diferencias en los resultados del examen para cada uno de los grupos( en
función del método de enseñanza empleado?).
8
Loli Martínez
Lo 1º: Planteamos el contraste de hipótesis:

- Hipótesis nula (H0): no existen diferencia de medias entre los 3 grupos
H0: µ1 = µ2 = µ3
- Hipótesis alternativa (H1): existen diferencias en los resultados entre los grupos o
al menos en 1.
Lo 2º: Comprobamos los supuestos de aplicación y desarrollo de los cálculos: Comprobamos

las condiciones de aplicabilidad:
Para comprobar si sigue o no la normalidad usamos el test de Shapiro-Wilk (porque
tenemos muestras muy pequeñas) y se comprobó la normalidad de las observaciones.
Para comprobar si sigue la independencia tenemos que asegurarnos de que e hayan
obtenido de forma aleatoria para asegurar la homogeneidad dentro de los grupos.
La homocedasticidad con la que vemos la variabilidad. Las observaciones son

independientes. Se ha aplicado la prueba de Levene
Tras ello, vemos que se cumplen los supuestos, por lo que utilizaremos ANOVA (se cumple la
normalidad y la homocedasticidad de la variable cuantitativa ):
Si vemos la variabilidad intragrupo e intergrupo, podemos imaginar como va a ser la F de

Snedecor, en este caso parece que quedará lejana al 1, ya que la variabilidad entre los
grupos parece ser grande, es decir, que existe variabilidad, mientras que dentro de los
grupos es pequeña. Por tanto, la F de Snedecor sale 5,21, esto indica que existe una relación
de la variable dependiente con la variable independiente a simple vista. Esto lo
confirmamos con el p-Valor.
3º: Regla de decisión: el p-Valor es de 0,019 (≤0,05), por lo que esto nos confirma que SÍ
existen diferencias significativas entre las medias de los 3 grupos, por tanto rechazamos la
hipótesis nula de que las medias son iguales, y aceptamos la alternativa.
9
Loli Martínez
Nosotros siempre que hacemos un estudio realizamos una descripción de como son los
sujetos y tenemos la media (M) y la desviación típica (DT). Nosotros sin ver el intervalo de
confianza y el P-Valor, al ver las medias ya nos podemos hacer una idea de que no son
iguales, es decir, nos podemos imaginar con el estadístico descriptivo de como se va a
comportar nuestra variable dependiente (de la que varia), por lo tanto estamos
confirmando lo que a simple vista parece que es verdad, que existen diferencias en el
método de enseñanza en relación a los resultados que se han visto.
4º: Conclusión: Podemos asegurar que existen diferencias en las calificaciones para cada
uno de los grupos con un nivel de confianza del 95%.
4 Análisis de los resultados del ANOVA: Comparaciones post hoc

Sabemos que existen diferencias entre los 3 grupos, pero ahora yo me planteo: ¿Qué grupo
es diferente con respecto a otro? → En nuestro ejemplo: ¿porque el presencial parece que
es muy diferente al autodidacta respecto a las medias; pero el de internet y autodidacta no
son tan diferentes?, entonces, ¿que método cojo? Porque a lo mejor da igual que sea
internet o autodidacta en relación a presencial.
Por esto se plantea: que grupos son diferentes entre ellos (existen diferencias a nivel
general, pero ahora me planteo ver que diferencias hay de un grupo con respecto a otro), a
esto se le llama Comparaciones Post Hoc.
En nuestro ejemplo: `Supongamos que el resultado de contraste anterior ha sido que existen
diferencias significativas entre las medias de la característica en los grupos determinados por la
variable cualitativa. Sabemos que no todas las medias son iguales, pero no sabemos cuales son
diferentes concretamente. Por tanto, nos puede interesar conocer que niveles del factor (grupos) son
los que han influido más para que se dé este resultado en el ANOVA.’
El método más utilizado consiste en realizar todas las comparaciones por parejas. El
contraste que debemos realizar, para cada par de grupos, será:
H0: µi = µj
H1: µi ≠ µj
Existen varios tipos de Post Hoc, pero el que más se utiliza en el SPSS son, dependiendo de si
se cumplen o no una serie de supuestos:
- Tukey o Duncan si tenemos homogeneidad de varianzas, la variabilidad intragrupo tiene
que ser mayor de 0,05 para poder aplicar los dos test. Son dos tipos de Test.
- Games-Howeel y Dunnet cuando los grupos son diferentes, las varianzas son desiguales.
10
Loli Martínez
En la comparación Post Hoc, en la tabla vemos que el p-valor es el general, pero yo quiero
saber a que se debe ese p-valor, es decir, que grupo difiere con respecto a otro. Los dos
asteriscos (**) nos dice que ‘las diferencias significativas se encuentran entre la enseñanza
presencial y la autodidacta’. Es decir que cuando se hace las comparaciones entre los grupos
los que son diferentes realmente son el presencial con respecto a la autodidacta y no el
presencial con respecto internet, ni internet con respecto al autodidacta.
Lo que hace que tengamos mejor o peor resultado es que sea presencial o autodidacta, el
internet no es relevante con respecto a este tipo de métodos (autodidacta o presencial).
Simplemente nos dice cual es el significativo con respecto al otro y excluye a los que no
son significativos.
Podemos concluir (pero esto es ir un pasito más adelante) que la autodidacta vamos
obtener peores resultados que con la presencial porque estamos viendo la media.
RECUERDO: Con Post Hoc vemos que grupos son diferentes de manera específica (que
grupo con que grupo), mientras que ANOVA es de forma global (entre los 3 grupos).
5 ANOVA mediante SPSS

La estadística inferencial es que a partir de nuestra
EJEMPLO: Queremos conocer si el tipo de transporte utilizado (metro, bus, tren, coche,
moto, otros) influye sobre el tiempo que se tarda en llegar de Murcia a Molina
11
Loli Martínez
En este ejemplo vemos: N- tamaño de la muestra; Media de tiempo que se tarda en llegar
de un lugar a otro; la Desviación típica de ese grupo; y el Intervalo de confianza del 95%.
El IC95% de metro se encuentra entre 36,03 y 43,86, el de bus entre 28,50 y 43,85, etc.
Lo 1º es plantearnos el contraste de hipótesis:

Hipótesis nula: H0: µmetro = µbus = µtren = µcoche = µmoto = µotros
Hipótesis alternativa: H1: al menos una media es distinta
Lo 2º es comprobar nuestros supuestos de aplicación y desarrollo de los cálculos:

Comprobamos las condiciones de aplicabilidad, que se cumple:
- La normalidad: se usó Kolmogorov-Smirnov y se comprobó la normalidad de las observaciones.
- La independencia
- Si hay homocedasticidad: se usó la prueba de Levene y se obtuvo que las varianzas eran iguales.
3º. Regla de decisión:

p=0,000 ≤ 0,05 Aceptamos H1. Existen diferencias significativas entre las medias.
Vemos el ANOVA y la F de Snedecor, podemos decir que influye el medio de transporte que
usemos en el tiempo que tardamos en llegar de un sitio a otro, ya que está lejos del 1.
Además nos dice que es bastante significativo (p=0,000)
4º. Conclusión: puesto que en el cuadro de resultados del ANOVA, el valor del estadístico
de prueba: la F de Snedecor = 6,450 (es distinta de 1), y tenemos un P-Valor < 0,05,
podemos afirmar con un 95% de confianza que el tipo de transporte si que influye en el
tiempo que se tarda en llegar de Murcia a Molina.
EN CONCLUSIÓN, NOS TENEMOS QUE QUEDAR CON:

- EN QUE INFLUYE EL ANOVA (de que depende el anova→ de la variabilidad intra- e intergrupo);
- COMO SE INTERPRETA LA F DE SNEDECOR Y EL P-VALOR (nos puede poner una tabla como la
el ejemplo anterior y tenemos que saber que significa cada cosa, nos lo puede preguntar) .
- Y si queremos ir un paso más allá y VER QUE GRUPOS DIFIERE CON CUAL REALIZAMOS LAS
COMPARACIONES POST HOC.
12
Bloque 5. Tema 1 y Tema 2.

Tema 1. Difusión del conocimiento científico.
1. Introducción.
En este tema vamos a conocer cómo identificar artículos de manera correcta y donde
podemos buscarlos ya que hay muchos con baja evidencia y que por consiguiente no
son útiles. También es importante conocer cómo se difunde todo lo que hemos estado
realizando en temas anteriores.
(Donde pongo importante, tanto en este tema como en el siguiente, al lado de los títulos es
porque la profesora ha dicho que tengamos eso muy en cuenta, así que, imagino que caerá en el
examen).
2. Proceso de investigación.
Lo que es un proceso de investigación lo vimos al principio del todo, en el tema 1 del
bloque 1. Pongo aquí de nuevo en que se basa para recordar: La investigación científica
es un proceso dirigido a la adquisición de conocimiento y que usa el método científico.
Esta está constituida por las siguientes fases:
ELABORACIÓN
OBSERVACIÓN PREGUNTA HIPÓTESIS EXPERIMENTO RESULTADOS DE MODELOS
Y TEORIAS
Una vez que ya sabemos lo que es este proceso, lo llevamos a cabo mediante una
planificación del proyecto de investigación (esto lo hemos hecho con el trabajo grupal
que nos ha mandado). Esta parte es muy importante ya que permite a los fisioterapeutas
ir actualizándose día a día a cerca de las técnicas más empleadas; nosotros en la carrea
estamos aprendiendo técnicas que, en un futuro cuando ejerzamos, puede que ya no se
empleen y tengamos que investigar y actualizarnos para que los pacientes vuelvan a
nuestra clínica. Por tanto, es muy importante la parte de investigación.
Posteriormente, se ejecutará, recogeremos nuestros datos y los analizaremos para
poder obtener una conclusión. Una vez que tenemos esos datos, los difundimos al resto
para así poder generar nuevo conocimiento. La gran pregunta aquí es… ¿Cómo
difundimos este conocimiento?
1
3. Difusión del conocimiento.

Para transmitir esta información podemos emplear artículos, revistas, conferencias,
posters, internet, TFG, las noticias…Hoy en día, el principal medio de información son
las redes sociales, nos permiten llegar a una gran cantidad de personas que tienen esta
información al alcance de su mano y son las usadas que los artículos.
La transferencia del conocimiento no es posible si no existe difusión del mismo. El
producto de la actividad científica solamente se realiza cuando el autor comunica su
aportación a toda la comunidad científica. El objetivo es conseguir la mayor propagación
de la investigación debe ser una obligación.
Podemos entender como difusión del conocimiento al proceso de comunicación de
doble vía, en la cual los científicos entregan conocimiento a través de un canal definido,
transmitiendo un contenido adaptado a las necesidades, contexto y nivel de
comprensión del receptor.
(La profesora ha dicho que sobretodo le interesa lo que viene a continuación, que nos
centremos más en lo que se expone a partir de aquí).
La forma en la que nosotros tramitemos la información va a venir determinada en
función del medio que empleemos para ello y del receptor al que queramos enviar la
información. No es lo mismo contarle algo a un niño de 5 años, que a un fisioterapeuta,
por lo que es importante adaptar esta información según quien sea el destinatario. Por
ello, podemos determinar 3 factores importantes que intervienen en esta transmisión:
 La presentación de la información.
 Como la difundamos (el medio de entrega).
 Recepción de la información por la comunidad científica.
3.1. Medios generales de difusión del conocimiento.

 Libros, capítulos y artículos de divulgación Lo malo de estos es que en muchas
ocasiones se produce una desactualización de la información. Es decir, yo hoy me
compro el Kendall por ejemplo y aprendo mucho con él, pero dentro de 20 años,
este ya no se usa y resulta que hay otro nuevo modelo de referencia. Por ello, son
una forma fácil y sencilla de transmitir la información, pero presentan mayor riesgo
de quedar desfasados.
 Exposiciones de cualquier tipo (audiovisuales, objetos, paneles, etc.) tanto físicas
como virtuales, dirigidas a un público no especializado. Ir a dar una charla a un
colegio a cerca de la importancia de la postura corporal, por ejemplo, también es un
medio de difusión de la información.
 Materiales destinados a la divulgación de la ciencia (por ejemplo, cómics, folletos,
infografías (los posters que vemos cuando vamos al médico que tienen fotos en la pared, he
adjuntado una foto de esto en la siguiente página, solo me salían sobre el Covid-19 sorry),
vídeos, videojuegos o aplicaciones de móvil). El vídeo divulgativo, el formato que
está expandiéndose más deprisa y con más éxito, es transmitido a través de canales
2
en plataformas como Vimeo o YouTube, lugares idóneos para llegar a un amplio

público.
Esto es una infografía.
 Ayudar a periodistas en la elaboración de contenidos informativos.

 Participación en programas de radio y televisión.
 Blogs activos y en abierto.
 Redes sociales generalistas: Twitter y Youtube son los canales ideales para divulgar
es un sentido amplio.
 Cursos de difusión: un MOOC, un curso gratuito en línea disponible para cualquier
persona, puede ser un formato muy adecuado para divulgar.
 Actividades interactivas.
 Concursos como FotoCiencia, Fotografía Científica UNED, Certamen Jóvenes
Investigadores
 FameLAB.
 Premios recibidos por algún mérito relacionado con la divulgación: premio UNED
Santander-Divulgación, premios Prismas o premio Europeo de Divulgación Científica
«Estudi General».
 Proyectos de divulgación como FECYT Ayudas para el Fomento de la Cultura
Científica, EU H2020 Science With and For Society (SwafS) o Cuenta la Ciencia
(CSIC).
 Talleres, conferencias, mesas redondas, etc.
Con todo esto, se quiere hacer entender que existen muchas formas diferentes de
transmitir información.
4. Publicaciones científicas.
Son el punto de partida de cualquier investigación, pues aportan el estado del
conocimiento en un tema determinado y son el canal por el que se dará a conocer la
investigación concluida. Facilitan la difusión de nuevo conocimiento que será la base
para futuras investigaciones que harán posible el crecimiento de la ciencia y, en última
instancia, el progreso científico.
3
Por ello, estas publicaciones son generalmente artículos, poster o comunicaciones

orales, y se transmiten únicamente a personas formadas dentro del ámbito de la salud
y en función de la carrera que se haya estudiado serán de un tipo u otro.
Se caracterizan porque estas constituyen el apoyo esencial para la actualización de
conocimientos de los profesionales de los distintos ramos y para el buen desarrollo de
la práctica profesional. Además, el personal investigador ha de efectuar un esfuerzo y
asumir como parte de su tarea la comunicación, tanto a la sociedad en su conjunto,
como a los colectivos sociales específicos interesados en esos temas.
Dentro de estas encontramos:
 Impreso Es cierto que esta ya está más en desuso, últimamente ya los

investigadores se suscriben a revistas electrónicas como pubmed, PEDro… Se suele
recurrir a estos ya que están indexados.
 Electrónico.
 Sitios Web.
 Portales.
 Repositorios.
 Redes Sociales.
5. Canales de transmisión de la información.

Podemos distinguir principalmente los canales informales y los formales.
5.1. Canales informales (importante).

Es lo que en fuentes documentales veíamos como literatura gris: TFG, informes,
recomendaciones, ponencias no publicadas, traducciones no publicadas, contenido en
redes sociales… Son todo aquello que no ha pasado por una revisión del comité de
expertos. Son aquellos en los que nadie nos va a rechazar nuestro estudio.
5.2. Canales formales (importante).

Son aquellos en los que únicamente se expone información si ha pasado por un filtro. Es
decir, al contrario de los informales, estos si tienen que pasar por un comité de expertos
para ser transmitidos. Son lo que conocemos como literatura científica y dentro de ellos
podemos distinguir:
 Libros o capítulos de libros Como ya se ha dicho antes , no todos los libros

tienen que pasar obligatoriamente por un comité de expertos pero sí que tienen
que tener un sustento. Además, estos se van quedando desactualizados por los
motivos que se han comentado en el apartado 3.1.
 Publicaciones seriadas Son las idóneas, lo que constituye las revistas
científicas cuando accedemos a PUBmed u otros.
 Comunicaciones orales  Podrían ser las exposiciones que se hacen en un
congreso frente a un público o bien, mediante un poster expuesto en una sala o
4
por web. En este último, no se transmitiría la información verbalmente, si no que

sería de manera visual.
 Ponencias en congresos científicos Son pequeños resúmenes de
investigaciones que se están llevando a cabo y que no han sido publicadas
todavía en una revista o si se ha publicado y queremos transmitir ese resumen.
De esta forma se transmitiría lo más relevante de la investigación.
5.2.1. Revistas científicas (Importante).
Las más importantes y la principal forma de transmisión va a ser mediante las

publicaciones seriadas ya que, como se ha dicho, constituye las revistas científicas.
Dentro de las revistas van a haber diferentes áreas de conocimiento, por ello, dentro
de estas no tiene por qué haber un orden ya que cada ‘fascículo’ tratará sobre algo.
Sin embargo, sí que siguen un orden en cuanto a volúmenes de publicación (volumen
1, volumen 2…).
A consecuencia de todo esto podemos decir que las revistas científicas son en la
actualidad el canal más importante de comunicación formal de los nuevos
conocimientos. Siendo su objetivo principal la difusión del conocimiento generado
en cada campo o disciplina; existen algunas más generales donde podemos
encontrarnos una revisión sistemática, el efecto del kinesiostape en linfedema…
Cuanto más alta es la calidad de los artículos que en ellas se publican, mayor es su
prestigio y su capacidad de difusión.
Cuando hablamos de revistas científicas tenemos que tener en cuenta que habrá
unas con mayor importancia y otras de menor relevancia, pero todo aquello que esté
publicado en ellas ha tenido que pasar si o si por ese comité de expertos. Por ello,
todo va a ser relevante sólo que nosotros, mirándolo desde el punto de vista crítico,
tendremos que valorar si está bien hecho o no el artículo. La profesora aquí ha querido
transmitir como que dentro de este mundo al final hay muchos enchufes y favores y a veces
dejan pasar y publican artículos que no tienen la calidad suficiente, aunque ellos lo sepan
(eso está muy feo pero bueno).
Dentro de estas revistas hay que distinguir entre las siguientes:
 Científicas → Registran resultado de las investigaciones.

 Científico-técnicas → Registran avances científicos en un área dando énfasis a
la aplicación práctica. Es decir, serían como las científicas, pero con una
aplicación más práctica que las otras. Por ejemplo, una comparación de
intervenciones.
 Divulgación → Ponen el conocimiento científico al alcance del público en
general, usando lenguaje sencillo. Sería la información encontrada en páginas
de internet que han redactado periodistas deportivos, como salud21 u otras.
Hoy en día lo que principalmente se emplea es el formato electrónico, pocas revistan
mantienen el formato en papel. Esto se debe a que nos facilita el intercambio de
5
información, es más económica, permite acceder más rápido a lo que nos interesa… Sin
embargo, también presentan una serie de problemas y es que:
 A veces se desconoce el origen y veracidad de la información.
 Profusión de información dispersa en la red.
 El usuario debe emplear una gran cantidad de tiempo aprendiendo las
particularidades de cada portal.
La edición electrónica debe someterse a controles de calidad rigurosos, similares o más
severos a los de la edición impresa. Es decir, debe pasar también por ese comité de
expertos y superar ese ‘filtro’.
5.3. Redes sociales (Importante).

En la actualidad, uno de los principales medios de comunicación son las revistas
científicas y las redes sociales y, seguramente en un futuro, sean los únicos medios de
información. Estas últimas tienen sus cosas buenas y malas por lo que hay que hacer
filtro y valorar qué es lo que realmente nos interesa.
La divulgación científica ha encontrado en las redes una herramienta sencilla de usar y
con gran poder de difusión. Estas aumentan la difusión de la ciencia y la visibilidad del
trabajo del investigador. Por ello, tenemos que encontrar la manera idónea de transmitir
la información en ella, sintetizando nuestros resultados, exponiendo los puntos clave y
siempre de una forma sencilla y que atraiga la atención.
Las redes sociales tienen una gran ventaja y es que permiten a los investigadores entrar
en contacto con especialistas de todo el mundo, crear grupos de trabajo, atraer
financiación; y, en definitiva, devolver a la sociedad un poco de lo que esta ha invertido,
no solo en términos económicos sino de conocimiento. Es un canal bidireccional, es
decir, yo transmito información, pero también puedo recogerla e intercambiar opinión
con otras personas.
Recomendaciones de carácter general y buenas prácticas
Cuenta lo que haces en tu trabajo o proyecto de investigación de manera que todo
el mundo pueda entenderlo. Siempre debemos tener en cuenta quien es el público
al que nos vamos a referir ya que no es lo mismo que sean fisioterapeutas a que
sean conductores o niños.
Participa en debates de actualidad relacionados con tu especialidad: es una buena
manera de darse a conocer y completar informaciones.
Suscríbete a fuentes de divulgación de tu disciplina y difunde información relevante
aportando tu punto de vista personal.
Las redes son canales bidireccionales. Comenta, interacciona, responde a
comentarios, cita las fuentes.
Incluye imágenes y enlaces.
6
En la actualidad existen diferentes redes sociales (Instagram, twitter, Facebook,

Snapchat, telegram…) y cada vez van a haber más. Por ello, es muy importante adaptarse
a las redes sociales actuales y conocerlas para poder difundir información con ellas.
Tema 2. Lectura crítica.

1. Lectura crítica.
Evaluar críticamente (“critical appraisal”) se define como la capacidad de verificar la
validez (aproximación a la verdad) y utilidad práctica de los resultados de la investigación
publicados, con el fin de incorporarlos al cuidado de los pacientes y mejorar así la calidad
de la asistencia.
Con esto se refiere a que cuando nosotros valoramos críticamente debemos tener
criterio a la hora de mirar un artículo. Debemos fijarnos en la validez interna y externa
(lo veremos más adelante) para ver si el estudio está bien hecho o hay muchas pérdidas,
riesgos de sesgo… Es tan importante la validez como la aplicabilidad clínica ya que
nuestro objetivo es realizar el mejor tipo de tratamiento posible para cada tipo de
paciente y, por tanto, mejorar la calidad del servicio.
Para cada tipo de artículo tenemos una serie de guías de recomendación que nos
pueden ayudar a ver los puntos clave de mi artículo y si estos están presentes o no. Entre
ellas podemos encontrar la guía CONSORT para evaluar la calidad de los ensayos
clínicos, los criterios QUORUM para las revisiones sistemáticas y los criterios AGREE
7
para valorar las guías de práctica clínica. En función del tipo de estudio que realicemos
usaremos una u otra guía de recomendación.
Parte de la guía CONSORT (la vimos en fuentes documentales) No hay que saberlo, lo ha
puesto de ejemplo.
Criterios de la guía AGREE. No hay que saberlo, lo ha puesto de ejemplo.
La lectura crítica se compone de (importante estos 3 puntos que luego se desarrollan):

8
Valoración de la validez interna y externa  Si a nivel metodológico está bien

construido internamente mi estudio, valorando la adecuación y corrección
metodológica. Si es correcto, vamos a poder extrapolarlo al resto de poblaciones.
Importancia (magnitud) de los resultados.
Valoración de la aplicabilidad  Los resultados obtenidos se pueden extrapolar
a mi paciente (“¿Me serán útiles los resultados para atender a mis pacientes?”).
Esto es lo que realmente nos interesa.
2. Fases de la lectura crítica.
2.1. Valoración de la validez interna.
Lo lógico es empezar con esta valoración ya que vamos a ver si nuestro estudio está bien
hecho a nivel metodológico. Es decir, implica analizar si la metodología empleada es la
más adecuada para la consecución del objetivo del estudio y si es correcta. Cada tipo
de estudio tiene una metodología distinta y la mejor evidencia es la que aporta el diseño
más idóneo. Ejemplos:
 Valorar una intervención (curativa o preventiva). Recordemos que para comparar
grupos deben ser homogéneos.  Ensayo clínico aleatorizado será el diseño más
correcto.
 Evolución de una enfermedad  Deberemos hacer un seguimiento mediante un
estudio de cohorte.
 Evaluar una prueba diagnóstica  Estudio transversal comparándola con un GOLD
estándar.
 Identificar la etiología de un problema  Estudio casos-control.
Para que haya validez interna se tienen que dar los siguientes elementos (Importante):
 Clara definición de los objetivos. Si no conozco cual es el objetivo del estudio no voy
a conseguir obtener unos resultados. Ejemplo:
9
 Asignación aleatoria de los grupos para que no aparezca riesgo de sesgo. Ejemplo:
Recordemos que, a nivel de cegamiento, el triple era el mejor de todos. No genera

ningún riesgo de sesgo.
 Seguimiento completo, es decir, que no haya una gran pérdida de pacientes ya que,
si no, no vamos a poder extrapolar. Diagrama de flujo de la guía de recomendación
consort para un ECA (tiene que aparecer si o si):
Importante saber distinguir las pérdidas:
10
 Consideraciones sobre errores y sesgos, así como maneras en las que el estudio
podría haberse mejorado.
 Conclusión acorde con los resultados del análisis, que sea acorde a los objetivos que
hemos planteado desde un principio en el estudio.
2.2. Valoración de la validez externa.
Se basa en la capacidad para poder extrapolar los resultados a otras poblaciones. Es
decir, si yo estoy trabajando con una población diana de pacientes con EPOC, que pueda
aplicar a todos los pacientes con EPOC del mundo las conclusiones que yo obtenga.
Si los resultados del estudio pueden ser generalizados a otras poblaciones de personas,
ambientes, resultados, tiempos y variaciones de tratamiento, entonces se considera que
el estudio tiene buena validez externa.
Algo muy importante es que para que exista validad externa debe haber interna, si no,
es imposible que esta se de.
Existen ciertos factores que pueden amenazar la validez externa, como la forma en que
son seleccionados los sujetos. Si estos no son seleccionados al azar, entonces los
resultados no pueden ser generalizados, ya que los resultados sólo se referirán a
personas de un grupo selecto (estarían sesgados ya que no serían homogéneos).
3. Importancia (magnitud) de los resultados.

 Magnitud del efecto del tratamiento (diferencia de medias o proporciones).
Para explicar esto, la profesora ha puesto el siguiente ejemplo:
11
Dentro del grupo experimental, podemos ver que dentro del grupo si existe diferencia
estadísticamente significativa (<0,05) entre el dolor pre y el dolor post por lo que si nos
valdría la técnica. Sin embargo, dentro del grupo control no existe diferencia
estadísticamente significativa ya que el valor de P= 0,27 (>0,05) y, por ello, no podríamos
aplicar la técnica. Si ahora nos basamos entre ambos grupos, tampoco existe una
diferencia estadísticamente significativa ya que es 0,96, muy superior a 0,05. En
conclusión, podríamos decir que no usamos la prueba ya que no hay diferencias
estadísticamente significativas al comparar control y experimental.
 Precisión de los resultados (considerar el IC 95%).
Lo más importante es saber interpretar los resultados.
4. Valoración de la aplicabilidad (Importante).

Para valorar esto tenemos que tener en cuenta tres factores:
 Reproducibilidad ¿Puedo aplicar esta técnica a mis pacientes? ¿Está tan bien
explicada que yo soy capaz de reproducirla a mis pacientes? Para que sea
reproducible tenemos que tener en cuenta si el tratamiento realmente es efectivo o
no y si es aplicable justo a mi paciente, ya que si puede ser útil para alguien joven
pero no para una persona de 70 años. Es muy importante ser crítico.
 Considerar todas las variables clínicamente relevantes Muy importante la edad
del paciente a la hora de comparar.
 Relación entre beneficios y perjuicios/costes Hay veces en las que ocurren tanto
beneficios como perjuicios, en ese caso, habría que valorar si lo que nosotros vamos
a generar es más beneficioso que perjudicial. Lo mismo ocurre a la hora de comprar
material en función del coste económico que eso conlleva. También hay que tener
en cuenta el posible impacto de los resultados sobre el manejo del paciente y tener
en consideración el entorno y las preferencias de los pacientes.
 Hasta aquí estadística. Mucha suerte en el examen gente 
12

Untitled

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Untitled

Cargado por

Copyright:

Formatos disponibles

ESTADISTICA Y METODOS DE INVESTIGACION EN FISIOTERAPIA.

Bloque 1: Introducción a la Estadística e Investigación en Fisioterapia

TEMA 1. El método estadístico.

TEMA 2. Variables estadísticas, datos y medición

TEMA 3. La investigación científica y el método científico

Bloque 2: Estadística descriptiva

TEMA 1. Descripción de datos univariante: tablas y gráficos

TEMA 2. Síntesis de datos univariante

TEMA 3. La posición en la distribución y el modelo Normal

TEMA 4. Descripción y síntesis de datos bivariante

Bloque 3: Planificación de la Investigación

TEMA 1. Elementos básicos del plan de investigación

TEMA 2. Principios metodológicos de los diseños experimentales

TEMA 3. Diseño de un protocolo de estudio

TEMA 4. Principios metodológicos de los diseños no experimentales

Bloque 4: Estadística inferencial uni y bivariante.

TEMA 1. Elementos de la estadística inferencial

TEMA 2. Estimación de parámetros

TEMA 3. Contraste de hipótesis estadísticas. Planteamiento general

TEMA 4. Contraste de dos medias

TEMA 5. Contraste de dos proporciones

TEMA 6. Análisis de la varianza

Bloque 5: Difusión y evaluación del conocimiento

TEMA 1. Difusión del conocimiento científico

TEMA 2. Lectura crítica

Práctica 1. Descripción y síntesis de datos de una variable.

Práctica 2. Descripción y síntesis de datos de dos variables.

Práctica 3. Pruebas inferenciales: contraste de 2 medias de muestras independientes y

Práctica 4. Pruebas inferenciales: análisis de la varianza y contraste de proporciones

Práctica 5. Gestión de datos e integración.

1. ¿Qué es la investigación científica?

Tenemos la pirámide invertida, en la base está la

La investigación científica no es el único modo de adquirir conocimiento, por ejemplo, el ensayo y

1.1. PLANTEAMIENTO DEL PROBLEMA.

1.4. ANÁLISIS DE LOS RESULTADOS.

Por ello estamos confirmando nuestra hipótesis.

1. La vida no se genera de la nada, no existe la generación espontánea (de la materia inerte no

El método científico tiene que ser:

➢ EMPÍRICO: se debe basar en la experiencia de nuestros resultados y en lo que ya se conoce

➢ CONTROLADO: tenemos que controlar todas las variables.

3. Proceso de investigación científica.

PLANIFICACIÓN EJECUCIÓN DIFUSIÓN

Formas de difusión de conocimiento:

Cristina Torres Pérez

 Nombre  Antecedentes personales  Tipo de dolor y de tope

Cristina Torres Pérez

4º Diagnóstico de fisioterapia: el fisioterapeuta debe establecer cuál es el diagnóstico

Cristina Torres Pérez

3. Datos (Tablas o Matriz de datos).

Importante: Están formados por 3 elementos que son:

Cristina Torres Pérez

Cristina Torres Pérez

Cristina Torres Pérez

6. Escalas de Medición: Propiedades, tipos e importancia.

Cristina Torres Pérez

6.1. Propiedades de medición.

Cero absoluto→ El valor de 0 representa ausencia de lo medido. Es decir, que no

6.1.1. Escala de razón. (Categóricas)

Cristina Torres Pérez

6.1.2. Escala de Intervalo (distancia entre valores). (Categóricas)

6.1.3. Escala Ordinal. (Cuantitativa)

Cristina Torres Pérez

corresponder con el mismo nivel de dolor 4 y 3 que el de mi hermano. Una persona

6.1.4. Escala nominal. (Cuantitativa)