Está en la página 1de 300

Metodología de la Investigación

Científica

Sesión 2 Semana 2:

Introducción, justificación, marco teórico, objetivos


e hipótesis. Formato de artículo científico.
Identificación del problema de investigación.
Evaluación de la factibilidad.
Profesores:
Danitsa Alarcón, Ana María Castañeda, Ingrid Cirilo Acero, Johanna Kohler,
Carlos Carbajal, Edwin Salas, Gustavo Calderón, Jhonatan Navarro, Carlos
Portocarrero

2021-2
Facultad de Psicología

Metodología de la Investigación Científica

Sesión 2 - Semana 2

2021 -2
En UPC
Introducción

ARTÍCULO CIENTÍFICO
Proyecto de investigación
Método (diseño, participantes,
medidas y procedimientos)
Introducción

FORMATO
Resultados
Método (Diseño, participantes,
medidas, procedimientos) Discusión

Referencias Referencias

Anexos o apéndices
Anexos o apéndices
Introducción
En la introducción se expone con claridad
la naturaleza y el alcance del problema a
investigar.

Incluye antecedentes pertinentes


(investigaciones previas)y base teórica
que permitan comprender lo que se
desea investigar.

Implica argumentos racionales y


objetivos.

Ocaña, Arias, Hernández, (2019)


Planteamiento del problema

Justificación

Está compuesto por


Objetivos

Hipótesis
Justificación
Justificación

Exponer las razones por las cuales se


llevará a cabo el estudio.
• Por qué es conveniente hacer la investigación?

¿Cuáles serán los beneficios?

• Explicar el valor de la investigación


Criterios para evaluar el valor potencial de una
investigación
Relevancia social

Implicancias prácticas

Valor teórico

Utilidad metodológica
Marco teórico
Marco teórico
Se utiliza para sustentar teóricamente el estudio

Es un compendio escrito de artículos, libros y otros


documentos que describen el estado pasado y
actual del conocimiento sobre el problema de
estudio

Proporciona una visión de dónde se sitúa el


planteamiento propuesto dentro del campo de
conocimiento

Revisión de la literatura
Funciones del marco teórico
Orientar el estudio

Prevenir errores

Ampliar el horizonte

Establecer la necesidad de la investigación

Inspirar nuevos estudios

Ayudar a formular hipótesis

Proveer de un marco de referencia


Etapas de construcción del marco teórico

1. Grado del desarrollo del conocimiento


Teoría desarrollada

Varias teorías desarrolladas

Generalizaciones empíricas

Descubrimientos parciales

Guías no investigadas e ideas vagas


Etapas de construcción del Marco Teórico

2. Organización

Índice de tema

Mapeo de
temas y
autores
El marco teórico debe tener dirección y progresión:

Dirección:

• Para elegir fuentes primarias apropiadas.

Progresión:

• Esto implica demostrar cómo otros


investigadores han utilizado el conocimiento
disponible para refinar sus problemas de
investigación y cómo sus preguntas, hipótesis y
resultados han evolucionado este conocimiento
Fuentes de información

Primarias

Secundarias

Terciarias
https://upcvirtual.adobeconnect.com/tci-fuentes-de-informacion-u1/
Objetivos
Objetivos de la Investigación
Los objetivos de la investigación se refieren a los
aspectos que se desea estudiar (qué pretende la
investigación?) o a los resultados intermedios que
se espera obtener para dar respuesta final al
problema.

• Objetivo General
• Objetivo(s) específico(s)

La definición de los objetivos se hace en relación


con el problema y tomando en cuenta la finalidad
o propósito de la investigación
Objetivos de la Investigación
Deben estar dirigidos a los elementos básicos del
problema: Objetivo General

Deben ser medibles, claros y precisos.

Deben ser expresados en verbos en infinitivo:

• El uso de los verbos que indican acción y que permiten su verificación es


básico en la redacción de los objetivos.
• Algunos de los más utilizados son identificar, determinar, establecer,
describir, distinguir, medir, entre otros.
Objetivos: Utilidad

Sirven de guía para el estudio

Utilidad Determinan los límites y la amplitud del


estudio

Orientan sobre los resultados eventuales que


se espera obtener

Permiten determinar las etapas del proceso


del estudio a realizar.
Hipótesis
Son proposiciones tentativas explicativas que
Hipótesis refiere la relación entre dos o más variables

Estas proposiciones son coherentes con el


problema o marco teórico y demostrables con el
método de investigación

Están redactadas en afirmativo.

Daniel (2018)
Pueden ser:

Hipótesis Descriptivas

Hipótesis Correlacionales

Hipótesis de la Diferencia entre Grupos

Hipótesis que establecen Relaciones de Causalidad


Problema
La investigación comienza cuando tenemos un problema.

Es afinar nuestro tema de investigación.

Es una pregunta para la que no tenemos una respuesta


inmediata.

La pregunta está inscrita dentro de un marco de conocimientos


Elementos del Planteamiento del Problema de
Investigación
Pregunta de
Investigación
• Puede expresarse en
una o más preguntas
concretas

Justificación de Objetivos de la
la Investigación Investigación
• ¿Por qué y/o para
• ¿Qué pretende la
qué se hace el
investigación?
estudio?
Criterios para la formulación del Problema

El problema ha de expresar una relación entre dos o


más variables psicológicas (medibles y cuantificables)
• Excepciones a este criterio se dan principalmente en la investigación
taxonómica o metodológica.

El problema debe formularse claramente y sin


ambigüedad
• En forma de pregunta (Kerlinger, 2002).

Se exige que el problema y su formulación sean tales


que permitan verificación empírica.
• El problema cuyas relaciones son indemostrables no tienen carácter
científico.
• Es decir, se expresa una relación real y las variables de la relación pueden
medirse de algún modo.
Criterios para la formulación del Problema

Se debe indicar en quienes se comprobarán


la relación entre las variables

• Es decir, el tipo de muestra que se va a utilizar.

Se debe expresar en una dimensión


espacial.

• Para especificar el problema, debe indicarse el lugar, institución de


salud, región o colegio donde se va a efectuar el estudio
• Algunos problemas también deben expresar una dimensión
temporal (e. g. el año de realización de la investigación).
Pregunta de Investigación: Errores

Los problemas no son


cuestiones morales

Errores Puntos metodológicos como sub


– problemas

Generalidad y especificidad
Errores
 No se entiende cuál es el problema
 Muy amplio, no está delimitado
 Demasiado específico, que puede resultar intrascendente o poco
atractivo
 No se puede medir
 Ya está resuelto
 El que lo propone no tiene los recursos (conocimientos, técnicas,
posibilidad de financiamiento) para investigarlo
 Planteamiento subjetivo, filosófico, “chamullero”
Revisar y discutir
• “ La perversión del abusador”
• “ Porqué los adolescentes son abusivos”
• “ Los niños hospitalizados y sus padres”
• “ Cómo las personas se comportan ante sus superiores”
• “ Porqué una empresa no tiene un buen rendimiento laboral?”
• “Efecto del Maltrato en la Autoestima de los niños”
Factibilidad
• ¿Es adecuado el número de sujetos?
• ¿Tenemos la experticia técnica para realizarlo?
• ¿Se puede abordar con los recursos disponibles?
• El objetivo es concreto
Referencias
• Ato, M. & Vallejo, G. (2015). Diseños de investigación en psicología.
Madrid: Pirámide.
• Daniel, C. (2018). Metodología de la investigación estadística aplicada
e instrumentos en Neuropsicología: guía practica en
investigación. Córdoba: Encuentro grupo editor.
• Ocaña, Y.; Arias, D.; Hernández, R. (2019). Publicar en revistas
científicas. Lima: USIL Fondo Editorial.
• Salgado, C. (2018). Manual de investigación. Teoría y practica para
hacer la tesis según la metodología cuantitativa. Lima:
Universidad Marcelino Champagnat
Metodología de la Investigación
Científica

Sesión 1 Semana 3:

Población y muestra. Muestreo y tipos


de muestreo. Fórmulas y GPOWER
Profesores:
Danitsa Alarcón, Ana María Castañeda, Ingrid
Cirilo Acero, Johanna Kohler, Carlos Carbajal,
Edwin Salas, Gustavo Calderón, Jhonatan
Navarro, Carlos Portocarrero
2021-2
Facultad de Ciencias de la Salud

Metodología de la Investigación
Científica

Sesión 1 - Semana 3

2021-2
El estudiante comprende los conceptos tipos de
muestreo, confianza, poder y errores
LOGRO estadísticos.
El estudiante es capaz de calcular el tamaño
muestral según el objetivo de estudio.
Selección de Muestra

 Determinar el
universo y la
población

 Extraer la muestra
¿Por qué no investigar toda población?

 A veces no interesa
trabajar con todo el grupo
o no es posible medir a la
población completa.

 Se espera que sub-grupo


represente lo que sucede
en el grupo completo.
Muestra: Ventajas
Facultad de Ciencias de la Salud

• Menor tiempo de estudio

• Menos gastos

• Profundizar en las variables

• Mayor control de las variables


Determinación de la
población y selección de una
muestra
Primero

 Definir la unidad de análisis, es decir,


quiénes van a ser medidos:
 Persona: pre infantes, niños, adolescentes,
jóvenes, adultos, adultos mayores, padres, etc.
 Organización
 Periódico, revista, artículo
 Para ello es necesario precisar el problema
y objetivos de investigación.
Segundo
 Delimitar una población
que va a ser estudiada y
sobre la cual se pretende
generalizar los resultados.
 Se necesita además
identificar las
características de esta
población.
Tercero

 Seleccionar la muestra:
subconjunto representativo
de la población completa.
 Una muestra representativa
de la población, permite
generalizar los resultados.
Características de población

 Las características que necesitamos


especificar de la población son:
contenido, lugar y tiempo.
 En el trabajo de investigación deben
anotarse estas especificaciones.
Permitirá que otro investigador replique el
estudio con una muestra similar.
Ejemplo 1
 Población objetivo: Estudiantes de la facultad X de una
universidad Y.
 Unidad de análisis: Personas (estudiantes
universitarios).
 Unidad muestral: Personas (estudiantes universitarios).
 Marco muestral: lista de todos los estudiantes de la
facultad X de una universidad Y, tomada de la oficina de
matrícula.
 Muestra: 235 estudiantes de la facultad X de una
universidad Y.
Ejemplo 2
 Población objetivo: Estudiantes de cuarto grado de
primaria de I.E. privadas en Lima Metropolitana.
 Unidad de análisis: Personas (escolares).
 Unidad muestral: Instituciones educativas.
 Marco muestral: lista de todas las instituciones
educativas primarias en Lima metropolitana de gestión
privada; tomada de la página web del Ministerio de
Educación del Perú.
 Muestra: 138 instituciones educativas primarias de
gestión privada ubicadas en Lima Metropolitana. Estas
IE agrupan a 4814 estudiantes.
TIPOS DE MUESTREO

No
probabilístico Muestreo Probabilístico
La elección entre el muestreo
probabilístico y no
proabilístico depende de:

- Planteamiento del problema


- Las hipótesis
- El diseño de investigación
- El alcance de las
contribuciones del estudio.
Muestreo Probabilístico

 Todos los elementos de la población tienen la


misma probabilidad de ser escogidos.
 Se obtiene:
- Definiendo las características de la población.
- Definiendo el tamaño de muestra.
- A través de una selección aleatoria => Tipos
 Para calcular el tamaño de muestra se recomienda
utilizar el programa STATS.
Calculando el tamaño de muestra …
Ejemplo:

Queremos describir y analizar la motivación intrínseca


que tienen los estudiantes de psicología de la UPC.

- Tamaño de la población: N=600 estudiantes.


- Error máximo aceptable: 5%
- Nivel de confianza: 95%
- Porcentaje estimado de la muestra: 50% (probabilidad
de ocurrencia del fenómeno)

Haciendo los cálculos, el programa STATS arroja que el


tamaño requerido para que la muestra sea representativa
es 234 estudiantes.
Tipos de Muestreo Probabilístico

- Aleatorio simple
- Aleatorio sistemático
- Aleatorio estratificado
- Aleatorio por racimos o conglomerados.
Aleatorio simple
Elaboramos un listado de todas las unidades
que conforman el universo, asignando a cada
una de ellas un número.

STATS

Sorteamos tantos números como participantes


sean necesarios para completar el tamaño de
muestra requerido.
Aleatorio simple Una investigadora
busca conocer en la
Facultad de letras y
Tamaño de muestra por ciencias humanas
STATS para un N=1000, quienes son los
le da 278 estudiantes. estudiantes con mayores
actitudes hacia el
liderazgo.
Obtiene la base de datos
de los alumnos de la Fac.
Numera la base del
1 al 1000

Selecciona a los 278 estudiantes


Es María Bolívar, quien mediante los números aleatorios
va a ser el primer caso que generados por STATS.
entra a la muestra … El primer número arrojado es el 706,
ve en su base a quien corresponde.
Aleatorio sistemático

 Exige también numerar todos los elementos


de la población.
 Se elige dentro de la población “N” un
número “n” de elementos (muestra) a partir
de un intervalo “k”, el cual es un intervalo de
selección sistemática.

k = N/n
Aleatorio sistemático

Filmación de servicios N = 1548

Estudio sobre la
Determinan un n = 308 unidades,
calidad de la
por lo que k = 1548/308 = 5 aprox.
atención en los
servicios médicos
y de enfermería de El inicio de la elección de las
un hospital. unidades deber ser al azar, por
ejemplo se tiran unos 3 dados y
si en sus caras muestran 2, 5, 9,
se iniciará en el servicio Nº 259.

La 2 da. unidad estaría dada por


259 + k = 259 + 5 = Nº 264…asi
sucesivamente … Nº 269, Nº 274…
hasta completar el caso o unidad
308. Si es necesario se vuelve a
Dra. Stats empezar por los primeros.
Aleatorio estratificado
 La población se divide en segmentos o estratos, y se
selecciona una muestra para cada segmento.

 Se usa, cuando no basta que cada uno de los elementos


tengan la misma probabilidad de ser escogidos, sino que
además es necesario segmentar la muestra en relación
con estratos o categorías presentes en la población, por
su relevancia para los objetivos de estudio.

 Cada estrato funciona independientemente pudiendo


aplicarse dentro de ellos el muestreo aleatorio simple,
para elegir a los elementos que conformarán la muestra.
Aleatorio estratificado
 Estratos según la variable nivel de estudios: preescolar,
primaria, secundaria, técnico, universitario, posgrado.

 Por ejemplo
Se requiere dividir a la población en estratos de nivel primario y
secundario => n = 100 participantes.
La población se distribuye así: 60% con estudios primarios y un
40% con nivel secundario.
Entonces la muestra estratificada de 100 participantes tendrá
que estar conformada por 60 participantes con nivel primario y
40 con nivel secundario.
Donde las unidades muestrales para cada estrato se obtendrán
aleatoriamente de cada nivel de estudios.

 Su desventaja, es necesario conocer la distribución en la


población, de las variables que se utilizarán para la
estratificación.
Aleatorio por racimos o conglomerados o
cluster
 Racimo: un grupo de cosas de la misma clase, conjunto
de elementos muestrales unidos por alguna(s)
característica(s) en común (Kerlinger y Lee, 2002).

 La población es fraccionada en racimos, y después


estos son muestreados aleatoriamente.

 La unidad muestral es el racimo, por medio del cual se


accede a la unidad de análisis.
Unidad de análisis Posibles racimos
Adolescentes Academias
preuniversitarias
Niños Colegios
Aleatorio por racimos o conglomerados

En una muestra Rendimiento


nacional de escolares académico y
Autoestima.

Elegimos aleatoriamente una


muestra de departamentos/provinc.

D1 D2 D3 D4 …….

c c c c c c c c c c c c
1 2 3

…….
Muestreo No Probabilístico

 Conocido también como “muestreo guiado”

 La elección de los participantes no depende de la


probabilidad, sino de las propias características de
la investigación.

 El procedimiento no es mecánico ni se basa en


fórmulas de probabilidad, sino que la muestra
seleccionada obedece a otros criterios de
investigación.
Muestreo No Probabilístico

 Se seleccionan participantes o casos “típicos” sin


intentar que sean representativos de una población
determinada.

 Desventaja: Al ser una muestra no probabilística,


no es posible calcular con precisión el error
estándar, es decir, no se puede calcular con qué
nivel de confianza se hace una estimación
No se puede generalizar
Tipos de Muestreo No Probabilístico

- Por cuotas
- Por conveniencia
- Bola de nieve
- Participantes voluntarios
- Casos-tipo
Por cuotas

 Las cuotas se refieren a un número determinado de


participantes que cumplen ciertas características.

 El investigador se dirige a un lugar determinado y


aplica encuestas o cuestionarios a cualquier
persona que cumpla con dichas características.

 Se necesita un buen conocimiento de los estratos


de la población y de los individuos más adecuados
para los fines de la investigación.
Por cuotas

 Por ejemplo, en un estudio sobre


la actitud de las personas hacia
las elecciones presidenciales, se
necesita encuestar a 200
personas.

 Dichas personas deben estar en


edad de votar, es decir, ser
mayores de 18 años y, además,
el 50% deben ser mujeres y el
50% hombres.
Por conveniencia
(Hernández, Fernández y Baptista, 2014)

 Conocido también como “muestreo causal o


incidental” (Vieytes, 2004).

 Utiliza como muestra a aquellas personas a las que


se tiene fácil acceso.

 Por ejemplo, un investigador quería investigar sobre


el ambiente laboral en diversas empresas, pero tuvo
muchas dificultades para acceder a estas.
Entonces, decidió entrevistar a compañeros de su
propio centro laboral.
Bola de nieve

 Se localizan a ciertos participantes claves para la


investigación.

 Luego de entrevistados, se les pregunta si conocen


a otras personas que puedan participar y que
cumplan con las mismas características, así
sucesivamente hasta conseguir una muestra
suficiente.

 Recomendable para estudios con poblaciones


marginales o de difícil acceso.
Participantes voluntarios

 También se le puede
llamar “autoseleccionada”.

 Las personas acceden


voluntariamente a
participar de una
investigación. Puede ser
que ellos mismos se
propongan como Por ejemplo:
participantes o que Personas que voluntariamente
respondan activamente a acceden a participar de un
una invitación. experimento donde se quiere
observar cuáles son los efectos del
alcohol en la memoria a corto plazo.
Casos - tipo

 Se utiliza en estudios cuantitativos exploratorios y


en investigaciones cualitativas.

 El objetivo es la riqueza, profundidad y calidad de la


información, no la cantidad ni la estandarización.

 Los participantes deben poseer ciertas


características sociales y demográficas de un
determinado grupo social.
Casos - tipo
Es frecuente el uso de casos-tipo en estudios fenomenológicos,
cuyo objetivo es analizar los valores, ritos y significados de un
grupo social.

Por ejemplo
Pensemos en los trabajos
de Beckler que se basan en
grupos de típicos músicos
de jazz y característicos
estudiantes de medicina.
Donde busca profundizar
en el análisis de los
patrones de identificación
y socialización de estas
dos profesiones.
Tamaño de la Muestra

 Estimar un Parámetro y Contrastar


una hipótesis
Tamaño de la muestra

 Hay muchas recetas de cocina, que deben


evitarse, pues usualmente no tienen una
base estadística sólida.

 Si bien hay múltiples fórmulas para su


cálculo, vamos a tratar dos perspectivas:
Orientada a estimar un parámetro.
Orientadas por el tipo de técnica estadística
usada para contrastar una hipótesis.
Tamaño de la muestra para estimar
un parámetro
 Depende de la varianza de la
característica en la población, el nivel de
confianza y el margen de error.

 Las fórmulas para estimar el tamaño de la


muestra dependen del método de
muestreo y pueden ser consultadas en
textos especializados como el de Levy y
Lemeshaw (2008) o el de Lohr (2010).
Estimación del Parámetro

 Población: Infinita y finita


Componentes del tamaño de la muestra:

Grado de variabilidad de los


datos (Varianza)

Nivel de confianza (Z)

Margen de error establecido

Tamaño poblacional
Error de muestreo

Es la diferencia que puede haber entre el


valor poblacional (parámetro) y la
estimación de la misma (estimación
puntual o estadígrafo), obtenida por medio
de una muestra aleatoria, observada en
una de las tantas muestras posibles de
una población dada. La totalidad de estos
errores, genera la distribución de muestreo
empleada para estimar el valor poblacional

• +-E = x (media muestral) – m (media poblacional)


Error de muestreo

El error es determinado por el investigador

Se requiere conocimiento previo sobre le


comportamiento de la característica en la
población que se estudia.

Es más práctico determinar el error como


porcentaje, en la mayoría no mayor del 10%

El porcentaje podría considerarse en algunos


casos como un complemento del nivel de
confianza: para una confianza de 95% un
error de 5%
Varianza

Grado de variabilidad que presentan


las unidades de la población.

Mientras más grande sea la varianza


mayor será el tamaño de la muestra

El valor de la varianza debe ser


conocido de lo contrario se debe
estimar a través de estudios
preliminares
Varianza

En el caso de proporciones (s2p =


PQ) también debe ser estimado

También se asume P = 0.50, con lo


cual se obtiene el máximo valor
posible de n
Intervalo de confianza
Corresponde a un intervalo de valores, dentro de
los cuales se espera que esté el parámetro con
cierta grado de confianza o con riesgo de error
conocido

El grado de confianza es determinado por el


investigador.

Los valores que se trabajan por lo general son:

• Z = 2.58 (99%)
• Z = 1.96 (95%)
• Z = 1.64 (90%)
Cálculo de n en poblaciones infinitas
 n = Tamaño de la muestra

 Z = Nivel de confianza
2
Z PQ
n=  s2= Varianza de la
población

E 2
 s2 = PQ

 P = 0.5, se obtiene el
máximo valor posible de n
Cálculo de n en poblaciones infinitas

 Un auditor desea tener un nivel de


confianza del 95%, para que la verdadera
proporción de error no exceda del 2%. Si
la población es muy grande, ¿qué tamaño
tendrá la muestra que va a tomar, si el
auditor estima que la proporción de error
es de 5%?
1.962(0.05) (0.95)
n= = 456.19
0.022
Cálculo de n en poblaciones finitas
 n = Tamaño de la muestra

 N = Tamaño de la
población
2
Z NPQ
n =(N -1)E2 + Z2PQ  Z = Nivel de confianza

 s2 = Varianza de la
población

 s2 = PQ

 P = 0.5, se obtiene el
máximo valor posible de n
Cálculo de n en poblaciones finitas
 El departamento de tránsito y transporte requiere
estimar la proporción de conductores con experiencia de
un año o menos, que puedan clasificarse como
conductores descuidados. ¿De qué tamaño deberá ser
la muestra a fin de que los resultados estén dentro de un
2%, con una confianza del 95% y con una población de
10000 conductores? Se espera observar que
aproximadamente ¼ del total de conductores sean
descuidados

1.962(10 000)(0.25)(0.75)
2 2
= 1 526
n = (10 000 - 1)(0.02 )+ 1.96 (0.25)(0.75)
Tamaño de la muestra para contrastar una
hipótesis
 Se debe considerar el tipo de prueba estadística
a aplicar, el nivel de significancia, la potencia y
tamaño del efecto.
Potencia: probabilidad de detectar una diferencia de
parámetros. Es decir, rechazar una H0 verdadera.
Tamaño del efecto: medida de la diferencia de
parámetros o fuerza de la asociación.

 Los cálculos son complejos, pero se pueden


hacer con programas informáticos como el
G*Power (Buchner, Erdfelder, Faul, y Lang,
2014).
Cohen, 1992; Ferguson, 2009
G*Power, características
 La versión 3.1.9.4 de G*Power está
disponible tanto para Windows y Mac.

 Permite cinco tipos de cálculos de


potencia, destacando el análisis de
potencia a priori:
Calcula el tamaño N de una muestra, sobre la
base de un nivel de potencia requerido (1 - ),
el nivel de significancia, y el tamaño d efecto
poblacional que se espera detectar con una
probabilidad 1 - .
(Faul, Erdfelder, Lang y Buchner, 2007)
G*Power, características

 Usar G*Power implica por lo general


cuatro pasos:
1. Seleccionar la prueba estadística adecuada
para el problema de investigación
2. Seleccionar uno de los cinco tipo de análisis
de potencia disponibles.
3. Ingresar los parámetros requeridos para el
análisis.
4. Hacer clic en “Calculate” para obtener los
resultados.

(Faul, Erdfelder, Lang y Buchner, 2007)


(Faul, Erdfelder, Lang y Buchner, 2007)
G*Power, ejemplo
Redacción

Para el cálculo del tamaño de la muestra, se


hizo un análisis a priori de potencia a través del
programa G*Power (Faul, Erdfelder, Buchner, y
Lang, 2009). Se pondrá a prueba una hipótesis
XXX (e.g. correlacional bivariada) (# cola), con
una significancia estadística de .05 y una
potencia estadística de .95. Asimismo, a partir
de otros estudios como referencia XXX, XXX,
se espera en el presente encontrar una
correlación de XXX. De este modo, el análisis
sugiere una muestra de # participantes.
REFERENCIAS

Faul, F. Et al (2007) Tutorials in Quantitative Methods for Psychology: a short


tutorial of GPower, 2da edición, pp. 51-59. ISSN: 1913-4126 Disponible en:
http://www.gpower.hhu.de/fileadmin/redaktion/Fakultaeten/Mathematisch-
Naturwissenschaftliche_Fakultaet/Psychologie/AAP/gpower/GPowerShortTut
orial.pdf.

Hernández, Fernández & Baptista (2014). Metodología de la investigación. 6ta ed.,


México. Disponible en: https://www.uca.ac.cr/wp-
content/uploads/2017/10/Investigacion.pdf.

Morales, P. (2012) Estadística aplicada a las Ciencias Sociales Tamaño necesario


de la muestra: ¿Cuántos sujetos necesitamos? Universidad Pontificia
Comillas • Madrid • Facultad de Humanidades Disponible en
http://www.upcomillas.es/personal/peter/investigacion/Tama%F1oMuestra.p
df
LINKS TUTORIALES

Cálculo de muestra para una correlación bivariada:


https://www.youtube.com/watch?v=vYjWkdQZCp0

Cálculo de muestra para comparación de dos muestras dependientes e


independientes:
https://www.youtube.com/watch?v=nVBwhJ9gonQ
Metodología de la Investigación
Científica

Sesión 2 Semana 3:

Plagio. Redacción científica en


Psicología. Estilo APA.
Profesores:
Danitsa Alarcón, Ana María Castañeda, Ingrid
Cirilo Acero, Johanna Kohler, Carlos Carbajal,
Edwin Salas, Gustavo Calderón, Jhonatan
Navarro, Carlos Portocarrero
2021-2
Facultad de Ciencias de la Salud

Metodología de la Investigación
Científica

Sesión 2 - Semana 3

2021-2
El estudiante redacta sin plagio.
El estudiante respeta los criterios de autoría al
LOGROS producir documentos científicos.
El estudiante redacta empleando el estilo APA.
Consideraciones para
escribir un texto científico

 Saber el mensaje a comunicar.


 Estructurar las ideas que se desean
comunicar.
 Identificar los conocimientos requeridos
(fuentes).
 Citar.
Las “reglas” de la escritura científica1
 1. Escribe para comunicar, no para
impresionar.
 2. Sigue las indicaciones.
 3. Utiliza buenos modelos.
 4. Recolecta información suficiente.
 5. Organiza la información.
 6. Tómate el tiempo necesario para
escribir.
 7. Piensa en tu público.
 8. Escribe para que te entiendan.
 9. Da crédito a tus fuentes y
colaboradores.
 10. Haz revisiones.

1. Gastel, Barbara. Scientific writing: 10 basics. Presentación de PPT. 20 Jan 2012.


www.authoraid.info/resource-library/scientific-writing-10-basics
Conceptos claves para la escritura
general1
• Claridad:
– Evitar jergas
– Siglas y definir lo no conocido.
• Brevedad:
– Usar palabras eficientemente
– Como acortar
• Sencillez
– Tener cuidado con los excesivos detalles
• Lenguaje – Elección de palabras
• Voz activa

1. Kelley, Nicole. Sentence structure of technical writing. Presentación de PPT. Fall 2006.
web.mit.edu/me-ugoffice/communication/technical-writing.pdf
Qué se debe citar (1)
 Fuentes verificables
 Hallazgos de una investigación
 Conceptos
 Metodología que sirvió para el estudio
 Discusión relevante
 Recomendaciones
 Comunicaciones personales (si no hay
otra opción, pero mejor evitarlas)
Qué se debe citar (2)
 Fuentes verificables (Scholar Google)
 Artículos > Libros > Resúmenes de
congreso
 Originales > Revisiones
 Recomendable: 50% de las referencias
debe ser de los últimos 5 años
 Considerar referencias nacionales
Cuándo no se debe citar
 Cuando no he leído el artículo
 Una revisión cuando se refiere al
resultado de una investigación específica
 Es buena la auto-citación pero sin
excesos
 Si solo he leído el resumen
Chesley L. History and epidemiology of preeclampsia-
eclampsia. Obstet Gynecol Clin North Am 1994; 4:
1025-48 [abstract].
Por las citas puedo evidenciar plagio
Fraude científico

 Fabricación de datos (inventados).


 Falsificación de datos (manipulados).
 Plagio.
Apropiación de las ideas, procesos o resultados,
presentados en una publicación –o trabajo- sin dar
crédito al autor de la misma
¿Qué es plagio?

• “Entendemos como plagio la apropiación,


presentación y utilización de material intelectual
ajeno, sin el debido reconocimiento de su fuente
original. Constituye, por lo tanto, un acto fraudulento,
en el cual existe presunción de intencionalidad, en
el sentido de hacer aparecer un determinado
conocimiento, labor o trabajo, como producto propio; y
de desconocer la participación de otros en su
generación, aplicación o en su perfeccionamiento”

Comisión de Ética, Facultad de Medicina, Universidad de Chile. En referencia


al plagio intelectual. Rev Med Chile.2008;136:653-8.
 Si es que NO existe intencionalidad, no
significa que la falta no existe.
 Si existe intencionalidad, la falta se
agrava.
Plagio de ideas

La apropiación de ideas (ej. Explicaciones,


teorías, conclusiones, hipótesis o
metáforas) en forma completa o parcial, o
con modificaciones superficiales sin dar
los créditos a quienes la originaron.

Roig M. Avoiding plagiarism, self-plagiarism, and other questionable writing


practices: A guide to ethical writing. Saint Johns University; 2006.
Plagio de ideas: cómo evitarlo

 Citando la fuente.
 Comunicación personal.
 Agradecimientos.

 Siempre se deben reconocer los aportes.

Roig M. Avoiding plagiarism, self-plagiarism, and other questionable writing


practices: A guide to ethical writing. Saint Johns University; 2006.
Plagio de texto

• “Copiar una parte del texto de otra fuente sin darle el


crédito a su autor y sin poner el texto
entrecomillado”.
• “Copia de una parte de un texto de una o más
fuentes, insertando y/o suprimiendo una o más
palabras, o sustituyendo algunas palabras por
sinónimos, pero nunca da el crédito al autor, ni
entrecomilla lo literal”
• Todo fraseo literal debe ir entrecomillado y
referenciado (pero NO es usual en ciencias).
Roig M. Avoiding plagiarism, self-plagiarism, and other questionable writing
practices: A guide to ethical writing. Saint Johns University; 2006.
Sospecha de plagio
• Párrafos
– No coherencia entre sí.
– Diferentes personas (primera, tercera, plural, singular).
– Diferentes estilos de la redacción.
• Palabras
– No usadas en nuestro medio.
• Citas
– Referencias no citadas, citas no referenciadas.
– Diferentes estilos de citación.
– Citas muy antiguas o de idiomas no tradicionales.
– Cita de citas
Y en trabajos universitarios?
• Evaluaron las introducciones de 24 trabajos de investigación
realizados en un curso universitario el 2004 de una facultad
de medicina.
• 23/24 tenían evidencia de plagio, 8 tenían plagio literal.
• De 44 fuentes de donde se realizó el plagio, 31 de ellas
fueron no especializadas (rincondelvago, monografias.com,
etc)

Huamani C, Dulanto-Pizzorni A, Rojas-Revoredo V. Copiar y pegar en investigaciones en el pregrado:


haciendo mal uso de Internet. An Fac Med (Lima). 2008; 69(2): 117-19.
¿Y en las tesis?
• Se evaluaron 33 tesis de medicina sustentadas el 2008 para buscar
plagio en las introducciones.
• Se evidenció plagio en 27/33 tesis y en 37,3% (171/479) de
párrafos evaluados.
• Se encontró plagio literal en 20/27.

Saldaña-Gastulo JJC, Quezada-Osoria CC, Peña-Oscuvilca A, Mayta-Tristán P. Alta frecuencia de plagio


en tesis de medicina de una universidad pública peruana. Rev Peru Med Exp Salud Publica. 2010; 27(1):
63-67.
Caso PUCP

 Por qué el plagio es condenable y sancionado.


Equivale a negarse a pensar
Retraso el progreso del conocimiento
Negamos la razón de ser de la universidad
Comportamiento contrario a la ética

Pontificia Universidad Católica del Peru. Por qué y cómo debemos combatir el plagio.
http://www.pucp.edu.pe/plagio.pdf
CASO PUCP. Abril 2010
• Dos estudiantes son sancionados por cometer plagio (en forma
reiterada).
• Caso se eleva al CODACUN de la Asamblea Nacional de Rectores
• El CODACUN resuelve a favor de los estudiantes, tomando como
fuente a Wikipedia:
– “los estudiantes se comportan de manera natural al imitar y copiar en
exceso o sin indicar las fuentes”
– “la enseñanza consiste fundamentalmente en la repetición constante de
ideas y formulaciones ajenas, omitiéndose muchas veces, por economía,
las fuentes”.
Caso ESAN
• Un grupo de cinco alumnos de maestría presentaron un trabajo
corporativo donde se encontró plagio y fueron retirados los cinco
de la universidad, ellos adujeron que sólo uno de ellos realizó el
plagio y solicitaban que las medidas tomadas sean diferenciadas
ya que no todos cometieron plagio.
• El Tribunal Constitucional declaró infundado su pedido, dado que
aceptaron cometer la falta, que expresamente en el reglamento de
la universidad estaba contemplada la sanción y que el firmar la
autoría de un trabajo implica la aceptación de la responsabilidad
compartida del trabajo. Para mayor información pueden revisar el
caso en: http://www.tc.gob.pe/jurisprudencia/2010/03690-2007-
AA.html
Plagio en figuras

http://lanuez.blo
gspot.com/2011/
06/caso-plagio-
en-caretas-
carta-de-
boligan.html
Plagio en figuras

Tucci V, Galwankar S. JETS policy on plagiarism and academic dishonesty. J Emerg


Trauma Shock 2011;4:3-6
“Parafraseo inapropiado” (plagio)
• “Tomar porciones de texto de una o más
fuentes dando crédito a los autores, pero sólo
cambian una o dos palabras, o simplemente
cambian el orden, la voz (activa, pasiva) o el
tiempo de la oración (presente, futuro)”

Roig M. Avoiding plagiarism, self-plagiarism, and other questionable


writing practices: A guide to ethical writing. Saint Johns University;
2006.
Parafraseo adecuado

 Escribir lo que se entiende del artículo con


nuestras propias palabras.

 Tener cuidado en no cambiar el mensaje.

Roig M. Avoiding plagiarism, self-plagiarism, and other questionable


writing practices: A guide to ethical writing. Saint Johns University;
2006.
Detección de plagio

Rojas-Revoredo V, Huamani C, Mayta-Tristan P. Plagio en publicaciones estudiantiles: experiencias y


recomendaciones. Rev Med Chil. 2007; 135(8): 1087-88.
Softwares
Detectando plagio
Plagio literal
Plagio literal
Cómo escribir sin plagio

• Evitar copiar párrafos de otros para refrasearlos


– Si se olvida de citar es plagio.
– Si es literal y se olvida de entrecomillar es plagio.
– Si ha refraseado mal pero cita, es una mala práctica de
redacción.

• Partir de ideas y constructos propios, luego se ajusta


con lo revisado por la literatura.
Cómo escribir sin plagio

• Definir ideas clave.


• Ordenar ideas.
• Redactar cada párrafo.
• Buscar información complementaria para cada idea.
• Revisar si los párrafos expresan las ideas que se quieren
comunicar
• Revisar si las ideas tienen una secuencia lógica.
• ¿Se puede reducir?
• Verificar citas
• Revisar ortografía y gramática
• Pasarlo por un detector de plagio
• Enviárselo a otra persona para ver si entendió lo que queremos
comunicar.
Aprendizajes:
- Pregunta 1: ¿Qué es lo más importante
que debo hacer para evitar cometer
plagio?

a) Leer las fuentes

b) Nunca copiar y pegar. Bajo ninguna


circunstancia, incluso si, según yo, lo voy a
cambiar/borrar después.

c) Cambiar una que otra palabra, como si eso


hiciera menos grave la falta de robar texto
ajeno que estoy cometiendo.
Aprendizajes:
- Pregunta 1: ¿Qué es lo más importante
que debo hacer para evitar cometer
plagio?

a) Leer las fuentes

b) Nunca copiar y pegar. Bajo ninguna


circunstancia, incluso si, según yo, lo voy a
cambiar/borrar después.

c) Cambiar una que otra palabra, como si eso


hiciera menos grave la falta de robar texto
ajeno que estoy cometiendo.
Redacción científica

La principal cualidad de los reportes


científicos es la comunicación clara. Usted
puede lograr una comunicación eficaz si
presenta sus ideas de manera ordenada,
precisa y fluida. Transmita los puntos
esenciales de su estudio de manera
interesante y atrapará a los lectores (APA,
2010, p. 65)
Redacción científica

 Las habilidades de redacción son importantes para


los estudiantes y para los investigadores
 La redacción científica es una tarea compleja que
incluye la comunicación, no sólo con palabras sino
también con números y gráficos
Plagio e integridad académica

 El plagio es una forma de conducta académica


inadecuada en la que alguien se apropia del trabajo
o los esfuerzos de otros sin citar autorización o sin
citar apropiadamente.
 Para evitar el plagio:
 Llevar nota detallada de las fuentes
 Aprender a parafrasear de manera adecuada
 Citar y proporcionar las referencias de forma correcta
Redacción como una forma de
aprendizaje
 Redactar no solo implica mostrar lo que se sabe
 Escribir también ayuda a los autores a lograr una
mejor comprensión del tema
 Obliga a sintetizar el conocimiento para expresarlo de
forma que otros puedan comprenderlo
 Escribir es un medio más formal de comunicación
que la presentación oral y requiere un mayor grado
de organización
¿Cómo empezar?

 Se puede empezar diferentes métodos:


 Empezar por un esquema y luego redactar oraciones y
párrafos.
 Escritura libre, a manera de lluvia de ideas, escribiendo
las ideas tal como van ocurriendo para luego evaluarlas.
 Escribir primero un resumen, forzando a pensar primero
en el mensaje global
 Evitar detenerse mucho tiempo en actividades
previas a la redacción (¡Cuidado con procrastinar!)
 Al inicio, se necesita un borrador que deberá ser
revisado cuidadosamente, por lo general varias
veces.
Guías de estilo

 Guías técnicas de estilo


 Organización, estructura, formato, estilo, puntuación, etc
 En las ciencias conductuales, una guía técnica
ampliamente usada es el Manual de Estilo de
Publicaciones de la APA (www.apastyle.org)
 Guías de estilo de redacción
 Reglas y principios gramaticales para la composición y
uso adecuado de palabras
 Normatividad lingüística vigente en español: Real
Academia de la Lengua Española (RAE; www.rae.es)
Mitos acerca de la redacción

 Los buenos escritores:


 Nacen, no se hacen (¡se necesita práctica”)
 No empiezan a escribir hasta que tienen suficiente tiempo
y están inspirados
 Trabajan mejor bajo presión
 No creen en la revisión porque temen perder la
espontaneidad del primer borrador
 No comparten el producto con otros hasta que este pulido
y perfecto
Principios generales de redacción
 Simple, clara y directa

La buena redacción es eficiente y concisa


 Un texto corto es mejor que uno largo, si ambos
transmiten las misma información
 Usar palabras familiares y organizar la información
en oraciones cortas y directas (voz activa, no
pasiva)
 Usar las palabras adecuadamente
 Evitar antropomorfismo, e.d., la atribución de
características exclusivamente mente humanas a
entidades abstractas u objetos inanimados.
Principios generales de redacción
 Leer y escuchar

 Leer para escribir mejor


 Permite desarrollar un sentido de la organización y fluidez
de la redacción efectiva
 Se puede usar como modelo un artículo bien escrito en el
área de investigación
 Leer en voz alta el borrador
 Escuchar
Redacción científica
 Principios generales

El principal requerimiento de la redacción científica es


un buen contenido,
 Hipótesis claramente formuladas, basadas en
argumentos sólidos
 Diseño, método y análisis técnicamente correctos y
apropiados al problema de investigación
Estilo de redacción
 (APA, 2010)

 Continuidad en la presentación de las ideas


 Ilación en palabras, conceptos y desarrollo temático desde
la oración introductoria hasta la conclusión.
 Fluidez en la expresión
 Comunicación clara y racional, evitando el uso de artificios
literarios (ambigüedad, cambios súbitos de tema, etc.).
 Tono
 Presentación directa de ideas, con un estilo atractivo y
persuasivo
 Imaginar al lector al que quiere informar o persuadir
Estilo de redacción
 (APA, 2010)

 Economía de la expresión
 Decir únicamente lo que necesita ser dicho
 Eliminar redundancia, palabrería, términos coloquiales,
circunloquios, prosa densa y abuso de la voz pasiva.
 Evitar dar demasiados detalles innecesarios en la
descripción de participantes, materiales o procedimiento
 Uso del lenguaje especializado que sea comprensible
para los profesionales del área
Estilo de redacción
 (APA, 2010)

 Precisión y claridad
 Elección de vocabulario que exprese exactamente lo que se
quiere decir
 Evitar expresiones coloquiales que diluyan el significado
(hacer un reporte en vez de redactar un reporte) o el uso de
cuantificadores indefinidos (una buena parte de, muy poco,
prácticamente todo) o atribuciones erróneas de acción (e.g.
Antropomorfismo)
 Recursos lingüísticos
 Recursos que atraen la atención a las palabras, sonidos u
otro tipo de ornamentación son inadecuados en la redacción
científica.
 Evitar aliteraciones, rimas, expresiones poéticas y
clichés
 Evite palabras con significados inusuales o no deseados
Estrategias para mejorar la
redacción
 (APA, 2010)

1. Desarrollar el texto a partir de un borrador


2. Hacer a un lado el primer borrador para corregirlo
después de algún tiempo
3. Pedir a un colega que critique el borrador
Reducción de discriminación
 (APA, 2010)

1. Describir con el nivel de especificidad apropiado


 Elección de palabras precisas y claras en función del
problema de investigación
2. Ser sensible a las etiquetas
 Respetar preferencias de denominación de las personas
 Evitar etiquetas; describir
3. Reconocer la participación
 Remplazar sujetos por participantes, estudiantes
universitarios, niños, examinados
 Usar voz activa
Retos de las presentaciones
orales
 “Pánico escénico”
 Es esperado y normal
 Puede ser positivo
 Los buenos oradores se hacen, no nacen
 No confiar en PP para reducir la ansiedad, confiar en un
buen contenido
 Límite de tiempo
 20 minutos es suficiente para transmitir una buena
cantidad de información, si la presentación está bien
planificada
 Funciona mejor si el apoyo visual (PPT) no son
distractores
 PowerPoint: ¿herramienta u obstáculo?
Errores comunes en las
presentaciones en PowerPoint
 Expositor lee las diapositivas
 Texto muy pequeño
 Dificultad para ver las diapositivas por los colores
usados
 Oraciones completas en lugar de ideas
 Textos o gráficos que se mueven o vuelan
Errores comunes en las
presentaciones en PowerPoint
 Uso de sonidos
 Diagramas o tablas excesivamente complejos
 Carencia de fluidez en las ideas
 No hay un propósito claro en la presentación
 Uso de muchos tipos de letras (fuentes)
Estrategias para presentaciones
efectivas
 Primero las ideas
 Preparación
 10, 20, 30, 3x5
 PPT debe tener 10 diapositivas, no debe durar más de 20
minutos y tener letras como mínimo de 30 puntos
 El texto en las diapositivas debe tener 3 viñetas con 5
palabras cada una.
Estrategias para presentaciones
efectivas
 Diseño
 Evitar diseños predeterminados
 Simplicidad
 Fuente Sans Serif (e.g. Arial) son fáciles de leer en
pantalla
 Evitar mayúsculas
 Tablas simples
 No efectos especiales
Referencias
American Psychological Association (2010). Manual de
Publicaciones (3ª ed.) México D. F.: Manual Moderno
Kline, R. B. (2009). Becoming a behavioral researcher: a
guide to producing research that matters. New York:
The Guilford Press.
Shaughnessy, J. J., Zechmeister, E. B. & Zechmeister, J.
S. (2007). Métodos de investigación en psicología (7ª
ed.). México D. F.: McGraw-Hill.
Metodología de la Investigación Científica

Sesión 1 Semana 4:

Pruebas de normalidad. Software JAMOVI.

Profesores:
Danitsa Alarcón, Ana María Castañeda, Ingrid
Cirilo Acero, Johanna Kohler, Carlos Carbajal,
Edwin Salas, Gustavo Calderón, Jhonatan
Navarro, Carlos Portocarrero
2021-2
Facultad de Psicología

Metodología de la Investigación
Científica

Sesión 1 - Semana 4

2021-2
Facultad de Psicología

Estadística inferencial
Pruebas de normalidad – Pruebas
paramétricas y no paramétricas
Facultad de Psicología

El estudiante calcula e interpreta una


prueba de normalidad y decide si
LOGRO empleará una prueba paramétrica y no
paramétrica.
Facultad de Psicología

Puntos a revisar:

- Punto 1: Pruebas de normalidad

- Punto 2: Pruebas paramétricas y no


paramétricas
Facultad de Psicología

De la distribución empírica a la distribución teórica


1. Distribución teórica: es como se espera
que se ocurran y se distribuyan las cosas
Distribución
según una teoría estadística. empírica =
nuestros datos

2. Distribución empírica: es como ocurren


en la realidad, en los datos empíricamente
extraídos, por ejemplo mediante la
aplicación de tests.

Z -4 -3 -2 -1 0 1 2 3 4

50% 50%
¿QUÉ FORMA TIENE LA DISTRIBUCIÓN
EMPÍRICA?
Distribución teórica = p.e.,
distribución normal
Facultad de Psicología
Propiedad de la curva normal: Simetría

Área debajo de la curva normal

Observe
esto
Facultad de Psicología

Normalidad: ¿Los datos se aproximan


a esa distribución?
• No todas las variables continuas están normalmente
distribuidas

• Es importante evaluar en qué grado la distribución de


los datos se aproximan a la distribución normal
Facultad de Psicología

Pruebas de normalidad
• Histograma
• Prueba Chi-cuadrado de bondad de ajuste.
• Prueba de Kolmogorov-Smirnov.
• Prueba de Shapiro-Wilk.
(Estudios de simulación han determinado que esta prueba es la más potente).
Facultad de Psicología En JAMOVI…

Debido a que p < .001 es mucho


menor que .05, entonces las edades NO
SE DISRIBUYEN DE MANERA NORMAL.
Facultad de Psicología En JAMOVI…

Si P > 0.05, las puntuaciones de la


variable se aproximan a una
distribución normal.

Si p < 0.05, las puntuaciones de la


variable no se aproximan a una
distribución normal.
Facultad de Psicología En JAMOVI…

Las p de varones y mujeres,


resultaron ser mayores que .05, en
consecuencia los puntajes de calidad
de vida tienen distribución normal.
Facultad de Psicología

Prueba Paramétrica NO paramétrica


Si las
puntuaciones Grupos o
en la variable
tienen
Variables
distribución 2 Grupos “t” Student para La “U” de Mann-Whitney
normal,
entonces se Independientes grupos independientes
empleará una
estadística
paramétrica.
2 Grupos “t” Student para Prueba de Rangos
En caso Dependientes grupos relacionados asignados de Wilcoxon
contrario, se
empleará
estadística no Más de 2 Grupos F de análisis de Prueba “H” de Kruskal-
paramétrica. independientes varianza (ANOVA) Wallis

Más de 2 Grupos Análisis de varianza Prueba de Friedman.


dependientes con medidas repetidas
(ANOVA MR)
2 Variables Prueba de Correlación Prueba de Correlación de
PEARSON Spearman

Más de 2 Prueba de Correlación Prueba “W” de Kendall


Variables Múltiple
Metodología de la Investigación Científica

Sesión 1 Semana 5:

Comparación de una variable numérica entre


dos grupos independientes: t de Student y U
de Mann Whitney.
Profesores:
Danitsa Alarcón, Ana María Castañeda, Ingrid
Cirilo Acero, Johanna Kohler, Carlos Carbajal,
Edwin Salas, Gustavo Calderón, Jhonatan
Navarro, Carlos Portocarrero
2021-2
Facultad de Psicología

Metodología de la Investigación
Científica

Sesión 1 - Semana 5

2021 - 2
Facultad de Psicología

Estadística inferencial
Comparación de una variable numérica
entre dos grupos independientes: t de
Student y U de Mann Whitney
Facultad de Psicología

El estudiante calcula e interpreta una


prueba de comparación de dos grupos
LOGRO independientes: t de Student y U de
Mann Whitney.
Facultad de Psicología

Observar atentamente el siguiente vídeo:


https://www.youtube.com/watch?v=5mw-pC3d2KY
Facultad de Psicología

¿Existe un patrón de conducta característico entre


varones y mujeres?

¿Existen diferencias en los intereses que motivan a


los varones y las mujeres?
Facultad de Psicología

Diferencias en las respuestas frente al rumor entre


varones y mujeres

H1: Las mujeres se interesan más por el rumor en


comparación con los varones.

H0: Las mujeres no se interesan más por el rumor


en comparación con los varones.

H1: m1 < m2 Donde: m1 es la media de mujeres


Ho: m1> m2 y m2 es la media de varones.
Facultad de Psicología

Poblaciones

Muestras
Facultad de Psicología

Puntos a revisar:

- Punto 1: Prueba t de Student para dos


grupos independientes

- Punto 2: Prueba U de Mann Whitney


Facultad de Psicología

Prueba t de Student para muestras


independientes (supuestos de los datos): Si p > 0.05, las p
variable se apro
distribución normal.

- Los datos de las muestras de comparación Si p < 0.05, las p


variable no se a
deben tener distribución normal.(Shapiro) distribución normal.

- Las muestras de comparación deben ser


independientes. (sin)
- Las muestras deben ser comparables.
- Se debe desconocer los valores de las
varianzas poblacionales de donde se
extrajeron las muestras.
Facultad de Psicología En JAMOVI…

 En función de los valores obtenidos para el cálculo de


la d de Cohen, un tamaño del efecto:
Debido a que p = .039 y es menor que .05,
De entre 0,2-0,3 podría considerarse “pequeño”,
entonces se rechaza la Ho y se concluye que existen
diferencias estadísticamente significativas en los En torno a 0,5-0,8 un efecto “medio”,
puntajes de habilidades sociales según género. De 0,8 en adelante, un efecto de “grande”.
Facultad de Psicología

Prueba U de Mann Whitney (supuestos de


los datos):

- Los datos de las muestras de comparación


no deben tener distribución normal.
- Las muestras de comparación deben ser
independientes.
- Las muestras deben ser comparables.
Facultad de Psicología En JAMOVI…

 En función de los valores obtenidos para el cálculo de la r


(corelación biserial por rangos). según Cohen (1988).
 Un tamaño del efecto de entre
Debido a que p = .281 y es mayor que .05,
entonces se acepta la Ho y se concluye que no r=0.10 (bajo)
existen diferencias estadísticamente significativas en r=0,30 (medio)
los puntajes de depresión según género. r=0,50 (grande)
r=0,70 (muy grande)
Facultad de Psicología

El tamaño sí importa (Lectura):

https://www.maximaformacion.es/blog-
dat/conoce-el-alcance-de-tus-resultados-el-
tamano-importa/
Estadística aplicada a las Ciencias Sociales

Tamaño necesario de la muestra:


¿Cuántos sujetos necesitamos?
©Pedro Morales Vallejo
• Universidad Pontificia Comillas • Madrid • Facultad de Humanidades
(Última revisión, 13 de Diciembre, 2012).
Disponible en http://www.upcomillas.es/personal/peter/investigacion/Tama%F1oMuestra.pdf

Índice
1. Tipos de muestras .......................................................................................................... 2
1.1. Muestras probabilísticas o aleatorias................................................................... 2
1.2. Muestras no probabilísticas.................................................................................. 3
2. Número de sujetos y finalidad pretendida ..................................................................... 4
3. Número de sujetos necesarios en la muestra para extrapolar los datos a la población.. 4
3.1. Variables de las que depende el tamaño de la muestra ........................................... 4
3.2. Cómo calcular el tamaño de la muestra .................................................................. 5
3.2.1. En el caso de poblaciones infinitas (tamaño grande, indefinido…)............. 5
3.2.1.1. Fórmulas para determinar el tamaño de la muestra ......................... 5
3.2.1.2. Cuando tenemos los sujetos que tenemos: estimación del margen
de error al extrapolar de la muestra a la población ......................... 7
3.2.1.3. Poblaciones y subpoblaciones.......................................................... 9
3.2.1.4. ¿De dónde vienen estas fórmulas? .................................................. 9
3.2.2. En el caso de poblaciones finitas (tamaño conocido, pequeño) ................... 10
3.2.2.1. Fórmulas para determinar el tamaño de la muestra ......................... 10
3.2.2.2. Margen de error al extrapolar de la muestra a la población............. 12
3.3. Observaciones sobre el tamaño de la muestra ........................................................ 13
4. Número de sujetos para construir un instrumento de medición .................................... 13
5. Número de sujetos para el análisis factorial .................................................................. 14
6. Tamaño de la muestra en estudios de carácter empírico o experimental ...................... 15
6.1. Variables que intervienen en la determinación del tamaño de la muestra .............. 15
6.2. Tamaño de cada muestra cuando comparamos dos grupos (t de Student) .............. 17
6.3. Tamaño de la muestra en el análisis de varianza .................................................... 18
6.3.1. Cuando tenemos más de dos muestras (análisis de varianza unifactorial) .. 18
6.3.2. Tamaño de la muestra en los diseños factoriales
(análisis de varianza, dos factores) ............................................................... 19
6.4. El tamaño de la muestra en estudios correlacionales .............................................. 20
7. Cuando N = 1................................................................................................................. 22
8. Referencias bibliográficas ............................................................................................. 22
Anexo. Tamaño de la muestra y números aleatorios en Internet....................................... 24

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


2

1. Tipos de muestras
En muchas investigaciones no se pretende en principio (al menos como objetivo
prioritario) extrapolar los resultados. Cuando el interés del investigador tiene como objetivo
analizar una muestra concreta (verificar si una innovación didáctica funciona en una clase,
estudiar las actitudes de nuestros alumnos, etc.), el tamaño de la muestra es el tamaño del grupo
objeto de estudio.
Cuando se trata de extrapolar los resultados a la población representada por una muestra
hay que tratar de dos temas: el tipo de muestra y el número de sujetos.
Cómo se obtiene la muestra tiene que ver con la representatividad de la muestra
El tamaño de la muestra tiene que ver con los márgenes de error al extrapolar de la
muestra a la población.
Cuando se trata de recoger unos datos de una muestra (por ejemplo en un survey o
encuesta sociológica, de opiniones, etc.) para extrapolar los resultados a la población, el número
de sujetos no es el único dato que hay que tener en cuenta, y esto hay que tenerlo presente desde
el principio. La muestra, cualquiera que sea su magnitud, debe ser representativa de la población
a la que se van a extrapolar los resultados. Debemos recordar que los límites o características de
la población los determina y define el que investiga (los alumnos de una facultad o de
universidad, o de todo el país, etc.). En cualquier caso hay que explicar cómo se hizo este
muestreo y describir bien la muestra para poder valorar esta representatividad.
Las muestras (y los métodos para obtenerlas) podemos dividirlas en dos grandes categorías
según sean o no sean muestras probabilísticas o aleatorias (ambos términos, probabilísticas o
aleatorias, expresan lo mismo1.
1.1. Muestras probabilísticas o aleatorias
Una muestra aleatoria o probabilística es aquella en la que todos los sujetos de la
población han tenido la misma probabilidad de ser escogidos. Son en principio los tipos de
muestra más profesionales.
¿Por qué es importante el muestreo aleatorio? Las muestras aleatorias aseguran o
garantizan mejor el poder extrapolar los resultados. En una muestra aleatoria tenemos más
seguridad de que se encuentran representadas las características importantes de la población en
la proporción que les corresponde. Si el 20% de la población tiene la característica A (una
determinada edad, una determinada situación económica, etc.) podemos esperar que en la
muestra también habrá en torno a un 20% con esa característica.
Si la muestra no es aleatoria (no probabilística) puede suceder que esté sesgada y que por
lo tanto no sea representativa de la población general porque predominan más unos determinados
tipos de sujetos que otros. Por ejemplo, si hacemos una pregunta a los conductores que se paran
ante un semáforo, prescindimos de los que utilizan otro medio de transporte, y si hacemos la
pregunta a la salida de una estación de metro, prescindimos de los que tienen y utilizan coche
particular, etc. Si la población es la de una universidad, según el día y método seguido, podemos

1 En Internet StatPac Inc (2003) ofrece una buena información sobre surveys, (Questionnaires & Survey Design) y en
Sampling Mehods (menú) una clara explicación de los diversos tipos de muestras. Más información sobre muestras, asequible en
Internet, son Stark (2003, chapter 16) y Trochim en Sampling (last revised 2006). Los diversos tipos de muestreo aleatorio y
cómo llevarlos a cabo pueden verse en muchos textos (como Hernández Sampieri, Fernández Collado y Baptista Lucio, 2008) y
en monografías específicas (como Rodríguez Osuna, 1991, 1993). En Internet hay programas sencillos que generan tablas de
números aleatorios y calculan el tamaño de la muestra y los márgenes de error (intervalos de confianza) para poblaciones de
distinto tamaño; pueden verse algunas direcciones útiles en el anexo.

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


3

tener infra-representados a los alumnos de los cursos que asisten menos a clase, o tener
representados en exceso a los alumnos que llegan muy pronto por la mañana (y este llegar antes
o llegar tarde puede estar asociado con otras variables), etc. Características aparentemente
irrelevantes pueden estar relacionadas precisamente con el objeto de la investigación (con la
variable dependiente).
Sobre el cómo hacer un muestreo aleatorio no tratamos aquí de manera específica, hay
diversas maneras de hacerlo y por lo general, y para poblaciones grandes, este tema suele tratarse
en textos de sociología. En principio podemos concretar tres procedimientos para hacer un
muestreo aleatorio.
a) Muestreo aleatorio simple.
Podemos concebirlo como un sorteo, una lotería. Para poblaciones pequeñas (tan pequeñas
como los alumnos de una clase o de un curso) hay métodos sencillos (como las tablas de
números aleatorios, e incluso estos números están programados en muchas calculadoras)2.
b) Muestreo sistemático.
Es también sencillo y cómodo para poblaciones pequeñas; se escoge un número al azar que
se utiliza como intervalo; si sale por ejemplo el 9, se escoge de una lista cada noveno sujeto…
c) Muestreo estratificado.
Es un tipo de muestreo muy recomendable, sobre todo para poblaciones grandes: se divide
la población en estratos o segmentos según algunas características importantes para lo que se
desea investigar (como pueden ser: sexo, curso, edad, tipo de vivienda…) y se procura que en la
muestra esté representado cada estrato en la proporción que le corresponda. Dentro de cada
estrato los sujetos se escogen aleatoriamente. Los estratos se establecen en función de
características importantes por su interés específico descriptivo y sobre todo porque, si se desea
extrapolar a toda la población, pueden tener que ver con la variable dependiente.
1.2. Muestras no probabilísticas
Entra las muestras no probabilísticas tenemos las siguientes:
a) Muestras de conveniencia
Como ya sugiere el mismo término se trata de una muestra disponible. Puede ser útil en
estudios preliminares (por ejemplo para depurar un instrumento) pero discutible para extrapolar
los datos a la población general; en cualquier caso habría que describirla bien y hacer una
extrapolación cautelosa a la población que pueda estar representada por esa muestra. Por lo
general estas muestras se utilizan para hacer estudios específicos sobre las mismas muestras y en
numerosos estudios experimentales con pocos sujetos. Se denominan de juicio prudencial, o
términos parecidos, cuando se estima y se razona que la muestra es representativa de una
determinada población.
b) Muestras bola de nieve
Se denominan así cuando la muestra se obtiene yendo de unos sujetos a otros; útil cuando
la característica de la población es poco común o de acceso no fácil y unos sujetos informan
sobre otros que participan de la misma característica.

2 Pueden verse en el anexo algunos recursos disponibles en Internet. En el SPSS se puede hace una selección aleatoria de
casos; en el menú datos → seleccionar datos → selección aleatoria de casos y se indica el tanto por ciento de casos aleatorios
que se quieren seleccionar.

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


4

c) Muestreo por cuotas.


Es lo mismo que el muestreo estratificado, pero sin elección aleatoria dentro de cada
estrato; al menos se garantiza que todas las submuestras están representadas en su debida
proporción. En la práctica, y con el objetivo expreso de extrapolar los datos a toda la población,
puede ser un buen sistema.
2. Número de sujetos y finalidad pretendida
Cuando nos preguntamos cuántos sujetos necesitamos… hay que añadir, necesitamos
¿para qué? Porque puede haber varias finalidades.
Lo que con más frecuencia se encuentra en los textos es posiblemente las normas y
fórmulas para determinar el tamaño de la muestra cuando se quieren extrapolar los resultados a
la población (encuestas, sondeos pre-electorales, etc.); éste es el primer punto que vamos a tratar.
Pero en la investigación y experimentación en psicología, educación o sociología hay con
frecuencia otras finalidades: ¿Cuántos sujetos necesitamos para construir y analizar un
instrumento de medición (un test, una escala de actitudes), o para llevar a cabo un análisis
factorial o un análisis de varianza en un diseño experimental…?
En los textos de investigación experimental vemos con frecuencia ejemplos de
investigaciones con muy pocos sujetos, quizás sobre todo cuando se utilizan diseños
experimentales en sentido propio y el análisis de varianza es el método de análisis ¿Qué
podemos decir sobre el tamaño de la muestra en estos casos?
Vamos a dividir esta exposición en varios apartados de extensión muy desigual:
Número de sujetos necesario:
a) Para extrapolar los resultados a una población mayor (el caso típico de los sondeos de
opinión);
b) Para construir un instrumento de medición (test o escala)
c) Para llevar a cabo un estudio experimental (contrate de medias, análisis de varianza)
d) Para hacer un análisis correlacional

3. Número de sujetos necesarios en la muestra para extrapolar los datos a la población


Aunque podemos acudir a los programas de Internet (en el Anexo) es útil entender las
fórmulas y las variables que intervienen para determinar el tamaño de la muestra.
3.1. Variables de las que depende el tamaño de la muestra
Suponiendo que la muestra es la adecuada, el tamaño necesario de la muestra para poder
extrapolar los resultados a la población depende básicamente de tres variables. El por qué estas
variables inciden en el tamaño de la muestra es fácil comprenderlo de manera intuitiva, al
margen de la traducción de estas variables a valores estadísticos.
1º El nivel de confianza o riesgo que aceptamos de equivocarnos al presentar nuestros
resultados: lo que deseamos es que en otras muestras semejantes los resultados sean los mismos
o muy parecidos. También podemos denominarlo grado o nivel de seguridad. El nivel de
confianza habitual es de .05 (α = .05).
El nivel de confianza va a entrar en la fórmula para determinar el número de sujetos con un
valor de zeta, que en la distribución normal está asociado a una determinada probabilidad de
ocurrencia.

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


5

2º La varianza (o diversidad de opiniones…) estimada en la población. Esta diversidad en


la población es la diversidad estimada; si la conociéramos (cuántos van a decir que sí y cuántos
van a decir que no) en primer lugar no necesitaríamos hacer la encuesta.
Si sabemos de antemano que todos piensan lo mismo (aunque no sabemos qué piensan y
por eso lo preguntamos), nos bastará preguntar a un solo sujeto, pero si las opiniones pueden ser
muy distintas nos harán falta más sujetos. Por ejemplo, si aterrizamos en un país desconocido
donde todos hablan el mismo idioma y no sabemos cuál es…basta con preguntárselo a una sola
persona de ese país. Si en una agrupación de sujetos que viven juntos, todos se levantan a la
misma hora (un cuartel, un convento), y queremos saber a qué hora se levantan por la mañana,
basta con preguntárselo a una sola persona. A mayor diversidad esperada, o al menos posible, en
las opiniones o posibles respuestas en la población hará falta un mayor número de sujetos en la
muestra.
3º El margen de error que estamos dispuestos a aceptar.
Si por ejemplo el 20% de la muestra está de acuerdo con una proposición (o dice que va
votar a un determinado candidato o que prefiere un determinado producto) eso no significa que
el 20% exacto de la población vaya a responder lo mismo, puede ser el 22% o el 18%…
necesitaremos muestras mayores si queremos que el margen de error o de oscilación de muestra
a muestra de los resultados sea muy pequeño (el resultado exacto lo tendríamos si respondiera el
100% y la muestra coincidiera con la población).
Esto puede ser más o menos importante según la situación; el margen de error en sondeos
pre-electorales es, por ejemplo, muy importante y este margen de error suele ponerse en torno a
un 3%.
3.2. Cómo calcular el tamaño de la muestra
Vamos a distinguir entre poblaciones infinitas (de tamaño muy grande, indefinido, cuyo
tamaño exacto podemos desconocer) y poblaciones finitas (tamaño más reducido y que
conocemos).
En la práctica disponemos de tablas en numerosos textos y de programas de Internet (ver
anexo) en los que podemos ver con toda facilidad el tamaño necesario de la muestra en función
del tamaño de la población, del nivel de confianza y del margen de error tolerado; es muy útil sin
embargo entender las fórmulas (que por otra parte son muy sencillas) porque nos hacen ver
cómo se relacionan las variables que condicionan el tamaño de la muestra.

3.2.1. En el caso de poblaciones infinitas (tamaño grande, indefinido…)


3.2.1.1. Fórmulas para determinar el tamaño de la muestra
Para extrapolar a poblaciones muy grandes utilizamos la fórmula [1] para obtener el
tamaño de la muestra:
z 2 pq
N= 2 [1]
e
Explicamos los símbolos de la fórmula, que corresponden a las variables indicadas en el
apartado anterior.
z = Valor de z correspondiente al nivel de confianza;
Un nivel de confianza del 95% (también lo expresamos así: α = .05) corresponde a z =
1.96 sigmas o errores típicos; z = 2 (dos sigmas) corresponde a un 95.5% (aproximadamente, α
= .045).

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


6

Con z = 2.57 el nivel de confianza sube al 99% (nos equivocaríamos una vez de cada 100),
pero como aumenta el numerador aumenta el cociente… que es N, y harán falta más sujetos (y
más trabajo y más gastos).
pq = Varianza de la población
Como la varianza de la población la desconocemos, ponemos la varianza mayor posible
porque a mayor varianza hará falta una muestra mayor.
Recordamos el significado de los símbolos:
p = proporción de respuestas en una categoría (síes, respuestas correctas, unos en la
codificación usual, etc.)
q = proporción de repuestas en la otra categoría (noes, ceros en la codificación usual).
La varianza en los ítems dicotómicos (dos respuestas que se excluyen mutuamente) es
igual a pq y la varianza mayor (la mayor diversidad de respuestas) se da cuando p = q = .50 (la
mitad de los sujetos responde sí y la otra mitad responde no) por lo que en esta fórmula [1] pq es
siempre igual a (.50)(.50) = .25 (es una constante).
En las fichas técnicas de las encuestas sociológicas que se publican en la prensa es normal
indicar que la muestra ha sido escogida partiendo de la hipótesis de que p = q = .50 (a veces se
expresa de otras maneras: P = Q = 50, ó p/q = 50, etc.).
El suponer que p = q quiere decir que para escoger la muestra nos ponemos en la hipótesis
de que en la población hay la máxima diversidad posible: un 50% va a decir que sí y otro 50% va
a decir que no, de esta manera, y por lo que respecta a la varianza de la población, no corremos
riesgos de quedarnos cortos en el número de sujetos. Este valor de pq (= .25) es válido (válido
para calcular el tamaño de la muestra) aun cuando las preguntas no sean dicotómicas.
e = Error muestral
Lo representamos con la letra e (no es el único símbolo que se utiliza) que significa error o
desviación posible cuando extrapolemos los resultados. Es el margen de error que aceptamos.
Si el margen de error es 3.16%, en la fórmula pondremos e = 0.0316. Si dice que sí un
64.3% en la muestra, entendemos que dice que sí en la población entre un (64.3 - 3.16)% y un
(64.3 + 3.16)%. Cuanto más bajo sea este error probable, que es el denominador, aumenta la
precisión pero también subirá obviamente el cociente: harán falta más sujetos (y sube el precio,
etc.).
Observando la fórmula vemos que, efectivamente, el tamaño de la muestra (cociente o
resultado de la fórmula) será mayor según sea mayor el nivel de confianza y la varianza esperada
en la población (numerador en la fórmula) y según sea menor el margen de error que estamos
dispuestos a admitir (denominador en la fórmula).

Por ejemplo ¿qué muestra necesitaremos con un nivel de confianza del 95% (o α = .05), al
que corresponde z = 1.96, y admitiendo un margen de error del 5% o del 2%? Ya sabemos que
pq = .25.
error aceptado: 5% y α = .05 (z = 1.96) error aceptado: 2% y α = .05 (z = 1.96)
(1.96 2 )(.25) (1.96 2 )(.25)
N= = 384 N= = 2401
.05 2 .02 2

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


7

El nivel de confianza nunca suele ser menor de α = .05 (nos equivocaríamos en nuestra
predicción o generalización 5 veces de cada 100), y como pq es igual a .25, el número de sujetos
va a depender de hecho del margen de error que estamos dispuestos a tolerar.
Con frecuencia se opera con un nivel de confianza del 95.5%; la razón práctica está en que
este nivel de confianza corresponde a z = 2 (dos sigmas); y el numerador de la fórmula queda
muy simplificado:
2 2 1
(z ) (pq) = (2 )(.25) = 1, con lo que N= 2 [2]
e
El tamaño de la muestra no varía mucho; en el ejemplo anterior (error tolerado del 5% del
2%) necesitaríamos 400 y 2500 sujetos en vez de 384 y 2401.
Resumiendo lo dicho hasta ahora, el tamaño de la muestra (valor de N) aumentará:
1. Si aumenta nuestro nivel de confianza (de seguridad) que requiere un valor mayor de z,
2. Si disminuye el error muestral (e).

Es decir, si queremos mucha seguridad y poco margen de error hará falta un N mayor,
En la tabla 1 podemos ver el tamaño de la muestra (N) para diversos valores de e
(márgenes de error) y los dos niveles de confianza más usuales (z = 1.96 o un 95% de nivel de
confianza y z = 2.57 o un 99% de nivel de confianza o probabilidades de no equivocarnos):

e = .05 e = .04 e = .03 e = .02 e = .01


α = .05 z = 1.96 384 600 1067 2401 9604
α = .01 z = 2.57 660 1032 1835 4128 16512

Tabla 1
En general:
1º Es suficiente un nivel de confianza de α = .05 (que equivale a z = 1.96); es la práctica
habitual,
2º El margen de error no debe ser superior a .05 (5%) para que los resultados sean
realmente informativos y útiles.
También podemos ir directamente a los programas de Internet que figuran en el Anexo.
3.2.1.2. Cuando tenemos los sujetos que tenemos: estimación del margen de error al
extrapolar de la muestra a la población
¿Con qué margen de error podemos extrapolar los resultados a la población? Por margen
de error entendemos intervalos de confianza que es otra manera de decir lo mismo.
El partir de un número de sujetos determinado, sin haber calculado antes el tamaño de la
muestra necesario para extrapolar los resultados a la población objeto de estudio, es una
situación frecuente. El punto de partida, por lo que respecta al número de sujetos, es con
frecuencia uno de estos tres:
a) Partimos de un número de sujetos aproximado al que queremos, porque pretendemos
extrapolar los resultados a la población (para entendernos: queremos afirmar qué se piensa aquí
en general, y no qué piensan estos sujetos concretos); pero este número no es exacto (nos
quedamos cortos o puede que tengamos más de los necesarios).

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


8

b) Partimos de los sujetos disponibles, que pueden ser menos de los necesarios, pero
nuestra intención es extrapolar los resultados a la población, como en el caso anterior;
c) No pensamos extrapolar los resultados, estamos simplemente describiendo una muestra,
pero siempre cabe el hacernos esta pregunta ¿Entre qué márgenes se encuentra la población que
puede estar representada por estos sujetos?
La respuesta en estos casos es sencilla; se trata de verificar al margen de error cuando
extrapolamos a la población a partir de la muestra que de hecho tenemos disponible.
En la fórmula [1] conocemos los valores de N, de pq (= .25) y el de z (que puede ser
habitualmente 1.96). Despejamos el valor del margen de error (e):

z 2 pq
margen de error e = [3]
N
(z)(.50)
Que también se puede expresar así: e = [4]
N
Donde (.50) es la raíz cuadrada de pq (.25). Al nivel de confianza habitual z = 1.96,
tenemos que (1.96)(.50) = .98, por lo que la fórmula [4] nos queda así:
.98
e= [5]
N
1
y si z =2, e= [6]
N
Por ejemplo: en una encuesta a 200 sujetos responden sí a una pregunta el 45%. ¿Entre qué
límites se encontrará la población (de tamaño indefinido, desconocido) representada por esta
muestra? (no olvidemos que la representatividad puede ser problemática, pero nuestra pregunta
es legítima). Nuestro nivel de confianza, para no apartarnos de la práctica convencional y
suficientemente segura, es de α = .05 (luego z = 1.96); nuestro margen de error será [5]:
.98
Margen de error: e = = .069, redondeando el 7%
200
Esto quiere decir que si en nuestra muestra responde sí el 45% podemos afirmar que en la
población responde sí (sumando y restando 7% a nuestro 45%) entre el 38% y el 52%.
Este margen de error (límites máximo y mínimo probables en la población) es lo que se
denomina coloquialmente horquilla en otros contextos (como en las encuestas pre-electorales);
un término más apropiado es intervalos de confianza). Este margen de error del 7% (lógico con
una muestra tan pequeña) podemos considerarlo grande o pequeño según de qué se trate.
De hecho, aun cuando la finalidad sea extrapolar de la muestra a la población, es normal
disponer de un número de sujetos aproximado al que necesitamos para un determinado nivel de
confianza (como α = .05 que corresponde a z = 1.96) y también aproximado para un margen de
error dentro de unos límites que juzgamos tolerables. Ese margen de error, pero de manera más
exacta, podemos estimarlo después con las fórmulas [3] o [4]. Por esto nos encontramos a veces
en las fichas técnicas de las encuestas con unos márgenes de error que a primera vista parecen
arbitrarios o que no responden a un valor que podamos considerar muy lógico o especialmente
útil (como 3.17, 4.2, 2.27…); se han calculado a partir del tamaño real de la muestra.

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


9

3.2.1.3. Poblaciones y subpoblaciones


Una situación frecuente es la disponer de un número de sujetos suficiente para extrapolar
los resultados a la población con un margen de error pequeño, pero si esta población está
compuesta de subpoblaciones (como sucede en las muestras estratificadas o por cuotas) de cada
una de las cuales se ha tomado una muestra menor, al extrapolar a cada subpoblación el margen
de error será mayor (pero es naturalmente calculable y se puede dar la información).
Como ejemplo tomamos estos datos de la ficha técnica de una encuesta publicada en la
prensa.
Población: País Vasco, N = 1800, con 600 sujetos de cada una de las tres provincias
Nivel de confianza: 95.5% (ó α = .045; equivale a z = 2).
El margen de error al extrapolar los resultados nos lo da la fórmula [5] (o la fórmula [6] en
este caso concreto de z = 2)

Todo el País Vasco (N = 1800) Cada provincia (N = 600)


1 1
e= = .024 (2.4%) e= = .0408 (4.1%)
1800 600
3.2.1.4. ¿De dónde vienen estas fórmulas?
Podemos utilizar estas fórmulas sin entender de dónde vienen, pero es fácil entenderlas si
tenemos una idea de lo que es la distribución muestral de la media, un modelo teórico de
distribución que tiene su desviación típica o, con más propiedad, su error típico (y este modelo
nos viene del teorema del límite central).
Sabemos que el error típico (o desviación típica) de la media es igual a
σ
error típico de la media = [7]
N
Por las tablas de la distribución normal sabemos que un 66% de los casos
(aproximadamente) se encuentran entre la media obtenida más menos un error típico, y un 95%
de los casos se encuentran entre la media obtenida más menos 1.96 errores típicos (o
desviaciones típicas, el concepto es el mismo).
Este valor de z (o distancia en errores típicos con respecto a la media) lo decidimos
libremente y así establecemos los límites o intervalos de confianza de la verdadera media (la
media de la población, no la de la muestra).
La media de la población (que es lo que nos interesa, pues deseamos extrapolar de la
muestra a la población) estará entre la media obtenida en la muestra más menos (z)(σ/ N ).
Si por ejemplo, y como es usual, escogemos un nivel de confianza de α = .05, al que
corresponde z = 1.96, tenemos un 95% de probabilidades de que la verdadera media se encuentre
entre más menos (1.96)(σ/ N ) con respecto a la media de la muestra.
Si a este margen de error le denominamos e (error, desviación), tenemos que:
(z)(σ)
e= [8]
N
Esta fórmula es exactamente igual a las fórmulas [3] o [4] ( pq es la desviación típica de
los ítems dicotómicos cuyas respuestas se codifican como 1 ó 0).

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


10

Despejando N en la fórmula [8] tenemos la fórmula [1] para un determinado valor de las
otras variables (z, σ y e), y estos valores son σ = .50 ( y σ2 o pq = .25) y los valores de z (nivel
de confianza) y e (error tolerado al extrapolar de la muestra a la población) los escogemos
nosotros.
3.2.2. En el caso de poblaciones finitas (tamaño conocido, pequeño)
Las fórmulas anteriores se refieren a poblaciones grandes, de tamaño indefinido que no
podemos conocer con exactitud. Más o menos a partir de los 100.000 sujetos ya estamos en ese
tipo de poblaciones. En muchas ocasiones trabajamos también con poblaciones mucho más
pequeñas; después de todo el que investiga es el que establece los límites de la población. Los
alumnos de una universidad o de una carrera, o los profesores de un colegio, etc., pueden ser
nuestras poblaciones. A estas poblaciones las denominamos poblaciones finitas y su tamaño (de
manera más o menos exacta) lo conocemos o podemos conocer.
3.2.2.1. Fórmulas para determinar el tamaño de la muestra
Cuando conocemos el tamaño de la población, la muestra necesaria es más pequeña y su
tamaño se determina mediante la fórmula [9]:
N n = tamaño de la muestra que deseamos
n= [9] conocer,
e (N − 1)
2
1+ N = tamaño conocido de la población,
z 2 pq
e, z y pq (o σ2) como antes.
Naturalmente también en estos casos hay que recordar que para poder extrapolar los
resultados a la población, la muestra debe ser representativa, y estamos de nuevo con el
problema del muestreo aleatorio.
Por ejemplo: deseamos hacer un sondeo de opiniones en un centro escolar que tiene 600
alumnos. En este caso N = 600; es el tamaño de la población que ya conocemos. Nuestro nivel
de confianza va a ser del 95%, por lo tanto z = 1.96. Y como no queremos un error mayor del
3%, tenemos que e = .03. A falta de otros datos y para mayor seguridad suponemos que pq =
(.50)(.50) = .25. La muestra necesaria será:
600
n= = 384; necesitamos por lo tanto una muestra de 384 sujetos.
.032 (600 − 1)
1+
(1,96 2 )(.25)
Cuando la población es grande (más de 30.000 sujetos) esta fórmula no aporta mucho y
puede utilizarse la fórmula para poblaciones infinitas [1] que es más sencilla.
También podemos ir directamente a alguno de los programas de Internet, nos basta
introducir el nivel de confianza (95%) y el tamaño de la población:
Market Research Surveys Online http://www.macorr.com/ss_calculator.htm
Raosoft sample size calculator, http://www.raosoft.com/samplesize.html
Al aumentar el tamaño de la población no aumenta proporcionalmente el tamaño necesario
de la muestra, y llega un momento en que las dos fórmulas dan prácticamente los mismos
resultados. Podemos verlo en la tabla 2; aplicamos la fórmula para distintos valores de N
(tamaño conocido de la población) y cuando las muestras son grandes llegamos a las mismas o
parecidas cifras que vimos antes para poblaciones infinitas.

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


11

nivel de confianza
Tamaño
de la población α = .05 (z = 1.96)
para e = .05 para e = .03
N= 100 n = 80 n= 92
N= 150 n = 108 n= 132
N= 200 n = 132 n= 169
N= 250 n = 152 n= 203
N= 500 n = 217 n= 341
N= 1.000 n = 278 n= 516
N= 2.500 n = 333 n= 748
N= 5.000 n = 357 n= 879
N= 10.000 n = 370 n= 964
N= 100.000 n = 383 n= 1056
N= 1.000.000 n = 384 n= 1066
N= 2.000.000 n = 384 n= 1066

Tabla 2
Cuando la población es muy pequeña y el error tolerado muy pequeño, prácticamente hay
que tomar a toda o casi toda la población. En la tabla 3 tenemos el tamaño de muestra para
poblaciones entre 25 y 40 sujetos (40 puede ser el tamaño típico de muchas clases) a partir de la
fórmula [9]. El nivel de confianza es α = .05.
Tamaño Tamaño
de la error tolerado de la error tolerado
población población
N e = .05 e = .03 N e = .05 e = .03
40 36 38 32 30 31
39 35 38 31 29 30
38 35 37 30 28 29
37 34 36 29 27 28
36 33 35 28 26 27
35 32 34 27 35 26
34 31 33 26 24 25
33 30 32 25 24 24

Tabla 3
Con un error tolerado del 5% y poblaciones entre 25 y 15 sujetos la muestra debe ser N–1
(podemos prescindir de un sujeto) y con menos de 15 sujetos debemos incluir a toda la
población. En determinados casos el número real de respuestas en una clase (ejemplo típico) es
muy bajo y podemos preguntarnos en qué medida los resultados (por ejemplo de una escuela, de
una clase) son fiables.
En ocasiones podemos comprobar a posteriori, y con una razonable seguridad, si con una
muestra inadecuada (en tamaño y falta de aleatoriedad) hemos obtenido unos resultados válidos.
Un ejemplo típico es cuando los alumnos evalúan a sus profesores y responden muy pocos
alumnos; cada clase es una población y obviamente la muestra que ha respondido, si es muy
pequeña, no representa en principio a la población (a toda la clase).
En un caso semejante podemos calcular, tomando a la clase como unidad de análisis
(como si cada clase fuera un sujeto), la correlación entre proporción de respuestas y media del
profesor en cualquier ítem (o en la media de todos). Si la correlación es cero o muy baja

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


12

podemos concluir que el número de respuestas no tiene que ver con cómo es evaluado un
profesor3.
3.2.2.2. Margen de error al extrapolar de la muestra a la población
Si conocemos el tamaño de la población N y el tamaño de la muestra n, y establecemos un
nivel de confianza determinado (al que corresponde un valor de z en la fórmula), podemos
averiguar, como hicimos antes con la fórmula para poblaciones infinitas, el margen de error (e)
con el que podemos extrapolar los resultados a toda la población. En estas fórmulas nos
limitamos a despejar el valor del error; este cálculo es útil porque con frecuencia partimos
simplemente de la muestra que hemos podido conseguir.

(pqz 2 )(N − n) ⎡ pqz 2 ⎤ ⎡ N − n ⎤


e= o también e= ⎢ ⎥⎢ ⎥ [10]
n(N − 1) ⎣ n ⎦ ⎣ N −1 ⎦

⎛ N−n⎞
En poblaciones infinitas suponemos que el segundo miembro ⎜ ⎟ es igual a 1.
⎝ N −1 ⎠
Por ejemplo, de una población N = 360 (pueden ser los alumnos de una Facultad)
disponemos de los datos de una muestra n = 151. Si aceptamos un nivel de confianza del 95%
(que corresponde a un valor de z = 1.96), ¿con qué margen de error podemos extrapolar los
resultados a toda la población?

⎡ (.25)(1.96 2 ) ⎤ ⎡ 360 − 151⎤


e= ⎢ ⎥ ⎢ 360 − 1 ⎥ = .0608, o un 6.1% de margen de error.
⎣ 151 ⎦⎣ ⎦
Si de una población N = 1000 tenemos datos de 200 sujetos (n = 200), el margen de error
es semejante (6.2%). En todas estas fórmulas ya hemos indicado que el valor de pq es constante
(.50 x .50 = .25): suponemos la máxima varianza posible en la población. Como la varianza de la
población (que en principio nos es desconocida) no tiene por qué ser la máxima posible, todas
estas fórmulas tienden de hecho a sobrestimar el tamaño de la muestra.
Una aplicación práctica de la fórmula [10] es conocer el margen de error con el que
podemos extrapolar los resultados a las subpoblaciones que corresponden a las diversas
submuestras.
Por ejemplo: en un campus de una universidad la población es exactamente de 2962
alumnos. En una encuesta de evaluación de la universidad, y por lo que respecta a los alumnos
de todo el campus, con un nivel de confianza del 95% (z = 1.96) y un margen de error del 3%
necesitaremos este número de alumnos según la fórmula [9]:
2962
n= = 784.68 (= 785)
.03 2 (2962 − 1)
1+
(1.96 2 )(.25)
En este campus hay cuatro facultades; en una de ellas el número total de alumnos
(subpoblación) es N = 884, de los que han respondido al cuestionario una muestra de n = 291
alumnos. ¿Con qué margen de error podemos extrapolar los resultados de esta muestra de 291
alumnos a esa subpoblación concreta de 884 alumnos? Aplicamos la fórmula [10]:

3 Algunos estudios muestran que en estos casos la correlación es muy baja y frecuentemente negativa: a menor número de
alumnos que responden a estos cuestionarios el profesor tiende a ser mejor evaluado. Este resultado tiene su lógica; los alumnos
que van siempre a clase no suelen ser los más inclinados a evaluar mal a sus profesores.

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


13

⎡ (.25)(1.96 2 ) ⎤ ⎡ 884 − 291⎤


e= ⎢ ⎥⎢ ⎥ = .047
⎣ 291 ⎦ ⎣ 884 − 1 ⎦
Redondeando tenemos un 4.7% de margen de error al extrapolar a la población.
Es decir que si un 60% por ciento responde que está satisfecho con la calidad de la
enseñanza que recibe, habrá que entender que el tanto por ciento de satisfechos está entre el
55.3% (ó 60 - 4.7) y el 64.7% (ó 60 + 4.7).
La fórmula para poblaciones finitas (tamaño conocido) es de especial utilidad en el caso de
poblaciones de tamaño moderado. Una reducción en el tamaño de la muestra puede suponer un
ahorro importante en costes y trabajo.
3.3. Observaciones sobre el tamaño de la muestra
1º Recordamos lo dicho al principio: no conviene olvidar que un tamaño adecuado de la
muestra no es suficiente para poder extrapolar los resultados; además es necesario que la muestra
sea representativa de la población. No debemos preguntarnos solamente cuántos sujetos
necesitamos, sino cómo son seleccionados (cuántos y quiénes, son las dos cuestiones
importantes para extrapolar los resultados).
Cuando no es posible seleccionar una muestra aleatoria (trabajamos, por ejemplo, con
grupos hechos) hay que tenerlo en cuenta en la interpretación de los resultados. Siempre
podemos preguntarnos ¿A qué población puede representar esta muestra?
2º Una muestra grande, o mayor de lo que realmente necesitamos según las fórmulas
adecuadas, no es mejor necesariamente ni garantiza por sí sola el poder extrapolar los resultados
con un menor margen de error. Una muestra grande puede estar sesgada, a veces precisamente
por ser una muestra muy grande, con determinados segmentos de la población poco
representados o representados en exceso.
3º Si nos encontramos de hecho con una muestra grande, podemos intentar dividirla en
submuestras según características importantes y verificar en qué medida estas submuestras están
representadas en la proporción que les corresponde (tendríamos en este caso un muestreo por
cuotas). Podemos también reducir el tamaño de alguna submuestra, o eliminarla y no tenerla en
cuenta… en cualquier caso debemos examinar y describir bien la muestra para interpretar los
resultados.
4º Ya hemos visto que una muestra puede ser adecuada para extrapolar los resultados a
toda una población general previamente definida, pero cada submuestra (varones y mujeres,
subgrupos de edades, cursos, etc.) puede no tener el tamaño suficiente para extrapolar los
resultados a cada subpoblación con el mismo margen de error. Ya hemos indicado la fórmula
adecuada [10] para verificar estos márgenes de error.
El margen de error en las submuestras será mayor que en la población, pero también puede
ser una información útil y así se ve con frecuencia en los resultados publicados de encuestas
sociológicas, con un margen de error al extrapolar a toda la población y otros márgenes de error
mayores al extrapolar a las subpoblaciones.
4. Número de sujetos para construir un instrumento de medición
Por lo que respecta al número de sujetos cuando se trata de construir un instrumento de
medición como un test o una escala de actitudes, los análisis requeridos también imponen un
mínimum de sujetos, independientemente de otros criterios.

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


14

Para hacer bien el análisis de ítems debe de haber al menos unos cinco sujetos por ítem
inicial; por lo tanto si se parte de 60 ítems, con este criterio (que tomamos de Nunnally, 1978,
que lo propone como número mínimo) harán falta 300 sujetos. Como criterio general es
preferible tener más sujetos que menos; con más sujetos los resultados de los análisis serán más
estables; si son pocos los sujetos es más probable que los ítems discriminen de manera distinta
en otras muestras. Si además pensamos llevar a cabo un análisis factorial del instrumento
tenemos que pensar también en el número de sujetos necesario para hacer este análisis (lo vemos
más adelante).
La experiencia muestra por otra parte que se pueden construir instrumentos con muestras
muy pequeñas (con muchos menos sujetos de los requeridos, por ejemplo los sujetos disponibles
en nuestras clases…), pero utilizando varias muestras se pueden ir acumulando los análisis y
verificar qué ítems mantienen una discriminación aceptable.
También cabe, por supuesto, combinar los datos de cada ítem (medias y desviaciones)
procedentes de diversas muestras hasta conseguir una muestra del tamaño adecuado y calcular el
coeficiente de fiabilidad en la muestra total.
Ciertamente, cuando se pretende construir un instrumento, es preferible utilizar muchos
sujetos que pocos, pero como siempre en estos casos no hay que pensar solamente en el número
sino en el tipo de muestra; debe ser suficientemente representativo de la población con la que se
va a utilizar el instrumento (población general, universitarios, etc.).
5. Número de sujetos para el análisis factorial
a) No existe un criterio o norma definitiva sobre el número de sujetos necesario4; además
no hay que tener en cuenta solamente el número de sujetos en términos absolutos, sino que es
importante la proporción de sujetos con respecto al número de variables.
b) En el análisis factorial hacen falta en principio muestras grandes, porque el análisis
factorial se basa en coeficientes de correlación y el error típico de las correlaciones (su
oscilación probable de muestra a muestra) disminuye si aumenta el número de sujetos. Con
muestras pequeñas se pueden ir acumulando muchos errores de medición a lo largo del proceso
y aparecen factores puramente casuales, debidos a particularidades de la muestra.
c) Por otra parte con muestras relativamente pequeñas podemos encontrar con más
facilidad ítems que definen más de un factor; si esto sucede con muestras grandes una
explicación puede ser que el ítem no es apropiado; si esto sucede con muestras pequeñas no
sabemos si debe a la formulación del ítem o a peculiaridades de la muestra (Osborne y Costello,
2004).
d) La recomendación habitual es utilizar una muestra 10 veces mayor que el número de
variables o ítems (N = 10k donde k es el número de ítems o variables; Nunnally, 1978;
Thorndike, 1982). Otros autores (Guilford, 1954; Kline, 1986, 1994) estiman suficiente una
muestra menor, dos o tres veces el número de variables (N = 2k ó 3k), con tal de que el número
de sujetos no sea muy inferior a 200. Muestras más pequeñas pueden ser aceptables si vamos a
replicar el análisis en varias muestras (Kline, 1986:188).
e) La recomendación mínima que podemos hacer es utilizar muestras de al menos 150 o
200 sujetos aunque las variables (ítems) sean muy pocas (Kline, 1994:74, 79, pone el número

4 Los diversos criterios propuestos por diversos autores sobre el número de sujetos en el Análisis Factorial pueden verse
comentados en Garson (2003), Mundfrom et al. (2003) y Osborne y Costello (2004). El número de sujetos en el Análisis
Factorial lo tratamos también en otro lugar (Morales, 2010).

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


15

mínimo en unos 100 sujetos); y el número de sujetos debe ser al menos el doble del número de
variables.
f) Cuando el número de variables (ítems) es excesivo con relación al tamaño de la muestra
(N pequeño), una sugerencia de Marsh y O'Neill (1984) es reducir el número de variables
agrupándolas de dos en dos. Según estos autores las respuestas a dos ítems (o incluso más) se
suman y constituyen una nueva variable. De esta manera el número de sujetos aumenta en
proporción al número de variables. Las variables agrupadas tienen que ser razonablemente
homogéneas, y esta homogeneidad debe ser comprobada empíricamente mediante la correlación
ítem-total, que no debe ser inferior a .30 según estos autores.
Con este procedimiento las nuevas variables tienen una fiabilidad mayor (un componente
específico, no común a las otras variables, menor) y se ven menos afectadas por peculiaridades
de la redacción; se pierde en cambio información sobre las variables individuales.
La misma orientación la vemos en Cattell y Cattell (1995) en la preparación de la quinta
edición de su test de personalidad (16PF). La razón aducida no es aumentar la proporción de
sujetos por ítem, sino que dos o tres ítems agrupados tienen más fiabilidad que separados y la
estructura factorial es más clara. Las subescalas de 14 ítems se reducen a 6 sumando los ítems
que tienen entre sí sus mayores correlaciones.
c) Si la muestra es suficientemente grande, algunos autores (Amstrong y Soelberg, 1968)
sugieren subdividirla y hacer el análisis factorial en las diversas submuestras. El repetir el
análisis factorial en muestras distintas es la mejor manera de verificar si los factores se
mantienen.
6. Tamaño de la muestra en estudios de carácter empírico o experimental
Ahora tratamos sobre el número de sujetos en los estudios experimentales (o cuasi-
experimentales), más relacionados con la t de Student y el análisis de varianza, y en los análisis
correlacionales en general.
El primer punto va a ser recordar las variables que en estos casos intervienen en la
determinación del tamaño de la muestra.
6.1. Variables que intervienen en la determinación del tamaño de la muestra
Aunque en la práctica podemos limitarnos a consultar unas tablas, es muy conveniente
conocer con qué criterios están hechas estas tablas. Se trata de las variables de las que depende el
tamaño de la muestra.
1. El nivel de confianza (que solemos expresar así: α = .05, α = .01). Si escogemos un
nivel de confianza de .05 (como es práctica común) queremos decir que aceptamos un 5% de
probabilidades de error al rechazar la Hipótesis Nula (de no diferencia). Se trata de minimizar el
denominado error Tipo I (aceptamos pocas probabilidades de equivocarnos cuando afirmamos
una diferencia o una relación).
2. La potencia de la prueba. Por potencia entendemos la probabilidad de no cometer el
error denominado Tipo II: no rechazar la Hipótesis Nula cuando podríamos haberla rechazado.
La probabilidad de cometer este tipo de error se simboliza como β, y la potencia es por lo tanto
1-β. Podemos definir la potencia como la probabilidad de rechazar una Hipótesis Nula que es
falsa.
De la misma manera que un nivel de confianza de α = .05 es habitualmente aceptado como
razonable, por lo que respecta a la potencia (1-β) se estima que es razonable establecer una
potencia de .80, es decir tener un 80% de probabilidades de detectar una diferencia (o relación)

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


16

de una determinada magnitud5. Si deseamos una potencia mayor (.90 o incluso 1) el tamaño
requerido de la muestra puede ser ya excesivamente grande.
El error Tipo I (decir sí cuando habría que decir que no hay diferencia, relación, etc.) es
más serio que el error Tipo II (decir no cuando podríamos haber dicho que sí), de ahí la práctica
generalizada de utilizar unos niveles de confianza muy estrictos, como son .05 ó .01: aceptamos
muy pocas probabilidades de equivocarnos cuando afirmamos una diferencia. Si establecemos
un nivel de significación muy estricto (un valor de a muy bajo) es muy improbable que
cometamos el error Tipo I: si rechazamos el azar (o la variabilidad normal) como explicación de
una diferencia es muy poco probable que nos equivoquemos.
Lo que sucede es que con un valor muy bajo de α podemos caer en el error Tipo II: puede
ser que la Hipótesis Nula sea falsa, pero como somos muy estrictos en nuestro nivel de confianza
no llegamos a rechazarla (la Hipótesis Nula se rechaza con mayor facilidad con α = .05 que con,
por ejemplo, α = .001). En la práctica hay que sopesar ambos tipos de error. El minimizar el
error Tipo I no significa que no tengamos que prestar atención al error Tipo II. Aunque las
decisiones sobre el tamaño de la muestra se toman frecuentemente en función de los datos
disponibles, o imitando lo que han hecho otros, no es racional, (como señala Cohen, 1988:55), el
determinar el tamaño de la muestra sin tener en cuenta el error Tipo II.
3. La magnitud de la diferencia (o de la relación, etc.) que deseamos detectar y que
solemos denominar tamaño del efecto. El término efecto no implica causalidad, sino
simplemente el grado en que un fenómeno (diferencia, relación, etc.) está presente.
Lo normal es buscar resultadas (diferencias, relaciones,) estadísticamente significativos y
no tanto pensar en qué magnitud podríamos estar interesados. Sin embargo la magnitud es un
dato obviamente importante y para poder valorar adecuadamente los resultadas obtenidos (sin
que esto quiera decir que las única magnitudes de interés sean las grandes).
La implicación de la magnitud en el tamaño de la muestra es obvia: cuando las diferencias
son grandes, nos bastan pocos sujetos para detectarlas, pero cuando son muy pequeñas
necesitamos muchos sujetos; si solamente nos interesan diferencias grandes, necesitaremos
muchos menos sujetos. Podemos intuirlo con un ejemplo muy claro. Si estamos interesados en
comprobar si difieren en altura los escandinavos y los twa (pigmeos de Ruanda y Burundi) no
necesitaremos muchos sujetos en las muestras; nos bastarán muy pocos sujetos de cada grupo
para caer en la cuenta de que se trata de poblaciones muy distintas en altura. En cambio si se
trata de encontrar diferencias pequeñas entre las poblaciones, no nos bastará con comparar
muestras de tamaño pequeño. Es claro por otra parte que con muestras grandes es fácil encontrar
diferencias estadísticamente significativas pero pequeñas y con frecuencia irrelevantes.
Al planificar cualquier tipo de experimento o análisis debemos tener en cuenta también en
qué tipo de magnitud estamos interesados, porque si solamente son de interés magnitudes más
bien grandes podemos ahorrar costes y trabajo utilizando muestras relativamente pequeñas.
4. La varianza de la población: ya sabemos que si los sujetos son muy iguales dentro de
cada grupo, necesitaremos muestras menores para detectar diferencias (si todos son de idéntica
altura, o todos piensan lo mismo, etc., nos bastaría un solo sujeto de cada grupo para ver si hay
alguna diferencia entre los grupos).

5 La recomendación de establecer una potencia de .80 la propone y justifica Cohen (1988:56; Jacob Cohen es la fuente
principal que suele seguirse en este tema). El peligro de cometer el error Tipo II queda reducido a .20 (20% de probabilidades) y
está en equilibrio con α = .05; suponemos que el error Tipo I es cuatro veces más serio que el error Tipo II (.20 es cuatro veces
.05). esta recomendación no es tan seguida cono la de establecer un nivel de confianza de .05, porque con frecuencia no se tiene
en cuenta el error Tipo II.

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


17

Estas cuatro variables se combinan en las fórmulas apropiadas para determinar el tamaño
óptimo de las muestras. Aunque en principio son preferibles las muestras grandes, por razones de
economía (costos, trabajo) podemos calibrar el tamaño de la muestra de acuerdo con nuestras
especificaciones en estas cuatro variables.
No necesitamos aplicar las fórmulas para conocer el tamaño de la muestra porque ya
disponemos de tablas para las situaciones más frecuentes; las tablas que ponemos aquí están muy
reducidas pero pueden ser suficientes como orientación sobre el tamaño de la muestra que
debemos buscar (tablas más completas pueden encontrase en los autores que citamos y en otros).
Sí es de interés conocer qué variables inciden en el número de sujetos que necesitamos.
No sobra recordar aquí que el tamaño de la muestra es importante, pero no es la única
característica de la muestra que nos interesa. En diseños experimentales en sentido propio
necesitaremos muestras aleatorias, y en cualquier caso siempre debemos preguntarnos a qué
población pueden estar representando las muestras que utilizamos.

6.2. Tamaño de cada muestra cuando comparamos dos grupos (t de Student)


En la tabla 4 tenemos el tamaño de cada muestra necesario para comparar dos muestras6.
Tablas semejantes, más o menos extensas o adaptadas, pueden encontrarse en diversos autores;
no siempre coinciden exactamente las cifras del número de sujetos debido al distinto redondeo
de decimales al aplicar las fórmulas.
Suponemos: varianzas iguales,
muestras de idéntico tamaño,
hipótesis bilaterales
potencia (1-β) de .80

nivel de
confianza d =.20 d = .30 d =.50 d = .70 d =.80 d =.1.0 d = 1.20

.05 392 174 63 32 25 16 12


.01 586 260 93 48 36 23 18
Tabla 4
Estamos suponiendo muestras de idéntico tamaño, pero si tenemos ya una muestra con un
determinado número de sujetos, podemos calcular el tamaño necesario en la otra muestra.
(n disponible )(n tablas )
La fórmula [Cohen, 1988:59] es ésta: n nuevo = [11]
2n disponible − n tablas

Vamos a suponer, por ejemplo, que tenemos ya un grupo experimental de 40 sujetos que
ha tenido una determinada experiencia y deseamos compararlo con otro (grupo de control, o al
menos como término de comparación); estamos interesados en detectar al menos una diferencia
moderada (d = .50) a un nivel de confianza de α = .05: ¿Cuántos sujetos deberemos incluir en el
nuevo grupo de control? En las tablas vemos que necesitaríamos 63 sujetos en cada grupo; por lo
tanto el tamaño del nuevo grupo deberá ser:
(40)(63)
n nuevo = = 148
(2x40) − 63

6 Valores seleccionados de la tabla 2.4.1 de Cohen (1988). Tablas semejantes podemos verlas en otros autores, como por
ejemplo Light, Singer y Willett, J.B., (1990).

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


18

6.3. Tamaño de la muestra en el análisis de varianza


6.3.1. Cuando tenemos más de dos muestras (análisis de varianza unifactorial)
En la tabla 57 tenemos el número de sujetos necesario en cada muestra cuando tenemos
más de dos muestras (entre tres y seis muestras).
En esta tabla hemos puesto como orientación los valores correspondientes a α = .05 y 1-β
(potencia) de .70 y .80; suponemos también un número idéntico de sujetos en cada muestra.
Podemos tomar como referencia de magnitud o el valor de ω2 o el valor de f, el tamaño del
efecto propuesto por Cohen (1988) cuando tenemos más de dos grupos8
a) El coeficiente ω2 nos cuantifica el grado de asociación entre la variable
independiente (el pertenecer a uno u otro grupo) y la variable dependiente.
b) El tamaño del efecto f propuesto por Cohen (1988) cuando tenemos más de dos
grupos9.
Cuando tenemos solamente dos grupos, ya sabemos que el tamaño del efecto es igual a la
diferencia entre las dos medias dividida por la desviación típica combinada.
Cuando hay más dos grupos el denominador es el mismo, pero lo que tenemos en el
numerador es la dispersión o desviaciones de todas las medias con respecto a la media común
(un valor análogo a la desviación típica de las medias). En la práctica el cálculo más sencillo de f
es a partir de ω2 (que es habitual calcular como complemento al análisis de varianza); ambos
valores están relacionados de esta manera:
ω2
f= [12]
1− ω 2
Realmente si hemos calculado ω2 ya no necesitamos conocer el valor de f, pues no va a
aportar una información que nos lleve a una interpretación o a una valoración distinta. Por lo que
respecta a tener una orientación sobre el tamaño de la muestra, nos basta consultar las tablas
teniendo en cuenta, al menos de manera aproximada, el tipo de magnitud en la que estamos
interesados.
Las valoraciones (magnitud pequeña, moderada y grande) son de Cohen y constituyen una
referencia comúnmente aceptada como guía orientadora. Los tres valores de f = .10, .25 y .40
equivalen a .20, .50 y .80 cuando se trata de comparar dos medias (Cohen 1988:284-288).
Suponemos que las k muestras son de idéntico tamaño; si son de tamaño desigual podemos
utilizar el tamaño medio de las muestras (N/k)10.
Los valores tabulados son el número de sujetos en cada muestra. En el caso de tres
muestras, si estamos interesados en verificar solamente si hay diferencias valoradas como

7 Los valores de referencia seleccionados en la tabla están tomados de Cohen (1988, tablas 8.4.4 y 8.4.5); también pueden
verse en Kirk (1995:186 y tabla E.13). Las tablas de Cohen (válidas hasta 25 muestras) son más fáciles de consultar, y utiliza f
como criterio de magnitud; otros autores como Kirk utilizan ambos valores f y ω2. Cohen utiliza el símbolo η2 en vez de ω2 (y
comenta la falta de unanimidad en los símbolos en p. 282)
8 Ponemos los dos valores porque podemos encontrar los dos como referencia en otras tablas.
9 Explicado por Cohen (1988:274ss, 284). Se trata de un tamaño del efecto global, teniendo en cuenta todas las diferencias
de las medias con respecto a la media total (no se trata de la diferencia entre dos medias, como sucede en el tamaño del efecto
convencional al comparar dos medias).
10 Las implicaciones del tamaño desigual pueden vese comentadas en Cohen (1988:360ss). Si las muestras mayores tienen
también las mayores medias, el tamaño del efecto será mayor que si las muestras fueran de idéntico tamaño y también será mayor
la potencia (y a la inversa también es verdad).

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


19

grandes y con una probabilidad de encontrarlas (si las hay) del 80%, necesitaremos una muestra
total de (21)(3) = 63 sujetos; si en cambio consideramos un buen resultado el encontrar
diferencias pequeñas (pero significativas), necesitaremos una muestra total de (322)(3) = 966
sujetos.

número magnitud
de pequeña moderada grande
potencia ω2 = .01 ω 2 = .06 ω 2 = .14
grupos
f = .10 f = .25 f = .40
3 .70 258 42 17
.80 322 52 21
4 .70 221 36 15
.80 274 45 18
5 .70 195 32 13
.80 240 39 16
6 .70 175 29 12
.80 215 35 14
Tabla 5
Comparando los valores correspondientes a una potencia de .70 y 80 podemos apreciar
cómo al disminuir el número de sujetos disminuyen también las probabilidades de rechazar la
Hipótesis Nula.
6.3.2. Tamaño de la muestra en los diseños factoriales (análisis de varianza, dos factores)
En la tabla 6 tenemos el número necesario de sujetos en cada celda cuando tenemos dos
criterios de clasificación (o factores) divididos en entre dos y cuatro niveles. Suponemos que en
cada clasificación hay un idéntico número de sujetos, como es usual en estos planteamientos.
Suponemos también un nivel de confianza de α = .05 y una potencia (1-β) de .70 o de .80
En estas tablas los niveles (o subclasificaciones) de cada factor pueden ser 2, 3 ó 4.
Para valorar la magnitud utilizamos los mismos criterios de la tabla 511
El número total de sujetos será igual al número de sujetos que aparece en la tabla
multiplicado por el número de subclasificaciones o celdas. En una tabla 2x3 tenemos 6 celdas; si
estamos interesados en detectar diferencias moderadas y potencia de .70, el número total de
sujetos será 6x21 = 126, y con potencia de .80 6x26 = 156.
El número de sujetos especificado en la tabla es suficiente para detectar si uno de los dos
factores (o los dos) es estadísticamente significativo (si hay diferencias entre los niveles de cada
factor, o, lo que es lo mismo, entre las medias de cada columna o de cada fila), pero en el caso de
la interacción con estos mismos números la potencia es menor porque intervienen menos sujetos
(no los totales de cada fila o columna sino los que hay en cada clasificación).

11 Los valores del tamaño de la muestra (en cada clasificación), puestos como referencia orientadora, están seleccionados de
las extensas tablas de Kirk (1995:401 y tabla E.13).

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


20

Tamaño magnitud
de la pequeña moderada grande
potencia ω2 = .01 ω 2 = .06 ω 2 = .14
tabla
f = .10 f = .25 f = .40
2x2 .70 152 25 11
.80 193 32 13
2x3 .70 127 21 9
.80 158 26 11
2x4 .70 109 18 8
.80 134 22 9
3x3 .70 85 14 6
.80 106 18 7
3x4 .70 73 12 5
.80 90 15 6
4x4 .70 55 9 4
.80 67 12 5
Tabla 6

6.4. El tamaño de la muestra en estudios correlacionales


Como en otros casos semejantes, si estamos interesados en coeficientes grandes (.70 o
más) los detectaremos con facilidad en muestras pequeñas; si estamos interesados en coeficientes
pequeños, necesitaremos muestras mucho mayores.
El determinar cuándo un coeficiente es suficientemente grande depende del uso que
vayamos a hacer de ese coeficiente. Si nuestro interés está en predecir resultados futuros (y con
mayor razón si la medición va a tener consecuencias importantes, por ejemplo en pruebas de
admisión o selección) los coeficientes bajos serán de poca utilidad; coeficientes mayores y con
muestras grandes (para que el margen de error sea pequeño) nos darán una información más útil.
En términos generales y orientadores Cohen (1988:79-81) da estas valoraciones: r = .10
relación baja, r = .30 relación moderada y r = .50 relación grande.
Estas valoraciones pueden parecer muy modestas; después de todo una correlación de .10
quiere decir un 1% de varianza compartida por las dos variables, y una correlación de .30 no
llega a un 10% de varianza compartida.
La razón de estas valoraciones (juzgar como moderado o medio lo que es claro que en
términos absolutos es pequeño) está en que las ciencias sociales (de la conducta) son ciencias
blandas y las verdaderas relaciones están muy atenuadas o empequeñecidas por todo tipo de
ruidos, como son la baja fiabilidad de muchos instrumentos12 o, quizás en un mayor grado, por
la poca o discutible fidelidad del instrumento al constructo teórico.
El que la correlación sea pequeña puede significar no que sea realmente tan pequeña sino
que medimos mal las variables, o que esta correlación está contaminada por otras variables que
no tenemos en cuenta; casi nunca medimos variables puras (así la inteligencia, tal como la
medimos, puede estar contaminada por niveles de educación, etc.). Las relaciones observadas
(medidas) entre constructos pueden ser mucho más bajas de lo que serían si fuera posible medir

12 Es posible aplicar las fórmulas de corrección por atenuación que dan una estimación de la correlación que podríamos
obtener si la fiabilidad fuera perfecta.

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


21

rasgos puros, sin contaminaciones de todo tipo13. Por este tipo de razones podemos estar
interesados en detectar correlaciones (significativas, no aleatorias) tan bajas como .10.
Coeficientes de correlación muy pequeños, si son significativos (es decir, que probablemente no
son cero en la población), pueden estar indicando alguna ley psicológica14.
Algunos autores15 señalan que una correlación de .30 (también aparentemente baja) viene a
indicar el tipo de relación que un observador puede observar casualmente; es una relación
detectable a simple vista; por ejemplo, cuando un profesor cae en la cuenta, al cabo de los años,
de que entre los alumnos que se sientan en las últimas filas y junto a una ventana hay una
proporción mayor de suspensos… esa relación observable podría ser del orden de r = .30 y
ciertamente puede ser relevante.
Debemos tener en cuenta que a veces intentamos medir sentimientos profundos, recuerdos
del pasado, valoraciones difíciles de hacer, etc., con preguntas sencillas que con frecuencia se
responden muy rápidamente y sin mayor cuidado16; quizás no tenemos otra manera mejor de
hacerlo en un momento dado, pero en cuanto instrumentos de medición resultan muy pobres
(aunque pueden ser muy útiles).
En la tabla 7 seleccionamos el tamaño de la muestra necesario para detectar
a) una serie de valores de coeficientes de correlación (entre. 10 y .70) como referencia
útil;
b) a un nivel de confianza de α = .05
c) y para una potencia de .70, .80 y .9017.
coeficientes de correlación
potencia
.10 .20 .30 .50 .70
.70 616 153 67 23 10
.80 783 194 85 28 12
.90 1047 259 113 37 16

Tabla 7
Si estamos interesados en una correlación tan baja como .10, con una muestra de 1047
sujetos tenemos un 90% de probabilidades de encontrarla (si se da)18. Si nuestro interés está en
coeficientes muy altos, nos bastarán pocos sujetos para detectarlos.
Conviene recordar que si tenemos una correlación de una determinada magnitud y
estadísticamente significativa obtenida en una muestra, podemos extrapolar a la población el
hecho de la relación (distinta de cero), pero no su magnitud. Para determinar la magnitud de la

13 Cohen (1988:79) aduce (sin dar la cita) el comentario Thurstone: en psicología medimos a los hombres por sus sombras.
14 Guilford y Fruchter (1973:92). Correlaciones estadísticamente significativas pero muy bajas (de ninguna utilidad práctica)
entre variables medidas de manera muy modesta (como simples preguntas para captar situaciones complejas o lejanas en el
tiempo) pueden constituir una buena indicación para intentar medir las mismas variables con instrumentos más perfeccionados y
verificar de nuevo esas relaciones.
15 Por ejemplo Cohen P. (1981) y Cohen J. (1988:80), y también otros autores hacen la misma observación. Cohen J.
(1988:80) cita coeficientes de correlación importantes que son de este tipo de magnitud (.30).
16 Se podría decir, en relación a las preguntas de muchos cuestionarios y a cómo se responden, que lo que hacemos con
frecuencia es intentar atrapar sentimientos con un cazamariposas. A veces podemos sospechar que una correlación muy
pequeña, detectada con instrumentos muy pobres, es simplemente la punta del iceberg. Para Cohen (1988:79) muchas de las
correlaciones que podemos buscar en las ciencias blandas de la conducta son del orden de .10 ya que en las variables, tal como
las operacionalizamos, hay muchos ruidos (falta de fiabilidad o de fidelidad al constructo teórico, etc).
17 Los valores seleccionados están tomados de la tabla 3.4.1 de Cohen (1988)
18 Dicho con más propiedad, tenemos un 90% de probabilidades de rechazar (propiamente de no aceptar) la Hipótesis Nula
de no relación en el caso de que sea falsa.

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


22

correlación en la población debemos calcular los intervalos de confianza. Aquí entra el error
típico de la correlación, que depende del número de sujetos (es menor si aumenta el tamaño de la
muestra). Si deseamos una estimación muy precisa de la correlación en la población
necesitaremos siempre un número grande de sujetos.
7. Cuando N = 1
Tratando del número de sujetos, podemos preguntarnos ¿Es posible hacer estudios
experimentales, con tratamiento estadístico, cuando N = 1? La respuesta es sí. El estudio de
casos individuales puede ser de gran interés para investigar resultados de terapias individuales;
en psicología clínica y en educación especial. Estos estudios con N = 1 pueden tener una clara
significación clínica y práctica. El método requiere obtener del sujeto varias medidas antes y
después de un tratamiento. Por otra parte varios estudios con N =1 pueden integrarse después,
también con los análisis estadísticos adecuados19.

8. Referencias bibliográficas
AMSTRONG, J. C. and SOELBERG, P., (1968), On the Interpretation of Factor Analysis,
Psychological Bulletin, 70, 361-364.
BUSSE, R. T.; KRATOCHWILL, THOMAS R. and ELLIOT, STEPHEN N., (1995), Meta-Analysis for
Single-Case Consultation Outcomes: Applications to Research and Practice, Journal of
School Psychology, 33 (4), 269-285.
CATTELL, RAYMOND B. and CATTELL, HEATHER E.P., (1995), Personality Structure and The
New Fifth Edition of the 16PF, Educational and Psychological Measurement, 55, 6, 926-
937.
COHEN JCOB (1988). Statistical Power Analysis for the Behavioral Sciences, second edition.
Hillsdale, N.J.: Lawrence Erlbaum.
COHEN, PETER A. (1981). Student Ratings of Instruction and Student Achievement: A Meta-
analysis of Multisection Validity Studies. Review of Educational Research, 51, 281-309
GARSON, G. DAVID (2003). PA 765 Statnotes: An Online Textbook
http://www2.chass.ncsu.edu/garson/pa765/statnote.htm, Factor Analysis
http://www2.chass.ncsu.edu/garson/pa765/factor.htm (última revisión 27, 08, 2003)
GUILFORD, J. P. and FRUCHTER, B., Fundamental Statistics in Psychology and Education, 1973,
New York, McGraw-Hill.
GUILFORD, J.P., (1954), Psychometric Methods, New York, McGraw-Hill.
HERNÁNDEZ SAMPIERI, ROBERTO; FERNÁNDEZ COLLADO, CARLOS y BAPTISTA LUCIO, PILAR
(2008). Metodología de la Investigación. Cuarta Edición. México: McGraw-Hill
HERSEN, MICHEL (1990), Single-Case Experimental Designs, en BELLACK, ALAN S., HERSEN,
MICHEL and KAZDIN, ALAN E., (eds.) International Handboock of Behavior Modification
and Therapy (2nd edit.), New York and London, Plenum Press, 175-212 (438/701).
KENNEDY, CRAIG H. (2004). Recent Innovations in Single-Case Designs . Journal of Behavioral
Education, Dec2004, Vol. 13 Issue 4, 209-211
KIRK, ROGER E., (1995). Experimental Design, Procedures for the Behavioral Sciences. Boston:
Brooks/Cole.
KLINE, PAUL, (1986), A Handbook of Test Construction, New York, Methuen.
KLINE, PAUL (1994). An Easy Guide to Factor Analysis. Newbury Park: Sage

19 El sujeto único puede ser también una clase o una agrupación (Lundervold y Belwood, 2000). No es éste el lugar para
explicar estos procedimientos; se puede sugerir una bibliografía indicativa; por ejemplo Hersen (1990); Sharpley (1990),
McGuigan (1993) (dedica un capítulo al análisis de diseños de caso único, lo mismo que otros autores), Kratochwill, Mott, y
Dodson, (1984), Buse, Kratochwill y Elliot (1995, que presentan un meta-análisis con 44 estudios con N entre 1 y 4);
Lundervold y Belwood (2000); Olive y Smith (2005); Kennedy (2004) tiene la introducción de un número monográfico del
Journal of Behavioral Education dedicado al caso único (single case).

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


23

KRATOCHWILL, THOMAS R., MOTT, STACEY y DODSON, CECILIA L. (1984). Estudio de caso e
investigación de caso único. En BELLACK, ALAN S. y HERSEN, MICHAEL (Eds.), Métodos
de Investigación en Psicología Clínica (pp. 67-114). Bilbao: Desclée de Brouwer
LIGHT, R.J., SINGER, J. D. and WILLETT, J.B., (1990) By Design, Planning Research on Higher
Education, Cambridge, Mas., Harvard University Press.
LUNDERVOLD, DUANE A. and BELWOOD, MARILYN F. (2000). The Best Kept Secret in
Counseling: Single-Case (N = 1) Experimental Designs. Journal of Counseling &
Development, Winter 2000, Volume 78, 92-102.
MARSH, H.W. and O'NEILL, R., (1984), Self-Description Questionnaire III: the Construct
Validity of Multidimensional Self-Concept Ratings by Late Adolescents, Journal of
Educational Measurement, 21, 153-174.
MCGUIGAN, F.J., (1993), Experimental Psychology, Methods of Research, Sixth edit.,
Englewood Cliffs, N.J., Prentice-Hall.
MORALES VALLEJO, PEDRO (2010). El análisis factorial en la construcción e interpretación de
tests, escalas y cuestionarios
http://www.upcomillas.es/personal/peter/investigacion/AnalisisFactorial.pdf (última
revisión, 15 de Mayo de 2010)
MUNDFROM, DANIEL J.; SHAW, DALE G.; LU KE, TIAN, KNOFCZINSKI, GREG and MCFANN,
KIM (2003). Minimum Sample Size for Exploratory Factor Analysis. Paper presented at the
Annual Meeting of the American Educational Research Association, April 21, 2003,
Chicago, IL.
NUNNALLY, J.C., (1978), Psychometric Theory, New York, McGraw-Hill.
OLIVE, MELISSA L. and SMITH, BENJAMIN W. (2005). Effect Size Calculations and Single
Subject Designs. Educational Psychology Vol. 25, Nos. 2–3, pp. 313–324.
OSBORNE, JASON W. & COSTELLO, ANNA B. (2004). Sample size and subject to item ratio in
principal components analysis. Practical Assessment, Research & Evaluation, 9(11).
http://PAREonline.net/getvn.asp?v=9&n=11 (consultado 17 Dic. 2004)
RODRÍGUEZ OSUNA, JACINTO (1991). Métodos de muestreo. Cuadernos metodológicos. Madrid:
Centro de Investigaciones Sociológicas (CIS).
RODRÍGUEZ OSUNA, JACINTO (1993). Métodos de muestreo. Casos prácticos. Cuadernos
metodológicos. Madrid: Centro de Investigaciones Sociológicas (CIS).
SHARPLEY, C.F., (1990), Single-Subject Research, in REEVES, JOHN P., (Ed.). Educational
Research, Methodology, and Measurement, An International Handbook, Oxford,
Pergamon Press, 580-586
STARK, PHILIP B. (Department of Statistics, University of California, Berkeley). SticiGui,
Statistics Tools for Internet and Classroom Instruction with a Graphical User
http://www.stat.berkeley.edu/users/stark/SticiGui/index.htm (chapter 18) (Content last
modified Mon 28 May 2007). (revisado 03, 09, 2008)
STATPAC INC (2003) Questionnaires & Survey Design en
http://www.statpac.com/surveys/index.htm#toc (en Sampling Methods, o directamente en
http://www.statpac.com/surveys/sampling.htm) (consultado 5 Agosto, 2010).
THORNDIKE, R.L., (1982), Applied Psychometrics, Boston, Houghton-Mifflin.
TROCHIM, WILLAM M. (Cornell University), Research Methods Knowledge Base
http://www.socialresearchmethods.net/kb/ (en Contents: Sampling, Last Revised:
10/20/2006 (consultado 2 de Sept. 2007)

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


24

Anexo. Tamaño de la muestra y números aleatorios en Internet


Los recursos disponibles en Internet son muy numerosos; aquí nos limitamos a una breve
selección.
1. Tamaño de la muestra
Son varios los programas de Internet que nos calculan el tamaño necesario de la muestra y
los intervalos de confianza (o márgenes de error) dado el tamaño de la población y también cuál
es el margen de error para un determinado tamaño de la muestra20.
Algunas direcciones útiles:
Creative Research Systems. The Survey System Sample Size Calculador
http://www.surveysystem.com/sscalc.htm
Custominsight.com: Home: http://www.custominsight.com/index.asp) En menú: insights
Survey Random Sample Calculator http://www.custominsight.com/articles/random-
sample-calculator.asp
Dimension Research, Inc. Confident Intervals for Proportion Calculator
http://www.dimensionresearch.com/index.html (tamaño de la muestra e intervalos de
confianza)
Grapentine Company, Inc. Sample Size Calculators
http://www.grapentine.com/calculator.htm
Graphpad Software Random number generator
http://www.graphpad.com/quickcalcs/randomN1.cfm
Market Research Surveys Online http://www.macorr.com/ss_calculator.htm
Raosoft sample size calculator, http://www.raosoft.com/samplesize.html
2. Números aleatorios
Random.org Web Interface to the True Random Numbers (del Department of Computer
Science, University of Dublin, Trinity College)http://www.random.org/nform.html
Surf Stat Australia, http://www.anu.edu.au/nceph/surfstat/surfstat-home/ (en tables)

20 Se pueden buscar en Google con samples size calculators

Tamaño necesario de la muestra: ¿Cuántos sujetos necesitamos?


SEMANA 2 - SESIÓN 1

Tema: ESTADÍSTICA DESCRIPTIVA - JAMOVI


- estadística descriptiva:

Medidas de resumen para variable categórica: frecuencia( f) y porcentajes %


ese 100% acumulativo es la suma del 38.2 y 61.8

Medidas de resumen para variable numérica


- Medidas de tendencia central: Moda, mediana y media

-
a) ventajas y desventajas de la media
b) mediana:

-
c) Moda: la frecuencia más alta(cantidad que se repita mas), se puede
determinar en todos los niveles( nominal, cuantitativas y ordinales), no le
afectan valores muy grandes o muy pequeños.

- Medidas de variabilidad: desviación estándar y coeficiente de variación


a) desviación estandar : cantidad promedio en que cada uno de los puntajes
individuales varía respecto a la media del conjunto de puntajes
b) coeficiente de variación: NO LO CALCULA EL JAMOVI, PERO TE DA LOS
DATOS PARA HALLAR LA ( MEDIA Y DESVIACIÓN ESTÁNDAR)
Su resultado se expresa en porcentaje

PROCEDIMIENTO EN JAMOVI :
- Si el documento e info esta en word, pasarlo a excel ( datos y cuadros).
Luego abrir el jamovi y en la opcion de las tres lineas arribita en la parte azul
presionar open,aparecerá un cuadro con los documentos que puedes abrir,
presionar la carpetita que dice BROWSE y seleccionar el documento en
excel que tenemos; una vez que tenemos la info puesta en el jamovi
seleccionar la opcion analyses , luego en descriptives y seleccionar
cualquiera de la variables que tenemos , para obtener la media, mediana y
moda

Para hallar la mediana,media y moda seleccionar en central tendecy las


opciones para activarlas( mean, median y mode)

SEMANA 2- SESION 2 -

Para hallar el coeficiente de variación tenemos que dividir la desviación estandar sobre la
media x(por( 100)

SEMANA 3 - SESIÓN 1 - GPOWER

Tema: Población y muestra. Muestreo y tipos de muestreo. Fórmulas y GPOWER

● GPOWER permite cinco tipos de cálculos de potencia, destacando el análisis de


potencia a priori
● PASOS PARA USAR GPOWER:
1. Seleccionar la prueba estadística adecuada para el problema de investigación
2. Seleccionar uno de los cinco tipos de análisis de potencia disponibles.
3. Ingresar los parámetros requeridos para el análisis.
➔ Colas
➔ Tamaño del efecto
➔ Alfa o nivel de significancia
➔ Poder o potencia

4. Hacer clic en “Calculate” para obtener los resultados.


Ejemplo 1:

Ejemplo 2:

SEMANA 4 - SESIÓN 1
Tema: Pruebas de normalidad, pruebas paramétricas o no paramétricas - Jamovi
Pruebas de normalidad:
- Histograma
- Prueba Chi-cuadrado de bondad de ajuste.
- Prueba de Kolmogorov-Smirnov (se aplica para grupos grandes, mayores a 50
personas, ya no se usa mucho)
- Prueba Shapiro - Wilk (es la prueba más potente con grupos pequeños o grandes, la
más usada. Busca evidenciar si los datos están normalmente distribuidos)

En Jamovi:
1. Se importan los datos
2. Análisis → exploración → descripciones

3. Descripciones → estadística
4. Normalidad- activar Shapiro- Wilk

*A la derecha se activarán dos shapiro- wilk, uno con una W y otra con una P. La W
nos dice que es la suma de los resultados (profe: “es cómo que tu sumes 2 mas 2, te
va a salir 4). Por otro lado, la P, nos va a decir “si ese 4” es significativo o no. Para
decir que la distribución de datos es normal, el valor de P debe ser mayor a 0.05. Si
P, tiene un valor menor a 0.05 se dice que los datos no se distribuyen normalmente.

*Se hacen estos cálculos para poder hacer inferencias estadísticas

* Cuando los datos no tienen una distribución normal, se debe tomar una prueba
paramétrica

SEMANA 5 - SESIÓN 1
Metodología de la Investigación Científica

Sesión 1 Semana 1:

Introducción a la estadística y su importancia


en la investigación psicológica. Variables
psicológicas: Cuantitativas y categóricas

Profesores:
Danitsa Alarcón, Ana María Castañeda, Ingrid Cirilo Acero, Johanna
Kohler, Carlos Carbajal, Edwin Salas, Gustavo Calderón, Jhonatan
Navarro, Carlos Portocarrero

2021-2
Recordando CIENCIA La conducta

Facultad de Ciencias de la Salud


Método
científico

Describir Explicar Predecir

Atribución de números a los


atributos o características de los Medición
objetos…
…para representar cantidades de
Permite realizar la contrastación
dicho atributo (Stevens, 1951).
de hipótesis y apoyar a la
ESTADÍSTICA elaboración de teorías
científicas.
Estadística e investigación psicológica

Arnau (1990
en Ato y FASES DEL PROCESO
Vallejo,2015) INVESTIGACIÓN

1ra. Fase: Nivel 2da. Fase: Nivel 3ra. Fase: Nivel


Teórico - Técnico - Estadístico-
Conceptual Metodológico Analítico
 Se introduce el  Se describe el diseño  Procedimientos
problema de de la investigación. descriptivos
investigación  Variables.  Procedimientos
 Se delimita los  Participantes inferencias
objetivos e  Procedimientos
hipótesis  Instrumentos
Schuyten (1990) señala ciertas competencias estadísticas en el
campo de la Psicología:

Competencias para interpretar la


Competencias requeridas para el
literatura de investigación:
desarrollo de la investigación

• Conocer y comprender los métodos • Elegir la técnica apropiada e interpretar


empleados en Psicología. sus resultados

• Capacidad de juzgar decisiones • Selección de muestra, su codificación de


metodológicas de otros investigadores. datos en cases de datos.

• Discriminación de investigaciones con • Procesamientos de cálculos sencillos


validez y confiabilidad • Presentación de datos
Por lo tanto la Estadística interviene en ….

Decisión de los tipos variables que


se investigan

Planificación de recogida de datos


y propio análisis

Interpretación de los resultados


Facultad de Ciencias de la Salud

¿Qué fue lo que te motivó a investigar en estos


tiempos de aislamiento social obligatorio?

VARIABLES
VARIABLES
Facultad de Ciencias de la Salud

• Es una propiedad que puede


fluctuar y cuya variación es
susceptible de medirse u
observarse (Peters, 2014).

• Es una propiedad que asume


diversos valores (que varía) o
un símbolo al que se le asigna
valores o números (Kerlinger &
Lee, 2001).
¿Cuál es su importancia? autoeficacia académica: Son el conjunto de
juicios (creencias) de cada individuo sobre
las capacidades (aptitudes) propias para
Facultad de Ciencias de la Salud organizar y ejecutar acciones requeridas en
el manejo y afronte de situaciones
Teorías relacionadas con ámbitos académicos.

Hipótesis
Constructo: Es un concepto, que
tiene el significado agregado de
haber sido inventado o adoptado
Constructos para un propósito especial
(Kerlinger & Lee, 2002; p. 35)

Variables Resalta su importancia cuando se


relacionan y forman parte de un
constructo
Tipos de variables
Facultad de Ciencias de la Salud

Variable Independiente
(VI)
Variable dependiente (VD)
Considerada como la causa
Considerada como el
de la VD
efecto de la VI
Es la que manipula el
Los cambios en esta
investigador
variable es producto de
cambios en la VI
Debe tener al menos dos
niveles o valores
Ejemplo
Facultad de Ciencias de la Salud

VD
VI
Rendimiento
Inteligencia
académico
Nivel bajo
Bajo
Nivel medio
Medio
Nivel alto
Alto
Variables, valores
Facultad de Ciencias de la Salud

• El conjunto de Variable Valores


valores que puede
tomar una variable Sexo Varones
se llama la escala de Mujeres
esa variable Edad 14
26

Ingreso S/. 500.00
mensual S/. 456.00
Nominal o cualitativa

• Los números representan una relación de identidad


1

• No se puede realizar operaciones matemáticas tales como


2 sumar, restar, multiplicar, etc. No reflejan orden ni jerarquía

• Se basan en propiedades, atributos, características, etc.


3

• Representan igualdad o desigualdad respecto a un atributo


4
Facultad de Ciencias de la Salud
• Por ejemplo, tenemos a la variable SEXO, cuyos valores
son varón y mujer.

• A estos valores de la variable SEXO se les puede


ASIGNAR LOS NÚMEROS 1 y 2, a varones y a mujeres,
respectivamente.

• Al igual que tenemos la variable ESTADO CIVIL, Casado,


Soltero, Viudo y Divorciado. A estos valores de la
variable, se le pueden ASIGNAR NÚMEROS, tales como
1, 2, 3 y 4, respectivamente.
En la encuesta presentada, ¿hay alguna variable que
tenga esas características?
Facultad de Ciencias de la Salud

•Sí. Sexo y Lugar de nacimiento. Sus categorías no


implican un orden, SOLO PERTENENCIA.
Ordinal
Facultad de Ciencias de la Salud

• Relación de igualdad –desigualdad y además una relación de orden


1 respecto a la característica evaluada

• Solo admiten cálculos de razones y proporciones.


2

• El tamaño del intervalo entre los valores no son necesariamente los


3 mismos.

• Indican jerarquía y suponen un continuo


4
Facultad de Ciencias de la Salud

• En tal sentido, se le puede ASIGNAR 1 a analfabetos, 2 a las


personas con educación primaria, 3 a las personas con
educación secundaria y 4 a las personas con educación
universitaria.

• Los números representan relaciones de orden: 1 al de menor


grado de instrucción, y 4 al máximo grado de instrucción.

• Los números asignados reflejan distintos grados de la


posesión de determinado atributo o característica. Los
números indican un orden o rango.
Facultad de Ciencias de la Salud

• Sí. Ansiedad ante exámenes. Sus categorías siguen un


orden, UNA JERARQUIA.
Intervalo
Facultad de Ciencias de la Salud

• Se cuenta con una unidad (arbitraria) de medida que permitirá establecer


la igualdad-desigualdad de las diferencias entre las magnitudes.
1

• Permite, proporciones, porcentajes, estadísticos como media, moda, y


desviación estándar
2

• El punto cero es arbitrario y no significa ausencia absoluta de la


característica medida.
3
• Entonces, permite determinar cuán lejos están dos
personas o dos cosas respecto a un atributo (en este
caso el RENDIMIENTO ACADÉMICO), ya que permite
saber la magnitud de la diferencia. Otro ejemplo es
la temperatura y sus escalas.

• El punto “cero” es arbitrario, no indica la ausencia de


una característica, sino un punto conveniente del
cual se marcan intervalos de igual magnitud.
Razón

• Tiene todas las propiedades de las anteriores


1 escalas

• El punto cero indica la ausencia de la propiedad.


2

• Ejemplo: la edad, el peso, la distancia.


3
Facultad de Ciencias de la Salud

Razón

Intervalo COMPLEJIDAD CRECIENTE

El nivel superior contiene las características


Ordinal del nivel inferior

Nominal
Discretas vs. Continuas
Facultad de Ciencias de la Salud
• Según el número de valores que tengan en la escala

 Discretas: número de valores finito (números enteros)

• Variables cualitativas (escala nominal)


• Variables cuantitativas: las que son el resultado de contar; sus valores son números enteros (personas
en el hogar, ingresos, tamaño del municipio).

 Continuas:
• Número de valores infinito (números con infinitos decimales)
• Sólo aquellas variables cuantitativas que son resultado de medir (ejemplos: altura, peso, tamaño del
piso, edad)
Dificultades de las variables
Facultad de Ciencias de la Salud
• Definición incorrecta/inadecuada  procedimientos estadísticos
inadecuados
• Algunas variables no hace falta definirlas ni hay dificultades para
medirlas (ejemplo “sexo”)
• Otras variables: son muy complejos de definir
 Estatus social
 Nivel educativo
 Ideología política
 Religiosidad
 Ansiedad
 Arte
Las variables se pueden agrupar:
Facultad de Ciencias de la Salud

Rol en la •Independiente /
investigación dependiente

Escala de
•Nominal / ordinal / intervalo
medición o
respuesta / razón

Valores de la
escala
• Discreta / continua
¿Cuáles son las variables y escalas de medición en
los siguientes ejemplos?
Facultad de Ciencias de la Salud

• Niveles de ansiedad y autoeficacia académica en


estudiantes universitarios de distritos de Lima.
Y saber esto
• Diferencia de los niveles de inteligencia emocional ¿cómo me
ayuda? ¿para
entre estudiantes de diferentes carreras qué me sirve?
universitarios y entre varones y mujeres.

• Edad, talla, peso al nacer y psicomotricidad en


niños
Metodología de la Investigación Científica

Sesión 1 Semana 2:

Estadística descriptiva. Software JAMOVI.

Profesores:
Danitsa Alarcón, Ana María Castañeda, Ingrid Cirilo
Acero, Johanna Kohler, Carlos Carbajal, Edwin Salas,
Gustavo Calderón, Jhonatan Navarro, Carlos
Portocarrero
2021-2
Facultad de Psicología

Metodología de la Investigación
Científica

Semana 2 – Sesión 1

2021 1
Facultad de Psicología

Estadística descriptiva
Medidas de resumen
Facultad de Psicología

El estudiante calcula e interpreta


LOGRO medidas de resumen para
variables categóricas y numéricas.
Facultad de Psicología

Software para el procesamiento de datos


Facultad de Psicología

Instalando el software JAMOVI:


https://www.jamovi.org/download.html
Facultad de Psicología

Puntos a revisar:

- Punto 1: Medidas de resumen para


variables categóricas

- Punto 2: Medidas de resumen para


variables numéricas
Facultad de Psicología

Medidas de resumen para


variables categóricas
• Frecuencias (f)
• Porcentajes (%)
Facultad de Psicología

En JAMOVI…
Porcentaje
(proporción)
Frecuencia absoluta

Frequencies
Frequencies of Víctima de violencia

Levels Counts % of Total Cumulative %

Víctima 50 38.2 % 38.2 %

No Víctima 81 61.8 % 100.0 %


Facultad de Psicología

Gráficamente
Gráfico de barras
Facultad de Psicología
Facultad de Psicología

Medidas de resumen para


variables numéricas
• Medidas de tendencia central: Media,
mediana y moda.
• Medidas de variabilidad: desviación estándar y
coeficiente de variación.
Facultad de Psicología
Facultad de Psicología

Media aritmética
Facultad de Psicología
Facultad de Psicología
Facultad de Psicología

Mediana
Facultad de Psicología
Facultad de Psicología
Facultad de Psicología

Moda
Facultad de Psicología
Facultad de Psicología
Facultad de Psicología

Medidas de variabilidad: Desviación estándar


Facultad de Psicología
Facultad de Psicología

En JAMOVI…

Descriptives
CALIDADDEVIDA
Mean 76.3
Median 76
Mode 74

Standard deviation 13
Facultad de Psicología
Facultad de Psicología

Medidas de variabilidad: Coeficiente de variación


• Es un estadístico de dispersión que tiene la ventaja de que no
lleva asociada ninguna unidad, por lo que nos permitirá decir
entre dos muestras, cual es la que presenta mayor dispersión.
La denotaremos por C.V. El resultado se expresa en
porcentaje.
• No lo calcula JAMOVI. Pero te brinda los datos para su cálculo:
media y desviación estándar.
Metodología de la Investigación Científica

Sesión 1 Semana 6:

Comparación de una variable numérica entre


más de dos grupos independientes: F de
ANOVA y H de Kruskal Wallis.
Profesores:
Danitsa Alarcón, Ana María Castañeda, Ingrid
Cirilo Acero, Johanna Kohler, Carlos Carbajal,
Edwin Salas, Gustavo Calderón, Jhonatan
Navarro, Carlos Portocarrero
2021-2
Facultad de Psicología

Metodología de la Investigación
Científica

Sesión 1 - Semana 6

2021 - 2
Facultad de Psicología

Estadística inferencial
Comparación de una variable numérica
entre más de dos grupos
independientes: F de ANOVA y H de
Kruskal Wallis
Facultad de Psicología

El estudiante calcula e interpreta una


prueba de comparación de más de dos
LOGRO grupos independientes: F de ANOVA y
H de Kruskal Wallis.
Facultad de Psicología

Observar atentamente el siguiente vídeo:


https://www.youtube.com/watch?v=FmDQlK9_KKk
Facultad de Psicología

¿Existe un patrón de conducta característico entre


los diferentes trastornos de la personalidad?

¿Existen diferencias en el rendimiento académico de


los estudiantes según el trastorno de personalidad
que presentan?
Facultad de Psicología

Diferencias en el rendimiento académico entre


estudiantes con distintos trastornos de la personalidad

H1: Existen diferencias estadísticamente significativas en


el rendimiento académico entre estudiantes con
distintos trastornos de la personalidad.

H0: No existen diferencias estadísticamente


significativas en el rendimiento académico entre
estudiantes con distintos trastornos de la personalidad.

Donde: m es la media de
rendimiento académico en cada
grupo que se está comparando.
Facultad de Psicología
Poblaciones

Muestras
Facultad de Psicología

Puntos a revisar:

- Punto 1: Prueba F de ANOVA

- Punto 2: Prueba H de Kruskal Wallis


Facultad de Psicología

Prueba F de ANOVA (supuestos de los


datos):

- Los datos de las muestras de comparación


deben tener distribución normal.
- Las muestras de comparación deben ser
independientes.
- Las muestras deben ser comparables.
- Las muestras deben provenir de
poblaciones con varianzas similares
(homocedasticidad).
Facultad de Psicología En JAMOVI…

Debido a que p = .0014 y es menor que .05, entonces se rechaza la Ho y se concluye que existen diferencias estadísticamente
significativas en los puntajes de fluidez verbal según años de estudio. Debido a que se ha rechazado la hipótesis nula, se debe indagar
entre qué grupos se presentan las diferencias estadísticamente significativas que se han hallado.
Facultad de Psicología En JAMOVI…

Debido a que p = .0013 y es menor


que .05, entonces existen diferencias
estadísticamente significativas entre 3
y 5 años de estudio.
Facultad de Psicología

Prueba H de Kruskal Wallis (supuestos de


los datos):

- Los datos de las muestras de comparación


no deben tener distribución normal.
- Las muestras de comparación deben ser
independientes.
- Las muestras deben ser comparables.
Facultad de Psicología En JAMOVI…
Facultad de Psicología En JAMOVI…

Análisis de comparación múltiple de Debido a que p = .004, se rechaza la Ho y se concluye que existen diferencias
Dwass, Steel, Critchlow y Fligner (DSCF), estadísticamente significativas en los puntajes de déficit de atención según años de
que se basa en comparaciones de Wilcoxon estudio. Debido a que se ha rechazado la hipótesis nula, se debe indagar entre qué
de dos muestras por pares. Solamente se grupos se presentan las diferencias estadísticamente significativas que se han
emplea cuando se rechaza la hipótesis nula. hallado. La prueba DSCF indica que hay una diferencia significativa entre 3 y 5 año (p
= .017 < .050) y entre 4 y 5 año (p = .010 < .050).
Metodología de la Investigación Científica

Sesión 1 Semana 7:

Plan de análisis: Correlación lineal bivaria:


Pearson y Spearman.

Profesores:
Danitsa Alarcón, Ana María Castañeda, Ingrid Cirilo Acero, Johanna
Kohler, Carlos Carbajal, Edwin Salas, Gustavo Calderón, Jhonatan Navarro
2021-1
Facultad de Psicología

Metodología de la Investigación
Científica

Sesión 1 - Semana 7

2021 - 1
Facultad de Psicología

Estadística inferencial
Correlación lineal bivariada: Pearson y
Spearman.
Facultad de Psicología

El estudiante calcula e interpreta una


LOGRO prueba de correlación lineal bivariada:
Pearson y Spearman.
Facultad de Psicología

Observar atentamente el siguiente vídeo:


https://www.youtube.com/watch?v=7YfJ0sMf120
Facultad de Psicología

¿Qué relación existe entre la cantidad de bromas


realizadas por el odontólogo y la ansiedad de la paciente?

¿Qué relación existe entre la cantidad de anestesia general


empleada por el odontólogo y la arritmia cardiaca de la
paciente?
Facultad de Psicología

Cantidad de bromas que realizan los odontólogos y


ansiedad en los pacientes

H1: Existen relación estadísticamente significativa entre


la cantidad de bromas que realizan los odontólogos y la
ansiedad de los pacientes.

H0: No existen relación estadísticamente significativa


entre la cantidad de bromas que realizan los
odontólogos y la ansiedad de los pacientes.

Ho: rxy = 0 Donde: “r” es el coeficiente de correlación.


H1: rxy ≠ 0
“x” es la variable a correlacionar 1 e “y” es
la variable a correlacionar 2.
Facultad de Psicología

La Magnitud
• Es el valor cuantificado o numérico obtenido luego
de procesar los datos y nos indica la asociación
existente entre dos variables (correlación bivariada).
Variación de “r”

r=0 0< r <0,2 0,2< r <0,4 0,4< r <0,7 0,7< r <0,9 0,9< r <1 r=1

NULA MUY DÉBIL DÉBIL MODERADA FUERTE MUY DEPENDENCI


FUERTE A
FUNCIONAL

Fuente: Prieto Ángel. Matemáticas aplicadas CS I


Facultad de Psicología

La Dirección
• Indica el sentido siguen las variables. Se determina mediante el
diagrama de dispersión o a partir de la aplicación de un
coeficiente de correlación (valor que usualmente va asociado a
un signo positivo o negativo). Correlación directa = signo
positivo. Correlación inversa = signo negativo.

Correlación Positiva Correlación Negativa


Correlación Nula
Las puntuaciones altas
Las puntuaciones altas en una variable tienden
No existe dependencia
en una variable tienden a coincidir con
entre las variables
a coincidir con puntuaciones bajas en
puntuaciones altas en la la otra variable y
otra variable y viceversa. viceversa.
Facultad de Psicología

Correlación negativa Correlación positiva


X
0 Y
10 = 0.134
20 X + 2.122
30 40 50 60 70 80 90
0

16
2 16 16

14
4 14 14

12
12 12
6

10
10 10
8
Y

88

Y
8
10
66 6
12
44 4
14
22 2
16
00 0
00 10 20 30 40 50 60
60 70
70 80
80 90
90 0 10 20 30 40 50 60 70 80 90
X X

-1  r  0 0  r  +1
Facultad de Psicología
16 Y = 0.093 X + 4.335 8 Y=4
14 7

12 6

10 5
Y

Y
8 4

6 3

4 2

2 1

0 0
20 25 30 35 40 45 50 55 60 20 25 30 35 40 45 50 55 60
X X

16 #¡DIV/0!
14

12 Correlación Nula r=0


10
Y

0
0 1 2 3 4 5 6
X
Facultad de Psicología

La Significancia

• La significancia indica si la correlación de las


variables X e Y son iguales a cero o diferentes (rxy = 0,
ó rxy ≠ 0). La significancia puede ser valorada como:
Estadísticamente no
significativa
(p > 0.05). Acepta la Ho

Estadísticamente Estadísticamente muy


significativa significativa
(p < 0.05). Rechaza Ho (p < 0.01). Rechaza Ho
Facultad de Psicología

Puntos a revisar:

- Punto 1: Prueba r de Pearson

- Punto 2: Prueba ρ (rho) de Spearman


Facultad de Psicología En JAMOVI…
Facultad de Psicología En JAMOVI…

Debido a que r = 0.450, es considerada moderada. Además, tiene signo positivo, por lo tanto es una relación directa (a más fluidez
verbal existe más organización).
p < .001 y es menor que .05, entonces existe una correlación altamente significativa entre fluidez verbal y organización.
Facultad de Psicología En JAMOVI…
Facultad de Psicología En JAMOVI…

Debido a que r = 0.770, es considerada fuerte. Además, tiene signo positivo, por lo tanto es una relación directa (a más hiperactividad
existe más impulsividad).
p < .001 y es menor que .05, entonces existe una correlación altamente significativa entre hiperactividad e impulsividad.

También podría gustarte