Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ISSN: 1560-6139
dalvarez@correo.ulima.edu.pe
Universidad de Lima
Perú
The role of the Effect Size Report in Data Analysis in Psychology Research
In this essay we discuss the traditional method of inferential analysis in quantitative
methodology (null hypothesis significance testing) and demonstrate its limitations and
inability to provide a measure for the practical significance of the results. The effect size is
presented as a quantitative measure of the strength of a phenomenon, and this report has
been explicitly requested by the American Psychological Association (APA) in the last three
publication manuals. Finally, we show that in our local context, there is a lack of studies
describing the application of the effect size.
138
Importancia del tamaño del efecto en el análisis de datos de investigación en psicología
ral aplicación, proviene de los aportes plio número de autores han criticado el
de Ronald Fisher y Jerzy Neyman con exceso y las interpretaciones erróneas
Egon Pearson (Cowles, 2001; Kline, de artículos que con este método han
2004; Lehmann, 2011). Los anteriores sido publicados en la investigación psi-
representan dos líneas que contribuyen cológica (Hubbard y Ryan, 2000). Por
a lo que se denomina el procedimien- ejemplo, desde los años sesenta se tie-
to clásico de estadística inferencial: el ne a Rozeboom (1960) y Bakan (1966);
test de significancia de la hipótesis nula. en los setenta a Carver (1978) y Meehl
Este es un procedimiento usado am- (1978); en los años ochenta Dar (1987),
pliamente en psicología, ciencias de la Rosnow y Rosenthal (1989), etc. En
salud, educación, etc. los años noventa la crítica se intensifi-
El método del NHST empezó a ha- ca (e.g., Cohen, 1990, 1994; Schmidt,
cerse de aplicación generalizada en 1996; Thompson, 1999a). Los anterio-
psicología desde la década de 1940, res y otros numerosos autores no solo
experimentando un incremento rápido criticaron la inadecuada interpretación
de su aplicación (Kline, 2004). Este au- del método en mención, sino, también,
mento en el uso del test de significancia su imposibilidad de brindar resultados
estadística en artículos de revistas es- acordes a los objetivos del investigador
pecializadas en psicología puede revi- en psicología.
sarse con más detalle en el estudio de La aplicación del NHST en la inves-
Hubbard y Ryan (2000), donde se tomó tigación en psicología también motivó
una muestra de 8001 artículos publica- severas expresiones por parte de reco-
dos entre los años 1911 y 1998 de una nocidos psicólogos especialistas en in-
muestra aleatoria de 12 revistas de la vestigación cuantitativa, los que fueron
American Psychological Association publicando a lo largo de varias décadas
(APA). El porcentaje de aplicación del en las más importantes revistas interna-
método de NHST fue de alrededor de cionales de psicología. Así se tiene, por
17 % entre los años 1911 y 1929, luego ejemplo, que con el título de “La fala-
se da un incremento hacia el 50 % alre- cia del test significancia de la hipótesis
dedor de 1940. Este aumento continuó, nula”, Rozeboom (1960) se expresa sobre
con un 80 % para 1960, y excediendo el el uso del método en mención como: “…
90 % hacia 1970. costumbres estadísticas de un pasado
primitivo continúan dominando la esce-
na local” (p. 417). Cronbach (1975), pre-
Controversia del NHST
ocupado por la práctica de investigadores
A pesar de su extendido uso, el método de preferir los resultados “significativos”,
del NHST es controversial (Nickerson, escribe: “Ha llegado el momento para
2000). En las últimas décadas, un am- exorcizar la hipótesis nula… la dicoto-
139
Ronald W. Castillo-Blanco, Alberto A. Alegre
140
Importancia del tamaño del efecto en el análisis de datos de investigación en psicología
141
Ronald W. Castillo-Blanco, Alberto A. Alegre
publicaciones, la APA hace una expre- el relacionar el tamaño del efecto con
sión más explícita para la presentación el término de hipótesis nula, y por ende
de los tamaños del efecto: con el método del NHST, debería ser
evitado ya que ambos representan di-
Los tamaños del efecto, los intervalos ferentes maneras de analizar los datos
de confianza y una extensa descrip- cuando se hacen inferencias.
ción son necesarios para transmitir el
significado más completo de los re- De acuerdo con Kelley y Preacher
sultados… Uno de los requerimientos (2012), “el tamaño del efecto es una
mínimos de todas las publicaciones reflexión cuantitativa de la magnitud
periódicas de la APA es una presen- de algún fenómeno, el que se usa para
tación completa de todas las hipótesis abordar alguna cuestión de interés”
examinadas y las estimaciones de ta- (p. 140). Es así que una medida del ta-
maños del efecto e intervalos de con- maño del efecto evalúa, ya sea en el
fianza adecuados. (APA, 2010, p. 33) análisis de una diferencia de grupos, en
una correlación, etc., el tamaño, grado
o magnitud del fenómeno presente, en-
Definición y cálculo del tamaño tendiéndose como fenómeno cualquiera
del efecto de los análisis anteriores. Una expre-
Cohen (1988) define el tamaño del efec- sión simplificada del tamaño del efecto
to como “el grado en que el fenómeno correspondería a la medida del grado en
se presenta en la población” (p. 9), o “el que el fenómeno de interés está presen-
grado en el que la hipótesis nula es fal- te en la muestra.
sa” (p. 10). Esta definición, en la que se Para el cálculo del tamaño del efec-
considera al tamaño del efecto a partir to se debe considerar una formulación
de la relación con el valor de la hipó- específica según el fenómeno estudia-
tesis nula que corresponde al NHST, do. Así, para una comparación de dos
también es considerada por otros au- grupos independientes se tiene como
tores, como Grissom y Kim (2005), expresión más común a la diferencia de
para los que “un tamaño del efecto medias de los grupos en función de su
mide el grado en que la hipótesis nula desviación estándar: d=(M1–M2)/DE*,
es falsa” (p. 4). También Vacha-Hasse donde d es el tamaño del efecto, M1 y
y Thompson (2004) expresan que el M2 son las medias de cada uno de los
término tamaño del efecto lo usarán grupos, respectivamente, y DE* es la
para “referirse a cualquier estadístico desviación estándar). Se tienen tres for-
que cuantifica el grado en que los re- mas de estimar d, las que básicamente
sultados de la muestra divergen de la difieren por la consideración particular
hipótesis nula” (p. 473). Sin embargo, que hacen para el cálculo de DE*. De
y siguiendo a Kelley y Preacher (2012), esta manera se tienen las fórmulas de
142
Importancia del tamaño del efecto en el análisis de datos de investigación en psicología
143
Ronald W. Castillo-Blanco, Alberto A. Alegre
144
Importancia del tamaño del efecto en el análisis de datos de investigación en psicología
145
Ronald W. Castillo-Blanco, Alberto A. Alegre
146
Importancia del tamaño del efecto en el análisis de datos de investigación en psicología
its statistics recommendations are Keselman, H., Huberty, C., Lix, L., Ole-
so controversial. Educational and jnik, S., Cribbie, R., Donahue, B., …
Psychological Measurement, 62(5), Levin, J. (1998). Statistical practices
749-770. of educational researchers: An analy-
García, J., Ortega, E., y De la Fuente, L. sis of their Anova, Manova, and An-
(2008). Tamaño del efecto en las re- cova analyses. Review of Educational
vistas de Psicología indizadas en Re- Research, 68(3), 350-386.
dalyc. Informes Psicológicos, 10(11), Kirk, R. (1996). Practical significance: a
173-188. concept whose time has come. Edu-
García, J., Ortega, E., y De la Fuente, cational and Psychological Measu-
L. (2011). The use of the effect rement, 56(5), 746-759.
size in JCR spanish journals of Kirk, R. (2001). Promoting good sta-
Psychology: from theory to fact. tistical practices: some suggestions.
The Spanish Journal of Psychology, Educational and Psychological Mea-
14(2), 1050-1055. surement, 61(2), 213-218.
Glass, G. (1976). Primary, secondary, Kirk, R. (2008). Statistics: an introduc-
and meta-análysis of research. Edu- tion (5.a ed.). Belmont, CA: Thomsom
cational Researcher, 5(10), 3-8. Wadsworth.
Goodwin, J. (2010). Research in Psy- Kline, R. (2004). Beyond significance
chology: Methods and Design (6.a testing: reforming data analysis
ed.). Toronto: John Wiley and Sons. methods in behavioral research.
Grissom, R., y Kim, J. (2005). Effect Washington, DC: American Psycho-
sizes for research. Mahwah, New logical Association.
Jersey: Lawrence Erlbaum. Lehmann, E. (2011). Fisher, Neyman,
Hernández, R., Fernández, C., y Bap- and the creation of classical statis-
tista, P. (2010). Metodología de la tics. New York: Springer.
investigación (5.a ed.). México, D. F.: Meehl, P. (1978). Theoretical risks and
McGraw-Hill. tabular asterisk: Sir Karl, Sir Ronald,
Hubbard, R., y Ryan, P. (2000). The and the slow progress of soft psycho-
historical growth of statistical sig- logy. Journal of Consulting and Cli-
nificance testing in psychology and nical Psychology, 46, 806-834.
its future prospects. Educational Myers, J., y Well, A. (2003). Research
and Psychological Methods, 60(5), design and statistical analysis (2.a
661-681. ed.). Mahway, New Jersey: Lawrence
Kelley, K., y Preacher, K. (2012). On Erlbaum Associates.
effect size. Psychological Methods, Nickerson, R. (2000). Null hypothesis sig-
17(2), 137-152. nificance testing: A review of an old
147
Ronald W. Castillo-Blanco, Alberto A. Alegre
148