Está en la página 1de 12

Conceptos generales 1

1.1. INTRODUCCIÓN
La palabra «estadística» evoca las tablas de datos y gráficas que tan a
menudo se encuentran en libros, en medios de comunicación o en Internet, y que
se emplean para comunicar datos económicos, electorales, demográficos o de
cualquier otro tipo. Aunque estos resúmenes de datos son, desde luego, el
resultado de aplicar técnicas estadísticas, el campo de esta disciplina es bastante
más amplio de lo que esos ejem- plos sugieren. La estadística no sólo es un
conjunto de técnicas para resumir y co- municar informaciones cuantitativas, sino
que sirve también, y fundamentalmente, para hacer inferencias, generalizaciones y
extrapolaciones de un conjunto relativa- mente pequeño de datos (observados) a
un conjunto mayor (no observados). Una de las aplicaciones más importantes de
estas técnicas es el propio trabajo de adqui- sición de conocimiento mediante la
investigación científica, a la que ha proporcio- nado poderosos instrumentos para
el análisis de datos y la toma de decisiones.
En el cuadro 1.1 se describen algunos ejemplos variados de aplicaciones de la
estadística. En ellos se llega a un punto en el que es necesario trabajar con un
conjunto de números, a veces muy grande, con el que describir aquello que esta-
mos estudiando. Además, en algunos estudios también llega un punto en el que
surge la necesidad, o el deseo, de extraer conclusiones, a partir de las observacio-
nes hechas, acerca de los casos que no han participado en el estudio, o de obser-
vaciones potenciales que no se han hecho. La estadística proporciona los medios
técnicos para realizar estas dos tareas.
Estas dos grandes funciones de la estadística (la organización y descripción
de datos, por un lado, y la realización de inferencias por el otro) reflejan la propia
historia del desarrollo de esta ciencia. La estadística actual es el producto del
encuentro y mutua fecundación en el siglo XIX de dos ramas distintas del cono-
cimiento, la antigua estadística y el cálculo de probabilidades. Etimológicamente,
la palabra «estadística» procede de la palabra «estado». Ya en la antigüedad los
romanos y los egipcios hicieron intentos por tener un conocimiento preciso del
número de sus habitantes y de sus posesiones, es decir, por conocer el estado de
sus naciones (de ahí la raíz del término). Para ello hacían censos y recogían datos
que posteriormente tenían que resumir de una forma comprensiva para propor-
cionar informaciones útiles.

© Ediciones Pirámide © Ediciones Pirámide


18 / Análisis de datos en psicología I Conceptos generales / 18

CUADRO 1.1
Ejemplos

EJEMPLO 1. La empresa BSX nos encarga un estudio sobre los perfiles de competen-
cias de su plantilla de mandos intermedios, con vistas a futuras promociones. Les
administramos varios cuestionarios que miden diversas competencias, entre ellas el
grado en que demuestran «capacidad de liderazgo». Al terminar la corrección de esas
pruebas contamos con un conjunto de números a partir de los cuales describiremos
las competencias de los miembros de esa plantilla.

EJEMPLO 2. Se trata de un estudio sobre la eficacia de un programa de atención a los


familiares que ejercen el papel de cuidadores de enfermos con dolor crónico. La ab-
negada dedicación de los familiares de un enfermo (con frecuencia el marido, la mu-
jer, el padre o la madre) tiene para esos cuidadores un importante coste psicológico,
en términos de estrés y otros efectos en su calidad de vida. Para estudiarlo reunimos
a los familiares de 30 enfermos con dolor crónico que son atendidos en un determi-
nado centro (centro A) y aceptan participar en el estudio. También pedimos a los
colegas de otro centro en el que no hay un programa de este tipo que colaboren con
nosotros en el estudio, como grupo de control (centro B); reúnen también a 30 fami-
liares de otros enfermos con dolor crónico que aceptan participar en el estudio. Eva-
luamos el nivel de estrés de los 60, pero luego sólo los del centro A reciben las sesiones
del programa destinado a controlar y reducir el estrés. Valoramos también para cada
uno el nivel educativo (sin estudios, primarios, secundarios, universitarios) y la inteli-
gencia, dado que pueden afectar al grado de comprensión tanto del programa como
de la forma en que se aplica. Al final nos encontramos con un conjunto de puntua-
ciones de cada uno de los 60 familiares, a partir de las cuales deseamos extraer con-
clusiones acerca de la eficacia del programa y de los efectos moduladores que puedan
tener el nivel educativo y la inteligencia sobre esa eficacia.

EJEMPLO 3. Se centra en un aspecto de la atención selectiva. Se presentan al partici-


pante tres letras en la pantalla del ordenador y debe responder lo más rápidamente
que pueda a la letra central, presionando una tecla si es una vocal y otra tecla si se
trata de una consonante. Es habitual emplear dos condiciones experimentales (a veces
se añaden otras): en la condición de flancos compatibles, las letras que acompañan a
la letra central (llamadas flancos) son de la misma categoría que la letra central (vo-
cales si la central es vocal y consonantes en caso contrario); en la condición de flancos
incompatibles los flancos pertenecen a la categoría contraria. El resultado habitual,
muchas veces replicado, es que se tarda más en responder a la letra central si los flan-
cos son de la categoría contraria (flancos incompatibles) que si son de la misma cate-
goría (flancos compatibles). Este resultado se interpreta en el sentido de que los ob-
servadores no consiguen que su selección atencional se sustraiga completamente a los
flancos y no consiguen ignorarlos del todo. Supongamos que queremos probar este
efecto con números y las categorías pares/impares. Administramos a una persona 30
ensayos de cada condición y registramos los tiempos de respuesta. Si nos centramos
en la condición de flancos incompatibles, dispondremos de 30 mediciones de tiempos.
No en todos los ensayos el participante tarda lo mismo. Hay una cierta variabilidad
en las distintas ejecuciones de la tarea. Para hacernos una idea global de cómo reali-

© Ediciones Pirámide
19 / Análisis de datos en psicología I Conceptos generales / 19

za la tarea nuestro voluntario en cada condición tenemos que trabajar con los 30
valores procedentes de cada una.

© Ediciones Pirámide
Conceptos generales / 20

CUADRO 1.1 (continuación)

EJEMPLO 4. Es un sondeo de opinión acerca de lo que la gente pensaría si se adop-


tasen medidas restrictivas en el consumo de tabaco. La idea es anticiparse a las reac-
ciones, de forma que interesa conocer la opinión general a partir de las preguntas
realizadas en el sondeo. Sin duda, lo más preciso sería preguntarles a todos y cada
uno de los españoles por su opinión, pero por razones económicas esto no sería sen-
sato. Decidimos, en consecuencia, seleccionar un grupo de 2.500 españoles de todas
las comunidades autónomas y edades, consultándoles acerca de su opinión (a favor/
en contra) sobre esta cuestión.

Sin embargo, las conclusiones extraídas se agotaban en el propio conjunto de


datos observados; el objetivo consistía en hacerse una idea clara de lo que había,
lo cual se contaba y medía. Lo que posibilitó el cálculo de probabilidades fue el
desarrollo de un conjunto de métodos para extrapolar las conclusiones a entida-
des no observadas. Es decir, proporcionó la base conceptual para hacer
inferencias acerca de potenciales observaciones a partir de unas pocas
observaciones reales. Estas técnicas tuvieron su fundamento en el desarrollo de
la curva normal por Gauss, en su aplicación por Galton a los problemas de
herencia, etc. Sin embar- go, los auténticos padres de estas técnicas fueron
Karl Pearson (1857-1936) y Ronald Fisher (1890-1962); sobre la historia de la
estadística en psicología, véase Cowles (1989) y Walker (1975).
Clásicamente, la estadística se ha dividido en dos partes: la estadística descrip-
tiva y la estadística inferencial. Estas dos partes reflejan, como ya hemos dicho,
las dos grandes épocas de su historia, pero también pueden reflejar la profundidad
de los análisis que se realizan o, incluso, las fases de un estudio, puesto que para
hacer un estudio inferencial primero hay que hacer un estudio descriptivo de los
datos. Es decir, un estudio descriptivo se agota en la descripción, mientras que
uno inferencial comienza por la descripción y luego aborda la inferencia.
Mientras que la estadística descriptiva se puede abordar sin conocimientos
téc- nicos previos más allá del álgebra elemental, para el estudio de la estadística
infe- rencial es imprescindible adquirir unas nociones básicas de probabilidad. Por
ello es frecuente encontrar que los libros de estadística aplicada están organizados,
al me- nos, en esos tres bloques. En este libro nosotros nos ocupamos sobre todo
de los dos primeros, aunque también incluimos una introducción a la inferencia
estadística, cuyo desarrollo pleno se puede seguir en otras obras (Pardo y San
Martín, 2010).
Proponemos la siguiente definición de la estadística.

La estadística es la disciplina que se ocupa de la ordenación y análisis de


datos procedentes de muestras y de la realización de inferencias acerca de las
poblaciones de las que proceden.

© Ediciones Pirámide
Conceptos generales / 21

Se puede decir que el sentido vulgar del término «estadística» al que nos re-
feríamos al comenzar esta sección corresponde más o menos a la estadística des-

© Ediciones Pirámide
Conceptos generales / 22

criptiva. El otro conjunto de técnicas estadísticas, que se utilizan para extraer


conclusiones de poblaciones a partir de la observación de unos pocos casos, son
las que integran la estadística inferencial. Por tanto, un trabajo en el que se apli-
ca la estadística podría clasificarse como exclusivamente descriptivo o como in-
ferencial (puesto que, como ya hemos dicho, la inferencia incluye la descripción).
Si, por ejemplo, nos interesa conocer la opinión de un grupo docente de la facul-
tad acerca de una serie de cuestiones que afectan a la organización del aula, po-
demos utilizar una pequeña encuesta. Con los datos recogidos podremos calcular
promedios, porcentajes, etc., y con estos resúmenes numéricos podremos transmi-
tir la información contenida en esos datos brutos utilizando los formatos compac-
tos y de gran calidad informativa que nos proporciona la estadística descriptiva.
El estudio se agota en esos mismos datos, por lo que es un estudio descriptivo.
Si, por el contrario, queremos hacernos una idea de las opiniones de los estu-
diantes de la universidad sobre esas mismas cuestiones, no podremos preguntar-
les a todos. Probablemente utilizaríamos la estrategia de seleccionar un grupo de
estudiantes, administrarles la encuesta y, a partir de sus resultados, hacernos una
idea de cuál es el estado de opinión del conjunto de los estudiantes de la univer-
sidad. En este caso se trata de hacer inferencias acerca de toda una universidad
a partir de los datos observados en una pequeña parte de sus estudiantes; es un
estudio inferencial. De la misma forma, podemos decir que nuestro ejemplo sobre
la capacidad de liderazgo es descriptivo, mientras que los ejemplos sobre el pro-
grama para reducir el estrés de cuidadores, el tiempo de respuesta en la tarea de
los flancos y el sondeo de opinión son inferenciales. En el cuadro 1.4 se señala el
carácter descriptivo o inferencial de los trabajos descritos en el cuadro 1.1.
Una última idea que merece la pena destacar en esta introducción es la dis-
tinción entre estadística teórica y estadística aplicada. La primera se dedica al
estudio y desarrollo de métodos formalmente válidos (sobre todo para hacer in-
ferencias, pero también con otros objetivos), mientras que la segunda se dedica a
la aplicación de esos métodos y modelos de actuación a disciplinas concretas.
Según Kruskall (1974): «...estadística aplicada, al menos en principio, es la apli-
cación documentada de métodos que han sido teóricamente investigados, es
decir, el salto real después de estudiar la teoría del salto» (p. 390).
De los modelos y métodos que proporciona la estadística teórica y las técnicas
concretas y usos que desarrolla la estadística aplicada, no todos son utilizados en
la misma medida por las distintas ciencias. Por eso, para referirse al conjunto de
técnicas más utilizadas en cada una a veces se utilizan nombres tales como bio-
estadística, psicoestadística o socioestadística. Algunos autores han propuesto
para los contenidos de la estadística aplicada otros términos, entre los que des-
taca el de análisis de datos (Tukey, 1962), que da nombre a este libro.

1.2. CONCEPTOS GENERALES


Cualquier aplicación de la estadística se refiere a un conjunto de entidades,
cono- cido como «población», aunque casi siempre se desarrolle utilizando sólo

© Ediciones Pirámide
Conceptos generales / 23

una parte de ese conjunto, conocida como «muestra»; proponemos las siguientes
definiciones:

© Ediciones Pirámide
Conceptos generales / 24

Se llama población estadística al conjunto de todos los elementos que


cumplen una o varias características.
Se llama muestra a cualquier subconjunto de los elementos de una po-
blación.

A los elementos que componen una población se les denomina «entidades es-
tadísticas o individuos». Pueden ser personas, animales, objetos o, simplemente,
números. En nuestro ejemplo 1, sobre la capacidad de liderazgo, son las
personas que integran la plantilla de mandos intermedios de la empresa BSX; en
el ejemplo
2, de los cuidadores, son todos los potencialmente cuidadores de un enfermo; en
el ejemplo 3, sobre la selección atencional, serían todas las realizaciones de la ta-
rea, en las condiciones de flancos compatibles e incompatibles, que potencialmen-
te podría realizar la persona que realiza nuestro experimento; en el ejemplo 4, la
población del sondeo son todos los ciudadanos españoles mayores de edad.
Dependiendo del número de elementos que la compongan, la población pue-
de ser finita o infinita. Los niños que estudian la ESO en la Comunidad de Ma-
drid, los niños invidentes españoles, las empresas de nuevas tecnologías con sede
en Tres Cantos o las poblaciones de nuestros ejemplos sobre la capacidad de li-
derazgo, el estrés de los cuidadores y el sondeo son casos de poblaciones finitas,
puesto que en ellas los elementos se podrían contar, obteniendo un número
finito. El número de lanzamientos posibles de un dado, el conjunto de los
números pares o la población de nuestro ejemplo sobre tiempo de respuesta son
casos de pobla- ciones infinitas, puesto que teóricamente no tienen un límite: por
muchas obser- vaciones que realicemos, siempre podríamos recoger más.
Muchas poblaciones con las que trabajamos son finitas, pero tan numerosas
que, a la hora de hacer inferencias acerca de ellas, se pueden considerar infinitas
a efectos prácticos (en este caso estarían la poblaciones de nuestros ejemplos so-
bre estrés de cuidadores y sobre sondeos de opinión). En la estadística hay pro-
cedimientos de cálculo que varían dependiendo de que la población sea finita o
infinita, pero a medida que se va incrementando el tamaño de las poblaciones
finitas el uso de uno u otro procedimiento resulta indiferente; proporcionan re-
sultados cada vez más parecidos. En consecuencia, la mayor parte de las veces
trabajaremos con poblaciones infinitas, ya sea porque lo son de verdad o porque
su tamaño es tan grande que tomarlas por tales no afecta prácticamente a los
resultados.
Cuando un investigador aborda un trabajo empírico, debe definir la
población correspondiente. La población ha de ser el marco o conjunto de
referencia sobre el cual se van a realizar las conclusiones e interpretaciones;
éstas no pueden ex- ceder ese marco.
El hecho de que las poblaciones sean en general muy numerosas hace que la
descripción de sus propiedades sea inaccesible. De ahí que se trabaje fundamen-
talmente con muestras.

© Ediciones Pirámide
Conceptos generales / 25

La muestra nos va a proporcionar unos datos que podemos ordenar,


simpli- ficar y describir. Pero uno de los objetivos es el de poder describir la
población

© Ediciones Pirámide
Conceptos generales / 26

de partida mediante lo que encontremos en la muestra. Siguiendo con nuestros


ejemplos del cuadro 1.1, podemos decir que lo que nos interesa no es la eficacia
del programa de reducción de estrés en los 30 familiares concretos que participan
en nuestro estudio del ejemplo 2, ni la forma de responder en los 30 ensayos de
tiempo de reacción aplicados, ni la opinión de los 2.500 encuestados acerca de la
pregunta. Lo que nos interesa realmente es extraer conclusiones generales acerca
de la eficacia general de la técnica, la forma general de responder en la tarea y la
opinión de toda la población. Y para poder extraer esas conclusiones lo más im-
portante es que las muestras de observaciones sean representativas. Veámoslo
con otro ejemplo. Supongamos que queremos estudiar la estatura de los
españoles; para ello nos situamos en una calle de nuestra ciudad y nos
disponemos a pre- guntar a los primeros cien transeúntes que pasen por aquel
punto. Si por una casualidad nos hemos situado cerca de un polideportivo
donde se practica el ba- loncesto, al cual suelen dedicarse individuos altos, los
datos que recogeremos no serán representativos. Si lo que intentamos es
hacernos una idea de cuál puede ser la estatura media de los españoles a partir
de la estatura media de los inte- grantes de esa muestra, nuestras conclusiones
serán incorrectas.
Existe todo un campo de la metodología, llamado muestreo, dedicado a es-
tudiar procedimientos de extracción de muestras que maximicen la representati-
vidad de las mismas. Sólo un adecuado muestreo asegurará la representatividad
de la muestra. Remitimos al lector interesado a obras específicas sobre muestreo
(Azorín y Sánchez-Crespo, 1986; Clairin y Brion, 2001).
Habitualmente, uno de los objetivos de cualquier investigación será la de al-
canzar conclusiones acerca de la población a partir de la información obtenida
en la muestra. Pero ese objetivo sólo se alcanzará plenamente en la medida en
que esa información se aproveche adecuadamente. Por ello, un primer objetivo
de la estadística descriptiva consiste en conseguir resúmenes de los datos, con
índices compactos y muy informativos.
Las poblaciones se pueden caracterizar mediante unas constantes denomina-
das «parámetros». Una de las tareas de la estadística es hacer conjeturas acerca
de esas cantidades. Para ello se utilizan magnitudes análogas obtenidas en las
muestras, que se denominan «estadísticos». Podemos establecer las siguientes
definiciones:

Un parámetro es una propiedad descriptiva de una población.


Un estadístico es una propiedad descriptiva de una muestra.

Por ejemplo, el estrés medio de la población de cuidadores o el tiempo medio


que invertiría nuestro participante en todas sus hipotéticas realizaciones de la
tarea de los flancos son ejemplos de parámetros. Como estas cantidades son des-
conocidas, haremos conjeturas sobre ellas a partir de cantidades similares obteni-
das en las muestras. Así, es casi seguro que el estrés medio de los 60 familiares de

© Ediciones Pirámide
Conceptos generales / 27

nuestro estudio antes de comenzar con el programa no es idéntico al de la pobla-


ción, pero si la muestra seleccionada es realmente representativa, probablemente

© Ediciones Pirámide
Conceptos generales / 28

la media muestral (o estadístico) no difiera mucho de la media poblacional (o


parámetro).
Los parámetros y estadísticos no sólo son medias, sino que pueden ser otro
tipo de cantidades, como por ejemplo porcentajes. Ejemplo de ello es nuestro
sondeo, en el que el porcentaje de individuos de la población con opinión favo-
rable se considera un parámetro. Veamos otro ejemplo tomado de la psicología.
Supongamos que un investigador está estudiando la eficacia de un método tera-
péutico para la intervención en trastornos de alimentación. Ante la imposibilidad
material y la dificultad económica que supone utilizar para la experiencia a todas
las personas con trastornos de alimentación, decide tomar a cien personas que
acuden a su consulta a lo largo de un año. Esta muestra es representativa de la
población de personas con trastorno de alimentación. Utiliza el método con cada
paciente, y tras el seguimiento correspondiente observa que hay 60 que no rein-
ciden. Esto significa que se ha rehabilitado el 60 por 100. El valor 60 es un esta-
dístico. Si al cabo de algún tiempo desea replicar la experiencia y toma otra
muestra de personas con un trastorno de alimentación y se recuperan 58, tendre-
mos el mismo estadístico en otra muestra. Repitiendo sucesivamente la experien-
cia con muestras de cien pacientes con estos trastornos, se encontrará con distin-
tos porcentajes. Ninguno de ellos puede considerarse con seguridad el verdadero
porcentaje de los que se rehabilitarían en la población con el método en cuestión,
pero cada uno de ellos se puede utilizar para hacer conjeturas acerca de ese ver-
dadero porcentaje o parámetro.
En la práctica no será preciso estar repitiendo el estudio; bastará con obtener
una única muestra y, a partir de ella, tratar de estimar el parámetro. Para ello es
fundamental que la muestra sea representativa de la población y que el estadís-
tico calculado reúna la información necesaria y suficiente para que, a partir de
él, podamos decir algo acerca de la verdadera eficacia del tratamiento, el verda-
dero porcentaje de los que se recuperarán con ese nuevo método, es decir, el
parámetro.
Los parámetros se suelen representar por letras griegas
− (m, s, p), mientras que
los estadísticos se suelen simbolizar por letras latinas
X ( , S, P). En la primera
fase de una investigación se obtienen los estadísticos y en la segunda se utilizan
los valores obtenidos para hacer inferencias acerca de los parámetros.

© Ediciones Pirámide

También podría gustarte