Está en la página 1de 22

Resumen Estadstica

Estadstica Descriptiva.
Botella
Captulo 1: Conceptos Generales.
La estadstica actual no slo es un conjunto de tcnicas para resumir y transmitir informacin
cuantitativa, sino que sirve tambin, y fundamentalmente para hacer inferencias, generalizaciones y
extrapolaciones de un conjunto relativamente pequeo de datos a un conjunto mayor !l"sicamente
la estadstica se ha dividido en dos partes, la estadstica descriptiva y la estadstica inferencial
#ara hacer un estudio inferencial primero hay que hacer un estudio descriptivo de los datos $s decir,
un estudio descriptivo se agota en la descripcin, mientras que uno inferencial comienza por la
descripcin y luego aborda la inferencia %ientras que la estadstica descriptiva puede abordarse sin
conocimientos tcnicos previos, aparte del "lgebra elemental, para el estudio de la estadstica
inferencial es imprescindible adquirir nociones b"sicas de probabilidad
Estadstica es la ciencia que se ocupa de la ordenacin y anlisis de
datos procedentes de muestras y de la reali!acin de in"erencias
acerca de las po#laciones de las que $stas proceden.
&tro conjunto de tcnicas m"s so'sticadas y desconocidas de la estadstica, y que se utilizan para
extraer conclusiones de poblaciones a partir de la observacin de unos pocos casos, son las que
integran la estadstica inferencial
Distincin entre estadstica terica y estadstica aplicada( la primera se dedica
al estudio de los mtodos formalmente v"lidos para la realizacin de inferencias La
segunda se dedica a la aplicacin de esos mtodos y modelos de actuacin a campos
reales
!ualquier trabajo en el que se aplica la estadstica se re'ere a un conjunto de entidades, conocido
con el nombre de poblacin.
%e llama po#lacin estadstica al con&unto de todos los elementos que
cumplen una o varias caractersticas o propiedades.
) los elementos que componen una poblacin se les denomina entidades estadsticas o
individuos *ependiendo del n+mero de elementos que la compongan, la poblacin puede ser
fnita o infnita La mayor parte de las poblaciones con las que solemos trabajar son 'nitas, pero
tan numerosas que a la hora de hacer inferencias acerca de ellas se pueden considerar in'nitas a
efectos pr"cticos !uando un investigador aborda un trabajo emprico debe de'nir claramente la
poblacin sobre la cual se interesa La poblacin ha de ser el marco o conjunto de referencia sobre el
cual van a recaer las conclusiones e interpretaciones, y stas no pueden exceder ese marco $l
hecho de que las poblaciones sean, por lo general, muy numerosas, suele hacer inaccesible la
descripcin de sus propiedades *e ah que se trabaje fundamentalmente con muestras
'na muestra es un su#con&unto de los elementos de una po#lacin.
La muestra nos va a ofrecer una serie de datos que podemos ordenar, simpli'car y describir #ero el
objetivo fundamental es el poder describir la poblacin de partida mediante lo que podamos
encontrar en la muestra , para poder extraer esas conclusiones lo m"s importante es que las
muestras de observaciones sean representativas $xiste todo un campo de la estadstica, llamado
muestreo, dedicado a estudiar los procedimientos de extraccin de muestras encaminados a
maximizar la representatividad de las mismas #or ello un primer objetivo de la estadstica
descriptiva consiste en conseguir res+menes de los datos en ndices compactos y de gran calidad
informativa
Las poblaciones pueden caracterizarse a partir de unas constantes denominadas parmetros
!omo normalmente los par"metros son desconocidos, una de las tareas de la estadstica es la de
hacer conjeturas lo m"s acertada posibles acerca de esas cantidades #ara ello se utilizan cantidades
an"logas obtenidas en las muestras, que se denominan estadsticos
'n parmetro es una propiedad descriptiva de una po#lacin
'n estadstico es una propiedad descriptiva de una muestra.
Los par"metros y estadsticos no slo son medias, sino que pueden ser otros tipos de cantidades,
como porcentajes *esde un punto de vista simblico, conviene indicar, para distinguirlos, que los
par"metros se suelen representar por letras griegas mientras que los estadsticos se suelen
simbolizar por letras latinas $n la primera fase de una investigacin se obtienen los estadsticos, y
en la segunda se utilizan los valores obtenidos para hacer inferencias acerca de los par"metros
!uando estudiamos las entidades que conforman una poblacin nos interesamos por algunas de las
propiedades de sus elementos, y esas propiedades adoptan distintas variedades
'na caracterstica es una propiedad o cualidad de un individuo.
'na modalidad es cada una de las maneras como se presenta una
caracterstica.
(ED)C)*+.
La estadstica no realiza sus funciones directamente sobre las modalidades observadas, sino que
stas se representan por n+meros, y la estadstica realiza sus funciones sobre esos n+meros
%e llama medicin al proceso de atri#uir n,meros a las caractersticas.
La asignacin de n+meros a las caractersticas se hace siguiendo unas reglas- del estudio de los
modelos mediante los cuales conocemos las reglas para una correcta atribucin de los n+meros se
ocupa la .eora de la %edida $l objetivo de la medicin de una caracterstica es conectar un sistema
relacional emprico y un sistema relacional numrico, de tal forma que las relaciones entre las
entidades se re/ejen en las relaciones entre los n+meros que los simbolizan 0lo si se consigue este
objetivo ocurrir" que de las relaciones entre los n+meros podr"n hacerse inferencias v"lidas acerca
de las relaciones entre las entidades La medicin estudia las condiciones de construccin de
representaciones numricas, y los modelos desarrollados para la medicin se llaman escalas
0e utiliza una clase por cada una de las modalidades que adopta la caracterstica que se est"
estudiando Las clases son mutuamente exclusivas y exhaustivas, es decir, cada observacin es
incluida en una y slo una clase 0e tiene un conjunto de objetos cuya caracterstica nos interesa
para su estudio 1sta adopta un n+mero k de modalidades distintas- representamos por m a la
modalidad del objeto )signamos n+meros a los objetos en funcin de la modalidad que presentan
en esa caracterstica- representamos por n al n+mero asignado al objeto )l tipo de medicin que
cumple con estas condiciones se la llama escalamiento cualitativo o nominal, y al conjunto de
clases que las integran se le llama escala nominal #odran tambin utilizarse otros smbolos, como
letras, palabras, etc, puesto que los n+meros asignados no se van a utilizar como tales, sino como
simples cdigos de identi'cacin
0upongamos que contamos de nuevo con un conjunto de objetos que di'eren en una caracterstica
que cada uno posee en una cierta cantidad *e nuevo el proceso de medicin debe consistir en la
aplicacin de una regla de asignacin de n+meros a las diferentes cantidades, pero ahora de tal
forma que los n+meros asignados a los objetos re/ejen esos distintos grados en los que se presenta
la caracterstica ) aquellas escalas de medida que cumplen estas caractersticas se les llama
escalas ordinales
#ara poder extraer conclusiones m"s precisas, como la de en cu"nto m"s presenta la caracterstica
un objeto sobre otro, hay que contar con una unidad de medida, y para ello hay que pasar al
siguiente tipo de escala, escala de intervalo $sta unidad de medida y su origen son arbitrarios La
principal limitacin de este tipo de escalas es que, aunque cuenta con una unidad de medida, no
tiene un cero absoluto $s decir, el n+mero cero no representa realmente la ausencia de esa
caracterstica
$n la siguiente escala, escala de razn, cumple la funcin de preservar el signi'cado del valor cero,
de forma que siempre represente la ausencia de esa caracterstica La consecuencia fundamental de
la presencia de un origen absoluto, y no arbitrario, es que a dem"s de poder extraer conclusiones
acerca de la igualdad o desigualdad de diferencias, tambin puede hablarse de desigualdad o
igualdad de razones
2n concepto ligado al concepto de escala, y que las caracteriza, es el de transformacin
admisible, que hace referencia al problema de la unicidad de la medida La cuestin de la unicidad
puede plantearse de la siguiente manera( 3es la representacin numrica que hemos construido la
+nica posible4 $n general la respuesta ser" negativa 0er"n muchas las representaciones
alternativas que seran correctas *e un conjunto de valores correctamente atribuidos se puede
pasar a otro tambin correctamente atribuido mediante una transformacin admisible 0e dice que
una transformacin de los n+meros asignados en una escala es una transformacin admisible si
preserva las caractersticas que de'nen a esa escala, es decir, si los n+meros transformados tambin
representan al sistema emprico
-ipo )n"ormacin
deduci#le
-rans. .dmisi#le E&emplos
+ominal 5elaciones 6igual
que7 o 6distinto que7
)plicaciones
inyectivas
0exo, estado civil,
diagnstico clnico
/rdinal 5elaciones 6mayor
que7 o 6igual que7
8unciones crecientes *ureza, nivel
socioeconmico,
grado de asertividad
)ntervalo 9gualdad o
desigualdad de
diferencias
) : b ; x <b = >? .emperatura,
calendario,
inteligencia
Ra!n 9gualdad o @ ; x <b = >? Longitud, peso
desigualdad de
razones
0.R).B1E%.
$n el proceso de medicin se asignan n+meros a los objetos seg+n unas reglas, y el conjunto de
valores numricos atribuidos a las modalidades de una caracterstica constituyen lo que llamamos
variable estadstica
'na varia#le es una representacin num$rica de una caracterstica.
Aay veces que una caracterstica tiene una +nica modalidad, en ese caso todas las entidades
estudiadas adoptaran el mismo valor numrico, y decimos que se trata de una constante
Las variables pueden clasi'carse de varias formas Las variables cuantitativas <sean de intervalo
o razn? pueden a su vez clasi'carse en variables discretas y variables continuas, en funcin
del n+mero de valores asumibles por ellas 2na variable discreta es aquella que adopta valores
aislados #or tanto, 'jados dos consecutivos, no puede tomar ninguno intermedio $n las variables
continuas entre dos valores cualesquiera, por prximos que sean, siempre pueden encontrarse
valores intermedios Las variables estadsticas se simbolizan por letras may+sculas latinas, y
generalmente con un subndice, para distinguirlas de las constantes
Captulo 2
Luego de obtener un conjunto de valores tomados en una o varias variables hay que empezar por
inspeccionar los datos !uando la cantidad de n+meros recolectados es demasiado grande, se hace
difcil hacer una inspeccin directa que sea realmente comprensiva #or eso el primer paso suele
consistir en reorganizar los datos 2n instrumento para conseguir esa ordenacin es la denominada
distribucin de frecuencias, y a partir de ella es frecuente tambin construir representaciones
grfcas
D)%-R)B'C)*+ DE 3REC'E+C).%.
La distribucin de frecuencias es un instrumento diseado para cumplir tres funciones( a?
proporcionar una reorganizacin y ordenacin racional de los datos recogidos, b? ofrecer la
informacin necesaria para hacer representaciones gr"'cas y c? facilitar los c"lculos necesarios para
obtener los estadsticos muestrales 5epresentaremos por X a la variable con la que trabajamos, y
que puede adoptar distintos valores <BC, BD, BEF? pero cada uno de esos valores puede aparecer
repetido m"s de una vez en los n elementos que componen la muestra
%e llama frecuencia absoluta de un valor X
p
456 7 se sim#oli!a por n
p
al
n,mero de veces que se repite el valor 8
i
en la muestra.
%e llama frecuencia relativa de un valor x
p
y se sim#oli!a por p
p
al
cociente entre la "recuencia a#soluta de ese valor y el tama9o de la
muestra.
%e llama frecuencia absoluta acumulada de un valor x
p
y se sim#oli!a
por p
:
al cociente entre su "recuencia a#soluta acumulada y el tama9o
de la muestra.
) veces las frecuencias relativas, ya sean simples o acumuladas, se expresan en trminos
porcentuales $n esos casos suelen representarse con may+sculas- par obtenerlas basta con
multiplicar por C>> las frecuencias relativas !onstruimos la distribucin de frecuencias siguiendo los
pasos descritos(
a; 0e ponen los valores que toma la variable en la primera columna de abajo hacia arriba
#; #ara la columna de f absolutas contamos el n+mero de veces que se repite cada valor
La suma de ellos es igual al tamao de la muestra
c; #ara la columna de f relativas dividimos cada f absoluta por n Las suma de ellas debe
dar C
d; #ara obtener las f absolutas acumuladas sumamos para cada valor su f absoluta m"s
la absoluta acumulada del valor anterior 0u suma debe dar tambin n
e; #ara las f relativas acumuladas dividimos cada f absoluta acumulada por n La
frecuencia relativa de valor mayor debe ser igual a C
$n muestras en donde se tienen muchsimos valores que toma la variable, suele aplicarse lo que se
denomina una agrupacin en intervalos, y que consiste en formar grupos de valores
consecutivos, llamados intervalos, y poner uno de estos grupos en cada 'la, en lugar de poner cada
valor individual por separado ) continuacin se calculan las f absolutas conjuntas de los valores
incluidos en el intervalo haciendo lo mismo despus con las f relativas, las absolutas acumuladas y
las relativas acumuladas $n las distribuciones de frecuencias con valores agrupados en intervalos
aparecen algunos elementos nuevos(
%e llama intervalo a cada uno de los <rupos de valores que ocupan una
=la en una distri#ucin de "recuencias.
%e llaman lmites aparentes o informados de un intervalo a los valores
mayor y menor que puede adoptar la varia#le dentro de ese intervalo.
%e llaman lmites exactos de un intervalo a los valores m:imo y
mnimo incluidos en el intervalo.
%e llama punto medio de un intervalo a la suma de sus lmites e:actos
partido por dos.
%e llama amplitud de un intervalo a la di"erencia entre su lmite e:acto
superior y su lmite e:acto in"erior. %e representa por la letra ).
Aay tres reglas y algunas directrices para hacer una distribucin( a? el intervalo superior debe
incluir al mayor valor observado, b? el intervalo inferior debe incluir al menor valor observado, c?
cada intervalo debe incluir el mismo n+mero de valores #ero al ser muchas las agrupaciones
diferentes que se pueden realizar, para decidir entre ellas hay que tener presentes algunas
directrices basadas en dos guas principales( a? dado que el objetivo de una distribucin es conseguir
una ordenacin manejable que ayude a comprender el signi'cado de los datos, no es conveniente
que el n+mero de intervalos sea demasiado grande, b? el n+mero apropiado de intervalos debe ser
tal que, simult"neamente, con ella se consiga una agrupacin operativa y que cumpla los objetivos
para los que ha sido diseada la distribucin, pero sin distorsionar los valores con el error de
agrupamiento
2.2.1 %upuestos de distri#ucin intraintervalo 2.>.2 convenciones so#re las
representaciones <r=cas 2.>.> tendenciosidad de las representaciones
<r=cas.
RE?RE%E+-.C)/+E% GR@3)C.%.
) partir de las distribuciones de frecuencias se pueden construir representaciones gr"'cas La
funcin de stas es dar informaciones globales mediante un solo golpe de vista
a? Dia<rama de rectn<ulos( para hacer un diagrama de rect"ngulos se colocan en el
eje de abscisas las modalidades <o los n+meros que las representan?, y en el eje de
ordenadas las frecuencias <puede ser absolutas o relativas simples o acumuladas?
0obre cada modalidad se levanta un rect"ngulo cuya altura es la frecuencia
correspondiente #ara variables nominales u ordinales
b? ?er=l octo<onal: se utiliza mucho en informes psicopedaggicos o de rendimiento
c? ?icto<rama: son representaciones en forma de crculos en los que stos son divididos
en secciones cuya super'cie es proporcional a la frecuencia de la modalidad
correspondiente
d? Dia<rama de #arras: se utiliza en variables cuantitativas discretas $n el eje de
abscisas se colocan los distintos valores de la variable y en el eje de ordenadas las
frecuencias 0obre cada valor de la variable se traza una lnea o barra perpendicular
cuya altura debe ser igual a la frecuencia
e? Aisto<rama: se utiliza para variables cuantitativas continuas con datos agrupados en
intervalos $n el eje de abscisas se colocan los lmites exactos de los intervalos, y en el
eje de ordenadas las frecuencias 0obre cada intervalo se levanta un rect"ngulo cuya
altura sea igual a la frecuencia correspondiente
f? ?ol<ono de "recuencias: para variables discretas, el polgono es la 'gura que resulta
de unir los extremos superiores de las que hubieran sido las barras
g? Dia<rama de #arras acumuladas: se utiliza en variables discretas $n el eje de
abscisas se colocan los valores de la variable y en el de ordenadas las frecuencias
acumuladas, ya sean absolutas o relativas 0obre cada valor se traza una perpendicular
cuya longitud sea igual a la f acumulada *esde el extremo superior de cada una de
estas barras se traza una lnea horizontal que se une con la barra situada a su derecha
h? ?ol<ono de "recuencias acumuladas: se utiliza en variables continuas $l eje de
abscisas se construye igual que en los histogramas, pero en el de ordenadas se
incluyen las f acumuladas, ya sean absolutas o relativas 0obre cada lmite se levanta
una perpendicular cuya longitud sea idntica a la f acumulada y se une con los
extremos superiores de dichas perpendiculares
i? /tros di#u&os: muchas veces se utilizan otras representaciones 'guritas, en las que
se incluyen los objetos de los que se est"n haciendo recuentos de frecuencias, a alg+n
smbolo que los identi'que de forma muy expresiva
?R/?)ED.DE%.
Los conjuntos de datos de variables cuantitativas obtenidos en muestras, tienen algunas
caractersticas 0on cuatro(
a? -endencia central: se re'ere a la magnitud general de las observaciones hechas $sta
magnitud general puede cuanti'carse mediante unos ndices conocidos como ndices
de tendencia central o promedios y que reciben ese nombre porque pretenden ser
sntesis de los valores de la variable
b? 0aria#ilidad: esta propiedad se re'ere al grado de concentracin de las observaciones
en torno al promedio 2na distribucin ser" homognea o poco variable si los datos
di'eren poco entre si, y por tanto, se agolpan en trono a su promedio 0er"
heterognea o muy variable si los datos se dispersan mucho con respecto al promedio
$sta propiedad es independiente de la anterior, es decir, dos grupos que tengan
distinta variabilidad pueden tener tendencias centrales muy distintas o similares
c? .simetra o ses<o( esta propiedad se re'ere, por tanto, al grado en que los datos
tienden a concentrarse en los valores centrales, en los valores inferiores al promedio, o
en los valores superiores a ste $xiste simetra perfecta cuando en caso de doblar la
representacin gr"'ca por una vertical trazada sobre la media, las dos mitades se
superponen perfectamente
d? Curtosis: se re'ere al grado de apuntamiento de la distribucin 0i es muy apuntada,
se llama leptocrtica, y si es muy aplastada, se llama platicrtica Generalmente el
grado de curtosis de una distribucin se compara con un modelo de distribucin
llamado distribucin normal, y que respecto a la curtosis se llama distribucin
mesocrtica
D).GR.(. DE -.11/% 7 A/B.%.
Las distribuciones de frecuencias no son el +nico medio para resumir y exponer conjuntos de datos-
una alternativa a ellas son los llamados diagramas de tallo y hojas 0u obtencin requiere separar
cada puntuacin en dos partes( el primer o primeros dgitos, que reciben el nombre de tallo y el
dgito o dgitos restantes, que reciben el nombre de hojas <xHIJ, I <tallo? y J <hoja? Pasos
a; 0e identi'can los valores m"ximo y mnimo observados
#; 0e toma una decisin acerca del n+mero m"s apropiado de tallos distintos
c; 0e listan todos los tallos distintos en una columna, ordenados de forma creciente de
arriba hacia abajo
d; 0e escribe cada hoja, junto al tallo que le corresponda, preferiblemente ordenados
seg+n su valor
$l diagrama de tallo y hojas tiene varias venta!as sobre la distribucin e inconvenientes( una
primera ventaja es que permite identi'car cada puntuacin individual $n las distribuciones
tradicionales slo conocemos las frecuencias del intervalo, y eso nos obliga a tratar los datos de
ciertas maneras distorcionadas- no facilita, como la distribucin cl"sica, el c"lculo de estadsticos-
ofrece tanto un listado de las puntuaciones como un dibujo de la distribucin- al contener los valores
de cada observacin es m"s f"cil de modi'car para obtener un dibujo con un nivel de detalle
distinto- pueden representarse dos conjuntos de datos en el mismo diagrama, con lo que facilita la
comparacin
Captulo >: (edidas de posicin
#ara hacer estas valoraciones relativas se pueden utilizar las llamadas medidas de tendencia
central" #ue son ndices dise$ados especialmente para revelar la situacin de una
puntuacin con respecto a un grupo" utilizando a %ste como marco de referencia 2n tipo
concreto de medida de posicin son las llamadas medidas de tendencia central
Centiles o percentiles( son KK valores de la variable que dividen a la distribucin en
C>> secciones, cada una conteniendo a la centsima parte de las observaciones 60e
simboliza por !
DL
a aquella puntuacin que deja por debajo de si al DL por C>> de las
observaciones y que es superada por el MD por C>>7 Los centiles no suelen calcularse
con cantidades de pequeos datos, y cuando es necesario hacerlo se obtienen
sencillamente ordenando las puntuaciones y calculando la proporcin de stas que
superan al valor que se quiere comparar Normalmente los centiles se obtienen sobre
datos agrupados en intervalos, y en su c"lculo se asume el supuesto de distribucin
homognea intraintervalo 8rmula(
Deciles: son nueve puntuaciones que dividen a la distribucin en C> partes, cada una
conteniendo al C> por C>> de las observaciones 0e representa por *
O
, donde O indica el
n+mero del decil al que se re'ere )s, el decil cuarto, es la puntuacin que deja por
debajo de si al P> por C>> de las observaciones y por encima de si al J> por C>>
Cuartiles( son tres puntuaciones que dividen a la distribucin en cuatro partes, cada
una conteniendo al DI por C>> de las observaciones 0e representan por Q
O
donde O
indica el n+mero del cuartil al que se re'ere
$xiste una equivalencia directa entre los distintos cuantiles Gracias a esta equivalencia, las frmulas
de c"lculo de los cuantiles se resumen en la de los centiles correspondientes al cuantil que se quiera
Captulo C: (edidas de tendencia central
Las medidas de posicin permiten comparar una puntuacin con a#uellos valores #ue
ocupan ciertas posiciones especiales en un grupo de referencia. *e todas esas posiciones
hay una, la que representa la posicin central, que suele suscitar un mayor inters que las dem"s,
las medidas de tendencia central. &on ndices #ue act'an como res'menes num%ricos de
las observaciones (ec(as. )epresentan la magnitud general observada en los valores.
*ambi%n sirven para comparar con!untos de valores. *ado que no se pueden comparar
distribuciones completas, lo que se comparan son ciertas caractersticas resumen de stas
(ED). .R)-(D-)C..
$l ndice de tendencia central m"s utilizado 0e de'ne como la suma de los valores observados"
dividida por el n'mero de ellas #or tanto, si recogemos n observaciones de la variabel B,
entonces la media de los valores observados es( BH
$l procedimiento para hacer los c"lculos de la media con datos agrupados en una distribucin de
frecuencias(
#ropiedades de la media aritmtica(
) las puntuaciones que hemos venido tratando hasta aqu, y que no son m"s que los valores brutos,
las denominaremos a partir de ahora puntuaciones directas y las representaremos por la letra de la
variable en may+scula #or el contrario, a las diferencias de cada sujeto con respecto a la media
grupal las denominaremos puntuaciones diferenciales y las representaremos por la letra min+scula(
!on las puntuaciones diferenciales podemos dar una informacin m"s precisa que con las directas
1E 1a suma de las di"erencias de n puntuaciones con respecto a su
media o puntuaciones di"erenciales es i<ual a cero
La razn por la que la suma de las diferenciales es igual a cero es que unas son positivas y otras
negativas <las que superan la media y las que quedan por debajo de ella? y se compensan con otras
2E 1a suma de los cuadrados de las desviaciones de unas puntuaciones
con respecto a su media es menor que con respecto a cualquier otro
valor.
) veces nos interesar" sumar a las puntuaciones observadas una cantidad constante, y en esos
casos tambin nos interesar" conocer la media de las nuevas puntuaciones
>E %i sumamos una constante a un con&unto de puntuaciones la media
aritm$tica quedar aumentada en esa misma constante.
#ero las puntuaciones no slo pueden transformarse sumando constantes, tambin lo pueden hacer
multiplicando constantes
CE %i multiplicamos por una constante a un con&unto de puntuaciones
la media aritm$tica quedar multiplicada por esa misma constante.
$n algunos casos contamos con la media de varios grupos en una variable y nos interesa conocer la
media de todas las observaciones juntas 0u frmula suele denominarse media ponderada
FE 1a media total de un <rupo de puntuaciones cuando se conocen los
tama9os y medias de varios su#<rupos GecGos a partir de un <rupo
total mutuamente e:clusivos y e:Gaustivos puede o#tenerse
ponderando las medias parciales a partir de los tama9os de los
su#<rupos en que Gan sido calculadas.
&tra situacin relativamente frecuente es aquella en la que se forma una variable a partir de una
combinacin lineal de dos o m"s variables, e interesa conocer la media de la variable resultante
HE 'na varia#le de=nida como la com#inacin lineal de otras varia#les
tiene como media la misma com#inacin lineal de las medias de las
varia#les intervinientes en su de=nicin
(ED).+..
+s el ndice" la puntuacin #ue es superada por la mitad de las observaciones pero no por
la otra mitad. #ara su c"lculo podemos encontrarnos en dos casos generales, aquel en el que
contamos con un n+mero impar de observaciones y aquel en que nos encontramos con un n+mero
par de ellas $n el primero se toma como mediana el valor central, en el segundo se da la
circunstancia de que cualquier valor comprendido entre los dos centrales cumple con la de'nicin de
la mediana
(/D..
2na tercer va para representar la tendencia central de un conjunto de valores consiste en informar
del valor m"s frecuentemente observado $n esta idea se basa nuestro tercer ndice de tendencia
central, la moda, que se representa por %o, y se de'ne sencillamente como el valor de la variable
con mayor frecuencia absoluta.
C/(?.R.C)*+.
3!on qu criterios elegimos uno sobre los dem"s para representar la magnitud general observada en
unos valores o para comparar la de dos o m"s grupos de valores4 0i no hay ning+n argumento de
peso en contra, se preferir siempre la media Aay dos razones para apoyar esta normal general
La primera es que en ella se basan otros estadsticos y la segunda es que es mejor estimador de su
par"metro que la mediana y la moda $ste segundo argumento signi'ca que, en trminos generales,
las medias halladas sobre muestras representativas se parecen m"s a la media poblacional que lo
que se parecen las medianas y modas muestrales a la mediana y la moda poblacional Aay al menos
tres situaciones en las que se preferir" la mediana a la media( a? cuando la variable est medida en
una escala ordinal- b? cuando haya valores extremos que distorsionen la interpretacin de la media y
c? cuando haya intervalos abiertos $ste tercer y +ltimo caso se re'ere a situaciones en las que el
intervalo superior carece de lmite superior, el intervalo inferior carece de lmite inferior, o ambas
cosas a la vez
La mediana ser" la segunda candidata para representar la tendencia central y por tanto, si no hay
argumentos de peso en contra, se preferir" la mediana a la moda #ero hay al menos dos situaciones
en las que se dar" esa preferencia( a? cuando se trate de una variable medida en una escala
nominal, b? cuando haya intervalos abiertos y la mediana pertenezca a uno de ellos
$n algunos casos los tres ndices de tendencia central dan valores parecidos, o incluso pueden
coincidir exactamente
Captulo F: (edidas de variacin
#ara conseguir una visin completa y comprensiva de los datos hay que complementar las medidas
de tendencia central con las de otras propiedades de los mismos 2na de las propiedades m"s
importantes de los conjuntos de datos es el grado en que stos se parecen o se diferencian entre si
$sta propiedad se denomina variabilidad" dispersin u (omogeneidad, y es diferente de la
tendencia central
0.R).+I. 7 DE%0).C)*+ -J?)C..
2na idea que se ha demostrado +til a las hora de cuanti'car la variabilidad es la de trabajar con las
distancias desde los valores hasta alg+n poste central, que podra ser la media aritmtica 0in
embargo tambin vimos en el tema anterior que la suma de las diferenciales es necesariamente
igual a cero 2na solucin al problema de que las distancias con respecto a la media sumen cero
consiste en elevar al cuadrado esas distancias antes de hallar su promedio, dado que los cuadrados
son siempre positivos +l ndice basado en esta idea se llama varianza" y se representa por
la expresin &
,
x. -uando se #uiere describir el grado de variabilidad de un grupo de
valores basta con obtener este ndice La cuestin que puede surgir es la de cmo valorar el
grado de dispersin cuanti'cando mediante este ndice *ado que valores de varianzas que pueden
ser normales en ciertas variables y poblaciones podran parecer exagerados en otros casos, no tiene
sentido comparar varianzas halladas sobre variables distintas La varianza sirve sobre todo para
comparar el grado de dispersin de dos o m"s conjuntos de valores en una misma variable, llegando
a conclusiones como la siguiente( 6la poblacin de hombres presenta una mayor variabilidad en su
estatura que la poblacin de mujeres, que son m"s homogneas en esa caracterstica7 La razn de
esta discrepancia es que las distancias no se han tratado como tales, sino que para evitar el
problema de que las diferenciales sumen cero se han elevado stas al cuadrado #or ello es
frecuente, con objeto de retomar las unidades originales de esas distancias, se calcule la raz
cuadrada de la cantidad obtenida )l ndice as hallado se le llama desviacin tpica" se
representa por &x y se defne sencillamente como la raz cuadrada de la varianza Las
variaciones entre los datos est"n re/ejando variaciones en las caractersticas que est"n estudiando,
y que en psicologa suelen ser indicadores de variables psicolgicas o mediciones del
comportamiento La variabilidad de los datos re/ejando el hecho incuestionable de las diferencias
individuales 2no de los objetivos de la psicologa es precisamente la explicacin sistem"tica de esas
diferencias, en tanto en cuanto presentan regularidades asociadas a segundas o terceras variables
No siempre son la varianza y la desviacin tpica los ndices m"s apropiados para representar la
variabilidad de un grupo de datos Aay veces en que alg+n dato extremo distorsionara su
interpretacin, en otras ocaciones la variable est" medida en una escala ordinal y en otras no se
puede calcular
C@1C'1/.
$l c"lculo de la varianza puede siempre hacerse por medio de la frmula que la de'ne, pero en
muchas ocasiones resulta m"s pr"ctico utilizar otras frmulas derivadas de aqulla, y en cualquier
caso es necesario adaptar la frmula a aquellas situaciones en las que los valores est"n agrupados
en intervalos
R La varianza es tambin igual a la media de las puntuaciones directas elevadas al
cuadrado menos el cuadrado de la media $sta frmula resultar" +til en ciertos casos
?R/?)ED.DE%.
$n primer lugar, hay que destacar que un conjunto de valores puede mostrar un mayor o menor
grado de homogeneidad, pero el grado m"s pequeo posible de homogeneidad se produce cuando
todos los valores son idnticos $n ese caso las desviaciones de los valores con respecto a su media
son todas cero y en consecuencia tambin es igual a cero la media de sus cuadrados, por tanto, se
es el mismo valor que puede adoptar la varianza 9gualmente, como desviacin tpica se toma la raz
positiva de la varianza
1E 1a varian!a y la desviacin tpica como medidas de la dispersin
son valores esencialmente positivos.
) veces interesa transformar las puntuaciones observadas sumando una constante ySo multiplicando
por otra constante, tal y como vimos al exponer las propiedades de la media $n esos casos no har"
falta calcular la varianza de las puntuaciones transformadas, sino que podr" deducirse conociendo la
varianza de las puntuaciones originales
2E %i sumamos una constante a un con&unto de puntuaciones su
varian!a no se altera.
0i la transformacin consiste en multiplicar por una constante, la varianza si se ve alterada
!onociendo la varianza de las puntuaciones originales y la constante multiplicada se puede obtener
f"cilmente la varianza de las puntuaciones obtenidas mediante la multiplicacin de la constante
>E %i multiplicamos por una constante a un con&unto de puntuaciones
la varian!a quedar multiplicada por el cuadrado de la constante y la
desviacin tpica por el valor a#soluto de esa constante.
$n ciertas ocasiones conocemos las varianzas de varios subgrupos y se quiere obtener la varianza
del grupo total $sto se puede conseguir aplicando una propiedad que relaciona la varianza de todas
las puntuaciones juntas con las varianzas, medias, y tamaos de los subgrupos
CE 1a varian!a total de un <rupo de puntuaciones cuando se conocen
los tama9os las medias las varian!as de varios su#<rupos GecGos a
partir del <rupo total mutuamente e:clusivos y e:Gaustivos puede
o#tenerse sumando la media 4ponderada; de las varian!as y la
varian!a 4ponderada; de las medias.
/-R.%.
2na forma muy sencilla el grado de dispersin consiste en calcular la distancia entre el mayor y el
menor de los valores observados $ste ndice se llama amplitud total" rango o recorrido y se
obtiene sencillamente hallando la diferencia entre los valores extremos *istincin entre ambos tipos
de amplitud, que se denominan rango excluyente y rango incluyente, usadas en variables discretas y
continuas $sto es muy sensible a los valores extremos y nada sensibles a los intermedios, pudiendo
carecer de toda representatividad &tro inconveniente de este ndice es que est" ligado al tamao de
la muestra utilizada 0i se quiere comprara la variabilidad de las dispersin de dos conjuntos de
datos de tamao marcadamente distinto, es probable que la muestra de mayor tamao presente
una mayor amplitud aunque las poblaciones de referencia tengan la misma variabilidad
Desviacin media: tomar las desviaciones con respecto a la media, o puntuaciones
diferenciales, en valores absoluto
.mplitud semiKintercuartil: basad en las puntuaciones correspondientes a los
cuartiles primero y tercero
Coe=ciente de variacin: a veces se desea comparar la variabilidad de grupos cuya
media es distinta $ste ndice es expresado como un porcentaje $ste ndice puede
construirse como un ndice de la representatividad de la media !uanto mayor es el
coe'ciente de variacin, menos representativa es la media
Captulo H: ?untuaciones tpicas y escalas derivadas.
!omparar las magnitudes mediante la comparacin de los valores asociales a ellas &tras soluciones,
que se basan en la transformacin de las puntuaciones observadas en otras que, sin perder o
distorsionar la informacin contenida en las puntuaciones originales, permitan una comparacin
directa de las mismas
?'+-'.C)*+ -J?)C..
Las puntuaciones diferenciales son informaciones insu'cientes para comparar puntuaciones de
sujetos pertenecientes a distintos grupos o a distintas variables Las puntuaciones tpicas, se
representa por letra z )l proceso de obtencin de las puntuaciones tpicas se llama tipifcacin
1a puntuacin tpica de una o#servacin indica el n,mero de
desviaciones tpicas que esa o#servacin se separa de la media del
<rupo de o#servaciones.
Las puntuaciones tpicas permiten, por tanto, hacer comparaciones entre unidades de distintos
grupos, entre variables medidas de distintas formas, o incluso entre variables diferentes $n
cualquier caso, las puntuaciones tpicas siempre nos indicar"n el n+mero de desviaciones tpicas <de
las de ese grupo y variable? que se separan de la media <de ese grupo y variable? y si esa desviacin
es por encima o po debajo de la media <seg+n el signo de la puntuacin tpica? Las caractersticas
de las puntuaciones tpicas son universales, no dependen del tipo de puntuaciones ni de su
dispersin, ni de su n+mero
1a media de las puntuaciones tpicas es cero mientras que su
varian!a y desviacin tpica son i<uales a uno.
Las puntuaciones tpicas re/ejan las relaciones esenciales entre las puntuaciones, con independencia
de la unidad de medida que se haya utilizado en la medicin !uando en dos conjuntos de
puntuaciones, emparejadas con alg+n criterio, a los elementos de cada para les corresponde la
misma puntuacin tpica dentro de su conjunto, puede decirse que mantienen la misma estructura
interna, y se dice entonces que son puntuaciones e#uivalentes
E%C.1.% DER)0.D.%.
9nconvenientes que surgen de las desviaciones tpicas $n concreto y dado que la media de las
tpicas es cero y su desviacin tpica uno, buena parte de las puntuaciones suelen ser negativas, y
casi todas decimales $sto hace que resulte incmodo su tratamiento y que muchas veces se
busquen procedimientos que permitan superar esta di'cultad 2n procedimiento consiste en
transformar las puntuaciones tpicas en otras que retengan todas las relaciones que mani'estan las
puntuaciones originales, por tanto que sean puntuaciones equivalentes, pero evitando la di'cultad
operativa, y que constituyen lo que se denomina una escala derivada $stas transformaciones se
basan en una propiedad de las puntuaciones tpicas
%i trans"ormamos linealmente las puntaciones tpicas
multiplicndolas por una constante a y sumando una constante #
entonces las puntuaciones trans"ormadas tendrn como media la
constante sumada # como desviacin tpica el valor de la constante
multiplicada LaL y como varian!a el cuadrado de esta constante a
2
.
$n resumen la construccin de una escala derivada parte de unas puntuaciones directas, stas se
tipi'can, y despus se transforman linealmente en otras puntuaciones
La cuestin fundamental de las escalas derivadas consiste en transformar las puntuaciones
originales, Bi, en otras puntuaciones transformadas, .i, tales que sean m"s cmodas de tratar e
interpretar, pero que a la vez retengan las relaciones comerciales entre los valores, es decir, que
sean puntuaciones equivalentes
Captulo M: (edidas de asimetra y curtosis.
Aay otras dos caractersticas con las que se pueden describir y comparar las distribuciones de
frecuencias
J+D)CE% DE .%)(E-RJ.
+l grado de asimetra de una distribucin (ace referencia al grado en #ue los datos se
reparten e#uilibradamente por encima y por deba!o de la tendencia central 0e han
propuesto diferentes ndices con los que cuanti'car esta propiedad
relacin entre la media y la moda, y se de'ne como la distancia entre la media y la
moda, medida en desviaciones tpicas, es decir( la media es inferior a la moda, y por
tanto este ndice dar" un valor negativo- la media es superior y el ndice dar" positivo-
coinciden los dos ndices de tendencia central y por tanto el ndice de asimetra dar"
cero Las distribuciones como las primeras tienen asimetra negativa y el ndice da
valores menores que cero- las del segundo tipo asimetra positiva, y este ndice da
valores mayores que cero $n las +ltimas se dice que son distribuciones sim%tricas,
puesto que no est"n inclinadas hacia ning+n lado- este ndice da en ellas valores en
torno a cero y si la simetra es perfecta entonces da exactamente cero 0lo se puede
calcular en distribuciones unimodales
Jndice de asimetra de ?earson: es igual al promedio de las puntuaciones tpicas
elevadas al cubo Los valores menores que cero indican asimetra negativa, los
mayores que cero asimetra positiva y los valores en torno a cero indican distribuciones
aproximadamente simtricas $s el ndice m"s utilizado
Jndice de asimetra intercuartlico: se basa, en los cuartiles La interpretacin es
similar a la de los ndices anteriores Los valores mayores de cero indican asimetra
positiva, los menores indican asimetra negativa y los valores en torno a cero re/ejan
distribuciones simtricas .ienen una ventaja sobre los ndices anteriores, y es que
tiene un valor m"ximo y mnimo con lo que se facilita su interpretacin en trminos
relativos
J+D)CE% DE C'R-/%)%
&e basa en el promedio de las tpicas elevadas a la cuarta potencia.
2na distribucin en la que el ndice sea igual a cero tienen un grado de curtosis similar al de la
distribucin normal, y se dice que es mesoc'rtica, mientras que si es positivo su grado de
apuntamiento es mayor que el de la distribucin normal, y se dice que es una distribucin
leptoc'rtica y si es negativo su apuntamiento es menor que el de la distribucin normal y se dice
que es platic'rtica
Captulo N: Correlacin lineal
2no de los objetivos principales de la ciencia consiste en descubrir las relaciones entre variables, y la
estadstica ha desarrollado instrumentos apropiados para esta tarea La observacin de relaciones
claras y estables entre las variables ayuda a comprender los fenmenos y a encontrar explicaciones
de los mismos, e indica las vas probablemente m"s e'caces para intervenir sobre las situaciones
$l estudio de las relaciones lineales, es aplicable exclusivamente a las variables de intervalo
%e dice que dos varia#les 8 e 7 mantienen una relacin lineal directa
cuando los valores altos en 7 tienden a empare&arse con valores altos
en 8 los valores intermedios en 7 tienden a empare&arse con valores
intermedios en 8 y los valores #a&os en 7 tienden a empare&arse con
valores #a&os de 8.
%e dice que dos varia#les 8 e 7 mantienen una relacin lineal inversa
cuando los valores altos en 7 tienden a empare&arse con valores #a&os
en 8 los valores intermedios en 7 tienden a empare&arse con valores
intermedios en 8 y los valores #a&os en 7 tienden a empare&arse con
valores altos en 8.
%e dice que Gay relacin lineal nula entre dos varia#les cuando no Gay
un empare&amiento sistemtico entre ellas en "uncin de sus valores.
)l hacer una representacin gr"'ca conjunta de dos variables pueden apreciarse visualmente estos
tres tipos de relacin #ara ello se identi'can los pares de valores y se sealan los correspondientes
puntos en unos ejes de coordenadas $stas nubes de puntos reciben el nombre de diagramas de
dispersin
C'.+-)3)C.C)*+
2n primer procedimiento consistira en hallar el promedio de los productos cruzados de las
puntuaciones diferenciales )l hablar de productos cruzados nos referimos al producto, para cada
sujeto o caso, de sus valores en las dos variables, es decir Bi ; , $stos productos pueden obtenerse
con puntuaciones directas, diferenciales o tpicas !ada 'gura est" separa en cuatro cuadrantes, y
los puntos estar"n en uno u otro dependiendo de que la observacin supere o no la media de B ySo la
media de , $n concreto, si supera ambas medias, el punto aparecer" en el cuadrante superior
derecho <N$?, si supera la media de B pero no la de ,, como el par aparecer" en el cuadrante inferior
derecho <0$?- si supera la de , pero no la de B, aparecer" el cuadrante superior izquierdo <N&?- sino
supera ninguna de las medias, aparecer" en el cuadrante inferior izquierdo <0&? )l tratar con
puntuaciones diferenciales, stas ser"n positivas si superan la media y negativas en caso contrario
#or tanto, aquellas observaciones que aparezcan en los cuadrantes N$ o 0& tendr"n productos
cruzados positivos, mientras que las que aparezcan en los cuadrantes N& o 0$ tendr"n productos
cruzados negativos $l promedio de productos cruzados de diferenciales tender" a dar positivo si la
relacin es directa, negativo si es inversa, y en torno a cero si es nula, y a dem"s su valor absoluto
ser" mayor cuanto m"s acusada sea la tendencia a la linealidad en el diagrama de dispersin
?R/?)ED.DE%
La razn principal por la que la covarianza no llegaba a satisfacer completamente la necesidad de un
ndice de la asociacin lineal era la di'cultad de su valoracin, dado que careca de un m"ximo y un
mnimo estables #uesto que hemos destacado su alternativa principal, el coe'ciente de correlacin
de #earson, precisamente porque no tiene esa di'cultadF
El coe=ciente de correlacin de ?earson no puede valer ms de O1 ni
menos de K1
%i Gacemos trans"ormaciones lineales de una o las dos varia#les en
las que las constantes multiplicadoras son positivas la correlacin de
?earson no se altera.
0.1/R.C)*+ E )+-ER?RE-.C)*+
$n la interpretacin de una correlacin de #earson hay que separar dos aspectos distintos( su
cuanta y su sentido La cuanta se re'ere al grado en el que la relacin entre dos variables queda
bien descrita con un ndice de asociacin lineal como r, mientras que el sentido se re'ere al tipo de
relacin 2na correlacin en torno a cero indica una relacin lineal baja o nula- una correlacin
positiva indica una relacin lineal directa, mientras que una correlacin negativa indica una relacin
lineal inversa !uanto m"s cercano quede un coe'ciente del valor cero, menos apto es el modelo
lineal como descripcin de la relacin entre las variables #or el contrario, cuanto m"s se acerque a
los extremos, mejor describe esa relacin
ReucGlin
Captulo 1: carcter varia#le de las conductas.
Tariaciones previsibles y variaciones imprevisibles( las variaciones de las conductas son previsibles
cuando se conoce la situacin, el momento o la persona #or otra parte, estas variaciones de las
conductas son imprevisibles a partir de las informaciones de las que dispone el observador $l
psiclogo utiliza a menudo el mtodo estadstico precisamente porque este mtodo permite tratar
con m"s e'cacia las observaciones que presentan a la vez variaciones previsibles y variaciones
imprevisibles
Las fuentes de variacin y an"lisis estadstico( las variaciones que son imprevisibles porque no est"n
asociadas a ninguna fuente de variacin sistem"tica Las variaciones imprevisibles se atribuyen as a
un conjunto de fuentes fortuitas de variacin para el experimentador o encuestador Las variaciones
que son previsibles porque est"n asociadas a fuentes sistem"ticas de variacin 0i las variaciones as
previstas no son mayores que las variaciones imprevisibles, el psiclogo comprobar" que no se
veri'ca su hiptesis sobre el efecto de las fuentes sistem"ticas de variacin que haba credo
introducir en la experiencia o en la encuesta La comparacin entre la amplitud de las variaciones
previsibles y la amplitud de las variaciones imprevisibles permite interpretar los resultados de la
experiencia o de la encuesta e identi'car, a la vez, algunas fuentes sistem"ticas de variacin
#onderacin de una fuente sistem"tica de variacin( cuando el experimentador o el encuestador
hace la hiptesis de que varias fuentes sistem"ticas de variacin producen efectos sobre sus
observaciones, comienza en general por veri'car si cada una de ellas tiene efectivamente un efecto
no nulo y signi'cativo $l experimentador podr" intentar averiguar cu"les son las fuentes de
variacin m"s importantes, es decir, las que contribuyen m"s a las variaciones de las observaciones
#onderacin de las fuentes fortuitas de variacin( debe evaluar el peso que toman en sus
observaciones las fuentes fortuitas de variacin 0i este peso es grande, con relacin al de las
fuentes sistem"ticas de variacin, ser" difcil poner en evidencia estas +ltimas, reconocer su
signi'cado
Captulo 2: Res,menes estadsticos en el nivel de las escalas nominales.
$l empleo de la estadstica en psicologa( distinguir dentro de las observaciones las variaciones
fortuitas de las variaciones sistem"ticas #ara asumir esta funcin del mtodo estadstico procede a
hacer res+menes de series de observaciones 3#or qu tiene necesidad el psiclogo de efectuar
res+menes estadsticos de este tipo4 #ara poder razonar sobre conjuntos de observaciones( pueden
compararse dos medias o dos gr"'cos $l resumen de una serie de observaciones puede hacerse de
manera que se ponga en evidencia un aspecto particular de la informacin contenida en estas
observaciones y llegar as a poseer un instrumento de an"lisis de esta informacin Aay que
examinar algunos mtodos que permiten describir una serie de observaciones en forma resumida y
que pueden tener signi'caciones diferentes La eleccin de uno u otro de estos mtodos depender"
del problema que se plantee el psiclogo
Niveles de medida( tres niveles, estando de'nido cada nivel por las propiedades del conjunto de los
valores que pueden obtener mediante las operaciones de medida Aay una jerarqua entre estos tres
niveles( en cada uno de ellos los n+meros gozan de todas las propiedades del nivel inferior y de otras
propiedades
!onstruccin de la escala nominal( para construir una escala nominal basta que el psiclogo sea
capaz de repartir sus observaciones en un cierto n+mero de clases, el conjunto de las cuales
constituye la escala, y que deben poseer las dos propiedades siguientes( cada observacin debe
entrar en una clase y solamente en una $l que dos observaciones entren o no en la misma clase de
equivalencia no se sigue de un criterio estadstico, sino de un criterio emprico 0e producen
di'cultades, ya que hay que de'nir el conjunto de clases de manera tal que toda observacin entre
dentro de una clase, luego hay que conseguir que cada observacin no pueda entrar m"s que en una
+nica clase 0e necesitar" adoptar una de'nicin precisa de cada clase y veri'car que los criterios
as propuestos los comprenden de la misma manera utilizadores diferentes
#ropiedades de los n+meros en una escala nominal( una vez realizada esta particin de una serie de
observaciones se van a poder utilizar n+meros para describir y resumir esta serie #ero cada uno de
estos n+meros designar" aqu una clase de observaciones $stas operaciones slo permiten decir
que una observacin que pertenece a una clase es diferente de una observacin que pertenece a
otra clase- no permiten decir que la primera es mayor o menor que la segunda $l n+mero de
observaciones que pertenecen a una clase es el efectivo de esta clase
$ntropa( la informacin de la distribucin no permite saber si las posibilidades de pertenecer a otra
clase son muy diferentes o solamente poco diferentes, dicho de otro modo, si las observaciones son
muy diferentes o poco diferentes, si su distribucin est" muy dispersada o poco dispersada 0e
admitir" que la dispersin podr" ser tanto mayor cuanto mayor sea el n+mero de clases #ara un
n+mero 'jo de clases, ser" mayor si las observaciones se reparten igualmente sobre todas las clases
en vez de concentrarse solamente sobre algunas clases 0e puede explicitar y cuanti'car esta nocin
de'niendo y calculando la entropa de la distribucin
Glosario de Conceptos
Elementos o 'nidades: son las entidades acerca de las que se re+nen datos #or ejemplo( C? si se
eval+a la memoria de los aspirantes a un puesto de mozo en el restaurante B, las unidades son cada
uno de los aspirantes
?o#lacin de )ndividuos: es el conjunto de todos los elementos sobre los cuales se observa una o
m"s caractersticas de inters
(uestra de )ndividuos: es un subconjunto o parte de una poblacin de individuos
Notas: cuando hablamos de unidades como de la poblacin objetivo o de individuos o de la
muestra de individuos, stas entidades deben ser situadas en el espacio <situacin geogr"'ca? y en
el tiempo <ao o fecha?
!omo generalmente las muestras se extraen con 'nes inferenciales- esto es, para tener
conocimiento de lo que acontece a nivel poblacional, es de desear que sean representativas de las
respectivas poblaciones #ara favorecer la representatividad de las muestras, la llamada .eora de
%uestreo ha desarrollado diversidad de mtodos 2no de ellos es la eleccin al azar de las unidades
muestrales
0aria#les o Caracterstica: es una caracterstica de un fenmeno observable en los individuos de
una poblacin $s una variable propiamente dicha cuando presenta diferentes modalidades <dos o
m"s? entre los individuos 0i se presenta bajo una +nica modalidad se dice que es una caracterstica
constante
0aria#le Estadstica( es una representacin, a travs de n+meros u otros smbolos, de una
variable $sta representacin se obtiene mediante alg+n procedimiento de medicin Las variables
estadsticas se clasi'can de acuerdo con el tipo de valores que pueden tomar en( .ariable
cualitativa( es aquella cuyos valores expresan atributos- .ariable cuasi/cuantitativa( es aquella
cuyos valores indican un orden de jerarqua- .ariable cuantitativa( es aquella cuyos valores
expresan cantidades numricas *entro de las variables cuantitativas se diferencian las llamadas
discretas de las continuas 0e consideran discretas aquellas cuyos valores son puntos aislados, esto
es, cuando todo valor tiene un consecutivo 0e consideran continuas a las variables que, al menos
tericamente pueden tomar cualquier valor dentro de un intervalo numrico
Constructo y /peracionali!acin: cuando se alude a estas variables es necesario explicitar que
se entiende por ellas, o que aspectos se est"n considerando y qu relaciones se veri'can entre
ellas *e all surge una construccin terica, hipottica que toma el nombre de constructo $stos
constructos o variables complejas no son directamente observables como son y esto es lo que
di'culta el proceso de medicin, para poder obtener valores de estas variables a travs de la
medicin es necesario hacer un 6recorte adecuado7 del constructo- es decir, considerar un solo
aspecto del mismo y explicitar cu"les son las manifestaciones observables que dan cuenta de l $n
estos casos se recurre a una de'nicin operacional <operacionalizacin? del constructo permite
asignar sin ambigUedad un valor a la variable a travs del proceso de medicin ) las variables que
no son directamente observables tambin se las denomina rasgos latentes
Continuo o discreto: el hecho de que una variable estadstica sea discreta o continua determina el
tipo de tratamiento estadstico que se le dar" 0in embargo muchas veces es decisin del
investigador si la tratar" de un modo y otro dependiendo de la naturaleza de la variable estadstica y
de su correspondiente variable latente $s importante considerar que para que una variable discreta
pueda ser tratada adecuadamente como continua, es conveniente que tome una gran cantidad de
valores diferentes
?o#lacin de /#servaciones: es el conjunto de todos los valores que pueden tomar una variable
estadstica sobre la poblacin de individuos Ntese que sobre una misma poblacin de individuos se
pueden de'nir muchas poblaciones de observaciones, tantas como variables de inters
(uestra de /#servaciones: es el conjunto de de valores que toma una variable estadstica sobre
una muestra de individuos- es decir, es un subconjunto de la poblacin de observaciones
Estadstica Descriptiva: es la parte de la estadstica que proporciona mtodos para organizar,
representar, resumir y analizar la informacin contenida en un conjunto de datos muestrales o
poblaciones
Estadstica in"erencial( es la parte de la estadstica que proporciona mtodos para extraer
conclusiones sobre las poblaciones a partir de sus muestras controlando el margen de error que se
pueden cometer en esa extrapolacin de lo muestral a lo poblacional Los mtodos de inferencia
estadstica se agrupan fundamentalmente en dos clases( estimacin de par"metros y contraste de
hiptesis
?o#laciones reales o Gipot$ticas =nitas o in=nitas( una muestra de observaciones siempre es
eral porque consiste de datos efectivamente recolectados- pero la correspondiente poblacin de
observaciones puede ser real o hipottica #or otra parte, una poblacin de observaciones puede ser
'nita, esto es con una cantidad grande o pequea pero limitada de elementos #ero una poblacin
puede ser in'nita La importancia de reconocer con que tipo de poblacin se est" trabajando radica
en la pertinencia de los mtodos estadsticos que se utilizan para recoger los datos, analizarlos y
sacar conclusiones
?armetro: es una caracterstica 'ja, generalmente numrica, de la poblacin de valores de una
variable
Estadstico( es una caracterstica muestral y como tal, es una variable porque sus valores dependen
de la muestra que salga seleccionada !ada valor del estadstico se obtiene como funcin de las
observaciones de una muestra
Estimador: es un estadstico cuyos valores se consideran prximos a un par"metro que, por ser
generalmente desconocido, se desea estimar
3recuencia .#soluta( es la cantidad de veces que cada valor de la variable aparece en un conjunto
de datos La suma de todas las frecuencias absolutas coincide con la totalidad de los datos
Estadstica )n"erencial.
Botella
Captulo 11.
$l azar tiene que ver con aquellos eventos cuyo resultado no podemos predecir con certeza, y a los
que nosotros llamaremos experimentos aleatorios Lo que depende del azar, y por tanto, da
sentido al trmino aleatorio en este contexto, es el procedimiento de extraccin de un individuo y
slo uno, de los que componen la poblacin .odo experimento aleatorio tiene dos o m"s resultados
posibles, que nosotros llamaremos sucesos elementales $n un experimento que tuviera solo un
resultado posible no habra incertidumbre y por tanto, no podramos hablar de experimento
aleatorio La realizacin de un experimento aleatorio da lugar a un suceso elemental, y slo uno, de
entre los posibles )l conjunto de los resultados posibles de un experimento aleatorio, o sucesos
elementales, se le llama espacio muestral y se representa por $ 0e llama veri'cacin de un
suceso elemental al hecho de que la realizacin del experimento aleatorio produzca ese suceso
elemental 0obre los espacios muestrales, como conjuntos que son, se pueden de'nir subconjuntos,
que denominaremos sucesos y los representaremos por letras may+sculas )unque para de'nir un
suceso basta con de'nir un subconjunto cualquiera de $, normalmente los sucesos con los que
trabajaremos se constituiran con los sucesos elementales que cumplen alguna condicin, y no de
forma arbitraria 2n suceso se veri'car" cuando el experimento aleatorio de lugar a uno de los
sucesos elementales que integran el subconjunto que lo de'ne $n algunas ocasiones se de'nen
sucesos a partir de subconjuntos vacos $ste tipo de sucesos reciben el nombre de suceso
imposible $n otras ocasiones de'nen sucesos cuyo subconjunto constituyente est" formado por
todos los elementos del espacio muestral $ste tipo de sucesos reciben el nombre de suceso
seguro Tamos a de'nir operaciones sobre sucesos que utilizaremos a partir de aqu(
a; Llamaremos unin de dos sucesos al subconjunto $ formado por sucesos elementales
que integran los subconjuntos de al menos uno de esos sucesos
#; Llamaremos interseccin de dos sucesos al subconjunto de $ formado por los sucesos
elemtanles que pertenecen simult"neamente a ambos sucesos !uando la interseccin
de dos sucesos es un subconjunto vaco se dice que son sucesos incompatibles o
exclusivos
c; Llamaremos diferencia de dos sucesos al subconjunto $ integrado por los sucesos
elementales que pertenecen al primero, pero no al segundo
d; Llamaremos complementario de un suceso al subconjunto de $ integrado por los
sucesos elementales no incluidos en ese suceso
$n trminos generales representaremos por n al n+mero de sucesos elementales que integran el
espacio muestral, y por n
a
al n+mero de sucesos elementales que constituyen el suceso )
'n experimento aleatorio es toda accin cuyo resultado no se puede
predecir con certe!a.
Cada uno de los resultados posi#les de un e:perimento aleatorio se
llama suceso elemental y su con&unto constituye el espacio muestral
del e:perimento aleatorio.
1a veri=cacin de un suceso elemental es la o#servacin de ese suceso
elemental al reali!ar el e:perimento aleatorio.
'n suceso es cualquier su#con&unto de los elementos de un espacio
muestral.
Dos sucesos son incompati#les o e:clusivos si no tienen elementos
comunes y por tanto no pueden veri=carse simultneamente.
El complementario de un suceso es el su#con&unto de sucesos
elementales del espacio muestral que no participan en ese suceso.
1a interseccin de dos sucesos es el su#con&unto de elementos del
espacio muestral que simultneamente estn incluidos en los
su#con&untos de am#os sucesos.
1a unin de dos sucesos es el su#con&unto de elementos del espacio
muestran que estn incluidos al menos en uno de esos sucesos.
-ipos de espacio muestral: los espacios muestrales se clasi'can en espacios muestrales 'nitos e
in'nitos y a su vez estos +ltimos se subdividen en numerables y no numerables
a; $spacios muestrales 'nitos( un espacio muestral es 'nito si tiene un n+mero de
sucesos elementales 'nito
#; $spacios muestrales in'nitos numerables .iene in'nitos sucesos elementales pero
estos pueden ponerse en correspondencia biunvoca con los n+meros naturales
c; $spacios muestrales in'ntos no numerables .iene in'nitos sucesos elementales pero
stos no pueden ponerse en correspondencia biunvoca con los n+meros naturales
?R/B.B)1)D.D.
$l concepto de probabilidad hace referencia a como los eventos puntuales que tienen resultados
inciertos, al estudiar su repeticin un n+mero grande veces, comienzan a tener resultados
globalmente previsibles, y a mostrarse sujetos a ciertas leyes La probabilidad es un concepto ideal,
pues se re'ere a las frecuencias con las que ocurriran las cosas en el caso hipottico de que los
eventos se repitiesen un n+mero in'nitamente grande de veces y en las mismas condiciones La
con'anza puesta en cada uno de los elementos posibles en la prxima realizacin del evento debe
ser proporcional al n+mero de repeticiones que cada una de esas alternativas se daran en el futuro
La asignacin de n+meros a esos grados de con'anza depositados en la obtencin de cada resultado
es la clave del concepto de probabilidad(
1a pro#a#ilidad de un suceso es un n,mero que cuanti=ca en t$rminos
relativos las opciones de veri=cacin de ese suceso.
2n suceso sin opcin alguna tendra una probabilidad igual a >, y un suceso con todas las opciones
tendran una probabilidad igual a C !ualquier suceso con un n+mero de opciones intermedio entre
esos dos tendr" como probabilidad asociada un n+mero intermedio cuya magnitud represente
cuantitativamente esas opciones No obstante a veces se utilizan porcentajes para indicar
probabilidad, que es lo mismo, pero estrictamente hablando esos valores no son probabilidades, sino
porcentajes de posibilidades que expresan cuantas de cada cien veces se espera que ocurra el
suceso
E+3/P'E C1@%)C/
La aplicacin del enfoque cl"sico o a priori exige la aceptacin del llamado principio de indiferencia,
seg+n el cual todos los elementos del espacio muestral tienen las mismas opciones de ser
veri'cados al realizar un experimento aleatorio *esde el enfoque cl"sico que exige asumir el
principio de indiferencia se de'ne la probabilidad de un suceso como la frecuencia relativa de ese
suceso en el espacio muestral *esde este enfoque la probabilidad de un suceso es igual al cociente
entre el n+mero de casos favorables y posibles Los procedimientos habitualmente utilizados para
determinar estas cantidades reciben los nombres de tcnicas de contar o combinatoria *e la forma
de de'nir la probabilidad de este enfoque se deducen(
a; La probabilidad de un suceso es un valor que oscila entre > y C
#; 2n suceso que no contiene ning+n suceso elemental tiene una probabilidad igual a >, y
por ello recibe el nombre de suceso imposible
c; 2n suceso que contiene todos los sucesos elementales del espacio muestral tiene una
probabilidad igual a C y por ello recibe el nombre de suceso seguro
d; La suma de las probabilidades de un suceso y su complementario es igual a C
E+3/P'E 3REC'E+C).1)%-.
La probabilidad se determinara mediante una operacin ideal de repeticin sistem"tica del
experimento aleatorio y de cmo del n+mero de veces que se veri'can los sucesos Las opciones de
veri'cacin de un suceso se manifestaran en el n+mero de veces que se repite este al realizar una y
otra vez el experimento aleatorio 5epresenta proporcionalmente a su probabilidad, el n+mero de
veces que se realiza el experimento debe ser in'nitamente grande #or tanto, desde el enfoque
frecuencialista la probabilidad de un suceso ) se de'ne como el lmite de la frecuencia relativa de
apariciones de ese suceso cuando el n+mero de repeticiones del experimento aleatorio tiende a
in'nito
La diferencia fundamental entre este enfoque y el anterior es que mientras en el primero n era el
tamao del espacio muestral, en este representa el n+mero de repeticiones del experimento
aleatorio *e esta de'nicin se deducen las mismas consecuencias y propiedades que exponamos
en conexin con el enfoque cl"sico
Captulo 12.
$n ciencia resulta extremadamente +til representar a los sucesos elementales por n+meros, creando
lo que se denominan variables aleatorias 2na funcin es cualquier conjunto de pares ordenandos de
elementos, en los cuales se repite el primer elemento )s, el siguiente conjunto de pares ordenados
es una funcin Las variables aleatorias son funciones que cumplen con ciertos requisitos
'na varia#le aleatoria es una "uncin que asocia un n,mero real y
slo uno a cada suceso elemental del espacio muestral de un
e:perimento aleatorio.
5epresentaremos a las variables aleatorias por letras may+sculas *istinguiremos entre variables
aleatorias discretas y variables aleatorias continuas Las primeras son las que se de'nen sobre
espacios muestrales 'nitos o in'nitos pero numerables, mientras que las segundas son las que se
de'nen sobre espacios muestrales in'nitos no numerables
Captulo 1>: (odelos de distri#ucin de pro#a#ilidad.
D)%-R)B'C)*+ B)+/().1
#ara que la distribucin de probabilidad de una variable se ajuste al modelo binomial deben
cumplirse una serie de requisitos $l primero es que se base en una variable dicotmica $sta
variable dicotmica no es todava la variable nominal, pero su presencia es imprescindible para la
generacin de sta Las variables que est"n en la base de una variable binomial pueden de'nirse
como aquellas que adoptan la regla de asignar un C si se cumple una cierta condicin y un > si no se
cumple $l segundo requisito es que haya una repeticin de n ensayos de la variable dicotmica en
los que la probabilidad de que cada repeticin se veri'que la condicin, y por tanto se asigne un C,
sea constante ) la probabilidad de veri'cacin de la condicin en cada ensayo independiente la
representaremos por n $l tercer y +ltimo requisito es que se de'na una variable B, como el 6n+mero
de casos que en la secuencia de n ensayos dicotmicos veri'can la condicin especifcada, o lo que
es lo mismo, el n+mero de unos observados
%i a; de=nimos una varia#le dicotmica a partir del cumplimiento o
incumplimiento de una condicin.
B; reali!amos una secuencia de n o#servaciones de esos ensayos
dicotmicos en los que la pro#a#ilidad de veri=cacin de la condicin en cada
repeticin es constante.
C; de=nimos una varia#le aleatoria 8 como el n,mero de casos de esa
secuencia en los que se cumple la condicin.
Entonces la varia#le 8 se a&usta a un modelo #inomial con parmetros n y
9 y se representa por: B48Q n 9;
*e la forma de generar una variable aleatoria binomial se deducen algunas de sus caractersticas(
a; Los valores de una variable binomial oscilan entre > y n $l n+mero m"s pequeo posible de
casos en los que se veri'ca la condicin es ninguno y el m"ximo de todos
#; 0i representamos el resultado de cada ensayo dicotmico con ceros y unos, el valor que
adopta la variable B no es m"s que la suma de esa secuencia de unos y ceros
c; $l valor esperado de una variable binomial se obtiene a partir de las propiedades de la suma
de variables aleatorias y de la de'nicin del valor esperado *ado que una binomial es la suma de
una secuencia de n valores, y cada uno de ellos puede considerarse una variable aleatoria
dicotmica, su valor esperado ser" igual a la suma de los valores esperados de cada una de ellas
-R.+%?.RE+C).%
2na distribucin de probabilidades es un modelo de distribucin de frecuencias relativas tericas-
esto es, una variable que toma ciertos valores y a cada uno de estos valores se les asigna una cierta
frecuencia relativa que no proviene de la observacin de un hecho realizado sino que es deducida a
partir de ciertas condiciones tericas La probabilidad de un valor de la variable puede interpretarse
como una medida de la posibilidad de que dicho valor sea observado
(/DE1/ BER+/'11): una variable se distribuye seg+n el modelo @ernoulli, cuando toma slo dos
valores Los dos valores de un variable @ernoulli, suelen denominarse 6xito7 o 6fracaso7 y
codi'carse respectivamente con C y > La probabilidad asignada al xito se la denota con la letra 6p7
por lo que la del fracaso con 6CRp7 ya que deben sumar C 2na variable @ernoulli queda totalmente
caracterizada conociendo el par"metro p, es decir, la probabilidad de xito o, equivalentemente, la
probabilidad de fracaso
B)+/().1: la distribucin binomial depende de dos valores 'jos o par"metros a saber( un n+mero
natural n y una probabilidad p 2na variable binomial es aquella cuyos valores son >, C, DF n, por
tanto es un modelo para una variable discreta V y las probabilidades asociadas a cada uno de ellos
resultan de la aplicacin de una frmula matem"tica que involucran a n y a p
RE1.C)*+: una variable binomial de par"metros n y p puede generarse, bajo ciertas condiciones
que mencionaremos despus, a partir de n observaciones de una variable @ernoulli de par"metro p
<n es la cantidad de observaciones de una variable @ernoulli y p la probabilidad de xito en cada
observacin de la variable @ernoulli?
C/+D)C)/+E% +ECE%.R).% ?.R. 1. RE1.C)*+.
$stabilidad( la probabilidad de xito debe permanecer constante en las n observaciones de la
variable @ernoulli
9ndependencia( la probabilidad de obtener xito en una observacin no aumenta ni disminuye si se
conoce el resultado de otra observacin
D)%-R)B'C)*+ ('1-)+/().1
$n ocasiones se trabaja con ensayos que en lugar de dar lugar a dos resultados alternativos
<dicotoma? puede dar lugar a m"s de dos <politoma? $n estos casos las probabilidades asociadas a
cualquier combinacin de resultados pueden obtenerse mediante el modelo multinomial
(/DE1/% ?.R. 0.R).B1E% C/+-)+'.%.
La mayor parte de las tcnicas inferenciales que se utilizan para la investigacin en psicologa tienen
distribuciones de probabilidad que se ajustan a las de los modelos tericos para variables continuas
La curva normal, a dem"s de ser un instrumento para la inferencia estadstica, es el modelo al que
se ajustan muchas variables de inters en psicologa
D)%-R)B'C)*+ REC-.+G'1.R: es la equivalente a la uniforme de las variables discretas 2na
variable aleatoria se ajusta a este modelo si todos los valores con probabilidad no nula tienen la
misma funcin de densidad de probabilidad 5epresentacin gr"'ca( un rect"ngulo
D)%-R)B'C)*+ +/R(.1: la importancia de la curva normal estriba no slo en su utilidad para el
an"lisis estadstico, sino que en muchas variables de inters para los psiclogos La estatura, el
peso, la agudeza visual, la fuerza son variables que se ajustan a este modelo ,a dentro de la
psicologa, variables como el cociente intelecutal, la extraversin son variables con distribucin
normal $n la mayor parte de las variables existe un valor central <la media? en torno a la cual se
concentran la mayor parte de los individuos, y a medida que nos vamos 'jando en valores m"s
alejados de la media observamos que stos son menos frecuentes $sta reduccin gradual en la
frecuencia no es lineal, sino que es mayor al principio y menor despus <pasa de convexa a cncava
al alejarse de la media? 2na variable aleatoria se distribuye seg+n el modelo nomral, con
par"metros u y o Las variables cuya distribucin se ajusta al modelo normal adoptan una
representacin gr"'ca en la que se pueden apreciar algunas de las propiedades que vamos a
enumerar(
a; $s simtrica con respecto a un valor central <u? y en ese valor central coinciden la media, la
mediana o la moda
#; $s asinttica con respecto al eje de abscisas, es decir, por mucho que se extienda, nunca
llega a tocar los ejes
c; Aay toda una familia de curvas normales, dependiendo de los valores de u y o *e entre
ellas, la m"s importante es aquella que tienen media > y de desviacin tpica C
d; Los puntos de in/exin se encuentran en los puntos correspondientes a la media m"sSmenos
una desviacin tpica <u :R o?
e; !ualquier combinacin lineal de variables aleatorias normales se ajusta tambin al modelo
normal
La mayor parte del trabajo pr"ctico con variables aleatorias normales consiste en hallar
probabilidades asociadas a valores $sto signi'cara integrar la funcin de densidad entre los valores
de inters #ara evitar tener que resolver este tipo de operaciones se han construido tablas
apropiadas con las "reas ya halladas y cuyo eso se basa en el teorema de tipi'cacin 0eg+n este
teorema, la funcin de distribucin asociada a un valor de una variable aleatoria, B, con distribucin
normal, es la misma que la funcin de distribucin de la tipi'cada de ese valor en la normal unitaria
#ara obtener las "reas asociadas a un valor de cualquier otra distribucin normal basta con tipi'car
ese valor y acudir con la z obtenida en la tabla correspondiente
$l trabajo con variables aleatorias normales, al igual que con otras variables continuas, se reduce a
la obtencin de las probabilidades de obtener un valor menor o igual que uno concreto, la de obtener
un valor mayor o igual que uno concreto, o la de obtener un valor comprendido entre dos valores
concretos
.nlisis de datos en ?sicolo<a ?ardo y %an (artin
Contraste de Aiptesis
$l objetivo +ltimo del an"lisis de datos es el de extraer conclusiones de tipo general a partir de unos
pocos datos particulares $s decir, el de extraer conclusiones sobre las propiedades de una poblacin
a partir de la informacin contenida en una muestra procedente de esa poblacin <inferencia
estadstica? *os formas b"sicas de inferencia estadstica( la estimacin de par"metros y el contraste
de hiptesis La estimacin de par"metros es el proceso consistente en asignar a las propiedades
desconocidas de una poblacin las propiedades conocidas de una muestra extrada de esa
poblacin $l contraste de hiptesis es un proceso mediante el cual se trata de comprobar si una
a'rmacin sobre alguna propiedad poblacional puede ser sostenida a la luz de la informacin
muestral disponible #uede ser entendido como un mtodo de toma de decisiones, que nos permite
decidir si una proposicin acerca de una poblacin puede ser mantenida o debe ser rechazada
1*G)C.
$l primer paso del proceso de veri'cacin de una hiptesis consiste en formular estadsticamente la
hiptesis cient'ca que se desea contrastar, es decir, en transformar la hiptesis cient'ca en
hiptesis estadstica $sto supone que una hiptesis cient'ca puede ser formulada en trminos de la
forma de una o varias distribuciones poblacionales, o en trminos del valor de uno o m"s par"metros
de esa o esas distribuciones 8ormulada la hiptesis estadstica, el segundo paso del proceso de
veri'cacin consiste en buscar evidencia emprica relevante capaz de informar sobre si la hiptesis
establecida es o no sostenible 2na hiptesis ser" compatible con los datos empricos cuando a partir
de ella sea posible deducir o predecir un resultado muestral con cierta precisin Necesitamos una
regla de decisin que debe establecerse en trminos de probabilidad #ero la necesidad de trabajar
con muestras en lugar de con poblaciones nos obliga a establecer una regla de decisin en trminos
de probabilidad $n general, la regla de decisin que utilizaremos ser" una a'rmacin de este tipo( si
el resultado muestral observado es, suponiendo correcta nuestra hiptesis, muy poco probable,
consideraremos que nuestra hiptesis es incompatible con los datos- por el contrario, si el resultado
muestral observado es, suponiendo correcta nuestra hiptesis, probable, consideraremos que
nuestra hiptesis es compatible con los datos
'n contraste de Giptesis es un proceso de decisin en el que una
Giptesis "ormulada en t$rminos estadsticos es puesta en relacin con
los datos empricos para determinar si es o no compati#le con ellos.
A)?*-E%)% E%-.DJ%-)C.
2na hiptesis estadstica es una a'rmacin sobre una o m"s distribuciones de probabilidad- m"s
concretamente, sobre la forma de una o m"s distribuciones de probabilidad, o sobre el valor de uno
o m"s par"metros de esas distribuciones La hiptesis estadstica se suele representar por la letra A
seguida de una informacin que le da contenido 0urge a partir de una hiptesis cient'ca La
primera proporciona la base para la formulacin de la segunda, pero no son la misma cosa %ientras
una hiptesis cient'ca se re'ere a alg+n aspecto de la realidad, una hiptesis estadstica se re'ere a
alg+n aspecto de una distribucin de probabilidad $xisten varias formas de expresar
estadsticamente una hiptesis cient'ca correcta $l primer paso en el proceso de veri'cacin de
una hiptesis consiste en formular en trminos estadsticos la a'rmacin contenida en la hiptesis
cient'ca que se desea veri'car .odo contraste se basa en la formulacin de dos hiptesis
1a Giptesis nula representada por AR S 1a Giptesis alternativa
representada por Ai.
La hiptesis nula es la hiptesis que se somete a contraste !onsiste generalmente en una
a'rmacin concreta sobre la forma de una distribucin de probabilidad o sobre el valor de alguno de
los par"metros de esa distribucin La hiptesis alternativa es la negacin de la nula, incluye todo lo
que la nula excluye %ientras la nula suele ser una hiptesis exacta <tal cosa es igual a tal otra?, la
alternativa suele ser inexacta <tal cosa es distinta, mayor o menor que otra? !uando en Ai aparece
el signo 6distinto7 decimos que el contraste es bilateral o bidireccional !uando en Ai aparece los
signos mayor o menor, decimos que el contraste es unilateral o unidireccional La hiptesis nula y
alternativa suelen plantearse como hiptesis rivales 0on exhaustivas y mutuamente exclusivas, lo
cual implica que si una es verdadera, la otra es necesariamente falsa
%'?'E%-/%
#ara que una hiptesis estadstica pueda predecir un resultado muestral con cierta exactitud es
necesario, en primer lugar, que la distribucin poblacional con la que se va a trabajar est
completamente especi'cada 0on hiptesis que especi'can por completo las distribuciones
poblacionales a las que hacen referencia 0e las llama simples Las hiptesis en las que la
distribucin poblacional no queda completamente especi'cada reciben el nombre de compuestas Lo
ideal es plantear hiptesis nulas simples, pero ocurre que ni los intereses del investigador se
corresponden siempre con el contenido de una hiptesis simple
1os supuestos de un contraste de Giptesis son un con&unto de
a=rmaciones que necesitamos esta#lecer 4so#re la po#lacin de
partida y so#re la muestra utili!ada; para conse<uir determinar la
distri#ucin de pro#a#ilidad en la que se #asar nuestra decisin
so#re Ao.
)lgunos de estos supuestos son m"s restrictivos o exigentes que otros $s importante tener presente
que el incumplimiento de uno o varios supuestos podra invalidad el contraste y llevarnos a una
decisin errnea !onviene, por tanto, que los supuestos sean pocos y poco exigentes
E%-.DJ%-)C/ DE C/+-R.%-E.
'n estadstico de contraste es un resultado muestral que cumple la
do#le condicin de proporcionar in"ormacin emprica relevante so#re
la a=rmacin propuesta en la Giptesis nula y poseer una distri#ucin
muestral conocida.
La condicin que debe cumplir un resultado muestral para poder ser utilizado como estadstico de
contraste es la de poseer una distribucin muestral conocida 2n estadstico, es una variable
aleatoria y como tal, tiene su propia funcin de probabilidad a la que denominamos distribucin
muestral 2na vez planteada la hiptesis, es necesario seleccionar el estadstico de contraste capaz
de proporcionarnos informacin relevante sobre ellas y establecer los supuestos necesarios para
conseguir determinar la distribucin normal del estadstico
REG1. DE DEC)%)*+
La regla de decisin es el criterio que vamos a utilizar para decidir si la hiptesis nula planteada
debe o no ser rechazada $ste criterio se basa en la particin de la distribucin muestral del
estadstico de contraste en dos zonas mutuamente exclusivas( la zona de rechazo y la zona de
aceptacin La zona de rechazo tambin llamada zona crtica, es el "rea de la distribucin muestral
que corresponde a los valores del estadstico de contraste que se encuentran tan alejados de la
a'rmacin establecida en Ao, que es muy poco probable que ocurran si Ao, como se supone, es
verdadera 0u probabilidad es alfa <nivel de signi'cacin? La zona de aceptacin es el "rea de la
distribucin muestral que corresponde a los valores del estadstico de contraste prximos a la
a'rmacin establecida en Ao $s, por tanto, el "rea correspondiente a los valores del estadstico de
contraste que es probable que ocurran si Ao como se supone, es verdadera 0u probabilidad es C V
alfa, valor llamado nivel de con'anza
1a re<la de decisin consiste en recGa!ar Ao si el estadstico de
contraste toma un valor perteneciente a la !ona de recGa!o o crticaQ
mantener Ao si el estadstico de contraste toma un valor
perteneciente a la !ona de aceptacin.
0e rechaza una hiptesis sometida a contraste cuando e valor del estadstico de contraste cae en la
zona crtica- y se rechaza porque eso signi'ca que el valor tomado por el estadstico de contraste se
aleja demasiado de la prediccin establecida por esa hiptesis, es decir, porque, si la hiptesis
planteada fuera verdadera, el estadstico de contraste no debera haber tomado ese valor- como de
hecho el estadstico ha tomado es el valor, la conclusin m"s razonable ser" que la hiptesis
planteada no es verdadera $l tamao de las zonas se determina 'jando el valor de alfa, es decir,
'jando el valor de signi'cacin con el que se desea trabajar La forma dividir la distribucin muestral
en zonas depende de si el contraste es bilateral o unilateral La zona crtica debe estar situada all
donde puedan aparecer los valores muestrales incompatibles con Ao, es decir, all donde puedan
aparecer los valores muestrales que apunten en la direccin propuesta en A $n los contrastes
bilaterales, la zona crtica se encuentra, generalmente repartida a partes iguales entre las dos colas
de la distribucin muestral $n los contrastes unilaterales la zona crtica se encuentra en una de las
dos cola de la distribucin muestral
DEC)%)*+
2na decisin, en el contexto del contraste, siempre consiste en rechazar o mantener una Ao
particular 0i la rechazamos estamos a'rmando que esa hiptesis es falsa, es decir, estamos
a'rmando con una probabilidad alga de equivocarnos, que hemos conseguido probar que esa
hiptesis es falsa #or el contrario, si la mantenemos, no estamos a'rmando que hemos probado que
esa hiptesis es verdadera, simplemente estamos a'rmando que no disponemos de evidencia
emprica su'ciente para rechazarla y que por lo tanto, podemos considerarla compatible con los
datos
Cuando decidimos mantener una Giptesis nula queremos si<ni=car
con ello que consideraos que esa Giptesis es compati#le con los
datos. Cuando decidimos recGa!ar una Giptesis nula queremos
si<ni=car con ello que consideramos pro#ado que esa Giptesis es
"alsa
ERR/RE% DE -)?/ ) 7 ))
Ao puede ser verdadera o puede ser falsa 0i Ao es verdadera y la mantenemos estaremos tomando
una decisin correcta- si es falsa y la rechazamos, tambin estaremos tomando una decisin
correcta #ero si Ao es verdadera y la rechazamos, estaremos cometiendo un error e igualmente
estaremos cometiendo un error si Ao es falsa y la mantenemos
1lamamos error de tipo ) al que se comete cuando se decide recGa!ar
una Ao que en realidad es verdadera. 1a pro#a#ilidad de cometer ese
error es al"a.
1lamamos error de tipo )) al que se comete cuando se decide mantener
una Ao que en realidad es "alsa. 1a pro#a#ilidad de cometer ese error
es #eta.
#or tanto 9 V alfa ser" la probabilidad de tomar una decisin correcta cuando Ao es verdadera , CR
beta ser" la probabilidad de tomar una decisin correcta cuando Ao es falsa La probabilidad de
cometer un error 9 con nuestra decisin es una probabilidad conocida, pues el valor de alfa lo 'ja el
propio investigador 0in embargo, la probabilidad de cometer un error de tipo 99, es un valor
desconocido que en un contraste depende de tres factores( la verdadera Ai, el valor de alga y el
tamao del error tpico de la distribucin muestral utilizada para efectuar el contraste
?/-E+C).
1a potencia 41KB; de un contraste es la pro#a#ilidad de recGa!ar una
Giptesis nula que en realidad es "alsa.
!uando hablamos de la potencia de un contraste, por tanto, nos estamos re'riendo a la capacidad
de ese contraste para detectar que una hiptesis concreta es falsa #ara poder calcular la potencia
de un contraste necesitamos referirnos a una a'rmacin de las muchas de'nidas en Ai
+)0E1 CRJ-)C/ 7 -.(.T/ DE1 E3EC-/.
La probabilidad de cometer un error de tipo 9 se establece antes de efectuar el contraste para evitar
que in/uya en la decisin 'nal $n ese sentido, podemos entender el nivel de signi'cacin como el
riesgo m"ximo que estamos dispuestos a asumir al tomar la decisin de rechazar la hiptesis
concreta $fectuar un contraste estableciendo previamente un nivel de signi'cacin es lo que se
hace, aunque trae inconvenientes(
1. La decisin sobre Ao puede depender decisivamente del nivel de signi'cacin
establecido #odemos decidir mantener la hiptesis con alfa H >>C y rechazarla con
alfa H >>I
2. *ecidir si Ao es o no falsa no proporciona ning+n tipo de informacin sobre el grado en
el que la evidencia muestral se muestra incompatible con esta hiptesis
0i consideramos que cometer un error de tipo 9 es muy grave, adoptaremos para alfa un valor m"s
pequeo que si consideramos que cometer ese error no tiene consecuencias graves #ero
recordemos que al hacer m"s pequeo el valor de alfa, la potencia del contraste disminuye
autom"ticamente <que es igual que decir que la potencia de que se produzca un error 99 se
incrementa? $so puede llevar a cometer un error 99 por querer evitar el 9
1lamamos nivel crtico y lo representamos por p al nivel de
si<ni=cacin ms peque9o al que una Giptesis nula puede ser
recGa!ada con el estadstico de contraste o#tenido.
#odemos de'nir el nivel crtico, m"s brevemente, como la probabilidad asociada al estadstico de
contraste en trminos generales, en un contraste unilateral, el nivel crtico es la probabilidad
asociada a los valores mayores o menores que el estadstico de contraste obtenido- en un contraste
bilateral, el nivel crtico es la probabilidad asociada a los valores que se encentran tan alejados de
Ao como, al menos, el estadstico de contraste 0eg+n esto, e nivel crtico se obtiene, a diferencia de
lo que ocurre con el nivel de signi'cacin, despus de efectuar el contraste, es decir, una vez
obtenido el estadstico de contraste *ecidir si una hiptesis es o no falsa no constituye, en la mayor
parte de las situaciones experimentales, un criterio su'ciente para determinar si el experimento
realizado contribuye o no de la forma signi'cativa al desarrollo de una teora o de una lnea de
investigacin $sto es as porque la decisin a la que se llega en un contraste de hiptesis sobre la
base del grado de discrepancia existente entre la Ao planteada y la evidencia muestral observada
depende directamente, seg+n hemos sealado ya, del tamao de la muestra utilizada .amaos
muestrales grandes pueden llevarnos a considerar estadsticamente signi'cativas discrepancias muy
pequeas y tamaos muestrales muy pequeos pueden llevarnos a considerar estadsticamente
insigni'cantes discrepancias tericamente relevantes
Contraste de Aiptesis so#re (edias
$l contraste de hiptesis sobre una media sirve para tomar decisiones acerca del verdadero valor
poblacional que corresponde a la media de una variable 0abemos que si extraemos una muestra
aleatoria de tamao n de una poblacin normal, y calculamos la media, esa media es un estadstico
distribuido normalmente 0abemos tambin, por el teorema central del lmite, que, aun
desconociendo la forma de la poblacin de donde extraemos la muestra, el estadstico tiende a
distribuirse normalmente a medida que el tamao de la muestra n va aumentando #recisamente el
conocimiento de esas probabilidades es el que nos proporciona la posibilidad de tomar decisiones
respecto al par"metro u al contrastar hiptesis sobre la media de una poblacin, la situacin con la
que generalmente nos encontraremos ser" aquella la cual los par"metros poblacionales <tanto u
como o? ser"n desconocidos
D/% (ED).% )+DE?E+D)E+-E%
$l contraste sobre dos medias independientes es el idneo para comparar dos grupos de sujetos en
alguna variable de inters )l trabajar con dos medias independientes, lo estamos haciendo con dos
poblaciones distintas de las que extraemos, independientemente, dos muestras aleatorias de
tamaos ni y nD $n cada una de esas muestras medimos la variable aleatoria, calculamos el
estadstico en cada una de ellas y utilizamos esa informacin muestra para determinar si las dos
poblaciones poseen o no la misma media u *ado que ,i y ,D son valores muestrales, difcilmente
ser"n iguales, pero la cuestin que interesa responder es si esas medias muestrales son lo bastante
diferentes como para pensar que proceden de poblaciones con diferente media $s decir, si esas
medias muestrales son lo bastante diferentes como para pensar que los grupos comparados di'eren
signi'cativamente en la variable estudiada *el mismo modo que la media muestral nos proporciona
la mejor estimacin de la media poblacional, la mejor estimacin que podemos obtener sobre la
diferentes entre dos medias poblacionales es justamente la diferencia de dos medias muestrales
%'?/+)E+D/ 0.R).+I.% )G'.1E%
0i suponemos que las varianzas poblacionales son iguales <homocedasticidad?, slo ser" necesario
estimar un par"metro o
D
, puesto que los dos estimadores insesgados de que disponemos so
independientes, lo apropiado ser" utilizar ambos estimadores para obtener una +nica estimacin de
o
D
, pues lo m"s probable es que la combinacin ponderada de ambos estimadores nos proporcione
una estimacin m"s exacta de o
D
que la de uno por separado
#rueba sobre diferencia de medias( es necesario que las poblaciones originales sean normales 0i los
tamaos muestrales son razonablemente grandes, e iguales o aprox iguales, el incumplimiento de
esta condicin no tiene consecuencias relevantes sobre las conclusiones del contraste *e manera
que con tamaos apropiados, el procedimiento sigue siendo v"lido independientemente de la forma
de las poblaciones de origen $n lo relativo al supuesto de homocedasticidad, si los tamaos
muestrales son iguales y el supuesto de normalidad no se incumple, el procedimiento es v"lido
incluso con varianzas poblacionales muy diferentes $s conveniente que los tamaos muestrales
sean grandes para poder garantizar que, independientemente de la forma de las poblaciones de
origen, la distribucin muestral se aproxime al modelo de distribucin de probabilidad normal
%'?/+)E+D/ 0.R).+I.% D)%-)+-.%
0i las varianzas poblacionales no son iguales, carece de sentido obtener una +nica estimacin de las
mismas a partir de la combinacin ponderada de los dos estimadores disponibles %"s bien, cada
uno deber" ser considerado un estimador de la varianza de su propia poblacin
1a prue#a 8
2
de ?earson.
La prueba permite estudiar diferentes aspectos del an"lisis de datos referidos a variables
cualitativas $stos aspectos son la bondad de ajuste, la independencia y homogeneidad de
proporciones $n el primero se trabaja con una sola variable y se trata de averiguar si unos datos
empricos concretos se ajustan o no a una determinada distribucin terica $n el segundo, se
estudian dos variables con el objetivo de contrastar si son o no independientes $n el tercero, se
trabaja tambin con dos variables, pero poniendo el nfasis en la distribucin condicional de una de
ellas para los diferentes niveles de la otra
-.B1.% DE C/+-)GE+C).
!uando se trabaja con variables de ndole cualitativa, los datos suelen presentarse en tablas de
contingencia( conjunto organizado de frecuencias clasi'cadas seg+n uno o m"s criterios !uando una
tabla de contingencia slo incluye dos variables las llamamos bidimensional- si incluye tres,
tridimensional, etc
B/+D.D DE .B'%-E
Los contrastes de hiptesis sobre bondad de ajuste permiten comprobar si la forma de la distribucin
de probabilidad de una variable se ajusta a una determinada distribucin de probabilidad terica
#uesto que estamos tratando con variables cualitativas, esas distribuciones tericas ser"n la
uniforme, la binmial y la multinomial $l procedimiento se trata de comparar las frecuencias
observadas o empricas con las frecuencias esperadas o tericas, es decir, con las frecuencias que
cabra esperar encontrar en la muestra si realmente la distribucin de probabilidad terica o
poblacional fuera la propuesta
)+DE?E+DE+C).
La segunda importante utilidad del estadstico B
D
se re'ere al estudio de la relacin entre dos
variables cualitativas *isponemos ahora, no de una +nica variable como en el anterior, sino de dos
La estrategia consiste en comenzar planteando la hiptesis nula de que las variables Bi e ,i son
independientes 0i mantenemos esa hiptesis, concluiremos que los datos disponibles no nos
permiten a'rmar que las variables Bi e ,i estn relacionadas 0i rechazamos esa hiptesis,
concluiremos que las variables Bi e ,i est"n relacionadas Necesitamos comparar las frecuencias
observadas ni con las esperadas que deberamos haber encontrado en la muestra si fueran
independientes *os sucesos ) y @ son independientes si la probabilidad de su interseccin es igual
al producto de sus individuales probabilidades
)G'.1D.D DE ?R/?/RC)/+E%
Las categoras de una de las variables son grupos o muestras de sujetos cuyo comportamiento
interesa comparar en la otra variable $l inters del an"lisis en el estudio de W proporciones
independientes se centra, no en determinar si las dos variables consideradas son o no
independientes, sino en si los diferentes grupos de'nidos por las categoras de una de las variables
se distribuyen de la misma manera en las diferentes categoras de la otra variable
C/(?.R.C)/+E% (U1-)?1E%
0i llegamos a la conclusin de que no todas las proporciones poblacionales son iguales, podemos
estar interesados en averiguar que poblaciones en concreto di'eren entre si #ara ello, puede
utilizarse la prueba de B
D
de #earson para efectuar comparaciones entre dos poblaciones No slo se
averigua que poblaciones di'eren entre si sino en qu categora de la variable di'eren
Ra!n de Correlacin
$s una medida de la relacin entre la dispersin estadstica entre categoras individuales y la
dispersin entre la muestra o la poblacin completa La razn de correlacin n toma valores entre > y
C $l limite n H > representa el caso especial de la no dispersin entre la medias de las diferentes
categoras, mientras n H C se re'ere a la no dispersin dentro de las respectivas categoras
-au de Vendall
$s un estadstico usado para medir la asociacin entre dos cantidades medidas $l coe'ciente de
rango de Xendall es a veces usado como una prueba estadstica en una prueba de hiptesis
estadstica para establecer si dos variables deben ser consideradas como estadsticamente
dependientes $sta prueba no es paramtrica, y no descansa en ninguna suposicin sobre las
distribuciones de B o , o la distribucin de <B,,?
-au .: las pruebas de .auRa demuestran la fuerza de la asociacin de cross tabulations <4? )mbas
variables deben ser ordinales .au R a no har" ning+n ajuste para los vnculos
-au #: hace ajustes para vnculos Talores para el rango tauRb desde RC <C>>Y de asociacin
negativa o inversin perfecta a :C <C>>Y de asociacin positiva o acuerdo perfecto? 2n valor de
cero indica la ausencia de asociacin
-eorema central del lmite
0i B es una variable, u la media de todos sus valores y s su varianza oD, la media B de muestras de n
observaciones tiene distribucin aproximadamente normal con la misma media u y la nRsima4 #arte
de la varianza La distribucin de B ser" tanto m"s normal cuanto mayor sea el tamao de la
muestra

También podría gustarte