Está en la página 1de 22

Resumen Estadstica

Estadstica Descriptiva.
Botella
Captulo 1: Conceptos Generales.
La estadstica actual no slo es un conjunto de tcnicas para resumir y transmitir informacin cuantitativa, sino que sirve tambin, y fundamentalmente para hacer inferencias, generalizaciones y extrapolaciones de un conjunto relativamente pequeo de datos a un conjunto mayor !l"sicamente la estadstica se ha dividido en dos partes, la estadstica descriptiva y la estadstica inferencial #ara hacer un estudio inferencial primero hay que hacer un estudio descriptivo de los datos $s decir, un estudio descriptivo se agota en la descripcin, mientras que uno inferencial comienza por la descripcin y luego aborda la inferencia %ientras que la estadstica descriptiva puede abordarse sin conocimientos tcnicos previos, aparte del "lgebra elemental, para el estudio de la estadstica inferencial es imprescindible adquirir nociones b"sicas de probabilidad

Estadstica es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes de muestras y de la reali!acin de in"erencias acerca de las po#laciones de las que $stas proceden.
&tro conjunto de tcnicas m"s sofisticadas y desconocidas de la estadstica, y que se utilizan para extraer conclusiones de poblaciones a partir de la observacin de unos pocos casos, son las que integran la estadstica inferencial Distincin entre estadstica terica y estadstica aplicada ' la primera se dedica al estudio de los mtodos formalmente v"lidos para la realizacin de inferencias La segunda se dedica a la aplicacin de esos mtodos y modelos de actuacin a campos reales !ualquier trabajo en el que se aplica la estadstica se refiere a un conjunto de entidades, conocido con el nombre de poblacin.

%e llama po#lacin estadstica al con&unto de todos los elementos que cumplen una o varias caractersticas o propiedades.
( los elementos que componen una poblacin se les denomina entidades estadsticas o individuos )ependiendo del n*mero de elementos que la compongan, la poblacin puede ser finita o infinita La mayor parte de las poblaciones con las que solemos trabajar son finitas, pero tan numerosas que a la hora de hacer inferencias acerca de ellas se pueden considerar infinitas a efectos pr"cticos !uando un investigador aborda un trabajo emprico debe definir claramente la poblacin sobre la cual se interesa La poblacin ha de ser el marco o conjunto de referencia sobre el cual van a recaer las conclusiones e interpretaciones, y stas no pueden exceder ese marco $l hecho de que las poblaciones sean, por lo general, muy numerosas, suele hacer inaccesible la descripcin de sus propiedades )e ah que se trabaje fundamentalmente con muestras

'na muestra es un su#con&unto de los elementos de una po#lacin.


La muestra nos va a ofrecer una serie de datos que podemos ordenar, simplificar y describir #ero el objetivo fundamental es el poder describir la poblacin de partida mediante lo que podamos encontrar en la muestra + para poder extraer esas conclusiones lo m"s importante es que las muestras de observaciones sean representativas $xiste todo un campo de la estadstica, llamado muestreo, dedicado a estudiar los procedimientos de extraccin de muestras encaminados a maximizar la representatividad de las mismas #or ello un primer objetivo de la estadstica descriptiva consiste en conseguir res*menes de los datos en ndices compactos y de gran calidad informativa Las poblaciones pueden caracterizarse a partir de unas constantes denominadas parmetros !omo normalmente los par"metros son desconocidos, una de las tareas de la estadstica es la de hacer conjeturas lo m"s acertada posibles acerca de esas cantidades #ara ello se utilizan cantidades an"logas obtenidas en las muestras, que se denominan estadsticos

'n parmetro es una propiedad descriptiva de una po#lacin 'n estadstico es una propiedad descriptiva de una muestra.
Los par"metros y estadsticos no slo son medias, sino que pueden ser otros tipos de cantidades, como porcentajes )esde un punto de vista simblico, conviene indicar, para distinguirlos, que los par"metros se suelen representar por letras griegas mientras que los estadsticos se suelen simbolizar por letras latinas $n la primera fase de una investigacin se obtienen los estadsticos, y en la segunda se utilizan los valores obtenidos para hacer inferencias acerca de los par"metros !uando estudiamos las entidades que conforman una poblacin nos interesamos por algunas de las propiedades de sus elementos, y esas propiedades adoptan distintas variedades

'na caracterstica es una propiedad o cualidad de un individuo. 'na modalidad es cada una de las maneras como se presenta una caracterstica.
(ED)C)*+. La estadstica no realiza sus funciones directamente sobre las modalidades observadas, sino que stas se representan por n*meros, y la estadstica realiza sus funciones sobre esos n*meros

%e llama medicin al proceso de atri#uir n,meros a las caractersticas.


La asignacin de n*meros a las caractersticas se hace siguiendo unas reglas, del estudio de los modelos mediante los cuales conocemos las reglas para una correcta atribucin de los n*meros se ocupa la -eora de la %edida $l objetivo de la medicin de una caracterstica es conectar un sistema relacional emprico y un sistema relacional numrico, de tal forma que las relaciones entre las entidades se reflejen en las relaciones entre los n*meros que los simbolizan .lo si se consigue este objetivo ocurrir" que de las relaciones entre los n*meros podr"n hacerse inferencias v"lidas acerca de las relaciones entre las entidades La medicin estudia las condiciones de construccin de representaciones numricas, y los modelos desarrollados para la medicin se llaman escalas .e utiliza una clase por cada una de las modalidades que adopta la caracterstica que se est" estudiando Las clases son mutuamente exclusivas y exhaustivas, es decir, cada observacin es incluida en una y slo una clase .e tiene un conjunto de objetos cuya caracterstica nos interesa para su estudio /sta adopta un n*mero k de modalidades distintas, representamos por m a la modalidad del objeto (signamos n*meros a los objetos en funcin de la modalidad que presentan en esa caracterstica, representamos por n al n*mero asignado al objeto (l tipo de medicin que cumple con estas condiciones se la llama escalamiento cualitativo o nominal, y al conjunto de clases que las integran se le llama escala nominal #odran tambin utilizarse otros smbolos, como letras, palabras, etc, puesto que los n*meros asignados no se van a utilizar como tales, sino como simples cdigos de identificacin .upongamos que contamos de nuevo con un conjunto de objetos que difieren en una caracterstica que cada uno posee en una cierta cantidad )e nuevo el proceso de medicin debe consistir en la aplicacin de una regla de asignacin de n*meros a las diferentes cantidades, pero ahora de tal forma que los n*meros asignados a los objetos reflejen esos distintos grados en los que se presenta la caracterstica ( aquellas escalas de medida que cumplen estas caractersticas se les llama escalas ordinales #ara poder extraer conclusiones m"s precisas, como la de en cu"nto m"s presenta la caracterstica un objeto sobre otro, hay que contar con una unidad de medida, y para ello hay que pasar al siguiente tipo de escala, escala de intervalo $sta unidad de medida y su origen son arbitrarios La principal limitacin de este tipo de escalas es que, aunque cuenta con una unidad de medida, no tiene un cero absoluto $s decir, el n*mero cero no representa realmente la ausencia de esa caracterstica $n la siguiente escala, escala de razn, cumple la funcin de preservar el significado del valor cero, de forma que siempre represente la ausencia de esa caracterstica La consecuencia fundamental de la presencia de un origen absoluto, y no arbitrario, es que a dem"s de poder extraer conclusiones acerca de la igualdad o desigualdad de diferencias, tambin puede hablarse de desigualdad o igualdad de razones 0n concepto ligado al concepto de escala, y que las caracteriza, es el de transformacin admisible, que hace referencia al problema de la unicidad de la medida La cuestin de la unicidad puede plantearse de la siguiente manera' 1es la representacin numrica que hemos construido la *nica posible2 $n general la respuesta ser" negativa .er"n muchas las representaciones alternativas que seran correctas )e un conjunto de valores correctamente atribuidos se puede pasar a otro tambin correctamente atribuido mediante una transformacin admisible .e dice que una transformacin de los n*meros asignados en una escala es una transformacin admisible si preserva las caractersticas que definen a esa escala, es decir, si los n*meros transformados tambin representan al sistema emprico -ipo +ominal /rdinal )ntervalo )n"ormacin deduci#le 3elaciones 4igual que5 o 4distinto que5 3elaciones 4mayor que5 o 4igual que5 7gualdad o desigualdad de diferencias -rans. .dmisi#le (plicaciones inyectivas 6unciones crecientes ( 8 b 9 x :b ; <= E&emplos .exo, estado civil, diagnstico clnico )ureza, nivel socioeconmico, grado de asertividad -emperatura, calendario, inteligencia

Ra!n

7gualdad o desigualdad de razones

> 9 x :b ; <=

Longitud, peso

0.R).B1E%. $n el proceso de medicin se asignan n*meros a los objetos seg*n unas reglas, y el conjunto de valores numricos atribuidos a las modalidades de una caracterstica constituyen lo que llamamos variable estadstica

'na varia#le es una representacin num$rica de una caracterstica.


?ay veces que una caracterstica tiene una *nica modalidad, en ese caso todas las entidades estudiadas adoptaran el mismo valor numrico, y decimos que se trata de una constante Las variables pueden clasificarse de varias formas Las variables cuantitativas :sean de intervalo o razn= pueden a su vez clasificarse en variables discretas y variables continuas , en funcin del n*mero de valores asumibles por ellas 0na variable discreta es aquella que adopta valores aislados #or tanto, fijados dos consecutivos, no puede tomar ninguno intermedio $n las variables continuas entre dos valores cualesquiera, por prximos que sean, siempre pueden encontrarse valores intermedios Las variables estadsticas se simbolizan por letras may*sculas latinas, y generalmente con un subndice, para distinguirlas de las constantes

Captulo 2
Luego de obtener un conjunto de valores tomados en una o varias variables hay que empezar por inspeccionar los datos !uando la cantidad de n*meros recolectados es demasiado grande, se hace difcil hacer una inspeccin directa que sea realmente comprensiva #or eso el primer paso suele consistir en reorganizar los datos 0n instrumento para conseguir esa ordenacin es la denominada distribucin de frecuencias, y a partir de ella es frecuente tambin construir representaciones grficas D)%-R)B'C)*+ DE 3REC'E+C).%. La distribucin de frecuencias es un instrumento diseado para cumplir tres funciones' a= proporcionar una reorganizacin y ordenacin racional de los datos recogidos, b= ofrecer la informacin necesaria para hacer representaciones gr"ficas y c= facilitar los c"lculos necesarios para obtener los estadsticos muestrales 3epresentaremos por X a la variable con la que trabajamos, y que puede adoptar distintos valores :@A, @B, @CD= pero cada uno de esos valores puede aparecer repetido m"s de una vez en los n elementos que componen la muestra

%e llama frecuencia absoluta de un valor Xp 456 7 se sim#oli!a por np al n,mero de veces que se repite el valor 8i en la muestra. %e llama frecuencia relativa de un valor xp y se sim#oli!a por pp al cociente entre la "recuencia a#soluta de ese valor y el tama9o de la muestra. %e llama frecuencia absoluta acumulada de un valor xp y se sim#oli!a por p: al cociente entre su "recuencia a#soluta acumulada y el tama9o de la muestra.
( veces las frecuencias relativas, ya sean simples o acumuladas, se expresan en trminos porcentuales $n esos casos suelen representarse con may*sculas, par obtenerlas basta con multiplicar por A<< las frecuencias relativas !onstruimos la distribucin de frecuencias siguiendo los pasos descritos' a; .e ponen los valores que toma la variable en la primera columna de abajo hacia arriba #; #ara la columna de f absolutas contamos el n*mero de veces que se repite cada valor La suma de ellos es igual al tamao de la muestra c; #ara la columna de f relativas dividimos cada f absoluta por n Las suma de ellas debe dar A d; #ara obtener las f absolutas acumuladas sumamos para cada valor su f absoluta m"s la absoluta acumulada del valor anterior .u suma debe dar tambin n e; #ara las f relativas acumuladas dividimos cada f absoluta acumulada por n La frecuencia relativa de valor mayor debe ser igual a A $n muestras en donde se tienen muchsimos valores que toma la variable, suele aplicarse lo que se denomina una agrupacin en intervalos, y que consiste en formar grupos de valores consecutivos, llamados intervalos, y poner uno de estos grupos en cada fila, en lugar de poner cada valor individual por separado ( continuacin se calculan las f absolutas conjuntas de los valores incluidos en el intervalo haciendo lo mismo despus con las f relativas, las absolutas acumuladas y

las relativas acumuladas $n las distribuciones de frecuencias con valores agrupados en intervalos aparecen algunos elementos nuevos'

%e llama intervalo a cada uno de los <rupos de valores que ocupan una "ila en una distri#ucin de "recuencias. %e llaman lmites aparentes o informados de un intervalo a los valores mayor y menor que puede adoptar la varia#le dentro de ese intervalo. %e llaman lmites exactos de un intervalo a los valores m:imo y mnimo incluidos en el intervalo. %e llama punto medio de un intervalo a la suma de sus lmites e:actos partido por dos. %e llama amplitud de un intervalo a la di"erencia entre su lmite e:acto superior y su lmite e:acto in"erior. %e representa por la letra ).
?ay tres reglas y algunas directrices para hacer una distribucin' a= el intervalo superior debe incluir al mayor valor observado, b= el intervalo inferior debe incluir al menor valor observado, c= cada intervalo debe incluir el mismo n*mero de valores #ero al ser muchas las agrupaciones diferentes que se pueden realizar, para decidir entre ellas hay que tener presentes algunas directrices basadas en dos guas principales' a= dado que el objetivo de una distribucin es conseguir una ordenacin manejable que ayude a comprender el significado de los datos, no es conveniente que el n*mero de intervalos sea demasiado grande, b= el n*mero apropiado de intervalos debe ser tal que, simult"neamente, con ella se consiga una agrupacin operativa y que cumpla los objetivos para los que ha sido diseada la distribucin, pero sin distorsionar los valores con el error de agrupamiento 2.2.1 %upuestos de distri#ucin intraintervalo 2.=.2 convenciones so#re las representaciones <r"icas 2.=.= tendenciosidad de las representaciones <r"icas. RE>RE%E+-.C)/+E% GR?3)C.%. ( partir de las distribuciones de frecuencias se pueden construir representaciones gr"ficas La funcin de stas es dar informaciones globales mediante un solo golpe de vista a= Dia<rama de rectn<ulos' para hacer un diagrama de rect"ngulos se colocan en el eje de abscisas las modalidades :o los n*meros que las representan=, y en el eje de ordenadas las frecuencias :puede ser absolutas o relativas simples o acumuladas= .obre cada modalidad se levanta un rect"ngulo cuya altura es la frecuencia correspondiente #ara variables nominales u ordinales b= >er"il octo<onal: se utiliza mucho en informes psicopedaggicos o de rendimiento c= >icto<rama: son representaciones en forma de crculos en los que stos son divididos en secciones cuya superficie es proporcional a la frecuencia de la modalidad correspondiente d= Dia<rama de #arras: se utiliza en variables cuantitativas discretas $n el eje de abscisas se colocan los distintos valores de la variable y en el eje de ordenadas las frecuencias .obre cada valor de la variable se traza una lnea o barra perpendicular cuya altura debe ser igual a la frecuencia e= @isto<rama: se utiliza para variables cuantitativas continuas con datos agrupados en intervalos $n el eje de abscisas se colocan los lmites exactos de los intervalos, y en el eje de ordenadas las frecuencias .obre cada intervalo se levanta un rect"ngulo cuya altura sea igual a la frecuencia correspondiente f= >ol<ono de "recuencias: para variables discretas, el polgono es la figura que resulta de unir los extremos superiores de las que hubieran sido las barras g= Dia<rama de #arras acumuladas: se utiliza en variables discretas $n el eje de abscisas se colocan los valores de la variable y en el de ordenadas las frecuencias acumuladas, ya sean absolutas o relativas .obre cada valor se traza una perpendicular cuya longitud sea igual a la f acumulada )esde el extremo superior de cada una de estas barras se traza una lnea horizontal que se une con la barra situada a su derecha h= >ol<ono de "recuencias acumuladas: se utiliza en variables continuas $l eje de abscisas se construye igual que en los histogramas, pero en el de ordenadas se incluyen las f acumuladas, ya sean absolutas o relativas .obre cada lmite se levanta una perpendicular cuya longitud sea idntica a la f acumulada y se une con los extremos superiores de dichas perpendiculares i= /tros di#u&os: muchas veces se utilizan otras representaciones figuritas, en las que se incluyen los objetos de los que se est"n haciendo recuentos de frecuencias, a alg*n smbolo que los identifique de forma muy expresiva

>R/>)ED.DE%. Los conjuntos de datos de variables cuantitativas obtenidos en muestras, tienen algunas caractersticas .on cuatro' a= -endencia central: se refiere a la magnitud general de las observaciones hechas $sta magnitud general puede cuantificarse mediante unos ndices conocidos como ndices de tendencia central o promedios y que reciben ese nombre porque pretenden ser sntesis de los valores de la variable b= 0aria#ilidad: esta propiedad se refiere al grado de concentracin de las observaciones en torno al promedio 0na distribucin ser" homognea o poco variable si los datos difieren poco entre si, y por tanto, se agolpan en trono a su promedio .er" heterognea o muy variable si los datos se dispersan mucho con respecto al promedio $sta propiedad es independiente de la anterior, es decir, dos grupos que tengan distinta variabilidad pueden tener tendencias centrales muy distintas o similares c= .simetra o ses<o' esta propiedad se refiere, por tanto, al grado en que los datos tienden a concentrarse en los valores centrales, en los valores inferiores al promedio, o en los valores superiores a ste $xiste simetra perfecta cuando en caso de doblar la representacin gr"fica por una vertical trazada sobre la media, las dos mitades se superponen perfectamente d= Curtosis: se refiere al grado de apuntamiento de la distribucin .i es muy apuntada, se llama leptocrtica, y si es muy aplastada, se llama platicrtica Eeneralmente el grado de curtosis de una distribucin se compara con un modelo de distribucin llamado distribucin normal, y que respecto a la curtosis se llama distribucin mesocrtica D).GR.(. DE -.11/% 7 @/A.%. Las distribuciones de frecuencias no son el *nico medio para resumir y exponer conjuntos de datos, una alternativa a ellas son los llamados diagramas de tallo y hojas .u obtencin requiere separar cada puntuacin en dos partes' el primer o primeros dgitos, que reciben el nombre de tallo y el dgito o dgitos restantes, que reciben el nombre de hojas :xFGH, G :tallo= y H :hoja= Pasos: a; .e identifican los valores m"ximo y mnimo observados #; .e toma una decisin acerca del n*mero m"s apropiado de tallos distintos c; .e listan todos los tallos distintos en una columna, ordenados de forma creciente de arriba hacia abajo d; .e escribe cada hoja, junto al tallo que le corresponda, preferiblemente ordenados seg*n su valor $l diagrama de tallo y hojas tiene varias venta as sobre la distribucin e inconvenientes' una primera ventaja es que permite identificar cada puntuacin individual $n las distribuciones tradicionales slo conocemos las frecuencias del intervalo, y eso nos obliga a tratar los datos de ciertas maneras distorcionadas, no facilita, como la distribucin cl"sica, el c"lculo de estadsticos, ofrece tanto un listado de las puntuaciones como un dibujo de la distribucin, al contener los valores de cada observacin es m"s f"cil de modificar para obtener un dibujo con un nivel de detalle distinto, pueden representarse dos conjuntos de datos en el mismo diagrama, con lo que facilita la comparacin

Captulo =: (edidas de posicin


#ara hacer estas valoraciones relativas se pueden utilizar las llamadas medidas de tendencia central! "ue son ndices dise#ados especialmente para revelar la situacin de una puntuacin con respecto a un grupo! utilizando a $ste como marco de referencia 0n tipo concreto de medida de posicin son las llamadas medidas de tendencia central Centiles o percentiles' son II valores de la variable que dividen a la distribucin en A<< secciones, cada una conteniendo a la centsima parte de las observaciones 4.e simboliza por !BJ a aquella puntuacin que deja por debajo de si al BJ por A<< de las observaciones y que es superada por el KB por A<<5 Los centiles no suelen calcularse con cantidades de pequeos datos, y cuando es necesario hacerlo se obtienen sencillamente ordenando las puntuaciones y calculando la proporcin de stas que superan al valor que se quiere comparar Lormalmente los centiles se obtienen sobre datos agrupados en intervalos, y en su c"lculo se asume el supuesto de distribucin homognea intraintervalo 6rmula'

Deciles: son nueve puntuaciones que dividen a la distribucin en A< partes, cada una conteniendo al A< por A<< de las observaciones .e representa por ) M, donde M indica el n*mero del decil al que se refiere (s, el decil cuarto, es la puntuacin que deja por debajo de si al N< por A<< de las observaciones y por encima de si al H< por A<< Cuartiles' son tres puntuaciones que dividen a la distribucin en cuatro partes, cada una conteniendo al BG por A<< de las observaciones .e representan por O M donde M indica el n*mero del cuartil al que se refiere $xiste una equivalencia directa entre los distintos cuantiles Eracias a esta equivalencia, las frmulas de c"lculo de los cuantiles se resumen en la de los centiles correspondientes al cuantil que se quiera

Captulo B: (edidas de tendencia central


Las medidas de posicin permiten comparar una puntuacin con a"uellos valores "ue ocupan ciertas posiciones especiales en un grupo de referencia. )e todas esas posiciones hay una, la que representa la posicin central, que suele suscitar un mayor inters que las dem"s, las medidas de tendencia central. %on ndices "ue act&an como res&menes num$ricos de las observaciones 'ec'as. (epresentan la magnitud general observada en los valores. )ambi$n sirven para comparar con untos de valores. )ado que no se pueden comparar distribuciones completas, lo que se comparan son ciertas caractersticas resumen de stas (ED). .R)-(C-)C.. $l ndice de tendencia central m"s utilizado .e define como la suma de los valores observados! dividida por el n&mero de ellas #or tanto, si recogemos n observaciones de la variabel @, entonces la media de los valores observados es' @F $l procedimiento para hacer los c"lculos de la media con datos agrupados en una distribucin de frecuencias' #ropiedades de la media aritmtica' ( las puntuaciones que hemos venido tratando hasta aqu, y que no son m"s que los valores brutos, las denominaremos a partir de ahora puntuaciones directas y las representaremos por la letra de la variable en may*scula #or el contrario, a las diferencias de cada sujeto con respecto a la media grupal las denominaremos puntuaciones diferenciales y las representaremos por la letra min*scula' !on las puntuaciones diferenciales podemos dar una informacin m"s precisa que con las directas

1D 1a suma de las di"erencias de n puntuaciones con respecto a su media o puntuaciones di"erenciales es i<ual a cero
La razn por la que la suma de las diferenciales es igual a cero es que unas son positivas y otras negativas :las que superan la media y las que quedan por debajo de ella= y se compensan con otras

2D 1a suma de los cuadrados de las desviaciones de unas puntuaciones con respecto a su media es menor que con respecto a cualquier otro valor.
( veces nos interesar" sumar a las puntuaciones observadas una cantidad constante, y en esos casos tambin nos interesar" conocer la media de las nuevas puntuaciones

=D %i sumamos una constante a un con&unto de puntuaciones la media aritm$tica quedar aumentada en esa misma constante.
#ero las puntuaciones no slo pueden transformarse sumando constantes, tambin lo pueden hacer multiplicando constantes

BD %i multiplicamos por una constante a un con&unto de puntuaciones la media aritm$tica quedar multiplicada por esa misma constante.

$n algunos casos contamos con la media de varios grupos en una variable y nos interesa conocer la media de todas las observaciones juntas .u frmula suele denominarse media ponderada

ED 1a media total de un <rupo de puntuaciones cuando se conocen los tama9os y medias de varios su#<rupos FecFos a partir de un <rupo total mutuamente e:clusivos y e:Faustivos puede o#tenerse ponderando las medias parciales a partir de los tama9os de los su#<rupos en que Fan sido calculadas.
&tra situacin relativamente frecuente es aquella en la que se forma una variable a partir de una combinacin lineal de dos o m"s variables, e interesa conocer la media de la variable resultante

GD 'na varia#le de"inida como la com#inacin lineal de otras varia#les tiene como media la misma com#inacin lineal de las medias de las varia#les intervinientes en su de"inicin
(ED).+.. *s el ndice! la puntuacin "ue es superada por la mitad de las observaciones pero no por la otra mitad. #ara su c"lculo podemos encontrarnos en dos casos generales, aquel en el que contamos con un n*mero impar de observaciones y aquel en que nos encontramos con un n*mero par de ellas $n el primero se toma como mediana el valor central, en el segundo se da la circunstancia de que cualquier valor comprendido entre los dos centrales cumple con la definicin de la mediana (/D.. 0na tercer va para representar la tendencia central de un conjunto de valores consiste en informar del valor m"s frecuentemente observado $n esta idea se basa nuestro tercer ndice de tendencia central, la moda, que se representa por %o, y se define sencillamente como el valor de la variable con mayor frecuencia absoluta. C/(>.R.C)*+. 1!on qu criterios elegimos uno sobre los dem"s para representar la magnitud general observada en unos valores o para comparar la de dos o m"s grupos de valores2 .i no hay ning*n argumento de peso en contra, se preferir siempre la media ?ay dos razones para apoyar esta normal general La primera es que en ella se basan otros estadsticos y la segunda es que es mejor estimador de su par"metro que la mediana y la moda $ste segundo argumento significa que, en trminos generales, las medias halladas sobre muestras representativas se parecen m"s a la media poblacional que lo que se parecen las medianas y modas muestrales a la mediana y la moda poblacional ?ay al menos tres situaciones en las que se preferir" la mediana a la media' a= cuando la variable est medida en una escala ordinal, b= cuando haya valores extremos que distorsionen la interpretacin de la media y c= cuando haya intervalos abiertos $ste tercer y *ltimo caso se refiere a situaciones en las que el intervalo superior carece de lmite superior, el intervalo inferior carece de lmite inferior, o ambas cosas a la vez La mediana ser" la segunda candidata para representar la tendencia central y por tanto, si no hay argumentos de peso en contra, se preferir" la mediana a la moda #ero hay al menos dos situaciones en las que se dar" esa preferencia' a= cuando se trate de una variable medida en una escala nominal, b= cuando haya intervalos abiertos y la mediana pertenezca a uno de ellos $n algunos casos los tres ndices de tendencia central dan valores parecidos, o incluso pueden coincidir exactamente

Captulo E: (edidas de variacin


#ara conseguir una visin completa y comprensiva de los datos hay que complementar las medidas de tendencia central con las de otras propiedades de los mismos 0na de las propiedades m"s importantes de los conjuntos de datos es el grado en que stos se parecen o se diferencian entre si $sta propiedad se denomina variabilidad! dispersin u 'omogeneidad, y es diferente de la tendencia central 0.R).+H. 7 DE%0).C)*+ -I>)C.. 0na idea que se ha demostrado *til a las hora de cuantificar la variabilidad es la de trabajar con las distancias desde los valores hasta alg*n poste central, que podra ser la media aritmtica .in embargo tambin vimos en el tema anterior que la suma de las diferenciales es necesariamente igual a cero 0na solucin al problema de que las distancias con respecto a la media sumen cero consiste en elevar al cuadrado esas distancias antes de hallar su promedio, dado que los cuadrados son siempre positivos *l ndice basado en esta idea se llama varianza! y se representa por la expresin %+x. ,uando se "uiere describir el grado de variabilidad de un grupo de valores basta con obtener este ndice La cuestin que puede surgir es la de cmo valorar el grado de dispersin cuantificando mediante este ndice )ado que valores de varianzas que pueden ser normales en ciertas variables y poblaciones podran parecer exagerados en otros casos, no tiene sentido comparar varianzas halladas sobre variables distintas La varianza sirve sobre todo para comparar el grado de dispersin de dos o m"s conjuntos de valores en una misma variable, llegando

a conclusiones como la siguiente' 4la poblacin de hombres presenta una mayor variabilidad en su estatura que la poblacin de mujeres, que son m"s homogneas en esa caracterstica5 La razn de esta discrepancia es que las distancias no se han tratado como tales, sino que para evitar el problema de que las diferenciales sumen cero se han elevado stas al cuadrado #or ello es frecuente, con objeto de retomar las unidades originales de esas distancias, se calcule la raz cuadrada de la cantidad obtenida (l ndice as hallado se le llama desviacin tpica! se representa por %x y se define sencillamente como la raz cuadrada de la varianza Las variaciones entre los datos est"n reflejando variaciones en las caractersticas que est"n estudiando, y que en psicologa suelen ser indicadores de variables psicolgicas o mediciones del comportamiento La variabilidad de los datos reflejando el hecho incuestionable de las diferencias individuales 0no de los objetivos de la psicologa es precisamente la explicacin sistem"tica de esas diferencias, en tanto en cuanto presentan regularidades asociadas a segundas o terceras variables Lo siempre son la varianza y la desviacin tpica los ndices m"s apropiados para representar la variabilidad de un grupo de datos ?ay veces en que alg*n dato extremo distorsionara su interpretacin, en otras ocaciones la variable est" medida en una escala ordinal y en otras no se puede calcular C?1C'1/. $l c"lculo de la varianza puede siempre hacerse por medio de la frmula que la define, pero en muchas ocasiones resulta m"s pr"ctico utilizar otras frmulas derivadas de aqulla, y en cualquier caso es necesario adaptar la frmula a aquellas situaciones en las que los valores est"n agrupados en intervalos P La varianza es tambin igual a la media de las puntuaciones directas elevadas al cuadrado menos el cuadrado de la media $sta frmula resultar" *til en ciertos casos >R/>)ED.DE%. $n primer lugar, hay que destacar que un conjunto de valores puede mostrar un mayor o menor grado de homogeneidad, pero el grado m"s pequeo posible de homogeneidad se produce cuando todos los valores son idnticos $n ese caso las desviaciones de los valores con respecto a su media son todas cero y en consecuencia tambin es igual a cero la media de sus cuadrados, por tanto, se es el mismo valor que puede adoptar la varianza 7gualmente, como desviacin tpica se toma la raz positiva de la varianza

1D 1a varian!a y la desviacin tpica como medidas de la dispersin son valores esencialmente positivos.
( veces interesa transformar las puntuaciones observadas sumando una constante yQo multiplicando por otra constante, tal y como vimos al exponer las propiedades de la media $n esos casos no har" falta calcular la varianza de las puntuaciones transformadas, sino que podr" deducirse conociendo la varianza de las puntuaciones originales

2D %i sumamos una constante a un con&unto de puntuaciones varian!a no se altera.

su

.i la transformacin consiste en multiplicar por una constante, la varianza si se ve alterada !onociendo la varianza de las puntuaciones originales y la constante multiplicada se puede obtener f"cilmente la varianza de las puntuaciones obtenidas mediante la multiplicacin de la constante

=D %i multiplicamos por una constante a un con&unto de puntuaciones la varian!a quedar multiplicada por el cuadrado de la constante y la desviacin tpica por el valor a#soluto de esa constante.
$n ciertas ocasiones conocemos las varianzas de varios subgrupos y se quiere obtener la varianza del grupo total $sto se puede conseguir aplicando una propiedad que relaciona la varianza de todas las puntuaciones juntas con las varianzas, medias, y tamaos de los subgrupos

BD 1a varian!a total de un <rupo de puntuaciones cuando se conocen los tama9os las medias las varian!as de varios su#<rupos FecFos a partir del <rupo total mutuamente e:clusivos y e:Faustivos puede o#tenerse sumando la media 4ponderada; de las varian!as y la varian!a 4ponderada; de las medias.
/-R.%. 0na forma muy sencilla el grado de dispersin consiste en calcular la distancia entre el mayor y el menor de los valores observados $ste ndice se llama amplitud total! rango o recorrido y se obtiene sencillamente hallando la diferencia entre los valores extremos )istincin entre ambos tipos de amplitud, que se denominan rango excluyente y rango incluyente, usadas en variables discretas y continuas $sto es muy sensible a los valores extremos y nada sensibles a los intermedios, pudiendo carecer de toda representatividad &tro inconveniente de este ndice es que est" ligado al tamao de la muestra utilizada .i se quiere comprara la variabilidad de las dispersin de dos conjuntos de datos de tamao marcadamente distinto, es probable que la muestra de mayor tamao presente una mayor amplitud aunque las poblaciones de referencia tengan la misma variabilidad

Desviacin media: tomar las desviaciones con respecto a la media, o puntuaciones diferenciales, en valores absoluto .mplitud semiJintercuartil: basad en las puntuaciones correspondientes a los cuartiles primero y tercero Coe"iciente de variacin: a veces se desea comparar la variabilidad de grupos cuya media es distinta $ste ndice es expresado como un porcentaje $ste ndice puede construirse como un ndice de la representatividad de la media !uanto mayor es el coeficiente de variacin, menos representativa es la media

Captulo G: >untuaciones tpicas y escalas derivadas.


!omparar las magnitudes mediante la comparacin de los valores asociales a ellas &tras soluciones, que se basan en la transformacin de las puntuaciones observadas en otras que, sin perder o distorsionar la informacin contenida en las puntuaciones originales, permitan una comparacin directa de las mismas >'+-'.C)*+ -I>)C.. Las puntuaciones diferenciales son informaciones insuficientes para comparar puntuaciones de sujetos pertenecientes a distintos grupos o a distintas variables Las puntuaciones tpicas, se representa por letra z (l proceso de obtencin de las puntuaciones tpicas se llama tipificacin

1a puntuacin tpica de una o#servacin indica el n,mero de desviaciones tpicas que esa o#servacin se separa de la media del <rupo de o#servaciones.
Las puntuaciones tpicas permiten, por tanto, hacer comparaciones entre unidades de distintos grupos, entre variables medidas de distintas formas, o incluso entre variables diferentes $n cualquier caso, las puntuaciones tpicas siempre nos indicar"n el n*mero de desviaciones tpicas :de las de ese grupo y variable= que se separan de la media :de ese grupo y variable= y si esa desviacin es por encima o po debajo de la media :seg*n el signo de la puntuacin tpica= Las caractersticas de las puntuaciones tpicas son universales, no dependen del tipo de puntuaciones ni de su dispersin, ni de su n*mero

1a media de las puntuaciones tpicas es cero varian!a y desviacin tpica son i<uales a uno.

mientras que su

Las puntuaciones tpicas reflejan las relaciones esenciales entre las puntuaciones, con independencia de la unidad de medida que se haya utilizado en la medicin !uando en dos conjuntos de puntuaciones, emparejadas con alg*n criterio, a los elementos de cada para les corresponde la misma puntuacin tpica dentro de su conjunto, puede decirse que mantienen la misma estructura interna, y se dice entonces que son puntuaciones e"uivalentes E%C.1.% DER)0.D.%. 7nconvenientes que surgen de las desviaciones tpicas $n concreto y dado que la media de las tpicas es cero y su desviacin tpica uno, buena parte de las puntuaciones suelen ser negativas, y casi todas decimales $sto hace que resulte incmodo su tratamiento y que muchas veces se busquen procedimientos que permitan superar esta dificultad 0n procedimiento consiste en transformar las puntuaciones tpicas en otras que retengan todas las relaciones que manifiestan las puntuaciones originales, por tanto que sean puntuaciones equivalentes, pero evitando la dificultad operativa, y que constituyen lo que se denomina una escala derivada $stas transformaciones se basan en una propiedad de las puntuaciones tpicas

%i trans"ormamos linealmente las puntaciones tpicas multiplicndolas por una constante a y sumando una constante # entonces las puntuaciones trans"ormadas tendrn como media la constante sumada # como desviacin tpica el valor de la constante multiplicada KaK y como varian!a el cuadrado de esta constante a2.
$n resumen la construccin de una escala derivada parte de unas puntuaciones directas, stas se tipifican, y despus se transforman linealmente en otras puntuaciones La cuestin fundamental de las escalas derivadas consiste en transformar las puntuaciones originales, @i, en otras puntuaciones transformadas, -i, tales que sean m"s cmodas de tratar e interpretar, pero que a la vez retengan las relaciones comerciales entre los valores, es decir, que sean puntuaciones equivalentes

Captulo L: (edidas de asimetra y curtosis.


?ay otras dos caractersticas con las que se pueden describir y comparar las distribuciones de frecuencias I+D)CE% DE .%)(E-RI.

*l grado de asimetra de una distribucin 'ace referencia al grado en "ue los datos se reparten e"uilibradamente por encima y por deba o de la tendencia central .e han propuesto diferentes ndices con los que cuantificar esta propiedad relacin entre la media y la moda, y se define como la distancia entre la media y la moda, medida en desviaciones tpicas, es decir' la media es inferior a la moda, y por tanto este ndice dar" un valor negativo, la media es superior y el ndice dar" positivo, coinciden los dos ndices de tendencia central y por tanto el ndice de asimetra dar" cero Las distribuciones como las primeras tienen asimetra negativa y el ndice da valores menores que cero, las del segundo tipo asimetra positiva, y este ndice da valores mayores que cero $n las *ltimas se dice que son distribuciones sim$tricas, puesto que no est"n inclinadas hacia ning*n lado, este ndice da en ellas valores en torno a cero y si la simetra es perfecta entonces da exactamente cero .lo se puede calcular en distribuciones unimodales Indice de asimetra de >earson: es igual al promedio de las puntuaciones tpicas elevadas al cubo Los valores menores que cero indican asimetra negativa, los mayores que cero asimetra positiva y los valores en torno a cero indican distribuciones aproximadamente simtricas $s el ndice m"s utilizado Indice de asimetra intercuartlico: se basa, en los cuartiles La interpretacin es similar a la de los ndices anteriores Los valores mayores de cero indican asimetra positiva, los menores indican asimetra negativa y los valores en torno a cero reflejan distribuciones simtricas -ienen una ventaja sobre los ndices anteriores, y es que tiene un valor m"ximo y mnimo con lo que se facilita su interpretacin en trminos relativos I+D)CE% DE C'R-/%)% %e basa en el promedio de las tpicas elevadas a la cuarta potencia. 0na distribucin en la que el ndice sea igual a cero tienen un grado de curtosis similar al de la distribucin normal, y se dice que es mesoc&rtica, mientras que si es positivo su grado de apuntamiento es mayor que el de la distribucin normal, y se dice que es una distribucin leptoc&rtica y si es negativo su apuntamiento es menor que el de la distribucin normal y se dice que es platic&rtica

Captulo M: Correlacin lineal


0no de los objetivos principales de la ciencia consiste en descubrir las relaciones entre variables, y la estadstica ha desarrollado instrumentos apropiados para esta tarea La observacin de relaciones claras y estables entre las variables ayuda a comprender los fenmenos y a encontrar explicaciones de los mismos, e indica las vas probablemente m"s eficaces para intervenir sobre las situaciones $l estudio de las relaciones lineales, es aplicable exclusivamente a las variables de intervalo

%e dice que dos varia#les 8 e 7 mantienen una relacin lineal directa cuando los valores altos en 7 tienden a empare&arse con valores altos en 8 los valores intermedios en 7 tienden a empare&arse con valores intermedios en 8 y los valores #a&os en 7 tienden a empare&arse con valores #a&os de 8. %e dice que dos varia#les 8 e 7 mantienen una relacin lineal inversa cuando los valores altos en 7 tienden a empare&arse con valores #a&os en 8 los valores intermedios en 7 tienden a empare&arse con valores intermedios en 8 y los valores #a&os en 7 tienden a empare&arse con valores altos en 8. %e dice que Fay relacin lineal nula entre dos varia#les cuando no Fay un empare&amiento sistemtico entre ellas en "uncin de sus valores.
(l hacer una representacin gr"fica conjunta de dos variables pueden apreciarse visualmente estos tres tipos de relacin #ara ello se identifican los pares de valores y se sealan los correspondientes puntos en unos ejes de coordenadas $stas nubes de puntos reciben el nombre de diagramas de dispersin C'.+-)3)C.C)*+ 0n primer procedimiento consistira en hallar el promedio de los productos cruzados de las puntuaciones diferenciales (l hablar de productos cruzados nos referimos al producto, para cada sujeto o caso, de sus valores en las dos variables, es decir @i 9 + $stos productos pueden obtenerse con puntuaciones directas, diferenciales o tpicas !ada figura est" separa en cuatro cuadrantes, y los puntos estar"n en uno u otro dependiendo de que la observacin supere o no la media de @ yQo la media de + $n concreto, si supera ambas medias, el punto aparecer" en el cuadrante superior derecho :L$=, si supera la media de @ pero no la de +, como el par aparecer" en el cuadrante inferior derecho :.$=, si supera la de + pero no la de @, aparecer" el cuadrante superior izquierdo :L&=, sino

supera ninguna de las medias, aparecer" en el cuadrante inferior izquierdo :.&= (l tratar con puntuaciones diferenciales, stas ser"n positivas si superan la media y negativas en caso contrario #or tanto, aquellas observaciones que aparezcan en los cuadrantes L$ o .& tendr"n productos cruzados positivos, mientras que las que aparezcan en los cuadrantes L& o .$ tendr"n productos cruzados negativos $l promedio de productos cruzados de diferenciales tender" a dar positivo si la relacin es directa, negativo si es inversa, y en torno a cero si es nula, y a dem"s su valor absoluto ser" mayor cuanto m"s acusada sea la tendencia a la linealidad en el diagrama de dispersin >R/>)ED.DE% La razn principal por la que la covarianza no llegaba a satisfacer completamente la necesidad de un ndice de la asociacin lineal era la dificultad de su valoracin, dado que careca de un m"ximo y un mnimo estables #uesto que hemos destacado su alternativa principal, el coeficiente de correlacin de #earson, precisamente porque no tiene esa dificultadD

El coe"iciente de correlacin de >earson no puede valer ms de N1 ni menos de J1 %i Facemos trans"ormaciones lineales de una o las dos varia#les en las que las constantes multiplicadoras son positivas la correlacin de >earson no se altera.
0.1/R.C)*+ E )+-ER>RE-.C)*+ $n la interpretacin de una correlacin de #earson hay que separar dos aspectos distintos' su cuanta y su sentido La cuanta se refiere al grado en el que la relacin entre dos variables queda bien descrita con un ndice de asociacin lineal como r, mientras que el sentido se refiere al tipo de relacin 0na correlacin en torno a cero indica una relacin lineal baja o nula, una correlacin positiva indica una relacin lineal directa, mientras que una correlacin negativa indica una relacin lineal inversa !uanto m"s cercano quede un coeficiente del valor cero, menos apto es el modelo lineal como descripcin de la relacin entre las variables #or el contrario, cuanto m"s se acerque a los extremos, mejor describe esa relacin

ReucFlin

Captulo 1: carcter varia#le de las conductas.


Rariaciones previsibles y variaciones imprevisibles' las variaciones de las conductas son previsibles cuando se conoce la situacin, el momento o la persona #or otra parte, estas variaciones de las conductas son imprevisibles a partir de las informaciones de las que dispone el observador $l psiclogo utiliza a menudo el mtodo estadstico precisamente porque este mtodo permite tratar con m"s eficacia las observaciones que presentan a la vez variaciones previsibles y variaciones imprevisibles Las fuentes de variacin y an"lisis estadstico' las variaciones que son imprevisibles porque no est"n asociadas a ninguna fuente de variacin sistem"tica Las variaciones imprevisibles se atribuyen as a un conjunto de fuentes fortuitas de variacin para el experimentador o encuestador Las variaciones que son previsibles porque est"n asociadas a fuentes sistem"ticas de variacin .i las variaciones as previstas no son mayores que las variaciones imprevisibles, el psiclogo comprobar" que no se verifica su hiptesis sobre el efecto de las fuentes sistem"ticas de variacin que haba credo introducir en la experiencia o en la encuesta La comparacin entre la amplitud de las variaciones previsibles y la amplitud de las variaciones imprevisibles permite interpretar los resultados de la experiencia o de la encuesta e identificar, a la vez, algunas fuentes sistem"ticas de variacin #onderacin de una fuente sistem"tica de variacin' cuando el experimentador o el encuestador hace la hiptesis de que varias fuentes sistem"ticas de variacin producen efectos sobre sus observaciones, comienza en general por verificar si cada una de ellas tiene efectivamente un efecto no nulo y significativo $l experimentador podr" intentar averiguar cu"les son las fuentes de variacin m"s importantes, es decir, las que contribuyen m"s a las variaciones de las observaciones #onderacin de las fuentes fortuitas de variacin' debe evaluar el peso que toman en sus observaciones las fuentes fortuitas de variacin .i este peso es grande, con relacin al de las fuentes sistem"ticas de variacin, ser" difcil poner en evidencia estas *ltimas, reconocer su significado

Captulo 2: Res,menes estadsticos en el nivel de las escalas nominales.

$l empleo de la estadstica en psicologa' distinguir dentro de las observaciones las variaciones fortuitas de las variaciones sistem"ticas #ara asumir esta funcin del mtodo estadstico procede a hacer res*menes de series de observaciones 1#or qu tiene necesidad el psiclogo de efectuar res*menes estadsticos de este tipo2 #ara poder razonar sobre conjuntos de observaciones' pueden compararse dos medias o dos gr"ficos $l resumen de una serie de observaciones puede hacerse de manera que se ponga en evidencia un aspecto particular de la informacin contenida en estas observaciones y llegar as a poseer un instrumento de an"lisis de esta informacin ?ay que

examinar algunos mtodos que permiten describir una serie de observaciones en forma resumida y que pueden tener significaciones diferentes La eleccin de uno u otro de estos mtodos depender" del problema que se plantee el psiclogo Liveles de medida' tres niveles, estando definido cada nivel por las propiedades del conjunto de los valores que pueden obtener mediante las operaciones de medida ?ay una jerarqua entre estos tres niveles' en cada uno de ellos los n*meros gozan de todas las propiedades del nivel inferior y de otras propiedades !onstruccin de la escala nominal' para construir una escala nominal basta que el psiclogo sea capaz de repartir sus observaciones en un cierto n*mero de clases, el conjunto de las cuales constituye la escala, y que deben poseer las dos propiedades siguientes' cada observacin debe entrar en una clase y solamente en una $l que dos observaciones entren o no en la misma clase de equivalencia no se sigue de un criterio estadstico, sino de un criterio emprico .e producen dificultades, ya que hay que definir el conjunto de clases de manera tal que toda observacin entre dentro de una clase, luego hay que conseguir que cada observacin no pueda entrar m"s que en una *nica clase .e necesitar" adoptar una definicin precisa de cada clase y verificar que los criterios as propuestos los comprenden de la misma manera utilizadores diferentes #ropiedades de los n*meros en una escala nominal' una vez realizada esta particin de una serie de observaciones se van a poder utilizar n*meros para describir y resumir esta serie #ero cada uno de estos n*meros designar" aqu una clase de observaciones $stas operaciones slo permiten decir que una observacin que pertenece a una clase es diferente de una observacin que pertenece a otra clase, no permiten decir que la primera es mayor o menor que la segunda $l n*mero de observaciones que pertenecen a una clase es el efectivo de esta clase $ntropa' la informacin de la distribucin no permite saber si las posibilidades de pertenecer a otra clase son muy diferentes o solamente poco diferentes, dicho de otro modo, si las observaciones son muy diferentes o poco diferentes, si su distribucin est" muy dispersada o poco dispersada .e admitir" que la dispersin podr" ser tanto mayor cuanto mayor sea el n*mero de clases #ara un n*mero fijo de clases, ser" mayor si las observaciones se reparten igualmente sobre todas las clases en vez de concentrarse solamente sobre algunas clases .e puede explicitar y cuantificar esta nocin definiendo y calculando la entropa de la distribucin

Glosario de Conceptos
Elementos o 'nidades: son las entidades acerca de las que se re*nen datos #or ejemplo' A= si se eval*a la memoria de los aspirantes a un puesto de mozo en el restaurante @, las unidades son cada uno de los aspirantes >o#lacin de )ndividuos: es el conjunto de todos los elementos sobre los cuales se observa una o m"s caractersticas de inters (uestra de )ndividuos: es un subconjunto o parte de una poblacin de individuos Notas: cuando hablamos de unidades como de la poblacin objetivo o de individuos o de la muestra de individuos, stas entidades deben ser situadas en el espacio :situacin geogr"fica= y en el tiempo :ao o fecha= !omo generalmente las muestras se extraen con fines inferenciales, esto es, para tener conocimiento de lo que acontece a nivel poblacional, es de desear que sean representativas de las respectivas poblaciones #ara favorecer la representatividad de las muestras, la llamada -eora de %uestreo ha desarrollado diversidad de mtodos 0no de ellos es la eleccin al azar de las unidades muestrales 0aria#les o Caracterstica: es una caracterstica de un fenmeno observable en los individuos de una poblacin $s una variable propiamente dicha cuando presenta diferentes modalidades :dos o m"s= entre los individuos .i se presenta bajo una *nica modalidad se dice que es una caracterstica constante 0aria#le Estadstica' es una representacin, a travs de n*meros u otros smbolos, de una variable $sta representacin se obtiene mediante alg*n procedimiento de medicin Las variables estadsticas se clasifican de acuerdo con el tipo de valores que pueden tomar en' -ariable cualitativa' es aquella cuyos valores expresan atributos, -ariable cuasi.cuantitativa' es aquella cuyos valores indican un orden de jerarqua, -ariable cuantitativa' es aquella cuyos valores expresan cantidades numricas )entro de las variables cuantitativas se diferencian las llamadas discretas de las continuas .e consideran discretas aquellas cuyos valores son puntos aislados, esto es, cuando todo valor tiene un consecutivo .e consideran continuas a las variables que, al menos tericamente pueden tomar cualquier valor dentro de un intervalo numrico Constructo y /peracionali!acin: cuando se alude a estas variables es necesario explicitar que se entiende por ellas, o que aspectos se est"n considerando y qu relaciones se verifican entre ellas )e all surge una construccin terica, hipottica que toma el nombre de constructo $stos constructos o variables complejas no son directamente observables como son y esto es lo que dificulta el proceso de medicin, para poder obtener valores de estas variables a travs de la

medicin es necesario hacer un 4recorte adecuado5 del constructo, es decir, considerar un solo aspecto del mismo y explicitar cu"les son las manifestaciones observables que dan cuenta de l $n estos casos se recurre a una definicin operacional :operacionalizacin= del constructo permite asignar sin ambigSedad un valor a la variable a travs del proceso de medicin ( las variables que no son directamente observables tambin se las denomina rasgos latentes Continuo o discreto: el hecho de que una variable estadstica sea discreta o continua determina el tipo de tratamiento estadstico que se le dar" .in embargo muchas veces es decisin del investigador si la tratar" de un modo y otro dependiendo de la naturaleza de la variable estadstica y de su correspondiente variable latente $s importante considerar que para que una variable discreta pueda ser tratada adecuadamente como continua, es conveniente que tome una gran cantidad de valores diferentes >o#lacin de /#servaciones: es el conjunto de todos los valores que pueden tomar una variable estadstica sobre la poblacin de individuos Ltese que sobre una misma poblacin de individuos se pueden definir muchas poblaciones de observaciones, tantas como variables de inters (uestra de /#servaciones: es el conjunto de de valores que toma una variable estadstica sobre una muestra de individuos, es decir, es un subconjunto de la poblacin de observaciones Estadstica Descriptiva: es la parte de la estadstica que proporciona mtodos para organizar, representar, resumir y analizar la informacin contenida en un conjunto de datos muestrales o poblaciones Estadstica in"erencial' es la parte de la estadstica que proporciona mtodos para extraer conclusiones sobre las poblaciones a partir de sus muestras controlando el margen de error que se pueden cometer en esa extrapolacin de lo muestral a lo poblacional Los mtodos de inferencia estadstica se agrupan fundamentalmente en dos clases' estimacin de par"metros y contraste de hiptesis >o#laciones reales o Fipot$ticas "initas o in"initas ' una muestra de observaciones siempre es eral porque consiste de datos efectivamente recolectados, pero la correspondiente poblacin de observaciones puede ser real o hipottica #or otra parte, una poblacin de observaciones puede ser finita, esto es con una cantidad grande o pequea pero limitada de elementos #ero una poblacin puede ser infinita La importancia de reconocer con que tipo de poblacin se est" trabajando radica en la pertinencia de los mtodos estadsticos que se utilizan para recoger los datos, analizarlos y sacar conclusiones >armetro: es una caracterstica fija, generalmente numrica, de la poblacin de valores de una variable Estadstico' es una caracterstica muestral y como tal, es una variable porque sus valores dependen de la muestra que salga seleccionada !ada valor del estadstico se obtiene como funcin de las observaciones de una muestra Estimador: es un estadstico cuyos valores se consideran prximos a un par"metro que, por ser generalmente desconocido, se desea estimar 3recuencia .#soluta' es la cantidad de veces que cada valor de la variable aparece en un conjunto de datos La suma de todas las frecuencias absolutas coincide con la totalidad de los datos

Estadstica )n"erencial.
Botella
Captulo 11.
$l azar tiene que ver con aquellos eventos cuyo resultado no podemos predecir con certeza, y a los que nosotros llamaremos experimentos aleatorios Lo que depende del azar, y por tanto, da sentido al trmino aleatorio en este contexto, es el procedimiento de extraccin de un individuo y slo uno, de los que componen la poblacin -odo experimento aleatorio tiene dos o m"s resultados posibles, que nosotros llamaremos sucesos elementales $n un experimento que tuviera solo un resultado posible no habra incertidumbre y por tanto, no podramos hablar de experimento aleatorio La realizacin de un experimento aleatorio da lugar a un suceso elemental, y slo uno, de entre los posibles (l conjunto de los resultados posibles de un experimento aleatorio, o sucesos elementales, se le llama espacio muestral y se representa por $ .e llama verificacin de un suceso elemental al hecho de que la realizacin del experimento aleatorio produzca ese suceso elemental .obre los espacios muestrales, como conjuntos que son, se pueden definir subconjuntos, que denominaremos sucesos y los representaremos por letras may*sculas (unque para definir un suceso basta con definir un subconjunto cualquiera de $, normalmente los sucesos con los que trabajaremos se constituiran con los sucesos elementales que cumplen alguna condicin, y no de forma arbitraria 0n suceso se verificar" cuando el experimento aleatorio de lugar a uno de los sucesos elementales que integran el subconjunto que lo define $n algunas ocasiones se definen

sucesos a partir de subconjuntos vacos $ste tipo de sucesos reciben el nombre de suceso imposible $n otras ocasiones definen sucesos cuyo subconjunto constituyente est" formado por todos los elementos del espacio muestral $ste tipo de sucesos reciben el nombre de suceso seguro Ramos a definir operaciones sobre sucesos que utilizaremos a partir de aqu' a; Llamaremos unin de dos sucesos al subconjunto $ formado por sucesos elementales que integran los subconjuntos de al menos uno de esos sucesos #; Llamaremos interseccin de dos sucesos al subconjunto de $ formado por los sucesos elemtanles que pertenecen simult"neamente a ambos sucesos !uando la interseccin de dos sucesos es un subconjunto vaco se dice que son sucesos incompatibles o exclusivos c; Llamaremos diferencia de dos sucesos al subconjunto $ integrado por los sucesos elementales que pertenecen al primero, pero no al segundo d; Llamaremos complementario de un suceso al subconjunto de $ integrado por los sucesos elementales no incluidos en ese suceso $n trminos generales representaremos por n al n*mero de sucesos elementales que integran el espacio muestral, y por na al n*mero de sucesos elementales que constituyen el suceso (

'n experimento aleatorio es toda accin cuyo resultado no se puede predecir con certe!a. Cada uno de los resultados posi#les de un e:perimento aleatorio se llama suceso elemental y su con&unto constituye el espacio muestral del e:perimento aleatorio. 1a veri"icacin de un suceso elemental es la o#servacin de ese suceso elemental al reali!ar el e:perimento aleatorio. 'n suceso es cualquier su#con&unto de los elementos de un espacio muestral. Dos sucesos son incompati#les o e:clusivos si no tienen elementos comunes y por tanto no pueden veri"icarse simultneamente. El complementario de un suceso es el su#con&unto de sucesos elementales del espacio muestral que no participan en ese suceso. 1a interseccin de dos sucesos es el su#con&unto de elementos del espacio muestral que simultneamente estn incluidos en los su#con&untos de am#os sucesos. 1a unin de dos sucesos es el su#con&unto de elementos del espacio muestran que estn incluidos al menos en uno de esos sucesos.
-ipos de espacio muestral: los espacios muestrales se clasifican en espacios muestrales finitos e infinitos y a su vez estos *ltimos se subdividen en numerables y no numerables a; $spacios muestrales finitos' un espacio muestral es finito si tiene un n*mero de sucesos elementales finito #; $spacios muestrales infinitos numerables -iene infinitos sucesos elementales pero estos pueden ponerse en correspondencia biunvoca con los n*meros naturales c; $spacios muestrales infintos no numerables -iene infinitos sucesos elementales pero stos no pueden ponerse en correspondencia biunvoca con los n*meros naturales >R/B.B)1)D.D. $l concepto de probabilidad hace referencia a como los eventos puntuales que tienen resultados inciertos, al estudiar su repeticin un n*mero grande veces, comienzan a tener resultados globalmente previsibles, y a mostrarse sujetos a ciertas leyes La probabilidad es un concepto ideal, pues se refiere a las frecuencias con las que ocurriran las cosas en el caso hipottico de que los eventos se repitiesen un n*mero infinitamente grande de veces y en las mismas condiciones La confianza puesta en cada uno de los elementos posibles en la prxima realizacin del evento debe ser proporcional al n*mero de repeticiones que cada una de esas alternativas se daran en el futuro La asignacin de n*meros a esos grados de confianza depositados en la obtencin de cada resultado es la clave del concepto de probabilidad'

1a pro#a#ilidad de un suceso es un n,mero que cuanti"ica en t$rminos relativos las opciones de veri"icacin de ese suceso.
0n suceso sin opcin alguna tendra una probabilidad igual a <, y un suceso con todas las opciones tendran una probabilidad igual a A !ualquier suceso con un n*mero de opciones intermedio entre esos dos tendr" como probabilidad asociada un n*mero intermedio cuya magnitud represente cuantitativamente esas opciones Lo obstante a veces se utilizan porcentajes para indicar probabilidad, que es lo mismo, pero estrictamente hablando esos valores no son probabilidades, sino porcentajes de posibilidades que expresan cuantas de cada cien veces se espera que ocurra el suceso

E+3/O'E C1?%)C/ La aplicacin del enfoque cl"sico o a priori exige la aceptacin del llamado principio de indiferencia, seg*n el cual todos los elementos del espacio muestral tienen las mismas opciones de ser verificados al realizar un experimento aleatorio )esde el enfoque cl"sico que exige asumir el principio de indiferencia se define la probabilidad de un suceso como la frecuencia relativa de ese suceso en el espacio muestral )esde este enfoque la probabilidad de un suceso es igual al cociente entre el n*mero de casos favorables y posibles Los procedimientos habitualmente utilizados para determinar estas cantidades reciben los nombres de tcnicas de contar o combinatoria )e la forma de definir la probabilidad de este enfoque se deducen' a; La probabilidad de un suceso es un valor que oscila entre < y A #; 0n suceso que no contiene ning*n suceso elemental tiene una probabilidad igual a <, y por ello recibe el nombre de suceso imposible c; 0n suceso que contiene todos los sucesos elementales del espacio muestral tiene una probabilidad igual a A y por ello recibe el nombre de suceso seguro d; La suma de las probabilidades de un suceso y su complementario es igual a A E+3/O'E 3REC'E+C).1)%-. La probabilidad se determinara mediante una operacin ideal de repeticin sistem"tica del experimento aleatorio y de cmo del n*mero de veces que se verifican los sucesos Las opciones de verificacin de un suceso se manifestaran en el n*mero de veces que se repite este al realizar una y otra vez el experimento aleatorio 3epresenta proporcionalmente a su probabilidad, el n*mero de veces que se realiza el experimento debe ser infinitamente grande #or tanto, desde el enfoque frecuencialista la probabilidad de un suceso ( se define como el lmite de la frecuencia relativa de apariciones de ese suceso cuando el n*mero de repeticiones del experimento aleatorio tiende a infinito La diferencia fundamental entre este enfoque y el anterior es que mientras en el primero n era el tamao del espacio muestral, en este representa el n*mero de repeticiones del experimento aleatorio )e esta definicin se deducen las mismas consecuencias y propiedades que exponamos en conexin con el enfoque cl"sico

Captulo 12.
$n ciencia resulta extremadamente *til representar a los sucesos elementales por n*meros, creando lo que se denominan variables aleatorias 0na funcin es cualquier conjunto de pares ordenandos de elementos, en los cuales se repite el primer elemento (s, el siguiente conjunto de pares ordenados es una funcin Las variables aleatorias son funciones que cumplen con ciertos requisitos

'na varia#le aleatoria es una "uncin que asocia un n,mero real y slo uno a cada suceso elemental del espacio muestral de un e:perimento aleatorio.
3epresentaremos a las variables aleatorias por letras may*sculas )istinguiremos entre variables aleatorias discretas y variables aleatorias continuas Las primeras son las que se definen sobre espacios muestrales finitos o infinitos pero numerables, mientras que las segundas son las que se definen sobre espacios muestrales infinitos no numerables

Captulo 1=: (odelos de distri#ucin de pro#a#ilidad.


D)%-R)B'C)*+ B)+/().1 #ara que la distribucin de probabilidad de una variable se ajuste al modelo binomial deben cumplirse una serie de requisitos $l primero es que se base en una variable dicotmica $sta variable dicotmica no es todava la variable nominal, pero su presencia es imprescindible para la generacin de sta Las variables que est"n en la base de una variable binomial pueden definirse como aquellas que adoptan la regla de asignar un A si se cumple una cierta condicin y un < si no se cumple $l segundo requisito es que haya una repeticin de n ensayos de la variable dicotmica en los que la probabilidad de que cada repeticin se verifique la condicin, y por tanto se asigne un A, sea constante ( la probabilidad de verificacin de la condicin en cada ensayo independiente la representaremos por n $l tercer y *ltimo requisito es que se defina una variable @, como el 4n*mero de casos que en la secuencia de n ensayos dicotmicos verifican la condicin especifcada, o lo que es lo mismo, el n*mero de unos observados

%i a; de"inimos una varia#le dicotmica a partir del cumplimiento o incumplimiento de una condicin. B; reali!amos una secuencia de n o#servaciones de esos ensayos dicotmicos en los que la pro#a#ilidad de veri"icacin de la condicin en cada repeticin es constante. C; de"inimos una varia#le aleatoria 8 como el n,mero de casos de esa secuencia en los que se cumple la condicin.

Entonces la varia#le 8 se a&usta a un modelo #inomial con parmetros n y 9 y se representa por: B48P n 9;
)e la forma de generar una variable aleatoria binomial se deducen algunas de sus caractersticas' a; Los valores de una variable binomial oscilan entre < y n $l n*mero m"s pequeo posible de casos en los que se verifica la condicin es ninguno y el m"ximo de todos #; .i representamos el resultado de cada ensayo dicotmico con ceros y unos, el valor que adopta la variable @ no es m"s que la suma de esa secuencia de unos y ceros c; $l valor esperado de una variable binomial se obtiene a partir de las propiedades de la suma de variables aleatorias y de la definicin del valor esperado )ado que una binomial es la suma de una secuencia de n valores, y cada uno de ellos puede considerarse una variable aleatoria dicotmica, su valor esperado ser" igual a la suma de los valores esperados de cada una de ellas -R.+%>.RE+C).% 0na distribucin de probabilidades es un modelo de distribucin de frecuencias relativas tericas, esto es, una variable que toma ciertos valores y a cada uno de estos valores se les asigna una cierta frecuencia relativa que no proviene de la observacin de un hecho realizado sino que es deducida a partir de ciertas condiciones tericas La probabilidad de un valor de la variable puede interpretarse como una medida de la posibilidad de que dicho valor sea observado (/DE1/ BER+/'11): una variable se distribuye seg*n el modelo >ernoulli, cuando toma slo dos valores Los dos valores de un variable >ernoulli, suelen denominarse 4xito5 o 4fracaso5 y codificarse respectivamente con A y < La probabilidad asignada al xito se la denota con la letra 4p5 por lo que la del fracaso con 4APp5 ya que deben sumar A 0na variable >ernoulli queda totalmente caracterizada conociendo el par"metro p, es decir, la probabilidad de xito o, equivalentemente, la probabilidad de fracaso B)+/().1: la distribucin binomial depende de dos valores fijos o par"metros a saber' un n*mero natural n y una probabilidad p 0na variable binomial es aquella cuyos valores son <, A, BD n, por tanto es un modelo para una variable discreta T y las probabilidades asociadas a cada uno de ellos resultan de la aplicacin de una frmula matem"tica que involucran a n y a p RE1.C)*+: una variable binomial de par"metros n y p puede generarse, bajo ciertas condiciones que mencionaremos despus, a partir de n observaciones de una variable >ernoulli de par"metro p :n es la cantidad de observaciones de una variable >ernoulli y p la probabilidad de xito en cada observacin de la variable >ernoulli= C/+D)C)/+E% +ECE%.R).% >.R. 1. RE1.C)*+. $stabilidad' la probabilidad de xito debe permanecer constante en las n observaciones de la variable >ernoulli 7ndependencia' la probabilidad de obtener xito en una observacin no aumenta ni disminuye si se conoce el resultado de otra observacin D)%-R)B'C)*+ ('1-)+/().1 $n ocasiones se trabaja con ensayos que en lugar de dar lugar a dos resultados alternativos :dicotoma= puede dar lugar a m"s de dos :politoma= $n estos casos las probabilidades asociadas a cualquier combinacin de resultados pueden obtenerse mediante el modelo multinomial (/DE1/% >.R. 0.R).B1E% C/+-)+'.%. La mayor parte de las tcnicas inferenciales que se utilizan para la investigacin en psicologa tienen distribuciones de probabilidad que se ajustan a las de los modelos tericos para variables continuas La curva normal, a dem"s de ser un instrumento para la inferencia estadstica, es el modelo al que se ajustan muchas variables de inters en psicologa D)%-R)B'C)*+ REC-.+G'1.R: es la equivalente a la uniforme de las variables discretas 0na variable aleatoria se ajusta a este modelo si todos los valores con probabilidad no nula tienen la misma funcin de densidad de probabilidad 3epresentacin gr"fica' un rect"ngulo D)%-R)B'C)*+ +/R(.1: la importancia de la curva normal estriba no slo en su utilidad para el an"lisis estadstico, sino que en muchas variables de inters para los psiclogos La estatura, el peso, la agudeza visual, la fuerza son variables que se ajustan a este modelo +a dentro de la psicologa, variables como el cociente intelecutal, la extraversin son variables con distribucin normal $n la mayor parte de las variables existe un valor central :la media= en torno a la cual se concentran la mayor parte de los individuos, y a medida que nos vamos fijando en valores m"s alejados de la media observamos que stos son menos frecuentes $sta reduccin gradual en la frecuencia no es lineal, sino que es mayor al principio y menor despus :pasa de convexa a cncava al alejarse de la media= 0na variable aleatoria se distribuye seg*n el modelo nomral, con par"metros u y o Las variables cuya distribucin se ajusta al modelo normal adoptan una representacin gr"fica en la que se pueden apreciar algunas de las propiedades que vamos a enumerar'

a; $s simtrica con respecto a un valor central :u= y en ese valor central coinciden la media, la mediana o la moda #; $s asinttica con respecto al eje de abscisas, es decir, por mucho que se extienda, nunca llega a tocar los ejes c; ?ay toda una familia de curvas normales, dependiendo de los valores de u y o )e entre ellas, la m"s importante es aquella que tienen media < y de desviacin tpica A d; Los puntos de inflexin se encuentran en los puntos correspondientes a la media m"sQmenos una desviacin tpica :u 8P o= e; !ualquier combinacin lineal de variables aleatorias normales se ajusta tambin al modelo normal La mayor parte del trabajo pr"ctico con variables aleatorias normales consiste en hallar probabilidades asociadas a valores $sto significara integrar la funcin de densidad entre los valores de inters #ara evitar tener que resolver este tipo de operaciones se han construido tablas apropiadas con las "reas ya halladas y cuyo eso se basa en el teorema de tipificacin .eg*n este teorema, la funcin de distribucin asociada a un valor de una variable aleatoria, @, con distribucin normal, es la misma que la funcin de distribucin de la tipificada de ese valor en la normal unitaria #ara obtener las "reas asociadas a un valor de cualquier otra distribucin normal basta con tipificar ese valor y acudir con la z obtenida en la tabla correspondiente $l trabajo con variables aleatorias normales, al igual que con otras variables continuas, se reduce a la obtencin de las probabilidades de obtener un valor menor o igual que uno concreto, la de obtener un valor mayor o igual que uno concreto, o la de obtener un valor comprendido entre dos valores concretos

.nlisis de datos en >sicolo<a >ardo y %an (artin Contraste de @iptesis


$l objetivo *ltimo del an"lisis de datos es el de extraer conclusiones de tipo general a partir de unos pocos datos particulares $s decir, el de extraer conclusiones sobre las propiedades de una poblacin a partir de la informacin contenida en una muestra procedente de esa poblacin :inferencia estadstica= )os formas b"sicas de inferencia estadstica' la estimacin de par"metros y el contraste de hiptesis La estimacin de par"metros es el proceso consistente en asignar a las propiedades desconocidas de una poblacin las propiedades conocidas de una muestra extrada de esa poblacin $l contraste de hiptesis es un proceso mediante el cual se trata de comprobar si una afirmacin sobre alguna propiedad poblacional puede ser sostenida a la luz de la informacin muestral disponible #uede ser entendido como un mtodo de toma de decisiones, que nos permite decidir si una proposicin acerca de una poblacin puede ser mantenida o debe ser rechazada 1*G)C. $l primer paso del proceso de verificacin de una hiptesis consiste en formular estadsticamente la hiptesis cientfica que se desea contrastar, es decir, en transformar la hiptesis cientfica en hiptesis estadstica $sto supone que una hiptesis cientfica puede ser formulada en trminos de la forma de una o varias distribuciones poblacionales, o en trminos del valor de uno o m"s par"metros de esa o esas distribuciones 6ormulada la hiptesis estadstica, el segundo paso del proceso de verificacin consiste en buscar evidencia emprica relevante capaz de informar sobre si la hiptesis establecida es o no sostenible 0na hiptesis ser" compatible con los datos empricos cuando a partir de ella sea posible deducir o predecir un resultado muestral con cierta precisin Lecesitamos una regla de decisin que debe establecerse en trminos de probabilidad #ero la necesidad de trabajar con muestras en lugar de con poblaciones nos obliga a establecer una regla de decisin en trminos de probabilidad $n general, la regla de decisin que utilizaremos ser" una afirmacin de este tipo' si el resultado muestral observado es, suponiendo correcta nuestra hiptesis, muy poco probable, consideraremos que nuestra hiptesis es incompatible con los datos, por el contrario, si el resultado muestral observado es, suponiendo correcta nuestra hiptesis, probable, consideraremos que nuestra hiptesis es compatible con los datos

'n contraste de Fiptesis es un proceso de decisin en el que una Fiptesis "ormulada en t$rminos estadsticos es puesta en relacin con los datos empricos para determinar si es o no compati#le con ellos.
@)>*-E%)% E%-.DI%-)C. 0na hiptesis estadstica es una afirmacin sobre una o m"s distribuciones de probabilidad, m"s concretamente, sobre la forma de una o m"s distribuciones de probabilidad, o sobre el valor de uno o m"s par"metros de esas distribuciones La hiptesis estadstica se suele representar por la letra ? seguida de una informacin que le da contenido .urge a partir de una hiptesis cientfica La primera proporciona la base para la formulacin de la segunda, pero no son la misma cosa %ientras una hiptesis cientfica se refiere a alg*n aspecto de la realidad, una hiptesis estadstica se refiere a alg*n aspecto de una distribucin de probabilidad $xisten varias formas de expresar estadsticamente una hiptesis cientfica correcta $l primer paso en el proceso de verificacin de

una hiptesis consiste en formular en trminos estadsticos la afirmacin contenida en la hiptesis cientfica que se desea verificar -odo contraste se basa en la formulacin de dos hiptesis

1a Fiptesis nula representada por @Q R 1a Fiptesis alternativa representada por @i.


La hiptesis nula es la hiptesis que se somete a contraste !onsiste generalmente en una afirmacin concreta sobre la forma de una distribucin de probabilidad o sobre el valor de alguno de los par"metros de esa distribucin La hiptesis alternativa es la negacin de la nula, incluye todo lo que la nula excluye %ientras la nula suele ser una hiptesis exacta :tal cosa es igual a tal otra=, la alternativa suele ser inexacta :tal cosa es distinta, mayor o menor que otra= !uando en ?i aparece el signo 4distinto5 decimos que el contraste es bilateral o bidireccional !uando en ?i aparece los signos mayor o menor, decimos que el contraste es unilateral o unidireccional La hiptesis nula y alternativa suelen plantearse como hiptesis rivales .on exhaustivas y mutuamente exclusivas, lo cual implica que si una es verdadera, la otra es necesariamente falsa %'>'E%-/% #ara que una hiptesis estadstica pueda predecir un resultado muestral con cierta exactitud es necesario, en primer lugar, que la distribucin poblacional con la que se va a trabajar est completamente especificada .on hiptesis que especifican por completo las distribuciones poblacionales a las que hacen referencia .e las llama simples Las hiptesis en las que la distribucin poblacional no queda completamente especificada reciben el nombre de compuestas Lo ideal es plantear hiptesis nulas simples, pero ocurre que ni los intereses del investigador se corresponden siempre con el contenido de una hiptesis simple

1os supuestos de un contraste de Fiptesis son un con&unto de a"irmaciones que necesitamos esta#lecer 4so#re la po#lacin de partida y so#re la muestra utili!ada; para conse<uir determinar la distri#ucin de pro#a#ilidad en la que se #asar nuestra decisin so#re @o.
(lgunos de estos supuestos son m"s restrictivos o exigentes que otros $s importante tener presente que el incumplimiento de uno o varios supuestos podra invalidad el contraste y llevarnos a una decisin errnea !onviene, por tanto, que los supuestos sean pocos y poco exigentes E%-.DI%-)C/ DE C/+-R.%-E.

'n estadstico de contraste es un resultado muestral que cumple la do#le condicin de proporcionar in"ormacin emprica relevante so#re la a"irmacin propuesta en la Fiptesis nula y poseer una distri#ucin muestral conocida.
La condicin que debe cumplir un resultado muestral para poder ser utilizado como estadstico de contraste es la de poseer una distribucin muestral conocida 0n estadstico, es una variable aleatoria y como tal, tiene su propia funcin de probabilidad a la que denominamos distribucin muestral 0na vez planteada la hiptesis, es necesario seleccionar el estadstico de contraste capaz de proporcionarnos informacin relevante sobre ellas y establecer los supuestos necesarios para conseguir determinar la distribucin normal del estadstico REG1. DE DEC)%)*+ La regla de decisin es el criterio que vamos a utilizar para decidir si la hiptesis nula planteada debe o no ser rechazada $ste criterio se basa en la particin de la distribucin muestral del estadstico de contraste en dos zonas mutuamente exclusivas' la zona de rechazo y la zona de aceptacin La zona de rechazo tambin llamada zona crtica, es el "rea de la distribucin muestral que corresponde a los valores del estadstico de contraste que se encuentran tan alejados de la afirmacin establecida en ?o, que es muy poco probable que ocurran si ?o, como se supone, es verdadera .u probabilidad es alfa :nivel de significacin= La zona de aceptacin es el "rea de la distribucin muestral que corresponde a los valores del estadstico de contraste prximos a la afirmacin establecida en ?o $s, por tanto, el "rea correspondiente a los valores del estadstico de contraste que es probable que ocurran si ?o como se supone, es verdadera .u probabilidad es A T alfa, valor llamado nivel de confianza

1a re<la de decisin consiste en recFa!ar @o si el estadstico de contraste toma un valor perteneciente a la !ona de recFa!o o crticaP mantener @o si el estadstico de contraste toma un valor perteneciente a la !ona de aceptacin.
.e rechaza una hiptesis sometida a contraste cuando e valor del estadstico de contraste cae en la zona crtica, y se rechaza porque eso significa que el valor tomado por el estadstico de contraste se aleja demasiado de la prediccin establecida por esa hiptesis, es decir, porque, si la hiptesis planteada fuera verdadera, el estadstico de contraste no debera haber tomado ese valor, como de hecho el estadstico ha tomado es el valor, la conclusin m"s razonable ser" que la hiptesis planteada no es verdadera $l tamao de las zonas se determina fijando el valor de alfa, es decir,

fijando el valor de significacin con el que se desea trabajar La forma dividir la distribucin muestral en zonas depende de si el contraste es bilateral o unilateral La zona crtica debe estar situada all donde puedan aparecer los valores muestrales incompatibles con ?o, es decir, all donde puedan aparecer los valores muestrales que apunten en la direccin propuesta en ? $n los contrastes bilaterales, la zona crtica se encuentra, generalmente repartida a partes iguales entre las dos colas de la distribucin muestral $n los contrastes unilaterales la zona crtica se encuentra en una de las dos cola de la distribucin muestral DEC)%)*+ 0na decisin, en el contexto del contraste, siempre consiste en rechazar o mantener una ?o particular .i la rechazamos estamos afirmando que esa hiptesis es falsa, es decir, estamos afirmando con una probabilidad alga de equivocarnos, que hemos conseguido probar que esa hiptesis es falsa #or el contrario, si la mantenemos, no estamos afirmando que hemos probado que esa hiptesis es verdadera, simplemente estamos afirmando que no disponemos de evidencia emprica suficiente para rechazarla y que por lo tanto, podemos considerarla compatible con los datos

Cuando decidimos mantener una Fiptesis nula queremos si<ni"icar con ello que consideraos que esa Fiptesis es compati#le con los datos. Cuando decidimos recFa!ar una Fiptesis nula queremos si<ni"icar con ello que consideramos pro#ado que esa Fiptesis es "alsa
ERR/RE% DE -)>/ ) 7 )) ?o puede ser verdadera o puede ser falsa .i ?o es verdadera y la mantenemos estaremos tomando una decisin correcta, si es falsa y la rechazamos, tambin estaremos tomando una decisin correcta #ero si ?o es verdadera y la rechazamos, estaremos cometiendo un error e igualmente estaremos cometiendo un error si ?o es falsa y la mantenemos

1lamamos error de tipo ) al que se comete cuando se decide recFa!ar una @o que en realidad es verdadera. 1a pro#a#ilidad de cometer ese error es al"a. 1lamamos error de tipo )) al que se comete cuando se decide mantener una @o que en realidad es "alsa. 1a pro#a#ilidad de cometer ese error es #eta.
#or tanto 7 T alfa ser" la probabilidad de tomar una decisin correcta cuando ?o es verdadera + AP beta ser" la probabilidad de tomar una decisin correcta cuando ?o es falsa La probabilidad de cometer un error 7 con nuestra decisin es una probabilidad conocida, pues el valor de alfa lo fija el propio investigador .in embargo, la probabilidad de cometer un error de tipo 77, es un valor desconocido que en un contraste depende de tres factores' la verdadera ?i, el valor de alga y el tamao del error tpico de la distribucin muestral utilizada para efectuar el contraste >/-E+C).

1a potencia 41JB; de un contraste es la pro#a#ilidad de recFa!ar una Fiptesis nula que en realidad es "alsa.
!uando hablamos de la potencia de un contraste, por tanto, nos estamos refiriendo a la capacidad de ese contraste para detectar que una hiptesis concreta es falsa #ara poder calcular la potencia de un contraste necesitamos referirnos a una afirmacin de las muchas definidas en ?i +)0E1 CRI-)C/ 7 -.(.S/ DE1 E3EC-/. La probabilidad de cometer un error de tipo 7 se establece antes de efectuar el contraste para evitar que influya en la decisin final $n ese sentido, podemos entender el nivel de significacin como el riesgo m"ximo que estamos dispuestos a asumir al tomar la decisin de rechazar la hiptesis concreta $fectuar un contraste estableciendo previamente un nivel de significacin es lo que se hace, aunque trae inconvenientes' 1. La decisin sobre ?o puede depender decisivamente del nivel de significacin establecido #odemos decidir mantener la hiptesis con alfa F < <A y rechazarla con alfa F < <G 2. )ecidir si ?o es o no falsa no proporciona ning*n tipo de informacin sobre el grado en el que la evidencia muestral se muestra incompatible con esta hiptesis .i consideramos que cometer un error de tipo 7 es muy grave, adoptaremos para alfa un valor m"s pequeo que si consideramos que cometer ese error no tiene consecuencias graves #ero recordemos que al hacer m"s pequeo el valor de alfa, la potencia del contraste disminuye autom"ticamente :que es igual que decir que la potencia de que se produzca un error 77 se incrementa= $so puede llevar a cometer un error 77 por querer evitar el 7

1lamamos nivel crtico y lo representamos por p al nivel de si<ni"icacin ms peque9o al que una Fiptesis nula puede ser recFa!ada con el estadstico de contraste o#tenido.

#odemos definir el nivel crtico, m"s brevemente, como la probabilidad asociada al estadstico de contraste en trminos generales, en un contraste unilateral, el nivel crtico es la probabilidad asociada a los valores mayores o menores que el estadstico de contraste obtenido, en un contraste bilateral, el nivel crtico es la probabilidad asociada a los valores que se encentran tan alejados de ?o como, al menos, el estadstico de contraste .eg*n esto, e nivel crtico se obtiene, a diferencia de lo que ocurre con el nivel de significacin, despus de efectuar el contraste, es decir, una vez obtenido el estadstico de contraste )ecidir si una hiptesis es o no falsa no constituye, en la mayor parte de las situaciones experimentales, un criterio suficiente para determinar si el experimento realizado contribuye o no de la forma significativa al desarrollo de una teora o de una lnea de investigacin $sto es as porque la decisin a la que se llega en un contraste de hiptesis sobre la base del grado de discrepancia existente entre la ?o planteada y la evidencia muestral observada depende directamente, seg*n hemos sealado ya, del tamao de la muestra utilizada -amaos muestrales grandes pueden llevarnos a considerar estadsticamente significativas discrepancias muy pequeas y tamaos muestrales muy pequeos pueden llevarnos a considerar estadsticamente insignificantes discrepancias tericamente relevantes

Contraste de @iptesis so#re (edias


$l contraste de hiptesis sobre una media sirve para tomar decisiones acerca del verdadero valor poblacional que corresponde a la media de una variable .abemos que si extraemos una muestra aleatoria de tamao n de una poblacin normal, y calculamos la media, esa media es un estadstico distribuido normalmente .abemos tambin, por el teorema central del lmite, que, aun desconociendo la forma de la poblacin de donde extraemos la muestra, el estadstico tiende a distribuirse normalmente a medida que el tamao de la muestra n va aumentando #recisamente el conocimiento de esas probabilidades es el que nos proporciona la posibilidad de tomar decisiones respecto al par"metro u al contrastar hiptesis sobre la media de una poblacin, la situacin con la que generalmente nos encontraremos ser" aquella la cual los par"metros poblacionales :tanto u como o= ser"n desconocidos D/% (ED).% )+DE>E+D)E+-E% $l contraste sobre dos medias independientes es el idneo para comparar dos grupos de sujetos en alguna variable de inters (l trabajar con dos medias independientes, lo estamos haciendo con dos poblaciones distintas de las que extraemos, independientemente, dos muestras aleatorias de tamaos ni y nB $n cada una de esas muestras medimos la variable aleatoria, calculamos el estadstico en cada una de ellas y utilizamos esa informacin muestra para determinar si las dos poblaciones poseen o no la misma media u )ado que +i y +B son valores muestrales, difcilmente ser"n iguales, pero la cuestin que interesa responder es si esas medias muestrales son lo bastante diferentes como para pensar que proceden de poblaciones con diferente media $s decir, si esas medias muestrales son lo bastante diferentes como para pensar que los grupos comparados difieren significativamente en la variable estudiada )el mismo modo que la media muestral nos proporciona la mejor estimacin de la media poblacional, la mejor estimacin que podemos obtener sobre la diferentes entre dos medias poblacionales es justamente la diferencia de dos medias muestrales %'>/+)E+D/ 0.R).+H.% )G'.1E% .i suponemos que las varianzas poblacionales son iguales :homocedasticidad=, slo ser" necesario estimar un par"metro oB + puesto que los dos estimadores insesgados de que disponemos so independientes, lo apropiado ser" utilizar ambos estimadores para obtener una *nica estimacin de oB, pues lo m"s probable es que la combinacin ponderada de ambos estimadores nos proporcione una estimacin m"s exacta de oB que la de uno por separado #rueba sobre diferencia de medias' es necesario que las poblaciones originales sean normales .i los tamaos muestrales son razonablemente grandes, e iguales o aprox iguales, el incumplimiento de esta condicin no tiene consecuencias relevantes sobre las conclusiones del contraste )e manera que con tamaos apropiados, el procedimiento sigue siendo v"lido independientemente de la forma de las poblaciones de origen $n lo relativo al supuesto de homocedasticidad, si los tamaos muestrales son iguales y el supuesto de normalidad no se incumple, el procedimiento es v"lido incluso con varianzas poblacionales muy diferentes $s conveniente que los tamaos muestrales sean grandes para poder garantizar que, independientemente de la forma de las poblaciones de origen, la distribucin muestral se aproxime al modelo de distribucin de probabilidad normal %'>/+)E+D/ 0.R).+H.% D)%-)+-.% .i las varianzas poblacionales no son iguales, carece de sentido obtener una *nica estimacin de las mismas a partir de la combinacin ponderada de los dos estimadores disponibles %"s bien, cada uno deber" ser considerado un estimador de la varianza de su propia poblacin

1a prue#a 82 de >earson.
La prueba permite estudiar diferentes aspectos del an"lisis de datos referidos a variables cualitativas $stos aspectos son la bondad de ajuste, la independencia y homogeneidad de

proporciones $n el primero se trabaja con una sola variable y se trata de averiguar si unos datos empricos concretos se ajustan o no a una determinada distribucin terica $n el segundo, se estudian dos variables con el objetivo de contrastar si son o no independientes $n el tercero, se trabaja tambin con dos variables, pero poniendo el nfasis en la distribucin condicional de una de ellas para los diferentes niveles de la otra -.B1.% DE C/+-)GE+C). !uando se trabaja con variables de ndole cualitativa, los datos suelen presentarse en tablas de contingencia' conjunto organizado de frecuencias clasificadas seg*n uno o m"s criterios !uando una tabla de contingencia slo incluye dos variables las llamamos bidimensional, si incluye tres, tridimensional, etc B/+D.D DE .A'%-E Los contrastes de hiptesis sobre bondad de ajuste permiten comprobar si la forma de la distribucin de probabilidad de una variable se ajusta a una determinada distribucin de probabilidad terica #uesto que estamos tratando con variables cualitativas, esas distribuciones tericas ser"n la uniforme, la binmial y la multinomial $l procedimiento se trata de comparar las frecuencias observadas o empricas con las frecuencias esperadas o tericas, es decir, con las frecuencias que cabra esperar encontrar en la muestra si realmente la distribucin de probabilidad terica o poblacional fuera la propuesta )+DE>E+DE+C). La segunda importante utilidad del estadstico @ B se refiere al estudio de la relacin entre dos variables cualitativas )isponemos ahora, no de una *nica variable como en el anterior, sino de dos La estrategia consiste en comenzar planteando la hiptesis nula de que las variables @i e +i son independientes .i mantenemos esa hiptesis, concluiremos que los datos disponibles no nos permiten afirmar que las variables @i e +i estn relacionadas .i rechazamos esa hiptesis, concluiremos que las variables @i e +i est"n relacionadas Lecesitamos comparar las frecuencias observadas ni con las esperadas que deberamos haber encontrado en la muestra si fueran independientes )os sucesos ( y > son independientes si la probabilidad de su interseccin es igual al producto de sus individuales probabilidades )G'.1D.D DE >R/>/RC)/+E% Las categoras de una de las variables son grupos o muestras de sujetos cuyo comportamiento interesa comparar en la otra variable $l inters del an"lisis en el estudio de U proporciones independientes se centra, no en determinar si las dos variables consideradas son o no independientes, sino en si los diferentes grupos definidos por las categoras de una de las variables se distribuyen de la misma manera en las diferentes categoras de la otra variable C/(>.R.C)/+E% (T1-)>1E% .i llegamos a la conclusin de que no todas las proporciones poblacionales son iguales, podemos estar interesados en averiguar que poblaciones en concreto difieren entre si #ara ello, puede utilizarse la prueba de @B de #earson para efectuar comparaciones entre dos poblaciones Lo slo se averigua que poblaciones difieren entre si sino en qu categora de la variable difieren

Ra!n de Correlacin
$s una medida de la relacin entre la dispersin estadstica entre categoras individuales y la dispersin entre la muestra o la poblacin completa La razn de correlacin n toma valores entre < y A $l limite n F < representa el caso especial de la no dispersin entre la medias de las diferentes categoras, mientras n F A se refiere a la no dispersin dentro de las respectivas categoras

-au de Uendall
$s un estadstico usado para medir la asociacin entre dos cantidades medidas $l coeficiente de rango de Vendall es a veces usado como una prueba estadstica en una prueba de hiptesis estadstica para establecer si dos variables deben ser consideradas como estadsticamente dependientes $sta prueba no es paramtrica, y no descansa en ninguna suposicin sobre las distribuciones de @ o + o la distribucin de :@,+= -au .: las pruebas de -auPa demuestran la fuerza de la asociacin de cross tabulations :2= (mbas variables deben ser ordinales -au P a no har" ning*n ajuste para los vnculos -au #: hace ajustes para vnculos Ralores para el rango tauPb desde PA :A<<W de asociacin negativa o inversin perfecta a 8A :A<<W de asociacin positiva o acuerdo perfecto= 0n valor de cero indica la ausencia de asociacin

-eorema central del lmite


.i @ es una variable, u la media de todos sus valores y s su varianza oB, la media @ de muestras de n observaciones tiene distribucin aproximadamente normal con la misma media u y la nPsima2 #arte

de la varianza La distribucin de @ ser" tanto m"s normal cuanto mayor sea el tamao de la muestra

También podría gustarte