BOTELLA
CAPTULO 1: Conceptos Generales
La estadstica actual no slo es un conjunto de tcnicas para resumir y transmitir informacin cuantitativa, sino
que sirve tambin, y fundamentalmente para hacer inferencias, generalizaciones y extrapolaciones de un conjunto
relativamente pequeo de datos a un conjunto mayor. Clsicamente la estadstica se ha dividido en dos partes, la
estadstica descriptiva y la estadstica inferencial. Para hacer un estudio inferencial primero hay que hacer un
estudio descriptivo de los datos. Es decir, un estudio descriptivo se agota en la descripcin, mientras que uno
inferencial comienza por la descripcin y luego aborda la inferencia. Mientras que la estadstica descriptiva puede
abordarse sin conocimientos tcnicos previos, aparte del lgebra elemental, para el estudio de la estadstica
inferencial es imprescindible adquirir nociones bsicas de probabilidad.
Estadstica es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes de muestras, y de
la realizacin de inferencias acerca de las poblaciones de las que stas proceden.
Otro conjunto de tcnicas ms sofisticadas y desconocidas de la estadstica, y que se utilizan para extraer
conclusiones de poblaciones a partir de la observacin de unos pocos casos, son las que integran la estadstica
inferencial.
Distincin entre estadstica terica y estadstica aplicada: la primera se dedica al estudio de los mtodos
formalmente vlidos para la realizacin de inferencias. La segunda se dedica a la aplicacin de esos mtodos y
modelos de actuacin a campos reales.
Cualquier trabajo en el que se aplica la estadstica se refiere a un conjunto de entidades, conocido con el nombre
de poblacin.
Se llama poblacin estadstica al conjunto de todos los elementos que cumplen una o varias
caractersticas o propiedades
A los elementos que componen una poblacin se les denomina entidades estadsticas o individuos. Dependiendo
del nmero de elementos que la compongan, la poblacin puede ser finita o infinita. La mayor parte de las
poblaciones con las que solemos trabajar son finitas, pero tan numerosas que a la hora de hacer inferencias acerca
de ellas se pueden considerar infinitas a efectos prcticos. Cuando un investigador aborda un trabajo emprico debe
definir claramente la poblacin sobre la cual se interesa.
La poblacin ha de ser el marco o conjunto de referencia sobre el cual van a recaer las conclusiones e
interpretaciones, y stas no pueden exceder ese marco. El hecho de que las poblaciones sean, por lo general, muy
numerosas, suele hacer inaccesible la descripcin de sus propiedades. De ah que se trabaje fundamentalmente con
muestras.
Una muestra es un subconjunto de los elementos de una poblacin
La muestra nos va a ofrecer una serie de datos que podemos ordenar, simplificar y describir. Pero el objetivo
fundamental es el poder describir la poblacin de partida mediante lo que podamos encontrar en la muestra. Y para
poder extraer esas conclusiones lo ms importante es que las muestras de observaciones sean representativas.
Existe todo un campo de la estadstica, llamado muestreo, dedicado a estudiar los procedimientos de extraccin
de muestras encaminados a maximizar la representatividad de las mismas. Por ello un primer objetivo de la
estadstica descriptiva consiste en conseguir resmenes de los datos en ndices compactos y de gran calidad
informativa.
Las poblaciones pueden caracterizarse a partir de unas constantes denominadas parmetros. Como normalmente
los parmetros son desconocidos, una de las tareas de la estadstica es la de hacer conjeturas lo ms acertada
posibles acerca de esas cantidades. Para ello se utilizan cantidades anlogas obtenidas en las muestras, que se
denominan estadsticos.
Un parmetro es una propiedad descriptiva de una poblacin
Un estadstico es una propiedad descriptiva de una muestra
Los parmetros y estadsticos no slo son medias, sino que pueden ser otros tipos de cantidades, como
porcentajes. Desde un punto de vista simblico, conviene indicar, para distinguirlos, que los parmetros se suelen
representar por letras griegas mientras que los estadsticos se suelen simbolizar por letras latinas. En la primera fase
de una investigacin se obtienen los estadsticos, y en la segunda se utilizan los valores obtenidos para hacer
inferencias acerca de los parmetros.
Cuando estudiamos las entidades que conforman una poblacin nos interesamos por algunas de las propiedades
de sus elementos, y esas propiedades adoptan distintas variedades.
Una caracterstica es una propiedad o cualidad de un individuo.
Una modalidad es cada una de las maneras como se presenta una caracterstica
MEDICIN
La estadstica no realiza sus funciones directamente sobre las modalidades observadas, sino que stas se
representan por nmeros, y la estadstica realiza sus funciones sobre esos nmeros.
Se llama medicin al proceso de atribuir nmeros a las caractersticas
La asignacin de nmeros a las caractersticas se hace siguiendo unas reglas; del estudio de los modelos mediante
los cuales conocemos las reglas para una correcta atribucin de los nmeros se ocupa la Teora de la Medida.
El sistema numrico est formado por un conjunto de entidades (nmeros) y unas relaciones entre ellos. Es decir,
que se trata de un sistema relacional numrico. El objetivo de la medicin de una caracterstica es conectar un
sistema relacional emprico y un sistema relacional numrico, de tal forma que las relaciones entre las entidades se
reflejen en las relaciones entre los nmeros que los simbolizan. Slo si se consigue este objetivo ocurrir que de las
relaciones entre los nmeros podrn hacerse inferencias vlidas acerca de las relaciones entre las entidades. Por
ejemplo: las modalidades que adopta la variable estatura son tales que se podra decir que una determinada
modalidad es una estatura superior a otra determinada modalidad. Pues bien, los nmeros que se atribuyan a esas
modalidades en el proceso de medicin deben reflejar esa superioridad. Por el contrario, lo nico que podemos decir
al comprar las modalidades de dos individuos en la variable sexo es si esas modalidades son la misma o no; no tiene
sentido decir que una de las modalidades supone tener ms sexo que la otra.
La medicin estudia las condiciones de construccin de representaciones numricas, y los modelos desarrollados
para la medicin se llaman escalas: nominales, ordinales, cuantitativas de intervalo y cuantitativas de razn.
Se utiliza una clase por cada una de las modalidades que adopta la caracterstica que se est estudiando. Las
clases son mutuamente exclusivas y exhaustivas, es decir, cada observacin es incluida en una y slo una clase.
Transformacin admisible: es un concepto ligado al concepto de escala y que de hecho las se caracteriza, que
hace referencia al problema de la unicidad de la medida. La cuestin de la unicidad puede plantearse de la siguiente
manera: es la representacin numrica que hemos construido la nica posible? En general la respuesta ser
negativa. Sern muchas las representaciones alternativas que seran correctas. De un conjunto de valores
correctamente atribuidos se puede pasar a otro tambin correctamente atribuido mediante una transformacin
admisible. Se dice que una transformacin de los nmeros asignados en una escala es una transformacin admisible
si preserva las caractersticas que definen a esa escala, es decir, si los nmeros transformados tambin representan al
sistema emprico.
- ESCALA NOMINAL: supongamos que se tiene un conjunto de objetos cuya caracterstica nos interesa para su
estudio. sta adopta un nmero k de modalidades distintas; representamos por m a la modalidad del objeto.
Asignamos nmeros a los objetos en funcin de la modalidad que presentan en esa caracterstica; representamos por
n al nmero asignado al objeto. Al tipo de medicin que cumple estas condiciones se le llama escalamiento
cualitativo o nominal. Podran tambin utilizarse otros smbolos, como letras, palabras, etc., puesto que los nmeros
asignados no se van a utilizar como tales, sino como simples cdigos de identificacin. Por ejemplo: el sexo, los
diagnsticos psicopatolgicos (neurosis, psicosis, psicopatas, etc.). La clave de estas escalas de medidas es que solo
informan de la igualdad o desigualdad de los individuos en una caracterstica, pero no de posibles ordenaciones,
puesto que la caracterstica a la que se refieren no se tiene en mayor o menor medida, sino que simplemente adopta
formas cualitativamente distintas.
En una escala nominal son admisibles todas las transformaciones que supongan aplicaciones inyectivas. El
conjunto de transformaciones admisibles determina el tipo de escala o grado de unicidad de la medida.
- ESCALAS ORDINALES: supongamos que contamos de nuevo con un conjunto de objetos que difieren en una
caracterstica que cada uno posee en una cierta cantidad. De nuevo el proceso de medicin debe consistir en la
aplicacin de una regla de asignacin de nmeros a las diferentes cantidades, pero ahora de tal forma que los
nmeros asignados a los objetos reflejen esos distintos grados en los que se presenta la caracterstica. Los nmeros
asignados nos permitirn extraer conclusiones acerca de las magnitudes. Sin embargo, a veces lo nico que esos
nmeros nos permiten inferir son relaciones del tipo "mayor que" o "menor que". Los objetos pueden ordenarse,
puede decirse cul de esos objetos presenta una mayor o menor magnitud de esa caracterstica. Ejemplo: un
individuo es ms extravertido que otro, que un nio es ms hiperactivo que otro, o que el aprendizaje es ms rpido
con el mtodo A que con el mtodo B.
Al igual que en las escalas nominales, las ordinales tienen transformaciones admisibles, que lgicamente sern
todas aquellas que preserven las caractersticas de la escala ordinal. Se puede demostrar que esto ocurre con todas
aquellas transformaciones que cumplan con la condicin de ser transformaciones crecientes.
La limitacin de estas escalas es que aunque nos informa de que un objeto presenta la caracterstica en cuestin
en una mayor magnitud que otro objeto, no nos dice en cuanto mas.
- ESCALA DE INTERVALO: supone una mejora sustancial con respecto a las escalas ordinales, es que se cuenta
con una unidad de medida, sin importar que tanto esta unidad de medida como el origen de la escala sean
arbitrarios.
La diferencia entre los nmeros asignados a dos objetos es igual a la diferencia entre los nmeros asignados a
otros dos, entonces tambin son iguales las diferencias en magnitudes entre estos dos pares. Y, por el contrario, una
mayor diferencia entre los nmeros asignados implica una mayor diferencia entre las magnitudes representadas.
Ejemplo: la temperatura. Para construir la escala centgrada se enfra el agua hasta la temperatura de congelacin,
y se pone un cero en la altura que alcanza la columna de mercurio. Despus se calienta el agua hasta el punto de
ebullicin, y donde se encuentre la altura de la columna de mercurio se marca cien., Posteriormente se divide el
espacio entre esas dos marcas en cien partes iguales, a las que se llama grados centgrados.
La condicin para que una transformacin de los nmeros asignados en una escala de intervalos sea una
transformacin admisible es que los nmeros asignados deben ser transformaciones lineales de las magnitudes
reales, entonces son admisibles las transformaciones que sean tambin son lineales. Las transformaciones admisibles
para las escalas de intervalo no significan ms que un cambio en la unidad de medida y en el origen asignado a la
escala, valores ambos arbitrarios en ese tipo de escalas.
La principal limitacin de este tipo de escalas es que, aunque cuenta con una unidad de medida, no tiene un cero
absoluto. Es decir, el nmero cero no representa realmente la ausencia de esa caracterstica. Un ejemplo de
transformacin admisible es su traduccin a grados Fahrenheit.
- ESCALA DE RAZN: cumple la funcin de preservar el significado del valor cero, de forma que siempre
represente la ausencia de esa caracterstica. La consecuencia fundamental de la presencia de un origen absoluto, y
no arbitrario, es que a dems de poder extraer conclusiones acerca de la igualdad o desigualdad de diferencias,
tambin puede hablarse de desigualdad o igualdad de razones.
La nica transformacin admisible es la multiplicacin por una constante positiva, puesto que solo estas
transformaciones preservan el cero, mientras que permiten un cambio en la unidad de medida.
VARIABLES
En el proceso de medicin se asignan nmeros a los objetos segn unas reglas, y el conjunto de valores numricos
atribuidos a las modalidades de una caracterstica constituyen lo que llamamos variable estadstica.
Una variable es una representacin numrica de una caracterstica
Los valores atribuidos a las correspondientes modalidades de una caracterstica permiten diferenciar a los
objetos, que varan entre s en esa caracterstica. Por el contrario, hay veces que una caracterstica tiene una nica
modalidad, en ese caso todas las entidades estudiadas adoptaran el mismo valor numrico, y decimos que se trata
de una constante.
Las variables pueden clasificarse de varias formas: las variables cuantitativas (sean de intervalo o razn) pueden a
su vez clasificarse en variables discretas y variables continuas, en funcin del nmero de valores asumibles por ellas.
Una variable discreta es aquella que adopta valores aislados. Por tanto, fijados dos consecutivos, no puede tomar
ninguno intermedio. Ejemplo: hijos de las familias espaolas, el nmero de piezas dentales que conservan los
internos de una residencia de ancianos, el numero de libros ledos pasado el verano, etc. En las variables continuas
entre dos valores cualesquiera, por prximos que sean, siempre pueden encontrarse valores intermedios. Ejemplo: la
longitud, la duracin de los sucesos o el peso. Las variables estadsticas se simbolizan por letras maysculas latinas, y
generalmente con un subndice, para distinguirlas de las constantes.
En la prctica las variables continuas no pueden representarse numricamente como tales. Los instrumentos de
medida son imprecisos y solo permiten atribuir nmeros discretos. Cuando decimos que un suceso ha durado 20
segundos lo que queremos decir es que el numero de segundos mas cercano a su duracin es 20; es decir, que su
duracin esta en el intervalo 20 +/- 0,5. El 20 se llama valor informado, mientras que los valores 19,5 y 20,5 se llaman
lmites exactos de la medida, y se obtienen sumando y restando el valor informado la mitad de la unidad de medida
utilizada, que pueden ser unidades, decimas, centsimas, etc.
Se llama intervalo a cada uno de los grupos de valores que ocupan una fila en una distribucin de
frecuencias.
Se llaman lmites aparentes o informados de un intervalo a los valores mayor y menor que puede
adoptar la variable dentro de ese intervalo.
Se llaman lmites exactos de un intervalo a los valores mximo y mnimo incluidos en el intervalo.
Se llama punto medio de un intervalo a la suma de sus lmites exactos partido por dos.
Se llama amplitud de un intervalo a la diferencia entre su lmite exacto superior y su lmite exacto
inferior. Se representa por la letra I.
Hay tres reglas y algunas directrices para hacer una distribucin: a) el intervalo superior debe incluir al mayor
valor observado, b) el intervalo inferior debe incluir al menor valor observado, c) cada intervalo debe incluir el mismo
nmero de valores. Pero al ser muchas las agrupaciones diferentes que se pueden realizar, para decidir entre ellas
hay que tener presentes algunas directrices basadas en dos guas principales: a) dado que el objetivo de una
distribucin es conseguir una ordenacin manejable que ayude a comprender el significado de los datos, no es
conveniente que el nmero de intervalos sea demasiado grande, b) el nmero apropiado de intervalos debe ser tal
que, simultneamente, con ella se consiga una agrupacin operativa y que cumpla los objetivos para los que ha sido
diseada la distribucin, pero sin distorsionar los valores con el error de agrupamiento.
REPRESENTACIONES GRFICAS
A partir de las distribuciones de frecuencias se pueden construir representaciones grficas. La funcin de stas es
dar informaciones globales mediante un solo golpe de vista.
- Diagrama de rectngulos: para hacer un diagrama de rectngulos se colocan en el eje de abscisas las
modalidades (o los nmeros que las representan), y en el eje de ordenadas las frecuencias (puede ser absolutas o
relativas simples o acumuladas). Sobre cada modalidad se levanta un rectngulo cuya altura es la frecuencia
correspondiente. La base de los rectngulos ser arbitraria. Para variables nominales u ordinales.
- Perfil octogonal: se utiliza mucho en informes psicopedaggicos o de rendimiento.
- Pictograma: son representaciones en forma de crculos en los que stos son divididos en secciones cuya
superficie es proporcional a la frecuencia de la modalidad correspondiente.
- Diagrama de barras: se utiliza en variables cuantitativas discretas. En el eje de abscisas se colocan los
distintos valores de la variable y en el eje de ordenadas las frecuencias. Sobre cada valor de la variable se traza una
lnea o barra perpendicular cuya altura debe ser igual a la frecuencia.
- Histograma: se utiliza para variables cuantitativas continuas con datos agrupados en intervalos. En el eje de
abscisas se colocan los lmites exactos de los intervalos, y en el eje de ordenadas las frecuencias. Sobre cada intervalo
se levanta un rectngulo cuya altura sea igual a la frecuencia correspondiente.
- Polgono de frecuencias: para variables discretas, el polgono es la figura que resulta de unir los extremos
superiores de las que hubieran sido las barras. Si se trata de una variable continua, podemos decir lo mismo pero
referido a los puntos medios de las bases superiores de los rectngulos correspondientes a un hipottico histograma
construido con esos mismos datos.
- Diagrama de barras acumuladas: se utiliza en variables discretas. En el eje de abscisas se colocan los valores
de la variable y en el de ordenadas las frecuencias acumuladas, ya sean absolutas o relativas. Sobre cada valor se
traza una perpendicular cuya longitud sea igual a la f. acumulada. Desde el extremo superior de cada una de estas
barras se traza una lnea horizontal que se une con la barra situada a su derecha.
- Polgono de frecuencias acumuladas: se utiliza en variables continuas. El eje de abscisas se construye igual
que en los histogramas, pero en el de ordenadas se incluyen las f. acumuladas, ya sean absolutas o relativas. Sobre
cada lmite se levanta una perpendicular cuya longitud sea idntica a la f. acumulada y se une con los extremos
superiores de dichas perpendiculares.
- Otros dibujos: muchas veces se utilizan otras representaciones figuritas, en las que se incluyen los objetos
de los que se estn haciendo recuentos de frecuencias, a algn smbolo que los identifique de forma muy expresiva.
Si transformamos linealmente las puntaciones tpicas, multiplicndolas por una constante a, y sumando
una constante b, entonces las puntuaciones transformadas tendrn como media la constante sumada b,
como desviacin tpica el valor de la constante multiplicada, |a| y como varianza el cuadrado de esta
constante, a2.
En resumen la construccin de una escala derivada parte de unas puntuaciones directas, stas se tipifican, y
despus se transforman linealmente en otras puntuaciones.
La cuestin fundamental de las escalas derivadas consiste en transformar las puntuaciones originales, X i, en otras
puntuaciones transformadas, Ti, tales que sean ms cmodas de tratar e interpretar, pero que a la vez retengan las
relaciones comerciales entre los valores, es decir, que sean puntuaciones equivalentes.
Supongamos que ahora hay otra prueba que consiste en tachar las letras R. Al inspeccionar los resultados es
posible que aparezca un fenmeno llamado balance entre velocidad y precisin, y que se manifiesta en que los
sujetos que acaban antes suelen cometer ms errores. En este caso tambin hay una cierta relacin entre las
variables. En concreto, los valores bajos en la variable "tiempo invertido" tienden a estar emparejados con valores
altos en la variable "nmeros de errores", y viceversa.
Se dice que dos variables X e Y mantienen una relacin lineal inversa cuando los valores altos en Y
tienden a emparejarse con valores bajos en X, los valores intermedios en Y tienden a emparejarse con
valores intermedios en X, y los valores bajos en Y tienden a emparejarse con valores altos en X.
Supongamos que en un grupo de estudiantes medimos tambin la estatura, y escribimos los valores obtenidos
por cada sujeto emparejado con sus puntuaciones en inteligencia. Salvo coincidencias inesperadas, la inspeccin de
esos pares de valores probablemente nos indicada que no existe relacin entre las variables. No podramos decir que
haya relacin directa o inversa entre las variables.
Se dice que hay relacin lineal nula entre dos variables cuando no hay un emparejamiento sistemtico
entre ellas en funcin de sus valores.
Al hacer una representacin grfica conjunta de dos variables pueden apreciarse visualmente estos tres tipos de
relacin. Para ello se identifican los pares de valores y se sealan los correspondientes puntos en unos ejes de
coordenadas. Estas nubes de puntos reciben el nombre de diagramas de dispersin.
Un caso en que la relacin lineal fuera determinista seria aquel en el que la representacin grafica los puntos
formaran una lnea recta perfecta.
CUANTIFICACIN
Un primer procedimiento consistira en hallar el promedio de los productos cruzados de las puntuaciones
diferenciales. Al hablar de productos cruzados nos referimos al producto, para cada sujeto o caso, de sus valores en
las dos variables, es decir Xi Y. Estos productos pueden obtenerse con puntuaciones directas, diferenciales o tpicas.
Cada figura est separa en cuatro cuadrantes, y los puntos estarn en uno u otro dependiendo de que la observacin
supere o no la media de X y/o la media de Y. En concreto, si supera ambas medias, el punto aparecer en el
cuadrante superior derecho (NE), si supera la media de X pero no la de Y, como el par aparecer en el cuadrante
inferior derecho (SE); si supera la de Y pero no la de X, aparecer el cuadrante superior izquierdo (NO); sino supera
ninguna de las medias, aparecer en el cuadrante inferior izquierdo (SO). Al tratar con puntuaciones diferenciales,
stas sern positivas si superan la media y negativas en caso contrario. Por tanto, aquellas observaciones que
aparezcan en los cuadrantes NE o SO tendrn productos cruzados positivos, mientras que las que aparezcan en los
cuadrantes NO o SE tendrn productos cruzados negativos. El promedio de productos cruzados de diferenciales
tender a dar positivo si la relacin es directa, negativo si es inversa, y en torno a cero si es nula, y a dems su valor
absoluto ser mayor cuanto ms acusada sea la tendencia a la linealidad en el diagrama de dispersin.
PROPIEDADES DEL COEFICIENTE DE CORRELACION DE PEARSON
La razn principal por la que la covarianza no llegaba a satisfacer completamente la necesidad de un ndice de la
asociacin lineal era la dificultad de su valoracin, dado que careca de un mximo y un mnimo estables. Puesto que
hemos destacado su alternativa principal, el coeficiente de correlacin de Pearson, precisamente porque no tiene esa
dificultad
Si hacemos transformaciones lineales de una o las dos variables, en las que las constantes
multiplicadoras son positivas, la correlacin de Pearson no se altera.
VALORACIN E INTERPRETACIN
En la interpretacin de una correlacin de Pearson hay que separar dos aspectos distintos: su cuanta y su sentido.
La cuanta se refiere al grado en el que la relacin entre dos variables queda bien descrita con un ndice de asociacin
lineal como r, mientras que el sentido se refiere al tipo de relacin. Una correlacin en torno a cero indica una
relacin lineal baja o nula; una correlacin positiva indica una relacin lineal directa, mientras que una correlacin
negativa indica una relacin lineal inversa. Cuanto ms cercano quede un coeficiente del valor cero, menos apto es el
modelo lineal como descripcin de la relacin entre las variables. Por el contrario, cuanto ms se acerque a los
extremos, mejor describe esa relacin.
-1 -0,5 0 0,5 1
Sin embargo, la valoracin de r no debe hacerse con base en su valor simple. De hacerlo as se cae en la tentacin
de establecer conclusiones del tipo de que una correlacin de 0,60 indica que hay un 60 por 100 de asociacin lineal,
o que una correlacin de 0,80 indica el doble de asociacin lineal que una correlacin que una correlacin de 0,40. La
valoracin de un coeficiente de correlacin debe hacerse con base en el cuadrado de su valor r2. Como
consecuencia, el grado de asociacin lineal rxy = 0,80 y ruv = 0,40 no es el doble en la primera que en la segunda, sino
del cudruple (r2xy/r2uv =0,64/0,16= 4)
Hay, adems, otros factores que alteran las expectativas sobre el valor de r, como son la variabilidad, la mediacin
de terceras variables, etc. Tambin hay una especificidad en los campos de estudios concretos. Por ejemplo, para
estudiar la estabilidad de la puntuaciones que ofrece un test se suele aplicar el test dos veces en un breve intervalo
de tiempo (es tpico hacerlo en el plazo de una semana), y se halla la correlacin entre las puntuaciones obtenidas en
las dos administraciones de la prueba. As se obtiene la fiabilidad del test. En cada rea de estudio se va a desarrollar
un conocimiento que permite valorar los coeficientes de correlacin en trminos relativos. Los coeficientes de
correlacin deben valorarse comparando unos con otros o comparndolos con los valores que tpicamente se suelen
encontrar en el campo de estudio especifico del que se trate.
La obtencin de una correlacin igual (o cercana) a cero puede llevar a pensar que no hay relacin entre las
variables sin ser cierto. La correlacin de Pearson mide el grado de adecuacin de unos datos a un modelo lineal,
pero entre las variables puede existir otro tipo de relacin. Un ejemplo prototpico de esto es la relacin entre
activacin y rendimiento, por ejemplo: con estados altos de ansiedad se reduce el rendimiento en los exmenes. Es
decir el rendimiento mximo se obtiene con niveles medios de activacin, mientras que con niveles demasiados
bajos o demasiados altos el rendimiento disminuye.
Lo que se desprende de todo esto es que no conviene analizar la relacin entre dos variables exclusivamente
mediante el clculo coeficiente de correlacin, sino que conviene representar grficamente el diagrama de dispersin
para observar esa relacin. Una representacin grafica puede ser mucho ms informativa que un simple valor de r.
Tampoco hay que interpretar los coeficientes de correlacin en trminos de relaciones causales entre las
variables.
REUCHLIN
GLOSARIO DE CONCEPTOS
ELEMENTOS O UNIDADES: son las entidades acerca de las que se renen datos. Por ejemplo: 1) si se evala la
memoria de los aspirantes a un puesto de mozo en el restaurante X, las unidades son cada uno de los aspirantes. 2) si
a un comerciante le interesa el volumen de ventas semanal de su comercio durante el ltimo ao, las unidades son
cada una de las semanas de ese ao.
POBLACIN DE INDIVIDUOS: es el conjunto de todos los elementos sobre los cuales se observa una o ms
caractersticas de inters. Se alude a ella como poblacin objetivo, en razn de que sobre ella recae el objetivo o el
inters del estudio. Ejemplos: 1) el conjunto de aspirantes al empleo del restaurante X. 2) el conjunto de semanas a lo
largo del ultimo ao.
MUESTRA DE INDIVIDUOS: es un subconjunto o parte de una poblacin de individuos. Ejemplos: 1) los cinco
primeros aspirantes entrevistados. 3) las semanas 1, 6, 12, 19,27, etc. del ltimo ao.
Notas: cuando hablamos de unidades como de la poblacin objetivo o de individuos o de la muestra de
individuos, estas entidades deben ser situadas en el espacio (situacin geogrfica) y en el tiempo (ao o fecha).
Como generalmente las muestras se extraen con fines inferenciales; esto es, para tener conocimiento de lo que
acontece a nivel poblacional, es de desear que sean representativas de las respectivas poblaciones. Para favorecer la
representatividad de las muestras, la llamada Teora de Muestreo ha desarrollado diversidad de mtodos. Uno de
ellos es la eleccin al azar de las unidades muestrales.
VARIABLES O CARACTERSTICA: es una caracterstica de un fenmeno observable en los individuos de una
poblacin. Es una variable propiamente dicha cuando presenta diferentes modalidades (dos o ms) entre los
individuos. Si se presenta bajo una nica modalidad se dice que es una caracterstica constante. Ejemplos: 1)
memoria de los aspirantes al empleo. 2) volumen de ventas respectivamente.
VARIABLE ESTADSTICA: es una representacin, a travs de nmeros u otros smbolos, de una variable. Esta
representacin se obtiene mediante algn procedimiento de medicin. Ejemplos: 1) cantidad de palabras recordadas
de una lista de 12. 2) total de $ de los productos vendidos en una semana.
Las variables estadsticas se clasifican de acuerdo con el tipo de valores que pueden tomar en:
- Variable cualitativa: es aquella cuyos valores expresan atributos. Ejemplo: tipo de trastorno que presentan
los pacientes de un servicio de salud mental (de ansiedad, de atencin, de sueo, etc.)
- Variable cuasi-cuantitativa: es aquella cuyos valores indican un orden de jerarqua. Ejemplo. Nivel de
desercin escolar (bajo, medio, alto)
- Variable cuantitativa: es aquella cuyos valores expresan cantidades numricas. Dentro de las variables
cuantitativas se diferencian las llamadas discretas de las continuas. Se consideran discretas aquellas cuyos valores
son puntos aislados, esto es, cuando todo valor tiene un consecutivo. Se dice que dos valores son consecutivos
cuando no puede existir un valor de la variable entre ellos. Ejemplo: cantidad de palabras recordadas. Se consideran
continuas a las variables que, al menos tericamente pueden tomar cualquier valor dentro de un intervalo numrico.
Ejemplo: tiempo de reaccin ante un estimulo.
CONSTRUCTO Y OPERACIONALIZACIN: la mayora de las caractersticas psicolgicas son de naturaleza compleja,
resultado de varias variables que interactan. Cuando se alude a estas variables es necesario explicitar que se
entiende por ellas, o que aspectos se estn considerando y qu relaciones se verifican entre ellas. De all surge una
construccin terica, hipottica que toma el nombre de constructo. Ejemplos: inteligencia, la memoria, la ansiedad,
la actitud solidaria, etc. Estos constructos o variables complejas no son directamente observables como son; por
ejemplo, la estatura o el estado civil de una persona, y esto es lo que dificulta el proceso de medicin, para poder
obtener valores de estas variables a travs de la medicin es necesario hacer un recorte adecuado del constructo;
es decir, considerar un solo aspecto del mismo y explicitar cules son las manifestaciones observables que dan
cuenta de l. Por ejemplo, una manifestacin observable de la memoria es la cantidad de palabras recordadas,
aunque la sola recordacin de palabras no agota la riqueza del constructo memoria. En estos casos se recurre a una
definicin operacional (operacionalizacin) del constructo permite asignar sin ambigedad un valor a la variable a
travs del proceso de medicin. En el ejemplo, la definicin operacional del constructo memoria es la cantidad de
palabras recordadas. A las variables que no son directamente observables tambin se las denomina rasgos latentes.
As, por ejemplo, la obsesividad de un estudiante es un rasgo latente que se puede manifestarse a travs de la
cantidad de veces que pregunta lo mismo hasta sentirse satisfecho.
CONTINUO O DISCRETO?: el hecho de que una variable estadstica sea discreta o continua determina el tipo de
tratamiento estadstico que se le dar. Sin embargo muchas veces es decisin del investigador si la tratar de un
modo y otro dependiendo de la naturaleza de la variable estadstica y de su correspondiente variable latente . Por
ejemplo: la cantidad de palabras recordadas de una lista es claramente una variable discreta. Pero esta variable
representa a la variable latente memoria, la cual tiene sentido que sea concebida en una continuo; esto es, entre dos
niveles de memoria es razonable pensar que podran existir infinitos valores posibles. De modo que se puede
considerar que en realidad est ante una discretizacin de un continuo debida al instrumento de medicin; del
mismo modo que la hora registrada con un reloj digital es una discretizacin del tiempo que se desea medir. Bajo
esta perspectiva el investigador puede dar a la cantidad de palabras recordadas un tratamiento de variable continua y
considerar, por ejemplo, que el valor 10 (diez palabras recordadas) bien puede representar todo un continuo de
niveles de memoria entre 9,5 y 10,5 que podra observar si dispusiera de un instrumento de medicin ms sensible
que la sola cantidad de palabras recordadas. Es importante considerar que para que una variable discreta pueda ser
tratada adecuadamente como continua, es conveniente que tome una gran cantidad de valores diferentes.
POBLACIN DE OBSERVACIONES: es el conjunto de todos los valores que pueden tomar una variable estadstica
sobre la poblacin de individuos. Ntese que sobre una misma poblacin de individuos se pueden definir muchas
poblaciones de observaciones, tantas como variables de inters.
MUESTRA DE OBSERVACIONES: es el conjunto de de valores que toma una variable estadstica sobre una muestra
de individuos; es decir, es un subconjunto de la poblacin de observaciones.
ESTADSTICA DESCRIPTIVA: es la parte de la Estadstica que proporciona mtodos para organizar, representar,
resumir y analizar la informacin contenida en un conjunto de datos muestrales o poblaciones.
ESTADSTICA INFERENCIAL: es la parte de la Estadstica que proporciona mtodos para extraer conclusiones sobre
las poblaciones a partir de sus muestras controlando el margen de error que se pueden cometer en esa extrapolacin
de lo muestral a lo poblacional. Los mtodos de inferencia estadstica se agrupan fundamentalmente en dos clases:
estimacin de parmetros y contraste de hiptesis.
POBLACIONES REALES O HIPOTTICAS, FINITAS O INFINITAS: una muestra de observaciones siempre es real
porque consiste de datos efectivamente recolectados; pero la correspondiente poblacin de observaciones puede ser
real o hipottica. Por otra parte, una poblacin de observaciones puede ser finita, esto es con una cantidad grande o
pequea pero limitada de elementos. Pero una poblacin puede ser infinita. La importancia de reconocer con que
tipo de poblacin se est trabajando radica en la pertinencia de los mtodos estadsticos que se utilizan para recoger
los datos, analizarlos y sacar conclusiones.
PARMETRO: es una caracterstica fija, generalmente numrica, de la poblacin de valores de una variable . Por
ejemplo: si la variable es el tiempo de reaccin de sujetos entrenados ante un estimulo, un parmetro es el tiempo
promedio de reaccin de todos los individuos de la poblacin de inters si estos fueran entrenados. Otro parmetro
podra ser el tiempo mnimo de reaccin que surgira de comparar los tiempos de todos los sujetos de la poblacin y
que, por tanto, tambin es nico; lo mismo puede decirse del tiempo mximo. Si la variable es actitud de los
consumidores hacia un nuevo producto, un parmetro puede ser el porcentaje de consumidores de toda la poblacin
objetivo que tiene actitud positiva.
ESTADSTICO: es una caracterstica muestral y como tal, es una variable porque sus valores dependen de la
muestra que salga seleccionada. Cada valor del estadstico se obtiene como funcin de las observaciones de una
muestra. Por ejemplo, tiempo promedio de reaccin de 10 individuos que fueron entrenados. Porcentaje de
consumidores entre 100 encuestados que manifestaron tener una actitud positiva frente al producto.
ESTIMADOR: es un estadstico cuyos valores se consideran prximos a un parmetro que, por ser generalmente
desconocido, se desea estimar.
FRECUENCIA ABSOLUTA: es la cantidad de veces que cada valor de la variable aparece en un conjunto de datos.
La suma de todas las frecuencias absolutas coincide con la totalidad de los datos.
ESTADSTICA INFERENCIAL
BOTELLA
CAPTULO 11
El azar tiene que ver con aquellos eventos cuyo resultado no podemos predecir con certeza, y a los que nosotros
llamaremos experimentos aleatorios. Lo que depende del azar, y por tanto, da sentido al trmino aleatorio en este
contexto, es el procedimiento de extraccin de un individuo y slo uno, de los que componen la poblacin. Todo
experimento aleatorio tiene dos o ms resultados posibles, que nosotros llamaremos sucesos elementales. En un
experimento que tuviera solo un resultado posible no habra incertidumbre y por tanto, no podramos hablar de
experimento aleatorio. La realizacin de un experimento aleatorio da lugar a un suceso elemental, y slo uno, de
entre los posibles. Al conjunto de los resultados posibles de un experimento aleatorio, o sucesos elementales, se le
llama espacio muestral y se representa por E. Se llama verificacin de un suceso elemental al hecho de que la
realizacin del experimento aleatorio produzca ese suceso elemental. Sobre los espacios muestrales, como conjuntos
que son, se pueden definir subconjuntos, que denominaremos sucesos y los representaremos por letras maysculas.
Aunque para definir un suceso basta con definir un subconjunto cualquiera de E, normalmente los sucesos con los
que trabajaremos se constituiran con los sucesos elementales que cumplen alguna condicin, y no de forma
arbitraria. Un suceso se verificar cuando el experimento aleatorio de lugar a uno de los sucesos elementales que
integran el subconjunto que lo define. En algunas ocasiones se definen sucesos a partir de subconjuntos vacos. Este
tipo de sucesos reciben el nombre de suceso imposible. En otras ocasiones definen sucesos cuyo subconjunto
constituyente est formado por todos los elementos del espacio muestral. Este tipo de sucesos reciben el nombre de
suceso seguro. Vamos a definir operaciones sobre sucesos que utilizaremos a partir de aqu:
a) Llamaremos unin de dos sucesos al subconjunto E formado por sucesos elementales que integran los
subconjuntos de al menos uno de esos sucesos.
b) Llamaremos interseccin de dos sucesos al subconjunto de E formado por los sucesos elementales que
pertenecen simultneamente a ambos sucesos. Cuando la interseccin de dos sucesos es un subconjunto vaco se
dice que son sucesos incompatibles o exclusivos.
c) Llamaremos diferencia de dos sucesos al subconjunto E integrado por los sucesos elementales que
pertenecen al primero, pero no al segundo.
d) Llamaremos complementario de un suceso al subconjunto de E integrado por los sucesos elementales no
incluidos en ese suceso.
En trminos generales representaremos por n al nmero de sucesos elementales que integran el espacio
muestral, y por na al nmero de sucesos elementales que constituyen el suceso A.
Un experimento aleatorio es toda accin cuyo resultado no se puede predecir con certeza.
Cada uno de los resultados posibles de un experimento aleatorio se llama suceso elemental y su
conjunto constituye el espacio muestral del experimento aleatorio.
La verificacin de un suceso elemental es la observacin de ese suceso elemental al realizar el
experimento aleatorio.
Un suceso es cualquier subconjunto de los elementos de un espacio muestral.
Dos sucesos son incompatibles o exclusivos si no tienen elementos comunes y por tanto, no pueden
verificarse simultneamente.
El complementario de un suceso es el subconjunto de sucesos elementales del espacio muestral que no
participan en ese suceso.
La interseccin de dos sucesos es el subconjunto de elementos del espacio muestral que,
simultneamente estn incluidos en los subconjuntos de ambos sucesos.
La unin de dos sucesos es el subconjunto de elementos del espacio muestran que estn incluidos, al
menos, en uno de esos sucesos.
Tipos de espacio muestral: los espacios muestrales se clasifican en espacios muestrales finitos e infinitos y a su
vez estos ltimos se subdividen en numerables y no numerables.
a) Espacios muestrales finitos: un espacio muestral es finito si tiene un nmero de sucesos elementales finito.
b) Espacios muestrales infinitos numerables. Tiene infinitos sucesos elementales pero estos pueden ponerse
en correspondencia biunvoca con los nmeros naturales.
c) Espacios muestrales infinitos no numerables. Tiene infinitos sucesos elementales pero stos no pueden
ponerse en correspondencia biunvoca con los nmeros naturales.
PROBABILIDAD
El concepto de probabilidad hace referencia a como los eventos puntuales que tienen resultados inciertos, al
estudiar su repeticin un nmero grande veces, comienzan a tener resultados globalmente previsibles, y a mostrarse
sujetos a ciertas leyes. La probabilidad es un concepto ideal, pues se refiere a las frecuencias con las que ocurriran
las cosas en el caso hipottico de que los eventos se repitiesen un nmero infinitamente grande de veces y en las
mismas condiciones. La confianza puesta en cada uno de los elementos posibles en la prxima realizacin del evento
debe ser proporcional al nmero de repeticiones que cada una de esas alternativas se daran en el futuro. La
asignacin de nmeros a esos grados de confianza depositados en la obtencin de cada resultado es la clave del
concepto de probabilidad:
La probabilidad de un suceso es un nmero que cuantifica en trminos relativos las opciones
de verificacin de ese suceso.
Un suceso sin opcin alguna tendra una probabilidad igual a 0, y un suceso con todas las opciones tendran una
probabilidad igual a 1. Cualquier suceso con un nmero de opciones intermedio entre esos dos tendr como
probabilidad asociada un nmero intermedio cuya magnitud represente cuantitativamente esas opciones. No
obstante a veces se utilizan porcentajes para indicar probabilidad, que es lo mismo, pero estrictamente hablando
esos valores no son probabilidades, sino porcentajes de posibilidades que expresan cuantas de cada cien veces se
espera que ocurra el suceso.
ENFOQUE CLSICO
La aplicacin del enfoque clsico o a priori exige la aceptacin del llamado principio de indiferencia, segn el cual
todos los elementos del espacio muestral tienen las mismas opciones de ser verificados al realizar un experimento
aleatorio. Desde el enfoque clsico que exige asumir el principio de indiferencia se define la probabilidad de un
suceso como la frecuencia relativa de ese suceso en el espacio muestral. Desde este enfoque la probabilidad de un
suceso es igual al cociente entre el nmero de casos favorables y posibles. Los procedimientos habitualmente
utilizados para determinar estas cantidades reciben los nombres de tcnicas de contar o combinatoria. De la forma
de definir la probabilidad de este enfoque se deducen:
a) La probabilidad de un suceso es un valor que oscila entre 0 y 1.
b) Un suceso que no contiene ningn suceso elemental tiene una probabilidad igual a 0, y por ello recibe el
nombre de suceso imposible.
c) Un suceso que contiene todos los sucesos elementales del espacio muestral tiene una probabilidad igual a 1
y por ello recibe el nombre de suceso seguro.
d) La suma de las probabilidades de un suceso y su complementario es igual a 1.
ENFOQUE FRECUENCIALISTA
La probabilidad se determinara mediante una operacin ideal de repeticin sistemtica del experimento
aleatorio y de cmo del nmero de veces que se verifican los sucesos. Las opciones de verificacin de un suceso se
manifestaran en el nmero de veces que se repite este al realizar una y otra vez el experimento aleatorio.
Representa proporcionalmente a su probabilidad, el nmero de veces que se realiza el experimento debe ser
infinitamente grande. Por tanto, desde el enfoque frecuencialista la probabilidad de un suceso A se define como el
lmite de la frecuencia relativa de apariciones de ese suceso cuando el nmero de repeticiones del experimento
aleatorio tiende a infinito.
La diferencia fundamental entre este enfoque y el anterior es que mientras en el primero n era el tamao del
espacio muestral, en este representa el nmero de repeticiones del experimento aleatorio. De esta definicin se
deducen las mismas consecuencias y propiedades que exponamos en conexin con el enfoque clsico.
La hiptesis nula es la hiptesis que se somete a contraste. Consiste generalmente en una afirmacin concreta
sobre la forma de una distribucin de probabilidad o sobre el valor de alguno de los parmetros de esa distribucin.
La hiptesis alternativa es la negacin de la nula, incluye todo lo que la nula excluye. Mientras la nula suele ser una
hiptesis exacta (tal cosa es igual a tal otra), la alternativa suele ser inexacta (tal cosa es distinta, mayor o menor que
otra). Cuando en Hi aparece el signo distinto decimos que el contraste es bilateral o bidireccional. Cuando en Hi
aparece los signos mayor o menor, decimos que el contraste es unilateral o unidireccional. La hiptesis nula y
alternativa suelen plantearse como hiptesis rivales. Son exhaustivas y mutuamente exclusivas, lo cual implica que si
una es verdadera, la otra es necesariamente falsa.
El signo de igualdad siempre va en la hiptesis nula.
SUPUESTOS
Para que una hiptesis estadstica pueda predecir un resultado muestral con cierta exactitud es necesario, en
primer lugar, que la distribucin poblacional con la que se va a trabajar est completamente especificada. Son
hiptesis que especifican por completo las distribuciones poblacionales a las que hacen referencia. Se las llama
simples. Las hiptesis en las que la distribucin poblacional no queda completamente especificada reciben el nombre
de compuestas. Lo ideal es plantear hiptesis nulas simples, pero ocurre que ni los intereses del investigador se
corresponden siempre con el contenido de una hiptesis simple.
Los supuestos de un contraste de hiptesis hacen referencia al conjunto de condiciones que deben cumplirse para
poder tomar una decisin sobre la hiptesis nula Ho basada en una distribucin de probabilidad conocida.
Los supuestos de un contraste de hiptesis son un conjunto de afirmaciones que necesitamos establecer
(sobre la poblacin de partida y sobre la muestra utilizada) para conseguir determinar la distribucin de
probabilidad en la que se basar nuestra decisin sobre Ho.
Algunos de estos supuestos son ms restrictivos o exigentes que otros. Es importante tener presente que el
incumplimiento de uno o varios supuestos podran invalidad el contraste y llevarnos a una decisin errnea.
Conviene, por tanto, que los supuestos sean pocos y poco exigentes.
ESTADSTICO DE CONTRASTE
Un estadstico de contraste es un resultado muestral que cumple la doble condicin de proporcionar
informacin emprica relevante sobre la afirmacin propuesta en la hiptesis nula y, poseer una
distribucin muestral conocida.
La primera condicin que debo cumplir es que debemos recurrir a un estadstico que sea capaz de detectar
cualquier desviacin de la afirmacin establecida en Ho. Para contrastar la hiptesis, lo razonable ser utilizar la
informacin muestral proporcionada por el estadstico X
La segunda condicin que debe cumplir un resultado muestral para poder ser utilizado como estadstico de
contraste es la de poseer una distribucin muestral conocida. Un estadstico es una variable aleatoria y como tal,
tiene su propia funcin de probabilidad a la que denominamos distribucin muestral. Es en la distribucin muestral
del estadstico de contraste en la que nos vamos apoyar para tomar una decisin respecto Ho en trminos de
probabilidad.
Una vez planteada la hiptesis, es necesario seleccionar el estadstico de contraste capaz de proporcionarnos
informacin relevante sobre ellas y establecer los supuestos necesarios para conseguir determinar la distribucin
normal del estadstico.
REGLA DE DECISIN
La regla de decisin es el criterio que vamos a utilizar para decidir si la hiptesis nula planteada debe o no ser
rechazada. Este criterio se basa en la particin de la distribucin muestral del estadstico de contraste en dos zonas
mutuamente exclusivas: la zona de rechazo y la zona de aceptacin.
La zona de rechazo tambin llamada zona crtica, es el rea de la distribucin muestral que corresponde a los
valores del estadstico de contraste que se encuentran tan alejados de la afirmacin establecida en Ho, que es muy
poco probable que ocurran si Ho, como se supone, es verdadera. Su probabilidad es alfa (nivel de significacin).
La zona de aceptacin es el rea de la distribucin muestral que corresponde a los valores del estadstico de
contraste prximos a la afirmacin establecida en Ho. Es, por tanto, el rea correspondiente a los valores del
estadstico de contraste que es probable que ocurran si Ho como se supone, es verdadera. Su probabilidad es 1 alfa,
valor llamado nivel de confianza.
La regla de decisin consiste en rechazar Ho si el estadstico de contraste toma un valor perteneciente a
la zona de rechazo o crtica; mantener Ho si el estadstico de contraste toma un valor perteneciente a la
zona de aceptacin
Se rechaza una hiptesis sometida a contraste cuando el valor del estadstico de contraste cae en la zona crtica; y
se rechaza porque eso significa que el valor tomado por el estadstico de contraste se aleja demasiado de la
prediccin establecida por esa hiptesis, es decir, porque, si la hiptesis planteada fuera verdadera, el estadstico de
contraste no debera haber tomado ese valor; como de hecho el estadstico ha tomado es el valor, la conclusin ms
razonable ser que la hiptesis planteada no es verdadera.
El tamao de las zonas de rechazo y aceptacin se determina fijando el valor de alfa, es decir, fijando el valor de
significacin con el que se desea trabajar. Alfa ser, necesariamente, un valor pequeo.
La forma dividir la distribucin muestral en zonas depende de si el contraste es bilateral o unilateral. La zona
crtica debe estar situada all donde puedan aparecer los valores muestrales incompatibles con Ho, es decir, all donde
puedan aparecer los valores muestrales que apunten en la direccin propuesta en H. En los contrastes bilaterales, la
zona crtica se encuentra, generalmente repartida a partes iguales entre las dos colas de la distribucin muestral. En
los contrastes unilaterales la zona crtica se encuentra en una de las dos colas de la distribucin muestral.
DECISIN
El paso consiste en obtener una muestra aleatoria de tamao n, calcular el estadstico de contraste y tomar una
decisin. Tal decisin se toma siempre, respecto a Ho, y consiste en rechazarla o mantenerla de acuerdo con el valor
tomado por el estadstico de contraste y las condiciones establecidas en la regla de decisin: si el estadstico de
contraste cae en la zona critica, se rechaza H o; si el estadstico de contraste cae en la zona de aceptacin, se mantiene
Ho.
Una decisin, en el contexto del contraste, siempre consiste en rechazar o mantener una Ho particular. Si la
rechazamos estamos afirmando que esa hiptesis es falsa, es decir, estamos afirmando con una probabilidad alga de
equivocarnos, que hemos conseguido probar que esa hiptesis es falsa. Por el contrario, si la mantenemos, no
estamos afirmando que hemos probado que esa hiptesis es verdadera, simplemente estamos afirmando que no
disponemos de evidencia emprica suficiente para rechazarla y que por lo tanto, podemos considerarla compatible
con los datos
Cuando decidimos mantener una hiptesis nula, queremos significar con ello que consideraos que esa
hiptesis es compatible con los datos. Cuando decidimos rechazar una hiptesis nula, queremos significar
con ello que consideramos probado que esa hiptesis es falsa
La razn de que esto sea as es doble. Por un lado, dada la naturaleza inespecfica de Hi, raramente es posible
afirmar que Hi no es verdadera; las desviaciones pequeas de Ho forman parte de Hi, por lo que al mantener una Ho
particular, tambin se estn manteniendo algunos valores de Hi; debe concluirse que se mantiene o se rechaza Ho,
pero nunca que se acepta como verdadera. Por otro lado, en el razonamiento estadstico que lleva a la toma de una
decisin respecto a Ho puede reconocerse el argumento deductivo modus tollens.
ERRORES DE TIPO I Y II
Ho puede ser verdadera o puede ser falsa. Si Ho es verdadera y la mantenemos estaremos tomando una decisin
correcta; si es falsa y la rechazamos, tambin estaremos tomando una decisin correcta. Pero si Ho es verdadera y la
rechazamos, estaremos cometiendo un error e igualmente estaremos cometiendo un error si Ho es falsa y la
mantenemos.
Llamamos error de tipo I al que se comete cuando se decide rechazar una Ho que en realidad es
verdadera. La probabilidad de cometer ese error es alfa.
Llamamos error de tipo II al que se comete cuando se decide mantener una Ho que en realidad es falsa.
La probabilidad de cometer ese error es beta.
Por tanto I ser la probabilidad de tomar una decisin correcta cuando Ho es verdadera. Y 1-beta ser la
probabilidad de tomar una decisin correcta cuando Ho es falsa. La probabilidad de cometer un error I con nuestra
decisin es una probabilidad conocida, pues el valor de alfa lo fija el propio investigador. Sin embargo, la probabilidad
de cometer un error de tipo II, es un valor desconocido que en un contraste depende de tres factores: la verdadera
Hi, el valor de alfa y el tamao del error tpico de la distribucin muestral utilizada para efectuar el contraste.
POTENCIA
La potencia (1-B) de un contraste es la probabilidad de rechazar una hiptesis nula que en realidad es
falsa.
Cuando hablamos de la potencia de un contraste, por tanto, nos estamos refiriendo a la capacidad de ese
contraste para detectar que una hiptesis concreta es falsa. Para poder calcular la potencia de un contraste
necesitamos referirnos a una afirmacin de las muchas definidas en Hi.
NIVEL CRTICO Y TAMAO DEL EFECTO.
La probabilidad de cometer un error de tipo I se establece antes de efectuar el contraste para evitar que influya en
la decisin final. En ese sentido, podemos entender el nivel de significacin como el riesgo mximo que estamos
dispuestos a asumir al tomar la decisin de rechazar la hiptesis concreta.
Efectuar un contraste estableciendo previamente un nivel de significacin es lo que se hace, aunque trae
inconvenientes:
1. La decisin sobre Ho puede depender decisivamente del nivel de significacin establecido. Podemos decidir
mantener la hiptesis con = 0.01 y rechazarla con = 0.05.
2. Decidir si Ho es o no falsa no proporciona ningn tipo de informacin sobre el grado en el que la evidencia
muestral se muestra incompatible con esta hiptesis.
Si consideramos que cometer un error de tipo I es muy grave, adoptaremos para alfa un valor ms pequeo que si
consideramos que cometer ese error no tiene consecuencias graves. Pero recordemos que al hacer ms pequeo el
valor de alfa, la potencia del contraste disminuye automticamente (que es igual que decir que la potencia de que se
produzca un error II se incrementa). Eso puede llevar a cometer un error II por querer evitar el I.
Llamamos nivel crtico y lo representamos por p, al nivel de significacin ms pequeo al que una
hiptesis nula puede ser rechazada con el estadstico de contraste obtenido
Podemos definir el nivel crtico, ms brevemente, como la probabilidad asociada al estadstico de contraste. En
trminos generales, en un contraste unilateral, el nivel crtico es la probabilidad asociada a los valores mayores
(contraste unilateral derecho) o menores (contraste unilateral izquierdo) que el estadstico de contraste obtenido; en
un contraste bilateral, el nivel crtico es la probabilidad asociada a los valores que se encentran tan alejados de Ho
como, al menos, el estadstico de contraste. Segn esto, el nivel crtico se obtiene, a diferencia de lo que ocurre con
el nivel de significacin, despus de efectuar el contraste, es decir, una vez obtenido el estadstico de contraste.
Decidir si una hiptesis es o no falsa no constituye, en la mayor parte de las situaciones experimentales, un criterio
suficiente para determinar si el experimento realizado contribuye o no de la forma significativa al desarrollo de una
teora o de una lnea de investigacin. Esto es as porque la decisin a la que se llega en un contraste de hiptesis
sobre la base del grado de discrepancia existente entre la Ho planteada y la evidencia muestral observada depende
directamente, segn hemos sealado ya, del tamao de la muestra utilizada. Tamaos muestrales grandes pueden
llevarnos a considerar estadsticamente significativas discrepancias muy pequeas y tamaos muestrales muy
pequeos pueden llevarnos a considerar estadsticamente insignificantes discrepancias tericamente relevantes.
El nivel crtico, no solo nos ayuda a tomar una decisin sobre Ho, sino que su tamao nos informa sobre el grado
de compatibilidad o discrepancia existente entre la evidencia muestral observada y esa Ho. Podemos decir que el
tamao del nivel crtico nos est informando sobre el grado en el que la evidencia emprica obtenida se muestra
incompatible con la Ho planteada.
La utilizacin del nivel crtico como una medida del grado de discrepancia entre la Ho planteada y la evidencia
muestral observada tiene el inconveniente de que el valor del nivel crtico est condicionado por el tamao de la
muestra concreta utilizada. Necesitamos, por tanto, otra medida de ese grado de discrepancia que no dependa del
tamao de la muestra tamao del efecto
Decidir si una hiptesis es o no falsa no constituye un criterio suficiente para determinar si el experimento
realizado contribuye o no de forma significativa al desarrollo de una teora o de una lnea de investigacin. Esto es as
porque la decisin a la que se llega en un contraste de hiptesis sobre la base del grado de discrepancia existente
entre Ho planteada y la evidencia muestral observada depende directamente del tamao de la muestra utilizada.
Tamaos mustrales grandes pueden llevar a considerar como estadsticamente significativas discrepancias muy
pequeas; y tamaos mustrales muy pequeos pueden llevarnos a considerar estadsticamente insignificante
discrepancias tericamente relevantes.
CONTRASTE BILATERALES Y UNILATERALES
Cuando un investigador desea comprobar si un parmetro toma o no un determinado valor, si dos grupos
difieren entre si en alguna variable, si dos variables son independientes, etc., puede someter a contraste de hiptesis
como estas: Ho: = 0,5; Hi: 0,5
Las hiptesis formuladas no contienen ninguna prediccin sobre la direccin en la que se puede producir un
resultado muestral incompatible con la afirmacin establecida en Ho. Lo cual est reflejado en Hi, con el signo de" ="
As, por ejemplo, si se quiere estudiar si los varones y las mujeres difieren en inteligencia, y no existen una
expectativa justificada sobre cul de los dos grupos es ms inteligente, lo razonable ser plantear un contraste
bilateral: Ho: v = m; Hi: v m
Cuando se utiliza la distribucin normal o la distribucin t de Student en un contraste bilateral, la zona critica est
repartida en partes iguales, entre las dos colas de la distribucin muestral. De ah el nombre bilateral.
Cuando un investigador desea comprobar si el valor de un parmetro ha aumentado, si un grupo supera o es
mejor que otro en alguna variable, si dos variables se encuentran negativamente relacionadas, etc. puede someter a
contraste hiptesis como estas: Ho: 0,65; Hi: 0,65
A este tipo de contraste se les llama unilaterales. Las hiptesis contienen una prediccin concreta sobre la
direccin en la que se puede producir un resultado muestral incompatible con la afirmacin establecida en Ho. Lo
cual esta reflejado en Hi, con los signos "< y >"
Cuando se utiliza la distribucin normal o la distribucin t de Student en un contraste bilateral, la zona critica est
en una de las dos colas de la distribucin.
WELKOWITZ
RANGO PERCENTILAR
Una forma de suministrar la informacin adicional consiste en transformar la puntuacin original (puntuacin
directa) en una nueva puntuacin que mostrar de forma inmediata la situacin de un individuo en comparacin con
los dems estudiantes de la clase: los percentiles.
El rango percentil de un valor dado es un nmero que expresa el tanto por ciento de casos en el grupo especfico
de referencia, cuyo valor es igual o inferior al dado. Por ejemplo: a una puntuacin de 41 le corresponde un rango 85,
significa que el 85% de la clase obtuvo una puntuacin igual o inferior a 41 puntos, mientras que slo un 15% de la
clase recibi puntuaciones ms elevadas. Un percentil es un valor no superado por un tanto por ciento dado de los
casos registrados. Una puntuacin que nos colocase en el percentil 5 debera inquietarnos, pues significara que el
95% de la clase lo hizo mejor que nosotros y solo un 5% se comporto peor o igual. As, el percentil muestra
directamente como un valor concreto se compara con los dems en un grupo especfico.
No se puede interpretarse correctamente un percentil si no se conoce perfectamente un grupo de referencia en
cuestin.
Un percentil compara un valor con un grupo especfico de valores.
- PROCEDIMIENTO DE CALCULO: para encontrar el rango del percentil correspondiente a la calificacin de 41,
solo hay que hacer lo siguiente:
1. Localizar el intervalo de clase al que pertenece dicha calificacin (intervalo critico)
2. Clasificar las frecuencias (f) en tres categoras: las correspondientes a todas las calificaciones superiores al
intervalo crtico, las correspondientes a todas las calificaciones del intervalo crtico y las correspondientes a todas las
calificaciones inferiores a dicho intervalo.
En orden a determinar exactamente nuestra situacin en el intervalo crtico debemos cerciorarnos de cul es el
lmite inferior real del mismo. Una regla conveniente consiste en situar el lmite inferior real de un intervalo
exactamente en el punto medio entre la calificacin ms baja de este intervalo y la ms alta inmediatamente
inferior.