A los elementos que componen una población se les denomina entidades estadísticas o
individuos. Dependiendo del numero que la componga, la población puede ser finita o infinita.
Cuando un investigador aborda un trabajo empírico claramente la población sobre la cual se
interesa. La población ha de ser el marco o conjunto de referencias sobre el cual van a recaer las
conclusiones e interpretaciones.
El hecho de que las poblaciones sean muy numerosas, suele hacer inaccesible la descripción de
sus propiedades. Por eso, se debe trabajar con:
Para poder extraer conclusiones de las muestras, lo mas importante es que las observaciones
sean representativas.
Las poblaciones pueden caracterizarse a partir de unas constantes denominadas parámetros. Los
parámetros son desconocidos, unas de las tareas de la estadística es la de hacer conjeturas lo
mas acertadas posibles acerca de esas cantidades.
Medición
La estadística no realiza sus funciones directamente sobre las modalidades observadas, sino que
estas se representan por números y la estadística realiza sus funciones sobre esos números.
En su forma más simple, un esquema no es mas que una regla que permite organizar las
observaciones en clases de equivalencias, de manera que las observaciones que son incluidas
en la misma clase son consideradas como cualitativamente iguales y las que son incluidas en
clase diferentes son consideradas como cualitativamente diferentes. Se utiliza una clase diferente
2
por cada una de las modalidades que adopta la característica que se esta estudiando. Las clases
son mutuamente exclusivas y exhaustivas, es decir, cada observación es incluida en una y solo
una clase.
A aquellas escalas que cumplen las siguientes características se les llama escalas
ordinales. Dos objetos con el mismo numero asignado podemos concluir que presentan la
misma modalidad, pero de dos objetos a los que se han asignado números diferentes no solo
pueden decirse que son diferentes en esa característica, sino que pueden establecerse relaciones
del tipo “mayor que” o “menor que”. Es decir, que os objetos pueden ORDENARSE.
2
La limitación de las escalas ordinales es que, aunque nos informa de que un objeto presenta la
característica en cuestión en una mayor magnitud que otro objeto, no nos dice en cuanto más.
Para poder extraer conclusiones mas precisas, como las de en cuento mas presenta la
característica un objeto sobre otro, hay que contar con una unidad de medida.
2
Variables
El proceso de medición se asignan números a los objetos según unas reglas y el conjunto de
valores numéricos atribuidos a las modalidades de una característica constituyendo lo que
llamamos variable estadística.
En el caso de la psicología, esta se centra en el estudio de las variables que le son propias y que
constituyen su objeto de estudio. Por el contrario, hay veces en que una característica tiene una
única modalidad, en ese caso todas las entidades estudiadas adoptarían el mismo valor numérico
y decimos que se trata de una CONSTANTE.
Las variables cuantitativas (sean de intervalo o de razón) pueden a su vez clasificarse en
VARIABLES DISCRETAS Y VARIABLES CONTINUAS, en función del numero de valores
asumibles por ellas.
En las practica las variables continuas no pueden representarse numéricamente como tales. Los
instrumentos de medida son imprecisos y solo permiten atribuir números discretos. La medición
en la práctica supone una discretización artificial de las variables.
Las variables estadísticas se simbolizan por letras mayúsculas latinas: U, V, X, Y …,
generalmente con un subíndice, para distinguirlas de las constantes. En consecuencia, el
subíndice es un numero que nada tiene que ver con la magnitud del valor al que se esta
refiriendo, sino simplemente al lugar que dicho valor ocupa dentro de una serie de valores
https://www.youtube.com/watch?v=V5_wmR4udzs&feature=youtu.be
https://www.youtube.com/watch?v=HfeHE1TUoB4&feature=youtu.be
https://www.youtube.com/watch?v=snS-8PapBMg&feature=youtu.be
2
> > > > > > > > Unidad 2 < < <
<<<<<
Organización y representación de datos
Bibliografía: capítulo 2, “organización y representación de datos”- libro botella.
Cuando la cantidad de números recolectados es demasiado grande, se hace difícil hacer una
inspección directo que sea realmente comprensiva. Por eso el primer paso suele consistir en
reorganizar los datos utilizados un formato mas inteligible que la simple yuxtaposición de
números. Un instrumento para conseguir esa ordenación es la denominada distribución de
frecuencias y a partir de ella se puede construir representaciones graficas.
Distribucion de frecuencias:
Son agrupaciones de los datos en tablas o gráficos, para de esta forma mostrarlos en forma
resumida y organizada, obteniendo conclusiones acerca de ellos más rápida y certeramente.
Es un instrumento diseñado para cumplir tres funciones:
a) Proporcionar una reorganización y ordenación racional de los datos recogidos.
b) Ofrecer la información necesaria para hacer representaciones graficas.
c) Facilitar los cálculos necesarios para obtener los estadísticos muestrales.
Simbología:
X : es la variables con la que trabajamos y puede adoptar distintos valores X1, X2, X3, etc.
2
Las frecuencias relativa se expresan en términos porcentuales para obtenerlas basta con
multiplicar por 100 las frecuencias relativas.
A veces no surgen ciertas complicaciones a la hora de distribuir las frecuencias. Una primera
dificultad, es el excesivo número de valores distintos. Una segunda dificultad, es que hay valores
intermedios que no aparecen. El resultado en los dos casos, seria una tabla excesivamente
grande e inmanejable que difícilmente ayudaría a los objetivos para los que ha sido diseñada. En
estos casos, se aplicará lo que se denomina agrupación en intervalos, que consiste en formar
grupos de valores consecutivos, llamados intervalos y poner uno de estos grupos en cada fila. En
la distribución de frecuencias con valores agrupados en intervalos aparecen algunos elementos
nuevos:
Intervalo: se lo llama a cada uno de los grupos de valores que ocupan una fila en una
distribución de frecuencias. También pueden ser llamados clases.
Limites aparentes o informados: es un intervalo de valores mayor y menos que
puede adoptar la variable dentro de ese intervalo, según el instrumento de medida
utilizado.
Limites exactos: se lo llama a un intervalo a los valores máximos y mínimos incluidos
en el intervalo y que podrían medirse si se contara con un instrumento de precisión
perfecta.
Punto medio: es la suma de sus limites exactos partidos por dos. Se puede llamar
“marca de clase”
2
Amplitud: es la diferencia entre su limite exacto superior y su limite exacto inferior.
Suele representarse por la letra I.
Para hacer una distribución de frecuencias no hay unas normas muy rigurosas. Pero
plantearemos tres:
a) El intervalo superior debe incluir al mayor valor observado.
b) El intervalo inferior debe incluir al menor valor observado.
c) Cada intervalo debe incluir el mismo numero de valores.
Y también algunas directrices:
1) Dado que el objetivo de una distribución de frecuencias es conseguir una ordenación
manejable que ayude a comprender el significado de los datos, no es conveniente que el
numero de intervalos sea demasiado grande.
2) Como consecuencia de lo anterior, podemos sentirnos inclinados a reducir al máximo el
número de intervalos, pero los intervalos tendrían una excesiva amplitud.
Lo que podemos decir es que el numero apropiado de intervalos debe ser tal que, con ellas se
consiga una agrupación operativa y que cumpla los objetivos para los que ha sido diseñada la
distribución de frecuencias.
Representaciones graficas:
2
A partir de las distribuciones de frecuencias se pueden construir representaciones graficas. La
función, es dar informaciones globales mediante un solo golpe de vista.
Diagrama de barras: se utiliza para variables cuantitativas discretas. Ene el eje de abscisas
distintos valores de la variable y en el eje de ordenadas
las frecuencias.
2
Poligono de frecuencias: se utiliza para variables discretas. Es una figura que
resulta de unir los extremos superiores de las que hubiera sido las barras.
2
Tendencia central: se refiere a la
magnitud general de las observaciones
hechas. Pueden cuantificarse mediante
INDICES DE TENDENCIA CENTRAL O
PROMEDIOS.
2
Links de los videos de la catedra unidad 2:
https://www.youtube.com/watch?v=sJX0KBMaSMk&feature=youtu.be
https://www.youtube.com/watch?v=2gj3MLW0vlY&feature=youtu.be
https://www.youtube.com/watch?v=hcC7Cw3e2vg&feature=youtu.be
unidad 3:
https://www.youtube.com/watch?v=t9saRunwPoQ&feature=youtu.be
https://www.youtube.com/watch?v=gDfmcWvTNw8&feature=youtu.be
https://www.youtube.com/watch?v=qS9ulvsRtzo&feature=youtu.be
https://www.youtube.com/watch?v=bAjAjxdoHd8&feature=youtu.be
https://www.youtube.com/watch?v=TzrPkF1izGU&feature=youtu.be
https://www.youtube.com/watch?v=HKlzfKMRWMY&feature=youtu.be
https://www.youtube.com/watch?v=TRjGzSNERFc&feature=youtu.be
> > > > > > > > Unidad 3 < < < <
<<<<
Resúmenes estadísticos en los distintos niveles de medición
Bibliografía:
Capítulo 3 de Botella (Hasta punto 3.3.3 inclusive).
Capítulo 4 de Botella (Hasta punto 4.5 inclusive).
Capítulo 5 de Botella (Hasta punto 5.2.3 inclusive).
Capítulo 6 de Botella (Puntos 6.1 y 6.2).
Capítulo 7 de Botella (Hasta punto 7.3 inclusive).
Coeficiente de Variación según Botella.
resumenes estadisticos: sirve para describir lo que paso en la muestra con respecto a la
variable que nos interesa estudiar.
La distribución de los casos de una muestra con respecto a los valores de una variable
(distribución de frecuencias de una variable) tiene distintas propiedades o características
que vamos a querer describir.
Los resúmenes estadísticos describen casa una de estas características de las muestras.
La variabilidad del conjunto de datos: esta propiedad nos indica cuanto difiere los
valores entre si. Y refiere al grado de concentración de las observaciones.
Menos variabilidad: mayor concentración de los casos en uno o unos pocos calores de la
variable. Los casos son más homogéneos o parecidos entre si con respecto a la variable
estudiada.
2
Mas variabilidad: mayor dispersión de los casos en el recorrido de los valores de la
variable. Los casos son más homogéneos o diferentes entre si con respecto a la variable
estudiada.
2
3. Si sumamos una constante a un conjunto de puntuaciones, la media quedara aumentada
en esa misma constante.
5. Otro método, nos permite calcular la media del grupo total, a partir del conocimiento de las
media de cada uno de los grupos parciales y de sus tamaños. La formula puede
denominarse media ponderada: la media de un grupo de puntuaciones, cuando se
conocen los tamaños y medias de varios subgrupos hechos a partir del total, mutuamente
exclusivos y exhaustivos, pueden obtenerse ponderando las medias parciales a partir de
los tamaños de los subgrupos en que han sido calculadas.
6. Una variable definida como la combinación lineal de otras variables, tiene como media la
misma combinación lineal de las medias de las variables intervinientes en su definición.
2
Hay tres situaciones en las que se preferirá la mediana a la media:
Cuando la variable esta medida en una escala ordinal
Cuando haya valores extremos que distorsionen la interpretación de la media. La
media es extremadamente sensible a la puntuación y un cambio en solo una de
ellas supone un cambio en la media aritmética.
Cunado haya intervalos abiertos. Se refiere a situaciones en las que el intervalo
superior carece de limite superior, el intervalo inferior carece de limite inferior o
ambas cosas a la vez.
Pero no siempre se puede utilizar la mediana. A veces se presenta casos en los que es mas
apropiado utilizar la moda. Se puede decir en regla general, que la mediana será la segunda
candidata para representar la tendencia central.
¿Qué razones pueden hacernos preferir la moda sobre la mediana?
a) Cuando se trate de una variable medida en una escala nominal.
b) Cuando haya intervalos abiertos y la mediana pertenezca a uno de ellos. La formula de los
centiles supone un distribución homogénea de los valores dentro del intervalo. Esto puede
hacerse solo si el intervalo esta cerrado.
Medidas de variabilidad:
Una de las propiedades mas importantes de los conjuntos de datos es el grado en que
estos se parecen o se diferencian entre sí. Esta propiedad se denomina variabilidad,
dispersión u homogeneidad.
La tendencia central y la variabilidad son propiedades diferentes y puede haber grupos de
datos con la misma tendencia central y diferente variabilidad y viceversa. Se trata de medir
el grado de variación que hay en un conjunto de datos.
Al estudiante de psicología, la variabilidad de los datos esta reflejando el hecho
incuestionable de las diferencias individuales y estas con uno de los objetos primordiales.
Procedimientos para cuantificar la variabilidad:
La varianza sirve sobre todo para comparar el grado de dispersión de dos o mas
conjuntos de valores en una misma variable. No tiene sentido comparar varianzas
halladas sobre variables distintas.
Desviacion tipica: se calcula la raíz cuadrada de la cantidad obtenida y se
define sencillamente como la raíz cuadrada de la varianza.
2
La desviación típica en un mejor descriptor de la variabilidad.
Segunda propiedad:
Tercera propiedad:
Cuarta propiedad:
2
Otras medidas de variacion:
Una forma de sencilla de indicar el grado de dispersión consiste en calcular la distancia entre el
mayor y el menor de los valores observados. Este índice se llama amplitud total, rango o
recorrido y se obtiene sencillamente hallando la diferencia entre los valores extremos.
Otra medida, consiste en tomar las desviaciones con respecto a la meida o puntuaciones
diferenciales, en valor absoluto. Este índice se llama desviación media (DM):
Cuando en las puntuaciones hay algún valor extremo que pudiera distorsionar la
representatividad de la varianza, se puede utilizar otro índice, basado solo en las puntuaciones
correspondientes a los cuartiles primero y tercero. Se denomina Amplitud semi-intercuartil:
2
Medidas de Asimetría y Curtosis
Tal como lo plantea Botella, además de la tendencia central y la variabilidad, hay otras dos características
con las que se pueden describir y comparar las distribuciones de frecuencias.
Estas dos medidas se refieren a la forma que toma la representación gráfica de la distribución de frecuencias.
Asimetria:
El grado de asimetría de una distribución hace referencia al grado en que los datos se reparten
equilibradamente por encima y por debajo de la tendencia central.
Es importante tener en cuenta que el índice de asimetría se basa en la relación entre la media y la moda y se
define como la distancia entre la media y la moda medida en desviaciones típicas. Es decir:
AS=(media-moda)/desviación típica.
Como ejemplo de dos distribuciones asimétricas podríamos pensar que:
Si un examen (evaluado con calificaciones del 1 al 10) resultó muy fácil abundarán las notas altas y la
representación gráfica quedará inclinada hacia la derecha. En este caso, el índice de asimetría es negativo,
ya que la media es inferior a la moda. Por lo tanto, en esta distribución, los valores de la variable
“calificaciones obtenidas en el examen” tienden a agruparse por encima de la media.
Si, por el contrario, el examen resultó difícil abundarán las notas bajas y la representación gráfica quedará
inclinada hacia la izquierda. En este caso, el índice de asimetría será positivo, ya que la media será mayor
que la moda. Por lo tanto, en esta distribución, los valores de la variable “calificaciones obtenidas en el
examen” tienden a agruparse por debajo de la media.
Por otra parte, si una distribución es simétrica sus frecuencias se reparten equitativamente alrededor de la
media. En una distribución simétrica coinciden la media y la moda y el índice de asimetría es igual a 0.
Una distribución simétrica sólo es posible en distribuciones unimodales (con una sola moda). En este tipo de
distribuciones, los valores de la variable tienden a agruparse en torno de la media
Curtosis
La curtosis expresa el grado de apuntamiento de la curva que representa gráficamente a la distribución de
frecuencias.
A mayor curtosis, mayor apuntamiento de la curva que representa gráficamente la distribución de
frecuencias. Por lo tanto, en la medida que una distribución presente un grado de apuntamiento mayor,
mayor será la homogeneidad entre los valores de la variable y menor será la variabilidad entre los
mismos.
A menor curtosis, menor apuntamiento de la curva que representa gráficamente la distribución de
frecuencias. Por lo tanto, en la medida en que una distribución presente un grado de apuntamiento menor,
menor será la homogeneidad, los valores de la variable serán más heterogéneos y habrá mayor variabilidad
entre los mismos.
2
Si el índice de curtosis es igual a 0, la curva tendrá un grado de curtosis similar al de la distribución normal
y, según la terminología de Pearson, se dice que es mesocúrtica.
Si este índice es positivo, el apuntamiento de la curva es mayor que el de una distribución normal y se
dice que es una distribución leptocúrtica.
Por último, si este índice es negativo, el apuntamiento de la curva que representa la distribución de
frecuencia es menor que el de la distribución normal y se trata de una distribución platicúrtica.
2
procedimiento consiste en transformar las puntuaciones típicas en otras que retengan
todas las relaciones que manifiestan las puntuaciones originales, por tanto que sean
puntuaciones equivalentes, pero evitando la dificultad operativa, y que constituyen lo que
se denomina una escala derivada. Estas transformaciones se basan en una propiedad de
las puntuaciones típicas.
En resumen la construcción de una escala derivada parte de unas puntuaciones directas,
éstas se tipifican, y después se transforman linealmente en otras puntuaciones.
La cuestión fundamental de las escalas derivadas consiste en transformar las
puntuaciones originales, Xi, en otras puntuaciones transformadas, Ti, tales que sean más
cómodas de tratar e interpretar, pero que a la vez retengan las relaciones comerciales
entre los valores, es decir, que sean puntuaciones equivalentes.