Está en la página 1de 10

ESTADÍSTICA APLICADA A LA PSICOLOGÍA

ORÍGENES, CARACTERÍSTICAS Y APLICACIÓN DE LA ESTADÍSTICA


Desde tiempos remotos los seres humanos se han valido de instrumentos para remediar las
limitaciones de sus sentidos e inventaron una técnica adecuada para vencer la incapacidad de su
mente de cuantificar fenómenos colectivos. Esta técnica que permite el conocimiento de tales
fenómenos es la Estadística.

La palabra Estadística deriva de la voz latina status que en el latín medieval significaba “estado
político”. La Estadística se configura a lo largo de los siglos como una serie de herramientas que
pretendían dar respuesta a necesidades y problemas provenientes de la Ciencia, del Estado o de
ambos. Mayormente para censos.

Pueden agruparse estas necesidades en tres grandes bloques, correlativos en el tiempo en


cuanto a su origen, pero que en su devenir fueron interceptándose:
1. Enumerar, inventariar, administrar.
2. Medir, describir, comparar, resumir.
3. Predecir, dominar la incertidumbre.

Los modelos estadísticos nacen de la Matemática, pero esto no debe asustar a nadie, puesto que
lo que hay que saber muy bien en Estadística son los fundamentos lógicos, los razonamientos y
los modelos estadísticos que subyacen a los cálculos.

Por Estadística entendemos los métodos científicos por medio de los cuales podemos recolectar,
organizar, resumir, presentar y analizar datos numéricos relativos a un conjunto de individuos u
observaciones y que nos permiten extraer conclusiones válidas y efectuar decisiones lógicas,
basadas en dichos análisis.

Asimismo, puede definirse como la ciencia que tiene por objetivo realizar inferencias basadas en
datos, para lo cual proporciona técnicas de recolección, resumen y presentación de éstos, como
así también permite cuantificar el error cometido en dicho proceso de inferencia. La Estadística
brinda los procedimientos para obtener y resumir información en la toma de decisiones.

Utilizamos la Estadística para estudiar aquellos fenómenos en los que tenemos una gran cantidad
de observaciones y cuya aparición se rige por leyes del azar o aleatorias. La aplicación de la
Estadística tiene lugar porque los fenómenos de algunas ciencias no se dan siempre iguales entre
sí exactamente, sino que presentan variaciones. Estas pequeñas diferencias son debidas a una
serie de causas tan numerosas y complejas que no podemos determinarlas por separado y que
las incluimos dentro del nombre común de azar.

La inferencia estadística propociona un auxilio fundamental en una gran variedad de campos de


investigación en los que se trabaja con observaciones y se pretende tomar decisiones fundadas
en la información contenida en dichas observaciones, de ahí su escencia interdisciplinaria.

Cuando se quiere estudiar una característica de un grupo, este grupo en total es la población, por
ej.: habitantes de la ciudad de Rosario. Generalmente si la población es muy grande, no se puede
estudiar a todos los individuos y se toma a un subgrupo que se denomina muestra, por ej.:
habitantes de cinco barrios de la ciudad de Rosario. La poblacion puede ser finita o infinita.
Si estudiamos una característica de un grupo, sea en una población o en una muestra y lo
describimos sin sacar de ello conclusiones, estamos en la etapa de la Estadística Descriptiva.

Si estudiamos en una muestra una característica cualquiera e infermos, a partir de los resultados
obtenidos en la muestra, conclusiones sobre la población correspondiente, estamos haciendo
Estadística Inferencial y como estas inferencias no pueden ser exactamente ciertas aplicamos el
lenguaje probabilístico para sacar las conclusiones.

EL PROCESO DE MEDICIÓN, VARIABLES Y NIVELES DE MEDICIÓN


VARIABLE: Una variable es una cualidad, propiedad o característica de personas o cosas que es
dinámica (cambia) y que puede ser estudiada (medida). Pueden clasificarse en:
● Cualitativas: son aquellas que clasifican a las unidades en categorías. Puden ser
nominales u ordinales. Las nominales no tienen un orden determinado, ejemplo: sexo,
lengua materna. Las ordinales tienen un orden natural, ejemplo: nivel academico
alcanzado.
● Cuantitativas: son aquellas cuyos valores provienen de mediciones o conteos. Se clasifican
en continuas (pueden asumir cualquier valor, medidas de peso, altura) o discretas (la
unidad de medida no es divisible, solo numeros enteros ej, numeros de hijos por familia).
¿QUÉ SIGNIFICA MEDIR?
La medición puede definirse como el proceso de vincular conceptos abstractos con indicadores
empíricos, el cual se realiza mediante un plan explícito y organizado para clasificar (y con
frecuencia cuantificar) los datos disponibles (los indicadores), en términos del concepto que el/la
investigador/a tiene en mente. Medir incluye dos consideraciones:
● La primera es desde el punto de vista empírico y se resume en que el centro de atención
es la respuesta observable; sea una alternativa de respuesta marcada en un cuestionario,
una conducta registrada mediante observación, un valor de un instrumento y su
interpretación o una respuesta dada a un/a entrevistador/a.
● La segunda es desde una perspectiva teórica y se refiere a que el interés se sitúa en el
concepto subyacente no observable que se representa por medio de la respuesta. Así, los
registros la medición representan valores visibles de conceptos abstractos.
CARACTERISTICAS DEL PROCESO DE MEDICION:
Un proceso de medición adecuado es aquel que registra datos observables que representan
verdaderamente los conceptos o las variables que el/la investigador/a tiene en mente. En términos
cuantitativos: capturo verdaderamente la “realidad” que deseo capturar. La función de la medición
es establecer una correspondencia entre el “mundo real” y el “mundo conceptual”. El primero
provee evidencia empírica, el segundo proporciona modelos teóricos para encontrar sentido a ese
segmento del mundo real que estamos tratando de describir. Al medir estandarizamos y
cuantificamos los datos.
Existen tres cuestiones básicas respecto a las variables que deben considerarse al momento del
proceso de medición: La operacionalización, la codificación y establecer los niveles de medición

OPERACIONALIZACIÓN:
El paso de una variable teórica a indicadores empíricos verificables y medibles e ítems o
equivalentes se denomina operacionalización. La operacionalización se fundamenta en la
definición conceptual y operacional de la variable. En el proceso de medición lo más lógico es
transitar de la variable a sus dimensiones o componentes, luego a los indicadores y finalmente a
los ítems o reactivos y sus categorías. Por ejemplo, la variable síndrome de burnout se define
conceptualmente como un estado de agotamiento físico, emocional y mental que está vinculado
con el ámbito laboral. Es una variable multidimensional; una de sus dimensiones es el cansancio
emocional. Puede operacionalizarse a partir de indicadores empíricos en ítems en nuestro
instrumento de medición. De este modo le preguntaremos a lxs participantes de nuestra
investigación si se sienten emocionalmente agotados por su trabajo, si se sienten frustrados en su
trabajo, si trabajar en atención al público les produce estrés

CODIFICACIÓN;
Codificar los datos significa asignarles un valor numérico o símbolo que los represente. Es decir, a
las categorías (opciones de respuesta o valores) de cada ítem o variable se les asignan valores
numéricos o signos que tienen un significado. La codificación es necesaria para analizar
cuantitativamente los datos (aplicar análisis estadístico). A veces se utilizan letras o símbolos en
lugar de números (*, A, Z). Asimismo, es muy importante indicar el nivel de medición de cada ítem
y, por ende, el de las variables, porque es parte de la codificación y dependiendo de dicho nivel se
selecciona uno u otro tipo de análisis estadístico. De esta forma, es necesario hacer una relación
de variables, ítems y niveles de medición.

NIVELES DE MEDICIÓN:
Existen cuatro niveles de medición ampliamente conocidos:
- CUALITATIVAS:
● Nivel de medición nominal: en este nivel hay dos o más categorías del ítem o la variable.
Las categorías no tienen orden ni jerarquía. Lo que se mide (por ej., objeto, persona) se
coloca en una u otra categoría, lo cual indica tan sólo diferencias respecto de una o más
características. Ninguna de las categorías implica mayor jerarquía que la otra. Las
categorías únicamente reflejan diferencias en la variable. No hay orden de mayor a menor.
Los números utilizados en este nivel de medición tienen una función puramente de
clasificación y no se pueden manipular de manera aritmética. Las variables nominales
pueden incluir dos categorías (dicotómicas), por ej. tipo de escuela a la que se asiste
(privada-pública); o bien, tres o más categorías (categóricas), por ej. nacionalidad
(argentina, chilena, uruguaya).
● Nivel de medición ordinal: en este nivel hay varias categorías, pero además mantienen un
orden de mayor a menor. Las etiquetas o los símbolos de las categorías sí indican
jerarquía. Sin embargo, las categorías no están ubicadas a intervalos iguales (no hay un
intervalo común). Por ej., la variable posición jerárquica en una empresa. En este caso, el
presidente (10) es más que el vicepresidente (9); éste, más que el director general (8); a su
vez este último, más que el gerente (7) y así sucesivamente; pero no se precisa en cada
caso cuánto más. Tampoco pueden utilizarse las operaciones aritméticas básicas: no
podríamos decir que 4 (empleado A) + 5 (jefe) = 9 (vicepresidente), ni que 10 (presidente)
÷ 5 (jefe) = 2 (empleado C). Sería absurdo, no tiene sentido. Otros ejemplos pueden ser: el
nivel educativo; el nivel socioeconómico.
- CUANTITATIVAS:
● Discretas: aquellas la cual la unidad de medida no es divisible, solo numeros enteros. Ej;
cantidad de hijos (3 hijos, no 2 y medio)
● Continuas: aquellas que pueden asumir cualquier valor dentro de los numeros reales, es
decir que puede tener decimales. Ej; el peso, la altura se puede expresar en decimales
1.67 cm o 56, 8 kg.
● Dicotomicas: solo puede tener dos valores. Ej; come carne? si/no.
● Nivel de medición por intervalos: pueden ser discretas o continuas. además del orden o la
jerarquía entre categorías, se establecen intervalos iguales en la medición. Las distancias
entre categorías son las mismas a lo largo de toda la escala, por lo que hay un intervalo
constante, una unidad de medida. En este nivel de medición el cero (0) es arbitrario, no es
real, ya que se asigna arbitrariamente a una categoría el valor de cero y a partir de ésta se
construye la escala. Por ejemplo: temperatura, que puede medirse en grados centígrados y
Fahrenheit: el cero es arbitrario, pues no implica que en realidad haya cero (ninguna)
temperatura (incluso en ambas escalas el cero es diferente). Cabe agregar que diversas
mediciones en ciencias sociales no son verdaderamente de intervalo (por ejemplo, escalas
de actitudes, pruebas de inteligencia y de otros tipos); pero para algunxs autores se
acercan a este nivel y se suele tratarlas como si fueran mediciones de intervalo. Esto se
hace porque este nivel de medición permite utilizar las operaciones aritméticas básicas y
diversos métodos estadísticos, que de otro modo no se utilizarían. Aunque algunxs
investigadores no están de acuerdo con suponer tales mediciones como si fueran de
intervalo.
● Nivel de medición de razón: pueden ser discretas o continuas. En este nivel, además de
tenerse todas las características del nivel de intervalos (unidad de medida común,
intervalos iguales entre las categorías y aplicación de operaciones aritméticas básicas y
sus derivaciones), el cero es real y absoluto (no es arbitrario). Cero absoluto implica que
hay un punto en la escala donde está ausente o no existe la propiedad medida. Por
ejemplo: peso, altura, número de hijxs, ingresos en una unidad monetaria (alguien puede
tener cero ingresos), consumo de un medicamento específico, etc.

POBLACIÓN, MUESTRA Y UNIDAD DE ANÁLISIS

Para seleccionar una muestra (n), lo primero que hay que hacer es definir la unidad de muestreo o
unidad de análisis, es decir ¿qué o quiénes serán medidos?: individuos, objetos, sucesos o
colectividades de estudio (casos o elementos). Una vez definida la unidad de muestreo o unidad
de análisis se delimita la población (N), teniendo en cuenta que sus elementos deben compartir
características de contenido, lugar y tiempo.

La muestra es un subgrupo de la población de interés sobre el cual se recolectarán datos, tiene


que definirse y delimitarse de antemano con precisión, además de que debe ser representativo de
la población. El/la investigador/a pretende que los resultados encontrados en la muestra se
generalicen o extrapolen a la población. El interés es que la muestra sea estadísticamente
representativa.

Llamamos población o universo (N) al conjunto de todos los casos que concuerdan con
determinadas especificaciones, por ej.: adolescentes de la ciudad de Rosario. Los valores
estadísticos que se obtienen estudiando poblaciones completas se denominan parámetros.

Mientras que la muestra (n) es, en esencia, un subgrupo de la población. Es un subconjunto de


elementos que pertenecen a ese conjunto definido en sus características al que llamamos
población, un subgrupo del universo o población del cual se recolectan los datos y que debe ser
representativo de ésta, por ej.: adolescentes de una escuela pública y una escuela privada de la
ciudad de Rosario. Se toma una muestra para ahorrar recursos y tiempo; para poder extrapolar
nuestras conclusiones a una población y sistematizar la toma de datos. Los valores que se
obtienen de las muestras se llaman estadísticos.

PARÁMETROS Y ESTADÍSTICOS
La estadística permite la estimación confiable de parámetros de una población gracias al
conocimiento de los estadísticos obtenidos de una muestra, siempre que la muestra sea
representativa de la población.

MUESTREOS PROBABILÍSTICOS Y NO PROBABILÍSTICOS


En las muestras probabilísticas, todos los elementos de la población tienen la misma posibilidad
de ser escogidos para la muestra (principio de equiprobabilidad de sujetos). Se obtienen
definiendo las características de la población y el tamaño de la muestra, y por medio de una
selección aleatoria o mecánica de las unidades de muestreo o de análisis en donde se puede
calcular el denominado error muestral. Suelen ser de gran tamaño y resultan esenciales cuando
se buscan estimaciones de una población.
En este tipo de muestras necesitamos una muestra (n) que sea representativa del universo o
población (N) con cierto nivel de confianza (que se pretende maximizar) y cierta posibilidad de
error (que se pretende minimizar). Para determinar el tamaño muestral, se debe considerar: el
nivel de confianza, es decir probabilidad de “acierto” de que la muestra sea representativa; el error
muestral, es decir probabilidad de error de que la muestra no se representativa y el nivel de
heterogeneidad de la población.

En las muestras no probabilísticas, la elección de los elementos no depende de la probabilidad,


sino de causas relacionadas con las características de la investigación o los propósitos de quien
investiga. Aquí el procedimiento no es mecánico ni se basa en fórmulas de probabilidad, sino que
depende del proceso de toma de decisiones de quien investiga y, desde luego, las muestras
seleccionadas obedecen a otros criterios de investigación. Suelen ser de un tamaño menor a las
muestras probabilísticas, no permiten calcular el error muestral y tampoco generalizar.

La ventaja de una muestra no probabilística es su utilidad para determinados diseños de estudios


que requieren no tanto una “representatividad” de elementos de una población, sino una
cuidadosa y controlada elección de casos con ciertas características especificadas previamente
en el planteamiento del problema de investigación.

MUESTREOS PROBABILÍSTICOS
● Muestreo aleatorio simple: una muestra aleatoria simple es seleccionada de tal manera
que cada elemento (unidad de análisis) en la población tiene que tener la misma
probabilidad de ser seleccionado. Por ejemplo, numerando todos los elementos muestrales
de la población, del uno al número N. Después se hacen fichas o papeles, uno por cada
elemento, se revuelven en una caja y se van sacando n número de fichas, según el
tamaño de la muestra. Los números elegidos al azar conformarán la muestra.
● Muestreo aleatorio sistemático: consiste en extraer elementos de una población mediante
una regla previamente creada, que se aplica sistemáticamente hasta obtener el total
definido. La regla se define del siguiente modo: se divide el número total de unidades de
análisis presentes en la población (N) por el número de unidades que deberá contener la
muestra (n), obteniéndose el número a aplicar (k). Se elige el primer elemento (caso) al
azar y, a partir de él, se aplica la regla. Por ejemplo: 60 (N)/12 (n) = 5 (k), “Se elige un
sujeto cada 5 personas, de una población de 60 sujetos, para conformar una muestra de
12 sujetos”.
● Muestreo aleatorio estratificado: se divide a la población en un determinado número de
estratos (grupos) con el fin de asegurarse que en la muestra final todos puedan estar
representados. Cada estrato es internamente homogéneo y externamente heterogéneo.
Por ej., religión (católicos, judíos, protestantes, etc.). La muestra se conforma a partir de la
selección de n unidades de cada estrato, cada estrato funciona de modo independiente,
pudiendo aplicarse al interior del mismo un muestreo aleatorio simple o sistemático; no hay
necesidad de que cada estrato tenga la misma cantidad de unidades.

● Muestreo aleatorio por conglomerados, clusters o racimos : se utiliza cuando la población


se encuentra dividida en grupos o espacios físicos o geográficos que se supone que
contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a
ciertas características. Sólo se seleccionan algunos conglomerados, y de los
conglomerados seleccionados se eligen los elementos muestrales que integrarán la
muestra final. Por ejemplo: para conformar una muestra nacional de ciudadanxs de un país
por conglomerados, clusters o racimos se elige al azar una muestra de provincias; cada
provincia se convierte en un universo y se seleccionan al azar municipios; cada municipio
se considera un universo y se eligen al azar barrios; cada uno se concibe como universo y
de nuevo, al azar, se eligen manzanas o cuadras; por último, se escogen al azar viviendas
u hogares e individuos.
● Marco muestral: consiste en un marco de referencia que nos permite identificar físicamente
los elementos de la población, la posibilidad de enumerarlos y, por ende, de seleccionar
los casos de la muestra. Normalmente se trata de un listado existente o una lista que es
necesario confeccionar ad hoc, con los casos de la población. Por ejemplo, guías
telefónicas, listas de miembros de asociaciones, directorios especializados, listas oficiales
de escuelas de determinada zona, clientes de una empresa, registros médicos, etc.

MUESTREOS NO PROBABILÍSTICOS
● Muestreo por conveniencia o disponibilidad: quien investiga selecciona directa e
intencionadamente a los individuos de la población. El caso más frecuente de este
muestreo es utilizar como muestra a los individuos a los que se tiene fácil acceso. Por
ejemplo, lxs profesores universitarixs emplean con mucha frecuencia a sus propixs
alumnxs.
● Muestreo intencional: se caracteriza por un esfuerzo deliberado de obtener
representatividad mediante la inclusión de individuos supuestamente típicos. Es un
muestreo frecuentemente utilizado cuando se hacen estudios con poblaciones minoritarias
(sectas, determinados tipos de enfermos, etc.) y es muy frecuente también en sondeos
pre-electorales.
● Muestreo bola de nieve: se localiza a algunos individuos con características deseadas, los
cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra de tamaño
suficiente. Luego de observar al primer sujeto, quien investiga le pide ayuda para contactar
a otras personas que tengan un rasgo de interés similar.
¿CUÁL ELEGIR?
Elegir entre una muestra probabilística o una no probabilística depende del planteamiento del
problema, las hipótesis, el diseño y el alcance de la investigación. Ya sea que se trate de un tipo
de muestreo u otro, lo importante es elegir a los casos adecuados, de acuerdo con el
planteamiento del problema y lograr el acceso a ellos.

ESTADÍSTICA DESCRIPTIVA I: DISTRIBUCIÓN DE FRECUENCIAS Y MEDIDAS DE


TENDENCIA CENTRAL
¿QUÉ SON LOS DATOS?
Son las mediciones de las variables en estudio, expresadas en forma numérica, que se obtienen
de los/as participantes de la investigación. Se organizan mediante una matriz o base de datos,
organizada de forma bidimensional en filas y columnas. En las columnas se colocan las variables
relevadas. En las filas se colocan las unidades de análisis o casos.

MATRIZ DE DATOS
Una vez que los datos se han codificado, transferido a una matriz, guardado en un archivo y
“limpiado” los errores, el/la investigador/a está en condiciones de comenzar a analizarlos mediante
la Estadística.

ESTADÍSTICA DESCRIPTIVA
Lo primero que se realiza con los datos es describir los valores o las puntuaciones obtenidas para
cada variable en la muestra bajo estudio, a partir de una serie de medidas numéricas
(estadísticos), tablas y gráficos, a saber:
● Distribuciones de frecuencias
● Medidas de tendencia central
● Medidas de dispersión de los datos
● Medidas de posición no central
● Medidas de forma

DISTRIBUCIÓN DE FRECUENCIAS
Es un conjunto de puntuaciones respecto de una
variable, ordenadas en sus respectivas
categorías y presentadas en una tabla. Por
ejemplo:

Las tablas de frecuencias pueden incluir distintos valores:


● Frecuencia absoluta: cantidad de veces que aparece la
observación en la distribución.
● Frecuencia relativa: cociente entre la frecuencia absoluta
y el N total de datos. 15%60 en el primer caso
● Frecuencia porcentual: frecuencia relativa expresada
como porcentaje (FR x 100). 15 x 100 %60 porcentaje en
el primer caso

DISTRIBUCIÓN DE FRECUENCIAS Y GRÁFICOS


Las distribuciones de frecuencias pueden presentarse en forma gráfica. El gráfico debe agregar
información sustancial o clarificar los resultados. En general, cuando se trata de información
cuantitativa, una tabla puede ofrecer más precisión que un gráfico.
Para elegir el gráfico es imprescindible considerar el nivel de medición de la variable.
Los gráficos más utilizados para resumir variables cualitativas son el diagrama de sectores
circulares (“gráfico de torta”) y el gráfico de barras. Los gráficos más utilizados para resumir
variables cuantitativas son el gráfico de frecuencias, el diagrama de tallo y hojas, el diagrama de
caja y bigotes (box plot) y el histograma. EJEMPLOS DE GRÁFICOS:
MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central son puntos en una distribución obtenida, los valores medios o
centrales de ésta, y nos ayudan a ubicarla dentro de la escala de medición de la variable
analizada. El nivel de medición de la variable determina cuál es la medida de tendencia central
apropiada para interpretar. Las principales medidas de tendencia central son tres:

MEDIA
Es el promedio aritmético de una distribución, es la suma de todos los valores dividida entre el
número de casos. Es una medida solamente aplicable a mediciones por intervalos o de razón. En
ocasiones se acepta para variables ordinales. Carece de sentido para variables medidas en un
nivel nominal. Resulta sensible a valores extremos.

MEDIANA
Es el valor que divide la distribución por la mitad, refleja la posición intermedia de la distribución
ordenada de menor a mayor, parte a la
distribución en dos mitades. Es una medida
de tendencia central propia de los niveles de
medición ordinal, por intervalos y de razón.
Es particularmente útil cuando hay valores
extremos en la distribución, no es sensible a éstos.

MODA
Es la categoría o puntuación que ocurre con
mayor frecuencia. Se utiliza con cualquier nivel de
medición. Si varios valores comparten la mayor
frecuencia, cada uno es una moda.
ESTADÍSTICA DESCRIPTIVA II: MEDIDAS DE DISPERSIÓN, DE POSICIÓN NO CENTRAL Y
DE FORMA

MEDIDAS DE DISPERSIÓN
Las medidas de la variabilidad indican la dispersión de los datos en la escala de medición de la
variable considerada. Las medidas de tendencia central son valores en una distribución y las
medidas de la variabilidad son intervalos que designan distancias o un número de unidades en la
escala de medición. Las medidas de dispersión más utilizadas son:
● Rango
● Desviación estándar
● Varianza

RANGO: Es la diferencia entre la puntuación mayor y la puntuación menor, e indica el número de


unidades en la escala de medición que se necesitan para incluir los valores máximo y mínimo.
Cuanto más grande sea el rango, mayor será la dispersión de los datos de una distribución.
Por ejemplo: 13 18 24 36 77 85, 85 - 13 = 72, Rango = 72

DESVIACIÓN ESTÁNDAR (DE, DS o DT): Es el promedio de desviación de las puntuaciones con


respecto a la media. Es la raíz cuadrada positiva de la varianza. Esta medida se expresa en las
unidades originales de medición de la distribución. Se interpreta en relación con la media. Si el
DE es mayor a la mitad de la media, la variación o dispersión es importante. A la inversa, si es
menor a la mitad de la media la variación o dispersión es baja. Cuanto mayor sea la dispersión de
los datos alrededor de la media, mayor será la desviación estándar. La desviación estándar se
interpreta como cuánto se desvía, en promedio, de la media un conjunto de puntuaciones.

VARIANZA: Es la desviación estándar elevada al cuadrado. La varianza siempre será mayor que
cero. Cuanto más se aproxima la varianza a cero, más concentrados están los valores alrededor
de la media. A mayor varianza, mayor dispersión. Con fines descriptivos se utiliza
preferentemente la desviación estándar.

MEDIDAS DE POSICIÓN NO CENTRAL: Permiten dividir la distribución en un determinado


número de segmentos, facilitando la ubicación de un sujeto o caso sobre un conjunto de datos.
Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a
mayor (variables al menos ordinales). Las medidas de posición no central son:
● Cuartiles(Q): son los 3 valores de la variable que dividen a un conjunto de datos ordenados
en 4 partes iguales. Q1, Q2 y Q3 corresponden al 25%, al 50% y al 75% de los datos
respectivamente.
● Deciles(D): son los 9 valores que dividen la serie de datos en 10 partes iguales. Cada uno
de ellos concentra el 10% de los datos. Los deciles representan los valores
correspondientes al 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% y 90% de los datos.
● Percentiles(P): son los 99 valores que dividen la serie de datos en 100 partes iguales.
Cada uno concentra el 1% de los datos. Los percentiles dan los valores correspondientes
al 1%, al 2%... y al 99% de los datos.
El Q2, el D5 y el P50 coinciden con la mediana

MEDIDAS DE FORMA: Las medidas de forma nos permiten comprobar la forma que presenta la
distribución de los datos, es decir, la forma en que se separan o aglomeran los valores de acuerdo
a su representación gráfica. Sus principales medidas son:
Asimetría y Curtosis.
Estas estadísticas se usan para conocer cuánto se parece una distribución a la distribución teórica
llamada curva normal o campana de Gauss. La asimetría y la curtosis requieren al menos un nivel
de medición por intervalos. CAMPANA DE GAUSS:

ASIMETRÍA: Es una estadística necesaria para conocer cuánto se parece nuestra distribución a
una distribución teórica llamada curva normal y constituye un indicador del lado de la curva donde
se agrupan las frecuencias:
● Si es cero (asimetría = 0), la curva o distribución es simétrica.
● Cuando es positiva, quiere decir
que hay más valores agrupados
hacia la izquierda de la curva (por
debajo de la media).
● Cuando es negativa, significa que
los valores tienden a agruparse
hacia la derecha de la curva (por
encima de la media).

CURTOSIS: Es un indicador de lo plana o “picuda” que es una curva:


● Cuando es cero (curtosis = 0), significa que puede tratarse de una curva normal.
● Si es positiva, quiere decir que la curva, la distribución o el polígono es más “picudo” o
elevado.
● Si es negativa, indica que es más plana la curva.
Se definen 3 tipos de distribuciones según su grado de curtosis:
● Distribución mesocúrtica: presenta un
grado de concentración medio alrededor de
los valores centrales de la variable
(distribución normal).
● Distribución leptocúrtica: presenta un
elevado grado de concentración alrededor
de los valores centrales de la variable.
● Distribución platicúrtica: presenta un
reducido grado de concentración alrededor
de los valores centrales de la variable.

También podría gustarte