Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCION
Al analizar los datos contenidos en una muestra, un paso importante es
presentar diversos resúmenes numéricos de la información que contiene. Estos
resúmenes numéricos, que representan características interesantes de la
muestra, serán denominados 'estadísticas'. De una manera más formal, se
puede dar la siguiente definición:
En otras palabras, estadística es una función numérica de los datos que puede
efectivamente calcularse, porque los elementos necesarios para hacerlo son
conocidos. Existe una gran variedad de resúmenes numéricos que pueden
calcularse con los datos de la muestra. Cada uno de éstos ofrece una
descripción propia de algún aspecto de interés.
Contenido
Métodos estadísticos
Conceptos básicos sobre pruebas estadísticas
Como elegir la prueba estadística adecuada
La prueba más universal para la comparación de dos tratamientos
Análisis Estadístico de datos de Supervivencia
Se puede confiar en el Meta-Análisis ?
Ventajas y limitaciones del Análisis de la Varianza (ANOVA)
Utilización e Interpretación de las Técnicas de Regresión y Correlación
Utilidades estadísticas
He dado positivo, Estaré enfermo?
Cálculo del tamaño muestral en la comparación de dos muestras
Bibliografía
Población y Muestra.
Dos conceptos básicos en estadística son población y muestra.
Ejemplo:
Ejercicio.
Si, para cada alumno, su puntaje de Prueba de Aptitud Académica es el
promedio de la Prueba de Aptitud Verbal y la Prueba de Aptitud Matemática.
¿Cuál es el promedio de la Prueba de Aptitud Académica del establecimiento
representado por la muestra?
Nota.
MEDIANA
La mediana es una medida de centro que resulta ser un caso particular de
percentil.
Es el percentil 50.
Ejemplo.
En este caso, la mediana es 43, el tercer valor cuando se ordenan los datos.
Mientras este tercer valor no cambie, tampoco lo hará la mediana. Sin
embargo, los valores 57 y 63 pueden asumir cualquier valor superior o igual a
43 y la mediana no cambiará de valor. Asimismo, los valores 12 y 34 pueden
asumir cualquier valor menor o igual a 43 sin que cambie el valor de la
mediana.
MODA
Es un valor del recorrido de las observaciones que presenta mayor frecuencia
que aquellos a su alrededor.
En un conjunto de datos, puede haber más de un valor que cumple con la
característica presentada en el párrafo anterior. En consecuencia, la moda de
un conjunto de datos puede no ser única.
Como puede apreciarse, cuatro alumnas tienen una estatura de 165 cm.. Si no
se pone atención al resto de las observaciones, se podría reportar este valor
como la moda principal, lo que tiende a confundir ya que alrededor 159 cm. hay
una gran concentración de datos. La mayor utilidad de la moda, se presenta al
usarla con muestras relativamente grandes, donde la influencia de un dato
individual no distorsiona el análisis.
PROMEDIO PONDERADO
En muchas ocasiones, las observaciones recolectadas no tienen la misma
importancia relativa. Para hacer presente este hecho en la búsqueda de un
'centro' que represente a los datos, es necesario asignar a cada uno de éstos,
una ponderación (peso o coeficiente) que represente su importancia dentro de
la muestra.
Definición.
Sean x1 ,x2 ,....,xn , n datos y w 1 ,w2,....,wn, n, números reales tales que w i>=0;
i=1,2,....n; con a lo menos un wi>0. Entonces el promedio ponderado de los
datos, está dado por:
PROMEDIO RECORTADO
Considérese una muestra de n datos. Para calcular el promedio recortado, es
necesario comenzar ordenando los datos de menor a mayor. Después de esto,
se eliminan los datos menores y los mayores, dejando sólo los del centro. Con
estos últimos se calcula el promedio habitual.
Ejemplo.
Para el cálculo del promedio, como siempre, se incluye a todos los datos. Para
el promedio recortado al 5%, se eliminan el 23 y el 89.El cálculo se hace con
los valores 25 al 78 inclusive. A medida que aumenta el porcentaje de recorte,
aumenta el número de datos eliminados del cálculo.
Nota.
MEDIDAS DE DISPERSION.
RANGO
El Rango es una medida de dispersión muy simple,
Esta dificultad muestra un aspecto negativo del rango, sin embargo, su gran
simplicidad de cálculo, hace que en muchas situaciones sea práctico su uso.
DESVIACION MEDIANA.
El criterio que guía esta estadística, radica en el uso de diferencias de cada
dato respecto a la mediana muestral m.
Si estas diferencias son muy grandes, entonces estamos ante un caso de gran
variabilidad, y si son pequeñas se espera que la variabilidad sea pequeña.
Puede verse entonces que, cuanto mayor sea la dispersión existente entre los
datos, tanto mayor tenderá a ser el promedio del valor absoluto de las
diferencias de los datos, respecto de la mediana muestral.
VARIANZA
Dado un conjunto de datos, una forma de medir su variabilidad consiste en
calcular las diferencias de cada dato respecto del centro de los datos
representado por su promedio. Como las diferencias tienen signos negativos o
positivos, según el dato sea menor o mayor que el promedio, la simple suma de
las diferencias no sirve por los valores se compensan.
Comentario pedagógico.
Nota.
A modo de ejemplo, se puede decir que un valor está bastante alejado del
centro de los datos si su distancia de él supera dos desviaciones estándar.
MEDIDAS DE FORMA
ASIMETRIA
Además de la posición y la dispersión de un conjunto de datos, es común usar
medidas de forma en la descripción. Una de estas medidas es una estadística
que busca expresar la simetría ( o falta de ella ) que manifiestan los datos.
CURTOSIS
El coeficiente de curtosis mide cuan 'puntiaguda' es una distribución
respecto de un estándar. Este estándar es una forma acampanada
denominada 'normal', y corresponde a una curva de gran importancia en
estadística.
Leptocúrtica
Platicúrtica
Mesocúrtica
Una curva Mesocúrtica tiene un Coeficiente de Curtosis cercano a cero. Una
Leptocúrtica, un valor notoriamente mayor que cero y una Platicúrtica valores
menores que cero.
MEDIDAS DE POSICIÓN
PERCENTIL q (pq)
Una medida de posición muy útil para describir una población, es la
denominada 'percentil'. En forma intuitiva podemos decir que es un valor tal
que supera un determinado porcentaje de los miembros de la población.
Ejemplo.
Sin embargo, si se desea calcular un percentil que coincida con una proporción
asociada a un dato de la muestra, se produce una indefinición. Tómese el caso
del percentil 20. En este caso la línea horizontal que busca cortar la gráfica de
escalera, coincide justamente con un tramo horizontal de ésta; el que corre a la
altura del 20% entre los datos muestrales 8 y 11. Cualquier valor entre 8 y 11
podría ser considerado como el percentil 20.
Más adelante se usará una convención para encontrar salidas a esta
indefinición.
Definición.
NOTA.
Sin embargo, el uso inicial del gráfico de escalera y alguna ejercitación con la
fórmula de cálculo, ayudan a entender un procedimiento que en un comienzo
aparece mucho más difícil.
Para obtener este único resultado hay diversas soluciones. Aquí se usará
aquella que calcula un punto de intervalo entregado por el cálculo anterior
usando el mismo porcentaje que define al percentil.
El procedimiento es el siguiente:
Ejemplo.