Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MAESTRO Practica2 Trabajo de Investigacion
MAESTRO Practica2 Trabajo de Investigacion
Habitualmente necesitamos disponer de un valor numérico que represente la disparidad de datos de una
distribución de frecuencias. Estos valores son los llamados parámetros centrales o medidas de centralización, ya
que son valores "intermedios" que se situan alrededor del centro de la distribución.
La media aritmética
Para calcular la media se suman todos los valores de los datos y se divide por el
número total.
Cuando los datos se repiten, es más fácil formar la tabla de frecuencias y sumar los
productos de cada valor por las veces que se repite, después dividimos por el nº total
de datos.
En el caso de variables agrupadas en intervalos, como en el ejemplo que vemos aquí,
xi es la marca de clase o punto medio de cada intervalo.
La moda
ver fórmula
La moda de una variable estadística es el valor más repetido, el que tiene mayor
frecuencia absoluta.
Donde:
i es la clase modal,
i-1 e i+1 la anterior y posterior respectivamente,
ai es el extremo inferior,
ci la amplitud del intervalo,
ni la frecuencia absoluta.
Así como la mediana divide la distribución en dos partes con el mismo número de datos,
los cuartiles son los valores de la variable que la dividen en cuatro partes. El primer cuartil,
Q1, deja a la izquierda el 25% de los datos, el segundo es la mediana y el tercero, Q 3, deja
el 75% de los datos a la izquierda.
MEDIDAS DE CENTRALIZACIÓN
El objetivo principal de las medidas de tendencia central es poder representar por medio de un
solo número al conjunto de datos, es decir, dan valores representativos de la distribución de
frecuencias, situados en algún lugar intermedio, alrededor del cual, se encuentran los otros
valores. Nos indican dónde tienden a concentrarse los valores.
Medidas de dispersión. Parámetros estadísticos que indican como se alejan los
datos respecto de la media aritmética. Sirven como indicador de la variabilidad de los
datos. Las medidas de dispersión más utilizadas son el rango, la desviación estándar y
la varianza.
Contenido
[ocultar]
1 Rango
2 Desviación media
3 Desviación estándar
4 Varianza
5 Coeficiente de Variación
6 Enlaces relacionados
7 Fuentes
Rango
Indica la dispersión entre los valores extremos de una variable. se calcula como la
diferencia entre el mayor y el menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:
R = x(n) - x(1)
Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.
Desviación media
Es la media aritmética de los valores absolutos de las diferencias de cada dato
respecto a la media.
Donde:
xi:valores de la variable.
n: número total de datos
Desviación estándar
La desviación estándar mide el grado de disersión de los datos con respecto a la
media, se denota como s para una muestra o como σ para la población. Se define
como la raiz cuadrada de la varianza según la expresión:
Error al crear miniatura: Falta archivo
Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde se
divide entre n; también existe la formula de desviación típica donde el denominador
es n pero se prefiere n-1.
Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir
existe menor dispersión, el incremento de los valores de la desviación estándar indica
ina mayor variabilidad de los datos.
Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable
respecto a la media. Corresponde a la media aritmética de los cuadrados de las
desviaciones respecto a la media. Su expresión matemática es:
Error al crear miniatura: Falta archivo
Coeficiente de Variación
Permite determinar la razón existente entre la desviación estándar (s) y la media. Se
denota como CV. El coeficiente de variación permite decidir con mayor claridad sobre
la dispersión de los datos.
Error al crear miniatura: Falta archivo
También puede ser expresado en por ciento.