Documentos de Académico
Documentos de Profesional
Documentos de Cultura
¿Qué es la estadística?
Estudia la recolección de datos, los analiza e interpreta
Población: un conjunto completo sobre una característica particular (puntajes,
personas, medidas)
Muestra: subconjunto de individuos en base a la población.
MEDIDAS:
POBLACION MUESTRA
MEDIDA parámetro estadístico
PROMEDIO
VARIANZA
DESVIACION
PROPORCION
MUESTREO
• los datos deben ser seleccionados aleatoriamente, si no son seleccionados
de manera apropiada serán inútiles.
ESTADISTICO
Una medida numérica que describe alguna característica de una muestra.
• E. descriptiva: se recolectan los datos (encuestas), se resumen y se
presentan (gráficos).
TIPOS DE ESTUDIOS
Estudio transversal: los datos son tomados en el mismo momento.
ERRORES DE MUESTREO
• Error de muestreo es la diferencia entre el resultado de una muestra y el
verdadero resultado de la población; este error es consecuencia de las
fluctuaciones por el azar.
• Error que NO es de muestreo sucede cuando los datos muestrales se
obtienen, registran o analizan de forma incorrecta (como cuando se
selecciona una muestra sesgada, cuando se usa un instrumento de medición
defectuoso o cuando se copian los datos de forma incorrecta).
Centro: valor promedio que indica la localización de la mitad del conjunto de los
datos (media, moda, mediana).
Variación: medida de la cantidad en que los valores de los datos varían entre si
(diferencia entre datos, resta).
Distribución: forma de la distribución de los datos (forma campana, uniforme o
sesgada).
Valores extremos: Valores muestrales que están muy alejados de la vasta
mayoría de los demás valores de la muestra.
Tiempo: Características cambiantes de los datos a través del tiempo.
MEDIDAS CENTRO
Media aritmética (muestra): conocida como promedio
• Suma de valores dividida por el número de valores
• Es afectada por valores extremos
• No siempre es conveniente sacar promedio con números tan altos.
Media poblacional (población): *********************
Mediana: Punto que divide a la población o muestra en dos partes iguales.
• Es el numero de en medio (de menor a mayor)
• No le afectan los valores extremos
Moda: es el valor que ocurre con más frecuencia
• No es afectada por números extremos.
• Usada para datos numéricos como categóricos.
• Puede que no haya moda o que vayan varias.
SU USO
• La media aritmética es generalmente usada, a menos que existan valores
extremos.
• La mediana es a menudo usada cuando hay valores extremos.
• La moda es usada cuando los datos son cualitativos, o cuantitativos.
CUARTILES
• Se divide en 4 partes iguales, al dividir la muestra o población
(25,50,75,100) %
• La mediana coincide con el cuartil dos
• FORMULA EXCEL =CUARTILINC ($_$_; número cuartil)
PERCENTILES
• Se divide en 100 partes
• FORMULA EXCEL =PERCENTILINC (__; porcentaje cuartil)
MEDIDAS DE DISPERSION
Preferible que sean números pequeños
Campana de gauss: representa la cantidad de datos, tiene el mismo centro, pero
diferente variación
Rango
• Diferencia entre lo máximo y mínimo de un conjunto de datos
• Ignora la forma en que los datos están distribuidos
• Sensible a valores extremos
Rango intercuartílico
FORMULA EXCEL RIC= Q3 – Q1
• Se calcula como la Diferencia entre cuartil 3 y 1
• Los problemas de valores extremos se pueden eliminar con el ric
• Elimina algunos valores altos y bajos
• Calcula el rango de los valores remanentes
• Si hay un dato de valor extremo que sale solo 1 vez, se puede eliminar, de
lo contrario no ya que sería un patrón.
Varianza muestral
• Promedio aprox. del cuadrado de las desviaciones de los valores con
respecto a su media (aritmética)
FORMULA EXCEL
Varianza muestral: =VAR.S(celdas)
Varianza poblacional: =VAR.P(celdas)
FORMULA EXCEL
Desviación poblacional =DESVEST.P(celdas)
Desviación muestral =DESVEST.M(celdas)
Campana de gauss
Coeficiente de variación
• Mide la variación relativa y muestra a la media
• Es preferible medirlo en porcentaje
• Puede ser utilizada para comparar 2 o mas datos medidos en unidades
diferentes
Interpretación del coeficiente de variación
• Si C.V es MENOR a 10%: los datos son homogéneos. La media es
representativa
• Si C.V. MAYOR a 10%: Los datos son heterogéneos. La media no es
representativa.
Para elegir entre 2 o más distribuciones, es más conveniente la de menor
C.V. por ser más homogénea.
PRESENTACION DE DATOS
Datos categóricos: Son los Datos no numéricos y se representan por su
frecuencia a través de gráficos de barra o tablas de resumen
Tabla de resumen: Resumen los datos por categoría
Gráficos de barra y circulares: La altura de las barras o el tamaño del sector
circular muestran la frecuencia o porcentaje de cada categoría.
Forma de la distribución
PREGUNTA PRUEBA
Simetría
• La distribución de datos es simétrica, la parte izquierda del histograma es
casi espejo de la parte derecha
• Moda=media=mediana
Sesgo o asimetría
• Es sesgada si no es simétrica y se extiende mas hacia un lado que hacia el
otro
• Sesgada a la izquierda o derecha
DIAGRAMA DE DISPERSION
• Se utiliza para saber qué relación hay entre una variable y la otra.
• Una variable es medida por eje vertical y la otra por el eje horizontal.
LA COVARIANZA MUESTRAL
▪ Mide el GRADO de relación lineal entre dos variables, que son llamados