DESCRIPTIVA → recolectar, organizar, tabular, presentar y Población (N) → parámetro (medida resumen)
ESTADISTICA reducir información.
Muestra (n) → estadístico (medida resumen) Generalmente INFERENCIAL → Permite hacer predicciones (estimar, realizar Unidad de análisis → objeto bajo estudio NO ES perfecta test de hipótesis) Variable → cualidad o cantidad medible que se estudia de la unidad de análisis. DISTRIBUCION DE FRECUENCIAS Gr. de BASTONES (fi) → PARA DATOS AGRUPADOS EN SERIES DE FRECUENCIAS Gr. ESCALONADO (Fi)
I Xi fi fri fri % Fi Fri Fri %
Orden de Valores que Frecuencia Frecuencia Frecuencia Frecuencias los valores toma la absoluta relativa porcentual acumuladas variable TOTAL noN 1 100% → PARA DATOS AGRUPADOS EN INTERVALOS DE CLASE (cuando son muchos datos) Subdivisiones del dominio de la variable (tramos)
➢ Límites de clase: define los extremos de un intervalo Graficos:
o Li (límite inferior) Amplitud del intervalo: Ls - Li - Histograma Ls (límite superior) o - Polígono de frecuencia - Ojiva (Fi) ➢ Marca de la clase = Mi (punto medio de cada intervalo) ➢ R = Xmax – Xmin 𝑅 ➢ Amplitud (A) = 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
1 + 3,3 . Log N → se redondea en menos
MEDIDAS DE POSICION O LOCALIZACION DE DISPERCION O ESCALA Describen un valor alrededor del cual se encuentran las observaciones Expresan cuan variable es un conjunto de datos Depende de si la distribución es… Simétrica Asimétrica Rango = Xmax -Xmin (es muy sensible a la presencia de valores atípicos) (conducirán a resultados parecidos) (se obtendrán valores diferentes) Desvío estándar (s) → cuán lejos se encuentran los datos de la media (𝒙̅) ∑𝒏 𝒊=𝟏 𝒙𝒊 Para datos agrupados Media aritmética o promedio ̅= 𝒙 𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 . 𝒇𝒊 - es muy buena cuando la distribucion es simétrica ̅= 𝒙 - Solo para datos numéricos 𝒏 S2 es la varianza (ver material) Mediana (Me) → posición central en una muestra ordenada de menor a mayor Para datos agrupados 𝒏 Impar – el valor que ocupa la posición central - En series de frecuencias 𝑴𝒆 = N° de datos - En intervalos de clase 𝟐 Par – promedio de los dos datos centrales
- para datos numéricos y ordinales Es muy sensible a la presencia de datos atípicos
- no se ve afectada por la presencia de valores atípicos Regla empírica En una distribución aproximadamente simétrica y acampanada...
Para datos agrupados → Buscar s/Fi, el valor que acumula hasta n/2 observaciones
Para datos agrupados en intervalos (se puede aproximar)
𝑛 − 𝐹𝑖−1 𝑀𝑒 = 𝐿𝑖 + 2 ∗ 𝐴𝑚𝑝𝑙. 𝑓𝑖
Moda (Mo) → el dato que más se repite
𝒇𝒊 −𝒇𝒊−𝟏 - Para datos agrupados en I. de clase 𝑴𝒐 = 𝑳𝒊 + (𝒇𝒊 −𝒇𝒊−𝟏 )+(𝒇𝒊 −𝒇𝒊+𝟏 ) ∗ 𝑨𝒎𝒑𝒍.
- En D. de variables continuas: 1 pico: unimodal; 2 picos: bimodal