Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISTRIBUCIONES DE FRECUENCIAS
Introducción a la estadística
¿Qué es la estadística?
Método científico
Población vs Muestra
POBLACIÓN
INDIVIDUO
MUESTRA
MUESTREO
Debe garantizar que las características de la población se mantienen intactas en la muestra y los
resultados obtenidos sobre la muestra pueden utilizarse para realizar inferencias sobre la población.
Pueden tomar un valor cualquiera de un conjunto de valores prescritos para darnos el conjunto de
datos del estudio estadístico.
Redondeo de Datos
63,4 redondeado al entero más cercano es 63, porque 63,4 está más cerca de 63 que de 64.
37,8773 redondeado a la centésima más cercana es 37,88 puesto que 37,8778 está más próximo a
37,88 que a 37,87.
43,45 se encuentra a igual distancia de 43,4 de 43,5 por lo que redondeamos al par más cercano. Es
decir, 43,45 redondeado a la décima más próxima es 43,4 mientras que 43,55 redondeado a la décima
más próxima es 43,6.
Notación Científica
𝑥
El valor del exponente de la potencia (10 ) indica el número de posiciones que hay que desplazar el
separador decimal (a la derecha si el exponente es positivo y a la izquierda si es negativo).
6 −4
Ejemplo 1: 3, 765 × 10 = 3765000 . Ejemplo 2: 7, 23 × 10 = 0, 000723
Cifras Significativas
Si una variable es de tipo cuantitativa continua y su valor está registrado (1,72 m), significa que el
valor real está entre 1,715 m y 1,725. Los dígitos exactos, además de los ceros necesarios para
colocar el separador decimal, son denominados cifras significativas del número. (28,4 tiene tres
cifras significativas; 0,042 = 4,2 X 10-2 tiene dos cifras significativas; 98,5600 tiene seis cifras
significativas; 0,04200 = 4,200 X 10-2 tiene cuatro cifras significativas)
Cálculos
Al realizar cálculos (sumas y restas) el resultado final no puede tener más cifras significativas que el
número con menos cifras significativas. (4,23 + 6,4 = 10; 7,36 – 4 = 3)
Al realizar cálculos (multiplicación, división o raíces), el resultado final no puede tener más cifras
significativas que el menor número de cifras significativas. Para todos los cálculos intermedios
utilizaremos una cifra significativa más. (73,24 X 4,52 = 331; 1,648÷0,023 = 72)
● Tablas de Frecuencia
● Tablas Cruzadas
● Gráficos
● Datos Primarios o Brutos: los datos tal y como han sido recolectados.
● Datos Ordenados: en orden creciente o decreciente de los datos numéricos primarios
susceptibles de ordenación. (Variables cuantitativas y cualitativas ordinales)
● Rango, Amplitud de los datos o Recorrido: Diferencia entre el mayor valor observado y el
menor valor observado → Nº de Modalidades (Variables cuantitativas discretas/Continuas)
Representación de datos
Tabla de frecuencias
Resume la información contenida en los datos (xi) de una muestra de tamaño = n. Las columnas de la
tabla muestran distintas frecuencias dependiendo de si los datos son discretos o continuos.
𝑛𝑖 1
𝑓𝑖 = 𝑛
𝐹𝑖 = ∑ 𝑓𝑗 = 𝑛
∑ 𝑛𝑗 𝑁𝑖 = ∑ 𝑛𝑗
𝑗≤𝑖 𝑗≤𝑖 𝑗≤𝑖
𝐿𝑖−1, 𝐿𝑖 Límites de clase (Valor inferior y 𝑥𝑖 marcas de clase (Valor medio de los
superior de la clase) límites)
𝑙𝑜𝑔10(𝑁)
𝑆𝑡𝑢𝑟𝑔𝑒𝑠: 𝐶 = 1 + 𝑙𝑜𝑔2(𝑁) = 1 + 𝑙𝑜𝑔10(2)
En la primera L se coloca la nota mínima y en la otra L +1,6 todo el rato hasta llegar a 10.
Tablas cruzadas
Gráficos
● Cualitativas discretas
○ Diagrama de barras
○ Gráfico de mosaicos
● Cuantitativas continuas
○ Histograma
○ Diagrama de línea
○ Gráfico de series
● OTROS
○ Gráfico de dispersión
● Mixtos
○ Gráficos de barras y líneas
Cómo varían dos magnitudes en relación a una
tercera
Estadísticos y cuantiles
Estadístico es una cantidad numérica calculada sobre una muestra (La altura media de clase)
Parámetro es una cantidad numérica calculada sobre una población(La altura media de un país)
Cuantiles
Permiten dividir de forma regular la muestra, formando intervalos que comprenden la misma
proporción de valores (Variables cuantitativas)
- Se define el cuantil de orden α(𝐶α, con 0<α<1 (%)) como el valor de la variable 𝑋α por debajo
del cual se encuentra una frecuencia acumulada (ⲁ)
- Los datos se dividen en 2 partes ; (1-a)×100% de los datos tienen valores mayores que Xa.
1. Calcular el índice i.
2. Buscar el intervalo cuya Ni sea > ó = 𝑖
3. Fórmula
α𝑛−𝑁𝑖−1
𝐶α = 𝐿𝑖−1 + 𝑎𝑖 𝑛𝑖
Estadísticos de Posición Comunes
Los estadísticos de tendencia central son efectivos cuando queremos resumir la información de la
variable mediante un valor numérico.
Media aritmética
● Para datos sin agrupar: Sumatorio de los datos de la variable (xi) dividido entre n el
tamaño de la muestra.
● Para datos agrupados: Sumatorio de la multiplicación de la marca de clase (xi) por la
frecuencia absoluta de cada intervalo (ni) dividido entre n el tamaño de la muestra.
1 1
Sin agrupar: 𝑥 = 𝑛
∑ 𝑥𝑖 Agrupados: 𝑥 = 𝑛
∑(𝑥𝑖 · 𝑛𝑖)
Media ponderada
𝑥𝑝 = ∑ 𝑥𝑖 · 𝑤𝑖
Mediana
Moda
𝑛𝑖−𝑛𝑖.−1
𝑀𝑜𝑑𝑎 = 𝐿𝑖𝑖−1 + 𝑎 · 2·𝑛𝑖−𝑛𝑖−1−𝑛𝑖+1
Rango o Recorrido
𝑅𝑎𝑛𝑔𝑜 = 𝑚𝑎𝑥–𝑚𝑖𝑛
Rango intercuartílico
● Diagrama de Tukey
● Diagrama de cajas
Varianza
2 1 2 2 1 2
Sin agrupar: 𝑠 = 𝑛
∑(𝑥𝑖 − 𝑥) Agrupados: 𝑠 = 𝑛
∑ 𝑛𝑖 · (𝑥𝑖 − 𝑥)
Desviación típica
2
𝑠= 𝑠 68% < 𝑠 < 95%
Coeficiente de Variación
Cómo de grande es la dispersión de los datos de una variable con respecto a la media.
𝑠
𝐶𝑉 = · 100 = %
|𝑥|
Estadísticos de forma
Asimetría
𝑄3+𝑄1−2·𝑄2
𝐶𝐴𝐵 = 𝑄3−𝑄1
Curtosis
( )
𝑚4 𝑛 𝑥𝑘−𝑥
𝐶𝐶 = 4 = ∑ −3
𝑆𝑛 𝑘=1 𝑆𝑛
Correlación de variables
Datos Bidimensionales
La forma más sencilla de representar estos datos es mediante los diagramas o gráficos de dispersión.
Del gráfico podemos deducir que existe una relación lineal entre las dos variables: “parece que el peso
aumenta con la altura”.
Covarianza
( )( )
∑ 𝑥𝑖−𝑥 · 𝑦𝑖−𝑦
𝑆𝑥𝑦 = 𝑁
𝑆𝑥𝑦
𝑟𝑥𝑦 = 𝑆𝑥·𝑆𝑦
Coeficiente de Determinación
2
𝑅 = 𝑟𝑥𝑦 ( )2
Regresión Lineal
Encontrar la ecuación de una función, de una o varias variables independientes (X) que pueda ser
utilizada para predecir el valor de la variable dependiente (Y)
𝑌 = 𝑎 + 𝑏𝑋 + ϵ
Modelo de Regresión Lineal Simple (MRLS)
∈ = 𝑌 (𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎) − 𝑌´(𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎)
𝑆𝑥𝑦
𝑎 =𝑌− 𝑏 ·𝑋 𝑏= 2
𝑆𝑥
Dada una colección de sucesos A1 , A2, A3, A4… tales que la unión de todos ellos forman el espacio
muestral (E), y sus intersecciones son exhaustivas (disjuntas)
Teorema de Bayes
( ) ( )
𝑃 𝐴𝑖 ·𝑃 𝐵/𝐴𝑖
(
𝑃 𝐴𝑖/𝐵 = ) 𝑃(𝐴1)·𝑃(𝐵/𝐴1)+...+𝑃(𝐴1)·𝑃(𝐵/𝐴𝑛)