Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística descriptiva
El término estadística descriptiva se refiere al análisis, el resumen y la
presentación de los resultados relacionados con un conjunto de datos
derivados de una muestra o de toda la población.
Frecuencia fi
Es un resumen tabular de datos que muestra el número (frecuencia) de
elementos en cada una de las diferentes clases disyuntas (que no se
sobreponen).
Clases
Número de clases: Se recomienda emplear entre 5 y 20 clases. clases.
La idea es tener las clases suficientes para que se muestre la variación
en los datos, pero no deben ser demasiadas si algunas de ellas
contienen sólo unos cuantos datos.
Ancho de clase: es recomendable que el ancho sea el mismo para
todas las clases. Para determinar el ancho de clase apropiada se
empieza por identificar el mayor y el menor de los valores de los datos.
Después, usando el número de clases deseado, se emplea la expresión
siguiente para determinar el ancho aproximada de clase
Es una gráfica para representar los datos cualitativos de una distribución de frecuencia, de
frecuencia relativa o de frecuencia porcentual. En uno de los ejes de la gráfica (por lo general en
el horizontal), se especifican las etiquetas empleadas para las clases (categorías).
Para el otro eje de la gráfica (el vertical) se usa una escala para
frecuencia, frecuencia relativa o frecuencia porcentual.
Después, empleando un ancho de barra fijo, se dibuja sobre
cada etiqueta de las clases una barra que se extiende hasta la
frecuencia, frecuencia relativa o frecuencia porcentual de la
clase.
Grafica de pastel
Graficas de puntos
En el eje horizontal se presenta el intervalo de los datos. Cada dato se representa por un
punto colocado sobre este eje. Las gráficas de puntos muestran los detalles de los datos y son
útiles para comparar la distribución de los datos de dos o más variables.
Histograma
Una presentación gráfica usual para datos cuantitativos es el histograma. Esta gráfica se hace
con datos previamente resumidos mediante una distribución de frecuencia, de frecuencia
relativa o de frecuencia porcentual.
Un histograma se construye colocando la variable de interés en el eje
horizontal y la frecuencia, la frecuencia relativa o la frecuencia
porcentual en el eje vertical. La frecuencia, frecuencia relativa o
porcentual de cada clase se indica dibujando un rectángulo cuya
base está determinada por los límites de clase sobre el eje horizontal
y la altura es la frecuencia correspondiente
Ojiva
es una gráfica que muestra los valores de los datos en el eje
horizontal y las frecuencias acumuladas, las frecuencias relativas
acumuladas
o las frecuencias porcentuales acumuladas en el eje vertical.
R: Xᵢ max- Xᵢ min
K(num de intervalos): 1+log₂ (m)
MEDIDAS NUMÉRICAS A: R/K
MEDIA x
La media proporciona una medida de localización central de los datos. Si
los datos son datos de una muestra, la media se denota X̅ ; si los datos son
datos de una población, la media se denota con la letra griega μ.
x = Σxᵢ
n
Para calcular la media en base a datos agrupados:
x = Σxᵢ.fᵢ
N (número total de
datos, o la suma de fᵢ)
MEDIANA me o Xme
Ordenar los datos de menor a mayor (en forma ascendente).
1. Si el número de observaciones es impar, la mediana es el valor de
enmedio.
2. Si el número de observaciones es par, la mediana es el promedio de las
dos observaciones de enmedio
MODA mo o Xmo
i= (100
p ( n P= percentil deseado
n= número de observaciones
Paso 3:
Si no es un número entero redondeo para arriba
Si es un número entero el percentil p es el promedio de los valores
en las posiciones i e i + 1.
QUARTILES qk
Con frecuencia es conveniente dividir los datos en cuatro partes; así, cada
parte contiene una cuarta parte o 25% de las observaciones.
En datos agrupados
KN KN
- Fᵢ-1 . - Fᵢ-1
Q k = linf + 4 a P k = linf + 100 . a
fᵢ fᵢ
MEDIDAS DE VARIABILIDAD
s²= Σ Xᵢ² - X̅ ²
n
DESVIACIÓN ESTANDAR S ó DS
Se define como la raíz cuadrada positiva de la varianza
Desviación poblacional
Desviación muestral
COEFICIENTE DE VARIACIÓN CV
En algunas ocasiones se requiere un estadístico descriptivo que indique
cuán grande es la desviación estándar en relación con la media.
ASIMETRÍA AS
Indica si los datos presentan sesgo, es decir para que lado están corridos
los datos.
KURTOSIS k
Diagrama de caja
Es un resumen gráfico de los datos. La clave para la elaboración de un
diagrama de caja es el cálculo de la mediana y de los cuartiles Q1 y Q3
También se necesita el rango intercuartílico. Los pasos para elaborar un
diagrama de caja son los siguientes.
1. Se dibuja una caja cuyos extremos se localicen en el primer y tercer
cuartiles. Esta caja contiene 50% de los datos centrales
2. En el punto donde se localiza la mediana se traza una línea vertical.
3. Usando el rango intercuartílico, RIC Q3 – Q1, se localizan los límites.
En un diagrama de caja los límites se encuentran 1.5(RIC) abajo del
Q1 y 1.5(RIC) arriba del Q3. Los datos que quedan fuera de estos
límites se consideran observaciones atípicas.
4. Alas líneas punteadas que se observan en la figura 3.5 se les llama
bigotes. Los bigotes van desde los extremos de la caja hasta los
valores menor y mayor de los límites calculados en el paso 3.
5. mediante un asterisco se indica la localización de las observaciones
atípicas.
Para ejercicios:
El largo de la caja determina el RIC, por lo que cuanto más grande más dispersos
se encuentran los datos
La mediana indica si hay sesgos o es simetrica, si la mediana se encuentra más
cerca del Q1 hay sesgo positivo, si se encuentra más cerca del Q2 hay sesgo
negativo.
UNIDAD 2
Probabilidad
La probabilidad es una medida numérica de la posibilidad de que
ocurra un evento. Los valores de probabilidad se encuentran en una
escala de 0 a 1. Los valores cercanos a 0 indican que las posibilidades de
que ocurra un evento son muy pocas. Los cercanos a 1 indican
que es casi seguro que ocurra un evento. Otras probabilidades entre
cero y uno representan distintos grados de posibilidad de que ocurra
un evento.
Espacio muestral S
Es el conjunto de todos los resultados posibles de un evento aleatorio.
Ejemplo cara o cruz en el evento lanzar una moneda.
Evento o suceso
Uno o varios de los posibles resultados
Reglas de conteo
Experimentos de pasos múltiples: Un experimento se describe como
una sucesión de k pasos en los que hay n1 resultados posibles en el
primer paso, n2 resultados posibles en el segundo paso y así en lo
sucesivo, entonces el número total de resultados experimentales es (n1)
(n2) . . . (nk). Si considera el experimento del lanzamiento de dos
monedas como la sucesión de lanzar primero una moneda (n1 = 2) y
después lanzar la otra (n2 = 2), siguiendo la regla de conteo (2)(2) = 4,
entonces hay cuatro resultados distintos
*0!=1
Como ejemplo del uso de la regla de conteo para combinaciones,
considere un procedimiento de control de calidad en el que un
inspector selecciona al azar dos de cinco piezas para probar que no
tengan defectos. En un conjunto de cinco partes. De acuerdo con la
regla de conteo de la ecuación con N=5 y n=2 se tiene:
Asignación de probabilidades
método subjetivo
El más indicado cuando no es factible suponer que todos los resultados
de un experimento sean igualmente posibles y, además, cuenta con
pocos datos relevantes. Usa toda la información disponible, por ejemplo,
la propia experiencia o la intuición. Después de considerar dicha
información se asigna un valor de probabilidad que expresa el grado de
confianza (en una escala de 0 a 1) que tiene acerca de que un resultado
experimental ocurra. Como la probabilidad subjetiva expresa el grado
de confianza que tiene un individuo, es personal.
Ley de Laplace
Número de casos favorables
P(a)=
Número de casos posibles
Regla de la suma
O --> Union
Unión inclusiva:
Y--> Intersección
P(AUB)= P(A)+(PB)- P(A ∩ B) /--> Dado que
Probabilidad condicional
La notación | indica que se está considerando la probabilidad del evento A
dada la condición de que el evento B ha ocurrido.
P(A|B)= P (A∩ B)
PB
Probabilidad marginal
Se obtienen al sumar las probabilidades conjuntas del renglón o columna
correspondiente de la tabla de probabilidades conjuntas
Teorema de la probabilidad total
Permite calcular la probabilidad de que ocurra un evento, que se
puede realizar a través de varios caminos.
Teorema de bayes
Ejemplo:
En un experimento se determinó el número de bombas en dos
gasolineras. Se definen tres variables aleatorias:
X : número total de bombas en uso en ambas gasolineras,
Y: diferencia entre el número de bombas en la gasolinera 1 y 2
U:el máximo de los números de bombas en uso en ambas
gasolineras.
Distribución de probabilidad
Función de probabilidad
La función de probabilidad discreta asigna una probabilidad a cada
posible valor que puede tomar la variable aleatoria. La suma de todas las
probabilidades debe ser igual a 1.
F(x) = P(X ≤ x)
Por ejemplo, si X representa el resultado del lanzamiento de un dado y
se quiere calcular la probabilidad de obtener un valor menor o igual a
3,. En este caso, la FDA se define como:
F(x) = P(X <= x) = P(X = 1) + P(X = 2) + P(X = 3)
F(3) = P(X <= 3) = P(X = 1) + P(X = 2) + P(X = 3) = 1/6 + 1/6 + 1/6 = 1/2
Grafico:
Para una variable aleatoria discreta X, la
gráfica de F(x) mostrará un salto con cada
valor posible de X, y será plana entre los
valores posibles.
Propiedades
𝐸 (𝑏𝑋) = 𝑏 ∗ 𝐸(𝑋)
𝐸( 𝑋 + 𝑎) = 𝐸 (𝑋 )+ 𝑎
𝐸 (𝑎 + 𝑏𝑋 )= 𝑎 + 𝑏 ∗ 𝐸(𝑋)
𝐸 (𝑔(𝑋)) = Σ g(xi) . p(xi)
𝐸 (𝑋 ± 𝑌) = 𝐸(𝑋) ± 𝐸(𝑌)
𝐸 (𝑋𝑌) = 𝐸 (𝑋 )∗ 𝐸(𝑌) (si x e y eran independientes)
Varianza de X
Propiedades de la varianza:
𝑉 (𝑏𝑋) = 𝑏² ∗ 𝑉(𝑋)
𝑉 (𝑋 + 𝑎) = 𝑉( 𝑋)
𝑉 (𝑎 + 𝑏𝑋) = 𝑏 ² ∗ 𝑉(𝑋)
𝑉 𝑋 ± 𝑌 = 𝑉 (𝑋 )+ 𝑉 (Y)²
Desvió estándar
√V(X)
Asimetría
𝑉(𝑋) = Σ(Xi - 𝐸(𝑋))³.P(Xi)
(D.S (x) ³)
Si da menos que 0, hay sesgo negativo, los datos se encuentran a
izquierda (a), La media se encuentra a la izquierda de la mediana.
Curtosis
Densidad
Permite determinar la probabilidad de que la variable caiga dentro de
un rango continuo de valores. La fórmula de la función de densidad
para una variable aleatoria continua es la siguiente:
Esperanza
DS(X)=√V(X)
Asimetria