Teoría Estadística Aplicada

TEORÍA ESTADÍSTICA APLICADA
TABLA DE CONTENIDO
FUNDAMENTOS DE LA ESTADÍSTICA .............................................................................. 1
DISTRIBUCIONES DE FRECUENCIA.......................................................................................... 2
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓ N.................................................................. 2
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS ......................................................... 2
DISTRIBUCIÓN DE PROBABILIDAD .................................................................................. 3

DISTRIBUCIONES MUESTRALES ...................................................................................... 3
ESTIMACIÓN CON INTERVALOS DE CONFIANZA ............................................................ 13
PRUEBA DE HIPÓTESIS ................................................................................................. 17
PRUEBAS CUANDO SE TIENEN DOS POBLACIONES ........................................................ 17
ANÁLISIS DE VARIANZA O ANOVA ................................................................................ 18
FUNDAMENTOS DE LA ESTADÍSTICA
Población: Es la recolecció n completa de todas las observaciones de interés para el

investigador.
Parámetro: Es una medida descriptiva de la población total de todas las observaciones de
interés para el investigador.
Muestra: Es una parte representativa de la población que se selecciona para ser estudiada
ya que la población es demasiado grande como para analizarla en su totalidad.
́
Estadistico: Elemento que describe la muestra y sirve como una estimació n del parámetro
de la població n correspondiente.
Estadística Inferencial: involucra el uso de un estadi ́stico para sacar una conclusión o
inferencia sobre el parámetro (de la población) correspondiente.
El estadi ́stico se utiliza como estimador del parámetro, esto depende de la muestra que se
haya tomado.
Error de muestreo: es la diferencia entre el parámetro poblacional y el estadístico de la

muestra utilizado para estimar el parámetro.
Aunque nunca se puede calcular realmente el tamaño del error de muestreo debido a que
el parámetro de la población es desconocido, se debe ser consiente de que es probable
que exista un error de muestreo.
Error de muestreo: Es la diferencia entre el estadi ́stico de la muestra utilizada para
calcular el parámetro de la població n y el valor real pero desconocido del parámetro.
DISTRIBUCIONES DE FRECUENCIA
Frecuencia acumulada: es el número de observaciones que son mayor que o menor que
alguna observación.
Frecuencia relativa: expresa la frecuencia dentro de una clase como un porcentaje del
número total de observaciones.
Frecuencia relativa acumulada: presenta el porcentaje que es mayor que o menor que
alguna observación.
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓ N
Medida de la tendencia central: ubica e identifica el punto alrededor del cual se centran
los datos.
Medidas de dispersió n: miden la dispersió n o variabilidad de los datos y reflejan la
tendencia de las observaciones individuales a desviarse de dicho punto central.
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS
Media: es la medida de la tendencia central que normalmente era considerada como el

promedio
Media poblacional: Es el parámetro .
Media Muestral: Es el estadístico 

Mediana (Me): Es la observación de la mitad después de que se han colocado los datos de
manera ordenada.
Moda: Es la observación que ocurre con mayor frecuencia.
MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS
Rango: es la diferencia entre la observación más alta y la más baja.

Varianza: medida de la variabilidad o dispersión de los datos.
Varianza Poblacional: Es el parámetro 2
Varianza Muestral: Es el parámetro S2
Desviació n estándar: Es la rai ́z cuadrada de la varianza. Es una medida importante de

dispersión de los datos.
Desviación Estándar Poblacional: Es el parámetro .
Desviación Estándar Muestral: Es el estadístico S.
DISTRIBUCIÓN DE PROBABILIDAD
Es una lista de todos los resultados posibles de algún experimento y de la probabilidad

relacionada con cada resultado.
La probabilidad de que la variable aleatoria X tome algún valor específico x 1, se escribe
P(X= x1).
Vale la pena notar que 0  P(X= x1)  1 y que la sumatoria de todos los P(X= xi) = 1.
MEDIA DE LAS DISTRIBUCIONES DISCRETAS

Valor Esperado (E(X)): El valor esperado de una variable aleatoria discreta es la media
ponderada de todos los posibles resultados en los cuales los pesos son las probabilidades
respectivas de tales resultados.
VARIANZA DE LAS DISTRIBUCIONES DISCRETAS

Varianza (2): Es la medida de la variabilidad o dispersión de los datos. Se calcula con la
siguiente fórmula:
Desviación Estándar (): Es la raíz cuadrada de la varianza.
DISTRIBUCIÓN BINOMIAL
Se utiliza si cada ensayo en una distribución binomial termina en solo uno de dos
resultados mutuamente excluyentes, uno de los cuales se identifica como un éxito y el
otro como un fracaso, y si la probabilidad de cada resultado permanece constante de un
ensayo al siguiente. Esto ocurre si el muestreo se realiza con reemplazo o de una
población finita (o muy grande).
La media y la varianza de una distribución binomial:
Distribuciones binomiales acumuladas:
DISTRIBUCIÓN HIPERGEOMÉTRICA
Si se selecciona una muestra sin reemplazo de una población finita conocida y contiene
una proporción relativamente grande de la población, de manera que la probabilidad de
éxito sea perceptiblemente alterada de una selección a la siguiente, debe utilizarse la
distribución hípergeométrica. Se utiliza si la probabilidad de éxito no es constante. Esto
ocurre si la POBLACIÓN ES PEQUEÑA y ocurre el MUESTREO SIN REEMPLAZO.
Si N= 10, y r=4 cumplen una condición, ¿Cuál es la probabilidad de que en una muestra
n=3, x=2 cumplan la misma condición?
DISTRIBUCIÓN DE POISSON
Es una distribución DISCRETA. Mide el número de ocurrencias sobre algún intervalo de
tiempo o espacio. Describe las tasas de llegada dentro de un periodo dado
Son necesarios dos supuestos para la aplicación de la distribución de Poisson:
1. La probabilidad de ocurrencia del evento es constante para dos intervalos
cualesquiera de tiempo o espacio.
2. La ocurrencia del evento en intervalo es independiente de la ocurrencia de otro
intervalo cualquiera.
DISTRIBUCIÓN EXPONENCIAL
Es una distribución CONTÍNUA. Mide el paso del tiempo entre las ocurrencias que se dan
en un intervalo de tiempo. Mientras que la distribución de Poisson describe las tasas de
llegada dentro de un periodo dado, la distribución exponencial ESTIMA EL LAPSO ENTRE
TALES ARRIBOS. El número de ocurrencias tiene una distribución Poisson, el lapso entre
ocurrencias está distribuido exponencialmente.
DISTRIBUCIÓN UNIFORME
Es una distribución en la cual las probabilidades de todos los resultados son las mismas.
Todos los resultados sobre el rango total de posibilidades de distribución son igualmente
posibles, desde el mínimo a hasta el máximo de b.
DISTRIBUCIÓN NORMAL
Es una distribución de datos continuos que produce una curva simétrica en forma de
campana. La media, la mediana y la moda son iguales.
La desviación normal
Como el número de distribuciones normales es infinito, es necesario convertir todas estas
distribuciones normales a una forma estándar. Esta conversión se efectúa con la fórmula
Z.
Cálculo de probabilidades con la desviación normal
Estandarizar una distribución normal permite determinar más fácilmente la probabilidad

de que ocurra cierto evento.
Se puede hallar la probabilidad de que un solo evento este entre X1 y X2, P(X1  X 
X2), simplemente hallando el área bajo la curva entre X1 y X2. Es decir, si se conoce el área,
se conocerá la probabilidad.
En tablas se puede encontrar el área bajo la curva desde la media hasta algún valor por
encima o por debajo
Cálculo de un valor x a partir de una probabilidad conocida
Cuando se sabe cuál probabilidad se requiere, y se debe determinar qué valor de X dará
dicha probabilidad.
Con la probabilidad que se tiene se busca el área bajo la curva que hay desde la media
hasta el valor que se está buscando, con ese valor se busca su valor de Z correspondiente
y con él se despeja X en la ecuación.
La regla general es que, si se trabaja con área a la izquierda de la media, el signo siempre
es negativo.
Aproximación normal a la distribución binomial
Se hace necesario esta aproximación si n ES DEMASIADO GRANDE, ya que puede ser

engorroso calcular la distribución binomial y las tablas no sirven. Esta estimación se
considera lo suficientemente precisa si n  5 Y n(1-)  5 y si  está próximo a 0.5
Para la aproximación, primero se debe hallar:
DISTRIBUCIONES MUESTRALES
Es una lista de todos los valores posibles para un estadístico y la probabilidad relacionada
con cada valor.
Media de las medias muestrales
Una distribución muestral de las medias muestrales es simplemente UNA LISTA DE TODAS
LAS MEDIAS POSIBLES. Éstas, al igual que cualquier lista de número tienen una media
denominada la media de las medias muestrales o la GRAN MEDIA
La varianza y el error estándar de la distribución muestral de las medias muestrales
Varianza:
Mide la dispersión de las observaciones (medias muestrales) alrededor de su media (la
gran media)
Teorema del límite central
A medida que n se vuelve más grande, la distribució n de las medias muestrales se

aproximará a una distribución normal con una media 𝑋 = 𝜇 y un error estándar 𝜎𝑋 = 𝜎/
𝑛(1/2).
La regla general es que si n es por lo menos 30, el teorema del li ́mite central asegurará
una distribución normal en las medias muestrales incluso si la població n no es normal.
Uso de la dstribución normal
Muchas decisiones dependen de una muestra completa y no solo de una observación. En

este caso, la fórmula de conversión debe alterarse para explicar el hecho en el cual se está
interesado, no solo en una obseravación X sino en la media de varias observaciones X. Por
tanto, cuando se hace el muestreo, la fórmula de conversión se vuelve:
Distribución de las proporciones muestrales
Cuando no se trabaja con muestras sino con proporción, se quiere es determinar la

proporción de éxitos y la proporción de fracasos. En estos casos se utiliza la proporción
muestral p para estimar el parámetro desconocido .
El proceso de las proporciones muestrales es muy similar al de las medidas. De cualquier

población es posible obtener muchas muestras diferentes de un tamaño dado. Cada
muestra tendrá su propia proporción de éxitos p. Sin embargo, al igual que con las medias,
el valor esperado de la distribución muestral de las proporciones muestrales será igual a la
proporción de éxitos en la población: E(p)=.
Valor esperado de la distribución muestral

Error estándar
MÉTODOS DE MUESTREO
Una muestra que tergiverse la población presentará un error de muestreo y producirá

estimados imprecisos de los parámetros de la població n. Hay dos fuentes básicas de error
de muestreo, la mala suerte y el sesgo muestral.
Muestreo aleatorio simple: tomar una muestra aleatoria simple garantiza que cada
muestra de algún tamaño dado tenga la misma probabilidad de ser seleccionada. Se
pueden generar sacando los elementos al azar (de un sombrero) o con números
aleatorios.
Muestreo sistemático: se forma seleccionando cada iésimo i ́tem de la població n. La
población debe ordenarse o enumerarse en forma aleatoria. El peligro principal que debe
evitarse es la ocurrencia de un patró n en el ordenamiento de la población.
Muestreo estratificado: se toma una muestra estratificada forzando las proporciones de
la muestra de cada estrato para que esté conforme al patró n poblacional. Se emplea
comú nmente cuando la población es heterogénea, o disi ́mil, aunque ciertos subgrupos
homogéneos puedan aislarse.
Muestreo por conglomerados: consiste en dividir toda la població n en conglomerados, o
grupos, y luego seleccionar una muestra de estos conglomerados. Todas las observaciones
de estos conglomerados seleccionados están incluidas en la muestra.
ESTIMACIÓN CON INTERVALOS DE CONFIANZA
PRUEBA DE HIPÓTESIS
PRUEBAS CUANDO SE TIENEN DOS POBLACIONES

ANÁLISIS DE VARIANZA O ANOVA

Teoría Estadística Aplicada

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Teoría Estadística Aplicada

Cargado por

Copyright:

Formatos disponibles

TEORÍA ESTADÍSTICA APLICADA

DISTRIBUCIÓN DE PROBABILIDAD .................................................................................. 3

Población: Es la recolecció n completa de todas las observaciones de interés para el

Error de muestreo: es la diferencia entre el parámetro poblacional y el estadístico de la

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓ N

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS

Media: es la medida de la tendencia central que normalmente era considerada como el

Media Muestral: Es el estadístico 

Moda: Es la observación que ocurre con mayor frecuencia.

MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS

Rango: es la diferencia entre la observación más alta y la más baja.

Varianza Muestral: Es el parámetro S2

Desviació n estándar: Es la rai ́z cuadrada de la varianza. Es una medida importante de

Es una lista de todos los resultados posibles de algún experimento y de la probabilidad

MEDIA DE LAS DISTRIBUCIONES DISCRETAS

VARIANZA DE LAS DISTRIBUCIONES DISCRETAS

Desviación Estándar (): Es la raíz cuadrada de la varianza.

La media y la varianza de una distribución binomial:

Distribuciones binomiales acumuladas:

Cálculo de probabilidades con la desviación normal

Estandarizar una distribución normal permite determinar más fácilmente la probabilidad

Cálculo de un valor x a partir de una probabilidad conocida

Se hace necesario esta aproximación si n ES DEMASIADO GRANDE, ya que puede ser

Para la aproximación, primero se debe hallar:

Media de las medias muestrales

A medida que n se vuelve más grande, la distribució n de las medias muestrales se

Uso de la dstribución normal

Muchas decisiones dependen de una muestra completa y no solo de una observación. En

Cuando no se trabaja con muestras sino con proporción, se quiere es determinar la

El proceso de las proporciones muestrales es muy similar al de las medidas. De cualquier

Valor esperado de la distribución muestral

Una muestra que tergiverse la población presentará un error de muestreo y producirá

PRUEBAS CUANDO SE TIENEN DOS POBLACIONES

También podría gustarte