Está en la página 1de 18

TEORÍA ESTADÍSTICA APLICADA

TABLA DE CONTENIDO
FUNDAMENTOS DE LA ESTADÍSTICA .............................................................................. 1
DISTRIBUCIONES DE FRECUENCIA.......................................................................................... 2
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓ N.................................................................. 2
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS ......................................................... 2

DISTRIBUCIÓN DE PROBABILIDAD .................................................................................. 3


DISTRIBUCIONES MUESTRALES ...................................................................................... 3
ESTIMACIÓN CON INTERVALOS DE CONFIANZA ............................................................ 13
PRUEBA DE HIPÓTESIS ................................................................................................. 17
PRUEBAS CUANDO SE TIENEN DOS POBLACIONES ........................................................ 17
ANÁLISIS DE VARIANZA O ANOVA ................................................................................ 18

FUNDAMENTOS DE LA ESTADÍSTICA

Población: Es la recolecció n completa de todas las observaciones de interés para el


investigador.
Parámetro: Es una medida descriptiva de la población total de todas las observaciones de
interés para el investigador.
Muestra: Es una parte representativa de la población que se selecciona para ser estudiada
ya que la población es demasiado grande como para analizarla en su totalidad.
́
Estadistico: Elemento que describe la muestra y sirve como una estimació n del parámetro
de la població n correspondiente.

Estadística Inferencial: involucra el uso de un estadi ́stico para sacar una conclusión o
inferencia sobre el parámetro (de la población) correspondiente.
El estadi ́stico se utiliza como estimador del parámetro, esto depende de la muestra que se
haya tomado.

Error de muestreo: es la diferencia entre el parámetro poblacional y el estadístico de la


muestra utilizado para estimar el parámetro.
Aunque nunca se puede calcular realmente el tamaño del error de muestreo debido a que
el parámetro de la población es desconocido, se debe ser consiente de que es probable
que exista un error de muestreo.
Error de muestreo: Es la diferencia entre el estadi ́stico de la muestra utilizada para
calcular el parámetro de la població n y el valor real pero desconocido del parámetro.

DISTRIBUCIONES DE FRECUENCIA

Frecuencia acumulada: es el número de observaciones que son mayor que o menor que
alguna observación.
Frecuencia relativa: expresa la frecuencia dentro de una clase como un porcentaje del
número total de observaciones.
Frecuencia relativa acumulada: presenta el porcentaje que es mayor que o menor que
alguna observación.

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓ N

Medida de la tendencia central: ubica e identifica el punto alrededor del cual se centran
los datos.
Medidas de dispersió n: miden la dispersió n o variabilidad de los datos y reflejan la
tendencia de las observaciones individuales a desviarse de dicho punto central.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS

Media: es la medida de la tendencia central que normalmente era considerada como el


promedio
Media poblacional: Es el parámetro .

Media Muestral: Es el estadístico 


Mediana (Me): Es la observación de la mitad después de que se han colocado los datos de
manera ordenada.

Moda: Es la observación que ocurre con mayor frecuencia.

MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS

Rango: es la diferencia entre la observación más alta y la más baja.


Varianza: medida de la variabilidad o dispersión de los datos.
Varianza Poblacional: Es el parámetro 2

Varianza Muestral: Es el parámetro S2

Desviació n estándar: Es la rai ́z cuadrada de la varianza. Es una medida importante de


dispersión de los datos.
Desviación Estándar Poblacional: Es el parámetro .
Desviación Estándar Muestral: Es el estadístico S.

DISTRIBUCIÓN DE PROBABILIDAD

Es una lista de todos los resultados posibles de algún experimento y de la probabilidad


relacionada con cada resultado.
La probabilidad de que la variable aleatoria X tome algún valor específico x 1, se escribe
P(X= x1).
Vale la pena notar que 0  P(X= x1)  1 y que la sumatoria de todos los P(X= xi) = 1.

MEDIA DE LAS DISTRIBUCIONES DISCRETAS


Valor Esperado (E(X)): El valor esperado de una variable aleatoria discreta es la media
ponderada de todos los posibles resultados en los cuales los pesos son las probabilidades
respectivas de tales resultados.

VARIANZA DE LAS DISTRIBUCIONES DISCRETAS


Varianza (2): Es la medida de la variabilidad o dispersión de los datos. Se calcula con la
siguiente fórmula:

Desviación Estándar (): Es la raíz cuadrada de la varianza.

DISTRIBUCIÓN BINOMIAL
Se utiliza si cada ensayo en una distribución binomial termina en solo uno de dos
resultados mutuamente excluyentes, uno de los cuales se identifica como un éxito y el
otro como un fracaso, y si la probabilidad de cada resultado permanece constante de un
ensayo al siguiente. Esto ocurre si el muestreo se realiza con reemplazo o de una
población finita (o muy grande).

La media y la varianza de una distribución binomial:

Distribuciones binomiales acumuladas:

DISTRIBUCIÓN HIPERGEOMÉTRICA
Si se selecciona una muestra sin reemplazo de una población finita conocida y contiene
una proporción relativamente grande de la población, de manera que la probabilidad de
éxito sea perceptiblemente alterada de una selección a la siguiente, debe utilizarse la
distribución hípergeométrica. Se utiliza si la probabilidad de éxito no es constante. Esto
ocurre si la POBLACIÓN ES PEQUEÑA y ocurre el MUESTREO SIN REEMPLAZO.

Si N= 10, y r=4 cumplen una condición, ¿Cuál es la probabilidad de que en una muestra
n=3, x=2 cumplan la misma condición?

DISTRIBUCIÓN DE POISSON
Es una distribución DISCRETA. Mide el número de ocurrencias sobre algún intervalo de
tiempo o espacio. Describe las tasas de llegada dentro de un periodo dado
Son necesarios dos supuestos para la aplicación de la distribución de Poisson:
1. La probabilidad de ocurrencia del evento es constante para dos intervalos
cualesquiera de tiempo o espacio.
2. La ocurrencia del evento en intervalo es independiente de la ocurrencia de otro
intervalo cualquiera.

DISTRIBUCIÓN EXPONENCIAL
Es una distribución CONTÍNUA. Mide el paso del tiempo entre las ocurrencias que se dan
en un intervalo de tiempo. Mientras que la distribución de Poisson describe las tasas de
llegada dentro de un periodo dado, la distribución exponencial ESTIMA EL LAPSO ENTRE
TALES ARRIBOS. El número de ocurrencias tiene una distribución Poisson, el lapso entre
ocurrencias está distribuido exponencialmente.
DISTRIBUCIÓN UNIFORME
Es una distribución en la cual las probabilidades de todos los resultados son las mismas.
Todos los resultados sobre el rango total de posibilidades de distribución son igualmente
posibles, desde el mínimo a hasta el máximo de b.
DISTRIBUCIÓN NORMAL
Es una distribución de datos continuos que produce una curva simétrica en forma de
campana. La media, la mediana y la moda son iguales.

La desviación normal
Como el número de distribuciones normales es infinito, es necesario convertir todas estas
distribuciones normales a una forma estándar. Esta conversión se efectúa con la fórmula
Z.

Cálculo de probabilidades con la desviación normal

Estandarizar una distribución normal permite determinar más fácilmente la probabilidad


de que ocurra cierto evento.
Se puede hallar la probabilidad de que un solo evento este entre X1 y X2, P(X1  X 
X2), simplemente hallando el área bajo la curva entre X1 y X2. Es decir, si se conoce el área,
se conocerá la probabilidad.

En tablas se puede encontrar el área bajo la curva desde la media hasta algún valor por
encima o por debajo

Cálculo de un valor x a partir de una probabilidad conocida

Cuando se sabe cuál probabilidad se requiere, y se debe determinar qué valor de X dará
dicha probabilidad.
Con la probabilidad que se tiene se busca el área bajo la curva que hay desde la media
hasta el valor que se está buscando, con ese valor se busca su valor de Z correspondiente
y con él se despeja X en la ecuación.
La regla general es que, si se trabaja con área a la izquierda de la media, el signo siempre
es negativo.
Aproximación normal a la distribución binomial

Se hace necesario esta aproximación si n ES DEMASIADO GRANDE, ya que puede ser


engorroso calcular la distribución binomial y las tablas no sirven. Esta estimación se
considera lo suficientemente precisa si n  5 Y n(1-)  5 y si  está próximo a 0.5

Para la aproximación, primero se debe hallar:

DISTRIBUCIONES MUESTRALES

Es una lista de todos los valores posibles para un estadístico y la probabilidad relacionada
con cada valor.

Media de las medias muestrales

Una distribución muestral de las medias muestrales es simplemente UNA LISTA DE TODAS
LAS MEDIAS POSIBLES. Éstas, al igual que cualquier lista de número tienen una media
denominada la media de las medias muestrales o la GRAN MEDIA
La varianza y el error estándar de la distribución muestral de las medias muestrales

Varianza:
Mide la dispersión de las observaciones (medias muestrales) alrededor de su media (la
gran media)
Teorema del límite central

A medida que n se vuelve más grande, la distribució n de las medias muestrales se


aproximará a una distribución normal con una media 𝑋 = 𝜇 y un error estándar 𝜎𝑋 = 𝜎/
𝑛(1/2).
La regla general es que si n es por lo menos 30, el teorema del li ́mite central asegurará
una distribución normal en las medias muestrales incluso si la població n no es normal.

Uso de la dstribución normal

Muchas decisiones dependen de una muestra completa y no solo de una observación. En


este caso, la fórmula de conversión debe alterarse para explicar el hecho en el cual se está
interesado, no solo en una obseravación X sino en la media de varias observaciones X. Por
tanto, cuando se hace el muestreo, la fórmula de conversión se vuelve:
Distribución de las proporciones muestrales

Cuando no se trabaja con muestras sino con proporción, se quiere es determinar la


proporción de éxitos y la proporción de fracasos. En estos casos se utiliza la proporción
muestral p para estimar el parámetro desconocido .

El proceso de las proporciones muestrales es muy similar al de las medidas. De cualquier


población es posible obtener muchas muestras diferentes de un tamaño dado. Cada
muestra tendrá su propia proporción de éxitos p. Sin embargo, al igual que con las medias,
el valor esperado de la distribución muestral de las proporciones muestrales será igual a la
proporción de éxitos en la población: E(p)=.

Valor esperado de la distribución muestral


Error estándar
MÉTODOS DE MUESTREO

Una muestra que tergiverse la población presentará un error de muestreo y producirá


estimados imprecisos de los parámetros de la població n. Hay dos fuentes básicas de error
de muestreo, la mala suerte y el sesgo muestral.
Muestreo aleatorio simple: tomar una muestra aleatoria simple garantiza que cada
muestra de algún tamaño dado tenga la misma probabilidad de ser seleccionada. Se
pueden generar sacando los elementos al azar (de un sombrero) o con números
aleatorios.
Muestreo sistemático: se forma seleccionando cada iésimo i ́tem de la població n. La
población debe ordenarse o enumerarse en forma aleatoria. El peligro principal que debe
evitarse es la ocurrencia de un patró n en el ordenamiento de la población.
Muestreo estratificado: se toma una muestra estratificada forzando las proporciones de
la muestra de cada estrato para que esté conforme al patró n poblacional. Se emplea
comú nmente cuando la población es heterogénea, o disi ́mil, aunque ciertos subgrupos
homogéneos puedan aislarse.
Muestreo por conglomerados: consiste en dividir toda la població n en conglomerados, o
grupos, y luego seleccionar una muestra de estos conglomerados. Todas las observaciones
de estos conglomerados seleccionados están incluidas en la muestra.
ESTIMACIÓN CON INTERVALOS DE CONFIANZA

PRUEBA DE HIPÓTESIS

PRUEBAS CUANDO SE TIENEN DOS POBLACIONES


ANÁLISIS DE VARIANZA O ANOVA

También podría gustarte