Resumen Estadística

Una VARIABLE ALEATORIA es una función que asigna un valor numérico a cada suceso elemental del
espacio muestral.
Una variable aleatoria de tipo discreto es aquella que toma un número finito de valores, e incluso puede
tomar un número infinito, pero siempre que este número infinito sea numerable.
Una de tipo continuo tomará siempre un número infinito NO numerable de valores.
TIPO DISCRETO TIPO CONTINUA

La función de cuantía: Consiste en asignar a cada La función de densidad: Para cada valor x de una
valor que tome la variable aleatoria la probabilidad variable aleatoria continua X se representa por
(o «quantum» de probabilidad) que le corresponde. f(x) .tiene que cumplir los requisitos:
La función de distribución: consiste en asignar Función de distribución: será la probabilidad

probabilidades a todos los valores que están a su asignada a todos los valores que están a la izquierda
izquierda de x (son menores que x). O que van desde - 4 hasta
x.
VARIABLE ALEATORIA BIDIMENSIONAL: se abordará el estudio de dos variables aleatorias. Es decir, se

estudian conjuntamente dos características de un fenómeno aleatorio.
Tipo discreta Tipo continua

Función de cuantía: Función de densidad de probabilidad.
Función de distribución: Función de distribución
¿Qué relación existe entre la f(x,y) y la F(x,y)?---La f(x, y) coincide con la derivada parcial segunda,
respecto a x e y, de la función de distribución F(x, y).
Distribuciones marginales
Tipo discreta Tipo continuo

Funciones de cuantía marginal Funciones de densidad marginales
Funciones de distribución marginal Funciones de distribución marginales

Distribuciones condicionadas
 Distribuciones discretas. El alumno entenderá que tendrá todo el sentido hablar de: las
funciones de cuantía condicionadas y las funciones de distribución condicionadas.
Funciones de cuantía condicionadas se expresan por: P(xi/yj) y P(yj/xi).
Funciones de distribución condicionadas son: F(x/yj) y F(y/xi).
Puesto que el alumno ya estudió en la Introducción a la Estadística el concepto de

probabilidad condicionada, no deberá tener dificultad en comprender las expresiones a
que equivalen las funciones condicionadas anteriores.
 Distribuciones continuas. Aquí cabrá hablar de las funciones de densidad condicionadas y

las funciones de distribución condicionadas.
Funciones de densidad condicionadas: se expresan por f(x/y) y f(y/x). Funciones de

distribución condicionadas: expresadas por F(x/y) y F(y/x).
Al ser distribuciones continuas, recordemos que la probabilidad exigirá siempre

«integrar» la probabilidad elemental «f(x)·dx».
Tipificar una variable aleatoria x es transformarla mediante un cambio de origen Ex y un cambio de
escala  ; es decir hay que restarle la media y dividirla por la desviación típica.
Medidas de forma.
El coeficiente de correlación de Pearson es un índice estadístico que mide la fuerza de la relación lineal
que existe entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, el coeficiente de
correlación de Pearson es independiente de la escala de medida de las variables aleatorias. Se define
como:
Distribución de Bernoulli. Este modelo se utiliza principalmente en
situaciones en las que sólo pueden ocurrir dos
resultados posibles mutuamente excluyentes:
uno de ellos de probabilidad p y la otra 1-p
Distribución binomial. Cuando repetimos de forma independiente
un ensayo Bernoulli
Distribución de Poisson. Cuando observamos la aparición de sucesos

puntuales sobre un soporte continúo.
Distribución de Poisson como límite de la Binomial
La distribución de Poisson se obtiene como limite de la distribución binomial cuando n  , , de

manera que podemos considerar un soporte continuo,y p  ,para que el número medio de
sucesos, np , permanezca constante. En este caso np = , es decir el número de éxitos es una
variable aleatoria que tiene una distribución de Poisson con el parámetro .
Uniforme: Es la distribución donde todos resultados
posibles tienen la misma probabilidad, en este caso
la variable aleatoria al ser de tipo continuo toma
todos los posibles valores en un intervalo finito
Normales la distribución más utilizada porque la

mayoría de las variables utilizadas en fenómenos
sociales se distribuyen aproximadamente siguiendo
este modelo. La estudiaremos más detalladamente a
continuación y se le llama comúnmente distribución
normal
Ejemplos de distribuciones normales
Aproximación a la distribución normal la distribución binomial

El teorema de Moivre (1.756) permite realizar esta aproximación considerando que las variables
aleatorias sigan una distribución binomial con p=q=1/2 este teorema fue generalizado para
distribuciones no simétricas P q.
Teorena Central del Límite: No existe un único Teorema Central del Límite, sino un conjunto de
teoremas, todos ellos dando condiciones para que una sucesión de variables aleatorias tienda a
distribuirse según una distribución normal. Muchas variables aleatorias que se encuentran en la práctica
son sumas o promedios de un número grande de variables aleatorias independientes.
- La validez del teorema central del límite no está limitado a variables aleatorias
continuas y simétricas, se extiende también a variables aleatorias discretas y
asimétricas. Así tenemos el Teorema de Moivre
- Si las variables aleatorias no son independientes o no tienen la misma distribución

de probabilidad, en ese caso habrá que utilizar otras condiciones de mayor
dificultad que no consideraremos en este caso
Estimación puntual.
En una estimación puntual se utiliza un solo número o valor para determinar una
estimación del parámetro poblacional desconocido. En la estimación puntual se asume que
el estadístico es un buen estimador del parámetro desconocido. Obviamente cualquier
estadístico no sirve, es necesario que satisfaga ciertas propiedades:
Estimación por intervalos de confianza.

En un intervalo de confianza se indica un rango o recorrido, dentro del cual se pondría
encontrar el parámetro poblacional desconocido, y el nivel de confianza de que el intervalo
contenga este parámetro poblacional.
Contrastación de hipótesis.
Una hipótesis estadística es una conjetura relativa a alguna característica de la población,
que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la
información extraída de las muestras, y tanto si se aceptan como si se rechazan se puede
cometer un error.
La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa
por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1).
En este caso los pasos a seguir son los siguientes, plantear las hipótesis, escoger un
estadístico concreto, conocer la distribución de este estadístico y decidir, con los datos de
la muestra, si estamos caracterizando a la población.
1-Estimador insesgado o centrado y de varianza mínima. Cota de Cramer-Rao.
2. Estimador eficiente.
Se tiene dos estimadores insesgados , que siguen las mismas distribuciones , para
un mismo tamaño muestral n , se sidece que uno es más eficiente que el otro
cuando su varianza es menor.
Var estimador 1  Var estimador 2
3.Estimador consistente.
La consistencia de un estimador está relacionada con el comportamiento del estimador

cuando el tamaño de la muestra aumenta. Es decir, a medida que el tamaño de la muestra
aumenta la información que nos proporciona sobre la población será mayor.
4.Estimador suficiente.
Diremos que un estadístico suficiente para un parámetro poblacional desconocido

cuando recoge toda la información que la muestra contiene sobre el parámetro.
Estimador invariante: Un estimador es invariante si se verifica que el estimador de una función del
parámetro es igual a la función del estimador del parámetro.
Estimador robusto: Un estimador es robusto cuando pequeños cambios en las hipótesis de

partida del procedimiento de estimación considerado, no producen variaciones
significativas en los resultados obtenidos.
Métodos de obtención de estimadores.
Método de los Es el método más sencillo y antiguo. Se suele utilizar para

obtener una primera aproximación de los estimadores. Se
momentos
igualan tantos momentos muestrales, como parámetros se
tengan que estimar.
Propiedades:
- Si los parámetros desconocidos son momentos

poblacionales, entonces los estimadores obtenidos
serán insesgados y asintóticamente normales
- Bajo condiciones bastantes generales, los estimadores obtenidos

serán consistentes.
Método de máxima En esencia el método consiste en seleccionar como estimador

del parámetro, de un modelo probabilístico, a aquél valor que
verosimilitud
tiene la propiedad de maximizar el valor de la probabilidad de la
muestra observada. Es decir, encontrar el valor del parámetro
que maximiza la función de verosimilitud.
Propiedades:
- Los estimadores de máxima verosimilitud son

consistentes.
- Todo estimador de máxima verosimilitud no es

eficiente, pero sí son asintóticamente eficientes.
- Son asintóticamente normales.
- Son suficientes.
- En general son sinsesgados , pero si no son insesgados

son asintóticamnete insesgados.
Estimación por intervalos de confianza
Introduciendo un nuevo método de estimación, que llamaremos «estimación por intervalos». En este
método se trata de hallar dos estadísticos t1 (X1, X2,..., Xn) y t2 (X1, X2,..., Xn) que serán, por tanto,
variables aleatorias como ya sabemos, y tales que para el parámetro poblacional desconocido θ, se
cumpla:
Siendo conocida Siendo desconocida
Intervalo de confianza para la media.
n>=30
n<30
Siendo μ conocida Siendo μ desconocida

Intervalo de confianza para la varianza
Obtener un intervalo para la μ con varianza conocida( Desigualdad de CHEBYCHEV)
Intervalo de confianza de una proporción

Se utiliza un método gráfico (n es pequeña)
n es grande
Contrastes de hipótesis.
Hipótesis estadística: Es cualquier afirmación que hagamos, verdadera o falsa, sobre alguna
característica desconocida de la población.
Contraste paramétrico: Si la hipótesis formulada se refiere al valor de un parámetro desconocido

e de la población.
Contraste no paramétrico: Si la hipótesis formulada se refiere a la forma que tiene la función de

probabilidad [v. gr. la función de cuantía, o la función de densidad f(x, )] de la población.
La hipótesis que contrastamos se llama hipótesis nula H 0  y la contrastamos con la

hipótesis alternativa H1)
- Si una hipótesis, nula o alternativa, designa un único valor, llamado parámetro poblacional  en
este caso, se dice que la hipótesis es simple.
- La hipótesis, nula o alternativa, también puede designar un rango de valores para el
parámetro desconocido. Una hipótesis de este tipo se denomina compuesta y será cierta para más
de un valor del parámetro poblacional.
Si sólo se dispone de una muestra de la población, entonces el parámetro poblacional no se

conocerá con exactitud. Por consiguiente, no se puede saber con seguridad si la hipótesis nula es
cierta o falsa.
 El Error de Tipo I, es rechazar la hipótesis nula cuando es cierta. Si la regla de decisión

es tal que la probabilidad de rechazar la hipótesis nula cuando es cierta es ,
entonces se llama nivel de significación del contraste. Por tanto, la
probabilidad de aceptar la hipótesis nula cuando es cierta es (1- )
 El Error de Tipo II, ocurre cuando no se rechaza la hipótesis nula y es falsa. Supongamos
que para una determinada regla de decisión particular, la probabilidad de cometer este
error se denota por . Entonces, la probabilidad de rechazar una hipótesis nula falsa es
(1-y se denomina potencia del contraste.
Fases a realizar en un contraste de hipótesis.

Paramétricas, se refieren a características de los parámetros poblacionales.
No paramétricas, relacionadas con las características de la distribución.
1. Formular la hipótesis nula H 0 y la hipótesis alternativa H1 
2. Determinar el estadístico apropiado, que se utilizará para rechazar o no rechazar la hipótesis
nula H 0 
3. Seleccionar el nivel de significación, valor
4. Determinar la región crítica o región de rechazo y la región de aceptación en la curva de la

distribución del estadístico.
5. Seleccionar aleatoriamente la muestra y calcular el valor del estadístico.
6. Interpretación: Si el valor calculado para el estadístico cae dentro de la región crítica, entonces la
hipótesis nula H 0  se rechaza y si cae dentro de la región de aceptación entonces no se rechaza
H 0 
Valor Probabilístico o P-valor.
Contraste no significativo: p- valor > α (no se rechaza H 0 )
Contraste significativo: p- valor ≤ α (se rechaza H 0 )
Contrastes no paramétricos.
Pruebas paramétricas
Ventajas: Desventajas:
1.- Por lo general, son fáciles de usar y
entender.
1.-Pueden, ignorar,
2.- Eliminan la necesidad
desperdiciar o incluso
de suposiciones restrictivas
prescindir de información.
de las pruebas
paramétricas. 3.- Se pueden 2.- No son tan eficientes
usar con muestras (potentes) como las
pequeñas. paramétricas.
4.- Se pueden usar con datos

cualitativos.
Los contrastes no paramétricos que vamos a estudiar se clasifican en los siguientes

grupos:
 Contrastes de aleatoriedad: contrastan hipótesis sobre la aleatoriedad de las

muestras
Concepto de racha: Sea una sucesión en la que intervienen dos tipos de símbolos entonces definimos
una racha como una sucesión de uno o más símbolos idénticos, que están precedidos o seguidos
por un símbolo diferente o por ninguno, siendo la longitud de una racha el número de símbolos
iguales que incluye.
n grande muestra concreta
 Contrastes de localización: Contrastan hipótesis sobre medidas de posición
 Contrastes de comparación de poblaciones: contrastan hipótesis

sobre las distribuciones poblacionales

Resumen Estadística

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen Estadística

Cargado por

Copyright:

Formatos disponibles

Una VARIABLE ALEATORIA es una función que asigna un valor numérico a cada suceso elemental del

Una de tipo continuo tomará siempre un número infinito NO numerable de valores.

TIPO DISCRETO TIPO CONTINUA

La función de distribución: consiste en asignar Función de distribución: será la probabilidad

VARIABLE ALEATORIA BIDIMENSIONAL: se abordará el estudio de dos variables aleatorias. Es decir, se

Tipo discreta Tipo continua

Función de distribución: Función de distribución

Tipo discreta Tipo continuo

Funciones de distribución marginal Funciones de distribución marginales

Funciones de cuantía condicionadas se expresan por: P(xi/yj) y P(yj/xi).

Funciones de distribución condicionadas son: F(x/yj) y F(y/xi).

Puesto que el alumno ya estudió en la Introducción a la Estadística el concepto de

 Distribuciones continuas. Aquí cabrá hablar de las funciones de densidad condicionadas y

Funciones de densidad condicionadas: se expresan por f(x/y) y f(y/x). Funciones de

Al ser distribuciones continuas, recordemos que la probabilidad exigirá siempre

Distribución de Poisson. Cuando observamos la aparición de sucesos

Distribución de Poisson como límite de la Binomial

La distribución de Poisson se obtiene como limite de la distribución binomial cuando n  , , de

Normales la distribución más utilizada porque la

Ejemplos de distribuciones normales

Aproximación a la distribución normal la distribución binomial

- Si las variables aleatorias no son independientes o no tienen la misma distribución

Estimación por intervalos de confianza.

1-Estimador insesgado o centrado y de varianza mínima. Cota de Cramer-Rao.

Var estimador 1  Var estimador 2

La consistencia de un estimador está relacionada con el comportamiento del estimador

Diremos que un estadístico suficiente para un parámetro poblacional desconocido

Estimador robusto: Un estimador es robusto cuando pequeños cambios en las hipótesis de

Métodos de obtención de estimadores.

Método de los Es el método más sencillo y antiguo. Se suele utilizar para

- Si los parámetros desconocidos son momentos

- Bajo condiciones bastantes generales, los estimadores obtenidos

Método de máxima En esencia el método consiste en seleccionar como estimador

- Los estimadores de máxima verosimilitud son

- Todo estimador de máxima verosimilitud no es

- Son asintóticamente normales.

- En general son sinsesgados , pero si no son insesgados

Estimación por intervalos de confianza

Siendo μ conocida Siendo μ desconocida

Obtener un intervalo para la μ con varianza conocida( Desigualdad de CHEBYCHEV)

Intervalo de confianza de una proporción

Contraste paramétrico: Si la hipótesis formulada se refiere al valor de un parámetro desconocido

Contraste no paramétrico: Si la hipótesis formulada se refiere a la forma que tiene la función de

La hipótesis que contrastamos se llama hipótesis nula H 0  y la contrastamos con la

Si sólo se dispone de una muestra de la población, entonces el parámetro poblacional no se

 El Error de Tipo I, es rechazar la hipótesis nula cuando es cierta. Si la regla de decisión

probabilidad de aceptar la hipótesis nula cuando es cierta es (1- )

(1-y se denomina potencia del contraste.

Fases a realizar en un contraste de hipótesis.

No paramétricas, relacionadas con las características de la distribución.

1. Formular la hipótesis nula H 0 y la hipótesis alternativa H1 

2. Determinar el estadístico apropiado, que se utilizará para rechazar o no rechazar la hipótesis

3. Seleccionar el nivel de significación, valor

4. Determinar la región crítica o región de rechazo y la región de aceptación en la curva de la

5. Seleccionar aleatoriamente la muestra y calcular el valor del estadístico.

Contraste significativo: p- valor ≤ α (se rechaza H 0 )

usar con muestras (potentes) como las

4.- Se pueden usar con datos

Los contrastes no paramétricos que vamos a estudiar se clasifican en los siguientes

 Contrastes de aleatoriedad: contrastan hipótesis sobre la aleatoriedad de las

n grande muestra concreta

 Contrastes de localización: Contrastan hipótesis sobre medidas de posición

 Contrastes de comparación de poblaciones: contrastan hipótesis