Está en la página 1de 16

Capítulo 1.

Conceptos básicos de la Estadística


1.1 El análisis estadístico
El análisis estadístico de datos engloba un conjunto de procedimientos diseñados para:
1. Seleccionar datos
2. describirlos y
3. extraer conclusiones de ellos.

Estadística: Ciencia que recoge, ordena y analiza los datos de una muestra extraida de una determinada
población, para hacer inferencias acerca de esa población valiéndose del cálculo de probabilidades

•Estadística descriptiva. Organizar y resumir la información contenida en un conjunto (muestra) de datos.

•Estadística inferencial. Generalizar (inferir) las propiedades de un conjunto de datos empíricos (muestra)
al conjunto total de datos (población) a los que representa. Para poder efectuar esta generalización es
imprescindible que el conjunto de datos utilizados para obtener información sea representativo del
conjunto total de datos sobre el que se desea realizar la inferencia, es decir, es necesario efectuar una
correcta selección de los datos (Técnicas de muestreo).

1
Capítulo 1. Conceptos básicos de la Estadística
1.2 Conceptos básicos
Población. Conjunto de elementos que poseen una o más características en común. Dependiendo del número
de elementos de que constan, las poblaciones son finitas o infinitas.
Muestra. Subconjunto de elementos de una población. El objetivo de la inferencia estadística es extraer
conclusiones referidas a todos los elementos de la población a partir de la observación de sólo unos pocos
elementos de esa población. Para que esto sea posible es necesario que la muestra sea representativa de la
población, esto se consigue mediante las técnicas de muestreo.
Parámetro. Valor numérico que describe una característica de una población. Los parámetros son, en general,
valores poblacionales desconocidos. Los parámetros son valores numéricos constantes, es decir, NO son
variables.
Estadístico. Valor numérico que describe una característica de la muestra. NO es un valor numérico constante,
sino que es una variable: su valor concreto depende de la muestra en la que es calculado.
Muestreo. Proceso seguido para extraer una muestra de una población. Es necesario utilizar muestras
representativas del total de la población, es decir, muestras en las que exista alguna garantía de que cualquier
elemento de la población ha podido estar representado en ellas. El muestreo puede ser de dos tipos:
- Muestreo probabilístico. En este muestreo se conoce (o puede calcularse) la probabilidad asociada a
cada una de las muestras que es posible extraer de una determinada población
- Muestreo no probabilístico. En él se desconoce o no se tiene en cuenta la probabilidad asociada a cada
una de las muestras posibles; el investigador selecciona aquella muestra que, en su opinión, es más
representativa.
Solo el muestreo probabilístico permite obtener una idea sobre el grado de representatividad de una muestra.
Distribución muestral. El concepto de distribución muestral se refiere al comportamiento de un estadístico.
Los estadísticos son variables aleatorias. Como tales, tienen su propia función de probabilidad. Una 2
distribución muestral puede quedar caracterizada haciendo explícita su forma o su valor esperado y su varianza.
Capítulo 1. Conceptos básicos de la Estadística
1.3 Distribuciones de probabilidad más usuales
DISTRIBUCIÓN NORMAL.
Una v.a. X se dice que sigue una distribucion Normal de media  y desviacion tipica  (X  N( , )) si
su funcion de densidad es
1  1  x    2 
f ( x)  exp  , x  
2 2
 2  2

X 
Caso tabulado: N(0,1) Tipificación: Si X  N (  ,  )  Z   N (0,1)

DISTRIBUCIÓN CHI-CUADRADO
Sean X1 ,...,X n v.a. independientes e identicamente distribuidas segun N(0,1)  Y=X12 +  +Xn2   2

DISTRIBUCIÓN T-STUDENT
Z
Sean Z  N (0,1), Y   n2 , Z e Y v.a. independientes  T=  tn
Y
n
DISTRIBUCIÓN F-SNEDECOR
X /n
Sean X   n2 , Y   m2 , X e Y v.a. independientes  F=  Fn ,m
Y /m

3
Capítulo 1. Conceptos básicos de la Estadística
1.4 La inferencia estadística
1.4.1 La estimación de parámetros
Consiste en utilizar la información muestral para inferir alguna propiedad de la población. Es decir, utilizar
un estadístico que recibe el nombre de estimador para inferir el valor de algún parámetro. A esta estimación
directa se le llama estimación puntual.
Si al valor muestral o estimador puntual se le suma y resta una cantidad para estimar no un valor concreto,
sino un rango de valores, se habla de estimación por intervalos. La cantidad que se suma y se resta se llama
error máximo y depende de la distribución muestral del estadístico. El error máximo se calcula intentando que
el intervalo construido incluya el valor del parámetro con una probabilidad alta y conocida. Esta probabilidad
recibe el nombre de nivel de confianza y suele establecerse en 0.95. El intervalo de valores se le llama
intervalo de confianza y viene definido por dos valores: el límite inferior y el límite superior.

1.4.2 Contrastes de hipótesis


Es un método de toma decisiones. Es un procedimiento que permite decidir si una proposición acerca de una
población puede ser mantenida o debe ser rechazada. Pasos:
Formular estadísticamente la hipótesis científica que se desea contrastar.
Buscar evidencia empírica relevante capaz de informar sobre si la hipótesis establecida es o no
sostenible.
Establecer una regla de decisión. Esta regla es de este tipo: si el resultado muestral observado es,
suponiendo correcta la hipótesis, muy poco probable, se considerará que la hipótesis es incompatible con
los datos; por el contrario, si el resultado muestral observado es, suponiendo correcta la hipótesis, 4
probable, se considerará que la hipótesis es compatible con los datos.
Capítulo 1. Conceptos básicos de la Estadística
1.4 La inferencia estadística
1.4.2 Contrastes de hipótesis
ótesis estadísticas. Una afirmación sobre la forma de una o más distribuciones de probabilidad o sobre
alor de uno o más parámetros de esas distribuciones. Un contraste de hipótesis se basa en la formulación
os hipótesis:
1. Hipótesis nula. Es la que se somete a contraste.
2. Hipótesis alternativa. Es la negación de la hipótesis nula. Incluye todo lo que excluye la hip. nula.
Suelen plantearse como hipótesis rivales. Son exhaustivas y mutuamente excluyentes.
El signo = siempre va en la hipótesis nula ya que es desde donde se inicia el proceso de contrastación.
Si en la hip. alternativa aparece el signo distinto estamos ante un contraste bilateral. En otro caso será un
contraste unilateral.

Supuestos. Una hipótesis que especifica por completo la distribución poblacional se le llama simple. En otro
caso se denomina compuesta. Los supuestos son un conjunto de afirmaciones que hay que establecer sobre la
población de partida y sobre la muestra utilizada para conseguir determinar la distribución de probabilidad en
la que se basará la decisión sobre la hipótesis nula.

Estadístico de contraste. Es un resultado muestral que


1. proporciona información empírica relevante sobre la afirmación propuesta en la hipótesis nula.
2. posee una distribución muestral conocida.
5
Capítulo 1. Conceptos básicos de la Estadística
1.4 La inferencia estadística
1.4.2 Contrastes de hipótesis
egla de decisión. Criterio que se utiliza para decidir si la hipótesis nula planteada debe o no ser rechazada.
e basa en la partición de la distribución muestral del estadístico de contraste en dos zonas exclusivas y
haustivas:
.Zona de rechazo. Área de la distribución muestral que corresponde a los valores del estadístico de
contraste que se encuentran tan alejados de la afirmación de la hipótesis nula, que es muy poco
probable que ocurran si la hipótesis nula es verdadera. Su probabilidad se denomina nivel de
significación.
.Zona de aceptación. Área de la distribución muestral que corresponde a los valores del estadístico
próximos a la afirmación establecida en la hipótesis nula.
os valores que separan ambas regiones se denominan valores críticos. La regla de decisión consiste en
echazar la hipótesis nulas si el estadístico de contraste toma un valor perteneciente a la región de rechazo y
mantenerla si el estadístico toma un valor perteneciente a la zona de aceptación.
l tamaño de las zonas de rechazo y de aceptación se determina fijando el nivel de significación (1%, 5%)
a forma de dividir la distribución muestral en zona de rechazo y zona de aceptación depende de que el
ontraste sea bilateral o unilateral.
La decisión. Consiste en rechazar o mantener la hipótesis nula particular. Si se rechaza se está afirmando que
esa hipótesis es falsa. Por el contrario, si se mantiene, no se está afirmando que ha quedado probado que esa
hipótesis es verdad, simplemente se está afirmando que no se dispone de evidencia empírica suficiente para
rechazarla y que, por tanto, puede considerarse compatible con los datos.
6
Capítulo 1. Conceptos básicos de la Estadística
1.5 Intervalos de confianza en poblaciones normales
Media   S 
poblacional: P     X  t   1  
n 


n 1;1
 2

Diferencias de
medias
poblacionales: Muestras pequeñas (< o = 30):
   n  1 S x2   m  1 S y2 1 1  
  P x   y    X  Y   t
2 2
x y      1
  n  m  2;1 nm2 n m 
  2


2
 1 
  S x2 S y  
2     x2 S x2
P  x   y    X  Y   t  n m
  
2 2
   1   , v  ,  2  2
x y
  v ;1 n m  2 1  y Sy
  2
  2
n  n  1 m  m  1
2

Diferencias de
medias pobl.: Muestras grandes
  2
S y2 
P  x   y   X  Y   z 
 S   1
x
 7
  1 n n y 

  2 x

Capítulo 1. Conceptos básicos de la Estadística
1.5 Intervalos de confianza en poblaciones normales

  
Varianza  2   n  1 S  n  1 S 
2 2

poblacional: P    2 , 2   1  
   n 1;1   
n 1;
  2 2 

Cociente de  2  
 y 
2 2
varianzas 1 Sy S y 
P  2  ,f  1 
n 1, m 1;1 S 2  

pob.: x  f S 2
x 
 m 1, n 1;1
 x 2
  2 
Proporción   pˆ (1  pˆ ) 
poblacional: P  p   pˆ  z    1  

  1
2 n 
Diferencia de   pˆ x (1  pˆ x ) pˆ y (1  pˆ y )  
proporciones P  px  p y   pˆ x  pˆ y   z      1  
1  n m 
poblacionales  2  

8
Capítulo 1. Conceptos básicos de la Estadística
1.6 Contrastes de hipótesis en poblaciones normales

Sobre la media poblacional

Hipótesis Nula Valor del Estadístico bajo Hip. Nula


X  0
H 0 :   0 texp 
S
n

Hipótesis Alternativa Región Crítica

texp  t 
 n 1;1
2

H1 :    0 Rechazar H 0 si  ó
 texp  t 
 n 1;1
2

H1 :    0 Rechazar H 0 si t exp  t n 1;1


H1 :    0 Rechazar H 0 si t exp  t n 1;1

9
Capítulo 1. Conceptos básicos de la Estadística
1.6 Contrastes de hipótesis en poblaciones normales
Sobre la diferencia de medias poblacionales.
Varianzas Poblacionales desconocidas pero iguales. Muestras Pequeñas

Hipótesis Nula Valor del Estadístico bajo Hip. Nula


X  Y  0
H 0 :  x   y  0 texp 
 n  1 S x2   m  1 S y2 1 1

nm2 n m

Hipótesis Alternativa Región Crítica

texp  t 
n  m  2;1
 2

H1: x   y  0 Rechazar H 0 si  ó
 t t
 exp n  m 2;12
H1: x   y  0 Rechazar H 0 si t exp  t n m 2;1
H1: x   y  0 Rechazar H 0 si t exp  t n m 2;1

10
Capítulo 1. Conceptos básicos de la Estadística
1.6 Contrastes de hipótesis en poblaciones normales
Sobre la diferencia de medias poblacionales.
Varianzas Poblacionales desconocidas y diferentes. Muestras Pequeñas
Hipótesis Nula Valor del Estadístico bajo Hip. Nula
X  Y  0
H 0 :  x   y  0 texp 
2
S x2 S y

n m

Hipótesis Alternativa Región Crítica


texp  t 
 v ;1
2
ó
H1 :  x   y   0 Rechazar H 0 si 
 texp  t 
 v ;1
2

H1 :  x   y   0 Rechazar H 0 si t exp  tv ;1


H1 :  x   y   0 Rechazar H 0 si t exp  tv;1

2
 1 
    x2 S x2
v n m ; 2  2
2 1  y Sy
 2 2
n  n  1 m  m  1
2 2 11
Capítulo 1. Conceptos básicos de la Estadística
1.6 Contrastes de hipótesis en poblaciones normales

Sobre la diferencia de medias poblacionales.


Varianzas Poblacionales desconocidas. Muestras grandes

Hipótesis Nula Valor del Estadístico bajo Hip. Nula


X  Y  0
H 0 :  x   y  0 zexp 
2
S x2 S y

n m

Hipótesis Alternativa Región Crítica

 zexp   z 
 1
2
ó
H1 :  x   y   0 Rechazar H 0 si 
 zexp  z 
 1
2

H1 :  x   y   0 Rechazar H 0 si zexp  z1


H1 :  x   y   0 Rechazar H 0 si zexp   z1

12
Capítulo 1. Conceptos básicos de la Estadística
1.6 Contrastes de hipótesis en poblaciones normales

Sobre la varianza poblacional

Hipótesis Nula Valor del Estadístico bajo Hip. Nula


 n  1 S 2
H0 :  
2 2
0  exp 
 02

Hipótesis Alternativa Región Crítica

  exp   2 
 n 1;
2
ó
H1 :  2   02 Rechazar H 0 si 
   2
 exp n 1;1

2

H1 :  2   02 Rechazar H 0 si  exp   n21;1


H1 :  2   02 Rechazar H 0 si  exp   n21;

13
Capítulo 1. Conceptos básicos de la Estadística
1.6 Contrastes de hipótesis en poblaciones normales

Sobre igualdad de varianzas poblacionales

Hipótesis Nula Valor del Estadístico bajo Hip. Nula


S x2
H0 :  
2
x
2
y
f exp  2
Sy

Hipótesis Alternativa Región Crítica

 1
 f exp 
f
 m 1, n 1;1

 2
H1: x2   y2 Rechazar H 0 si 
ó
 f exp  f 
 n 1, m 1;1
2

H1: x2   y2 Rechazar H 0 si f exp  f n 1,m1;1


1
H1: x2   y2 Rechazar H 0 si f exp 
f m1,n 1;1

14
Capítulo 1. Conceptos básicos de la Estadística
1.6 Contrastes de hipótesis en poblaciones normales

Sobre una proporción poblacional

Hipótesis Nula Valor del Estadístico bajo Hip. Nula


pˆ  p0
zexp 
H 0 : p  p0 p0 1  p0 
n
Hipótesis Alternativa Región Crítica

 zexp   z 
 1
2
ó
H1 : p  p0 Rechazar H 0 si 
 zexp  z 
 1
2

H1 : p  p0 Rechazar H 0 si zexp  z1


H1 : p  p0 Rechazar H 0 si zexp   z1

15
Capítulo 1. Conceptos básicos de la Estadística
1.6 Contrastes de hipótesis en poblaciones normales
Sobre igualdad de proporciones poblacionales

Hipótesis Nula Valor del Estadístico bajo Hip. Nula

H 0 : px  p y
pˆ x  pˆ y
zexp 
n  m npˆ x  mpˆ y  npˆ x  mpˆ y 
1  
nm nm  nm 

Hipótesis Alternativa Región Crítica

 zexp   z 
 1
2
ó
H1 : p x  py Rechazar H 0 si 
 zexp  z 
 1
2

H1 : p x  py Rechazar H 0 si zexp  z1


H1 : p x  py Rechazar H 0 si zexp   z1

16

También podría gustarte