Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2018
Ciencias Jurídicas Y Sociales
Quinto Semestre
Metodos Estadisticos Para Investigadores
TEXTO PARALELO
UNIFICADO
POLLETH SINTO
Página 1 de 74
Polleth Sinto
16/06/2018 22:31:00
14 ESTIMA DE MAXIMA VEROSIMILITUD............................................................... 33
15 ESTIMAS INSESGADAS Y EFICIENTES ............................................................... 36
15.1 Estimadores insesgados ................................................................................................... 36
15.2 Error cuadrático medio. Estimadores insesgados de varianza mínima ............................ 38
15.3 Estimadores insesgados de mínima varianza ................................................................... 39
15.4 Estimadores Eficientes .................................................................................................... 41
16 ESTIMAS POR INTERVALOS DE CONFIANZA DE PROPORCIONES ................. 42
17 ESTIMAS POR INTERVALOS DE CONFIANZA PARA VARIANZAS .................... 43
18 ESTIMAS POR INTERVALO DE CONFIANZA PARA PROPORCIONES .............. 43
19 ESTIMAS POR INTERVALO DE CONFIANZA PARA DIFERENCIAS Y SUMAS . 44
20 ANEXO ..................................................................................................................... 46
21 Intervalo de confianza para una población ................................................................ 47
22 Intervalo para proporción .......................................................................................... 55
23 Ensayos de hipótesis .................................................................................................. 58
23.1 Hipótesis nula.................................................................................................................. 58
23.2 Hipótesis alternativa ....................................................................................................... 58
24 Nivel de significancia ................................................................................................ 58
24.1 Error tipo I y tipo II ........................................................................................................ 59
25 Ensayos de hipótesis para una población ................................................................... 60
25.1 La prueba de hipótesis tiene varias etapas: ..................................................................... 61
26 Pruebas de hipótesis para una población ................................................................... 62
26.1 Elementos de LA prueba:................................................................................................ 62
o Es la hipótesis o afirmación a ser probada ..................................................................... 63
o Puede ser por ejemplo =, σ, o a constante ................................................................ 63
o Sólo puede ser rechazada o no rechazada ...................................................................... 63
27 Prueba de hipótesis Estadística .................................................................................. 64
28 Estadístico de prueba ................................................................................................. 66
28.1 Pruebas de Hipótesis de dos colas: .................................................................................. 66
28.2 Pruebas de Hipótesis de cola derecha: ............................................................................. 67
28.3 Pruebas de Hipótesis cola izquierda: ............................................................................... 67
29 Modelos de Regresión y Correlación Lineal Simple y Múltiple ................................... 68
Página 2 de 74
Polleth Sinto
16/06/2018 22:31:00
29.1 Regresión Lineal Simple y Múltiple................................................................................. 68
29.2 Correlación Lineal Simple y Múltiple Correlación. ......................................................... 70
29.2.1 Coeficiente de correlación múltiple. ................................................................................................ 70
29.2.2 Correlación Parcial .......................................................................................................................... 72
29.2.3 Relación entre los coeficientes de correlación. ................................................................................ 73
29.2.4 Cálculo del coeficiente de correlación parcial. ................................................................................ 73
Página 3 de 74
Polleth Sinto
16/06/2018 22:31:00
1. TEORÍA DEL MUESTREO1
(Primera Semana)
Esta teoría trata sobre los fundamentos probabilísticos, las distribuciones estadísticas, los métodos
o técnicas de selección, las fórmulas de cálculo de los errores de muestreo, las fórmulas y tablas de
determinación del tamaño de la muestra, los métodos de estimación de los parámetros
poblacionales a partir de los estadísticos muestrales. Nosotros daremos una guía básica de
introducción a la teoría de las muestras.
Esta teoría indica los procedimientos o técnicas para extraer una parte o muestra del colectivo o
población que se quiere estudiar, o analizar en ella las características que interesen y el del resultado
de este análisis inferir o afirmar algo del universo total.
1
José Rodriguez, Ruben José (Lic.,Prof); “TEORÍA BÁSICA DEL MUESTREO®”
http://www.rubenjoserodriguez.com.ar/wp-content/uploads/2011/07/Teoria_Basica_del_Muestreo.pdf
2
Martinez Bencardino, Ciro. “Estadística y muestreo” Décima tercera edición. Complemento virtual. Pag.274
Página 4 de 74
Polleth Sinto
16/06/2018 22:31:00
1.2 Muestreo Con O Sin Reemplazo3
Si se extrae un objeto de una urna, se tiene la opción de devolverlo o no a ella antes de hacer otra
extracción. En el primer caso un objeto particular se puede extraer varias veces, mientras que en el
segundo caso sólo se puede extraer una vez. Un muestreo en el que cada miembro de la población
es extraído una sola vez se le llama muestreo sin reemplazo, mientras que un muestreo en el que
cada miembro puede ser extraído varias veces se le llama muestreo con reemplazo.
Desde un punto de vista teórico, una población finita que se muestra con reemplazo se considera
teóricamente infinita, puesto que pueden extraerse muestras de cualquier tamaño sin agotar la
población. Para la mayoría de los propósitos prácticos, el muestreo de una población finita muy
grande puede considerarse como un muestreo de una población infinita.
2 MÉTODOS DE MUESTREO4
(Segunda Semana)
2.1 Probabilístico
Es requisito que todos y c/u de los elementos de la población tengan la misma probabilidad de ser
seleccionados (azar). Se debe tener disponible un listado completo de todos los elementos de la
población, a esto se le llama MARCO DE MUESTREO.
A. Aleatorio Simple
Cada sujeto tiene una probabilidad igual de ser seleccionado para el estudio.
3
Universidad Interamericana para el Desarrollo. “Estadística Inferencial” págs. 3 y 4
4
Espinoza Salvadó, Iván. Dr. “Tipos de Muestreo”
Página 5 de 74
Polleth Sinto
16/06/2018 22:31:00
a. Estratificado: Cuando la muestra incluye subgrupos representativos (estratos) de
los elementos de estudio con características específicas: urbano, rural, nivel de
instrucción, año académico, carrera, sexo, grupo étnico, edad, paridad etc.
En cada estrato para obtener el tamaño de la muestra se puede utilizar el muestreo
aleatorio o sistemático.
EJEMPLO
EstudiantesdelaCarreradeMedicina2005
Iaño=20% II año=18%
IIIaño=15% IV año=30%
Opciones
Pasos
EJEMPLO
Página 6 de 74
Polleth Sinto
16/06/2018 22:31:00
Muestra = 60
Hacer una lista de todos los niños
Numerarlos de 1 a 1200
Selección aleatoria de 60 números
Se toman todos los individuos de la lista y se seleccionan c/3, c/7, o cualquier otro
numero. Para comenzar se utiliza un número al azar.
Se reducen costos, tiempo y energía al considerar que muchas veces las unidades de
análisis se encuentran encapsuladas o encerradas en determinados lugares físicos o
geográficos: Conglomerados.
Página 7 de 74
Polleth Sinto
16/06/2018 22:31:00
Los racimos o conglomerados
En los racimos se seleccionan a los sujetos a ser medidos.
B. No Probabilístico
EJEMPLO
Todos los pacientes que asistan a una clínica en particular cierto día, semana,
pueden ser requeridos para participar.
b. Por cuotas: Todos los elementos conocidos de la población tienen que aparecer en
lamuestra.
Página 8 de 74
Polleth Sinto
16/06/2018 22:31:00
c. Accidental o bola de nieve: Se aprovecha o utiliza personas disponibles en un
momento dado que se corresponda con el propósito del estudio.
i. De los tres tipos de muestreo no probabilístico resulta el más deficiente.
Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No
se esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga
la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier
estadístico, como la media muestral, calculado a partir de las medias en una muestra aleatoria,
cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos los
valores posibles de un estadístico
Tales distribuciones serán muy importantes en el estudio de la estadística inferencial, porque las
inferencias sobre las poblaciones se harán usando estadísticas muestrales.
Con el análisis de las distribuciones asociadas con los estadísticos muestrales, podremos juzgar la
confiabilidad de un estadístico muestral como un instrumento para hacer inferencias sobre un
parámetro poblacional desconocido.
Como los valores de un estadístico, tal como la media, varían de una muestra aleatoria a otra, se le
puede considerar como una variable aleatoria con su correspondiente distribución de frecuencias.
5
De La Torre, Mrta Leticia. “Distribuciones Muestrales. Distribucion Muestral de Medias” pag. 11.
Página 9 de 74
Polleth Sinto
16/06/2018 22:31:00
3 DISTRIBUCIONES MUÉSTRALES DE UNA POBLACIÓN
(Tercera Semana)
3.1 Media6
Dada una muestra aleatoria X1,X2,...,Xn de tamaño n, la media muestral es el estadístico obtenido
tomando o la media aritmética de los elementos de la muestra. La denotaremos mediante X :
Ilustración 1
Si la variable aleatoria en estudio sigue una distribución normal N(µ,σ) entonces la media
muestral X sigue una distribución normal N(µ,σ/ √ n), donde n es el tamaño de la muestra.
Por otra parte:
EJEMPLO
6
Universidad de La Laguna. “Muestreo y Estimación” pág. 3
Página 10 de 74
Polleth Sinto
16/06/2018 22:31:00
El tiempo que tarda un cajero automático en atender a los clientes es de una media de
3 minutos, con desviación típica de 1.2 minutos. Se observa una muestra de 50
personas. ¿Cuál es la probabilidad de que el tiempo medio de espera supere los 2
minutos?
Ilustración 2
Entonces:
Ilustración 3
Esto es, el tiempo medio de espera superará, con casi total seguridad, los 2 minutos.
3.2 Varianza7
Sea X1,...,Xn una m.a.s. de una variable aleatoria X con media E(X) = µ y varianza V ar (X) = σ2.
El estimador más razonable de la varianza poblacional σ2 es la varianza muestral.
7
“Introduccion a la Inferencia Estadística – Distribución en el Muestreo” pág. 8
Página 11 de 74
Polleth Sinto
16/06/2018 22:31:00
Ilustración 4
Ilustración 5
Ilustración 6
Ilustración 7
Ilustración 8
Página 12 de 74
Polleth Sinto
16/06/2018 22:31:00
Si conocemos la varianza poblacional µ, se verifica
Ilustración 9
EJEMPLO
Dada una población X ˜ N (6, σ = 2.5), y tomando una muestra aleatoria simple
X1,...,Xn de tamaño n = 12, calcular la probabilidad de que la varianza muestral sea
mayor que 4.9.
Ilustración 10
Ilustración 11
Página 13 de 74
Polleth Sinto
16/06/2018 22:31:00
Ilustración 12
3.3 Proporción8
De aquí:
8
Universidad de La Laguna. “Muestreo y Estimación” pág. 4
Página 14 de 74
Polleth Sinto
16/06/2018 22:31:00
4 TEORÍA DE LA ESTIMACIÓN9
(Cuarta Semana)
Como proceso, consiste en que dada una población que siga una distribución de cierto tipo con
función de probabilidad (de cuantía o de densidad) f( X, ) dependiente de un parámetro o
varios desconocido(s) " ", aventurar en base a los datos muestrales el valor que toma o puede
tomar el parámetro o parámetros .
Se ocupará, dentro del marco de la perspectiva c´lasica, de estudiar las caracteristicas deseables de
los estimadores permitiendonos escoger aquel estimador que reuna mas propiedades ventajosas
apra que realicemos buenas estimaciones
9
Universidad de Valencia Lejarza&Lejarza “ESTIMACIÓN PUNTUAL” págs.1-4
Página 15 de 74
Polleth Sinto
16/06/2018 22:31:00
si el parámetro a estimar es
tendremos que
tendremos que
tendríamos que
Página 16 de 74
Polleth Sinto
16/06/2018 22:31:00
dado que la esperanza del estimador coincide con el parámetro a estimar podemos
decir que la cuasivarianza muestral es un estimador insesgado de la varianza de la
población.
ECM( )=
Página 17 de 74
Polleth Sinto
16/06/2018 22:31:00
por lo expresado podemos aventurar que un estimador insegado , luego
(Quinta Semana)
Dada una población X, que sigue una distribución cualquiera con media µ y desviación estándar σ
.
i. Sabemos (por el TCL) que, para valores grandes de n , la media muestral x sigue una
ii. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribución normal,
aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos
desviaciones estándar de la media.
10
UOC (www.uoc.edu) “Estimación Puntual y Estimación por Intervalos de Confianza” pág. 3
Página 18 de 74
Polleth Sinto
16/06/2018 22:31:00
Ilustración 13
Ilustración 14
Por tanto, ésta última fórmula nos da un intervalo de valores tal que la probabilidad de que la media
de la población µ esté contenida en él es de 0,95.
6 TEORIA DE ESTIMACIÓN
Estimar qué va a ocurrir respecto a algo (o qué está ocurriendo, o qué ocurrió), a pesar de ser un
elemento muy claramente estadístico, está muy enraizado en nuestra cotidianidad. Dentro de ello,
además hacemos estimaciones dentro de un intervalo de posibilidades. Por ejemplo: “creo que
terminaré la tarea en unos 5-6 días”. Lo que hacemos en el terreno del análisis de datos es aplicar
matizaciones técnicas a este hábito. Vamos a dedicar este documento al concepto de estimación,
comenzando con la estimación puntual. Después nos ocuparemos de desarrollar un modelo de
estimación por intervalo donde identificaremos los elementos fundamentales, con su significado y
símbolo. Y, por último, habrá que desarrollar cómo se calculan esos elementos.
Página 19 de 74
Polleth Sinto
16/06/2018 22:31:00
6.1 Estimas por puntos y estimas por intervalos. SEGURIDAD
6.1.1 La estimación puntual:
Estimar puede tener dos significados interesantes. Significa querer e inferir. Desde luego, el primer
significado es más trascendente. Pero no tiene ningún peso en la estadística, disciplina que no se
ocupa de los asuntos del amor. El segundo significado es el importante aquí. Una estimación
estadística es un proceso mediante el que establecemos qué valor debe tener un parámetro según
deducciones que realizamos a partir de estadísticos. En otras palabras, estimar es establecer
conclusiones sobre características poblacionales a partir de resultados muestrales.
Vamos a ver dos tipos de estimaciones: puntual y por intervalo. La segunda es la más natural. Y
verás que forma parte habitual de nuestro imaginario como personas sin necesidad de una
formación estadística. La primera, la estimación puntual, es la más sencilla y, por ese motivo,
vamos a comenzar por ella. Ocurre, además, que la estimación por intervalo surge, poco más o
menos, de construir un intervalo de posibles valores alrededor de la estimación puntual.
Una estimación puntual consiste en establecer un valor concreto (es decir, un punto) para el
parámetro. El valor que escogemos para decir “el parámetro que nos preocupa vale X” es el que
suministra un estadístico concreto. Como ese estadístico sirve para hacer esa estimación, en lugar
de estadístico suele llamársele estimador. Así, por ejemplo, utilizamos el estadístico “media
aritmética de la muestra” como estimador del parámetro “media aritmética de la población”. Esto
significa: si quieres conocer cuál es el valor de la media en la población, estimaremos que es
exactamente el mismo que en la muestra que hemos manejado.
6.1.2 Insesgadez
Del párrafo anterior podemos concluir erróneamente que todo parámetro se infiere a partir de un
estadístico que resulta ser la misma fórmula o función pero calculado en la muestra. Si queremos
estimar la media poblacional, le asignamos directamente la media de la muestra. Si queremos
estimar la proporción poblacional, le asignamos el valor de la proporción en la muestra. Si
queremos estimar la varianza poblacional, le asignamos el valor de la varianza de la muestra. Esa
Página 20 de 74
Polleth Sinto
16/06/2018 22:31:00
norma general tiene excepciones, por lo que es mejor no pensar en ella como norma. De los tres
ejemplos, es cierto en los dos primeros casos: estimación puntual de una media o de una
proporción; pero no en el tercero: estimación puntual de una varianza. La razón proviene del
objetivo de la insesgadez.
Un sesgo es una tendencia constante. En un ejemplo clásico, solemos afirmar que las escopetas de
feria están diseñadas para errar, para desviarse. Si esa desviación es fija, es decir, si esa desviación
es una tendencia a errar hacia un sentido concreto, entonces hablamos de sesgo. Si no es fija,
entonces se trata de una variación aleatoria. Observa la figura 1. El objetivo es dar al centro de la
diana. El área de disparos A muestra una variación aleatoria, pero sin sesgo pues apunta
correctamente alrededor del objetivo. El área B muestra un sesgo claro: todos los disparos dan en
un mismo punto y ese punto no es el centro de la diana, estamos errando. El área C ejemplifica una
mezcla de ambos: existe sesgo y variación aleatoria, puesto que los disparos impactan en un área
con cierta dispersión aleatoria pero concentradas en torno a un punto desplazado del objetivo.
Los estimadores siempre suministran dispersión aleatoria. Como sabemos del monográfico sobre
muestreo, el conjunto de todas las muestras de un mismo diseño que provienen de una misma
población suministran valores diferentes. Esta circunstancia indica que existe una variación
aleatoria con la que hay que vivir porque es inevitable. Pero todavía sería peor. Es posible que el
Página 21 de 74
Polleth Sinto
16/06/2018 22:31:00
estimador escogido tenga sesgo, es decir, que no solo esté variando alrededor de un punto, sino que
el punto sobre el que varía no es el valor poblacional, verdadero u objetivo de nuestro interés. Esto
si es evitable. Así que los estimadores que utilizamos intentamos que sean insesgados, es decir, que
carezcan de sesgo.
El recurso que utilizamos para ello es el valor esperado, es decir, la media aritmética de la
distribución muestral del estimador. Ya lo viste en el monográfico sobre muestreo. El valor
esperado es, como dice la expresión, el valor que esperamos. Cabe elegir un estimador tal que el
valor esperado coincida con el parámetro. Esto ocurre si utilizamos la media aritmética de la
muestra como estimador de la media aritmética de la población, pues E(X̄ ) =μ . También ocurre
con las proporciones, pues E(p) = π . Pero no ocurre así con la varianza (y, por tanto, tampoco con
la desviación tipo) pues E(S 2 ) ≠ σ 2 . Esto ya lo hemos abordado en el monográfico sobre
muestreo. Lo que hacemos entonces es escoge otro estimador. En el muestreo aleatorio simple
donde las poblaciones son de gran tamaño, es la cuasivarianza el estadístico escogido como
estimador de la varianza poblacional, pues E(Ŝ 2 )= σ 2 , es decir, la cuasivarianza es un estimador
insesgado de la varianza poblacional.
6.1.3 Totales
Además de medias, proporciones y variaciones, un parámetro habitual es el total. Llamamos total
a una frecuencia absoluta calculada en la población. Por ejemplo, podemos tener interés en conocer
cuántas personas votarán al partido HH en las próximas elecciones o cuántos cigarrillos van a
consumirse en el mes de abril. Para responder, utilizamos un recurso indirecto que parte de una
estimación previa, bien sea de una media aritmética o de una proporción. Supongamos que la
población que nos interesa cuenta con un millón de habitantes. Hemos trabajado con una muestra
de 200. De los que 38 dicen que votarán al partido HH. Esto significa 38/200*100=19%. Una
estimación puntual establece que el 19% de la población votará a HH. Como hay un millón de
habitantes, entonces, hablamos de 1,000,000*19/100=190,000 personas. Supongamos también que
se fuman 50 cigarrillos por término medio cada mes. Si ese es el valor de la media aritmética de la
muestra, la estimación puntual afirmará que en la población se fumarán 50 cigarrillos por persona
durante el mes de abril, por término medio. Como hay un millón de habitantes, el mes de abril verá
Página 22 de 74
Polleth Sinto
16/06/2018 22:31:00
consumidos 50 millones de cigarrillos. Así pues, en la estimación de totales no realizamos un
camino alternativo específico sino que ampliamos la estimación realizada previamente, sea de una
proporción o de una media.
He iniciado este apartado afirmando que “Las estimaciones puntuales no son una buena opción
cuando constituyen el centro del objetivo, aunque solucionan problemas de procedimiento, por lo
que son absolutamente necesarias”. Ya has leído el razonamiento por el que la estimación puntual
parece una mala opción. Sin embargo, llegará un momento, dentro de unas páginas, en el que
tendremos que calcular el error de precisión. Es algo por lo que hay que pasar comprensiblemente
antes de construir el intervalo, ya que este surge de sumar y restar el error de precisión sobre el
valor del estimador. En el cálculo del error de precisión veremos que nos hace falta el valor de
algún parámetro más. ¿Qué hacemos? Si la estimación por intervalo es la opción razonable,
entonces pondremos en marcha un nuevo proceso, anidado en el anterior, donde necesitaremos
construir un nuevo intervalo, es decir, calcular un nuevo error de precisión, es decir, encontrar el
valor de un nuevo parámetro... y así sucesivamente. Esto debe tener un fin. El fin es la estimación
puntual. En pocas palabras:
Página 23 de 74
Polleth Sinto
16/06/2018 22:31:00
cuando la estimación es un objetivo finalista, es decir un fin que deriva de los objetivos de la
investigación, entonces la llevamos a cabo por intervalo, pero
cuando la estimación es un objetivo instrumental, es decir, una necesidad temporal que surge en el
proceso de construcción de un intervalo, entonces la estimación será puntual.
6.2.2 Seguridad
La figura 2 muestra una distribución muestral hipotética. Cada resultado muestral está representado
por un bloque o ladrillo. Cada bloque es la media aritmética del número de horas que una muestra
aleatoria de personas dice que sería capaz de permanecer en un centro comercial. Muchas muestras
han suministrado el mismo valor, pues sus ladrillos se apilan sobre el mismo punto, formando una
columna. En el eje horizontal figura la diferencia entre el valor del estimador en esa muestra y el
valor real en la población. Así, por ejemplo, hay 6 muestras en las que se ha obtenido un valor del
estimador inferior al parámetro en 5 unidades (la media de esas muestras es 5 horas de permanencia
menos que la media de la población), o también hay 11 muestras con valores del estimador que
superan al parámetro en 4 unidades.
Pues bien, de las 160 muestras que construyen esa distribución muestral, una de ellas es la mía. Tal
vez sea la que he marcado con el color rojo. Tal vez sea alguna de las 159 restantes. Haga lo que
haga, no tengo una respuesta precisa a la pregunta ¿dónde está mi muestra? Pero tengo otro tipo de
respuesta: puedo hacer una apuesta. Por ejemplo, puedo plantearme cuál es la probabilidad de que
mi muestra sea exactamente esa que he marcado en rojo. Si hay 160 posibilidades y he escogido
solo una, la probabilidad es muy baja: 1/160 = 0,00625. Es más, esta operación carece de sentido
Página 24 de 74
Polleth Sinto
16/06/2018 22:31:00
en una distribución muestral más real, puesto que sabemos que el número de muestras es
prácticamente infinito por lo que la probabilidad de ocurrencia de una cualquiera de ellas es cero.
Una forma de solucionar esto es plantearme la probabilidad de que mi muestra sea una de las que
forman un conjunto amplio de resultados muestrales, un intervalo de resultados posibles
En la figura 3 he marcado un área central alrededor del valor esperado del estimador que, como
sabemos, coincide con el parámetro. El área reúne 112 muestras, un 70% de las 160. Se trata de
todas las muestras que suministran valores del estimador que se alejan del parámetro en no más de
3 unidades, sea por abajo o por encima. La figura 4 representa una situación similar, pero acotando
un área del 95% que afecta a 152 muestras, con una distancia máxima al parámetro de 6 unidades.
Observa que, como resulta obvio, cuanto más amplío la superficie de la gráfica, es decir, el
porcentaje de muestras posibles consideradas, también se amplía el intervalo de distancias al
parámetro.
Página 25 de 74
Polleth Sinto
16/06/2018 22:31:00
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona
información sobre el valor del parámetro. Por ejemplo la media muestral es un estimador de la
media poblacional, la proporción observada en la muestra es un estimador de la proporción en la
población.
Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los estimadores más
probables en este caso son los estadísticos obtenidos en la muestra, aunque es necesario cuantificar
el riesgo que se asume al considerarlos. Recordemos que la distribución muestral indica la
distribución de los valores que tomará el estimador al seleccionar distintas muestras de la
población. Las dos medidas fundamentales de esta distribución son la media que indica el valor
promedio del estimador y la desviación típica, también denominada error típico de estimación, que
indica la desviación promedio que podemos esperar entre el estimador y el valor del parámetro.
Más útil es la estimación por intervalos en la que calculamos dos valores entre los que se encontrará
el parámetro, con un nivel de confianza fijado de antemano.
Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene al
parámetro que se está estimando.
Página 26 de 74
Polleth Sinto
16/06/2018 22:31:00
8 INTERVALOS DE CONFIANZA PARA MEDIAS
En la determinación del tamaño de la muestra se tuvieron en cuenta el nivel de confianza y el error
buscando que al estimar los parámetros poblacionales fueran lo ms confiables posibles.
Una vez aplicada la encuesta a la muestra se debe hacer las estimaciones de los parámetros
poblacionales.
Para hacer esas estimaciones se puede utilizar cualquiera de los estadísticos de la muestra. El
estadístico que se usa para hacer la estimación del parámetro poblacional se le denomina estimador
puntal. Usualmente se usan como estimadores puntales la muestra. La media de la muestra es una
estimación puntual de la media población. La media muestral no es el único valor que se podría
usar para estimar la media poblacional. También se podría usar la mediana muestral, aunque no es
tan eficiente, lo que significa que hay más dispersión en la distribución de las dispersiones.
Los estimadores puntuales usados son:
Pero como la estimación puntual no da mucha información acerca del parámetro poblacional, se
necesita mayor información por lo que el intervalo de confianza cumple este propósito.
Página 27 de 74
Polleth Sinto
16/06/2018 22:31:00
Como el error estándar está afectado por el tamaño de la muestra, este a su vez afecta el intervalo
de confianza. Conforme aumenta el tamaño de la muestra, el error estándar disminuye, indicando
esto que hay menos variabilidad en la distribución muestral de a media muestral. La estimación
obtenida de una muestra grande será más precisa que una estimación obtenida de una muestra
pequeña.
Cuando el tamaño de la muestra n es mayor o igual a 30, se aplica el teorema de límite central
asegura que la media muestral sigue la distribución normal. Si la media muestral tiene una
distribución normal, se puede usar la distribución normal estándar, es decir, z, para los cálculos.
Página 28 de 74
Polleth Sinto
16/06/2018 22:31:00
determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo
de confianza para la diferencia entre las medias de dos poblaciones.
Para la estimación del intervalo de confianza, el valor de t depende de los grados de libertad, n-1,
(fila) y del nivel de confianza.
Página 29 de 74
Polleth Sinto
16/06/2018 22:31:00
10 INTERVALOS DE CONFIANZA PARA PROPORCIONES
Si deseamos estimar la proporción p con que una determinada característica se da en una población,
a partir de la proporción p' observada en una muestra de tamaño n, sabemos que
intervalo:
Página 30 de 74
Polleth Sinto
16/06/2018 22:31:00
Figura 6.4.3 Diferencia de Parámetros con Poblacionales Infinitas
donde P1 y P2 son las dos proporciones muestrales n1 y n2, son los tamaños de las dos muestras
extraídas de las poblaciones, y p1 y p2 son las proporciones en las dos poblaciones (estimadas por
P1 y P2).
de la distribución :
Consideremos dos cuantiles de esta distribuci�n que nos dejen una probabilidad en la ``zona
central'' de la distribuci�n (cf. Figura 8.7):
Página 31 de 74
Polleth Sinto
16/06/2018 22:31:00
Entonces un intervalo de confianza al nivel para la varianza de una distribuci�n gaussiana
(cuyos par�metros desconocemos) lo obtenemos teniendo en cuenta que existe una
probabilidad de que:
Página 32 de 74
Polleth Sinto
16/06/2018 22:31:00
13 INTERVALOS DE CONFIANZA PARA RELACIONES DE VARIANZAS
En el centro de la distribución debe quedar el 95% del área, pero como la distribución no es
simétrica, los valores de los extremos son diferentes.
Para encontrar el valor de la izquierda, se busca el punto cuya área sea a la izquierda 0.025 o lo que
es lo mismo, cuya área a la derecha sea 0.975 para n-1 gl, a este valor se le llamará x2 0.975, n-1
Para encontrar el valor de la derecha, se busca el punto cuya área sea a la derecha 0.025 para
Nótese que los valores para los límites se cambian debido a que en la fórmula forman el
denominador.
Página 33 de 74
Polleth Sinto
16/06/2018 22:31:00
Para ilustrar este método, imaginemos la siguiente situación: queremos estimar la probabilidad p de
que salga cara en el lanzamiento de una moneda no necesariamente regular.
Para ello procedemos de la siguiente manera: lanzamos la moneda cinco veces y obtenemos la
siguiente secuencia:
C+CC+
Una manera aparentemente razonable de estimar p sería evaluar la probabilidad de obtener
esta muestra para diferentes valores de p y quedarnos con el valor que haga máxima dicha
probabilidad. En nuestro caso, debemos calcular:
para todos los posibles valores de p, es decir, para todo valor real entre 0 y 1. Es lo que se muestra
en la siguiente tabla, en la que se han simplificado los posibles valores de p tomando incrementos
de 0,1:
Como puede observarse, el valor para el que se obtiene la máxima probabilidad es 0,6. Por tanto,
dicho valor será la estimación máximo verosímil (EMV) de p.
Si analizamos este resultado es fácil darse cuenta que la EMV obtenida coincide con la frecuencia
relativa del número de caras (Fr (C) = 3/5 = 0,6), por lo que podemos preguntarnos ¿se trata de un
resultado casual o es generalizable? Para responder a esta cuestión volvamos al cálculo de la
probabilidad de nuestra muestra, pero aprovechemos para hacerlo más general. Supongamos que
Página 34 de 74
Polleth Sinto
16/06/2018 22:31:00
hemos efectuado n lanzamientos de la moneda de los que k (k <= n) han sido cara sin que importe
el orden en que han salido. La probabilidad de dicho suceso viene dada por:
y, si suponemos que los valores n y k son conocidos, esta probabilidad puede expresarse como una
función L(p) del parámetro p, exclusivamente. A dicha función se le llama función de
verosimilitud y puede definirse como la función de densidad conjunta de la muestra (probabilidad
de obtener la muestra observada, en nuestro caso), pero considerada como función del parámetro.
Por tanto, es posible maximizarla utilizando las técnicas conocidas de cálculo y asumiendo la
restricción de que 0 <= p <= 1. Es decir, derivamos L(p) e igualamos a cero. Aunque, los cálculos
suelen facilitarse al aplicar el hecho de que si una función (positiva) alcanza un máximo en un
punto dado, el logaritmo de dicha función alcanzará un máximo en el mismo punto:
Para ser rigurosos debemos comprobar que se trata de un máximo. Una manera de hacerlo es
demostrar que la derivada segunda de L(p) (o de su logaritmo) en el punto k/n es negativa. En
nuestro caso es fácil ver que la segunda derivada siempre es negativa:
Página 35 de 74
Polleth Sinto
16/06/2018 22:31:00
15 ESTIMAS INSESGADAS Y EFICIENTES
15.1 Estimadores insesgados
Obsérvese que escribimos el sesgo de un estimador con la letra "b", en lugar de la letra "s", como
parecería más normal. Esto ocurre porque, como sabemos, la letra "s" se emplea para designar la
desviación típica de unos datos (de una muestra). En su lugar, se emplea la inicial de la palabra
"biais" (léase bié), que es la expresión francesa para sesgo.
El sesgo de un estimador es un número, que depende del valor del parámetro, . Por tanto, es una
función del parámetro. En efecto, como veremos en los siguientes ejemplos, la esperanza del
estimador, es una función del parámetro porque la función de densidad o de probabilidad del
estimador depende del mismo. En consecuencia el sesgo depende también de .
Un estimador insesgado (con sesgo nulo) tiene por esperanza el valor del parámetro, sea quien sea
éste. Por ello, a los estimadores insesgados se les denomina también centrados. Nótese que si
utilizamos un estimador insesgado, "acertamos" en media, esto es, el valor esperado del estimador
es la cantidad que queremos estimar.
Ello no quiere decir, no obstante, que las estimaciones (que son los valores que toma el estimador)
se parezcan al parámetro, por el mismo motivo que una variable de Bernoulli b(p), tiene por
esperanza p, aunque sus valores son cero y uno. En otras palabras, una variable aleatoria no tiene
por qué estar cerca de su esperanza, luego un estimador insesgado no tiene por qué estar cerca del
parámetro.
Página 36 de 74
Polleth Sinto
16/06/2018 22:31:00
Obsérvese, finalmente, que se habla de estimadores insesgados. Esta propiedad no se aplica a las
estimaciones, esto es, no tiene sentido decir que una estimación es o no es insesgada.
Observa qué ocurre con los estimadores anteriores en la continuación del Ejemplo1 y en
la continuación del Ejemplo2
¿Conviene utilizar estimadores insesgados? o, dicho de otra forma, la insesgadez, ¿es una
propiedad de interés para los estimadores?
Pero puede observarse que aunque el estimador sea sesgado, asigna mayores probabilidades
que a los valores próximos a q , esto es, resulta más probable que las estimaciones obtenidas
Dicho de otra forma, la propiedad interesante para un estimador es su proximidad al parámetro, sea
éste su esperanza o no lo sea. Una forma de valorar esta proximidad es a través de la dispersión
Página 37 de 74
Polleth Sinto
16/06/2018 22:31:00
15.2 Error cuadrático medio. Estimadores insesgados de varianza mínima
No es difícil demostrar esa descomposición del error cuadrático medio. Obsérvese que
(donde estamos llamando a la esperanza del estimador). Entonces, el error cuadrático medio
(esperanza del término de la izquierda) es la suma de tres esperanzas:
Página 38 de 74
Polleth Sinto
16/06/2018 22:31:00
El error cuadrático medio nos permite comparar estimadores. Así, un criterio sería concluir que
entre dos estimadores, es preferible aquél cuyo error cuadrático medio es menor. Este criterio se
denomina de eficiencia relativa:
Nuevamente, la continuación del Ejemplo1 y la continuación del Ejemplo2 ilustran estas ideas.
Aunque el error cuadrático medio nos proporciona una forma de comparar estimadores, no permite
obtener estimadores óptimos. Esto es, para un problema concreto, no es posible obtener el
estimador de menor error cuadrático medio entre todos los estimadores del parámetro. Por ello esta
propiedad (la de minimizar el error cuadrático medio) no se suele presentar entre las propiedades
convenientes de los estimadores, porque no tiene interés práctico.
Si limitamos nuestro campo de interés a los estimadores insesgados, a veces el problema tiene
solución práctica. Para los estimadores insesgados, el error cuadrático medio coincide con la
varianza, por lo que hablaremos de estimadores insesgados de varianza mínima.
Página 39 de 74
Polleth Sinto
16/06/2018 22:31:00
Los estimadores insesgados de mínima varianza no tienen por qué existir para un problema
concreto. Pero si existen son únicos, esto es, para un problema concreto, no pueden existir dos
estimadores insesgados de varianza mínima distintos.
Como los dos son insesgados, , y como ambos son de mínima varianza, los
dos tendrén la misma varianza, V, esto es,
no puede ser menor que V, ya que entonces y no serían de mínima varianza entre los
insesgados. Por tanto,
y como los coeficientes de correlación lineal no pueden ser superiores a la unidad, deberá
ser . Pero entonces existe una relación lineal entre ambos estimadores,
, con b mayor o igual que cero, ya que el coeficiente de correlación es positivo. Veremos que a=0
y b=1. Tomando varianzas en esta expresión,
Página 40 de 74
Polleth Sinto
16/06/2018 22:31:00
de donde , esto es, b=1, ya que es positivo. Pero entonces, tomando esperanzas,
o, lo que es lo mismo, a=0 . En definitiva, a=0 y b=1, y por tanto, . Si existen dos
estimadores insesgados de mínima varianza son, necesariamente, iguales.
En conclusión, para un problema concreto, puede que exista o puede que no exista un estimador
insesgado de mínima varianza, y si existe, es único. Pero, ¿cómo localizarlo si existe? Como
veremos a continuación,
Sólo es posible intentar obtenerlo en ciertos problemas, cuando se cumplan unas condiciones de
regularidad que se denominan de Cramér-Rao.
En esos problemas, sólo se puede localizar si pertenece a cierto tipo de estimadores insesgados de
mínima varianza, los denominados estimadores eficientes.
primero es menor que la del segundo. Por ejemplo, si y son ambos estimadores de θ y
diremos que es más eficiente que . Un estimador es más eficiente (más preciso), por tanto,
cuanto menor es su varianza.
La eficiencia de los estimadores está limitada por las características de la distribución de
probabilidad de la muestra de la que proceden. El teorema de Cramer-Rao determina que la
Página 41 de 74
Polleth Sinto
16/06/2018 22:31:00
donde f(X;θ) es la funciones de densidad de probabilidad de la
Obsérvese que para construirlo, ¡se necesita conocer p!. Si n es grande (>30) se pueden
substituir p y q por sus estimadores sin mucho error, en cualquier caso como pq £ 0,25 si se
substituye pq por 0,25 se obtiene un intervalo más conservador (más grande).
Página 42 de 74
Polleth Sinto
16/06/2018 22:31:00
Ejemplo: En una muestra de 100 pacientes sometidos a un cierto tratamiento se obtienen 80
curaciones. Calcular el intervalo de confianza al 95% de la eficacia del tratamiento.
¿Qué significa este intervalo? La verdadera proporción de curaciones está comprendida entre,
aproximadamente, 72% y 88% con un 95% de probabilidad.
¿Es suficientemente preciso? Habrá que juzgarlo con criterios clínicos.
Se utiliza el estadístico pivote: que sigue una distribución llamada chi-cuadrado con n-1
grados de libertad, que se representa por X2 , que a diferencia de las anteriores presenta una curva
no simétrica, y las tablas dadas expresan el área de probabilidad a la derecha de la variable. Estamos
pues ante la siguiente situación:
Página 43 de 74
Polleth Sinto
16/06/2018 22:31:00
número de observaciónes de ese suceso en la muestra. La variable X es obviamente una binomial
(n, p). Para valores de n grande y p próximos a 0,5, podemos aproximarla mediante una normal de
alcanza un un máximo en 1/41 . y por tanto esta última expresión se podría tomar como radio del
intervalo de confianza propuesto.
30, entonces:
Página 44 de 74
Polleth Sinto
16/06/2018 22:31:00
Asi,́ si calculamos el valor de la diferencia de medias correspondientes a las muestras M1 y M2 de
Página 45 de 74
Polleth Sinto
16/06/2018 22:31:00
20 ANEXO
Ampliación de temas según el programa del curso
Página 46 de 74
Polleth Sinto
16/06/2018 22:31:00
21 Intervalo de confianza para una población
(7ma. Semana)
Supongamos que tenemos una moneda, la cual puede o no estar balanceada. Así, después de varios
lanzamientos, la probabilidad que el resultado sea sello variará desde 0 (todas las veces cara, es
decir, una moneda balanceada) hasta 1 (todas las veces sello, nuevamente balanceada), pasando
por 0,5 (la mitad de las veces sello y las otras cara, lo que equivale a una moneda no balanceada).
Como no conocemos la verdadera naturaleza de la moneda, vamos a experimentar con ella.
Iniciamos el experimento con 2 lanzamientos, uno es cara y el otro es sello. La probabilidad de que
el resultado sea sello fue 0,5, con lo que podríamos concluir que la moneda no está balanceada, sin
embargo, ¿con sólo 2 lanzamientos podemos concluir con total certeza que esa es la naturaleza de
la moneda? La respuesta es no, por lo tanto ¿cuál es el rango de valores donde se encuentra el valor
real? Dado que el azar pudo influir en este resultado, uno acepta que el rango de valores reales
posibles es amplio, incluso desde uno tan bajo como 0 a uno tan alto como 1, por lo tanto aún no
estamos seguros de la naturaleza de nuestra moneda.
Página 47 de 74
Polleth Sinto
16/06/2018 22:31:00
menos amplio. Por ejemplo, es poco probable que después de 10 lanzamientos 9 sean sello, menos
aún que todos lo sean, sin embargo, aún es factible que 8 ó 7 ó 6 sí lo sean. Así, nuestro nuevo
rango puede variar entre 0,2 y 0,8, pero con un alcance: todos advertimos que si bien 0,8 y 0,2 son
posibles, los valores centrales (0,4 y 0,6) lo son más aún, siendo 0,5 el más probable.
Realizamos 1.000 lanzamientos, resultando 500 sellos y 500 caras, con lo que estamos aún más
seguros que nuestra moneda no está balanceada (nuestro rango puede ser 0,45 a 0,55 o menor).
El ejemplo anterior nos permite aclarar varios conceptos:
La «verdadera naturaleza» de nuestra moneda (si está balanceada o no) corresponde al valor real.
El rango de valores reales posibles, es decir, el rango donde se encuentra la verdadera naturaleza
de nuestra moneda, corresponde al IC.
El valor real más probable corresponde al estimador puntual del estudio, en este caso 0,5.
Finalmente, advertimos la relación inversa entre la amplitud del IC y el tamaño muestral: si
consideramos que el número de lanzamientos representa el n de la muestra, observamos que
mientras más pequeño es el n más amplio es el IC. A mayor número de lanzamientos (mayor n)
más certeza tenemos que el resultado del experimento se acerca al valor real, por lo tanto el IC es
más estrecho.
Donde:
Página 48 de 74
Polleth Sinto
16/06/2018 22:31:00
p1 Tasa de eventos grupo 1
p2 Tasa de eventos grupo 2
n1 n grupo 1
n2 n grupo 2
Interpretación de un IC
El intervalo de confianza es una medida de precisión que permite al clínico evaluar 2 aspectos de
un resultado (estimador puntual):
Si existe diferencia estadística significativa.
Si tal diferencia es relevante para recomendarla a mis pacientes (relevancia clínica).
Para analizar si existe o no diferencia estadística significativa debemos observar los extremos del
IC. Independiente si el estimador puntual muestra beneficio o daño, debemos verificar si alguno de
los extremos del IC pasa sobre la línea del no efecto. Si es así, existe la posibilidad de que el valor
real corresponda al no efecto o incluso tenga un efecto opuesto al esperado. En este caso no existiría
diferencia estadísticamente significativa entre aplicar o no la intervención (Figura 1)
Cuando un estudio demuestra un efecto con significación estadística (es decir el extremo del IC no
cruza ni toca la línea del no efecto), el clínico debe definir cuál es el beneficio mínimo necesario
para recomendar la terapia, lo que llamaremos umbral. Así, nuestro estudio hipotético demuestra
beneficio estadístico significativo, siendo el beneficio mínimo probable un RRA de 0,9%. El que
este beneficio tenga relevancia clínica depende del tipo de evento prevenido o favorecido, los
efectos adversos de la droga A v/s la droga B, el costo, las circunstancias clínicas, etc. Si el evento
a prevenir es banal, o si la droga A tiene muchos efectos adversos y es más cara que B, nuestro
umbral va a ser alto, por lo tanto el beneficio demostrado en nuestro estudio no sería relevante
(Figura 2).
Página 49 de 74
Polleth Sinto
16/06/2018 22:31:00
nos basta para recomendarla (umbral), por lo tanto nuestro estudio no sólo demuestra diferencia
estadísticamente significativa, sino que también beneficio relevante para el paciente (Figura 3).
Figura 1. Estudio hipotético cuyo estimador puntual informa un RRA 2,8%, pero cuyo IC
sobrepasa la línea del no efecto, por lo tanto es posible que el valor real sea daño. No existe
diferencia estadística significativa en este estudio.
Figura 2. Estudio hipotético que informa beneficio estadístico significativo, sin embargo, el IC
pasa sobre el beneficio mínimo necesario para recomendar la terapia (umbral, RRA 3%). El
beneficio mínimo demostrado (RRA 0,9%) no es suficiente para recomendar la terapia.
Así, para evaluar beneficio clínico, primero debemos establecer un umbral mínimo de beneficio,
el que depende del tipo de evento a prevenir o favorecer los efectos adversos, costos, etc. de la
nueva droga, y luego observar el beneficio mínimo probable que muestra el estudio, que
corresponde al extremo del IC más cercano a la línea del no efecto. Si el extremo del IC no
sobrepasa el umbral se asume que el beneficio mínimo probable es suficiente para recomendar la
nueva terapia.
Página 50 de 74
Polleth Sinto
16/06/2018 22:31:00
Existe la posibilidad que la nueva droga hiciese daño (RRA negativo). El proceso es similar al
anterior, estableciendo un umbral máximo de daño tolerable, y observando el extremo del IC que
más se acerca a la línea del no efecto. Si la nueva droga genera más daño con una diferencia
estadísticamente significativa, debemos observar si el extremo del IC sobrepasa ese umbral. Si no
lo hace se asume que el daño mínimo probable es más alto que lo tolerable, por lo tanto se está en
condiciones de rechazar la nueva terapia (Figura 4).
Al comparar dos grupos en un estudio podemos demostrar que no existe diferencia entre ambos
(hipótesis nula) o que sí la hay (hipótesis alternativa)9,10. El valor P es un test de hipótesis que
nos ayuda a afirmar con cierto nivel de seguridad (por consenso se usa 95%, que se expresa como
P <0,05) que una de las hipótesis es la correcta. Para nuestro ejemplo, la hipótesis nula corresponde
a la igualdad de resultados al usar la droga A o B, mientras que la hipótesis alternativa supone que
una de ellas es mejor que la otra en prevenir la enfermedad.
El valor P representa la probabilidad que una diferencia observada entre 2 grupos sea sólo debida al
azar, es decir, la probabilidad que la hipótesis nula sea verdadera a pesar de observar diferencia en
un estudio7-9. Como toda probabilidad, puede tener valores desde 0 a 1. Valores más cercanos a 1
indican que existe una alta probabilidad que las diferencias observadas sean sólo por azar, es decir,
apoya la hipótesis nula. En cambio, valores más cercanos a 0 apoyan la hipótesis alternativa.
Apliquemos este concepto a nuestro ejemplo, en que se obtiene un RRA de 4,2% con un valor P
<0,05 (p=0,039). Si asumimos como valor real que la droga A es igual a B (hipótesis nula) y
pudiéramos repetir el estudio muchas veces, el P <0,05 nos dice que en menos de 5% de las
ocasiones se observaría tal diferencia entre ambas, sólo por azar. Dicho de otra forma, en la mayor
parte de las ocasiones la diferencia observada no se debe al azar, por lo tanto rechazamos la
hipótesis nula y establecemos que existe diferencia estadística significativa.
El valor P se correlaciona en forma muy estrecha con el intervalo de confianza, ya que si uno
muestra diferencia estadística significativa el otro también lo hace, y viceversa. Sin embargo, el
valor P, a diferencia del IC, no nos entrega información respecto al rango en el que se encuentra la
Página 51 de 74
Polleth Sinto
16/06/2018 22:31:00
magnitud del efecto de un determinado tratamiento (valor real), por lo que sólo nos habla de
diferencias estadísticas significativas, sin permitirnos evaluar si esta diferencia es relevante para
mi paciente. Por ejemplo, un resultado significativo (P <0,05) podría incluir diferencias
clínicamente irrelevantes, y resultados no significativos (P >0,05) podrían esconder una diferencia
clínicamente importante entre 2 tratamientos si el estudio no incluye un tamaño muestral adecuado
(un estudio con bajo poder puede no mostrar una diferencia que realmente sí existe).
De esta forma, aunque el valor P mide la fuerza de una asociación, siempre es útil el intervalo de
confianza para complementar la evaluación de la magnitud del efecto de una intervención y poder
realizar una interpretación adecuada de los resultados de un estudio.
Al leer un estudio es muy importante interpretar los resultados en forma correcta. Esto supone
comprender el significado del estimador puntual y de sus medidas de precisión, lo que permite
extrapolar los datos a la población de interés. Tanto el análisis de un intervalo de confianza como
el de un valor P nos permiten determinar diferencias estadísticas significativas, sin embargo sólo
el IC nos permite evaluar el rango de valores donde posiblemente se encuentra el valor real, y por
lo tanto, permite realizar una mejor interpretación y aplicación clínica de los resultados.
Figura 4. Estudio hipotético que informa daño estadístico significativo. El IC no sobrepasa el daño
mínimo establecido como umbral. El daño mínimo demostrado es suficientemente importante para
rechazar la terapia.
Página 52 de 74
Polleth Sinto
16/06/2018 22:31:00
Bajo ciertas condiciones de regularidad, es posible construir intervalos de confianza
asintóticos de una manera bastante general.
Si suponemos que un parámetro θ tiene una estimación máximo verosímil θ*, la distribución
asintótica del estimador, bajo condiciones generales de regularidad, es Normal, de media el valor
verdadero del parámetro θ y varianza igual a la cota de Cramér-Rao σ2(θ*).
Bajo las suposiciones anteriores, es posible construir un intervalo de confianza asintótico y con
nivel de confianza (1 − α) · 100 % a partir de:
Página 53 de 74
Polleth Sinto
16/06/2018 22:31:00
De hecho, su forma exacta depende de un parámetro llamado grados de libertad, que es
simplemente n-1, el tamaño de la muestra menos uno
Lo primero que debemos obtener es el valor de 𝛼. Si queremos un grado de confianza del 90%,
entonces hablamos del 0.9. Como 0.9 es una probabilidad, el valor máximo que puede tomar es 1.
Y realizamos esa resta: 𝛼 = 1 − 0.9 = 0.1
Como nos interesa 𝛼 2 = 0.1 2 = 0.05 y entonces, la columna que usamos en la tabla es para 𝑡0.05.
Una empresa realizó un estudio del nivel de nicotina para una muestra de 20 cigarrillos por otra
empresa. La siguiente tabla muestra la cantidad de nicotina contenida en cada uno de los cigarrillos de la
muestra.
22.5 6.7 28.1 24.5 23.9 23.6 23.4 25.8 24.7 24.8
24.6 24.3 26.0 22.7 23.6 24.1 25.2 27.3 27.0 25.2
Página 54 de 74
Polleth Sinto
16/06/2018 22:31:00
Sustituimos los datos
Esto significa que con una probabilidad de 0.95, el nivel medio de nicotina de la marca competidora
esta entre 24.18 y 25.62, o bien, que al estimar el nivel medio de nicotina como 24.9 mg. Sabemos
que con un grado del 95% el error es menor a 0.72 mg.
(9na. Semana)
Dada una variable aleatoria con distribución Binomial B(n, p), el objetivo es la construcción de
un intervalo de confianza para el parámetro p, basada en una observación de la variable que ha
dado como valor x. El mismo caso se aplica si estudiamos una Binomial B(1, p) y consideramos el
número de veces que ocurre el suceso que define la variable al repetir el experimento n veces en
condiciones de independencia.
Página 55 de 74
Polleth Sinto
16/06/2018 22:31:00
Utilizar un método exacto.
Aproximación asintótica
Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más referenciada en la
mayoría de textos de estadística. Se basa en la aproximación
que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una
variable discreta a una continua, se obtiene el intervalo de confianza asintótico:
donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha una probabilidad
de α para un intervalo de confianza de (1 − α) · 100 % Las condiciones generalmente
aceptadas para considerar válida la aproximación asintótica anterior son:
Intervalo exacto
Aun cuando las condiciones anteriores no se verifiquen, es posible la construcción de un intervalo
exacto, válido siempre pero algo más complicado en los cálculos. Es posible demostrar que un
intervalo exacto para el parámetro p viene dado por los valores siguientes:
donde Fα/2 a,b es el valor de una distribución F de Fisher-Snedecor con a y b grados de libertad que
deja a su derecha una probabilidad de α para un intervalo de confianza de (1 − α) · 100 %.
Página 56 de 74
Polleth Sinto
16/06/2018 22:31:00
En el programa siguiente se pueden calcular los intervalos de confianza asintótico y, si n es menor
de 100, también el exacto para una proporción.
Donde χ2α/2 es el valor de una distribución ji-cuadrado con n − 1 grados de libertad que deja a su
derecha una probabilidad de α/2
Por ejemplo, dados los datos siguientes:
Página 57 de 74
Polleth Sinto
16/06/2018 22:31:00
23 Ensayos de hipótesis
(10ma. Semana)
Si queremos decidir entre dos hipótesis que afectan a un cierto parámetro de la población, a partir
de la información de la muestra usaremos el contraste de hipótesis, cuando optemos por una de
estas dos hipótesis, hemos de conocer una medida del error cometido, es decir, cuantas veces de
cada cien nos equivocamos.
24 Nivel de significancia
(11va. Semana)
Cuando se toma la decisión de rechazar o no la Hipótesis Nula podemos acertar o cometer errores.
En el trabajo real no sabemos qué ocurre porque no sabemos si la Hipótesis Nula es verdadera o
no. Sin embargo, dados ciertos supuestos podemos obtener las probabilidades de cometer errores
de tipo I y de tipo II.
Página 58 de 74
Polleth Sinto
16/06/2018 22:31:00
verdadera. El valor de alfa, también denominado nivel de significación, es definido por el
investigador antes de recoger los datos, y la costumbre es hacer alfa=0.05 o alfa=0.01 (en el
ejemplo alfa es igual a 0.05). La probabilidad de cometer errores de tipo II se simboliza beta y
depende de varias circunstancias como la distancia que separa el valor asignado al parámetro en la
Hipótesis Nula de su valor real, el tamaño muestral y el valor asignado a alfa.
La siguiente tabla resume los tipos de errores en función de la decisión y de que la Hipótesis Nula
sea verdadera o no:
Página 59 de 74
Polleth Sinto
16/06/2018 22:31:00
25 Ensayos de hipótesis para una población
La inferencia estadística es el proceso mediante el cual se utiliza la información de los datos de una
muestra para extraer conclusiones acerca de la población de la que se seleccionó la muestra. Las
técnicas de inferencia estadística se dividen en dos áreas principales: Estimación de intervalos de
confianza y Pruebas de hipótesis.
En cada prueba estadística, se comparan algunos valores observados contra algunos esperados u
otro valor observado comparando estimaciones de parámetros (media, desviación estándar,
varianza). Estas estimaciones de los verdaderos parámetros son obtenidos usando una muestra de
datos y calculando los estadísticos.
La capacidad para detectar una diferencia entre lo que es observado y lo que es esperado depende
del desarrollo de la muestra de datos. Incrementando el tamaño de la muestra mejora la estimación
y la confianza en las conclusiones estadísticas.
Página 60 de 74
Polleth Sinto
16/06/2018 22:31:00
Por ejemplo, probar las afirmaciones en los parámetros se usan los estadísticos:
En una población
La media poblacional = 12; estadístico Zc
La varianza poblacional σ2 = 12; estadístico c2
La proporción poblacional = 0.3 estadístico Zc
En dos poblaciones
Las medias poblacionales son iguales 1 = 2 o 1 - 2 = 0; estadístico Zc o Tc
Las varianzas poblacionalesson iguales σ12 = σ22 o σ12 - σ22 = 0; estadístico Fc
Las proporciones poblacionales son iguales 1 = 2 o 1 - 2 = 0 estadístico Zc
Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es el valor
hipotético del parámetro que se compra con el resultado muestral resulta muy poco probable
cuando la hipótesis es cierta.
Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%,
entonces se rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor
hipotético que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una
probabilidad de 0.05 o menos.
Etapa 3.- Elegir el estadístico de prueba. El estadístico de prueba puede ser el estadístico muestral
(el estimador no segado del parámetro que se prueba) o una versión transformada de ese estadístico
muestral. Por ejemplo, para probar el valor hipotético de una media poblacional, se toma la media
de una muestra aleatoria de esa distribución normal, entonces es común que se transforme la media
en un valor Z el cual, a su vez, sirve como estadística de prueba.
Página 61 de 74
Polleth Sinto
16/06/2018 22:31:00
Etapa 4.- Establecer el valor o valores críticos del estadístico de prueba. Habiendo especificado la
hipótesis nula, el nivel de significancia y el estadístico de prueba que se van a utilizar, se procede
a establecer el o los valores críticos del estadístico de prueba. Puede haber uno o más de esos
valores, dependiendo de si se va a realizar una prueba de uno o dos extremos o colas.
Etapa 5.- Determinar el valor real del estadístico de prueba. Por ejemplo, al probar un valor
hipotético de la media poblacional, se toma una muestra aleatoria y se determina el valor de la
media muestral. Si el valor crítico que se establece es un valor de Z, entonces se transforma la
media muestral en un valor de Z.
Etapa 6.- Tomar la decisión. Se compara el valor observado del estadístico muestral con el valor
(o valores) críticos del estadístico de prueba. Después no se rechaza o se rechaza la hipótesis nula.
Si se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras
decisiones de los administradores operativos, como por ejemplo, mantener o no un estándar de
desempeño o cuál de dos estrategias de mercadotecnia utilizar.
La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo
y una de no rechazo. Si estadístico de prueba cae en esta última región no se puede rechazar la
hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente.
Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la
distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede
rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de
rechazo.
Página 62 de 74
Polleth Sinto
16/06/2018 22:31:00
Prueba Estadística: Procedimiento para decidir aceptar o rechazar hipótesis.
Hipótesis: Es una afirmación acerca de una o más poblaciones.
Hipótesis Nula (Ho): Usualmente es una afirmación representando una situación “status quo”.
Generalmente deseamos rechazar la hipótesis nula.
Región de Rechazo: Indica los valores de la prueba estadística para que podamos rechazar la
Hipótesis nula (Ho). Esta región esta basada en un riesgo a deseado, normalmente 0.05 o 5%.
Página 63 de 74
Polleth Sinto
16/06/2018 22:31:00
Las pruebas de hipótesis pueden ser de dos colas, de cola derecha o de cola izquierda, a
continuación se esquematizan cada una de ellas.
-Z 0 Z
Pruebas de Hipótesis de cola derecha:
Ho: a b
Ha: a > b Región de
Rechazo
0 Z
Pruebas de Hipótesis cola izquierda:
Ho: a b
Ha: a < b Región de
Rechazo
-Z 0 Z
Página 64 de 74
Polleth Sinto
16/06/2018 22:31:00
o Si el signo de la hipótesis alterna es entonces se trata de una prueba de dos colas;
si es > de cola derecha y si es < de cola izquierda.
o Puede ser por ejemplo 5 para prueba de dos colas
o < 5 para prueba de cola izquierda
o > 5 para prueba de cola derecha
Regiones de rechazo
Página 65 de 74
Polleth Sinto
16/06/2018 22:31:00
28 Estadístico de prueba
- Error tipo I (alfa = nivel de significancia, es común = 0.05 ). Alfa = 1- Nivel de confianza
Si la Ho: = que un valor poblacional, entonces el riesgo alfa se reparte en ambos extremos de
la distribución. Por ejemplo si Ha: ≠ 10 se tiene:
Ho: a = b
Ha: a b
Regiones de rechazo
Página 66 de 74
Polleth Sinto
16/06/2018 22:31:00
28.2 Pruebas de Hipótesis de cola derecha:
Si la Ho: , que un valor poblacional, entonces el riesgo alfa se coloca en el extremo derecho
de la distribución. Por ejemplo si Ho 10 y Ha: >10 se tiene una prueba de cola derecha:
Ho: a b
Ha: a > b
Región de
rechazo
Si la Ho: que un valor poblacional, entonces el riesgo alfa se coloca en el extremo izquierdo
de la distribución. Por ejemplo si Ho 10 y Ha: < 10 se tiene una prueba de cola izquierda:
Ho: a b
Ha: a < b
Región de
rechazo
P(Z<= - Zexcel ) = alfa
Zexcel ( 0.01 )
Página 67 de 74
Polleth Sinto
16/06/2018 22:31:00
29 Modelos de Regresión y Correlación Lineal Simple y Múltiple
29.1 Regresión Lineal Simple y Múltiple.
El caso más simple de regresión lineal ajusta a la ecuación de la recta los valores de la variable
independiente X1 a la variable dependiente Y, es decir:
Y = b0+b1X1,
La regresión lineal múltiple se basa en obtener una relación lineal entre un conjunto de variables
independientes X1,..,Xn con una variable dependiente Y, es decir:
El éxito de determinar una correlación lineal múltiple es que exista una correlación lineal simple
de cada variable independiente con la variable dependiente.
Página 68 de 74
Polleth Sinto
16/06/2018 22:31:00
la variable dependiente Y en función de X1: Y~ X1
la variable dependiente Y en función de X1 y X2: Y~ X1+X2
la variable dependiente Y en función de todas las variables independientes (se usa el ‘.’): Y~.
También hay que indicarle dónde están guardadas esas variables y almacenarlas. Así, añadimos
data=datos a la función lm(), es decir, indicamos que las variables están almacenadas en datos.
Posteriormente las almacenamos el resultado en reg. Los pasos a seguir son (recordar que en primer
lugar se cargan los datos):
datos<-read.table("datos.txt",header=T,blank.lines.skip=F)
reg<-lm(Y~.,data=datos)
En función de los resultados obtenidos en el modelo lineal (como se verá en el siguiente ejemplo)
éste se puede mejorar eliminado variables independientes que tienen poco peso estadístico en la
función. De esta forma se puede conseguir un modelo predictivo más preciso, aunque la
eliminación de estas variables puede disminuir la calidad del modelo geoquímico-predictivo.
Por último, siempre resulta práctico comprobar gráficamente los valores del modelo predictivo (o
teórico) con los valores experimentales con el objeto de cuantificar la bondad del modelo predictivo
y evaluar si el modelo se ajusta para todo el intervalo de valores. En primer lugar, guardamos los
datos del ajuste lineal (reg$fitted.values) y en segundo lugar lo almacenarlos (con la variable
Y_teor). Es decir:
Y_teor<-reg$fitted.values
Finalmente se representa gráficamente los datos experimentales (datos$Y) frente a los datos
teóricos (Y_teor) y el ajuste de la regresión lineal:
plot(datos$Y,Y_teor)
abline(lm(datos$Y~Y_teor),col="blue")
Página 69 de 74
Polleth Sinto
16/06/2018 22:31:00
29.2 Correlación Lineal Simple y Múltiple Correlación.
(8.25)
El coeficiente de correlación lineal simple es una medida de la relación lineal existente entre
las variables X e Y.
En general cuando se ajusta un modelo estadístico a una nube de puntos, una medida de la
bondad del ajuste es el coeficiente de determinación, definido por
(8.26)
Página 70 de 74
Polleth Sinto
16/06/2018 22:31:00
Si el modelo que se ajusta es un modelo de regresión lineal múltiple, a R se le
denomina coeficiente de correlación múltiple y representa el porcentaje de variabilidad de
la Y que explica el modelo de regresión.
Como scE < scG, se verifica que 0 < R2 < 1. Si R2 = 1 la relación lineal es exacta y si R2 =
0 no existe relación lineal entre la variable respuesta y las variables regresoras.
Página 71 de 74
Polleth Sinto
16/06/2018 22:31:00
(8.27)
Ahora es fácil deducir la siguiente relación entre los dos coeficientes de determinación
(8.28)
También es fácil relacionar el estadístico del contraste de regresión múltiple con el coeficiente
de determinación, obteniendo
(8.29)
Página 72 de 74
Polleth Sinto
16/06/2018 22:31:00
donde e1·34 son los residuos del ajuste lineal realizado.
X2
Por tanto, el coeficiente de correlación lineal se define siempre dentro de un conjunto de variables
y no tiene interpretación ni sentido si no se indica este conjunto de variables.
(8.30)
Página 73 de 74
Polleth Sinto
16/06/2018 22:31:00
se puede calcular fácilmente el coeficiente de correlación parcial entre la variable respuesta Y y
una variable regresora Xi controlado por el resto de variables regresoras. Para ello se utiliza
el estadístico del contraste individual de la t respecto a la variable Xi y que se definió
anteriormente como
(8.31)
Página 74 de 74
Polleth Sinto
16/06/2018 22:31:00