Está en la página 1de 16

INSTITUTO TECNOLOGICO DE CAMPECHE

ING. EN SISTEMAS COMPUTACIONALES

TAREA #1 TEMAS DE INVESTIGACION CONCEPTUAL

Temas V – Estadística Aplicada (Inferencial)

MAESTRO: Ing. Bocos Patrón Ramón Agustín

SAUL ARTURO MASS CRUZ

PROBABILIDAD Y ESTADISTICA

SEMESTRE: 2 GRUPO: MS2

28/04/17
Tabla de contenido
¿Qué es la Inferencia estadística?................................................................................................4
Los 2 problemas que atiende la Inferencia estadística..............................................................4
Razones del muestreo....................................................................................................................4
El muestreo aleatorio......................................................................................................................5
Métodos de muestreo.....................................................................................................................5
Objetivo del muestreo.....................................................................................................................7
¿Se puede esperar que al analiza una muestra de una población, un estadístico pudiera
ser igual al parámetro poblacional correspondiente?.................................................................8
Teorema del límite central..............................................................................................................8
Distribución de muestreo................................................................................................................9
Distribución muestral para medias “2” conocida.........................................................................9
Distribución muestral para medias, “2” desconocida, la distribución “t” de Student...............9
Características:.............................................................................................................................10
El estadístico de prueba:..............................................................................................................10
Uso de la tabla:.............................................................................................................................10
Distribución muestral para proporciones....................................................................................11
 Aproximación d/la dist. normal a la binomial.......................................................................12
 El estadístico de prueba.......................................................................................................12
La estimación estadística.............................................................................................................12
 Introducción.........................................................................................................................12
 Tipos de estimadores: puntuales y por intervalo.................................................................12
 Interpretaciones de y de (1- )...............................................................................................12
I. de C. Para la media de una población () varianza  conocida. ¿Cuándo se aplica?
¿Cuál es el modelo?.....................................................................................................................13
Determinación del tamaño de la muestra para medias............................................................13
I. de C. Para la media de una población () varianza  desconocida. ¿Cuándo se aplica? ¿Cuál es el
modelo?...........................................................................................................................................13
I. de C. Para la proporción,  de una población. ¿Cuándo se aplica? ¿Cuál es el modelo?...............13
Determinación del tamaño dela muestra para proporciones..........................................................13
La prueba de Hipótesis, Introducción...............................................................................................14
Def. de Hipótesis estadística............................................................................................................14
Tipos de hipótesis.............................................................................................................................14
Construcción de hipótesis (agregar ejemplos).................................................................................15
Tipos de pruebas..............................................................................................................................15
El estadístico de prueba...................................................................................................................15
Tipos de errores...............................................................................................................................15
Procedimiento para la P. de H..........................................................................................................15
P de H para una media con  conocida..........................................................................................15
P. de H. para una media con  desconocida...................................................................................15
P. de H. para una proporción ........................................................................................................15
¿Qué es la Inferencia estadística?

La inferencia estadística es el conjunto de métodos y técnicas que permiten inducir, a


partir de la información empírica proporcionada por una muestra, cual es el
comportamiento de una determinada población con un riesgo de error medible en
términos de probabilidad.

Los 2 problemas que atiende la Inferencia estadística


Los métodos paramétricos de la inferencia estadística se pueden dividir, básicamente, en
dos: métodos de estimación de parámetros y métodos de contraste de hipótesis. Ambos
métodos se basan en el conocimiento teórico de la distribución de probabilidad del
estadístico muestral que se utiliza como estimador de un parámetro.
La estimación de parámetros consiste en asignar un valor concreto al parámetro o
parámetros que caracterizan la distribución de probabilidad de la población. Cuando se
estima un parámetro poblacional, aunque el estimador que se utiliza posea todas las
propiedades deseables, se comete un error de estimación que es la diferencia entre la
estimación y el verdadero valor del parámetro. El error de estimación es desconocido por
lo cual es imposible saber en cada caso cual ha sido la magnitud o el signo del error; para
valorar el grado de precisión asociado con una estimación puntual se parte de dicha
estimación para construir un intervalo de confianza. En síntesis, un intervalo de confianza
está formado por un conjunto de valores numéricos tal que la probabilidad de que éste
contenga al verdadero valor del parámetro puede fijarse tan grande como se quiera. Esta
probabilidad se denomina grado de confianza del intervalo, y la amplitud de éste
constituye una medida del grado de precisión con el que se estima el parámetro.

Los métodos de contraste de hipótesis tienen como objetivo comprobar si determinado


supuesto referido a un parámetro poblacional, o a parámetros análogos de dos o más
poblaciones, es compatible con la evidencia empírica contenida en la muestra. Los
supuestos que se establecen respecto a los parámetros se llaman hipótesis paramétricas.
Para cualquier hipótesis paramétrica, el contraste se basa en establecer un criterio de
decisión, que depende en cada caso de la naturaleza de la población, de la distribución de
probabilidad del estimador de dicho parámetro y del control que se desea fijar a prioridad
sobre la probabilidad de rechazar la hipótesis contrastada en el caso de ser ésta cierta.
Razones del muestreo
Muestra:

La muestra es una parte de la población, que es representativa de la misma. Entonces


una muestra es una parte o un subconjunto de una población seleccionado con la
finalidad de analizar y obtener propiedades de esta.

Muestreo: es el procedimiento mediante el cual se obtiene una muestra


Algunas razones que justifican el uso del muestreo son:
1) naturaleza destructiva del proceso de investigación
2) imposibilidad de revisar todos los elementos de la población.
3) Costo: al obtener los datos de una pequeña porción del total.
4) tiempo: al considerar solo una parte del total, su recolección y resumen se hará con
mayor rapidez.
5) precisión: las posibilidades de usar personal más capacitado y supervisar
cuidadosamente el trabajo de campo y el procesamiento de la información

El muestreo aleatorio
Para seleccionar una muestra de una población hay diversos métodos; uno de los más
comunes es el muestreo aleatorio simple. La definición de muestreo aleatorio simple y del
proceso de seleccionar una muestra aleatoria simple dependen de si la población es finita
o infinita. Como el problema de muestreo de EAI tiene una población finita de 2500
administradores, primero se considera el muestreo de una población finita.
MUESTREO ALEATORIO SIMPLE (POBLACIÓN FINITA)
Una muestra aleatoria simple de tamaño n de una población finita de tamaño N es una
muestra
seleccionada de manera que cada posible muestra de tamaño n tenga la misma
probabilidad
de ser seleccionada.

MUESTRAALEATORIA SIMPLE (POBLACIÓN INFINITA)


Una muestra aleatoria simple de una población infinita es una muestra seleccionada de
manera que se satisfagan las condiciones siguientes.
1. Cada uno de los elementos seleccionados proviene de la población.
2. Cada elemento se selecciona independientemente.

Métodos de muestreo
Muestreo aleatorio estratificado
En el muestreo aleatorio estratificado los elementos de la población primero se dividen en
grupos, a los que se les llama estratos, de manera que cada elemento pertenezca a uno y
sólo un estrato.
La base para la formación de los estratos, que puede ser departamento, edad, tipo de
industria, etc., está a discreción de la persona que diseña la muestra. Sin embargo, se
obtienen mejores resultados cuando los elementos que forman un estrato son lo más
parecido posible. La figura 7.12 es un diagrama de una población dividida en H estratos.
Una vez formados los estratos, se toma una muestra aleatoria simple de cada estrato.
Existen fórmulas para combinar los resultados de las muestras de los varios estratos en
una estimación del parámetro poblacional de interés. El valor del muestreo aleatorio
estratificado depende de qué tan homogéneos sean los elementos dentro de cada estrato.
Si los elementos de un estrato son homogéneos, el estrato tendrá una varianza pequeña.
Por tanto, con muestras relativamente pequeñas de los estratos se obtienen buenas
estimaciones de las características de los estratos. Si los estratos son homogéneos, el
muestreo aleatorio estratificado, proporciona resultados tan precisos como los de un
muestreo aleatorio simple, pero con una muestra de tamaño total menor.

Muestreo por conglomerados


En el muestreo por conglomerados los elementos de la muestra primero se dividen en
grupos separados, llamados conglomerados. Cada elemento de la población pertenece a
uno y sólo un conglomerado (véase figura 7.13). Se toma una muestra aleatoria simple de
los conglomerados.
La muestra está formada por todos los elementos dentro de cada uno de los
conglomerados que forman la muestra. El muestreo por conglomerados tiende a
proporcionar mejores resultados cuando los elementos dentro de los conglomerados no
son semejantes. Lo ideal es que cada conglomerado sea una representación, a pequeña
escala, de la población. Si todos los conglomerados son semejantes en este aspecto,
tomando en la muestra un número pequeño de conglomerados se obtendrá una buena
estimación de los parámetros poblacionales.
Una de las principales aplicaciones del muestro por conglomerados es el muestreo de
áreas,
en el que los conglomerados son las manzanas de una ciudad u otras áreas bien
definidas. El muestreo por conglomerados requiere, por lo general, tamaños de muestra
mayores que los requeridos en el muestreo aleatorio simple o en el muestreo aleatorio
estratificado. Sin embargo, es posible reducir costos debido a que cuando se envía a un
entrevistador a uno de los conglomerados de la muestra (por ejemplo, a una manzana de
una ciudad), es posible obtener muchas observaciones en poco tiempo. Por tanto, se
obtiene una muestra de tamaño grande a un costo significantemente menor.
Muestreo sistemático
Para ciertos muestreos, en especial en aquellos con poblaciones grandes, se necesita
mucho tiempo para tomar una muestra aleatoria simple (hallando primero los números
aleatorios y después contando y recorriendo toda una lista de la población hasta encontrar
los elementos correspondientes).
Una alternativa al muestreo aleatorio simple es el muestreo sistemático. Por ejemplo,
si se quiere una muestra de tamaño 50 de una población que tiene 5000 elementos, se
muestrea uno de cada 5 000/50 _ 100 elementos de la población. En este caso, un
muestreo sistemático consiste en seleccionar en forma aleatoria uno de los primeros
elementos de la lista de la población.
Los otros elementos se identifican contando a partir del primer elemento 100 elementos
para tomar el elemento que tenga la posición 100 en la lista de la población, a partir de
este elemento se cuentan otros 100 y así se continúa. Por lo general, de esta manera es
más fácil de identificar la muestra de 50 que si se usara el muestreo aleatorio simple.
Como el primer elemento que se selecciona es elegido en forma aleatoria, se supone que
una muestra sistemática tiene las propiedades de una muestra aleatoria simple. Esta
suposición es aplicable, en especial, cuando la lista de los elementos de la población es
un orden aleatorio de los elementos.
Muestreo de conveniencia
Los métodos de muestreo hasta ahora vistos se conocen como técnicas probabilísticas de
muestreo.
Los elementos seleccionados de una población tienen una probabilidad conocida de ser
incluidos en la muestra. La ventaja del muestreo probabilístico es que, por lo general, se
identifica la distribución muestral del estadístico muestral correspondiente. Para
determinar las propiedades de la distribución muestral se usan las fórmulas presentadas
en este capítulo para el muestreo aleatorio simple. La distribución muestral permite hacer
afirmaciones probabilísticas acerca del error al usar los resultados muéstrales para hacer
inferencias acerca de la población.
El muestreo de conveniencia es una técnica de muestreo no probabilística. Como el
nombre
lo indica, la muestra se determina por conveniencia. Los elementos se incluyen en la
muestra sin que haya una probabilidad previamente especificada o conocida de que sean
incluidos en la muestra. Por ejemplo, un profesor que realiza una investigación en una
universidad puede usar estudiantes voluntarios para que constituyan una muestra; ¿la
razón para elegirlos simple, los tiene al alcance y participarán como sujetos a un costo
bajo o sin costo. De manera similar, un inspector puede muestrear un cargamento de
naranjas seleccionando al azar naranjas de varias de las cajas. Marcar cada naranja y
usar un método probabilístico de muestreo puede no resultar práctico. Muestras como los
paneles de voluntarios en investigaciones sobre los consumidores son también muestras
de conveniencia. Dichas muestras tienen la ventaja de que es relativamente fácil
seleccionar la muestra y recoger los datos; sin embargo, es imposible evaluar la “bondad”
de la muestra en términos de su representatividad de la población. Una muestra de
conveniencia puede o no dar buenos resultados. Algunas veces los investigadores aplican
los métodos estadísticos propios de muestras probabilísticas a las muestras de
conveniencia, con el argumento de que la muestra de conveniencia se trata como si fuera
una muestra probabilística. Sin embargo, estos argumentos no tienen fundamento y se
debe tener cuidado al interpretar los resultados de muestreos de conveniencia que han
sido usados para hacer inferencias acerca de la población.
Muestreo subjetivo
Otra técnica de muestreo no probabilística es el muestreo subjetivo. En este método la
persona que más sabe sobre un asunto selecciona elementos de la población que
considera los más representativos de la población. Este método suele ser una manera
relativamente fácil de seleccionar una muestra. Por ejemplo, un reportero puede
seleccionar dos o tres senadores considerando que estos senadores reflejan la opinión
general de todos los senadores. Sin embargo, la calidad de los resultados muéstrales
depende de la persona que selecciona la muestra. Aquí también hay que tener mucho
cuidado al hacer inferencias acerca de las poblaciones a partir de muestreos subjetivos.

Objetivo del muestreo

Estimar algún parámetro de una población de N elementos a partir de la información de


una muestra de n elementos.
El muestreo es importante porque:
1) Por lo general no se pueden estudiar a las poblaciones en su totalidad, entonces
estaremos obligados a hacer el muestreo.
2) Es más rápido y económico para conocer los parámetros (características) de interés de
la población.
3) Existe metodología clara y confiable para el muestreo (y tamaño de muestra)

Por supuesto que nunca se puede calcular realmente el tamaño del error de muestro
debido a que la media poblacional sigue siendo desconocida. Sin embargo, se debe ser
consciente de que es más probable que ocurra algún error de muestreo.

¿Se puede esperar que al analiza una muestra de una población,


un estadístico pudiera ser igual al parámetro poblacional
correspondiente?
Primero hay que definir sus características de cada uno:
En estadística un estadístico (muestral) es una medida cuantitativa, derivada de un
conjunto de datos de una muestra, con el objetivo de estimar o inferir características de
una población o modelo estadístico. 
Los parámetros poblacionales caracterizan y describen las poblaciones. Son equivalentes
a los estadísticos en las muestras. Un estadístico es una función de la muestra, esto,
depende sola y exclusivamente de nuestra muestra.
Por lo que la diferencia es que:
Varía y está sometido al error (variabilidad) del muestreo. Los parámetros no varían, son
constantes y además desconocidos. Contienen las características de la población.
Por lo que ambos no son iguales.

Teorema del límite central

El teorema del límite central es un teorema fundamental de probabilidad y estadística. El


teorema establece que la distribución de  , que es la media de una muestra aleatoria de
una población con varianza finita, tiene una distribución aproximadamente normal cuando
el tamaño de la muestra es grande, independientemente de la forma de la distribución de
la población. Muchos procedimientos estadísticos comunes requieren que los datos sean
aproximadamente normales, pero el teorema del límite central le permite aplicar estos
procedimientos útiles a poblaciones que son marcadamente no normales. El tamaño que
debe tener la muestra depende de la forma de la distribución original. Si la distribución de
la población es simétrica, un tamaño de muestra de 5 podría generar una aproximación
adecuada; si la distribución de la población es marcadamente asimétrica, se requiere un
tamaño de muestra de 50 o más. Las siguientes gráficas muestran ejemplos de cómo la
distribución afecta el tamaño de la muestra que usted necesita.
Distribución uniforme Medias de las muestras

Una población que sigue una distribución uniforme es simétrica, pero marcadamente no
normal, como lo indica el primer histograma. Sin embargo, la distribución de 1000 medias
de la muestra (n=5) de esta población es aproximadamente normal debido al teorema del
límite central, como lo demuestra el segundo histograma. Este histograma de medias de
la muestra incluye una curva normal superpuesta para ilustrar esta normalidad.

Distribución de muestreo

Una distribución de muestreo describe la probabilidad de obtener cada valor posible de un


estadístico de una muestra aleatoria de una población, en otras palabras, qué proporción
de todas las muestras aleatorias de ese tamaño ofrecerá ese valor. Supongamos que
usted mide el peso de llenado de una muestra aleatoria de 10 cajas de cereal que salen
de la máquina de llenado y calcula una media de 370 g. Junto con la población y el
tamaño de la muestra, la distribución de muestreo describe la probabilidad de obtener
este valor o cualquier otro para el peso medio de llenado.
Si usted conoce la población, puede determinar la distribución de muestreo. Sin embargo,
puede obtener información útil sobre la distribución de muestreo sin conocer la población.
Por ejemplo, si no conoce la población, podría decir que existe un 85% de certeza de que
la media de la muestra esté dentro de un cierto número de desviaciones estándar de la
media de la población. También podría decir que, si las medias de dos poblaciones son
iguales, la diferencia entre las medias de las muestras debería ubicarse entre ciertos
valores.

Distribución muestral para medias “2” conocida

Hasta ahora estábamos admitiendo que se conoce la varianza de la población de la que


se extrae la muestra, pero esta no ser ‘a la situación general, sino que la mayoría de las
veces no conocemos la varianza de la población, entonces como se dispone de una
muestra aleatoria de tamaño n, podemos, calcular la varianza muestral S 2 y utilizarla en
lugar de la varianza poblacional σ 2 desconocida, pues S 2 es, como veremos después,
un buen estimador de σ 2. Cuando σ 2 es desconocido, la distribución muestral de Z =
X¯−µ σ/√ n depende del tamaño de la muestra.
Distribución muestral para medias, “2” desconocida, la
distribución “t” de Student

Cuando se calcula un intervalo de confianza para la media poblacional, suele no contarse


con una buena estimación de la desviación estándar poblacional. En tales casos se usa la
misma muestra para estimar μ y σ. Esta situación es el caso que se conoce como σ
desconocida. Cuando se usa s para estimar σ, el margen de error y la estimación por
intervalo de la media poblacional se basan en una distribución de probabilidad conocida
como distribución t. Aunque la elaboración matemática de la distribución t parte de la
suposición de que la población de la que se muestrea tiene una distribución normal, las
investigaciones han demostrado que la distribución t se aplica en muchas situaciones en
que la población se desvía significantemente de una población normal.
Más adelante, en esta misma sección, se proporcionan lineamientos para usar la
distribución t cuando la población no está distribuida normalmente.
La distribución t es una familia de distribuciones de probabilidad similares; cada
distribución
t depende de un parámetro conocido como grados de libertad. La distribución t para un
grado de libertad es única, como lo es la distribución t para dos grados de libertad, para
tres grados de libertad, etc. A medida que el número de grados de libertad aumenta, la
diferencia entre la distribución t y la distribución normal estándar se va reduciendo. En la
figura 8.4 se muestran las distribuciones t para 10 y 20 grados de libertad y su relación
con la distribución de probabilidad normal estándar. Observe que una distribución t para
más grados de libertad exhibe menos variabilidad y un mayor parecido con la distribución
normal estándar, también que la media de toda distribución t es cero.
Para indicar el área en la cola superior de la distribución t, a la t se le pone un subíndice.
Por
ejemplo, así como se usó z0.025 para indicar el valor de z que deja en la cola superior de
la distribución normal estándar un área de 0.025, se usará t0.025 para indicar el valor de t
que deja en la cola superior de la distribución t un área de 0.025. En general se usará la
notación tα/2 para representar el valor de t que deja un área de α/2 en la cola superior de
la distribución t. Véase figura 8.5. La tabla 2 del apéndice B contiene una tabla con la
distribución t. En la tabla 8.2 se muestra parte de esa tabla. Cada renglón de la tabla
corresponde a una distribución t distinta con los grados de libertad que se indican. Por
ejemplo, en la distribución t con 9 grados de libertad, t0.025 _ 2.262. De manera similar en
la distribución t con 60 grados de libertad, t0.025 _ 2.000. A medida que los grados de
libertad aumentan, t0.025 se aproxima a z0.025 _ 1.96. En efecto, el valor z de la
distribución normal estándar se encuentra en el renglón correspondiente a infinitos grados
de libertad (cuyo encabezado es _) de la tabla de las distribuciones t. Si los grados de
libertad son más de 100, se puede usar el renglón correspondiente a infinitos grados de
libertad para aproximar el verdadero valor de t; en otras palabras, para más de 100
grados de libertad, el valor z normal estándar proporciona una buena aproximación al
valor t.
Características:
Margen de error en estimación
por intervalo
En la sección 8.1 se mostró que la estimación por intervalo de la media poblacional
cuando σ es conocida es Para calcular una estimación por intervalo para μ en el caso en
que no se conoce σ se usa la desviación estándar muestral s para estimar σ, y zα/2 se
sustituye por el valor ta/2 de la distribución t.
El estadístico de prueba:
ESTIMACIÓN POR INTERVALO DE LA MEDIA POBLACIONAL: σ DESCONOCIDA

s
(8.2)
x¯ ± tα/2 Vn

donde s es la desviación estándar muestral, (1 - α) es el coeficiente de confianza y tα/2 es


el valor de t que proporciona un área de α/2 en la cola superior de la distribución t para
n - 1 grados de libertad.

Uso de la tabla:
TABLA 8.2 ALGUNOS VALORES DE LA TABLA DE LA DISTRIBUCIÓN t*

Área o
probabilidad

0t

Grados Área en la cola superior


de libertad 0.20 0.10 0.05 0.025 0.01 0.005
1 1.376 3.078 6.314 12.706 31.821 63.656
2 1.061 1.886 2.920 4.303 6.965 9.925
3 0.978 1.638 2.353 3.182 4.541 5.841
4 0.941 1.533 2.132 2.776 3.747 4.604
5 0.920 1.476 2.015 2.571 3.365 4.032
6 0.906 1.440 1.943 2.447 3.143 3.707
7 0.896 1.415 1.895 2.365 2.998 3.499
8 0.889 1.397 1.860 2.306 2.896 3.355
9 0.883 1.383 1.833 2.262 2.821 3.250

60 0.848 1.296 1.671 2.000 2.390 2.660


61 0.848 1.296 1.670 2.000 2.389 2.659
62 0.847 1.295 1.670 1.999 2.388 2.657
63 0.847 1.295 1.669 1.998 2.387 2.656
64 0.847 1.295 1.669 1.998 2.386 2.655
65 0.847 1.295 1.669 1.997 2.385 2.654
66 0.847 1.295 1.668 1.997 2.384 2.652
67 0.847 1.294 1.668 1.996 2.383 2.651
68 0.847 1.294 1.668 1.995 2.382 2.650
69 0.847 1.294 1.667 1.995 2.382 2.649

90 0.846 1.291 1.662 1.987 2.368 2.632


91 0.846 1.291 1.662 1.986 2.368 2.631
92 0.846 1.291 1.662 1.986 2.368 2.630
93 0.846 1.291 1.661 1.986 2.367 2.630
94 0.845 1.291 1.661 1.986 2.367 2.629
95 0.845 1.291 1.661 1.985 2.366 2.629
96 0.845 1.290 1.661 1.985 2.366 2.628
97 0.845 1.290 1.661 1.985 2.365 2.627
98 0.845 1.290 1.661 1.984 2.365 2.627
99 0.845 1.290 1.660 1.984 2.364 2.626
100 0.845 1.290 1.660 1.984 2.364 2.626
00 0.842 1.282 1.645 1.960 2.326 2.576

Distribución muestral para proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino


que queremos investigar la proporción de artículos defectuosos o la proporción de
personas con teléfono, etc. en la muestra. La distribución muestral de proporciones es la
adecuada para dar respuesta a estas situaciones. Esta distribución se genera de igual
manera que la distribución muestral de medias, a excepción de que al extraer las
muestras de la población s e calcula el estadístico proporción (p=x/n en donde “x” es el
número de éxitos u observaciones de interés y “n” el tamaño de la muestra) en lugar de la
media de cada muestra que era lo que calculamos antes.

 Aproximación d/la dist. normal a la binomial


La distribución muestral de proporciones está estrechamente relacionada con la
distribución binomial; una distribución binomial es una distribución del total de éxitos en
las muestras, mientras que una distribución de proporciones es la distribución de un
promedio (media) de los éxitos. Como consecuencia de esta relación, las afirmaciones
probabilísticas referentes a la proporción muestral pueden evaluarse usando la
aproximación normal a la binomial, siempre que: np ≥ 5 y n (1- p) ≥ 5 Una distribución
binomial es, por ejemplo, si echamos una moneda al aire y observamos el lado que cae.
Está claro que sólo hay dos posibilidades. Ahora bien, la probabilidad de que caiga la
moneda de cualquier lado es la misma siempre que ésta no esté cargada. Como cada
caso tiene igual probabilidad de ocurrir, y siendo la suma de probabilidades siempre igual
a 1, entonces la probabilidad de que caiga la moneda de algún lado es 0.5. Si realizamos
el experimento n veces y queremos saber la probabilidad d de que salga águila o sol x
veces, entonces usamos una distribución binomial.
 El estadístico de prueba

ESTIMACIÓN POR INTERVALO DE UNA PROPORCIÓN POBLACIONAL


p¯ ± zα/2


p¯(1 p¯)
(8.6)
n

donde 1 α es el coeficiente de confianza y zα/2 es el valor de z que deja un área α/2 en


la cola superior de la distribución normal estándar.
La estimación estadística
 Introducción
 Tipos de estimadores: puntuales y por intervalo
 Interpretaciones de y de (1- )

I. de C. Para la media de una población () varianza  conocida.


¿Cuándo se aplica? ¿Cuál es el modelo?

Determinación del tamaño de la muestra para medias

I. de C. Para la media de una población () varianza  desconocida.


¿Cuándo se aplica? ¿Cuál es el modelo?

I. de C. Para la proporción,  de una población. ¿Cuándo se aplica?


¿Cuál es el modelo?

Determinación del tamaño dela muestra para proporciones


A partir de la fórmula para el intervalo de confianza

podemos determinar el tamaño muestral necesario con el fin de que la precisión de la


estimación sea la deseada con antelación. La fórmula que resulta es

donde d es el radio máximo deseado para el intervalo y zα/2 tiene el significado habitual.
Nótese que no hemos tenido en cuenta el último término de la primera expresión.
La aplicación efectiva de la fórmula obtenida requiere el conocimiento de p y de q = (1 −
p), valores que nos son desconocidos en la práctica. Para solventar este problema
tenemos dos alternativas:
 Considerar el caso más desfavorable posible, es decir, aquel que verifique
que p · q da el valor máximo posible. Es fácil verificar que esto sucede si p = 0,5.
En este caso el producto es p · q = 0,25.
 Utilizar un valor de referencia obtenido a partir de una muestra piloto o a partir de
datos bibliográficos y utilizar el valor compatible con la información más cercano
a p = 0,5.
A partir de la fórmula puede comprobarse que el tamaño muestral requerido, una vez
fijada p, crece al incrementarse la confianza del intervalo y crece también al
incrementarse la precisión (al disminuir el radio).

La prueba de Hipótesis, Introducción


La experiencia sobre el comportamiento de algún índice de un proceso, o la exigencia del
cumplimiento de alguna norma nos lleva a realizar proposiciones sobre el valor de algún
parámetro estadístico.
Estas proposiciones se denominan Hipótesis y el procedimiento para decidir si se aceptan
o se rechazan se denomina Prueba de Hipótesis

Def. de Hipótesis estadística


Una hipótesis Estadística es una proposición sobre los parámetros de una población o
sobre la distribución de probabilidad de una variable aleatoria
Ejemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para los
sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable aleatoria
con alguna distribución de probabilidad). Especialmente interesa la rapidez de combustión
promedio (que es un parámetro (µ) de dicha distribución). De manera más específica,
interesa decidir si esta rapidez promedio es o no 50 cm/seg.
Hipótesis Nula: H0: µ = 50 cm/seg
Hipótesis Alternativa: H1: µ≠ 50 cm/seg

Tipos de hipótesis
1. Hipótesis de Investigación
• Hasta este momento nos hemos referido exclusivamente a ellas.
• Se simbolizan como “Hi” pero también como “H1”, “H2”, etc.
• Pueden ser Descriptivas, Relacionales, de Diferencia entre grupos, y de
Establecimiento de causalidad.
• Ello dependerá de los objetivos y de la pregunta de investigación.
2. Hipótesis Estadísticas
Las hipótesis de investigación deben ser planteadas de tal forma que puedan ser
contrastadas mediante métodos estadísticos.
• Las Hipótesis Estadísticas son afirmaciones sobre una o más poblaciones, o
bien, son afirmaciones sobre uno o más parámetros de una o más poblaciones.
• Existen 2 tipos de Hipótesis estadísticas:
2.1 Hipótesis Nulas
• También se les llama de “ninguna diferencia”
• Al igual que las Hi se constituyen a partir de relaciones entre variables, pero
“sirven para refutar o negar lo que afirman las Hi” (Hernández et al, 1998, pp. 88).
• Es decir, es una afirmación en que se dice que no hay ninguna diferencia entre
dos poblaciones, entre dos parámetros poblacionales, o entre el valor verdadero
de algún parámetro y su valor hipotético
• Se simbolizan como “Ho”.
• Existen tantos tipos de Ho como Hi.
• Es la hipótesis que se contrastará empíricamente.

2.2 Hipótesis Alternativas


• Son posibilidades alternas ante los otros dos tipos de hipótesis.
• Ofrecen una descripción o explicación diferentes a las ya establecidas.
• Se simbolizan como “Ha”
• Suelen coincidir con la hipótesis de investigación.
• No siempre pueden formularse.

Construcción de hipótesis (agregar ejemplos)


1º definir del modo más preciso posible cada una de las variables intervinientes;
2º Establecer la o las variables independientes (causas) y las variables dependientes
(consecuencias o efectos); y
3º determinar la relación causal entre las variables.

Tipos de pruebas
El estadístico de prueba
Tipos de errores
Procedimiento para la P. de H.
P de H para una media con  conocida.
P. de H. para una media con  desconocida.
P. de H. para una proporción 
http://www.ub.edu/aplica_infor/spss/cap4-1.htm
http://frecuenciaestadistica.blogspot.mx/2009/04/muestreo.html
http://support.minitab.com/es-mx/minitab/17/topic-library/basic-statistics-and-
graphs/introductory-concepts/basic-concepts/central-limit-theorem/
http://support.minitab.com/es-mx/minitab/17/topic-library/basic-statistics-and-
graphs/introductory-concepts/basic-concepts/sampling-distribution/
http://www.geociencias.unam.mx/~ramon/EstInf/Clase5.pdf
el libro de Estadistica para admin. y economia - Anderson 10 th
proporcionado por el ingeniero bocos.

También podría gustarte