Apuntes Estadistica Inferencial 1 PDF

TEMARIO A DESARROLLAR DE ESTADISTICA INFERENCIAL I DE LA ESPECIALIDAD DE
INGENIERIA INDUSTRIAL.
UNIDAD I Distribuciones Fundamentales para el Muestreo
Introducción a la Estadística Inferencial

Muestreo: Introducción al muestreo y tipos de muestreo
Teorema del límite central
Distribuciones fundamentales para el muestreo
Distribución muestral de la media
Distribución muestral de la diferencia de medias
Distribución muestral de la proporción
Distribución muestral de la diferencia de proporciones
Distribución t-student
Distribución muestral de la varianza
Distribución muestral de la relación de varianzas
UNIDAD II Estimación
Introducción
Características de un estimador
Estimación puntual
Estimación por intervalos
Intervalo de confianza para la media
Intervalo de confianza para la diferencia de medias
Intervalos de confianza para la proporción
Intervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la varianza
Intervalos de confianza para la relación de varianzas
Determinación del tamaño de muestra
Basado en la media de la Población
Basado en la proporción de la Población
Basado en la diferencia entre las medias de la Población
UNIDAD III Pruebas de hipótesis
Introducción
Confiabilidad y significancia
Errores tipo I y tipo II
Potencia de la prueba
Formulación de Hipótesis estadísticas
Prueba de hipótesis para la media
Prueba de hipótesis para la diferencia de medias
Prueba de hipótesis para la proporción
Prueba de hipótesis para la diferencia de proporciones
Prueba de hipótesis para la varianza
Prueba de hipótesis para la relación de varianzas.
Uso de software estadístico
UNIDAD IV Pruebas de bondad de ajuste y pruebas no paramétricas
Bondad de ajuste
Análisis Ji-Cuadrada
Prueba de independencia
Prueba de la bondad del ajuste
Tablas de contingencia
Uso del software estadístico.
Pruebas no paramétricas
Escala de medición
Métodos estadísticos contra no paramétricos
Prueba de Kolmogorov – Smirnov
Prueba de Anderson – Darling
Prueba de Ryan – Joiner
Prueba de Shappiro – Wilk
UNIDAD V Regresión lineal simple y múltiple
Regresión Lineal simple

Prueba de hipótesis en la regresión lineal simple
Calidad del ajuste en regresión lineal simple
Estimación y predicción por intervalo en regresión lineal simple
Regresión lineal múltiple
Pruebas de hipótesis en regresión lineal múltiple
Intervalos de confianza y predicción en regresión múltiple
Uso de un software estadístico
Regresión no lineal.
UNIDAD I Distribuciones Fundamentales para el Muestreo
Introducción a la Estadística Inferencial

Muestreo: Introducción al muestreo y tipos de muestreo
Teorema del límite central
Distribuciones fundamentales para el muestreo
Distribución muestral de la media
Distribución muestral de la diferencia de medias
Distribución muestral de la proporción
Distribución muestral de la diferencia de proporciones
Distribución t-student
Distribución muestral de la varianza
Distribución muestral de la relación de varianzas
INTRODUCCION A LA ESTADISTICA INFERENCIAL
Estadística:
La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente
a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos
unos significados precisos o unas previsiones para el futuro.
Estadística Descriptiva
La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza
un conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una
escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las
diversas características de ese conjunto.
Inferencia
Inferencia es la acción y efecto de inferir (deducir algo, sacar una consecuencia de otra cosa,
conducir a un resultado). La inferencia surge a partir de una evaluación mental entre distintas
expresiones que, al ser relacionadas como abstracciones, permiten trazar una implicación
lógica.
Estadística Inferencial
La estadística inferencial no es más que un argumento. Un buen argumento hace creíble una
afirmación. En nuestro caso, cualquier estudio necesitará, al menos dos argumentos sólidos:
el estadístico y el relativo al diseño de investigación (lo que se puede aprender en Métodos I y
II). Desde este punto de vista, nuestra tarea es poder entender (y calibrar) los argumentos
estadísticos y también poder construirlos nosotros mismos.
La estadística inferencial es necesaria cuando queremos hacer alguna afirmación sobre más
elementos de los que vamos a medir. La estadística inferencial hace que ese salto de la parte
al todo se haga de una manera “controlada”. Aunque nunca nos ofrecerá seguridad absoluta,
sí nos ofrecerá una respuesta probabilística. Esto es importante: la estadística no decide; sólo
ofrece elementos para que el investigador o el lector decidan. En muchos casos, distintas
personas perciben diferentes conclusiones de los mismos datos.
El proceso será siempre similar. La estadística dispone de multitud de modelos que están a
nuestra disposición. Para poder usarlos hemos de formular, en primer lugar, una pregunta en
términos estadísticos. Luego hemos de comprobar que nuestra situación se ajusta a algún
modelo (si no se ajusta no tendría sentido usarlo). Pero si se ajusta, el modelo nos ofrecerá
una respuesta estadística a nuestra pregunta estadística. Es tarea nuestra devolver a la
psicología esa respuesta, llenándola de contenido psicológico.
¿Cuándo es necesaria la estadística inferencial? Cuando queremos hacer alguna afirmación
sobre más elementos de los que vamos a medir.
La estadística descriptiva, como indica su nombre, tiene por finalidad describir. Así, si
queremos estudiar diferentes aspectos de, por ejemplo, un grupo de personas, la estadística
descriptiva nos puede ayudar. Lo primero será tomar medidas, en todos los miembros del
grupo, de esos aspectos o variables para, posteriormente, indagar en lo que nos interese.
La estadística inferencial es la que va a permitir dar ese salto de los resultados obtenidos para
un grupo a la totalidad.
Definiciones Importantes
Población: un conjunto de elementos (generalmente personas, en psicología) que comparten
al menos una característica bien definida.
Muestra: es un subconjunto de elementos extraídos de una población
Variable: Característica de los elementos de una población que puede tomar diversos valores
(al menos, dos).
Datos: Valores obtenidos al medir una variable en una muestra.
Estadístico: Es un valor numérico que expresa una característica de una muestra.
Formalmente, un estadístico es una función definida sobre una variable.
Parámetro: Es un valor numérico que expresa una característica de una población
MUESTREO: INTRODUCCION AL MUESTREO Y TIPOS DE MUESTREO
Introducción
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los
elementos de una población), se selecciona una muestra, entendiendo por tal una parte
representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica
es determinar que parte de una población debe examinarse, con la finalidad de hacer
inferencias sobre dicha población.
Historia del muestro

Según Rao (2005), el primer personaje interesado en el método representativo (mas adelante
conocido como teoría de muestreo (fue el estadístico noruego A.N. Kaier (1897) puesto que
demostró empíricamente que seleccionando muestras estratificadas se obtienen mejores
resultados en los estimativos de medias y totales. En 1906, Bowley utiliza aproximaciones a la
distribución normal para la estimación de proporciones y propone la fórmula de estimación de
la varianza para diseños de muestro estratificados. Para la década de 1920, el método
representativo era usado de manera difundida en estados Unidos y alrededor del mundo. Fue
así como en 1924, el ISI (Instituto Internacional de Estadística,) crea una comisión de discusión
de este método. Los resultados de este comité incluyen el trabajo de bowley (1926 basado en
métodos de selección representativos con probabilidades de inclusión iguales. Con estos
avances teóricos y con la publicación de tablas de números aleatorio por tippett (1927) se
facilitó la selección de muestras pirobalísticas.
Muestreo
Es la actividad por la cual se toman ciertas muestras de una población de elementos de los
cuales vamos a tomar ciertos criterios de decisión, el muestreo es importante porque a través
de él podemos hacer análisis de situaciones de una empresa o de algún campo de la sociedad.
Terminología para el muestreo
Símbolos para estadísticos y parámetros correspondientes
Medida Símbolo para el estadístico Símbolo para el parámetro.
Distribución en el muestreo: Cuando el tamaño de la muestra (n) es más pequeño que el

tamaño de la población (N), dos o más muestras pueden ser extraídas de la misma población.
Un cierto estadístico puede ser calculado para cada una de las muestras posibles extraídas de
la población. Una distribución del estadístico obtenida de las muestras es llamada la
distribución en el muestreo del estadístico.
Error Estándar: La desviación estándar de una distribución, en el muestreo de un estadístico,

es frecuentemente llamada el error estándar del estadístico.
Error muestral o error de muestreo: La diferencia entre el resultado obtenido de una muestra
(un estadístico) y el resultado el cual deberíamos haber obtenido de la población (el parámetro
correspondiente) se llama el error muestral o error de muestreo.
Tipos de muestreo
No aleatorios: Se eligen los elementos, en función de que sean representativos, según la
opinión del investigador.
Aleatorios: Todos los miembros de la muestra han sido elegidos al azar, de forma que cada
miembro de la población tuvo igual oportunidad de salir en la muestra.
Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las
posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos
métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída
y son, por tanto, los más recomendables.
Muestreo aleatorio simple:

Consiste en elegir cada uno de los individuos al azar mediante números aleatorios.
El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la
población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números
aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen
tantos sujetos como sea necesario para completar el tamaño de muestra requerido.
Muestreo aleatorio sistemático

Consiste en elegir el primer individuo al azar y el resto de manera sistemática.
Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero
en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio
i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa
los lugares i, i+k, i+2k, i+3k,..., i+(n-1) k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número
i que empleamos como punto de partida será un número al azar entre 1 y k.
El Muestreo Aleatorio Estratificado

Consiste en dividir la población en grupos en función de una característica determinada y
realizar a continuación el muestreo proporcionalmente
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y
suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar
categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a
alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de interés estarán representados adecuadamente en la
muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán
parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues
exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...)
El Muestreo Por Conglomerados

Consiste en definir grupos de características semejantes e incluir en la muestra varios de estos
grupos
En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la
población que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias los departamentos universitarios, una caja de determinado producto, etc., son
conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas
suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en
seleccionar aleatoriamente un cierto número de conglomerados (el necesario para alcanzar el
tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a
los conglomerados elegidos.
Muestreo Por Etapas

En el muestreo por etapas o muestreo polietápico, la muestra se obtiene mediante extracción
sucesiva de unidades de muestreo de distinto orden en primero lugar se saca una muestra de
unidades de primer orden llamadas unidades primarias o de muestreo, después e obtiene una
submuestra de unidades de segundo orden llamadas unidades secundarias de muestreo
extraídas de cada una de las unidades de primer orden seleccionadas anteriormente y así en
forma sucesiva. Cuando dispone de un adecuado marco de muestreo se recurre al muestreo
por áreas, en que la unidad de muestreo está constituida por una fracción del territorio ocupado
por la población estudiada
Teorema del Limite Central

Si una población tiene media μ y desviación típica σ, y tomamos muestras de tamaño n (n>25,
o cualquier tamaño si la población es "normal"), las medias de estas muestras siguen
aproximadamente la distribución:
(El Teorema Central del Límite dice que si tenemos un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que éste sea),
la suma de ellas se distribuye según una distribución normal.)
Este teorema se aplica tanto a suma de variables discretas como de variables continuas.
Los parámetros de la distribución normal son:
Media: n * m (media de la variable individual multiplicada por el número de variables

independientes)
Varianza: n * s2 (varianza de la variable individual multiplicada por el número de variables

individuales)
En muestras de tamaño n, tomadas de una población en la que la regularidad estadística no
sigue una distribución normal (puede ser de cualquier forma), que tiene una media poblacional
m y varianza poblacional s2, entonces si n es grande, el proceso de tomar muchas muestras
y en cada una de ellas tomar su media, el promedio muestral produce una regularidad
estadística de los valores de la media que se modela con la distribución normal
con media x y varianza s2/n
Consecuencias:
1. Permite averiguar la probabilidad de que la media de una muestra concreta esté en un cierto
intervalo.
2. Permite calcular la probabilidad de que la suma de los elementos de una muestra esté, a
priori, en un cierto intervalo.
3. Inferir la media de la población a partir de una muestra.
Este teorema afirma que la distribución de medias muéstrales tiende hacia una distribución
normal, aunque las muestras procedan de una distribución no normal determinar un modelo
de probabilidad para describir el comportamiento de una variable continua.
Es un Teorema de gran importancia en Estadística, especialmente para la parte de Inferencia

Estadística. Establece que si X 1 ,.............,X n son variables aleatorias independientes con
media μ i y varianza σ i 2 , al margen del tipo de distribución que sigan los sumandos, la suma
de todas ellas, Y = X 1 +.........+X n tiende a distribuirse aproximadamente normal, con media
μ = (μ 1 +...........+ μ n ) y varianza σ 2 = ( +..........+ )/n, siendo las aproximaciones mejores a
medida que aumenta n.
De acuerdo con el resultado siempre que observemos una variable que sea el resultado de
muchas causas independientes, esperamos que su distribución sea aproximadamente normal,
de ahí la frecuencia con la que se presentan en realidad variables aleatorias cuya distribución
puede aproximarse a la distribución normal, debido a que muchas de éstas variables reales
pueden considerarse la suma de variables independientes. Por ejemplo, las medidas físicas
de una persona son debidas a muchas variables: genética, alimentación, ejercicio físico, etc.
Y se esperan que sigan una distribución normal.
Distribución de Muestreo.
La distribución de todos los valores posibles que puede asumir un estadístico muestral,
calculados a partir de muestras del mismo tamaño y extraído en forma aleatoria de la misma
población, se llama distribución muestral de ese estadístico. La distribución por muestreo de
un estadístico muestral es la distribución de probabilidad del mismo, calculado en cada una de
las muestras posibles extraídas aleatoriamente de la población.
Generalmente nos interesa conocer una o más de las siguientes características de la

distribución muestral.
1.- Su forma funcional (como aparece en su representación gráfica).
2.- Su media.
3.- Su desviación estándar (error estándar)
* Entre mayor sea el tamaño de la muestra n, más aproximada está la distribución del
estadístico X a la distribución normal.
* Un tamaño de muestra lo suficientemente grande se presenta cuando hay una coincidencia
mínima de cuatro cifras decimales entre las probabilidades del modelo y su aproximación.
* Para el caso de variables aleatorias continuas con varianza finita, un tamaño de n = 30 se
considera lo suficientemente grande.
* La gran importancia del TLC reside en que, a través de su aplicación, puede hacerse
inferencia estadística de una enorme cantidad de procesos naturales y sociales.
Si aplicamos el proceso de estandarización, a la formula Z= (X- μ)/σ se convierte en Z= (X-
μ)/(σ/n)
Porque en lugar de la variable aleatoria X ahora se tiene el estadístico de la media muestral X
y, por consiguiente, el parámetro σ ha sido sustituido por el correspondiente σn
Distribución
Es la acción de dividir algo entre varias personas, dar a algo el destino conveniente, entregar
una mercancía.
Distribución normal
Se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de
las distribuciones de probabilidad de variable continua que con más frecuencia aparece
aproximada en fenómenos reales. La gráfica de su función de densidad tiene una forma
acampanada y es simétrica respecto de un determinado parámetro estadístico. Esta curva se
conoce como campana de Gauss y es el gráfico de una función gaussiana.
° Distribución Muestral
Población: Consiste en la totalidad de las observaciones en las que estamos interesados. Cada
observación en una población es un valor de una v. a. X que tiene alguna distribución de
probabilidad.
Cada observación de una población es un valor de una v. a. X. que tiene alguna distribución
de probabilidad f(x)
Población normal- población f(x)
° La media (valor esperado) de una población
° La varianza de la población normal
Muestra Aleatoria
v.a. Xi i= 1,…,n xi:”i_esima medición o valor de la muestra que observemos”
En estadística, la distribución muestral es lo que resulta de considerar todas las muestras

posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad
que se tiene, dada una sola muestra, de acercarse al parámetro de la población. Mediante la
distribución muestral se puede estimar el error para un tamaño de muestra dado.
La fórmula para la distribución muestral dependerá de la distribución de la población, del

estadístico y del tamaño de la muestra
A partir de las muestras seleccionadas de una población pueden construirse variables
aleatorias alternativas, de cuyo análisis se desprenden interesantes propiedades estadísticas.
Las dos formas más comunes de estas variables corresponden a las distribuciones muéstrales
de las medias y de las proporciones.
Las dos medidas fundamentales de esta distribución son la media y la desviación típica,
también denominada error típico o desviación estándar.
DISTRIBUCION MUESTRAL DE LA MEDIA
1. SIGMA CONOCIDA
2. SIGMA DESCONOCIDA
° (σ CONOCIDA)
Supongamos que una muestra aleatoria de n observaciones ha sido tomada de cierta
población y que si tomáramos una segunda muestra aleatoria de tamaño n de esta población,
sería poco razonable esperar un valor idéntico de , mientras que si extrajéramos varias
muestras más, quizá ninguna de las sería igual. La diferencia entre tales atribuye por lo
general al azar, de lo que derivan importantes preguntas acerca de su distribución, y
especificaciones acerca del grado de sus azarosas fluctuaciones.
TEOREMA: Si una muestra aleatoria de tamaño n es extraída de una población con media μ
y varianza σ2 , entonces es una variable aleatoria cuya distribución tiene media μ. Pa
muestras poblacionales infinitas, la varianza de distribución es σ2 /n; para muestras de una
población finita de tamaño N, la varianza es (σ2 )/n) (N-n/N-1).
En general, es imposible determinar exactamente esa distribución sin conocer la forma real de
la población, aunque es posible determinar la distribución de limitación como n→∞ de una
variable aleatoria cuyos valores se relacionan estrechamente con , en el supuesto
únicamente de que la población tenga una varianza finita σ2 . La variable aleatoria a la nos
referimos aquí es la media muestral estandarizada.
Cuyos valores están dados por la diferencia entre y μ dividida entre el error estándar de la
media.
EJERCICIOS RESUELTOS
1 Suponiendo que la población de alumnos de Ciencias de la Educación presenta la

distribución N (100, 15) en el C.I. medido por un test de inteligencia, ¿qué porcentaje de las
muestras de tamaño n = 81 extraídas de esa población arrojarán una media por debajo de C.I.
= 95? ¿Qué probabilidad hay de que en una muestra extraída al azar obtengamos un C.I.
medio entre 98 y 103?
Para responder a ambos interrogantes, nos basaremos en el teorema del límite central. De
acuerdo con éste, podemos afirmar que la distribución muestral de la media de C.I. en mues-
tras de tamaño n = 81 es normal, puesto que tales muestras proceden de una población nor-
mal. Los parámetros de la distribución muestral de la media (valor esperado y error típico)
serán:
[D]
En la primera cuestión formulada, el problema se limita a hallar el porcentaje de puntuaciones

que se encuentran por debajo del valor z95 en una distribución normal, es decir el valor por-
centual del área marcada en la figura 1.
[D]
[D]
Figura 1: Área delimitada por la puntuación típica z = -3
Y consultando una tabla de valores para la distribución normal, sabemos que P {Z ≤ -3) =
0.0014, por lo que el porcentaje de muestras (n = 81) en que la media del C.I. de los alumnos
está por debajo de 95 es del 0.14%.
En cuanto a la segunda de las cuestiones, bastará con transformar de nuevo en puntuaciones

típicas los valores de las medias 98 y 103, y calcular la probabilidad de encontrar una puntua-
ción comprendida entre esos valores en la curva normal. Se trata del área bajo la curva, mar-
cada en la figura 2.
[D]
Es decir, existe una probabilidad de 0.849 de que La muestra seleccionada de la población de

alumnos presente una media de C.I. comprendida entre los valores 98 y 103.
[D]
Figura 2: Área delimitada entre las puntuaciones típicas -1.2 y 1.8

Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con
una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen
200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine:
a. El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
b. El número de medias muestrales que caen por debajo de 172 centímetros.
Solución:
Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo
sin reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular
el denominador de Z para sólo sustituirlo en cada inciso.
 N n 6.9 1000  25
  1.36
n N 1 25 1000  1
a.
x 172.5  174.5
z   1.47
 N n 1.36
n N 1
175.8  174.5
z  0.96
1.36
0.7607 200   152 Medias muestrales

b.
0.0336 200   7 medias muestrales
TEOREMA. Si es la media de una muestra aleatoria de tamaño n extraída de una población

con la media μ y la varianza finita σ2 , entonces es una variable aleatoria cuya función de
distribución se aproxima a la distribución normal estándar como n→∞
DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE MEDIAS
N1 N2
µ1 µ2
n1 n2
x1 x2
Sean X1 y X2 dos variables aleatorias con valores esperados 1 y  2 y varianzas  1 y  2 ,

2 2
respectivamente. Por ejemplo, X1 puede ser la duración de una batería para carro de una
marca, y X2 la duración de una batería de otra marca diferente. Si los medias 1 y  2 son
desconocidas, podríamos estar interesados en conocer si ambas baterías tienen la misma du-
ración media. En forma similar, si las varianzas son desconocidas, podríamos estar interesa-
dos en saber si son iguales o no. Para realizar estas inferencias, se pueden someter a pruebas
idénticas diferentes baterías, controlando los factores externos, de tal forma que las diferencias
se deban exclusivamente a la clase de marca probada
Inicialmente estaremos interesados en verificar si ambas distribuciones tienen la misma media
poblacional, es decir si 1 =  2 ó equivalentemente 1 -  2 = 0..
Suponga que es una muestra aleatoria de tamaño n1 tomada de una población
con media 1 y varianza  1 ,

2
es otra muestra aleatoria de tamaño n 2 tomada
de una población con media  2 y varianza  2 . Si deseamos realizar alguna inferencia sobre
2
1 -  2 , nos podemos basar en la distribución de la diferencia de las medias muestrales
. Por el TCL sabemos que tanto como se distribuyen normalmente con los siguientes
  
parámetros: x1  Normal 1 , 1 n1 , x2  Normal  2 , 2 n2
2 2

Ahora bien, para la diferencia de las medias muestrales se tiene:
Para conocer la distribución muestral de las diferencias entre las medias se debe saber si las
varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas,
se debe saber si son iguales o diferentes. Cada uno de estos tres casos se analizará por se-
parado.
a) Distribución de la diferencia entre dos medias cuando las varianzas son conocidas.
Si las varianzas  1 y  2 son conocidas, tanto

2 2
como se distribuyen normalmente. Por lo
tanto la distribución de la diferencia entre las medias muestrales es normal con el valor
esperado y la varianza dados anteriormente, es decir,
De acuerdo con lo anterior la siguiente variable aleatoria tiene una distribución normal están-
dar:
Por lo tanto, con base en la expresión anterior se pueden realizar inferencias con respecto a
la diferencia de medias poblacionales, bajo el supuesto de que las varianzas sean conocidas.
Si además, son iguales, la expresión anterior se puede expresar como:
Ejemplo:
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una
escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que
tanto para niños como para niñas los pesos siguen una distribución normal. El promedio de los
pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su desviación
estándar es de 14.142, mientras que el promedio de los pesos de todas las niñas del sexto
grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si repre-
senta el promedio de los pesos de 20 niños y es el promedio de los pesos de una muestra
de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los 20 niños sea al
menos 20 libras más grande que el de las 25 niñas.
Solución:
Datos:
1  100 libras
 2  85 libras
 1  14.142 libras
 2  12.247 libras
n1  20 niños
n 2  25 niñas
=?
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al
menos 20 libras más grande que el de la muestra de las niñas es 0.1056.
Ejemplo:
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación
estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una
desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34
tubos de la compañía A tenga una vida promedio de al menos un año más que la de una
muestra aleatoria de 40 tubos de la compañía B.
Solución:
Datos:
 A  7.2 años
 B  6.7 años
 A  0.8 años
 B  0.7 años
n A  34 tubos
n B  40 tubos
=?
x A  x B    A   B  1  7.2  6.7 
z   2.84
 2
A

 2
B 0.8 2

0.7  2
nA nB 34 40
Ejemplo:
Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación es-

tándar de 1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para la
segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos.
a. ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor

de 0.45km/L que la segunda gasolina?
b. ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre

entre 0.65 y 0.83km/L a favor de la gasolina 1?
Solución:
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos pobla-
ciones, por lo que se supondrán que son iguales.
Datos:
 1  1.23 km / lto
 2  1.37 km / lto
n1  35 autos
n 2  42 autos
=?
a. ?
x1  x2   1   2  0.65  0

z   2.19
 2
1

 2
2 1.232  1.372
n1 n2 35 42
x1  x2   1   2  0.83  0

z   2.80
 2
1

 2
2 1.232  1.372
n1 n2 35 42
La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre

entre 0.65 y 0.83 Km/Lt a favor de la gasolina 1 es de 0.0117.
b) Distribución de la diferencia entre dos medias cuando las varianzas son desconoci-
das pero iguales ( = = )
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadística
para verificar si éstas son iguales o diferentes. Para realizar esta prueba debemos hacer uso
de la distribución F para verificar si la relación de varianzas es igual a uno o diferente de uno.
Para cada una de las dos muestras se definen sus respectivas varianzas como:
s12 
1 n1
 x1 j  x1 2 s 22 
1 n2
 x2 j  x2 2
n1  1 j 1 n2  1 j 1
n1  1s12 n2  1s 22

Además 2 y 2 tienen distribuciones chi cuadrado con n1  1 y n2  1 grados de
libertad respectivamente. Por lo tanto su suma también sigue otra distribución chi cuadrado
con n1  n 2  2 grados de libertad. Es decir:
n1  1s12 n2  1s22

Y    2 n1  n2  2
 2
 2
Ahora bien, si Z es una variable normal (0,1) y Y tiene una distribución chi cuadrado con n
grados de libertad, entonces la variable tiene una distribución t con n grados de li-
bertad. Para nuestro caso la variable Z corresponde a la distribución de la diferencia de las dos
medias, con varianzas conocidas, y la variable chi cuadrado corresponde a la variable Y aca-
bada de definir. Por lo tanto
X 1  X 2  1   2 
z
1 1
 
n1 n2 X 1  X 2  1   2 
T 
 n1  1s12 n2  1s 22  n1  1s12  n2  1s 22 1 1
   n1  n2  2 
  2
2  n1  n2  2 n1 n2
X 1  X 2  1   2 
T  t n1  n2  2
1 1
Sp 
n1 n2
n1  1S12  n2  1S 22

S P2 
donde n1  n2  2 es un estimador ponderado de la varianza poblacional s² obte-
nida ponderando las varianzas poblacionales por sus respectivos grados de libertad.
c) Distribución de la diferencia entre dos medias cuando las varianzas son desconoci-
das y diferentes ( ≠ )
Cuando las varianzas son diferentes se puede demostrar que la siguiente variable aleatoria T
sigue una distribución t con n grados de libertad, donde
X 1  X 2  1   2 
T  t
S12 S 22

n1 n2
y el número de grados de libertad n está dado por:

S n   S
1
2
1
2
2 
n2
2
S n   S
1
2
1
2 2
2 n  2
2
n1  1 n2  1
DISTRIBUCIÓN MUESTRAL DE LA PROPORCION
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la

variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una
distribución binomial y cuando la extensión de la población es grande la distribución binomial
B(n,p) se aproxima a la normal .
 Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una dis-
tribución normal
 pq 
N  p, 

 n 
donde p es la proporción de uno de los valores que presenta la variable estadística en la po-
blación y q=1-p.
Si de una población, queremos conocer por ejemplo, la proporción de alumnos inscritos e una
especialidad, o la proporción de alumnos aprobados por materia, la distribución de proporcio-
nes, es la forma mas adecuada para hacer un estudio de este tipo.
Una población binomial está estrechamente relacionada con la distribución muestral de pro-
porciones; una población binomial es una colección de éxitos y fracasos, mientras que una
distribución muestral de proporciones contiene las posibilidades o proporciones de todos los
números posibles de éxitos en un experimento binomial, y como consecuencia de esta rela-
ción, las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse
usando la aproximación normal a la binomial, siempre que np 5 y
n(1-p) 5. Cualquier evento se puede convertir en una proporción si se divide el número obte-
nido entre el número de intentos.
Generación de la Distribución Muestral de Proporciones
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos. Se van
a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución muestral de
proporciones para el número de piezas defectuosas.
Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta po-
blación es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote están
defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos es

12C5=792, las cuales se pueden desglosar de la siguiente manera:
Número de ma-
Proporción
Artículos Artículos Ma- neras en las que
de artículos
Buenos los se puede obte-
defectuoso
ner la muestra
1 4 4/5=0.8 8C1*4C4=8
2 3 3/5=0.6 8C2*4C3=112
3 2 2/5=0.4 8C3*4C2=336
4 1 1/5=0.2 8C4*4C1=280
5 0 0/5=0 8C5*4C0=56
Total 792
Para calcular la media de la distribución muestral de proporciones se tendría que hacer la

sumatoria de la frecuencia por el valor de la proporción muestral y dividirla entre el número
total de muestras. Esto es:
p 
0.8  .8  0.6  112  0.4  336  0.2  280  0  56  1  0.3333
792 3
Como podemos observar la media de la distribución muestral de proporciones es igual a la

Proporción de la población.
p  P
También se puede calcular la desviación estándar de la distribución muestral de proporciones:
p 
0.8  1 32  8  0.6  1 32  112  0.4  1 32  336  0.2  1 32  280  0  1 32  56  0.1681
792
La varianza de la distribución binomial es   npq , por lo que la varianza de la distribución
2
 p2  Pq  n
muestral de proporciones es . Si se sustituyen los valores en esta fórmula tenemos
que:
p 
1 32 3  0.2108
5 , este valor no coincide con el de 0.1681, ya que nos falta agregar el
factor de corrección para una población finita y un muestreo sin reemplazo:
p 
1 32 3 12  5
 0.1681
5 12  1
Pq N  n
p 
n N 1
La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de

proporciones está basada en la aproximación de la distribución normal a la binomial. Esta fór-
mula nos servirá para calcular la probabilidad del comportamiento de la proporción en la mues-
tra.
pP
z
Pq
n
A esta fórmula se le puede agregar el factor de corrección de si se cumple con

las condiciones necesarias.
Ejemplo:
1. Antes de tomar la decisión de introducir una nueva bebida, la compañía presento
aproximadamente 40 mil consumidores en 30 ciudades de E.U.A. la nueva marca y la formula
anterior. Al lanzar la prueba sin marcas de identificación el 55% prefirió la nueva formula a la
anterior.
Suponga que los 40 mil consumidores de la encuesta representan una muestra aleatoria
de una población de bebedores de refresco de cola en las 30 ciudades.
a) Describa la distribución de muestreo de p.

b) Encuentre la probabilidad de que p localice dentro del punto .005 de la proporción p̂ de
los bebedores de refresco de cola en la población que favorecen la bebida nueva.
Solución:
n  40000
pˆ  0.55
qˆ  0.45
a) p  p  0.55
pˆ 
0.550.45  0.0024
40000
p  0.55
pˆ  0.0024
b) p = 0.55
q = 0.45
.545 .555 .55
0.545  0.55 0.555  0.55

z1   2.08 z2   2.08
0.0024 0.0024
-2.08 2.08
P0.545  p  0.555   0.9812  0.0188  0.9624
Conclusión: La probabilidad de que p se localice dentro del punto .005 de la proporción p̂

es de .9624.
2. Un periódico informa acerca de una encuesta de 313 jóvenes de entre 14 y 20 años,

hijos de los altos ejecutivos de las corporaciones más importantes de los E.U.A. Al pedir que
identificaran al mejor aspecto de ser uno de este grupo privilegiado, el 55% menciono las ven-
tajas materiales financieras.
a) Escriba la distribución de muestreo de la proporción muestral de los jóve-
nes que considera la ventaja material como el mejor aspecto de sus vidas privilegia-
das.
b) Suponga que la proporción p de jóvenes en la poblaciones realmente igual
a 0.5. Cuál es la probabilidad de observar una proporción muestral igual o mayor
que el observado de 0.55.
Solución:
n  313
pˆ  0.55
qˆ  1  0.55  0.45
a) p  p  0.55
pˆ 
0.550.45  0.0028
313
p  0.55
pˆ  0.0028
b)
0.5 0.55
0.55  0.5 0.05
z1    1.78
0.50.5 0.028
313
P  pˆ  0.55   1  0.9625  0.0375
Conclusión: La probabilidad de que la proporción muestral de jóvenes que considera la ven-

taja material como el mejor aspecto de sus vidas privilegiadas, sea mayor o igual que 0.55 es
de 0.0375.
DISTRIBUCIÓN DE MUESTREO DE LA DIFERENCIA DE PROPORCIONES
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse uti-
lizando proporciones o porcentajes
Pq
P 
En el tema anterior se comprobó que P   P y que n , por lo que no es difícil deducir
P1 q1 P2 q 2
 P1 p 2  
que  P1   P 2  P1  P2 y que
n1 n2
.
N1 N2
P1 P2
n1 n2
^ ^
p1 p2
 pˆ1  pˆ 2 1
 pˆ1  pˆ 2 2
 pˆ1  pˆ 2 3
Deduciendo que
z
 pˆ 1  pˆ 2   P1  P2 
P1 q1 P2 q 2

n1 n2
Ejemplo
Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron despe-
didos entre 1979 y 1984, encontró que el 20% había estado sin trabajo durante por lo menos
2 años. Suponga que tuviera que seleccionar una muestra aleatoria de 320 trabajadores, ¿cuál
sería la probabilidad de que el porcentaje muestral de hombres sin empleo difiera del porcen-
taje obtenido en la encuesta en 5% o más?
DATOS
n1 = n2 = 320
p1 = 0.20
q1 = 0.80
^ ^
P 0.05   p1  p 2   P1  P2   0.05
P1-P2 .05
-.05 .05
0.05
z
0.200.80  0.200.80
320 320
0.05
z  1.58
0.0316
P 0.05   p1  p 2   P1  P2   0.05  1  0.9429   0.1142
CONCLUSIÓN.
La probabilidad de que el porciento muestral de hombres sin empleo difiera del porciento ob-
tenido en la encuesta en 5% o más es de 0.1142.
Ejemplo
Se seleccionan dos muestras aleatorias independientes de n 1 y n2 de poblaciones binomiales

con parámetros P1 y P2. Encuentre la distribución de muestreo de la diferencia de proporciones
muestrales para cada uno de los siguientes casos:
a) n1 = 100; P1 = 0.5; n2 = 300; P2 = 0.4
b) n1 = 400; P1 = 0.1; n2 = 400; P2 = 0.6
^ ^
 pˆ  pˆ  P1  P2
1 2
P1q1 P2 q2
 pˆ  pˆ  
1 2
n1 n2
^
 pˆ  pˆ  0.5  0.4  0.1
a) 1 2
 pˆ  pˆ 
0.50.5  0.40.6  0.057
1 2
100 300
^ ^
 pˆ  pˆ  0.1  0.6  0.5
b) 1 2
 pˆ  pˆ 
0.10.9  0.60.4  0.0287
1 2
400 400
DISTRIBUCION MUESTRAL DE LA MEDIA σ DESCONOCIDA

TEORIA DE PEQUEÑAS MUESTRAS O TEORIA EXACTA DEL MUESTREO
En las unidades anteriores se manejó el uso de la distribución z, la cual se podía utilizar siem-
pre y cuando los tamaños de las muestras fueran mayores o iguales a 30 ó en muestras más
pequeñas si la distribución o las distribuciones de donde proviene la muestra o las muestras
son normales.
En esta unidad se podrán utilizar muestras pequeñas siempre y cuando la distribución de
donde proviene la muestra tenga un comportamiento normal. Esta es una condición para utili-
zar las tres distribuciones que se manejarán en esta unidad; t de student, X2 ji-cuadrada y
Fisher.
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya que
también la podemos utilizar con muestras aleatorias de tamaño grande.
En esta unidad se verá un nuevo concepto necesario para poder utilizar a las tres distribucio-
nes mencionadas. Este concepto es "grados de libertad".
Para definir grados de libertad se hará referencia a la varianza muestral:
n
 x  x
2
i
s2  i 1
n 1
Esta fórmula está basada en n-1 grados de libertad (degrees of freedom). Esta terminología
resulta del hecho de que si bien s2 está basada en n cantidades
x1  x , x 2  x ,…, x n  x , éstas suman cero, así que especificar los valores de cualquier n-1 de
las cantidades determina el valor restante. Por ejemplo, si n=4 y
; y , entonces automáticamente tenemos , así que
sólo tres de los cuatro valores de están libremente determinamos 3 grados de libertad.
Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su simbología
DISTRIBUCION "t DE STUDENT"
Supóngase que se toma una muestra de una población normal con media  y varianza  .
2
Si es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la

x
z
distribución  n es una distribución normal estándar. Supóngase que la varianza de la
población  es desconocida. ¿Qué sucede con la distribución de esta estadística si se reem-

2
plaza  por s? La distribución t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribución t son   0 y      2 para   2 , respectiva-

2
mente.
La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la
distribución t es similar a la de la distribución normal estándar: ambas son simétricas y unimo-
dales, y el valor máximo de la ordenada se alcanza en la media   0 . Sin embargo, la distri-

bución t tiene colas más amplias que la normal; esto es, la probabilidad de las colas es mayor
que en la distribución normal. A medida que el número de grados de libertad tiende a infinito,
la forma límite de la distribución t es la distribución normal estándar.
Curva Normal  z 
  15
 8
 5
Propiedades de las distribuciones t

1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, está más dispersa que la curva normal estándar z.
3. A medida que v aumenta, la dispersión de la curva t correspondiente disminuye.
4. A medida que v   , la secuencia de curvas t se aproxima a la curva normal estándar,
por lo que la curva z recibe a veces el nombre de curva t con v  
La distribución de la variable aleatoria t está dada por:
 v 1 2
v  1 2  t 2 
ht   1   ,   t  
v 2 v  v 
Esta se conoce como la distribución t con v grados de libertad.
Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media
x
t
s
 y desviación estándar  . Entonces la variable aleatoria n tiene una distribución t con
v  n  1 grados de libertad.
La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo de W. S.

Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que desaprobaba la
publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su tra-
bajo en secreto bajo el nombre de "Student". En consecuencia, la distribución t normalmente
se llama distribución t de Student, o simplemente distribución t. Para derivar la ecuación de
esta distribución, Gosset supone que las muestras se seleccionan de una población normal.
Aunque esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones
no normales que poseen distribuciones en forma casi de campana aún proporcionan valores
de t que se aproximan muy de cerca a la distribución t.
La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y
siempre es mayor a uno. Únicamente cuando el tamaño de la muestra tiende a infinito las dos
distribuciones serán las mismas.
Se acostumbra representar con t  el valor t por arriba del cual se encuentra un área igual a 
. Como la distribución t es simétrica alrededor de una media de cero, tenemos t1  t ; es
decir, el valor t que deja un área de a la derecha y por tanto un área de  a la izquierda,
es igual al valor t negativo que deja un área de  en la cola derecha de la distribución. Esto es
t 0.95  t 0.05 , t 0.99  t 0.01 , etc.
Para encontrar los valores de t se utilizará la tabla de valores críticos de la distribución t del
libro Probabilidad y Estadística para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo:
El valor t con v  14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto un
área de 0.975 a la derecha, es
t 0.975  t 0.025  2.145
Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto que
se tiene que hacer la resta de 1   . La manera de encontrar el valor de t es buscar el valor de
 en el primer renglón de la tabla y luego buscar los grados de libertad en la primer columna
y donde se intercepten  y v se obtendrá el valor de t.
Ejemplo:
Encuentre la probabilidad de.  t 0.025  t  t 0.05 .

Solución:
Como t 0.05 deja un área de 0.05 a la derecha, y  t 0.025 deja un área de 0.025 a la izquierda,
encontramos un área total de 1  0.05  0.025  0.925 .
P t 0.025  t  t 0.05   0.925
Ejemplo:
Encuentre k tal que P K  t  1.761  0.045 , para una muestra aleatoria de tamaño 15 que se
selecciona de una distribución normal.
Solución:
Si se busca en la tabla el valor de t  1.761 con 14 grados de libertad nos damos cuenta que a
este valor le corresponde un área de 0.05 a la izquierda, por ser negativo el valor. Entonces si
se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a  . Luego se busca el valor de
0.005 en el primer renglón con 14 grados de libertad y se obtiene un valor de t  2.977 , pero
como el valor de  está en el extremo izquierdo de la curva entonces la respuesta es
t  2.977 por lo tanto:
P 2.977  t  1.761  0.045

Ejemplo:
Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en
lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una
muestra de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho
con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 518
gramos por milímetro y una desviación estándar de 40 gramos? Suponga que la distribución
de rendimientos es aproximadamente normal.
Solución:
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el fabricante
queda satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711
y 1.711.
Se procede a calcular el valor de t:
x   518  500
t   2.25
s 40
n 25
Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un
valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02. De aquí que es probable que el fabricante concluya que el proceso
produce un mejor producto del que piensa.
DISTRIBUCIÓN MUESTRAL DE LA VARIANZA
Hasta ahora nos hemos ocupado exclusivamente de la distribución muestral de la media, pero
es necesario hablar de la distribución muestral teórica de la varianza para muestras aleatorias
de poblaciones normales puesto que S2 no puede ser negativa esta distribución no es una
curva normal sino más bien una distribución gama con parámetros = /2 y =2 y se denomina
distribución ji2 2 .
Si S2 es la varianza de una muestra aleatoria de tamaño n tomada de una población normal
cuya varianza es 2 entonces 2= (n-1)S2 que es el valor de
2
de una variable aleatoria que tiene la distribución 2 con parámetro =n-1 grados de libertad.
Propiedades de las distribuciones ji-cuadrada

1. Los valores de 2 son mayores o iguales que 0.
2. La forma de una distribución 2 depende del =n-1. En consecuencia, hay un número

infinito de distribuciones 2
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones 2 no son simétricas. Tienen colas estrechas que se extienden a la

derecha; esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución 2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribución 2 se da en el valor (n-3).
Ejercicios
Si una óptica adquiere cristales para montarlos en anteojos y se sabe por experiencia que la
varianza del índice de refracción de esta clase de cristales es de 1.26*10 -4 como es importante
que los diferentes cristales tengan un índice de refracción muy parecido la empresa rechaza
uno de tales cargamentos si la varianza muestral de 20 cristales escogidos al azar excede de
2*10-4. Suponiendo que los valores muestrales pueden considerarse como una muestra alea-
toria de una población normal Cuál es la probabilidad de que un cargamento sea rechazado a
pesar de que 2=1.26*10-4?
Datos
n=20
S2=2x10-4
2=1.26x10-4
.05
2 
n  1S 2 
20  12  104   30.15
2 1.26  104
30.144
  20  1  19
 2  0.05
Conclusión
La probabilidad de que un cargamento sea rechazado a pesar de que   1.26  10 está por
2 4
debajo de 0.05.
Se rechazará la afirmación de que la varianza de una población normal es 2=64 si la varianza

de una muestra aleatoria de tamaño 17 excede a 115.38 Cuál es la probabilidad de que la
afirmación sea rechazada aún cuando 2=64?
Datos
n=17
S2=115.38
2=64
115.38
2 
n  1S 2 
17  1115.38  28.845
 2
64
  17  1  16
 2  0.025
Conclusión
La probabilidad de que la afirmación sea rechazada aún cuando 2=64 es .025.
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una pobla-
ción normal con varianza   6 , tenga una varianza muestral:

2
a) Mayor que 9.1
b) Entre 3.462 y 10.745
Solución.
 Primero se procederá a calcular el valor de la ji-cuadrada:

2 
n  1s 2 
25  19.1  36.4
 2
6
Al buscar este número en el renglón de 24 grados de libertad nos da un área a la derecha de

0.05. Por lo que la P(s2 >9.1) = 0.05
1. Se calcularán dos valores de ji-cuadrada:
2 
n  1s 2 
25  13.462  13.847 y 2 
25  110.745  42.98
 2
6 6
Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al buscar
el valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da un área a
la derecha de 0.01. Como se está pidiendo la probabilidad entre dos valores se resta el área
de 0.95 menos 0.01 quedando 0.94.
Por lo tanto la P(3.462 s2 10.745) = 0.94

DISTRIBUCIÓN DE MUESTREO DE LA RAZÓN DE DOS VARIANZAS
Si S12 y S22 son las varianzas de dos muestras aleatorias de tamaño n 1 y n2
DISTRIBUCION "F" FISHER
La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos pobla-
ciones es evidente a partir del análisis de una sola población. Frecuentemente se desea com-
parar la precisión de un instrumento de medición con la de otro, la estabilidad de un proceso
de manufactura con la de otro o hasta la forma en que varía el procedimiento para calificar de
un profesor universitario con la de otro.
Intuitivamente, podríamos comparar las varianzas de dos poblaciones,
 12 y  22
2 2
s12 s 2 s12 s 2
Utilizando la razón de las varianzas muestrales . Si es casi igual a 1, se tendrá
poca evidencia para indicar que
 12 y  22
2
s12 s 2
no son iguales. Por otra parte, un valor muy grande o muy pequeño para , proporcionará
evidencia de una diferencia en las varianzas de las poblaciones.
La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada inde-
pendiente, cada una dividida entre sus respectivos grados de libertad.
La variable aleatoria F es no negativa, y la distribución tiene un sesgo hacia la derecha. La

distribución F tiene una apariencia muy similar a la distribución ji-cuadrada; sin embargo, se
encuentra centrada respecto a 1, y los dos parámetros
1 y  2
proporcionan una flexibilidad adicional con respecto a la forma de la distribución.

Si s12 y s22 son las varianzas muestrales independientes de tamaño n 1 y n2 tomadas de pobla-
ciones normales con varianzas
Características de la distribución F
Existe una "familia" de distribuciones F. Un miembro específico de la familia se determina por

dos parámetros: los grados de libertad en el numerador y en el denominador. Existe una dis-
tribución F para la combinación de 29 grados de libertad en el numerador y 28 grados en el
denominador. Existe otra distribución F para 19 grados en el numerador y 6 en el denominador.
 La distribución F es una distribución continua.
 F no puede ser negativa
 La distribución F tiene un sesgo positivo
 A medida que aumentan los valores, la curva se aproxima al eje x, pero nunca lo
toca
2
s12 s 2 2 2
La distribución F está relacionada con el cociente de varianzas . En donde s1 y s 2 son
las varianzas muestrales tienen una distribución  con grados de libertad  (n - 1).
2
Entonces podemos decir que:
 12
1
F
 2
2
2
Como
S 2 (n 1)
2 
2
S12 n  1
 12 S12
F
n  1   12
S 22 n  1 S 22
 22  22
n  1
S12 22
F
S 22 12
Uso de las tablas:
Cuando se quiere encontrar áreas del lado derecho de la curva;
1
F1 , 1 , 2 
F , 2 , 1
Ejemplos:
1. Encontrar el valor de F, en cada uno de los siguientes casos:
a. El área a la derecha de F, es de 0.25 con  =4 y  =9.
b. El área a la izquierda de F, es de 0.95 con  =15 y  =10.
c. El área a la derecha de F es de 0.95 con  =6 y  =8.
d. El área a la izquierda de F, es de 0.10 con  =24 y  =24
Solución:
a. Como el área que da la tabla es de cero a Fisher, se tiene que localizar primero los
grados de libertad dos que son 9, luego un área de 0.75 con 4 grados de libertad uno.
b. En este caso se puede buscar el área de 0.95 directamente en la tabla con sus respec-
tivos grados de libertad.
c. Se tiene que buscar en la tabla un área de 0.05, puesto que nos piden un área a la
derecha de F de 0.95.
d. Se busca directamente el área de 0.10, con sus respectivos grados de libertad.
Ejemplo
Si dos muestras aleatorias independientes de tamaño de n 1=7 y n2=13 se toma una población
normal Cuál es la probabilidad de que la varianza de la primera sea al menos 3 veces más
grande que la de la segunda?
Datos
n1  7
n 2  13

P S12  3S 22 
1  n1  1  7  1  6
 2  n 2  1  13  1  12 0.005
S12 3
F  3 S12  3S22
S 22 1
Conclusión
La probabilidad de que la varianza de la primera sea al menos 3 veces más grande que la de
la segunda es .005.
¿Qué es INFERIR?
De acuerdo con el diccionario de la Real Academia
Española, inferir significa "sacar una consecuencia o deducir
algo de otra cosa".
El principal objetivo de la Estadística consiste en poder

decir algo con respecto a un gran conjunto de personas,
mediciones u otros entes (población) con base en las
observaciones hechas sobre sólo una parte (muestra) de
dicho gran conjunto.
La capacidad para "decir algo" sobre poblaciones con base

en muestras está basada en supuestos con respecto a
algún modelo de probabilidad que permite explicar las
características del fenómeno bajo observación.
Al conjunto de procedimientos estadísticos en los que

interviene la aplicación de modelos de probabilidad y
mediante los cuales se realiza alguna afirmación sobre
poblaciones con base en la información producida por
muestras se le llama Inferencia Estadística o Estadística
Inferencial.
IMPORTANCIA DE LA ESTADISTICA INFERENCIAL
La Estadística Inferencial puede dar respuesta a muchas de
las necesidades que la sociedad actual puede requerir. Su
tarea fundamental es el análisis de los datos que se
obtienen a partir de experimentos, con el objetivo de
representar la realidad y conocerla. Permite la recolección
de datos importantes para el estudio de situaciones que se
presentan a diario y permite dar respuesta a los problemas
de una forma útil y significativa.
La Estadística Inferencial se centra en tomar una pequeña
muestra representativa de la población y a partir de ésta,
infiere que el resto de la población tiene el mismo
comportamiento.
Importancia de la toma de muestras.

Es de gran importancia ya que con un muestreo de toda la población se
puede examinar y sacar conclusiones en base a una pequeña parte de la
misma, dando por sentado que los resultados obtenidos en la muestra
es de hecho representativa de toda la población, una ventaja muy
grande es que es mucho más sencillo trabajar con una pequeña parte
de un todo que con su totalidad. Además, en ocasiones, el muestreo
puede ser más exacto que el estudio de toda la población porque el
manejo de un menor número de datos provoca también menos errores
en su manipulación.
Podemos definir su importancia en tres puntos:
1) Por lo general no se pueden estudiar a las poblaciones

en su totalidad, entonces estaremos obligados a hacer el
muestreo.
2) Es más rápido y económico para conocer los parámetros

(características) de interés de la población.
3) Existe metodología clara y confiable para el muestreo (y

tamaño de muestra).
INSTRODUCCIÓN AL MUESTREO Y
SUS TIPOS.
Definición y conceptos previos.
En la investigación científica es habitual que se empleen muestras

como medio de acercarse al conocimiento de la realidad.
Introduzcamos algunos conceptos previos en este contexto:
Población.
Conjunto de individuos distintos perfectamente identificables,
sobre el que se realizan las observaciones.
Muestra de tamaño n.
Subconjunto de n elementos de la población.
Etapas en la Planificación de un Muestreo
1. Seleccionar el objetivo del estudio.

2. Definir la población donde se extraerá la muestra.
3. Seleccionar las variables a estudiar, y los métodos para la
medición de las mismas. Calibración de aparatos.
4. Elegir unidades de muestreo, tamaño, y forma.
5. Seleccionar el diseño de muestreo más oportuno, la
intensidad y coste del mismo y con ello el tamaño de la
muestra.
6. Organizar el trabajo de campo.
7. Comprobar y analizar los datos de campo.
8. Aplicar los datos.
Tipos de Muestreo:
• Muestreo Probabilístico.
1. Muestreo Aleatorio Simple
2. Muestreo Aleatorio Sistemático
3. Muestreo Aleatorio Estratificado
4. Muestreo Aleatorio por Conglomerados
• Métodos de Muestreo No Probabilísticos

1. Muestreo por cuotas
2. Muestreo Intencional
3. Bola de Nieve
4. Muestreo Discrecional
Muestro Probabilístico:
Los métodos de muestreo probabilísticos son aquellos que se basan
en el principio de equiprobabilidad. Es decir, aquellos en los que
todos los individuos tienen la misma probabilidad de ser elegidos
para formar parte de una muestra y, consiguientemente, todas las
posibles muestras de tamaño n tienen la misma probabilidad de
ser seleccionadas. Sólo estos métodos de muestreo probabilísticos
nos aseguran la representatividad de la muestra extraída y son, por
tanto, los más recomendables.
Muestro Aleatorio Simple:

Es el que le permite al investigador conformar una muestra de
forma que cada elemento de la población o universo tenga la
misma probabilidad de ser seleccionado, por lo tanto, se requiere
enumerar a cada uno, de 1 a N.
Aplicación:
Una planta industrial colombiana genera residuos sólidos como

subproducto de su proceso. En la actualidad estos residuos se
están disponiendo inadecuadamente, aunque se cree que
podrían ser utilizados, al menos parcialmente, como materias
primas en otros procesos. Este artículo se refiere en particular al
procedimiento para elegir muestras de los diferentes residuos
sólidos del proceso, para su posterior caracterización, la cual
conducirá a identificar sus usos potenciales o recomendará su
adecuada disposición. Se analizan los resultados del análisis
elemental y se evalúa el plan de muestreo aplicado para lograr
esta caracterización.
Muestreo sistemático
Es la elección de una muestra a partir de los elementos de una
lista según un orden determinado, o recorriendo la lista a partir
de un número aleatorio determinado.
Si el orden de los elementos de la lista es aleatorio, este muestreo

equivale al Muestreo Sistemático Simple.. Sin embargo, si la lista
es tal que elementos más próximos tienden a ser más semejantes
respecto a la característica a estudiar, entonces este tipo de
muestreo puede ser más preciso.
Aplicación
Una empresa de publicidad desea hacer un estudio para una determinada

marca de bebidas. Para ello dispone del listín telefónico de Andalucía
(supongamos 10 millones de teléfonos entre fijos y móviles). Se estima que
con 2000 encuestas se obtiene la fiabilidad deseada. Se elige el muestreo
sistemático como método de selección de la muestra.
Si tenemos el listín telefónico ordenado alfabéticamente, este es una forma

aleatoria de ordenación. Dado que queremos 2000 encuestas, dividiremos
10.000.000 / 2.000 = 5.000. Si tomamos de ese listín un elemento cada
5.000 tendremos las 2.000 encuestas. Para decidir de que elemento
partiremos elegimos al azar un número entre 1 y 5000, esto lo podemos
hacer con una tabla de números aleatorios o con cualquier calculadora o
programa de ordenador. Una vez determinado el primer elemento p, los
sucesivos elementos que se tomen serán p+5000, p+2·5000, p+3·5000,..., .
De esta forma se obtiene una muestra sistemáticamente.
Muestreo estratificado
Consiste en la división previa de la población de estudio en
grupos o clases que se suponen homogéneos respecto a
característica a estudiar. A cada uno de estos estratos se le
asignaría una cuota que determinaría el número de miembros del
mismo que compondrán la muestra. Dentro de cada estrato el
muestreo se realizaría mediante Muestreo Aleatorio Simple.
Según la cantidad de elementos de la muestra que se han de

elegir de cada uno de los estratos, existen dos técnicas de
muestreo estratificado:
Asignación proporcional: el tamaño de cada estrato en

la muestra es proporcional a su tamaño en la población.
Asignación óptima: la muestra recogerá más individuos

de aquellos estratos que tengan más variabilidad. Para ello es
necesario un conocimiento previo de la población.
Aplicación
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar

por separado las opiniones de hombres y mujeres pues se estima que, dentro
de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la
población está compuesta de un 55% de mujeres y un 45% de hombres, se
tomaría una muestra que contenga también esa misma proporción
Muestreo por conglomerados
Se utiliza cuando la población se encuentra dividida, de manera natural, en grupos que se

supone que contienen toda la variabilidad de la población, es decir, la representan fielmente
respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o
conglomerados para la realización del estudio.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las
personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades,
es decir, los miembros del grupo, o sólo se le podría aplicar a algunos de ellos,
seleccionados al azar. Este método tiene la ventaja de simplificar la recogida de información
muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para

integrar la muestra, el diseño se llama muestreo bietápico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer método
funciona mejor cuanto más homogénea es la población respecto del estrato, aunque más
diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los conglomerados deben
presentar toda la variabilidad, aunque deben ser muy parecidos entre sí.
Ejemplo
Suponga que una compañía de servicio de televisión por cable está pensando
en abrir una sucursal en una ciudad grande; la compañía planea realizar un
estudio para determinar el porcentaje de familias que utilizarían sus
servicios. Como no es practico, preguntar en cada casa, la empresa decide
seleccionar una parte de la ciudad al azar. La cual forma un conglomerado.
MUESTREO POR ETAPAS
Cuando en el muestreo por conglomerados se prosigue en el análisis y

dentro de cada conglomerado se vuelven a seleccionar, también de forma
aleatoria, nuevos subconglomera-dos, y así sucesivamente hasta seleccionar
las unidades últimas, al muestreo se le denominador etapas o polietápico.
El más frecuente de los muéstreos por etapas es el bietápico, en el que se
seleccionan, en primer término y de forma aleatoria, los conglomerados o
áreas, y en una segunda etapa, las unidades últimas o más elementales del
conjunto poblacional, sin necesidad de tener que seleccionar ningún otro
tipo de unidad intermedia.
TEOREMA DEL LIMITE CENTRAL
Definición:
El teorema central del límite es uno de los resultados
fundamentales de la
estadística. Este teorema nos dice que si una muestra es lo
bastante grande (generalmente cuando el tamaño
muestral (n) supera los 30), sea cual sea la distribución de
la media muestral, seguirá aproximadamente una
distribución normal. Es decir, dada cualquier variable
aleatoria, si extraemos muestras de tamaño n (n>30) y
calculamos los promedios muestrales, dichos promedios
seguirán una distribución normal. Además, la media será la
misma que la de la
variable de interés, y la desviación estándar de la media
muestral será aproximadamente el error estándar.
La importancia del teorema central del límite
radica en que mediante un conjunto de teoremas,
se desvela las razones por las cuales, en muchos
campos de aplicación, se encuentran en todo
momento distribuciones normales o casi.
Contextualizando lo anterior tenemos: La

distribución de la media muestral de una
población normal es una distribución normal con
la misma media poblacional y con desviación típica
el error estándar. Este hecho nos permite calcular
probabilidades cuando tenemos una muestra de
una variable con distribución normal y desviación
típica conocida. Cuando no conocemos la
desviación típica de la variable, también podemos
hacer cálculos con la distribución t de Student.
La formula formal que se utiliza para resolver

problemas de este tema es:
DISTRIBUCIONES
FUNDAMENTALES PARA EL
MUESTREO
DISTRIBUCIÓN
MUESTRAL DE LA MEDIA
Una distribución muestral de las medias es de tipo

probabilístico e indica cuán probables son diversas
medias de la muestra. La distribución es una función
de la media, de la desviación estándar de la población
y del tamaño de la muestra.
DISTRIBUCIÓN MUESTRAL DE MEDIAS
Cada muestra de tamaño n que podemos extraer de una población

proporciona una media. Si consideramos cada una de estas medias como
valores de una variable aleatoria podemos estudiar su distribución que
llamaremos distribución muestral de medias.
Si tenemos una población normal y extraemos de ella muestras de

tamaño n, la distribución muestral de medias sigue también una
distribución normal
Si la población no sigue una distribución normal pero n>30, aplicando el

llamado Teorema central del límite la distribución muestral de medias se
aproxima también a la normal anterior.
Las notas de cierto examen se distribuyen según una normal de media 5.8
y desviación típica 2.4. Hallar la probabilidad de que la media de una
muestra tomada al azar de 16 estudiantes esté comprendida entre 5 y 7
La población es N(5,8;2,4), con n=16 la distribución muestral de medias se

distribuye N(5.8; 0.6)
Si x es la media de la muestra hemos de calcular la probabilidad

P(5 < x <7)= P(-1.33 < z < 2) =
=P(z < 2) - [1-P(z < 1.33)] = 0,8854
Caso A, B y C de Diferencia de
Muestras
Ejemplo caso C:
Se estudia el efecto de un vertido tóxico en un río, comparando

el índice de biodiversidad I.B-D. antes y
después del vertido.
Supongamos que los I.B-D. siguen distribuciones Normales. Antes
del vertido se habían realizado 35 pruebas y se obtuvo una
media de 1.9 y una cuasidesviación típica de 0.4. Después del
vertido se realizan 40 pruebas y se obtiene una media de 1.7 y
una cuasidesviación típica de 0.7.
Obtener la probabilidad de que la media poblacional
antes del vertido sea como máximo 0.5 unidades inferior a la
media poblacional después del vertido.
DISTRIBUCIÓN
MUESTRAL DE LA
DIFERENCIA DE MEDIAS
Suponga que se tienen dos poblaciones distintas, la primera con

media 1 y desviación estándar 1, y la segunda con media 2 y
desviación estándar 2. Más aún, se elige una muestra aleatoria de
tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la media
muestral para cada muestra y la diferencia entre dichas medias. La
colección de todas esas diferencias se llama distribución muestral de
las diferencias entre medias o la distribución muestral del estadístico.
La distribución es aproximadamente
normal para n1≥30 y n2 ≥ 30. Si las
poblaciones son normales, entonces
la distribución muestral de medias es
normal sin importar los tamaños de
las muestras.
La fórmula que se utilizará para el calculo de probabilidad del
estadístico de diferencia de medias es:
Ejemplo:
En un estudio para comparar los pesos promedio de niños y niñas de

sexto grado en una escuela primaria se usará una muestra aleatoria
de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como
para niñas los pesos siguen una distribución normal. El promedio de
los pesos de todos los niños de sexto grado de esa escuela es de 100
libras y su desviación estándar es de 14.142, mientras que el
promedio de los pesos de todas las niñas del sexto grado de esa
escuela es de 85 libras y su desviación estándar es de 12.247 libras.
Si representa el promedio de los pesos de 20 niños y es el promedio
de los pesos de una muestra de 25 niñas, encuentre la probabilidad
de que el promedio de los pesos de los 20 niños sea al menos 20
libras más grande que el de las 25 niñas.
Por lo tanto, la probabilidad de que el promedio de los pesos de la
muestra de niños sea al menos 20 libras más grande que el de la
muestra de las niñas es 0.1056.
DISTRIBUCIÓN MUESTRAL DE LA
PROPORCIÓN
Existen ocasiones en las cuales no estamos interesados en la

media de una muestra, sino que queremos investigar la
proporción de personas con cierta preferencia en la muestra.
La distribución muestral de proporciones es la adecuada
para dar respuesta a estas situaciones.
Esta distribución se genera de igual manera que la

distribución muestral de medias, a excepción de que al
extraer las muestras de la población se calcula el estadístico
proporción (p=x/n en donde “x” es el número de éxitos u
observaciones de interés y “n” el tamaño de la muestra) en
lugar de la media de cada muestra que era lo que calculamos
antes.
La distribución muestral de proporciones está
estrechamente relacionada con la distribución binomial;
una distribución binomial es una distribución del total de
éxitos en las muestras, mientras que una
distribución de proporciones es la distribución de un
promedio (media)
de los éxitos.
Como consecuencia de esta relación, las afirmaciones
probabilísticas referentes a la proporción muestral pueden
evaluarse usando la aproximación normal a la binomial,
siempre que:
Generación de la Distribución Muestral de Proporciones

Suponga que se cuenta con un grupo de 12 personas, el cual
tiene 4 personas con fobias. Se van a seleccionar 5 personas al
azar de ese Cgrupo sin reemplazo. Vamos a generar la
distribución muestral de proporciones para el número de
personas con fobias. Como se puede observar en este ejercicio
la proporción de personas con fobias de esta
población es
P = 4/12=1/3=0.333
Por lo que podemos decir que el 33% de las personas de este

grupo tienen fobias.
El número posible de muestras de tamaño 5 a extraer de una
población de 12 elementos es 12 C 5 =792, las cuales se pueden
desglosar de la siguiente manera:
Para calcular la media de la distribución muestral de
proporciones se tendría que hacer la sumatoria de la
frecuencia por el valor de la proporción muestral y dividirla
entre el número total de muestras. Esto es:
Como podemos observar la media de la distribución muestral

de proporciones es igual a la proporción de la población.
DIFERENCIA DE PROPORCIONES
Diferencia de proporciones
Ejemplo
 Los hombres y mujeres adultos radicados en una

ciudad grande del norte difieren en sus opiniones
sobre la promulgación de la pena de muerte para
personas culpables de asesinato. Se cree que el 12%
de los hombres adultos están a favor de la pena de
muerte, mientras que sólo 10% de las mujeres
adultas lo están. Si se pregunta a dos muestras
aleatorias de 100 hombres y 100 mujeres su opinión
sobre la promulgación de la pena de muerte,
determine la probabilidad de que el porcentaje de
hombres a favor sea al menos 3% mayor que el de las
mujeres.
Solución:
DISTRIBUCIÓN T-STUDENT
En probabilidad y estadística, la distribución t (de

Student) es una distribución de probabilidad que surge
del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra
es pequeño. Surge, en la mayoría de los estudios
estadísticos prácticos, cuando la desviación típica de
una población se desconoce y debe ser estimada a
partir de los datos de una muestra.
Existen dos versiones de la prueba t-Student: una que

supone que las varianzas poblacionales son iguales y
otra versión que no asume esto último. Para decidir si
se puede suponer o no la igualdad de varianza en las
dos poblaciones, se debe realizar previamente la
prueba F-Snedecor de comparación de dos varianzas.
La distribución t de Student es la distribución de probabilidad del cociente:
Donde:
Z tiene una distribución normal de media nula y
varianza 1
V tiene una distribución chi-cuadrado con ν
grados de libertad
Z y V son independientes
Si μ es una constante no nula, el cociente es una variable

aleatoria que sigue la distribución t de Student no central
con parámetro de no-centralidad μ.
•Propiedades de las distribuciones t.
1. Cada curva t tiene forma de campana con centro en 0.

2. Cada curva t, está más dispersa que la curva normal estándar
z.
3. A medida que n aumenta, la dispersión de la curva t
correspondiente disminuye.
4. A medida que n tiende a ∞, la secuencia de curvas t se
aproxima a la curva normal estándar, por lo que la curva z
recibe a veces el nombre de curva t con gl = ∞.
Sean X1, X2, . . . , Xn variables aleatorias independientes que
son todas normales con media m y desviación estándar s. Entonces
la variable aleatoria tiene una distribución t con v = n-1
grados de libertad.
Ejercicio
Un fabricante de focos afirma que su producto durará un promedio de 500 horas de
trabajo. Para conservar este promedio esta persona verifica 25 focos cada mes. Si el
valor y calculado cae entre –t 0.05 y t 0.05, él se encuentra satisfecho con esta
afirmación. ¿Qué conclusión deberá él sacar de una muestra de 25 focos
cuya duración fue?
Definición: Se dice que una variable aleatoria X se distribuye Chi-Cuadrado con n grados de libertad, denotado por X
sigue χ 2 (n) , si su función de densidad es:
Características de la distribución CHI-CUADRADO:
i. Es una distribución No Simétrica.

ii. Lee las probabilidades en el extremo superior de la distribución, por lo cual la notación para el cálculo de probabilidades
es como sigue:
El cálculo de probabilidades se puede realizar a través de las Tablas de la distribución Definición: Sea X1, X2, X3, X4…. Xn una
muestra aleatoria extraída de una población Normal con media
μ y varianza σ 2 . Si proponemos las siguientes estadísticas para la varianza:
DISTRIBUCION F DE FISHER
¿Cuándo usar esta distribución?

 Esta es la distribución de probabilidad de la razón de
dos varianzas provenientes de dos poblaciones
diferentes. Por medio de esta distribución es posible
determinar la probabilidad de ocurrencia de una razón
específica con v1=n1-1 y v2=n2-1 grados de libertad en
muestras de tamaño n1 y n2.
 Es la distribución más importante en experimentación
pues permite hacer cálculos sobre varianzas
diseminadas determinando si las diferencias
mostradas son significativas y por lo tanto atribuibles a
cambios importantes en el comportamiento de las
poblaciones en estudio.
 Fórmulas
La función acumulada está tabulada.
Función densidad
v1
v v   v 2
v1
1
 1 2  *  1  * x 2
 2   v2 
f ( x)  v1  v2
x0
v  v  v  2
 1  *  2  *  1 * x  1
 2   2   v2 
Forma de la curva de esta

distribución según v1 y v2
¿Cómo usar las tablas?

 La tabla da valores de probabilidad acumulados de
izquierda a derecha. Para extraer valores de
probabilidad de esta tabla se sigue el siguiente
procedimiento:
1. Extraer muestras de dos poblaciones y estimar las
desviaciones estándar.
2. Determinar los grados de libertad (v1 y v2) tal que
v1=n1-1 y v2=n2-1.
3. Calcular el valor de F=s12/ s22. Si se conocen las
varianzas entonces F=(s12 *22) / (s22 * 12)
¿Cómo usar las tablas?

3. Localizar en tablas, la probabilidad asociada a los
valores de F, v1 y v2. En algunos casos se puede
interpolar, de lo contrario, se escoge el que más se
aproxime. Por ejemplo, si F es igual 3.28 con v1=12 y
v2=8 grados de libertad, el valor de la probabilidad
menor que el es 0.95, pues se localiza en la segunda
columna a la izquierda tal y como se muestra a
continuación.
EJEMPLO
En un proceso hay dos máquinas cortadoras
diferentes en antigüedad lo que hace pensar que
las varianzas de corte no son iguales. Se toma
una muestra de 16 partes de cada máquina,
¿cuál es la probabilidad de que la razón de
varianzas sea:
a. Mayor a 1.97
b. Menor a 3.52
SOLUCIÓN
a.
P ( F  1.97 )  1  0.9  0.1 para v1  15 y v 2  15
La probabilidad de que la razón de varianzas sea

mayor a 1.97 es 0.1.
b.
P ( F  3.52)  0.99 para v1  15 y v 2  15
La probabilidad de que la razón de varianzas sea

menor a 3.52 es 0.99.
UNIDAD II Estimación
Introducción
Características de un estimador
Estimación puntual
Estimación por intervalos
Intervalo de confianza para la media
Intervalo de confianza para la diferencia de medias
Intervalos de confianza para la proporción
Intervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la varianza
Intervalos de confianza para la relación de varianzas
Determinación del tamaño de muestra
Basado en la media de la Población
Basado en la proporción de la Población
Basado en la diferencia entre las medias de la Población
ESTIMADOR
Un estimador de un parámetro poblacional es una función de los datos muestrales. En pocas

palabras, es una fórmula que depende de los valores obtenidos de una muestra, para realizar
estimaciones.
Por ejemplo, un estimador de la media poblacional, μ, sería la media muestral, , según la

siguiente fórmula:
1 n 1
x 
n i 1
xi  ( x1  ...  x n )
n
donde (x1, x2, ..., xn) sería el conjunto de de datos de la muestra.
En el ejemplo se habla de una estimación puntual. Sin embargo, el estimador es una variable
aleatoria que asigna a cada valor de la función su probabilidad de aparición, esto es, la proba-
bilidad de la muestra de la que se extrae.
CARACTERISTICAS DE UN BUEN ESTIMADOR
Un buen estimador debe reunir cuatro condiciones o propiedades:

a. Insesgado:- se dice si un estimador es insesgado, si el valor esperado del mismo es
igual al parámetro de la población que estima.
b. Eficiente:- se refiere a lo cerca que se encuentre el valor estimado del parámetro.
c. Consistente:- se obtiene cuando el tamaño de la muestra se incrementa en tal forma

que la varianza desminuya, siendo menor la diferencia entre el valor real y el estimado.
d. Suficiente: es un estimador que utiliza toda la información que posee una muestra so-
bre el parámetro que se estima.
ESTIMACION PUNTUAL
Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los estimadores
más probables en este caso son los estadísticos obtenidos en la muestra, aunque es necesario
cuantificar el riesgo que se asume al considerarlos. Recordemos que la distribución muestral
indica la distribución de los valores que tomará el estimador al seleccionar distintas muestras
de la población. Las dos medidas fundamentales de esta distribución son la media que indica
el valor promedio del estimador y la desviación típica, también denominada error típico de
estimación, que indica la desviación promedio que podemos esperar entre el estimador y el
valor del parámetro.
 Estimación puntual
Cuando en una población con familia distribucional conocida f(x, θ) queremos estimar el ver-
dadero valor del parámetro poblacional θ utilizando como lente para determinarlo al estima-
dor muestral θ̂ ; procedemos a seleccionar una muestra de tamaño n de dicha población,

calculamos a partir de ella un valor θ y afirmamos entonces que θ  θ  k es una estimación
puntual de θ con un error, por exceso o defecto, de valor k.
K depende en general de la variable aleatoria muestral θ̂ y de su desviación σ θ̂ .
En los casos de muestras grandes, cuando los valores de la muestra corresponden a variables
aleatorias estadísticamente independientes (iid) y por lo tanto se dan las condiciones del TLC,
se tiene que:
Maxk  θ̂ α/2 σ θ̂  Zα/2 σ/ n , n  30
¿Pero como escoger el estimador θ̂ que mejor precisa el parámetro θ ?

Hay dos métodos generales: el método de máxima verosimilitud y el método de momentos.
 Método de máxima verosimilitud

El método de estimación de máxima verosimilitud permite, en el caso de un parámetro o n
vector de parámetros poblacionales desconocidos, determinar el estimador o vector de esti-
madores que maximizan la función de probabilidad conjunta de una muestra de n v.a. selec-
cionadas de la población en estudio.
Sea f(x, θ) la fdp de una población en la cual queremos determinar θ .

Sea x1,x2,….,xn una muestra de v.a. iid seleccionadas de dicha población, a la función de pro-
babilidad conjunta L( θ ) de las n v.a. de la muestra la llamaremos
función de verosimilitud muestral, es decir:
L ( θ )=L(x1,x2,….,xn; θ )
Pero como las v.a. son independientes tenemos: L( θ ) = f(x1, θ ) f(x2, θ )….f (xn, θ ). Es decir:
n
 f(x , θ)
i
L ( θ )= i 1
 Estimador de máxima verosimilitud -EMV-

El EMV del parámetro θ es θ̂ siempre que L( θ̂ ) sea el valor de máxima probabilidad de la
función de verosimilitud L es decir:
θ̂ es el EMV de θ si y solo si L( θ̂ ) es máximo
 f(x , θ) i
En la expresión L( θ )= i1 la función de verosimilitud varia con el parámetro θ y para el
proceso de optimización se considera que las xi son constantes luego de haber determinado la
muestra aleatoria.
Observe que como la función logaritmo natural es siempre creciente el EMV de L( θ ) también
optimiza a Ln (L( θ )) y podemos definir:
n n
 f(xi, θ)  ln f(x , θ)
i
l( θ )=Ln (L( θ ))= Ln ( i1 )= i1
n
f ( xi , θ)
lθ    0
f( xi , θ) ˆ )  0 l(θ̂)
ˆ maximiza a l( θ ) es claro que l(θ
y optimizar así: i1
. Si θ  θ y <0.
Ejemplo: Considere una población Poisson y calcule el EMV para la tasa poblacional de su-
cesos raros λ
eλ λ x
f(x, λ) 
Sabemos que x! para x = 0,1,2,…
n
 f(xi, h)
L( λ )= 1
x
n λ x e nλ  λ i
Lλ    e λ /x ! 
i
i  xi!
1
 xi!
como es constante
lλ   lnLλ   nλ  (  x )lnλ  lnc
i
 xi  xi
lλ   n  0 entonces ˆλ  es el EMV para λ Poisson
λ n
 xi
lˆλ    0
λ2  xi  0
Observe que , ya que y λ  0.
 Momentos respecto del origen
Dada una variable aleatoria X con función de probabilidad o densidad f(x) podemos de-
finir una función de X que sea igual a la variable elevada a un exponente entero no negativo.
El valor esperado de z(x) es el k-ésimo momento de la variable X respecto a su origen

y se llama
· k=0
· k=1
a este primer momento respecto al origen que es igual al valor esperado se le llama también
media aritmética de la variable y se le denomina μX, simplemente μ.
En la mayoría de los casos, la media μ expresa la tendencia central de la variable o el

orden de magnitud de sus valores.
El resto de los momentos respecto al origen tienen escaso interés en la mayoría de los
casos.
 Momentos respecto a la media
Dada una variable aleatoria X con función de probabilidad o densidad f(x) podemos
definir una función de X que sea igual a la diferencia entre la variable y su media aritmética
elevada a un exponente entero no negativo.
El valor esperado de z(x) es el k-ésimo momento de la variable X respecto a la media y

se llama μk.
Ø k=0
Ø k=1
es decir, en cualquier variable aleatoria su primer momento respecto de la media es

igual a 0. Esta propiedad se utilizar reiteradamente en las demostraciones estadísticas.
Ø k=2
Este segundo momento respecto de la media se le llama también varianza.
La varianza de una variable mide la dispersión de sus valores respecto al valor

central μ.
Para calcular la varianza por un método más sencillo se utiliza la expresión:
Es decir, la varianza de una variable es igual a la media de los cuadrados menos

el cuadrado de la media.
El principal problema de la varianza es que se expresa en unidades cuadráticas
que no siempre tienen una interpretación clara. Para obviar este problema se define otra
medida de la dispersión que es la desviación típica, σX, o simplemente σ, que se cal-
cula como la raíz cuadrada positiva de la varianza; evidentemente, la desviación típica
se mide en las mismas unidades que la variable
No obstante, la desviación típica no resuelve todos los problemas que se pueden

plantear, como por ejemplo la comparación de situaciones en las que la unidad de me-
dida o el orden de magnitud de esta sea diferente. Para resolver esta cuestión se define
una medida adimensional de la variabilidad que es el coeficiente de variación, C V,
que se calcula como el cociente entre la desviación típica y la media (a veces este co-
ciente se expresa en tanto por ciento multiplicándolo por 100).
En este contexto de la medida de la variación se plantea el problema de medir la

variación conjunta de variables de variables asociadas.
si
Ø k=3
= asimetría
El tercer momento respecto de la media mide la asimetría de la distribución, es

decir, si existen o no observaciones muy extremas en algún sentido con frecuencias
razonablemente altas. Si la asimetría es negativa, la variable toma valores muy bajos
con mayor frecuencia que valores muy altos y se dice que tiene una cola izquierda pe-
sada o que es asimétrica hacia la izquierda. Si la asimetría es positiva, la variable toma
valores muy altos con mayor frecuencia que valores muy bajos y se dice que tiene una
cola derecha pesada o que es asimétrica hacia la derecha. Si la asimetría es cero, los
valores bajos y altos de la variable tienen probabilidades iguales (el ejemplo más típico
de variable simétrica es la variable normal)
La asimetría tiene el mismo problema que la varianza y la covarianza en cuanto

a sus unidades de medida y, por ello, normalmente se utiliza una medida adimensional
de la asimetría que es el coeficiente de asimetría, g1, que se calcula como el cociente
entre el tercer momento y el cubo de la desviación típica.
Ø k=4 = curtosis
El cuarto momento respecto de la media mide la curtosis de la distribución, es

decir, la forma de la distribución de probabilidad. Al representar gráficamente variables
con curtosis pequeña, platicúrticas, se observan curvas o histogramas con colas cortas
y aspecto aplanado o en meseta; si la variable tiene curtosis grande, es decir, si es
leptocúrtica, su gráfica ser alta y estilizada, con colas largas y pesadas
 Método de momentos
Recordemos que los momentos sirven para caracterizar una distribución de probabilidad, y si
dos variables aleatorias tienen los mismos momentos, entonces dichas variables tienen o si-
guen la misma función de densidad. Por lo tanto, los podemos emplear para estimar sus res-
pectivos parámetros.
El método consiste en igualar los primeros momentos de una población a los momentos co-
rrespondientes de una muestra.
Definición. Se define el k-ésimo momento (absoluto) de una variable aleatoria discreta como:
Si la variable aleatoria es continua su k-ésimo momento (absoluto) está dado por:
El k-ésimo momento mk de una muestra aleatoria X1, X2, ..., Xn es la media de sus k-ésimas
potencias y está dado por:
Entonces si una distribución tiene p parámetros desconocidos, para su estimación se tendrá

lo siguiente:
m1 = m1
m2 = m2
……………
mp = mp
Ejemplo. Si una variable aleatoria sigue una distribución exponencial con parámetro l, encon-
trar el estimador del parámetro usando el método de los momentos.
f(X) = le-lx, x > 0
Como sólo existe un parámetro, bastará con usar el primer momento, es decir,
m1 = m1,
El primer momento de la distribución exponencial es 1/l, por lo cual se tiene que
Es decir, el estadístico usado para estimar el parámetro l es el inverso de la media muestral.

Si el parámetro que estuviéramos estimando fuera el valor esperado q = 1/l, entonces el esti-
mador será la media muestral. Este estimador es insesgado.
ESTIMACIÓN POR INTERVALOS
Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado
con una cierta probabilidad. En la estimación por intervalos se usan los siguientes conceptos:
 Intervalo de confianza
El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro
a estimar. Este intervalo contiene al parámetro estimado con una determinada certeza o nivel
de confianza.
 Variabilidad del parámetro
Si no se conoce, puede obtenerse una aproximación en los datos aportados por la literatura
científica o en un estudio piloto. También hay métodos para calcular el tamaño de la muestra
que prescinde de este aspecto. Habitualmente se usa como medida de esta variabilidad la
desviación típica poblacional y se denota σ.
 Error de la estimación
Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza.
Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el
intervalo de confianza y, por tanto, menor el error, y más sujetos deberán incluirse en la mues-
tra estudiada. Llamaremos a esta precisión E, según la fórmula E = θ2 - θ1.
 Nivel de confianza
Es la probabilidad de que el verdadero valor del parámetro estimado en la población se sitúe

en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-α), aunque habi-
tualmente suele expresarse con un porcentaje ((1-α)·100%). Es habitual tomar como nivel de
confianza un 95% o un 99%, que se corresponden con valores α de 0,05 y 0,01, respectiva-
mente.
 Valor α
También llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar en nues-
tra estimación, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-α). Por ejem-
plo, en una estimación con un nivel de confianza del 95%, el valor α es (100-95)/100 = 0,05.
 Valor crítico
Es el valor de la abscisa en una determinada distribución que deja a su derecha un área igual
a α/2, siendo 1-α el nivel de confianza. Normalmente los valores críticos están tabulados o
pueden calcularse en función de la distribución de la población. Por ejemplo, para una distri-
bución normal, de media 0 y desviación típica 1, el valor crítico para α = 0,05 se calcularía del
siguiente modo: se busca en la tabla de la distribución ese valor (o el más aproximado), bajo
la columna "Área"; se observa que se corresponde con -0,64. Entonces Zα/2 = 0,64. Si la media
o desviación típica de la distribución normal no coinciden con las de la tabla, se puede realizar
el cambio de variable t=(X-μ)/σ para su cálculo.
Con estas definiciones, si tras la extracción de una muestra se dice que "3 es una estimación
de la media con un margen de error de 0,6 y un nivel de confianza del 99%", podemos inter-
pretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con una probabilidad
del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando, respectivamente, la mitad del
error, para obtener el intervalo de confianza según las definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza van relaciona-
dos. Si admitimos un error mayor, esto es, aumentamos el tamaño del intervalo de confianza,
tenemos también una mayor probabilidad de éxito en nuestra estimación, es decir, un mayor
nivel de confianza.
Es mas fácil explicar la estimación por intervalos, equiparando el parámetro que se
quiere estimar con una vaquilla echada, la cual no se mueve, así el parámetro, en el
momento de su estudio, mientras que el lazo que se utiliza, es el intervalo de confianza,
el cual, entre mas abierto esté, mas probable es que abarque a la vaquilla, o lo que es lo
mismo, la probabilidad de error, es menor.
Un intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza,

que es una medida del grado de fiabilidad en el intervalo. Un nivel de confianza de 95% implica
que 95% de todas las muestras daría lugar a un intervalo que incluye cualquier parámetro que
se esté estimando, y sólo 5% de las muestras producirá un intervalo erróneo. Cuanto mayor
sea el nivel de confianza podremos creer que el valor del parámetro que se estima está dentro
del intervalo.
 Encontrar z a partir de un nivel de confianza
Existen varias tablas en las cuales podemos encontrar el valor de z, según sea el área pro-
porcionada por la misma. En esta sección se realizará un ejemplo para encontrar el valor de
z utilizando tres tablas diferentes.
Ejemplo: Encuentre el valor de z para un nivel de confianza del 95%.
Solución 1:
Se utilizará la tabla que tiene el área bajo la curva de - hasta z. Si lo vemos gráficamente
sería:
El nivel de confianza bilateral está dividido en partes iguales bajo la curva:

En base a la tabla que se esta utilizando, se tendrá que buscar el área de 0.975, ya que cada
extremo o cola de la curva tiene un valor de 0.025.
Por lo que el valor de z es de 1.96.
Solución 2:
Si se utiliza una tabla en donde el área bajo la curva es de 0 a z:
En este caso sólo se tendrá que buscar adentro de la tabla el área de 0.475 y el resultado del
valor de z será el mismo, para este ejemplo 1.96.
Solución 3:
Para la tabla en donde el área bajo la curva va desde z hasta :
Se busca el valor de 0.025 para encontrar z de 1.96.
Independientemente del valor del Nivel de Confianza este será el procedimiento a seguir para
localizar a z. En el caso de que no se encuentre el valor exacto se tendrá que interpolar.
 Estimación de la media.
1.- Siendo σ2 conocida.

Sabemos por lo que se vio al hablar de distribuciones muestrales que la distribución muestral
de la media, calculada a partir de todas las muestras posibles de tamaño n que se puede
recoger de una población N, está normalmente distribuida y tiene una media  y una varianza
σ2/N.
Resumen:
1. Sacamos de la población una muestra de tamaño N

X 
2. Calculamos la X y N
3. Seleccionamos un nivel de confianza determinado al que pretendemos hacer la estimación

α=0.01, 0.05, ...., etc.
4. De acuerdo con ese nivel de confianza buscamos el valor de zi en la tabla de áreas de la


distribución normal entrando en ella con 2 ,
z
5. Construimos el intervalo de confianza, sumando y restando a la X el valor de i X , error
muestral máximo para α=0.01, 0.05, ...., etc.
Límite superior del intervalo
  X  zi  X
2
Límite inferior del intervalo

 Algunos ejemplos de intervalos de confianza
1. Intervalo de confianza para la media de una población normal y varianza de la pobla-

ción conocida.
Ejemplo: Supongamos que la σ2 de la población de alumnos de 1º en velocidad lectora es de

64 puntos. Seleccionamos al azar una muestra de 144 sujetos y obtenemos una media aritmé-
tica de 75 palabras. Se desea establecer el intervalo de confianza para la X con un nivel de

confianza del 99%.
En toda estimación por intervalo se tiene un estadístico (valor calculado en la muestra) o esti-
mador al que hay que sumar y restar el valor de su error muestral máximo al nivel de confianza
establecido.
Siguiendo los pasos expresados anteriormente tenemos
 Z i 
 Parámetro = estadístico 2
  X  zi  X
2

X 
 Cálculo del error típico N
8
X  0.67
144
 Como el nivel de confianza es del 99%, esto quiere decir que trabajamos con α= 0.01.
 A ese α= 0.01 le corresponde, mirando las tablas, con α/2, una zi de ±2.58.
 Por lo tanto el intervalo de confianza es:
76.7286
α= 0.01 μ=75±2.58*0.67 3.4572
1.7286 73.2714
Lo que significa que tenemos un 99% de confianza de que la media de la población no sea
menor que 73.2714 ni mayor que 76.7286, o que esté entre estos dos valores extremos.
76.31
α= 0.05 μ=75±1.96*0.67 2.62
1.31 73.69
Lo que significa que tenemos un 95% de confianza de que la media de la población no sea
menor que 73.69 ni mayor que 76.31, o que esté entre estos dos valores extremos.
Ejemplo: Se encuentra que la concentración promedio de zinc que se saca del agua a partir
de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro.
Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en
el río. Suponga que la desviación estándar de la población es 0.3.
Solución:
1. El valor de z para un nivel de confianza del 95% es 1.96, por lo tanto:
Z (1.96)(0.3)
x  2.6   2.50 y 2.70
n 36
Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo

será más amplio:
Z (2.575)(0.3)
x  2.6   2.47 y 2.73
n 36
LIMITES UNILATERALES
En ocasiones es necesario estimar algún parámetro, en solo alguno de sus límites, por lo
que el valor ∞ se carga a una sola cola y dependerá del problema si calculamos el límite su-
perior de confianza o el límite inferior de confianza.
Ejemplo: Una corporación quiere emitir algunos pagares a corto plazo y espera que los in-
tereses que tendrá que pagar no sean mayores de 11.5%. Para obtener cierta información
acerca de la tasa media de intereses que habría de pagar, la corporación pone a la venta 40
pagares a través de cada una de 40 firmas de corretaje. La media y la desviación estándar
para estas 40 tasas de interés fueron de 10.3% y 0.31% respectivamente. Encuentre el inter-
DATOS LSC  x  z 
n
n  40
 10.3  1.645(0.31/ 40 )
x  10.3%
 10.3  0.0801
  0.31%
  10.38%
1  de confianza
valo .95 del 95% para la tasa de interés que habría de pagar la corporación por los
pagares.
Conclusión: existe un 95% de confianza de que la media de interés que habría de pagar la
corporación sea menor o igual a 10.38%
 Con s2 desconocido
Para estimar s se debe utilizar el desvío estándar muestral corregido.

, ya que según se ha visto, es un estimador insesgado del correspondiente
S
SX 
parámetro poblacional s . Reemplazando en la variable tipificada  X por n resulta:
X  X X  X 
   t n1
X  S
n n
Por lo tanto:
 S S 
P X  t n1;     X  t n1;    1
 n n
En el siguiente esquema se condensa la información para la estimación si se conoce o no la

desviación estándar poblacional.
CONOCIDA Z
σ
x
Z
s
DESCONOCIDA n≥25 n
n<25
x
t
s
n
Ejemplo. Considere de nuevo el ejemplo anterior, donde m representa la longitud media de
un eje proveniente de un proceso de producción normal, pero con una varianza desconocida,
y se toman muestras de 16 ejes, con los siguientes valores:
Cuál será el intervalo de confianza del 95% para el nivel medio del proceso?. Puede conside-
rarse que este proceso tiene un nivel medio de 5.0 cm?
La media de la muestra es igual a 4.92 cm y la desviación estándar de 0.0913. Tenemos en-

tonces la siguiente información:
DATOS
n  16
x  4.92
s  0.0913
t n 1, / 2  t15, 0.025  2.131
El intervalo de confianza del 95% está dado por:
(4.92 - 2.131 x 0.0913/4, 4.92 + 2.131 x 0.0913/4) =
Si consideramos, además del 95%, niveles de confianza del 90% y del 99%, los respectivos
intervalos de confianza serían los siguientes:
De nuevo, se observa que para cualquier intervalo de confianza, no se acepta la hipótesis de

que el nivel medio del proceso sea 5.0.
Ejemplo: Un ingeniero esta investigando las características de desgaste de un tipo particular

de llanta para automóvil empleadas para una flotilla de la compañía. se selecciona una muestra
de 16 llantas y cada llanta se corre hasta que aparecen las bandas de desgaste.
Se registra el número de kilómetros que la llanta ha corrido y se considera que la vida útil es
una variable aleatoria distribuida normalmente. ¿Seguirá la compañía comprando este tipo de
llanta si el valor esperado de la duración de una llanta es de 39000km?
nº de llanta kilómetros corridos

1 41250
2 40187
3 43175
4 41010
5 39265
6 41872
7 42654
8 41287
9 38970
10 40200
11 42550
12 41095
13 40680
14 43500
15 39775
16 40400
lic  x  t , v, s
n
DATOS
 41116.87  1.753(1346.84 / 16 )
n  16
 41116.87  1.753(336.71)
x  4116.87
 41116.84  590.25
s  1346.84
  40526.61km
1    0.95
Conclusión: existe un 95% de confianza de que el promedio de duración de una llanta sea
mayor o igual que 40526.61 kilómetros.
Ejemplo: Una maquina produce barras metálicas empleadas en el sistema de suspensión de

automóviles. se selecciona una muestra de 15 barras y se mide el diámetro que se muestra a
continuación. Considere que el diámetro de las barras se distribuye normalmente y determine
el limite bilateral de confianza del 95% con respecto al diámetro medio de las barras.
8.24 8.23 8.20

8.21 8.20 8.28
8.23 8.26 8.24
8.25 8.19 8.25
8.26 8.23 8.24
x  t a , v, s    x  t a , v, s
DATOS 2 n 2 n
n  15  8.23  2.145(0.025 / 15)    8.23  2.145(0.025 / 15)
x  8.234  8.23  2.145(0.00645)    8.23  2.145(0.00645)
s  0.025  8.23  0.0138    8.23  0.0138
1    0.95  8.220    8.2438
Conclusión: existe un 95% de confianza de que el diámetro medio de las barras este entre
8.220 y 8.2438
 Estimación de la Diferencia entre dos Medias
Si se tienen dos poblaciones con medias y y varianzas 2 y 2

1 2 1 2 , respectivamente,
un estimador puntual de la diferencia entre 1 y 2 está dado por la estadística . Por

tanto. Para obtener una estimación puntual de
1- 2, se seleccionan dos muestras aleatorias independientes, una de cada población, de
tamaño n1 y n2, se calcula la diferencia , de las medias muestrales.
Recordando a la distribución muestral de diferencia de medias:
Al despejar de esta ecuación 1- 2 se tiene:
Bilateral
 12  22  12  22
( x1  x2 )  z   1   2  ( x1  x2 )  z 
2 n1 n2 2 n1 n2
Unilateral
 12  22
( x1  x 2 )  z   1   2
n1 n2
 12  22
1   2  ( x1  x 2 )  z 
n1 n2
Ejemplo: Se lleva a cabo un experimento en el que se comparan dos tipos de motores, se

mide el rendimiento en mi/gal de gasolina. Se realizan 50 experimentos con el motor tipos A y
75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen cons-
tantes. El rendimiento medio de la gasolina para el motor A es de 36mi/gal y el promedio para
el motor B es de 42 mi/gal. Encuentre un intervalo de confianza del 96% para μA y μB que son
el rendimiento de gasolina media poblacional para los motores tipo B y tipo A. Suponga que la
desviación estándar poblacional es de 6 y 8 para los motores A y B respectivamente.
0.02 0.02
0..96
6 2 82 6 2 82
 (42  36)  2.055    2  1  (42  36)  2.055 
50 75 50 75
 (42  36)  (2.577)   2  1  (42  36)  (2.577)
 3.423   2  1  8.57
Conclusión: Existe un 96% de confianza de que la diferencia en el rendimiento medio de ga-

solina entre los motores tipo B y tipo A oscile entre 4.423 mi/gal y 8.57 mi/gal.
Ejemplo: Se comparan las resistencias de dos clases de hilos, 50 piezas de cada clase se
DATOS : prueban bajo condiciones similares. La marca A tiene una resistencia a la trac-
n1  50 ción promedio de 78.3kg y una desviación estándar de 5.6kg, mientras que la
n2  50 marca B el promedio de la tracción es de 87.2kg con una desviación estándar
x1  78.3Kg de 6.3kg. Construya un intervalo de confianza de 95% para la diferencia de las
x2  87.2 Kg medias poblacionales.
 1  5.6 Kg
DATOS :
 2  6.3Kg n1  50
1    0.95
n 2  75
x1  36mi / gal
x 2  42mi / gal
1  6
2  8
1    0.96
0.05 0.05
0.95
62 82 62 82
 (78.3  87.2)  1.96    2  1  (78.3  87.2)  1.96 
50 75 50 75
 (78.3  87.2)  (1.96)   2  1  (78.3  87.2)  (1.96)
 11.236   2  1  6.564
Conclusión: Existe un 95% de confianza de que la diferencia en las resistencias A y B a la

tracción promedio oscila entre –11.236 y –6.564.
ESTIMACIÓN DE LA DIF. DE MEDIAS CON SIGMAS DESCONOCIDAS
Z= (x1 – x2) – (µ1 - µ2)

(12 + 22
σ si n1 n2
Checar el tamaño de las muestra

Dif. de
n25 Z
Medias σ no
1 ≠ 2
n< 25
1 = 2
Varianzas iguales y n<25
Limite bilateral
( x1  x 2 )  t / 2,v Sp 1 / n1  1 / n2  1   2  ( x1  x 2 )  t / 2,v Sp 1 / n1  1 / n2
Donde:
(n1  1) S12  (n2  1) S 22

Sp 
n1  n2  2
v  n1  n2  2
Ejemplo: Un artículo publicado en la revista de contaminación ambiental, se da un reporte

sobre una investigación realizada en un pueblo de Alabama, para determinar la relación entre
parámetros fisicoquímicos seleccionados y diversas mediciones de la estructura de la comu-
nidad de macro invertebrados se eligieron 2 estaciones de muestreo independientes para este
estudio, una que se localiza corriente abajo del punto de descarga de una mina de ácido y la
otra localizada corriente arriba. Para 12 muestras mensuales reunidas en la estación corriente
abajo, el índice de diversidad de especies tuvo un valor Χ1= 3.11 y una S1= .771. 10 muestras
mensuales reunidas en la estación corriente arriba tuvieron un X2= 2.04 y la desviación están-
dar S2= .448 encuentre intervalo 90% para diferencia de medias poblacionales de los 2 sitios.
Suponga que las poblaciones están distribuidas de forma aproximada normal con desviaciones
desconocidas pero iguales.
(3.11  2.04)  (1.725)(. 6459 ) 1 / 12  1 / 10  1   2  (3.11  2.04)  (1.725)(. 6459 ) 1 / 12  1 / 10
1.62  1   2  3.76
Datos: Existe un 90% de confianza

para decir que la diferencia
n1=12 de los promedios de medias
n2=10 de la diversidad de
especies de los dos sitios
x1=3.11 está entre 1.62 y 3.76
x2=2.04
S1=0.771
s2=.448
1- = .90
(12  1)(.771) 2  (10  1)(.448) 2

Sp 
12  10  2
Sp  .4172  .6459
v  12  10  2  20
ESTIMACION DE LA DIF. DE MEDIAS, SIGMAS DESC. PERO DIFERENTES
Bilateral
s12 s 22 s2 s2
( x1  x2 )  t , v   1   2  ( x1  x2 )  t , v 1  2
2 n1 n2 2 n1 n2
Unilateral
s12 s 22
( x1  x 2 )  t , v   1   2
2 n1 n2
s12 s 22
 1   2  ( x1  x 2 )  t , v 
2 n1 n2
Donde:
2 2
 s12   s 22 
    
v  n1   n2 
2 2
 s12   s 22 
    
 1
n  1   2 n  1 
Ejemplo: Los siguientes datos representan los tiempos de duración de las películas que pro-
ducen 2 compañías cinematográficas:
COMPAÑIA DURACIÓN (MINUTOS)

I 103, 94, 110, 87, 98
II 97, 82, 123, 92, 175, 88, 118
Calcule un intervalo de confianza del 90% para la diferencia entre los promedios de duración
que producen las dos compañías. Suponga que las diferencias de los tiempos de duración se
distribuyen normalmente con varianzas distintas.
DATOS :
n1  5
n2  7
x1  98.4 0.02 0.02
x 2  110.71 0..90
s1  8.73 t.05
s 2  32.18
1    0.90
2 2
 8.73   32.18 
   
v  5   7 
2 2
 8.73   32.18 
   
 4   6 
v
15.2425  147.93602
58.0834  3647.5100
v  7.18  7
8.732 32.182 8.732 32.182

(98.4  110.71)  (1.895)   1   2  (98.4  110.71)  (1.895) 
5 7 5 7
 36.51  1   2  11.89
Conclusión: Existe un 90% de confianza para la diferencia entre los promedios reales de du-
ración que producen las 2 compañías esta entre –36.51 y 11.89.
ESTIMACIÓN DE LA PROPORCION
Sea X una variable binomial de parámetros n y p (una variable binomial es el número de éxitos
en n ensayos; en cada ensayo la probabilidad de éxito (p) es la misma, por ejemplo: número
de diabéticos en 2000 personas).Si n es grande y p no está próximo a 0 ó 1 (np ³ 5) X es
aproximadamente normal con media np y varianza npq (siendo q = 1 - p) y se puede usar el
estadístico (proporción muestral), que es también aproximadamente normal, con error
pq
típico dado por n en consecuencia, un IC para p al 100(1 - a)% será
pq
pˆ  z / 2
n
Bilateral
pq pq
pˆ  z / 2  P  pˆ  z / 2
n n
Unilateral
pq pq
pˆ  z  P  pˆ  z
n n
Ejemplo: En una muestra aleatoria de 500 familias que tienen televisión en la ciudad de Ha-
milton Canadá, se encuentra s encuentra que 340 están suscritas a HBO. Encuentre el inter-
valo de confianza del 95% para la proporción real de familias en esa ciudad que están suscri-
tas.
Datos:
n = 500 .68 – (1.96) (.68)(.32) P 68 + (1.96) (.68)(.32)
x = 340 500 500
^p= 340 = 0.62
500 0.6392 P 0.7208
q = 0.32
1- = 0.95
Conclusión: existe un 95 % de confianza para decir que la proporción real
de familias en Hamilton Canadá que están suscritas a HBO está entre: 0 .6392 y 0.7208
Ejemplo: Se considera un nuevo sistema de lanzamiento de cohetes para el despliegue de

cohetes pequeños a corto alcance. El sistema existente tiene 0.8 como probabilidad de lan-
zamiento exitoso. Se realiza una muestra de 40 lanzamientos experimentales y 34 resultan
exitosos.
a) Construya intervalo de confianza 95% para P.
b) Concluiría que el nuevo sistema es mejor?
a).-
Datos: 0.85- (1.96)( (.85*.15)/40) P 0.85+(1.96)( (.85*.15)/40)

P= 0.8 .85 – (.0062) P .85 +(.0062)
n= 40 .8438 P .8562
^p= 34/ 40 = .85
^q=.15
1- = 0.95
Conclusión: existe un 95% de confianza para decir que la proporción real de lanzamiento
exitosos de cohetes esta entre 0.8438 y 0.8562.
b).- De acuerdo al resultado del inciso anterior, el valor de 0.8 esta por debajo del intervalo
encontrado por lo que podemos decir que si es mejor el nuevo sistema.
ESTIMACIÓN DE LA DIFERENCIA DE PROPORCIONES
Recordando la fórmula:
Despejando P1-P2 de esta ecuación:
Aquí se tiene el mismo caso que en la estimación de una proporción, ya que al hacer el des-
peje nos queda las dos proporciones poblacionales y es precisamente lo que queremos esti-
mar, por lo que se utilizarán las proporciones de la muestra como estimadores puntuales:
Bilateral
L.I .C  ( pˆ 1  pˆ 2 )  z / 2 ( P1 q1 / n1 )  ( P2 q 2 / n2 )
^ ^
L.S .C  ( pˆ 1  pˆ 2 )  z / 2 ( P1 q1 / n1 )  ( P2 q 2 / n2 )
Unilateral
L.I .C  ( pˆ 1  pˆ 2 )  z ( P1 q1 / n1 )  ( P2 q 2 / n2 )
^ ^
L.S .C  ( pˆ 1  pˆ 2 )  z ( P1 q1 / n1 )  ( P2 q 2 / n2 )
Ejemplo: Se considera cierto cambio en un proceso de fabricación de partes componentes.

Se toman muestras del procedimiento existente y del nuevo para determinar si éste tiene como
resultado un mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son
defectuosos y 80 de 2000 artículos del procedimiento nuevo también lo son, encuentre un
intervalo de confianza del 90% para la diferencia real en la fracción de defectuosos entre el
proceso actual y el nuevo.
DATOS
n1 = 1500
n2 = 2000
x1 = 75
x2 = 80
^
p1 = 75 / 1500 = 0.05
^
p2 = 80 / 2000 = 0.04
^
q1 = 1 – 0.05 = 0.95
^
q2 = 1 – 0.04 = 0.96
1- = 0.90
L.I .C  (0.05  0.04)  (1.645) (0.05)(0.95) / 1500)  (0.04)(0.96) / 2000)  0.0017

L.S .C  (0.05  0.04)  (1.645) (0.05)(0.95) / 1500)  (0.04)(0.96) / 2000)  0.0217
 0.0017  P1  P2  0.0217
Conclusión: Existe un 90% de confianza de que la diferencia real en la fracción de defectuosos

entre el procedimiento actual y el nuevo se encuentre entre –0.0017 y 0.0217.
Ejemplo: Una encuesta de 1000 estudiante concluye que 274 eligen al equipo de béisbol A
como su equipo favorito. En 1991 se realizó la misma encuesta con 760 estudiantes. Concluyó
que 240 de ellos también eligieron al equipo A como su favorito. Calcule con un intervalo de
confianza del 95% para la diferencia entre la proporción de estudiantes que favorecen al equipo
A entre las dos encuestas. ¿Hay una diferencia significativa?
DATOS
n1 = 1000
n2 = 760
x1 = 274
x2 = 240
^
p1 = 274 / 1000 = 0.274
^
p2 = 240 / 760 = 0.316
^ 1 = 1 – 0.274 = 0.726
q
^
q2 = 1 – 0.316 = 0.684
1- = 0.95
L.I .C  (0.274  0.316)  (1.96) (0.274)(0.726) / 1000)  (0.316)(0.684) / 760)  0.0851
L.S .C  (0.274  0.316)  (1.96) (0.274)(0.726) / 1000)  (0.316)(0.684) / 760)  0.0289
 0.0851 P1  P2  0.0289
Conclusión. Existe un 95% de confianza de que la diferencia entre la proporción de estudiantes

que favorecen al equipo A como su favorito entre las dos encuestas oscile entre –0.0851 y –
0.0289.
ESTIMACIÓN DE LA VARIANZA
Para poder estimar la varianza de una población normal se utilizará la distribución ji-cua-
drada.
Al despejar esta fórmula la varianza poblacional nos queda:
X21- /2 X2 /2
2
1- /2 < (n – 1) s2 / 2 < 2
/2
1/ 2
1- /2 > 2 / (n – 1) s2 > 1 / 2
/2
1/ 2
/2 < 2 / (n – 1) s2 < 1 / 2
1- /2
(n – 1) s2 / 2
/2 < 2 < (n – 1) s2 / 2
1- /2
Ejemplo: Los siguientes son los pesos en decagramos de 10 paquetes de semillas de pasto
distribuidas por cierta compañía. 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2, 46.0.
Encuentre un intervalo de confianza del 95% para la varianza de todos los paquetes de semi-
llas de pasto que distribuye esta compañía. Suponga una población normal.
DATOS
n = 10
s = 0.5345
1- = 0.95
/ 2 = 0.025
X2.025,9 X2.975,9
(9)(0.5345) 2 /  2 0.25,9   2  (9)(0.5345) 2 /  2 0.975,9

2.5712/ 19.023   2  2.5712/ 2.7
0.1352   2  0.9523
Conclusión. Existe un 95% de confianza de que la varianza de todos los paquetes de semillas
de pasto que distribuye esta compañía se halle entre 0.1352 y 0.9523.
Ejemplo: Una muestra aleatoria de 20 estudiantes obtiene una media x =72 y s2=16 en un
examen de diagnóstico de matemáticas. Suponga que las calificaciones se distribuyen nor-
malmente y construya un intervalo de confianza del 98% para 2.
DATOS
n = 20
x = 72
s2 = 16
1- = 0.98
/ 2 = 0.01 X2.01,19 X2.99,19
(19)(16) /  2 0.01,19   2  (19)(16) /  2 0.99,19
304 / 36.191   2  304 / 7.633
8.4   2  39.827
Conclusión. Existe un 98% de confianza de que la varianza de las calificaciones obtenidas por
los alumnos esté entre 8.4 y 39.827.
ESTIMACIÓN DE LA RAZÓN DE DOS VARIANZAS
Supóngase que se tienen dos poblaciones normales e independientes con varianzas desco-
nocidas  1 y  2 , respectivamente. De este par de poblaciones, se tienen disponibles dos

2 2
muestras aleatorias de tamaños n1 y n2, respectivamente, sean s12 y s22 las dos varianzas
muestrales. Se desea conocer un intervalo de confianza del 100(1   ) por ciento para el co-
ciente de las dos varianzas,  1 /  2 .

2 2
Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se

coloca la varianza muestral mayor en el numerador del estadístico F.
( S12 / S22 ) F1- /2 , 2, 1 1

2 / 2
2 ( S12 / S22 ) F /2 , 1, 2
Ejemplo: Los siguientes datos representan los tiempos de duración de las películas que pro-
ducen dos compañías cinematográficas:
COMPAÑÍA TIEMPO (MINUTOS)

I 103 94 110 87 98
II 97 82 123 92 175 88 118
Calcule un intervalo de confianza del 90% para 2 / 2

1 2 .
DATOS
n1 = 5
n2 = 7
s1 = 8.735
s2 = 32.185
1- = 0.90
/ 2 = 0.05
(32.18) 2
  
/(8.73) 2 ( F0.95, 4, 6 )   12 /  22  (32.18) 2 /(8.73) 2 ( F0.05, 6, 4 )
13.587 (0.1623)   12 /  22  (13.587 (6.16)
2.205   12 /  22  83.695
Conclusión: Existe un 90% de confianza de que la razón de las varianzas de los tiempos de
duración de las películas se encuentre entre 2.205 y 83.695.
Ejemplo: Se extraen muestras aleatorias de tamaños n 1=15, n2=20 provenientes de dos po-
blaciones independientes cuyas varianzas muestrales son s12=16, s22=49. Encuentre un inter-
valo
a) de confianza unilateral inferior para 2 / 2

1 2
b) bilateral de confianza para 2 / 2

1 2
DATOS
n1 = 15
n2 = 20
s12 = 16
s22 = 49
1- = 0.95
s12 / s 22 ( F1 / 2,v 2,v1 )   12 /  22
(49 / 16)( F0.975,,14,,19 )   12 /  22
(3.0625)1 / 2.84)   12 /  22
a) 1.078345  1 /  2
2 2
Conclusión: Existe un 95% de confianza de que 2 / 2 sea superior a 1.078345.

1 2
s12 / s 22 ( F1 / 2,v 2,v1 )   12 /  22  s12 / s 22 ( F / 2,v1,v 2 )

(49 / 16)( F0.975,,14,,19 )   12 /  22  (49 / 16)( F0.025,19,14)
(3.0625)1 / F0.025,19,14 )   12 /  22  (3.0625)F0.025,19,14 )
(3.0625)(1 / 2.84)   12 /  22  (3.0625)(2.84)
b) 1.078345  1 /  2  8.6975
2 2
Conclusión: Existe un 95% de confianza de que 2 / 2 se halle entre 1.078345 y 8.6975

1 2
DETERMINACION DEL TAMAÑO DE MUESTRA
Una cuestión que por lo general surge cuando se diseña un estudio estadístico es: “¿cuántos
elementos debo incluir en la muestra?”. Si una muestra es demasiado grande, se desperdicia
tiempo y dinero recolectando datos. Por el contrario, si la muestra es demasiado pequeña, las
conclusiones resultantes serán inciertas. Cuando se calcula una muestra para la estimación
de una media o de una proporción, el tamaño de la muestra depende de tres factores:
a) El nivel de confianza deseado. Tú, como investigador, seleccionas el nivel de confianza.

Como ya dijimos en secciones anteriores, es una convención que se utilice un nivel de
confianza del 95% (z=1.96), o bien del 99% (z=2.58). Mientras más alto sea el nivel de
confianza, mayor será el tamaño de la muestra.
b) El margen de error que se puede tolerar. El error máximo permisible, que se designa
como E, es la cantidad que se suma y/o resta de la media de la muestra, para determinar
los puntos extremos del intervalo de confianza correspondiente. Es la cantidad de error
que tú como investigador deseas tolerar. También es la mitad de la amplitud del inter-
valo de confianza correspondiente. Un error permisible pequeño requerirá una muestra
grande, mientras uno grande requerirá una muestra pequeña.
c) La desviación estándar de la población o la variabilidad en la población que se estudia.

Si la población tiene una dispersión amplia, se requiere una muestra grande. Por otra
parte si la población está concentrada (es homogénea), el tamaño requerido de la mues-
tra será pequeño.
Cuando no se conoce la desviación estándar de la población es necesario hacer una

estimación de ella. Algunos métodos para hacer esta estimación son los siguientes:
- El enfoque del estudio comparativo. Este se utiliza cuando con anterioridad se

ha realizado estudios estadísticos sobre la misma población. Si los datos obteni-
dos por estos estudios se consideran confiables se puede utilizar la desviación
estándar encontrada por ellos.
- La aproximación basada en rango. Para utilizar este método es necesario cono-

cer o tener una estimación de los valores máximos y mínimos de la población.
Recurda que la regla empírica establece que, suponiendo que la distribución es
normal, dentro del rango de + – 3 DE de la media se encuentran prácticamente
la totalidad de las observaciones de una distribución (99.7%). De esta manera la
distacia entre el valor menor y el mayor debe ser, en teoría, algo muy cercano a
6 DE. Se podría entonces estimar la DE como una sexta parte del rango. Por
ejemplo supón que quieres estimar la DE de la cantidad de cheques que expiden
al mes los alumnos de la universidad, supón que el mínimo de cheques expedi-
dos es de 2 y el máximo de 50, de esta manera el rango sería de 48 (50-2). En
este ejemplo la estimación de la DE sería de 8 cheques, que se obtiene de 48/6.
- Estudio piloto. Consiste en aplicar un estudio previo a una pequeña muestra de

la población y en tomar como DE la que se obtenga de esta pequeña muestra.
- El error estandar de la media o de la proporción. Consiste en aplicar el procedi-
miento visto en el tema anterior.
La fórmula para calcular el tamaño de la muestra para estimar una media es la siguiente:
Donde:
n = es el tamaño de la muestra
z = es el valor estándar normal que corresponde al nivel deseado de confianza
s = es una estimación de la desviación estándar de la población
E = es el máximo error permisible
Ejemplo: Un estudiante de administración desea determinar la cantidad media que perciben

los empleados del Municipio de Atotonilco del Rincón. El error para estimar la media es de
$1,000, con un nivel de confianza del 95%. El estudiante encuentra un informe en INEGI que
estima la desviación estándar en $10,000. ¿Cuál es tamaño requerido de la muestra?
n = ((1.96*$10,000)/$1,000)2
n = 384.16, es decir 385

Si se desea un nivel mayor de confianza, por ejemplo del 99%, la muestra deberá ser mayor.
n = ((2.58*$10,000)/$1,000)2
n = 665.64, es decir 666
El procedimiento que se describe arriba se puede adaptar para el cálculo del tamaño dela
muestra para el cálculo de una proporción. También es necesario identificar tres criterios:
a) El nivel de confianza deseado.
b) El margen de error que se puede tolerar.
c) Un estimado de la proporción de la población. Esta estimación se puede obtener por los

mismo métodos de la estimación de la media, aunque cuando no se cuenta con infor-
mación es común que se utilice 0.50
La fórmula que se utiliza en este caso es la siguiente:
Donde:
n = es el tamaño de la muestra
z = es el valor estándar normal que corresponde al nivel deseado de confianza
P = es una estimación de la proporción de la población
E = es el máximo error permisible

Ejemplo: El estudio del ejemplo anterior también estima la proporción de colonias del Munici-
pio que cuentan con servicio de recolección de basura. El estudiante desea que la estimación
esté dentro del 10% de la proporción de la población, el nivel deseado de confianza es de 90%
y no se dispone de una estimación para la proporción de la población. ¿Cuál es el tamaño de
la muestra requerido?
n  (.50)  (.50)(1.65 / .10) 2

n  68.06
El estudiante necesita entonces una muestra de 69 colonias.
CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR LA DIF DE MED.
Si se recuerda a la distribución muestral de diferencia de medias se tiene que error esta dado
por:
 12  22
sz 
n1 n2
En esta ecuación se nos pueden presentar dos casos:
 Los tamaños de muestra son iguales.
 Los tamaños de muestra son diferentes.
Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se despeja
n ya que n1 es igual a n2.
z 2 ( 12   22 )
n
s2
Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza cuando las
poblaciones son de diferente tamaño y se sabe que una es K veces mayor que la otra.
z 2 ( 12  k 22 )
n2 
ks 2
Ejemplo: Un director de personal quiere comparar la efectividad de dos métodos de entrena-

miento para trabajadores industriales a fin de efectuar cierta operación de montaje. Se divide
un número de operarios en dos grupos iguales: el primero recibe el método de entrenamiento
1, y el segundo, el método 2. Cada uno realizará la operación de montaje y se registrará el
tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan una desviación
estándar aproximadamente de 2 minutos. Si se desea que la estimación de la diferencia en
tiempo medio de montaje sea correcta hasta por un minuto, con una probabilidad igual a 0.95,
¿cuántos trabajadores se tienen que incluir en cada grupo de entrenamiento?
z 2 ( 12   22 ) (1.962 )(2 2  2 2 )
n   31
s2 12
Cada grupo debe contener aproximadamente 31 empleados.

ESTIMACIÓN
Introduccion
 Se define como un proceso que permite dar un
valor aproximado de los hechos poblacionales
(parámetros), utilizando para ello la información
proporcionada por muestras seleccionadas de la
población de interés, generalmente por métodos
aleatorios.
 Por ejemplo, una estimación de la media de una
determinada característica de una población de
tamaño N podría ser la media de esa misma
característica para una muestra de tamaño n.
Función
 A la función de los valores muestrales que les
permite dar un valor aproximado del hecho
poblacional, se le denomina el estimador, y
corresponde con las medidas que se presentaron
inicialmente con el nombre de “estadísticas” o
“estadígrafos”.
Caracteristicas de un estimador
 Insesgamiento: también conocida como imparcialidad,
se refiere a que la variable estimador para ser
insesgada o imparcial, debe tomar valores que tiendan
a agruparse alrededor del valor del parámetro que se
estima. En otras palabras, el valor esperado del
estimador debe ser igual al parámetro que se estima.
Simbólicamente:
 Donde T es la estadística estimador y theta el

parámetro a estimar.
 Consistencia: llamada también conciliabilidad, es

una propiedad que si se presenta para un
estimador implica que éste debe acercarse al
parámetro que estima, a medida que el tamaño de
la muestra aumenta. La presentación formal de esta
propiedad alude a que el estimador converge en
probabilidad al parámetro que estima; de una
manera sencilla:
 Eficiencia relativa: es esta una propiedad asociada con el

error del estimador o, más exactamente, con su error
cuadrático medio:
 Si existen dos posibles estimadores T1 y T2 de un mismo

parámetro, la eficiencia relativa se define como el cociente
entre sus errores cuadráticos medios. Con base en ella se
trata de seleccionar el mejor estimador que, obviamente,
será el de menor error. Este concepto se extiende al caso de
más de dos posibles estimadores.
 Si un estimador es insesgado su error cuadrático medio
equivale a su varianza, y si en el anterior proceso todos los
estimadores son insesgados, el seleccionado es conocido
como un estimador minivar.
 Suficiencia: implica que el estimador sólo requiere,
para el proceso de estimación, de la información
proporcionada por la muestra. Es decir, esta última le
es suficiente para hacer la estimación y no requiere de
algo más.
 Esta propiedad, de una evidencia intuitiva muy simple,
no tiene una formulación formal sencilla para presentar
en estas notas. A grandes rasgos, podría decirse que si
es posible descomponer la función de verosimilitud de
una muestra, en el producto de una función del
estimador condicionada al parámetro, por una función
de los solos valores muestrales, el estimador es
suficiente.
 Exactitud: Por exactitud de un estimador se

entiende una combinación de sesgo y
varianza. (Cuanto menos sesgo y varianza
posea más exacta sera). Se mide con el error
cuadrático medio.
Consistencia: Un estimador se
Robustez: Es la calidad de dice consistente si a medida que
resistencia en la eficiencia al aumenta el tamaño de la
cambiar el modelo de la muestra su diferencia con
distribución original respecto al parámetro se hace
mínima.
Exactitud: Por exactitud de un Eficiencia: se mide por la

estimador se entiende una varianza de su distribución
combinación de sesgo y muestral. Entre dos estimadores
varianza. (Cuanto menos sesgo no sesgados es preferible aquel
y varianza posea más exacta con mayor eficiencia pues
sera). Se mide con el error proporciona un rango más
cuadrático medio. aproximado de estimaciones
Sesgo: Un estimador U es
insesgado de θ si su esperanza
matemática coincide con el
parámetro.
Clasificación
 Estimación puntual:
 Método de los momentos;
 Método de la máxima verosimilitud;
 Método de los mínimos cuadrados;
 Estimación por intervalos.

 Estimación bayesiana.
Estimación Puntual
Estimacion por intervalos
2.4.1 estimación intervalo de confianza para

la media con sigma conocida.
 Dada una muestra aleatoria simple correspondiente a una
variable aleatoria dependiente de un parámetro θ, diremos que
los estadísticos L1 y L2 son un intervalo de confianza para θ con
nivel de confianza (1 − α) · 100 %, si se verifica:
1. L1 < L2 para toda muestra de tamaño n.
2. P(L1 ≤ θ ≤ L2) = 1 − α.
 Hay que destacar que en la segunda condición, en nuestro
contexto, el valor del parámetro es fijo, lo que es aleatorio
son los estadísticos que delimitan el intervalo.
 Formula.
Ejemplo.
 Se ha obtenido una muestra de 25 alumnos de una Facultad para
estimar la calificación media de los expedientes de los alumnos
en la Facultad. Se sabe por otros cursos que la desviación típica
de las puntuaciones en dicha Facultad es de 2.01 puntos. La
media de la muestra fue de 4.9.
 1. Intervalo de confianza al 90 %.
solución.
1. Intervalo de confianza al 90 %. Usamos la formula:
 Los cuantiles de orden 0.05 y 0.95, que encierran en el

centro de la distribución normal un área igual a 0.9 se
muestran en el grafico siguiente:
 Por ultimo, sustituyendo los datos en la formula del intervalo,
tenemos:
 4.9 +̲ 1.64 ( 2.01/ ) = 4.9 ± 0.66
(4.24 ,5.56)
Ejemplo para resolver en clase
INTERVALO DE CONFIANZA
PARA LA MEDIA CON
SIGMA DESCONOCIDA
Supongamos que la población es normal con media y
varianza desconocida y que se desea hacer
inferencias cercas de basada en una muestra
pequeña de (n<30) de la población. En este caso la
distribución de la media muestral ya no es normal si
no que sigue la distribución t de student.
Si de una población normal con media y

desviación estándar desconocida se extrae una
muestra de tamaño n, entonces al estadístico:
Se distribuye como una t student con
n-1 grados de libertad
Un intervalo de confianza de 100 (1- ) para es
de la forma:
Donde s es la desviación estándar muestral. Es
un valor de t con n-1grados de libertad y tal que el
area ala derecha de dicho valor es
Ejemplo
 Supongamos que la camaleón motor tiene que
hacer pruebas de choque con sus choques para
determinar el coste medio de la reparación tras
una colisión frontal unos 20 kilómetros por hora.
Resulta muy caro así que deciden probar con solo 5
camaleones. ¿Dónde podemos situar la media con
una confianza del 95 %?
 =540 dólares S=299
 n= 5
Ejemplo
 La asociación estadounidense de productores de
azúcar desea calcular el consumo medio de azúcar
por año. Una muestra de 16 personas revela que el
consumo medio anual es de 60 libras con una
desviación estándar de 20 libras. Construya un
intervalo de confianza del 99 % para la media
poblacional ¿Es razonable concluir que la media
poblacional es de 69 libras?
Tema 2.3 Intervalo de

confianza para la diferencia
de medias con sigma
conocida.
 El intervalo de confianza se construye de manera similar a como se estima el de la media,
excepto que el error estándar de la distribución muestral que corresponde en este caso es el
de la diferencia entre medias. La fórmula que se utiliza para estimar la diferencia entre las
medias de 2 poblaciones con intervalos de confianza es:
Ejemplo 1
El salario diario promedio para una muestra de n=30
empleados de una empresa manufacturera grande es x
(testada) = $28 888, con una desviación estándar de S= $
1400 En otra empresa grande, una muestra aleatoria de
n=40 empleados tiene un salario promedio de $27 000,
con desviación estándar muestral de S =$ 1000. El
intervalo de confianza del 99% para estimar la diferencia
entre los niveles diarios de salarios en las dos empresas
es…
 Conclusión: Por ello, puede afirmarse que el salario diario promedio

de la primera empresa es mayor que el correspondiente a la segunda,
en una cantidad que va de $226 a $1774, con una confianza del 99%
en esta estimación por intervalo.
Problema para resolver
Problema para resolver(hoja Nº6)
Problema para resolver(hoja Nº6)

Problema tarea
 Una muestra tomada al azar de una población normal de tamaño n 1=16

con 1=4.8 y tiene la media 1=18 y una muestra aleatoria de tamaño n2=25
tomada de una población diferente con 2=3.5 tiene la media 2=23.
 Determina un intervalo de confianza de 90% para M 1-M2
Intervalo de confianza para la

diferencia de medias con sigmas
desconocidas pero iguales.
• Para calcular el intervalo de confianza para la

diferencia de dos medias se debe saber si las
varianzas poblacionales son conocidas o
desconocidas, y en caso de que sean
desconocidas, se debe probar si son iguales o
diferentes. Nosotros analizaremos el caso de
cuando las varianzas son desconocidas pero
Iguales.
Parámetros.
• A) El parámetro usado como estimador de la
diferencia de medias μ1− μ2 será x(testada)1−
x(testada)2 , que es un estimador suficiente.
Y el estimador combinado de varianzas Sp.
• La variable aleatoria asociada con el estimador

será la variable definida como t (se usa t en
caso de muestras pequeñas)
Ej.-”Enunciado”
• Doce árboles de frutos cítricos maduros,

seleccionados al azar de una variedad de ejemplares,
tienen una altura media de 13.8 pies con una
desviación estándar 1.2 pies y 15 árboles de frutos
cítricos maduros , seleccionados también al azar de
otra variedad, tienen una altura media de 12.9 pies
con una desviación estándar de 1.5 pies
Problema del ejemplo.
• Suponiendo que las muestras aleatorias se
seleccionaron de poblaciones normales con
varianzas Iguales. Construya un intervalo de
confianza del 95% de la diferencia entre las
alturas promedio de los dos tipos de árboles
de frutos cítricos.
Ejercicio de tarea.
datos:
Las siguientes son las capacidades de
producción de calor del carbón extraido de
dos minas ( en millones de calorías por
tonelada):
Mina A: 8500, 8330, 8480, 7960, 8030.
Mina B: 7710, 7890, 7920, 8270, 7860
Problema.
• Suponiendo que los datos constituyen
muestras aleatorias independientes tomadas
de poblaciones normales con varianzas
iguales, construya un intervalo de confianza
del 99% de la diferencia entre el promedio
real de las capacidades de producción de calor
del carbón extraído de ambas minas.
DIFERENCIA DE
MEDIAS CON SIGMA
DESCONOCIDA PERO
DIFERENTE
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE

DOS DISTRIBUCIONES NORMALES VARIANZAS DESCONOCIDAS
PERO DIFERENTES.
O Consideremos ahora el problema de encontrar una
estimación por intervalos de µ1-µ2 cuando no es
probable que las varianzas poblacionales
desconocidas sean iguales. La estadística que se usa
con más frecuencia en este caso es:
O Al despejar la diferencia de medias

poblacionales de la formula de t nos queda:
O que tiene aproximadamente una
distribución t con V grados de libertad,
donde:
Ejemplo a resolver
O El departamento de zoología de cierta universidad llevó
a cabo un estudio para estimar la diferencia en la
cantidad de orto fósforo químico medido en dos
estaciones diferentes del río amazonas . El orto fósforo
se mide en miligramos por litro. Se reunieron 15
muestras de la estación 1 y se obtuvo una media de
3.84 con una desviación estándar de 3.07 miligramos
por litro, mientras que 12 muestras de la estación 2
tuvieron un contenido promedio de 1.49 con una
desviación estándar 0.80 miligramos por litro.
Encuentre un intervalo de confianza de 95% para la
diferencia del contenido promedio real de orto fósforo
en estas dos estaciones, suponga que las
observaciones vienen de poblaciones normales con
varianzas diferentes.
Problema a resolver..!!
En proceso de baño químico utilizando para grabar tarjetas de
circulo impreso, se están comparando 2 diferentes tiempos de
inmersión para remover cantidades idénticas de material foto
resistente. Se efectuaron 12 baños con un catalizador 1.
Resultando un tiempo de inmersión medio de muestra de
X1=min. Y una desviación estándar de S1 =.85 min. con el
catalizador 2 se efectuaron 15 baños, siendo el tiempo de
inmersión medio de X2=22.1 min y una desviación estándar de
S2=.98 min. Deseamos determinar un intervalo de confianza del
95% en la diferencia en las medias ϻ1-ϻ2, suponiendo que las
desviaciones standard (o varianzas) de las 2 poblaciones sean
diferentes.
Intervalo de confianza
para proporciones
Proporciones
O Sea p la proporción de éxitos en una
población, donde éxitos identifica a un
individuo u objeto que tiene una
propiedad especifica, por ejemplo
individuos que se gradúan de una
universidad, computadoras que no
requieren servicio de garantía.
O Una variable aleatoria de n individuos que

tiene que ser seleccionada y x es el numero
de éxitos en una muestra
O El estimador natural de p es ˆ = es la
fracción muestral de éxitos.
O La probabilidad de que el verdadero valor
del parámetro se encuentre en el intervalo
construido se denomina nivel de confianza,
y se denota 1- . La probabilidad de
equivocarnos se llama nivel de
significancia y se simboliza .
Generalmente se construyen intervalos con
confianza 1- =95%
O Donde zα/2 es el valor de una distribución Normal

estándar que deja a su derecha una probabilidad
de α/2 para un intervalo de confianza de (1 − α)
· 100 %.
O El articulo ¨Repeatability for pass/fail Data¨ reporto que
en n=48 ensayos e un laboratorio particular, 16 dieron
por resultado la ignición de un tipo particular de
sustrato por un cigarro encendido. Sea p la proporción a
largo plazo de tales ensayos que producirán ignición.
Una estimación puntual de p es ˆ =16/48 = 0.333. Un
intervalo de confianza para p con un nivel de confianza
de aproximadamente 95% es:
Datos
O n=48
O x=16
O p=16/48=0.333
O Nivel de confianza de 95%
( )( ) 2
O
2
O
O ( )
O Podemos decir que con el 95% de confianza que la

proporción de cigarrillos que producirán ignición se
encuentra entre 0.216 y 0.474
Ejercicio de Tarea
O De 1 500 personas encuestadas
en un sondeo preelectoral, 800
manifiestan su intención de
votar. ¿Entre qué valores puede
estimarse, con un 95% de
confianza, que se encontrará el
nivel de abstención en el
conjunto del censo?
Diccionario:
O Ignición: El conjunto de condiciones fisicas
(presión, temperatura) necesarias para que
la sustancia empiece a arder y se mantenga
la llama sin necesidad de añadir calor
exterior.
INTERVALO DE CONFIANZA SOBRE

LA DIFERENCIA EN DOS
PROPORCIONES
 Bibliografía:
 Libro Probabilidad y estadistica para

ingenieria y administración; 3ra Edición
 De William W. Hines y Douglas C.
Montgomery
FORMULA:
Despejando la formula nos queda:
Problema:
 Se considera cierto cambio en un proceso de
fabricación de partes componentes. Se toman
muestras del procedimiento existente y del nuevo
para determinar si este tiene como resultado una
mejora. Si se encuentra que 75 de 1500 artículos
del procedimiento actual son defectuosos y 80 de
2000 artículos del procedimiento nuevo también lo
son, encuentre un intervalo de confianza de 90%
para la diferencia real en la fracción de
defectuosos entre el proceso actual y el nuevo.
Ejercicio de tarea:
 Un artículo relacionado con la salud, reporta los
siguientes datos sobre la incidencia de disfunciones
importantes entre recién nacidos con madres
fumadoras de marihuana y de madres que no la
fumaban:
 Encuentre el intervalo de confianza del 99% para

la diferencia de proporciones.
2.4.6 INTERVALOS DE CONFIANZA
PARA LA VARIANZA
Si tenemos una muestra de tamaño n tomada de una población normal, podemos

obtener un intervalo de confianza del nivel dado (90%, 95%, 99%, etc) para la varianza
sabiendo que el valor de chi cuadrada es para este caso:
( ) 2
2
El cual es una variable aleatoria que tiene una distribución Chi cuadrada con n-1 grados
de libertad. Por lo tanto, podemos emplear esta definición para estimar un intervalo de
confianza ya que lo que necesitamos es que
2 2 1-
donde 2 es el valor de Chi cuadrada para los grados de libertad y nivel de confianza (1 -α)
especificado.
2
Entonces podemos despejar la varianza :
2
2 2
los valores de Chi cuadrada

2 2
2 2
Corresponden a lo que se muestra en la siguiente figura (notar que el valor mayor

define el límite de la izquierda del intervalo y el menor el derecho, ya que están
dividiendo)
EJEMPLO
En 16 recorridos de prueba, el consumo de gasolina de un motor
experimental tuvo una desviación estándar de 2.2. litros. Construir
un intervalo de confianza del 99% para la varianza y para la
desviación estándar esperadas de este motor.
2 ( ) 2
2
Podemos decir con un 99% de confianza que la varianza SE ENCUENTRA

ENTRE 2.21y 15.78 litros cuadrados, y su desviación estándar esta entre 1.49 y 3.97
litros.
EJERCICIO DE TAREA
En 15 recorridos de prueba, el consumo de luz eléctrica de un
aire acondicionado experimental tuvo una desviación estándar de
24volts. Construir un intervalo de confianza del 90% para la
varianza y para la desviación estándar esperadas de este motor.
UNIDAD III Pruebas de hipótesis
Introducción
Confiabilidad y significancia
Errores tipo I y tipo II
Potencia de la prueba
Formulación de Hipótesis estadísticas
Prueba de hipótesis para la diferencia de medias
Prueba de hipótesis para la proporción
Prueba de hipótesis para la diferencia de proporciones
Prueba de hipótesis para la varianza
Prueba de hipótesis para la relación de varianzas.
Introducción
1. ¿Qué es la Hipótesis?
La hipótesis es de suma importancia para el método científico, ya que esta nos va a ayudar a
proponer posibles soluciones para un problema determinado.
Hay muchas más definiciones de hipótesis, de las cuales mencionaré algunas a continuación:
a) Hipótesis, del griego hypo, debajo, inferior; thesis, posición o situación, es sinónimo de pos-
tulado.
Suposición de una cosa para sacar una consecuencia.
Exploración de datos vagos, inadecuados e indemostrables en forma objetiva.
Proposición que se puede someterse a prueba para determinar si es correcta o incorrecta.
b) Las hipótesis nos indican lo que estamos buscando o tratando de probar y pueden definirse
como explicaciones tentativas del fenómeno investigado formuladas a manera de proposicio-
nes.
Las hipótesis no necesariamente son verdaderas; pueden o no serlo, pueden o no compro-

barse con hechos. Son explicaciones tentativas, no los hechos en sí.
c) La hipótesis constituye una herramienta que nos ayuda a ordenar, estructurar y sistematizar
el conocimiento a través de una proposición,… la hipótesis implica una serie de conceptos,
juicios y raciocinios tomados de la realidad estudiada, que nos lleva a la esencia del conoci-
miento.
Puede considerarse a la hipótesis como un puente entre el conocimiento ya obtenido (conoci-

miento verificado) y el conocimiento nuevo (conocimiento por verificar).
d) es una conjetura, juicio o explicación preliminar de las causas o razones de un evento o

fenómeno que ya ha sucedido, que está sucediendo o que va a suceder.”
Estas definiciones tienen varios aspectos en común, para empezar todas concuerdan en que
son una proposición, con conceptos, juicios y raciocinios tomados de la realidad, es una expli-
cación preliminar, nos va a ayudar a ordenar, sistematizar y estructurar el conocimiento que
ya tenemos para poder saber que es lo que estamos buscando o tratando de probar, estas
pueden ser verdaderas o no, y es por eso que se van a someter a pruebas.
Todo lo anterior lo podemos reducir al siguiente concepto:
La hipótesis es una explicación preliminar en forma de proposiciones reales, lógicas y razona-

bles, que nos van a ayudar a ordenar, sistematizar y estructurar el conocimiento que ya tene-
mos, y a su vez a saber que es lo que estamos buscando o tratando de probar, esta será
sometida a pruebas para saber si es verdadera o no.
Una vez que ya hemos comprendido qué es una hipótesis, resulta necesario saber las carac-
terísticas de las mismas, las cuales serán tratadas en el siguiente tema.
2. Características de la hipótesis.
Los autores manejan varias características diferentes, las cuales mencionaremos a continua-
ción.
Las hipótesis deben referirse a una situación social real.
términos (variables) de la hipótesis tienen que ser comprensibles, precisos y lo más

concretos posible.
relación entre variables propuesta por una hipótesis debe ser clara y verosímil (lógica).
términos de la hipótesis y la relación planteada entre ellos, deben poder ser observados
y medidos, o sea tener referentes en la realidad.
hipótesis deben estar relacionadas con técnicas disponibles para probarlas.
expresión de hipótesis debe ser clara, esto se puede lograr por medio de definiciones
conceptuales y operacionales.
expresiones de hipótesis deben de ser libres de los valores propios del investigador.
Deben ser libres de cualquier sesgo.
en término de dirección y de la condición bajo la cual esas relaciones se mantienen.
hipótesis deben ser medibles, o sea, la evaluación de hipótesis depende de la existencia

de métodos para probarlas.
hipótesis deben de ser la transformación directa de las preguntas de la investigación.
… debe ser lógica y acorde con fenómenos conocidos, y puede aceptarse o rechazarse
por medio de estudios científicos de índole pertinente, sean clínicos, estadísticos, experimen-
tales de laboratorio o gabinete, etc. Otra característica es que debe coincidir con hechos
conocidos y no estar en conflicto con leyes o principios ya establecidos pues, de otro
modo tan sólo se estaría haciendo volar la imaginación en una esfera irreal o fuera del enten-
dimiento. Lo anterior no indica que deba seguirse un dogma; por el contrario, debe estar ba-
sada en fenómenos ya aceptados, o se estaría retrocediendo y la hipótesis tendría que ex-
presarse en un nivel retroactivo y obsoleto.
Conjuntando las anteriores y retroalimentando algunos aspectos, podemos decir que las ca-
racterísticas de las hipótesis son las siguientes:
 Deben referirse a una situación social real; esto es que debe ser racional, y sobre todo
que exista, sino estaríamos hablando de un mundo imaginario y de ensueño.
 Debe ser lógica y acorde con fenómenos conocidos y no estar en conflicto con leyes o
principios ya establecidos: Se refiere al principio de economicidad de la ciencia, el cual
nos dice que hay que retomar lo que ya esta aceptado para no tener que empezar desde
cero, y a su vez aportar algo.
 La relación entre variables propuesta por una hipótesis debe ser clara y verosímil (ló-
gica); Esto es que la hipótesis debe ser clara y creíble (Posteriormente veremos qué es
una variable).
 Los términos (variables) de la hipótesis tienen que ser comprensibles: Esto es que tenga
una adecuación entre la gente a la que será dirigida con el lenguaje utilizado en la pro-
posición.
 Las hipótesis deben de ser la transformación directa de las preguntas de la investiga-

ción: es decir, que estas nos ayudan a saber que es lo que buscamos y como lo busca-
mos.
 Las hipótesis deben ser medibles: Este punto es uno de los más importantes, pues
como ya se había dejado claro, las hipótesis deben ser comprobadas para poder llegar
a un conocimiento, y la única forma de poder probarlas, es que tengan la capacidad de
ser medibles.
 Las expresiones de hipótesis deben de ser libres de los valores propios del investigador:
Esto habla más que nada de que no debe haber subjetividad ni manipulación de hipó-
tesis por parte de quien la formula, sino por el contrario, que deben ser objetivas.
Las anteriores son las características que considero son las más relevantes de las hipótesis.
Como pudimos observar en la explicación de las características de las hipótesis, se maneja
mucho la palabra variable, pero ¿que es eso? Y ¿cuantos tipos hay?.
2.1 Que es una variable
Para poder explicar que es una variable, se procederá de la misma forma en la que se hizo
anteriormente, proporcionando varias definiciones:
Una variable es una propiedad que puede variar (adquirir diversos valores) y cuya variación es
susceptible de medirse… la variable se aplica a un grupo de personas u objetos, los cuales
pueden adquirir diversos valores respecto a la variable
“Las variables son características, atributos, rasgos, cualidades o propiedades que se dan en
individuos, grupos u objetos”
Con lo anterior y otros autores consultados, puedo concluir lo siguiente:
Las variables como su nombre lo indica, tienen la propiedad de adquirir diversos valores,
mismos que pueden medirse, y aplicarse a personas u objetos, los cuales por sus caracterís-
ticas, atributos, rasgos, cualidades, etc., pueden adquirir diversos valores respecto a otras.
Para poder comprender de mejor forma todo lo planteado anteriormente vamos a explicar los
tipos de hipótesis.
2.2 Tipos de Hipótesis
Debido a las diversas clasificaciones de hipótesis, en este caso nos basaremos a la proporcio-
nada por Roberto Hernández Sampieri, ya que es la que satisface de mejor forma nuestras
necesidades.
1. Hipótesis de investigación: son aquellas proposiciones acerca de las posibles relaciones

entre dos o más variables y que cumplen con las características ya mencionadas anterior-
mente, se simbolizan como Hi o Ha, H1, H2, etc.
1.1 Hipótesis descriptivas: Se utilizan a veces en estudios descriptivos, son afirmaciones más
generales, y pueden involucrar una variable, dos o más variables.
1.2 Hipótesis Correlaciónales: Corresponden a los estudios correlaciónales y pueden estable-

cer la asociación entre dos o más variables, y también como lo están. Alcanzan el nivel predic-
tivo y parcialmente explicativo. El orden en que coloquemos las variables no es importante.
1.3 Hipótesis de la diferencia de grupos: Se formulan en investigaciones dirigidas a comparar

grupos. Cuando el investigador no tiene bases para presuponer a favor de que grupo será la
diferencia, formula una hipótesis simple de diferencia de grupos, y cuando si tiene bases, es-
tablece una hipótesis direccional de diferencia de grupos.
Las hipótesis de diferencia de grupos pueden formar parte de estudios correlaciónales si úni-
camente establecen que hay diferencia entre los grupos, pero si además de establecer tales
diferencias explican el porqué de las mismas, entonces son hipótesis de estudios explicativos.
1.4 Hipótesis que establecen relaciones de causalidad: No solo afirman las relaciones entre
dos o más variables y como se dan esas relaciones, sino que además proponen un sentido de
entendimiento de ellas, todas estas establecen relaciones de causa-efecto. Estas a su vez se
clasifican en: 1.4.1) Causales divariadas: En estas se plantea una relación entre una variable
dependiente y una independiente. 1.4.2) Causales multivariadas: Plantean una relación entre
varias variables independientes y una dependiente, o una independiente y varias dependien-
tes, o varias variables independientes y varias dependientes.
2. Hipótesis nulas: Estas son lo contrario de las hipótesis de investigación, también constituyen
proposiciones acerca de la relación entre variables, solamente sirven para refutar o negar lo
que afirma la hipótesis de investigación, se clasifican en: 2.1) hipótesis nulas descriptivas de
una variable, 2.2) hipótesis que niegan o contradicen la relación entre dos o más variables,
2.3)hipótesis que niegan que haya diferencia entre grupos que se comparan, 2.4)hipótesis que
niegan la relación de causalidad entre dos o más variables.
3. Hipótesis alternativas: Son posibilidades alternativas ante las hipótesis de investigación y

nula. Ofrecen otra descripción, explicaciones distintas a las que proporcionan los ya mencio-
nados tipos de hipótesis, estas sólo pueden formularse cuando efectivamente hay otras posi-
bilidades adicionales a las hipótesis de investigación y nula.
4. Hipótesis estadísticas: Son la transformación de las hipótesis de investigación, nulas y al-

ternativas en símbolos estadísticos. Se pueden formular solamente cuando los datos del estu-
dio que se van a recolectar y a analizar para probar las hipótesis son cuantitativos, hay tres
tipos de estas hipótesis: 4.1) De estimación: son las descriptivas de una variable que se va a
observar en un contexto, diseñadas para evaluar la suposición de un investigador respecto al
valor de alguna característica de una muestra de individuos u objetos, o de una población, y
se basan en información previa. 4.2) Estadísticas de correlación: El sentido de estas es el de
traducir una correlación entre dos o más variables en términos estadísticos. 4.3) De la diferen-
cia de medias u otros valores: En estas se compara una estadística entre dos o más grupos.
Una vez que ya comprendimos de forma adecuada los tipos de hipótesis y cuantas variables
involucran, ahora hablaremos de las características de los cuatro niveles de investigación.
3. Características de los cuatro niveles de investigación.
Para empezar es importante definir cuáles son estos cuatro niveles; son el Exploratorio, Des-
criptivo, Correlacional, y Explicativo.
1) Exploratorio: Su objetivo principal es captar una perspectiva general del problema, se efec-
túa normalmente cuando el objetivo es examinar un tema o problema de investigación poco
estudiado o que no ha sido abordado con anterioridad. Identifican relaciones potenciales entre
variables y establecen el tono de investigaciones posteriores más rigurosas. Se caracterizan
por ser más flexibles en su metodología en comparación con los estudios descriptivos o expli-
cativos, además son más amplios y dispersos que estos otros dos tipos.
2) Estudios descriptivos: Buscan especificar las propiedades importantes de personas, grupos

comunidades o cualquier otro fenómeno que sea sometido análisis, es decir, buscan saber
quién, dónde, cuándo, cómo y porqué del sujeto de estudio, y principalmente miden o evalúan
diversos aspectos, dimensiones o componentes del fenómeno o fenómenos a investigar. En
un estudio descriptivo se selecciona una serie de cuestiones y se mide cada una de ellas
independientemente, para así describir lo que se investiga. La investigación descriptiva re-
quiere de un considerable conocimiento del área que se investiga para formular las preguntas
específicas que busca responder, se basa en la medición de uno o más atributos del fenómeno
descrito. Pueden ofrecer la posibilidad de predicciones rudimentarias.
3) Estudios Correlaciónales: Estos tienen como propósito medir el grado de relación que exista
entre dos o más conceptos o variables. La utilidad y el propósito principal de los estudios co-
rrelaciónales son saber cómo se puede comportar un concepto o variable conociendo el com-
portamiento de otra u otras variables relacionadas. En el caso de que dos variables estén
correlacionadas, esto significa que una varía cuando la otra también lo hace, puede ser positiva
o negativa, si es positiva quiere decir que sujetos con altos valores en una variable tenderán a
mostrar altos valores en la otra variable. Si dos variables están correlacionadas y se conoce la
correlación, se tiene bases para predecir con mayor o menor exactitud el valor aproximado que
tendrá un grupo de personas en una variable, sabiendo que valor tienen en la otra variable.
Estos se distinguen de los descriptivos ya que en vez de medir con presicion las variables
individuales, evalúan el grado de relación entre dos variables. Al saber que dos conceptos o
variables están relacionados se aporta cierta información explicativa.
4) Estudios explicativos: Los estudios explicativos van más allá de la descripción de conceptos
o fenómenos, o del establecimiento de relaciones entre conceptos, están dirigidos a responder
las causas de los eventos físicos o sociales, su interés se centra en explicar por que ocurre un
fenómeno y en qué condiciones se da este, o porque dos o más variables están relacionadas.
Estos son más estructurados que las demás clases de estudios y de hecho implican los pro-
pósitos de ellos, además de que proporcionan un sentido de entendimiento del fenómeno a
que hacen referencia, hay además un cierto valor explicativo.
4. Cuadro comparativo
En este momento que ya sabemos lo básico de los tipos de investigación, las hipótesis, y las
variables, entonces podemos concluir con el siguiente cuadro comparativo:
Tipo de inves-
Hipótesis Ejemplos
tigación
Exploratorio No hay …………….
Descriptiva de 2 o *El número de personas en la ciudad de México va a au-

Descriptivo
más variables mentar 4 millones.
*La inteligencia, la memoria y las calificaciones obteni-

Correlaciónales de 2
Correlacional das están relacionadas con el grado de estudio de las
o más variables.
personas
*A mayor exposición por parte de los niños a escenas

Descriptiva y/o Co-
Explicativa con alto contenido de violencia, mayor manifestación de
rrelacional
agresividad presentaran.
*Durante el año el 20% de niños que están expuestos a
escenas con alto contenido de violencia serán más
agresivos
Estadísticamente una prueba de hipótesis es cualquier afirmación acerca de una población y/o
sus parámetros.
Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste invo-
lucra la toma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una
hipótesis en favor de la otra. Una hipótesis estadística se denota por “H” y son dos:
- Ho: hipótesis nula

- H1 o Ha: hipótesis alternativa
Errores de Tipo I y de Tipo II
Las hipótesis nula y alternativa son aseveraciones sobre la población que compiten entre sí. O
la hipótesis nula H0 es verdadera, o lo es la hipótesis alternativa Ha, pero no ambas. En el
caso ideal, el procedimiento de prueba de hipótesis debe conducir a la aceptación de H0
cuando sea verdadera y al rechazo de H0 cuando Ha sea verdadera. Desafortunadamente no
siempre son posibles las conclusiones correctas. Como las pruebas de hipótesis se basan en
información de muestra, debemos considerar la posibilidad de errores.
Condición de la población
H0 verdadera Ha verdadera
Aceptar H0 Conclusión correcta Error de tipo II
Conclusión
Rechazar H0 Error de tipo I Conclusión correcta

Esta tabla muestra los dos tipos de errores que se pueden cometer en la prueba de hipótesis.
El primer renglón muestra lo que puede suceder cuando la conclusión es aceptar H0. Si H0 es
verdadera, esta conclusión es correcta. Sin embargo, si Ha es verdadera, hemos cometido un
error de tipo II, es decir, hemos aceptado H0 siendo falsa. El segundo renglón muestra lo que
puede suceder cuando la conclusión es rechazar H0. Si H0 es verdadera, hemos cometido un
error de tipo I, es decir, rechazar H0 cuando es verdadera. Sin embargo, si Ha es verdadera,
es correcto rechazar H0.
Si bien no se puede eliminar la posibilidad de errores en la prueba de hipótesis, sí podemos

considerar la probabilidad de su ocurrencia. Se usa la siguiente notación estadística normal
para indicar las probabilidades de cometer esos errores:
α = probabilidad de cometer un error de tipo I.
β = probabilidad de cometer un error de tipo II.
POTENCIA DE UN CONTRASTE.
La Potencia de una prueba β representa la probabilidad de que la hipótesis nula no sea recha-
zada cuando de hecho es falsa y debería rechazársele. La potencia de prueba 1-β representa
la sensibilidad de la prueba estadística para detectar cambios que se presentan al medir la
probabilidad de rechazar la hipótesis nula cuando de hecho es falsa y debería ser rechazada.
La potencia de prueba estadística depende de qué tan diferente en realidad es la media ver-
dadera de la población del valor supuesto. Una prueba de un extremo es más poderosa que
una de dos extremos, y se debería utilizar siempre que sea adecuado especificar la dirección
de la hipótesis alternativa. Puesto que la probabilidad de cometer un error tipo I y la probabili-
dad de cometer un error tipo II tienen una relación inversa y esta última es el complemento de
la potencia de prueba (1-β), entonces α y la potencia de la prueba varían en proporción directa.
Un aumento en el valor del nivel de significación escogido, tendría como resultado un aumento
en la potencia y una disminución en α tendría como resultado una disminución en la potencia.
Un aumento en el tamaño de la muestra escogida tendría como resultado un aumento en la
potencia de la prueba, una disminución en el tamaño de la muestra seleccionada tendría como
resultado una disminución en la potencia.
Partes de una hipótesis:
1. Datos
2. Establecimiento de las hipótesis ( H0: , Ha: )
3. Estadístico de prueba (z, t, χ2, F)
4. Región de rechazo (curva a utilizar)
RR RNR RR
RR RNR
RNR RR
RNR RR
5. Criterio de decisión (establecemos con qué estadístico estamos trabajando):

Si Ɩ Ec Ɩ > Ɩ Et Ɩ se rechaza H0, de otra manera no se rechaza (para z o t)
Ec : estadístico calculado
Et : estadístico de tablas
6. Cálculos (z, t, 2, F)
7. Decisión (“se rechaza” o “no se rechaza”)
8. Conclusión:
- Cuando la prueba cae en la RNR: “No existe suficiente evidencia estadística para decir
(lo que la hipótesis alternativa está aseverando), con un o nivel de significancia de .....”
- Cuando la prueba cae en la RR: “Existe suficiente evidencia estadística para decir (lo
que la hipótesis alternativa está aseverando), con un o nivel de significancia de .....”
PRUEBA DE HIPÓTESIS PARA LA MEDIA.
Cuando se van a realizar pruebas de hipótesis relativas a la media poblacional µ se debe saber
si la varianza poblacional σ² es conocida o desconocida, ya que la distribución subyacente al
estadístico de prueba será la normal estándar si la varianza es conocida, y la distribución t en
caso contrario.
Las diferentes hipótesis que se pueden presentar son las siguientes:
1) Ho: µ ≤µ0
H1: µ > µ0 unilaterales
2) Ho: µ≥ µ0
H1: µ < µ0
3) Ho: µ = µ0 bilateral
H1: µ ≠µ0
Las pruebas de hipótesis para la media se basan en el estadístico dado por la media muestral
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad
Ejemplo
H0: µ = 200
H1: µ ≠ 200
b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤
H0: µ ≥ 200 H0: µ ≤ 200
H1: µ < 200 H1: µ > 200
Prueba de hipótesis para la media con varianza conocida
Cuando la varianza σ² es conocida, las pruebas de hipótesis se basan en el hecho de que la
variable aleatoria Z definida como , se distribuye normalmente con media cero y va-
rianza unitaria.
Ejemplo:
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma apro-
ximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Si
una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas, ¿muestran los
datos suficiente evidencia para decir que la duración media ha cambiado? Utilice un nivel de
significancia del 0.04.
Datos:
 =800 horas
σ= 40 horas
x = 788 horas
n = 30
∞= 0.04
Hipótesis
Ho; µ= 800 horas
Ha; µ≠800 horas
Estadístico de prueba:
Regla de Decisión:
Si |Zc| > |Zt| se rechaza H0 de otra manera no se rechaza
Cálculos:
Decisión:
Como –2.05<-1.643<2.052 por lo tanto, no se rechaza Ho y se concluye con un nivel de signi-

ficancia del 0.04 que la duración media de los focos no ha cambiado.
Conclusión:
No existe suficiente evidencia estadística para decir que la duración media de focos sea dife-
rente de 800 horas, con un nivel de significancia de 0.04.
Ejemplo:
Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra
una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años,
¿esto parece indicar que la vida media hoyen día es mayor que 70 años? Utilice un nivel de
significancia de 0.05.
Datos:
 =70 años
σ= 8.9 años
x = 71.8 años
n = 100
∞= 0.05
Hipótesis
Ho; µ≤70 años.
Ha; µ> 70 años.
Región de rechazo:
Regla de decisión:
Si |Zc|>|Zt| se rechaza Ho de otra manera no

se rechaza
Cálculos:
Decisión.
Como 2.02 >1.645 se rechaza Ho
Conclusión:
Existe suficiente evidencia estadística para decir que la vida media hoy en día es mayor que
70 años. Con un nivel de significancia de 0.05.
También se utiliza la Z cuando el tamaño de la muestra es mayor o igual que 30.
Ejemplo:
La producción diaria en una planta industrial química registrada durante 50 días tiene una me-
dia y desviación de 871 toneladas y 21 toneladas respectivamente. Pruebe la hipótesis de que
el promedio de la producción diaria del producto químico es de 880 toneladas por día, contra
la alternativa de que es diferente a esa cantidad.
1. DATOS
n = 50
µ= 871 ton.
s = 21 ton.
∞= 0.05
2. HIPÓTESIS
H0: µ = 880 ton.
Ha: µ≠ 880 ton.
3. ESTADÍSTICO DE PRUEBA
4. REGIÓN DE RECHAZO
/2
/2
- Zt Zt
RR RNR RR
5. CRITERIO DE DECISIÓN
Si Ɩ Zc Ɩ>Ɩ Zt Ɩ se rechaza Ho de otra manera no se rechaza
6. CÁLCULOS
= 871 - 880 = -3.03

21/ / 50
7. DECISIÓN
/2
/2
- -3.03

- 1.96 1.96
RR RNR RR
se rechaza Ho
8. CONCLUSIÓN
Existe suficiente evidencia estadística para decir que el promedio de producción diaria del pro-
ducto químico es diferente de 880 toneladas con un de 0.05.
PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL, VA-

RIANZA DESCONOCIDA
Ciertamente sospechamos que las pruebas sobre una media poblacional con descono-
cida, debe incluir el uso de la distribución t de Student. La estructura de la prueba es idéntica
a la del caso de conocida, con la excepción de que el valor en la estadística de prueba

se reemplaza por la estimación de s calculada y la distribución normal estándar se reemplaza
con una distribución t.
Ejemplos:
El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-hora que gastan varios
aparatos electrodomésticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatt-
hora al año. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado
indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al año con una desviación
estándar de11.9 kilowatt-hora, ¿esto sugiere con un nivel de significancia de 0.05 que las as-
piradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente? Suponga que la po-
blación de kilowatt-hora es normal.
Solución:
Datos:
= 46 kilowatt-hora
s= 11.9 kilowatt-hora
= 42 kilowatt-hora
n = 12
= 0.05
Hipótesis
Ho; ≥46 kilowatt-hora
H1; < 46 kilowatt-hora
Región de rechazo
Regla de decisión:
Si |tc| |tt se rechaza Ho de otra manera no se rechaza
Cálculos:
Decisión:
Como –1.16 > -1.796, por lo tanto no se rechaza Ho
Conclusión:
No existe suficiente evidencia estadística para decir que las aspiradoras gastan en prome-
dio menos de 46 kw.-hr con un α= 0.05.
Ejemplo:
Un artículo publicado en la revista Materials Engineering describe los resultados de pruebas

de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga para la que
cada espécimen falla es la siguiente en MPa:
19.8 18.5 17.6 16.7 15.8
15.4 14.1 13.6 11.9 11.4
11.4 8.8 7.5 15.4 15.4

19.5 14.9 12.7 11.9 11.4
10.1 7.9
¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase
que la carga donde se presenta la falla tiene una distribución normal, y utilícese =
0.05.
Solución:
Datos:
= 10
s = 3.55
= 13.71
n = 22
= 0.05
Hipótesis
Ho; ≤10Mpa
H1; > 10Mpa
Estadístico de prueba
Región de rechazo
Regla de decisión:
Si |tc| > | tt | se rechaza H0 de otra manera no se rechaza.
Cálculos:
Decisión.
Como 4.90 >1.721 se rechaza Ho.
Conclusión:
Existe suficiente evidencia estadística para decir que la carga promedio de falla es mayor
que 10Mpa con un α =0.05.
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS
Cuando se van a realizar pruebas de hipótesis relativas a la diferencia entre dos medias po-
blacionales µ1 - µ2 se debe saber si las varianzas poblacionales son conocidas o des-

conocidas, ya que la distribución subyacente al estadístico de prueba será la normal estándar
si las varianzas son conocidas, y la distribución t en caso contrario. Además, si las varianzas
son desconocidas, se debe saber (verificar) si éstas son iguales o diferentes.
Las diferentes hipótesis que se pueden presentar son las siguientes:
1) Ho: µ1 - µ2 ≥ do
H : µ1 - µ2 < d0
2) Ho: µ1 - µ2 ≤ do
Ha: µ1 - µ2 > do
3) Ho: µ1- µ2 = do
Ha: µ1 - µ2 ≠ do
Donde d0 toma por lo general el valor de cero.
Las pruebas de hipótesis para la diferencia de medias se basan en el estadístico dado por la
diferencia entre las medias muestrales cuya distribución tiende a la distribución normal
si las dos poblaciones son normales, o aproximadamente normal si cumple con las condiciones
del teorema del limite central, es decir,
para muestras grandes.
Por lo tanto,
Prueba de hipótesis para la diferencia de medias con varianzas conocidas
El estadístico de prueba está dado:

Ejemplo:
Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura

tapaporos. Se prueban dos fórmulas de pintura; la fórmula 1 tiene el contenido químico están-
dar, y la fórmula 2 tiene un nuevo ingrediente secante que debe reducir el tiempo de secado.
De la experiencia se sabe que la desviación estándar del tiempo de secado es ocho minutos,
y esta variabilidad inherente no debe verse afectada por la adición del nuevo ingrediente. Se
pintan diez especímenes con la fórmula 1, y otros diez con la fórmula 2. Los dos tiempos pro-
medio de secado muestrales son 121 min. y 112 min. respectivamente. ¿A qué conclusiones
puede llegar el diseñador del producto sobre la eficacia del nuevo ingrediente, utilizando =
0.05?
Datos:
1= 2= 8
n1=n2= 10
= 0.05
Hipótesis
Ho; 1- 2 ≤0
Ha; 1- 2 >0
Se desea rechazar Ho que es la idea del fabricante es que el tiempo de secado del nuevo
producto es menor que el del anterior, por eso la H a se pone la diferencia mayor a cero o sea
positiva para poder probar que 2 es menor que 1.
Región de rechazo
Regla de decisión:
Si |Zc|>|Zt| se rechaza Ho de otra manera no se rechaza.
Cálculos:
Decisión:
Puesto que 2.52>1.645, se rechaza Ho,
Conclusión
Existe suficiente evidencia estadística para decir que el promedio se secado de la pintura an-
terior es mayor que el de la nueva pintura con un α=0.05.
Ejemplo:
Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto de 16.0 onzas.
Las distribuciones de los volúmenes de llenado pueden suponerse normales, con desviaciones
estándar 1= 0.020 y 2 = 0.025 onzas. Un miembro del grupo de ingeniería de calidad

sospecha que el volumen neto de llenado de ambas máquinas es el mismo, sin importar si éste
es o no de 16 onzas. De cada máquina se toma una muestra aleatoria de 10 botellas. ¿Se
encuentra el ingeniero en lo correcto? Utilice = 0.05
MAQUINA 1 MAQUINA 2
16.03 16.01 16.02 16.03
16.04 15.96 15.97 16.04
16.05 15.98 15.96 16.02
16.05 16.02 16.01 16.01
16.02 15.99 15.99 16.00
Datos:
1= 0.020
2= 0.025
n1=n2 = 10
= 0.05
Hipótesis
Ho; 1- 2 =0
H1; 1- 2 0
Región de rechazo
Regla de Decisión:
Si |Zc| > |Zt| se rechaza Ho de otra manera no se rechaza.
Cálculos:
Decisión:
Como –1.96 0.987 1.96 entonces no se rechaza Ho
Conclusión
No existe suficiente evidencia estadística para decir que el promedio de llenado de la ma-
quina 1 sea diferente al de la maquina 2 con un α=0.05.
Prueba de hipótesis para la diferencia de medias con varianzas desconocidas pero igua-
les
Como ya se mencionó, cuando las varianzas son desconocidas, se debe verificar previamente
si éstas son iguales o diferentes, lo cual puede realizarse mediante una prueba de hipótesis
con respecto a la igualdad de dos varianzas, la cual se analizará posteriormente.
Cuando las varianzas son iguales el estadístico de prueba bajo la hipótesis nula está dado
por:
tn, donde n = n1 +n2 -2

Ejemplo
Para encontrar si un nuevo suero detiene la leucemia, se seleccionan nueve ratones, todos
con una etapa avanzada de la enfermedad. Cinco ratones reciben el tratamiento y cuatro no.
Los tiempos de sobrevivencia en años, a partir del momento en que comienza el experimento
son los siguientes:
Con Tratamiento 2.1 5.3 1.4 4.6 0.9
Sin Tratamiento 1.9 0.5 2.8 3.1
¿Se puede decir en el nivel de significancia del 0.05 que el suero es efectivo? Suponga que
las dos poblaciones se distribuyen normalmente con varianzas iguales.
Datos:
Con tratamiento
s= 1.97
n=5
Sin tratamiento
s = 1.1672
n=4
Hipótesis
Ho; CT- ST=0
H1; CT- ST >0
Región de rechazo
Regla de decisión:
Si la |tc| ≥ |tt| se rechaza Ho de otra manera no se rechaza.
Cálculos:
por lo tanto sp = 1.848
Decisión
No se rechaza H0
Conclusión
No existe suficiente evidencia estadística para decir que el promedio de sobrevivencia de los
ratones con tratamiento se mayor que el promedio de sobrevivencia de los ratones sin trata-
miento con un α= 0.05.
Ejemplo
Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano
para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada
medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente.
Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en
minutos que tardó en alcanzar un nivel específico en la sangre. Calcule con = 0.05 si existe
diferencia entre los tiempos promedio y obtenga el valor de P. Suponga varianzas iguales.
Medicamento A Medicamento B
nA = 12 nB = 12
SA2= 15.57 SB2 = 17.54
Hipótesis
Ho; B- A=0
H1; B- A 0
Región de rechazo
Criterio de decisión:
Cálculos:
Decisión
Se rechaza H0
Conclusión
Existe suficiente evidencia estadístico para decir que el promedio de absorción del cuerpo hu-
mano para el fármaco B es diferente al promedio de absorción del fármaco A con un α=0.05.
Prueba de hipótesis para la diferencia de medias con varianzas desconocidas y dife-

rentes
Cuando las varianzas son desconocidas y diferentes el estadístico de prueba bajo la hipóte-
sis nula está dado por:
Ejemplo
Un fabricante de monitores prueba dos diseños de microcircuitos para determinar si produ-

cen un flujo de corriente equivalente. El departamento de ingeniería ha obtenido los datos si-
guientes:
Diseño 1
n1 = 16
s12 = 10
Diseño 2
n2 = 10
s22 = 40
Con = 0.05, se desea determinar si existe alguna diferencia significativa en el flujo de co-
rriente promedio entre los dos diseños, donde se supone que las dos poblaciones son nor-
males, pero no es posible suponer que las varianzas desconocidas sean iguales.
Datos
En la tabla
Hipótesis
Ho; 1- 2=0
H1; 1- 2 0
Región de rechazo
Regla de decisión
Cálculos:
Decisión
No se rechaza H0
Conclusión
No existe suficiente evidencia estadística para decir que lor promedios de flujo de corriente
de los dos diseños de microcircuitos son diferentes con un α=0.05.
Ejemplo
Dos proveedores fabrican un engrane de plástico utilizado en una impresora láser. Una carac-
terística importante de estos engranes es la resistencia al impacto la cual se mide en pies-
libras. Una muestra aleatoria de 10 engranes suministrados por el primer proveedor arroja los
siguientes resultados: y s1 = 12. Del segundo proveedor se toma una muestra aleatoria
de 16 engranes, donde los resultados son y s2 = 45. ¿Existe evidencia que apoye la
afirmación de que los engranes del proveedor 2 tienen una mayor resistencia promedio al im-
pacto. Use un nivel de significancia de 0.05
Datos:
Proveedor 1 Proveedor 2
n1 = 10 n2 = 16
S1= 12 S2 = 45
Hipótesis
Ho; 2- 1=0
H1; 2- 1 >0
Región de rechazo
Regla de decisión
Cálculos:
Decisión
Se rechaza H0
Conclusión
Existe suficiente evidencia estadística para decir que la resistencia promedio al impacto de
los engranes es mayor en el proveedor 2 que el proveedor 1 con un α=0.05.
Prueba De Hipótesis Para Proporciones
El concepto de prueba de hipótesis se puede utilizar para probar hipótesis en relación con
datos cualitativos. Por ejemplo, en un problema, el gerente de una fábrica de llantas quería
determinar la proporción de llantas que se reventaban antes de 10,000 millas. Este es un ejem-
plo de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la propor-
ción de los valores que tienen una característica particular.
El gerente de la fábrica de llantas quiere que la calidad de llantas producidas, sea lo bastante
alta para que muy pocas se revienten antes de las 10,000 millas. Si más de un 8% de las
llantas se revientan antes de las 10,000 millas, se llegaría a concluir que el proceso no funciona
correctamente. Aquí la proporción de llantas defectuosas es de P=0.08
El estadístico de prueba se transforma a:
Ejemplo
Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se
construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación si
una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bom-
bas de calor? Utilice un nivel de significancia de 0.10
Datos:
P= 0.70
p = 8/15 = 0.5333
n = 15
= 0.10
Hipótesis
Ho; P = 0.70
H1; P 0.70
Región de rechazo
Criterio de decisión
Si |zc| > |zt| se rechaza H0 de otra menara no se rechaza.
Cálculos
Decisión
No se rechaza H0
Conclusión
No existe suficiente evidencia estadística para decir que la proporción de casas en las que se
instalan bombas de calor sea diferente de 0.70 con un α=0.10.
Ejemplo
Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de

motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos en
uno de los pasos de manufactura críticos no sea mayor que 0.05, y que el fabricante demuestre
esta característica del proceso de fabricación con este nivel de calidad, utilizando = 0.05.
El fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra
que cuatro de ellos son defectuosos. ¿El fabricante puede demostrar al cliente la calidad del
proceso?
Datos:
P= 0.05
p = 4/200 = 0.02
n = 200
= 0.05
Hipótesis
Ho; P ≥ 0.05
H1; P < 0.05

Regla de decisión:
Cálculos
Decisión
Se rechaza H0
Conclusión
Existe suficiente evidencia estadística para decir que la proporción de controladores defectuo-
sos es menor que 0.05 con un α=0.05.
Pruebas de hipótesis para la diferencia de dos proporciones P1-P2
Suponga que se tienen dos poblaciones provenientes de ensayos de Bernoulli, con proporcio-
nes respectivas de P1 y P2 desconocidas, y deseamos verificar si dichas proporciones son
iguales o no, y queremos verificarlo mediante una prueba de hipótesis. En este caso las hipó-
tesis planteadas podrían ser las siguientes:
1) Ho:P1 - P2 ≥ 0
H1: P1 - P2 < 0
2) Ho:P1 - P2 ≤ 0
H1: P1 - P2 > 0
3) Ho:P1 - P2 = 0
H1: 1 - P2 ≠ 0
Para probar las anteriores hipótesis, se toman dos muestras de tamaños respectivos n 1 y n2.
Sea X1 el número de eventos observado en una primera muestra de tamaño n 1, y sea X2 el
número de eventos observados en la otra muestra de tamaño n2. Tanto X1 como X2 son varia-
bles aleatorias binomiales independientes con parámetros (n1 2
1 = X1/n1 y
P2 = X2/n2 son estimadores independientes de q1 y q2, respectivamente, y tienden a distribuirse
normalmente. Si los tamaños de muestra son suficientemente grandes, la siguiente estadística
tiene una distribución que es aproximadamente normal estándar.
Ejemplo
Se tomará el voto entre los residentes de una ciudad y el condado circundante para determinar
si se debe construir una planta química propuesta. El lugar de construcción está dentro de los
límites de la ciudad y por esta razón muchos votantes del condado consideran que la propuesta
pasará debido a la gran proporción de votantes que favorecen la construcción. Para determinar
si hay una diferencia significativa en la proporción de votantes de la ciudad y votantes del
condado que favorecen la propuesta, se realiza una encuesta. Si 120 de 200 votantes de la
ciudad favorecen la propuesta y 240 de 500 residentes del condado también lo hacen, ¿estaría
de acuerdo en que la proporción de votantes de la ciudad que favorecen la propuesta es más
alto que la proporción de votantes del condado? Utilice un nivel de significancia de 0.025.
Datos:
p1= 120/200= 0.60
p2 = 240/500= 0.48
n1 = 200
n2 = 500
Hipótesis:
Ho; P1-P2 ≤0
H1; P1-P2 > 0

Región de rechazo
Cálculos:
Z=. (0.60 – 0.48) – 0 . = 0.12 . = 2.911

[(0.60)(0.40) / 200] + [(0.48)(0.52) / 500] 0.0412
Decisión
Se rechaza H0
Conclusión
Existe suficiente evidencia estadística para decir que la proporción de votantes de la ciudad
que favorecen la propuesta es mayor que la proporción de votantes del condado que también
están a favor de que se construya la planta química con un de 0.025.
Ejemplo:
En un estudio sobre la fertilidad de mujeres casadas para la oficina de censos se seleccionaron

al azar dos grupos de esposas con edades de 25 a 29 años sin hijos y a cada mujer se le
preguntó si planeaban tener un hijo. Se seleccionó un grupo entre las mujeres con menos de
2 años de casadas y otro entre las que tenían 5 años de casadas. Suponga que 240 de 300
con menos de 2 años de casadas planean tener algún día un hijo, comparadas con 288 de 400
con 5 años de casadas. ¿Podemos concluir que la proporción de mujeres con menos de 2
años de casadas que planean tener un hijo es significativamente mayor que la proporción con
5 años de casadas?
Datos
n1 = 300 n2 = 400
x1 = 240 x2 = 288
^ ^
p1 = 240 / 300 = 0.80 p2 = 288 / 400 = 0.72
^
^ 1 = 0.20
q q2 = 0.28
∞= 0.05
Hipótesis
H0: P1 ≤ P2
Ha: P1 > P2
Región de rechazo
RNR Zt RR
Regla de decisión
Si Ɩ Zc Ɩ > Ɩ Zt Ɩ se rechaza H0, de otra manera no se rechaza
CÁLCULOS
Z=. (0.80 – 0.72) – 0 . = 0.08 . = 2.483

[(0.80)(0.20) / 300] + [(0.72)(0.28) / 400] 0.0322
Decisión
2.483


1.645
RNR RR
se rechaza H0
Conclusión
Existe suficiente evidencia estadística para decir que la proporción de mujeres con menos de
2 años de casadas que planean tener un hijo es mayor que la proporción de mujeres con 5
años de casadas que planean lo mismo con un ∞ de 0.05.
PRUEBA DE HIPÓTESIS PARA LA VARIANZA
Si la varianza σ² de una población normal es desconocida, y queremos verificar si es igual o

no a determinado valor, podemos plantear las siguientes pruebas:
, , .
S², y la variable aleatoria

asociada con el estadístico es la distribución chi cuadrado, definida como:
Si X1, X2, Xn es una muestra aleatoria de tamaño n tomada de una población normal, y si S²
es la varianza muestral, entonces el estadístico de prueba bajo H0 se calcula como:
Debe tenerse en cuenta que como la distribución chi cuadrado no es simétrica, entonces las
regiones de críticas deben calcularse por separado para cada tipo de prueba.
El criterio de decisión es el siguiente: Rechace la hipótesis nula H0 si:
· cuando la hipótesis alternativa sea
· cuando la hipótesis alternativa sea
· cuando la hipótesis alternativa sea , o equivalentemente
se acepta la hipótesis nula si:
Ejemplo
Un fabricante de baterías para autos afirma que la duración de sus baterías se distribuye de
forma aproximadamente normal con una desviación estándar de 0.9 años. Si una muestra
aleatoria de 10 de tales baterías tiene una desviación estándar de 1.2 años, ¿considera que σ
es mayor que 0.9 años? Utilice un nivel de significancia de 0.05.
Datos
n = 10
s = 1.2
∞ = 0.05
Hipótesis
H0: σ ≤ 0.9 años

Ha: σ > 0.9 años
σ2 = (n – 1) s2
σ2
Región de rechazo
2
RNR RR
Si χ2c > χ2t se rechaza H0, de otra manera no se rechaza

Cálculos
χ2 = (10 – 1) (1.2)2 = 12.96 = 16

(0.9)2 0.81
Decisión


16.919
16
RNR RR
No se rechaza H0
Conclusión
No existe suficiente evidencia estadística para decir que la desviación estándar de la duración
de las baterías para autos de cierto fabricante es mayor que 0.9 años con un de 0.05.
Ejemplo
Se sabe que el volumen de un lubricante particular se distribuye normalmente con una varianza
de 0.03. Pruebe la hipótesis de que σ2 es igual a 0.03 contra la alterna de que es diferente,
para una muestra aleatoria de 10 envases con una desviación estándar de 0.2458. Utilice un
nivel de significancia de 0.01.
Datos
n = 10
s = 0.2458
s2 = 0.0604
∞ = 0.01
Hipótesis
H0: σ2 = 0.03
Ha: σ2 ≠ 0.03
χ2 = (n – 1) s2
σ2
Región derechazo
/2
/2
21-/2 2/2
RR RNR RR
Si χ21-α/2 < χ2c o > χ2α/2 se rechaza H0, de otra manera no se rechaza
Cálculos
χ2 = (10 – 1) (0.0604) = 0.5636 = 18.12

(0.03) 0.03
Decisión
/2
/2

20.0995 , 9 18.12 20.005, 9
1.735 23.589
RR RNR RR
no se rechaza H0
CONCLUSIÓN
No existe suficiente evidencia estadística para decir que la varianza del volumen de un lubri-
cante particular es diferente de 0.03 con un α de 0.01.
PRUEBA DE HIPÓTESIS PARA RELACIÓN DE VARIANZAS
Se tienen dos poblaciones normales e independientes con varianzas desconocidas σ²1 y σ²2,
respectivamente, y se desea verificar la hipótesis de que las varianzas son iguales contra una
hipótesis alternativa de que son diferentes.
Para verificar las hipótesis anteriores nos basamos en el hecho de que la siguiente relación
tiene una distribución muestral F con n1-1 y n2-1 grados de libertad:
Bajo la hipótesis nula de que , el estadístico de prueba se calcula como

El criterio de decisión es:
· Rechace H0 si cuando la hipótesis alternativa es
· Rechace H0 si cuando la hipótesis alternativa es
· Rechace H0 SI ó cuando la hipótesis alternativa es
Ejemplo
Se lleva a cabo un experimento para comparar el desgaste por abrasivo de dos diferentes
materiales laminados. Se prueban 12 piezas del material 1 mediante la exposición de cada
pieza a una máquina para medir el desgaste. 10 piezas del material 2 se prueban de manera
similar. En cada caso se mide la profundidad del desgaste. Las muestras del material 1 dan
una desviación estándar muestral de 4, mientras que las muestras del material 2 dan una des-
viación estándar muestral de 5. ¿Se justifica la suposición de que las 2 varianzas poblaciona-
les sean iguales? Utilice un nivel de significancia de 0.10.
Datos
n1 = 12
n2 = 10
s1 = 4
s2 = 5
α = 0.10
Hipótesis
H0: σ1 / σ2 = 1
Ha: σ1 / σ2 ≠ 1
F = s12
s22
Región de rechazo
F1-/2 , 1 , 2 F/2 , 1 , 2
RR RNR RR
Si F1-α/2 > Fc o Fc> Fα/2 se rechaza H0, de otra manera no se rechaza
Cálculos
F = 25 / 16
F = 1.5625
DECISIÓN

0.325 1.56 3.07
RR RNR RR
no se rechaza H0
F1- /2 , 1, 2 = 1 / F1- /2 , 2, 1 = 1 / 3.07 = 0.325
CONCLUSIÓN
No existe suficiente evidencia estadística para decir que las dos varianzas poblacionales son
diferentes entre sí, con un de 0.10.
Ejemplo
Se lleva a cabo un estudio para comparar la longitud de tiempo entre hombres y mujeres para
ensamblar cierto producto. Experiencia pasada indica que la distribución de los tiempos para
hombres y mujeres es aproximadamente normal pero que la varianza de los tiempos para las
mujeres es menor que para los hombres. Una muestra aleatoria de tiempos para 11 hombres
y 14 mujeres produce una desviación muestral de 6.1 y 5.3 respectivamente. Pruebe la hipó-
tesis de que σ12 es menor o igual que σ22 contra la alterna de que es mayor. Utilice un nivel
de significancia de 0.01.
Datos
n1 = 11
n2 = 14
s1 = 6.1
s2 = 5.3
α = 0.01
Hipótesis
H0: σ12 ≤ σ22

Ha: σ12 > σ22
F = s12
s22
Región de rechazo
F1-/2 , 1 , 2
RNR RR
Si Fc > Fα/2 se rechaza H0, de otra manera no se rechaza
Cálculos
F = (6.1)2 = 37.21 = 1.32

(5.3)2 28.09
Decisión

1.32 4.82
RNR RR
no se rechaza H0
Conclusión
No existe suficiente evidencia estadística para decir que la varianza del tiempo que los hom-
bres tardan en ensamblar cierto producto es mayor que la varianza del tiempo para las mujeres
en realizar la misma tarea, con un de 0.01.
PRUEBA DE
HIPÓTESIS PARA LA
MEDIA CON SIGMA
DESCONOCIDA
INTRODUCCIÓN
• Cuando n<30 y se desconoce σ2 , la formula que

utilizaremos es:
•
Que es un valor de una variable aleatoria que tiene la

distribución t con n-1 grados de libertad. Por lo tanto las
regiones criticas de tamaño α para probar la hipótesis
nula contra las alternativas ≠ > o < son
respectivamente, t ≥ y
t≤ .
Para ilustrar esta prueba t de una sola muestra
considérese el siguiente ejemplo:
EJEMPLO
• En 12 recorridos de prueba sobre un curso

señalado, un bote de motor de nuevo diseño
promedió 33.6 segundos con una desviación
estándar de 2.3 segundos. Suponiendo que es
razonable considerar los datos como una muestra
tomada al azar de una población normal, pruebe
la hipótesis nula =35 contra la alternativa <35 en
el nivel de significancia α= 0.05.
PROBLEMA RESUELTO.
CONCLUSION..
• Existe suficiente evidencia estadistica para decir

que la media de los recorridos de prueba de los
botes sera menor de 35 seg..
TAREA
• Cinco mediciones del contenido de alquitrán de

cierto tipo de cigarrillo arrojaron los siguientes
resultados: 14.5, 14.2, 14.4, 14.3, y 14.6 mg/cig.
Demuestre que para α=0.05 se debe rechazar la
hipótesis nula =14 en favor de la hipótesis
alternativa ≠ 14.0. supóngase que los datos son
una muestra tomada al azar de una población
normal.
Prueba de Hipótesis para la
Diferencia
De Medias con Sigma Conocida
INTRODUCCION
PROBLEMA.
PRUEBA DE HIPÓTESIS PARA LA
DIFERENCIA DE MEDIAS CON
SIGMA DESCONOCIDA PERO
IGUALES
EJEMPLO
Se realizó un experimento para comparar el tiempo promedio requerido por el
cuerpo humano para absorber dos medicamentos, A y B. Suponga que el
tiempo necesario para que cada medicamento alcance un nivel específico en
el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce
personas para ensayar cada fármaco registrándose el tiempo en minutos que
tardó en alcanzar un nivel específico en la sangre. Calcule con α= 0.05 si
existe diferencia entre los tiempos promedio. Suponga varianzas iguales.
Medicamento A Medicamento B
n1 =12 n2 =12
=26.8 =32.6
2 2
=17.54
HIPOTESIS REGIÓN DE DECISIÓN
Rechazar Ho si t ≥ o bien si t -2.74
2
2 CALCULOS
datos
n1 =12
=26.8
2
n2 =12
=32.6
2
=17.54
CONCLUSIÓN
REGIÓN DE RECHAZO Existe suficiente evidencia estadística para
decir que con un α=.05 existe diferencia entre
RR RR los tiempos de los medicamentos A y B
RNR
-2.74 2.74
EJEMPLO
Se estudian dos métodos para el aprendizaje del idioma ingles.
Después de cierto período, dos grupos, cada uno llevando uno de
estos métodos, son examinados mediante un mismo test. Los resultados
obtenidos son:
Grupo 1 Grupo 2
=87 s2 =23
s2 n2 =16
n1 =10 =92
HIPOTESIS a probar:
2
2
Prueba de hipótesis para la
diferencia de medias con sigmas
desconocidas pero diferentes.
• Si la suposición de que las varianzas sean

Iguales resulta insostenible, la fórmula que se
usará será la siguiente:
.-Dicha función será equivalente a una

distribución de probabilidad tipo “t student”
con v grados de libertad que cómo los
parámetros no son iguales, se verán dados por
la siguiente fórmula:
• En contraste con la fórmula para cuando se
supone que la varianzas son iguales, el
estimador combinado de varianzas Sp, no será
de utilidad ya que las varianzas, no son
iguales.
Ejemplo.
• Si 8 proyectiles de corto alcance de un tipo tienen
un error de blanco promedio de x1(testada) = 90
ft. Con una desviación estándar de S1=18 ft.
Mientras que 10 proyectiles de corto alcance de
otro tipo tienen un error de blanco medio de
x2(testada)=76ft.con una desviación estándar de
S2 =15 ft. Prueba la hipótesis nula µ 1 - µ 2 =15
• Centra la hipótesis alternativa µ 1 - µ 2 >15 sea
ɚ=0.05 el tamaño de la región critica y supóngase
que las varianzas son diferentes.
• Datos:
X1=98 ft.
X2=76 ft. H0:µ1 - µ 2 =15
S1=18 ft. Ha: µ 1 - µ 2 >15
S2=15 ft.
n1=8
n2=10
ɚ=0.05
Tɚ,13=2.17
Gl=13
2
• t t(v)
• |t0|≤|tɚ∕2| no se rechaza H0
• |t0|> |tɚ∕2| se rechaza H0 de lo contrario no
se rechaza
Cálculos:
• t
T=2.77
minitab
• Se decide rechazar la hipótesis nula, ya que el
valor de T0 excede al valor de tablas, por lo
que se concluye que la diferencia entre los
errores de blanco promedios de las muestras
excederán de 15 pies.
PRUEBA DE HIPOTESIS PARA

PROPORCIONES
Esta prueba comprende el calculo del

valor estadístico Z
• Donde:
x= ocurrencias
n= observaciones
x/n= proporción de la muestra
p(sub indice 0)= proporción propuesta
• Si se muestrea a partir de una población finita:
• Se debe utilizar el factor finito de corrección:
Las pruebas de proporciones pueden

ser de una o dos colas
• El tipo de pueda lo refleja H1, hay 3
posibilidades:
1) H1:p>p0 Cola a la Derecha

2) H1:p<p0 Cola a la izquierda
3) H1:p≠p0 Dos Colas
EJEMPLO
• Una encuesta realizada por el banco a 35 clientes
indicó que un poco más del 74 por ciento tenían un
ingreso familiar de más de $200,000 al año. Si esto
es cierto, el banco desarrollará un paquete especial
de servicios para este grupo. La administración
quiere determinar si el porcentaje verdadero es
mayor del 60 por ciento antes de desarrollar e
introducir este nuevo paquete de servicios. Los
resultados mostraron que 74.29 por ciento de los
clientes encuestados reportaron ingresos de
$200,000 o más al año.
TAREA
• El presidente del en 1988, basado en su
experiencia, sostiene que un 95% de los votos
para las elecciones presidenciales han sido a
favor de su partido. Los partidos de oposición
levantaron una muestra de1,100 electores y
encontraron que un 87% de ellos votaría por
el PRI. El presidente del PRI quiere probar la
hipótesis, con un nivel de significación de
0.05, que el 95% de los votos son para su
partido.
PRUEBA DE HIPÓTESIS PARA

LA DIFERENCIA ENTRE DOS
PROPORCIONES
Nos interesa comparar los parámetros de dos

poblaciones binomiales.
Específicamente, deseamos probar
Asumiendo que tomamos muestras grandes, es posible, de

nueva cuenta, utilizar la aproximación normal a la
binomial. Sean n1 y n2 los tamaños muestrales
respectivos de las poblaciones 1 y 2.
Si la hipótesis nula es verdadera, el estadístico
se atribuye aproximadamente normal estándar,

donde
Problema
 Consideremos dos líneas de producción de una planta, al
final de las cuales se realiza una inspección por muestreo.
La información del ultimo turno de producción es:

 # de Partes # de
partes
 Inspeccionadas defectuosas
 LINEA 1 278 23
 LINEA 2 197 14
 Podemos afirmar que la calidad en ambas líneas es la

misma? Probarlo con un nivel ᾳ: 0.01
Solución:
 Sean p1 y p2 las fracciones defectuosas
(rechazadas) de líneas 1 y 2, respectivamente.
Deseamos probar
Hipótesis:
Ho : p1= p2
H1: p1 p2
1-Datos: 4-Región de rechazo
X1: 23
n1:278
X2:14
n2: 197
2-Hipótesis:
Ho : p1= p2 5-Regla de decisión
H1: p1 p2 Con = 1% la región critica para esta
prueba es lZl > 0.005, lZl > 2.58 no se
rechaza
3-Estadístico de prueba
6-Calculamos
=23/278= 0.0827
=14/197=0.0710
P= = 23+14/278+197=37/475= 0.0778
= . 117/ √ . 778(1-0.0778)(1/278+1/197) = 0.4690
7-Toma de decisión
•No se rechaza Ho
8-Conclusión:
Concluimos que no existe suficiente
evidencia estadística para el rechazo de
Ho, y para poder afirmar que la calidad
en ambas líneas es la misma con un nivel
de = 0.01
PRUEBA DE HIPÓTESIS
PARA LA VARIANZA
LA VARIANZA
 La varianza como medida de dispersión es importante dado

que nos ofrece una mejor visión de dispersión de datos
 Por ejemplo: si se determina que la población califica en
promedio con 6 el desempeño del gobierno; al decir que la
varianza es de cero podemos confiar en que
aproximadamente la misma calificación le asignaría toda la
población, en otras palabras, en términos generales la
población en su conjunto ve al gobierno con la misma
calificación ya que no hay variación o dispersión en dicha
calificación de lo contrario con una varianza muy alta
podemos interpretar que hay gente contenta con el gobierno
que le ha asignado calificaciones muy arriba del 6; pero hay
un conjunto poblacional muy molesto con el gobierno que
asigna calificaciones muy por debajo del 6.
FORMULA
 Nuevamente consideramos que la población sigue

una distribución de probabilidad normal, para lo cual
usamos el siguiente estadístico de prueba:
2
(n ) 2
2
gl = n -1
 Este estadístico de prueba se le conoce como ji

cuadrada
EJEMPLO
 Una empresa del giro alimenticio desea determinar si el

lote de una materia prima tiene o no una varianza
poblacional mayor a 15 en su grado de endulzamiento.
Se realiza un muestreo de 20 elementos y se obtiene una
varianza muestral de 20.98; realizar la prueba de
hipótesis con alfa = 0.05.
 Paso1
 Datos:
 n=20 gl=n-1= 20-1 =19
 =20.98
 =15
 =.05
 Paso 2 Paso 3
Hipótesis Estadístico de prueba
 Ho: ≤15
(n )
 Ha: >15 (prueba de una cola)
gl= n-1
 Paso 4 Región de rechazo: Unilateral
 Paso 5
Regla de decisión
 Si 2 c > 2 t se rechaza Ho
 De otra manera no se rechaza Ho.
 Paso 6
Cálculos
2 (n ) (2 )2
= =26.5746
 Paso 7 Paso 8
Decisión Conclusión
 No se rechaza Ho No existe suficientes evidencia
2
c= 26.5746 estadística para decir
2 t= 30.1435 que el lote de materia prima
tiene una 2 en su grado
de endulzamiento con un
Prueba de hipótesis para
la razón de varianza
Ejercicio
 Se ha demostrado que dosis elevadas de óxido de

etileno en conejos alteran significativamente la
estructura del ADN de las celulas. Aunque se sabe
que el óxido de etileno es mutagénico y carcinógeno,
este compuesto se utiliza con frecuencia para
esterilizar materiales de hospital. Se realizo un
estudio con miras a investigar el efecto del oxido
etileno sobre el personal hospitalario que participa
en el proceso de esterilizacion.
Se seleccionaron al azar 31 sujetos y se les asigno una
de dos tareas.
 A 18 sujetos se les asigno la tarea 1 de abrir el
paquete de esterilizacion que contiene oxido etileno
 A los otros 13 sujetos se les asigno la tarea 2 de abrir
y descargar la pistola esterilizada con el oxido
 Una vez realizadas las tareas, los investigadores

midieron la cantidad de oxido (en miligramos)
presente en la corriente sanguínea de cada sujeto.
¿proporcionan los datos indicios suficientes de una

diferencia en la variabilidad de los niveles de oxido en los
sujetos asignados a las dos tareas? Pruebe con α=.10
solución
.Datos
 = 18 2
 = 13 2
2
1. Establecer hipótesis
= =1 ( 2 = 2
 2)
2 2
 = 1 ( 2)
 2. Nivel de significancia
α=.10
 s2 con gl= - 1 = 18-1= 17 Denominador
 s2 2 con gl = - 1 = 13-1 = 12 Numerador
3. Estadistico de prueba
s
 F= =s
4. Regla de decisión
Rechazaremos : 2 = 2 2 para α=.10 cuando el valor
calculado de F exceda el valor tabulado
 Valor tabulado 6. Region de rechazo
= = 2.38 2.38
5. Cálculos
s ( )
F= s = = ( )
= 2.58
Region de rechazo 2.58

Region de NO rechazo
Por que se hace la grafica de una sola cola
 El establecimiento de las hipótesis que maneja el autor

del libro (probabilidad y estadística para ingeniería) nos
dice que esta será una prueba de dos colas pero como en
las tablas de Fisher nos dan los valores solo para el lado
derecho; lo que hacemos es colocar la varianza muestral
mas grande como numerador y la mas chica como
denominador, al hacer esto hacemos que se duplique el
valor tabulado de alfa ya que duplica la probabilidad de
que la región f cargue en el extremo derecho.
 Hacemos que la prueba sea de dos colas colocando la
varianza muestral mayor en el numerador.
7. Decisión
Se rechaza ya que >
8. Conclusión
Existe suficiente evidencia estadistica para decir con
un nivel de significancia de .10 que las varianzas son
diferentes
tabla
UNIDAD IV Pruebas de bondad de ajuste y pruebas no paramétricas
Bondad de ajuste
Análisis Ji-Cuadrada
Prueba de independencia
Prueba de la bondad del ajuste
Tablas de contingencia
Uso del software estadístico.
Pruebas no paramétricas
Escala de medición
Métodos estadísticos contra no paramétricos
Prueba de Kolmogorov – Smirnov
Prueba de Anderson – Darling
Prueba de Ryan – Joiner
Prueba de Shappiro – Wilk
4.1. Bondad de ajuste

Por bondad del ajuste hay que entender el grado de acoplamiento que existe entre los datos
originales y los valores teóricos que se obtienen de la regresión. Obviamente cuanto mejor sea
el ajuste, más útil será la regresión a la pretensión de obtener los valores de la
variable regresando a partir de la información sobre la variable regresora.
Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se ajustan a una
determinada distribución, esta distribución puede estar completamente especiﬁcada (hipótesis
simple) o perteneciente a una clase paramétrica (hipótesis compuesta).
Las pruebas de Bondad de Ajuste más comúnmente conocidas, son:

•Anderson-Darling
•Chi-Cuadrada
• Kolmogorov-Smirnov
Chi cuadrada
Supongamos que tenemos un número k de clases en las cuales se han ido registrado un total
de n observaciones (n será pues el tamaño muestral). Denotaremos las frecuencias
observadas en cada clase por O1, O2, ..., O k
(Oi es el número de valores en la clase Ai). Se cumplirá:
O1 + O2 + ... + O k = n
Lo que queremos es comparar las frecuencias observadas con las frecuencias esperadas
(teóricas), a las que denotaremos por E1, E2, ..., E k. Se cumplirá:
E1 + E2 + ... + E k = n
Se tratará ahora de decidir si las frecuencias observadas están o no en concordancia con las
frecuencias esperadas (es decir, si el número de resultados observados en cada clase
corresponde aproximadamente al número esperado). Para comprobarlo, haremos uso de un
contraste de hipótesis usando la distribución Chi-cuadrado:
El estadístico de contraste será
Observar que este valor será la suma de k números no negativos. El numerador de cada
término es la diferencia entre la frecuencia observada y la frecuencia esperada. Por tanto,
cuanto más cerca estén entre sí ambos valores más pequeño será el numerador, y viceversa.
El denominador permite relativizar el tamaño del numerador.
Las ideas anteriores sugieren que, cuanto menor sean el valor del estadístico , más
coherentes serán las observaciones obtenidas con los valores esperados. Por el contrario,
valores grandes de este estadístico indicarán falta de concordancia entre las observaciones y
lo esperado. En este tipo de contraste se suele rechazar la hipótesis nula (los valores
observados son coherentes con los esperados) cuando el estadístico es mayor que un
determinado valor crítico.
Notas:
(1) El valor del estadístico se podrá aproximar por una distribución Chi-cuadrado cuando el
tamaño muestral n sea grande (n > 30), y todas las frecuencias esperadas sean iguales o
mayores a 5 (en ocasiones deberemos agrupar varias categorías a fin de que se cumpla este
requisito).
(2) Las observaciones son obtenidas mediante muestreo aleatorio a partir de una población
particionada en categorías.
4.1.1. Análisis Ji-Cuadrada
La distribución ji cuadrada es una de las distribuciones de probabilidad más ampliamente

utilizada en la estadística inferencial.
En estadística, la distribución χ² (de Pesaron), llamada Chi cuadrado o Ji cuadrado, es
una distribución de probabilidad continua con un parámetro que representa los grados de
libertad de la variable aleatoria.
Donde son variables aleatorias normales independientes de media cero y varianza uno. El
que la variable aleatoria tenga esta distribución se representa habitualmente así: .
Aplicaciones
La distribución χ² tiene muchas aplicaciones en inferencia estadística. La más conocida es la
de la denominada prueba χ² utilizada como prueba de independencia y como prueba de
bondad de ajuste y en la estimación de varianzas. Pero también está involucrada en el
problema de estimar la media de una población normalmente distribuida y en el problema de
estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t
de Student.
Aparece también en todos los problemas de análisis de varianza por su relación con
la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias
independientes con distribución χ².
Su utilidad reside en que, bajo algunos supuestos razonables y poco exigentes, existen
variables que al calcularse pueden dar lugar a una distribución aproximada a la ji cuadrada.
Las situaciones mejor conocidas de uso de esta distribución están en la común prueba ji
cuadrada de bondad de ajuste de una distribución observada a una distribución teórica, y la de
independencia de dos criterios de clasificación de datos cualitativos.
La distribución ji cuadrada está asociada a un parámetro conocido como grado de libertad. La
forma de la distribución depende del valor de este parámetro.
Propiedades de las distribuciones ji-cuadrada
1. Los valores de X2 son mayores o iguales que 0.
2. La forma de una distribución X2 depende del gl =n-1. En consecuencia, hay un número
infinito de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la
derecha; esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).
4.1.2. Prueba de independencia
En el análisis de independencia se considera que la muestra, una vez escogida, se clasifica

según los criterios de interés; por ello se supone que las muestras provienen de una población.
En las aplicaciones estadísticas es frecuente interesarse en calcular si dos variables de
clasificación, ya sea cuantitativa o cualitativa, son independientes o si están relacionadas. En
situaciones como las siguientes, se puede estar interesado en determinar si dos variables
están relacionadas:
¿Están relacionados los hábitos de lectura con el sexo del lector?

¿Están relacionadas las calificaciones obtenidas con el número de faltas?
¿Es independiente la opinión sobre la política exterior de la política partidista?
¿Es independiente el sexo de una persona de su preferencia en colores?
¿Está relacionado el sexo con tener una educación universitaria?
¿Están relacionadas las enfermedades del corazón con el tabaquismo?
¿Son independientes el tamaño de una familia y el nivel de educación de los padres?
¿Está relacionado el desempleo con el incremento de la criminalidad?
¿El precio está asociado con la calidad de un producto electrodoméstico?
¿El estado nutricional está asociado con el desempeño académico?
Otra forma de expresar el hecho de que dos variables sean independientes, es diciendo, que
no se afectan entre sí; esto es que no están relacionadas o asociadas.
Ilustraremos esta técnica con el estudio que realizó Cervecería Modelo, la cual fabrica y
distribuye tres tipos de cerveza: ligera, clara y oscura. En un análisis de segmentación de
mercado para las tres cervezas, el grupo de investigación encargado ha planteado la duda de
si la preferencia para las tres cervezas es diferente entre los consumidores hombres y mujeres.
Si la preferencia de las cervezas fuera independiente del género del consumidor, se iniciaría
una campaña de publicidad para todas las cervezas Modelo. Sin embargo, si la preferencia
depende del género del consumidor, se ajustarían las promociones para tener en cuenta los
distintos mercados meta.
Una prueba de independencia usa la pregunta de si la preferencia de la cerveza (ligera, clara
y oscura) es independiente del género del consumidor (hombre, mujer). Las hipótesis para
esta prueba de independencia son:
~ Ho: La preferencia de la cerveza es independiente del género del consumidor
~ Ha: La preferencia de la cerveza no es independiente del género del consumidor
Podemos usar una tabla como la 1 para describir el caso que se estudia. Después de identificar
a la población, consumidores hombres y mujeres, se puede tomar una muestra y preguntar a
cada persona que diga su preferencia entre las cervezas modelo.
Cada persona de la muestra se clasificará en una de las seis celdas de la tabla. Por ejemplo
una persona puede ser hombre y prefiera la cerveza clara [celda (1,2)], una mujer que prefiere
la cerveza ligera [celda (2,1)], una mujer que prefiere la cerveza oscura [celda (2,3)] y así
sucesivamente. Como en la lista aparecen todas las combinaciones posibles de predilección
de cerveza y género, en otras palabras aparecen todas las contingencias posibles, a la tabla
se le llama tabla de contingencia.
Cerveza preferida
Ligera Clara Oscura
Género Hombre Celda (1,1) Celda (1,2) Celda (1,3)
Mujer Celda (2,1) Celda (2,2) Celda (2,3)
Supongamos que se ha tomado una muestra aleatoria simple de 150 bebedores de cerveza.
Después de saborear cada una, se les pide expresar su preferencia o primera alternativa. La
tabulación cruzada de la siguiente tabla 2 resume las respuestas obtenidas. Observamos que,
los datos para la prueba de independencia se agrupan en términos de cantidades o frecuencias
para cada celda o categoría. De las 150 personas de la muestra, 20 fueron hombres que
prefirieron la cerveza ligera, 40 fueron mujeres que prefirieron la cerveza clara, 20 fueron
hombres que prefirieron la cerveza oscura, y así sucesivamente.
Los datos de la tabla 2 constituyen las frecuencias observadas para las seis clases o
categorías.
Cerveza preferida
Ligera Clara Oscura Total
Género Hombre 20 40 20 80
Mujer 30 30 10 70
Total 50 70 30 150
Si podemos determinar las frecuencias esperadas bajo la hipótesis de independencia entre la

preferencia de cerveza y el género del consumidor, podemos usar la distribución ji cuadrada
para determinar si existe una diferencia significativa entre la frecuencia observada y la
esperada.
Las frecuencias esperadas en las celdas de la tabla de contingencia se basan en el siguiente
razonamiento. Primero suponemos que es verdadera la hipótesis nula, de independencia entre
la cerveza preferida y el género del consumidor. A continuación observamos que en toda la
muestra de 150 consumidores, hay 50 que prefieren la cerveza ligera, 70 la cerveza clara y 30
la cerveza oscura. Expresada en fracción, la conclusión es que de 50/150 = 1/3 de los
consumidores de cerveza prefieren la ligera; 70/150 = 7/15 la clara y 30/150 = 1/5 la oscura.
Si es válida la hipótesis de independencia, decimos que estas fracciones se deben de aplicar
por igual a los consumidores hombres y mujeres. Así bajo la hipótesis de independencia,
esperaríamos que la muestra de 80 consumidores hombres indicara que (1/3) 80 = 26.7
prefieren cerveza ligera, (7/15) 80 = 37.33 la clara y (1/5) 80 = 16 la oscura. La aplicación de
las mismas fracciones a las 70 consumidoras mujeres produce las frecuencias esperadas que
aparecen en la tabla.
eij
Sea la frecuencia esperada en la categoría del renglón i y la columna j de la tabla de
contingencia. Con esta notación reconsideremos el cálculo de la frecuencia esperada para los
hombres (renglón i = 1) que prefieren la cerveza clara (columna j = 2) esto es, la frecuencia
e1, 2
esperada . Apegándonos al esquema anterior para el cálculo de las frecuencias esperadas,
podemos demostrar que
e1, 2
= (7/15) 80 = 37.33
Esta ecuación se puede escribir como sigue
e1, 2
= (7/15) 80 = (70/150) 80 = 37.33
Observe que 80 es la cantidad total de hombres (total del renglón 1), 70 es la cantidad total de
individuos (hombres y mujeres) que prefieren la cerveza clara (total de la columna 2) y 150 es
el tamaño de la muestra total. En consecuencia vemos
(total del renglón1) (total de la columna2)
e1, 2 
tamañode la muestra
Al generalizar la ecuación vemos que la fórmula siguiente determina las frecuencias esperadas
de una tabla de contingencias para la prueba de independencia.
Frecuencias esperadas en la tabla de contingencia suponiendo independencia
(Total del renglón i) (total de la columna j )

eij 
tamañode la muestra
El procedimiento de prueba para comparar frecuencias observadas con las frecuencias
esperadas, se parece a los cálculos de bondad de ajuste. Específicamente, el valor de 

2
basados en las frecuencias observadas y esperadas se calcula como sigue:
 
2
k f oi  f ei 
2
i 1 f ei
Oi = Valor observado en la i-ésimo celda.

Ei = Valor esperado en la i-ésimo celda.
K = Categorías o celdas.
Con n renglones y m columnas en la tabla de contingencia, el estadístico de prueba tiene una
distribución ji cuadrada con (n – 1) (m – 1) grados de libertad, siempre y cuando las frecuencias
esperadas sean 5 o más para todas las categorías. En consecuencia proseguimos con el
cálculo de la estadística de prueba ji cuadrada.
Los cálculos necesarios para determinar el estadística ji cuadrada y ver si la preferencia de
cerveza es independiente del género de quien la bebe se ven en la tabla.
La cantidad de grados de libertad para la distribución ji cuadrada adecuada se determina
multiplicando la cantidad de renglones menos 1 por la cantidad de columnas menos 1. Como
tenemos dos renglones y tres columnas, entonces (2 – 1) (3 – 1) = (1) (2) = 2 grados de libertad
para la prueba de independencia entre cerveza y género del consumidor. Con  = .05 como
nivel de significancia de la prueba, buscamos en la tabla de ji cuadrada y nos da un valor

 .205
= 5.99. Observe que estamos usando el valor de la cola superior, porque rechazaremos
la hipótesis nula sólo si las diferencias entre frecuencias observadas y esperadas producen un
valor grande de  . En el ejemplo  =6.13 es mayor que  = 5.99. Por consiguiente,

2 2 2
rechazaremos la hipótesis nula de independencia y concluimos que la cerveza preferida no es

independiente del género del consumidor, es decir, la preferencia para las tres cervezas es
diferente entre los consumidores hombres y mujeres y por lo tanto la Cervecería Modelo deberá
estratificar a los consumidores para ajustar las promociones y la publicidad, teniendo en cuenta
estas diferencias.
4.1.3. Prueba de la bondad del ajuste
La prueba de bondad de ajuste se aplica en diseños de investigación en los que se estudia a

un único grupo.
La prueba compara la distribución de frecuencias observadas (Fo) de una variable usualmente-
cualitativa, pero que también puede ser cuantitativa, con la distribución de frecuencias de la
misma variable medida en un grupo de referencia.
El procedimiento de la prueba implica el calculo de una distribución esperada 9Fe) en el grupo
estudiado, usando como punto de partida a la distribución de la variable en el grupo de
referencia.
El propósito de la prueba es averiguar si existen diferencias estadísticamente significativas
entre la distribución observada (Fo) y la distribución esperada (Fe).
En la prueba se plantean las siguientes hipótesis estadísticas
El procedimiento de la prueba incluye el calculo de la medida de resumen llamada chi
cuadrada. El rechazo de la Ho ocurre cuando el valor calculado con los datos resulta mayo
que el valor critico de dicha medida contenido en una tabla llamada Valores Críticos de chi
cuadrada.
En el caso de que el valor de chi cuadrada calculada sea igual o menor al de Chi cuadrada
critica se dice que nos e rechaza a la Ho y, por tanto, se concluye que la Fo es semejante a la
Fe. En otras palabras, se dice que ambas distribuciones se ajustan bien; de ahí el nombre de
la prueba: bondad de ajuste.
4.1.4. Tablas de contingencia
En estadística las tablas de contingencia se emplean para registrar y analizar la relación

entre dos o más variables, habitualmente de naturaleza cualitativa (nominales u ordinales).
En otras palabras sirve para analizar la relación de dependencia o independencia entre dos
variables cualitativas nominales o factores, es necesario estudiar su distribución conjunta o
tabla de contingencia.
En muchas ocasiones, los n elementos de una muestra tomada de una población pueden
clasificarse con dos criterios diferentes. Por tanto, es interesante saber si los dos métodos de
clasificación son estadísticamente independientes. Supóngase que el primer método de
clasificación tiene r niveles, y que el segundo tiene c niveles. O sea Oij la frecuencia observada
para el nivel i del primer método de clasificación y el nivel j del segundo método de clasificación.
En general, los datos aparecerán como se muestra en la siguiente tabla. Una tabla de este tipo
usualmente se conoce como tabla de contingencia r x c.
Columnas
Renglones 1 2 ... c
1 O11 O12 ... O1c
2 O21 O22 ... O2c
. . . . .
. . . . .
. . . . .
r Or1 Or2 ... Orc
El interés recae en probar la hipótesis de que los dos métodos de clasificación renglón-columna
son independientes. Si se rechaza esta hipótesis, entonces se concluye que existe alguna
interacción entre los dos criterios de clasificación. Los procedimientos de prueba exactos son
difíciles de obtener, pero puede obtenerse un estadístico de prueba aproximado válido
para n grande.
Sea pij la probabilidad de que un elemento seleccionado al azar caiga el la

ij-ésima celda, dado que las dos clasificaciones son independientes. Entonces, p ij=uivj, donde
ui es la probabilidad de que un elemento seleccionado al azar pertenezca al renglón de la
clase i, y vj es la probabilidad de que un elemento seleccionado pertenezca a la columna de la
clase j. Ahora bien, si se supone independencia, los estimadores de u i y vj son:
Por lo tanto, la frecuencia esperada de la celda es:
Entonces, para n grande, el estadístico
Tiene una distribución aproximada ji-cuadrada con (r-1)(c-1) grados de libertad si la hipótesis
nula es verdadera. Por consiguiente, la hipótesis de independencia debe rechazarse si el valor
del estadístico de prueba X2 calculado es mayor que X2 crítico o de tabla.
4.1.5. Uso del

software estadístico
PRUEBA DE BONDAD Y AJUSTE DE LA CHI CUADRADA

El procedimiento de prueba de la Chi-cuadrada es un método analítico, requiere una muestra
aleatoria de tamaño n de la variable aleatoria x. Estas n observaciones se arreglan en
histogramas de frecuencias, teniendo k intervalos de clase (donde k  n ). Sea Oi la

frecuencia observada en el i-ésimo intervalo de clase. De la distribución de probabilidad
hipotética, se calcula la frecuencia esperada en el i-ésimo intervalo de clase, identificada como
Ei, La estadística de prueba es la siguiente:
k
(Oi  Ei ) 2
 02  
i 1 Ei
Puede demostrarse que  0 sigue aproximadamente una distribución Chi cuadrada con k-p-1
2
grados de libertad, donde k es el número de intervalos, p representa el número de parámetros

de la distribución hipotética, estimados por medio de estadísticas de la muestra. Esta
aproximación se mejora cuando n aumenta. Se rechaza la hipótesis de que x se ajusta a la
 02  2,k  p1
distribución hipotética, si .
El procedimiento para establecer la prueba utilizando Minitab -13 es el siguiente:

Ingreso de datos y cálculos de media y desviación estándar: del mismo modo que en el caso
anterior, se ingresan los datos en la hoja de trabajo (“worksheet”), de estos datos que viene a
ser la muestra de la variable aleatoria x, se calcula la media y la desviación estándar siguiendo
las siguientes secuencias: calc >column statistic> mean y calc>column>standard desviation,
respectivamente, tal como se puede apreciar en la ventana que se muestra a continuación.
Histogramas de frecuencia: Para realizar un histograma de frecuencia se sigues la siguiente
secuencia: graph > histogram >options >frecuency >cutpoint ># intervals 10. Para mostrar las
frecuencias en la gráfica, ingresar a <Annotation> <Data labels> y activar <show data labels>
Ademas en < <Annotation> ingresar a <Title..> para colocar un título.
De este modo se obtiene la siguiente gráfica.

El siguiente paso es ingresar los valores de frecuencia observada y los intervalos. Como se
puede apreciar de la figura anterior, Minitab -13 muestra estos valores en el histograma de
frecuencia, pero es necesario ingresarlos manualmente a la hoja de trabajo.
Cálculo de probabilidad para los límites superior e inferior de los intervalos. Para esto se sigue
la siguiente secuencia: calc>probability distribution> <Normal> se especifica la media y
desviación estándar halladas anteriormente en los espacios que correspondan así como la
columna en donde se requiere que se almacenen los resultados, previamente se elige la
distribución a la cual se ajustan los datos. En el ejemplo se escogió la distribución normal. Este
procedimiento se muestra en la siguiente pantalla.
Cálculo de los valores esperados: para esto se escoge el menú de calc>calculator; y se ingresa
la fórmula según se muestra en la siguiente pantalla.
Es importante notar que si los valores esperados tienen valores numéricos menores que 5.0,
entonces debemos hacer una nueva agrupación, para lo cual se tomarán aquellos valores
menores que 5 y se suman. En el ejemplo de 10 intervalos se reduce a 7. Los tres primeros se
reducen a uno y los dos últimos también se agrupan. Luego el primer intervalo va desde 7.25
hasta 8.75 y el séptimo va desde 11.25 hasta 12.25. Con estos nuevos intervalos se repite el
procedimiento anterior y se obtienen nuevos valores esperados. Además se estiman dos 2
parámetros (la media y la desviación estándar). Por tanto los grados de libertad para calcular
el valor Chi crítico es de 4, (g.l = 7-2-1 = 4)
Cálculo de la estadística Chi-cuadrada: Luego se sigue la secuencia siguiente:
Calc>Calculator; y se define los parámetros que aparecen a continuación. El valor obtenido es
de 4.187.
Cálculo del valor Chí-crítico: Este valor también se puede obtener de las tablas de distribución
Chi-cuadrada que se encuentran en los libros, pero Minitab-13 lo provee de la siguiente
manera: Calc>Probability distribution>Chi square>Inverse cumulative probability >imput
constant: 0.95>OK, el resultado correspondiente aparece en la ventana de “Session”, y es igual
a:  0.95  9.4877
2
Cálculo del valor p: En primer lugar se establece el valor de k, para tal efecto se realiza lo
siguiente: Calc>Probability Distributions> Chi-square; se selecciona Cumulative Probability >.
En Degrees of freedom se establece
(# grados de libertad) <Input column> y se establece el lugar a almacenar el valor en la celda
que contendrá k en Optional storage tal como se puede apreciar en la siguiente gráfica.
Finalmente se calcula el valor p: Para esto se sigue la siguiente secuencia: Calc> Calculator>
storage result, se establece donde se desea almacenar el resultado, y se escribe la ecuación
siguiente en Expression: (1-k), como se puede apreciar en el siguiente diagrama.
Resultados:
Como en el resultado de la prueba de Chi-cuadrada xcal  4.187  xcrítico  9.4877 , o como se

2 2
 02  2,k  p1
estableció en la parte teórica , entonces se acepta la hipótesis nula H0.
Por otro lado, como el p-value=0.38 > 0.05, no hay evidencia suficiente para rechazar H0.
4.2. Pruebas no paramétricas

Cuando se analizan datos medidos por una variable cuantitativa continua, las pruebas
estadísticas de estimación y contraste frecuentemente empleadas se basan en suponer que
se ha obtenido una muestra aleatoria de una distribución de probabilidad de tipo normal o de
Gauss.
Pero en muchas ocasiones esta suposición no resulta válida, y en otras la sospecha de que
no sea adecuada no resulta fácil de comprobar, por tratarse de muestras pequeñas. En estos
casos disponemos de dos posibles mecanismos: los datos se pueden transformar de tal
manera que sigan una distribución normal, o bien se puede acudir a pruebas estadísticas que
no se basan en ninguna suposición en cuanto a la distribución de probabilidad a partir de la
que fueron obtenidos los datos, y por ello se denominan pruebas no paramétricas (distribution
free), mientras que las pruebas que suponen una distribución de probabilidad determinada
para los datos se denominan pruebas paramétricas.
Dentro de las pruebas paramétricas, las más habituales se basan en la distribución de
probabilidad normal, y al estimar los parámetros del modelo se supone que los datos
constituyen una muestra aleatoria de esa distribución, por lo que la elección del estimador y el
cálculo de la precisión de la estimación, elementos básicos para construir intervalos de
confianza y contrastar hipótesis, dependen del modelo probabilístico supuesto.
Cuando un procedimiento estadístico es poco sensible a alteraciones en el modelo
probabilístico supuesto, es decir que los resultados obtenidos son aproximadamente válidos
cuando éste varía, se dice que es un procedimiento robusto.
Las inferencias en cuanto a las medias son en general robustas, por lo que si el tamaño de
muestra es grande, los intervalos de confianza y contrastes basados en la t de Student son
aproximadamente válidos, con independencia de la verdadera distribución de probabilidad de
los datos; pero si ésta distribución no es normal, los resultados de la estimación serán poco
precisos.
Contraste de Pearson
La idea del contraste de Pearson es muy sencilla: se agrupan los datos en k clases (k>5),
como si fuéramos a construir un histograma, cubriendo todo el rango posible de valores, siendo
deseable disponer, aproximadamente, del mismo número de datos en cada clase y al menos
de tres datos en cada una.
Se calcula entonces el siguiente índice de discrepancia entre las frecuencias observadas y las
que era previsible encontrar si el modelo fuera el adecuado:
Prueba de Kolmogorov-Smirnov
Este contraste, que es válido únicamente para variables continuas, compara la función de
distribución (probabilidad acumulada) teórica con la observada, y calcula un valor de
discrepancia, representado habitualmente como D, que corresponde a la discrepancia máxima
en valor absoluto entre la distribución observada y la distribución teórica, proporcionando
asimismo un valor de probabilidad P, que corresponde, si estamos verificando un ajuste a la
distribución normal, a la probabilidad de obtener una distribución que discrepe tanto como la
observada si verdaderamente se hubiera obtenido una muestra aleatoria, de tamaño n, de una
distribución normal
Prueba de Shapiro-Wilks
Aunque esta prueba es menos conocida es la que se recomienda para contrastar el ajuste de
nuestros datos a una distribución normal, sobre todo cuando la muestra es pequeña (n<30).
Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilístico normal. Este tipo
de representación también lo proporcionan algunos programas de estadística, de tal manera
que nos permite además apreciar el ajuste o desajuste de forma visual:
4.2.1. Escala de medición
Nominal o clasificatoria:
Se da cuando las observaciones consisten en clasificaciones de objetos en categorías o clases
mutuamente excluyentes. Se dice que la medición es elemental. Un ejemplo de datos en esta
escala son las observaciones de una variable aleatoria Bernoulli donde las observaciones son
del tipo éxito o fracaso, presente o ausente, mayor del 20% o menor del 20%, etc.
La única relación que puede establecerse es la de igualdad y por lo tanto de desigualdad. Dos
observaciones son iguales si están en la misma clase y diferentes si no lo están. El único
estadístico válido para este tipo de datos es la frecuencia en cada clase.
Ejemplo 1:
Un parasitoide ataca a un insecto plaga y se desea conocer si aquel presenta preferencia por
determinado instar o estadio. Se colectan 100 especimenes en cada instar y se registra la
presencia o ausencia del parasitoide.
Número de insectos parasitados sobre un total de 100 por cada instar.
INSTAR (Categoría)
Ordinal o de rango:
Ocurre cuando los objetos de una categoría están relacionados de forma conocida con los de
otra categoría, y no son considerados únicamente como diferentes. Tales relaciones pueden
expresarse como “mayor que” o “menor que”, y las escalas particulares pueden ser “mas
atacado que”, “más grande que”, etc.
Si la relación mayor (o menor) se sostiene en solo algunos pares de mclases pero no en todas,
tenemos una escala parcialmente ordenada. Si se sostiene en todos los pares de clases de
modo que surja un rango ordenado completo tenemos una escala ordinal. Esta escala, al
incorporar la relación de mayor (o menor) contiene mayor información que la anterior, por lo
que se dice que es una escala mas fuerte. Las propiedades de una escala ordinal no son
isomórficas al sistema numérico conocido como aritmética
Intervalo:
En esta escala además de poder ordenar las observaciones como en la escala anterior,
también se tiene idea de la distancia existente entre ellas. La localización del cero de la escala
y el tamaño de las unidades de distancia son arbitrarios. El cero no corresponde a la ausencia
de la característica física utilizada en las unidades de medida. Esta escala es más fuerte que
la ordinal y por consiguiente que la nominal. Pueden calcularse parámetros tales como la
media y la varianza, además de los que permiten las escalas anteriores.
Las operaciones y las relaciones en que se origina la estructura de una escala de intervalo son
tales, que las diferencias en la escala son isomórficas a la estructura de la aritmética. Un
ejemplo frecuentemente mencionado en la bibliografía es el caso de las escalas Fahrenheit y
Celsius utilizadas en la medición de la temperatura, donde tanto el cero como la unidad de
medida (el grado) son arbitrarios. No es el caso de la escala Kelvin o escala absoluta.
Proporción:
Esta escala posee las características de la escala de intervalo y además tiene en su origen un
punto cero real. Las observaciones pueden ordenarse. El cero y la unidad de distancia entre
observaciones son inherentes al sistema, es decir, no son arbitrarias.
Las observaciones originales del ejemplo presentado para ilustrar la escala de intervalo,
cantidad de insectos, es un ejemplo de medidas en escala de proporción. Esta es la escala
más fuerte de todas las consideradas y permite el cálculo de la media, varianza y cualquier
estadístico calculado con las otras escalas. Con una escala de proporción, cualquier prueba
estadística puede usarse ya que esta escala contiene a todas las anteriores. Características
tales como cantidad, peso, longitud, etc. son medidas en esta escala.
4.2.2 Métodos estadísticos contra no paramétricos

Pruebas estadísticas inferenciales mas frecuentes de acuerdo a la escala de medición de la
variable en estudio.
Tipo de descripción Escala de la variable o Método o Técnica
asociación Estadística
Variables individuales Nominales - Prueba de Z para una
proporción poblacional
- prueba de Ji-cuadrada
para varias proporciones
en una sola población
-intervalos de confianza
para proporciones
Variables individuales Ordinales -prueba del signo o
binomial para la mediana
poblacional
- intervalo de confianza
para proporciones
Asociación entre Muestras grandes con -prueba de t para un
variables distribución normal promedio poblacional
- intervalo de confianza
para el promedio
Asociación entre Muestras pequeñas sin
- prueba del signo o
variables distribución normal
binomial para la
mediana poblacio-
nal
- intervalo de con-
fianza para el pro-
medio
Pruebas estadísticas descriptivas mas frecuentes de acuerdo a la escala de medición de la

variable en estudio
Tipo de descripción Escala de la variable o Método o técnica
asociación estadística
Variables individuales Categorías (nominal y -Frecuencias,
ordinal) proporciones o
porcentajes
representados por
gráficos de barras, pastel
o pictogramas
Variables individuales Numéricas (intervalo y -distribución de
razón) frecuencias en clases
-Frecuencias acumuladas
-Percentiles
-Medidas de tendencia
central, dispersión
curtosis y oblicuidad
Asociación entre variables Categóricas con -tablas de contingencias
categóricas - gráficos de barras
- pruebas de kendall, de
Kramer, de spearman
Asociación entre variables Categórica con numérica -tablas con clasificación
categórica, con promedios
y desviaciones o error
estándar en cada entrada
Asociación entre variables Numérica con numérica -grafico de puntos
-coeficiente de correlación
- recta de regresión
Pruebas estadísticas para estudios comparativos mas frecuentes de acuerdo a la escala de

medición de la variable en estudio
Tipo de descripción Escala de la variable o Método o técnica estadística
asociación
Independientes Nominal -prueba exacta de Fisher
-prueba ji cuadrada
- calculo de riesgo relativo
- modelos lógicos y
logarítmicos
Independientes sin control Ordinal -prueba de u de mann
Whitney
-prueba de kruskall
-modelos logarítmicos
lineales
Independientes Razón -prueba de T
-Análisis de varianza para la
prueba de F
- Prueba de Logrank
- Regresión múltiple
Dependientes con bloques o nominal -prueba de mcnemar
igualación de atributos -método de mantel Haendel
- prueba de ji cuadrada para
cada nivel de confusión
-modelos logísticos
Dependientes con bloques Ordinal -prueba de Friedman
(control de factores de -prueba de wilcoxon
confusión) - modelos logarítmico-
lineales
Dependientes con bloques Razón -prueba de T apareada
(con control de factores de - Análisis de varianza para
confusión) prueba de F
Regresión múltiple
4.2.3. Prueba de Kolmogorov Smirnov

El test de Kolmogorov-Smirnov es un test de ajuste a una ley continua que tiene en cuenta el
conjunto de los cuantiles, en contraposición al test local del párrafo anterior. El caso típico sigue
siendo que se tiene una muestra de una ley desconocida.
La hipótesis nula es:
La ley tiene por función de distribución a donde es la función de distribución de

una ley continua dada. La idea es la siguiente: si la hipótesis es correcta, entonces
la función de distribución empírica de la muestra debe parecerse a la función . La función
de distribución empírica es la función que va de en , y que toma los valores:
Donde los son los estadígrafos de orden de la muestra (valores de la muestra puestos
en orden creciente). En otras palabras, es la proporción de elementos de la muestra

que son menores o iguales a .
Medimos el ajuste de la función de distribución empírica a la función por la distancia de

Kolmogorov-Smirnov, la cual es la distancia asociada a la norma uniforme entre funciones de
distribución. Para calcularla basta evaluar la diferencia entre y en los puntos .
Bajo la hipótesis , la ley del estadígrafo no depende de , porque los
valores que toma en los son variables aleatorias de ley . Pero la función de
distribución de no tiene una expresión explícita simple y debe ser calculada

numéricamente. Para muestras de tamaño suficientemente grande, se emplea el siguiente
resultado asintótico:
Proposición 2.2 Bajo la hipótesis , se tiene, para todo :
La serie converge muy rápidamente. En la práctica, para , la suma de los tres primeros
términos ya da una aproximación excelente. Si la hipótesis es
falsa, tiende a con . El test es por tanto necesariamente unilateral a
la derecha (rechazo de valores muy grandes). Supongamos que la distancia

toma el valor para una muestra de tamaño . El
estadígrafo vale . El p-valor correspondiente es:
El test de Kolmogorov-Smirnov se extiende a la comparación de dos funciones de distribución

empíricas y permite entonces poner a prueba la hipótesis de si dos muestras salieron de la
misma ley. Se pueden utilizar muchos otros tests de ajuste, como los de Stephens, Anderson-
Darling y Cramer-von Mises.
4.2.4. Prueba de Anderson Darling

Fue conocida en 1954, prueba tiene como propósito corroborar si una muestra de variables
aleatorias proviene de una población con una distribución de probabilidad específica. Trata de
una modificación de la prueba de kolmogorov-smirnov, aunque tiene la virtud de detectar las
discrepancias en los extremos de las distribuciones.
La principal desventaja que es necesario calcular los valores críticos para cada distribución.
Esta es muy sensible en los extremos de la distribución, por lo que debe ser usada con mucho
cuidado en distribuciones con límite inferior acotado, y no es confiable para distribuciones de
tipo discreto.
PROCEDIMIENTOS:
1. Obtener n datos de la variable aleatoria a analizar.
2. Calcular la media y la varianza de los datos.
3. Organizar los datos en forma ascendente: Yi i=1,2….,n.
4. Ordenar los datos en forma descendente Yn+1-i i = 1,2….,n.
5. Establecer explícitamente la hipótesis nula, proponiendo una distribución de probabilidad.
6. Calcular la probabilidad esperada acumulada para cada número Yi, PEA(Yi), y la
probabilidad esperada acumulada para cada número, PEA(Yn+1-i), a partir de la función de
probabilidad propuesta.
7. Calcular el estadístico de prueba:
8. Ajustar el estadístico de prueba de acuerdo con la distribución de probabilidad propuesta.

9. Definir el nivel de significancia de la prueba α, y determinar su valor crítico.
10. Comparar el estadístico de prueba con el valor crítico. Si el estadístico de prueba es menor
el valor crítico no se puede rechazar la hipótesis nula.
4.2.5. Prueba de Ryan Joiner
La prueba de Ryan - Joiner es usada para probar si una muestra viene de una
distribución específica.
Esta prueba es una modificación de la prueba de Kolmogorov-Smirnov donde se le da más
peso a las colas de la distribución que la prueba de Kolmogorov-Smirnov .En estadística, la
prueba de Ryan -Joiner es una prueba no paramétrica.
Si los datos de una muestra provienen de una distribución específica. La fórmula para el
estadístico determina si los datos (observar que los datos se deben ordenar) vienen de una
distribución con función acumulativa.
F. Formulas:
Estadístico de prueba para la prueba de Ryan Joiner

.2.6. Prueba de Shappiro Wilk.
En estadística, el Test de Shapiro–Wilk se usa para contrastar la normalidad de un conjunto

de datos. (Es un contraste de ajuste que se utiliza para comprobar si unos datos determinados
(X1, X2,…, Xn) han sido extraídos de una población normal. Los parámetros de la distribución
no tienen porqué ser conocidos y está adecuado para muestras pequeñas). Fue publicado en
1965 por Samuel Shapiro y Martin Wilk. Se considera uno de los test más potentes para el
contraste de normalidad, sobre todo para muestras pequeñas (n<30).
Un contraste de ajuste tiene como objetivo comprobar si con base en la información

suministrada por una muestra se puede aceptar que la población de origen sigue una
determinada distribución de probabilidad, en nuestro caso, la distribución normal. El estadístico
propuesto por Shapiro-Wilk es
donde
 x(i) (con el subíndice i entre paréntesis) es el número que ocupa la i-ésima posición en la
muestra;
 = (x1 + ... + xn) / n es la media muestral;
 las constantes ai se calculan2
Donde
Siendo m1, ..., mn son los valores medios del estadístico ordenado, de variables
aleatorias independientes e idénticamente distribuidas, muestreadas de distribuciones
normales. V es la matriz de covarianzas de ese estadístico de orden.
La hipótesis nula se rechazará si W es demasiado pequeño.
Interpretación:
Siendo la hipótesis nula que la población esta distribuida normalmente, si el p-valor es menor
a alfa (nivel de confianza) entonces la hipótesis nula es rechazada (se concluye que los datos
no vienen de una distribución normal). Si el p-valor es mayor a alfa, no se rechaza la hipótesis
y se concluye que los datos siguen una distribución normal.
PRUEBAS DE INDEPENDENCIA
 Las dos propiedades más importantes que deben

satisfacer los números de un conjunto ri son
uniformidad e independencia. A continuación
hablaremos de las pruebas estadísticas que tratan de
corroborar si los números en el intervalo (0,1) son
independientes o, en otras palabras, si parecen pseudo
aleatorios. Para probar la independencia de los
números de un conjunto ri primero es preciso formular
las siguientes hipótesis:
 H0: los números del conjunto ri son independientes

 H1: los números del conjunto ri no son independientes
Para realizar esta prueba de hipotesis existen

varios metodos, puede seleccionarse cualquiera de
la siguiente lista:
 Prueba de póker.
 Prueba de corridas arriba y abajo.
 Prueba de corridas arriba y abajo de la media.
 Prueba de la longitud de las corridas.
 Prueba de distancia.
 Prueba de series.
 Prueba de huecos.
PRUEBA DE CORRIDAS ARRIBA Y
ABAJO
 El procedimiento de esta prueba consiste en determinar una

secuencia de números (S) que sólo contiene unos y ceros, de
acuerdo con una comparación entre ri y ri-1. La secuencia de
unos y ceros se construye de esta manera: se coloca un
cero si el número ri es menor que o igual al número ri
anterior; en caso de ser mayor que el número ri anterior,
se pone un uno. Posteriormente se determina el número de
corridas observadas, C0 (una corrida se identifica como la
cantidad de unos y ceros consecutivos). Luego se calcula el valor
esperado, la varianza del número de corridas y el estadístico Z0,
mediante las ecuaciones:
 Si el estadístico Z0 es menor que el valor crítico de Z∞/2, se

concluye que los números del conjunto ri son independientes y se
acepta H0.
Ejemplo
 Realizar la prueba de corridas arriba y abajo con un
nivel de aceptación de 95% al siguiente conjunto de
números ri:
0.34 0.83 0.96 0.47 0.79 0.99 0.37 0.72 0.06 0.18
0.67 0.62 0.05 0.49 0.59 0.42 0.05 0.02 0.74 0.67
0.46 0.22 0.99 0.78 0.39 0.18 0.75 0.73 0.79 0.29
0.11 0.19 0.58 0.34 0.42 0.37 0.31 0.73 0.74 0.21
 Realizaremos la asignación de unos y ceros por renglón

(o fila). Por lo tanto, la secuencia S es:
S = {1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1,
0, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0}
 Obteniéndose un valor de C0 = 24, y ∞ = 5%. A
continuación se presentan los cálculos
correspondientes al valor esperado y a la varianza del
número de corridas:
 Como el estadístico Z0 es menor que el valor de tabla

de la normal estándar para Z∞/2  Z5%/2 = 1.96, se
acepta H0 y se concluye que los números del conjunto
ri son independientes. Es decir, de acuerdo a esta
prueba, los números son aptos para usarse en
simulación.
PRUEBA DE CORRIDAS ARRIBA Y
ABAJO DE LA MEDIA
 El procedimiento de esta prueba consiste en determinar una

secuencia de unos y ceros, de acuerdo con una comparación entre
los números del conjunto ri y 0.5. Posteriormente se determina el
número de corridas observadas C0, y los valores de n0 y n1. C0 es
el número de corridas en la secuencia, determinado de la misma
manera que en la prueba de corridas arriba y abajo; n0 es igual a
la cantidad de ceros en la secuencia, y n1 es igual a la cantidad de
unos en la secuencia, cumpliéndose que n0 + n1 = n. Luego se
calcula el valor esperado, la varianza del número de corridas y el
estadístico Z0 con las siguientes ecuaciones:
 Si el estadístico Z0 está dentro del intervalo: -Z∞/2  Z0  Z∞/2 se

concluye que los números del conjunto ri son independientes. De
lo contrario se rechaza que el conjunto de ri es independiente (se
rechaza H0).
Ejemplo
 Realizar la prueba de corridas arriba y abajo, con un
nivel de aceptación de 95%, al siguiente conjunto de
números ri:
0.809 0.042 0.432 0.538 0.225 0.88 0.688 0.772 0.036 0.854
0.397 0.268 0.821 0.897 0.07 0.721 0.087 0.35 0.779 0.482
0.136 0.855 0.453 0.197 0.444 0.799 0.809 0.691 0.545 0.857
0.692 0.055 0.348 0.373 0.436 0.29 0.015 0.834 0.599 0.724
0.564 0.709 0.946 0.754 0.677 0.128 0.012 0.498 0.6 0.913
Construiremos la secuencia de unos y ceros por renglón

quedado de la siguiente manera:
 S = {1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0,
1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1,
1, 0, 0, 0, 1, 1}
 A partir de la secuencia anterior se determina que hay
21 corridas, 23 ceros y 27 unos. Por lo tanto, C0=21,
n0=23 y n1=27. A continuación se presentan los
cálculos del valor esperado y de la varianza del número
de corridas:
 Como valor de Z0 cae dentro del intervalo

-1.96  Z0=-1.2484146  1.96 se dice que los números
del conjunto ri son independientes con un nivel de
confianza de 95% (se acepta H0). De acuerdo con esta
prueba, el conjunto de números ri se puede usar en un
estudio de simulación.
PRUEBA PÓKER
 Esta prueba consiste en visualizar el número ri con cinco

decimales (como si fuera una mano del juego de póker, con 5
cartas), y clasificarlo como: todos diferentes (TD),
exactamente un par (1P), dos pares (2P), una tercia (T), una
tercia y un par (TP), póker (P) y quintilla (Q).
Ejemplos:
ri = 0.69651  un par (1P)
ri = 0.13031  dos pares (2P)
ri = 0.98898  una tercia y un par (P)
 La prueba póker se puede realizar a números ri con tres,

cuatro y cinco decimales. Para ri con tres decimales solo hay
tres categorías de clasificación: todos diferentes (TD), un
par (1P) y una tercia (T). Cuando se consideran ri con
cuatro decimales se cuenta con cinco opciones para
clasificar los números: todos diferentes (TD), exactamente
un par (1P), dos pares (2P), una tercia (T) y póker (P).
 Prueba póker para números con cinco decimales
Categoría Probabilidad Ei
Todos diferentes (TD) 0.3024 0.3024n
Exactamente un par (1P) 0.5040 0.5040n
Dos pares (2P) 0.1080 0.1080n
Una tercia y una par (TP) 0.0090 0.0090n
Tercia (T) 0.0720 0.0720n
Póker (P) 0.0045 0.0045n
Quintilla (Q) 0.0001 0.0001n
 La prueba póker requiere el estadístico de la distribución Chi-

cuadrada X2∞,6 para números con cinco decimales.
El procedimiento de la prueba consiste en:

a) Determinar la categoría de cada número del conjunto ri.
b) Contabilizar los números ri de la misma categoría o clase para
obtener la frecuencia observada (0i).
c) Calcular el estadístico de la prueba X20 con la ecuación
Donde:
Ei = Frecuencia esperada de números ri en cada categoría
m = Cantidad de categorías o clases en las que se clasificaron
los números ri
Oi = Frecuencia observada
d) Comparar el estadístico de X20 con X2∞,m-1
 Si X20 es menor que X2∞,m-1 se acepta H0, o sea, que los

números del conjunto ri son independientes. En caso
contrario la independencia de los números del conjunto ri se
rechaza.
PRUEBA DE SERIES
 Consiste en comparar los números con el
propósito de corroborar la independencia entre
números consecutivos. Las hipótesis básicas son:
 H₀: los números del conjunto ri son independientes.

 H1: los números del conjunto ri no son
independientes.
PASOS:
 Crear una grafica de dispersión entre los números
consecutivos (ri , rr+1).
 Dividir la gráfica en m casillas, siendo m el valor entero

más cercano a que permita formar de preferencia
una matriz cuadrada.
 Se determina la frecuencia observada Oi,

contabilizando el numero de puntos en la casilla y su
correspondiente frecuencia esperada Ei
 De acuerdo con Ei = (n-1)/m, donde n-1 es el numero de
pares ordenados o puntos en la gráfica.
 Calcular el error o estadístico de prueba
 Si el valor del error es menor que o igual al estadístico

de tablas xα,m-1, no podemos rechazar la hipótesis de
independencia entre números consecutivos.
EJEMPLO:
Realizar la prueba de series a los siguientes 30

números, con un nivel de confianza de 95%.
0.872 0.950 0.343 0.058 0.384

0.219 0.041 0.036 0.213 0.946
0.570 0.842 0.706 0.809 0.300
0.618 0.152 0.462 0.005 0.203
0.291 0.151 0.596 0.443 0.868
0.913 0.511 0.586 0.608 0.879
Generar la gráfica de dispersión con los 29 pares

ordenados(x,y) = (ri , rr+1) siguientes:
(r1,r2)= 0.872 0.219

(r2,r3)= 0.219 0.570
(r3,r4)= 0.570 0.618
(r4,r5)= 0.618 0.291
(r5,r6)= 0.291 0.913
(r6,r7)= 0.913 0.95
…
(r28,r29)= 0.203 0.868

(r29,r30)= 0.868 0.879
Se contabiliza el número de puntos en cada casilla Oi y se
calcula la frecuencia esperada Ei de acuerdo Ei = 29/9. en la
ultima columna se presenta el calculo del estadístico de prueba.
Intervalo i Oi Ei=(n-1)/m =
29/9
1 3 3.22 0.015
2 3 3.22 0.015
3 5 3.22 0.984
4 3 3.22 0.015
5 6 3.22 2.400
6 1 3.22 1.531
7 5 3.22 0.984
8 1 3.22 1.531
9 2 3.22 0.462
Total 29 29 7.937
El valor de tablas es mayor que el

error total de 7.937, por lo cual no podemos rechazar la
hipótesis de independencia.
PRUEBA DE HUECOS
 Consiste en comparar los números con el
propósito de verificar el tamaño del “hueco” que
existe entre ocurrencias sucesivas de un número;
las hipótesis son las fundamentales:
 H₀: los números del conjunto ri son independientes.

 H1: los números del conjunto ri no son
independientes.
PASOS:
 Definir un intervalo de prueba(α,β), donde (α,β) є (0,1)
 Se construye una secuencia de 1 y 0 de esta manera: se

asigna un 1 si el ri pertenece al intervalo (α,β), y un 0 si
no pertenece.
 Ejemplo: si se define un intervalo (α,β)=(0.6,0.7) y se

tiene la muestra de 10 números.
 ri =(0.67,0 .62, 0.05,0.49,0.59,0.42,0.64,0.06,0.74,0.67)
 S={1,1,0,0,0,0,1,0,0,1}
 El tamaño del hueco i se define como el número de ceros
existentes entre unos consecutivos. En ejemplo tenemos
h=3
 A partir del conjunto anterior se determina la
frecuencia Oi, contabilizando el num. de ocurrencias de
cada tamaño de hueco y su correspondiente frecuencia
esperada Ei, de acuerdo con
 Ei = (h)(β-α)(1-(β-α))i
 Frecuencias observadas y esperadas en la prueba de

huecos.
Tamaño del EI (h)(β-α)(1-(β-α))i

Ei=(3)(0.7-0.6)(1-(0.7-
hueco OI 0.6))i Ei
0 1 (3)(0.1)(0.9)^0 0.3
1 0 (3)(0.1)(0.9)^1 0.27
2 1 (3)(0.1)(0.9)^2 0.243
3 0 (3)(0.1)(0.9)^3 0.2187
4 1 (3)(0.1)(0.9)^4 0.19683
≥5 0 (3)(0.9)^5 1.77147
TOTAL h=3 h=3 h=3
• Después se procede a calcular el error o

estadístico de prueba
EJEMPLO: REALIZAR LA PRUEBA DE HUECOS A LOS
SIGUIENTES 30 NÚMEROS, CON UN NIVEL DE CONFIANZA
DE 95% PARA EL INTERVALO (Α,Β) =(0.8,1.0)
0.872 0.950 0.343 0.058 0.384

0.219 0.041 0.036 0.213 0.946
0.570 0.842 0.706 0.809 0.300
0.618 0.152 0.462 0.005 0.203
0.291 0.151 0.596 0.443 0.868
0.913 0.511 0.586 0.608 0.879
Tomando los números por renglón se tiene:
S={1,1,0,0,0,0,0,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0,0,0,1,1,0,0,0,1}
0 7 1 1 10 0 3
 Prueba de huecos
Tamaño del EI (h)(β-α)(1-(β-α))i (Ei - Oi)2

Ei=(7)(1.0-0.8)(1-(1.0-
hueco OI 0.8))i Ei
0 2 1.4 0.257143
1 2 1.12 0.691429
2 0 0.896 0.896000
3 1 0.7168 0.111889
4 0 0.57344 0.573440
≥5 2 2.29376 0.037622
TOTAL h=7 7 2.567522
Ya que el estadístico de prueba =

2.567522 es menor
que el estadístico de tablas , no podemos

rechazar la hipótesis de independencia entre los
números.
PRUEBA DE INDEPENDENCIA (DATOS

CATEGÓRICOS)
 El procedimiento de ji cuadrada que se vio en la
exposición anterior, también se puede usar para
probar la hipótesis de independencia de dos variables
de clasificación.
 Suponga que deseamos determinar si las opiniones de

los votantes registrados del estado de Illinois con
respecto a una nueva reforma de impuestos son
independientes de sus niveles de ingreso. Una
muestra aleatoria de 1000 votantes registrados del
estado de Illinois se clasifican de acuerdo con su
posición en las categorías de ingreso bajo, medio o alto
y si están a favor o no de la nueva reforma de
impuestos. Las frecuencias observadas se presentan
en la siguiente tabla (mejor conocida como tabla de
contingencia)
 Nuestra decisión de aceptar o rechazar la Ho , de
independencia entre la opinión de un votante con respecto a
la nueva reforma de impuestos y su nivel de ingreso se basa
en que tan buen ajuste tenemos entre las frecuencias
observadas en cada una de las seis celdas y las frecuencias
que esperariamos para cada celda bajo la suposicion que Ho
es verdadera. Para encontrar estas frecuencias esperadas,
definamos los siguientes eventos:
 L : Persona con nivel de ingresos bajo
 M: Persona con nivel de ingresos medio
 H: Persona con nivel de ingresos alto
 F: persona a favor de la nueva reforma de impuestos
 A: persona en contra de la nueva reforma de impuestos.
 Con el uso de frecuencias marginales (que son los totales de

renglones y columnas en la tabla) podemos listar las
siguientes estimaciones de probabilidad
 Ahora bien si Ho es verdadera y las dos variables son

independientes debemos tener:
 Las frecuencias esperadas se obtienen al

multiplicar cada probabilidad de una celda por el
numero total de observaciones. Como antes,
redondeamos estas frecuencias a un decimal. Así,
se estima que el numero esperado de votantes de
bajo ingreso en nuestra muestra que favorecen la
nueva reforma fiscal es:
 Cuando Ho es verdadera, la regla general para

obtener la frecuencia esperada de cualquier celda
esta dada por la siguiente formula:
(Total de columna) x (total del renglón)
 Frecuencia esperada= _______________________

Gran total
COMPARACIÓN DE FRECUENCIAS
OBSERVADAS Y ESPERADAS
 En nuestro ejemplo necesitamos calcular solo las dos

frecuencias esperadas en el renglón superior de la
tabla y después encontrar las otras por sustracción. El
numero de grados de libertad con la prueba ji
cuadrada que aquí se usa es igual al numero de
frecuencias de celdas que se pueden llenar libremente
cuando se nos dan los totales marginales y el gran
total, en este caso es 2.
V = (r – 1) (c – 1)
v = ( 2 -1) ( 3 – 1 )= 2 Gl.
 Para probar la hipótesis nula de independencia,

usamos el criterio de decisión siguiente:
X² = ∑ (oi – ei)²
i ______
ei
Donde la suma se extiende a todas las celdas rc en
la tabla de contingencia r x c. si X² > X²a con v (r -
1)(c-1) grados de libertad, rechazar la hipotesis
nula de independencia al nivel de significancia a;
en cualquier otro caso, aceptar la hipótesis nula.
Probabilidad de un valor superior - Alfa (α)
Grados libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84

4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
11 17,28 19,68 21,92 24,73 26,76
12 18,55 21,03 23,34 26,22 28,30
13 19,81 22,36 24,74 27,69 29,82
14 21,06 23,68 26,12 29,14 31,32
15 22,31 25,00 27,49 30,58 32,80
16 23,54 26,30 28,85 32,00 34,27
17 24,77 27,59 30,19 33,41 35,72
18 25,99 28,87 31,53 34,81 37,16
19 27,20 30,14 32,85 36,19 38,58
20 28,41 31,41 34,17 37,57 40,00
21 29,62 32,67 35,48 38,93 41,40
22 30,81 33,92 36,78 40,29 42,80
23 32,01 35,17 38,08 41,64 44,18
 Al aplicar el criterio a nuestro ejemplo,
encontramos que:
Ahora de la tabla para X²0.05 = 5.991 con 2 grados

de libertad. Por lo tanto la Ho se rechaza.
Conclusión:
Entonces concluimos que la opinión de un votante
con respecto a la nueva reforma fiscal y su nivel de
ingresos no son independientes.
CORRECCIÓN DE YATES
Es importante recordar que la estadística sobre la
que basamos nuestra decisión tiene una distribución
que solo se aproxima por la distribución ji cuadrada.
Los valores ji cuadrada calculados dependen de las
frecuencias de las celdas y en consecuencia son
discretas.
La distribución ji cuadrada continua parece

aproximar muy bien a la distribución de muestreo
discreta de ji cuadrada, dado que el numero de
grados de libertad es mayor que 1. En una tabla de
contingencia de 2x2 donde solo tenemos 1 grado de
libertad, se aplica la correlación llamada Corrección
de Yates para continuidad. Por lo tanto:
Si las frecuencias de celdas esperadas son grandes,

los resultados corregidos y sin corrección son casi los
mismos. Cuando las frecuencias esperadas están
entre 5 y 10, se debe aplicar la corrección de Yates.
BIBLIOGRAFIA
 E.Walpole, H.Myers, L.Myers. PROBABILIDAD Y
ESTADISTICA PARA INGENIEROS . Pearson
Educacion. Mexico, 1999.
 http://es.scribd.com/doc/51329866/24/Pruebas-de-
independencia
 http://www.samiuc.es/index.php/estadisticas-con-
variables-binarias/valoracion-inicial-de-pruebas-
diagnosticas/chi-cuadrado-correccion-de-yates.html
 http://bioestadistico.com/chi-cuadrado-prueba-de-
independencia
Bondad de Ajuste
¿Qué es?
• Hablamos de bondad de ajuste cuando
queremos comparar una distribución
observada con los valores correspondientes
de una distribución teórica.
La prueba X2 hace uso de la distribución del mismo
nombre para probar la bondad del ajuste al
comparar el estadístico de prueba X2 con el valor en
tablas de la mencionada distribución X2 con v
grados de libertad y un nivel de significancia.
La fórmula básica de ji cuadrada es:
Donde:
O = frecuencia observada
E = frecuencia esperada o teórica
Problema
• Un científico de computadoras ha
desarrollado un algoritmo para generar
enteros pseudoaleatorios por encima del
intervalo de 0-9. El codifico el algoritmo y
genero 100 dígitos pseudoaleatorios
0 1 2 3 4 5 6 7 8 9 Total
n
Frecuencias 94 93 112 101 104 95 100 99 108 94 1000
Observadas
Frecuencias 100 100 100 100 100 100 100 100 100 100 1000
Esperadas
Hay evidencia que diga que el generador de números aleatorios esté

funcionando correctamente?
Si el generador de números aleatorios esta trabajando correctamente,
entonces los valores de 0-9 van a seguir una distribución uniforme
discreta. Lo que implica que cada uno de los enteros debe ocurrir
exactamente 100 veces. Eso es, las frecuencias esperadas = 100,
para i = 0,1 ,2…., 9. Desde que esas frecuencias esperadas pueden ser
determinadas sin estimar ningún parámetro de la muestra de los
datos, la resultante bondad de ajuste de 2 va a tener
k - p – 1 = 10 – 0 – 1 = 9 grados de libertad con un nivel de significancia
de 0.05.
k = Intervalos de clase
p = Numero de parámetros de la distribución hipotética mediante
estadísticas de muestra.
Probability and Statistics in Engineering and Management Science

William W. Hines and Douglas C. Montomery pag. 328
2.-Hipótesis
Ho: f(x) = fo(x)
En contraste con la hipótesis alterna:
Ha: f(x) ≠ fo(x)
X:variable aleatoria poblacional
f0 (x): la distribución de probabilidad especificada o
supuesta para X.
3.- Estadístico
4. Región Critica 1 –α
= 1-.95
=0.05
.95
5.- Regla
X²c > X²t = Se rechaza
( )
• 2
= .36
6.-Cálculos
2 ( )
• = .49
2 ( 2 ) X² =.36+.49+1.44+.01+.16+.25+0+.01+.64+.36=3.72
• 2 = 1.44
2 ( )
• = .01
2 ( )
• = .16
2 ( )
• = .25
2 ( )
• =0
. ,9=16.92
2 ( )
• = .01
2 ( )
• = .64
2 ( )
• = .36
• 7.-Desición
3.72 < 16.92 = No se Rechaza
8.-Conclusión
Ho no se rechaza por que no existe suficiente
evidencia estadística para decir que los datos
vienen de una distribución uniforme discreta.
Por lo tanto, el generador de números aleatorios
parece que trabaja satisfactoriamente.
ANALISIS DE JI
CUADRADA
(TABLA DE CONTINGENCIA/ PRUEBA
DE BONDAD DE AJUSTE/ PRUEBA DE
INDEPENDENCIA
ANÁLISIS JI CUADRADA (DISTRIBUCIÓN)
La distribución ji cuadrada es una de las

distribuciones de probabilidad mas
ampliamente utilizada en la estadística
inferencial.
Su uso reside en que, bajo algunos supuestos
razonables y poco exigentes, existen variables
que al calcularse pueden dar lugar a una
distribución aproximada de ji cuadrada.
PROPIEDADES DE LAS DISTRIBUCIONES JI-
CUADRADA
1. Los valores de X2 son mayores o iguales que 0.
2. La forma de una distribución X2 depende del gl=n-1. En

consecuencia, hay un número infinito de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal

es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas

estrechas que se extienden a la derecha; esto es, están
sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la

varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).
DISTRIBUCIÓN JI CUADRADA
La distribución ji cuadrada esta asociada a un
parámetro conocida como grado de libertad.
La forma de la distribución depende del valor de

este parámetro.
DISTRIBUCIÓN JI CUADRADA
APLICACIONES
 La distribución χ² tiene muchas aplicaciones
en inferencia estadística. La más conocida es la
de la denominada prueba χ² utilizada como
prueba de independencia y como prueba de
bondad de ajuste y en la estimación de varianzas
 Aparece también en todos los problemas
de análisis de varianza por su relación con
la distribución F de Snedecor, que es la
distribución del cociente de dos variables
aleatorias independientes con distribución χ².
PRUEBA JI CUADRADA
 La ji cuadrada se utiliza como una prueba de
significación cuando se tienen datos que se
expresan en frecuencias o que están en términos
de porcentajes o proporciones, y que pueden
reducirse a frecuencias.
 Cualesquier datos pueden reducirse a categorías
y a los datos así tabulados puede aplicárseles ji
cuadrada. Por ejemplo, las puntuaciones
respecto de una prueba de aptitud mental y una
prueba de destreza podrían tabularse como se
muestra a continuación, en una tabla de
contingencia.
TABLA DE CONTINGENCIA R X C
Donde:
~ n elementos tomados de una población pueden clasificarse con dos
criterios diferentes.
~ El primer criterio tiene r niveles, y que el segundo tiene c niveles.
Para utilizar el valor estadístico ji cuadrada, los datos deben ser

independientes, esto es, ninguna respuesta se relaciona con cualquiera otra.
Así mismo, las categorías en las que se colocan los datos deben ser
mutuamente
excluyentes, es decir, una frecuencia debe ser colocada en una y sólo una
categoría. Por último, deben utilizarse todos los datos. Todos los datos
observados deben ser empleados en un problema de ji cuadrada.
PRUEBA JI CUADRADA
 La fórmula básica de ji cuadrada es:
 Donde:
O = frecuencia de casilla (celda) observada
E = frecuencia esperada o teórica
 Al tomar decisiones acerca de parámetros, se

comparan los valores observados de ji cuadrada
calculados en los datos de muestra con los valores
críticos de la medida estadística encontrados en
la tabla que se provee.
PRUEBAS DE BONDAD Y AJUSTE
Estas pruebas permiten verificar que la población
de la cual proviene una muestra tiene una
distribución especificada o supuesta.
Sea X: variable aleatoria poblacional

f0 (x): la distribución de probabilidad especificada
o supuesta para X.
Se desea probar la hipótesis:

Ho: f(x) = f0(x)
En contraste con la hipótesis alterna:

Ha: f(x) ≠ f0(x) (negación de Ho)
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
La prueba Ji cuadrada hace uso de la

distribución del mismo nombre para
probar la bondad del ajuste al comparar el
estadístico de prueba X02 con el valor en
tablas de la mencionada distribución Ji
cuadrada con v grados de libertad y un
nivel de significancia alfa.
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
X² cuando la distribución básica es discreta.
Ejemplo:
Imagínese que se esta investigando la relación

entre la orientación política y los métodos de
crianza de los niños.
Se presentan tres muestras aleatorias: 32 liberales,
30 moderados y 27 conservadores.
Los métodos de crianza se categorizan como “no
rígidos”, ”Moderados” o “autoritarios”
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
Ejemplo:
Hipótesis Nula:
La frecuencia relativa de los métodos no rígidos,
moderados y autoritarios de crianza de los niños
es igual para liberales, moderados y
conservadores.
Hipótesis Alternativa o de Investigación:
La frecuencia relativa de los métodos no rígidos,
moderados y autoritarios de crianza de los niños
no es igual para liberales, moderados y
conservadores.
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
Ejemplo (estadístico):
Nota
Buen ajuste: Si las frecuencias observadas están cerca de
las frecuencias esperadas correspondientes, el valor ji
cuadrada será pequeño.
Mal Ajuste: si las frecuencias observadas difieren de
manera considerable de las frecuencias esperadas, el valor
ji cuadrada será grande y ajuste es pobre.
~Un buen ajuste conduce a un no rechazo de Ho, mientras
que un ajuste pobre conduce a su rechazo.
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
Metodo de Conservador Moderado Liberal
Crianza fo f0 f0
No rígido 7 9 14
Moderado 10 10 8
Autoritario 15 11 5
TOTAL 32 30 27
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
Fe = (total marginal de renglón) (total marginal de
columna)/ N
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
Fe (1,1) = (30) (32) / 89 = 960/89 =10.79
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
RESTAR LAS FRECUENCIAS ESPERADAS DE LAS FRECUENCIAS OBTENIDAS
Fo - fe
[1,1] 7-10.79=3.79
[1,2] 10-10.07=-0.07
[1,3] 15 – 11.14 = 3.86
[2,1] 9 – 10.11= -1.11
[2,2] 10 – 9.44= 0.56
[2,3] 11 – 10.45= 0.55
[3,1] 14 – 91 = 4.9
[3,2] 8 – 8.49 = 0.49
[3,3] 5 – 9.4 = -4.4
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
Elevar esta diferencia al
cuadrado
(fo – fe)²
[1,1] (3.79)²= 14.36

[1,2] (-0.07) ²=0.01
[1,3] (3.86) ²=14.9
[2,1] (-1.11) ²=1.23
[2,2] (0.56) ²=0.31
[2,3] (0.55) ²=0.3
[3,1] (4.9) ²=24.01
[3,2] (0.49) ²=0.24
[3,3] (-4.4) ²=19.36
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
Dividir entre la frecuencia
esperada
(fo – fe)²/ fe
[1,1] 14.36/10.79=1.33
[1,2] 0.01/10.07=0.00
[1,3] 14.9/11.14=1.34
[2,1] 1.23/10.11=0.12
[2,2] 0.31/9.44=0.03
[2,3] 0.3/10.45=0.03
[3,1] 24.01/9.1=2.64
[3,2] 0.24/8.49=0.03
[3,3] 19.36/9.4=2.06
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
Dividir entre la frecuencia
esperada
∑=(fo – fe)²/ fe
1.33
0.00
1.34
0.12 X² = 7.58
0.03
0.03
2.64
0.03
2.06
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
Ejemplo:
Así encontramos el valor de X², para interpretar este calor debemos
determinar el numero apropiado de grados de libertad, esto
puede hacerse por medio de tablas teniendo cualquier numero de
renglones y columnas y empleando la siguiente formula:
gl = (r-1)(c-1)
donde :
r = numero de renglones en la tabla de frecuencias obtenidas.
C = numero de columnas en la tabla de frecuencias obtenidas.

Para nuestro ejemplo
gl = (r-1)(c-1)
= (3-1)(3-1
= (2)(2) = 4
PRUEBA JI CUADRADA
(BONDAD DEL AJUSTE)
Ejemplo.
X² obtenida = 7.58
X² en la tabla = 9.49
gl = 4
α = 0.05
Se necesita un valor de ji cuadrada por lo menos de 9.49
para rechazar la hipótesis nula, dado que nuestra X²
obtenida es de solo 7.58 debemos de aceptar la
hipótesis nula y atribuir nuestras diferencias
muéstrales a la operación de la simple casualidad.
No se descubrieron evidencias estadísticamente
significativas que indiquen que la frecuencia relativa
de los métodos de crianza de los niños difieren para
los liberales, los moderados y los conservadores.
EJEMPLO PÁG. 353 PROBLEMA 4.47
Se lanza 180 veces un dado con los sig. Resultados:
X 1 2 3 4 5 6
f 28 36 36 30 27 23
¿Es un dado balanceado? Utilice un nivel de

significancia de 0.01
X 1 2 3 4 5 6
1.- Datos Obv 28 36 36 30 27 23 180
Fe=?
Fo=? Esp 30 30 30 30 30 30 180
V= (r-1)(c-1)=(6-1)(2-1)=5
N=180
1-α= 0.01

2.- Hipótesis
Ho = f(x) =fo(x) (Fe=Fo)
Ha = f(x) ≠ fo(x)
3.- Estadístico
1 –α
= 1-.99
4.- Región de Rechazo =0.01
.99

5.- Regla
/X²c/ > /X²t/ = Se rechaza
6.- Cálculos
X² = 0.013 + 1.2 +1.2+ 0 + 0.3 + 1.6 = 4.47
7.- Decisión
/4.47/ < /15.09/ = No se Rechaza
8.- Conclusión
Ho no se rechaza por lo que no hay suficiente evidencia
estadística para decir que el dado no esta balanceado
con un nivel de significancia de 0.01
PRUEBA JI CUADRADA
(PRUEBA DE INDEPENDENCIA)
Supongamos que de n elementos de una población
se han observado dos características X e Y,
obteniéndose una muestra aleatoria simple
bidimensional (X1,Y1),(X2,Y2),...,(Xn,Yn).
Sobre la base de dichas observaciones se desea
contrastar si las características poblacionales X e
Y son independientes o no. Para ello se dividirá
el conjunto de posibles valores de X en k
conjuntos disjuntos A1,A2,...,Ak; mientras que
el conjunto de posibles valores Y será
descompuesto en r conjuntos disjuntos:
B1,B2,...,Br.
PRUEBA JI CUADRADA
Al clasificar os elementos de la muestra, aparecerá

un cierto número de ellos, i j n , en cada una de las
k × r clases así constituidas, dando lugar a una tabla
de contingencia de la forma:
PRUEBA JI CUADRADA
PRUEBA JI CUADRADA
EJEMPLO:
Para estudiar la dependencia entre la práctica de algún
deporte y la depresión, se seleccionó
una muestra aleatoria simple de 100 jóvenes, con los
siguientes resultados:
Sin depresión Con depresión

Deportista 38 9
No deportista 31 22
Determinar si existe independencia entre la actividad

del sujeto y su estado de ánimo. Nivel de significancia
(5%)
PRUEBA JI CUADRADA
PRUEBA JI CUADRADA
Por lo tanto como el valor del estadístico es
superior al valor crítico, concluimos que debemos
rechazar la hipótesis de independencia y por lo
tanto asumir que existe relación entre la
depresión e los hábitos deportistas del individuo.
EJEMPLO: PÁG. 354 PROBLEMA 13
Una muestra aleatoria de 90 adultos se clasifica de
acuerdo a su genero y al numero de horas que se
pasan viendo televisión durante la semana:
Utiliza un nivel de significancia de 0.01 y pruebe la

hipótesis de que el tiempo que pasan viendo es
independiente de si el televidente es hombre o
mujer
SOLUCIÓN
Debemos primero calcular las frecuencias
esperadas bajo el supuesto de independencia. La
tabla de frecuencias esperadas sería:
Hombre Mujer Total

Mayor de 25hrs 20.53 23.46 44
Menor de 25hrs 21.46 24.53 46
Total 42 48 90
Datos
n= 90
1 – α= 0.01
V= 1
SOLUCIÓN
2.- Hipótesis
Ho = f(x) >25
Ha = f(x) <25
3.- Estadístico
1 –α
= 1-.99
4.- Región de Rechazo =0.01
.99
SOLUCIÓN
5.- Regla
/X²c/ > /X²t/ = Se rechaza
6.- Cálculos
X² = 1.48 +1.30 + 1.43 + 1.24 =5.45
7.- Decisión
/5.45/ < /6.63/ = No se Rechaza
Instituto Tecnológico
de Piedras Negras.
Ingeniería Industrial.
Estadística Inferencial I.
Unidad 4. Tema 4.1.4.
Tablas de Contingencia.
Tablas de Contingencia.
• Una tabla de contingencia es una de las formas mas comunes de resumir
datos categóricos. La mayoría de las veces organiza la información
contenida en un experimento cuando ésta es de carácter bidimensional, es
decir, cuando está referida a dos criterios, o factores.
• Sean X y Y dos Criterios categóricos con I y J categorías respectivamente,
entonces I x J es el numero de Clasificaciones que existe.
• Se usan en relación con clasificaciones múltiples. El tipo mas sencillo de
una tabla de contingencia se obtiene si clasificamos una muestra mediante
dos criterios. A las diferentes clasificaciones se les llama celdas, las cuales
contienen las frecuencias observadas.
Ejemplo:
• En un experimento conducido en Canadá en 1956, los hombres pensionados de
cierta edad (60-64 años) se clasificaron de acuerdo al habito de fumar y a la
mortalidad. Se consideraron dos clases con respecto al habito de fumar, a saber,
no fumadores, y fumadores de pipa. Con respecto a la mortalidad, también se
consideraron dos clases, a saber, personas aún con vida y personas que murieron
dentro de los seis años siguientes al comienzo del experimento.
Habito de fumar
Mortalidad No fumadores Fumadores de pipa
Muertos 117 54
Vivos 950 348
• Las tablas de contingencia 2x2 y 2x3 son ejemplos de tablas en dos direcciones. Una
tabla de contingencia en tres direcciones se podría haber obtenido al tener
clasificadas a las personas de acuerdo a un tercer criterio, por ejemplo el sexo
(hombre-mujer). Tabla de 2x2x2
• Clasificaciones:
Habito de fumar 1. Hombre no fumador muerto
Sexo No fumadores Fumadores de pipa
Hombres 2. Hombre no fumador vivo
Mujeres
3. Hombre fumador de pipa muerto
4. Hombre fumador de pipa vivo
Mortalidad 5. Mujer no fumadora muerta
Sexo Muertos Vivos
Hombres 6. Mujer no fumadora viva
Mujeres
7. Mujer fumadora de pipa muerta
8. Mujer fumadora de pipa viva
Representación Grafica
• En algunos casos es conveniente para propósitos comparativos representar
mediante un mismo gráfico dos características que están relacionadas. Estas
gráficas se llaman gráfico de barras.
• EJEMPLO:
1. Una compañía opera cuatro máquinas tres turnos al día. De los registros de
producción, se obtienen los siguientes datos sobre el número de fallas
Maquinas
Turnos A B C D
1 4 2 1 1
2 3 1 1 1
3 2 3 2 4
Grafica de número de fallas en cada una de Turnos 1 2
Maquinas
3 4
las máquinas por turno 1

2
3
4
3
2
2
1
3
1
1
2
1
1
4
4.5
4
3.5
NUMERO DE FALLAS
3
2.5
2
1.5
1
0.5
0
A B C D
MAQUINAS
1 2 3
Frecuencias marginales.
• Llamaremos frecuencia absoluta marginal de xi de X al número de individuos de
la muestra para los que los que X toma el valor de xi. La notación utilizada es ni
de modo que:
• De la misma forma se define la frecuencia marginal en la variable Y, como la que

tendría si no se tuviera en cuenta la X, o la suma de la columna correspondiente.
• En la tabla del ejemplo, la frecuencia marginal de B es 26, suma de las

frecuencias de la segunda fila.
• La frecuencia marginal de Marzo es igual a 20.
Meses
Niveles Enero Febrero Marzo Abril Mayo
A 4 6 7 8 8
B 3 3 6 5 9
C 9 7 7 13 14
• El problema que se considera en relación con las tablas de
contingencia consiste en si las características que llevan a la
clasificación son independientes, esto es, la distribución de una
característica debe ser la misma independientemente de la otra.
Bibliografía.
•Kreyszig, Erwin.(1994). “Introducción a la Estadística Matemática, Principios y
métodos”. México. Ed. Limusa
•http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/Categor/Tema2Cate.
pdf
•http://www.uam.es/personal_pdi/economicas/eva/pdf/tab_conting.pdf
•http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_141_41.ht
ml
PRUEBAS PARAMÉTRICAS
SON MÁS POTENTES QUE LAS NO PARAMÉTRICAS.
Las pruebas paramétricas tienen mayor capacidad para detectar una
relación real o verdadera entre dos variables, si es que la misma existe.
Por ello, exigen que los datos a los que se aplican, cumplan tres
requisitos:
1. Variable numérica: Que las variable de estudio (dependiente) esté

medida en una escala que sea por lo menos de intervalo.
2. Normalidad: Que los valores de la variable dependiente sigan una

distribución normal; por lo menos, en la población a la que
pertenece la muestra.
3. Homocedasticidad: Que las varianzas de la variable dependiente

en los grupos que se comparan sean aproximadamente iguales
(homogeneidad de las varianzas).
* Cuando los datos cumplen con los requisitos

indicados, las pruebas estadísticas paramétricas
exhiben su máximo poder.
* Cuando estas pruebas estadísticas se aplican a

datos que no cumplen al menos uno de los requisitos
señalados, pierden parte de su poder.
* Si se puede utilizar una prueba paramétrica y se usa

una no paramétrica hay una pérdida de información.
* Las pruebas estadísticas no paramétricas, no hacen

a los datos ninguna de las exigencias que les hacen las
pruebas estadísticas paramétricas; por eso se les
denomina "pruebas estadísticas libres de distribución".
La mayoría de procedimientos paramétricos

requiere conocer la forma de distribución para las
mediciones resultantes de la población estudiada.
Para la inferencia paramétrica es requerida como
mínimo una escala de intervalo, esto quiere decir
que nuestros datos deben tener un orden y una
numeración del intervalo. Es decir nuestros datos
pueden estar categorizados en: menores de 20
años, de 20 a 40 años, de 40 a 60, de 60 a 80, etc, ya
que hay números con los cuales realizar cálculos
estadísticos. Sin embargo, datos categorizados en:
niños, jóvenes, adultos y ancianos no pueden ser
interpretados mediante la estadística paramétrica
ya que no se puede hallar un parámetro numérico
(como por ejemplo la media de edad) cuando los
datos no son numéricos.
Estadística paramétrica Es la que requiere que los elementos que
integran las muestras contengan elementos parámetros o medibles.
La estadística paramétrica clásica plantea tres tipos de problemas:
Estimación puntual en la que pretendemos dar un valor al

parámetro a estimar.
Estimación por intervalos (buscamos un intervalo de

confianza)
Contrastes de hipótesis donde buscamos contrastar

información acerca del parámetro.
PRUEBAS NO PARAMÉTRICAS
método que no requiere conocimiento de la
distribución del muestreo estadístico.
Contrastan hipótesis que no son afirmaciones

sobre parámetros y no dependen de la forma
de la distribución poblacional
Las pruebas estadísticas no paramétricas son las que, a pesar de
basarse en determinadas suposiciones, no parten de la base de que
los datos analizados adoptan una distribución normal. Técnica
estadística que no presupone ninguna distribución de probabilidad
teórica de la distribución de nuestros datos.
Se denominan pruebas no paramétricas aquellas que no presuponen

una distribución de probabilidad para los datos, por ello se conocen
también como de distribución libre (distribución free).
En la mayor parte de ellas los resultados estadísticos se derivan
únicamente a partir de procedimientos de ordenación y recuento,
por lo que su base lógica es de fácil comprensión.
VENTAJAS DE LOS MÉTODOS NO PARAMÉTRICOS

Los métodos no paramétricos pueden
aplicarse a una amplia variedad de Los métodos no paramétricos, por lo
situaciones puesto que no tienen los regular, implican cálculos más
requisitos más estrictos de los métodos sencillos que los métodos
paramétricos correspondientes. En paramétricos correspondientes y, por
particular, los métodos no paramétricos no lo tanto, son más fáciles de
requieren de poblaciones distribuidas comprender y aplicar. (Sin embargo,
normalmente. como la tecnología ha simplificado los
cálculos, es probable que la facilidad
A diferencia de los métodos paramétricos, los de los cálculos no sea un factor tan
métodos no paramétricos a menudo pueden importante).
aplicarse a datos categóricos, como el género
de quienes responden una encuesta.
DESVENTAJAS DE LOS MÉTODOS NO PARAMÉTRICOS
Los métodos no paramétricos tienden a

desperdiciar información porque los Las pruebas no paramétricas no son
datos numéricos exactos suelen tan eficientes como las pruebas
reducirse a una forma cualitativa. Por paramétricas, de manera que con una
ejemplo, en la prueba del signo no prueba no paramétrica generalmente
paramétrica las pérdidas de peso de necesitamos evidencia más fuerte
las personas sometidas a una dieta se (como una muestra más grande o
registran simplemente como signos diferencias mayores) para rechazar una
negativos; las magnitudes reales de las hipótesis nula.
pérdidas de peso se ignoran.
Comparaciones y análisis
numéricos
Análisis Paramétrico No paramétrico

Describir un grupo , 2 Mediana, rango
Comparar un grupo T Student de una Prueba Wilcoxon

a un valor muestra
Comparar medias T Student de dos Mann-Whitney
en 2 grupos muestras
Comparar medias T Student Prueba Wilcoxon
en 2 grupos apareada
apareados
Comparar medias ANOVA Kruskal-Wallis
en 3 o mas
grupos
Correlación entre Pearson (lineal) Spearman
dos variables (monotónica)
4.2.4 Prueba de Anderson Darling
¿Qué es la prueba de Anderson – Darling?

La pruebe de Anderson Darling se utiliza para probar si una muestra de datos
proviene de una población con distribución especifica.
Se trata de una modificación de la KS prueba y le da mas peso a las colas que hace
la KS. La prueba de KS es la distribución gratuita en el sentido de que los
valores críticos no dependen de la distribución especifica se esta probando.
La prueba de Anderson Darling hace uso de la distribución especifica para el

calculo de valores críticos. Esto tiene la ventaja de permitir una prueba mas
sensible y la desventaja de que los valores críticos deberán calcularse para
cada distribución.
Actualmente, las tablas de valores críticos están disponibles para la normal

exponencial, weibull, valores extremos tipo I y las distribuciones logísticas.
La formula para el estadístico A determina si los datos

(observar que los datos se deben ordenar) vienen de una distribución con
función acumulativa F.
donde
El estadístico de la prueba se puede entonces comparar contra las

distribuciones del estadístico de prueba (dependiendo que F se utiliza) para
determinar el P-valor.
La prueba de Anderson – Darling se define como:
Nivel de significación: 0,10 0,05 0,01 0,005 0,002
Región critica: Los valores críticos para la prueba de Anderson –

Darling dependen de la distribución especifica que se esta
probando. Los valores tabulados y las formulas se han publicado
para determinada distribución de unos pocos (normal,
lognormal, exponencial, Weibull, extrema tipo valor logística 1)
Situándonos en el caso de bondad de ajuste a la distribución

normal se consideran los siguientes casos:
Para cada uno de los casos existe una tabla estadística para realizar la prueba de la
Hipótesis, Ho: “La muestra anterior proviene de una distribución normal”. La
estadística de Anderson – Darling se calcula para los cuatro casis de la misma
manera; sin embargo en el caso 3 se debe multiplicar por un factor de correlación
el cual es 1 + (0.75/n) + (2.25/n^2) que mejora la aproximación.
La prueba de Anderson – Darling para la bondad de ajuste norma, en el caso 0, se

realiza siguiendo los siguientes pasos:
a) Ordenar en forma ascendente a las c) Calcular según la formula dada.
b) Calcular y determinar d) Comparar con el valor de tablas para

determinar y llegar a una conclusion
las probabilidades acumuladas P(i) acerca de Ho.
correspondientes a los Z(i) con ayuda de
una tabla de distribución normal.
Ejemplo
Los siguientes datos fueron recolectados por Bob Soulen de NIST en octubre de 1971,
como una secuencia de observaciones recolectadas en equi-espacio en tiempo, de un
voltímetro para comprobar el proceso de temperatura en un termómetro de baja
temperatura experimental. comprobar que los datos recolectados siguen una
distribución normal.
Ho: prueba que los datos siguen una distribución normal
Ha: prueba que los datos no siguen una distribución normal

 En estadística, el Test de Shapiro–Wilk se usa para
contrastar la normalidad de un conjunto de datos. Se
plantea como hipótesis nula que una muestra x1,
..., xn proviene de una población normalmente
distribuida. Fue publicado en 1965 por Samuel
Shapiro y Martin Wilk. Se considera uno de los test
más potentes para el contraste de normalidad, sobre
todo para muestras pequeñas (n<30).
El estadístico del test es:
donde
 x(i) (con el subíndice i entre paréntesis) es el número
que ocupa la i-ésima posición en la muestra;
 = (x1 + ... + xn) / n es la media muestral;
 las constantes ai se calculan
Donde
siendo m1, ..., mn son los valores medios del

estadístico ordenado, de variables aleatorias
independientes e idénticamente distribuidas,
muestreadas de distribuciones normales. V es la
matriz de covarianzas de ese estadístico de orden.
La hipótesis nula se rechazará si W es demasiado
pequeño.
Interpretación: Siendo la hipótesis nula que la

población esta distribuida normalmente, si el p-valor
es menor a alfa (nivel de confianza) entonces la
hipótesis nula es rechazada (se concluye que los
datos no vienen de una distribución normal). Si el p-
valor es mayor a alfa, no se rechaza la hipótesis y se
concluye que los datos siguen una distribución normal.
INTRODUCCION PRUEBAS NO PARAMETRICAS
• LAS PRUEBAS NO PARAMETRICAS NO ASUMEN ACERCA DE LOS

PARAMETROS DE DISTRIBUCION NI SE PREOCUPA POR EL TIPO DE
DISTRIBUCION, SI NO TRABAJAN CON SIMPLE ORDENACION Y RECUENTO A
LOS VALORES DE LA VARIABLE SIN IMPORTAR LA DISTRIBUCION.
• COMO SE DEBEN USAR LAS PRUEBAS PARAMETRICAS
• CON DATOS DE DISTRIBUCION LIBRE (NO NECESARIAMENTE NORMAL). SI
UN GRUPO TIENE DISTRIBUCION NORMAL MIENTRAS OTRO NO.
• SI SE TRATA DE DATOS CUANTITATIVOS, ORDINALES O NOMINALES.
• CON VARIANZA GRANDE, UN GRUPO CON VARIANZA 0 Y EL OTRO NO.
• AL TRABAJAR CON MUESTRAS PEQUEÑAS.
PRUEBAS NO PARAMETRICAS
• CHI CUADRADO DE PEARSON (INDEPENDENCIA DE BONDAD DE AJUSTE,
HOMOGENIEDAD)
• PRUEBA EXACTA DE FISHER
• U DE MANN WHITNEY- W DE WILCOXON
• T DE WILCOXON
• MAC NEMAR
• KRUSKALL WALLIS
• FRIEDMAN
• Q DE COCHRAN
ESCALAS DE MEDICION
Medición
Efectuar comparaciones de una cantidad con su respectiva unidad.
Registrar el numero de veces que la segunda esta contenida en la primera.
VARIABLE
Es la caracterisitica de la muestra o poblacion de estudio
Los datos son el producto de su medicion
ESCALAS DE MEDICION
NOMINAL
ORDINAL
INTERVALO
RAZON
ESCALA NOMINAL
USAR NOMBRES PARA ESTABLECER CATEGORIAS

PUEDE USAR NUMEROS PERO DE CARÁCTER SIMBOLICO
ESCALA ORDINAL
TAMBIEN DEFINE CATEGORIAS, PERO ESTABLECE UNA RELACION MAYOR O MENOR QUE
LOS NUMEROS ASIGNADOS SI INDICAN JERARQUIAS
NO SE PUEDE ESTABLECER DISTANCIA ENTRE DOS PUNTOS
ESCALA DE INTERVALO
REUNE LAS CARACTERISTICAS ANTERIORES

REGISTRA DE MANERA NUMERICA LA DISTANCIA ENTRE DOS PUNTOS
EL CERO NO INDICA AUSENCIA DE VARIABLE Y ES ARBITRARIO
ESCALA DE RAZON
EL CERO INDICA AUSENCIA DE VARIABLE

LA DIFERENCIA ENTRE DOS VALORES ES DE MAGNITUD CONOCIDA
TEMA: 4.2.3 PRUEBA DE KOLMOGOROV–SMIRNOV
Prueba de Bondad de Ajuste de

Kolmogorov-Smirnov (KS)
• Las pruebas de kolmogorov-smirnov son
pruebas no parametricas para diferencias
entre distribuciones acumulativas. La prueba
de una muestra se refiere al acuerdo entre
una distribucion acumulativa observada, o
empirica de valores muestrales y una funcion
de distribucion continua especificada; por lo
tanto, es una prueba de bondad de ajuste.
La prueba de dos muestras se refiere al acuerdo
entre dos distribuciones acumulativas
observadas; prueba la hipótesis de si las dos
muestras independientes proceden de
distribuciones continuas idénticas, y es
sensible a diferencias de población respecto
de ubicación, dispersión o sesgadura
• La prueba de una muestra de kolmogorov-

Smirnov es generalmente mas eficiente que la
prueba ji cuadrada para bondad de ajuste de
muestras puequeñas, y puede servir para
muestras muy pequeñas en las que no se
aplica la prueba ji cuadrada.
• La prueba de una muestra se basa en la

diferencia maxima absoluta D entre los valores
de la distribucion acumulativa empirica de una
muestra aleatoria de tamaño n y una
distribucion acumulativa teorica especificada.
Para deeterminar esta diferencia es mayor de
lo que razonablemente podria esperarse para
un nivel dado de significacion. Consultamos el
valor critico de D en la tabla 10
• Ejemplo:
se desea comprobar si las perforaciones en
lamina estañada electrolítica están
uniformemente distribuidas a lo largo de una
bobina electro plateada. Con base en las
siguientes distancias en pulgadas de 10
perforaciones desde una orilla de una larga
tira de lamina estañada de 30 pulgadas de
ancho:
4.8 , 14.8, 28.2, 23.1, 4.4, 28.7, 19.5, 2.4, 25.0, 6.2
pruebe la hipótesis nula en el nivel de significación

de 0.05
SOLUCION
• Hipótesis nula:
0 para x ≤ 0
F(x)= x para 0˂ x ˂ 30
30
1 Para x ≥ 30
• Nivel de significancia:
 = 0.50
• Criterio:
rechazar la hipótesis nula si D>0.410, donde D
es la diferencia máxima entre las distribución
acumulativa empírica y la distribución
acumulativa supuesta conforme a la hipótesis
nula
• Calculos:
al trazar las dos distribuciones acumulativas
como en la figura 10.1 encontramos que la
diferencia es mas grande cuando x=6.2 y que
su valor es
D=0.40- 6.2
30 =0.193
• Decisión:
dado que D =0.193 no excede de 0.410, la
hipótesis nula (de que las perforaciones están
uniformemente distribuidas a lo largo de la
lamina estañada) no puede rechazarse
• A pesar de su atractivo intuitivo, las pruebas

de kolmogorov-Smirnov carecen de eficacia.
Las diferencias en las colas pueden detectarse
mas fácilmente si la diferencia entre la
distribución acumulativa empírica,F n Y F se
divide F ( x)(1  F ( x)) . En particular, la
prueba de Anderson –Darling se basa en 
grandes valores de la A² =   Fn( x)  F ( x)  F ( x)(1  F ( x)) f ( x)dx

 21

• A primera vista, el calculo numérico de esta

estadística parece difícil. Pero es posible
demostrar que A   (2i  1)(In(u )  In(1  u )) / n  n
n
2
i n 1i
i 1
donde u i  f ( x( i )) es el valor de la
distribución acumulativa teórica en la iesima
observación mas grande x (i )
• La hipótesis nula es rechazada para grandes
valores de la estadística A². Como pauta
general, el punto de 5% de muestras grandes
es 2.492 y el punto de 1% es de 3.857. se a
sugerido que estos valores críticos son suma
mente exactos incluso para muestras tan
pequeñas como 10
Ejercicio
El entrenador de salto de un grupo de atletas, desea conocer con vistas al procesamiento de los
datos por el obtenidos sobre salto de una muestra aleatoria de atletas de esa especialidad en un
CVD, si las mediciones realizadas por él están distribuidas normalmente. Los datos son los
siguientes:
Salto Largo
1 1.60
2 1.65 Ho: Los datos están distribuidos normalmente
3 1 .55 H1: Los datos no están distribuidos normalmente.
4 1.62
5 1.64
6 1.70
7 1.71
8 1.68
9 1.66
10 1.67
11 1.65
12 1.68
13 1.69
14 1.70
PRUEBA DE RYAN-JOINER.
 Esta prueba evalúa la normalidad calculando la
correlación entre sus datos y las puntuaciones
normales en sus datos. Si el coeficiente de
correlación se encuentra cerca de uno, es
probable que la población sea normal. La
estadística de Ryan-Joiner evalúa la solidez de
esta correlación; Si se encuentra por debajo del
valor critico apropiado, se rechazara la hipótesis
nula (H0) de normalidad en la población, esta
prueba es similar a la prueba de normalidad de
Shapiro-Wilk.
 En contraste R-J es especifico para someter a
prueba la normalidad analizando el grado de
ajuste de los datos de la muestra a una recta,
dibujada sobre un papel probabilístico normal.
 Finalmente la prueba R-J, basada en la técnica
de Shapiro-Wilk, resulta extremadamente útil
para muestras de pequeño tamaño (n<30),
mostrando una elevada potencia de contraste.
VALORES CRÍTICOS APROXIMADOS PARA LA
ESTADÍSTICO DE RYAN-JOINER.
 La prueba de normalidad de Ryan-Joiner es muy
similar a la de Shapiro-Wilk, como ya habíamos
mencionado anteriormente, pero los autores dicen
que es mas fácil implementarlo en un software y
explicarlo a los usuarios, ya que es una simple
versión de correlación entre los datos de la
muestra, yi y bi, son los puntos de porcentaje de
una distribución normal.
ESTADÍSTICO DE RYAN-JOINER.
 Puesto que la media de los valores de b es 0, se
puede simplificar esta expresión ignorando el
cambio de los valores de y por su media a:
USO MINITAB.
 La prueba resultante esta correlacionada con la
de Shapiro-Wilk, así que cualquiera de las
pruebas se puede utilizar y se producen
resultados muy similares. La prueba de Ryan-
Joiner se implementa en el paquete de software
Minitab pero no ampliamente en otros lugares.
 A continuación veremos un ejemplo en Minitab:
 En el método de Anderson Darling o Ryan Joiner,

si el valor de probabilidad P de la prueba es
mayor a 0.05, se considera que los datos son
normales.
USO DEL SOFTWARE

ESTADÍSTICO
La importancia del software en la

estadística
• ¿Qué es un paquete estadístico?
• Un paquete estadístico es un programa
informático que está especialmente diseñado
para resolver problemas en el área de la
estadística, o bien está programado para
resolver problemas de esta área. Existen
muchos programas que no son especialmente
estadísticos pero que pueden hacer algunos
cálculos aplicables en estadística.
• ¿Cuáles son las ventajas de estos software?
• Pueden ayudar a un investigador a realizar
cientos o miles de contrastes de hipótesis en
un tiempo muy reducido. Asimismo puede
calcular decenas de modelos de regresión en
un tiempo muy corto y después quedarse con
el más apropiado de ellos.
• Un programa estadístico es capaz de realizar
miles de iteraciones por segundo de un
logaritmo en el que una persona tardaría
varios minutos en cada una de ellas.
• Inconvenientes
• En los programas más complejos se necesita
tener conocimientos de programación, así
como para realizar los cálculos más laboriosos.
• Otro inconveniente está en que en estadística
a menudo nos pueden salir resultados
contradictorios entre test distintos. Un
programa informático se dará cuenta de ello y
nos avisara de algún modo, pero tendrá que
ser el usuario el que decida a cuál de los test
hacer caso.
• Ji cuadrada
• Una moneda fue lanzada al aire 1000 series,

de 5 veces cada serie y se observo el numero
de series en los que se presento 0,1,2,3,4,5
caras se muestran en la siguiente tabla
No. caras Numero de series (frecuencia observada)
0 38
1 144
2 342
3 287
4 164
5 25
Total= 1000
• Ajustar una distribución binomial a los datos

con un α = 0.05
• K=6
• M=1
Grados de libertad= k-m-1= 6-1-1=4

• Regla de decisión:
• Si X2R ≤9.49 no se rechaza Ho.
• Si X2R >9.49 se rechaza Ho.
Pruebas de independencia
• Supongamos que se ha tomado una muestra
aleatoria simple de 150 bebedores de
cerveza. Después de saborear cada una, se les
pide expresar su preferencia o primera
alternativa.. De las 150 personas de la
muestra, 20 fueron hombres que prefirieron la
cerveza ligera, 40 fueron mujeres que
prefirieron la cerveza clara, 20 fueron
hombres que prefirieron la cerveza oscura, y
así sucesivamente.
Cerveza preferida
Ligera Clara Oscura Total

Género
Hombre 20 40 20 80
Mujer 30 30 10 70
Total 50 70 30 150
GRADOS DE LIBERTAD (2-1)(3-1)=2

Prueba bondad de ajuste.
• Estamos interesados en comprobar la
perfección de un dado cúbico (un dado
normal de 6 caras). Para esto realizamos 100
lanzamientos del dado anotando los puntos
obtenidos en cada lanzamiento. A la vista de
los resultados obtenidos, ¿podemos concluir
que el dado no es perfecto?. Nivel de
significación (5%)
Dado puntuación
1 14
2 22
3 18
4 17
5 20
6 9
UNIDAD V Regresión lineal simple y múltiple
Regresión Lineal simple

Prueba de hipótesis en la regresión lineal simple
Calidad del ajuste en regresión lineal simple
Estimación y predicción por intervalo en regresión lineal simple
Regresión lineal múltiple
Pruebas de hipótesis en regresión lineal múltiple
Intervalos de confianza y predicción en regresión múltiple
Uso de un software estadístico
Regresión no lineal.
REGRESION LINEAL SIMPLE
El análisis de regresión lineal simple es una técnica estadística para establecer la relación
entre dos variables mediante un modelo matemático establecido.
Existen dos variables, las cuales suponemos que están relacionadas entre sí, es decir, una
ejerce cierto efecto sobre la otra. El objetivo es establecer un modelo que nos sirva para
determinar la relación que existe entre dichas variables.
Las variables a manejar son dos, la variable independiente, X, y la variable dependiente, Y. La

variable independiente se considera como una variable física y controlable, mientras que la
variable dependiente es considerada como una variable aleatoria y medible.
Se puede establecer la relación entre dichas variables por medio de una línea recta (al
suponerse dicha relación como lineal).
Y
Y = a + bX
La ecuación de la línea está dada por Y = a + bX, donde a es el punto de intersección de la

recta con el eje Y mientras que la b es la pendiente, es decir, la inclinación de la recta.
El modelo de regresión lineal simple es, de hecho, la ecuación de la línea; para efectos
prácticos definimos dicho modelo mediante:
Y = α+ βX
Donde α y β son los parámetros del modelo.
α representa la ordenada en el origen, esto es, el punto donde la recta corta el eje Y.
β representa la pendiente, esto es, el cambio esperado en Y por cada incremento unitario en
X.
ESTIMACION DE PARAMETROS
El modelo anteriormente descrito representa la relación real existente entre las dos variables,
X y Y. Es necesario encontrar los valores de X0 y 1 que nos sirvan para estimar dichos
parámetros.
Para encontrar estos estimadores, partiremos de una muestra aleatoria de tamaño n para
valores de X y de Y:
X1 Y1
X2 Y2
X3 Y3
. .
. .
. .
Xn Yn
Al ser una muestra aleatoria, el error estará presente en dichas mediciones. Debemos
considerar dicho error en el modelo de regresión a fin de representar, mediante éste, cada una
de las observaciones anteriores:
Y = α + βX + ε
Donde ε es un error aleatorio con media cero y varianza σ2.

Al utilizar el modelo anterior para representar cada observación de Y, éstas quedarán de la
siguiente manera:
Y1 = 0 + 1X1 + 1 Y
Y2 = 0 + 1X2 + 2
Y3 = 0 + 1X3 + 3 Y = 0 + 1X
. . . .
. . . . Y = 0 + 1X + 
. . . .
Yn = 0 + 1Xn + n
X
En general, Yi = β0 + β1Xi + εi para i = 1, 2, 3, ..., n
METODO DE MINIMOS CUADRADOS
Para encontrar los estimadores de los parámetros, utilizaremos el método de mínimos

cuadrados.
El método de mínimos cuadrados consiste en minimizar la función de mínimos cuadrados.
La función de mínimos cuadrados está dada por:
n
L    i2
i 1
Si de Yi 0 1Xi i despejamos i y sustituimos dicha expresión en L:
n n
L    i2   Yi   0  1 X i 
2
i 1 i 1
Buscaremos aquellos valores de 0 y 1 que minimicen la ecuación anterior. Para esto,

derivaremos la función y evaluaremos con respecto a ̂ 0 y ̂ 1 ( los estimadores) e igualaremos
a cero.
L
0
 0 ˆ 0 ,ˆ1
L
0
 1 ˆ 0 ,ˆ1
Dichas derivadas resultan en:

L n
 2 Yi  ˆ 0  ˆ1 X i   0
 0 ˆ 0 , ˆ1 i 1
L n
 2 Yi  ˆ 0  ˆ1 X i X i  0
1 ˆ 0 , ˆ1 i 1
Lo cual nos lleva a las siguientes ecuaciones conocidas como ecuaciones normales de
mínimos cuadrados.
n n
Y
i 1
i  nˆ 0  ˆ 1  X i  0
i 1
n n n
 X iYi  ˆ 0  X i  ˆ1  X i2  0
i 1 i 1 i 1
Despejando ˆ 0 y ˆ1 :
 0  Y  1 X
n n
n  X i  Yi
X Y i i  i 1
n
i 1
1  i 1
2
 n 
n
 Xi 
 X i2   
i 1
i 1 n
Si definimos las siguientes expresiones:
Sxx, como la suma corregida de los cuadrados de X:

2
 n 
n n
 Xi 
Sxx    X i  X    X i2   i 1 
2
i 1 i 1 n
y Sxy, como la suma corregida de los productos cruzados de X y de Y:
n n
n n  X Y i i
Sxx   Yi  X i  X    X i Yi  i 1 i 1
,
i 1 i 1 n
entonces ̂ 1 se puede expresar también como:
Sxy
̂1 
Sxx
Por lo tanto, el modelo de regresión lineal simple ajustado queda de la siguiente forma:
Yˆ  ˆ 0  ˆ 1 X
donde ˆ 0 y ˆ 1 son los estimadores de los valores verdaderos de la ordenada en el origen y
la pendiente, respectivamente.
INFERENCIA EN LA REGRESION LINEAL SIMPLE
Podemos generalizar sobre los parámetros del modelo a partir de la información obtenida de
los estimadores de éstos. Dicha generalización (o inferencia estadística) se puede realizar ya
sea mediante pruebas de hipótesis o mediante intervalos de confianza.
PRUEBAS DE HIPOTESIS EN LA REGRESION LINEAL SIMPLE
PARA LA ORDENADA EN EL ORIGEN
Deseamos probar la hipótesis de que 0 es igual a un valor determinado contra la alternativa

apropiada, digamos por ejemplo, diferente a dicho valor; esto es:
H 0 :  0   0 ,0
H a :  0   0 ,0
El estadístico de prueba apropiado será:
ˆ 0   0,0
t0 
1 X 2 
MSE   
 n Sxx 
donde:
MSE es la media de los cuadrados del error o bien, el estimador de la varianza del modelo:
SSE
 2  MSE 
n2
en este caso SSE es la suma de los cuadrados del error y n – 2 son los grados de libertad del
error.
SSE  Syy  SSR
Syy es la suma corregida de los cuadrados de Y o la suma total de cuadrados:

2
 n 
n
  Yi 
Syy   Yi   i 1 
2
i 1 n
y SSR es la suma de cuadrados de la regresión:
SSR  ̂ 1 Sxy
Retomando la hipótesis planteada:
H 0 :  0   0 ,0
H a :  0   0 ,0
ˆ 0   0,0
t0 
1 X 2 
MSE   
 n Sxx 
este estadístico sigue una distribución t-student con v = n – 2 grados de libertad.
1 X 2 
En el estadístico de prueba vemos que MSE    representa la desviación estándar para
 n Sxx 
0.
Si el valor absoluto del estadístico de prueba es mayor que el valor de tablas, t n – 2, entonces
rechazaremos la hipótesis nula; aceptaremos la alternativa concluyendo que la ordenada en el
origen es diferente al valor con el cual la estamos comparando.
PARA LA PENDIENTE
Algo semejante realizaremos para la pendiente. Partimos de la hipótesis nula afirmando que
la pendiente es igual a un valor determinado (siempre que dicho valor sea diferente de cero),
contra la alternativa apropiada, por ejemplo que sea diferente a dicho valor:
H 0 :  1   1,0
H a :  1   1,0
el estadístico de prueba en este caso es:
ˆ 1  1,0
t0 
MSE
Sxx
Este estadístico también sigue una distribución t-student con v = n – 2 grados de libertad.
MSE
Del mismo modo, la expresión representa la desviación estándar para 1.
Sxx
Si el valor absoluto del estadístico de prueba es mayor que el valor de tablas, t n – 2, entonces
se rechaza la hipótesis nula y se acepta la alternativa: la pendiente es diferente al valor
representado por 1,0.
Un caso especial para la pendiente sería probar la hipótesis nula afirmando que la pendiente
es igual a cero contra la alternativa que sea diferente de cero.
También conocido como Prueba de Significancia, nos ayuda a determinar si la variable

independiente tiene o no efecto significativo sobre la variable dependiente.
Para realizar este procedimiento de prueba de hipótesis, descomponemos la suma total de

cuadrados en dos partes: la suma de cuadrados de la regresión y la suma de los cuadrados
del error.
Syy  SSR  SSE

Entonces:
H 0 : 1  0
H a : 1  0
También hacemos uso de la tabla de análisis de varianza (ANOVA) para determinar el

estadístico de prueba.
Dicha tabla se compone de lo siguiente:
Estadístico
Fuente de Suma de Grados de Media de
de
variación cuadrados libertad cuadrados
prueba
SSR
Regresión SSR 1 MSR 
1 MSR
F0 
SSE MSE
Error SS n-2 MSE 
n2
Total Syy n-1
Este estadístico de prueba sigue una distribución F (Fisher)con v1 = 1 y v2 = n – 2 grados de

libertad en el numerador y en el denominador, respectivamente.
En este caso si el estadístico de prueba es superior que el valor de tablas (de la distribución
F), Fν,n – 2, se rechaza la hipótesis nula y por consiguiente se acepta la alternativa, concluyendo
que la variable independiente (X) si tiene efecto significativo sobre la variable dependiente (Y).
En las pruebas descritas anteriormente el valor de α representa el nivel de significancia en la

prueba de hipótesis, esto es, la probabilidad de rechazar la hipótesis nula.
INTERVALOS DE CONFIANZA EN LA REGRESION LINEAL SIMPLE.
Como vimos anteriormente, a parte de las pruebas de hipótesis; también podemos generalizar
sobre los parámetros a partir de los estimadores, mediante intervalos de confianza. Esto es,
encontraremos dos límites, inferior y superior, dentro de los cuales se encontrará el valor
verdadero del parámetro del modelo en cuestión.
Así, para la ordenada en el origen, el intervalo de confianza de (1 - α) 100%, para este

parámetro está dado por la siguiente ecuación.
1 X 2  1 X 2 
ˆ 0  t ,n  2
MSE      0  ˆ 0  t ,n  2 MSE   
2
 n Sxx  2
 n Sxx 
Aquí, como β0 representa solamente una posición, no debe existir problema alguno en cuanto
a la conclusión de los resultados obtenidos.
Igualmente, también podemos calcular un intervalo de confianza de (1 -α ) 100%, para la

pendiente verdadera del modelo mediante la siguiente expresión.
MSE MSE
ˆ 1  t ,n  2
 1  ˆ 1  t ,n  2
2 Sxx 2 Sxx
En este caso la conclusión si depende del resultado obtenido, veamos los casos posibles:
Puede que el intervalo resulte en  a  1  b ; la conclusión apropiada será que por cada
incremento en X, Y, disminuirá, en promedio, por lo menos b y a lo mucho a veces.
Otro resultado posible para el intervalo sería a   1  b ; la conclusión será, en este caso, que
por cada incremento en X, Y se incrementará, en promedio, por lo menos a y a lo mucho b
veces.
Si el resultado del intervalo es  a   1  b , en este caso, solamente concluiremos que no se
puede afirmar que X tenga efecto sobre Y.
INTERVALOS DE CONFIANZA PARA LA RESPUESTA MEDIA Y PARA UNA PREDICCION

FUTURA
El modelo de regresión lineal simple ajustado Y  ˆ 0  ˆ 1 X nos permite establecer como es la
relación entre X y Y, de que medida X afecta a Y. También podemos utilizar este modelo para
predecir un valor futuro de Y dado un valor determinado de X.
Esto es, ¿Cuál es el valor esperado de Y cuando X = X0?, solamente hay que introducir el valor
de X0 en la variable X del modelo.
Yˆ  ˆ 0  ˆ 1  X 0 
Podemos calcular intervalos de confianza tanto para la media de una serie de observaciones
(para la recta verdadera) como para una observación futura en particular.
El intervalo de confianza de (1 –α)100% para el valor esperado de Y cuando X = X0, esta dado
por la ecuación:
 1  X  X 2   1  X 0  X 2 
Yˆ0  t ,n  2
MSE   0    y  ˆ
Y0  t  ,n  2 MSE   
2
 n Sxx  2
 n Sxx 
El intervalo de confianza de (1 - α) 100% para una observación futura de Y cuando X = X0, está
dado por la expresión:
 1 X 0  X 2   1 X 0  X 2 
ˆ 0  t
Y MSE 1   ˆ 0  t
  Y0  Y MSE 1   
,n  2 ,n  2
2
 n Sxx  2
 n Sxx 
Si deseamos determinar un intervalo de confianza de (1 - α) 100% para k observaciones

futuras haremos:
 1 1  X  X 2   1 1  X 0  X 2 
Yˆ0  t ,n  2
MSE    0   Y0  ˆ
Y0  t  ,n  2 MSE   
2
 k n Sxx  2
 k n Sxx 
MEDIDAS DE ADECUACION DEL MODELO
El siguiente paso ahora es determinar si el modelo calculado nos sirve para representar la
relación entre las variables.
Para esto, el modelo tiene que pasar una serie de pruebas ó medidas de adecuación. Dichas
medidas son:
El análisis de los residuos

El coeficiente de determinación y
La prueba de falta de ajuste.
ANALISIS DE LOS RESIDUOS
Este procedimiento se emplea para determinar o analizar el comportamiento de la variación de

los residuos o los errores.
Mediante el modelo de regresión lineal simple, calculado a partir de n observaciones en X y Y,
podemos predecir valores estimados de Y para valores determinados de X.
La diferencia entre los valores observados de Y y los valores estimados de esta variable resulta
en los errores o residuos:
ei  Yi  Yˆi
Graficamos estos residuos ya sea contra los valores de X, contra los valores estimados de Y,
contra los valores observados de Y o contra la variable tiempo, si es que se tiene.
Basta comparar, esta gráfica con los siguientes patrones para llegar a una conclusión acerca
de la adecuación del modelo:
ei ei
0 0
Yi Yi
En este caso, la variación de los residuos La variación crece a medida que la
es constante. variable Yi o el tiempo crece.
El modelo lineal sí es adecuado El modelo no es adecuado.
ei ei
0 0
Y Y
La variación de los residuos no es lineal.
La variación es irregular. i i
El modelo lineal no es adecuado para expresar la
El modelo no es adecuado relación entre X y Y.
Se puede ajustar dicha relación como un modelo
cuadrático, sólo basta agregar una variable de
orden superior.
Y = 0 + 1X + 2X2
COEFICIENTE DE DETERMINACION
El coeficiente de determinación nos permite evaluar qué tanta variación de los valores de Y se
explica mediante el modelo de regresión lineal simple.
Este coeficiente de determinación se representa por el símbolo R2; toma valores entre 0 y 1. A
medida que se acerca a 1 el modelo sí es adecuado puesto que explica la mayor cantidad de
variación presente en los datos.
En tanto R2 se acerque a cero, el modelo deja de ser adecuado puesto que la cantidad de
variación de los datos que se explica mediante el modelo es pobre.
El coeficiente de determinación se expresa como un porcentaje y se calcula mediante:
SSR
R2   100%
Syy
PRUEBA DE FALTA DE AJUSTE
Esta prueba nos permite determinar si el modelo lineal se puede utilizar para representar la
relación entre las variables, principalmente en aquellos casos en los cuales para un mismo
valor de X se tienen mas de una observación en Y:
X1 Y11 Y12 Y13 . . . Y1n1

X2 Y21 Y22 Y23 . . . Y2n2
X3 Y31 Y32 Y33 . . . Y3n3
. . . . . . . .
. . . . . . . .
. . . . . . . .
Xm Ym1 Ym2 Ym3 . . . Ymnm
En general se tienen m niveles distintos de X.

En esta prueba partimos de la hipótesis nula:
H0 : El modelo se ajusta a los datos
Contra la alternativa:
Ha : El modelo no se ajusta a los datos
Para este procedimiento se requiere descomponer la suma de cuadrados del error en dos
partes:
SSE = SSLOF + SSPE
Donde:
SSLOF es la suma de cuadrados debida a la falta de ajuste.

SSPE es la suma de cuadrados debida al “error puro”
Sabemos que:
SSE = Syy - SSR
Entonces:
 Y  Yi 
m ni
SS PE   ij
i 1 i 1
Y
SSLOF  SSE  SSPE
El estadístico de prueba apropiado en esta prueba de hipótesis es:
SS LOF
F02  m2
SS PE
nm
El cual sigue una distribución F con v1  m  2 y v 2  n  m grados de libertad en el numerador

y en el denominador, respectivamente.
Si el estadístico de prueba es mayor que el valor de tablas F m – 2, n – m se rechaza la hipótesis

nula y por consiguiente se acepta la alternativa , el modelo no se ajusta a los datos, por lo
tanto, el modelo lineal no es adecuado para relacionar X y Y.
CORRELACION
Hasta este momento hemos relacionado dos variables que suponemos de antemano tienen
una relación entre sí, esto es, cualquier cambio que provoquemos en la variable independiente,
trae como consecuencia un cambio en la variable dependiente.
Ahora bien, puede haber casos en que las dos variables, X y Y, sean aleatorias; ninguna tiene
efecto sobre la otra, pero sería apropiado relacionar dichas variables (siempre que sea
posible).
Podemos relacionar dichas variables mediante el modelo de regresión lineal simple
Y   0  1 X
Aunque éste no nos dice nada sobre la existencia de la relación entre las dos variables.
Es el coeficiente de correlación el que va a determinar si las dos variables están relacionadas
entre sí.
El coeficiente de correlación se representa mediante el símbolo  (rho). Se define mediante:
 xy

 x y
donde  xy2 es la covarianza entre X y Y.
El coeficiente de correlación también se puede definir mediante
x
  1
y
Aquí vemos que el coeficiente de correlación está relacionado con 1 sin que esto represente
que se trate de conceptos iguales.
Y Y Y
1 > 0
>0 1 < 0
<0
1 = 0
=0
X X X
Los estimadores de los parámetros del modelo de regresión son los mismos calculados en
temas anteriores:
ˆ 0  Y  ˆ 1 X
Sxy
ˆ 1 
Sxx
En tanto que el estimador del coeficiente de correlación se puede calcular mediante:
Sxy
r
Sxx  Syy12
Ahora bien, si elevamos al cuadrado ambos lados de la igualdad:

S XY
2
r2 
Sxx  Syy
Sxy  Sxy
r2 
Sxx  Syy
Sxy
Como  ̂1 :
Sxx
̂1 Sxy
r2 
Syy
y ̂ 1 Sxy  SSR :
entonces:
SSR
r2   R2
Syy
Concluimos que el coeficiente de correlación es igual a la raíz cuadrada del coeficiente de

determinación
SSR
r  R2
Syy
Vemos también que el coeficiente de correlación está relacionado con el coeficiente de

determinación, aunque son conceptos totalmente diferentes.
INFERENCIAS SOBRE EL COEFICIENTE DE CORRELACION
Al igual con los parámetros del modelo de regresión, también se pueden hacer inferencias
sobre el coeficiente de correlación verdadero; ya sea mediante pruebas de hipótesis o
mediante intervalos de confianza.
PRUEBAS DE HIPOTESIS SOBRE EL COEFICIENTE DE CORRELACION
Para establecer si existe una relación verdadera entre X y Y, podemos realizar la siguiente
prueba de hipótesis:
H0 :   0
Ha :   0
Esta prueba es semejante a la prueba de significancia realizada en la regresión lineal simple,

aunque tiene una diferente connotación.
El estadístico de prueba apropiado en este caso es:

r n2
t0 
1 r 2
el cual sigue una distribución t-student con v = n – 2 grados de libertad.
Si el estadístico de prueba es mayor que el valor de tablas t α/2,n – 2, se rechaza H0 y por

consiguiente se acepta la alternativa: el coeficiente de correlación es diferente de cero, por lo
tanto, las variables sí están relacionadas entre sí.
También se puede demostrar que el coeficiente de correlación verdadero es igual o diferente
a cierto valor determinado.
Partimos de la hipótesis nula
H 0 :   0
contra la alternativa
H a :   0
El estadístico de prueba es:
 
zo  tanh 1 r   tanh 1  0  n  3
donde
1 1 x
tanh 1 x   In
2 1 x
Este estadístico de prueba sigue una distribución normal estándar.
Entonces, si el valor absoluto del estadístico de prueba es mayor que el valor de tablas z ,
se rechaza H0 y se acepta la alternativa: el coeficiente de correlación verdadero es diferente
del valor con el que se está comparando.
INTERVALO DE CONFIANZA PARA EL COEFICIENTE DE CORRELACION

Podemos también establecer dos límites, inferior y superior, dentro de los cuales estará el
coeficiente de correlación verdadero.
El intervalo de confianza de (1 – α)100% para el coeficiente de correlación está dado por:
 z   z 
tanh  tanh 1 r   2     tanh  tanh 1 r    2 
 n3  n3
   
donde
e x  ex
tanhx   x
e  ex
EJERCICIO
Para ejemplificar lo visto anteriormente, resolveremos el siguiente ejercicio utilizando las

fórmulas encontradas.
La resistencia del papel utilizado en la manufactura de cajas de cartón ( Y ) se relaciona con el

porcentaje de la concentración de madera dura en la pulpa original ( X ). En condiciones
controladas, una planta piloto manufactura 16 muestras, cada una de diferentes lotes de pulpa, y
se mide la resistencia a la tensión. Los datos son los siguientes.
X Y
1.0 101.4
1.5 117.4
1.5 117.1
1.5 106.2
2.0 131.9
2.0 146.9
2.2 146.8
2.4 133.9
2.5 111.3
2.5 123.0
2.8 125.1
2.8 145.2
3.0 134.3
3.0 144.5
3.2 143.7
3.3 146.9
I.Ajuste un modelo de regresión lineal simple a los datos.
II.Pruebe la significancia y la falta de ajuste de la regresión. Utilice
III.Construya un intervalo de confianza del 90 % en la pendiente.
IV. Construya un intervalo de confianza del 98 % en la intersección.
V. Construya un intervalo de confianza del 95 % sobre la línea de regresión real en X =
2.5
VI. ¿Qué porcentaje de la variabilidad en la resistencia del papel se explica a partir de la
concentración de madera dura en la pulpa original?
Para encontrar las respuestas a cada uno de los incisos del ejercicio anterior, necesitamos
primero calcular las sumatorias de las variables X y Y:
n= 16
ΣX = 37.2
ΣX2 = 93.66
ΣY = 2075.6
ΣY2 = 272908.02
ΣXY = 4937.97
Con los valores anteriores, calcularemos las expresiones Sxx, Sxy que nos permitirán
determinar los estimadores de los parámetros del modelo solicitado en el inciso 1 del ejercicio.
 X  Y 
Sxy   XY 
n
Sxy  4937.97 
37.2  2075.6
16
Sxy  112.2
 X  2
Sxx   X 2

n
Sxx  93.66 
37.2 
2
16
Sxx  7.17
Calculamos enseguida ̂ 1 a partir de las expresiones anteriores:

Sxy
ˆ 1 
Sxx
112.2
ˆ 1 
7.17
ˆ 1  15.6485
y el valor de ̂ 0 lo calcularemos mediante:
ˆ 0  Y  1 X
ˆ 0  129.725  15.64852.325
ˆ 0  93.3422
El primer inciso nos pide ajustar un modelo de regresión lineal simple a los datos:
Yˆ  93.3422 15.6485X
De aquí concluimos lo siguiente:
 La línea de regresión cortará el eje Y en y = 93.3422.
 Por cada incremento en la concentración de madera dura en la pulpa original, la resis-
tencia del papel se incrementará 15.6485 veces en promedio.
Enseguida calcularemos los valores de Syy, SSR y SSE que nos permitirán realizar la prueba
de significancia del modelo.
 Y  2
Syy   Y 2

n
Syy  272908.02 
2075.62
16
Syy  3650.81
SSR  ˆ 1 Sxy
SSR  15.6485112.2
SSR  1755.7617
SSE  Syy  SSR

SSE  3650.81  1755.7617
SSE  1895.0483
Para la significancia del modelo planteamos las siguientes hipótesis:
H 0  1  0
H a  1  0
F0 
SSR1 
SSE n  2


1755.7617 
1
F0
1895. 0483
14

1755.7617
F0 
135.3605
F0  12.9710
El valor de las tablas de la distribución F con un nivel de significancia del 5 % con 1 y 14 grados
de libertad en el numerador y el denominador, respectivamente, es 4.6
Al comparar el estadístico de prueba con dicho valor vemos que 12.9710 es mayor que 4.6.
esto no lleva a rechazar la hipótesis nula y por consiguiente a aceptar la alternativa:
La resistencia del papel sí está relacionada significativamente con la concentración de
madera dura en la pulpa original.
En la segunda parte del inciso 2 se pide probar también la falta de ajuste del modelo. Para
esto acomodaremos los valores de X, que estén repetidos en los datos, con sus respectivos
valores de Y de la siguiente forma:
X Y Y  Y Y =
2
i
1.5 117.4 117.1 113.5666 (117.4 – 113.5666 )2+(117.1 – 81.4466

106.2 13.5666)2+
(106.2 – 113.5666)2 =
2.0 131.9 146.9 139.4 (131.9 – 139.4 )2+(146.9 – 139.4)2= 112.5
2.5 111.3 123.0 117.15 (111.3 – 117.15 )2+(123.0 – 117.5)2= 68.445
2.8 125.1 145.2 135.15 (125.1 – 135.15 )2+(145.2 – 135.15)2= 202.005
3.0 134.3 144.5 139.4 (134.3 – 139.4 )2+(144.3 – 139.4)2= 52.02
SSpe = 516.4166
La suma de los cuadrados del error es 1895.0483.
La suma de los cuadrados debida al error puro es 516.4166
Y la suma de los cuadrados debida a la falta de ajuste es 1895.0483 – 516.4166 = 1378.6317
En este caso tenemos n = 16 parejas de valores de X y de Y, y m = 10 valores distintos de X.
Planteamos las hipótesis:
H 0 : el modelo lineal se ajusta a los datos
H a : el modelo lineal no se ajusta a los datos
el estadístico de prueba es:
SSlof
F02  m2
SS pe
nm
1378.6317
F02  8
516.4166
6
F02  2.0022
El valor de las tablas de la distribución F con un nivel de significancia del 5 % y con 8 y 6 grados
de libertad en el numerador y el denominador, respectivamente, es 4.15
Comparando el estadístico de prueba con el valor encontrado en las tablas de la distribución
F, vemos que dicho estadístico es menor que 4.15, por lo tanto no podemos rechazar la
hipótesis nula:
No se puede afirmar que el modelo lineal no se ajuste a los datos, por lo que podemos
decir que dicho modelo sí es adecuado para representar la relación entre las variables
del ejercicio.
En el inciso 3 se pide calcular un intervalo de confianza del 90% para la pendiente de la línea
de regresión. Para esto necesitamos buscar en las tablas de la distribución t-student el valor
de t0.5,14. Este valor en la tablas es 1.761, por lo que el intervalo de confianza quedará de la
siguiente manera:
MSE MSE
ˆ 1  t ,n  2
  1  ˆ 1  t ,n  2
2 Sxx 2 Sxx
135.3605 135.3605
15.6485  1.761   1  15.6485  1.761
7.17 7.17
7.9970   1  23.2999
aquí concluiremos:
Se puede afirmar con un 90% de certeza que por cada incremento en la concentración
de madera dura en la pulpa original del papel, la resistencia del mismo se incrementará
por lo menos 7.9970 y a lo mucho 23.2999 veces en promedio.
En el inciso 4 se pide un intervalo de confianza del 98 % para la intersección de la recta.

Buscaremos en este caso el valor de t0.01,14 también en las tablas de la distribución t-student.
Dicho valor es 2.624, el cual utilizaremos para calcular el intervalo solicitado:
1 X 2  1 X 2 
ˆ 0  t ,n  2
MSE      0  
ˆ 0  t  ,n  2 MSE   
2  n Sxx  2  n Sxx 
 1 2.3252   1 2.3252 
93.3422  2.624 135.3605     0  93. 3422  2. 624 135. 3605  
16 7. 17  16 7.17 
65.7575   0  120.9268
La conclusión será:
Se puede afirmar con un 98% de certeza que la línea de regresión cortará el eje Y en por
lo menos 65.7575 y a lo mucho 120.9268.
Para el inciso 5 en el que se pide un intervalo de confianza del 95% para la línea de regresión
verdadera en
X = 2.5, buscaremos el valor de t0.025,14 en las tablas de la distribución t-student. Este valor es
2.145.
También necesitamos determinar el valor estimado de Y cuando X es igual a 2.5; para esto
introducimos dicho valor en el modelo de regresión lineal calculado en el primer inciso:
Yˆ0  93.3422  15.6485X 0
Yˆ0  93.3422  15.64852.5
Yˆ0  132.4634
El intervalo de confianza para la respuesta media de Y queda determinado de la siguiente
manera:
 1  X 0  X 2   1  X 0  X 2 
Y0  t ,n  2
MSE      Y  Y0  t ,n  2 MSE   
2
 n Sxx  2
 n Sxx 
 1 2.5  2.3252   1 2.5  2.3252 

132.4634  2.145 135.3605     Y  132. 4634  2. 145 135. 3605  
16 7. 17  16 7.17 
126.0150   Y  138.9123
en este caso concluiremos:

Existe un 95% de certeza al afirmar que cuando la concentración de madera dura en la
pulpa original del papel sea de 2.5%, su resistencia esperada será por lo menos 126.0150
y a lo mucho 138.9123.
Por último, el inciso 6 se pide determinar el porcentaje de la variabilidad en la resistencia del

papel que se explica mediante el modelo de regresión lineal simple. Esto es, calcular el
coeficiente de determinación:
SSR
R2 
Syy
1755.7617
R2 
3650.81
R  0.4809
2
esto nos indica que:
El 48.09% de la variabilidad de la resistencia del papel se explica mediante el modelo de

regresión lineal simple:
Yˆ  93.3422 15.6485X
como el valor de R2 es bajo, podemos concluir que el modelo no es adecuado para representar
la relación entre los valores de X y Y.
Podemos verificar la mayoría de los resultados obtenidos anteriormente en la siguiente hoja

de cálculo diseñada en Excel. Esta hoja arroja automáticamente los valores requeridos para
resolver un problema de regresión lineal simple.
X Y PARAMETROS
1 101.4
1.5 117.4 93.34215481 15.64853556
1.5 117.1
1.5 106.2 Yo
2 131.9 132.4634937
2 146.9
2.2 146.8 ESTADISTICOS DE PRUEBA
2.4 133.9
2.5 111.3 Fo
2.5 123 12.97105273
2.8 125.1 to1
2.8 145.2 8.879216556
3 134.3 to2
3 144.5 3.601534774
3.2 143.7
3.3 146.9 INTERVALOS DE CONFIANZA
65.75235768 o< 120.9319519
7.995711933 23.3013592
126.0154945 Yo < 138.9114929
106.6904439 < Yo < 158.2365436
COEFICIENTE DE DETERMINACION
X1 : 2.5
I.C. para
o: 0.98 R^2
I.C. para
0.9 0.48092497
I.C. para
Yo: 0.95
I.C. para Yo: 0.95 COEFICIENTE DE CORRELACION
I.C. para 0.95
r
0.693487541
ESTADISTICO DE PRUEBA
to
3.601534774
INTERVALO DE CONFIANZA
0.301389825 0.884970481
EJERCICIO PROPUESTO
En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la revista Field Crops
Research, los datos usados en la investigación son:
X= Duración
92 92 96 100 102 102 106 106 121 143
1.7 2.3 1.9 2.0 1.5 1.7 1.6 1.8 1 0.3
y= Rendimiento
Con x = la duración de la cosecha de porotos de soya en días, y = rendimiento de la cosecha

en toneladas por hectárea.
DESARROLLO
INTRODUCCION
(Regresión lineal) Asumiremos que si hay una relación de causalidad de la variable X (causa)
hacia la variable Y (efecto). Además, se sabe que esa relación es de tipo lineal, dentro del
rango de los datos.
Estableceremos un modelo para explicar la causa (Y) en términos del efecto (X), del tipo
siguiente: Y = a + bX + ei
Para i = 1,2,..., n
En que a y b son dos cantidades fijas (parámetros del modelo) y los e i son cantidades
aleatorias que representan las diferencias entre lo que postula el modelo a + bx y lo que
realmente se observa, y.
Por esa razón a los ei los llamaremos "errores" o "errores aleatorios". Se asume que tienen
valor esperado 0 y desviación estándar común σ.
Representación de los datos en un gráfico de dispersión:
Diseñando plantas en climas difíciles

2.5 y = -0.0342x + 5.2068
R² = 0.8829
2
Rendimiento
1.5
1 Series1
Lineal (Series1)
0.5
0
0 50 100 150 200
Duracion
Se puede apreciar la relación lineal existente entre ambas variables observadas.

Nuestro problema es estimar los parámetros a, b y σ2 para poder identificar el modelo.
Para estimar a y b se utiliza el método de Mínimos cuadrados, que consiste en encontrar
aquellos valores de a y de b que hagan mínima la suma de los cuadrados de las desviaciones
de las observaciones respecto de la recta que representa el modelo, en el sentido vertical.
(Aquí seria en dirección negativa)

Son los cuadrados de los segmentos verticales cuya suma de cuadrados se debe minimizar,
para determinar a y b. Estos segmentos representan los errores e del modelo, b (B 1) se llama
pendiente de la recta que representa los datos y a se llama intercepto sobre el eje vertical.
La solución está dada por las siguientes fórmulas (Estimación de los parámetros del modelo):
Calculamos los promedios de ambas variables y se las restamos a los valores.
Promedio de las Y: 1.58
Promedio de las X: 106
Cálculo de de las desviaciones respecto de las medias, sus cuadrados y productos. Entonces,
utilizando las fórmulas dadas más arriba, obtenemos los valores de los parámetros del modelo
de regresión:
El modelo, para estos datos, entonces, es

y = -0.0342x + 5.2068
Representa una recta, cuyo intercepto con el eje vertical es -0.0342, y su pendiente es 5.2068.
VALORES AJUSTADOS AL MODELO.

El modelo de regresión lineal se puede utilizar para obtener valores de Y ajustados al modelo,
Los valores puntuales se obtienen mediante la fórmula Y= a + bx en que a y b son los valores
estimados por el procedimiento indicado anteriormente, y Xi toma los valores de la muestra.
Los puntos que representan estos valores en el gráfico de dispersión, yacen sobre la recta.
La tabla siguiente contiene los valores de Y ajustados, para cada valor de X, además de los
valores de Y observados, a modo de comparación. Los ajustados se obtienen por la fórmula
y = 5.2068 -0.0342x
El promedio de los valores ajustados es igual al promedio de los valores observados, y que el
promedio de las diferencias es cero.
La raíz cuadrada del promedio de los cuadrados de las diferencias entre los valores
observados y ajustados, es una estimación de la varianza del error, σ2; la estimación de la
desviación estándar del error es igual a
Hay dos objetivos básicos en el ajuste de un modelo de regresión:
 Conocer la relación existente entre la variable respuesta y las variables regreso-
ras. En el caso de la regresión lineal simple se estima la mejor recta de regresión
que relaciona la variable Y con la variable X y se cuantifica la importancia de dicha
relación por medio del coeficiente de correlación, r.
Coeficiente de determinación. Es una medida de bondad de ajuste de los modelos de regresión

lineal a los datos. Es deseable que los valores de Y ajustados al modelo, sean lo más
parecidos posible a los valores observados. Una medida de lo parecido que es, es el
coeficiente de correlación.
Se define el coeficiente de determinación, R2, como el cuadrado del coeficiente de correlación
entre los valores de Y observados y los valores de Y ajustados. Sin embargo se puede
demostrar que es igual a la siguiente expresión:
El rango de R2 es entre 0, cero ajuste, hasta 1, ajuste perfecto (cuando los puntos aparecen
en un línea recta).
n = 10 x = 106 y = 1.58
Sxx= ∑ (xi− x)2= 2154
Syy = ∑ (yi− y) 2= 2.856
Sxy = ∑(xi − x)( yi− y) = -73.7
= (-73.7)2_ = 0.8829398
(2154)(2.856)
r=-0,939627586 es el coeficiente de correlación lineal, que es en valor absoluto próximo a 1

por lo que existe una relación lineal fuerte con pendiente negativa, es decir que cuando “x”
crece y “y” se hace menor.
El coeficiente de determinación es el cuadrado de r representa la proporción de la variación

total de y explicada por la correlación, y en nuestro caso es: r^2=0,8829
ESTIMACION Y PREDICCION
 Utilizar el modelo de regresión ajustado para “predecir” el valor de la variable
respuesta Y cuando la variable regresora toma un valor determinado:
 X = xt.
y = -0.0342 (103) + 5.2068

y= 1.6842
Conclusión
Al tener 103 días de duración de cosecha se espera que su rendimiento en toneladas por
hectárea sea de 1.6842
Se observa que este valor se encuentra en la recta.
 Predicción por intervalo (UNILATERAL)
t con n-2 grados de libertad (del error)

Intervalo al 95% de confianza. Entonces t (8, 0.025)
y (+/-) tt * Se
Se: Error estándar de estimación
Se= √ (Σ𝑦 𝑎Σ𝑦 𝑏Σ 𝑦) ( )
(Se pierden dos por la estimación de la pendiente y la ordenada y <b y a>)
Se=
(Unilateral) t (0.05, 8) = 1.85955

=y tc * Se
= y (+/-) (1.85955*0.072276)
En Excel
Conclusión
Con un nivel de confianza de 95% (o nivel de significancia de 0.05) se puede esperar que con
103 días de duración de cosecha de porotos de soya su rendimiento en toneladas por hectárea
se encuentre entre 1.515599253 y 1.784400747.
HIPOTESIS (BILATERAL)
Es necesario evaluar que tan bien el modelo explica la relación entre X y Y
La hipótesis de mayor interés plantea que (la pendiente β1 o b) es significativamente diferente
de cero.
H0: β1 (b que es la pendiente) = 0
Ha: β1 (b que es la pendiente) ≠ 0
Con respecto al parámetro β0 o a

(Intersección al eje y)
H0: β1 (b que es la pendiente) = 0
Ha: β1 (b que es la pendiente) ≠ 0
Cuando β1 = 0; y = 5.2068 + 0x
Cuando β0 = 0; y = 0 - 0.0342 x (sustituimos los valores de x y graficamos)

E (error):
= - 0.016
SCE (sumatoria del cuadrado del error)
Σ𝑒i = 0.3343502
CME: (Cuadrado Medio del Error SCE) Es la suma de cuadrados del error y mide la variabilidad
no explicada por la recta de regresión.
= 0.3343502
I b I > t (0.025, 5) = 2.57058
I a I > t (0.025, 8) = 2.30600
Conclusion
I-7.76763597I > 2.57058
I 11.04616429I > 2.30600
Se rechazan las Hipótesis Nulas para ambos parámetros por lo que existe suficiente evidencia
estadística para decir que existe una buena relación lineal entre las variables.
Análisis de Regresión Múltiple
Dispone de una ecuación con dos variables independientes adicionales:
Se puede ampliar para cualquier número "m" de variables independientes:
Para poder resolver y obtener y en una ecuación de regresión múltiple el cálculo se

presenta muy tediosa porque se tiene atender 3 ecuaciones que se generan por el método de
mínimo de cuadrados:
Para poder resolver se puede utilizar programas informáticos como AD+, SPSS y Minitab y Ex-
cel.
El error estándar de la regresión múltiple

Es una medida de dispersión la estimación se hace más precisa conforme el grado de disper-
sión alrededor del plano de regresión se hace más pequeño.
Para medirla se utiliza la fórmula:
Y: Valores observados en la muestra

: Valores estimados a partir a partir de la ecuación de regresión
n: Número de datos
m: Número de variables independientes
El coeficiente de determinación múltiple
Mide la tasa porcentual de los cambios de Y que pueden ser explicados por , y si-
multáneamente.
APLICACION DE REGRESION MULTIPLE
Mediante el siguiente problema podremos ilustrar la aplicación de Regresión Multiple:

En la Facultad de Ingeniería de Sistemas y Computo de la Universidad "Inca Garcilaso de la
Vega" se quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura
de PHP, para lo cual se escoge al azar una muestra de 15 alumnos y ellos registran notas
promedios en las asignaturas de Algoritmos, Base de Datos y Programación como se muestran
en el siguiente cuadro.
Alumno PHP Algoritmos Base de Datos Programación
1 13 15 15 13
2 13 14 13 12
3 13 16 13 14
4 15 20 14 16
5 16 18 18 17
6 15 16 17 15
7 12 13 15 11
8 13 16 14 15
9 13 15 14 13
10 13 14 13 10
11 11 12 12 10
12 14 16 11 14
13 15 17 16 15
14 15 19 14 16
15 15 13 15 10
Lo que buscamos es construir un modelo para determinar la dependencia que exista de apren-
dizaje reflejada en las notas de la asignatura de PHP, conociendo las notas de las asignaturas
Algoritmos, Base de Datos y Programación.
Se presentara la siguiente ecuación a resolver:
Utilizando las fórmulas de las ecuaciones normales a los datos obtendremos los coeficientes
de regresión o utilizando Regresión de Análisis de datos, en la Hoja de Cálculo de Excel po-
demos calcular también los coeficientes de regresión:
Por lo tanto podemos construir la ecuación de regresión que buscamos:
El Error Estándar de Regresión Múltiple

Mediante esta medida de dispersión se hace más preciso el grado de dispersión alrededor del
plano de regresión, se hace más pequeño.
Para calcularla se utiliza la formula siguiente:
En los resultados de Excel se llama error típico y para explicar la relación del aprendizaje de
PHP que se viene desarrollando es de 0.861
El coeficiente de determinación múltiple (r2)
Utilizaremos para determinar la tasa porcentual de Y para ser explicados las variables múlti-
ples, utilizando la si siguiente formula:
IV.- CONCLUSIONES
El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas
por las asignaturas de Algoritmos, Base de Datos y Programación.
REGRESION NO LINEAL
Supongamos que al hacer la representación gráfica correspondiente de una distribución bidi-

mensional, obtenemos la figura siguiente. Se observa una clara relación entre las dos varia-
bles, pero desde luego, esa relación no es lineal.
Por tanto, debemos buscar la función que ha de describir la dependencia entre las dos varia-
bles.
Nos limitaremos al estudio de las más utilizadas: la función parabólica, la logarítmica, la expo-
nencial y la potencial.
PARÁBOLA DE REGRESIÓN
En muchos casos, es una función de segundo grado la que se ajusta lo suficiente a la situación
real dada.
La expresión general de un polinomio de 2º grado es:
Y=a+bX+cX2
donde a, b y c son los parámetros.

El problema consiste, por tanto, en determinar dichos parámetros para una distribución dada.
Seguiremos para ello, un razonamiento similar al que hicimos en el caso del modelo de regre-
sión lineal simple, utilizando el procedimiento de ajuste de los mínimos cuadrados, es decir,
haciendo que la suma de los cuadrados de las desviaciones con respecto a la curva de regre-
sión sea mínima:
donde, siguiendo la notación habitual, yi son los valores observados de la variable dependiente,
e los valores estimados según el modelo; por tanto, podemos escribir D de la forma:
Para encontrar los valores de a, b y c que hacen mínima la expresión anterior, deberemos
igualar las derivadas parciales de D con respecto a dichos parámetros a cero y resolver el
sistema resultante. Las ecuaciones que forman dicho sistema se conocen como ecuaciones
normales de Gauss (igual que en el caso de la regresión lineal simple).
FUNCIÓN EXPONENCIAL, POTENCIAL Y LOGARÍTMICA
El problema de ajustar un modelo potencial, de la forma Y=AXb y uno exponencial Y=ABX se

reduce al de la función lineal, con solo tomar logaritmos.
v Modelo potencial:
Si tomamos logaritmos en la expresión de la función potencial, obtendremos:
logY = logA +b logX
Como vemos es la ecuación de una recta: Y=a+bX, donde ahora a = logA. De modo que el
problema es sencillo, basta con transformar Y en logY y X en logX y ajustar una recta a los
valores transformados. El parámetro b del modelo potencial coincide con el coeficiente de re-
gresión de la recta ajustada a los datos transformados, y A lo obtenemos mediante el antilog(a).
v Modelo exponencial:
Tomando logaritmos en la expresión de la función exponencial, obtendremos:
logY = logA + logB X
También se trata de la ecuación de una recta Y=a+bX, pero ahora ajustándola a logY y a X;
de modo que, para obtener el parámetro A del modelo exponencial, basta con hacer antilog(a),
y el parámetro B se obtiene tomando antilog(b).
v Modelo logarítmico:
La curva logarítmica Y = a + b logX es también una recta, pero en lugar de estar referida a las
variables originales X e Y, está referida a logX y a Y.
Hemos visto, cómo, a pesar de ser inicialmente modelos mucho más complejos que el de una
recta, estos tres últimos se reducen al modelo lineal sin más que transformar adecuadamente
los datos de partida.
TABLAS
BIBLIOGRAFIA Y REFERENCIAS
Probabilidad y Estadistica Para Ingenieros 6ta Edicion - Ronald E. Walpole & Raymond H.
Myers.
Probabilidad y estadística para ingenieros Miller Freund Johnson 4a edición
Probabilidad y Estadistica - Schaum (Murray R Spiegel)
Chacón José. Una introducción a la ESTADISTICA INFERENCIAL.
SUÁREZ, Mario, (2012), Interaprendizaje de Probabilidades y Estadística Inferencial con
Excel, Winstats y Graph, Primera Edición. Imprenta M & V, Ibarra, Ecuador
° http://www.monografias.com/trabajos15/estadistica/estadistica.shtml
° http://www.vadenumeros.es/sociales/tipos-de-muestreo.htm
° http://es.scribd.com/doc/94908795/Muestreo
° Casal Jordi, Mateu Enric. TIPOS DE MUESTREO. CReSA. Centre de Recerca en Sanitat
Animal / Dep. Sanitat i Anatomia Animals, Universitat Autònoma de Barcelona, 08193-
Bellaterra, Barcelona. (2003). Pág. 3
° http://www.eio.uva.es/tapia/polietapico11-12.pdf
°_http://ocwus.us.es/métodos-de-investigacion-y-diagnostico-en-educacion/análisis-de-datos-
en-la-investicacion-educativa/bloque_II/page_26.htm/
° http://predictive.files.wordpress.com/2009/04/binder12.pdf
° www.piedrasnegras.gob.mx/wp.../2010/06/Perfil-Economico.pptx
° http://es.wikipedia.org/wiki/Piedras_Negras
° http://www.inegi.org.mx/
° http://www.estadisticafacil.com/Main/TeoremaDelLimiteCentral
° http://www.buenastareas.com/ensayos/Estadistica-Inferencial/2797362.html
° http://www.itch.edu.mx/academic/industrial/estadistica1/cap01b.html
° http://www.inegi.org.mx/
° http://www.slideshare.net/hfunes/distribuciones-muestrales-presentation
° http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal
° http://es.wikipedia.org/wiki/Distribuci%C3%B3n_muestral
° http://www.monografias.com/trabajos-pdf4/la-estadistica-inferencial/la-estadistica-
inferencial.pdf
° http://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student
° http://virtual.uptc.edu.co/ova/estadistica/docs/libros/tstudent.pdf
° http://jacroman.blogspot.mx/2009/12/distribucion-t-student.html
° Orellana, Liliana. ESTADISTICA DESCRIPTIA. Capitulo 1, Introducción. (marzo 2011)
° http://es.wikipedia.org/wiki/gradodelibertad(estad%C3%ADstica
°http://www.buenastareas.com/ensayos/grados-de-libertad/1670595
°http://fisica.udea.edu.co/~labgicm/Laboratorio%20Fisica%201_2011/2010_teoria%20de%20
errores/Distribucion%20de%20t%20Student.pdf
°http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad#Distribucionesdevariableon
tinua
° http://es.wikipedia.org/wiki/Distribuci%C3%B3n_%CF%87%C2%B2
° http://es.wikipedia.org/wiki/Distribuci%C3%B3n_exponencial
° http://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student
° http://es.wikipedia.org/wiki/Distribuci%C3%B3n_Gamma
° http://es.wikipedia.org/wiki/Distribuci%C3%B3n_Beta
° http://www.hrc.es/bioest/esti_medias.html
° http://www.hrc.es/bioest/esti_medias.html
° http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html
°http://biplot.usal.es/ALUMNOS/BIOLOGIA/BIOTECNOLOGIA/transpcontrastes2.pdf
~http://www.monografias.com/trabajos30/prueba-de-hipotesis/prueba-de-hipotesis.shtml
~www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r16617.DOC
http://pis.unicauca.edu.co/moodle2.1.2/pluginfile.php/20816/mod_resource/content/0/Material
es/Libro_de_metodologia/CAPITULO_5.pdf
www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r16617.DOC
http://www.monografias.com/trabajos91/prueba-hipotesis-proporciones-z-y-ji-cuadrado-
empleando-excel-y-winstats/prueba-hipotesis-proporciones-z-y-ji-cuadrado-empleando-excel-
y-winstats.shtml
http://www.monografias.com/trabajos91/prueba-hipotesis-proporciones-z-y-ji-cuadrado-
empleando-excel-y-winstats/prueba-hipotesis-proporciones-z-y-ji-cuadrado-empleando-excel-
y-winstats.shtml
http://www.uv.es/ceaces/base/regresion/bondad.htm
http://bellman.ciencias.uniovi.es/estadistica2/estadistica2_archivos/ajuste.pdf
http://www.buenastareas.com/ensayos/Pruebas-De-Bondad-De-Ajuste/158033.html

Apuntes Estadistica Inferencial 1 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Apuntes Estadistica Inferencial 1 PDF

Cargado por

Copyright:

Formatos disponibles

TEMARIO A DESARROLLAR DE ESTADISTICA INFERENCIAL I DE LA ESPECIALIDAD DE

UNIDAD I Distribuciones Fundamentales para el Muestreo

Introducción a la Estadística Inferencial

UNIDAD IV Pruebas de bondad de ajuste y pruebas no paramétricas

Regresión Lineal simple

Introducción a la Estadística Inferencial

INTRODUCCION A LA ESTADISTICA INFERENCIAL

MUESTREO: INTRODUCCION AL MUESTREO Y TIPOS DE MUESTREO

Historia del muestro

Símbolos para estadísticos y parámetros correspondientes

Medida Símbolo para el estadístico Símbolo para el parámetro.

Distribución en el muestreo: Cuando el tamaño de la muestra (n) es más pequeño que el

Error Estándar: La desviación estándar de una distribución, en el muestreo de un estadístico,

Muestreo aleatorio simple:

Muestreo aleatorio sistemático

El Muestreo Aleatorio Estratificado

El Muestreo Por Conglomerados

Muestreo Por Etapas

Teorema del Limite Central

Los parámetros de la distribución normal son:

Media: n * m (media de la variable individual multiplicada por el número de variables

Varianza: n * s2 (varianza de la variable individual multiplicada por el número de variables

3. Inferir la media de la población a partir de una muestra.

Es un Teorema de gran importancia en Estadística, especialmente para la parte de Inferencia

Generalmente nos interesa conocer una o más de las siguientes características de la

1.- Su forma funcional (como aparece en su representación gráfica).

3.- Su desviación estándar (error estándar)

En estadística, la distribución muestral es lo que resulta de considerar todas las muestras

La fórmula para la distribución muestral dependerá de la distribución de la población, del

DISTRIBUCION MUESTRAL DE LA MEDIA

1 Suponiendo que la población de alumnos de Ciencias de la Educación presenta la

En la primera cuestión formulada, el problema se limita a hallar el porcentaje de puntuaciones

Figura 1: Área delimitada por la puntuación típica z = -3

En cuanto a la segunda de las cuestiones, bastará con transformar de nuevo en puntuaciones

Es decir, existe una probabilidad de 0.849 de que La muestra seleccionada de la población de

Figura 2: Área delimitada entre las puntuaciones típicas -1.2 y 1.8

0.7607 200   152 Medias muestrales

TEOREMA. Si es la media de una muestra aleatoria de tamaño n extraída de una población

DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE MEDIAS

Sean X1 y X2 dos variables aleatorias con valores esperados 1 y  2 y varianzas  1 y  2 ,

Inicialmente estaremos interesados en verificar si ambas distribuciones tienen la misma media

poblacional, es decir si 1 =  2 ó equivalentemente 1 -  2 = 0..

Suponga que es una muestra aleatoria de tamaño n1 tomada de una población

con media 1 y varianza  1 ,

1 -  2 , nos podemos basar en la distribución de la diferencia de las medias muestrales

Si las varianzas  1 y  2 son conocidas, tanto

grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si repre-

Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación es-

a. ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor

b. ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre

x1  x2   1   2  0.65  0

x1  x2   1   2  0.83  0

La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre

das pero iguales ( = = )

n1  1s12 n2  1s 22

con n1  n 2  2 grados de libertad. Es decir:

n1  1s12 n2  1s22

n1  1S12  n2  1S 22

y el número de grados de libertad n está dado por:

DISTRIBUCIÓN MUESTRAL DE LA PROPORCION

En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la

B(n,p) se aproxima a la normal .

Generación de la Distribución Muestral de Proporciones