Apuntes de Estadistica Inf

UNIDADA 1:
INTRODUCCION A LA ESTADISTICA INFERENCIAL
1.1 BREVE HISTORIA DE LA ESTADISTICA:
La estadística surgió en épocas muy remotas, y como todas las ciencias, no surgió de improviso, sino
mediante un proceso largo de desarrollo y evolución, desde hechos de simple recolección de datos hasta
la diversidad y rigurosa interpretación de los datos que se dan hoy en día. Así pues, el origen de la
Estadística se remonta a los comienzos de la historia y esto se sabe tanto a través de crónicas, datos
escritos, como de restos arqueológicos, y esto es explicable por cuanto en ese tiempo se estaba formado
recién la sociedad y es algo inherente la necesidad de saber cosas elementales como: cuántos
habitantes tiene la tribu, con cuantos bienes cuenta, etc. 3050 a.C. En los antiguos monumentos egipcios
se encontraron interesantes documentos en que demuestran la sabia organización y administración de
este pueblo; ellos llevaban cuenta de los movimientos poblacionales y continuamente hacían censos,
que ponían bajo la protección la diosa Safnkit, diosa de los libros y las cuentas.
2238 a.C. En China Confucio, en uno en uno de sus clásicos "Shu-King" escrito hacia el año 550 a.C., nos
narra cómo el Rey Yao en el año 2238 mandó hacer una estadística agrícola, industrial y comercial
1800 a.C. Su origen empieza posiblemente en la isla de Cerdeña, donde existen monumentos
prehistóricos pertenecientes a los nuragas, los primeros habitantes de la isla; estos monumentos
formados por bloques de basalto superpuestos sin mortero y en cuyas paredes se encontraban grabados
toscos signos que servían para llevar la cuenta del ganado y la caza. Poco a poco conforme fue
evolucionando la sociedad, estos hechos fueron más frecuentes y menos inciertos 1450 a.C. En la Biblia
observamos en uno de los libros del Pentateuco, bajo el nombre de Números, el censo que realizó
Moisés después de la salida de Egipto. Textualmente dice: "Censo de las tribus: El día primero del
segundo año después de la salida de Egipto, habló Yahvé a Moisés en el desierto de Sinaí en el
tabernáculo de la reunión, diciendo: "Haz un censo general de toda la asamblea de los hijos de Israel,
por familias y por linajes, describiendo por cabezas los nombres de todos los varones aptos para el
servicio de armas en Israel.”". Igual tipos de datos en varios libros que conforman la Biblia.
721 a.C. Fue Sargón II, rey de Asiria, quien fundó una biblioteca en Nívine que luego fue ampliada y
organizada bajo el reinado de Assurbanipal; los "textos" que allí se guardaban eran tablillas de ladrillo
de arcilla cocida de 25 por 16 cm., teniendo sólo en una de sus caras inscripciones cuneiformes. Lo
interesante de todo esto es que en esta biblioteca no se guardaban poemas u obras literarias; sino
simplemente era una recopilación de hechos históricos, religiosos, importantes datos estadísticos sobre
producción, cuentas; así como también datos de medicina, astronomía, etc.
594 a.C. Grecia también tuvo importantes observaciones estadísticas en lo que refiere a distribución de
terreno, servicio militar, etc. También cabe citar entre los griegos principalmente a Sócrates, Herodoto
y Aristóteles, quienes a través de sus escritos incentivaron la estadística por su importancia para el
Estado.
27 a.C. El Imperio Romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la
población, superficie y renta de todos los territorios bajo su control. Durante la época de César Augusto,
se decretó que todos los súbditos tenían que tributar y por tanto exigió a todas las personas que se
presentaran al estadístico más cercano que era entonces el recaudador de impuestos. Los censos se
realizaban cada cinco años, y los funcionarios públicos tenían la obligación de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas
en las tierras conquistadas. En la época del nacimiento de Cristo sucedía uno de estos
empadronamientos de la población bajo la autoridad del Imperio.
758 Durante los mil años posteriores a la caída del Imperio Romano se hicieron muy pocas operaciones
estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas
por Pipino el Breve y por Carlomagno en los años 758 y 762, respectivamente. En Francia se realizaron
algunos censos parciales de siervos durante el siglo IX.
1532 Debido al temor que Enrique VII tenía de la peste, en el año 1532 empezaron a registrarse en
Inglaterra las defunciones causadas por esta enfermedad. En Francia, más o menos por la misma época,
la ley exigía a los clérigos registrar los bautismos, fallecimientos y matrimonios.
1540 Alrededor del año 1540, el alemán Sebastián Muster realizó una compilación estadística de los
recursos nacionales, que comprendía datos acerca de la organización política, instituciones sociales,
comercio y poderío militar.
1632 Durante un brote de peste que apareció a fines del siglo XVI, el gobierno inglés comenzó a publicar
estadísticas semanales de los decesos. Esa costumbre continuó muchos años, y en 1632 los llamados
Bills of Mortality (Cuentas de Mortalidad) ya contenían datos sobre los nacimientos y fallecimientos por
sexo. En 1662, el capitán John Graunt compiló documentos que abarcaban treinta años, mediante los
cuales efectuó predicciones sobre el número de personas que morirían de diversas enfermedades, así
como de las proporciones de nacimientos de hombres y mujeres que cabía esperar. El trabajo de Graunt,
condensado en su obra Natural and political observations made upon the Bills of Mortality
(Observaciones políticas y naturales…hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo de
inferencia y teoría estadística
1691 Gaspar Neumann, un profesor alemán que vivía en Breslau, se propuso destruir la antigua creencia
popular de que en los años terminados en 7 moría más gente que en los restantes, y para lograrlo hurgó
pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de
defunción, pudo demostrar que en tales años no fallecían más personas que en los demás. Los
procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley, descubridor del cometa
que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos sirvieron de base para
las tablas de mortalidad que hoy utilizan todas las compañías de seguros.
1760 Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística,
que extrajo del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva
ciencia serían el aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla en el
término latino s t a t u s, que significa “estado” o “situación”. Esta etimología aumenta el valor intrínseco
de la palabra por cuanto que la estadística revela el sentido cuantitativo de las más variadas situaciones.
1888 A finales del siglo XIX, Sir Francis Galton introdujo el concepto de correlación, que tiene por objeto
medir la influencia relativa de los factores sobre las variables. De aquí partió el desarrollo del coeficiente
de correlación creado por Karl Pearson y otros cultivadores de la ciencia biométrica, tales como J. Pease
Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones.
1892 Una vez sentadas las bases de la teoría de probabilidades, podemos situar el nacimiento de la
estadística moderna también conocida como inferencia estadística, y su empleo en el análisis de
experimentos, en los trabajos de Sir Francis Galton y Karl Pearson. Este último publicó en 1892 el libro
The Grammar of Science (La gramática de la ciencia), un clásico en la filosofía de la ciencia, y fue él quien
ideó el conocido test de Chi-cuadrado. El hijo de Pearson, Egon, y el matemático nacido en Polonia, Jerzy
Neyman pueden considerarse los fundadores de las pruebas modernas de contraste de hipótesis.
1908 William Sealey Gosset publica un artículo en el que aporta grandes resultados para el estudio de
muestras pequeñas, y deduce la distribución t, que se conoce como "t de student, ya que este era el
seudónimo con el que publicó dicho artículo.
1922 Pero es sin lugar a dudas Ronald Arnold Fisher la figura más influyente de la estadística moderna,
pues la situó como una poderosa herramienta para la planeación y análisis de experimentos.
Contemporáneo de Pearson, desarrolló el análisis de varianza y fue pionero en el desarrollo de
numerosas técnicas de análisis multivariante y en la introducción del método de máxima verosimilitud
para la estimación de parámetros. Su libro Statistical Methods for Research Workers (Métodos
estadísticos para los investigadores), publicado en 1925, ha sido probablemente el libro de estadística
más utilizado a lo largo de muchos años.
1933 Andréi Kolmogórov desarrolló una teoría de la probabilidad totalmente rigurosa basada en
axiomas fundamentales. La construcción axiomática de la teoría de la probabilidad procede de las
propiedades fundamentales de la probabilidad observada en los ejemplos que ilustran las definiciones
clásicas y frecuentista. Así, la definición axiomática las incluye como casos particulares y supera las
carencias de ambas.
En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los
valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como
herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo
en reunir y tabular los datos, sino sobre todo en interpretar esa información. El desarrollo de la teoría
de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de
datos se pueden estudiar con gran exactitud utilizando determinadas distribuciones probabilísticas. La
probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y
la cantidad de datos necesarios en un determinado estudio estadístico.
1.2 CONCEPTOS DE ESTADISTICA
Caracteres Cada uno de los individuos de la población en estudio posee uno o varios caracteres.
Así por ejemplo, si la población en consideración es la de los estudiantes de una determinada
universidad, éstos poseen una serie de caracteres, o si se quiere características, que permiten
describirlo. Los caracteres en este ejemplo pueden ser "facultad en la que está matriculado",
"curso que sigue", "sexo", "edad", etc. Precisamente la observación de uno o más de esos
caracteres en los individuos de la muestra es lo que dará origen a los datos. Los caracteres
pueden ser de dos clases: cuantitativos, cuando son tales que su observación en un individuo
determinado proporciona un valor numérico como medida asociada, como ocurre por ejemplo
con los caracteres "edad" o "curso que sigue", y cualitativos, cuando su observación en los
individuos no suministra un número, sino la pertenencia a una clase determinada, como por
ejemplo el "sexo", o la "facultad en la que está matriculado".
Modalidades de los caracteres: Consideremos un carácter cualquiera, como por ejemplo el

"gusto". Este carácter, al a las posibilidades, tipos o clases que pueden presentar los caracteres
las denominaremos modalidades. Las modalidades de un carácter deben ser a la vez
incompatibles y exhaustivas. Es decir, las diversas modalidades de un carácter deben cubrir
todas las posibilidades que éste puede presentar y además deben ser disjuntas un individuo no
puede presentar a la vez más de una de ellas y además debe presentar alguna de ellas).
Así, al estudiar algún carácter, como por ejemplo la raza, el investigador deberá considerar
todas las posibles modalidades del carácter (todas las posibles razas), con objeto de poder
clasificar a todos los individuos que observe.
Una población está formada por la totalidad de las observaciones en las cuales se tiene cierto
observa.
Una muestra es un subconjunto de observaciones seleccionadas de una población.
Muestras Aleatorias Cuando nos interesa estudiar las características de poblaciones grandes,
se utilizan muestras por muchas razones; una enumeración completa de la población, llamada
censo, puede ser económicamente imposible, o no se cuenta con el tiempo suficiente.
A continuación se verá algunos usos del muestreo en diversos campos:
1. Política. Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinión pública y el apoyo en las elecciones.
2. Educación. Las muestras de las calificaciones de los exámenes de estudiantes se usan
para determinar la eficiencia de una técnica o programa de enseñanza.
3. Industria. Muestras de los productos de una línea de ensamble sirve para controlar la
calidad.
4. Medicina. Muestras de medidas de azúcar en la sangre de pacientes diabéticos prueban
la eficacia de una técnica o de un fármaco nuevo.
5. Agricultura. Las muestras del maíz cosechado en una parcela proyectan en la producción
los efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usaría para determinar los
criterios del público sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.
Errores en el Muestreo
Cuando se utilizan valores muestrales, o estadísticos para estimar valores poblacionales,
o parámetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no
muestral.
El error muestral se refiere a la variación natural existente entre muestras tomadas de la misma
población.
Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran cuidado
para asegurar que dos muestras del mismo tamaño sean representativas de una cierta
población, no esperaríamos que las dos sean idénticas en todos sus detalles. El error muestral
es un concepto importante que ayudará a entender mejor la naturaleza de la estadística
inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores muestrales y
se denominan errores no muestrales. El sesgo de las muestras es un tipo de error no muestral.
El sesgo muestral se refiere a una tendencia sistemática inherente a un método de muestreo
que da estimaciones de un parámetro que son, en promedio, menores (sesgo negativo), o
mayores (sesgo positivo) que el parámetro real. El sesgo muestral puede suprimirse, o
minimizarse, usando la aleatorización. La aleatorización se refiere a cualquier proceso de
selección de una muestra de la población en el que la selección es imparcial o no está sesgada;
una muestra elegida con procedimientos aleatorios se llama muestra aleatoria. Los tipos más
comunes de técnicas de muestreo aleatorios son el muestreo aleatorio simple, el muestreo
estratificado, el muestreo por conglomerados y el muestreo sistemático. Si una muestra
aleatoria se elige de tal forma que todos los elementos de la población tengan la misma
probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.
Ejemplo
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadística de 20 alumnos. 20C5 da el número total de formas de elegir una muestra no ordenada
y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las 15,504 en
trozos separados de papel, una tarea tremenda, luego los colocamos en un recipiente y después
los revolvemos, entonces podremos tener una muestra aleatoria de 5 si seleccionamos un trozo
de papel con cinco nombres. Un procedimiento más simple para elegir una muestra aleatoria
sería escribir cada uno de los 20 nombres en pedazos separados de papel, colocarlos en un
recipiente, revolverlos y después extraer cinco papeles al mismo tiempo.
El muestreo estratificado requiere de separar a la población según grupos que no se traslapen

llamados estratos, y de elegir después una muestra aleatoria simple en cada estrato. La
información de las muestras aleatorias simples de cada estrato constituiría entonces una
muestra global.
Ejemplo
Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una gran
universidad. Puede ser difícil obtener una muestra con todos los profesores, así que
supongamos que elegimos una muestra aleatoria de cada colegio, o departamento académico;
los estratos vendrían a ser los colegios, o departamentos académicos.
El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de unidades
heterogéneas entre sí de la población llamadas conglomerados. Cada elemento de la población
pertenece exactamente a un conglomerado, y los elementos dentro de cada conglomerado son
usualmente heterogéneos o disímiles.
Ejemplo
Suponga que una compañía de servicio de televisión por cable está pensando en abrir una
sucursal en una ciudad grande; la compañía planea realizar un estudio para determinar el
porcentaje de familias que utilizarían sus servicios, como no es práctico preguntar en cada casa,
la empresa decide seleccionar una parte de la ciudad al azar, la cual forma un conglomerado.
En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como sea
posible, a toda la población; entonces se usa una muestra aleatoria simple de conglomerados
para estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y
prisiones se realizan, generalmente, con base en el muestreo por conglomerados.
El muestreo sistemático es una técnica de muestreo que requiere de una selección aleatoria
inicial de observaciones seguida de otra selección de observaciones obtenida usando algún
sistema o regla.
Ejemplo
Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede obtenerse
primero una muestra aleatoria de los números de las páginas del directorio telefónico; al elegir
el vigésimo nombre de cada página obtendríamos un muestreo sistemático, también podemos
escoger un nombre de la primera página del directorio y después seleccionar cada nombre del
lugar número cien a partir del ya seleccionado. Por ejemplo, podríamos seleccionar un número
al azar entre los primeros 100; supongamos que el elegido es el 40, entonces seleccionamos los
nombres del directorio que corresponden a los números 40, 140, 240, 340 y así sucesivamente.
1.3 ESTADISTICA DESCRIPTIVA

La ESTADÍSTICA DESCRIPTIVA con base matemática hace referencia a la recolección, análisis e
interpretación de datos y que busca explicar condiciones regulares en fenómenos de tipo aleatorio. Es
transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las
ciencias de la salud hasta el control de calidad y se usa para la toma de decisiones en áreas de negocios
o instituciones gubernamentales.
1.4 ESTADISTICA INFERENCIAL

La ESTADÍSTICA INFERENCIAL, que no es la simple recopilación de datos, proporciona métodos que
permiten al ingeniero, comprender mejor los sistemas que producen los datos y haciendo uso de leyes
fundamentales de probabilidad llegar a conclusiones a partir de la información que se colecta, en forma
de muestras o agrupaciones de observaciones o acopiando datos científicos en forma sistemática para
aplicarlos en sus planeaciones y el descubrimiento de oportunidades de mejora
1.5 BREBE INTRODUCCION A LA INFERENCIA ESTADISTICA

Una vez obtenida una muestra de una población, posiblemente el investigador quiera usar la
información de la muestra para llegar a un tipo de conclusión, es decir hacer un tipo de inferencia acerca
de la población. Esto es, la muestra es un medio hacia un fin y no un fin en sí misma. Las técnicas de
generalización que parten de una muestra y se dirigen hacia una población se ubican dentro de la rama
de nuestra disciplina llamada ESTADISTICA INFERENCIAL.
También se le llama Inferencia Estadística, pero previamente recordemos que la Estadística (EI)
comprende el conjunto de métodos estadísticos que permiten deducir (inferir) cómo se distribuye la
población bajo estudio a partir de la información que proporciona una muestra representativa, obtenida
de dicha población. Para que la Estadística Inferencial proporcione buenos resultados debe:
1. Basarse en una técnica estadístico-matemática adecuada al problema y suficientemente validada.
2. Utilizar una muestra que realmente sea representativa de la población y de un tamaño suficiente.
1.6 TEORIA DE DECISIÓN EN ESTADISTICA:

La mayor parte de la teoría de la decisión es normativa o prescriptiva, es decir concierne a la
identificación de la mejor decisión que pueda ser tomada, asumiendo que una persona que tenga que
tomar decisiones (decisión maker) sea capaz de estar en un entorno de completa información, capaz de
calcular con precisión y completamente racional. La aplicación práctica de esta aproximación
prescriptiva (de cómo la gente debería hacer y tomar decisiones) se denomina análisis de la decisión y
proporciona una búsqueda de herramientas, metodologías y software para ayudar a las personas a
tomar mejores decisiones. Las herramientas de software orientadas a este tipo de ayudas se desarrollan
bajo la denominación global de Sistemas para la ayuda a la decisión (decisión support systems, abreviado
en inglés como DSS).
Como parece obvio que las personas no se encuentran en estos entornos óptimos y con la intención de
hacer la teoría más realista, se ha creado un área de estudio relacionado que se encarga de la parte de
la disciplina más positiva o descriptiva, intentando describir qué es lo que la gente realmente hace
durante el proceso de toma de decisiones. Se pensó en esta teoría debido a que la teoría normativa,
trabaja sólo bajo condiciones óptimas de decisión y a menudo crea hipótesis, para ser probadas, algo
alejadas de la realidad cotidiana. Los dos campos están íntimamente relacionados; no obstante, es
posible relajar algunas presunciones de la información perfecta que llega al sujeto que toma decisiones,
se puede rebajar su racionalidad y así sucesivamente, hasta llegar a una serie de prescripciones o
predicciones sobre el comportamiento de la persona que toma decisiones, permitiendo comprobar qué
ocurre en la práctica de la vida cotidiana.
1.7 COMPONENTES DE UNA INVESTIGACION ESTADISTICAS:
La inferencia estadística se orienta a sacar conclusiones acerca del parámetro o

parámetros poblacionales con base en el valor de un estimador obtenido a partir de los datos
muestrales extraídos de esa población. Para llegar a ese objetivo a través de un proceso racional y eficaz,
se aconseja que se tengan en cuenta los siguientes pasos:
1. Formulación del problema. En este punto se debe especificar de manera clara la pregunta que se
debe responder y la población de datos asociada a la pregunta. Los conceptos deben ser precisos y
deben ponerse limitaciones adecuadas al problema motivadas por el tiempo, dinero disponible y la
habilidad de los Investigadores. Algunos conceptos como, artículo defectuoso, económico, salario,
pueden variar en cada caso y para cada problema debemos coincidir con las ideas señaladas en
el estudio.
2. Diseño del experimento. Este aspecto es de gran importancia, puesto que la recolección de datos
requiere dinero y tiempo. Es siempre nuestro deseo obtener máxima Información con el mínimo costo
(dinero y tiempo) posible. Incluir excesiva Información en la muestra es a menudo costoso y
antieconómico. Incluir poca también es poco satisfactorio. Esto implica, entre otras cosas, que
debemos determinar el tamaño de la muestra o la cantidad o tipo de datos que nos permita resolver el
problema de la manera más eficiente.
3. Recolección de datos. Esta parte, por lo general, es la que exige más tiempo en la Investigación. Esta
recolección debe ajustarse a reglas estrictas ya que de los datos esperamos extraer la Información
deseada.
4. Tabulación y descripción de los resultados. En esta etapa, los datos muestrales se exponen de
manera clara y se ilustran con representaciones tabulares y gráficas (diagramas. histogramas, etc.);
además se calculan las medidas estadísticas apropiadas al proceso inferencial que haya sido escogido.
5. Inferencia estadística y conclusiones. Este último paso constituye tal vez la contribución más
importante de la estadística al proceso inferencial. Aquí se fija el nivel de confiabilidad para la inferencia;
esto es debido a que las conclusiones derivadas de inferencias estadísticas jamás se pueden tomar con
un 100% de certeza, pero sí se les puede asociar un nivel de confiabilidad; en términos de probabilidad
denominados nivel de confianza y nivel de significancia. El proceso Inferencial nos llevará a una
conclusión estadística que servirá de orientación a quien o quienes deban tomar la decisión
(administrativa o clínica) sobre el tema objeto de estudio.
1.8 RECOLECCION DE DATOS:

Es importante tener presente la fuente de los datos con los que se trabajan. Es posible tener datos de
fuentes internas, que son aquellos generados al interior de la organización, como pueden ser datos
contables, registros de ventas, de personal, etc. Existen también los datos de fuentes externas, que
pueden obtenerse de otras personas u organizaciones. Los datos se clasifican por un lado, si son datos
de fuentes primarias, en cuyos casos son generados por quien los utiliza, como serian los dato de fuentes
internas. Sin embargo, los datos de fuentes primarias pueden también conseguirse en el exterior por
medio de encuestas (como las realizadas en investigación de mercados) o directamente a través de otras
instituciones. Por otro lado están los datos de fuentes secundarias que se recogen de fuentes que no
son los recopiladores originales de los datos.
1.9 ESTADISTICA PARAMETRIA (POBLACION Y MUESTRA ALEATORIA)

Población. Es el conjunto formado por todos los valores posibles que puede asumir, la variable objeto
de estudio. Así por ejemplo, en un estudio sobre la preferencia de los votantes en una
elección presidencial, la población consiste en todas las respuestas de los votantes registrados. Pero el
término no sólo está asociado a la colección de seres humanos u organismos vivos; y tenemos así que,
si se va a hacer una investigación de las ventas anuales de los supermercados, entonces las ventas
anuales de todos los supermercados constituyen así mismo la población. Es bueno tener en cuenta que
el término población se interpreta de dos maneras cuando se hace un estudio estadístico, a saber:
1. La interpretación propia en el Análisis Estadístico, que corresponde a la que hemos presentado

anteriormente.
2. Como el conjunto de objetos sobre los cuales actúa la variable considerada. Por tanto, no es extraño
escuchar expresiones tales como, "se hizo un estudio de los niveles de ingreso de la población
trabajadora colombiana", entendiéndose con ello que el elemento estadístico objeto de análisis fue el
registro numérico de los ingresos.
Muestra. Es cualquier subconjunto de la población, escogido al seguir ciertos criterios de selección. La

muestra es el elemento básico sobre el cual se fundamenta la posterior inferencia acerca de la población
de donde se ha tomado. Por ello, su escogencia y selección debe hacerse siguiendo ciertos
procedimientos que son ampliamente tratados en la parte de la estadística llamada Teoría de muestreo.
El concepto de muestra tiene también las dos connotaciones que hemos señalado para la población. Las
características de una población se resumen para su estudio generalmente irá mediante lo que se
denominan parámetros; éstos a su vez se toman o consideran como valores verdaderos de la
característica estudiada. Por ejemplo, la proporción de todos los clientes que declaran cierta preferencia
por una marca particular de un producto dado, es un parámetro de la población de todos los clientes;
es la verdadera proporción de la población. Igualmente, la media aritmética de las cuentas corrientes
de los clientes de un banco determinado constituye un parámetro de la población de las cuentas de los
clientes de ese banco.
UNIDADA 2:
INFERENCIA ESTADISTICA ESTIMACION
El objetivo principal de la estadística inferencial es la estimación, esto es que mediante el estudio de una
muestra de una población se quiere generalizar las conclusiones al total de la misma. Como vimos en la
sección anterior, los estadísticos varían mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estándar de un estadístico, más cercanos serán unos de otros sus valores.
Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo. Una estimación puntual
es un único valor estadístico y se usa para estimar un parámetro. El estadístico usado se denomina
estimador.
Una estimación por intervalo es un rango, generalmente de ancho finito, que se espera que contenga el
parámetro.
Estimación Puntual
La inferencia estadística está casi siempre concentrada en obtener algún tipo de conclusión acerca de
uno o más parámetros (características poblacionales). Para hacerlo, se requiere que un investigador
obtenga datos muestrales de cada una de las poblaciones en estudio. Entonces, las conclusiones pueden
estar basadas en los valores calculados de varias cantidades muestrales . Po ejemplo, representamos
con (parámetro) el verdadero promedio de resistencia a la ruptura de conexiones de alambres
utilizados para unir obleas de semiconductores. Podría tomarse una muestra aleatoria de 10 conexiones
para determinar la resistencia a la ruptura de cada una, y la media muestral de la resistencia a la
ruptura se podía emplear para sacar una conclusión acerca del valor de . De forma similar,
si es la varianza de la distribución de resistencia a la ruptura, el valor de la varianza muestral s 2 se
podría utilizar para inferir algo acerca de .
Cuando se analizan conceptos generales y métodos de inferencia es conveniente tener un símbolo

genérico para el parámetro de interés. Se utilizará la letra griega para este propósito. El objetivo de
la estimación puntual es seleccionar sólo un número, basados en datos de la muestra, que represente el
valor más razonable de .
Una muestra aleatoria de 3 baterías para calculadora podría presentar duraciones observadas en horas
de x1=5.0, x2=6.4 y x3=5.9. El valor calculado de la duración media muestral es = 5.77, y es razonable
considerar 5.77 como el valor más adecuado de .
Una estimación puntual de un parámetro es un sólo número que se puede considerar como el valor
más razonable de . La estimación puntual se obtiene al seleccionar una estadística apropiada y calcular
su valor a partir de datos de la muestra dada. La estadística seleccionada se llama estimador
puntual de .
El símbolo (theta sombrero) suele utilizarse para representar el estimador de y la estimación

puntual resultante de una muestra dada. Entonces se lee como "el estimador puntual de es
la media muestral ". El enunciado "la estimación puntual de es 5.77" se puede escribir en forma
abreviada .
Ejemplo:
En el futuro habrá cada vez más interés en desarrollar aleaciones de Mg de bajo costo, para varios
procesos de fundición. En consecuencia, es importante contar con métodos prácticos para determinar
varias propiedades mecánicas de esas aleaciones. Examine la siguiente muestra de mediciones del
módulo de elasticidad obtenidos de un proceso de fundición a presión:
44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1
Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la varianza
poblacional . Un estimador natural es la varianza muestral:
En el mejor de los casos, se encontrará un estimador para el cual siempre. Sin embargo, es
una función de las Xi muestrales, por lo que en sí misma una variable aleatoria.
+ Error de estimación entonces el estimador preciso sería uno que produzca sólo pequeñas
diferencias de estimación, de modo que los valores estimados se acerquen al valor verdadero.
Propiedades de un Buen Estimador
Insesgado.- Se dice que un estimador puntual es un estimador insesgado de si , para todo

valor posible de . En otras palabras, un estimador insesgado es aquel para el cual la media de la
distribución muestral es el parámetro estimado. Si se usa la media muestral para estimar la media
poblacional , se sabe que la , por lo tanto la media es un estimador insesgado.
Eficiente o con varianza mínima.- Suponga que 1 y 2 son dos estimadores insesgados de .
Entonces, aun cuando la distribución de cada estimador esté centrada en el valor verdadero de , las
dispersiones de las distribuciones alrededor del valor verdadero pueden ser diferentes.
Entre todos los estimadores de que son insesgados, seleccione al que tenga varianza mínima.
El resultante recibe el nombre de estimador insesgado con varianza mínima (MVUE, mínimum
variance unbiased estimator) de .
En otras palabras, la eficiencia se refiere al tamaño de error estándar de la estadística. Si comparamos

dos estadisticas de una muestra del mismo tamaño y tratamos de decidir cuál de ellas es un estimador
más eficiente, escogeríamos la estadística que tuviera el menor error estándar, o la menor desviación
estándar de la distribución de muestreo.
Tiene sentido pensar que un estimador con un error estándar menor tendrá una mayor oportunidad de
producir una estimación más cercana al parámetro de población que se está considerando.
Como se puede observar las dos distribuciones tienen un mismo valor en el parámetro sólo que la
distribución muestral de medias tiene una menor varianza, por lo que la media se convierte en un
estimador eficiente e insesgado.
Coherencia.- Una estadística es un estimador coherente de un parámetro de población, si al aumentar

el tamaño de la muestra se tiene casi la certeza de que el valor de la estadística se aproxima bastante al
valor del parámetro de la población. Si un estimador es coherente se vuelve más confiable si tenemos
tamaños de muestras más grandes.
Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la información contenida de la muestra

que ningún otro estimador podría extraer información adicional de la muestra sobre el parámetro de la
población que se está estimando.
Es decir se pretende que al extraer la muestra el estadístico calculado contenga toda la información de
esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se necesitan todos los datos.
Cuando se calcula la mediana de una muestra sólo se utiliza a un dato o a dos. Esto es solo el dato o los
datos del centro son los que van a representar la muestra. Con esto se deduce que si utilizamos a todos
los datos de la muestra como es en el caso de la media, la varianza, desviación estándar, etc.; se tendrá
un estimador suficiente.
Estimación por Intervalos
Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información alguna sobre
la precisión y confiabilidad de la estimación. Por ejemplo, imagine que se usa el estadístico para
calcular un estimado puntual de la resistencia real a la ruptura de toallas de papel de cierta marca, y
suponga que = 9322.7. Debido a la variabilidad de la muestra, nunca se tendrá el caso de que =
. El estimado puntual nada dice sobre lo cercano que esta de . Una alternativa para reportar un solo
valor del parámetro que se esté estimando es calcular e informar todo un intervalo de valores factibles,
un estimado de intervalo o intervalo de confianza (IC). Un intervalo de confianza se calcula siempre
seleccionando primero un nivel de confianza, que es una medida del grado de fiabilidad en el intervalo.
Un intervalo de confianza con un nivel de confianza de 95% de la resistencia real promedio a la ruptura
podría tener un límite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un nivel de confianza
de 95%, es posible tener cualquier valor de entre 9162.5 y 9482.9. Un nivel de confianza de 95%
implica que 95% de todas las muestras daría lugar a un intervalo que incluye o cualquier otro
parámetro que se esté estimando, y sólo 5% de las muestras producirá un intervalo erróneo. Cuanto
mayor sea el nivel de confianza podremos creer que el valor del parámetro que se estima está dentro
del intervalo.
Una interpretación correcta de la "confianza de 95%" radica en la interpretación frecuente de

probabilidad a largo plazo: decir que un evento A tiene una probabilidad de 0.95, es decir que si el
experimento donde A está definido re realiza una y otra vez, a largo plazo A ocurrirá 95% de las veces.
Para este caso el 95% de los intervalos de confianza calculados contendrán a .
Esta es una construcción repetida de intervalos de confianza de 95% y se puede observar que de los 11
intervalos calculados sólo el tercero y el último no contienen el valor de .
De acuerdo con esta interpretación, el nivel de confianza de 95% no es tanto un enunciado sobre
cualquier intervalo en particular, más bien se refiere a lo que sucedería si se tuvieran que construir un
gran número de intervalos semejantes.
Encontrar z a partir de un nivel de confianza
Existen varias tablas en las cuales podemos encontrar el valor de z, según sea el área proporcionada por
la misma. En esta sección se realizará un ejemplo para encontrar el valor de z utilizando tres tablas
diferentes.
Ejemplo:
Encuentre el valor de z para un nivel de confianza del 95%.
Solución 1:
Se utilizará la tabla que tiene el área bajo la curva de - hasta z. Si lo vemos gráficamente sería:
El nivel de confianza bilateral está dividido en partes iguales bajo la curva:
En base a la tabla que se está utilizando, se tendrá que buscar el área de 0.975, ya que cada extremo o
cola de la curva tiene un valor de 0.025.
Por lo que el valor de z es de 1.96.
Solución 2:
Si se utiliza una tabla en donde el área bajo la curva es de 0 a z:
En este caso sólo se tendrá que buscar adentro de la tabla el área de 0.475 y el resultado del valor de z
será el mismo, para este ejemplo 1.96.
Solución 3:
Para la tabla en donde el área bajo la curva va desde z hasta :

Se busca el valor de 0.025 para encontrar z de 1.96.
Independientemente del valor del Nivel de Confianza este será el procedimiento a seguir para localizar
a z. En el caso de que no se encuentre el valor exacto se tendrá que interpolar.
Estimación para la Media
Es conocido de nosotros durante este curso, que en base a la distribución muestral de medias que se
generó en el tema anterior, la fórmula para el cálculo de probabilidad es la siguiente:
Como en este caso no conocemos el parámetro y lo queremos estimar por medio de la media de la
muestra, sólo se despejará de la formula anterior, quedando lo siguiente:
De esta fórmula se puede observar que tanto el tamaño de la muestra como el valor de z se conocerán.
Z se puede obtener de la tabla de la distribución normal a partir del nivel de confianza establecido. Pero
en ocasiones se desconoce por lo que en esos casos lo correcto es utilizar otra distribución llamada
"t" de student si la población de donde provienen los datos es normal.
Para el caso de tamaños de muestra grande se puede utilizar una estimación puntual de la desviación
estándar, es decir igualar la desviación estándar de la muestra a la de la población (s= ).
Ejemplos:
1. Se encuentra que la concentración promedio de zinc que se saca del agua a partir de una
muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los
intervalos de confianza de 95% y 99% para la concentración media de zinc en el río. Suponga que la
desviación estándar de la población es 0.3.
Solución:
La estimación puntual de es = 2.6. El valor de z para un nivel de confianza del 95% es 1.96, por lo
tanto:
Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo será más amplio:
El intervalo de confianza proporciona una estimación de la precisión de nuestra estimación puntual.

Si es realmente el valor central de intervalo, entonces estima sin error. La mayor parte de las
veces, sin embargo, no será exactamente igual a y la estimación puntual es errónea. La magnitud
de este error será el valor absoluto de la diferencia entre y , y podemos tener el nivel de confianza
de que esta diferencia no excederá .
Como se puede observar en los resultados del ejercicio se tiene un error de estimación mayor cuando
el nivel de confianza es del 99% y más pequeño cuando se reduce a un nivel de confianza del 95%.
2. Una empresa eléctrica fabrica focos que tienen una duración aproximadamente distribuida de
forma normal con una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una duración
promedio de 780 horas, encuentre un intervalos de confianza de 96% para la media de la población de
todos los focos que produce esta empresa.
Solución:
Con un nivel de confianza del 96% se sabe que la duración media de los focos que produce la empresa
está entre 765 y 765 horas.
3. La prueba de corte sesgado es el procedimiento más aceptado para evaluar la calidad de una
unión entre un material de reparación y su sustrato de concreto. El artículo "Testing the Bond Between
Repair Materials and Concrete Substrate" informa que, en cierta investigación, se obtuvo una resistencia
promedio muestral de 17.17 N/mm2, con una muestra de 48 observaciones de resistencia al corte, y la
desviación estándar muestral fue 3.28 N/mm2. Utilice un nivel de confianza inferior del 95% para estimar
la media real de la resistencia al corte.
Solución:
En este ejercicio se nos presentan dos situaciones diferentes a los ejercicios anteriores. La primera que
desconoce la desviación estándar de la población y la segunda que nos piden un intervalo de confianza
unilateral.
El primer caso ya se había comentado y se solucionará utilizando la desviación estándar de la muestra

como estimación puntual de sigma.
Para el intervalo de confianza unilateral, se cargará el área bajo la curva hacia un solo lado como sigue:
Esto quiere decir que con un nivel de confianza de 95%, el valor de la media está en el intervalo
(16.39, ).
Distribución Muestral de Diferencia de Medias
Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviación estándar 1,
y la segunda con media 2 y desviación estándar 2. Más aún, se elige una muestra aleatoria de
tamaño n1 de la primera población y una muestra independiente aleatoria de tamaño n2 de la segunda
población; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La
colección de todas esas diferencias se llama distribución muestral de las diferencias entre medias o
la distribución muestral del estadístico
La distribución es aproximadamente normal para n1 30 y n2 30. Si las poblaciones son normales,

entonces la distribución muestral de medias es normal sin importar los tamaños de las muestras.
En ejercicios anteriores se había demostrado que y que , por lo que no es difícil deducir
que y que .
La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de medias es:
Ejemplo:
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela primaria
se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como para
niñas los pesos siguen una distribución normal. El promedio de los pesos de todos los niños de sexto
grado de esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras que el promedio
de los pesos de todas las niñas del sexto grado de esa escuela es de 85 libras y su desviación estándar es
de 12.247 libras. Si representa el promedio de los pesos de 20 niños y es el promedio de los pesos
de una muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los 20 niños
sea al menos 20 libras más grande que el de las 25 niñas.
Solución:
Datos:
1= 100 libras
2 = 85 libras
1= 14.142 libras
2= 12.247 libras
n1 = 20 niños
n2 = 25 niñas
=?
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos 20
libras más grande que el de la muestra de las niñas es 0.1056.
Ejemplo:
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos compañías.
Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación estándar de 0.8 años,
mientras que los de la B tienen una vida media de 6.7 años con una desviación estándar de 0.7.
Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía A tenga una vida
promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la compañía B.
Solución:
Datos:
A= 7.2 años
B = 6.7 años
A= 0.8 años
B= 0.7 años
nA = 34 tubos
nB = 40 tubos
=?
Ejemplo:
Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación estándar de

1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para la segunda gasolina; se
prueba la primera gasolina en 35 autos y la segunda en 42 autos.
a. ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de

0.45km/L que la segunda gasolina?
b. ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65
y 0.83km/L a favor de la gasolina 1?.
Solución:
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos poblaciones, por
lo que se supondrán que son iguales.
Datos:
1= 1.23 Km/Lto
2= 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
a. =?
b.
?
La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 0.65
y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0117.
Distribución Muestral de Diferencia de Proporciones
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando
proporciones o porcentajes. A continuación se citan algunos ejemplos:
 Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de
los que aprueban inglés?
 Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una
reacción adversa que el de los usuarios del fármaco B que también presentan una reacción de
ese tipo?
 Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en posiciones
gerenciales.
 Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la
máquina A con respecto a los que genera la máquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribución muestral de diferencia de proporciones es aproximadamente normal para
tamaños de muestra grande (n1p1 5, n1q1 5,n2p2 5 y n2q2 5). Entonces p1 y p2tienen distribuciones
muestrales aproximadamente normales, así que su diferencia p1-p2 también tiene una distribución
muestral aproximadamente normal.
Cuando se estudió a la distribución muestral de proporciones se comprobó que y
que , por lo que no es difícil deducir que y
que .
La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de proporciones
es:
Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre
la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los
hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo
están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la
promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor
sea al menos 3% mayor que el de las mujeres.
Solución:
Datos:
PH = 0.12
PM = 0.10
nH = 100
nM = 100
p(pH-pM 0.03) = ?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución binomial y se
está utilizando la distribución normal.
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos
3% mayor que el de mujeres es de 0.4562.
Ejemplo:
Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron despedidos entre
1979 y 1984, encontró que 20% habían estado sin trabajo durante por lo menos dos años. Supóngase
que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los empleados
despedidos entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral de trabajadores
sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston
College, en 5% o más?
Solución:
En este ejercicio se cuenta únicamente con una población, de la cual se están extrayendo dos muestras
y se quiere saber la probabilidad de la diferencia de los porcentajes en esas dos muestras, por lo que se
debe de utilizar la distribución muestral de proporciones con P1= P2, ya que es una misma población.
Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de trabajadores
despedidos entre 1979 y 1984 que estuvieron desempleados por un período de por lo menos dos años,
sólo se conoce la
p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa proporción.
En la fórmula de la distribución muestral de proporciones para el cálculo de probabilidad se necesita

saber las proporciones de las poblaciones, las cuales en este ejercicio las desconocemos, por lo que se
utilizará el valor de 0.20 como una estimación puntual de P. En el siguiente tema se abordará el tema de
estimación estadística y se comprenderá él porque estamos utilizando de esa manera el dato.
También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la probabilidad de
que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del
porcentaje obtenido en la encuesta de Boston College, en 5% o más?, la palabra difiera quiere decir que
puede existir una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que se tendrán
que calcular dos áreas en la distribución y al final sumarlas.
Datos:
p1 = 0.20
n1 = 320 trabajadores
n2 = 320 trabajadores
P1 = P2
La probabilidad de que su proporción muestral de trabajadores sin empleo durante por lo menos dos
años, difiera del porcentaje obtenido en la encuesta de Boston College, en 0.05 o más es de 0.1260.
Ejemplo:
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos
fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:
a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a
la máquina 1 en por lo menos 0.10?
b. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a
la máquina 2 en por lo menos 0.15?
Solución:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
a. p(p2-p1 0.10) = ?
Otra manera de hacer este ejercicio es poner P1-P2:

La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo
menos 10% a favor de la máquina 2 es de 0.0011.
b. p(p1-p2
0.15)=?
La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos
15% a favor de la máquina 1 es de 0.2357.
DISTRIBUCION JI-CUADRADA (X2)
En realidad la distribución ji-cuadrada es la distribución muestral de s2. O sea que si se extraen todas las
muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la
distribución muestral de varianzas.
Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X2. Si se
elige una muestra de tamaño n de una población normal con varianza , el estadístico:
Tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1 grados de libertad y se
denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada esta dado por:
Donde n es el tamaño de la muestra, s2 la varianza muestral y la varianza de la población de donde

se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con la siguiente expresión:
Propiedades de las distribuciones ji-cuadrada
1. Los valores de X2 son mayores o iguales que 0.

2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un número infinito de
distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la derecha;
esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).
La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n-3) = (gl-
2).
La función de densidad de la distribución X2 está dada por:
para x>0
La tabla que se utilizará para estos apuntes es la del libro de probabilidad y estadística de Walpole, la
cual da valores críticos (gl) para veinte valores especiales de . Para denotar el valor crítico de
una distribución X2 con gl grados de libertad se usa el símbolo (gl); este valor crítico determina a
su derecha un área de bajo la curva X y sobre el eje horizontal. Por ejemplo para encontrar X20.05(6)
2
en la tabla se localiza 6 gl en el lado izquierdo y a lo largo del lado superior de la misma

tabla.
Cálculo de Probabilidad
El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para saber cómo se va a
comportar la varianza o desviación estándar en una muestra que proviene de una distribución normal.
Ejemplos:
1. Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos en una
ciudad grande forman una distribución normal con una desviación estándar =1 minuto. Si se elige
al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor
que 2.
Solución:
Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como sigue:
El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad y se encuentra que a

este valor le corresponde un área a la derecha de 0.01. En consecuencia, el valor de la probabilidad es
P(s2>2)
2. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal
con varianza , tenga una varianza muestral:
a. Mayor que 9.1

b. Entre 3.462 y 10.745
Solución.
a. Primero se procederá a calcular el valor de la ji-cuadrada:
Al buscar este número en el renglón de 24 grados de libertad nos da un área a la derecha de 0.05. Por
lo que la P(s2 >9.1) = 0.05
1. Se calcularán dos valores de ji-cuadrada:
Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al buscar el valor de
13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da un área a la derecha de 0.01.
Como se está pidiendo la probabilidad entre dos valores se resta el área de 0.95 menos 0.01 quedando
0.94.
Por lo tanto la P(3.462 s2 10.745) = 0.94

Estimación de la Varianza
Para poder estimar la varianza de una población normal se utilizará la distribución ji-cuadrada.
Al despejar esta fórmula la varianza poblacional nos queda:
Los valores de X2 dependerán de nivel de confianza que se quiera al cual le llamamos . Si nos
ubicamos en la gráfica se tiene:
Ejemplos:
1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta
compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de confianza
de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compañía,
suponga una población normal.
Solución:
Primero se calcula la desviación estándar de la muestra:
al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2= 0.286.
Para obtener un intervalo de confianza de 95% se elige un = 0.05. Después con el uso de la tabla
con 9 grados de libertad se obtienen los valores de X2.
Se puede observar en la gráfica anterior que el valor de X2 corre en forma normal, esto es de izquierda
a derecha.
Por lo tanto, el intervalo de confianza de 95% para la varianza es:
Gráficamente:
Se observa que la varianza corre en sentido contrario, pero esto es sólo en la gráfica. La interpretación
quedaría similar a nuestros temas anteriores referentes a estimación. Con un nivel de confianza del 95%
se sabe que la varianza de la población de los pesos de los paquetes de semillas de pasto está entre
0.135 y 0.935 decagramos al cuadrado.
2. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de los

resultados que producen muestras estándar. En un estudio de la cantidad de calcio en el agua potable,
el cual se efectúa como parte del control de calidad, se analizó seis veces la misma muestra en el
laboratorio en intervalos aleatorios. Los seis resultados en partes por millón fueron 9.54, 9.61, 9.32,
9.48, 9.70 y 9.26. Estimar la varianza de los resultados de la población para este estándar, usando un
nivel de confianza del 90%.
Solución:
Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.
Se busca en la tabla los valores correspondientes con 5 grados de libertad, obteniéndose dos resultados.
Para X2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07.
Entonces el intervalo de confianza esta dado por:
y
UNIDAD III:
PRUEBA DE HIPOTESIS CON UNA MUESTRA:
Las secciones anteriores han mostrado cómo puede estimarse un parámetro a partir de los datos
contenidos en una muestra. Puede encontrarse ya sea un sólo número (estimador puntual) o un
intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos problemas de ingeniería,
ciencia, y administración, requieren que se tome una decisión entre aceptar o rechazar una proposición
sobre algún parámetro. Esta proposición recibe el nombre de hipótesis. Este es uno de los aspectos más
útiles de la inferencia estadística, puesto que muchos tipos de problemas de toma de decisiones,
pruebas o experimentos en el mundo de la ingeniería, pueden formularse como problemas de prueba
de hipótesis.
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones.
Suponga que se tiene interés en la rapidez de combustión de un agente propulsor sólido utilizado en los
sistemas de salida de emergencia para la tripulación de aeronaves. El interés se centra sobre la rapidez
de combustión promedio. De manera específica, el interés recae en decir si la rapidez de combustión
promedio es o no 50 cm/s. Esto puede expresarse de manera formal como
Ho; = 50 cm/s
H1; 50 cm/s
La proposición Ho; = 50 cm/s, se conoce como hipótesis nula, mientras que la proposición
H1; 50 cm/s, recibe el nombre de hipótesis alternativa. Puesto que la hipótesis alternativa
especifica valores de que pueden ser mayores o menores que 50 cm/s, también se conoce
como hipótesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una hipótesis
alternativa unilateral, como en
Ho; = 50 cm/s Ho; = 50 cm/s
H1; < 50 cm/s H1; > 50 cm/s
Es importante recordar que las hipótesis siempre son proposiciones sobre la población o distribución
bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del parámetro de la población
especificado en la hipótesis nula se determina en una de tres maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el
objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del
parámetro.
2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso bajo
estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo.
3. Cuando el valor del parámetro proviene de consideraciones externas, tales como las
especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación, el
objetivo usual de la prueba de hipótesis es probar el cumplimiento de las especificaciones.
Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el nombre
de prueba de hipótesis. Los procedimientos de prueba de hipótesis dependen del empleo de la
información contenida en la muestra aleatoria de la población de interés. Si esta información es
consistente con la hipótesis, se concluye que ésta es verdadera; sin embargo si esta información es
inconsistente con la hipótesis, se concluye que esta es falsa. Debe hacerse hincapié en que la verdad o
falsedad de una hipótesis en particular nunca puede conocerse con certidumbre, a menos que pueda
examinarse a toda la población. Usualmente esto es imposible en muchas situaciones prácticas. Por
tanto, es necesario desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la
probabilidad de llegar a una conclusión equivocada.
La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de poblaciones
que al inicio se supone cierta (es decir, la "creencia a priori").
La hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta es la hipótesis
del investigador.
La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia muestral sugiere que
Ho es falsa. Si la muestra no contradice decididamente a Ho, se continúa creyendo en la validez de la
hipótesis nula. Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis
son rechazar Ho o no rechazar Ho.
Prueba de una Hipótesis Estadística
Para ilustrar los conceptos generales, considere el problema de la rapidez de combustión del agente
propulsor presentado con anterioridad. La hipótesis nula es que la rapidez promedio de combustión es
50 cm/s, mientras que la hipótesis alternativa es que ésta no es igual a 50 cm/s. Esto es, se desea probar:
Ho; = 50 cm/s
H1; 50 cm/s
Supóngase que se realiza una prueba sobre una muestra de 10 especímenes, y que se observa cual es la
rapidez de combustión promedio muestral. La media muestral es un estimador de la media verdadera
de la población. Un valor de la media muestral que este próximo al valor hipotético = 50 cm/s es
una evidencia de que el verdadero valor de la media es realmente 50 cm/s; esto es, tal evidencia
apoya la hipótesis nula Ho. Por otra parte, una media muestral muy diferente de 50 cm/s constituye una
evidencia que apoya la hipótesis alternativa H1. Por tanto, en este caso, la media muestral es el
estadístico de prueba.
La media muestral puede tomar muchos valores diferentes. Supóngase que si 48.5 51.5, entonces
no se rechaza la hipótesis nula Ho; = 50 cm/s, y que si <48.5 ó >51.5, entonces se acepta la
hipótesis alternativa H1; 50 cm/s.
Los valores de que son menores que 48.5 o mayores que 51.5 constituyen la región crítica de la
prueba, mientras que todos los valores que están en el intervalo 48.5 51.5 forman la región de
aceptación. Las fronteras entre las regiones crítica y de aceptación reciben el nombre de valores
críticos. La costumbre es establecer conclusiones con respecto a la hipótesis nula Ho. Por tanto, se
rechaza Ho en favor de H1 si el estadístico de prueba cae en la región crítica, de lo contrario, no se rechaza
Ho.
Este procedimiento de decisión puede conducir a una de dos conclusiones erróneas. Por ejemplo, es
posible que el valor verdadero de la rapidez promedio de combustión del agente propulsor sea igual a
50 cm/s. Sin embargo, para todos los especímenes bajo prueba, bien puede observarse un valor del
estadístico de prueba que cae en la región crítica. En este caso, la hipótesis nula Ho será rechazada en
favor de la alternativa H1cuando, de hecho, Ho en realidad es verdadera. Este tipo de conclusión
equivocada se conoce como error tipo I.
El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera. También es
conocido como ó nivel de significancia.
Si tuviéramos un nivel de confianza del 95% entonces el nivel de significancia sería del 5%. Análogamente
si se tiene un nivel de confianza del 90% entonces el nivel de significancia sería del 10%.
Ahora supóngase que la verdadera rapidez promedio de combustión es diferente de 50 cm/s, aunque la
media muestral caiga dentro de la región de aceptación. En este caso se acepta Ho cuando ésta es
falsa. Este tipo de conclusión recibe el nombre de error tipo II.
El error tipo II ó error se define como la aceptación de la hipótesis nula cuando ésta es falsa.
Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que
determinan si la decisión final es correcta o errónea.
Decisión Ho es verdadera Ho es falsa
Aceptar Ho No hay error Error tipo II ó
Rechazar Ho Error tipo I ó No hay error
1. Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por lo general
tiene como resultado un aumento en la probabilidad del otro.
2. El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I, siempre se puede
reducir al ajustar el o los valores críticos.
3. Un aumento en el tamaño muestral n reducirá y de forma simultánea.
4. Si la hipótesis nula es falsa, es un máximo cuando el valor real del parámetro se aproxima al
hipotético. Entre más grande sea la distancia entre el valor real y el valor hipotético, será menor
PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS
INDEPENDIENTEMENTE DE LA DISTRIBUCION QUE SE ESTE TRATANDO
1. Interpretar correctamente hacia que distribución muestral se ajustan los datos del enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los parámetros de los estadísticos. Así
mismo se debe determinar en este punto información implícita como el tipo de muestreo y si la
población es finita o infinita.
3. Establecer simultáneamente el ensayo de hipótesis y el planteamiento gráfico del problema. El ensayo de
hipótesis está en función de parámetros ya que se quiere evaluar el universo de donde proviene la
muestra. En este punto se determina el tipo de ensayo (unilateral o bilateral).
4. Establecer la regla de decisión. Esta se puede establecer en función del valor crítico, el cual se obtiene
dependiendo del valor de (Error tipo I o nivel de significancia) o en función del estadístico límite de
la distribución muestral. Cada una de las hipótesis deberá ser argumentada correctamente para tomar
la decisión, la cual estará en función de la hipótesis nula o Ho.
5. Calcular el estadístico real, y situarlo para tomar la decisión.
6. Justificar la toma de decisión y concluir.
Tipos de Ensayo
Se pueden presentar tres tipos de ensayo de hipótesis que son:
 Unilateral Derecho
 Unilateral Izquierdo
 Bilateral
Dependiendo de la evaluación que se quiera hacer se seleccionará el tipo de ensayo.
 Unilateral Derecho. El investigador desea comprobar la hipótesis de un aumento en el parámetro, en

este caso el nivel de significancia se carga todo hacia el lado derecho, para definir las regiones de
aceptación y de rechazo.
Ensayo de hipótesis:
Ho; Parámetro x
H1; Parámetro > x
 Unilateral Izquierdo: El investigador desea comprobar la hipótesis de una disminución en el parámetro,

en este caso el nivel de significancia se carga todo hacia el lado izquierdo, para definir las regiones de
aceptación y de rechazo.
Ho; Parámetro x
H1; Parámetro < x
 Bilateral: El investigador desea comprobar la hipótesis de un cambio en el parámetro. El nivel de

significancia se divide en dos y existen dos regiones de rechazo.
Ho; Parámetro = x
H1; Parámetro x
Para realizar los ejemplos y ejercicios de ensayo de hipótesis se recomienda seguir los pasos
mencionados anteriormente. Los ejemplos siguientes se solucionarán por los pasos recomendados,
teniéndose una variedad de problemas en donde se incluirán a todas las distribuciones muestrales que
se han visto hasta aquí.
Ejemplos:
1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra una vida
promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años, ¿esto parece indicar
que la vida media hoy en día es mayor que 70 años? Utilice un nivel de significancia de 0.05.
Solución:
1. Se trata de una distribución muestral de medias con desviación estándar conocida.

2. Datos:
=70 años
= 8.9 años
= 71.8 años
n = 100
= 0.05
3. Ensayo de hipótesis
Ho; = 70 años.
H1; > 70 años.
4. Regla de decisión:
Si zR 1.645 no se rechaza Ho.
Si zR> 1.645 se rechaza Ho.

5. Cálculos:
6. Justificación y decisión.
Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la vida media
hoy en día es mayor que 70 años.
Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en este
caso la media de la muestra. De la formula de la distribución muestral de medias se despeja la media
de la muestra:
Regla de decisión:
Si 71.46 No se rechaza Ho
Si > 71.46 Se rechaza Ho
Como la media de la muestral es de 71.8 años y es mayor al valor de la media muestral límite de 71.46
por lo tanto se rechaza Ho y se llega a la misma conclusión.
2. Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma
aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Si una
muestra aleatoria de 30 focos tiene una duración promedio de 788 horas, ¿muestran los datos
suficiente evidencia para decir que la duración media ha cambiado? Utilice un nivel de significancia del
0.04.
Solución:
1. Se trata de una distribución muestral de medias con desviación estándar conocida.

2. Datos:
=800 horas
= 40 horas
= 788 horas
n = 30
= 0.04
Ho; = 800 horas
H1; 800 horas
4. Regla de Decisión:
Si –2.052 ZR 2.052 No se rechaza Ho
Si ZR < -2.052 ó si ZR > 2.052 Se rechaza Ho
5. Cálculos:
6. Justificación y decisión:
Como –2.052 -1.643 2.052 por lo tanto, no se rechaza Ho y se concluye con un nivel de
significancia del 0.04 que la duración media de los focos no ha cambiado.
Solución por el otro método:
785.02 y 814.98
Regla de decisión:
Si 785.02 814.98 No se rechaza Ho
Si < 785.02 ó > 814.98 se rechaza Ho
Como la = 788 horas, entonces no se rechaza Ho y se concluye que la duración media de los focos
no ha cambiado.
3. Una muestra aleatoria de 64 bolsas de palomitas de maíz pesan, en promedio 5.23 onzas con una
desviación estándar de 0.24 onzas. Pruebe la hipótesis de que = 5.5 onzas contra al hipótesis
alternativa, < 5.5 onzas en el nivel de significancia de 0.05.
Solución:
1. Se trata de una distribución muestral de medias con desviación estándar desconocida, pero como el
tamaño de muestra es mayor a 30 se puede tomar la desviación muestral como un estimador puntual
para la poblacional.
2. Datos:
= 5.5 onzas
s= 0.24 onzas
= 5.23 onzas
n = 64
= 0.05
Ho; = 5.5 onzas
H1; < 5.5 onzas
Si ZR -1.645 No se rechaza Ho
Si ZR < -1.645 Se rechaza Ho
5. Cálculos:
Como –9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de significancia del 0.05 que las
bolsas de palomitas pesan en promedio menos de 5.5 onzas.

Regla de decisión:
Si 5.45 No se Rechaza Ho
Si < 5.45 Se rechaza Ho
Como la = 5.23 y este valor es menor que 5.45 pot lo tanto se rechaza Ho.
4. Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se construyen hoy
en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación si una investigación de casas
nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bombas de calor? Utilice un nivel de
significancia de 0.10.
Solución:
1. Se trata de una distribución muestral de proporciones.

2. Datos:
P= 0.70
p = 8/15 = 0.5333
n = 15
= 0.10
Ho; P = 0.70
H1; P 0.70
5. Cálculos:
Como –1.645 -1.41 1.645 No se rechaza Ho y se concluye con un nivel de significancia de

0.10 que la afirmación del constructor es cierta.
= 0.505 y 0.894
Regla de decisión:
Si 0.505 pR 0.894 No se rechaza Ho

Si pR < 0.505 ó si ZR > 0.894 Se rechaza Ho
Como el valor del estadístico real es de 0.533 por lo tanto no se rechaza Ho y se llega a la misma
conclusión.
UNIDAD IV:
PRUEBA CON DOS MUESTRAS Y VARIAS MUESTRAS DE DATOS

NUMERICOS
TEORIA DE PEQUEÑAS MUESTRAS O TEORIA EXACTA DEL MUESTREO
En las unidades anteriores se manejó el uso de la distribución z, la cual se podía utilizar siempre y cuando
los tamaños de las muestras fueran mayores o iguales a 30 ó en muestras más pequeñas si la distribución
o las distribuciones de donde proviene la muestra o las muestras son normales.
En esta unidad se podrán utilizar muestras pequeñas siempre y cuando la distribución de donde
proviene la muestra tenga un comportamiento normal. Esta es una condición para utilizar las tres
distribuciones que se manejarán en esta unidad; t de student, X2 ji-cuadrada y Fisher.
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya que también la
podemos utilizar con muestras aleatorias de tamaño grande.
En esta unidad se verá un nuevo concepto necesario para poder utilizar a las tres distribuciones
mencionadas. Este concepto es "grados de libertad".
Para definir grados de libertad se hará referencia a la varianza muestral:
Esta fórmula está basada en n-1 grados de libertad (degrees of freedom). Esta terminología resulta del
hecho de que si bien s2 está basada en n cantidades ..., éstas suman cero,
así que especificar los valores de cualquier n-1 de las cantidades determina el valor restante. Por
ejemplo, si n=4 y
; y , entonces automáticamente tenemos , así que

sólo tres de los cuatro valores de están libremente determinamos 3 grados de libertad.
Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su simbología

DISTRIBUCION "t DE STUDENT"
Supóngase que se toma una muestra de una población normal con media y varianza Si es
el promedio de las n observaciones que contiene la muestra aleatoria, entonces la
distribución es una distribución normal estándar. Supóngase que la varianza de la

población es desconocida. ¿Qué sucede con la distribución de esta estadística si se
reemplaza por s? La distribución t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribución t son mínima y para >2,

respectivamente.
La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la

distribución t es similar a la de la distribución normal estándar: ambas son simétricas y unimodales, y el
valor máximo de la ordenada se alcanza en la media máximo Sin embargo, la distribución t tiene colas
más amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribución normal.
A medida que el número de grados de libertad tiende a infinito, la forma límite de la distribución t es la
distribución normal estándar.
Propiedades de las distribuciones t
1. Cada curva t tiene forma de campana con centro en 0.

2. Cada curva t, está más dispersa que la curva normal estándar z.
3. A medida que aumenta, la dispersión de la curva t correspondiente disminuye.
4. A medida que , la secuencia de curvas t se aproxima a la curva normal estándar, por
lo que la curva z recibe a veces el nombre de curva t con gl =
La distribución de la variable aleatoria t está dada por:

Esta se conoce como la distribución t con grados de libertad.
Sean X1, X2, . . . , En variables aleatorias independientes que son todas normales con media y
desviación estándar . Entonces la variable aleatoria tiene una distribución t con = n-

1 grados de libertad.
La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo de W. S. Gosset.

En esa época, Gosset era empleado de una cervecería irlandesa que desaprobaba la publicación de
investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo en secreto bajo el
nombre de "Student". En consecuencia, la distribución t normalmente se llama distribución t de Student,
o simplemente distribución t. Para derivar la ecuación de esta distribución, Gosset supone que las
muestras se seleccionan de una población normal. Aunque esto parecería una suposición muy
restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en forma casi
de campana aún proporcionan valores de t que se aproximan muy de cerca a la distribución t.
La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre

es mayor a uno. Únicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones
serán las mismas.
Se acostumbra representar con el valor t por arriba del cual se encuentra un área igual a .
Como la distribución t es simétrica alrededor de una media de cero, tenemos ; es

decir, el valor t que deja un área de a la derecha y por tanto un área de a la izquierda, es
igual al valor t negativo que deja un área de en la cola derecha de la distribución. Esto es, t0.95 = -
t0.05, t0.99=-t0.01, etc.
Para encontrar los valores de t se utilizará la tabla de valores críticos de la distribución t del libro
Probabilidad y Estadística para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo:
El valor t con = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto un área
de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145
Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto que se tiene que
hacer la resta de . La manera de encontrar el valor de t es buscar el valor de en el primer
renglón de la tabla y luego buscar los grados de libertad en la primer columna y donde se
intercepten y se obtendrá el valor de t.
Ejemplo:
Encuentre la probabilidad de –t0.025 < t < t0.05.
Solución:
Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda, encontramos
un área total de 1-0.05-0.025 = 0.925.
P( –t0.025 < t < t0.05) = 0.925
Ejemplo:
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se selecciona
de una distribución normal.
Solución:
Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este valor
le corresponde un área de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045
se tiene un valor de 0.005, que equivale a Luego se busca el valor de 0.005 en el primer renglón
con 14 grados de libertad y se obtiene un valor de t = 2.977, pero como el valor de está en el
extremo izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto:
P(-2.977 < t < -1.761) = 0.045
Ejemplo:
Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500
gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 25 lotes
cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho con su afirmación. ¿Qué
conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación
estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.
Solución:
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el fabricante queda
satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711 y 1.711.
Se procede a calcular el valor de t:
Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor de t
con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De
aquí que es probable que el fabricante concluya que el proceso produce un mejor producto del que
piensa.
INTERVALO DE CONFIANZA PARA ; CON DESCONOCIDA

Si y s son la media y la desviación estándar de una muestra aleatoria de una población normal con
varianza , desconocida, un intervalo de confianza de

( )100% para es:
donde /2 es el valor t con = n-1 grados de libertad, que deja un área de /2 a la derecha.
Se hace una distinción entre los casos de conocida y desconocida al calcular las estimaciones del
intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza el teorema del límite central,
mientras que para desconocida se hace uso de la distribución muestral de la variable aleatoria t. Sin
embargo, el uso de la distribución t se basa en la premisa de que el muestreo se realiza de una
distribución normal. En tanto que la distribución tenga forma aproximada de campana, los intervalos de
confianza se pueden calcular cuando la varianza se desconoce mediante el uso de la distribución t y se
puede esperar buenos resultados.
Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se pueda suponer,
con desconocida y n 30, s puede reemplazar ha y se puede utilizar el intervalo de confianza:
Por lo general éste se denomina como un intervalo de confianza de muestra grande. La justificación yace
sólo en la presunción de que con una muestra grande como 30, s estará muy cerca de la real y de
esta manera el teorema del límite central sigue valiendo. Se debe hacer énfasis en que esto es solo una
aproximación y que la calidad de este enfoque mejora a medida que el tamaño de la muestra crece más.
Ejemplos:
1. El contenido de siete contenedores similares de ácido sulfúrico son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6
litros. Encuentre un intervalo de confianza del 95% para la media de todos los contenedores si se supone
una distribución aproximadamente normal.
Solución:
La media muestral y la desviación estándar para los datos dados son:
10 y s= 0.283
En la tabla se encuentra que t0.025=2.447 con 6 grados de libertad, de aquí, el intervalo de confianza de
95% para es:
Con un nivel de confianza del 95% se sabe que el promedio del contenido de los contenedores está entre
9.47 y 10.26 litros.
2. Un artículo publicado en el Journal of Testing and Evaluation presenta las siguientes 20 mediciones del
tiempo de combustión residual en segundos de especímenes tratados de ropa de dormir para niños:
9.85 9.93 9.75 9.77 9.67
9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88
9.95 9.95 9.93 9.92 9.89
Se desea encontrar un nivel de confianza del 95% para el tiempo de combustión residual promedio.
Supóngase que el tiempo de combustión residual sigue una distribución normal.
Solución:
La media muestral y la desviación estándar para los datos dados son:
9.8525 y s= 0.0965
En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de aquí, el intervalo de confianza de
95% para es:
Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustión residual promedio se
encuentra entre 9.8073 y 9.8977 segundos.
PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL, VARIANZA DESCONOCIDA
Ciertamente sospechamos que las pruebas sobre una media poblacional con desconocida,
debe incluir el uso de la distribución t de Student. La estructura de la prueba es idéntica a la del caso
de conocida, con la excepción de que el valor en la estadística de prueba se reemplaza por la
estimación de s calculada y la distribución normal estándar se reemplaza con una distribución t.
Ejemplos:
1. El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-hora que gastan varios aparatos
electrodomésticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatt-hora al año. Si una
muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras gastan
un promedio de 42 kilowatt-hora al año con una desviación estándar de11.9 kilowatt-hora, ¿esto sugiere
con un nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46 kilowatt-
hora anualmente? Suponga que la población de kilowatt-hora es normal.
Solución:
1. Datos:
= 46 kilowatt-hora
s= 11.9 kilowatt-hora
= 42 kilowatt-hora
n = 12
= 0.05
Ho; = 46 kilowatt-hora
H1; < 46 kilowatt-hora
Si tR -1.796 No se rechaza Ho
Si tR < -1.796 Se rechaza Ho
5. Cálculos:
Como –1.16 > -1.796, por lo tanto no se rechaza Ho y se concluye con un nivel de significancia
del 0.05 que el número promedio de kilowatt-hora que gastan al año las aspiradoras no es
significativamente menor que 46.

Regla de decisión:
Si 39.83 No se Rechaza Ho
Si < 39.83 Se rechaza Ho
Como la = 42 y este valor no es menor que 39.83 por lo tanto no se rechaza Ho.
Se puede aprovechar este ejemplo para calcular el valor de P , como el valor de t calculada es de –1.16,
se busca en la tabla y se ve que el área a la izquierda de este valor es de 0.135 con 11 grados de libertad,
por lo tanto no se rechaza Ho., ya que sería un valor alto para un nivel de significancia.
1. Un artículo publicado en la revista Materials Engineering describe los resultados de pruebas de resistencia
a la adhesión de 22 especímenes de aleación U-700. La carga para la que cada espécimen falla es la
siguiente en MPa:
19.8 18.5 17.6 16.7 15.8
15.4 14.1 13.6 11.9 11.4
11.4 8.8 7.5 15.4 15.4
19.5 14.9 12.7 11.9 11.4
10.1 7.9
¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que la carga donde
se presenta la falla tiene una distribución normal, y utilícese = 0.05. Calcule el valor de P.
Solución:
1. Datos:
= 10
s = 3.55
= 13.71
n = 22
= 0.05
Ho; = 10
H1; > 10
Si tR 1.721 no se rechaza Ho.
Si tR> 1.721 se rechaza Ho.
5. Cálculos:
6. Justificación y decisión.
Como 4.90 >1.721 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la carga de falla
promedio es mayor que 10Mpa.
Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en este
caso la media de la muestra. De la fórmula de la distribución muestral de medias se despeja la media de
la muestra:
Regla de decisión:
Como la media de la muestral es de 13.71 MPa y es mayor al valor de la media muestral límite de 11.30
por lo tanto se rechaza Ho y se llega a la misma conclusión.
Para calcular el valor de P se va a la tabla y se busca en 21 grados de libertad el valor de t = 4.90. Se

observa que el valor mayor de t que se encuentra en la tabla con 21 grados de libertad es de 3.819 el
cual le corresponde un área a la derecha de 0.0005, por lo que para el valor de 4.90 el valor de P es
prácticamente cero, y esto apoya la decisión de rechazar Ho.
3. Los pesos en libras de una muestra aleatoria de bebés de seis meses son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9,
13.7 y 14.9. Haga una prueba con nivel de 5% de significancia para determinar si el peso promedio de
todos los bebés de seis meses es distinto a 14 libras, suponga que sus pesos se distribuyen normalmente
y calcule el valor de P.
Solución:
1. Datos:
= 14 libras
s = 1.21 libras
= 14.3 libras
n=8
= 0.05
Ho; = 14 libras
H1; 14 libras
Si –2.365 tR 2.365 No se rechaza Ho
Si tR < -2.365 ó si tR > 2.365 Se rechaza Ho
4. Cálculos:
Como –2.365 0.7012 2.365 por lo tanto, no se rechaza Ho y se concluye con un nivel de significancia
del 0.05 que el peso promedio de todos los bebés de seis meses es de 14 libras.
12.98 y 15.01
Regla de decisión:
Si 12.98 15.01 No se rechaza Ho
Si < 12.98 ó > 15.01 se rechaza Ho
Como la = 14.3 libras, entonces no se rechaza Ho .
Para calcular el valor de P se busca en la tabla el valor de 0.7012 con 7 grados de libertad. Se observa
que este valor no se encuentra pero se puede interpolar entre los valores de 0.549 y 0.896 con áreas de
0.30 y 0.20 respectivamente. Interpolando linealmente se obtiene el valor de 0.2561.
Error tipo II ó
El error tipo II se calcula de la misma forma en la que se calculó con la distribución z. Se realizarán algunos
ejercicios en los cuales se determinará la probabilidad de cometer el error tipo II, utilizando la tabla de
la distribución.
Existen curvas características de operación en los libros con diferentes grados de libertad para
determinar los tamaños de muestra correspondientes según el grado de error que se quiera, recordando
que entre mayor sea el tamaño de muestra menor será el error.
1. Se sabe que los voltajes de una marca de pilas tamaño C se distribuyen normalmente, se probó una
muestra aleatoria de 15 y se encontró que la media es de 1.4 volts con una desviación estándar de 0.21
volts. En el nivel de significancia de 0.01:
a. ¿Indica esto que la media de los voltajes es menor que 1.5 volts?
b. Calcular la probabilidad de cometer el error tipo II si el voltaje promedio real de las pilas es de 1.3 volts.
Solución:
1. Datos:
= 1.5 volts.
s= 0.21 volts
= 1.4 volts.
n = 15
= 0.01
Ho; = 1.5 volts
H1; < 1.5 volts
Si tR -2.624 No se rechaza Ho
Si tR < -2.624 Se rechaza Ho
5. Cálculos:
Como –1.84 > -2.624, por lo tanto no se rechaza Ho y se concluye con un nivel de significancia del 0.01 que
los voltajes de las pilas tamaño C no son menores a 1.5.
Para calcular el error tipo II se tiene que obtener el valor de de la siguiente forma:
Para encontrar el valor de se busca en la tabla de la distribución t el valor de 1.05 con 14 grados de
libertad. Como este valor no se encuentra en la tabla se interpola entre 0.868 y 1.076 con un área de
0.20 y 0.15 respectivamente. Al interpolar se obtiene un área de 0.15612 y esta es la probabilidad de
cometer el error tipo II cuando la media verdadera es de 1.3 volts y un tamaño de muestra de 15.
2. Para el ejercicio del peso de los bebés de 6 meses, calcular el error tipo II, si los pesos verdaderos hubieran
sido de 11 y 14.5 libras.
Solución:
Primero se calculan los valores de :

En este último cálculo para se tendrá que analizar las áreas de los dos extremos, pues estas no están
dentro de la región de aceptación, por lo tanto no se deben de tomar en cuenta para el error tipo II.
Se busca en la tabla el valor de 3.55 con 7 grados de libertad, y al interpolar nos da un área de 0.00475.
El área correspondiente a 1.19 con 7 grados de libertad es de 0.1479. Por lo que =1-
(0.00475+0.1479)= 0.8473
3. Para el ejercicio en donde se dan los resultados de pruebas de resistencia a la adhesión de 22 especímenes
de aleación U-700., encontrar la probabilidad de cometer el error tipo II si la carga promedio de falla es
igual a 11.
Solución:
Primero se obtendrá el valor del estadístico límite:
3. Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores

automovilísticos. El cliente requiere que la fracción de controladores defectuosos en uno de los pasos
de manufactura críticos no sea mayor que 0.05, y que el fabricante demuestre esta característica del
proceso de fabricación con este nivel de calidad, utilizando = 0.05. El fabricante de semiconductores
toma una muestra aleatoria de 200 dispositivos y encuentra que cuatro de ellos son defectuosos. ¿El
fabricante puede demostrar al cliente la calidad del proceso?
Solución:
1. Se trata de una distribución muestral de proporciones.

2. Datos:
P= 0.05
p = 4/200 = 0.02
n = 200
= 0.05
Ho; P = 0.05
H1; P < 0.05
Si ZR -1.645 No se rechaza Ho
Si ZR < -1.645 Se rechaza Ho
5. Cálculos:
Puesto que –1.946<-1.645, se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la
fracción de artículos defectuosos es menor que 0.05.
6. Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura tapa poros.
Se prueban dos fórmulas de pintura; la fórmula 1 tiene el contenido químico estándar, y la fórmula 2
tiene un nuevo ingrediente secante que debe reducir el tiempo de secado. De la experiencia se sabe que
la desviación estándar del tiempo de secado es ocho minutos, y esta variabilidad inherente no debe
verse afectada por la adición del nuevo ingrediente. Se pintan diez especímenes con la fórmula 1, y otros
diez con la fórmula 2. Los dos tiempos promedio de secado muestrales son 121 min y 112 min
respectivamente. ¿A qué conclusiones puede llegar el diseñador del producto sobre la eficacia del nuevo
ingrediente, utilizando = 0.05?
Solución:
1. Se trata de una distribución muestral de diferencia de medias con desviación estándar conocida.
2. Datos:
1= 2= 8
n1=n2= 10
= 0.05
Ho; 1- 2 =0
H1; 1- 2 > 0 Se desea rechazar Ho si el nuevo ingrediente disminuye el tiempo promedio de

secado, por eso se pone la diferencia mayor a cero o sea positiva para poder probar que 2 es
menor que 1.
5. Cálculos:
Puesto que 2.52>1.645, se rechaza Ho, y se concluye con un nivel de significancia de 0.05 que la adición
del nuevo ingrediente a la pintura si disminuye de manera significativa el tiempo promedio de secado.

Regla de decisión:
Puesto que = 121-112 = 9 y este número es mayor a 5.88 por lo tanto se rechaza Ho.
7. Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto de 16.0 onzas. Las
distribuciones de los volúmenes de llenado pueden suponerse normales, con desviaciones estándar
1=0.020 y 2 = 0.025 onzas. Un miembro del grupo de ingeniería de calidad sospecha que el volumen
neto de llenado de ambas máquinas es el mismo, sin importar si éste es o no de 16 onzas. De cada
máquina se toma una muestra aleatoria de 10 botellas. ¿Se encuentra el ingeniero en lo correcto?
Utilice 0.05
MAQUINA 1 MAQUINA 2
16.03 16.01 16.02 16.03
16.04 15.96 15.97 16.04
16.05 15.98 15.96 16.02
16.05 16.02 16.01 16.01
16.02 15.99 15.99 16.00
Solución:
2. Datos:
1= 0.020
2= 0.025
Este dato se obtuvo calculando la media de los datos en la máquina 1.
Este dato se obtuvo calculando la media de los datos en la máquina 2.
n1=n2 = 10
= 0.05
Ho; 1- 2 =0
H1; 1- 2 0 Si se cae en Ho se podrá probar que el volumen de llenado es el mismo en las

dos máquinas.
5. Cálculos:
Como –1.96 0.987 1.96 entonces no se rechaza Ho y se concluye con un nivel de significancia de
0.05 que las dos máquinas tienen en promedio la misma cantidad de llenado.
-0.019 y 0.019
Regla de decisión:
Si –0-019 0.019 No se rechaza Ho
Si < -0.019 ó > 0.019 Se rechaza Ho
Como = 16.015 – 16.005 = 0.01, entonces cae en la región de aceptación y no se rechaza Ho.
8. Existen dos tipos de plástico apropiados para su uso por un fabricante de componentes electrónicos. La
tensión de ruptura de ese plástico es un parámetro importante. Se sabe que 1= 2= 1.0 psi. De una
muestra aleatoria de tamaño 10 y 12 para cada plástico respectivamente, se tiene una media de 162.5
para el plástico 1 y de 155 para el plástico 2. La compañía no adoptará el plástico 1 a menos que la
tensión de ruptura de éste exceda a la del plástico 2 al menos por 10 psi. Con base a la información
contenida en la muestra, ¿la compañía deberá utilizar el plástico 1? Utilice = 0.05 para llegar a una
decisión.
Solución:
2. Datos:
1= 2= 1.0 psi
n1= 10
n2= 12
= 0.05
Ho; 1- 2 = 10
H1; 1- 2 > 10 Se desea rechazar Ho si la media del plástico 1 supera a la media del plástico 2
en por lo menos 10 psi.
5. Cálculos:
No existe evidencia suficiente para apoyar el uso del plástico 1 ya que

–5.83 1.645, por lo tanto no se rechaza Ho.

Regla de decisión:
Puesto que = 162.5-155 = 7.5 y este número es no es mayor a 10.7 por lo tanto no se
rechaza Ho.
8. Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso en una operación de
pulido en la fabricación de lentes intraoculares utilizados en el ojo humano después de una cirugía
de cataratas. Se pulen 300 lentes con la primera solución y, de éstos, 253 no presentaron defectos
inducidos por el pulido. Después se pulen otros 300 lentes con la segunda solución, de los cuales 196
resultan satisfactorios. ¿Existe alguna razón para creer que las dos soluciones para pulir son
diferentes? Utilice = 0.01
Solución:
1. Se trata de una distribución muestral de diferencia de proporciones.

2. Datos:
p1= 253/300= 0.8433
p2 = 196/300= 0.6533
n1=n2 = 300
3. Ensayo de hipótesis:
Ho; P1-P2 = 0
H1; P1-P2 0
5. Cálculos:
En esta fórmula se puede observar que en el denominador se tienen a las proporciones poblacionales o
sea los parámetros, los cuales no se conocen, por lo que en el ensayo de hipótesis la fórmula para poder
calcular la ZR cambia, estimando el parámetro común P de la siguiente forma:
Ó bien
Entonces la fórmula de ZR quedaría de la siguiente manera:
Se calculará el valor de P:
Puesto que 5.36>2.575, se rechaza la hipótesis nula y se concluye con un nivel de significancia de 0.01
que los dos fluidos para pulir son diferentes.
10. Se tomará el voto entre los residentes de una ciudad y el condado circundante para determinar si se
debe construir una planta química propuesta. El lugar de construcción está dentro de los límites de la
ciudad y por esta razón muchos votantes del condado consideran que la propuesta pasará debido a la
gran proporción de votantes que favorecen la construcción. Para determinar si hay una diferencia
significativa en la proporción de votantes de la ciudad y votantes del condado que favorecen la
propuesta, se realiza una encuesta. Si 120 de 200 votantes de la ciudad favorecen la propuesta y 240 de
500 residentes del condado también lo hacen, ¿estaría de acuerdo en que la proporción de votantes de
la ciudad que favorecen la propuesta es más alto que la proporción de votantes del condado? Utilice un
nivel de significancia de 0.025.
Solución:
1. Se trata de una distribución muestral de diferencia de proporciones.

2. Datos:
p1= 120/200= 0.60
p2 = 240/500= 0.48
n1 = 200
n2 = 500
3. Ensayo de hipótesis:
Ho; P1-P2 = 0
H1; P1-P2 > 0

5. Cálculos:
Se calculará el valor de P:
Puesto que 2.9>1.96, se rechaza la hipótesis nula y se concluye con un nivel de significancia de 0.025
que la proporción de votantes de la ciudad a favor de la propuesta es más alta que la proporción de
votantes del condado.
UNIDAD V:
PRUEBA DE HIPOTESIS CON DOS MUESTRASY VARIAS MUESTRAS CON DATOS

CATEGORICOS:
PRUEBAS CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA
Como ya se ha visto varias veces, los resultados obtenidos de muestras no siempre concuerdan
exactamente con los resultados teóricos esperados, según las reglas de probabilidad. Por ejemplo,
aunque consideraciones teóricas conduzcan a esperar 50 caras y 50 cruces cuando se lanza 100 veces
una moneda bien hecha, es raro que se obtengan exactamente estos resultados.
Supóngase que en una determinada muestra se observan una serie de posibles sucesos E1, E2, E3,. . ., EK,
que ocurren con frecuencias o1, o2, o3,. . ., oK, llamadas frecuencias observadas y que, según las reglas
de probabilidad, se espera que ocurran con frecuencias e1, e2, e3,. . . ,eK llamadas frecuencias teóricas o
esperadas.
A menudo se desea saber si las frecuencias observadas difieren significativamente de las frecuencias
esperadas. Para el caso en que solamente son posibles dos sucesos E1 y E2 como, por ejemplo, caras o
cruces, defectuoso, etc., el problema queda resuelto satisfactoriamente con los métodos de las unidades
anteriores. En esta unidad se considera el problema general.
Definición de X2
Una medida de la discrepancia existente entre las frecuencias observadas y esperadas es suministrada
por el estadístico X2, dado por:
donde si el total de frecuencias es N,
Si X2 = 0, las frecuencias observadas y esperadas concuerdan exactamente, mientras que si X2>0, no

coinciden exactamente. A valores mayores de X2, mayores son las discrepancias entre las frecuencias
observadas y esperadas.
Si las frecuencias esperadas son al menos iguales a 5, la aproximación mejora para valores superiores.
El número de grados de libertad está dado por:

=k–1–m
En donde:
K = número de clasificaciones en el problema.
m = número de parámetros estimados a partir de los datos muestrales para obtener los valores
esperados.
Ensayo de Hipótesis
En la práctica, las frecuencias esperadas se calculan de acuerdo con la hipótesis Ho. Si bajo esta hipótesis
el valor calculado de X2 dado es mayor que algún valor crítico, se deduce que las frecuencias observadas
difieren significativamente de las esperadas y se rechaza Ho al nivel de significación correspondiente. En
caso contrario, no se rechazará. Este procedimiento se llama ensayo o prueba de chi-cuadrado de la
hipótesis.
Debe advertirse que en aquellas circunstancias en que X2 esté muy próxima a cero debe mirarse con
cierto recelo, puesto que es raro que las frecuencias observadas concuerden demasiado bien con las
esperadas. Para examinar tales situaciones, se puede determinar si el valor calculado de X2 es menor
que las X2 críticas o de tabla (ensayo unilateral izquierdo), en cuyos casos se decide que la concordancia
es bastante buena.
Ejemplos:
1. La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120 veces. Ensayar la hipótesis de
que el dado está bien hecho al nivel de significación del 0.05.
Cara 1 2 3 4 5 6
Frecuencia Observada 25 17 15 23 24 16
Solución:
Ensayo de Hipótesis:
Ho; Las frecuencias observadas y esperadas son significativamente iguales (dado bien hecho)
H1; Las frecuencias observadas y esperadas son diferentes (dado cargado).
Primero se procede a calcular los valores esperados. Como es bien sabido por todos la probabilidad de
que caiga cualquier número en un dado no cargado es de 1/6. Como la suma de los valores observados
es de 120, se multiplica este valor por 1/6 dando un resultado de 20 para cada clasificación.
Cara 1 2 3 4 5 6 Total
Frecuencia Observada 25 17 15 23 24 16 120
Frecuencia esperada 20 20 20 20 20 20
Grados de libertad = k-1-m = 6-1-0 = 5
No se tuvo que calcular ningún parámetro para obtener las frecuencias esperadas.
Regla de decisión:
Si X2R 11.1 no se rechaza Ho.
Si X2R >11.1 se rechaza Ho.
Cálculos:
Justificación y decisión:
Como 5 es menor a 11.1 no se rechaza Ho y se concluye con una significación de 0.05 que el dado está
bien hecho.
2. En los experimentos de Mendel con guisantes, observó 315 lisos y amarillos, 108 lisos y verdes, 101
rugosos y amarillos y 32 rugosos y verdes. De acuerdo con su teoría, estos números deberían presentarse
en la proporción 9:3:3:1. ¿Hay alguna evidencia que permita dudar de su teoría al nivel de significación
del 0.01?
Solución:
Ho; La teoría de Mendel es acertada.

H1; La teoría de Mendel no es correcta.
El número total de guisantes es 315+108+101+32=556. Puesto que los números esperados están en la
proporción 9:3:3:1 (9+3+3+1=16), se esperaría:
Lisos y amarillos
Lisos y verdes
Rugosos y amarillos
Rugosos y verdes
Grados de libertad = k-1-m = 4-1-0 = 3
No se tuvo que calcular ningún parámetro para obtener las frecuencias esperadas.
Regla de decisión:
Cálculos:
Como 0.470 es menor que 11.3 no se rechaza Ho y se concluye con un nivel de significación de 0.01 que
la teoría de Mendel es correcta.
Como el valor de 0.470 está cercano a cero, se procede a hacer un ensayo unilateral izquierdo:
Ho; La teoría de Mendel es acertada.
H1; La teoría de Mendel es muy acertada.
Regla de decisión:
Si X2R < 0.115 se rechaza Ho.
Como el valor de 0.470 no es menor a 0.115 se concluye que el experimento o la teoría de Mendel solo
es buena.
3. Una encuesta sobre 320 familias con 5 niños dio la distribución que aparece en la siguiente tabla. ¿Es el
resultado consistente con la hipótesis de que el nacimiento de varón y hembra son igualmente posibles?
Use = 0.05.
Número de niños 5 4 3 2 1 0
Número de niñas 0 1 2 3 4 5
Número de familias 18 56 110 88 40 8
Solución:
H0; El nacimiento de niños y niñas es igualmente probable.

H1; El nacimiento de niños y niñas no es igualmente probable.
Este experimento tiene un comportamiento binomial, puesto que se tienen dos posibles resultados y la
probabilidad de éxito se mantiene constante en todo el experimento.
Se le llamará éxito al nacimiento de un varón o niño. Por lo que la variable aleatoria "x" tomará valores
desde 0 hasta 5.
Como se quiere ver si es igualmente probable el nacimiento de niños y niñas, la probabilidad de éxito
será de 0.5.
Utilizando la fórmula de la distribución binomial se calcularán las probabilidades, que multiplicadas por
el número total de familias nos darán los valores esperados en cada clasificación.
Recordando la fórmula de la distribución binomial:
En donde n = 5 y "x" es el número de niños.
Probabilidad de 5 niños y 0 niñas =
Probabilidad de 4 niños y 1 niña =
Probabilidad de 1 niño y 4 niñas =
Si cada una de estas probabilidades se multiplican por 320 se obtienen los valores esperados:
Número de niños 5 4 3 2 1 0
Total
Número de niñas 0 1 2 3 4 5
Número de familias 18 56 110 88 40 8 320
Frecuencias esperadas 10 50 100 100 50 10
Grados de libertad: k-1-m = 6-1-0 = 5
Regla de decisión:
Cálculos:
Como el 12 es mayor a 11.1, se rechaza H0 y se concluye con un = 0.05 que el nacimiento de

hombres y mujeres no es igualmente probable.
4. Una urna contiene 6 bolas rojas y 3 blancas. Se extraen al azar dos bolas de la urna, se anota su color y
se vuelven a la urna. Este proceso se repite un total de 120 veces y los resultados obtenidos se muestran
en la siguiente tabla. Determinar al nivel de significación del 0.05 si los resultados obtenidos son
consistentes con los esperados.
0 1 2
Bolas blancas 2 1 0
Número de extracciones 6 53 61
Solución:
Este experimento tiene las características de una distribución hipergeométrica, por lo cual se calcularán
los valores esperados con el razonamiento de esta distribución.
Se llamara "x" a la variable aleatoria de interés que en este caso serán las bolas rojas. Por lo tanto "x"
puede tomar valores desde 0 hasta 2.
La fórmula de la distribución hipergeométrica es:
Se tiene:
Probabilidad de extraer 0 rojas y 2 blancas:
Probabilidad de extraer 1 roja y 1 blanca:
Probabilidad de extraer 2 rojas y 0 blancas:
Con las probabilidades anteriores se obtendrán los valores esperados multiplicando por 120.
0 1 2
Bolas blancas 2 1 0
Número de extracciones 6 53 61
Frecuencias esperadas 10 60 50
Regla de decisión:
Cálculos:
Como el 4.83 no es mayor a 5.991, no se rechaza H0 y se concluye con un

= 0.05 que los resultados son los mismos que los esperados.
PRUEBA CHI-CUADRADA PARA LA BONDAD DEL AJUSTE
A lo largo de este curso nos ocupamos de la prueba de hipótesis estadísticas acerca de parámetros de
una población como , y P. Ahora se considera una prueba para determinar si una población tiene
una distribución teórica específica. La prueba se basa en qué tan buen ajuste se tiene entre la frecuencia
de ocurrencia de las observaciones en una muestra observada y las frecuencias esperadas que se
obtienen a partir de la distribución hipotética.
La fórmula que se utilizará para calcular el valor de chi-cuadrada es igual a la de la sección anterior, con
el mismo concepto de grados de libertad.
Ejemplo:
1. Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se observó el número de caras de
cada serie. El número de series en los que se presentaron 0, 1, 1, 3, 4 y 5 caras se muestra en la siguiente
tabla.
Número de series
Número de
caras
(frecuencia observada)
0 38
1 144
2 342
3 287
4 164
5 25
Total 1000
Ajustar una distribución binomial a los datos con un = 0.05.
Solución:
H0; Los datos se ajustan a una distribución binomial.
H1; Los datos no se ajustan a una distribución binomial.
Para obtener los valores esperados se tiene que utilizar la formula de la distribución
binomial: , donde n en este ejercicio vale 5, p y q son las probabilidades respectivas de

cara y sello en un solo lanzamiento de la moneda. Para calcular el valor de p, se sabe que =np en una
distribución binomial, por lo que = 5p.
Para la distribución de frecuencias observada, la media del número de caras es:
Por lo tanto . Así pues, la distribución binomial ajustada viene dada por p(x) =
.
Al seguir esta fórmula se calcula la probabilidad de obtener caras, según el valor de la variable aleatoria.
La probabilidad multiplicada por 1000 nos dará el valor esperado. Se resumen los resultados en la tabla
siguiente:
Número de caras Frecuencia Frecuencia

P(x caras)
(x) esperada observada
0 0.0332 33.2 38
1 0.1619 161.9 144
2 0.3162 316.2 342
3 0.3087 308.7 287
4 0.1507 150.7 164
5 0.0294 29.4 25
Para los grados de libertad el valor de m será uno, ya que se tuvo que estimar la media de la población
para poder obtener el valor de p y así poder calcular los valores esperados. Grados de libertad: k-1-m =
6-1-1 = 4
Regla de decisión:
Cálculos:

= 0.05 que el ajuste de los datos a una distribución binomial es bueno.
2. Se propone que el número de defectos en las tarjetas de circuito impreso sigue una distribución Poisson.
Se reúne una muestra aleatoria de 60 tarjetas de circuito impreso y se observa el número de defectos.
Los resultados obtenidos son los siguientes:
Número de Frecuencia
defectos observada
0 32
1 15
2 9
3 ó más 4
¿Muestran estos datos suficiente evidencia para decir que provienen de una distribución Poisson? Haga
la prueba de la bondad del ajuste con un = 0.05.
Solución:
H0; La forma de la distribución de los defectos es Poisson.
H1; La forma de la distribución de los defectos no es Poisson.
La media de la distribución Poisson propuesta en este ejemplo es desconocida y debe estimarse a partir
de los datos contenidos en la muestra.
A partir de la distribución Poisson con parámetro 0.75, pueden calcularse las probabilidades asociadas
con el valor de x. Esto es la fórmula de la Poisson es:
Con esta fórmula se calculan las probabilidades, mismas que se multiplican por 60 para obtener los
valores esperados.
Número de Frecuencia Frecuencia

Probabilidad
defectos esperada observada
0 0.472 28.32 32
1 0.354 21.24 15
2 0.133 7.98 9
3 ó más 0.041 2.46 4
Puesto que la frecuencia esperada en la última celda es menor que 5, se combinan las dos últimas celdas.
Número de Frecuencia Frecuencia

defectos esperada observada
0 28.32 32
1 21.24 15
2 ó más 10.44 13
Los grados de libertad serían 3-1-1=1, debido a que la media de la distribución Poisson fue estimada a
partir de los datos.
Regla de decisión:
Cálculos:

= 0.05 que la distribución de defectos en las tarjetas de circuito impreso es Poisson.
3. Pruebe la hipótesis de que la distribución de frecuencia de las duraciones de baterías dadas en la

siguiente tabla, se puede aproximar mediante una distribución normal con media = 3.5 y desviación
estándar =0.7. Utilice un = 0.05.
Límites de Frecuencias
clase observadas
1.45 – 1.95 2
1.95 – 2.45 1
2.45 – 2.95 4
2.95 – 3.45 15
3.45 – 3.95 10
3.95 – 4.45 5
4.45 – 4.95 3
Solución:
Se procede a elaborar el histograma, para visualizar los datos:

Como se puede observar el histograma tiene una forma que aparenta ser normal, se probará
esta hipótesis.
H0; Los datos provienen de una distribución normal.
H1; Los datos no provienen de una distribución normal.
En este ejercicio en particular se cuenta con la media y desviación estándar de la población, por lo que
no se tiene que estimar. En caso de que no se tuviera, se estimarían a partir de los datos agrupados con
las fórmulas que se vieron en la Unidad III del curso de probabilidad y estadística, tomando en cuenta
que para los grados de libertad el valor de m sería 2, ya que se estimaría la media y la desviación
estándar.
Se procederá a calcular los valores de z para encontrar las probabilidades en la tabla. Recordando que
, se sustituye el valor de x por los límites de clase comenzando con el límite de 1.95
Límite real P(x)
1.95 -2.21 P(x 1.95) = 0.01355
2.45 -1.50 P(x 2.45) = 0.06680
2.95 -0.79 P(x 2.95) = 0.21476
3.45 -0.07 P(x 3.45) = 0.47210
3.95 0.64 P(x 3.95) = 0.26109

4.45 1.36 P(x 4.45) = 0.08691
La razón por la cual se comienza con el límite de 1.95 y se termina con el límite de 4.45, es porque la
suma de todas las probabilidades debe ser 1, bajo la curva normal.
A continuación se muestra la curva normal con sus respectivas probabilidades, según los limites reales.
Las probabilidades que no se muestran en la tabla anterior y están en la curva se calcularon por
diferencias.
P (1.95 x 2.45) = 0.0668-0.013553 = 0.053254
P (2.45 x 2.95) = 0.21476-0.0668 = 0.147953
P (2.95 x 3.45) = 0.4721-0.21476 = 0.25734
P (3.45 x 3.50) = 0.50-0.4721 = 0.0279
P (3.50 x 3.95) = 0.50-0.26109= 0.23891
P (3.95 x 4.45) = 0.26109-0.086915 = 0.17417
Con estas probabilidades se calcularán los valores esperados, multiplicando cada probabilidad por 40.
Límites de Frecuencias Frecuencia

Probabilidad
clase observadas esperada
1.45 – 1.95 2 0.01355 0.54212
1.95 – 2.45 71 0.05325 2.13016
2.45 – 2.95 4 0.14795 5.91812
2.95 – 3.45 15 0.25734 10.29360
3.45 – 3.95 10 0.26681 10.67240
3.95 – 4.45 85 0.17417 6.96680
4.45 – 4.95 3 0.08691 3.47660
Regla de decisión:
Cálculos:
Como el 3.06 no es mayor de 7.815, no se rechaza H0 y se concluye con un

= 0.05 que el ajuste de los datos a una distribución normal es bueno.

Apuntes de Estadistica Inf

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Apuntes de Estadistica Inf

Cargado por

Copyright:

Formatos disponibles

UNIDADA 1:

INTRODUCCION A LA ESTADISTICA INFERENCIAL

1.1 BREVE HISTORIA DE LA ESTADISTICA:

Modalidades de los caracteres: Consideremos un carácter cualquiera, como por ejemplo el

El muestreo estratificado requiere de separar a la población según grupos que no se traslapen

1.3 ESTADISTICA DESCRIPTIVA

1.4 ESTADISTICA INFERENCIAL

1.5 BREBE INTRODUCCION A LA INFERENCIA ESTADISTICA

1.6 TEORIA DE DECISIÓN EN ESTADISTICA:

1.7 COMPONENTES DE UNA INVESTIGACION ESTADISTICAS:

La inferencia estadística se orienta a sacar conclusiones acerca del parámetro o

1.8 RECOLECCION DE DATOS:

1.9 ESTADISTICA PARAMETRIA (POBLACION Y MUESTRA ALEATORIA)

1. La interpretación propia en el Análisis Estadístico, que corresponde a la que hemos presentado

Muestra. Es cualquier subconjunto de la población, escogido al seguir ciertos criterios de selección. La

INFERENCIA ESTADISTICA ESTIMACION

si es la varianza de la distribución de resistencia a la ruptura, el valor de la varianza muestral s 2 se

podría utilizar para inferir algo acerca de .

Cuando se analizan conceptos generales y métodos de inferencia es conveniente tener un símbolo

El símbolo (theta sombrero) suele utilizarse para representar el estimador de y la estimación

poblacional . Un estimador natural es la varianza muestral:

Propiedades de un Buen Estimador

Insesgado.- Se dice que un estimador puntual es un estimador insesgado de si , para todo

En otras palabras, la eficiencia se refiere al tamaño de error estándar de la estadística. Si comparamos

Coherencia.- Una estadística es un estimador coherente de un parámetro de población, si al aumentar

Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la información contenida de la muestra

Estimación por Intervalos

Una interpretación correcta de la "confianza de 95%" radica en la interpretación frecuente de

Encontrar z a partir de un nivel de confianza

Encuentre el valor de z para un nivel de confianza del 95%.

Por lo que el valor de z es de 1.96.

Si se utiliza una tabla en donde el área bajo la curva es de 0 a z:

Para la tabla en donde el área bajo la curva va desde z hasta :

Estimación para la Media

El intervalo de confianza proporciona una estimación de la precisión de nuestra estimación puntual.

de que esta diferencia no excederá .

El primer caso ya se había comentado y se solucionará utilizando la desviación estándar de la muestra

Distribución Muestral de Diferencia de Medias

La distribución es aproximadamente normal para n1 30 y n2 30. Si las poblaciones son normales,

Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación estándar de

a. ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de

Distribución Muestral de Diferencia de Proporciones

que , por lo que no es difícil deducir que y

En la fórmula de la distribución muestral de proporciones para el cálculo de probabilidad se necesita

Otra manera de hacer este ejercicio es poner P1-P2:

DISTRIBUCION JI-CUADRADA (X2)

Donde n es el tamaño de la muestra, s2 la varianza muestral y la varianza de la población de donde

Propiedades de las distribuciones ji-cuadrada

1. Los valores de X2 son mayores o iguales que 0.

La función de densidad de la distribución X2 está dada por:

en la tabla se localiza 6 gl en el lado izquierdo y a lo largo del lado superior de la misma

Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como sigue:

El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad y se encuentra que a

a. Mayor que 9.1

a. Primero se procederá a calcular el valor de la ji-cuadrada:

1. Se calcularán dos valores de ji-cuadrada:

Por lo tanto la P(3.462 s2 10.745) = 0.94

Al despejar esta fórmula la varianza poblacional nos queda:

Primero se calcula la desviación estándar de la muestra:

al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2= 0.286.

Por lo tanto, el intervalo de confianza de 95% para la varianza es:

2. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de los

Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.