Está en la página 1de 20

Universidad de Guadalajara

Centro Universitario de Ciencias


Exactas e Ingenierías

Estimaciones con Z-test y T-test

Ingeniería Industrial

30 Octubre 2015
Guadalajara, Jalisco.
Marco Teórico

Estimaciones

Estimar qué va a ocurrir respecto a algo, a pesar de ser un elemento claramente


estadístico, está muy relacionado a la vida cotidiana, ya que todo el tiempo estamos
suponiendo o sugiriendo lo que va a suceder, dando también periodos de tiempo, como
consecuencia de esto hacemos estimaciones dentro de un intervalo de posibilidades. Es
decir tomamos valores que pueden ser muy cercanos a lo que va a ocurrir.
La estimación tiene el objetivo de obtener estadísticos, es decir, fórmulas
matemáticas que permitan conocer, a partir de ellos y de manera resumida, las
características más relevantes de una población, utilizando la información contenida en
una muestra. Al estadístico también se le conoce con el nombre de estimador. Recuerda
que la inferencia estadística es el proceso mediante el cual una muestra es analizada y,
con base en su información, se infiere, se deduce o se concluye sobre lo que está
sucediendo en una población. El propósito de la estimación es proveer los estimadores o
expresiones matemáticas que proporcionen un valor o un conjunto de valores que reflejen
el valor del parámetro poblacional. Una buena estimación proporcionara técnicas
correctas para encontrar los verdaderos parámetros poblacionales.
Cuando se hace una estimación se debe tomar en cuenta que se pueden hacer dos tipos:
a) Estimación puntual: una estimación puntual consiste en establecer un valor
concreto (es decir, un punto) para el parámetro. El valor que escogemos para decir
“el parámetro que nos preocupa vale X” es el que suministra un estadístico
concreto. Como ese estadístico sirve para hacer esa estimación, en lugar de
estadístico suele llamársele estimador. Utilizamos el estadístico “media aritmética
de la muestra” como estimador del parámetro “media aritmética de la población”.
Esto significa que si quieres conocer cuál es el valor de la media en la población,
estimaremos que es exactamente el mismo que en la muestra que hemos
manejado.
b) Estimación por intervalo: es la estimación de un parámetro de la población dado
por dos números entre los cuales se puede considerar que se encuentra el
parámetro. Las estimaciones de intervalo indican la precisión de una estimación y
son, por lo tanto, preferibles a las estimaciones puntuales.

Una vez que conocemos los dos tipos de estimaciones, sabemos que la puntual es
solo un valor dado, pero la estimación por intervalos es un proceso un poco más
complejo, que requiere hacer algunos métodos como son la Z-test y T-test o T de student,
entonces llegamos a la suposición de que un buen estimador debe contener los siguientes
puntos:
a) Debe ser insesgado: un estimador es insesgado, si en promedio, tiende a tomar
valores que están por encima del parámetro de la población con la misma
frecuencia y la misma extensión, con la que tiende a asumir valores por debajo del
parámetro de población que se está estimando.
b) Debe ser eficiente: de varios estimadores insesgados, el más eficiente es el que
tiene el error estándar más pequeño.
c) Debe ser consistente: significa que a medida que aumenta el tamaño de la
muestra, la estimación se aproxima al valor del parámetro.
d) Debe ser suficiente: significa que ningún otro estimador puede suministrar más
información sobre el parámetro.

Hacer un intervalo requiere de un nivel de confianza, esto es definir qué tan seguro se
está, de que el intervalo incluirá el parámetro de la población. Siempre que buscamos
este tipo de nivel de confianza, es necesario saber que todo está dispuesto a cambios,
cambios que así como podemos controlar, puede que no podamos, entonces es
necesario tener cuidado en el nivel de confianza que utilicemos, por lo que es de suma
importancia mencionar lo que nos heredó Ronald Fisher: el nivel de seguridad del 95%.
Sir Ronald Fisher astrónomo inglés que ideó recursos en estadística, genética,
matemáticas y física durante el primer tercio del siglo pasado. Sir Ronald Fisher estuvo
pensando en cuestiones de intervalos de confianza sin definirlo de esta manera, por lo
que se le ocurrió definir una situación concreta: imaginó a una viejecita que decía ser
capaz de distinguir si en una taza de té con leche se había volcado antes el té o la leche.
Y decía que era capaz de ello con solo probar un poco del líquido, el inglés siguió
pensando, llego a la conclusión que había que acotar cuántos aciertos serían suficientes
como para creer en la mujer. Si esta mujer fuera capaz de lo que decía, estaba claro que
teníamos que aceptar algún error por su parte, supuso que le damos 10 tazas, que las
acierte todas es algo que puede ocurrir en una ocasión de cada mil veces que sometemos
a una persona a esa prueba y resulta que no tiene ni idea, acertando por casualidad, que
acierte casi todas, errando solo en una ocasión es algo que puede pasar en una de cada
cien pruebas. Que falle en dos, ocurre en una de cada 25 ocasiones (un 4%).
Fisher pensó en 8 tazas donde la mitad se han servido con un orden y la otra
mitad con otro y pidió imaginariamente a la mujer que las distinguiera formando dos
grupos. Y concluyó que un buen nivel de seguridad era el 95%, es decir, una probabilidad
no superior al 5% de que la mujer acertara por casualidad, fue así como surgió el nivel de
seguridad del 95%, hoy en día aun después de su muerte no existe quien le discuta este
nivel de seguridad, ya que es utilizado en la mayoría de investigaciones en las que se
realizan intervalos de confianza, si los investigadores utilizan este porcentaje nadie lo
discutirá, pero en cambio si alguien decide utilizar un porcentaje por ejemplo de 91%
deberá contestar la pregunta ¿Por qué?, esto es que le está haciendo al 4% restante o
porque lo está afectando, cuales son las causas por las que disminuye el intervalo de
confianza y para que sea aceptado deberá tener muy buenos argumentos, o alguna razón
especifica que pruebe que utilizar un intervalo con el 91% es mejor que el 95%, y porque
se obtendrían mejores resultados.
La seguridad absoluta o del 100% no existe, sabemos que cuanta más seguridad
queramos tener, se tendrá que pagar un precio, este precio puede ser una baja precisión
en las estimaciones, o puede ser un tamaño de muestra tan grande que no tengamos
tiempo, medios humanos ni dinero suficiente como para abordar todas las unidades de
esa muestra.
A continuación se presentan unas graficas de 160 muestras con dos tipos de nivel
de seguridad para demostrar la importancia de usar un nivel del 95%

Ilustración 1. Nivel de Seguridad del 70%

En la ilustración uno se tiene una distribución aproximadamente normal acotada


con un nivel de seguridad del 70%, por lo que en la práctica se saldrían muchísimos
valores de nuestro intervalo, lo cual no es para nada útil, y sería un intervalo con muchos
errores, aplicados a ámbitos como la industria, representaría perdidas grandes de dinero.
Ilustración 2. Nivel de Seguridad del 95%

En comparación con la gráfica anterior, podemos observar como al utilizar un intervalo de


confianza con el 95% de seguridad, tendremos un resultado más acertado de lo que
puede ocurrir, además de que evitamos los errores de una mejor forma, retomando el
ejemplo de la industria, este nivel de seguridad representaría perdidas, mucho menores,
perdidas que además no se pueden eliminar, ya que siempre existirán condiciones que
nos den un margen de error, pero entre menos sea este y podamos realizar el ajuste, será
mejor para la empresa.
Ahora que conocemos la utilidad de los intervalos, mencionaremos algunos de los casos
que se pueden presentar, y la forma de calcular los intervalos.
Estimación de la media (Muestras grandes)

Un intervalo de confianza de (1- α) 100% para la media poblacional μ es:

Z = valor crítico de la distribución normal estandarizada. Se llama valor crítico al valor de Z


necesario para construir un intervalo de confianza para la distribución.
= la media muestral
σ = Desviación Poblacional
n = Tamaño de muestra

Tabla 1. Valores Zα/2

Intervalo de Confianza Valor de la tabla

99% 2.575

95% 1,96

90% 1.645

El error máximo de estimación es:

 Si el tamaño de la muestra (n) se aumenta; el error será menor.


 Si el nivel de confianza (1- α) se aumenta; el error será mayor.

Tamaño de la muestra

 Si aumentamos el nivel de confianza (1- α), como consecuencia aumenta el


tamaño de la muestra
 Si disminuimos el error (E), debemos aumentar el tamaño de la muestra.
Estimación de la media (Muestras pequeñas)

Un intervalo de confianza de (1- α) 100% para la media poblacional μ es:

Si se compara con la fórmula para muestras grandes, se observa que el estadístico Z / 2


de la distribución normal fue reemplazado por el estadístico t / 2 de la distribución t
student y, puesto que se desconoce la desviación estándar poblacional “σ”, se le sustituye
por el estimador de la desviación estándar de la muestra “S”.
T = se obtiene el valor de la tabla de probabilidades.
= Media muestral.
S = Desviación estándar de la muestra como una aproximación a la desviación estándar.
n = Número de observaciones.
Los grados de libertad representan el tamaño de la muestra menos uno (n – 1), a mayor
tamaño de la muestra, los grados de libertad serán mayores.
Una diferencia de la distribución t con respecto de la distribución normal
estandarizada (Z) es que la primera tiene mayores variaciones que la segunda. La mayor
variabilidad de la distribución t se debe a que depende tanto de la media muestral como
de la aproximación a la desviación estándar “S”.
Estimación entre la diferencia de dos medias (Muestras grandes)

Existen casos en los que es necesario estimar la diferencia entre dos medias, con la
finalidad de comparar dos poblaciones. Si 1 y 2 son medias de muestras aleatorias
independientes de tamaño n1 y n2 con varianzas σ12 y σ22 conocidas, entonces un
intervalo de confianza de (1- α) 100% para la diferencia de medias μ1 – μ2 se expresa
como sigue

En el caso de muestras grandes en las que no se conozca la desviación estándar


poblacional se puede utilizar la desviación estándar muestral, por lo que la fórmula del
intervalo de confianza quedaría de la siguiente manera:

Estimación entre la diferencia de dos medias (Muestras pequeñas)

El intervalo de confianza para la diferencia de medias de una población es dada por:

Como se desconoce la desviación estándar poblacional, se tiene que calcular la varianza


muestral de ambas poblaciones S2 mediante la siguiente fórmula:

Para obtener la desviación estándar muestral de ambas poblaciones se le saca la raíz


cuadrada a la varianza y su resultado S se sustituye en la fórmula del intervalo de
confianza

Estimación de la media (Varianza desconocida)

Así como la media poblacional μ suele ser desconocida, rara vez se conoce la desviación
estándar real de la población σ, por lo tanto se requiere desarrollar un intervalo de
confianza de μ usando y S.
Un intervalo de confianza de (1- α) 100% para la media μ con varianza desconocida es:
Con v = n -1 grados de libertad
Estimación por intervalo de confianza de una proporción

El concepto de la proporción poblacional está íntimamente ligado con la distribución


binomial, pues en un experimento binomial el estimador puntual de la proporción
poblacional es:

Si se utiliza el muestreo aleatorio, entonces la variable X, que representa el número de


éxitos que se pueden obtener en una muestra, es una variable binomial, pues permite
definir la probabilidad de obtener cierto número de éxitos al estudiar una muestra en
experimentos independientes. Lo anterior resulta de gran trascendencia ya que, cuando
se busca estimar una proporción poblacional a partir de una muestra, en la que se conoce
el número de éxitos y fracasos, se debe hacer uso de variables binomiales; de éstas, al
igual que en apartados anteriores, el teorema del límite central permite hacer inferencias
de las proporciones poblacionales mediante intervalos de confianza.
Para el intervalo se utiliza entonces la siguiente forma:

Donde:
Es la desviación estándar del estadístico p, también conocido como error estándar
de la proporción.

Es el error máximo de la estimación de una proporción.

Estimación de la diferencia de dos proporciones poblacionales

Frecuentemente se presentan casos donde es necesario tomar decisiones a partir de la


estimación de dos proporciones. En este caso, la finalidad de la estimación consiste en
calcular las diferencias o similitudes que existen entre dos proporciones de poblaciones
diferentes.
En este tipo de casos es importante contar con un medio que permita estimar la diferencia
que existe entre las proporciones de dos poblaciones y decidir de qué manera hemos de
llevar a cabo el análisis e interpretación de sus resultados. Un procedimiento que facilita
esta labor es la estimación de la diferencia entre proporciones a través de intervalos de
confianza.
Este procedimiento se puede aplicar a partir de elegir dos muestras independientes n1 y
n2 de dos poblaciones binomiales, si X1 y X2 son los números de aciertos o éxitos que se
obtienen al muestrear n1 y n2, entonces se pueden formar las proporciones.
Las proporciones son:

La desviación estándar esta dada por:

El intervalo queda definido como:

Estimación de la varianza de una población

En las secciones anteriores se han venido desarrollando diversas técnicas de estimación


mediante intervalos de confianza para la media de una población, para la diferencia entre
las medias de dos poblaciones, la proporción de una población y la diferencia de
proporciones de dos poblaciones. Sin embargo, en muchas ocasiones necesitamos
estimar medidas de dispersión como es la varianza.
Método de estimación para la varianza de una población σ2 a través de intervalos
de confianza, a menudo se presentan casos donde se desconoce esta medida de
dispersión, por lo que se tiene que buscar un método que permita hacer inferencias sobre
σ2. El hecho de que se desconozca el valor de σ2 crea problemas en el momento de
querer tomar decisiones a partir de la inferencia de una muestra, esto se debe a que se
desconoce la variación que existe entre los distintos elementos que componen la muestra.
El estimador puntual de la varianza poblacional se calcula con:
Nuevamente, una forma de facilitar la estimación de la varianza de una población es a
través de la construcción de intervalos de confianza, la estimación del intervalo de σ2 se
puede realizar haciendo uso del estadístico conocido como ji cuadrada con n – 1 grados
de libertad.
Este estadístico se puede presentar como:

El intervalo queda definido como:


Objetivo

El objetivo de este proyecto es poner en práctica y reafirma los métodos de Z-test y T-test
vistos en clases así como ver la aplicación y relación que tienen dichos métodos con la
ingeniería en general o también con la ingeniería industrial en específico ya que esta será
nuestro campo laboral.
Entender la importancia de estos métodos en la obtención de estimaciones que nos
permitan ajustar procesos, mejorar métodos de trabajo, obtener datos de pérdidas en la
producción o los materiales necesarios para la línea de producción de determinados
periodos de tiempo.

Justificación

Las estimaciones son utilizadas como método para calcular distintos tipos de parámetros,
que tienen como función, rechazar o aceptar valores, para ciertos fenómenos analizados,
una vez que se selecciona el método de estimación a utilizar se toman todos los datos
necesarios, y se llega a la conclusión de obtener intervalos en la mayoría de ocasiones,
estos intervalos tienen la función de establecer los límites de ciertos parámetros, los
límites son afectados por el nivel de confianza que se utiliza en cada estimación, por lo
que los intervalos tienen cierta variabilidad, sin embargo se tiene un nivel de confianza
establecido de 95% generalmente.
El uso de estadísticos de prueba como son Z-test y T-test, son algunos de tantos
que se pueden utilizar, para hacer comparaciones o simplemente para establecer
parámetros que tiene como objetivo estandarizar los procesos o inferencias de futuros
fenómenos. Este trabajo tiene contenido en el cual las estimaciones son utilizadas en
procesos relacionados a la ingeniería industrial, la aplicación de estas pueden
proporcionarnos información conveniente para mejorar procesos, desarrollas inferencias o
deducciones, y con esto lograr ajustes necesarios en los procesos y métodos de trabajo.
Hipótesis

Las estimaciones con los estadísticos Z y T-student son las más utilizadas en la obtención
de parámetros, son de gran apoyo para mejorar e implementar modelos nuevos de trabajo
que son implementados por la ingeniería industrial, así como llegar a conclusiones de si
algún proceso está fallando y que tanto está fallando, con la finalidad de darle solución a
las fallas que aparecen comúnmente.

Metodología
Aplicación de los métodos Z y T-student para la resolución de problemas relacionados con
la ingeniería.
Investigación de los tipos de estimaciones existentes para los métodos
mencionados anteriormente.
Desarrollo
Problemas Utilizando Z

1. Un ingeniero industrial que trabaja en una empresa dedicada a la producción de acero


inoxidable quiere obtener un intervalo de confianza del 95% para medir la resistencia a la
corrosividad que tiene el acero inoxidable que producen. La resistencia a la corrosividad
se mide en una escala del 1 al 10, siendo el 10 la mayor resistencia.
Para realizar el estudio, el ingeniero tomo una muestra de 35 láminas de acero inoxidable
obteniendo los siguientes resultados:
9.1, 8.2, 9.4, 9.7, 9.8, 9.85, 9.15, 8.75, 8.35, 9.0, 9.0, 8.9, 8.28, 9.9, 9.95, 9.3, 9.1, 9.35,
9.6, 9.5, 9.5, 9.5, 9.8, 10, 9.85, 9.75, 9.63, 9.58, 9.34, 9.65, 9.62, 9.87, 8.95, 8.78, 8.63.
Además del intervalo de confianza el ingeniero quiere calcular el error estándar y el error
de precisión.
Solución:
Los datos obtenidos fueron los siguientes:
n=35
= 9.3322
z α/2= 1.96
= 0.49
Para obtener el intervalo:
+
- z α/2 9.3322 +- 1.96
√ √

9.3322
+
Intervalo de confianza:
- 0.1623 9.1699< µ < 9.4945 ó 9.1699< 9.3322 < 9.4945

El ingeniero puede asegurar con el 95% de confianza que el valor de la media relativa a la
resistencia a la corrosividad de las láminas de acero inoxidables que fabrican se localiza
en el intervalo de 9.1699 a 9.4945, concluyendo así que las láminas de acero que
producen tienen muy buena resistencia a la corrosión ya que la calificación va del 1 al 10
y el intervalo obtenido no baja de 9.1699 que es cercano a 10 pero aun así se podría
mejorar.
Después de obtener el intervalo de confianza el ingeniero obtuvo el error estándar y de
precisión obteniendo los siguientes datos.

0.0828

Error estándar: = 0.1623


Error de precisión: z α/2 1.96 =



Conclusiones

Sin duda alguna la estadística y sus estimaciones, son de suma importancia para
el desarrollo laboral del ingeniero, y no solo para el ingeniero sino también para
muchas otras profesiones.
El ingeniero al utilizar la estadística puede hacer inferencias con cierto
grado de certeza de cómo se comportará por ejemplo una línea de producción, o
que cantidad de producto está saliendo defectuoso, por mencionar algunos
ejemplos, y así con base a los resultados encontrados buscar una solución o
mejora para que el proceso sea más óptimo, disminuya el desperdicio, salga
menos producto defectuoso, calcular el material que se ocupara, etc.
Pudimos darnos cuenta como desde el siglo pasado Sir Ronald Fisher
buscaba obtener resultados de eventos con cierto grado de confianza,
estableciendo el 95% de confianza.
Anexos
Referencias
Bibliografía

 Arrondo, V. M. (2012). Estimacion estadistica. 1-18.


 Files Wordpress. (s.f.). Recuperado el 23 de Octubre de 2015, de Teoria de la
estimacion estadistica: https://wwwyyy.files.wordpress.com/2013/04/teorc3ada-de-
la-estimacic3b3n-estadc3adstica.pdf

 Lind, D. y. (2005). Estadistica aplicada a los negocios y la economia. Mexico, D.F.:


Mc Graw Hill.

 Webster, A. (2000). Unidad 7. Estimacion de medias, varianzas y proporciones. En


Estadistica aplicada a los negocios. Mexico, D.F.: Mc Graw Hill.

También podría gustarte