Está en la página 1de 25

<< Año del Buen Servicio al Ciudadano >>

Universidad Nacional de Cajamarca

Facultad de Ingeniería

Escuela Académico Profesional de Ingeniería de Minas

ESTIMACIÓN DE
PARAMETROS
<< Informe Monográfico de Estadística, Capitulo IV >>

Curso:
<< Estadística y Probabilidades >>
Docente:
<< Ing. Irvin Cabrera Pinedo >>
Fecha de Presentación:
<< 09 de enero del 2017 >>
Integrantes de Grupo:
Bazán Dávila, Karol Agustina
Carrillo Yamunaque, Antony Walter
Chavez Chugnas, Jesús.
Flores Llanos, Bladimir Jhonatan
Guevara Mariscal, Juan José
Lopez Arevalo, Gilmer
Sanchez Valdivia, Cristian Gustavo
Silva Bobadilla, Gregory
Zelada Arevalo, Nestor
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

1
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

1.- Introducción:

Para hablar de parámetros nos basamos básicamente en el estudio de


poblaciones estadísticas que supone en general el conocimiento de la función
de probabilidad que gobierna el comportamiento aleatorio de la variable de
interés. En muchos casos sabemos o presumimos conocer la familia
distribucional de una población. Sabemos por ejemplo que la población es
aproximadamente normal; pero desconocemos la media y la varianza
poblacionales.

Lógicamente en todas estas situaciones la función de probabilidad de la variable


en estudio se concreta determinando los parámetros poblacionales
correspondientes y para lograrlo se utilizan los denominados métodos de
estimación de parámetros. La estimación de uno o varios parámetros
poblacionales desconocidos es posible construyendo funciones de probabilidad
de variables aleatorias maestrales, los parámetros también son utilizados en
Minería y en varios campos de la ingeniería.

Dichos estimadores garantizaran un cálculo o una aproximación satisfactoria del


parámetro poblacional desconocido siempre que cumplan propiedades de:
insesgamiento o máxima simetría, varianza mínima o máxima concentración de
los datos alrededor del parámetro estimado y máxima probabilidad.

2
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

2.- Objetivos:

2.1.- Objetivo General:

Conocer todo acerca de la Estimación de Parámetros y


saber cómo usarlos en la estadística y en otros campos
como en ingeniería.

2.2.- Objetivos Específicos:

Conocer acerca de estimación por intervalos de Confianza


del promedio poblacional para muestras grandes y
pequeñas.
Realizar ejercicios acerca del tema como un ejemplo para
entender mejor el tema.

3.- Desarrollo del Tema:


En principio, para poder resolver ejercicios acerca de nuestro tema
debemos saber que es y para qué sirve, entonces ¿Qué es la estimación
de parámetros? La estimación de parámetros es un procedimiento que
suele utilizarse para conocer las características de un criterio poblacional
a partir de la recolección y el análisis de una muestra. Para comprender
un poco más acerca de este tema, es necesario comprender los
significados de ciertos vocablos relacionados con el tema. Entre estos:

Intervalo de Confianza. - Se llama así a un intervalo en el que


sabemos que está un parámetro, con un nivel de confianza
específico.

Nivel de Confianza. - Probabilidad de que el parámetro a estimar


se encuentre en el intervalo de confianza.

3
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

Parámetro. - Un parámetro es un número que describe una


opinión que pertenece a la población en estudio. En el desarrollo
práctico, el valor del parámetro es desconocido. en la mayoría de
los casos (población infinita, pruebas destructivas, etc.)
 Estimación Puntual. - Es un valor estadístico único y se usa
normalmente para la estimación de un Parámetro. El valor
estadístico utilizado toma el nombre de estimador.

 Estimación por Intervalos. - Es un rango, generalmente de


ancho finito, que tiene altas probabilidades de contener al
parámetro.

3.1. Estimación por Intervalos de confianza del promedio poblacional


para muestras grandes y pequeñas.

Desde que hemos empezado la materia hemos hablado de inferencia


estadística o inferir que no significa más que generalizar. En el caso de la
estadística es de generalizar las características muéstrales a una
población. Nosotros vamos a generalizar, dos estadígrafos. En relación al
tipo de variables.
En caso de ser un caso de variables cuantitativas, el estadígrafo
(población) que vamos a generalizar es la media aritmética. Que se infiere
a un parámetro (muestra) que llamaremos “Mu”.

𝐶𝑢𝑎𝑛𝑡𝑖𝑡𝑎𝑡𝑖𝑣𝑜: 𝑋̅ → 𝜇

Cuando estemos trabajando con una variable cualitativa, tenemos “P” que
es la probabilidad o proporción muestral y vamos a inferirla a “Pi (𝜋)” que
es la proporción poblacional.

𝐶𝑢𝑎𝑙𝑖𝑡𝑎𝑡𝑖𝑣𝑜: 𝑃̅ → 𝜋

4
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

A la hora de hacer un intervalo de confianza es necesario tener en cuenta


si es que se conocen o no se conocen datos anteriores y de qué tamaño
es la muestra que estamos analizando en nuestro ejercicio. Es por eso
que debemos dividir a las muestras por tamaño y debemos considerar
entonces a una muestra pequeña cuando es menor que treinta (𝑛 < 30),
y se considerara una muestra como grande cuando la muestra es mayor
o igual a treinta datos ( 𝑛 ≥ 30 ).
Para estimar un intervalo de confianza, en otras palabras hallar un “𝜇” o
un “𝜋” existen diferentes fórmulas.

Para estimar “𝝁” que es el más importante por ser el de variables


cualitativas se tienen cuatro formulas:
A. Cuando existe un estudio previo y la muestra es grande:
𝝈
𝝁 = 𝒙̅ ± 𝒛.
√𝒏

B. Cuando no existe un estudio previo y la muestra es grande:


𝒔
𝝁 = 𝒙̅ ± 𝒛.
√𝒏

C. Cuando existe un estudio previo y la muestra es pequeña:


𝝈
𝝁 = 𝒙̅ ± 𝒛.
√𝒏

D. Cuando no existe un estudio previo y la muestra es pequeña:

𝒔
𝝁 = 𝒙̅ ± 𝒕.
√𝒏

Donde:
Z es la distribución normal de probabilidad.
𝜎 2 es la varianza poblacional o variación estándar.
𝑡 es la t de Student

5
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

Recordando:
Desviación estándar:

∑(𝑥𝑖 − 𝑥̅ )2
𝑆 =√
𝑛−1

Media Aritmética:
∑𝑥
𝑥̅ =
𝑛

Para hallar el Z, se debe usar la tabla de la distribución normal de


probabilidades. Teniendo en cuenta el grado de confianza que se debe
tomar por ejemplo con 86.6 % de grado de confianza (0.866) se lo dividirá
entre dos y se correlacionará. Entonces (0.433) el valor más cercano de
la tabla es 0,4332 y se correlaciona con 1.5 y 0.0 entonces el valor de Z
seria (1.5)

6
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

7
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

3.2. PROPORCIÓN POBLACIONAL ( 𝝅)

En poblaciones dicotómicas con una proporción 𝝅 de éxitos el estimador puntual


del parámetro π es la proporción muestral de éxitos 𝝆, que coincide con la media
de la muestra cuando se codifica como 1 la característica que se considera como
éxito y 0 la que se considera no éxito. A partir de un tamaño muestral
moderadamente grande el estadístico 𝝆 tiene una distribución aproximadamente
normal. El intervalo de confianza para la proporción poblacional está centrado en
la proporción muestral; siendo sus límites superior e inferior 𝝆 ±
𝝆(𝟏−𝝆)
𝒛𝜶⁄ √ donde 𝒛𝜶⁄ es el valor crítico correspondiente al grado de
𝟐 𝒏 𝟐
𝝆(𝟏−𝝆)
confianza 1- de la distribución normal tipificada y √ es el error típico de
𝒏
la proporción.

Para obtener el intervalo de confianza y contrastar hipótesis sobre la proporción


una alternativa consiste en tratar a la proporción 𝝅 como la media poblacional
de una variable dicotómica codificada como se ha descrito anteriormente
(éxito=1, no éxito=0) y la secuencia es:

 Para el intervalo de confianza:

Analizar

Estadísticos Descriptivos

Explorar

 Para contrastar la hipótesis nula 𝑯𝟎 : 𝝅 = 𝝅𝟎

Analizar

Comparar medias

Prueba T para una muestra

Utilizando este criterio los resultados numéricos no coinciden exactamente con


los que se obtendrían aplicando la expresión del error típico de la proporción; no
obstante la discrepancia es despreciable si el número de observaciones es
suficientemente grande.

8
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas
Otras alternativas para realizar este contraste son de naturaleza no paramétrica.

PRUEBA BINOMIAL

La prueba binomial prueba binomial analiza variables dicotómicas y compara las


frecuencias observadas en cada categoría con las que cabría esperar según una
distribución binomial de parámetro 𝝅 especificado en la hipótesis nula. El nivel
de significación crítico de esta prueba indica la probabilidad de obtener una
discrepancia igual o superior a la observada a partir de la muestra si la
distribución es la postulada por la hipótesis nula.

El nivel de significación crítico (bilateral) de este contraste debe interpretarse


como:
𝑿𝟎
𝑷(|𝑿 − 𝒏𝝅𝟎 | ≥ − 𝑩(𝒏, 𝝅𝟎 )) el número de éxitos en la muestra.
𝒙

Cuando n es suficientemente grande se calcula esta probabilidad aproximando


la distribución binomial a la normal con corrección de continuidad.

La secuencia para realizar este contraste es:

Analizar

Pruebas no paramétrica

Binomial

9
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas
Se especifica la variable en Contrastar variables. Se indica la proporción
postulada en la hipótesis nula en Contrastar proporción. Si la variable es
dicotómica se mantiene activada la opción Obtener de los datos. Si la variable
no es dicotómica en Punto de corte se indica el valor de corte de forma que los
inferiores o iguales se agrupan en la primera categoría y el resto en la otra.

El botón Opciones permite obtener estadísticos de resumen y modificar el


tratamiento de los valores missing.

PRUEBA CHI-CUADRADO

Otra alternativa de naturaleza no paramétrica se basa en el valor del estadístico


Chi-cuadrado. Esta prueba compara la frecuencia observada para cada
categoría (Oi) con la frecuencia teórica o esperada (Ei) bajo el supuesto de que
la proporción de éxitos es la postulada por la hipótesis nula. Para una muestra
de tamaño n la frecuencia esperada se calcula: 𝑬𝟎 = 𝝅𝟎 𝒏 para los éxitos
y 𝑬𝟏 = (𝟏 − 𝝅𝟎 )𝒏 para los no éxitos. El estadístico de prueba Chi-cuadrado se
(𝑶𝒊 −𝑬𝒊 )𝟐
define 𝑿𝟐 = ∑𝟐𝒊=𝟏 y presenta una distribución Chi-cuadrado con 1
𝑬𝒊
grado de libertad.

La secuencia es:

Analizar

Pruebas no paramétricas

Chi-cuadrado

10
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas
En el cuadro de diálogo se indica, en la casilla Contrastar variables la variable
sobre la que se realiza el contraste; obsérvese que en Rango esperado está
activada la opción Obtener de los datos, que toma tantas categorías como
valores distintos presenta la variable. Si la hipótesis nula es 𝑯𝟎 : 𝝅 = 𝟎, 𝟓 los
valores esperados serán Todas las categorías iguales, en cualquier otro caso se
pueden introducir los valores (frecuencias esperadas absolutas o relativas) con
la opción Valores.

EJEMPLO

Con los datos de la encuesta Enctran.sav estimar la proporción de alumnos que


viven en Barcelona mediante un intervalo de confianza del 90% y contrastar la
hipótesis de que son mayoría.

El primer paso es comprobar si la variable Resid está correctamente codificada,


es decir, presenta valor 1 cuando el alumno es residente en Barcelona y 0 en
otro caso. En la base de datos se ve que la codificación de la variable Resid no
es la adecuada, por lo tanto, en primer lugar habrá que recodificar la variable. La
secuencia es Transformar > Recodificar > En la misma variable. En el cuadro de
diálogo se selecciona la variable Resid y se definen los Valores antiguos y
nuevos asignando al valor antiguo 2 el valor nuevo 0. En el editor de datos se
puede etiquetar el valor 0 como 'no' haciendo doble clic sobre el título de la
variable Resid.

 Una aproximación del intervalo de confianza se obtiene con la


secuencia Analizar > Estadísticos descriptivos > Explorar. En el cuadro de
diálogo se selecciona como variable dependiente la variable Resid y
en Estadísticos se modifica el grado de confianza fijándolo en el 90%. Los
resultados que se obtienen al aceptar son:

11
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

Como se observa la media igual a 0,61 indica que el 61% de los elementos de la
muestra residen en Barcelona. A partir de esta estimación puntual de 𝝅 y de la
estimación de su error típico se obtiene el intervalo de confianza al 90% cuyos
límites inferior y superior son 0,54 y 0,69, respectivamente.

 Para contrastar las hipótesis 𝑯𝟎 : 𝝅 = 𝟎, 𝟓 𝑦 𝑯𝟏 : 𝝅 > 𝟎 considerando la


proporción como media la secuencia es Analizar > Comparar medias >
Prueba T para una muestra. Se selecciona la variable Resid y se indica
como Valor de prueba 0,5, los resultados del contraste se recogen en el
siguiente cuadro:

Como el contraste es a una sola cola el nivel de significación crítico es la mitad


de 0,014, es decir, 0,007. Para niveles de significación superiores a 0,007 se
rechaza la hipótesis nula. Así pues, para los niveles de significación habituales
se acepta que la mayoría de alumnos viven en Barcelona (𝝅 >0,5).

 Utilizando la prueba binomial para contrastar las hipótesis 𝑯𝟎 : 𝝅 =


𝟎, 𝟓 𝑦 𝑯𝟏 : 𝝅 > 𝟎, 𝟓 la secuencia es Analizar > Pruebas no paramétricas >
Binomial.

12
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

Si la hipótesis nula es cierta, el número de residentes observado (70) proviene


de una población binomial de parámetros n=114 y 𝝅 =0,5 y por tanto con valor
esperado 57. En tal caso:

𝑷(|𝑿 − 𝟓𝟕| ≥ 𝟕𝟎) = 𝑷(𝑿 ≤ 𝟏𝟑) + 𝑷(𝑿 ≥ 𝟕𝟎) = 𝟎, 𝟎𝟏𝟗

Por lo tanto, 𝑷(𝑿 ≥ 𝟕𝟎) = 0,0095 que es el nivel de significación crítico del
contraste a cola superior, en consecuencia se rechaza la hipótesis nula.

 Para contrastar las hipótesis 𝑯𝟎 : 𝝅 = 𝟎, 𝟓 𝑦 𝑯𝟏 : 𝝅 > 𝟎, 𝟓 aplicando la


prueba Chi-cuadrado la secuencia es Analizar > Pruebas no paramétricas
> Chi-cuadrado.

Como el nivel de significación asintótico es 0,015 la hipótesis nula no se rechaza


para los niveles de significación inferiores al 1,5 %.

13
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

DIFERENCIA DE PROPORCIONES 𝝅𝟏 − 𝝅𝟐

El estadístico de prueba que permite contrastar 𝑯𝟎 : 𝝅𝟏 = 𝝅𝟐 frente a 𝑯𝟏 : 𝝅𝟏 ≠ 𝝅𝟐 a


𝝆𝟏 −𝝆𝟐
partir de dos muestras aleatorias e independientes es 𝒛 = siendo p la
𝝆(𝟏−𝝆) 𝝆(𝟏−𝝆)
√ 𝒏 + 𝒏
𝟏 𝟐
estimación de 𝝅 obtenida del total de observaciones.

Si se consideran las proporciones como medias y se aplica la prueba t utilizada para


comparar medias poblacionales los resultados no son fiables ya que la estimación del
error típico que realiza el programa no coincide con la del estadístico de prueba. Para
resolver el problema con el programa SPSS se deberá cruzar la variable analizada con
la que define los grupos (obtener la tabla de contingencia) y realizar el contraste de
independencia Chi-cuadrado.

(𝑶𝒊𝒋 −𝑬𝒊𝒋 )𝟐
El estadístico de prueba Chi-cuadrado se define: 𝑿𝟐 = ∑𝟐𝒊=𝟏 y presenta una
𝑬𝒊𝒋
distribución Chi-cuadrado con (I-1)(J-1) grados de libertad. Las Eij se calculan
multiplicando las frecuencias marginales y dividendo el producto por n. Estas Eij son
estimaciones de las frecuencias absolutas que cabría esperar en cada casilla bajo el
supuesto de que la proporción de éxitos es la obtenida a partir del total de
observaciones muestrales sin considerar diferencias entre los dos grupos.

La secuencia es:

Analizar

Estadísticos Descriptivos

Tablas de contingencia

En el cuadro de diálogo se indica la variable que se quiere contrastar (filas), la variable


que define los dos grupos (columnas) y se selecciona la opción Chi-cuadrado en
Estadísticos.

14
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

EJEMPLO

Con referencia a la encuesta Enctrans.sav se quiere comprobar si la proporción de


alumnos con vehículo difiere significativamente entre los grupos definidos según el
género.

La hipótesis nula del contraste es 𝑯𝟎 : 𝝅𝟏 = 𝝅𝟐 ; siendo 𝝅𝟏 la proporción poblacional


de hombres con vehículo y 𝝅𝟐 la proporción poblacional de mujeres con vehículo.

Con la secuencia Analizar > Estadísticos Descriptivos > Tablas de contingencia se


accede al cuadro de diálogo donde se indica que la variable a contrastar es Vehículo y
que la variable de agrupación es el Género, y se selecciona la opción Chi-cuadrado en
Estadísticos. Al aceptar se obtiene el siguiente cuadro de resultados.

15
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

Si es cierto que la proporción de propietarios de vehículo es la misma en los dos


grupos, 𝝅𝟏 = 𝝅𝟐 = 𝝅 la estimación de 𝝅 es la proporción de propietarios de vehículo
para el total de alumnos de la muestra, es decir, 39/114=0,3421. La frecuencia
esperada de hombres con vehículo se obtendrá multiplicando esta proporción por el
total de hombres en la muestra, o sea, 0,3421·54=18,5; y de la misma forma se
obtendrá la frecuencia esperada de mujeres con vehículo: 0,3421·60=20,5 (veáse que
estas frecuencias esperadas coinciden con las que cabría esperar en el caso de que
las variables Género y Vehículo fueran independientes).

El estadístico Chi-cuadrado toma el valor 0,998 y el nivel de significación crítico es


0,318, por lo tanto no se rechaza la hipótesis nula para los niveles de significación
habituales y se puede aceptar que no hay diferencia entre la proporción de hombres y
mujeres propietarios de vehículos.

16
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

17
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

18
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

19
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

20
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

21
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

4.- Conclusiones.

 La función de densidad o masa de probabilidad depende del vector


de parámetros θ: f (x; θ).
 Una muestra aleatoria simple está con función de densidad o masa
de probabilidad f(x; θ).
 Para estudiar la variabilidad de los valores del estimador alrededor
del parámetro se hace uso de una cantidad llamada error
cuadrático medio.
 El nivel de confianza, 1−α, es la probabilidad de que un intervalo
de confianza contenga al verdadero valor del parámetro.
 A medida que aumenta el tamaño de la muestra disminuye la
amplitud del intervalo.
 A medida que el nivel de confianza es mayor aumenta la amplitud
del intervalo

5.- Bibliografía.

Montgomery, D. y Runger, G. Probabilidades y estadísticas

aplicadas a la ingeniería. editores, SA de C.V

Maneiro, N. y Mejías, A. estadística para ingeniería. Biblioteca de

Ingeniería. Universidad de Carabobo.

Docente de Estadística - Evelio Hernández

22
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

23
Estadística y Probabilidades
<< Año del Buen Servicio al Ciudadano>>

Universidad Nacional De Cajamarca


Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería de Minas

24
Estadística y Probabilidades