Está en la página 1de 16

estadística

Autores:
profesor:
Castillo Luis C.I: 27592413
Wilmer millan
Marcano Shirley C.I: 28279561

M01 T3
Contenido
Introducción.......................................................................................................................................2
estimadores.......................................................................................................................................3
Propiedades recomendables de un estimador...................................................................................4
Suficiente:......................................................................................................................................4
Insesgado:......................................................................................................................................4
Consistente:...................................................................................................................................4
Eficiente:........................................................................................................................................4
Robusto:.........................................................................................................................................4
Estimación por intervalo....................................................................................................................4
Ejemplo......................................................................................................................................5
Intervalos de confianza......................................................................................................................6
Ejemplo......................................................................................................................................7
Ejemplo......................................................................................................................................7
Error típico o estándar.......................................................................................................................8
Intervalo de confianza para una proporción......................................................................................8
Ejemplo......................................................................................................................................9
Intervalo de confianza para una media..............................................................................................9
Ejemplo....................................................................................................................................10
Estimación por intervalo de confianza.............................................................................................10
Depende de..................................................................................................................................11
estimación de parámetros...............................................................................................................12
Ejemplo....................................................................................................................................12
estimación puntual...........................................................................................................................13
Estimación de la media de la población...........................................................................................14
Conclusiones....................................................................................................................................15
Introducción
El material sobre teoría de probabilidad constituye la base de la inferencia
estadística, rama de la estadística que tiene que ver con el uso de los
conceptos de la probabilidad para tratar con la toma de decisiones en
condiciones de incertidumbre. La inferencia estadística está basada en la
estimación, y en la prueba de hipótesis. Tanto en la estimación como en la
prueba de hipótesis, se hace inferencias acerca de ciertas características de
las poblaciones a partir de la información contenida en las muestras (Badii &
Castillo, 2007, 2009).
En este trabajo introducimos métodos que nos permiten estimar con
precisión razonable la porción de la población y la media de la población.
Calcular la porción exacta o la media exacta sería una meta imposible de
obtener, pero, a pesar de ello, seremos capaces de hacer una estimación, de
hacer una afirmación con respecto al error que probablemente acompañará
a tal estimación, y de poner en marcha algunos controles para evitar lo más
que se puede de dicho error. Como tomadores de decisiones, en ocasiones,
nos veremos forzados, a confiar en nuestros presentimientos. Sin embargo,
en otras situaciones, en las cuales se tenga disponible información y
podamos aplicar los conceptos de la estadística, podemos desempeñamos de
mejor manera (Badii et al., 2007a, 2007b).
estimadores
Un estimador es un estadístico (una función de la muestra) utilizado para estimar un parámetro
desconocido de la población.

Por ejemplo, si se desea conocer el precio medio poblacional de un artículo (parámetro


desconocido) se recogen observaciones del precio de dicho artículo en diversos establecimientos
(muestra) pudiendo utilizarse la media aritmética de las observaciones para estimar el precio
medio poblacional.

El valor de un estimador proporciona una estimación puntual del valor del parámetro en estudio.
En general, se realiza la estimación mediante un intervalo, es decir, se obtiene un intervalo
parámetro muestral error muestral dentro del cual se espera se encuentre el valor poblacional
dentro de un cierto nivel de confianza. El nivel de confianza es la probabilidad de que a priori el
valor poblacional se encuentre contenido en el intervalo.

Para cada parámetro pueden existir varios estimadores diferentes. En general, se elige el
estimador que posea mejores propiedades que los restantes

En general, se puede afirmar que un estimador puede ser:

Insesgado: cuando el estimador muestral coincide con el poblacional, sin ninguna desviación
sistemática. Es decir, un estimador es insesgado si su valor medio sobre todas las posibles
muestras de tamaño n coincide con el parámetro poblacional.

Sesgado:

cuando el estimador muestral no se corresponde con el poblacional, debido a un error sistemático.

Eficiente:

aquel estimador muestral de igual valor a otros, pero que presenta la mínima varianza. Interesa
que las distintas estimaciones difieran lo menos posible del parámetro poblacional; es decir, que la
varianza muestral del estimador sea mínima. De esta forma, se tendrá una mayor confianza en que
la estimación resultante de la muestra finalmente seleccionada esté próxima al parámetro
poblacional.

Suficiente:

aquel estimador que utiliza toda la información contenida en la muestra.

Un buen estimador es aquel que es insesgado, eficiente y suficiente (Rothman y Greenland, 1998)

Propiedades recomendables de un estimador


Para que cumpla bien su función, además de que los estimadores cumplan su condición básica de
estimadores, es recomendable que cumplan ciertas propiedades adicionales. Estas propiedades
son las que permitirán que las conclusiones extraídas de nuestro estudio sean fiables.
Suficiente:
La propiedad de suficiencia indica que el estimador trabaja con todos los datos de la muestra. Por
ejemplo, la media no escoge solo el 50% de los datos. Tiene en cuenta el 100% de los datos para
calcular el parámetro.

Insesgado:
La propiedad de insesgadez hace referencia a la centralidad de un estimador. Es decir, la media de
un estimador debe coincidir con el parámetro a estimar. No debemos confundir media de un
estimador con la estimadora media.

Consistente:
El concepto de consistencia va aparejado del tamaño de la muestra y del concepto de límite. En
palabras sencillas, viene a decirnos que los estimadores cumplen esta propiedad cuando, en caso
de que la muestra sea muy grande, puedan estimar casi sin error.

Eficiente:
La propiedad de eficiencia puede ser absoluta o relativa. Un estimador es eficiente en sentido
absoluto cuando la varianza del estimador es mínima. No debemos confundir varianza de un
estimador con estimadora varianza.

Robusto:
Se dice que un estimador es robusto en caso de que, a pesar de que la hipótesis de partida sea
incorrecta, los resultados se asemejan mucho a los reales.

Las anteriores propiedades son las principales. Eso sí, dentro de cada propiedad existen muchos
casos diferentes. Del mismo modo, también existen otras propiedades deseables.

Estimación por intervalo


La estimación por intervalos consiste en establecer el intervalo de valores donde es más probable
se encuentre el parámetro. La obtención del intervalo se basa en las siguientes consideraciones:

a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades de


ocurrencia de los estadísticos muestrales.

b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la probabilidad de


que el estimador se halle dentro de los intervalos de la distribución muestral.

c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se establece


alrededor del estimador. Si repetimos el muestreo un gran número de veces y definimos un
intervalo alrededor de cada valor del estadístico muestral, el parámetro se sitúa dentro de cada
intervalo en un porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo de
confianza".

Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución Normal,
y resulta:
La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral son los
valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se pueden obtener
en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones informáticas
como Excel). Seguidamente generamos una muestra de la población y obtenemos su Media, que
es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el parámetro
poblacional (5.1) está incluido dentro de sus límites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razón, la
distancia desde m a la Media muestral es la misma que va de la Media muestral a m. En
consecuencia, si hacemos un muestreo con un número grande de muestras observamos que el
95% de las veces (aproximadamente) el valor de la Media de la población (m) se encuentra dentro
del intervalo definido alrededor de cada uno de los valores de la Media muestral. El porcentaje de
veces que el valor de m se halla dentro de alguno de los intervalos de confianza es del 95%, y es
denominado nivel de confianza.

Si queremos establecer un intervalo de confianza en que el % de veces que m se halle dentro del
intervalo sea igual al 99%, la expresión anterior es:
(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución muestral en las
tablas de la distribución Normal estandarizada o de funciones en aplicaciones informáticas como
Excel), y son los valores cuya función de probabilidad es igual a 0.995 y 0.005 respectivamente).

Intervalos de confianza
Un problema habitual es el de estimar parámetros que ayuden a caracterizar una variable. Por
ejemplo, el porcentaje de individuos que mejora ante un cierto tratamiento, o el tiempo medio
que tarda un anestésico en hacer efecto.

Podríamos decir, tras realizar un estudio, "el 75% de los pacientes tratados experimentó una
mejoría". Una respuesta más sofisticada usando intervalos de confianza podría ser: "Nuestro
estudio muestra que en el 75% de los casos se experimenta una mejoría, siendo el margen de
error del 6%. El nivel de confianza es del 95%".

El cálculo de intervalos de confianza para la estimación de parámetros son técnicas que nos
permiten hacer declaraciones sobre qué valores podemos esperar para un parámetro. El intervalo
calculado dependerá de:

• Lo estimado en la muestra (porcentaje, media,...) El intervalo de confianza esta formado por


valores ligeramente menores y mayores que la aproximación ofrecida por la muestra.

• El tamaño muestral. Cuantos más datos hayan participado en el cálculo, más pequeño
esperamos que sea la diferencia entre el valor estimado y el valor real desconocido.

• La probabilidad (nivel de confianza) con la que el método dará una respuesta correcta. Niveles
de confianza habituales para los intervalos de confianza son el 95% y el 99%.

Puede parecer sorprendente que no busquemos respuestas con una confianza del 100%, pero
ocurre que en ese caso, los intervalos serían tan grandes que no serían de gran provecho. La
elección de un nivel de confianza como el 95% es un compromiso entre hacer declaraciones con
una razonable probabilidad de acertar, y que además el intervalo declarado, sea lo
suficientemente pequeño como para suscitar algún interés. El nivel de confianza hay que
interpretarlo como que disponemos de un método de calcular intervalos que seguido con rigor, en
cierto porcentaje de casos acierta (nivel de confianza) y en el resto falla.

Un intervalo de confianza es una técnica de estimación utilizada en inferencia estadística que


permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación
puntual buscada (con una determinada probabilidad).

Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una media muestral
(uno superior y otro inferior). Estos valores van a acotar un rango dentro del cual, con una
determinada probabilidad, se va a localizar el parámetro poblacional.

Intervalo de confianza = media +- margen de error


Conocer el verdadero poblacional, por lo general, suele ser algo muy complicado. Pensemos en
una población de 4 millones de personas. ¿Podríamos saber el gasto medio en consumo por hogar
de esa población? En principio sí. Simplemente tendríamos que hacer una encuesta entre todos
los hogares y calcular la media. Sin embargo, seguir ese proceso sería tremendamente laborioso y
complicaría bastante el estudio.

Ante situaciones así, se hace más factible seleccionar una muestra estadística. Por ejemplo, 500
personas. Y sobre dicha muestra, calcular la media. Aunque seguiríamos sin saber el verdadero
valor poblacional, podríamos suponer que este se va a situar cerca del valor muestral. A esa media
le sumamos el margen de error y tenemos un valor del intervalo de confianza. Por otro lado, le
restamos a la media ese margen de error y tendremos otro valor. Entre esos dos valores estará la
media poblacional.

En conclusión, el intervalo de confianza no sirve para dar una estimación puntual del parámetro
poblacional, si nos va a servir para hacernos una idea aproximada de cuál podría ser el verdadero
de este. Nos permite acotar entre dos valores en dónde se encontrará la media de la población.

Ejemplo
Ejemplo. En un estudio se pretende estimar la edad media a la que se diagnostica la Diabetes
Mellitus en la Comunidad Valenciana. Para ello se dispone de una muestra de 21 pacientes a los
que se les ha preguntado la edad de diagnóstico de la enfermedad. A partir de estos 21 pacientes
se ha obtenido una edad media (muestral) de 48.78 años y una desviación típica muestral de
16.32. Calcula un intervalo de confianza al 95% para la edad media de diagnóstico de esta
enfermedad en la región de estudio.

(Mediante la distribución t-Student en este caso hallamos el intervalo;)

[41.35 , 56.20]

Con un 95% de confianza, la edad media a la que se diagnostica la Diabetes Mellitus en la


Comunidad Valenciana estará contenida en el intervalo [41.35, 56.20], es decir, entre 41 y 56 años
aproximadamente.

Ejemplo
Un estudio pretende estimar el porcentaje de hipertensos que hay entre las personas mayores de
65 años en la Comunidad Valenciana. Además de una estimación puntual de este porcentaje,
interesa obtener un intervalo de confianza al 95% para este parámetro de la población (P). Para
llevar a cabo este estudio, han sido seleccionadas 350 personas mayores de 65 años en toda la
Comunidad, resultando tras realizar las pruebas correspondientes que 167 padecen de
hipertensión.

Estimador puntual: (167/350) x100=47.71%

Intervalo de confianza: [42.48, 52.94]

Con un 95% de confianza, el porcentaje de hipertensos entre las personas mayores de 65 años en
la Comunidad Valenciana estaría contenido en el intervalo [42.48, 52.94], es decir,
aproximadamente entre el 42.5% y 53% de la población.
Error típico o estándar
En multitud de ocasiones al utilizar un programa estadístico encontramos junto a las más diversas
estimaciones como una media, una proporción, un coeficiente de regresión, un coeficiente de
asimetría, etc., una cantidad misteriosa denominada error estándar o también error típico.

El error estándar depende del parámetro que estemos calculando y de la distribución de la


variable. Es una medida de la variabilidad del estimador. Su cálculo exacto es salvo excepciones y
sin hacer simplificaciones, excesivamente complicado. Estas simplificaciones suelen ser del tipo
que la variable en estudio tiene una distribución conocida, o que la muestra es lo suficientemente
grande para considerar algunas aproximaciones adecuadas. No entraremos en más detalles sobre
esta espinosa cuestión.

El Error Cuadrático Medio (ECM) calcula la distancia promedio que existe entre el valor esperado
del estimador muestral Q y el estimador poblacional. La forma cuadrática del ECM se debe a que
los errores pueden ser por defecto, negativos, o por exceso, positivos, respecto al valor esperado.
De este modo, ECM siempre computará valores positivos.

ECM depende de la varianza y del sesgo (en el caso que lo hubiera) permitiéndonos comparar dos
estimadores cuando uno o ambos son sesgados. Aquel cuyo ECM sea mayor se entenderá que es
menos preciso (tiene más error) y, por tanto, menos eficiente.

Intervalo de confianza para una proporción


Raro será que veamos alguna vez un estudio donde se pregunta a los individuos si les
gusta determinado producto y nos encontremos como respuesta simplemente el porcentaje de
satisfechos. Como hemos mencionado anteriormente en la respuesta esperaríamos encontrar un
margen de error, a ser posible pequeño (indicador de que la muestra es representativa) y con un
nivel de confianza alto, por ejemplo 95%.

Para poder dar una respuesta es necesario calcular el error estándar. Si la muestra es
suficientemente grande (más de 50 individuos, por ejemplo), y el porcentaje a estimar, n, no es
muy extremo (cercano al 0% o al 100%), la distribución del estimador de la proporción, p, es
aproximadamente normal. El error estándar puede ser aproximado mediante:

Ejemplo
Se preguntó a 80 pacientes si habían sufrido algún trastorno tras seguir un tratamiento, de los
cuales 60 (p=60/80=3/4=75%) dijeron que no. La muestra es grande y no esperamos que el
porcentaje real en caso de haber sido extendido a muchos más pacientes sea muy diferente. Por
tanto, el error estándar es:
Podemos decir, pues, que el 75% de los individuos no mencionaron haber sufrido trastornos, con
un margen de error de 2. EE = 9.6%. La confianza es del 95%.

Intervalo de confianza para una media


Otro caso muy común es el de estimar el valor medio de una variable numérica. Como sabemos la
media es interesante como medida de centralización cuando la distribución de la misma es más o
menos normal. En este caso el error estándar se puede aproximar con:

En este caso, incluso podemos hacer estimaciones, aunque las muestras sean pequeñas, con sólo
verificarse que la distribución de la variable es normal, ya que la distribución del estimador es
conocida de forma exacta como distribución t-student. En cualquier caso, si las muestras son
grandes, aunque la distribución de los datos no sea normal, la media como en el caso de las
proporciones se distribuye de manera aproximadamente normal. Y el mismo método que usamos
para proporciones sigue siendo válido.

Ejemplo
En un trabajo de Quetelet se estudia la distribución del
perímetro torácico medido en pulgadas de militares
escoceses de principios del siglo XIX. Los resultados se
muestran en la gráfica, y aparentan una distribución
normal. La media es 39.8 y la desviación típica 2.05; El
tamaño de la muestra es de 5738 individuos, por tanto,
el error estándar es:

Podemos decir que el perímetro torácico medio es de 39.8 pulgadas con un margen de error de 2
• EE = 0.054 pulgadas. La confianza es del 95%.

Estimación por intervalo de confianza


Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que
posiblemente incluya el valor de un parámetro de población desconocido. Debido a su naturaleza
aleatoria, es poco probable que dos muestras de una población en particular produzcan intervalos
de confianza idénticos. Sin embargo, si usted repitiera muchas veces su muestra, un determinado
porcentaje de los intervalos de confianza resultantes incluiría el parámetro de población
desconocido.

En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de la
población, µ. Los intervalos de confianza azules verticales que se sobreponen a la línea horizontal
contienen el valor de la media de la población. El intervalo de confianza rojo que está
completamente por debajo de la línea horizontal no lo contiene. Un intervalo de confianza de 95%
indica que 19 de 20 muestras (95%) de la misma población producirán intervalos de confianza que
contendrán el parámetro de población.

Utilice el intervalo de confianza para evaluar la estimación del parámetro de población. Por
ejemplo, un fabricante desea saber si la longitud media de los lápices que produce es diferente de
la longitud objetivo. El fabricante toma una muestra aleatoria de lápices y determina que la
longitud media de la muestra es 52 milímetros y el intervalo de confianza de 95% es (50,54). Por lo
tanto, usted puede estar 95% seguro de que la longitud media de todos los lápices se encuentra
entre 50 y 54 milímetros.

El intervalo de confianza se determina calculando una estimación de punto y luego determinando


su margen de error.

La expresión más general para hacer estimaciones calculando intervalos de confianza es sumar y
restar al estimador muestral z veces el EE del estimador:

Parámetro  (estimador + z x EE del estimador)

donde z es el valor correspondiente de la distribución normal.

A veces, en vez de z, se usa la distribución t de Student, debido a que no disponemos de s (la


desviación estándar poblacional) sino sólo de  (la desviación estándar muestral).

Si el I.C. es al nivel de confianza del 95% (en general, 1- ), implica que hay un 5% de error (en
general,) repartido en dos colas, una a cada lado. Cada cola valdría el 2.5% ( / 2 = 0.025); en
este caso, z valdría1 1.96.
Depende de
El intervalo de confianza calculado dependerá de:

 Lo estimado en la muestra (porcentaje, media,..) El I.C. está formado por valores ligeramente
menores y mayores que la aproximación ofrecida por la muestra.

 El tamaño muestral. Cuantos más datos hayan participado en el cálculo, más pequeño
esperamos que sea la diferencia entre el valor estimado y el valor real desconocido.

 La probabilidad, nivel de confianza (1-), con la que el método dará una respuesta correcta.
Niveles de confianza habituales para los I.C. son el 95% y el 99%.

estimación de parámetros
La estimación de parámetros es un método que consiste en asignar un valor al parámetro o al
conjunto de parámetros que caracterizan el campo sujeto a estudio. La fórmula matemática que lo
determina se denomina estimador.

Al ser una estimación existe cierto error. Incluso, aunque el estimador tenga todas las propiedades
óptimas. Por pequeño que sea, siempre existirá un error.

Así pues, para obtener estimaciones adaptadas a esa realidad, se crean intervalos de confianza. Es
decir, rangos entre los que están esos valores estimados con cierto grado de confianza. El grado de
confianza (fiabilidad) se puede modificar. Cuando mayor sea el grado de confianza, más grande
será el intervalo. Eso sí, cuanto menos error tenga la estimación inicial, más acotado será el
intervalo de confianza.

Una estimación consiste en apostar por un valor para un parámetro poblacional, habitualmente
calculando también un rango de valores entre los que puede situarse dicho parámetro
poblacional. Por tanto, un intervalo de confianza es simplemente un rango de valores en el que
confiamos que se contenga el parámetro poblacional (Altman, 1991).

Simplificando, puede decirse que el análisis estadístico inferencial conduce a dos clases de
resultados: valores “p” e intervalos de confianza.
Todo el proceso de estimación parte de los correspondientes estimadores muestrales. Un
estimador es una función de los valores de una muestra que se elabora para indagar el valor de un
parámetro de la población de la que procede la muestra. El valor de esta característica en la
población es lo que denominamos parámetro. Las estimaciones pueden ser de dos tipos:

 Estimación puntual:

obtendremos un punto, un valor, como estimación del parámetro desconocido, quedando sin
especificar cómo de buena es la aproximación. Si a partir de una muestra se afirma que el 20% de
una población es fumadora se está haciendo una estimación puntual de la proporción de
fumadores.

 Estimación por intervalo:

proporciona un rango de posibles valores, dentro del cual estimamos (bajo cierta probabilidad)
que estará el parámetro desconocido. Si a partir de una muestra se afirma que el porcentaje de la
población que es fumadora se sitúa entre un 18 y 22% se está haciendo una estimación por
intervalo de la proporción poblacional de fumadores.

Ejemplo
Queremos información sobre el resultado de las elecciones generales e intentar predecir qué
porcentaje de votos tendrá cada partido político. Tras utilizar las técnicas pertinentes se extraen
los siguientes resultados:

Partido A: 32%

Partido B: 51%

Partido C: 17%

Sin embargo, somos conscientes, de que es una estimación. Así pues, utilizando las fórmulas
adecuadas, establecemos los intervalos de confianza al 95%.

Partido A: [30 – 34]%

Partido B: [47 – 53]%

Partido C: [15-19]%

Tras los resultados obtenidos se puede interpretar que existe un 95% de probabilidades de que el
resultado de los partidos políticos esté en ese rango. Aun así, existe un 5% de probabilidades de
que los resultados estén fuere de ese rango.

Podemos tomar una muestra, calcular en ella un estadístico (promedio o porcentaje, por ejemplo)
y luego hacer afirmaciones respecto del correspondiente parámetro. Esto se conoce con el
nombre de estimación de parámetros, y se puede hacer de dos formas:

Estimación puntual: consiste en asumir que el parámetro tiene el mismo valor que el estadístico
en la muestra.
estimación puntual
Un estimador puntual es simplemente un estadístico muestral (media aritmética, varianza, etc.)
que se emplea para estimar parámetros (media poblacional, varianza poblacional, etc.).

Una forma natural de estimar muchos parámetros poblacionales consiste en utilizar el estadístico
muestral correspondiente. Así, la media muestral es un estimador puntual de la media poblacional
y la proporción de casos de una enfermedad en la muestra es un estimador puntual de la
probabilidad de tener la enfermedad en la población.

No obstante, para un determinado parámetro poblacional, pueden contemplarse distintos


estimadores alternativos. Algunos estimadores de la media poblacional distintos de la media
muestral podrían ser, por ejemplo, la mediana, la media del 50% central de la muestra o la media
de los valores máximo y mínimo.

Los méritos de un estimador no se juzgan por la estimación resultante en una muestra concreta,
sino por la distribución de todos los posibles valores o estimaciones a que pueda dar lugar; esto es,
por las propiedades de su distribución muestral.

Cuando estimamos un parámetro de forma puntual, podemos saber con certeza, cual es ese valor.
Imaginemos una población de 30 personas de las que seleccionamos una muestra de 20 para las
que conocemos sus edades. Estimar de forma puntual la media de edad, sería tan sencillo como
sumar esos 20 datos y dividirlos entre el total de la muestra estadística.

Pensemos ahora en que queremos estimar la altura media de esa muestra. Al contrario que antes,
no tenemos el valor de la altura de cada persona. En este caso no podríamos realizar una
estimación puntual, es decir, no podríamos hallar un valor concreto de esa altura media. En este
caso tendríamos que realizar una estimación por intervalos, es decir, podríamos acotar el valor
más alto y más bajo de las alturas de las personas con cierta seguridad o lo que en estadística se
conoce como cierto nivel de confianza.

Estimación de la media de la población


Explicaremos este punto con el siguiente ejemplo: queremos estimar el número de hijos promedio
que tienen las mujeres de una población determinada. Con este objeto se seleccionó, por
muestreo aleatorio simple, una muestra de 20 mujeres a quienes se entrevistó, obteniendo como
resultado un promedio de 3,2 hijos y una desviación estándar de 0,8. Con estos resultados
podríamos hacer una estimación puntual y decir que la población de interés tiene en promedio 3,2
hijos. Pero esta estimación tiene el inconveniente de que se desconoce el error que se está
cometiendo.

Si a esta estimación le asignamos un error, que llamaremos E, podríamos decir que el promedio de
hijos de la población está ubicado dentro de un intervalo de estimación que tiene como límite
inferior 3,2 - E y como límite superior 3,2 + E. De este modo, le asignamos al resultado un intervalo
de estimación. Si además le damos a este intervalo una probabilidad de ocurrencia de los valores
comprendidos en él, habremos construido un intervalo de confianza para el promedio de hijos de
nuestra población de mujeres.
Entonces, generalizando lo que se explicó para la variable “promedio de hijos”, podemos decir
que:

Un intervalo de confianza para estimar el promedio de la población está constituido por los
siguientes elementos: el promedio de la muestra y el error de estimación.

El elemento esencial en la construcción del intervalo de estimación es el error.


Conclusiones
La primera fase de la estadística se trata de coleccionar, ordenar y presentar
los datos o hechos numéricos. La segunda parte de la estadística se encarga
de analizar, sintetizar (hacer inferencias y realizar interpretación) y
finalmente publicar los datos que han sido presentados en forma de grafica
y/o de manera tabular. Es precisamente en la sección del análisis estadístico
en donde el investigador debe modificar los datos, es decir hacer
estimaciones de los datos brutos. Para hacer estimaciones, uno debe estar
bien familiarizado con los criterios estadísticos que se debe reunir y
considerar en el proceso de la estimación, ya que las estimaciones sesgadas
nos conducen a las inferencias y decisiones erróneas. Es precisamente con
este punto en la mente que se avoco a realizar la presente investigación.

También podría gustarte