Está en la página 1de 30

REPUBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACION UNIVERSITARIA UNIVERSIDAD NACIONAL EXPERIMENTAL SIMON RODRIGUEZ

NUCLEO APURE EXTENSION ELORZA

OBLIGACIONES DEL COMERCIANTE

FACILITADOR:

PARTICIPANTES:

ELORZA, ABRIL, 2013

INDICE

INTRODUCCION En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a partir de una poblacin. Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzaran si se realizase un estudio de toda la poblacin. Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la poblacin sino estimar tambin los mrgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero s podemos actuar de manera que esta condicin se alcance con una probabilidad alta. En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se puede extraer dos o ms muestras de la misma poblacin. Al conjunto de muestras que se pueden obtener de la poblacin se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extraccin, sigue la llamada distribucin muestral.

NOCIONES DE MUESTREO La estadstica inferencial estudia un conjunto de procedimientos para extender las conclusiones que se obtienen en una muestra a la poblacin general que es objeto de inters. Por razones de tiempo y costos operativos, la mayor parte de las veces, no es posible estudiar la poblacin completa, por ello se opta por estudiar las variables en una muestra representativa de dicha poblacin. Ser necesario entonces proceder a una estimacin por inferencia del o los valores que se investigan a partir de datos de slo una parte seleccionada de la totalidad de los objetos (sujetos) en estudio. El muestreo es un procedimiento mediante el cual se selecciona de un conjunto determinado llamado poblacin, un subconjunto que recibe el nombre de muestra, con el objeto de llegar al conocimiento de determinadas caractersticas de los elementos de la poblacin mediante la observacin y generalizacin de las correspondientes a los elementos de la muestra. No siempre, en una investigacin tenemos una muestra, pero en la mayoria de los casos s se realiza el estudio en una muestra. Slo cuando se realiza un censo se debe incluir en el estudio a todos los sujetos del universo o la poblacin. Por ejemplo, los estudios motivacionales en empresas suelen abarcar a todos los empleados para evitar que los excludos piensen que su opinin no se toma en cuenta. Las muestras, como dijimos, se utilizan por economa de tiempo y recursos. Sobre qu o quienes se recolectarn los datos. El inters se centra en los sujetos, objetos, sucesos, eventos o contextos de estudio. Esto va a depender del planteamiento inicial de la investigacin. Si por ejemplo, el objetivo es describir el uso que hacen los nios de la televisin, lo ms factible sera interrogar a un grupo de nios. Tambin es til entrevistar a las mams de los nios. Escoger entre los nios o a sus mams, o ambos, depender no slo del objetivo de la investigacin, sino del diseo de la misma. En el caso de la investigacin de Fernndez Collado, Baptista y Elkes (1998), donde el objetivo bsico del estudio era describir la relacin niotelevisin, se determin que los sujetos seleccionados para el estudio fueran nios que respondieran sobre sus conductas y percepciones relacionadas con este medio de comunicacin. En otro estudio de Greenberg, Ericson y Vlahos (1972), el objetivo de anlisis era investigar las uso de la tdiscrepancias o semejanzas en las opiniones de madres e hijos con respecto al uso de la televisin. Aqu el objetivo del estudio supuso la seleccin de madres y nios, para entrevistarlos por separado, correlacionando posteriormente la respuesta de cada par madre-hijo.

POBLACION Y MUESTRA El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. "Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996). "Una poblacin es un conjunto de elementos que presentan una caracterstica comn". Cadenas (1974). Ejemplo: Los miembros del Colegio de Ingenieros del Estado Cojedes. El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos. Una poblacin finita es aquella que est formada por un limitado nmero de elementos, por ejemplo; el nmero de estudiante del Ncleo San Carlos de la Universidad Nacional Experimental Simn Rodrguez. Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadstica. Es a menudo imposible o poco prctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado poblacin o universo, se examina una pequea parte del grupo llamada muestra. "Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla". Murria R. Spiegel (1991). "Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos". Levin & Rubin (1996). "Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia", Cadenas (1974). Ejemplo; El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado Cojedes. El estudio de muestras es ms sencillo que el estudio de la poblacin completa; cuesta menos y lleva menos tiempo. Por ltimo se aprobado que el examen de una poblacin entera todava permite la aceptacin de elementos
5

defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin. Los expertos en estadstica recogen datos de una muestra. Utilizan esta informacin para hacer referencias sobre la poblacin que est representada por la muestra. En consecuencia muestra y poblacin son conceptos relativos. Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo.

PAREMETROS Y ESTADISTICAS En estadstica, un parmetro es un nmero que resume la ingente cantidad de datos que pueden derivarse del estudio de una variable estadstica. El clculo de este nmero est bien definido, usualmente mediante una frmula aritmtica obtenida a partir de datos de la poblacin. Los parmetros estadsticos son una consecuencia inevitable del propsito esencial de la estadstica: crear un modelo de la realidad. El estudio de una gran cantidad de datos individuales de una poblacin puede ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea global de la poblacin, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parmetros estadsticos. Por ejemplo, suele ofrecerse como resumen de la juventud de una poblacin la media aritmtica de las edades de sus miembros, esto es, la suma de todas ellas, dividida por el total de individuos que componen tal poblacin.

INFERENCIA ESTADISTICA La Estadstica inferencial o Inferencia estadstica estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una muestra, y el grado de fiabilidad o significacin de los resultados obtenidos. La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga del estudio de los mtodos para la obtencin del modelo de probabilidad (forma funcional y parmetros que determinan la funcin de distribucin) que sigue una variable aleatoria de una determinada poblacin, a travs de una muestra (parte de la poblacin) obtenida de la misma. Los dos problemas fundamentales que estudia la inferencia estadstica son el "Problema de la estimacin" y el "Problema del contraste de hiptesis"
6

Cuando se conoce la forma funcional de la funcin de distribucin que sigue la variable aleatoria objeto de estudio y slo tenemos que estimar los parametros que la determinan, estamos en un problema de inferencia estadstica paramtrica ; por el contrario cuando no se conoce la forma funcional de la distribucin que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadstica no paramtrica. En lo que sigue nos vamos a limitar a problemas de inferencia estadstica paramtrica, donde la variable aleatoria objeto de estudio sigue una distribucin normal, y slo tendremos que tratar de estimar los parmetros que la determinan, la media y la desviacin tpica. Esta situacin se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional de la distribucin de probabilidad, por consideraciones tericas, quedando nicamente indeterminados los parmetros que determinan la funcin de distribucin. Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria, son grandes, es muy caro o imposible, estudiar a todos sus individuos; lo que se hace, es estudiar una muestra ( una parte) de la poblacin En todos estos problemas que estudia la inferencia estadstica juega un papel fundamental la "Teora de la Probabilidad" (distintas formas funcionales de las distribuciones de probabilidad) y la "Teora de Muestras" (procedimientos para tomar muestras de manera apropiada).

VENTAJAS DEL MUESTREO Hay dos formas de estudiar las poblaciones: por censo o por muestreo. En el censo se analizan todos y cada una uno de los elementos de una poblacin y en el muestreo se analiza una parte de la poblacin. Las principales ventajas del muestreo comparadas con el censo son: a) Costo reducido. Si la informacin se obtienen nicamente para una parte de la poblacin, los gastos son menores que los se tendran si se realiza un censo. b) Mayor rapidez. La informacin puede ser recolectada y procesada ms rpidamente cuando se selecciona una muestra que cuando se realiza un censo. c) Mayor exactitud. Cuando los errores ajenos al muestreo son necesariamente grandes, una muestra puede dar mejores resultados que un censo, ya que esos errores se controlan con ms facilidad si la operacin es de pequea escala. Como el volumen de trabajo se reduce, se puede emplear personal calificado y realizar una supervisin cuidadosa del trabajo de campo y del procesamiento de la informacin, reduciendo as los errores de no muestreo.

d) Posibilidad de hacerse. En la industria algunas pruebas son destructivas, por lo tanto, ciertas investigaciones slo pueden realizarse con una muestra de productos. Por ejemplo, un estudio sobre la duracin de los bombillos o la resistencia de cualquier material.

DISTRIBUCION EN L MUESTREO El Muestreo es el Proceso de seleccin de muestras, se utiliza cuando no es posible contar o medir todos los elementos de la poblacin objeto de estudio Existen dos mtodos para seleccionar muestras de poblaciones entre estos estn el Muestreo no aleatorio o de juicio Se emplea el conocimiento y la opinin personal para identificar aquellos elementos de la poblacin que deben incluirse en la muestra, el Muestreo aleatorio o de probabilidad es en el cual todos los elementos de la poblacin tienen la oportunidad de ser escogidos para la muestra Dentro de este tipo de muestreo se encuentran Muestreo aleatorio simple el cual es un mtodo de seleccin de muestras que permite que cada muestra posible pueda ser elegida con la misma probabilidad. Por su parte cada elemento de la poblacin tiene la misma oportunidad igual de ser incluido en la muestra, Muestreo sistemtico mtodo en el cual los elementos que se muestrearn se seleccionan de la poblacin en un intervalo uniforme que se mide con respecto al tiempo, al orden o al espacio, Muestreo estratificado, mtodo en el que la poblacin se divide en grupos homogneos o estratos y despus se toma una muestra aleatoria simple de cada estrato, Aqu la variabilidad dentro de cada grupo es pequea y entre los grupos es grande, Muestreo de racimo mtodo en el que la poblacin se divide en grupos o racimos de elementos, y luego se selecciona una muestra aleatoria de estos racimos. La variabilidad dentro de cada grupo es grande y entre los grupos es pequea; es como si cada racimo fuese un pequea representacin de la poblacin en si mima de la distribucin muestral que realiza una lista de todos los valores posibles de un estadstico y la probabilidad asociada a cada valor. Se considerarn la distribucin muestral de medias y la de proporciones. en estos experimentos pueden existir error muestral que hace la diferencia entre el parmetro de la poblacin y el estadstico de la muestra utilizado para estimar el parmetro. Cada muestra de tamao n que podemos extraer de una poblacin proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribucin que llamaremos distribucin muestral de medias. Si tenemos una poblacin normal N y extraemos de ella muestras de tamao n, la distribucin muestral de medias sigue tambin una distribucin normal. Si la poblacin no sigue una distribucin normal pero n>30, aplicando el llamado Teorema central del limite la distribucin muestral de medias se aproxima tambin a la normal anterior. Consideremos todas las posibles muestras de tamao n en una poblacin. Para cada muestra podemos calcular un estadstico
8

(media y la desviacin tpica, proporcin) que variar de una a otra. As obtenemos una distribucin del estadstico que se llama distribucin muestral. Las dos medidas fundamentales de esta distribucin son la media y la desviacin tpica, tambin denominada error tpico. Hay que hacer notar que si el tamao de la muestra es lo suficientemente grande las distribuciones muestrales son normales y en esto se basarn todos los resultados que alcancemos. El teorema de central del lmite dice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribucin (cualesquiera que ste sea), la suma de ellas se distribuye segn una distribucin normal. El teorema del lmite central o teorema central del lmite indica que, en condiciones muy generales, si Sn es la suma de n variables aleatorias independientes, entonces la funcin de distribucin de Sn se aproxima bien a una distribucin normal (tambin llamada distribucin gaussiana, curva de Gauss o campana de Gauss). As pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo suficientemente grande.

DISTRIBUCION DE LA MEDIDA MUESTRAL El estudio de determinadas caractersticas de una poblacin se efecta a travs de diversas muestras que pueden extraerse de ella. El muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. Una poblacin finita en la que se efecta muestreo con reposicin puede considerarse infinita tericamente. Tambin, a efectos prcticos, una poblacin muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo con reposicin. Consideremos todas las posibles muestras de tamao n en una poblacin. Para cada muestra podemos calcular un estadstico (media, desviacin tpica, proporcin,) que variar de una a otra. As obtenemos una distribucin del estadstico que se llama distribucin muestral. Las dos medidas fundamentales de esta distribucin son la media y la desviacin tpica, tambin denominada error tpico. Hay que hacer notar que si el tamao de la muestra es lo suficientemente grande las distribuciones muestrales son normales y en esto se basarn todos los resultados que alcancemos.

DISTRIBUCION MUESTRAL DE MEDIDA Si tenemos una muestra aleatoria de una poblacin N(m,s ), se sabe (Teorema del lmite central) que la fdp de la media muestral es tambin normal con media m y varianza s2/n. Esto es exacto para poblaciones normales y aproximado (buena aproximacin con n>30) para poblaciones cualesquiera. Es decir es el error tpico, o error estndar de la media.
9

Cmo usamos esto en nuestro problema de estimacin? 1 problema: No hay tablas para cualquier normal, slo para la normal m=0 y s=1 (la llamada z); pero haciendo la transformacin (llamada tipificacin) una normal de media m y desviacin s se transforma en una z. Llamando za al valor de una variable normal tipificada que deja a su derecha un rea bajo la curva de a, es decir, que la probabilidad que la variable sea mayor que ese valor es a (estos son los valores que ofrece la tabla de la normal) podremos construir intervalos de la forma

para los que la probabilidad es 1 - a. Teniendo en cuenta la simetra de la normal y manipulando algebracamente

que tambin se puede escribir o, haciendo nfasis en que es el error estndar de la media,

Recurdese que la probabilidad de que m est en este intervalo es 1 - a. A un intervalo de este tipo se le denomina intervalo de confianza con un nivel de confianza del 100(1 - a)%, o nivel de significacin de 100a%. El nivel de confianza habitual es el 95%, en cuyo caso a=0,05 y za /2=1,96. Al valor estimacin puntual y se dice que es un estimador de m. se le denomina

Ejemplo: Si de una poblacin normal con varianza 4 se extrae una muestra aleatoria de tamao 20 en la que se calcula se puede decir que m tiene una probabilidad de 0,95 de estar comprendida en el intervalo

que sera el intervalo de confianza al 95% para m


10

En general esto es poco til, en los casos en que no se conoce m tampoco suele conocerse s2; en el caso ms realista de s2 desconocida los intervalos de confianza se construyen con la t de Student (otra fdp continua para la que hay tablas) en lugar de la z.

o, haciendo nfasis en que media,

es el error estndar estimado de la

Este manera de construir los intervalos de confianza slo es vlido si la variable es normal. Cuando n es grande (>30) se puede sustituir t por z sin mucho error.

ERROR TIPICO DE ESTIMACION En estadstica, error muestral o error de estimacin es el error a causa de observar una muestra en lugar de la poblacin completa. La estimacin de un valor de inters, como la media o el porcentaje, estar generalmente sujeta a una variacin entre una muestra y otra. Estas variaciones en las posibles muestras de una estadstica pueden, tericamente, ser expresadas como errores muestrales, sin embargo, normalmente, en la prctica el error exacto es desconocido. El error muestral se refiere en trminos ms generales al fenmeno de la variacin entre muestras. El error muestral deseado, generalmente puede ser controlado tomando una muestra aleatoria de la poblacin, suficientemente grande, sin embargo, el costo de esto puede ser limitante. Si las observaciones son tomadas de una muestra aleatoria, la teora estadstica brinda clculos probabilsticos del tamao deseado del error muestral para una estadstica en particular o estimacin. Estos usualmente son expresados en trminos del error estndar. El error muestral puede ser contrastado con el error no muestral, el cual se refiere al conjunto de las desviaciones del valor real que no van en funcin de la muestra escogida, entre los cuales se encuentran varios errores sistemticos y algunos errores aleatorios. Resultan mucho ms difciles de cuantificar que el error muestral.

DISTRIBUCION MUESTRAL DE PROPORCIONES En numerosas ocasiones se plantea estimar una proporcin o porcentaje. En estos casos la variable aleatoria toma solamente dos valores diferentes (xito o fracaso), es decir sigue una distribucin binomial y cuando la extensin de la
11

poblacin es grande la distribucin binomial B(n,p) se aproxima a la normal . Para muestras de tamao n>30, la distribucin muestral de proporciones sigue una distribucin normal donde p es la proporcin de uno de los valores que presenta la variable estadstica en la poblacin y q=1-p.

ESTIMACION En estadstica, un estimador es un estadstico (esto es, una funcin de la muestra) usado para estimar un parmetro desconocido de la poblacin. Por ejemplo, si se desea conocer el precio medio de un artculo (el parmetro desconocido) se recogern observaciones del precio de dicho artculo en diversos establecimientos (la muestra) y la media aritmtica de las observaciones puede utilizarse como estimador del precio medio. Para cada parmetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia, convergencia y robustez (consistencia). El valor de un estimador proporciona lo que se denomina en estadstica una estimacin puntual del valor del parmetro en estudio. En general, se suele preferir realizar una estimacin mediante un intervalo, esto es, obtener un intervalo [a,b] dentro del cual se espera est el valor real del parmetro con un cierto nivel de confianza. Utilizar un intervalo resulta ms informativo, al proporcionar informacin sobre el posible error de estimacin, asociado con la amplitud de dicho intervalo. El nivel de confianza es la probabilidad de que a priori el verdadero valor del parmetro quede contenido en el intervalo. En la prctica, los intervalos suelen indicarse dando el valor del estimador puntual utilizado como centro del intervalo y un valor que debe sumarse y restarse para obtener el lmite superior e inferior; por ejemplo: equivale a

ESTIMACION En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar un valor aproximado de un parmetro de una poblacin a partir de los datos proporcionados por una muestra. Por ejemplo, una estimacin de la media
12

de una determinada caracterstica de una poblacin de tamao N podra ser la media de esa misma caracterstica para una muestra de tamao n. La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos mtodos que se usan en funcin de las caractersticas y propsitos del estudio:

Estimacin puntual Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una frmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la talla media de los individuos. Lo ms importante de un estimador, es que sea un estimador eficiente. Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo o eficiente (varianza mnima).

Estimacin por intervalos Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro estimado con una cierta probabilidad. En la estimacin por intervalos se usan los siguientes conceptos:

Intervalo de confianza El intervalo de confianza es una expresin del tipo [1, 2] 1 2, donde es el parmetro a estimar. Este intervalo contiene al parmetro estimado con una determinada certeza o nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un axioma o un equivalente circustancial.

Variabilidad del Parmetro Si no se conoce, puede obtenerse una aproximacin en los datos aportados por la literatura cientfica o en un estudio piloto. Tambin hay mtodos para calcular el tamao de la muestra que prescinden de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviacin tpica poblacional y se denota . Error de la estimacin Es una medida de su precisin que se corresponde con la amplitud del intervalo de confianza. Cuanta ms precisin se desee en la estimacin de un
13

parmetro, ms estrecho deber ser el intervalo de confianza y, si se quiere mantener o disminuir el error, ms ocurrencias debern incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, ms error se comete al aumentar la precisin. Se suele llamar E, segn la frmula E = 2 1.

Lmite de Confianza Es la probabilidad de que el verdadero valor del parmetro estimado en la poblacin se site en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-), aunque habitualmente suele expresarse con un porcentaje ((1 )100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores de 0,05 y 0,01 respectivamente.

Valor Tambin llamado nivel de significacin. Es la probabilidad (en tanto por uno) de fallar en nuestra estimacin, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-). Por ejemplo, en una estimacin con un nivel de confianza del 95%, el valor es (100-95)/100 = 0,05.

Valor crtico Se representa por Z/2. Es el valor de la abscisa en una determinada distribucin que deja a su derecha un rea igual a /2, siendo 1 - el nivel de confianza. Normalmente los valores crticos estn tabulados o pueden calcularse en funcin de la distribucin de la poblacin. Por ejemplo, para una distribucin normal, de media 0 y desviacin tpica 1, el valor crtico para = 0,1 se calculara del siguiente modo: se busca en la tabla de la distribucin ese valor (o el ms aproximado), bajo la columna "rea"; se observa que se corresponde con -1,28. Entonces Z/2 = 1,64. Si la media o desviacin tpica de la distribucin normal no coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-)/ para su clculo. Con estas definiciones, si tras la extraccin de una muestra se dice que "3 es una estimacin de la media con un margen de error de 0,6 y un nivel de confianza del 99%", podemos interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando, respectivamente, la mitad del error, para obtener el intervalo de confianza segn las definiciones dadas. Para un tamao fijo de la muestra, los conceptos de error y nivel de confianza van relacionados. Si admitimos un error mayor, esto es, aumentamos el
14

tamao del intervalo de confianza, tenemos tambin una mayor probabilidad de xito en nuestra estimacin, es decir, un mayor nivel de confianza.

Otros usos del trmino El trmino estimacin tambin se utiliza en ciencias aplicadas para hacer referencia a un clculo aproximado, que normalmente se apoya en la herramienta estadstica aunque puede no hacerlo. En este sentido, un ejemplo clsico son los poco conocidos pero tiles en economa problemas de Fermi.

CARACTERISTICAS DE UN BUEN ESTIMADOR Sesgo Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el verdadero valor del parmetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza igual al parmetro que se desea estimar. Por ejemplo, si se desea estimar la media de una poblacin, la media aritmtica de la muestra es un estimador insesgado de la misma, ya que su esperanza (valor esperado) es igual a la media de la poblacin. En efecto, si una muestra X=(X1,X2,...,Xn)t procede de una poblacin de media , quiere decir que: para cualquier i=1...n

La media aritmtica o media presupuestal, , con lo que, al aplicar las propiedades de linealidad de la esperanza matemtica se tiene que:

Eficiencia Diremos que un estimador es ms eficiente o ms preciso que otro estimador, si la varianza del primero es menor que la del segundo. Por ejemplo, si y son ambos estimadores de y diremos que es ms

15

eficiente que . Un estimador es ms eficiente (ms preciso), por tanto, cuanto menor es su varianza. La eficiencia de los estimadores est limitada por las caractersticas de la distribucin de probabilidad de la muestra de la que proceden. El teorema de Cramr-Rao determina que la varianza de un estimador insesgado de un

parmetro es, como mnimo,

donde

es

la funcin de densidad de probabilidad de la muestra en funcin del parmetro , (denominada funcin de verosimilitud). Si un estimador alcanza esta cota mnima, entonces se dice que el estimador es de mnima varianza. Consistencia Si no es posible emplear estimadores de mnima varianza, el requisito mnimo deseable para un estimador es que a medida que el tamao de la muestra crece, el valor del estimador tienda a ser el valor del parmetro, propiedad que se denomina consistencia. Existen diversas definiciones de consistencia, ms o menos restrictivas, pero la ms utilizada es la denominada consistencia en media cuadrtica que exige que: 1. 2. cuando cuando

Robustez El estimador ser un estimador robusto del parmetro si la violacin de los supuestos de partida en los que se basa la estimacin (normalmente, atribuir a la poblacin un determinado tipo de funcin de distribucin que, en realidad, no es la correcta), no altera de manera significativa los resultados que ste proporciona.

Suficiencia Se dice que un estimador es suficiente cuando resume toda la informacin relevante contenida en la muestra, de forma que ningn otro estimador pueda proporcionar informacin adicional sobre el parmetro desconocido de la
16

poblacin. Por ejemplo, la media muestral sera un estimador suficiente de la media poblacional, mientras que la moda no lo sera.

Invarianza Se dice que un estimador es invariante cuando el estimador de la funcin parmetro coincide con la funcin del estimador del parmetro,

del

Ejemplo.- Si para estimar la varianza poblacional utilizamos la varianza muestral, entonces para estimar la desviacin tpica poblacional ser razonable utilizar la desviacin tpica muestral.

TIPOS DE ESTIMACION Un estadstico utilizado para aproximar un parmetro de poblacin se denomina estimador del parmetro. El nmero obtenido cuando se evala el estimador para una muestra en particular, es una estimacin del parmetro. Si quiero conocer la estatura promedio de los colombianos podra hacer dos cosas: Tomar la estatura de todos y cada uno de los colombianos y calcular el valor promedio. Tomar una muestra de colombianos y calcular el valor promedio de la muestra.

El valor que encontramos en el primer caso es el valor real y se denomina parmetro. En el segundo caso tendremos un valor aproximado al valor real que se denomina estimacin. Es decir, un parmetro de la poblaciones estimado a partir de una muestra, siendo el estimador la funcin o estadstico elegido entre los posibles para caracterizar al parmetro. El valor tomado por dicho estimador en cada caso concreto recibe el nombre de estimacin. En la notacin utilizada en publicaciones sobre estos temas, los parmetros se representan con letras griegas y los estimadores o estadsticos con letras latinas . Es decir, si estamos hablando del promedio de todos los colombianos se denota como y el valor que arroja la muestra se denota como . Para lograr que la muestra nos permita obtener un estimador lo ms cercano al parmetro se deben cumplir dos condiciones:

Asegurar un adecuado proceso de muestreo. Obtener un buen tamao de muestra


17

Obtener un buen estimador permite sacar conclusiones que sean aplicables a toda la poblacin de la cual se sac la muestra. Se deben distinguir dos tipos de estimacin: la estimacin puntual y la estimacin por intervalo. La estimacin puntual: consiste en asignar un nico valor como estimacin del parmetro; esta estimacin se utiliza cuando queremos conocer el valor concreto de un parmetro poblacional y no disponemos de este valor. La estimacin por intervalo: es aquella que calcula un intervalo que contenga entre sus lmites, con cierta probabilidad, el verdadero valor del parmetro poblacional. Este intervalo se llama.

ESTIMACIN POR INTERVALOS El inconveniente principal es que un nico valor observado de generalmente no es exactamente igual a ; habr cierta diferencia entre y . Sera conveniente tener idea de lo cerca que est nuestra estimacin del verdadero valor de la media poblacional. Tambin sera bueno poder dar informacin de lo seguros o confiados que estamos de la precisin de la estimacin. Para tener una idea, no solo del valor de la media, sino tambin de la precisin de la estimacin, los investigadores optan por el mtodo de estimacin por intervalo o intervalos de confianza. Un intervalo estimador es lo que su propio nombre indica, un intervalo aleatorio, cuyos puntos extremos L 1 y L 2 son estadsticos. Esto se utiliza para determinar un intervalo numrico a partir de la muestra. Se espera que este contenga el parmetro de la poblacin que est siendo estimado. Si se ampla el intervalo, se gana error, se pierde confianza. Un intervalo de confianza de del 95% es tal que: . Decir que un intervalo es un intervalo de confianza del 95% de significa que, cuando se utiliza un muestreo repetido de la poblacin, el 95% de los intervalos resultantes deber contener a ; debido al azar, el 5% no incluir la verdadera media poblacional. El grado de confianza deseado es controlado por el investigador.

Ejemplo Hallemos un intervalo de confianza, del 95%, de , nmero medio de microgramos de partculas en suspensin por metro cbico de aire, sobre la base de una muestra aleatoria de tamao 5 dada en la que se ha calculado que una estimacin puntual de es . Supongamos que por experiencias anteriores se sabe que , nmero de microgramos de partculas en suspensin por metro
18

cbico de aire, est normalmente distribuido, con varianza . Queremos extender la estimacin puntual a un intervalo, de forma talque podamos tener una confianza del 95 % de que el intervalo obtenido contenga al verdadero valor de . Es decir, queremos determinar As: y de forma que

Para hacerlo as, consideremos la particin de la curva normal tipificada dibujada en la siguiente figura:

Particin de Z para obtener un intervalo de confianza de del 95 %

Puede verse que podemos concluir que

. En este caso,

, por tanto,

Veamos que los lmites superior e inferior del intervalo de confianza del 95% son:

19

Puesto que se supone que observados por la muestra

es 9, y son

, son estadsticos. Sus valores

Puesto que este intervalo se obtuvo usando un procedimiento que, en muestreos repetidos, contendr a la media en un 95% de confianza de que est verdaderamente entre 58.37y 63.63:

58.37 = 61 - 2.63 61 61 +2.63 = 63.63 Dos observaciones son evidentes a partir de esta frmula: La primera es que cada intervalo de confianza est centrado en La segunda es que la amplitud del intervalo depende de tres factores : La confianza deseada. La desviacin estndar El tamao muestral

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL Y LA DISTRIBUCIN DE T En la mayora de los casos, el estudio estadstico que interesa se hace por primera vez, por lo que no hay una forma de conocer previamente cul es la media o la varianza de la poblacin en cuestin. Entonces, consideraremos ahora hacer inferencia sobre una media poblacional cuando se considera que la varianza de la poblacin es desconocida .

S Donde S es la desviacin entandar muestral


20

Z tiene como parmetros a

ya

T tiene como parmetro a v grados de libertad El nmero de grados de libertad implicados en la bsqueda de un intervalo de confianza de cuando no se conoce es n-1. La distribucin T es el cociente entre una variable aleatoria con una Distribucin normal tipificada (z) y la raz cuadrada de otra variable aleatoria (independiente de la anterior) con su Distribucin ji cuadrado de v grados de libertad dividida por sus grados de libertad: t= Esta distribucin solo depende de un parmetro, los grados de libertad, y est definida entre - y + . Existen tantas distribuciones de t de studentFisher como grados de libertad haya. Grados de libertad: El nmero de maneras en que los datos pueden variar libremente. La funcin de Distribucin se encuentra en la Tabla C (Anexos). En la columna izquierda se encuentran los grados de libertad y en la fila del encabezado se encuentra las probabilidades pertinentes y los puntos asociados con estas probabilidades estn situados en el cuerpo de la tabla.

ENTRE MS GRADOS DE LIBERTAD TIENE LA CURVA DE T SE APROXIMA A LA CURVA NORMAL TIPIFICADA

Tpica relacin entre una curva T y una curva normal tipificada Ejemplo: El valor t con v =14 grados de libertad que tiene un rea de 0.025 a la izquierda, y por lo tanto un rea de 0.975 a la derecha, es:

21

Ejemplo:Encuentre Dado que tiene un rea de 0.05 a la derecha, y 0.025 a la izquierda, se tiene un rea total de: tiene un rea de De aqu que,

ESTIMACIN DE UNA PROPORCION El mejor estimador de la proporcin (p) de una caracterstica de una poblacin es la proporcin observada (p o ) en una muestra, que se corresponde con la frecuencia relativa de una caracterstica en la muestra. Si obtenemos distintas muestras de tamao n de una poblacin con una proporcin p de una determinada caracterstica, los distintos valores de las proporciones observadas no son todos ellos iguales y es necesario, por lo tanto, averiguar qu distribucin siguen. Se puede afirmar que la distribucin de este estimador es una distribucin normal de media p y varianza pxq/n, cuando el tamao de la muestra es suficientemente grande. Donde q al ser el complementario de p, vale 1-p .

INTERVALO DE CONFIANZA DE UNA PROPORCION Al seguir esta variable p una distribucin normal, se puede calcular un intervalo que contenga entre sus lmites una gran proporcin de los valores de la variable p :

22

p Distribucin de intervalos de proporciones Ejemplo. En un estudio para el estado de la salud oral de una ciudad, se toma una muestra aleatoria de 280 hombres entre 35 y 44 aos, y se estudia la variable nmero de dientes en la boca. Se desea realizar la estimacin por intervalo de confianza del 0.95 de la proporcin de individuos de esta ciudad con 28 dientes o ms, considerando este valor como denticin completa. Luego del examen clnico se encontr que hay 70 individuos con 28 diente o ms dientes. La estimacin puntual de p es p o siendo: p o = 70/280 = 0,25, que representa el 25% de los individuos con denticin completa. Sabiendo que q o =1 - p o = 1 - 0,25 = 0,75, y consultando el anexo B de la distribucin normal tipificada, se encuentra que el valor de se obtiene: para una confianza del 0,95 es de 1.96,

De manera que, el intervalo de confianza del 0.95 de la proporcin de hombres con denticin completa esta entre 0.1933 0.3007; es decir, que existe una probabilidad del 0,95% de que este intervalo contenga entre sus lmites el valor de p.

ERROR DE ESTIMACION Como se desea que este error sea lo menor posible, interesa saber si es menor que una cierta cota que se suele expresar en trminos de la desviacin estndar del estimador: Cota para el error de estimacin. c .

Sin embargo, conociendo las caractersticas de la distribucin de , se puede calcular la probabilidad de que | | < c , es decir,
23

Ahora bien, no se puede saber si |

| < c

Por ejemplo, si c = 1.96 y suponiendo que la distribucin de es normal, P(| | < 1.96 ) = 0.95

P(|

| < c )

muestra de tamao n = 50 y se obtiene x = 9.1, s = 0.24. Dar una estimacin evaluar la exactitud de la estimacin con c = 1.96.

Estimador x (insesgado E( x normal si el tamao de la muestra es grande). Cota para 1.96 x Como P(| x
n 1.96 s / n = 1.96 0.24 /

50 0.07.

x ) = 0.95 P(| x

) = 0.95

podemos decir que la probabilidad de que el error de estimacin sea menor que 0.07 es de 95%. En la siguiente figura aparece el rea correspondiente. Estimacin del riesgo Se debe estimar la frecuencia con que se presentarn los riesgos identificados, as como tambin se debe cuantificar la probable prdida que ellos pueden ocasionar. Una vez identificados los riesgos al nivel de organismo y de programa/actividad, debe procederse a su anlisis. Los mtodos utilizados para determinar la importancia relativa de los riesgos pueden ser diversos, e incluirn como mnimo:

una estimacin de su frecuencia, o sea la probabilidad de ocurrencia. una valoracin de la prdida que podra resultar.

En general, aquellos riesgos cuya concrecin est estimada como de baja frecuencia, no justifican preocupaciones mayores. Por el contrario, los que se estima de alta frecuencia deben merecer preferente atencin. Entre estos extremos se encuentran casos que deben ser analizados cuidadosamente, aplicando elevadas dosis de buen juicio y sentido comn. Existen muchos riesgos dificultosos de cuantificar, que como mximo se prestan a calificaciones de "grande", "moderado" o "pequeo". Pero no debe cederse a la difundida inclinacin de conceptuarlos rpidamente como "no medibles". En muchos casos, con un esfuerzo razonable, puede conseguirse una medicin satisfactoria.

24

Esto se puede expresar matemticamente en la llamada Ecuacin de la Exposicin: PE = F x V en donde: PE = Prdida Esperada o Exposicin, expresada en pesos y en forma anual. F = Frecuencia, veces probables en que el riesgo se concrete en el ao. V = Prdida estimada para cada caso en que el riesgo se concrete, expresada en pesos. TAMAO DE LA MUESTRA En estadstica el tamao de la muestra es el nmero de sujetos que componen la muestra extrada de una poblacin, necesarios para que los datos obtenidos sean representativos de la poblacin. La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las caractersticas que definen a la poblacin de la cual fue extrada, indicando que es representativa. Es decir, que para hacer una generalizacin exacta de una poblacin, es necesario tomar una muestra representativa. Por lo tanto, la validez de la generalizacin depende de la validez y tamao de la muestra. No obstante, cuando se trabaja con muestras, generalmente se presentan dos tipos de errores:

CONSTRUCCION DE UN INTERVALO DE CONFIANZA En estadstica, se llama intervalo de confianza a un par o varios pares de nmeros entre los cuales se estima que estar cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parmetro poblacional. La probabilidad de xito en la estimacin se representa con 1 - y se denomina nivel de confianza. En estas circunstancias, es el llamado error aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar en la estimacin mediante tal intervalo.1 El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa, aumentan sus posibilidades de error. Para la construccin de un determinado intervalo de confianza es necesario conocer la distribucin terica que sigue el parmetro a estimar, . Es habitual que el parmetro presente una distribucin normal. Tambin pueden construirse intervalos de confianza con la desigualdad de Chebyshev.

25

En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un parmetro poblacional que sigue una determinada distribucin de probabilidad, es una expresin del tipo [1, 2] tal que P[1 2] = 1 - , donde P es la funcin de distribucin de probabilidad de .

Intervalo de confianza para la media de una poblacin De una poblacin de media y desviacin tpica se pueden tomar muestras de elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional:2 Pero adems, si el tamao de las muestras es lo suficientemente grande, 3 la distribucin de medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con media y una desviacin tpica dada por la siguiente expresin: . Esto se representa como sigue: . Si estandarizamos,

se sigue que: En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 z z2] = 1 - , donde (1 - )100 es el porcentaje deseado (vase el uso de las tablas en una distribucin normal). Se desea obtener una expresin tal que En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se encontrar la media poblacional si slo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamar (debido a que es el error que se cometer, un trmino opuesto). Para ello se necesita calcular el punto estandarizada o, mejor dicho, su versin

o valor crtico junto con su "opuesto en la distribucin"

. Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:

26

Dicho punto es el nmero tal que:

Y en la versin estandarizada se cumple que:

As:

Haciendo operaciones es posible despejar

para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:

Obsrvese que el intervalo de confianza viene dado por la media muestral producto del valor crtico Si no se conoce por el error estndar .

el

y n es grande (habitualmente se toma n 30):4

, donde s es la desviacin tpica de una muestra. Aproximaciones para el valor para los niveles de confianza estndar son 1,96 para y 2,576 para .5
27

Intervalo de confianza para una proporcin El intervalo de confianza para estimar una proporcin p, conocida una proporcin muestral pn de una muestra de tamao n, a un nivel de confianza del (1-)100% es:

En la demostracin de estas frmulas estn involucrados el Teorema Central del Lmite y la aproximacin de una binomial por una normal.6

28

CONCLUSION La inferencia estadstica o estadstica inferencial se refiere a un conjunto de mtodos mediante los cuales podemos hacer afirmaciones con respecto a una poblacin completa a partir nicamente de la observacin de una parte de ella. Dos formas bsicas para realizar inferencia estadstica son la estimacin y el contraste de hiptesis, tambin llamado "prueba de hiptesis". Una hiptesis estadstica es una afirmacin con respecto a una distribucin de probabilidad (por ejemplo, podramos decir que un cierto fenmeno se comporta de forma que puede explicarse por una distribucin binomial). En particular, una hiptesis estadstica puede ser una afirmacin con respecto a un parmetro (si sabemos que la distribucin es binomial, entonces podramos establecer la hiptesis de que la probabilidad de xito es p = 0.5). Un contraste estadstico de hiptesis es un procedimiento mediante el cual se compara lo propuesto por una hiptesis contra la evidencia emprica que proporciona la observacin de datos provenientes de la poblacin sobre la cual se hace la hiptesis. El ttulo que se ha dado a esta discusin tiene qu ver con una cuestin bsica en el contraste de hiptesis, por la cual podra considerarse que no es muy adecuado el nombre prueba. Lo anterior, porque este sustantivo podra dar al lector la impresin de que el procedimiento implica certeza, lo cual en estadstica desde luego difcilmente se tiene.

29

BIBLIOGRAFIA http://es.wikipedia.org/wiki/Intervalo_de_confianza

http://es.wikipedia.org/wiki/Intervalo_de_confianza

30

También podría gustarte