Está en la página 1de 30

UNIVERSIDAD SERGIO ARBOLEDA METODOS ESTADISTICOS Estadstico Isaac Huertas Forero Septiembre de 2006 Objetivos: Manejar informacin aplicando

las Tcnicas Estadsticas apropiadas para comprender y analizar datos obtenidos en una muestra representativa de una poblacin y realizar inferencias para toma de decisiones. Producto a Obtener: El buen uso de las herramientas estadsticas y manejo de datos en forma terica, aplicada con el uso de una ayuda computacional (Excell o SPSS). Sistema de Evaluacin: Dos parciales cada uno del 15%, el 70% restante Talleres y manejo de tcnicas computacionales aplicado a la estadstica. Contenido 1 Sesin 2 Sesin 3 Sesin 4 Sesin : : : Anlisis descriptivo de los datos Medidas de dispersin Taller Manejo Paquete SPSS Conceptos de Probabilidad Variables aleatorias Tipos de Distribucin Discreta Binomial, Poisson, Hipergeometrica Taller Distribucin continua Normal Distribuciones Muestrales, taller Estimacin e Hiptesis Regresin y correlacin, taller Muestreo, taller Grficos de Control Grficos de Control

5 Sesin 6 Sesin 7 Sesin 8 Sesin 9 Sesin 10 Sesin

: :

: : :

1. CONCEPTOS FUNDAMENTALES DE LA ESTADISTICA 1.1. DEFINICIONES DE LA ESTADISTICA Alexander M. Mood, profesor universitario norteamericano, define a la Estadstica como la tecnologa del Mtodo Cientfico, ya que proporciona instrumentos para la toma de decisiones cuando prevalecen condiciones de incertidumbre. Deber adoptarse esta definicin, ms que como de Estadstica, de Estadstica aplicada. El profesor escandinavo, Harald Crmer, presenta la siguiente definicin La Estadstica es una ciencia basada en el Clculo de probabilidades, cuyo objetivo fundamental consiste en investigar la posibilidad de extraer de los datos estadsticos, inferencias vlidas, elaborando mtodos mediante los cuales puedan ser obtenidas dichas inferencias. Leo Dugu de Bernonville, profesor francs, la define como la ciencia que se dedica al estudio numrico de fenmenos colectivos. Estudio que comprende la observacin de los hechos, su correcta ordenacin y adecuada clasificacin y su anlisis y tiene como fin principal el descubrimiento de caractersticas o propiedades de tipo general, que se aplica a los elementos del colectivo en su conjunto, pero no necesariamente a todos y cada uno de ellos. 1.2. CARACTERISTICAS DEL METODO ESTADISTICO A partir de las definiciones anteriores, se puede colegir las siguientes caractersticas del mtodo estadstico: Es LOGICO y su lgica esta basada en la llamada ley de los grandes nmeros, la cual expresada en trminos no formales, dice que entre mayor sea el nmero de hechos que se observan, ms exactas sern las conclusiones que se obtengan y en la llamada Ley de seguridad de frecuencias referida la hecho de que si se realizan repeticiones u observaciones sucesivas e incrementadas de un fenmeno, la frecuencia relativa de algn suceso de inters, tiende a estabilizarse alrededor de un valor, el cual corresponder a la probabilidad de tal suceso. Es conveniente anotar, a propsito de esta caracterstica, que la Estadstica no es exacta y como sucede en este tipo de ciencias, trata de lograr la mayor exactitud posible o sea el mayor acercamiento a la verdad. El proceso de razonamiento que utiliza la Estadstica para alcanzar sus objetivos de aplicabilidad es el INDUCTIVO y para su desarrollo propio el DEDUCTIVO. Por su misma naturaleza, el mtodo estadstico es NUMERICO. Todo estudio estadstico siempre conlleva algn tratamiento numrico de la informacin, as sea el elemental de contar.

Est referido siempre a FENOMENOS COLECTIVOS o como algunos autores sugieren, a AGREGADOS; como un Mtodo Cientfico, solo le, interesa el hecho numeroso, los resultados que se obtienen no se pueden aplicar en forma particular o individual; siempre es GENERALIZANTE. Naturalmente el mtodo estadstico es OBJETIVO, en la misma forma en que se habla de objetividad en el Mtodo Cientfico. Es esta una caracterstica que algunos usuarios de supuestos procesos estadsticos , han desacreditado al manipular, en el peor sentido de una palabra, informacin numrica para comprobar o demostrar as, verdades predeterminadas o mostrar realidades distorsionadas. Como conclusin de esta caracterizacin de la Estadstica y siguiendo a Mood, es conveniente tener presente que el fin ltimo de la Estadstica, su objetivo mediato, es colaborar con el Mtodo Cientfico en procesos de TOMA DE DECISIONES, cuando prevalecen condiciones de RIESGO Y/O INCERTIDUMBRE, 1.3. CLASIFICACION DE LOS METODOS ESTADISTICOS Para su desarrollo y aplicacin la Estadstica utiliza diversos procedimientos, los cuales puede clasificarse de la siguiente manera, no exhaustiva ni necesariamente excluyente: METODOS DESCRIPTIVOS: Cuando las conclusiones que se obtienen de las experiencias o datos en estudio, se rebasan de los limites de los mismos. Tiene como objetivo fundamental su presentacin a anlisis como paso previo a los procesos inferenciales. METODOS INDUCTIVOS O INFERENCIA ESTADISTICA: cuando las conclusiones que se obtienen de los datos en estudio, rebasan los lmites de los mismos. Implica en general, el tomar decisiones en el caso ms universal del cual forman parte los datos. El proceso de tomar decisiones en situaciones generales, sobre la base de una informacin incompleta contenida en algunos datos, es arriesgado y no puede realizarse con certeza absoluta sino con incertidumbre. Sin embargo esta ltima no es total, pueden controlarse sus niveles, puede medirse su magnitud, lo cual se lleva a cabo con base en el CLCULO DE PROBABILIDADES. METODOS TEORICOS O TEORIA ESTADISTICA: S e est ante la misma cuando se aborda el estudio de los fenmenos estadsticos, utilizando los mtodos matemticos en toda su plenitud. Esto no supone, sin embargo, que la Estadstica sea una rama de las Matemticas, sino que al igual que otras ciencias (Fsica, Economa, Qumica, etc.), la utiliza como instrumento, y as mientras en la

Matemtica Pura se permanece en el terreno de lo conceptual, en estas ciencias es preciso que las conclusiones se ajusten a la realidad, pues de lo contrario no sirven. 1.4. SISTEMA CONCEPTUAL BSICO 1.4.1. El Colectivo, Agregado, Poblacin, Universo El objeto de estudio de la Estadstica son los llamados fenmenos colectivos para los cuales, el comportamiento de una serie de caractersticas, est afectado por la casualidad o la aleatoriedad; tambin se les conoce con el nombre de agregados, poblaciones o universos. Como COLECTIVO O AGREGADO deben entenderse no solo los colectivos humanos, sino cualquier de hechos numerosos de la misma naturaleza, cualquiera que ella sea, que presentan ciertas caractersticas o modalidades distintivas, cuyo comportamiento generalizado y/o posible relacin son objeto de estudio. Como POBLACIN, se define a un conjunto de medidas obtenidas al observar alguna caracterstica de inters en los elementos del colectivo, la que indica que con un mismo colectivo pueden, en general, estar asociadas varias poblaciones. Algunos autores definen el concepto de UNIVERSO, como un colectivo terico, bsico para el desarrollo de la Teora Estadstica. Es necesario anotar que casi siempre se utilizan los trminos citados como sinnimos, sin que tenga un consenso aceptado en general, sobre el uso de los mismos. 1.4.2. Las Variables Se define cono una VARIABLE, a una caracterstica observable o a un aspecto discernible en un objeto de estudio, que puede adoptar diferentes valores o expresarse en varias categoras, o a una caracterstica observable ligada, con una relacin determinada, a otros aspectos observables. Desde el punto de vista de su naturaleza, se habla de variables CUALITATIVAS para referirse a aquellas cuyos elementos de variacin tiene un carcter cualitativo, no susceptible de observacin medible numricamente y de varias CUANTITATIVAS como aquellas cuyas propiedades pueden presentarse en diversos grados o intensidades de carcter numrico. De acuerdo con su naturaleza matemtica, se diferencian las variables cuantitativas en DISCRETAS Y CONTINUAS, siendo las primeras aquellas que estn definidas sobre recorridos finitos o infinitos numerables; no pueden tomar valores intermedios entre dos valores dados. Las continuas son aquellas definidas

sobre recorridos infinitos no numerables; pueden tomar cualquier valor dentro de un recorrido dado. Para clasificar o categorizar variables, se utilizan diferentes tipos de escalas, siendo las ms comunes las NOMINALES, las ORDINALES, las DE INTERVALO, y las DE RAZON, cuyo uso depende bsicamente de los objetivos del estudio y de la naturaleza de la variable. 1.4.3. Escalas de Medicin o Clasificacin 1.4.3.1. La Medicin El papel que desempea la medida y la cantidad en la Ciencia es muy grande, pero creo que a veces se ha exagerado. La tcnica matemtica es poderosa, y los hombres de ciencia estn naturalmente ansiosos de aplicarla siempre que sea posible; pero una ley puede ser muy cientfica sin ser cuantitativa Rusell. La generalizacin cientfica es siempre y necesariamente cuantitativa: Lundberg Cuando uno puede medir y expresar numricamente lo que dice, conoce algo de ello; pero mientras no pueda medir ni expresarse en nmeros, su conocimiento es escaso y poco satisfactorio: Lord Kelvin Contar hechos observables es la operacin bsica de la medicin. Contar o computar es establecer una correspondencia biunvoca entre el conjunto de objetos que hay que contar y un subconjunto de los enteros positivos para una coleccin de hechos sea empricamente contable, tiene que consistir en miembros empricamente distinguibles: Bunge Las citas anteriores, algunas de ellas demasiado extremas, son evidencia de la importancia para los tratadistas de la ciencia, la metodologa cientfica y la investigacin, tiene la medicin y la cuantificacin. Pero es conveniente tratar de responder a la inquietud relativa a si estos conceptos significan los mismo, si tiene la misma acepcin y aplicacin. El sentido ms corriente y elemental, el concepto de medir es utilizado para significar la asignacin de valores numricos o dimensiones a un objeto u objetos mediante la utilizacin de determinados procedimientos. En trminos ms estrictamente metodolgicos, la medicin consiste sustancialmente en una observacin cuantitativa, atribuyendo un nmero a determinadas caractersticas o rasgos del hecho o fenmeno observado. Esto no presenta mayores inconvenientes si se trata de medir aspectos materiales y morfolgicos de los objetos de estudio; la dificultad aparece cuando se desea expresar numricamente aspectos ms evanescentes e intangibles.

El proceso de medicin tiene como propsito inicial distinguir y por ende clasificar objetos, casos, fenmenos y debe responder a una serie de principios o requisitos que se enuncian a continuacin. En primer lugar el proceso de medicin debe ser vlido, entendindose que cumple este requisito cuando mide de alguna manera demostrable aquello que trata de medir, libre de distorsiones sistemticas. Cabe anotar que existen diferentes mtodos de validacin, a saber: La validez pragmtica, consiste en encontrar un criterio exterior al instrumento de medida, para relacionarlo con las puntuaciones obtenidas. La validez predictiva, que se comprueba por los resultados obtenidos en el futuro, y la validez concurrente, que contrasta resultados de otros elementos de juicio, con tipos de validez pragmtica. Otro procedimiento de validacin es el anlisis factorial, aunque su aplicacin se limita principalmente a los aspectos psicosociales. El segundo principio deseable en la medicin es la fiabilidad. Una medicin es confiable o segura cuando aplicada repetidamente a un mismo individuo o grupo, o al mismo tiempo por investigadores diferentes, proporciona resultados iguales, o por lo menos parecidos. La determinacin de la confiabilidad consiste pues, en establecer si las diferencias de resultados se deben a inconsistencias en la medida. El problema de la fiabilidad se presente en el instrumental que se utiliza, cuando la validez de las mediciones ofrece dudas en relacin con lo que se quiere medir. Los procedimientos ms usuales para la determinacin de la fiabilidad son el anlisis de la estabilidad de los resultados, mediante la aplicacin de mediciones repetidas y la equivalencia de los resultados cuando los instrumentos son administrados por diferentes personas. Finalmente se tiene el principio de la precisin. Se puede decir que una medicin es precisa cuando localiza con exactitud satisfactoria, en relacin con el propsito que se busca, la posicin del fenmeno que se estudia. El nivel de medida o escala de medida, expresiones aceptadas casi universalmente, est formado por un conjunto de numerales distintos y un conjunto de modalidades distintas relacionadas biunvocamente. Se suelen distinguir cuatro niveles de medicin quedan lugar a cuatro de escalas: nominal, ordinal o de orden jerrquico, de intervalos y de razn o cociente. Ahora bien, el tipo de escala estar dado, segn sea verificable uno u otro tipo de relacin.

1.4.3.2. La Escala Nominal

Consiste en clasificar objetos o fenmenos, segn ciertas caractersticas, tipologas o nombres, dndoles una denominacin o smbolo, sin que implique ninguna relacin de orden, distancia o proporcin entre los objetos o fenmenos. La medicin se da a un nivel elemental cuando los nmeros u otros smbolos se usan para la distincin y clasificacin de objetos, persona o caracterstica. Cuando se utilizan nmeros para representar las diferentes clases de una escala nominal, estos no poseen propiedades cuantitativas y sirven solamente para identificar las clases. 1.4.3.3. La Escala Ordinal Llamada tambin escala de orden jerrquico, con ella se establecen posiciones relativas de los objetos o fenmenos de estudio, respecto a alguna caracterstica de inters sin que se reflejen distancias entre ellos. Puede suceder que los objetos de una categora de la escala, sino estn relacionados entre si. Los numerales empleados en las escalas ordinales no son cuantitativos, sino que indican exclusivamente la posicin en la serie ordenada y no cual es la diferencia entre posiciones sucesivas de la escala. 1.4.3.4. La Escala de Intervalo Representa un nivel de medicin ms preciso, matemticamente, hablando, que las anteriores; no solo se establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide tambin la distancia entre los intervalos o las diferentes categoras o clases. En este caso, la medicin se ejecuta en el sentido de una escala de intervalo; esto es, si la asignacin de nmeros a varias clases de objetos es tan precisa que se sabe la magnitud de los intervalos (distancias) entre varias clases de objetos es tan precisa que se sabe la magnitud de los intervalos. Una escala de intervalo est caracterizada por una unidad de medida comn y constante que asigna un nmero real a todos los pares de objetos en un conjunto ordenado. En esta clase de medida, la proporcin de los intervalos cualquiera es independiente de la unidad de medida y del punto cero. Es una escala de intervalo, el punto cero y la unidad de medida son arbitrarios. 1.4.3.5. La Escala de razn Cuando una escala tiene todas las caractersticas de una escala de intervalo y adems un punto cero real en su origen, se llama escala de razn. Adems de distincin, orden y distancia, sta es una escala que permite establecer en que proporcin es mayor una categora de una escala que otra. El cero absoluto o natural representa la nulidad de lo que se estudia.

1.4.4. El Censo o Enumeracin Completa Un censo o enumeracin completa consiste en desarrollar los estudios estadsticos, identificando y ubicando a TODOS los elementos del colectivo o agregado, para obtener de ellos la informacin necesaria sobre las variables de inters, con el fin de analizarla e interpretarla. Este mtodo presenta las siguientes caractersticas: No requiere de procesos de inferencia estadstica. Sus resultados sirven de marco muestral a otros estudios. Facilita la realizacin de estudios en subcolectivos. Produce costos demasiados altos, en todo tipo de recursos. Implica un complicado proceso de planeacin, organizacin y control. En general los resultados se obtienen a mediano o largo plazo, perdiendo oportunidad y actualidad. No permite la realizacin de estudios con altos niveles de especificidad y desagregacin. En algunos casos, la naturaleza del estudio impide la realizacin del censo, por requerir procesos de observacin de caractersticas de estudio, mediante mtodos parcial o totalmente destructivos de los elementos del agregado.

Las desventajas del mtodo censal, no implica necesariamente que nunca se pueda realizar estudios censales, por el contrario cuando las circunstancias lo permitan puede existir objetivos de tipo muy global, agregados relativamente pequeos y fcilmente ubicables, recursos suficientes, etc., se debe utilizar este tipo de enumeracin. 1.4.5. El Muestreo Para resolver los problemas que en general se presentan para realizar censos, se ha desarrollado el mtodo de muestreo, el cual de manera sencilla puede definirse como un mtodo cientfico que pone en prctica principios estadsticos matemticos, que permiten obtener informacin de una PARTE de los elementos del agregado y hacer inferencias acerca de las caractersticas estudiadas, para todo el colectivo de origen. Las principales caractersticas son: Costos en general ms bajos que en el censo. Planeacin, organizacin y control ms sencillos y detallados. Resultados a corto plazo y oportunos. Posibilidad de realizar estudios ms detallados, al permitir la obtencin de informacin a nivel ms especifico. Solucin de los problemas ocasionados por procesos de medicin destructivos.

Flexibilidad, que permite utilizar diferentes formas de medicin, anlisis e inferencia. - Requiere de procesos de inferencia estadstica. - Dificulta, en algunos casos, los estudios desagregados en subcolectivos. - No es aceptado, en algunas instancias, sobre todo por la falta de conocimiento de sus bondades. La parte de elementos que es seleccionada para el estudio, es conocida como LA MUESTRA y par que el proceso tenga validez, esta debe tener caractersticas de confiabilidad con respecto al agregado del cual procede. En procura de tal confiabilidad, se han desarrollado diferentes tipos de DISEO MUESTRAL, que consiste en: Determinar el tamao de la muestra. Determinar el proceso de seleccin de la misma. Determinar los procesos de inferencia.

1.4.6. Los parmetros y las Estadsticas Los resultados de estudios y anlisis estadsticos, se reflejan bsicamente en un conjunto de diversas medidas de diferente ndole y naturaleza. Cuando tales medidas son resultado de una enumeracin completa o sea que se refieren a todo el agregado, reciben el nombre de PARAMETROS y cuando son de nivel muestral se les conoce como ESTADISTICAS O ESTADIGRAFOS. Por ser las muestras seleccionadas en general por mtodos de azar, las estadsticas o estadgrafos se constituyen en variables aleatorias, para cuyo manejo ser necesario conocer o deducir, el comportamiento probalistico de las mismas. Constituyen los anteriores conceptos, el conjunto bsico del lxico estadstico, especialmente relativos a lo que se debe ser una introduccin a cualquier curso inicial de Estadstica. Conceptos ms especficos, van apareciendo en la medida en que se presentan otros mtodos, tcnicas y procesos analticos de esta ciencia. 1.5. DETERMINACION DEL MARCO DE MUESTREO 1.5.1. Definicin Se entiende por Marco de Muestreo o Marco Muestral, todo artificio o conjunto de artificios, que permita la identificacin y ubicacin de todos y cada uno de los elementos de la poblacin o en su defecto, de todas y cada una de las unidades muestrales, ya que es la base del proceso de seleccin de muestra.

Los factores relevantes de la naturaleza del marco disponible o factible, incluyen los tipos de unidades muestrales que contenga, la extensin de la cobertura, la exactitud y completez del mismo, la cantidad y la calidad de informacin auxiliar en l y es determinante para el diseo de la muestra. Algunos de marcos son listas de elementos, archivos, mapas, cartogramas, krdex, dispositivos de entrada -salida en sistemas de computacin, etc. 1.6. DEFINICIONES DE UNIDADES En trminos generales son normas o patrones de conteo, medicin, seleccin u observacin y su definicin es fundamental en el estudio, por lo cual debe hacerse tambin muy clara, concreta y unificadamente. Se distinguen y es necesario definirlas en los correspondientes casos, los tipos de unidades que a continuacin se presentan. 1.6.1. Unidad Poblacional Tambin conocidas como las unidades elementales, corresponden al elemento o hecho individual que se cuenta y/o mide y que unido a los dems de su misma naturaleza, forma el colectivo que se estudia. Su naturaleza y caractersticas se determinan segn los objetivos de estudio. 1.6.2. Unidad Muestral Se constituye en el elemento bsico para la seleccin de la muestra de unidades poblacionales. Pueden ser estas mismas o grupos de ellas, como sucede en el muestreo por conglomerados. Deben esta definidas en forma tal que cada unidad poblacional pertenezca a una y solo una unidad de muestreo. Se subdividen en unidades parciales, que son aquellas que aparecen en razn del proceso de seleccin y constituyen siempre subdivisiones de la poblacin a travs de las cuales ha de pasarse, antes de llegar a la unidades finales, definidas estas ltimas como aquellas que tienen caractersticas definidas de permanencia y son fcilmente distinguibles en periodos ms o menos largo de tiempo. 1.6.3. Unidades de Observacin Son aquellos elementos los cuales se obtiene la informacin, por cual se les conoce tambin con los nombres de fuentes de informacin. Pueden coincidir o no con la unidad poblacional y son determinantes para la calidad de la informacin y para el proceso de recoleccin de la misma. 1.7. DETERMINACION DEL DISEO MUESTRAL

Definidos claramente los objetivos del estudio y la poblacin, determinando el marco muestral y los recursos disponibles y definidas as mismo las diversas unidades del proceso, se puede pasar a la fase de seleccin del tipo de diseo muestral a utilizar, aunque en la prctica todas estas etapas se desarrollen paralelamente. Para determinar el tipo de seleccin se tiene en cuenta principalmente, los objetivos del estudio, la estructura de la poblacin, el marco y los recursos disponibles (humanos, financieros, materiales, de disponibilidad de tiempo, etc.). Para el tamao de la muestra se deben considerar los siguientes aspectos: tipo de seleccin, grado de confiabilidad de los procesos inferenciales, errores de muestreo, recursos disponibles, caractersticas bsicas a analizar y tamao de la poblacin. Se suele hacer una gran clasificacin de los tipos de diseo muestral, en dos categoras que son Muestreo No Probalistico y el Muestro Probalistico. 1.7.1. Muestreo No Probalistico Se caracteriza porque el diseo se realiza en forma subjetiva, arbitraria segn el criterio del investigador o del entrevistador de campo. No existe una oportunidad real de que un elemento en particular de la poblacin, sea seleccionado. no es posible, por lo tanto, calcular el error de muestreo, ni la confiabilidad de las inferencias. Se est simplemente en el campo de las especulaciones y las suposiciones. Algunas modalidades de este tipo de muestreo son: El muestreo de convivencia, que se caracteriza por que en general la unidad de muestreo se auto-selecciona o se ha seleccionado debido a su fcil disponibilidad. En estos casos no se especifica claramente la poblacin de la cual se ha tomado la muestra, por lo cual se desconoce la diferencia entre el valor de inters de la poblacin y el valor de la muestra, en trminos de tamao y direccin. Desafortunadamente es un muestreo moderadamente en la prctica. Muestreo de comparacin, para el cual los elementos son seleccionados con base en lo que algn experto piensa a cerca de lo que esas unidades pueden a portar a la investigacin, por lo cual se les conoce tambin como muestras por expertos. Es este caso se desconoce tambin el error de muestreo y la confianza, pero si el criterio y tica del experto son vlidos, la muestra puede resultar mejor que la de convivencia. Se utiliza este tipo de muestreo moderadamente en la prctica. El muestreo por cuotas, que puede considerarse ms un mtodo de seleccin que un tipo de diseo. El tamao de la muestra y los procesos de inferencia se realizan en forma tcnica, pero les elementos para la muestra son seleccionados en forma subjetiva, pero con arreglo a ciertas caractersticas de control previamente

determinadas. Es un mtodo de seleccin muy til en las etapas previas de la investigacin y si se elabora con cuidado, puede suministrar informacin ms definitiva.

1.7.2. Muestreo Probalistico Se fundamenta en la probabilidad que tiene cada elemento del agregado para hacer parte de la muestra. Dadas ciertas condiciones de confiabilidad, error mximo admisible y tamao poblacional, se deja al azar el diseo de la muestra. El muestreo se realiza mediante reglas estadsticas que no permiten ningn elemento de juicio al investigador, generando muestras ms objetivas. Permite medir la confiabilidad de los procesos de inferencia y el error de muestreo que por su naturaleza conlleva. Presenta tambin diversas modalidades, siendo las ms clsicas el muestreo aleatorio simple, el muestreo estratificado y el muestreo por conglomerados. 1.8. RECOLECCION DE INFORMACION Se define como el proceso estadstico mediante el cual se obtiene toda la informacin pertinente a un problema dado. Para llevar a cabo esta tarea de recopilacin de datos e informacin, existen mltiples procedimientos y la utilizacin de uno u otro, depende de la naturaleza del problema a estudiar, del equipo de investigacin disponible y de la estructura y caractersticas de las unidades de observacin. El trminos globales se consideran dos situaciones bsicas, que dependen del estado de la informacin y que implican dos tipos de tareas diferentes a saber: Recopilacin de datos sobre el terreno (informacin primaria) Identificacin y recoleccin de datos ya disponibles para posterior utilizacin (informacin secundaria)

En el primer caso el procedimiento se basa en la utilizacin de formularios estadsticos, definidos como un instrumento de recopilacin de datos, rigurosamente estructurado, que traduce y operacionaliza determinados problemas que son objeto de estudio. Aunque existen diferentes formas de aplicarlo, estas se pueden resumir fundamentalmente en dos que son: la entrevista personal y el formulario postal; modificaciones de estas dos formas bsicas, generan otras.

En la segunda situacin, el proceso se reduce a la llamada recopilacin documental, para lo cual lo importante es la determinacin de la calidad y la confiabilidad de la informacin a ser utilizada en estudio. Al igual que todas las anteriores, esta fase es de gran importancia para la investigacin, pues genera la materia prima para su desarrollo, lo cual son los datos, existen diversas tcnicas y recomendaciones respecto a la manera de realizar este proceso, que hacen referencia desde la forma y tipos de preguntas, hasta la presentacin personal del encuestador en el caso de la entrevista personal. 1.9. TRATAMIENTO DE LA INFORMACION Cuando un investigador conduce un estudio, rene una gran cantidad de informacin numrica o datos acerca del problema en cuestin. Los datos podrn tener variedad de formas y su expresin original, tal cual son recopilados, son usualmente un enredo de recuentos, mediciones, etc. Al realizar la funcin descriptiva, la estadstica formula reglas y procedimientos para la depuracin, clasificacin, presentacin y reduccin de los datos, de tal manera que sean tiles para su anlisis e interpretacin. Es necesario depurar los datos, ordenarlos, clasificarlos y reducirlos a cifras relativas como los porcentajes, los promedios, los coeficientes estadsticos y en general las medidas bsicas de inters. 1.9.1. Distribucin de Frecuencias Suponiendo que se ha realizado n observaciones de las variables en estudio, el proceso genera un conjunto de n resultados observacionales, denominado datos originales, que sern de igual dimensin al nmero de variables consideradas. Esta masa o acopio de informacin es difcil de manejar e interpretar y no permite detectar, en primera instancia, hechos relevantes a cerca del comportamiento generalizado de las variables, en los n casos observados. Un primer paso en logro de este ltimo objetivo, consiste en agrupar la informacin, clasificando los datos segn los diferentes valores que puedan presentar una o un conjunto de caractersticas, valores que constituirn las diferentes categoras o clases para la clasificacin. Dependiendo de la naturaleza de las variables y de los objetivos propuestos, se utilizaran adecuadamente las diferentes escalas de clasificacin ya enunciadas. El proceso continua con el conteo (o recuento como lo llaman popularmente) del nmero de observaciones o casos que se presentan en cada clase, generndose

de esta manera las llamadas frecuencias de clase, lo que da inicio al proceso conocido como la reduccin del dato. De acuerdo con el nmero de variables que se tengan en cuenta cada vez para la clasificacin, se presentan fundamentalmente las clasificaciones simples o unidimensionales, las de doble entrada o bidimensionales y la clasificacin mltiple, segn que se consideren simultneamente una, dos o ms variables para el proceso, respectivamente. 2. ANALISIS DESCRIPTIVO UNIDIMENCIONAL 2.1. MEDIDAS CARACTERISTICAS UNIDIMENSIONALES Se ha comprobado que, en general, los colectivos estadsticos tienden a comportarse respecto a los aspectos de estudio, de una manera variable, pero con ciertas tendencias o regularidades, comportamientos que se describen con base en una serie de medidas llamadas caractersticas o caracterizadoras de los mismos. Tales medidas estudian entonces la tendencia y la variabilidad o dispersin de los diferentes factores en observacin dentro de un estudio y son la base para procesos analticos ms profundos que el de simplemente describir el comportamiento de las variables. Se presentan a continuacin algunas de tales medidas, enfatizando ms su conceptualizacin, que sus procesos de clculo. 2.1.1. La Media Aritmtica Conocida tambin como el promedio aritmtico o simplemente la medida o el promedio, se define como el cociente entre las sumas de todos los valores observados de la variable en cada elemento considerado y el total de stos o sea es una razn entre el total de la variable y el total de elementos en que ha sido observada. La formula para calcular esta medida tiene la siguiente forma, cuando se trabaja con los datos originales:

M ( x) = x =

x
j =1

que se transforma en el caso de datos agrupados en:

M ( y) = y =

y
j =1

nj

= y j1 h j
j =1

De acuerdo con su definicin y naturaleza, la medida aritmtica es el valor alrededor del cual la variable tiende preferencialmente a agruparse; implica que los elementos del colectivo o de la muestra presentaron para la variable, valores que estn preferencialmente alrededor del promedio. 2.1.2. La Varianza Partiendo del hecho de que la tendencia generalizada de los datos se ha representado o sintetizado por el promedio, ser pertinente observar la diferencia entre los datos (representados) y la media (representante), para tener alguna idea de que tan buena es la representacin. Si en suma tales diferencias son pequeas, se deber a buena representacin o sea que los datos realmente tienen alguna tendencia. En caso contrario, esto ltimo deber descartarse. Para corroborar lo anterior, obsrvese los tres conjuntos de datos siguientes: Conjunto I : Conjunto II : Conjunto III : 700 698 50 700 699 100 700 700 350 700 700 701 702 1000 2000

Se puede comprobar fcilmente que ellos tres casos el promedio es de 700, pero no por esto se puede decir que los datos se comportan igual, en trminos generales. Se define: V (X) = S =
2

(x
n i =1

n x i x1 i =1 =1 = n n
n 2 1

En el caso de los datos originales, y:

V ( y) =

(y
m j =1

y nj n

j =1

m 1 y n j 1 y j n j 2 j= j= y j y hj = n n
m

2 j

Para los datos agrupados.

2.1.3. La desviacin estndar y el coeficiente de variacin Para obviar el problema de interpretacin tangible de la varianza, se define una medida adicional de dispersin, como la raz cuadrada positiva de la varianza, denominada desviacin estndar o tipo o tpica. Es una medida que esta expresada en las mismas unidades de la variable, lo que permite darle una interpretacin directamente relacionada con ella, que la considera como la dispersin promedio entre los datos y la medida que los presenta. Aunque la desviacin tipo tiene una interpretacin accesible que la varianza, no dar una idea concreta de la magnitud de la dispersin si no se referencia simultneamente el correspondiente promedio. Esta relacin entre las dos medidas se concreta en el llamado Coeficiente de Variacin, que se obtiene como el coeficiente entre la desviacin tipo y la media aritmtica, o sea: CV ( X ) = s

x El coeficiente de variacin es una expresin de la proporcin o porcentaje de dispersin que tienen los datos con respecto a su promedio y por ser una medida relativa, permite comparaciones de diversas series de datos, an de aquellas que sean de diferente naturaleza. 2.1.4. Los Porcentiles Se define como tales a valores del recorrido de la variable, que acotan determinados porcentajes de casos, dividindolos en dos subconjuntos, uno de ellos con una determinada proporcin de menores valores de la variable y el otro con la proporcin restante de valores mayores. El porcentaje relacionado con el subconjunto de menores, se utiliza para hacer referencia al orden del correspondiente percentil. En trminos de porcentajes enteros, existen 100 percentiles y la utilizacin simultanea de varios de ellos, crea subconjuntos de elementos que se caracterizan por presentar para la variable, valores ms o menos homogneos. Es costumbre denominar Mediana al percentil 50 y Cuartiles superior a los porcentiles 25 y 75 respectivamente. inferior y

La naturaleza de estas medidas que implica un ordenamiento ascendente previo de los datos, esta relacionada con el concepto de localizacin o de posicin.

Para ubicar un percentil determinado, simplemente se determina la posicin que se debe ocupar dentro de los datos y se observa el valor de la variable que se encuentra en tal posicin. Se les denomina tambin estadsticas de orden. Para datos agrupados en una distribucin de frecuencias, de forma continua el percentil t-simo se localiza mediante la siguiente expresin: 0,01 tn N k 1 Pt = Yk 1 + ck nk Siendo K, la clase percentilica. 2.1.5. La Moda Conocida tambin con los nombres de Modo, Promedio Tpico o Valor Modal se define como el valor de la variable que ms se repite o sea que aparece con ms frecuencia en trminos de probabilidad corresponde al ms probable. La determinacin de la moda corresponde a un proceso eminente observacional, asociado con su concepcin: detectar cual es el valor de la variable que ms se repite o que tiene mayor frecuencia. Para datos agrupados en forma continua este proceso se realiza mediante la forma: nk nk 1 M dt = Yk 1 + ck 2 nk nk 1 nk + 1 Correspondiendo K, a la clase con mayor frecuencia. 3. ESPACIO MUESTRAL Es el conjunto de todos los resultados posibles de un experimento estadistico. Evento: Es un subconjunto del Espacio Muestral. Probabilidad: De un evento A es la suma de los pasos de todos los puntos muestrales en A. por tanto: 0 P ( A ) 1 P ( o) = 0 P ( s) = 1

Definicin: Si un experimento puede tener como resultado cualquiera N resultados igualmente probables, y si exactamente n de estos resultados corresponde al evento A, entonces la probabilidad del evento A es: P ( A) = n N

Regla Aditiva: Si A y B son cualesquiera dos eventos, entonces: P ( A B ) = P ( A) + P ( B ) P ( A B )

Probabilidad Condicional: Dados dos eventos A y B que pertenecen al espacio muestral S, se define: P ( A / B) = Independencia: Si A y B son eventos que pertenecen al espacio muestral entonces: P ( A B ) = P ( A) P ( B ) Variable Aleatoria: Es una funcin que asocia un mnimo real muestral. Tipos de Variables Aleatorias: 1. Discreta: Quien contiene un nmero finito de posibilidades o una serie interminable con tantos elementos como nmeros enteros existen. 2. Continuas: Quien contiene un nmero infinito de posibilidades igual al nmero de puntos en un segmento de lnea. con cada elemento del espacio P ( A B) P ( B) si P ( B ) > 0

Tipos de Distribucin 1. Discretas de Probabilidad: El conjunto pares ordenados (x, f ( x ) ) es una funcin de distribucin de probabilidad de la variable aleatoria discreta X, si para cada resultado posible X, Cumple: a. f ( x ) 0 b. f x ( x ) =1 c. P ( x = x ) = f ( x ) 2. Continuas de Probabilidad La funcin f ( x ) es una funcin de densidad de probabilidad, para la variable aleatoria continua X, definida en el conjunto de nmeros reales R, si: a. f ( x ) > 0 para todo x R b.
x

f ( x ) dx = 1

c. P ( a < x < b ) =

f ( x ) dx
a b

Esperanza Matemtica Si x es una variable aleatoria con distribucin de probabilidad valor esperado de X es: E ( x) = x f x ( x) E ( x) = si X es discreta si X es continua f ( x ) ,la media o

f ( x ) dx

DISTRIBUCIONES DE PROBABILIDAD MS FRECUENTES EN CONTROL DE CALIDAD Una distribucin de probabilidad es el conjunto de todas las probabilidades de los valores del dominio de la variable. Una funcin de probabilidad es una funcin que asigna a cada valor del dominio su probabilidad de aparicin. Una funcin de densidad de probabilidad es la funcin continua que se obtendra si en un histograma redujsemos indefinidamente la amplitud de las clases. Una funcin de distribucin es una funcin de probabilidad (o de densidad) acumulada. Ejemplos

prcticos de estas funciones se presentan a continuacin para las distribuciones de probabilidad ms utilizadas en control de calidad. DISTRIBUCIN HIPERGEOMTRICA En una poblacin finita del tamao N, el nmero de elementos de una determinada clase (no conforme, por ejemplo) es D. Si de esta poblacin se extrae sin reposicin una muestra de n individuos, cabe la posibilidad de definir la variable aleatoria discreta x, nmero de elementos en la muestra que pertenecen a la categora mencionada, que puede tomar los valores x = 0,1 , , n . La distribucin de probabilidad de la variable aleatoria x es decir, la expresin matemtica que ofrece la probabilidad de que parezca en la muestra x elementos no conforme es: D N D x n x D ! ( N D ) ! ( N n ) ! n! = P ( x) = ( D x ) ! x! ( N D n + x ) ! ( n x )! N ! N n donde N es el nmero de maneras de elegir una muestra de n elementos de una n poblacin N D , el nmero de formas de seleccionar x elementos no conforme de un total x de Dy N D n x , el nmero de formas de elegir n x elementos correctos de un total de ND La media de la distribucin muestras de tamao n D ( N D) ( N n) N 2 ( N 1) (nmero medio de elementos no conforme en nD x = n) es y su desviacin tpica N

x =

Ejemplo 2 Se sabe que en un envo de 50 impresoras, 8 funcionan defectuosamente. Determinar la probabilidad de encontrar 0,1 ,, 5 impresora defectuosas en

muestras de tamao n = 5 , as como la media y la desviacin distribucin. DISTRIBUCIN BINOMIAL

tpica de la

Consideremos una poblacin finita de N elementos, clasificados en dos categoras, por ejemplo, correctos y no conforme. Se sabe que los no conforme se encuentran en una proporcin p y los correctos en una proporcin q. p = nmero de elementos no conforme/ N q = nmero e elementos correctos/ N Dado que slo hay dos clases de individuos se ha de cumplir que p + q = 1. Es decir, la probabilidad de que un individuo elegido al azar sea correcto o defectuoso es igual a uno. En estas circunstancias se extrae una muestra (con reposicin) de n elementos de la poblacin N. Y se quiere saber la probabilidad de encontrar x elementos no conformes en la muestra. Esta variable se distribuye segn una distribucin binomial que tiene la siguiente expresin: Probabilidad de encontrar x elementos no conforme en la muestra = n n! n x P ( x) = p x qn x = p x (1 p ) x ( n x )! x! La media, es decir el nmero medio de elementos no conforme que encontraremos en la muestra, de esta distribucin es igual a x = n p , y la desviacin tpica a x = n p . q . La distribucin binomial es una buena aproximacin a la hipergeomtica cuando el tamao de la muestra es pequeo en relacin con el de la poblacin. Se suele n utilizar esta aproximacin cuando la fraccin de muestreo es menor que 0,1. N D En este caso los parmetros de la binomial son p = y n. N Ejemplo 3 En un lote de productos manufacturados de 1000 unidades se sabe que hay 70 elementos no conforme. Si se extrae una muestra de 5 elementos, calcular: - La probabilidad de que haya cero elementos no conforme. - La probabilidad de que haya un elemento no conforme. - La probabilidad de que haya dos elementos no conforme.

La probabilidad de que haya tres elementos no conforme, etc.

El nmero medio de elemento no conforme que se obtendr en una muestra de este tamao, y su desviacin tpica. DISTRIBUCIN DE POISSON La distribucin de Poisson se utiliza para controlar defectos en productos y en general para modelizar sucesos con una baja probabilidad de ocurrencia en un punto determinado pero con una alta cantidad de puntos en los que puede ocurrir el suceso. Su expresin es: e x P ( x) = x! Donde > 0 es el parmetro de la distribucin de Poisson. La media y la desviacin tpica son: x =

x = La distribucin de Poisson es una adecuada aproximacin a la binomial para valores pequeos de p y grandes de n. El parmetro de la distribucin de Poisson es = n p . Esta aproximacin se realiza para p < 0,1 y n grande.
Ejemplo 4 El nmero medio de averas que se producen al ao en la red de alcantarillado de una ciudad es de 2,8 por cada 10 Km. Determinar la probabilidad de encontrar en un tramo de 10 Km 0, 1, etc averas. Representar la funcin de probabilidad. Tipos de Distribucin Continuos 1. Normal La funcin de densidad de la variable aleatoria normal X, con media varianza, se define: fx ( x ) = 1 J 2n e
1 x 2 J
2

DISTRIBUCIONES DE MUESTREO En control de calidad se examinan normalmente muestras extradas de poblaciones de elementos y, por este motivo, interesa saber que relacin existe

entre los estadsticos de las muestras (media muestral, por ejemplo) y los parmetros e la poblacin (media de la poblacin). En una poblacin de tamao N (media y desviacin tpica ) se extraen con reposicin todas la muestras de tamao n y para cada una se calcula, por ejemplo, su media. Esta media muestral, x , tomar un valor distinto para cada muestra y es, por tanto, una variable que tiene distribucin de probabilidad, media, desviacin tpica, etc. De la misma forma se puede proceder con la desviacin tpica, la mediana o cualquier otro estadstico que se nos ocurra. Esta es la forma de obtener distribuciones de muestreo. La distribucin de muestreo de medias para poblaciones infinitas o muestreo con reposicin se distribuye aproximadamente como una normal de media y desviacin tpica:

x = n Para poblaciones finitas y muestreo sin reposicin: = x = = n


N n N 1

La distribucin de muestreo de medias es aproximadamente normal para N 30 . La aproximacin mejora al aumentar el tamao de la poblacin.

Ejemplo 1 Se sabe que un conjunto de 300 arandelas se distribuye con media 2 cm y desviacin tpica 0,05 cm. Se quiere conocer la probabilidad de que en una muestra de 20 elementos, la media este entre 1,98 y 2,02 cm. ESTIMACIN La inferencia estadstica es la parte de la Estadstica que se encarga de realizar estimaciones de los parmetros de la poblacin (media o desviacin tpica poblacional, por ejemplo) a partir de estadsticas muestrales (como la media o la desviacin tpica muestral).

Un estimador es insesgado o centrado si su media coincide con el parmetro de la poblacin. El sesgo de un estimador se define como la diferencia entre su media y el parmetro de la poblacin que se pretende estimar. La eficiencia o precisin de un estimador est relacionada con la inversa de su varianza, es decir, cuanto menor sea la varianza de un estimador mayor es su eficiencia o precisin. Una estimacin puntual de un parmetro es ofrecer un valor numrico de su media. Normalmente no se realizan estimaciones puntuales sino estimaciones por intervalos, es decir, se ofrece un par de valores y la probabilidad de que el parmetro de la poblacin est entre esos dos valores. Una estimacin por intervalos informa, por tanto, sobre la precisin de la estimacin. Consideremos el caso de una poblacin de media desconocida y desviacin tpica conocida ( ). La estimacin de se puede realizar mediante la distribucin de la media muestral ( x ) cuya media es , y es por tanto un estimador insesgado, y cuya desviacin tpica es . Sabemos, adems, que para tamaos muestrales n grandes x se distribuye segn una normal. En estas condiciones se puede afirmar que en el intervalo x se encuentra el valor de el 68,27% de las veces. Y n de la misma forma los intervalos x 2 y x 3 contiene el valor de la n n media poblacional con una probabilidad del 95,45% y el 99,73% respectivamente. De forma ms general, un intervalo con un nivel de confianza de (1 ) 100% tiene la expresin x 2 , donde 2 es un valor critico de la normal (0,1) n P ( x 2 ) = 1 para el que se cumple que lo que es lo mismo 2 P ( 2 x 2 ) = 1 . Ejemplo 2 Determinar un intervalo de confianza del 95% para la media del peso de una lata de conservas vegetales. La media de una muestra de 50 latas fue de 188 gramos. La desviacin tpica de la poblacin se sabe que es de 2 gramos. CONTRASTE DE HIPTESIS

Las hiptesis estadsticas suelen ser enunciados que se formulan sobre los parmetros de las poblaciones o sus distribuciones de probabilidad. Estas hiptesis se aceptan o se rechazan utilizando informacin muestral. La terminologa que se utiliza en contraste de hiptesis es la siguiente: Hiptesis nula ( H 0 ) : es cualquier hiptesis que se formula con la intencin de rechazarla. Hiptesis alternativa ( H1 ) : es cualquier enunciado distinto a la hiptesis nula. Error tipo I o nivel de significacin ( ) : es la probabilidad de rechazar una hiptesis cuando debera ser aceptada. El control de calidad el error tipo I se conoce con el nombre de riesgo del vendedor. Error tipo II o potencia del contraste ( ) : es la probabilidad de aceptar una hiptesis cuando debera ser rechazada. Tambin se utiliza el nombre riesgo del comprador para denominar esta probabilidad. Regin de aceptacin: es el intervalo para el cual no se rechaza ( H 0 ) . Regin crtica o de rechazo: es un conjunto de valores para el cual se rechaza la hiptesis nula a un nivel de significacin . Consideremos una poblacin de rodamientos metlicos con peso medio , desviacin tpica y distribucin normal. Se quiere saber si una bolsa de 10 rodamientos pertenece a esta poblacin. Para ello se formulan las hiptesis: H 0 : x = (La media de la bolsa de rodamientos es igual a la media de la poblacin). H1 : x Si la muestra de 10 rodamientos perteneciese a la poblacin, su media muestral se distribuir segn una normal de media y desviacin tpica y el 95% de 10 las veces se encontrara en el intervalo 1,96 . n

Por tanto, para un nivel de significacin del 5% la regin de aceptacin de la x + 1,96 hiptesis nula es 1,96 10 10 y su rgimen de rechazo es x 1,96 y x + 1,96 . 10 10 El contraste se realiza determinando la media de los 10 rodamientos de la bolsa, si el valor obtenido est fuera de la regin de aceptacin se rechaza la hiptesis nula a un nivel de significacin del 5%, es decir, hay una probabilidad del 5% de haber rechazado H 0 cuando es cierta. Si el valor de la media muestral est dentro de la regin de aceptacin no se rechaza la hiptesis de que la muestra pertenezca a la poblacin. Ejercicio 1 Se sabe que la proporcin de tornillos no conforme que suministra una empresa es del 0,5%. Cul es la probabilidad de que en un envo de 1000 tornillos haya ms de un 1% de no conforme? Ejercicio 2 En un cmara frigorfica haba almacenados ms de 100.000 yogures cuando se produjo una avera en el suministro de energa elctrica. Este fallo no se detecto hasta pasados dos das. En ese momento se tomo una muestra de 100 yogures, se analizaron y se determin que la proporcin de unidades en mal estado en la muestra era del 45%. Hallar intervalos de confianza del 90% y del 99% para la proporcin de yogures en mal estado en la cmara frigorfica.

Ejercicio 3 La altura media de los hombres adultos de una regin se distribuye segn una normal de media 178 cm y desviacin tpica 5,3 cm. Es un pequeo municipio de esa regin se medi a los 123 hombres adultos censados y se obtuvo una altura media de 174,5 cm. se puede afirmar a un nivel de significacin del 1% que la altura media de los hombres de este pueblo es la misma que en la regin? Ejercicio 4 Un proveedor afirma que el 99% de los componentes electrnicos suministrados son correctos. Establecer a un nivel de confianza del 99,73% la regin de

aceptacin para hiptesis nula de que la proporcin de no conforme en un lote de 100 es del 1%. Ejercicio 5 En un proceso de manufacturas de lminas de corcho el 10% de las unidades son defectuosas. Determinar la probabilidad de que en una muestra aleatoria de 400 unidades sean defectuosas. a. Menos de 50 unidades. b. Menos de 40 unidades. c. Menos de 35 unidades. Ejercicio 6 En un proceso de fabricacin de latas para conservas se recogieron durante 15 das datos sobre las medidas de los recipientes mediante muestras aleatorias de 300 unidades. La altura media fue de 10,75 cm y la desviacin tpica 0,04 cm. Se quieren saber los lmites de confianza (95% y 99%) para la altura media de todas las latas. Ejercicio 7 En un muestreo (n = 100) realizado al azar en un almacn de envases de Tetrabrik se detectaron 15 unidades que tenan algn defecto. Determinar los intervalos de confianza para la proporcin de envases con algn defecto.

4. ESTUDIO DE RELACION ENTRE VARIABLES 4.1. LA REGRESION En mltiples estudios estadsticos, aparece como una gran necesidad practica, el considerar simultneamente dos o ms variables, con el fin de analizar si entre ellas existe alguna relacin, si la misma se puede formalizar y que tan intensa es la misma. Se trata de establecer fundamentalmente, con respecto a la relacin: la existencia la forma la intensidad

Los mtodos estadsticos utilizados por estos anlisis son conocidos como Mtodos de Regresin y Correlacin y el supuesto de partida para su desarrollo,

considera que algunas de las variables explican en parte, el comportamiento de otras. Este supuesto estable una divisin general entre las variables consideradas, clasificndolas en dos grupos constituidos por las variables explicativas y las variables explicadas. El objetivo de este tipo de procesos es tratar de estimar o predecir o conjeturar valores de las variables explicadas, con base en valores dados o supuestos de las explicativas. Por tal razn son llamadas tambin stas variables explicativas o predictorias y las anteriores variables estimadas o predictando. Otros nombres no muy adecuados, son los de variables independientes para las explicativas y variables dependientes para las explicadas. Para poder alcanzar el objetivo citado, es necesario darle de alguna forma funcional a la relacin, lo cual se logra mediante el ajuste de funciones de base estadstico-matemtica, que estn compuestas por una parte deterministica y una parte aleatoria o no-deterministica. A tales funciones se les denomina Modelos de Regresin. La componente aleatoria solo se puede manejar por medio de la probabilidad, por lo cual en la practica no se puede incluir en el modelo, lo que imposibilita poder determinar valores de las variables explicadas, limitndose el proceso a la estimacin de los mismos. La natural diferencia entre los verdaderos valores de las variables explicadas y los que se estiman por medio del modelo, constituye la llamada variable aleatoria de error y el principio fundamental para construir un modelo, indica que debe ser tal, que minimice la suma de los cuadrados de tal variable, principio que es entonces denominado como de mnimos cuadrados. Uno de los modelos bsicos, es el que esta asociado con la consideracin de una variable explicada y su relacin lineal con un conjunto de P variables explicativas y la variable de error, que formalmente se expresa como: Y = 0 + 1 x1 + 2 x2 + ... + p x p + u = E ( Y ) + u y que en la prctica es: E ( Y ) = 0 + 1 x1 + 2 x2 + ... + p x p de tal manea que: U = Y E ( Y ) y el principio de minimizacin implica que el modelo se ajuste de tal forma que:

= [Y E ( Y ) ]

= min

El anterior modelo es conocido como MODELO GENERAL DE REGRESIONLINEAL, y en el mismo Y representa a la variable explicada x j alguna de las variables explicativas de U a la variable aleatoria de error.

Los coeficientes beta que acompaan a cada una de las variables estimadoras, as como e independiente son llamados los parmetros del modelo y ser necesario estimarlos mediante informacin muestral. Lo anterior se hace con base en el proceso de minimizacin de cuadrados, ya que esta genera un sistema de p+1 ecuaciones, cuya solucin permite encontrar las p+1 incgnitas. Los coeficientes asociados con cada variable explicadora reciben el nombre de COEFICIENTES DE REGRESION PARCIAL, y cada uno de ellos indica la modificacin que se opera en la estimacin Y, por cada modificacin que se haga en la unidad de la correspondiente X, cuando las dems se supone que permanecen invariables. Al coeficiente independiente se le denomina VALOR AUTONOMO, por estar asociado con la estimacin de Y, cuando todas las variables explicativas presentan el valor cero. Es innegable la importancia que en los estudios de relacin entre variables, tiene el anlisis correcto de los coeficientes de regresin y al respecto es conveniente advertir que la interpretacin de los mismos, se debe hacer siempre sin perder el punto de referencia del modelo que se esta trabajando, en cada situacin especifica. Los mtodos de regresin permiten analizar varios modelos, a partir de un conjunto dado de variables explicativas, con el fin de determinar cuales de estas se deben incluir finalmente para que se logren los mejores resultados. De estos procedimientos, los ms comunes son los conocidos como Stepwise, Forward y Backward.

BIBLIOGRAFIA

Anderson, Sweeney Williams. Estadstica para Administracin y Economa. Ed. Thomson 1999 Bartes, Albert y Otros. Mtodos Estadsticos. Control y Mejora de Calidad. Ed. Alfaomega 2000. Daz, Luis G. Estadstica Nacional 2002. Multivariada. inferencias y Mtodos. Universidad

Duncan. Control de Calidad y Estadstica Industrial. Alfaomega 1989 Kume Hitoschi. Herramientas Estadsticas Bsicas para el Mejoramiento de la calidad. Ed. Norma 1988. Montgomary, Douglas. Control estadstico de la calidad. Ed. Iberoamericana 1991 Montgomary, Douglas. Probabilidad y Estadstica aplicada a la Ingeniera II Edicin. Ed. Limusa 2002. Walpole Myer. Probabilidad y Estadstica para Ingeniera. VI Edicin. Ed. Prentice Hall 1998. HANSEN B.L., GHARE P.M. (1989). Control de Calidad: Teora y Aplicaciones. Daz de Santos. (Captulo 2). JURAN J.M. GRYNA F.M. (1994).Manual de Control de Calidad. Volumen IIMC Graw-Hill. (Captulo 23). MONTGOMERY D.C. (1991). Control Estadstico de Calidad. Grupo Editorial Iberoamrica. (Captulo 3). PEA D. (1991). Estadstica, Modelos y Mtodos. 1. Fundamentos. Alianza Universidad Textos. (Captulos 4 y 5) SPIEGEL M.R. (1990). Estadstica. Mc Graw-Hill.(captulos 8, 9 y 10).

También podría gustarte