Está en la página 1de 10

Unidad 1.

Fundamentos de la estadstica Presentacin de la unidad La palabra estadstica a menudo te remite a grficas y tablas; cifras relativas a nacimientos, muertes, impuestos, demografa, ingresos, deudas, crditos, etc. No obstante, para aprovechar las herramientas de anlisis estadstico, es necesario comprender qu representa cada concepto y la metodologa mediante la cual se obtiene un dato estadstico. En esta unidad se hablar sobre la importancia de la estadstica, conocers sus conceptos bsicos, as como la metodologa del muestreo para que al final, obtengas una muestra aleatoria simple. Propsitos de la unidad Identificars los conceptos bsicos relacionados con la Estadstica. Reconocers la utilidad e importacia de la Estadstica. Aplicars el procedimiento para obtener una muestra aleatoria simple. Aplica la metodologa estadstica para obtener una muestra aleatoria simple, identificando los elementos que intervienen en un problema estadstico. --------------------------1.1. Introduccin a la estadstica La estadstica es la ciencia cuyo objetivo es reunir informacin cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al anlisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadstica, en general, es la ciencia que trata la recopilacin, la organizacin, la presentacin, el anlisis y la interpretacin de datos numricos con el fin de realizar una toma de decisiones ms efectiva. Las estadsticas La palabra estadstica tambin se utiliza para referirse a la informacin estadstica (descripcin de parmetros); es decir, a series de datos, tablas y grficas que presentan resultados. Por ejemplo, cuando leemos las estadsticas de los equipos o escuchamos la estadstica muestra que el ndice de reprobacin en las escuelas es tal, se hace referencia a los datos y no al procedimiento o metodologa de anlisis. Utilidad e importancia de la estadstica La estadstica resulta muy til no slo para recopilar y describir datos, sino tambin para interpretar la informacin obtenida, que puede ser aprovechada para demostrar la evolucin de un fenmeno a travs de cierto tiempo. En Mxico, el Instituto Nacional de Estadstica y Geografa (INEGI) se encarga de recabar informacin estadstica y geogrfica de todo el pas, en diferentes reas y contextos.

Los mtodos estadsticos se utilizan en investigaciones de todas las reas del conocimiento en el mbito acadmico, profesional y laboral. La finalidad es resolver un problema, entendiendo ste como la diferencia entre lo real y lo deseado, donde la estadstica muestra la realidad para que el investigador la analice y tome una decisin. Divisin de la estadstica La estadstica, por su aplicacin se divide en: 1) Estadstica descriptiva. La funcin descriptiva de la estadstica se enfoca en la presentacin y clasificacin de los datos obtenidos de la poblacin que se analiza. 2) Estadstica inferencial. Esta aplicacin de la estadstica busca plantear y resolver problemas especficos y/o hacer previsiones a partir de los datos de una muestra, dado que es muy difcil estudiar a la poblacin completa.

----------------------Actividad 1. Encuesta ----VERIFICAR QUE ESTE HECHA Antes de continuar con el contenido de la asignatura, responde la encuesta Preferencias por carrera. Es necesario que participes en este ejercicio, porque a partir de los datos que arroje la encuesta, realizars las actividades para evaluar las tres unidades de la asignatura. Para ingresar a la Encuesta: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades de la unidad, da clic en la Actividad 1. Encuesta Preferencias por carrerra. ---------------------------1.2. Conceptos de estadstica

La estadstica tiene aplicacin en prcticamente todas las reas del conocimiento, inclusive en la vida cotidiana, mucho ms a menudo de lo que crees. La siguiente actividad te permitir apreciar una aplicacin simple de la estadstica e identificar algunos conceptos relacionados con ella: Lee el texto La estadstica y la salud. Identifica los conceptos relacionados con la estadstica. Define cada concepto utilizando slo la informacin de la lectura. No es necesario que busques definiciones. Da clic en el icono para descargar el documento. EB_U1_LaEstadisticaYlaSalud.pdf ---------------------------------Conceptos bsicos de estadstica Los conceptos ms utilizados en estadstica son los que a continuacin se presentan. Poblacin: Conjunto de todos los elementos que permiten resolver un problema, que presentan una caracterstica comn determinada, observable y medible. Por ejemplo, si el elemento es una persona, se pueden estudiar las caractersticas edad, peso, nacionalidad, sexo, etc. Los elementos que integran una poblacin pueden corresponder a personas, objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.). Individuo: Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin. Nota que un individuo en estadstica puede ser distinto a un individuo como persona. Por ejemplo, en los censos econmicos se obtienen datos de los negocios. En este caso cada negocio, que est formado por varias personas, es un individuo de la poblacin. Muestra: Cuando es difcil estudiar la poblacin debido a su gran tamao o que provenga de un proceso que no se detiene (como la produccin de un bien), se debe analizar un subconjunto o parte de sta que la represente, llamado muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y caractersticas que la poblacin. En general el tamao de la muestra es mucho menor al tamao de la poblacin. Muestreo: Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporcin reducida y representativa de la poblacin. Dato: El dato es cada uno de los valores que se han obtenido al realizar un estudio estadstico. Por ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Variable: Se llama variable a una caracterstica que se observa en una poblacin o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Las variables se pueden clasificar en dos tipos: 1. Variable cuantitativa. Puede ser escala continua o discreta. 2. Variable cualitativa. Puede ser escala nominal u ordinal. Tipos de variables La variable es una caracterstica de la poblacin o muestra que desea estudiarse. Las variables pueden ser:

Cmo utilizamos los conceptos? En el ejemplo La estadstica y la salud identificaste algunos conceptos bsicos de estadstica. Ahora, revisemos juntos(as) los conceptos que estaban en el texto. La poblacin de estudio es la sangre del individuo, de la cual se toma una muestra que representa una pequea parte de esta poblacin. Esta muestra contiene informacin sobre las caractersticas que se desean observar. Los (las) expertos(as) de laboratorio preparan la sangre para observar en un microscopio electrnico los elementos (variables) que contiene, por ejemplo pueden observar la cantidad de plaquetas o neutrfilos (las plaquetas y los neutrfilos son los individuos y la cantidad que contiene la sangre de estos elementos son los datos) que contiene la muestra por unidad de volumen. Se realiza un conteo, en este caso, del nmero de plaquetas y del nmero de neutrfilos, esta informacin se representa por medio de un estadstico, caracterstica numrica que refleja la informacin contenida en la muestra, en la que se observa el total de plaquetas. Aunque, en realidad, lo que nos interesa conocer o estimar es el total de plaquetas en el total de la sangre (poblacin) del individuo.

Cuntos conceptos identificaste en la lectura?

La metodologa para solucionar un problema estadstico comprende los siguientes pasos: 1. Planteamiento del problema. En el planteamiento se define si se requiere de una muestra o es posible estudiar la poblacin, las caractersticas a estudiar (las variables), si es necesario establecer una hiptesis, entre otros. En este punto tambin se analizan los medios de los que se dispone y el procedimiento a seguir. 2. Elaboracin de un modelo. Se establece un modelo terico de comportamiento de las variables de estudio. En ocasiones no es posible disear el modelo hasta realizar un estudio previo. Los posibles modelos son normal, binomial, poisson, uniforme, y otros como binomial negativa, geomtrico. 3. Extraccin de la muestra. Se usa alguna tcnica de muestreo o un diseo experimental para obtener informacin de una pequea parte de la poblacin. 4. Tratamiento de los datos. En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que sern necesarios en pasos posteriores, como la media y la varianza de la muestra. Los mtodos de esta etapa corresponden a los mtodos de la estadstica descriptiva. Algunas de las etapas de esta fase son: recopilacin, clasificacin y presentacin de la informacin. 5. Estimacin de los parmetros. La estadstica inferencial nos proporciona herramientas para la prediccin o estimacin de los parmetros de la poblacin que nos ayudarn a resolver el problema. Un ejemplo de estas herramientas son las pruebas de hiptesis que se obtienen del anlisis de los datos y los intervalos de confianza. ---------------------------------1.3. Muestreo aleatorio Introduccin Los estudios estadsticos normalmente se hacen con una parte de la poblacin, ya que realizarlos sobre la totalidad resultara demasiado complicado. Para que la informacin obtenida tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones especficas.

Estas condiciones estn relacionadas con el mtodo para determinar el tamao y caractersticas de la muestra y los individuos que la componen. Los mtodos de muestreo se pueden clasificar en:

Revisa los mtodos de muestreo probabilstico, para ello, lee el texto Tipos de muestreo. Da clic en el icono para descargar el documento. EB_U1_MuestreoAleatorio.pdf

Muestreo aleatorio simple El muestreo aleatorio simple es el procedimiento por medio del cual se obtiene una muestra aleatoria simple. Una muestra aleatoria simple es la que resulta de aplicar un mtodo por el cual todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos.

A continuacin, conocers cules son los pasos para obtener una muestra aleatoria simple. Paso 1. Definir la poblacin de estudio y el parmetro a estudiar. Paso 2. Enumerar a todas las unidades de anlisis que integran la poblacin, asignndoles un nmero de identidad o identificacin. Paso 3. Determinar el tamao de la poblacin, determinar el porcentaje de error y el porcentaje de confianza y obtener una muestra preliminar. Paso 4. Determinar el tamao ptimo de la muestra para el estudio. Paso 5. Seleccionar los sujetos dela muestra usando nmeros aleatorios.

Pasos para obtener una muestra aleatoria simple Has visto una descripcin general del procedimiento que debes seguir para obtener una muestra aleatoria simple, ahora revisars cada paso especfico. Paso 1. Definir la poblacin de estudio y las variables a estudiar. Recuerda que la poblacin es el grupo formado por el conjunto total de individuos, objetos o medidas que poseen algunas caractersticas comunes, observables en un lugar y en un momento determinado. Por lo tanto, el paso 1 es determinar qu se estudiar. Ejemplo Un investigador realiza un estudio sobre las relaciones de gnero en el noviazgo, su objeto de estudio son las manifestaciones de violencia fsica y psicolgica entre los (las) estudiantes del ltimo ao de la carrera de qumica. Su poblacin es el total de estudiantes del ltimo ao de ingeniera qumica que tengan novio o novia; el total de individuos con esta caracterstica es de 386. Por lo que, la poblacin es de 386 individuos y las variables son: violencia fsica y violencia psicolgica. Paso 2. Numerar todas las unidades de anlisis que integran la poblacin, asignndoles un nmero de identificacin. Una vez que has definido la poblacin y las variables a estudiar, es necesario asignar un nmero de identificacin a cada individuo de la poblacin. Siguiendo con el ejemplo de la relaciones de gnero en el noviazgo de los (las) estudiantes de qumica, lo que sigue es numerar a los 386 estudiantes un nmero del 1 al 386. Paso 3. Definir la poblacin, determinar el porcentaje de error y el porcentaje de confianza. Para calcular el tamao de una muestra hay que tomar en cuenta tres factores: 1. El porcentaje de confianza con el que se quiere generalizar los datos, desde la muestra hacia la poblacin total. 2. 3. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. El nivel de variabilidad que se calcula para comprobar la hiptesis.

A continuacin definiremos estos conceptos. Ahora veamos una definicin de los conceptos implicados en el paso 3. Definir el tamao de la poblacin. Significa determinar el nmero de individuos que la constituyen; la variable N representa el tamao de la poblacin. N=X Porcentaje de confianza. Es el grado o nivel de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto se busca un porcentaje de

confianza menor, comnmente es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningn clculo) para poder acertar al valor verdadero de la poblacin . Este dato se obtiene a partir de la distribucin normal estndar. Porcentaje de error. Este error es una distancia alrededor del valor que deseamos estimar y nos da un margen de aproximacin. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error. Variabilidad. Es la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere comprobar. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y se indica con p (tambin llamada probabilidad de xito ), y el porcentaje con el que se rechaz la hiptesis es la variabilidad negativa, identificada por q (tambin llamada probabilidad de fracaso y se obtiene 1-p). Variabilidad positiva=p= a la probabilidad de que suceda el evento Variabilidad negativa=q=a la probabilidad de que no suceda el evento La variabilidad positiva (p) al sumarla con la negativa (q) siempre nos debe dar la unidad p+q=1. Cuando no se tienen antecedentes sobre la investigacin, entonces los valores de variabilidad son p=q=0.5 Paso 4. Determinar el tamao de la muestra ptimo para el estudio. Una vez que la poblacin, el porcentaje de confianza, el porcentaje de error y el nivel de variabilidad han sido determinados, se debe determinar el tamao de la muestra. Puedes calcularlo mediante alguna de las dos frmulas que examinars: una para los casos en que se conoce el tamao de la poblacin y la otra para cuando este dato se desconoce. Frmula para cuando no se conoce el tamao de la poblacin

-------Como se aplica: n es el tamao de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa

E es la precisin o error Ejemplo: En un lote grande de medicinas, se desea verificar que la proporcin de los ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de confianza del 95% con un error del 5%. Supn que la variabilidad p=q=0.5. Solucin: Para el nivel de confianza sea igual al 95%, tienes que P(Z)=0.95 si Z=1.96. Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en el caso necesario, hay que convertir esos valores a proporciones. Sustituyendo: Es decir, se ocupar una muestra de aproximadamente 384 unidades. -----Frmula para cuando se conoce el tamao de la poblacin

-----------Como se aplica: n es el tamao de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa N es el tamao de la poblacin E es la precisin o error Ejemplo: En un lote de 25,000 cajas de medicina, se desea verificar que la proporcin de los ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de confianza del 95% con un error del 5%. Supn que la variabilidad p=q=0.5. Solucin: Para el nivel de confianza sea igual al 95%, tienes que p(Z)=0.95 si Z=1.96. Sustituyendo: En otras palabras, se ocupar una muestra de aproximadamente 378 cajas. -----------

Nota. En este momento no conoces los procedimientos para obtener todos los componentes de las frmulas, en los ejemplos, estos componentes ya estn dados. Estos procedimientos se vern ms adelante. 1.Haz clic sobre las frmulas para ver un ejemplo de cmo se aplican. 2.Observa el video Determinar el tamao de la poblacin, que se encuentra en la pestaa Material de apoyo, en la pgina de inicio del curso.

Paso 5. Seleccionar los sujetos de la muestra usando nmeros aleatorios. El ltimo paso para obtener la muestra es saber qu individuos especficos de la poblacin se tomarn. Para hacer esto debes: 1. Numerar a los individuos de la poblacin del 1 a N (donde N es el tamao de la poblacin). 2. 3. Generar nmeros aleatorios para seleccionar los individuos de la muestra. Tomar los individuos correspondientes a los nmeros elegidos.

Los nmeros aleatorios se pueden generar por diversos mtodos, por ejemplo mediante programas computaciones (por ejemplo en Excel con la funcin =aleatorio()), funciones en calculadora, sacando nmeros de una urna o lanzando una moneda al aire, o bien utilizando tablas de nmeros aleatorios. Para obtener los nmeros aleatorios, utilizars la tabla, para ello lee el documento Uso de la tabla de nmeros aleatorios. Da clic en el icono para descargar el documento. EB_U1_UsoTabla.pdf