Está en la página 1de 26

ESTADSTICA

Asignatura Clave:FIM008 Nmero de Crditos: 6 Tericos:2 Prcticos: 4

Fecha de actualizacin: 18 de Julio de 2003

INSTRUCCIONES PARA OPERACIN ACADMICA:


El Sumario representa un reto, los Contenidos son los ejes temticos, los Activos una orientacin inicial para resolverlo y la sntesis concluyente, como posibilidad de integracin conceptual corresponder a lo factible de un punto de vista temtico amplio. La visin global de los asuntos resueltos como Titular Acadmico, te ofrecer oportunidades de discusin que se enriquecern en la medida que intensificas las lecturas, asistes a tu comunidad de estudio, te sirves de los asesores y analizas la ciberinformacin disponible posicionndote de los escenarios informativos adecuados. Los perodos de evaluacin son herramientas de aprendizaje. La acreditacin es un consenso de relacin con el nivel de competencia. Mantn informado a tu Tutor de tus avances acadmicos y estado de nimo. Selecciona tus horarios de asesora. Se recomienda al Titular Acadmico (estudiante) que al iniciar su actividad de dilucidacin, lea cuidadosamente todo el texto guin de la asignatura. Para una mejor facilitacin, el documento lo presentamos en tres mbitos: 1.- Relacin de las Unidades, 2.- Relacin de activos, 3.- Principia Temtica consistente en informacin inicial para que desarrolles los temas.

COMPETENCIA:
Realizacin e interpretacin de grficas estadsticas. Empleo de clculos de las primeras estadsticas. Desarrollar sus habilidades de pensamiento complejo. Fortalecimiento del pensamiento lgico y simblico. Incremento del pensamiento creativo.

SUMARIO: Desarrollar las habilidades numricas y de pensamiento lgico,


para la solucin de problemas estocsticos, partiendo de situaciones de la vida real hasta las conclusiones tericas ms fundamentales.

ESTADSTICA CONTENIDOS:
Unidad I Unidad II Unidad III Probabilidad. Estadstica descriptiva. Presentacin grfica de datos estadsticos.

Unidad IV Unidad V Unidad VI

Estimacin. Regresin. Anlisis de datos

ACTIVOS UNIDAD I Probabilidad


I.1.- Definicin y concepto. I.2.- Teora (teorema), fundamental del conteo. I.3.- Evento o suceso. I.4.- Punto muestral. I.5.- Espacio muestral. I.6.- Distribuciones de muestreo. I.7.- Intervalos de confianza. Actividad: Aplicacin e importancia de la probabilidad dentro de la estadstica

UNIDAD II Estadstica Descriptiva


II.8.- Estadstica.- definicin. II.9.- Importancia y usos de la estadstica. II.10.- Definicin de: poblacin y muestra. II.11.- Experimentacin. II.12.- Presentacin de datos. II.13.- Estadsticos mustrales. II.14.- Distribucin de frecuencias no agrupadas. II.15.- Distribucin de frecuencias agrupadas Actividad: Efectuar un muestreo poblacional.

UNIDAD III Presentacin grfico de datos estadsticos.


III.16.- Grfica de lneas. III.17.- Histograma. III.18.- Polgono de frecuencias. III.19.- Grfica de pastel. III.20.- Ojivas. Actividad: De la unidad anterior efectuar una representacin grfica del muestreo. UNIDAD IV

Estimacin.

IV.21- Estimaciones y estimadores. IV.22.- Estimadores Insesgados ptimos. IV.23.- Funcin de verosimilitud y estimadores mximo-verosmiles. IV.24.- Precisin de estimaciones. IV.25.- Intervalos de estimacin. IV.26.- determinacin del tamao muestral. Actividad: Efectuar estimaciones de produccin en productos agrcolas ms importantes de la regin.

UNIDAD V Regresin
V.27.- Mtodos de regresin. V.28.- Regresin lineal mnimo cuadrtica. V.29.- Anlisis de la bondad de ajuste. V.30.- Regresin no lineal y mltiple. V.31.- Correlacin total, parcial y mltiple. Actividad: Ejemplificar y comprender el concepto de regresin.

UNIDAD VI Anlisis de Datos


VI.32.- Introduccin. VI.33.- Hiptesis y modelos VI.34.- Prueba de hiptesis estadstica. VI.35.- La hiptesis nula. VI.36.- Hiptesis alternativa. Actividad: Ejemplificar y comprender el concepto de hiptesis.

ESCENARIOS INFORMATIVOS:
Asesores locales Asesores externos Disposicin en internet. Puntualidad en intranet. Fuentes directas e indirectas. Bibliografa

BIBLIOGRAFA: Holguin Quiones Fernando 1984 Estadstica Descriptiva Aplicada a las Ciencias Sociales Editorial UNO, Mxico, pp. 452 Jack, Levin 1979 Fundamentos de Estadstica en la Investigacin Social

Editorial Karla, Mxico, 2da. edicin, pp. 305 Jonson Robert, Patricia Kuby 1999 Estadstica Elemental Editorial Thomson, Mxico, 2da. Edicin, pp. 534

Pginas WEB: http://www.ruf.rice.edu/~lane/rvls.html http://research.ed.asu.edu/siip/

ESTADSTICA
PRINCIPIA TEMTICA:
I.1.Definicin y concepto. Se entiende por probabilidad, Especficamente se habla sobre la probabilidad de que ocurre un evento. Naturaleza de la probabilidad.- Puede pensarse que la probabilidad es la frecuencia relativa con que ocurre un evento. La probabilidad y la estadstica son dos campos ajenos pero relacionados de las matemticas. Se ha dicho que la probabilidad es el vehculo de la estadstica. Es decir que si no fuera por las leyes de la probabilidad, la teora de la estadstica no seria posible.

I.2.-

Teora (teorema), fundamental del conteo. Para encontrar la probabilidad de muchos eventos es necesario determinar el nmero de resultados posibles del experimento implicado. Esto requiere enumerar (obtener un conteo de) las posibilidades. Este conteo puede obtenerse usando uno de los mtodos: 1) Enlistar todas las posibilidades y luego proceder a contarlas (1, 2, 3, ); 2) Ya que a menudo no es necesario delinear (obtener una representacin de) todas las posibilidades., el conteo puede determinarse al calcular su valor numrico. Existen tres mtodos bsicos de conteo de uso comn para obtener el conteo mediante clculos: La tcnica fundamental y dos tcnicas especficas. Regla fundamental de conteo. Si un experimento esta integrado por dos ensayos, donde uno de ellos (una sola accin o eleccin) posee m resultados posibles y el otro tiene n resultados posibles, entonces cuando los ensayos se realizan juntos, se tiene: mxn (A-1) Resultados posibles para el experimento. Ejemplo: Un vendedor de automviles ofrece uno de sus modelos deportivos compactos con dos o opciones de transmisin (estndar o

automtica) y en uno de tres colores- Cuntas elecciones posibles de combinaciones de transmisin y color tiene el cliente?. Tenemos que: m = 2; n = 3. Al usar la regla fundamental de conteo (A-1), el nmero de opciones posibles disponibles para el cliente es: mxn= 2 x 3 = 6 Esta regla fundamental de conteo puede ampliarse para incluir experimentos que tienen ms de dos ensayos. Regla general de conteo. Si un experimento esta compuesto por k ensayos realizados en un orden definido, donde el primero tiene n1 resultados posibles, el segundo posee n2 resultados posibles, el tercero tiene n3 resultados posibles, etc., entonces el nmero de resultados posibles para el experimento es: n1 x n2 x n3 .........x nk (A - 2) Ejemplo: En muchos estados (USA), en las placas del automvil se usan tres letras seguidas de tres numerales, para obtener el nmero de placas. Si se supone que puede usarse cualquiera de las 26 letras del alfabeto ingles para ocupar cada uno de los tres caracteres y que puede utilizarse cualquiera de los dgitos del 0 al 9 para ocupar los tres ltimos caracteres.Cuntos nmeros de placas diferentes son posibles?

Solucin: Para la primera letra hay 26 opciones posibles (n1 = 26), 26 para la segunda (n2 = 26) y 26 para la tercera (n3 = 26). De manera semejante hay 10 opciones posibles para el numeral que se usara para los caracteres cuarto (n4 = 10), quinto (n5 = 10) y sexto (n6 = 10). En consecuencia, al usar la regla general de conteo (formula A -2), Se encuentra que hay: 26 x 26 x 26 x 10 x 10 x 10 = 17,576,000 Nmero de placas diferentes, al usar este esquema de seis caracteres. I.3.Evento o suceso. Un suceso es un subconjunto A del espacio muestral (), es decir, es un conjunto de resultados posibles. Evento.- Acontecimiento, suceso, cosa que sucede, acontecimiento. Si el resultado de un experimento es un elemento de A, decimos que el suceso A ha ocurrido. Probabilidad de eventos: Hay tres mtodos para asignar probabilidades a un evento: Emprico, Terico y Subjetivo. Emprico o Probabilidad Experimental. Se trata de la frecuencia relativa observada con la que ocurre un evento (lanzamiento de moneda), y se representa con la siguiente notacin que se usa para denotar la probabilidad emprica. n( A) p ' ( A) = n

Donde: p(A) .- Probabilidad del evento (A). n (A).- Nmero de veces que se observa el evento (A) n.- Es el nmero de veces que se intenta el experimento. Ejemplo: En un experimento del lanzamiento de monedas, se observo exactamente un guila (1A) en 104 de los 200 lanzamientos de un par de monedas. La probabilidad emprica observada de la ocurrencia de (1A) fue: 104 = 0.52,................52%..de.. probabilidad 200 I.4.Espacio Muestral. Un conjunto que () consiste en todos los resultados de un experimento aleatorio se llama un Espacio Muestral. Punto muestral. Y a cada uno de los resultados se le denomina punto muestral

I.5.-

VARIABILIDAD DE LA MUESTRA I.6.Distribuciones de muestreo. Distribuciones mustrales.- Para hacer inferencias sobre una poblacin es necesario analizar un poco ms los resultados mustrales. De una manera se obtiene una media muestral x . Es de esperar que este valor, x . Sea exactamente igual a la media de una poblacin ?..La respuesta es no. No es de esperar que ocurra esto, pero los resultados mustrales sern aceptables si la media de la muestra esta prxima al valor de la media de la poblacin. Considrese una segunda pregunta, si se toma una segunda muestra la media de esta ser igual a la media de la poblacin?, igual a la media de la primera muestra? Nuevamente, No, no espera que sea igual a la media de la poblacin, y tampoco que la media de la segunda muestra sea una repeticin de la primera segunda no obstante otra vez se espera que los valores estn prximos. Este argumento debe ser valido para cualquier estadstica muestral y sus valores de la poblacin correspondiente. DISTRIBUCIN MUESTRAL DE UN ESTADSTICO MUESTRAL Es la distribucin de valores de un estadstico muestral, obtenindose muestras repetidas, todas del mismo tamao y extradas de la misma poblacin. Para ilustrar el concepto de distribucin muestral, se considerara una poblacin finita muy pequea: el conjunto de dgitos pares, {o, 2, 4, 6, 8}, y todas las muestras posibles de tamao 2; adems, se tomara en cuenta dos distribuciones mustrales diferentes que pueden formarse con: 1) las medias y 2) los rangos mustrales Primero, se requiere enumerar todas las muestras posibles de tamao 2; hay 25 muestras posibles:

{0, 0} {0, 2} {0, 4} {0, 6} {0, 8}

{2, 0} {2, 2} {2, 4} {2, 6} {2, 8}

{4, 0} {4, 2} {4, 4} {4, 6} {4, 8}

{6, 0} {6, 2} {6, 4} {6, 6} {6, 8}

{8, 0} {8, 2} {8, 4} {8, 6} {8, 8}

Cada una de las muestras tiene una media x. Estas medias son, respectivamente: 0 1 2 3 4 1 2 3 4 5 2 3 4 5 6 3 4 5 6 7 4 5 6 7 8

Cada una de las muestras es igualmente probable, por lo que cada una de las 25 medias mustrales se le puede asignar una probabilidad de 1/25 = 0.004. La distribucin muestral de las medias mustrales se presenta en la tabla 7.1 como una distribucin de probabilidad y en la figura 7.1, como un histograma. DISTRIBUCIN MUESTRAL DE MEDIAS MUESTRALES x p( x ) 0 0.04 1 0.08 2 0.12 3 0.16 4 0.20 5 0.16 6 0.12 7 0.08 8 0.04

HISTOGRAMA: Distribucion muestral de medias muestrales


0.25 0.2 0.15 0.1 0.05 0 1 2 3 4 5 6 7 8 9

Recuerde que p = p, y que el estadstico muestral p, es un estimador insesgado de p. As, la informacin sobre la distribucin muestral de p se resume como sigue: Si de una poblacin se elige una muestra aleatoria de tamao n con p = P (xito), entonces la distribucin muestral de p tiene: 1. Una media p, igual a p. 2. un error estndar p igual a ( pq) / n, y 3. una distribucin aproximadamente normal si n es suficiente grande. I.7.Intervalos de confianza.
Procedimiento del Intervalo de Confianza:

Las inferencias sobre el parmetro binomial de poblacin p, P(xito), se realizara usando procedimientos bastantes semejantes a los que se emplean para hacer las inferencias sobre la media poblacional . Cuando se calcula la proporcin de la poblacin p, las estimaciones se basan en las estadstica muestral insesgada p,. La estimacin puntual, p, se vuelve el centro del intervalo de confianza, y el error mximo de estimacin es un mltiplo del error estndar. El nivel de confianza determina el coeficiente de confianza, el nmero de mltiplos del error estndar. a p' q' a p' q' p' z . ......a...... p'+ z . 2 n 2 n donde: p = x / n y q = 1 p

II.8.- Estadstica.- Definicin. Definicin.- Ciencia de recolectar, describir e interpretar datos. Como usuarios potenciales de la estadstica necesitamos dominar la ciencia y el arte de utilizar correctamente su metodologa. El empleo cuidadoso de los mtodos estadsticos permite obtener informacin precisa de los datos: Estos mtodos incluyen: 1) Definir cuidadosamente la situacin 2) Recolectar los datos 3) resumir con precisin los datos, y 4) obtener y comunicar las conclusiones significativas. La estadstica se divide en dos reas: estadstica descriptiva y estadstica inferencial. Estadstica Descriptiva.- es en lo que piensa la mayora de las personas al escuchar la palabra estadstica. La estadstica descriptiva incluye la recoleccin, presentacin y descripcin de los datos mustrales. La estadstica inferencial.- Se refiere a la tcnica de interpretacin de los valores resultantes de las tcnicas descriptivas y a la toma de decisiones y obtencin de conclusiones sobre la poblacin muestreada. II.9.- Importancia y usos de la estadstica. El trmino estadstica posee varios significados para personas de diversos entornos e intereses. Para algunos, es un campo de magia en

el que una persona con conocimientos supera a los dems. Para otros, se trata de un medio para recolectar y representar grandes cantidades de informacin. Y todava para otro grupo, se trata de un medio para tomar decisiones de frente a la incertidumbre. En la perspectiva idnea, cada uno de estos puntos de vista es correcto.

II.10.- Definicin de: Poblacin y Muestra.

Poblacin.- Es la coleccin, o conjunto, de individuos, objetos o eventos cuyas propiedades sern analizadas. La poblacin de inters debe de definirse cuidadosamente y se considera que esta completamente definida solo cuando se especifica la lista de los elementos que pertenecen a ella. Un ejemplo de poblacin bien definida es el conjunto de todos los estudiantes que han asistido a una universidad estadounidense. Por lo general, se piensa que una poblacin es una coleccin de personas. No obstante, en estadstica la poblacin puede ser una coleccin de animales, objetos manufacturados o de cualquier cosa. Hay dos tipos de poblaciones; finitas e infinitas: Poblacin finita: Cuando es (o puede ser) posible enumerar fsicamente los elementos que pertenecen a una poblacin, se dice que la poblacin es finita. Ejemplo: Los libros de una biblioteca universitaria constituyen una poblacin finita. (Los libros se pueden contar.) Poblacin infinita: Cuando los elementos de una poblacin son ilimitados, la poblac in es infinita. Ejemplo: La poblacin de todas las personas que podran tomar aspirina, y la poblacin de todos los focos de 40 watts que sern producidos en Mxico, son infinitas. Muestra.- Es un conjunto de la poblacin. Una muestra consta de los individuos, cuyos objetos o medidas seleccionados de la poblacin por el colector de la muestra. Variable.- Caracterstica de inters sobre cada elemento individual de una poblacin o muestra. Por ejemplo: La edad de un estudiante que ingresa a la universidad, el color de su cabello, su estatura, y su peso son cuatro variables. Dato.- Valor de la variable asociada a un elemento de una poblacin o muestra. Este valor puede ser un nmero, una palabra o un smbolo. Por ejemplo; Juan Prez, ingreso a la universidad a la edad de 23 aos. Datos.- Conjunto de valores recolectados para la variable de cada uno de los elementos que pertenecen a la muestra. Por ejemplo: El conjunto de 25 estaturas recolectadas de 25 estudiantes. II.11.- Experimentacin. Experimento.- Actividad planeada cuyos resultados producen un conjunto de datos. El experimento incluye las actividades para seleccionar los elementos y obtener los valores de los datos.

Parmetro.- Valor numrico que resume todos los datos de una poblacin completa. En un experimento, el investigador controla o modifica el entorno y observa el efecto sobre la variable bajo el estudio. A menudo leemos sobre resultados de laboratorio obtenidos usando ratas blancas para probar dosis diferentes de un nuevo medicamento y su efecto sobre la presin arterial. Los tratamientos experimentales fueron diseados especficamente para obtener los datos necesarios para estudiar el efecto sobre la variable.

II.12.- Presentacin de datos. Definicin.- Valor de la variable asociada a un elemento de una poblacin o muestra. Este valor puede ser un nmero, una palabra o un smbolo. Recoleccin de datos.- Uno de los primeros problemas que enfrentan quienes se dedican a la estadstica es la obtencin de datos. Los datos no ocurren simplemente; es necesario recolectarlos. Es importante obtener buenos datos porque en ltima estancia las inferencias efectuadas se basan en las estadsticas obtenidas a partir de los datos. Estas inferencias pueden ser tan buenas como lo sean los datos. La recoleccin de datos para el anlisis estadstico es un proceso complicado que incluye los siguientes pasos: 1. Definir los objetos de la investigacin o del experimento. Ejemplo: Comparar la eficacia de un nuevo medicamento con la eficacia de un medicamento normal; estimar el ingreso familiar medio en algn municipio. 2. Definir la variable y la poblacin de inters Ejemplo: duracin del tiempo de recuperacin de los pacientes que sufren algn enfermedad particular; ingreso total de los hogares de algn municipio. 3. Definir los esquemas para recolectar y medir los datos. Esto incluye los procedimientos de muestreo, el tamao de la muestra y el instrumento de medicin (cuestionario, por telfono, etc.) de los datos. 4. Determinar las tcnicas idneas para realizar el anlisis de datos: descriptivas o inferenciales. Los mtodos que se emplean para recolectar los datos son: los experimentos y las encuestas.

Experimento.- El investigador controla o modifica el entorno y observa el efecto sobre la variable en estudio. Encuesta.- En una encuesta o (inspeccin), los datos se obtienen al muestrear alguna parte de la poblacin de inters sin embargo, el investigador no modifica el entorno. Censo.- Si es posible enlistar (o enumerar) y observar cada elemento de la poblacin, entonces se compila un censo. Un censo es una encuesta al cien por ciento. II.13.- Estadsticos muestrales. Estadstica.- Valor numrico que resume los datos de la muestra. La estatura promedio encontrada al utilizar el conjunto de 25 estaturas es un ejemplo de una estadstica muestral. Una estadstica es un valor que describe una muestra. Casi todas las estadsticas mustrales se determinan con ayuda de formulas y suele asignarse denominaciones simblicas usando letras del alfabeto espaol (por ejemplo; x , s y r) Ejemplo: Un estudiante de estadstica esta interesado en determinar algo sobre el promedio del valor en dlares de los automviles que pertenecen al cuerpo docente de nuestra universidad. Cada uno de los 8 trminos descritos puede identificarse en esta situacin. 1) La poblacin es la coleccin de todos los automviles que pertenecen a todos los miembros de del cuerpo docente de la universidad. 2) Una Muestra, es cualquier subconjunto de esa poblacin. Por ejemplo, una muestra serian los automviles que pertenecen a los profesores del departamento de matemticas. 3) La variable, es el valor en dlares de cada automvil individual. 4) Un dato podra ser el valor en dlares de un automvil en particular. El automvil de l Prof. Neyoy, por ejemplo esta valuado en 9,400 dlares. 5) Los datos serian el conjunto de valores que corresponden a la muestra obtenida (9,400; 8,700; 15,950...). 6) El experimento serian los mtodos aplicados para seleccionar los automviles que integren la muestra y determinar el valor de cada automvil de la muestra. Podra efectuarse preguntando a cada miembro del Dpto. de matemticas, o de otros formas. 7) El parmetro sobre el que se esta buscando informacin es el valor promedio de todos los automviles de la poblacin. 8) La estadstica que se encuentre es el valor promedio de todos los automviles de la muestra. II.14.- Distribucin de frecuencias no agrupadas. Los listados de grandes conjuntos de datos no presentan una imagen valiosa de. Algunas veces se desea condensar los datos en una forma ms manejable. Esto puede lograrse con ayuda de una distribucin de frecuencias.

Distribucin de frecuencias.- Listado, a menudo expresado en forma de diagrama, que asocia cada valor de una variable con su frecuencia.

Para ilustrar el concepto de distribucin de frecuencias se usara el siguiente conjunto de datos: 3 2 2 3 2 4 4 1 2 2 4 3 2 0 2 2 1 3 3 1 Si x representa una variable, puede usarse una distribucin de frecuencias para representar este conjunto de datos enumerando los valore x con sus frecuencias. Por ejemplo, el valor 1 se presenta tres veces en la muestra; por tanto, la frecuencia de x = 1 es 3. El conjunto de datos completo esta representado por la distribucin de frecuencias que se muestra en la tabla siguiente: X F 0 1 1 3 2 8 3 5 4 3 L frecuencia f es el nmero de veces de que aparece el valor x en la muestra, La tabla es una distribucin de frecuencias no agrupadas: no agrupadas porque cada valor de x en la distribucin permanece solo. II.15.- Distribucin de frecuencias agrupadas. Cuando en un gran conjunto de datos tiene muchos valores x distintos, en lugar de unos cuantos valores repetidos, como en el ejemplo anterior, es posible agrupar los valores en un conjunto de clases y elaborar una distribucin de frecuencias agrupadas. La representacin de tallo y hojas de la figura (siguiente) muestra, en forma de fotografa, una distribucin de frecuencias agrupadas. 19 PUNTAJES DE EXAMEN 5 2 6 6 8 2 7 6 4 6 8 8 2 6 4 2 9 6 2

2 8

Cada tallo representa una clase. El nmero de hojas en cada tallo es el mismo que la frecuencia de esa misma clase. Los datos representados en la figura, se enumeran como una distribucin de frecuencias de la tabla, siguiente.

DISTRIBUCIN DE FRECUENCIAS AGRUPADAS clase 50 o ms hasta menos que 60 50 60 o ms hasta menos que 70 60 70 o ms hasta menos que 80 70 80 o ms hasta menos que 90 80 90 o ms hasta menos que 100 90 frecuencia 60 1 70 3 80 8 90 5 100 2 19

x x x x x

< < < < <

El proceso de tallo y hojas puede usarse para elaborar una distribucin de frecuencias; no obstante, la representacin del tallo no es compatible con todos los anchos de clase. Por ejemplo, puede ser inconveniente utilizar los anchos de clase 3, 4, 6, o 7. Por tanto, algunas veces es ventajoso contar con un procedimiento por separado para elaborar una distribucin de frecuencias agrupadas. III.16.- Introduccin. Una vez que se han recolectado los datos de la muestra, es necesario familiarizarse con ellos. Una de las formas de ms conocidas para lograr lo anterior es, aplicar una tcnica inicial exploratoria de anlisis de datos que produzca una representacin visual. La representaciones resultantes revelan, visualmente, patrones de comportamiento de la variable en estudio. Hay muchas formas Grficas (visuales) para describir los datos. El mtodo que se aplica es determinado por el tipo de datos y el concepto a representar. Nota: Cuando se elabora una representacin grafica no existe solamente una respuesta correcta. El juicio del analista y las circunstancias que rodean al problema desempean un papel primordial en el desarrollo de la grafica. III.17.- Grfico de lneas.

20 15 10 5 0 1 2 3 4 5 6 7 Y X

III.18.- Histograma.

Un histograma o un histograma de frecuencias esta formado por una serie de rectngulos que tienen sus bases sobre un eje horizontal (eje x) e iguales al ancho de clase, su altura es igual a la frecuencia de clase. HISTOGRAMA: Distribucion muestral de medias muestrales
0.25 0.2 0.15 0.1 0.05 0 1 2 3 4 5 6 7 8 9

III.19.- Polgono de Frecuencias. Un polgono de frecuencias es un Grfica de lneas trazado sobre los puntos medios de cada clase, se obtiene uniendo los puntos medios de los extremos superiores de cada rectngulo. Se acostumbra a prolongar el polgono hasta los puntos medios inferiores y superior de la clase inmediata.

Polgono frecuencias

de

III.20.- Grfico de pastel.


X

1 2 3 4 5

III.21.- Ojivas.

12 10 8 6 4 2 0 1 2 3 4 5 Y X

IV.22- Estimaciones y estimadores. La estimacin de un parmetro poblacional dado por un nmero se llama estima de punto del parmetro. La estima de un parmetro poblacional dada por dos nmeros entre los cuales se considera que se encuentra dicho parmetro se llama estima de intervalo del parmetro. Ejemplo: Si se dice que una distancia viene dada por 5.28 m., se esta dando una estima de punto del parmetro. Si se dice que la distancia es 5.28 0.03 m. es decir, la distancia real se encuentra entre 5.25 y 5.31 m, se esta dando una estima de intervalo. Nota: La precisin o conocimiento del error de una estima se conoce tambin como su seguridad. Estimadores.IV.23.-Estimadores Insesgados ptimos. Definicin.- Estadstica insesgada, es una estadstica de la muestra cuya distribucin muestral tienen un valor medio igual al valor del parmetro de la poblacin que esta estimndose. Una estadstica que no es insesgada es sesgada. Un estadstico se llama estimador insesgado de un parmetro poblacional si la media o esperanza del estadstico es igual al parmetro. El valor correspondiente del estadstico se llama estima insesgado del parmetro. Ejemplo: La media x1, y la varianza 2 son estimadores insesgados de la media poblacional y de la varianza poblacional 2 , puesto que E(x) = , E(2)= 2, los valores x1 y 2 se llaman estims insesgadas, pero no siempre es posible. x + x 2 + ......... + x n 1)..x = 1 n n 2 ( x1 x 2 ) 2 + ( x 2 x) 2 + ..... + ( x n x) 2 2)..S 2 = S = n 1 n 1 2) = 2 E(S

IV.24.-Funcin de Verosimilitud y estimadores mximo-verosmiles. Aunque los lmites de confianza tienen valor para estimar un parmetro poblacional es conveniente tener un estimador por punto. Para obtener

el mejorde tales estimadores empleamos una tcnica conocida como el estimador de mxima verosimilitud, (FISHER). Para ilustrar el mtodo suponemos que la poblacin tiene una funcin de densidad que contiene un parmetro poblacional, por ejemplo , que se va a estimar por un estadstico determinado. Por tanto, la funcin de densidad puede denotarse por f (x1, ) . Suponiendo que hay n observaciones independientes x1,.....,xn, la funcin densidad conjunto para estas observaciones es: L = f (x1, ) f (x2, ). f (xn, ) Que se llama verosimilitud. Estimadores mximo-verosimilitud. La mxima verosimilitud puede tomarse tomando la derivada de L con respecto a e igualamos a 0 (cero). Para este propsito es conveniente tomar primero el logaritmo de y luego la derivada. De esta manera hallamos:

f ( x n , ) f ( x1 , ) 1 1 . . =0 + .......... + f ( x , ) f ( x n , ) De aqu podemos obtener en trminos de xk


El mtodo puede generalizarse, as para el caso donde existan varios parmetros tomamos las derivadas parciales con respecto a cada uno de los parmetros. Los igualamos a cero y resolvemos las ecuaciones resultantes simultneamente. IV.25.-Intervalos de Estimacin. En el intervalo limitado por dos valores y sirve para estimar el parmetro de una poblacin. Los valores que limitan este intervalo son estadsticas calculados a partir de la muestra que se esta utilizando como base para la estimacin. IV.26.-Determinacin del tamao muestral. Tamao de la muestra.- El intervalo de confianza posee dos caractersticas bsicas que determinan su calidad; su nivel de confianza y su ancho. Es preferible que el intervalo tenga un alto nivel de confianza y que sea exacto (estrecho) a la vez. Mientras ms alto sea el nivel de confianza, ms probable es que el intervalo contenga el parmetro, y mientras estrecho es el intervalo ms exacta es la estimacin. No obstante, estas dos propiedades parecen contraponerse, ya que parecera que un intervalo ms ancho es menos exacto. La parte del error mximo de la formula del intervalo de confianza especifica la relacin implicada. E = z . 2 n Las componentes de esta formula son: a) El error mximo E , La mitad de del ancho del intervalo de confianza. b) El coeficiente de confianza, z(/2), que es determinado por el nivel de confianza.

c) El tamao de la muestra,n. d) La desviacin estndar, La desviacin estndar, no es de inters de en este anlisis porque es una constante, (la desviacin estndar, de una poblacin no cambia de valor). IV.24.-Precisin de Estimaciones. As quedan, tres factores. El anlisis de la formula (8.2) indica lo siguiente: el aumentar el nivel de confianza, se hace ms grande el coeficiente de confianza y por tanto, y por tanto se requiere incrementar el error mximo de o el tamao de la muestra; aminorar el error mximo, requiere de la reduccin de del nivel de confianza o bien aumentar el tamao de la muestra; disminuir el tamao de la muestra obliga a que el error mximo se vuelva ms grande o que el nivel de confianza disminuya. Se tiene una lucha tripartita por la supremaca, como se muestra en la figura. Un aumento o una disminucin de cualquiera de los tres factores afectan a uno o a ambos, de los otros dos elementos. El trabajo del experto en estadstica es equilibrar el nivel de confianza. El tamao de la muestra y el error mximo. De modo que se obtenga un intervalo aceptable.

1-

Nivel de confianza

Error mximo

Tamao de la muestra Pg. 296

V.27.- Mtodo de regresin. Aunque el coeficiente de correlacin mide la intensidad de una relacin lineal, no dice nada sobre la relacin matemtica que hay entre las dos variables. En la seccin 3.2, se encontr que el coeficiente de correlacin para los datos lagartijas y sentadillas era de 0.84. Esto implica que existe una relacin lineal entre el nmero de lagartijas y el nmero de sentadillas que hace un estudiante. El coeficiente de correlacin no ayuda a predecir a el nmero de sentadillas que pueda hacer una persona con base en el conocimiento de que puede hacer 28 lagartijas. El anlisis de regresin encuentra la ecuacin de la recta que describe mejor la relacin entre dos variables. Una aplicacin de esta ecuacin es hacer predicciones. Hay muchas situaciones en las que estas predicciones se usan regularmente; Por ejemplo, predecir el xito que tendr un estudiante en la universidad con base en los resultados que obtuvo en el bachillerato, y averiguar la distancia necesaria para detener un automvil conociendo su velocidad.

En general, el valor exacto de y no es predecible: sin embargo, las aproximaciones a este valor son de utilidad si las predicciones son razonablemente acertadas. La relacin entre estas dos variables es una expresin algebraica que describe la relacin matemtica entre x & y . A continuacin se presentan algunos ejemplos de varias relaciones posibles, denominadas modelos o ecuaciones de prediccin: Lineal: = b0 + b1x Cuadrtica: = a + bx + cx2 Exponencial: = a (bx) Logartmica: = a logbx Regresin lineal con pendiente positiva negativa X Regresin lineal con pendiente x

Figura V.1 Y Regresin curvilnea (cuadrtica) X

figura V.2 y No hay relacin x

(Regresin no lineal) Y
figura V.3 figura V.4

V.28.- Regresin lineal mnimo cuadrtica. Si un modelo de lnea recta parece idneo, la recta del mejor ajuste se encuentra aplicando el mtodo de mnimos cuadrados suponga que: = b0 + b1x

Es la ecuacin de una recta, donde: (que se lee como y gorro) representa el valor estimado de y que corresponde a un valor particular de x. El criterio de mnimos cuadrados requiere encontrar las constantes de b0 y b1 tales que la sumatoria (y- )2 sea lo ms pequea posible (figura A). = b0 + b1x y (x, ) y- Figura A (x, y)

y x

En la figura A se muestra la distancia de un valor observado de y a un valor estimado de . La longitud de esta distancia representa el valor (x, ), mostrado como el segmento de recta de lnea gruesa de la figura A, Observe que (y- ) es positivo cuando el punto (x, y) por arriba de la recta, y es negativo cuando (x, y) esta por debajo de la recta.

En la figura B se muestra un diagrama de dispersin con una posible recta del mejor ajuste, junto con los 10 valores individuales de (y- ) . Los valores positivos se muestran con lnea gruesa, y los valores negativos con lnea (punteada). Si la recta es, en efecto la del mejor ajuste, la suma de los cuadrados de estas diferencias se minimiza (se hace lo ms pequea posible).

+1 +1.5 +2.5 -1.5 -1 +1 +1 -2.5 -1 -1 x (y- )2 = (-1)2 + (+1)2 +...........+ (+1)2 = 23 La recta el mejor ajuste Figura B

En la figura C, Se muestra los mismos puntos que en la figura B con los 10 valores individuales (y- ) , asociados a una recta que, definitivamente, no es la del mejor ajuste. El valor de (y- )2 es 149, mucho mayor que el 23 de la figura B. Cada recta diferente trazada a partir de este conjunto de 10 puntos, produce un valor distinto de (y- )2 . La tarea consiste en encontrar la recta tal que el valor de (y- )2 sea menor posible.

No es la recta la mejor curva de ajuste. (y- )2 = (-6)2 +(-4)2 ......+(+6)2 = 149.0 La ecuacin de la recta del mejor ajuste es determinada por su pendiente (b1), y su ordenada al origen (a0). Los valores de la constantes, pendiente y ordenada al origen, que satisfacen el criterio de mnimos cuadrados se encuentran aplicando las siguientes formulas.
( x x)( y y ) ......................3.5 ( x x ) 2 ( suma..de.. y ) [( pendiente)( suma..de..x)] Ordenada..al..origen;......b0 = numero y(b1. x) ..........................3.6 ordenada..al..origen...b0 = n Para encontrar la pendiente b1 se usara una equivalencia matemtica de la formula (3.5), que utilice la suma de los cuadrados determinados en los clculos preliminares de la correlacin. SC ( xy ) .................................3.7 Pendiente;..................b1 = SC ( x) Observe que el numerador de la formula (3.7) es la SC(xy) de la formula (3.4) y que el denominador es la formula (2.8) de los clculos del coeficiente de correlacin. Entonces, si ya ha calculado previamente el coeficiente de correlacin lineal aplicando. El procedimiento delineado en <(la hoja no) (seccin .3.2) , es fcil encontrar la pendiente de la recta del mejor ajuste. Si no ha calculado previamente r, elabore una tabla semejante (3.11) y complete los clculos preliminares necesarios.

Pendiente;.....................b1 =

Ahora se consideraran los datos de la ilustracin (3.7) y la cuestin es predecir las sentadillas efectuadas por un estudiante con base en el nmero de lagartijas hechas. Se requiere encontrar la recta del mejor ajuste, = b0 + b1x. Los clculos ya han sido completados en la tabla (3.11) . Para calcular la pendiente, b1, usando la formula (3.7), recuerde que; SC (xy) =919.0 y que SC(x) = 1396.9. SC ( xy ) 919.0 = = 0.6579 = 0.66 pendiente......b1 = SC ( x) 1396.9 Para calcular la ordenada al origen, b0, usando la formula (3.6), recuerde que por la tabla de extensiones, x = 351, y y = 380.

Ordenada..al..origen.......b0 =
=

y (b . x) = 380 (0.6579)(351)
1

10

380 230.9229 = 14.9077 = 14.9 10 Asi..la..ecuacion..de..la..recta..es........ y = 14.9 + 0.66 x

V.29.- Anlisis de la bondad de ajuste. El problema de ensayar la bondad de ajuste de las distribuciones tericas a las distribuciones mustrales es esencialmente el mismo que al decidir si hay diferencias importantes entre los valores de la poblacin y la muestra. Un ensayo de significacin importante para la bondad de ajuste de distribuciones tericas, el ensayo Chi-cuadrado. En un intento para determinar si una distribucin normal representa un buen ajuste para datos dados, conviene usar un papel Grfica de curva normal o papel de probabilidad, como a veces se llama. Ensayo Chi-cuadrado para la bondad de ajuste. Para determinar si la proporcin P de xitos en una muestra de tamao n extrada de una poblacin binomial difiere de la proporcin poblacional P de xitos, hemos usado el estadstico dado por (5) o (6). P p .................................(5) Z= p ( q / n) Z= x np ......................................(6) npq

En este caso sencillo solamente dos sucesos A1, A2 pueden ocurrir, que los hemos llamado xito y fracaso con probabilidades p y q = 1 p. Un valor muestral especifico de la variable aleatoria x = np se llama frecuencia observada para el suceso A1 en tanto que np se llama la frecuencia esperada o terica.

Ejemplo: Si obtenemos una muestra de 100 lanzamientos de una moneda honrada, de modo que n = 100, p = , entonces la frecuencia esperada de caras (xitos) es: Np = (100)(1/2) = 50 La frecuencia observada en la muestra podra lgicamente ser diferente. Una generalizacin al caso donde pueden ocurrir k sucesos posibles A1, A2, ......,AK con probabilidades p1, p2, ...., pk , respectivamente. En tal caso tenemos una poblacional multinomial. ...si x Z= / n Si extraemos una muestra de tamao n de esta poblacin, las frecuencias observadas para los sucesos , A1, A2, ...,Ak pueden describirse por las variables aleatorias x1,...,xk (cuyos valores especficos

x1, x2,...xk, serian las frecuencias observadas para la muestra) en tanto que las frecuencias esperadas estaran dadas por np1, ......, npk respectivamente. Los resultados pueden indicarse como se muestra en la siguiente tabla.

Suceso A1 Frecuencia observada x1 Frecuencia esperada np1 V.30.- Regresin No lineal y mltiple.

A2 x2 np2

........... ........... ...........

Ak xk npk

Regresin no lineal: Muy a menudo en la practica se encuentra que existe una relacin entre dos, (o ms) variables y se desea expresar esta relacin en forma matemtica, determinando una ecuacin que conecte dos variables. 1) Un primer paso es la coleccin de datos indicando los valores correspondientes de las variables. 2) El siguiente paso es dibujar los puntos (x, y) en un sistema de coordenadas rectangulares. El conjunto resultante se llama diagrama de dispersin. Del diagrama de dispersin es posible frecuentemente visualizar una curva que se aproxime a los datos. Dicha curva se llama curva de aproximacin, en la figura (V.1 ) por ejemplo se observa que los datos se aproximan bien por una recta y decimos que existe una regresin lineal entre las variables.

Sin embargo, en la figura (V.3) , aunque existe una relacin entre las variables esta no es una relacin lineal y por eso la llamamos regresin no lineal. Regresin lineal mltiple. Por ejemplo, si creemos que hay una relacin lineal entre una variable dependiente de z sobre x, y, entonces buscaramos una ecuacin conectando las variables que tenga la forma: z = a + bx + cy..............................( A) Esta se denomina ecuacin de regresin de z sobre x, y, . Si x es la variable dependiente una ecuacin semejante se llamara ecuacin de regresin de x sobre y, z. Puesto que (A), representa un plano en un sistema de coordenadas rectangulares tridimensional se llama con frecuencia plano de

regresin. Para hallar el plano de regresin de mnimos cuadrados a, b, c en (A) de modo que:

z = na + b x + c y xz =a x + b x + c xy yz = a y + b xy + c y
2

Estas funciones llamadas las ecuaciones normales correspondientes a (A), se obtienen como resultado de aplicar una definicin anloga (pendiente ref.) advirtase que puede obtenerse formalmente de (A), multiplicando por 1, x, y respectivamente y sumando

V.31.- Correlacin total, parcial y mltiple. Correlacin lineal: El objetivo primordial del anlisis de correlacin lineal es medir la intensidad de una relacin lineal entre dos variables. Se analizaran algunos diagramas de dispersin que muestran diferentes relaciones entre variables independientes o de entrada, x, y variables dependientes o de salida, y, Si a medida que crece x no hay un cambio definido en los valores de y, se dice que no hay correlacin o relacin entre x & y. Si a medida que crece x, hay un cambio en los valores de y, existe una correlacin. La correlacin es positiva cuando y tiende a crecer, y es negativa cuando y tiende a decrecer. Si los pares ordenados (x, y) tienden a seguir un patrn de lnea recta, se tiene una correlacin lineal. Los diagramas de dispersin siguientes ilustran estas ideas: DIAGRAMA DE DISPERSIN Y CORRELACIN

No hay correlacin alta

Correlacin positiva

Correlacin positiva

Correlacin negativa

Correlacin negativa alta

La correlacin lineal perfecta ocurre cuando todos los puntos estn exactamente sobre una recta, como se observa en la siguiente figura. Esta correlacin puede ser positiva o negativa, dependiendo de si y crece o decrece a medida que x se incrementa. Silos datos forman una recta horizontal o vertical, no hay correlacin, ya que una variable no afecta a la otra.

Correlacin positiva perfecta

Correlacin negativa perfecta

VI.32.-Introduccin.Naturaleza de la prueba de hiptesis: Todo mundo toma decisiones en la vida diaria. Algunas de estas decisiones son de fundamental importancia y otras aparentemente insignificantes. Todas las decisiones siguen el mismo patrn bsico. Se ponderan las alternativas; luego, con base en las convicciones y preferencias personales, y cuales sean los hechos disponibles, se llega a una decisin y se emprende la accin idnea. La prueba de hiptesis sigue casi el mismo proceso, excepto que implica informacin estadstica. Un amigo suyo va hacer una fiesta (para celebrar el sper tazn por que acaba de ingresar a la universidad; usted conoce la situacin, cualquier pretexto sirve) a la que usted esta invitado. Debe tomar una decisin de: ir o no ir. Decisin simple; buena tal vez, a salvo que usted desea asistir solo si esta convencido de que la fiesta ser ms divertida que las reuniones clsicas de sus amigo; adems, definitivamente no quiere asistir si solo va a ser un desastre de fiesta. Usted ha asumido la posicin de que la fiesta ser un fracaso y no asistir a menos que se convenza de lo contrario. Su amigo le asegura Esta garantizado, la fiesta ser un xito . Asistir usted o no?. El proceso de toma de decisiones comienza con la identificacin de algo de inters y luego con el planteamiento de dos hiptesis al respecto. VI.33.- Hiptesis y modelos HIPTESIS.- Afirmacin de que algo es verdadero. La afirmacin de su amigo La fiesta ser un xito es una hiptesis. Su posicin de que la fiesta ser un fracaso tambin es una hiptesis. VI.34.- Prueba de hiptesis estadstica

Proceso que permite tomar una decisin entre dos hiptesis opuestas. Estas hiptesis se plantean de modo que una es la negacin de la otra (de esta forma una de ellas siempre es verdadera y la otra es falsa). Luego, una hiptesis se prueba con la esperanza de poder demostrar que su ocurrencia es muy improbable, implicndose as que la otra hiptesis es probablemente verdadera. Las dos hiptesis presentes en la toma de una decisin se denominan hiptesis nula e hiptesis alternativa.

VI.35.-La hiptesis nula. (Ho) Es la hiptesis que se prueba. Por lo general, es una afirmacin sobre un parmetro poblacional que tiene un valor especfico. La hiptesis nula se denomina as porque es el punto inicial de la investigacin (en su interpretacin a menudo se usa la frase no hay diferencia). VI.36.- Hiptesis alternativa. (Ha) Es la afirmacin sobre el mismo parmetro da la poblacin que se usa en la hiptesis nula. En general, es una afirmacin que especifica que el parmetro de la poblacin tiene un valor diferente, de alguna manera, del

valor proporcionado en la hiptesis nula. El rechazo de la hiptesis nula implica la probable veracidad de la hiptesis alternativa. Con respecto a la fiesta de su amigo, los dos puntos de vista o hiptesis opuestos son: La fiesta ser un xito, y La fiesta ser un fracaso. Cul afirmacin se vuelve hiptesis nula y cual alternativa? Un paso muy importante es determinar las afirmaciones de las hiptesis nula y alternativa. La idea bsica de la prueba de hiptesis es que los hechos tengan la posibilidad de refutar la Ho. La hiptesis nula es la afirmacin que podra ser refutada por los hechos. Su inters (conviccin o resultado deseado), como la persona que realiza la prueba, se expresa en la hiptesis alternativa. Siendo usted quien toma la decisin, considera que los hechos demostraran la factibilidad de su teora al demostrar la improbabilidad de la veracidad de la hiptesis nula. Algunas veces, la hiptesis alternativa se denomina hiptesis de investigacin, ya que representa lo que el investigador espera encontrar como verdadero (De ser as el investigador publicara un articulo sobre la investigacin). Debido a que los hechos (quien asiste a la fiesta, que se ofrecer en esta, etc.) solo pueden demostrar la improbabilidad de que la reunin ser un fracaso, su postura inicial, La fiesta ser un fracaso, se

convierte en la hiptesis nula. As, la afirmacin de su amigo, La fiesta ser un xito , se vuelve la hiptesis alternativa. Ho: La fiesta cera un fracaso vs. Ha: La fiesta ser un xito.

INTEGRACIN CONCEPTUAL: (El Titular Acadmico, conocer las


respuestas). La tecnologa de los mtodos cientficos se aborda de manera axiomtica a travs de las tcnicas de anlisis de los fenmenos estocsticos. --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------REPORTES CRTICOS O SUGERENTES A: MC Ernesto Guerra Garca, Coordinador General Educativo. (Correo electrnico: eguerra@uaim.edu.mx ) Benito Jurez No. 39, Mochicahui, El Fuerte, Sinaloa, Mxico. C.P. 81890, Tel. 01 (698) 8 92 00 42. -------------------------------------------------------------------------------------------------------UNIVERSIDAD AUTNOMA INDGENA DE MXICO Mochicahui, El Fuerte, Sinaloa Jurez 39, C.P. 81890. Tel y fax: (698)8 92 00 42 y 8 92 00 23 Correo electrnico:_ uaim@uaim.edu.mx Pgina Web: http//www.uaim.edu.mx

También podría gustarte