Universidad Nacional Experimental Simn Rodrguez Asignatura: Terminologia en Estadistica e Investigacion
Facilitador: Participantes: Ronhiel Blanca Maria Blanquicett. C.I 24.891.069 Anabel Silva C.I 18.237.945 Johana Salazar C.I 18.598.555 Thisika Carter C.I 27.010.368 Brian Centeno C.I 24.378.431
Ciudad Bolivar, 11 de abril de 2014 ndice Pg Introduccin.1 Desarrollo 2 Qu son las medidas de variabilidad? 2 Rango..2 Rango para datos agrupados....3 Mediana de las desviaciones absolutas (la media).3 Coeficiente de variacin.4 Correlacin y Causalidad5 Probabilidades...6 Mtodos de medicin de Probabilidad...7 Conclusin..10 Bibliografa..11
Introduccin Una medida de dispersin o variabilidad nos determina el grado de acercamiento o distanciamiento de los valores de una distribucin frente a su promedio de localizacin, sobre la Base de que entre ms grande sea el grado de variacin menor uniformidad tendrn los datos (sinnimo de heterogeneidad) y por lo tanto menor representatividad o confiabilidad del promedio de tendencia central o localizacin por haber sido obtenido de datos dispersos. Por el contrario, si este valor es pequeo (respecto a la unidad de medida) entonces hay una gran uniformidad entre los datos. Cuando es cero quiere decir que todos los datos son iguales. Hay bsicamente dos tipos de medidas de dispersin: Medidas Absolutas y Medidas Relativas. Las absolutas se caracterizan por ser nmeros concretos, es decir, valores expresados en las mismas unidades de la variable en estudio y que por lo tanto no permiten comparaciones o anlisis respecto a la mayor o menor dispersin de series expresadas en diferentes unidades. Estas medidas son: la varianza, la desviacin estndar y el rango intercuartilico. Las medidas relativas de dispersin son valores abstractos, es decir, medidas a dimensionales y por lo tanto no expresadas en ninguna unidad especfica, obviando as el inconveniente sealado para las medidas absolutas. La principal medida es el Coeficiente de variacin. La probabilidad es una herramienta de ayuda para la toma de decisiones porque proporciona una forma de medir, expresar y analizar las incertidumbres asociadas con eventos futuros de razones entre el nmero de casos favorables y el nmero de casos posibles.
Desarrollo Qu son las medidas de variabilidad? La puntuacin media en una distribucin es importante en muchos contextos de investigacin. Pero tambin lo es otro conjunto de estadsticos que cuantifican que tan variables, o que tan dispersas, tienden a ser las puntuaciones. Las puntuaciones varan mucho, o tienden a tener valores muy similares. A veces, la variabilidad en las puntuaciones es la cuestin central en una investigacin. La variabilidad es un concepto cuantitativo, de modo que nada de esto se aplica a las distribuciones de datos cualitativos. Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al aplicar una medida de variabilidad podemos evaluar la medida de tendencia central utilizada. Una medida de variabilidad pequea indica que los datos estn agrupados muy cerca, digamos, de la media. La media, por lo tanto es considerada bastante representativa de la serie de datos. Inversamente, una gran medida de variabilidad indica que la media no es muy representativa de los datos. Una segunda razn para estudiar la variabilidad de una serie de datos es para comparar como estn esparcidos los datos en dos o ms distribuciones. Por ejemplo, la calificacin promedio de dos estudiantes, A = {90, 80, 75, 75 } y B = {90, 55, 85, 90 }, es de 80. Basados en esto podramos pensar que sus calificaciones son idnticas. Pero si revisamos el detalle de sus calificaciones vemos que esta conclusin no es correcta. Hay muchas medidas de variabilidad intuitivamente atractivas, pero poco utilizadas, como el rango, la desviacin media y la desviacin cuartilar. De lejos, las medidas de variabilidad ms ampliamente utilizadas son las que tienen que ver con cmo extender los resultados a partir de la media. Estas son la desviacin estndar (s), y la varianza (s o "var"). Rango La forma ms sencilla de medir la variabilidad es el rango. Es la diferencia entre los ms altos y ms bajos valores en un conjunto de datos no agrupados. En la forma de una ecuacin: Rango = valor ms alto - valor ms bajo El rango tiene la ventaja de ser fcil de calcular y entender. Ejemplo: Las calificaciones de cinco estudiantes de estadstica son: 8, 8, 10, 6, y 8. Cul es el rango de las calificaciones? Rango = valor ms alto - valor ms bajo = 10 - 6 = 4 Rango para datos agrupados Para estimar el rango de una distribucin de frecuencia se resta el lmite inferior del intervalo de clase ms chico del lmite superior del intervalo de clase ms grande Ejemplo: Una muestra de las edades del pblico de un concierto se encuentra distribuida de la siguiente manera: Edades Nmero de personas 15 - 19 2 20 24 1 25 29 4 30 34 15 35 - 39 10 40 - 44 5 45 - 49 3 Rango = mayor limite superior - menor lmite inferior = 49 - 15 = 34 (Valor absoluto de un nmero a = | a | es el nmero a sin su signo.)
Mediana de las desviaciones absolutas (la media) Cuando la mediana es la medida de tendencia que mejor representa los datos, la Meda es la medida ms apropiada. Se calcula mediante:
Es decir, contiene la mediana de las diferencias, en valor absoluto, respecto a la mediana. El proceso de clculo supone que se debe obtener, en primer lugar, el valor de la mediana de la muestra y, a continuacin, obtener las diferencias en valor absoluto de cada uno de los valores con la mediana. Luego se ordenan estas diferencias y se determina la mediana. Ejemplo Suponga que se tiene la siguiente muestra 10, 10, 11, 12, 12, 13, 14, 15, 15, 15, 16, 18, 19 Aqu la mediana es 7 Las respectivas desviaciones en valor absoluto de cada dato con respecto a la mediana son: 4, 4, 3, 2, 2, 1, 0, 1, 1, 1, 2, 4, 5 Reordenando se tiene 0, 1, 1, 1, 1, 2, 2, 2, 3, 4, 4, 4, 5 Y as la meda es 2 Coeficiente de variacin Es una medida que se emplea fundamentalmente para: 1. Comparar la variabilidad entre dos grupos de datos referidos a distintos Sistema de medidas de medida. Por ejemplo, kilogramos y centmetros. 2. Comparar la variabilidad entre dos grupos de datos obtenidos por dos o ms personas distintas. 3. Comparar dos grupos de datos que tienen distinta media. 4. Determinar si cierta media es consistente con cierta varianza. El Coeficiente de variacin muestral se denota y se define como:
Ejemplo Con un micrmetro, se realizan mediciones del dimetro de un balero, que tienen una media de 4.03 mm y una Desviacin estndar de 0.012 mm; con otro micrmetro se toman mediciones de la longitud de un tornillo que tiene una media de 1.76 pulgadas y una desviacin estndar de 0.0075 pulgadas. Cul de los dos micrmetros presenta una variabilidad relativamente menor? Los coeficientes de variacin son: CV = y CV = En consecuencia, las mediciones hechas por el primer micrmetro exhiben una variabilidad relativamente menor con respecto a su media que las efectuadas por el otro micrmetro. Correlacin y Causalidad Con respecto a la determinacin de causalidad, debemos ser siempre extremadamente cautelosos. Como ya dijimos la existencia de correlacin no implica causalidad. En el mejor de los casos, los estadsticos pueden establecer una correlacin entre diferentes elementos, esto es, que los elementos que se estn midiendo se comportan como si estuvieran relacionados. Y por cierto, tambin pueden establecer que no hay ninguna relacin entre los objetos estudiados. Pero la estadstica no puede establecer causalidad. En otras palabras, no se puede inferir causalidad sobre la base de una correlacin emprica.
El hecho de que dos variables parezcan estar correlacionadas no necesariamente significa que una est causando a la otra. Para empezar, la relacin podra ser falsa o casual. Pero la relacin entre las variables tambin puede ser el resultado de una tercera variable que causa o explica las otras dos, y que por lo tanto lleva a que las dos variables causadas por esta tercera parezcan estar relacionadas entre s. Por ejemplo, si en una escuela primaria uno midiera la relacin entre las habilidades aritmticas de los estudiantes y las estaturas de estos, se concluira que, de hecho, existe una correlacin positiva entre estatura y habilidades aritmticas, es decir, mientras mayor es la estatura de los estudiantes, mayores son sus habilidades aritmticas. Sin embargo, sabemos que la altura no hace que los estudiantes aprendan matemtica ni que el aprendizaje de la aritmtica hace que los estudiantes sean ms altos. En este caso, que es muy evidente, hay un tercer factor que explica la correlacin entre las mejores habilidades aritmticas y la estatura de los estudiantes: la edad de los estudiantes. De modo que no es que los estudiantes ms altos sean mejores para la aritmtica, sino que los estudiantes de ms edad, o sea en los niveles ms altos, tienden a ser ms altos y a tener mayores habilidades aritmticas. Hay un tercer factor que explica las dos variables y que por este motivo parecen estar relacionadas, pero en realidad no hay ninguna relacin entre ellas.
Desafortunadamente, la mayora de nosotros tenemos la tendencia a inferir automticamente una relacin de causalidad sobre la base de una correlacin. Pero para sostener una causalidad se debe siempre ir ms all de los hechos empricos y buscar una explicacin o teora aceptable que conecte convincentemente las variables involucradas. Una teora es a un conjunto de hechos o datos, lo que un edificio es a un montn de ladrillos. Una teora, que desde luego debe resistir sistemticamente las pruebas empricas, es la que proporciona la base para hablar de una relacin causal entre variables y as darle significado real a los datos. En los siguientes prrafos presentamos algunos ejemplos especficos para la educacin que deberan ayudarlo a pensar un poco ms acerca de las relaciones de causalidad entre las variables. Los ejemplos tratan de subrayar la necesidad, como usted bien sabe, de ser muy cautelosos al extraer conclusiones sobre la base de una correlacin. 1. Los cambios a largo plazo en la remuneracin de los maestros primarios y las tasas de matrcula primaria estn correlacionados. En la mayor parte del mundo, a partir de los aos sesenta han aumentado tanto las remuneraciones reales de los maestros primarios como las tasas de matrcula, pero significa esto que el aumento de los salarios de los maestros constituye la causa del aumento de las matrculas en educacin primaria? No necesariamente. En primer lugar, una tercera causa podra explicar la correlacin entre las dos variables. En general, tres dcadas de desarrollo econmico a su vez han originado mayores presupuestos para la educacin y esto ha permitido que los pases aumenten simultneamente las remuneraciones de los maestros primarios y las matrculas.
En segundo lugar, y lo que es muy importante, hay explicaciones ms plausibles para el crecimiento simultneo de las tasas de matrcula primaria y la remuneracin real de los maestros primarios, aunque esto ltimo podra tener algn efecto indirecto al mejorar la calidad de la enseanza. 2. En muchos pases en desarrollo, aunque no en todos, los alumnos de las escuelas privadas tienden a tener mejor rendimiento que los estudiantes de escuelas pblicas en pruebas de rendimiento en matemtica y lectura. Significa esta correlacin entre el tipo de escuela y el rendimiento de los estudiantes que las escuelas privadas (escuelas relativamente autnomas, manejadas en forma relativamente autnoma por administradores privados) imparten una mejor enseanza de matemticas y lectura a los nios que las escuelas pblicas (escuelas con poca autonoma, manejadas por funcionarios pblicos supervisados atentamente y regulados en forma rigurosa)? No necesariamente.
La autonoma de la administracin de las escuelas y el conjunto de incentivos asociados con ello podra constituir una parte de la explicacin, pero otras variables tendran tambin gran peso en ayudar a explicar las diferencias en los resultados de aprendizaje de los estudiantes en escuelas privadas y pblicas en pases en desarrollo. Una explicacin alternativa, y bastante razonable, es el hecho de que en los pases en desarrollo, los nios de las escuelas privadas tienden a provenir de estratos socioeconmicos ms altos que los nios de las escuelas pblicas y por lo tanto son factores independientes de las escuelas los que tienden a explicar las diferencias en los resultados. Otra explicacin razonable es que las escuelas privadas tienen mayores recursos por estudiante que las pblicas. Desde luego, esto no descarta que la autonoma de las escuelas privadas para determinar la poltica educacional, junto con su mayor responsabilidad frente a las familias de los estudiantes, tambin ayude a explicar porqu los estudiantes de las escuelas privadas obtienen, en gran parte de los pases en desarrollo, mejores resultados. Probabilidades. Las probabilidades constituyen una rama de las matemticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que un suceso o experimento produzca un determinado resultado. La probabilidad est basada en el estudio de la combinatoria y es fundamento necesario de la estadstica. La creacin de la probabilidad se atribuye a los matemticos franceses del siglo XVII Blaise Pascal y Pierre de Fermat, aunque algunos matemticos anteriores, como Gerolamo Cardano en el siglo XVI, haban aportado importantes contribuciones a su desarrollo. La probabilidad matemtica comenz como un intento de responder a varias preguntas que surgan en los juegos de azar, por ejemplo saber cuntas veces se han de lanzar un par de dados para que la probabilidad de que salga seis sea el 50 por ciento. La probabilidad de un resultado se representa con un nmero entre 0 y 1, ambos inclusive. La probabilidad 0 indica que el resultado no ocurrir nunca, y la probabilidad 1 que el resultado ocurrir siempre. Los problemas ms sencillos estudian la probabilidad de un suceso favorable en un experimento o acontecimiento con un nmero finito de resultados, todos ellos con igual probabilidad de ocurrir. Si un experimento tiene n posibles resultados, y f de ellos se consideran favorables, la probabilidad de un suceso favorable es f/n. Por ejemplo, un dado no trucado se puede lanzar de seis formas posibles, por tanto, la probabilidad de que salga un 5 un 6 es 2/6. Problemas ms complicados estudian acontecimientos en que los distintos resultados tienen distintas probabilidades de ocurrir. Por ejemplo, encontrar la probabilidad de que salga 5 6 al lanzar un par de dados: los distintos resultados (2, 3,12) tienen distintas probabilidades. Algunos experimentos pueden incluso tener un nmero infinito de posibles resultados, como la probabilidad de que una cuerda de circunferencia dibujada aleatoriamente sea de longitud mayor que el radio. Los problemas que estudian experimentos repetitivos relacionan la probabilidad y la estadstica. Algunos ejemplos: encontrar la probabilidad de obtener 5 veces un 3 y al menos 4 veces un 6 al lanzar un dado, sin hacer trampas, 50 veces; si una persona lanza una moneda al aire y da un paso hacia delante si sale cara y un paso hacia atrs si sale cruz, calcular la probabilidad de que, despus de 50 pasos, la persona est a menos de 10 pasos del origen. El uso ms generalizado de la probabilidad es su utilizacin en el anlisis estadstico. Por ejemplo, la probabilidad de sacar 7 al lanzar dos dados es 1/6, lo que significa (se interpreta como) que al lanzar dos dados aleatoriamente y sin hacer trampas, un gran nmero de veces, alrededor de un sexto de los lanzamientos darn 7. La probabilidad matemtica se utiliza mucho en las ciencias fsicas, biolgicas y sociales, as como en el comercio y la industria. Se aplica a muchas reas tan dispares como la gentica, la mecnica cuntica y los seguros. Tambin estudia problemas matemticos tericos de gran importancia y dificultad y est bastante relacionada con la teora del anlisis matemtico, que se desarroll a partir del clculo.
La probabilidad mide la mayor o menor posibilidad de que se d un determinado resultado (suceso o evento) cuando se realiza un experimento aleatorio. Para calcular la probabilidad de un evento se toma en cuenta todos los casos posibles de ocurrencia del mismo; es decir, de cuntas formas puede ocurrir determinada situacin. Los casos favorables de ocurrencia de un evento sern los que cumplan con la condicin que estamos buscando. La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%): El valor cero corresponde al suceso imposible; ejemplo: lanzamos un dado al aire y la probabilidad de que salga el nmero 7 es cero. El valor uno corresponde al suceso seguro, ejemplo: lanzamos un dado al aire y la probabilidad de que salga cualquier nmero del 1 al 6 es igual a uno (100%). El resto de sucesos tendr probabilidades entre cero y uno: que ser tanto mayor cuanto ms probable sea que dicho suceso tenga lugar. Mtodos de medicin de Probabilidad Uno de los mtodos ms utilizados es aplicando la Regla de Laplace: define la probabilidad de un suceso como el cociente entre casos favorables y casos posibles.
Ejemplos: a) Probabilidad de que al lanzar un dado salga el nmero 2: el caso favorable (f) es tan slo uno (que salga el dos), mientras que los casos posibles (n) son seis (puede salir cualquier nmero del uno al seis). Por lo tanto: (o lo que es lo mismo, 16,6%) b) Probabilidad de que al lanzar un dado salga un nmero par: en este caso los casos favorables (f) son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles (n) siguen siendo seis. Por lo tanto: (o lo que es lo mismo, 50%) c) Probabilidad de que al lanzar un dado salga un nmero menor que 5: en este caso tenemos cuatro casos favorables (f) (que salga el uno, el dos, el tres o el cuatro), frente a los seis casos posibles. Por lo tanto: (o lo que es lo mismo, 66,6%) d) Probabilidad de ganarse el premio mayor de una lotera en la que juegan 100.000 nmeros nos: tan slo un caso favorable (f), el nmero que jugamos, frente a los 100.000 casos posibles (n). Por lo tanto: (o lo que es lo mismo, 0,001%) d) Probabilidad al lanzar una moneda, con un guila en una cara y un sol en la otra. Hay dos casos posibles (n) de ocurrencia (o cae guila o cae sol) y slo un caso favorable (f) de que pueda caer guila (pues slo hay un guila en la moneda). Por lo tanto: (o, lo que es lo mismo, 50 %)
Existe una probabilidad del 50% de obtener un guila al tirar una moneda.
e) Probabilidad de elegir tal o cual fruta. Si en una canasta hay 20 peras y 10 manzanas. Qu fruta es ms probable que saque al azar de la canasta?
Para este ejemplo tenemos que 30 es el total de frutas en la canasta; es decir los casos posibles (n). Para calcular la probabilidad de sacar una manzana los casos favorables (f) son 10 puesto que existen slo 10 manzanas. Por lo tanto: (o, lo que es lo mismo, 33,3 %) (o, lo que es lo mismo, 66,7 %) Fjate bien que 33,3% + 66,7% es igual al 100% porque siempre que saquemos algo de la canasta es seguro que ser una fruta
Conclusin Podemos concluir que una medida razonable de la variabilidad podra ser la amplitud o rango, que se obtiene restando el valor ms bajo de un conjunto de observaciones del valor ms alto. Es fcil de calcular y sus unidades son las mismas que las de la variable, aunque posee varios inconvenientes: No utiliza todas las observaciones (slo dos de ellas); Se puede ver muy afectada por alguna observacin extrema; El rango aumenta con el nmero de observaciones, o bien se queda igual. En cualquier caso nunca disminuye. la estadstica es una rama de la matemtica que est no se encuentra muy visible en lo cotidiano pero que en realidad es de mucha utilidad para interpretar y ver desde un punto de vista muy general datos que se obtienen. A travs de sus grficas, medidas de tendencia central, variabilidad y de dispersin podemos ver mas claro y concreto un conjunto de datos que se nos hacen muy complicados, en resumen es un verdadero mtodo de ayuda para informar.