Está en la página 1de 47

Probabilidad y estadstica

[Escribir el subttulo del documento]


[Escriba aqu una descripcin breve del documento. Una descripcin breve es un resumen corto del contenido del documento. Escriba aqu una descripcin breve del documento. Una descripcin breve es un resumen corto del contenido del documento.]

[Seleccionar fecha]

INTRODUCCION
El siguiente trabajo va dirigido a los alumnos, con temas interesantes en los cuales se mostraran definiciones, que podrn servir en su aprendizaje en la materia de estadstica y probabilidad. Por lo consiguiente se hicieron 6 objetivos con el fin de cumplir las expectativas del trabajo. La siguiente exposicin y la investigacin que est en la misma se les proporciona a los alumnos para que sepan los conceptos investigados. Tambin es importante mencionar que los conceptos son bsicos y muy interesantes, por ms que mencionar se hicieron tres objetivos los cuales se espera que se cumplan con la explicacin de la investigacin.

OBJETIVOS
El alumno aprender las bases de la probabilidad Conocer el origen de la probabilidad Saber cmo se relaciona la probabilidad en la vida cotidiana Conocer que es un Modelo Probabilstico Saber cuntos Modelos discretos hay Conocer el modelo continuo Conocer que es un espacio muestral Como se saca el espacio muestral de un problema Como se representa Conocer que es un espacio muestral Como se saca el espacio muestral de un problema Como se representa Saber que es un evento Realizar un evento sencillo Conocer Los tipos de evento Conocer las corrientes de la probabilidad Ver en qu se diferencia una de otra Como resolver problemas con ellas Conocer las tcnicas de conteo Pasos a seguir sobre las tcnicas de conteo Aplicacin de las mismas Conocer el diagrama de rbol Realizacin del mismo Saber las partes del mismo Saber que es una permutacin y una combinacin Saber las formulas de las mismas Ver diferencias entre ambos Que el alumno conozca ms el concepto de probabilidad. Que comprenda cuando es un evento dependiente y un evento independiente. Que conozca acerca del teorema de bayes. Que conozca lo que es una variable discreta y sus tipos de distribucin. Y que los alumnos se enfoquen ms con la materia de probabilidad y estadstica y conceptos bsicos de la misma.

BASES DE LA PROBABILIDAD
Comenz siendo una coleccin de observaciones con respecto al juego de dados con el tiempo se a convertido en una rama importante sima de las matemticas. Es el estudio de los hechos morales y fsicos del mundo y su conjunto expresado y presentado cuadros o tablas como material de comparacin y deduccin Es importante mencionarles que se dio por la observacin del juego de dados, y por lo tanto la probabilidad se convirti en una rama pura y aceptable. En el siglo XIX Fermat en su obra Teora Analtica de la probabilidad y Felmugurov hicieron que la probabilidad se hiciera una ciencia. Por lo tanto se puede decir que la probabilidad es un suceso en la cual hay probabilidades de n eventos

MODELO PROBABILSTICO
Es una representacin matemtica deducida de un conjunto de el propsito de estudiar los resultados de un experimento aleatorio. Pro los anterior se puede decir que nos da a conocer distribucin de probabilidades, de lao valores de la variable aleatoria, por lo anterior el modelo toma un conjunto de muestra de datos como se dice de forma aleatoria.

MODELO DISCRETO Modelo Bernualli Modelo Binomial Modelo geomtrico

MODELO CONTINUO Distribucin normal Distribucin exponencial

ESPACIO MUESTRAL
Es el conjunto de todos los resultados posibles de un experimento se denomina con la letra S Puede asumir muchas formas, tablas, diagrama de rbol y sistema de rejillas. A los resultados de un espaci muestral se le denominan puntas de muestra. EJEMPLO: Un seor tiene 6 dados pero el comprador quiere 4 Cul ser el espacio muestral? 6/4=1.5

EXPERIMENTO/RESULTADO
Un experimento es cualquier proceso que produce un resultado u observacin Un resultado es particular de un experimento, entonces se puede entender que sin un experimento no hay resultado o viceversa

TIROS PRIMERO SEGUNDO TERCERO CUARTO

OBSERVACION CARA CRUZ CARA CARA

EVENTO
Se llama evento o suceso a todo subconjunto de un espacio muestral, se puede decir que es tambin un acontecimiento o suceso impredecible que puede pasar en un juego de azar Hay tres tipos de eventos: Evento frecuente: Es aquel suceso que ayuda a que el resultado se favorable y aceptable. Evento imposible: Es aquel que no se puede llevar acabo Evento seguro: Es aquel que por condiciones ya establecidas se puede llevar acabo

CORRIENTES DE LA PROBABILIDAD
CORRIENTE FRECUENTISTA

En la corriente frecuensista tal vez una de las ms empleadas-, se asigna un valor de probabilidad a un evento E, a partir de lo que se considera que ocurrir. Su definicin o interpretacin de la probabilidad est basada, como su titulo lo indica, en la frecuencia relativa2 con la que se obtendra E, si el experimento se repite una gran cantidad de veces, en condiciones similares (no idnticas, puesto que en este caso el proceso no sera aleatorio). Por ejemplo, se lanza una moneda 3 veces y se cuenta la cantidad de soles que aparecen. Sea el evento E: Obtencin de dos soles en los tres lanzamientos, Cul es la probabilidad de que ocurra el evento E? Supongamos que el experimento se repite 1000 veces en condiciones similares y como resultado se obtienen 400 casos con dos soles, en tal situacin, se dira que la probabilidad de que ocurra E, ser: 400/1000=0.4
CORRIENTE SUBJETIVA En la corriente subjetivista (esta interpretacin de la probabilidad es muy empleada en el estudio de la teora de decisiones), se asignan probabilidades a eventos basndose en el conocimiento o experiencia que cada persona tiene sobre el experimento; por lo tanto, la probabilidad asignada est sujeta al conocimiento que

el cientfico tenga con respecto al fenmeno estudiado. Para un mismo experimento las probabilidades asignadas por diferentes personas pueden ser distintas. La interpretacin subjetiva de la probabilidad tiene diferentes dificultades, una de ellas es la dependencia en el juicio de cada persona al asignarla, adems que tal juicio debe estar completamente fuera de contradicciones lo que es sumamente difcil por depender de la persona que la asigne. CORRIENTE BAYESIANA (A POSTERIORI) En la corriente bayesiana se asignan probabilidades a eventos, despus del experimento. Es decir las probabilidades son del tipo dependiente, esto es basndose en el conocimiento de la ocurrencia de eventos que estn en dependencia con el evento estudiado. CORRIENTE CLASICA (A PRIORI) En la corriente clsica se consideran espacios mustrales uniformes, es decir se asigna probabilidades a eventos, basndose en resultados Cabe notar que de lo anterior se deduce, que la probabilidad de los puntos mustrales se establece a priori, es decir, antes de cualquier experimento.

TCNICAS DE CONTEO
Cuando los diversos resultados de un experimento son equiparables se asigna la misma probabilidad a cada evento simple la tcnica de calcular probabilidades se reduce a contar. En particular si es N es el nmero de resultados en un espacio muestra y N(A) el nmero de resultados contenido en un evento A entonces P(A)=N(A)/A Primero: Se define el experimento del que habla el problema Segundo: Se encuentra el espacio muestral del experimento Tercero: Se define y se encuentra el evento correspondiente

DIGRAMA DE ARBOL
Muchos problemas de probabilidad condicional muy en especial problemas de decisin se pueden resolver por los diagramas de rbol. El rbol comienza trazando desde un punto llamado vrtice, las diferentes ramas llamadas caminos o aristas cada uno de ellas llega a otro vrtice y de igual forma desde ese punto pueden trazarse atrs aristas y casi sucesivamente hasta terminar en todos los caminos posibles En la teora de las probabilidades debe cumplirse que la suma de todas las probabilidades de los diferentes caminos de cualquier vrtice son igual a 1. La probabilidad de una rama cualquiera se obtiene multiplicando las probabilidades de los caminos descendentes

esto se hace a partir del vrtice de la ultima arista y hasta llegar a el vrtice final. Es importante hacer notar que las probabilidades de los caminos ascendentes son probabilidades condicionales puesto que estn restringidas a que sucedan los eventos de las aristas por las que est dirigido el camino

PERMUTACIN
Se llama permutacin de k elementos escogidos de un total de n (todos diferentes) a: Pnk=n/(n-k) 0 k n Que representa la cantidad de arreglos ordenados de tamao k los cuales se pueden formar con n elementos diferentes cuando no se permite la repeticin. Arreglos en los que el orden entre sus elementos es de suma importancia puesto que la permutacin ab es de diferente arreglo que va

COMBINACIN
Son los arreglos en los que el orden entre sus elementos no importa es decir dado un conjunto n elementos distintos se desea contar el numero de subconjuntos m ordenados de tamao k. Por ejemplo: Dado un grupo de la UAEM Texcoco de 40 estudiantes se pide elegir a 3 alumnos para que representen al grupo, Como se puede observar no es de mucho inters el orden con los 3 alumnos a elegir. Definiendo: Dado un conjunto de n elementos diferentes se llama combinacin de cualquier subconjunto no ordenado de tamao k. el nmero de combinaciones de tamao k que se pueden formar con n elementos se denota: Cnk=n/K(n-k) 0 k n Una diferencia fundamental entre las permutaciones y las conminaciones consiste en que el orden de los elementos de los grupos escogidos en estas ltimas no importa solo se considera su cantidad de elementos en el grupo, mientras que para las permutaciones es fundamental el orden entre sus elementos Permutaciones= ab ba Combinacin = ab = ba Se debe tener muy en claro que aunque los resultados de Cnk=n/K(n-k) y Pnk=n/(n-k) son numricamente iguales el significado es muy diferente ya que Cnk=n/K(n-k) representa los subconjuntos de k elementos que se pueden formar con n disponibles mientras que Pnk=n/(n-k) representa todos los ordenamientos de n elementos

PROBABILIDAD CONDICIONAL
Es el resultado que tenga un suceso, ya se: b, f o d, cuando se sabe el resultado de un suceso: a, e o c. dependiendo del resultado del primer caso se puede calcular el resultado probable de un segundo caso. Esta se puede interpretar como, tomando los mundos en los que B se cumple, la fraccin en los mundos tambin en los que tambin se cumple A. suponiendo que B es tener gripa y el caso A es tener dolor de cabeza, esto es P(A/B)que seria la probabilidad de tener dolor de cabeza cuando se tiene gripe. A seria los mundos en los que se tiene dolor de cabeza, B los espacios en que se tiene gripa y la zona verde los espacios en que se tiene gripa y dolor de cabeza. La interseccin seria los grupos en que se tiene gripa y dolor de cabeza (se denota como P(A B)). Es decir el resultado de A con respecto a B, es la probabilidad de que alguien tenga dolor de cabeza sabiendo qua tiene gripa, esto sera la de la proporcin de los mundos con gripa y los mundos con dolor de cabeza. Esto seria el rea verde dividida por el rea de B y como el rea verde representa P(A B) y el rea de B representa el espacio en que se tiene gripa P (B), formalmente se tiene que:

PROBABILIDAD CONDICIONAL
La definicin de probabilidad condicional se encuentra en la mayor parte de los libros analizados. Por ejemplo, PEA (1986) define la frecuencia relativa de A condicionada a la ocurrencia de B y de esta definicin deduce el concepto de probabilidad condicional indicando donde A, B representa el suceso ocurrencia conjunta de A y B y suponemos que P (B) >0 Esta definicin est implcita la restriccin del espacio muestral pea hace incapie en las siguientes propiedades: Es importante diferenciar entre P(A,B) y P (A/B) Una probabilidad conjunta P(A, B) es siempre menor que las probabilidades simples P(A) y P(B). Una probabilidad condicional P(A/B) puede ser mayor, menor o igual que P(A) El espacio muestral de la probabilidad condicional P(A/B) queda restringido a B. Nortes (1993) demuestra que una probabilidad condicional cumple los axiomas de probabilidad. Cuadras y cols (1984) tambin resaltan que la probabilidad condicional implica una reduccin del espacio muestral. Sacerdote y Balima (en preparacin) recuerdan que nunca podra aparecer en una formula una sume o diferencia de probabilidades condicionadas a deferentes sucesos, dado que las probabilidades estaran definidas sobre distintos pasos mustrales.

EJEMPLO Se seleccionan dos semillas aleatoriamente, una por una, de una bolsa que contiene 10 semillas de flores rojas y 5 de flores blancas. Cul es la probabilidad de que: a. La primera semilla sea roja? b. La segunda semilla sea blanca dado que la primera fue roja?

SOLUCIN

a) La probabilidad de que la primera semilla sea roja es , puesto que hay 10 semillas de flores rojas de un total de 15. Escrito con notacin de probabilidad tenemos: b) La probabilidad de que la segunda semilla sea blanca se ve influida por lo que sali primero, es decir esta probabilidad est sujeta a una condicin, la de que la primera semilla sea roja. Este tipo de probabilidad se le llama probabilidad condicional y se denota por , y se lee: la probabilidad de B2 dado R1.

Esta probabilidad total de 14 restantes.

, puesto que todava hay 5 semillas blancas en un

EJEMPLO: Muchos fenmenos naturales son aleatorios, pero existen algunos como el lanzamiento de un dado, donde el fenmeno no se repite en las mismas condiciones, debido a que la caractersticas del material hace que no exista una simetra del mismo, as las repeticiones no garantizan una probabilidad definida. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parmetros que intervienen; sta es una de las razones por las cuales la estadstica, que busca determinar estos parmetros, no se reduce inmediatamente a la teora de la probabilidad en s.

EVENTO INDEPENDIENTE.
DEFINICION: A y B son independientes entre s y solo si se cumplen en la relacin p (AnB) = P(B)P(A) Ntese que se est hablando de independencia desde el punto de vista probabilstico, pero no desde el punto de vista casual. EJEMPLO: Un congestionamiento de trfico en una avenida no se puede ser causa de lluvia pero esta no puede ser causa de lluvia pero esta si lo puede ser de un

embotellamiento. Si E es el evento (hay un embotellamiento) y L es otro evento (llueve) en efecto no existe una relacin causal de L dado E sin embargo la lluvia no es un suceso de los embotellamientos (desde el punto de vista probabilstico. Esto es, aun cuando un embotellamiento de autos y camiones no puede provocar lluvia ni impedirla, la probabilidad de que llueva es diferente (menor) a la probabilidad de que llueva dado que se da que hay un embotellamiento.

EVENTOS DEPENDIENTES
DEFINICION: Son aquellos eventos de dos o ms, que sern independientes cuando el resultado o no resultado de uno de ellos afecte su probabilidad. Lo que hacemos es consistir en hallar la probabilidad de que al extraer cualquiera de los datos, ambos sea de otro gnero as marcando la diferencia entre ellos. Cuando nosotros tenemos este caso empleamos el concepto de probabilidad condicional para denominar el evento reclamado. EJEMPLO: Si hago la probabilidad de que pase B dado de que ya ha ocurrido A, esto es igual a la probabilidad de que pase B solo entonces son eventos dependientes: Si quiero sacar siete en los dados sabiendo que sali 2 en el primer tiro refirindose
del evento A depende que salga 5 en el evento B.

TEOREMA DE BAYES.
El teorema de bayes es el resultado del estudio enunciado por thomas bayes en 1763 en la teora de la probabilidad, que expresa la probabilidad condicional de un evento aleatorio o probable A dado B en trminos de la distribucin de probabilidad condicional En trminos ms generalizados, este teorema es la enorme relevancia puesto que relaciona la probabilidad de A dado B con la probilidad de B dado A. es decir un ejemplo sabiendo la probabilidad de un dolor de cabeza dado a que se tiene una gripe se podra saber si existe un algn dato ms, la probabilidad de tener gripe si se tiene un dolor de cabeza Este sencillo ejemplo muestra la alta relevancia del teorema de bayes para la ciencia y todas sus ramas dado que tiene vinculacin intima con la comprensin de la probabilidad de aspectos causales dados los efectos observados Sea {A1,A3,...,Ai,...,An} un conjunto de sucesos mutuamente excluyentes y exhaustivos, y tales que la probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se conocen las probabilidades condicionales P(B | Ai). Entonces, la probabilidad P(Ai | B) viene dada por la expresin:

Donde:
P(Ai) son las probabilidades a priori. P(B | Ai) es la probabilidad de B en la hiptesis Ai. P(Ai | B) son las probabilidades a posteriori.

VARIABLE ALEATORIA DISCRETA.


Una Variable aleatoria Discreta X, tiene un conjunto definido de valores posibles x1,x2,x3,..xn , con probabilidades respectivas p1,p2,p3,..pn., Es decir que slo puede tomar ciertos valores dentro de un campo de variacin dado. Como X ha de tomar uno de los valores de este conjunto, entonces p1 + p2 ++ pn=1. En general, una variable aleatoria discreta X, representa los resultados de un espacio muestral en forma tal que por P(X = x) se entender la probabilidad de que X tome el valor de x. De esta forma, al considerar los valores de una variable aleatoria es posible desarrollar una funcin matemtica que asigne una probabilidad a cada realizacin x de la variable aleatoria X. Esta funcin recibe el nombre de funcin de la probabilidad.

VARIABLE ALEATORIA
Una variable es aleatoria si su valor est determinado por el azar. En gran nmero de experimentos aleatorios es necesario, para su tratamiento matemtico, cuantificar los resultados de modo que se asigne un nmero real a cada uno de los resultados posibles del experimento. De este modo se establece una relacin funcional entre elementos del espacio muestral asociado al experimento y nmeros reales. Los valores posibles de una variable aleatoria pueden representar los posibles resultados de un experimento an no realizado, o los posibles valores de una cantidad cuyo valor actualmente existente es incierto. Intuitivamente, una variable aleatoria puede tomarse como una cantidad cuyo valor no es fijo pero puede tomar diferentes valores; una distribucin de probabilidad se usa para describir la probabilidad de que se den los diferentes valores. El trmino elemento aleatorio se utiliza para englobar todo ese tipo de conceptos relacionados. Un concepto relacionado es el de proceso esttico, un conjunto de variables aleatorias ordenadas (habitualmente por orden o tiempo).

DISTRIBUCIN BINOMIAL
La distribucin binomial es tpica de las variables que proceden de un experimento que cumple las siguientes condiciones:

10

1) El experimento est compuesto de n pruebas iguales, siendo n un nmero natural fijo. 2) Cada prueba resulta en un suceso que cumple las propiedades de la variable binmica o de Bernouilli, es decir, slo existen dos posibles resultados, mutuamente excluyentes, que se denominan generalmente como xito y fracaso. 3) La probabilidad del xito (o del fracaso) es constante en todas las pruebas. P(xito) = p ; P(fracaso) = 1 - p = q 4) Las pruebas son estadsticamente independientes, En estas condiciones, la variable aleatoria X que cuenta el nmero de xitos en las n pruebas se llama variable binomial. Evidentemente, el espacio muestral estar compuesto por los nmeros enteros del 0 al n. Se suele decir que una variable binmica cuenta objetos de un tipo determinado en un muestreo de n elementos con reemplazamiento

DISTRIBUCIN HIPERGEOMTRICA
Una variable tiene distribucin hipergeomtrica si procede de un experimento que cumple las siguientes condiciones: 1) Se toma una muestra de tamao n, sin reemplazamiento, de un conjunto finito de N objetos. 2) K de los N objetos se pueden clasificar como xitos y N - K como fracasos. X cuenta el nmero de xitos obtenidos en la muestra. El espacio muestral es el conjunto de los nmeros enteros de 0 a n, de 0 a K si K < n. En este caso, la probabilidad del xito en pruebas sucesivas no es constante pues depende del resultado de las pruebas anteriores. Por tanto, las pruebas no son independientes entre s.

DISTRIBUCIN MULTIHIPERGEOMTRICA
Esta variable se define igual que la hipergeomtrica con la nica diferencia de que se supone que el conjunto de objetos sobre el que se muestrea se divide en R grupos de A1, A2,..., AR objetos y la variable describe el nmero de objetos de cada tipo que se han obtenido (x1, x2,..., xR)

DISTRIBUCIN DE POISSON
Una variable de tipo poisson cuenta xitos (es decir, objetos de un tipo determinado) que ocurren en una regin del espacio o del tiempo. El experimento que la genera debe cumplir las siguientes condiciones: 1. El nmero de xitos que ocurren en cada regin del tiempo o del espacio es independiente de lo que ocurra en cualquier otro tiempo o espacio disjunto del anterior.

11

2. La probabilidad de un xito en un tiempo o espacio pequeo es proporcional al tamao de este y no depende de lo que ocurra fuera de l. 3. La probabilidad de encontrar uno o ms xitos en una regin del tiempo o del espacio tiende a cero a medida que se reducen las dimensiones de la regin en estudio. Como consecuencia de estas condiciones, las variables Poisson tpicas son variables en las que se cuentan sucesos raros. Esta caracterstica puede servirnos para identificar a una variable Poisson en casos en que se presenten serias dificultades para verificar los postulados de definicin. La distribucin de Poisson se puede considerar como el lmite al que tiende la distribucin Binomial cuando n tiende a y p tiende a 0, siendo no constante (y menor que 7); en esta situacin sera difcil calcular probabilidades en una variable Binomial y, por tanto, se utiliza una aproximacin a travs de una variable Poisson con media l = n p. Las variables Poisson cumplen la propiedad de que la suma de variables Poisson independientes es otra Poisson con media igual a la suma las medias. EJEMPLO DE VARIABLE ALEATORIA. Sea el experimento aleatorio consistente en lanzar una moneda al aire. Los sucesos elementales del experimento, que salga cara, que salga cruz, no vienen representados por los nmeros, por lo que cada suceso elemental se le hace corresponder un nmero real. As al suceso elemental, que salga cara, se le hace corresponder el nmero 1 y al suceso elemental, que salga cruz, se le hace corresponder el nmero 2. La variable aleatoria ser: X = (1,2). Se trata de una variable aleatoria o discreta, ya que nicamente puede adoptar los valores 1 y 2. Supongamos que se lanzan dos monedas al aire. El espacio muestral, esto es, el conjunto de resultados elementales posibles asociado al experimento, es Donde (c representa "sale cara" y x, "sale cruz"). Podemos asignar entonces a cada suceso elemental del experimento el nmero de caras obtenidas. De este modo se definira la variable aleatoria X como la funcin

Dada por:

El recorrido o rango de esta funcin, RX, es el conjunto

12

DISTRIBUCIONES Distribucin de probabilidad. Es una distribucin terica de frecuencias que describe cmo se espera que varen los resultados de un experimento. Existen diferentes tipos de modelos que permiten describir el comportamiento de fenmenos estadsticos que permiten hacer inferencias y tomar decisiones en condiciones de incertidumbre. Estos tipos de distribucin se clasifican de la siguiente manera: Distribuciones discretas. Son aquellas donde las variables asumen un nmero limitado de valores, por ejemplo el nmero de aos de estudio. De las cuales son las siguientes:

Binomial Hipergeomtrica Multinomial Poisson

discretas.

Distribuciones continuas. Son aquellas donde las variables en estudio pueden asumir cualquier valor dentro de determinados lmites; por ejemplo, la estatura de un estudiante. De las cuales son las siguientes:

Uniforme Exponencial Normal

Continas

Normal.

Exponencial.

Uniforme. Conocer los siguientes modelos discretos de probabilidad: uniforme, binomial, geomtrico y Poisson.

13

MODELOS DISCRETOS Aunque en adelante hablemos de distribucin "tal", nos estaremos refiriendo al modelo tal. Los modelos discretos, son modelos de probabilidad de variable aleatoria discreta.Los ms importante son los modelos de BERNOUILLI (especialmente "la distribucin binomial") y la "distribucin de Poisson". 1.- Uniforme 2.- binomial 3.- geomtrico 4.- Poisson. DISTRIBUCIN DE POISSON Es una distribucin de probabilidad que muestra la probabilidad de x ocurrencias de un evento en un intervalo especificado de tiempo o e espacio Las propiedades de un experimento de Poisson son: La probabilidad de una ocurrencia es igual en dos intervalos cualesquiera de igual longitud La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la ocurrencia o no ocurrencia en cualquier otro intervalo

Distribucin binomial En estadstica, la distribucin binomial es una distribucin de probabilidad discreta que mide el nmero de xitos en una secuencia de n ensayos independientes de Bernoulli con una probabilidad fija p de ocurrencia del xito entre los ensayos. Es una distribucin discreta de probabilidad conocida por sus variadas aplicaciones que se relaciona con un experimento de etapas mltiples Distribucin binomial La distribucin binomial se suele representar por B(n, p). n es el nmero de pruebas de que consta el experimento. p es la probabilidad de xito. Distribucin uniforme

14

En teora de la probabilidad, la distribucin uniforme discreta es una distribucin de probabilidad que asume un nmero finito de valores con la misma probabilidad. Ejemplos: Para un dado perfecto, todos los resultados tienen la misma probabilidad 1/6. Luego, la probabilidad de que al lanzarlo caiga 4 es 1/6. Para una moneda perfecta, todos los resultados tienen la misma probabilidad 1/2. Luego, la probabilidad de que al lanzarla caiga cara es 1/2.

Distribucin de probabilidad geomtrica La variable aleatoria al igual que en la distribucin binomial, slo puede tomar dos valores (xito ofracaso). Las pruebas son tambin idnticas e independientes entre s. La probabilidad de xito es p y se mantiene constante de prueba en prueba.Sin embargo, mientras que en la distribucin binomial se buscaba el nmero de xitos que ocurran en npruebas, en la distribucin geomtrica lo que se busc a es el nmero de pruebas necesarias para que ocurraun xito, es decir, el experimento consiste de una serie de pruebas, las cuales concluyen cuando un xito esobservado Una caracterstica de esta distribucin es que carece de memoria, es decir, se puede empezar a contar en cualquier ensayo o intento hasta obtener el xito Es una serie de ensayos de Bernoulli independientes, con probabilidad constante p de un xito, sea que la variable aleatoria X denote el nmero de ensayos hasta el primer xito. Modelos discretos de la probabilidad. 1. Modelos probabilsticos. Introduccin al concepto de probabilidad. Elementos del modelo probabilstico. Experimentos aleatorios, espacio muestral, sucesos, variables aleatorias. El concepto de probabilidad y su definicin formal. Interpretaciones del concepto de probabilidad. Reglas bsicas del Clculo de Probabilidades. 2. Probabilidad condicionada e independencia. Actualizacin de la informacin: probabilidad condicionada. Regla de multiplicacin. Experimentos en etapas sucesivas. Independencia de sucesos. Regla las Probabilidades Totales. Regla de Bayes. Independencia condicional. Paradoja de Simpson. 3. Modelos para variables y vectores aleatorios. Modelos para experimentos discretos.El modelo uniforme discreto. Regla de Laplace. Combinatoria. Modelos continuos.El modelo uniforme continuo.Funcin de distribucin de una variable aleatoria. Funcin de

15

4.

5.

6.

7.

distribucin de una variable discreta. Funcin de distribucin de una variable continua. Modelos mixtos. Modelos para vectores aleatorios. Vectores aleatorios discretos. Vectores aleatorios continuos. Distribuciones condicionadas. Independencia de variables aleatorias. Caso discreto. Caso continuo. Independencia de variables aleatorias. Transformaciones de variables y vectores aleatorios. Clculo de distribuciones. Caractersticas asociadas a una distribucin de probabilidad. Media de una variable aleatoria. Momentos. Percentiles. La transformacin cuantil. Simulacin de variables aleatorias. Medidas de posicin, dispersin y forma. Parmetros poblacionales de una funcin lineal de una variable aleatoria. Tipificacin o estandarizacin de variables. Covarianza y correlacin. La desigualdad de Chebychev. La Ley de los Grandes Nmeros. Esperanza condicionada. Regresin. La esperanza condicionada como curva de regresin. La distribucin normal. Modelos de distribucin de mediciones y errores. Introduccin. Caractersticas numricas de la distribucin normal. Tipificacin de variables normales. Uso de tablas. Reproductividad de la distribucin normal. El efecto lmite central. El proceso de Bernoulli y sus distribuciones asociadas. El Proceso de Bernoulli. Distribuciones de Bernoulli y binomial. Reproductividad de la distribucin binomial. Aproximacin binomial-normal. La distribucin geomtrica. Falta de memoria de la ley geomtrica. La distribucin de Pascal. Relacin de las probabilidades de Pascal con las probabilidades binomiales. Reproductividad de la distribucin de Pascal. Aproximacin de la ley de Pascal por la normal. La distribucin hipergeomtrica. Muestreo con y sin reemplazamiento. Aproximacin hipergeomtrica-binomial. La distribucin multinomial. El proceso de Poisson y sus distribuciones asociadas. El proceso de Poisson. La distribucin de Poisson. Aproximacin binomialPoisson. Ley de los "sucesos raros". Reproductividad de la distribucin de Poisson. Aproximacin Poisson-normal. La distribucin exponencial.La distribucin gamma. Relacin de las probabilidades gamma con las probabilidades de Poisson. Reproductividad de la distribucin gamma. Aproximacin de la ley gamma por la normal.

Distribucin multinomial
Sea una poblacin de D tipos de elementos en proporciones dadas por el vector de reales 1. Sea a su vez el nmero de elementos del tipo d obtenidos tras seleccionar x+ elementos de forma aleatoria, independiente y con reemplazamiento. El vector es una variable aleatoria multinomial de parmetros x+ y p (en smbolos X Mult(x+, p)). Existen secuencias posibles al seleccionar x+ elementos aleatoriamente y a cada una de ellas le podemos asociar un

16

vector de contadores . La probabilidad de cada una de estas secuencias es d , sin embargo la correspondencia entre secuencias y vectores de contadores no es biunvoca, existiendo

Representacin de los documentos


En nuestro caso consideramos como poblacin de origen para cada tarea el vocabulario de los textos (posiblemente restringido) y cada documento vendr representado por un vector de cuentas de las palabras presentes en el documento. Consideraremos entonces que la distribucin de probabilidad condicional es una multinomial, siendo entonces la probabilidad condicional de un documento La simplicidad de este modelo provoca que se ignoren ciertas caractersticas propias de los documentos, como la informacin que proporciona la secuencialidad del texto, es decir el contexto que rodea cada palabra. Otro punto a notar es que se est asumiendo que la longitud de los documentos est fijada por una constante, hecho que es indudablemente falso. Podramos considerar la probabilidad condicional donde representa la longitud del documento x, quedando entonces la probabilidad conjunta

Suavizado
el aprendizaje por mxima verosimilitud presenta problemas de sobreentrenamiento, lo que puede ocasionar que el clasificador no generalice adecuadamente. Un caso evidente de este problema se muestra en el siguiente ejempo:

17

Supongamos que una palabra d del vocabulario no aparece en ningn documento de la clase c, es decir, tendremos Por tanto, si en la fase de test aparece un documento x pertenciente a la clase c que s contiene la palabra d, la probabilidad a posteriori p(c|x) ser nula, por lo que lo clasificaremos en una clase errnea.

Identificabilidad
Naturalmente resulta deseable que las mixturas con las que trabajemos sean identificables, ya que si no no podemos tener garanta alguna de que efectivamente estemos aprendiendo la mixtura correcta, independientemente de la cantidad de muestras de entrenamiento que tengamos. 4.2. El algoritmo EM 27 Existen una serie de no-identificabilidades triviales consistentes por ejemplo en permutar los ndices de las componentes de una mixtura o dividir una componente en dos o ms componentes iguales, distribuyendo la probabilidad a priori original entre ellas. Claramente esta clase de no-identificabilidad no presenta un problema prctico de gran importancia, por lo que por lo general se puede ignorar. Existen estudios acerca de la identificabilidad de las mixturas (consultar por ejemplo [TSM85]) en los que se demuestra que la familia de mixturas finitas de distribuciones de probabilidad discretas no son identificables, un resultado que no es favorable para nuestros propsitos. Sin

18

embargo en [CPR00] se muestra que esto no representa un problema prctico importante.

VARIABLES ALEATORIAS CONTINUAS A diferencia de una variable aleatoria discreta, una variable continua es la que puede tomar cualquier valor fraccionario determinado de valores. Como existe un nmero infinito de posibles mediciones fraccionarias, no puede enlistarse todos los valores posibles con una probabilidad correspondiente. Ms bien, se define una funcin de densidad de probabilidad. Esta expresin de matemtica dala funcin X, y se representa mediante el smbolo f(x), para calcular el valor designado de la variable aleatoria X, a la grafica de una funcin de este tipo se le denomina curva de probabilidad y el rea entre dos puntos cualquiera bajo la curva de la probabilidad de la ocurrencia aleatoria de un valor entre esos dos puntos. Una variable continua, es aquella que puede tomar un valor cualquiera para un determinado intervalo. O sea en la practica los valores para esta variable solo esta limitados por la presin de los instrumentos de medicin, en el caso de medidas como el peso, por dar un ejemplo; o sea siempre va haber una valor entre dos valores que pueda tomar una variable continua. Puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2.3kg, 2.4kg, 2.5kg) o la altura (1.64m, 1.65m, 1.66m...) que solo esta limitado por la precisin del aparato medidor, en teora permiten que siempre exista un valor entre dos variables, tambin puede ser el dinero o un salario dado FUNCION DE DENSIDAD DE PROBABILIDAD La funcin de densidad de probabilidad se utiliza en estadstica con el propsito de conocer cmo se distribuyen las probabilidades de un suceso o evento, en relacin al resultado del suceso. La funcin de densidad de probabilidad se representa generalmente por f(x). Matemticamente la es la derivada de la funcin distribucin de probabilidad F(x), o de manera inversa, la funcin de distribucin es la integral de la funcin de densidad Las propiedades de FDP son: 0 para toda x. El rea total encerrada bajo la curva es igual a 1:

19

La probabilidad de que X tome un valor en el intervalo [a,b] es el rea bajo de la funcin de densidad en ese intervalo o lo que es lo mismo, la integral definida en dicho intervalo. Algunas FDP estn declaradas en rangos de a , como la de la distribucin normal. es una funcin, usualmente denominada f(x) que describe la densidad de la probabilidad en cada punto del espacio de tal manera que la probabilidad de que la variable aleatoria tome un valor dentro de un determinado conjunto sea la integral de la funcin de densidad sobre dicho conjunto. Una funcin de densidad de probabilidad es una funcin matemtica que caracteriza el comportamiento probable de una poblacin. Es una funcin f(x) que especifica la posibilidad relativa de que una variable aleatoria continua X tome un valor cercano a x, y se define como la probabilidad de que X tome un valor entre x y x+dx, dividido por dx, donde dx es un nmero infinitesimalmente pequeo. La mayora de las funciones de densidad de probabilidad requieren uno o ms parmetros para especificarlas totalmente. FUNCION DE DISTRIBUCION ACUMULADA La funcin de distribucin acumulada, F(x), para una variable aleatoria continua X, est definida para todo nmero x mediante:

Para cada x, F(x) es el rea bajo la curva de densidad a la izquierda de x. F(x) se incrementar de manera uniforme cuando aumenta x.

En la teora de probabilidades y estadsticas , la funcin de distribucin acumulativa , o simplemente funcin de distribucin, describe la probabilidad de que un valor real variable aleatoria X con una determinada distribucin de probabilidad se encontrar en un valor menor o igual que x. Intuitivamente, es el rea "hasta ahora" en funcin de la distribucin de probabilidad. funciones de distribucin acumulativa tambin se utilizan para especificar la distribucin de mltiples variables variables aleatorias . Desigualdad de Chebyshev En probabilidad, la desigualdad de Chebyshev, es un resultado que ofrece una cota inferior a la probabilidad de que el valor de una variable aleatoria con varianza finita est a una cierta distancia de su esperanza matemtica. La desigualdad recibe su nombre del matemtico ruso Pafnuti Chebyshev.

20

Formulacin Si X es una variable aleatoria de media y varianza finita , entonces, para todo nmero real k > 0,

Slo en caso de que k > 1 la desigualdad proporcionan una cota no trivial. Ejemplos Para ilustrar este resultado, supongamos que los artculos de una revista tienen una extensin media de 1000 caracteres y una desviacin tpica de 200 caracteres. De la desigualdad de Chebyshov, usando k = 2, se deduce que al menos el 75% de los artculos tendrn una extensin comprendida entre 600 y 1400 caracteres. Otra consecuencia del teorema es que para cada distribucin de media y desviacin tpica finita , al menos la mitad de sus valores se concentrarn en el intervalo (-2 , +2 ). Demostracin Para demostrar la desigualdad se parte de la variable aleatoria auxiliar Y definida as:

Entonces, trivialmente,

y por lo tanto,

Tomando esperanzas en ambos miembros se obtiene

por lo que

21

Pero, a su vez, dado que Y slo puede ser 0 o 1,

lo que prueba el resultado. Demostracin Para demostrar la desigualdad se parte de la variable aleatoria auxiliar Y definida as:

Entonces, trivialmente,

y por lo tanto,

Tomando esperanzas en ambos miembros se obtiene

por lo que

Pero, a su vez, dado que Y slo puede ser 0 o 1,

lo que prueba el resultado.

22

Discusin La cota proporcionadas por la desigualdad de Chebyshov, en general, no se pueden mejorar. De hecho es posible construir una variable aleatoria cuya cota de Chebyshov coincida con las probabilidade real. Sin embargo, en casos concretos el teorema proporciona cotas poco precisas. El teorema puede ser til a pesar de las cotas imprecisas porque se aplica a una amplia gama de variables que incluye las que estn muy alejadas de la distribucin normal, y porque las cotas son fciles de calcular. El teorema se emplea para demostrar la ley dbil de los grandes nmeros.

Distribucin normal

Distribucin normal

La lnea verde corresponde a la distribucin normal estndar Funcin de densidad de probabilidad

23

Funcin de distribucin de probabilidad Parmetros >0 Dominio Funcin de densidad (pdf) Funcin de distribucin (cdf)

Media Mediana Moda Varianza Coeficiente de simetra 0

24

Curtosis Entropa

Funcin generadora de momentos (mgf) Funcin caracterstica En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece aproximada en fenmenos reales. La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro. Esta curva se conoce como campana de Gauss. La importancia de esta distribucin radica en que permite modelar numerosos fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observacin se obtiene como la suma de unas pocas causas independientes. De hecho, la estadstica es un modelo matemtico que slo permite describir un fenmeno, sin explicacin alguna. Para la explicacin causal es preciso el diseo experimental, de ah que al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional. La distribucin normal tambin es importante por su relacin con la estimacin por mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos. Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la normal son:

caracteres morfolgicos de individuos como la estatura; caracteres fisiolgicos como el efecto de un frmaco; caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de individuos;

25

caracteres psicolgicos como el cociente intelectual; nivel de ruido en telecomunicaciones; errores cometidos al medir ciertas magnitudes; etc.

La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las medias muestrales es aproximadamente normal, cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal.1 Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida en estadstica y muchos tests estadsticos estn basados en una supuesta "normalidad". En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de probabilidad continuas y discretas. == Historia == CARINA

Abraham de Moivre, descubridor de la distribucin normal La distribucin normal fue presentada por primera vez por Abraham de Moivre en un artculo del ao 1733,2 que fue reimpreso en la segunda edicin de su The Doctrine of Chances, de 1738, en el contexto de cierta aproximacin de la distribucin binomial para grandes valores de n. Su resultado fue ampliado por Laplace en su libro Teora analtica de las probabilidades (1812), y en la actualidad se llama Teorema de De Moivre-Laplace.

26

Laplace us la distribucin normal en el anlisis de errores de experimentos. El importante mtodo de mnimos cuadrados fue introducido por Legendre en 1805. Gauss, que afirmaba haber usado el mtodo desde 1794, lo justific rigurosamente en 1809 asumiendo una distribucin normal de los errores. El nombre de Gauss se ha asociado a esta distribucin porque la us con profusin cuando analizaba datos astronmicos3 y algunos autores le atribuyen un descubrimiento independiente del de De Moivre.4 Esta atribucin del nombre de la distribucin a una persona distinta de su primer descubridor es un claro ejemplo de la Ley de Stigler. El nombre de "campana" viene de Esprit Jouffret que us el trmino "bell surface" (superficie campana) por primera vez en 1872 para una distribucin normal bivariante de componentes independientes. El nombre de "distribucin normal" fue otorgado independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis hacia 1875.[cita requerida] A pesar de esta terminologa, otras distribuciones de probabilidad podran ser ms apropiadas en determinados contextos; vase la discusin sobre ocurrencia, ms abajo.

La Campana de Gauss La campana de Gauss o curva de distribucin normal tiene, como ya hemos visto, la forma parecida a una campana

desciende lentamente y de forma simtrica por ambos lados. El vrtice de la campana se corresponde con lo que hemos denominado el valor medio, y la anchura nos muestra la frecuencia con que aparecen las desviaciones de dicha media, de forma que cuanto ms estrecha sea la campana, ms raras sern las desviaciones con respecto a la media. Si, por ejemplo, estamos hablando, como hicimos antes, de la altura en centmetros de un grupo de estudiantes y calculamos su distribucin normal observaremos que

27

la media se sita alrededor de los 170 centmetros y que lo menos frecuente es encontrar estudiantes de 187 o 162 centmetros de altura.

CONCLUSIONES
Se puede mencionar que este trabajo sirvi para conocer de donde proviene la probabilidad, como se presenta en nuestra vida, ms bien en los juegos de azar. Por lo anterior se puede mencionar que las definiciones se mencionaron, se dan mucho en juegos de azar como son dados o el lanzamiento de una moneda etc. Cabe mencionar que son conceptos que se presentan en la vida cotidiana Como conclusin sobre este trabajo se puede mencionar que se conoci como es, para que nos sirva, y como se hace un diagrama de rbol ya que es muy til, por lo consiguiente las tcnicas de conteo son importantes ya que son tres pasos a seguir. Cabe mencionar que podemos hacer nuestra propia definicin sobre las permutaciones y combinaciones ya que son dos palabras muy diferentes pero muy fciles de aprender y ver las diferencia de ambos los alumnos y el equipo c vimos algunos de los conceptos que van de acuerdo a la materia que es probabilidad y estadstica, y de esta manera ir reforzando un poco ms el conocimiento adquirido en la materia y poco a poco ir enfocndonos ms acerca de ella. Otra conclusin seria que el mtodo de exponer temas al grupo es muy dinmico y que si se aprende por lo menos el concepto de los temas porque entre compaeros nos compartimos informacin y se dialogan.

28

Tablas estadsticas: Cabeza encabezamiento Campo Taln autos Golf pointer jetta derbi passat total ventas 20 30 15 50 10 125 frecuencia 20 50 65 105 125

Cuerpo

Pie

Tabla estadstica La tabla o cuadro estadstico consta de 3 partes, que reciben nombres que mencionan la peculiaridad fundamental de la estructura: Cabeza, cuerpo y pie La cabeza O encabezamiento de la tabla ocupa la parte superior de la misma y contiene: El titulo, que Ha de expresar clara y concisamente el contenido o significado estricto de la informacin: el periodo o sea, El espacio de tiempo para el cual es valida la informacin y la unidad de medida, siempre y cuando sea comn a toda la informacin. El cuerpo esta localizado en la parte central de la tabla y en el se encuentra la esencia misma de la informacin, o sea, las categoras de las variables y sus correspondientes frecuencias o intensidades por regla general, las categoras se colocan de lado izquierdo y sus frecuencia o intensidades del lado derecho, pero a veces puede ser al revs, dependiendo del tipo y de las peculiaridades de la informacin que se presenta es decir, al espacio no hay reglas rgidas. Algunos autores llaman taln y campo a las partes izquierdas y derechas del cuerpo de una tabla

Datos agrupados Datos agrupados. Cuando el rango de valores que se tiene es mayor a 20 es conveniente organizarlos y clasificarlos en clases, tomando en cuenta alguna de sus cualidades o caractersticas. Los datos organizados en clases o intervalos se conocen como datos agrupados. Una manera de representar los datos es mediante una distribucin de frecuencia. Ejemplo de Datos Agrupados: Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuantos nios haba de cada ao. (Y siguen siendo 20 nios) Edad..........Frecuencia
1..................2 2..................4 3..................7 4..................4 5..................2 6..................1 Total............20

29

Contados y clasificados y DATOS NO AGRUPADOS cuando no tienen frecuencia o que no estn contabilizados o clasificados Datos no agrupados Datos no agrupados. Se presentan cuando los datos que se toman de la poblacin o de una muestra no estn clasificados segn una caracterstica en particular. Normalmente los datos no agrupados son conjuntos cuyo rango o recorrido es menor a 20 valores y sin ser categorizados son factibles de ser ordenados. Ejemplo de Datos no Agrupados: Vas a investigar la edad a un grupo de 20 Nios en datos no agrupados (es decir, vienen los 20 nios y as como te dan la edad as la anotas2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3, (Total 20 nios) Estos son datos no agrupados por que no los has clasificado y contado1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5, (Total 20 nios)Los datos no agrupados tambin los puedes ordenar, por ejemplo de la edad menor ala edad mayor, no estn contabilizados ni clasificados solamente estn ordenados Distribucin de frecuencia Distribucin de frecuencia o tabla de frecuencia es una ordenacin en forma de tabla de los datos estadsticos asignado a cada dato su frecuencia correspondiente. tipos de frecuencia Frecuencia absoluta Es el numero de veces que aparece un determinado valor en un estudio estadstico. Frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el numero total de datos se puede expresar en tantos porcientos. Frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado y se representa por la letra F Frecuencia relativa acumulada Es el cociente entre la frecuencia acumulada de un determinado valor y el numero total de datos se puede expresar en tantos porcientos

se investiga los siguientes datos siguientes N de hijos respectivos del ao 1980 al 2005 N de hijos Frecuencia f.r% relativa f.R f.r.a % acumulada f.r.a (-) f.r.a (-)%

30

0 1 2 3 4 5 6 7 8 9 10 11 12 TOTAL

5 5 4 6 7 5 2 3 2 5 2 1 3 50

10% 10% 8% 12% 14% 10% 4% 6% 4% 10% 4% 2% 6% 100%

5 10 14 20 27 32 34 37 39 44 46 47 50

10% 20% 28% 40% 54% 64% 68% 74% 78% 88% 92% 94% 100%

50 45 40 36 30 23 18 16 13 11 6 4 3

100% 90% 80% 72% 60% 46% 36% 32% 26% 22% 12% 8% 6%

se investiga las edades de empleados en un supermercado

Clase 119-178 129-138 139-148 Edad 17-21 22-26 27-31 32-36 37-41 42-46 47-51 Total 149-158 159-168 169-178

FR 4 7 13

FR% 10.00% 17.50% 32.50% frecuencia relativa 10 6 10 12 3 2 7 50

FR.A 4 11 24 Fr% 19.60% 11.70% 21.50% 23.50% 5.80% 3.90% 13.70% 100.00% 33 28 40

F.R.A% 10.00% 27.50% 60.00%

F.R.C (-) 40 33 20

FR(-) % 100.00% 82.50% 50.00%

LIM inf LIM Sup 118.5-128.5 128.5-138.5 138.5-148.5

Marca de clase 123.5 132.5 143.5

f.R f.r.a % acumulada


10 16 26 38 41 43 50 82.50% 95.00% 100.00% 19.60% 31.30% 52.90% 76.40% 82.30% 86.20% 100.00% 11 6 4

f.r.a (-)
51 41 35 24 12 9 7 27.50% 15.00% 10.00%

f.r.a (-)%
100.00% 80.30% 68.60% 47.00% 23.50% 17.60% 13.70% 148.5-158.5 158.5-168.5 168.5-178.5 153.5 163.5 173.5

9 5 2

22.50% 12.50% 5.00%

31

Total

40

100.00%

Definicin de los 11 pasos Media Para Datos Agrupados. Cuando se tiene un conjunto de n datos, que se encuentran agrupados en una distribucin de frecuencias, una aproximacin de la media es: Donde: MEDIANA (med) SE ENCUENTRA A LA MITAD DE LOS DATOS ORDENADOS. Med = Li ( )( )

MODA Es el valor que se presenta con mayor frecuencia en un conjunto de datos (dato que ms se repite. Y cuando: A una distribucin que contiene una moda se le denomina unimodal. Cuando se repite dos veces una moda es bimodal. Cuando existen varias modas se le denomina multimodal. ( )( )

CUARTIL. Uno de los tres puntos que dividen un conjunto de datos numricamente ordenados en cuatro partes iguales. A estos tres puntos se les llama primer cuartil (tambin llamado el cuartil inferior), segundo cuartil (el cuartil medio; es la mediana) y el tercer cuartil (cuartil superior), respectivamente. Se pueden utilizar para darnos una idea de la dispersin de los datos. El primer cuartil es el valor que es mayor o igual que el 25% de las observaciones de la muestra y menor o igual que el 75%. o El segundo cuartil es la mediana. o El tercer cuartil es mayor o igual que el 75% de las observaciones de la muestra y menor o igual que el 25%.
( )

Qn =

)( )

Deciles. Son los nueve valores que dividen la serie de datos de diez partes iguales. Los deciles dan valores correspondientes al 10% al 20% y al 90% de los datos y se su formula para calcular es:
( )

Dn = Percentil.

)( )

32

El percentil es una medida de posicin no central que nos dice cmo est posicionado un valor respecto al total de una muestra. Tambin se usan los cuartiles, deciles o quintiles pero no son ms que casos particulares, y su formula es:
( )

Pn = RANGO

)( )

La diferencia entre el menor y el mayor valor. En {4, 6, 9, 3, 7} el menor valor es 3, y el mayor es 9, entonces el rango es 9-3 igual a 6. Rango puede significar tambin todos los valores de resultado de una funcin.

Ry - Rn = Desviacin Media Es Una Medida de la dispersin de un conjunto de nmeros, que se puede obtener calculando la media de los valores absolutos de las diferencias entre estos nmeros y su media. | | D.M. = VARIANZA Esta medida que nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de observaciones que se tengan. Si la varianza es calculada a una poblacin (Total de componentes de un conjunto), la ecuacin sera:
[ ( ) ] [ ( ) ]

Desviacin estndar o Tpica Esta medida nos permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar nos da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviacin estndar basta con hallar la raz cuadrada de la varianza, por lo tanto su ecuacin sera:
[ ( [ ( ) ] ) ]

Tabla1

33

1. 2. 3. 4. 5.
( [ ]( ) [
( )

)( ) [ ]( )

)(
(

)
)

( )( +( )

) ]( )

6. 7. 8.

]( )

+(

( [ ]( ) [

) ]( )

( [ ]( ) [

) ]( )

9.

34

10.

) )

11.

tabla2

1. 2. 3. 4. 5. 6.

( *

)( ) +( )

( *

)( +(

) )

]( )

+(

]( )

+(
(

)
)

]( )

+(

35

7. 8.
( )

[ [

]( ) ]( )

* [

+( ( )

) ]( )

9. 10.
( ) ( (

) )

11.

tabla3

36

1.
Tiempo de auditoria al min. mas cercano N de registros FA

PUNTO MEDIO

FX

LIM.EXACTO DE CLASE

XM

/ X- M/

(X- M)2

F(X- M)

F{( X- M)}2

10-19 20-29 30-39 40-49 50-59

3 5 10 12 20 50

3 8 18 30 50

14.5 24.5 34.5 44.5 54.5 172.5

43.5 122.5 345 534 1090 2135

9.5-19.5 19.5-29.5 29.5-39.5 39.5-49.5 49.5-59.5

-28.2 -18.2 -8.2 1.8 11.8

/28.2/ /18.2/ /8.2/ /1.8/ /11.8/

795.24 331.24 67.24 3.24 139.24 1336.2

84.6 91 82 21.6 236 515.2

2385.72 1656.2 672.4 38.88 2784.8 7538

2. 3. 4. 5.

( *

)( ) +( )

( *

)(

) +( )

6. 7. 8.
[ ]( ) [

) ]( )

37

( [ ]( ) [

) ]( )

9. 10.
( ( ) )

11.

tabla4

38

NO DE LESIONES

N DE EMPLEADOS

FA

PUNTO MEDIO

FX

LIM.EXACTO DE CLASE

XM

/ X- M/

(X- M)2 0.5184 0.1764 0.0144

F(X- M) 2.16 5.04 1.68 1.62 3.36

F{( X- M)}2 1.5552 2.1168 0.2016 0.2916 1.6128 3.042 8.82

1.5 - 1.7 1.8 - 2.0 2.1 - 2.3 2.4 - 2.6 2.7 - 2.9 3.0 - 3.2 TOTAL

3 12 14 9 7 5 50

3 15 29 38 45 50

1.6 1.9 2.2 2.5 2.8 3.1 14.1

4.8 22.8 30.8 22.5 19.6 15.5 116

1. - 2.2 1.3 2.5 1.6 2.8 1.9 3.1 2.2 3.4 2.5 3.7

- 0.72 - 0.42 - 0.12 0.18 0.48 0.78

/0.72/ /0.42/ /0.12/

/0.187 0.0324 /0.48/ /0.78/ 0.2304

0.6084 3.9 1.5804 17.76

1. 2. 3. 4. 5. 6.

7. 8.
[ ]( ) [ ( ) ]( )

39

( [ ]( ) [

) ]( )

9. 10.
( (

) )

11.

Conclusin: Este trabajo nos ayudo a todos como grupo aprender a contestar una tabla estadstica y saber la diferencia de unos datos agrupados y unos no agrupados.

40

MEDIA PARA DATOS AGRUPADOS


Cuando se tiene un conjunto de n datos, que se encuentran agrupados en una distribucin de frecuencias, una aproximacin de la media es:

DONDE: X Es el valor de la media. K Es el nmero de intervalos. F1 Es la frecuencia de i-esimo intervalo. M1 Es la marca de la clase de i-esimo intervalo. N Es el nmero de datos.

MEDIANA (MED)
Se encuentra a la mitad de los datos ordenados y su frmula para calcularla es la siguiente:

Med = Li

)( )

MODA
Es el valor que se presenta con mayor frecuencia en un conjunto de datos (dato que ms se repite. NOTA: Cuando a una distribucin que contiene una moda se le denomina unimodal. Cuando se repite dos veces una moda es bimodal. Cuando existen varias modas se le denomina multimodal.

)( )

CUARTIL
Uno de los tres puntos que dividen un conjunto de datos numricamente ordenados en cuatro partes iguales. A estos tres puntos se les llama primer cuartil (tambin llamado el cuartil inferior), segundo cuartil (el cuartil medio; es la mediana) y el tercer cuartil (cuartil superior), respectivamente. Se pueden utilizar para darnos una idea de la dispersin de los datos.
( )

Qn =

)( )

DECILES
Son los nueve valores que dividen la serie de datos de diez partes iguales. Los deciles dan valores correspondientes al 10% al 20% y al 90% de los datos y se su frmula para calcular es:

41

( )

Dn =

)( )

PERCENTIL
El percentil es una medida de posicin no central que nos dice cmo est posicionado un valor respecto al total de una muestra. Tambin se usan los cuartiles, deciles o quintiles pero no son ms que casos particulares, y su frmula es:
( )

Pn =

)( )

RANGO
Es la diferencia entre el menor y el mayor valor. En {4, 6, 9, 3,7} en menor valor es 3, y el mayor es 9, entonces el rango es 9-3=6 Su frmula es la siguiente:

Ry Rn=

DESVIACIN MEDIA
Es una Medida de la dispersin de un conjunto de nmeros, que se puede obtener calculando la media de los valores absolutos de las diferencias entre estos nmeros y su media.

D.M. =

VARIANZA
Esta medida que nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de observaciones que se tengan. Si la varianza es calculada a una poblacin (Total de componentes de un conjunto), la ecuacin sera:

[ ( [ (

) ] ) ]

42

DESVIACIN ESTNDAR O TPICA


Esta medida nos permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar nos da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviacin estndar basta con hallar la raz cuadrada de la varianza, por lo tanto su ecuacin sera:

[ (

) ] ) ]

[ (

43

NO. DE PERSONAS (TRABAJADORES Y CIVILES) ENTRANTES Y SALIENTES EN UNA AGENCIA DE AUTOS NISSAN

Tiempo en minutos 1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-55

Personas entrantes Frecuencia f 5 4 15 7 15 20 9 10 21 16 19 141

Frecuencia Acumulada fa 5 9 24 31 46 66 75 85 106 122 141

Punto Medio De Clase (X) 3 8 13 18 23 28 33 38 43 48 53 308

Fx 15 32 195 126 345 560 297 380 903 768 1007 4628

Limites Exactos De Clase 0.5-1.5 5.5-10.5 10.5-15.5 15.5-20.5 20.5-25.5 25.5-30.5 30.5-35.5 35.5-40.5 40.5-45.5 45.5-50.5 50.5-55.5

X-M -29.822 -24.822 -19.822 -14.822 -9.822 -4.822 0.178 5.178 10.178 15.178 20.178

IX - MI 29.822 24.822 19.822 14.822 9.822 4.822 0.178 5.178 10.178 15.178 20.178

(X M)2 889.351 626.131 382.911 219.691 96.471 23.251 0.031 26.811 103.591 230.371 407.151 3005.761

F( IX-MI ) 149.11 99.288 297.33 103.754 147.33 96.44 1.602 51.78 213.738 242.848 383.382 1786.602

F((X-M)2) 4446.755 2464.524 5893.665 1537.837 1447.065 465.12 0.279 268.11 2175.411 3685.936 7735.869 30010.571

44

1.2.3.4.-

( (
( )

)( ) )( )
(

( (
)

) )( )

(
( )

)( ) )( )
( )

(
( )

) (
( )

( (
( )

) ( (

( )( ) ) ) ( ) ) ( ( ( )( ) )( ) )( ) )( )

)( ) )( )
( )

(
( )

(
( )

)( ) )( )
(

( (

7.-Rango Ry - Rn = 55 1 = 54 9.-Desviacin media


| |

10.-Varianza
[ ( [ ( ) ] ) ]

11.-Desviacin Estndar
[ ( [ ( ) ] ) ]

Conclusiones:
Por medio de la investigacin que realizamos a una agencia de automviles pudimos darnos cuenta que con solo observar la cantidad de personas que entraban y salan de la empresa pudimos crear una tabla de datos agrupados en la cual aplicamos ciertas formulas ya antes vistas en clase esto para poder entenderle mejor al tema y reforzar nuestros conocimientos sobre el tema.

45


Edades de las personas 15 25

OBJETIVOS: Determinar el porcentaje de personas que asisten al cine en familia, en pareja o solos. En base a lo anterior hacer una tabulacin. Con los datos de la tabla realizada sacar: media, mediana, moda, cuartil, decil, y percentil
Frecuencia Frecuencia acumulada Punto de clase FX Limites exactos de clase 17.525.5 25.533.5 33.541.5 41.549.5 49.557.5 X-M /X-M/ (X-M)
2

F(/XM/)

F(X-M)

35

35

21.5

752.5

- 10.4

/10.4/

108.16

364

3785.6

26 33

33

68

29.5

973.5

2.4

/2.4/

5.76

79.2

190.08

34 41

25

93

37.5

937.5

5.6

/5.6/

31.36

140

784

42 49

10

103

45.5

455

13.6

/13.6/

184.96

136

1849.6

50 57

111

53.5

428

21.6

/21.6/

466.56

172.8

3732.4

Total

= 111

187.5

3546.5

796.8

892

10341.6

Mx=fx/N= 3546.5/111= 31.9 Mod= 17.5(0/0+2)8 Mod=17.5 Med=Li+[N/2 - faA)i Fc Med=25.5(111/2 - 35)8 = 30.4 33 Q3=3(111)/4=83.2-35/33=1.060(8)=8.48 Q6=6(111)/4=166.5-103/8=7.937(8)=63.5 D12=12(111)/10=133.2-103/8=3.775(8)=30.2 D14=14(111)/10=155.4 103/8=6.55(8) =52.4 P65= 65(111)/100=72.15-35/33=1.125 (8) =9 P87= 87(111)/100=96.57-68/25=1.142 (8) =9.13 RY-Rm=57-18= 39 RY-Rm 57-18= 39

Desviacion media

46

892/111=8.036 Varianza 10341.6/111=93.16 10341.6/111-1=94.014 Desviacion Estandar 10341.6 =9.65 111-1 CONCLUSIONES: Retroalimentar el conocimiento sobre las medidas de tendencia central y las tabulaciones. Que el porcentaje de personas que van al cine, son el 50% van en familia, el 10% van en pareja, el 20% van solos, el 10% personas de la tercera edad y el 10% van como amigos(as).

47