Está en la página 1de 7

Bolilla 1 LA ESTADISTICA DESCRIPTIVA

Primera Acepcin: No es ms que una coleccin de datos ordenados y clasificados segn un criterio.
Segunda Acepcin: Es la ciencia que con ayuda del clculo de probabilidades estudia las leyes del comportamiento de aquellos fenmenos que dependen del azar.
Tercera Acepcin: Es la ciencia que aporta las tcnicas o mtodos que se sigue para recolectar, organizar, resumir, describir, analizar, interpretar, generalizar y contrastar
resultados de las observaciones de los fenmenos reales para ayudar a tomar decisiones ms efectivas.-
Bioestadstica: Cuando los datos que se analizan proceden de las ciencias biolgicas o medicas, se utiliza el trmino bioestadstica para diferenciar esta aplicacin
particular de las herramientas y conceptos de la estadstica general.
Estadstica Descriptiva: comprende aquellos mtodos usados para recopilar, organizar y describir la informacin que se ha recogido con el fin de describir sus
caractersticas.
Estadstica Inferencial: comprende aquellos mtodos y tcnicas usadas para hacer generalizaciones, predicciones o estimaciones sobre una caracterstica de la poblacin o
la toma de una decisin con respecto a una poblacin, a partir de una muestra de esa poblacin.
Poblacin: Definicin 1: El conjunto de personas, animales o cosas que son objeto de nuestro estudio.-DEFINICIN 2: es la que est formada por la totalidad de las
observaciones en las cuales se tiene cierto inters. ELEMENTOS O UNIDAD ESTADSTICA: Son las personas, animales o cosas que forman la poblacin.
Tamao de la poblacin: FINITA: cuando el nmero de elementos que la forman es numerable, se puede contar, por ejemplo el nmero de alumnos de la universidad,
cantidad de empleados de una fbrica, cantidad de pacientes. INFINITA: cuando el nmero de elementos que la forman es incontable o tan grande que puede
considerarse infinito.
Elementos: Los elementos de una poblacin poseen una serie de cualidades, propiedades o rasgos comunes que se denominan en estadstica CARACTERES. Pueden ser-
VARIABLES CATEGRICAS: son aquellas que por su propia naturaleza no se pueden medir y se describen mediante palabras. Son producto de conteo, sexo
VARIABLES NUMERICAS: son aquellos que se pueden describir mediante nmero, es decir, que son susceptibles de cuantificacin o de medicin. Peso, altura. Pueden ser-
Discreta: si toma un nmero finito o infinito numerable de valores, o dicho de otra forma, si entre dos valores consecutivos puede tomar a lo sumo un nmero finito de
valores. Continua: si toma un nmero infinito de valores en un intervalo, o dicho de otra manera si entre dos valores consecutivos puede tomar cualquier otro.
Muestra: Una muestra estadstica es un subconjunto de la poblacin. El punto esencial en el muestreo es estar seguro de que los elementos de la muestra representan a la
poblacin tan fielmente como sea posible.
Mtodos de Seleccin: MUESTRA ALEATORIA: Si cada elemento de la poblacin tiene la misma posibilidad de ser elegido. MUESTRA NO ALEATORIA: Si algunos elementos
de la poblacin tienen mayores posibilidades de seleccin que otros.
Estadstico: es cualquier caracterstica numrica de una muestra. Parmetro: es cualquier caracterstica numrica de una poblacin.
Escalas de Medicin: En trminos sencillos, significa que se asigna nmeros, letras, palabras o algn otro smbolo a personas o cosas para dar a conocer la informacin
acerca de la caracterstica que se somete a medicin. NOMINAL O DE CLASIF: es la menos elaborada de las cuatro y posee dos caractersticas principales.- Primero,
produce clasificaciones de personas o cosas con base en una evaluacin cualitativa de la caracterstica que se somete a consideracin; segundo, su uso no brinda
informacin con respecto a la cantidad. ESCALA ORDINAL: clasifica personas o cosas sobre la base de las caractersticas evaluadas.- Sin embargo, a diferencia de la escala
nominal, las clasificaciones producidas por esta escala incorporan los atributos muy importantes de mayor que o menor que. ESCALA DE INTERVALOS: agrega los
atributos de cuanto ms y cuanto menos a aquellos de la escala ordinal. ESCALA DE RAZONES: es similar a la escala de intervalo, con excepcin de que posee un verdadero
punto cero.
Dato: es el registro (numrico o no) que se obtiene como resultado de observar cierta caracterstica de inters en un individuo. DATOS TRANSVERSALES: Se renen en el
mismo momento de tiempo. DATOS LONGITUDINALES: Son los datos de series de tiempo, se coleccionan a lo largo de varios perodos de tiempo.
Obtencin de Datos: DATOS PRIMARIOS: son aquellos que se encuentran en la forma original en que fueron registrados. DATOS SECUNDARIOS: son aquellos que fueron
producidos (diseados y recopilados) por terceros, con un fin ajeno al de la investigacin y que ya han sido sometidos a alguna forma de elaboracin posterior.
Tipos de Mtodos de Muestreo: MARCOS: El proceso de muestreo comienza con localizacin de las fuentes adecuadas de datos, como listados de poblacin, registros,
directorios y otras fuentes. Las muestras se extraen de estos marcos.
Tipos de Muestras Utilizadas (Probabilsticas): MUESTRA ALEATORIA SIMPLE: es aquella en la cual cada individuo o elemento de una poblacin tiene la misma
oportunidad de ser elegido. Se una n para representar el tamao de la muestra y N para representar el tamao de la poblacin.- Cada persona o elemento en el marco se
enumera de 1 a N .en particular de la poblacin la primera vez es igual a 1/N. Usa el muestreo con remplazo, que vuelve al marco y tiene la misma probabilidad de salir
(1/N) O Muestreo sin remplazo, no regresa la persona al marco, y no puede elegirse de nuevo por ende (1/N-1) MUESTRA SISTEMATICA: se dividen N individuos o
elementos del marco poblacional en k grupos, dividiendo el tamao de la poblacin N entre el tamao de la muestra deseado n.- Es decir, (k = N / n) donde k se
redondea al entero ms cercano. MUESTRA ESTRATIFICADA: primero se dividen los N individuos o elementos de la poblacin en sub poblaciones separadas, o estratos, de
acuerdo con algunas caractersticas comunes.- Se realiza un muestreo aleatorio simple en cada estrato y despus se combinan los resultados de las muestras aleatorias
simples. MUESTRA CONGLOMERADA: se divide los N individuos o elementos de la poblacin en varios conglomerados, de manera que cada conglomerado sea
representativo de la poblacin completa.- Despus, se obtiene una muestra aleatoria de los conglomerados y se estudian todos los individuos o elementos dentro de cada
conglomerado seleccionado.
Presentacin de Variable Categrica: [ 1 variable (tabla resumen-frecuencia absoluta, % frec relavtiva) varias variables (super tabla) 2 variables (tabla de contingencia- frec
absolut conjuntas, frec absolutas marginales) ] Cuadro estadstico.
Presentacin de Variable Numrica: Datos sin agrupar lo primero que debemos hacer siempre es ordenarlos en forma creciente (Grficos de puntos o Dotplot).
Datos agrupados sin intervalo disc se usa tabla de distribucin de Frecuencia, y grafico de bastones. Datos agrupados con intervalos continua: debemos pensar varias
cosas, como cuantos intervalos vamos a hacer, que amplitud usamos Se recomienda no usar menos de 5 ni ms de 15 intervalos. A) Sacamos cant de interv :( k > n) B)
amplitud a realizar: rx = rango recorrido de la variable (xi max xi min) ci=( rx/interv) Debemos ahora determinar con que valor de variable empezamos los intervalos,
para ello definimos el siguiente criterio: (Li Xi <Ls) Tomamos el dato donde es lmite inferior. Se representa con histograma, polgono de frecuencia, ojiva.
Histograma: Es un grfico de barras verticales adyacentes y me muestra la forma en que se distribuyen los datos que estamos estudiando.- Todas las barras tienen el
mismo ancho y se diferencia en la altura que corresponde a cada frecuencia absoluta o frecuencia relativa del intervalo.
Polgono de Frecuencia: Es un grfico lineal.- Los puntos medios de los intervalos representa los datos de ese intervalo.- Me cuenta lo mismo que el histograma, como se
distribuyen mis datos.- Es apropiado cuando se quieren comparar distribuciones, ya que pueden encimarse dos polgonos con distintas tramas.
Ojiva o frec. Acumulada: podemos calcular alguna medidas descriptivas, adems, podemos decir que porcentaje de observaciones son menores a cierto valor de variable.
Diagrama de tallo y hoja: Tecnica para explorar datos, La importancia de este diagrama es que no perdemos el dato original, cosa que nos sucede con las distribucin de
frecuencia con intervalos. Org un conjunto de datos y entender la distribucin dentro de un intervalo de observacin.
































MEDIDAS DESCRIPTIVAS
Medida de la Tendencia Central
MEDIA ARITMETICA (x) Es el promedio o medida de tendencia central que se utiliza con mayor frecuencia.- Se calcula con la suma de todas las observaciones en un
conjunto de datos, dividida entre el nmero de elementos involucrados. (x= Xi/n) muestra, (u=Xi/N) poblacin. En escalas intervalares o proporcionales
es una medida que atiende en forma exhaustiva toda la informacin disponible: los valores, las distancias y proporcionalidad entre ellos y la frecuencia de cada uno.
Sensible a los valores extremos. No se puede calcular cuando hay una distribucin de intervalos abiertos.
PARA DATOS SIN AGRUPAR: (x=xi/n)
PARA DATOS AGRUPADOS SIN Y CON INTERVALOS: La diferencia va estar dada en el valor de la variable xi, los valores de la variable sern los puntos medios de los
intervalos. (x=xi*fi/n)
PROPIEDADES: 1 Est definida en la misma unidad de medida que la variable en estudio. 2 la media me dar un valor promedio que estar incluida dentro del recorrido
de la variable. 3 de la formula se puede despejar. 4El promedio es una medida calculada a partir de todos y cada uno de los datos de una serie, en consecuencia resume
apropiadamente la informacin del conjunto, sin embardo puede ser no representativa. Si existen valores atpicos fuera de la serie, deforman a x y no es representativa.
Produce asimetra en distribuciones, histograma y polgonos. Los residuos de un conjunto de datos, con respecto a su media, tienen la propiedad de que la suma de todos
los desvos o residuales es siempre igual a cero.
MEDIANA (Me) me divide mis observaciones en dos partes iguales, valor de la variable que un 50% de los datos es menor a ella. Solo utiliza el orden expresado por los
valores numricos y no atiende el valor de las observaciones extremas. Cuando la distribucin es asimtrica
PARA DATOS SIN AGRUPAR: (Me=n+1/2) n impar y para n par, se saca promedio en la posicin.
PARA DATOS AGRUPADOS SIN INTERVALO: Buscamos el menor Fi% que contiene el 50%.
PARA DATOS AGRUPADOS CON INTERVALO: [Me= Li+(n|2-Fi-1/fi)*ci].
MODO (Mo) Es el valor de la variable que ms veces se repite. Cuando tenemos dos frecuencias absolutas o tres decimos que no tienen modo. Es la nica medida
descriptiva de Tendencia Central que podamos calcular cuando tenemos variables categricas. Medidas de asimetra.
PARA DATOS SIN AGRUPAR: Es la variable que ms se repite.
PARA DATOS AGRUPADOS SIN INTERVALOS: Observamos la mayor frecuencia absoluta y es ese valor. P
ARA DATOS AGRUPADOS CON INTERVALOS: (d1= fi - fi-1) (d2= fi - fi+1)-> [Mo=Li+ (d1/d1+d2)*ci]
Medidas de Orden
CUARTILES (Qr) donde r es el cuartil que queremos calcular. Los cuartiles dividen mi distribucin de datos u observaciones en cuatro partes iguales o sea que tenemos tres
cuartiles el cuartil de orden 1, de orden 2 y el de orden 3, y en cada uno se encuentra el 25 % del total de casos observados. Q1 25%, Q2 50%, Q3 75%.
PARA DATOS SIN AGRUPAR: Se orden en forma creciente, donde halla pocos datos [Qr=(n+1)*r/4], 1) Si da nm. entero, es la variable. 2) Decimal en 5 el cuartil buscado
ser el promedio entre el dato posicin del entero y el siguiente. 3) Ninguno de los dos,

ser el dato que ocupe la posicin siguiente al valor entero.
PARA DATOS AGRUPADOS SIN INTERVALO: El cuartil 3 nos implica el 75%, por lo tanto buscamos el menor porcentaje que lo cubre, y observamos el valor de variable.
PARA DATOS AGRUPADOS CON INTERVALO: [Qr=Li+(n*r|4-Fi-1/fi)*ci]
PERCENTILES (Pr%) Los percentiles me dividen las observaciones en cien partes iguales. PARA DATOS SIN AGRUPAR: datos < 20, se orden las observaciones en forma
creciente y se calcula la posicin. [Pr%=(n+1)*r%/100] 1) Valor entero, ser el valor de la variable que ocupe este lugar. 2) Decimal en 5, ser el promedio entre el dato
posicin del entero y el siguiente. 3) Ninguno de estos, ser el dato que ocupe la posicin siguiente al valor entero.
PARA DATOS AGRUPADOS SIN INTERVALO: Buscamos el menor % que lo cubre y observamos el valor de la variable.
PARA DATOS AGRUPADOS CON INTERVALO: [Px%=Li+(n*r|100-Fi-1/fi)*ci]. RANGO DEL PERCENTIL: preguntan qu porcentaje de datos estn por debajo de un
determinado valor de variable. [Rp=Fi-1+(Xi-Li*fi/ci)/n*100]
Medidas de Dispersin Un valor pequeo para una medida de dispersin indica que los datos se encuentran acumulados cercanamente. Una medida de dispersin grande
indica que la media no es confiable, es decir, que no es representativa de los datos.
RANGO O RECORRIDO (Rx) Se la calcula haciendo la diferencia entre el mximo valor de la variable y el mnimo que toma. uso importante cuando vemos la Estadstica
Descriptiva en el Control de Calidad de procesos
RANGO INTERCUARTILICO (Ric) RIC=Q3 - Q1 considera la dispersin de la mitad (parte central) de los datos; por lo tanto, los valores extremos no influyen en ella.
VARIANCIA (Sx ) toman en cuenta como se distribuyen o agrupan las observaciones.- Por lo tanto se pens en una medida estadstica que me tuviera en cuenta todos los
datos. de la muestra es la suma de los cuadrados de las diferencias con relacin a la media aritmtica dividida entre el tamao de la muestra menos uno.
[Sx= ( xi - x)/n-1]. VALOR CUADRADO NUNCA VALOR NEGATIVO. PARA DATOS SIN AGRUPAR [Sx= x - nx/n-1]. PARA DATOS AGRUPADOS [Sx=x fi - nx/n-1].
DESVIACION ESTANDAR (Sx) mide la dispersin promedio alrededor de la media: como fluctan las observaciones mayores arriba de ella y las observaciones menores
debajo de ella. es la verdadera medida de dispersin ya que se expresa en las mismas unidades de medida que los datos originales. (Sx=Tvariancia) definen donde se
agrupan los datos. Un valor pequeo me indica q los datos estn localizados cerca de la Media, mejores datos.
COEFICIENTE DE VARIACION (CVx) es una indicacin relativa de la variacin.- Siempre se expresa como porcentaje. Se Pueda usarse para comparar distribuciones en
diferentes unidades de medidas, y poder decir de ellas cual es ms homognea en sus datos respecto a la media (CVx= Sx/X*100) Menor CV mas homognea.
Medidas de Forma forma de distribucin de datos. Compara Media y Mediana.- Media > Mediana: sesgo positivo a la derecha - Media = Mediana; simetra o sesgo cero
Media < Mediana: sesgo negativo o a la izquierda. Cuando hay simetra no hay valores extremos, estn equilibrados.
COMO MEDIR ASIMETRIA (Poligono de frecuencia) A medida que la distribucin se hace ms asimtrica hacia uno u otro lado (derecha e izquierda), las medidas de
tendencia central tienden a alejarse una de otra, siendo la media por estar afectada por los valores extremos la que ms se desplaza hacia la cola de la distribucin.
Derecha = X < Me < Mo . Izquierda= X > Me > Mo.
COEFICIENTE DE ASIMETRIA DE PEARSON (CAP) diferencia en trminos del desvio estndar (CAP= X Mo/s) o (CAP=3*(X-Me)/s). La magnitud indica cantidad de desvo
estndar en el modo. Si es igual a cero, simetra perfecta. Derecha valores + E izquierda valores. Varia entre +3 y -3.
CAJA Y BIGOTES, BOXPLOT 1) traza un rectngulo, extremos en el primer cuartil y tercer cuartil, contiene el 50%. 2) se traza una recta horizontal en el lugar de la mediana.
3) Se calcula RIC. 4) Se aplica regla de tukey (RIC*1.5) para Q1 y Q3.




































Bolilla 2 ELEMENTOS DE PROBABILIDAD
Probabilidad Constituye la base para el estudio de los mtodos de la Estadstica Inferencial, La Probabilidad pregunta sobre la posibilidad de que ocurra algo especifico
cuando se conocen las posibilidades, es decir se conoce la poblacin. El estudio de esta se facilita mucho con.
TEORIA DE CONJUNTOS
CONJUNTO Es una coleccin bien definida de objetos. Letras maysculas
ELEMENTOS Son los objetos o cosas de que est formado el conjunto. Letras minsculas.
DESCRIPCION DE UN CONJUNTO
METODO DE LA LISTA Donde se describen todos los elementos del conjunto entre corchetes (A=[a,b,c,d,e]
METODO DE LA REGLA A = x / x es un elemento].
CONJUNTO UNIVERSAL ms extenso por el cual hay inters en un anlisis dado. Se simboliza al conjunto universal con U, SIMILAR a poblacin.
SUBCONJUNTO decimos que A es un subconjunto de B si cada elemento de A es tambin un elemento de B. Observamos aqu que muestra.
CONJUNTOS IGUALES Si dos conjuntos tienen los mismos elementos.
CONJUNTO VACIO No Contiene ningn elemento C.
OPERACIONES DE UN CONJUNTO
COMPLEMENTO al conjunto que consta de todos los elementos de U que no son elementos del conjunto A. A.
INTERSECCION de dos conjuntos A y B es el conjunto que contiene todos los elementos de A y de B, es decir que son los elementos comunes. Simbolizamos a la
interseccin con .
MUTUAMENTE EXCLUYENTES Cuando no tienen ningn elemento en comun.
UNION de dos conjuntos A y B es el conjunto que consta de todos los elementos que son elementos de A o de B o de ambos. Se simboliza la unin con .
TECNICAS DE CONTEO
REGLA DE LA MULTIPLICACION Si hay que hacer m operaciones y si las primeras se pueden hacer de n1 formas y sin importarme como se hicieron las primeras la segundas
se pueden hacer de n2 formas y as sucesivamente para las m operaciones, entonces la cantidad de operaciones que podemos hacer ser (n1*n2*n3) Cuando son pocas
n se puede dibujar un Diagrama de Arbol.
PERMUTACIOANES Y COMBINACIONES depende si el orden de las selecciones hace diferencia.- Si un orden es suficiente para constituir otro subconjunto entonces se trata
de permutaciones (nPr=n!/n-r!)
Si dos subconjuntos se consideran iguales debido a que simplemente se han reordenado los mismos elementos, entonces se involucran combinaciones (n C r=n!/r![n-r]!)
PROBABILIDAD se refiere al estudio de la aleatoriedad y la incertidumbre. es la posibilidad o la oportunidad de que ocurra un evento o suceso especfico, es una
proporcin o fraccin cuyo valor se encuentra entre 0 y 1 inclusive. Cuando es 0 nunca ocurre, 1 si ocurre.
EXPERIMENTO un proceso que genera resultados bien definidos.
EXPERIMENTO ALEATORIO aquel que proporciona diferentes resultados an cuando se repita siempre de la misma manera.
ESPACIO MUESTRAL (s) Es el conjunto de todos los resultados de un experimento aleatorio.
EVENTO son cada uno de los resultados del experimento aleatorio. SIMPLES/COMPUESTOS.
EVENTOS COLECTIVAMETE EXHAUSTIVOS Si la unin de varios eventos cubre todo el espacio muestral S.
DETERMINAR LA PROBABILIDAD DE OCURRENCIA
PROBABILIDAD CLASICA O DE LAPLACE para asignar probabilidad cuando los resultados del experimento son igualmente probables.Si son posibles n resultados
experimentales, una probabilidad de 1/n es la que corresponde a cada evento. [P(A)=Nde formas que puede ocurrir el evento A/N total de resultados posib].
PROBABILIDAD EMPIRICA O FRECUENCIAL para asignar probabilidad cuando se cuenta con datos para estimar la proporcin del tiempo en que ocurrir el resultado
experimental si el experimento se repite un nmero grande de veces (FRECUEncias).
[P(A)= Nmero de veces que ha ocurrido el evento A en el pasado/N total de Observaciones].
PROBABILIDAD SUBJETIVA y asignamos probabilidad en base al conocimiento del hecho que tenemos. Cuando no podemos poner las otras Ejemplo TEMPERATURA.
PROBABILIDAD MARGINALES Y CONJUNTAS Se toma una tabla de contingencia, frec absolutas, marginales y frecuenciales. De aqu se calcula.
PROBABILIDAD CONDICIONAL De un evento A, se ve influida por la ocurrencia de otro evento relacionado. se escribe P (A / B) y se lee Probabilidad de A dado B.
[P(A/B)=P(A B)/ P (B)].
TEOREMA DE PROBABILIDAD TOTAL interesa la probabilidad de ocurrencia de un evento, pero solo se conoce la probabilidad de ocurrencia del mismo asociado a factores
relacionados (o sea las probabilidades condicionadas a los distintos factores) y las probabilidades de ocurrencia de dichos factores
TEOREMA DE BAYES Constituye una prueba importante de diagnostico. Pues relacin el valor predictivo de una prueba con su sensibilidad y especificidad.
[P(A/C)=P(AC)/P(c)].
SENSIBILIDAD de una prueba es la probabilidad de que una persona con la enfermedad de un resultado positivo O. Sensibilidad = P (+/D)
ESPECIFICIDAD de una prueba es la probabilidad de que una persona que no tiene la enfermedad (sana) de un resultado negativo O. Especificidad = P (-/ D)
VALOR PREDICTIVO POSTIVO es la probabilidad de que una persona que da positivo tenga la enfermedad o. PPV = P (D/+).
VALOR PREDICTIVO NEGATIVO es la probabilidad de que una persona que da negativo no tenga la enfermedad o. NPV = P (D/-)
PREVALENCIA es simplemente la probabilidad de enfermedad o. Prevalencia = P (D).













































Bolilla 3 DISTRIBUCIONES DE PROBABILIDAD
VARIABLE ALEATORIA Es la variable que asume un valor numrico nico para cada uno de los resultados de un experimento aleatorio.
CONTINUA es aquella que puede asumir una cantidad innumerable de valores dentro de ciertos lmites. Peso, altura.
DISCRETA es aquella que puede asumir una cantidad numerables de valores. Cant de hijos de familias de un barrio.
DISTRIBUCION DE PROBABILIDAD PARA VARIABLES ALEATORIAS DISCRETAS
Una distribucin de probabilidad es una representacin de todos los posibles resultados de un experimento aleatorio con las probabilidades de cada resultado.
FUNCION DE CUANTA
La funcin de probabilidad P (X =x), de una variable aleatoria discreta X representa la probabilidad de que X tome el valor xI, como funcin de x:
p (xi) = P (X = x) donde la funcin se evala en todos los posibles valores de x. Al asignar uan funcin de probabilidad para cualq. Variable debe satisfacer:
p (xi) 0 y p (xi) = 1.
FUNCION PROBABILIDAD ACUMULADA F (x) de una variable aleatoria X representa la probabilidad de que X no tome un valor superior a x.[ F(x)=P(X<x)= p(x). ]
ESPERANZA Y VARIANCIA,EL VALOR ESPERADO O MEDIA de una variable aleatoria es una medida de la tendencia central de esa variable.- La ecuacin matemtica del
valor esperado de una variable aleatoria discreta x es: [E (x)== x* p (x) ] Es un promedio ponderado de todos los resultados posibles, donde ponderac. Son las
probabilidades.
VARIANCIA nos dar una idea de variacin de los valores de la variable aleatoria respecto a su valor esperado o media.[ = (x - ) * p (x) ] o [ = x p (x) - ].
DESVIACION ESTANDAR [ = T Variancia].Se mide en las mismas unidades de medidas que la variable aleatoria en estudio.
DISTRIBUCION DE PROBABILIDAD BIPUNTUAL
este es el modelo ms simple, se lo llama tambin prueba de Bernoulli o ensayo de Bernoulli y se refiere a un experimento aleatorio con dos resultados posibles.
DISTRIBUCION DE PROBABILIDAD BINOMIAL En un experimento binomial nos interesa el nmero de xitos que suceden en los n intentos.
1] Se selecciono ya sea a partir de una poblacin infinita sin reemplazo o a partir de una poblacin finita con reemplazo.
2] clasificar en una de dos categora mutuamente excluyentes y colectivamente exhaustivas que por lo comn llamamos xitos y Fracasos.
3] La probabilidad de que una observacin se clasifique como xito, p, es constante entre una observacin y otra.- Entonces la probabilidad de que una observacin sea
clasificada como fracaso es (1-p), es constante en todas las observaciones.
4] El resultado (xito o fracaso) es independiente del resultado de cualquier otra observacin.
FUNCION DE PROBABILIDAD BINOMIAL [P(X=x)=N/X) pala x (1-p) ala n-x].
FORMAS puede ser simtrica o asimtrica.- Siempre que p = 0,50 independiente de que n sea grande o pequeo la distribucin ser simtrica.-
Cuando p es diferente de 0,50, la distribucin binomial ser sesgada.
MEDIA de la binomial es igual al tamao de la muestra n multiplicada por la probabilidad del xito. [= E (x)= n p].
VARIANCIA ser igual al producto del tamao de la muestra por la probabilidad de xito y la de fracaso. [ = n*p * (1 - p)].
DESVIO ESTANDAR raz cuadrado de la variancia. [ = T n* p * q].
DISTRIBUCION DE PROBABILIDAD DE POISSON Su distribucin de probabilidad proporciona un buen modelo para los datos que representan la frecuencia de un evento
especfico en una unidad dada de tiempo, espacio o volumen. x representa el nmero de eventos en tiempo y son los promedios de eventos nuevos.
Para modelar se supone que los eventos ocurran al azar y sean independientes unos de otros.
FORMA de la distribucin de Poisson es asimtrica a derecha, dependiendo del valor de .- A medida que se hace ms grande la distribucin tiende a ser simtrica.-
*P>0.50 ASIMETRICA A LA IZQUIERDA. * P<0.10 ASIMETRICA A LA DERECHA.
POISSON LIMITA DE LA BINOMIAL En el caso de la binomial, si n es bastante grande y p es pequea, simular de espacio continuo proceso de Poisson.- La independencia
entre las pruebas de Bernoulli en el caso Binomial es consistente con la propiedad 2 del proceso de Poisson.- Si se hace al parmetro p cercano a cero se relaciona con la
propiedad 3.- En realidad, derivaremos ahora la distribucin de Poisson como forma limitante de la distribucin binomial cuando n , p 0 y n p permanece
constante.-
De aqu, si n es grande y p cercano a 0, se puede usar la distribucin de Poisson con = = n p para aproximar probabilidades binomiales.- Si p es cercano a 1, an
podemos utilizar la distribucin de Poisson para aproximar probabilidades binomiales, mediante el intercambio de los que definimos como xito y fracaso, cambiamos
con ello p a un valor cercano a 0.-
b ( x; n; p) p ( x; )


















































Bolilla 4
DISTRIBUCION DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS
pueden asumir la cantidad infinita de valores que correspondan a los puntos en un intervalo de la recta.- Si se intenta asignar una probabilidad positiva a cada uno de
estos incontables valores, las probabilidades ya no sumaran 1, como las variables aleatorias discretas. Puede tomar cualquier valor de un nmero infinito de valores en la
recta real.
LA PROFUNDIDAD O DENSIDAD DE LA PROBABILIDAD
P ( a < X < b) es igual al rea sombreada bajo la curva.
PROPIEDADES
*El rea bajo la curva en una distribucin de probabilidad continua es igual a 1.
*La probabilidad de que x se encuentre en un intervalo particular; por ejemplo de a a b. es igual al rea bajo la curva entre dos puntos a y b.
*P (x = a) = 0 para variable aleatoria continua. P (x a) = P (x> a) y P (x a) = P( x< a).
ELECCION DE MODELO
Que se ajuste al conjunto acumulado de datos.-
Que permita hacer las mejores inferencias posibles usando los datos.
DISTRIBUCION DE PROBABILIDAD NORMAL O GAUSS
La importancia no se debe a su forma ya que muchas distribuciones tienen esa forma y no se distribuyen normalmente.
CONDICIONES PARA USAR
1] Tiene forma de campana y est centrada en el valor de la media poblacional, . -> es la desviacin estndar de la poblacin.
2] Funcin de densidad ----------------------------------------------------------------------- es la media poblacional
3] El rea total comprendida bajo la curva y por encima del eje horizontal es igual a 1,00 de probabilidad.
4] es simtrica respecto a su media, es decir que la media es igual a la mediana y al modo, 50% de cada lado.
5] La distancia que hay desde el punto de inflexin de la curva, que es donde deja de ser cncava hacia abajo y empieza a ser cncava hacia arriba, hasta una
perpendicular levantada sobre la media es igual a 1 .
6] La curva de la distribucin normal se extiende de - a + .
7] Es asinttica al eje de abscisa X, la curva se extiende sobre el pero nunca llega a tocarlo.
9] El rea comprendida entre 1 es igual al 68 % de probabilidad 9] El rea comprendida entre 2 es igual al 95 % de probabilidad. 9] 3 es igual al 99%.
NORMAL ESTANDARIZADA nos expresa la desviacin de una observacin con respecto a su media expresada en unidades de la desviacin estndar
Parmetro una media = 0 y una desviacin tpica o = 1. [z= - Xi -/ o +].
* para valores negativos de Z, me da probabilidad de reas que van de - a valores negativos de Z.
* para valores positivo de Z, me da probabilidad de reas que van de - a valores positivos de Z.
PROPIEDADES TEORICAS
Es simtrica, por lo tanto, la media y la mediana son iguales.-
Tiene forma de campana, por lo que se aplica la regla emprica.-
El rango intercuartil es igual a 1,33 desviaciones estndar.-
* El rango es infinito.


DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIONES DISCRETAS DISTRIBUCIONES CONTINUAS
BINOMIAL
BINOMIAL
ACUMULADA
HIPERGEOMETRICA
UNIFORME
EXPONENCIAL
NORMAL
APROXIMACION A
BINOMIAL Y
POISSON
DETERMINACION
DEL VALOR X
NORMAL
ESTANDARIZADA
DE POISSON
NORMAL
APROXIMACION A
BINOMIAL Y
POISSON
DETERMINACION
DEL VALOR X
NORMAL
ESTANDARIZADA












































( )
e
(
(
(
(

|
.
|

\
|
=
o

t o
- x
2
1
x f
2
2
1
Bolilla 5 DISTRIBUCIONES MUESTRALES mtodos que nos permita obtener los valores de los parmetros poblacionales basndonos en los resultados de la muestra.
DISTRIBUCION DE PROBABILIDAD
Sirven Permiten responder preguntas de probabilidad acerca de estadsticas muestrales y Proporcionan la teora necesaria para hacer vlidos los procedimientos de
inferencia estadstica.
DISTRIBUCION MUESTRAL
La distribucin de todos los valores posibles que puede asumir un estadstico calculado a partir de muestras del mismo tamao, seleccionado aleatoriamente de la
poblacin.
ELABORACION Pueden construirse empricamente a partir de poblaciones finitas y discretas. Imposible realizar si poblacin grande e infinita.
1] De una poblacin finita de tamao N, se extraen de manera aleatorias todas las muestras posible de tamao n.
2] Se calcula el estadstico de inters para cada muestra.
3] Se ordena en una columna los distintos valores observados del estadstico y en otra columna, las frecuencias de ocurrencia correspondientes de cada valor
observado.
CARACTERISTICAS
MEDIA FORMA FUNCIONAL GRAFICA VARIANCIA
DISTRIBUCION DE LA MEDIA DE LA MUESTRA
Puede construirse ordenando los diferentes valores de media en una columna, y sus frecuencias de ocurrencia en la otra. En la tabla se aprecian los datos que satisfacen
los requerimientos para la distribucin de probabilidad. Las probabilidades individuales todas son mayores de 0 y la suma de todas ellas me da 1,00.
DISTRIBUCION MUESTRAL X forma funcional, observamos que el grfico en la poblacin esta distribuido uniformemente, en la distribucin muestral va tomando una
forma cada vez ms similar a la normal.
DISTRIBUCION MUESTRAL X la media, lo calculamos. me da igual a la media de la poblacin, esto no es casualidad, siempre es as.
DISTRIBUCION MUESTRAL X variancia , no es igual a la de la poblacin, a la raz cuadrada de la variancia de la distribucin muestral, se la conoce como ERROR EST MEDIA.
MUESTREO DE UNA POBLACION CON DISTRIBUCION NORMAL La distribucin de la media de la muestra tiene las siguientes propiedades.
1] La distribucin de la media ser normal.
2] La media de la media de la distribucin muestral , ser igual a la media de la poblacin de la, cual proviene la muestra.
3] La variancia de la distribucin muestral ser igual a la variancia de la poblacin dividida entre el tamao de la muestra.
MUESTREO DE UNA POBLACIAON CON DISTRIBUCION NO NORMAL
se utiliza un teorema matemtico conocido como teorema central del lmite. Dada una poblacin de cualquier forma funcional no normal con una media y variancia
finita , la distribucin muestral de la media x, ser casi normal con media x y variancia /n cuando la muestra es muy grande.
TEOREMA CENTRAL DEL LMITE
permite tomar muestras a partir de la poblaciones con distribucin no normal y garantizar que se obtengan aproximadamente los mismos resultados que si la poblacin
tuviera una distribucin normal.
Que tan grande tiene que ser la muestra para que el teorema sea aplicable?
pues el tamao de la muestra depende de la condicin de no normalidad en la poblacin, 30 es sufieciente(n).
MEDIA DE LA MUESTRA, DISTRIBUCION MUESTRAL DE LA MEDIA
se tienen la seguridad de que la distribucin muestral est distribuida en forma al menos aproximadamente normal con tres condiciones:
1] Cuando se hace el muestreo a partir de una poblacin con distribucin normal.
2] Cuando se hace el muestreo a partir de una poblacin que no exhibe una distribucin normal y la muestra es grande.
3] Cuando se hace el muestreo a partir de una poblacin cuya forma funcional se desconoce, siempre que el tamao de la muestra sea grande.
DISTRIBUCION DE LA PROPORCION DE LA MUESTRA tiene inters en la distribucin muestral de estadsticos como la proporcin de muestras que resulta de los datos de
conteo o frecuencias. PROPORCION DE LA MUESTRA (P).
ELABORACION A partir de la poblacin, que se supone es finita, se toman todas las muestras posibles de un tamao dado y para cada muestra se calcula la proporcin de
la muestra p. se elabora una distribucin de frecuencia de p, ordenando los valores distintos de p junto con sus frecuencias de ocurrencia. Esta distribucin de frecuenc.
Es la distribucin muestral de p.
CARACTERISTICAS Cuando la muestra es grande, la distribucin de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema central del
lmite. La media de la distribucin Up.(promedio de todas las proporciones posibles de la muestra) es igual a la proporcin real de la poblacin Py la variancia de la distr.
es igual a p(1-p)/n o tmb p*q/n. ]

















































Bolilla 6 ESTIMACION
implica calcular, a partir de los datos de una muestra, algn estadstico que se ofrece como una aproximacin del parmetro correspondiente de la poblacin de la cual
fue extrada la muestra. inters en parmetros, como la media y la proporcin.
ESTIMACION PUNTUAL
es un solo valor numrico utilizado para estimar el parmetro correspondiente de la poblacin.
ESTIMACION POR INTERVALOS
consta de dos valores numricos que definen un intervalo que, con un grado especfico de confianza, se considera que incluye al parmetro por estimar.
INTERVALO DE CONFIANZA El intervalo de valores.
ELECCION DEL ESTIMADOR ADECUADO
La regla para calcular este valor o estimacin se conoce como estimador. EL VALOR DE ESTIMACION. [X=xi /n] es un estimador de la media de la poblacin, .-
1] Se dice que un estimador, por ejemplo T, para el parmetro es un estimador insesgado de , si la E (T) = .
POBLACION MUESTREADA La poblacin muestreada es la poblacin de la cual se extrae una muestra.-
POBLACION OBJETIVO La poblacin objetivo es la poblacin de la que se pretende hacer una inferencia.
INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA POBLACION
extraen una muestra aleatoria simple de tamao n de la poblacin y calcula el valor de x, el cual utiliza como estimador puntual de .- Aunque este estimador de
posee todas las cualidades de un buen estimador, se sabe que, debido a los caprichos del muestreo aleatorio, no se puede esperar que x sea igual a .- Por lo tanto,
sera mucho ms significativo estimar mediante un intervalo que de alguna forma muestre su probable magnitud .
COEFICIENTE DE CONFIABILIDAD Es el valor de Z El ltimo componente x es el error estndar o desviacin estndar de la distribucin muestral de x.- En general una
estimacin por intervalo se expresa como; [ Estimador coeficiente de confiabilidad error estndar de la media muestral ]
PRECISION a la cantidad que se obtiene al multiplicar el factor de confiabilidad por el error estndar de la media se le llama precisin de la estimacin. O MARG DE ERR.
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCIN NORMAL poblacin > 30
Cuando se utiliza una muestra pequea y adems se desconoce la desviacin estndar poblacional puede ser necesaria una distribucin alternativa, que se conoce como
la distribucin t de Student o distribucin t simplemente.
SE CUMPLE CUANDO
La muestra es pequea, menor de 30 * es desconocida*La poblacin es normal o casi normal.
Si la variable aleatoria X tiene una distribucin normal, entonces [ t= X - / S / Tn]
TIENE MEDIA = 0 * SIMETRICA RESPECTO A LA MEDIA * OSCILA ENTRE - y + *AUMENTA EL GRADO DE LIBERTAD T SE ACERCA POCO A POCO A LA DISTR NORMAL*
LA VARIANCIA DEPENDE DE LOS GRADOS DE LIBERTAD* VALORES TABULADOS.
DETERMINACION DE INTERVALO DE CONFIANZA para la mediade una poblacin normal con variancia poblacional desconocida , tamao de la muestra es menor a 30.
PROCEDIMIENTO DE ESTIMACION DE INTERVALO PARA UNA MEDIA DE POBLACION
Es n 30
Se conoce

La poblacin es
normal
Use Z
Usar S
en lugar
de
Use Z Utilizo
Estadstica
No
Paramtrica
Se
conoce

Use Z
Usar S
en lugar
de
Use t
si no
no si
no si
si no

CONTROL DEL ANCHO DE UN INTERVALO
Como hemos dicho anteriormente, es preferible un intervalo ms estrecho debido a la precisin adicional que proporciona.
REDUCCIN DEL NIVEL DE CONFIANZA perder un poco de confianza logren intervalos de confianza ms estrecho logra mayor precisin en la estimacin.
INCREMENTO DEL TAMAO MUESTRA Incrementando el tamao de la muestra se puede reducir el error estndar de las media muestrales, / n .- Para niveles de
confianza como el 95 y 99% nos van a dar intervalos muy similares.
DISTRIBUCION t Y LA DIFERENCIA ENTRE LAS MEDIAS.
no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblaciones con un intervalo de confianza, es posible utilizar la distribucin t para
suministrar el factor de confiabilidad si se conocen ciertas suposiciones.
VARIANCIAS SON IGUALES
sobre igualdad de las variancias poblacionales esta justificada, las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse
como estimacin de lo mismo, es decir, la variancia comn Esta variancia se obtiene mediante el calculo promedio ponderado de las dos variancias de las muestras.
VARIANCIAS DISTINTAS
an cuando pueda suponerse que las dos poblaciones presentan distribucin normal, no es adecuado utilizar la distribucin t como acabamos de ver para construir los
intervalos de confianza. El problema gira en torno al hecho de que la cantidad, No sigue una distribucin t con n1 + n2 - 2 grados de libertad cuando las variancias de las
poblaciones son distintas.