Está en la página 1de 19

Probabilidad y Estadstica

ESTADSTICA DESCRIPTIVA En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo el proceso de interpretacin de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico. A medida que aumenta la complejidad de nuestro mundo, se hace cada vez ms difcil tomar decisiones inteligentes y bien documentadas. Con frecuencia tales decisiones deben tomarse con mucho menos que un conocimiento adecuado y experimentando una gran incertidumbre. Sin embargo, las soluciones a estos problemas son esenciales para nuestro bienestar e incluso para nuestra supervivencia final. Virtualmente cada rea de la investigacin cientfica puede beneficiarse del anlisis estadstico. Para quien formula las polticas econmicas y para quien asesora al presidente y otros funcionarios pblicos sobre procedimientos econmicos apropiados la estadstica ha demostrado ser una herramienta muy valiosa. ESTADSTICA DESCRIPTIVA: Se refiere aquella parte del estudio que incluye la obtencin, organizacin, presentacin y descripcin del la informacin numrica. ESTADSTICA INFERENCIAL:(INFERENCIA ESTADSTICA) Es una tcnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a una informacin parcial o incompleta obtenida mediante tcnicas descriptivas. ESTADSTICA: Se refiere a un conjunto de mtodos para manejar la obtencin, presentacin y anlisis de observaciones numricas. Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las caractersticas de todas las posibles observaciones bajo consideracin.

Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

ESTADSTICA: Rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones. Las dos principales ventajas de saber elaborar un anlisis estadstico son: 1. Tomar decisiones. 2. Solucionar problemas. CONCEPTOS BSICOS Toda rama de la investigacin cientfica tiene un vocabulario propio y la estadstica no es la excepcin. Las definiciones y expresiones que siguen son esenciales para la comprensin de cmo se realizan las pruebas estadsticas. POBLACIN: Se define como la totalidad de todas las posibles mediciones y observaciones bajo consideracin en una situacin dada de un fenmeno. POBLACIN FINITA: Es aquella que incluye un nmero limitado de medidas y observaciones. POBLACIN INFINITA: Es aquella que incluye un gran conjunto de medidas u observaciones que no pueden alcanzarse por conteo. La gran parte del trabajo en un proceso estadstico se realiza con muestras. Las muestras son necesarias debido a que con frecuencia las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Es muy costoso y demanda mucho tiempo examinar la poblacin total, por tanto debe seleccionarse una muestra de la poblacin, calcular el estadstico de la muestra, y utilizarlo para estimar el parmetro correspondiente de la poblacin. MUESTRA: Es un conjunto de medidas u observaciones tomadas a partir de una poblacin dada. Es un subconjunto de la poblacin. MUESTRA REPRESENTATIVA: Para que una muestra sea representativa, todos los elementos de la poblacin deben tener la misma oportunidad de ser seleccionados, sin que intervenga el deseo o la inclinacin del investigador. A estas muestras se les conoce tambin como aleatorias El muestreo puede ser con reemplazo o sin reemplazo; muestreo con reemplazo es aquel en que cada elemento de la muestra o poblacin puede ser elegido ms de una vez; en cambio, el muestreo sin reemplazo los elementos pueden ser elegidos slo una vez, ya que hay que excluirlos una vez que son utilizados; al tomar un elemento como parte de la muestra, ste se elimina para que no pueda ser tomado nuevamente.
Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

TIPOS DE VARIABLES En el trabajo estadstico la informacin se recoge en variables. Estas variables se organizan en forma ordenada. Las variables pueden contener datos numricos (Variables cuantitativas) y datos categricos no cuantificables numricamente (variables cualitativas). Las variables cuantitativas pueden ser discretas o continuas. Una variable es discreta cuando toma una cantidad finita o numerable de valores aislados; es decir, entre cada dos valores consecutivos no se puede intercalar ningn otro valor de la variable. El nmero de hijos, el nmero de cuartos por casa habitacin y el nmero de caras obtenido al lanzar tres monedas al aire seran ejemplos de variables cuantitativas discretas. Una variable es continua cuando toma una infinidad no numerables de valores; es decir, entre cada dos valores cualesquiera, siempre existen infinitos valores de la variable. La fuerza fsica, la longitud y el peso seran ejemplos de variables cuantitativas continuas. Las variables cualitativas suelen clasificarse, segn la naturaleza de los datos categricos que representan, en variables nominales y variables jerarquizadas u ordinales. Las variables nominales describen las categoras directamente por su contenido; por ejemplo, las categoras de la variable sexo son varn o mujer. A veces suele asignarse por comodidad cdigos numricos a las distintas categoras de una variable cualitativas nominal, por ejemplo, varn=1 y mujer=2, en cuyo caso hay que resaltar que dichos cdigos siguen siendo variables cualitativas no tratables numricamente. Las variables ordinales o jerarquizadas describen las categoras por el orden que ocupan; por ejemplo, los valores (categoras) de la variable cualitativa satisfaccin en el trabajo pueden ordenarse en satisfaccin alta, satisfaccin media y satisfaccin baja.

DISCRETAS (PARA CONTAR) CUANTITATIVAS (NUMRICAS O ESCALARES CLASIFICACIN DE LAS VARIABLES CUALITATIVAS O CATEGRICAS
Elabor: Lic. Octavio Navarro Franco.

CONTINUAS (PARA MEDIR)

NOMINALES

Probabilidad y Estadstica

JERARQUIZADAS U ORDINALES

Contesta las siguientes preguntas. Describa en sus propias palabras cmo puede utilizarse la estadstica para solucionar problemas en varias disciplinas y ocupaciones. Describa en sus propios trminos la diferencia entre una poblacin y una muestra. Cul es la diferencia entre una variable cuantitativa y una variable cualitativa? Diferencia una variable continua de una variable discreta. D un ejemplo de cada una. Cul es la diferencia entre la estadstica descriptiva y la estadstica inferencial? Cul cree usted que constituye una forma ms elevada de anlisis estadstico y por qu? Si la estadstica est interesada en poblaciones, por qu generalmente trabaja con muestras? ORGANIZACIN Y DESCRIPCIN DE DATOS. Al analizar una caracterstica medida por una variable estadstica, los datos que obtenemos siempre estn dispersos. Una vez que sabemos que los datos relativos a las distintas caractersticas van a estar dispersos, nos surge el problema de detectar el patrn en la variabilidad de los datos. Para ayudar a esta tarea, existen herramientas estadsticas bsicas como las distribuciones de frecuencia. Las distribuciones de frecuencias son la herramienta ms sencilla y utilizada y eficaz cuando estamos rodeados de montones de datos, que no nos dicen nada si no hacemos ms que enumerarlos. Al expresar estos datos en forma de una distribucin de frecuencias, ya nos proporcionan diversas ideas. Puesto que las distribuciones de frecuencias se utilizan muy a menudo es necesario conocer su finalidad, su interpretacin y su uso. El fin principal de la preparacin de una distribucin de frecuencias es, usualmente uno de los siguientes. Dejar bien visible la distribucin de la variable estudiada e identificar su forma. Analizar, controlar y mostrar las capacidades de los procesos de los que derivan sus datos, tanto cualitativa como cuantitativamente.

Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

Ayudar a determinar el promedio, la desviacin estndar as como otras medidas caractersticas de una distribucin.

DATOS ESTADSTICOS: Son todos los que se han obtenido por observaciones, que muestran alguna caracterstica de una poblacin o muestra y no son de inters los valores individuales separados, sino en forma global. DISTRIBUCIONES DE FRECUENCIAS: Al analizar una caracterstica medida por una variable estadstica los datos que obtenemos siempre estn dispersos. Una vez que sabemos que los datos relativos a las distintas caractersticas va a estar dispersos, nos surge el problema de detectar el patrn en la variabilidad de los datos. Para ayudar a esta tarea, existen herramientas estadsticas bsicas como las distribuciones de frecuencias. FRECUENCIA: Es el nmero de observaciones que tiene cada posible valor de la variable aleatoria, es decir cuntas veces ocurre. Tambin se le llama frecuencia absoluta FRECUENCIA RELATIVA: Es la parte de observaciones para cada valor de la variable aleatoria del total de ellas, por lo tanto es una fraccin. FRECUENCIA ACUMULADA: Permite observar la suma de las frecuencias anteriores con la de cierto valor de la variable aleatoria, esta puede ser absoluta o relativa, segn lo que se sume. Al conjunto de valores que ha tomado una variable, junto con sus frecuencias se le denomina distribucin de frecuencias de la caracterstica o variable. AGRUPAMIENTO DE DATOS: Las distribuciones de frecuencias pueden ser simples o agrupadas por intervalos. Cuando el rango de valores que toma la variable de respuesta no es muy grande, se recomienda utilizar una distribucin de frecuencias simple. Se entrevistaron a 51 alumnos del Colegio de Estudios Cientficos y Tecnolgicos del Estado de Michoacn plantel 02 para que nos dijeran el nmero de televisiones que tienen en casa. Con la informacin obtenida, completa la siguiente distribucin de frecuencias. No. De Tv s (X) 1 2 3 4 f Frecue ncia 2 5 19 12 fr Frecuencia relativa fa Frecuencia acumulada % Porcenta je Grados

Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

5 6 7

9 3 1 N=51

Cuando el rango de los valores que toma la variable de respuesta es muy extenso, se recomienda que la distribucin de frecuencias se realice por intervalos de clase. ( Distribucin de frecuencias de datos agrupados por intervalos) . Existen algunos elementos en este tipo de distribuciones que se definen de la siguiente manera. Rango: Es la longitud que existe entre el mximo y el mnimo valor de la variable. Intervalo de clase: El rango se divide en varios subintervalos llamados intervalos de clase. Se recomienda que el nmeros de ellos sea entre 5 y 20, con el criterio de que entre mayor sea la muestra mayor ser el nmero de intervalos de clase. Existen diversas maneras de determinar el nmero de intervalos de clase en una distribucin. El ms usado es calcular la raz cuadrada del total de la poblacin o muestra. Tambin se utiliza la siguiente expresin: N=Total de la poblacin o muestra

2c N

c= Nmero de intervalos a considerar. Para efectos de este curso se darn los intervalos ya elaborados para optimizacin del curso y poder abarcar ms temas durante el semestre. Lmites de clase: Son las fronteras de cada intervalo de clase. El lmite inferior de clase es el valor ms pequeo que puede asignarse en cada clase. Los lmites superiores de cada clase son los valores de mayor magnitud que pueden asignarse a cada clase. Ejemplo: Se registraron durante 50 das el nmero de pasajeros que abordaron un avin en cierta compaa de aviacin. Con la informacin obtenida elabore una distribucin de frecuencias agrupadas por intervalos. CLASE 1 2 3 4 5 6 FRONTE RA INTERV ALO 50-59 60-69 70-79 80-89 90-99 100-109 f 3 7 18 12 8 2 N=50 fr fa X % GRAD OS

Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

El ancho de la clase es la diferencia entre un lmite inferior de clase y el lmite inferior de la siguiente clase. (No es la diferencia entre los lmites superior e inferior de la misma clase). Las fronteras de clase son nmeros que no estn presentes en los datos muestrales, sino que se localizan en medio del lmite superior de una clase y del lmite inferior de la clase siguiente. En el ejemplo anterior, las fronteras de clase son: 49.5, 59.5, 69.5, 79.5, 89.5, 99.5 y 109.5 La diferencia entre las fronteras inferior y superior se denomina tambin ancho de clase. Una vez establecidas las clases es necesario registrar los datos, la marca de clase (punto medio) es valor numrico situado exactamente en la parte central de cada clase. Una vez que se han determinado las marcas de clase, se tiene una distribucin de frecuencias agrupadas. PRESENTACIN GRAFICA: Todas las distribuciones de frecuencias pueden presentarse grficamente. Los puntos medios y los lmites inferior y superior de las clases se representan sobre el eje x, y las frecuencias se representan en el eje y. Para datos cuantitativos, comnmente se utilizan tres tipos de grficas: histogramas, polgonos de frecuencias y ojivas. Para datos cualitativos con frecuencia se utilizan grficas de sectores circulares. HISTOGRAMA: En realidad esto es una versin de la familiar grfica de barras, y se construye marcando primero los intervalos de la clase a lo largo del eje x y dibujando despus para cada intervalo de clase un rectngulo con una altura igual a la frecuencia de la clase. Tambin se puede construir un histograma de frecuencias relativas, con la nica diferencia que en vez de tomar la frecuencia absoluta de la clase se tomarn las frecuencias relativas de cada clase. Para datos que no estn considerados en intervalos, en el eje x se escribirn los valores que tome la variable.

Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

POLGONOS DE FRECUENCIA: Un histograma puede transformarse en un polgono de frecuencias conectando los puntos medios de las partes superiores de los rectngulos. (Normalmente los rectngulos mismos no son parte del polgono; se emplean en este caso como ayuda visual) La curva comienza en el punto medio de la clase inmediato antes de la ms baja y termina en el punto medio de la clase inmediatamente despus de la ms alta. La curva se construye considerando que las observaciones de cada clase estn distribuidas de modo uniforme a lo largo de la clase. Al igual que el histograma, tambin se puede construir un polgono de frecuencias relativas, tomando sobre el eje de las y las frecuencias relativas de cada clase. En datos no agrupados (sin intervalos), sobre el eje x se escribirn los valores que tome la variable en cuestin.

OJIVAS: Tambin es posible representar a la distribucin de frecuencias acumuladas mediante una grfica denominada ojiva. Para construir una ojiva, colquese primero un punto en el lmite inferior de la clase ms baja sobre el eje x, para mostrar que no existe observacin de esa magnitud o menor. Despus, directamente encima del lmite superior de la clase ms baja, colquese un punto en la altura igual a la frecuencia de la clase. Ahora, en el lmite superior de la clase despus de la ms baja, colquese un punto a la altura igual a la frecuencia acumulada (esto es, la suma de las frecuencias de las clases ms baja y de la siguiente). Continese de esa forma hasta que se coloque un punto que represente a la frecuencia acumulada total en un lugar inmediatamente encima de la clase superior ms alta. Por ltimo, nanse estos puntos mediante lneas rectas. A la ojiva obtenida de esta forma tambin se le conoce como polgono de frecuencias acumuladas. De manera semejante se puede construir una ojiva de frecuencias relativas acumuladas.

Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

GRAFICA DE SECTORES CIRCULARES: Con frecuencia, los datos obtenidos slo pueden clasificarse en categoras cualitativas en vez de intervalos numricos, estas categoras pueden representarse en una grfica de sectores circulares (tambin denominada de pastel). Para construir una grfica de sectores, es necesario convertir la distribucin a una de frecuencias relativas.

MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central son valores numricos que tienden a localizar, en algn sentido, la parte central de un conjunto de datos. A menudo el trmino promedio se asocia a estas mediciones. Cada una de las diferentes medidas de tendencia central puede recibir el nombre de valor promedio. Son las medidas que describen mejor el comportamiento de una muestra, y por lo tanto de la poblacin de donde fue tomada dicha muestra. Podemos decir que son las medidas o valores que representan toda la muestra. Las principales medidas de tendencia central son la moda, mediana y media. MODA: Es el valor ms frecuente de un conjunto de datos. En ocasiones se presentan dos o ms valores que se repiten con mayor frecuencia. En este caso, a los datos se les conoce como bimodales o multimodales, respectivamente. La moda es la nica medida de tendencia central que se puede aplicar a datos de tipo cualitativo.
Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

10

MEDIANA: Es el valor de elemento de la posicin central de los datos individuales, ordenados de menor a mayor (o viceversa), y es el punto que marca la mitad de los valores mayores que l y la mida de valores menores que l, es decir, est a la mitad, con el 50% de valores a su derecha y el 50% de valores a la izquierda. MEDIA: Es la medida de tendencia central ms comnmente utilizada y se define como la lnea imaginaria que compensa los valores que se exceden de la media y los que quedan por debajo de sta; de esta manera la media es mayor que el valor ms pequeo y menor que el valor ms grande. Estas medidas de tendencia central se pueden calcular para datos sin agrupar, distribucin de frecuencias simples y distribucin de frecuencias para datos agrupados. CALCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL EN DATOS SIN AGRUPAR MODA: Para obtener la moda (Mo), simplemente buscamos el puntaje o categora que ocurre ms frecuentemente en una distribucin. La moda puede encontrarse fcilmente inspeccin ms que por clculo. MEDIANA: Ordene los datos de mayor a menor o viceversa y calcule la posicin de la mediana (nmero de elementos +1 entre 2, determine el elemento de la posicin central. (si el nmero de datos es par, deber obtener el promedio del valor de los dos elementos centrales). Observe que cuando el nmero de datos es impar, la posicin de la mediana es nica, mientras que si el nmero de datos es par, la posicin exacta de la mediana se encuentra entre dos valores, los que, por lo general se promedian para obtener la mediana. MEDIA: Es la suma de un conjunto de puntajes dividido entre el nmero total de puntajes del conjunto. A diferencia de la moda, la media no es siempre el puntaje que ocurre ms a menudo. A diferencia de la mediana no es necesariamente el punto ms cercano al medio en una distribucin. Se considera como el centro de gravedad, el punto alrededor del cual las desviaciones positivas y negativas de cualquier distribucin de equilibran. Ejemplo: Un estudiante obtuvo las siguientes calificaciones parciales en la materia de probabilidad, 5,3,6,6,7,5,2. Calcula la moda, la mediana y la media. CLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL EN DATOS AGRUPADOS EN UNA DISTRIBUCIN DE FRECUENCIAS SIMPLE. MODA: Es el valor de la variable de respuesta que tiene mayor frecuencia. MEDIANA: Se construye una columna con la frecuencia acumulada comenzando por el valor ms bajo de la variable de respuesta, el total de la poblacin o muestra se divide entre dos y ese
Elabor: Lic. Octavio Navarro Franco.

por

X=

fx
N

Probabilidad y Estadstica

11

valor se busca en la frecuencia acumulada, se verifica a qu valor de la variable de respuesta corresponde. Si el total de la poblacin o muestra es impar se le agrega uno y se divide entre dos. MEDIA: Se calcula con la siguiente expresin:

X =Media
fx= Producto de la frecuencia por el valor de la variable de respuesta. N= Total de la poblacin o muestra. Ejemplo: Se pidi a 71 alumnos matriculados en el quinto curso de primaria para que indicaran el nmero de sus hermanos y/o hermanas que viven en su hogar. Con la informacin obtenida calcula la moda, la mediana y la media. CLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL EN UNA DISTRIBUCIN DE FRECUENCIAS AGRUPADAS POR INTERVALOS. MODA: Es el punto medio del intervalo que tiene mayor frecuencia. MEDIA: Se calcula con la siguiente expresin.

X= X =Media

fx
N

fx= Producto de la frecuencia por el punto medio de cada intervalo. N= Total de la poblacin o muestra. MEDIANA: Se calcula con la siguiente expresin:

L1=Frontera inferior del intervalo de la mediana. N= Total de la poblacin o muestra.

( f )

=Frecuencia acumulada antes del intervalo de la mediana (numrico no de posicin)

F mediana= Frecuencia en la mediana del intervalo C= Ancho de clase.

COMPARACIN DE LA MODA, LA MEDIANA Y LA MEDIA. La media es la medida ms comn de tendencia central. Se presta para mayor manipulacin e interpretacin algebraica. Desafortunadamente, la media se ve afectada por
Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

12

valores extremos, o valores atpicos, y a diferencia de la mediana, puedes ser sesgada por las observaciones que estn muy por encima o muy por debajo de sta. La moda tambin es menos afectada por unas pocas observaciones atpicas, Sin embargo, si no hay moda, o si el conjunto de datos es bimodal, su uso puede ser confuso. Esto no implica que una medida sea necesariamente mejor que las otras. La naturaleza de los datos o de la forma como se utilicen los datos. La decisin sobre cul del las tres medidas de tendencia central se utilizar, incluye diversos factores: El nivel de medicin. (se refiere al tipo de variables utilizadas en la investigacin) La forma de distribucin de las observaciones. (se refiere si existen valores extremos que afecten a la distribucin) El objetivo de la investigacin. (Intereses personales, grupales, Institucionales.) MEDIDAS DE DISPERSIN. Una vez que se ha determinado la parte central de un conjunto de datos, la bsqueda de informacin se dirige inmediatamente a las medidas de dispersin. Las medidas de dispersin abarcan la amplitud (rango), la desviacin media y la desviacin estndar. Estos valores numricos describen el grado de dispersin o variabilidad de los datos. Los valores de stas medidas de dispersin sern mayores cuando los datos estn muy disgregados, y sern menores cuando los datos estn ms cercanamente agrupados. Las medidas de dispersin tambin se pueden calcular para datos sin agrupar, para distribucin de frecuencias simple y para distribuciones de frecuencias agrupadas por intervalos. En el anlisis estadstico no basta el clculo e interpretacin de las medidas de tendencia central o de posicin, ya que, por ejemplo, cuando pretendemos representar toda una informacin con la media aritmtica, no estamos siendo absolutamente fieles a la realidad, pues suelen existir datos extremos inferiores y superiores a la media aritmtica, los cuales, en honor a la verdad, no estn siendo bien representados por este parmetro. En dos informaciones con igual media aritmtica, no significa este hecho, que las distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus datos. Por ejemplo, los valores 5, 50, 95 tiene igual media aritmtica, y mediana que los valores 49, 50,51; sin embargo, para la primera informacin la media aritmtica, se encuentra muy alejada de los valores extremos 5 y 95, cosa que no ocurre con la segunda informacin que posee igual media aritmtica y mediana, vemos entonces que la primera informacin es mas heterognea o
Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

13

dispersa que la segunda. Para medir el grado de dispersin de una variable, se utilizan principalmente los siguientes indicadores: Rango o recorrido, Desviacin media Varianza y desviacin tpica o estndar, Coeficiente de variabilidad. CLCULO DE LAS MEDIDAS DE DISPERSIN EN DATOS SIN AGRUPAR RANGO: Es la diferencia, entre el dato mayor y el menor, es la ms simple de las medidas de dispersin, pero slo da una idea aproximada de la dispersin. DESVIACIN MEDIA: Es el promedio de las desviaciones con respecto a la media y se calcula de la siguiente manera:

DM =

X
N

DM= Desviacin media. N= Total de la poblacin o muestra.

x = Sumatoria de las desviaciones absolutas.

DESVIACIN ESTNDAR: El clculo de la desviacin media ya no es utilizada ampliamente por los investigadores, debido a su dificultad para hacer operaciones algebraicas ms complejas, por esta razn, los investigadores utilizan ms la desviacin estndar que supera estas dificultades. Para calcular la desviacin estndar en un conjunto de datos sin agrupar se utiliza la siguiente expresin.

x
N

X2

= Desviacin estndar

= La suma de las desviaciones de la media, elevadas al cuadrado.

X 2 = La media elevada al cuadrado


N= Total de la poblacin o muestra. CLCULO DE LA DESVIACIN ESTNDAR EN UNA DISTRIBUCIN DE FRECUENCIAS SIMPLE

= Desviacin estndar

fx
N

X2

fx

= La suma del producto de fx por x

X 2 = La media elevada al cuadrado


N= Total de la poblacin o muestra.

CLCULO DE LA DESVIACIN ESTNDAR EN UNA DISTRIBUCIN DE FRECUENCIAS AGRUPADA POR INTERVALOS


Elabor: Lic. Octavio Navarro Franco.

fx
N

= Desviacin estndar
X2

Probabilidad y Estadstica

14

fx

= La suma del producto de fx por x

X 2 = La media elevada al cuadrado


N= Total de la poblacin o muestra

DISTRIBUCIN NORMAL La curva normal es un modelo terico o ideal que se obtuvo de una ecuacin matemtica ms que de una investigacin y recoleccin de datos real. La curva normal es un ingrediente esencial en la toma de decisiones en estadstica, por medio del cual el investigador social generaliza sus resultados de muestras a poblaciones. La distribucin normal es aquella en la cual, a partir de un punto central de mxima frecuencia (la media de la distribucin), los valores mayores y menores que la media se distribuyen simtricamente a derecha e izquierda, disminuyendo gradualmente hasta desaparecer. Esta distribucin es la ms utilizada para variables aleatorias continuas, es decir, aquellas para las cuales es imposible enumerar todos los eventos posibles. Asimismo, esta distribucin permite resolver en forma aproximada los problemas propios de la distribucin binomial o de Poisson, por lo que su importancia en probabilidad y estadstica es fundamental. Aunque los conceptos bsicos fueron planteados inicialmente por el matemtico francs Abraham de Moivre (1667-1774) y por el astrnomo francs Marqus Pedro Simn de Laplace (1749-1827), fue el matemtico alemn Karl Fiederich Gauss (1777-1855) quien present las leyes fundamentales de la distribucin normal de probabilidad, de manera que sta se conoce tambin como distribucin gaussina y su curva se conoce como campana de Gauss. PROPIEDADES DE LA CURVA NORMAL 1. Es simtrica en forma de campana. 2. La media, la moda y la mediana tienen el mismo valor, ubicado al centro de la figura. 3. Tericamente, la curva se extiende hasta el infinito en ambas direcciones, sin tocar nunca la horizontal.

Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

15

PROBLEMAS DE APLICACIN DE LA CURVA NORMAL

1. Dada una distribucin normal con una media de 50 y una Desviacin estndar de 10, encuentre la probabilidad de que X tome un valor entre 45 y 62. 2. Cierto tipo de pila almacenada dura un promedio de 3.0 aos, con una desviacin estndar de 0.5 aos. Suponiendo que la vida de las pilas est distribuida normalmente, encuentre la probabilidad de que una pila dure menos de 2.3 aos. 3. Cierta firma elctrica fabrica bombillas que tienen una vida distribuida normalmente, con una media igual a 800 horas y una desviacin estndar de 40 horas. Encuentre la probabilidad de que una bombilla se queme entre 778 y 834 horas. 4. Cierta mquina produce resistencias elctricas que tienen una media de 40 ohms y una desviacin estndar de 2 Ohms. Suponiendo que las resistencias siguen una distribucin normal y que pueden medirse con cualquier grado de exactitud, qu porcentaje de ellas tendr un valor mayor de 43 Ohms?. 5. Las calificaciones promedio de 300 estudiantes siguen aproximadamente una distribucin normal, con una media de 2.1 y una desviacin estndar de 0.6. Cuntos estudiantes se espera que tengan una puntuacin de entre 2.5 y 3 .5? 6. Dada una distribucin normal con una media de 40 y una desviacin estndar de 6, encuentre: a) b) c) d) e) El rea bajo la curva normal, a la izquierda de 32. El rea bajo la curva normal, a la derecha de 37. El rea bajo la curva normal entre 42 y 51. El punto que tiene el 45% del rea bajo la curva normal, a su izquierda. El punto que tiene el 13% del rea bajo la curva normal, a su derecha.

7. Dada una distribucin normal con una media igual 200 y una desviacin estndar de 10. Encuentre. a) b) c) d) El rea bajo la curva normal, a la izquierda de 214. El rea bajo la curva normal, a la derecha de 179. El rea bajo la curva normal entre 188 y 206. El punto que tiene el 80% del rea por debajo del mismo.

Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

16

e)

Los dos puntos que contienen el 75% del rea en forma centrada.

8. Una mquina de refrescos est regulada para que descargue un promedio de 207 mililitros por vaso. Si la cantidad de lquido est distribuida normalmente con una desviacin estndar de 15 mililitros. a) b) Qu porcentaje de los vasos contendr ms de 231 ml. Cul es la probabilidad de que un vaso contenga entre 198 y 216 ml?

9. La vida promedio de cierto motor pequeo es de 10 aos con una desviacin estndar de 2 aos. El fabricante repone sin cargo todos los motores que fallen dentro del periodo de garanta. Si slo desea reponer el 3% de los motores que fallen, qu tiempo de garanta debe ofrecer?. Suponga que la vida de los motores sigue una distribucin normal. 10.La distribucin de los salarios de 2000 trabajadores tiene una media de $70 y una desviacin media de $6. Supngase que la distribucin es normal. Cuntos trabajadores ganan $60 o menos? Cuntos trabajadores gana ms de $82?. 11.En cierta universidad los estudiantes tienen un promedio de coeficiente de inteligencia igual a 110 puntos y una desviacin estndar de 12.5 puntos. Qu porcentaje de estudiantes tienen un coeficiente de inteligencia superior a los 182 puntos? 12.Un automvil consume 0.08 litros de combustible por kilometro y recorre diariamente una distancia promedio de 385 kilmetros , con una desviacin estndar de 25 kilmetros. Cuntos litros de combustible debe tener el tanque al iniciar el da, si se desea asegurar que al menos el 99.9% de los das no le falte combustible?

REGRESIN LINEAL Con frecuencia hay que resolver problemas en el que intervienen un conjunto de variables, cuando se sabe que existe cierta relacin entre ellas. Por ejemplo: El peso de las personas dependen en cierta medida de sus alturas, el rea de una circunferencia depende de la longitud del radio. El aspecto estadstico consiste en llegar a la mejor estimacin de la relacin entre las variables.

Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

17

La regresin lineal simple considera nicamente el caso de una variable independiente. A partir de un diagrama de dispersin es posible visualizar una curva suave que aproxime los datos. El objetivo al evaluar la relacin entre dos variables es realizar predicciones ms precisas: Cuando se analizan las mediciones correspondientes a dos variables y se plantea una ecuacin de regresin, despus se intenta determinar que tan cercanamente estn relacionadas las variables. Esto requiere de una tcnica conocida como anlisis de correlacin, la cual se ocupa de la medicin de la cercana de la relacin entre las dos variables involucradas en la ecuacin de regresin. Una vez que se ha decidido que existe una relacin lineal entre dos variables, surge la tarea de determinar la recta en particular que puede proporcionar un buen ajuste a los puntos del diagrama. La forma ms tosca de de trazar una recta a travs de estos puntos es mtodo llamado de mano alzada. Implica trazar una lnea recta a mano alzada a travs de / o cerca de los puntos del diagrama de dispersin, de manera que el nmero de puntos que se encuentran por debajo de la recta sea casi igual al de aquellos que se encuentran por encima de la lnea. Obviamente tal recta tiene la desventaja de que no existe ninguna seguridad de que el ajuste es el mejor y no es posible mejorarlo. El criterio que ms se utiliza para ajustar la recta el conocido como mtodo de mnimos cuadrados, que implica que la recta elegida para ajustar los puntos del diagrama de dispersin sea tal que la suma de los cuadrados de las distancias verticales entre los puntos y la recta sea lo ms pequea posible. La ecuacin de la recta que queremos encontrar se expresa en su forma simplificada: y=mx+b. Donde:

m=

n( xy ) ( x )( y ) n

( x ) ( x)
2

b=

( y )( x ) ( x )( xy ) n( x ) ( x )
2 2 2

El coeficiente de correlacin es la proporcin de variabilidad total de y debida a o explicada por, su relacin con x, que tambin se conoce como coeficiente de determinacin.

r=

2 2 2 2 n ( x ) ( x ) n ( y ) ( y )

n ( xy ) ( x ) ( y )

El valor del ndice de correlacin vara en el intervalo [-1, +1]:


Elabor: Lic. Octavio Navarro Franco.

Probabilidad y Estadstica

18

Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la otra tambin lo hace en proporcin constante.

Si 0 < r < 1, existe una correlacin positiva. Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todava relaciones no lineales entre las dos variables.

Si -1 < r < 0, existe una correlacin negativa. Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la otra disminuye en proporcin constante.

PROBLEMAS DE APLICACIN DE REGRESIN LINEAL 1. En una compaa de seguros se desea determinar la relacin entre la experiencia en ventas y el volumen de las mismas. Se selecciona una muestra aleatoria de nueve vendedores. Se encuentra que sus aos de experiencia (x) y ventas anuales normales (y) son las siguientes. X Y 1 2 3 4 5 6 7 8 9 2 1 3 3 4 5 6 5 7 Construya un diagrama de dispersin y determine la ecuacin de la recta. Estmese el

volumen de ventas anuales para un vendedor que tiene una experiencia en ventas de 10 aos. 2. Se tiene un registro de los costos de mantenimiento para seis mquinas idnticas de distintas edades. Por parte de la gerencia se desea determinar si existe una relacin funcional entre la edad de la mquina(X) y el costo de mantenimiento (Y). Se obtienen los siguientes datos: MAQUINA 1 2 3 4 5 6 Obtngase la ecuacin de regresin. mquina de cuatro aos?. 3. El registro de un distrito escolar muestran los siguientes datos correspondientes a profesores que renuncian voluntariamente.
Elabor: Lic. Octavio Navarro Franco.

X Y 2 70 1 40 3 100 2 80 1 30 3 100 Cul sera el costo de mantenimiento para una

Probabilidad y Estadstica

19

AOS EN SERVICIO (X) RENUNCIAS VOLUNTARIAS (Y) 15 10 9 16 13 14 11 15 12 15 Obtngase una ecuacin de regresin y determine el nmero de profesores que renunciarn entre aquellos que han estado 14 aos en servicio.

Elabor: Lic. Octavio Navarro Franco.

También podría gustarte