Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Antologia Estadistica
Antologia Estadistica
INTRODUCCIN
La estadstica surgi en pocas muy remotas. La historia demuestra que Tacito, historiador latino, cuenta que Augusto orden una amplia encuesta sobre las riquezas del imperio, enumer los soldados, los navos, los recursos de todas clases y las rentas pblicas.
La estadstica, como todas las ciencias, no surgi de improviso, sino mediante un proceso largo de desarrollo y evolucin, desde hechos de simple recoleccin de datos hasta la diversidad y rigurosa interpretacin de los datos que se dan hoy en da. As pues, el origen de la Estadstica se remonta a los comienzos de la historia y esto se sabe tanto a travs de crnicas, datos escritos, como de restos arqueolgicos que muestran la cuenta de ganado y la caza, as como los movimientos poblacionales y los censos, etc.
Con el paso del tiempo, la Estadstica pas a ser un poderoso auxiliar de las distintas ciencias y al poseer una tcnica descriptiva y una inferencial, sta ha provocado la investigacin de las leyes del comportamiento de ciertas variables que intervienen en un fenmeno.
La ESTADSTICA DESCRIPTIVA con base matemtica hace referencia a la recoleccin, anlisis e interpretacin de datos y que busca explicar condiciones
regulares en fenmenos de tipo aleatorio. Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad y se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales.
La ESTADSTICA INFERENCIAL, que no es la simple recopilacin de datos, proporciona mtodos que permiten al ingeniero, comprender mejor los sistemas que producen los datos y haciendo uso de leyes fundamentales de probabilidad llegar a conclusiones a partir de la informacin que se colecta, en forma de muestras o agrupaciones de observaciones o acopiando datos cientficos en forma sistemtica para aplicarlos en sus planeaciones y el descubrimiento de oportunidades de mejora.
Por otra parte, la Probabilidad, algunas veces, se denomina vehculo de la Estadstica, es decir, la Probabilidad asociada con eventos de azar es la teora que subyace a la Estadstica y es por esto podemos definirla como la ciencia de hacer afirmaciones sobre lo que ocurrir cuando de las poblaciones conocidas se extraen muestras. Para hacer estas inferencias, es necesario estudiar resultados muestrales en situaciones en que se conoce la poblacin, de modo que sea posible comprender el comportamiento de los eventos al azar. La estadstica de la mano con la Probabilidad, nos ayudarn a obtener una buena recoleccin de datos, un presentacin grfica adecuada y un interpretacin de los resultados obtenidos. Y haciendo uso de las herramientas, podemos llegar a obtener inferencias, conclusiones e incluso predicciones de gran importancias obre el tema de estudio.
TEMA 1:
INTRODUCCIN A LA ESTADSTICA
ESTADSTICA
ESTADSTICA DESCRIPTIVA
Se ocupa de los mtodos de recoleccin, visualizacin, descripcin y resumen de los datos que se originan a partir de los fenmenos que se encuentran bajo investigacin.
ESTADSTICA INFERENCIAL
Se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio.
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. Hay tambin una disciplina llamada estadstica matemtica, la cual se refiere a las bases tericas de la materia. La palabra estadsticas tambin se refiere al resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en estadsticas econmicas, estadsticas criminales, etc.
MUESTRA: Es el subconjunto de la poblacin. Ejemplo: La vacuna de AH1N1 aplicada a los pacientes de la clnica del IMSS-Madero en el periodo de enerojunio del 2010. El estudio de muestras es ms sencillo que el estudio de la poblacin completa; cuesta menos y lleva menos tiempo. Por ltimo se aprobado que el examen de una poblacin entera todava permite la aceptacin de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad.
VARIABLE: Es la caracterstica de inters y de estudio sobre cada elemento individual de una poblacin o una muestra. De acuerdo a sus caractersticas, la variable se clasifica en: 1.- Variable de entrada: Tambin conocida como variable independiente y hace referencia al eje de las x. 2.- Variable de salida: Tambin conocida como variable dependiente y hace referencia al eje de las y. 3.- Variable discreta: Utiliza valores enteros, ejemplo: 25,6,100, etc. 4.- Variable continua: Utiliza valores fraccionarios, ejemplo: 1.5, , , -0.334, etc. 5.- Variable cuantitativa: Es una variable numrica. 6.- Variable cualitativa: Es una variable de atributos o caractersticas, como: color, forma, etc.
DATO: Valor de la variable asociada a un elemento de una poblacin o muestra. Este valor puede ser un nmero, palabra o un smbolo.
POBLACIN ESTADSTICA: Recoleccin de datos sobre los cules se desea reunir informacin.
PROCESO ESTADSTICO
MUESTRA.
Datos recolectados de la poblacin.
Las muestras son elegidas con base Son muestras en que los elementos a en el hecho de que son tpicos. La seleccionar se obtienen con base en la persona que elige la muestra lo realiza probabilidad. a su consideracin.
ESTADSTICA:
PROBABILIDAD: Es el vehculo
de la Estadstica. Pregunta sobre la posibilidad de que ocurra algo especfico.
escalas de frecuencia pueden ser incorrectas, truncas y tender a la enfatizacin de ciertas cifras. En otras ocasiones, la informacin presentada es insuficiente y tiende a la incertidumbre de problemas. Como en todos los lenguajes, con la Estadstica, se puede abusar y en manos de imprudentes, la informacin puede ser tan falsa y producir mentiras y malos entendidos.
EJEMPLOS:
OBSERVACIONES:
OBSERVACIONES:
OBSERVACIONES:
TEMA 2:
2.1.- INTRODUCCIN
Una grfica es una representacin de datos, generalmente numricos, mediante lneas, superficies o smbolos, para ver la relacin que guardan entre s. Tambin puede ser un conjunto de puntos, que se plasman en coordenadas cartesianas, y sirven para analizar el comportamiento de un proceso, o un conjunto de elementos o signos que permiten la interpretacin de un fenmeno. La representacin grfica permite establecer valores que no han sido obtenidos experimentalmente, es decir, mediante la interpolacin (lectura entre puntos) y la extrapolacin (valores fuera del intervalo experimental). La estadstica grfica es una parte importante y diferenciada de una aplicacin de tcnicas grficas, a la descripcin e interpretacin de datos e inferencias sobre stos. Forma parte de los programas estadsticos usados con los ordenadores. Autores como Edward R. Tufte han desarrollado nuevas soluciones de anlisis grficos. Hay muchas formas grficas (visuales) para describir los datos. El mtodo que se aplique es determinado por el tipo de datos y el concepto a representar, entre los cuales se mencionarn los siguientes: Grfica de barras Histograma Diagrama de pastel Ojiva
2.2.1.- ELEMENTOS: 1. Ttulo de la grfica 2. Eje x : variable de entrada 3. Eje y : variable de salida 4. Conclusin
Conclusin: La operacin con mayo incidencia fue la abdominal y la de menor frecuencia fue la torcica.
pertenecen a cada categora como una parte proporcional de un crculo. 2.3.1.- ELEMENTOS: 1. Ttulo de la grfica 2. Categoras: porcentajes 3. Conclusin EJEMPLO:
2.4.- OJIVA
Tipo de grfica constituida por una serie de puntos unidos por lneas rectas. 2.4.1.- ELEMENTOS: 1. Ttulo de la grfica 2. Eje x : variable de entrada 3. Eje y : variable de salida 4. Conclusin
EJEMPLO:
Conclusin: Las operaciones abdominales fueron practicadas con mayor frecuencia y las torcicas las de menor frecuencia.
2.5.- HISTOGRAMA
Es un grfica de barras que presenta una distribucin de frecuencias de una variable cuantitativa. 2. 5.1.- ELEMENTOS: 1. Ttulo de la grfica 2. Eje x : variable de entrada 3. Eje y : variable de salida 4. Conclusin
2.5.2.- TIPOS DE HISTOGRAMAS Simtrico: Ambos lados de la distribucin son idnticos. Uniforme (rectangular): Cada valor aparece con igual frecuencia. Sesgado: Una cola es ms larga que la otra. La direccin del sesgo es del lado de la cola ms larga. En forma de J: No hay cola del lado de la clase con la frecuencia ms alta. Bimodal: Las dos clases ms pobladas estn separadas por una o ms clases. Esta situacin a menudo implica que se estn muestreando dos poblaciones. Normal: Alrededor de la media se forma una distribucin simtrica en forma de montculo que se vuelve ms dispersa en los extremos.
2.5.3.- ELABORACIN DE HISTOGRAMAS Cada clase debe ser del mismo ancho. Las clases deben estar dispuestas de modo que no se superpongan y que cada porcin de informacin pertenezca exactamente a una clase. Se recomienda que se usen de 5 a 12 clases. El ancho de clase es la diferencia entre los lmites de clase superior e inferior.
EJEMPLO: A continuacin se presentan los puntajes de la ronda de apertura del torneo de la Ladies Profresional Golf Association en el Locust Hill Country Club: 69 75 74 72 72 74 67 74 68 70 79 78 78 73 78 74 73 72 73 69 78 71 68 77 78 78 72 76 68 73 72 72 71 77 72 69 75 76 74 74 79 72 75 72 70 81 72 71 75 74 77 73 75 72 75 74 72 73 75 77 74 75 80 68 76 71 74 71 74 73 74 78 73 72 75 71 75 71 74 72 76 74 76 68 73 72 74 72 77 70 74 73 75 68 77 72 72 72 72 75 74 82 76 72 75 71 74 73 71 75 83 79 74 77 76 72 74 74 74 78 68 74 68 74 75 76 74 74 73 78 73 77 70 76 73 75 75 73 73 74 74 70 73 79 71 77
TABULACIN
NO. DE CLASES LMITE DE CLASES FRECUENCIA MARCA DE CLASE
1 2 3 4 5 6
67 X 69 70 X 72 73 X 75 76 X 78 79 X 81 82 X 84
12 38 61 27 6 2
69 72 75 78 81 84
EJERCICIO:
A continuacin se proporcionan las edades de 50 bailarines que asistieron a una audicin para una comedia musical. 21 19 21 20 18 19 20 19 20 21 22 21 21 19 19 19 22 21 21 18 18 21 19 21 22 20 20 19 22 21 23 22 20 19 24 19 20 19 19 20 19 21 19 21 24 20 20 19 19 17
a.) Prepare una distribucin de frecuencias no agrupadas para estas edades. b.) Prepare una distribucin de frecuencias relativas no agrupadas para los mismos datos. c.) Prepare un histograma de frecuencias relativas para estos datos.
32.- Escriba los elementos de la ojiva 31.- Defina histograma 32- Escriba los elementos de un histograma 33.- Mencione los tipos de histograma
d.) Si un grifo es o no defectuoso. e.) El nmero de reactivos contestados correctamente en una prueba estandarizada. f.) El tiempo necesario para contestar una llamada telefnica en cierta oficina de bienes races. 3.- Para los siguientes datos, realice una grfica de barras, una ojiva y un diagrama de pay. No olvide anotar todos los elementos necesarios de la grfica. Anote sus conclusiones - En el artculo Railroads on the Fast Track, se proporcionan las millas operadas por las 10 compaas ms grandes de ferrocarril.
COMPAA CSX Transportation Burlington Union Pacific Norfolk Southern Conrail Southern Pacific Santa Fe Pacific Chicao and North Western Soo Line Illinois Central
MILLAS DE VAS OPERADAS 32 844 32 791 30 315 25 855 24 183 18 768 15 367 8 620 7 265 4 764
4.- Para los siguientes datos, realice un histograma y diga de qu tipo es. Anote todos sus elementos y sus conclusiones. 12 18 17 14 6 22 6 5 17 9 6 12 14 4 2 9 21 16 5 17 2 23 19 22 15 9 9 19 12 9 5 10 18 15 4 9 24 3 18 15 3 21 4 20 14 5 17 21 8 19 16 11 16 10 3 1 18 20 13 24 22 19 15 20
TEMA 3: 3:
La estadstica descriptiva se dedica a aprender cmo presentar y cmo describir un conjunto de valores o datos obtenidos de un experimento. La estadstica descriptiva se divide en tres categoras, las cuales son:
MEDIDAS DE TENDENCIA CENTRAL: Son los valores numricos que localizan, de alguna manera, el centro de un conjunto de datos.
MEDIDAS DE DISPERSIN: Miden la variabilidad que se encuentra entre los datos del experimento.
MEDIDAS DE POSICIN Se utilizan para describir la posicin que tiene un valor de datos especficos en relacin con el resto de los datos.
3.1.1.- MEDIA
Promedio que quiz sea el ms conocido. Se representa por X (que se lee como x barra o media de la muestra). La media se encuentra sumando todos los valores de la variable x (suma de valores x se simboliza como x) y dividiendo entre el nmero de estos valores, n. Lo anterior se expresa con una frmula como:
Media de la muestra:
X =
suma de x nmero
x n
3.1.2.- MODA
Es el valor de x que ocurre con mayor frecuencia. Si dos o ms valores de una muestra estn empatados en cuanto a mayor frecuencia (nmero de ocurrencias), se dice que no hay moda.
3.1.3.- MEDIANA
Valor de los datos que ocupa la posicin central cuando los datos se ordenan segn su tamao. 3.1.3.1.- PROCEDIMIENTO PARA ENCONTRAR LA MEDIANA Paso 1: Ordene los datos. Paso 2: Determine la profundidad de la mediana. La profundidad (nmero de
posiciones a partir de cualquier extremo), o posicin, de la mediana se determina con la siguiente frmula. Profundidad de la mediana = n + 1 2
La profundidad (o posicin) de la mediana se encuentra al sumar los nmeros de posicin de los valores de los datos ms pequeos (1) y ms grandes (n) y dividir el resultado entre 2. Paso 3: Determine el valor de la mediana. Contar los datos ordenados, localizando el dato que est en la d(x)-sima posicin. La mediana ser la misma sin importar a partir de cul extremo de los datos (mximo o mnimo) ordenados cuente. De hecho, contar desde ambos extremos sirve como una comprobacin excelente.
EJEMPLO: Encuentre la mediana para la siguiente serie. 6, 3, 8, 5, 3 Los datos ordenados de manera creciente son: 3,3,5,6 y 8 Profundidad de la mediana: (n + 1) / 2 = ( 5 + 1)/2 = 6/2 =3 La mediana es el tercer nmero desde cualquier extremo en los datos ordenados, o bien, mediana =5
EJEMPLO: Encuentre la mediana de la siguiente serie. 9, 6, 7, 9, 10,8 Los datos ordenados de manera creciente son: 6,7,8,9 y 10 Profundidad de la mediana: (n + 1) / 2 = (6 + 1)/2 = 7/2 =3.5 Es decir, la mediana est a la mitad entre las porciones de datos tercera y cuarta. Para encontrar el nmero situado a la mitad de dos valores cualesquiera, se suman los dos valores y el resultado se divide entre 2. En este caso, se suman el tercer valor (8) y el cuarto valor (9); luego se divide entre 2, esto es se obtiene un promedio. La mediana es (8 + 9) / 2 = 8.5, nmero que est en medio entre los dos nmeros.
3.1.5.- EJERCICIO:
1.- Considere la muestra 2, 4, 7, 8, 9. Encuentre lo siguiente: a.) La media b.) La mediana c.) La moda d.) El rango medio 2.- Considera la muestra 6, 8, 7, 5, 3, 7. Encuentre lo siguiente: a.) La media b.) La mediana c.) La moda d.) El rango medio 3.- A 15 estudiantes universitarios, elegidos aleatoriamente, se les solicit mencionar el nmero de horas que durmieron la noche anterior. Los datos resultantes fueron 5,6,6,8,7,7,9,6,4,8,11,6,7,8,7. a.) La media b.) La mediana c.) La moda d.) El rango medio
4.- En el artculo Financing Your kids Collage Education, se enumeraron las siguientes cuotas de enseanza por escuela y por ao escolar de 14 universidades: 1554, 2291, 2084, 4443, 2884, 2478, 3087, 3708, 2510, 2055, 3000,2052, 2550, 2013. a.) Encuentre la media por ao escolar. b.) Encuentre la mediana por ao escolar. c.) Encuentre el rango medio por ao escolar. d.) Encuentre la moda, en caso de existir, por ao escolar.
5.- A los reclutas de una academia de polica se les solicit presentar un examen que mide la capacidad que tienen para hacer ejercicio. minutos) se obtuvo para cada uno de los 20 reclutas: 25 26 27 25 30 29 33 31 30 31 32 32 30 34 34 32 30 33 27 30 Esta capacidad (medida en
a.) Encuentre la media, la mediana, la moda y el rango medio. b.) Elabore una grfica de puntos para estos datos y localice la media, la mediana, la moda y el rango medio sobre la grfica. c.) Describa la relacin que hay entre los cuatro promedios (semejanza) y qu propiedades muestran los datos por las que dichos promedios son semejantes.
3.2.1.- RANGO
Es la diferencia en valor entre las porciones de datos de mayor valor (Mx) y de menor valor (Mn). Rango = mximo mnimo Rango = Mx Mn
3.2.3.- VARIANZA
La varianza de la muestra, s2, es la media de las desviaciones al cuadrado, calculada usando como divisor a n-1. Varianza de la muestra: s cuadrada = suma de (desviaciones) nmero 1 = S2 = (x x ) 2 n -1
DATOS
MEDIA
VARIANZA
DESVIACIN ESTNDAR
6 3 8 5 2 n=5
Media
= 6-4.8 = 1.2
(1.2)2 =1.44 (-1.8)2 =3.24 (3.2)2 =10.24 (0.2)2 = 0.04 (-2.8)2= 5.7
S2 =22.80/4 S2 = 5.7
S = 2.38
(6+3+8+5+2)/5 3-4.8 = -1.8 8-4.8 =3.2 Media = 4.8 5-4.8 = 0.2 2-4.8 = -2.8
EJERCICIOS: 1.- Considere la muestra 2 ,4, 7, 8, 9. Encuentre lo siguiente: a.) Rango b.) Varianza c.) Desviacin estndar.
2.- Considere la muestra 6 ,8 ,7, 5, 4, 7. Encuentre lo siguiente: a.) Rango b.) Varianza c.) Desviacin estndar.
3.- Dada la muestra 7,6,10,7,5,9,3,7,5,13, encuentre lo siguiente: a.) Rango b.) Varianza c.) Desviacin estndar
4.- A 15 estudiantes universitarios, elegidos aleatoriamente, se les solicit el nmero de horas que durmieron la noche anterior. 5,6,6,8,7,7,9,5,4,8,7. Encuentre lo siguientes: a.) Rango b.) Varianza c.) Desviacin estndar Los datos resultantes fueron
5.- .En el artculo Financing Your Kids collage Education, 1994, se enumeraron las siguientes cuotas de enseanza por escuela y por ao escolar de 14 universidades: 1554,2 291,2084 ,4443,2884,2478,3087,3708,2510,2055,3000,2052,2550, 2013. Encuentre lo siguiente: a.)Varianza b.) Desviacin estndar
6.- En el artculo Railroads on the Fast Track, se proporcionan las millas operadas por las 10 compaas ms grandes de ferrocarril.
Norfolk Southern Conrail Southern Pacific Santa Fe Pacific Chicao and North Western Soo Line Illinois Central
a.)Encuentre la media y la desviacin estndar par las millas de vas operadas por estas 10 compaas ms grandes del ferrocarril. b.) Elabore una grfica que muestre la dispersin de los datos. c.) Analice la relacin entre la dispersin de los datos, la media y la desviacin estndar.
7.- A los reclutas de una academia de polica se les solicit presentar un examen que mide la capacidad que tienen para hacer ejercicio. minutos) se obtuvo para cada uno de los 20 reclutas: 25 26 27 25 30 29 33 31 30 31 32 32 30 34 34 32 30 33 27 30 Esta capacidad (medida en
c.) Encuentre la desviacin estndar. d.) Elabore un grfica de puntos y trace una recta que represente al rango y una recta que empiece en la media y cuya longitud represente el valor de la desviacin estndar. e.) Describa cmo estn relacionados la distribucin de los datos, el rano y la desviacin estndar.
3.3.1.- FRMULA PARA CLCULO DE CUARTILES (Q), DECILES (D) Y PERCENTILES (P)
X = nk 100
Dnde: X = incgnita (cuartiles, deciles o percentiles) K = porcentaje de acuerdo al valor para cuartil, decil o percentil. Tabla 1
3.3.2.-
PROCEDIMIENTO
PARA
DETERMINAR
CUALQUIER
DECILES D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
EJEMPLO:
Para la siguiente serie calcular el Q2, D7 y P82 2, 5, 7, 25, 10, 12, 4, 5, 13, 20,
Paso 1: Ordenar la serie de datos de menor mayor. 2, 4, 5, 5, 7, 10, 12, 13, 20, 25
Paso 2: Calcular valores utilizando tabla 1 a.)Q2 = (10)(50)/ 100 = 5 b.) D7 = (10)(70)/ 100 = 7 c.) P82 = (10)(82)/ 100 = 8.2 ----redondeando = 8
Paso 3: Relacionar los datos obtenidos con la posicin que ocupan en la serie de datos ordenados. VALOR DE FRMULA Q2 = 5 D7 = 7 P82 = 8 POSICIN EN SERIE ORDENADA 7 12 13
4.1.- INTRODUCCIN
En el campo de la Estadstica hay muchos problemas que requieren un anlisis combinado de dos variables. En administracin, en ecuacin y en muchas otras materias, a menudo es necesario contestar preguntas como las siguientes: Estn relacionadas estas dos variables? En caso afirmativo, de qu manera?, existe una correlacin entre las variables? Las relaciones bajo anlisis no son de causa y efecto, sino las de tipo matemtico que permiten predecir el comportamiento de una variable con base en el conocimiento que se tiene sobre otra. Los objetivos del anlisis descriptivo y representacin de datos son: a.)Poder representar datos de dos variables en forma tabular y grfica. b.)Comprender la distincin entre los propsitos bsicos del anlisis de correlacin del de regresin. c.)Familiarizarse con las ideas de la presentacin descriptiva. Con estos fines en mente, el estudio se restringir a la forma ms simple y fundamental de regresin y correlacin: el caso lineal de dos variables.
dispersin que muestran diferentes relaciones entre variables independientes o de entrada (x), y variables dependientes o de salida (y). Si a medida que crece x, hay un cambio en los valores de y, existe una correlacin. La correlacin es positiva cuando y tiende a crecer, y es negativa cuando y tiende a decrecer. Si los pares ordenados (x.y) tienden a seguir un patrn de lnea recta, se tiene una correlacin lineal. La precisin del cambio en y cuando crece x, determina la intensidad de la correlacin lineal. Existen diferentes tipos de correlacin
La correlacin lineal perfecta ocurre cuando todos los puntos estn exactamente sobre una recta. Esta correlacin puede ser positiva o negativa,
dependiendo de si y crece o decrece a medida que x se incrementa. Si los datos forman una recta horizontal o vertical, no hay correlacin, ya que una variable no afecta la otra.
El coeficiente de correlacin lineal r, es la medida numrica de la intensidad de la relacin lineal entre dos variables. El coeficiente refleja la consistencia del efecto que el cambio en una variable tiene sobre la otra. El valor del coeficiente de correlacin lineal ayuda a responder a la pregunta: existe una correlacin lineal entre las dos variables en consideracin?. El coeficiente de correlacin lineal r,, siempre tiene un valor entre -1 y +1. Un valor de +1 significa una correlacin positiva perfecta, y un valor de -1, indica una correlacin negativa perfecta. Si a medida que x crece hay un incremento general en el valor de y, entonces el valor de r es positivo. El valor de r est definido por la frmula PRODUCTO MOMENTO DE PEARSON: r = SC (xy) SC(x) SC(y) Donde SC equivale a las sumatorias de cuadrados para x, y ,xy.
SC(x) = x2 (x)2 n
SC ( y)= y2 (y)2 n
SC(xy) = xy xy n
que
describe la relacin matemtica entre x y y. A continuacin se presentan algunos ejemplos de varias relaciones posibles, denominados modelos o ecuaciones de prediccin. Lineal: Cuadrtica Exponencial: Logartmica: y = bo + b1x y = a + bx + cx2 y = a (bx) y = a logb x
Si un modelo de lnea recta parece idneo, la recta del mejor ajuste se encuentra aplicando el mtodo de mnimos cuadrados. El criterio de mnimos cuadrados requiere encontrar las constantes b0 y b1. La ecuacin de la recta del mejor ajuste es determinada por su pendiente (b1) y su ordenada al origen (b0). Los valores de las constantes, pendiente y ordenada al origen, que satisfacen el criterio de mnimos cuadrados se encuentran aplicando las frmulas siguientes: Pendiente: b1 = ( x x ) (y y) ( x x) 2
Ordenada al origen:
b0 = y - ( b1 * x) n
EJEMPLO: Calcule la ecuacin de prediccin para la siguiente tabulacin. Determine la variable de salida para x=68. ESTATURA (pulg) 65 65 62 67 69 65 61 67 PESO (lb) 105 125 110 120 140 135 95 130
SUMATORIAS
C (x) = 33979 (524)2 / 8 = 48.87 C (y) = 116900 (960)2 / 8 = 1700 C (x) = 62750 (521.96)/ 8 = 230
PRODUCTO MOMENTO PEARSON R = 230 / ( 48.87)(1700) = 0.79 ---- Correlacin positiva alta
REGRESIN LINEAL b1= bo + b1x b1= 230/ 48.87 = 4.7 b0 = 960 [ (4.7)(521] = -186.08
EJERCICIO:
Considere los siguientes datos, que indican el peso x (en miles de libras) y el rendimiento de gasolina y (millas por galn de automviles). x 2.5 3 4 3.5 2.7 4.5 3.8 2.9 5.0 2.2 Y 40 43 30 35 42 19 32 39 15 44
21.- Defina variable 22.- Defina variable de entrada 23.- Defina variable de salida 24.- Diga cules son las preguntas que contesta la estadstica descriptiva o anlisis descriptivo 25.- Defina variable cuantitativa 26.- Defina variable cualitativa 27.- Defina diagrama de dispersin 28.- Mencione la diferencia entre diagrama de dispersin y ojiva 29.- Mencione el concepto de correlacin lineal 30.- Escriba la frmula para clculo de r 31.- Escriba las frmulas para clculo de sumatorias cuadradas x, y xy 32.- Trace los diferentes tipos de diagramas de correlacin 33.- Defina modelos o ecuaciones de prediccin 34.- Escriba las ecuaciones para modelos de prediccin 35.- Escriba las frmulas para clculo de b0 y b1
TEMA 5:
PROBABILIDAD
5.1.- INTRODUCCIN
Tal vez usted ya est familiarizado con algunas ideas de probabilidad, ya que sta forma parte de la cultura cotidiana. Constantemente, se escucha a personas que hacen afirmaciones relacionadas con la probabilidad como las siguientes: Probablemente nuestro equipo gane el juego de esta noche Hay 40% de posibilidades de que llueva esta tarde Es ms probable hacer una cita para el fin de semana Si dejo mi en el centro de la ciudad, talvez me multen Tengo una posibilidad de 50-50 de aprobar el examen de qumica de hoy
Resumen de frecuencias:
RESULTADO 2A 1A 0A
FRECUENCIA 3 6 1
2A 1A 0A
3 3 5 1 4 2 4 3 1 1 6 5 5 5 5 7 5 5 5 5 1 2 0 4 1 1 1 2 4 4
2 8 0
5 4 1
6 3 1
3 7 0
1 5 4
4 1 5
1 5 4
0 4 6
3 5 2
1 9 0
53 104 43
De un total de 200 lanzamientos del par de monedas, en 53 ocasiones se obtuvo 2A; en 104 ocasiones, 1A y en 43 ocasiones, 0A. Estos resultados pueden expresarse en trminos de frecuencias relativas, usando una grfica de barras:
3 VALORES
Serie1
10
20
30 PORCENTA JES
40
50
60
Qu conclusiones se obtienen? Si se consideran los conjuntos individuales de 10 lanzamientos, se observa una gran variacin en el nmero de veces que ocurri cada uno de los eventos (2A, 1A y 0A).
En consecuencia, podra esperarse encontrar que la frecuencia relativa para 0A sea aproximadamente , o 25%; que la frecuencia relativa de 1A sea aproximadamente , o 50%, y que la frecuencia relativa de 2A sea
aproximadamente , o 25%. Estas frecuencias relativas reflejan con precisin en el concepto de probabilidad.
EJERCICIOS: 1.- Lance 10 veces una moneda y registre A (guila) o S (sol) despus de cada lanzamiento. Use los resultados para encontrar la frecuencia relativa de: a.) Las guilas b.) Los soles
2.- Lance 20 veces un dado y registre 1, 2, 3, 4, 5 6 despus de cada lanzamiento. Use los resultados para encontrar la frecuencia relativa de: a.) 1 b.) 2 c.)3 d.) 4 e.) 5 f.) 6
3.- Coloque tres monedas en una taza, agtela, viera su contenido y observe el nmero de guilas que aparece. Registre 0A, 1A, 2A 3A despus de cada ensayo. Repita 25 veces el proceso. Use los resultados para encontrar la frecuencia relativa de: a.) 0A b.)1A c.)2A d.)3A
4.- Coloque un par de dados en una taza, vierta su contenido y observe la suma de los puntos. Registre 2,3,4,.,12. Repita 25 veces el proceso. Use los resultados para encontrar la frecuencia relativa de cada uno de los valores: 2, 3, 4, 5, . 12.
5.- Use la tabla de nmeros aleatorios o una computadora para simular: a.) El lanzamiento de un dado 50 veces; exprese sus resultados como frecuencias relativas. b.) El lanzamiento de una moneda 100 veces; exprese sus resultados como frecuencias relativas.
6.- Use la tabla de nmeros aleatorios o una computadora para simular la seleccin aleatoria de 100 dgitos del 0 al 9. a.) Enumere los 100 dgitos. b.) Prepare una distribucin de frecuencias relativas de los 100 dgitos. c.) Prepare un histograma de frecuencias relativas de la distribucin del inciso b.)
EVENTO: Es cualquier subconjunto del espacio muestral. Si A es un evento, entonces n(A) es el nmero de puntos muestrales que pertenecen al evento A.
EJEMPLO:
Encuentre el espacio muestral para el lanzamiento de una moneda Espacio muestra = [ guila, sol ]
RESULTADO: A ( A,A) , (A,S) , (S,A), (S,S)
A S
A S S
EJERCICIOS:
1.- Un vendedor de automviles ofrece uno de sus modelos deportivos compactos con dos opciones de transmisin (estndar o automtica) y en uno de tres colores (negro, rojo o blanco), Cuntas elecciones posibles de combinaciones de transmisin y color tiene el cliente?
2.- Dos monedas, una de un peso y otra de cinco, se lanzan simultneamente y el resultado de cada moneda se registra usando una notacin de pares ordenados (moneda de un peso, moneda de cinco). Encuentre el espacio muestral.
3.- Se lanza un dado una vez y se observa el nmero de puntos de la cara superior. Determine el espacio muestral.
4.- Una caja contiene tres fichas de pker (una roja, una azul y una blanca) y dos se extraen con reemplazamiento ( esto significa que una vez que se ha elegido una ficha, se observa su color y luego vuelve a introducirse en la caja. Las fichas son revueltas antes de extraer una segunda ficha y observar su color. Determine el espacio muestral.
5.- Una caja contiene tres fichas de pker: una roja, una azul y una blanca. Se extraen dos fichas simultneamente, o bien, una a la vez sin reemplazamiento (lo cual significa que se extrae una ficha y luego se extrae otra sin introducir la primera en la caja. Determine el espacio muestral.
7.- Una prediccin climatolgica afirma que habr una cantidad mesurable de precipitacin o que no habr precipitacin en un da dado. Determine el espacio muestral.
TEMA 6:
6.1.- INTRODUCCIN
Para encontrar la probabilidad de muchos eventos es necesario determinar el nmero de resultados posibles del experimento implicado. Esto requiere enumerar (obtener un conteo de) las posibilidades. Este conteo puede obtener usando uno de los dos mtodos: 1.) Enlistar todas las posibilidades y luego proceder a contarlas 2.) Calcular valor numrico.
6.2.- REGLA FUNDAMENAL DEL CONTEO Si un experimento est integrado por dos ensayos, donde uno de ellos (una sola accin o eleccin) posee m resultados posibles y el otro tiene n resultados posibles, entonces cuando los ensayos se realizan juntos se tiene: mxn resultados posibles para el experimento
EJEMPLO:
En muchos estados (de la Unin Americana), en las placas del automvil se usan tres letras seguidas de tres numerales, para obtener el nmero de placas. Si se supone que puede usarse cualquiera de las 26 letras del alfabeto ingls para ocupar cada uno de los tres primeros caracteres y que puede utilizarse cualquiera de los dgitos del 0 a 9 para ocupar los tres ltimos caracteres, cuntos nmeros de placas diferentes son posibles? n1 = 26 n2 = 26 n3 = 26 n4 = 10 n5 = 10 n6 = 10
EJERCICIO
1.-Cuntos nmeros de placas diferentes son posibles si para los tres primeros caracteres se usan los dgitos distintos de cero, para los tres ltimos caracteres se usan letras y no se permite la repeticin de alguna de ellas? 2.- Un experimento consiste en extraer de una caja que contiene una mezcla de canicas rojas, amarillas y verdes aluna de ellas. posibilidades. 3.- Una moneda balanceada se lanza dos veces. Enumere las posibilidades. 4.- Un experimento consta de dos ensayos. El primero es lanzar una moneda de una moneda de un peso y observar el resultado: guila o sol; el segundo es lanzar un dado y observar el resultado: 1, 2, 3, 4, 5 6. Obtenga el nmero de soluciones posibles. 5.- Una computadora genera (de manera aleatoria) pares de enteros. El primer Encuentre el nmero de
entero est entre 1 y 5, inclusive, y el segundo est entre 1 y 4, tambin inclusive. Represente el nmero de soluciones en un sistema de ejes coordenados, donde x es el primer nmero y y es el segundo.
6.- Se lanza una moneda y los resultados posibles son guila o sol. Si se obtiene guila, la moneda es lanzada por segunda vez. Si en el primer lanzamiento se obtiene sol, se lanza un dado. Cul es la posibilidad de lanzar un dado la segunda etapa del este experimento?
6.4.- COMBINACIONES
Conjunto de objetos distintos sin importar una disposicin o un orden. Es decir, lo nico que importa es la pertenencia al conjunto. Frmula de combinaciones: C= n! (n-r)! X r!
EJEMPLO:
En una caja hay cuatro banderas de colores diferentes (rojo, blanco, azul y verde), y se solicita seleccionar tres banderas cualesquiera. Si se escoge (rojo, blanco,
verde), se tiene la misma combinacin de colores que (verde, rojo, blanco). C= 4! ( 4-3)! X 3! = 4 soluciones
6.5.- PERMUTACIONES
Disposicin ordenada de un conjunto de objetos diferentes. Es decir, hay un primer objeto, un segundo, un tercero, etc., y cada objeto es distinto de los dems. P= n! (n-r)! Donde: n= total de elementos r = incgnita, arreglo
EJEMPLO:
En una caja hay cuatro banderas de colores diferentes (rojo, blanco, azul y verde), y se solicita seleccionar tres banderas cualesquiera y hacer una bandera. Encuentre la cantidad de banderas aplicando la frmula de permutacin. P= 4! = 24 soluciones
(4-3)!
Cuntos comits distintos posibles hay? 5.- Mateo tiene seis camisas, cuatro pantalones y cinco pares de calcetines limpios y listos para usar. Cuntas combinaciones diferentes puede crear si: a.) Se pone un artculo de cada categora. b.) Se pone una camisa especfica y un artculo de las otras dos categoras. c.) Slo se pone dos de las camisas con unos pantalones especficos y sin calcetines, pero el resto se lo pone en cualquier combinacin completa. 6.- Cuntos nmeros de placas diferentes son posibles si para los tres primeros caracteres se usan los dgitos distintos de cero, para los tres ltimos caracteres se usan letras y no se permite la repeticin de alguna de ellas? Tomar como referencia el alfabeto ingls.
TAREAS TAREAS
TEMA 1:
1.- Escriba un ensayo a cerca de la diferencia entre Estadstica y Probabilidad. 2.- Investigue los pasos del Proceso Estadstico 3.- Mencione 10 ejemplos de usos de la Estadstica 4.- Mencione 10 ejemplos de abusos de la Estadstica.
TEMA 2:
1.- Investigar qu es una grfica, cules son los tipos, cules son sus elementos y para qu se utilizan. 2.- Investigue la definicin de: Grfica de barras, histograma, diagrama de pastel y ojiva.
TEMA 3:
1.- Investigar qu es la Estadstica descriptiva. 2.- Definas las medidas de tendencia central: moda, media mediana y rango medio. 3.- Investigue las frmulas para clculo de medidas de tendencia central: media, mediana y rango medio. 4.- Defina las medidas de dispersin: rango, desviacin con respecto a la media, varianza y desviacin estndar. 5.- Establezca la diferencia entre rango y rango medio 6.- Defina las medidas de posicin: cuartil, decil y percentil.
7.- Escriba la frmula para clculo de las medidas de posicin significado de cada uno de los parmetros.
establezca el
TEMA 4
1.- Mencione el concepto de variable cualitativa. 2.- Mencione el concepto de variable cuantitativa. 3.- Defina diagrama de dispersin 4.- Defina correlacin lineal 5.- Dibuje los tipos de correlacin lineal y su significado. 6.- Defina regresin lineal
TEMA 5:
1.- Investigar biografa de Karl Pearson 2.- Defina los siguientes conceptos: experimento, resultado, ensayo y espacio muestral.
TEMA 6:
1.- Investigue la frmula de la regla general del conteo 2.- Investigue el concepto de combinacin 3.- Investigue el concepto de permutacin 4.- Mencione el concepto de arreglo
BIBLIOGRAFA
Walpole, Ronald E. Probabilidad y Estadstica. Prentice Hall. Jonson and Kuby. Estadstica Elemental. Lo esencial. Mc Graw Hill