Educación Superior Abierta y a Distancia

Ingeniería en Tecnología Ambiental

Asignatura

Estadística Básica
Primer Trimestre

Alumno xxxxxxx xxxxxxxxxxxxx

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

1

UNIDAD 1: FUNDAMENTOS DE LA ESTADÍSTICA ACTIVIDAD 2: DETERMINACIÓN DE MUESTRAS ACTIVIDAD 3: PROBLEMAS: CIERRE DE LA UNIDAD ACTIVIDAD 4. FORO: LA IMPORTANCIA DE LA ESTADÍSTICA EVIDENCIA DE APRENDIZAJE 1 AUTORREFLEXIONES: UNIDAD 1. AUTOEVALUACIÓN: UNIDAD 1 UNIDAD 2: REPRESENTACIÓN NUMÉRICA Y GRÁFICA DE DATOS ACTIVIDAD 1: DATOS AGRUPADOS Y NO AGRUPADOS ACTIVIDAD 2: FRECUENCIAS ACTIVIDAD 3: INTERVALOS ACTIVIDAD 4: GRÁFICAS ACTIVIDAD 5: FORO USO COTIDIANO DE LA ESTADÍSTICA DESCRIPTIVA EVIDENCIA DE APRENDIZAJE 2: REPRESENTACIÓN DE DATOS AUTOEVALUACIÓN UNIDAD 2 AUTORREFLEXIONES: UNIDAD 2 UNIDAD 3: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN ACTIVIDAD 1: MEDIDAS DE TENDENCIA CENTRAL ACTIVIDAD 2: MEDIDAS DE DISPERSIÓN ACTIVIDAD 3: PROBLEMAS CON MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN EVIDENCIA DE APRENDIZAJE 3: MEDIDAS DE DISPERSIÓN Y TENDENCIA CENTRAL AUTORREFLEXIONES: UNIDAD 3 EXAMEN FINAL LITERATURA CONSULTADA

3 3 5 7 8 9 10 14 14 16 18 19 24 25 27 30 31 31 34 37 41 58 62 63

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

2

Unidad 1: Fundamentos de la Estadística
Actividad 2: Determinación de Muestras Determina el tamaño de la muestra para cada uno de los ejemplos, tomando en cuenta que el valor de Z para el porcentaje de confianza del 95% es igual a 1.96. Explica tu procedimiento de sustitución de datos e incluye la fórmula que usaste para cada caso. 1. En una fábrica de alimentos para animales se producen diariamente 58500 sacos de alimento de 5 kg. Para garantizar que el peso del contenido sea correcto, se toma aleatoriamente algunos sacos y se pesan. Se sabe que la variabilidad positiva es de p=0.7. Si se quiere garantizar un nivel de confianza de 95% y un porcentaje de error de 5%, ¿cuántos sacos se debe pesar? Fórmula para cuando se conoce la población: se coloca el índice de confianza en 1.96, ya que me están dando variabilidad positiva y negativa se sustituyen en la fórmula 0.7 y 0.3, la población es conocida por lo que hay que usar la cantidad 58500. n= (1.96*1.96)*(0.7*0.3)*58500 . 58500*(0.05*0.05)+ (1.96*1.96)*(0.7*0.3) n= (3.8416)*12285 . 146.25+ 0.806736 n= 47194.056 147.056726 n=320 sacos de alimento 2. Se desea realizar un estudio sobre la incidencia de complicaciones postoperatorias en mujeres. El estudio no tiene antecedentes, pero se desea garantizar un nivel de confianza de 95% y un porcentaje de error máximo de 10%, ¿cuál debe ser el tamaño de la muestra? Fórmula para cuando NO se conoce la población: En este caso no se conoce la población por lo que hay que usar la formula correspondiente, se utiliza variabilidad negativa y positiva de 0.5 ya que no me fueron proporcionadas en el texto del ejercicio. n=(1.96*1.96)*(0.5*0.5) (0.1*0.1) n=(3.8416)*(0.25) (0.01) n=96 mujeres

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

3

3. Un estudio pretende estimar la cantidad de niños(as) que no tiene un nivel de nutrición adecuado, en determinada zona rural. Se sabe que hay 480 niños(as) en la zona. Calcula el tamaño de la muestra para garantizar un nivel de confianza del 95%, y un porcentaje de error de 4%. Fórmula para cuando se conoce la población: La población es conocida en 480 individuos por lo que se usa la formula correspondiente, no se proporciona variabilidad negativa y positiva por lo que se usa 0.5 para cada caso n= (1.96*1.96)*(0.5*0.5)*480 . 480*(0.04*0.04)+(1.96*1.96)*(0.5*0.5) n= (3.8416)*(0.25)*480 . 480*(0.0016)+ (3.8416)*(0.25) n= 460.992 1.7284 n=266 niños

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

4

Actividad 3: Problemas: Cierre de la unidad 1. Un lingüista quiere estudiar cuáles son las vocales más usadas dentro de las palabras en un texto de alrededor de tres mil palabras. Contar palabra por palabra sería demasiado trabajo. Por lo que se analizará un subconjunto representativo. Resuelve las siguientes cuestiones:

a) b) c) d) e)

¿Cuál es la población de estudio? Las tres mil palabras ¿Cuáles son los individuos de esa población? Cada una de las tres mil palabras ¿De cuántos individuos consta la población? Numéralos comenzando por el 00: la población consta de 3000 palabras del 0001 al 3000. ¿Cuál es la variable o cuáles son las variables a estudiar? Las vocales más usadas ¿Cuál debe ser el número de elementos necesarios para tomar una muestra aleatoria simple tal que los resultados del estudio tengan un porcentaje de error de 5% y un porcentaje de confianza de 95%? Para calcularlo, considera que Z= 1.96 y que la variabilidad positiva es igual a la negativa.

n=((1.96*1.96)*(0.5*0.5)*3000) / (3000*(0.05*0.5))+( (1.96*1.96)* (0.5*0.5)) n=((3.8416)*(0.25*3000)) / ((3000*0.0025)+( 3.8416*0.25)) n=2881.2 / 8.4604 n=340.55127 n=340 palabras f) Con el resultado anterior:  Obtén la muestra a partir de una tabla de números aleatorios.  Elabora una lista de los datos obtenidos de la muestra de acuerdo con las variables que señalaste en el inciso d. Resultados en la hoja de cálculo anexa, (doble clic en el icono para abrirla)

Hoja de cálculo binaria de Microsoft Office Excel

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

5

2. Determina los elementos necesarios para saber cuál es el color que se presenta con mayor frecuencia en los carros de tu colonia. a) ¿Cuál es la población de tu estudio? Todos los carros de mi colonia b) ¿Cuáles son los individuos de esa población? Cada uno de los carros c) ¿Puedes determinar de cuántos individuos consta la población? Si es posible, numéralos comenzando por 00. Si no es posible, explica por qué. Si es posible, si contamos cada carro de la colonia lo cual es complicado y costoso en tiempo y esfuerzo, ya que no está dado el valor de la población se puede manejar como valor desconocido. Otra forma es hacer una estimación, por ejemplo, en mi colonia las casas son de constructora, por lo que cada manzana tiene exactamente 40 casas y son 7.5 manzanas, si estimamos que en cada hogar tienen un vehículo tendremos aproximadamente 300 vehículos en la colonia d) ¿Cuál es la variable o cuáles son las variables a estudiar? El color de los carros e) Obtén el número de elementos necesarios para tomar una muestra aleatoria simple tal que los resultados del estudio tengan un porcentaje de error de 5% y un porcentaje de confianza de 95%? Para calcularlo, considera que Z= 1.96 y que la variabilidad positiva es igual a la negativa.

f)

n=((3.8416)*(0.25)*(300)) / ((300*.0025)+(3.8416*0.25)) n=288.12 / 1.7104 n=168.451 n=168 carros Con el resultado anterior:  Obtén la muestra a partir de una tabla de números aleatorios.  Elabora una lista de los datos obtenidos de la muestra de acuerdo con las variables que señalaste en el inciso d.  Organiza los datos obtenidos en orden ascendente. Resultados en la hoja de cálculo anexa, (doble clic en el icono para abrirla)

Hoja de cálculo binaria de Microsoft Office Excel

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

6

Actividad 4. Foro: La importancia de la estadística El foro La importancia de la estadística tiene como propósito que reflexiones acerca de la percepción que tienes sobre la estadística y su utilidad, y la compartas con tus compañeros(as) de grupo y el (la) Facilitador(a). Responde las siguientes preguntas en el foro: ¿Qué importancia tiene el uso de la estadística? La estadística es una ciencia de suma importancia (y en muchas ocasiones considerada poco útil), ya que esta nos permite conocer patrones de comportamiento de fenómenos tanto naturales como sociales. Así como establecer reglas dentro de procesos importantes o críticos, por medio de la estadística se pueden establecer cuáles son los valores para considerar que un proceso ha alcanzado ciertas características consideradas críticas y en base a ello tomar acciones que lo estabilicen a los valores considerados óptimos. ¿Quién usa la estadística y para qué la usa? La estadística tiene un amplio uso en todas las ramas de la ciencia. En el campo de la salud, establece los parámetros que determinan las condiciones óptimas de salubridad en la población, también establece los parámetros considerados de alto riesgo en una situación de alerta sanitaria. En las disciplinas de humanidades establece los rasgos de comportamiento de la población, aporta nuevos parámetros y actualiza los ya existentes, todo esto con el fin de conocer de mejor manera la distribución de las características más importantes de un grupo humano. ¿Qué utilidad le encuentras a esta asignatura? Específicamente para la carrera que he seleccionado, Ingeniería en Tecnologías Ambientales, aporta herramientas sumamente útiles, ya que en esta disciplina se deben hacer estudios relacionados con la calidad del medio ambiente, estos estudios se realizan analizando variables que son de alto impacto para la vida, tales como contaminación del aire, el agua y el suelo y los elementos que forman esa contaminación. La estadística aporta el conocimiento necesario para establecer valores a dichas variables, tales valores nos indican en qué momento las condiciones son las más óptimas y en qué momento están fuera de las normas establecidas.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

7

Evidencia de Aprendizaje 1 Descarga la base de datos Preferencias por carrera, disponible en la pestaña Material de apoyo. En este documento encontrarás los resultados de la encuesta en que participaste en la Actividad 1. Los resultados presentados son de todos los (las) alumnos(as) que respondieron. Determina lo siguiente:    ¿Cuál es la población de estudio?: Todos los alumnos de ESAD de primer cuatrimestre ¿Cuáles son los individuos de esa población? Las edades y las carreras de los alumnos inscritos en el primer cuatrimestre ¿De cuántos individuos consta la población? Nombra el rango que abarca la población (numéralos comenzando por el 1 y ocupa la cantidad de ceros necesaria para completar los dígitos del número total de la población, por ejemplo del 0001 al 1845). 0001 al 5329 Obtén el número de elementos necesarios para seleccionar una muestra aleatoria simple tal que los resultados del estudio tengan un porcentaje de error del 5% y un porcentaje de confianza del 95%. Para ello considera que Z = 1.96 y que la variabilidad positiva es igual a la negativa. n=((1.96*1.96)*(0.5*0.5)*5329) / (5329*(0.05*0.05)+ (1.96*1.96)*( 0.5*0.5)) n=((3.8416*0.25)*5329) / ((5329*0.0025)+( 3.8416*0.25)) n=5117.9716 / 13.3225+.9604 n=5117.9716 / 14.2829 n=358.3286 n=358 alumnos ¿Cuál es la variable o cuáles son las variables a estudiar en esa muestra? La edad de los alumnos Obtén la muestra con base en la tabla de números aleatorios que tienes (no olvides indicar el renglón que elegiste para comenzar a seleccionar los individuos de la muestra) (ver archivo de Excel anexo, doble clic en el icono)

 

Hoja de cálculo binaria de Microsoft Office Excel

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

8

Autorreflexiones: Unidad 1. 1) ¿Cómo defines a la estadística? La estadística es la ciencia que nos sirve para analizar conjuntos o poblaciones desde un punto de vista matemático, esto con el fin de conocer sus características y particularidades de los individuos que la conforman, así como clasificar de diferentes formas dicha población. 2) ¿Qué es una población? La población es un conjunto de individuos o elementos que pueden ser analizados, clasificados y divididos en subgrupos o muestras que nos permiten conocerlos mejor. 3) ¿Cuál es la diferencia entre variable e individuos en una población? Los individuos son los elementos que conforman una población mientras que las variables son características ya sea de los individuos o de la misma población, cuando se toma una muestra se muestrean los individuos pero con el objetivo de analizar las variables o características que estos tienen respecto a la población que conforman. 4) ¿Cuáles son los pasos para obtener una muestra aleatoria simple? Primero, conocer que tan grande es la población de donde sacaremos la muestra. Segundo, debemos determinar un grado de error en la muestra. Tercero, determinar el grado de confianza que requerimos evitando con esto analizar la totalidad de la población. Cuarto, determinar la variabilidad positiva y negativa. En base a todo esto aplicar la fórmula correspondiente para determinar cuántos individuos debemos considerar en nuestra muestra. 5) ¿En qué consiste el porcentaje de confianza (Z) en una muestra? Representa la posibilidad de generalizar la muestra, es decir, que la muestra que tomaremos de una población determinada es representativa de la misma por lo que no es necesario analizar la población total (lo cual es muy costoso).

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

9

Autoevaluación: Unidad 1
Comenzado el Completado el Tiempo empleado Calificación Comentario domingo, 26 de junio de 2011, 13:57 domingo, 26 de junio de 2011, 14:00 2 minutos 29 segundos 10 de un máximo de 10 (100%) Has concluido la autoevaluación, para obtener el máximo aprovechamiento de esta actividad te sugerimos prestar especial atención a la retroalimentación que recibiste, ya que te ofrece información que orienta tu proceso de aprendizaje. Continúa esforzándote.

Question1
Puntos: 1

Muestreo en el que todos los elementos tienen la misma probabilidad de ser elegidos y se eligen al azar: Seleccione una respuesta. a. Muestreo aleatorio simple ¡Correcto! El muestreo aleatorio simple es aquél en el que todos los elementos tienen las mismas posibilidades de ser elegidos.

b. Muestreo por selección intencionada c. Muestreo sistemático d. Muestreo estratificado Correcto

Puntos para este envío: 1/1.

Question2
Puntos: 1

Número de hijos(as) en una familia, edad de los alumnos(as), peso y estatura son ejemplos de variables: Seleccione una respuesta.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

10

a. Discretas b. Nominales c. Cualitativas d. Cuantitativas ¡Correcto! Son ejemplos de variables cuantitativas porque se expresan mediante números.

Correcto

Puntos para este envío: 1/1.

Question3
Puntos: 1

Característica que se desea estudiar y se observa en una población o muestra: Seleccione una respuesta. a.Estadístico b.Parámetro c. Dato d. Variable ¡Correcto! Las variables son las características que se desean estudiar de una determinada población o muestra. Pueden ser de cuatro tipos: nominales, ordinales, continuas y discretas.

Correcto

Puntos para este envío: 1/1.

Question4
Puntos: 1

Consiste en la presentación de datos en forma de tablas y gráficas: Seleccione una respuesta. a. Estadística inferencial b. Estadística descriptiva ¡Correcto! La estadística descriptiva se define como los métodos de recopilación, caracterización y presentación de un conjunto de datos con el fin de describir algunas de sus características.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

11

c. Muestreo d. Muestra aleatoria simple Correcto

Puntos para este envío: 1/1.

Question5
Puntos: 1

Conjunto de todos los elementos que presentan una característica común: Seleccione una respuesta. a. Datos b.Población ¡Correcto! La población es un conjunto de todos los elementos que presentan una característica común determinada, observable y medible.

c.Variable d.Muestra Correcto

Puntos para este envío: 1/1.

Question6
Puntos: 1

Estado civil, sexo, nivel educativo, calidad de la atención son tipos de variables: Seleccione una respuesta. a. Ordinales b.Cualitativas ¡Correcto! Son ejemplo de variables cualitativas porque expresan cualidades que no son numéricas, pueden ser nominales u ordinales.

c.Cuantitativas d. Continuas Correcto

Puntos para este envío: 1/1. Question7
Puntos: 2

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

12

Se van a estudiar las preferencias, en cuanto a carreras, de los (las) estudiantes que ingresaron al Curso Propedéutico de la ESAD para determinar cuáles carreras necesitan un mayor número de facilitadores(as). Para determinar el tamaño de la muestra utilizarías: Seleccione una respuesta. ¡Correcto! La ESAD sabe con exactitud cuántos alumnos(as) ingresaron al Curso Propedéutico, esta fórmula se utiliza para obtener el número de la muestra cuando se conoce con exactitud la población de estudio.

a. La fórmula

b. Un método de muestreo no probabilístico

c. La fórmula d. Un método de muestreo probabilístico Correcto

Puntos para este envío: 2/2. Question8
Puntos: 2

Un ecologista desea estudiar el promedio de vida de los delfines, en una zona en la cual se están aplicando con mayor rigor las normas de pesca desde hace aproximadamente 10 años, y comparar este promedio con el promedio de vida en una zona donde dichas reglas han sido aplicadas de una forma menos estricta. Para encontrar el tamaño de la muestra el ecologista debe aplicar en su investigación: Seleccione una respuesta.

a. La fórmula b. Un método de muestreo no probabilístico ¡Correcto! En este caso, el investigador desconoce cuál es el tamaño exacto de la población de delfines y esta fórmula se utiliza para determinar el tamaño de la muestra cuando no se conoce con exactitud el tamaño de la población.

c. La fórmula

d. Un método de muestreo probabilístico Correcto

Puntos para este envío: 2/2.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

13

Unidad 2: Representación numérica y gráfica de datos
Actividad 1: Datos agrupados y no agrupados 1. Datos Agrupados: Son aquellos datos que forman parte de una muestra y que han sido contados, ordenas, clasificados. Por lo que se pueden representar por medio de grupos o rangos. Una característica de estos datos es que presentan una frecuencia o número de veces que un mismo dato se repite en la muestra. Ejemplo 1: un grupo de 310 alumnos presentó examen de admisión para una universidad. El encargado de selección de alumnos presenta a la dirección de la universidad una tabulación o que contiene los totales obtenidos por alumnos representados en rangos: Puntaje 0-5 6 7 8 9 10 No. de alumnos 30 30 150 50 40 10 En este ejemplo los datos que se están presentando ya han sido previamente contados, ordenados, clasificados, agrupados y divididos en rangos por lo que presentan una frecuencia representada por la columna No. de alumnos.

Ejemplo 2: Una persona quiere saber las calificaciones que obtuvo durante sus estudios universitarios, para esto obtiene de su Kardex las frecuencias de las mismas: 88; 88; 86; 100; 80; 87; 92; 97; 100; 93; 92; 98; 81; 90; 98; 89; 97; 81; 80; 100; 90; 100; 98; 90; 100; 85; 100; 100; 89; 95; 74; 81; 88; 87; 93; 76; 95; 82; 86; 86; 90; 74; 73; 93;
Calificación 73 74 76 80 81 82 85 86 87 88 89 90 92 93 95 97 98 100 Frecuencia 1 2 1 2 3 1 1 3 2 3 2 4 2 3 2 2 3 7

En este ejemplo se mencionan 44 calificaciones correspondientes a 44 materias cursadas. Pero al agruparse por frecuencias se forman 18 renglones donde se representan las frecuencias en que las calificaciones se obtuvieron a lo largo de los estudios, siendo el 100 la calificación que se presentó con mayor frecuencia.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

14

2. Datos no Agrupados: Son aquellos que aún no han sido clasificados o contados, los datos no agrupados si bien pueden presentar un ordenamiento, no presentan una frecuencia por lo que no pueden ser agrupados o representados en rangos hasta que sean contados y clasificados. Los datos no agrupados son aquellos que resultan del muestreo aleatorio inicial, a los cuales todavía no se les ha aplicado ningún formato, ordenamiento, agrupación o tabulación. Ejemplo 1: Una persona quiere saber los promedios que obtuvo durante sus estudios universitarios, para esto obtiene de su Kardex las calificaciones, las cuales están ordenadas por nombre de materia, el resultado es: 88; 88; 86; 100; 80; 87; 92; 97; 100; 93; 92; 98; 81; 90; 98; 89; 97; 81; 80; 100; 90; 100; 98; 90; 100; 85; 100; 100; 89; 95; 74; 81; 88; 87; 93; 76; 95; 82; 86; 86; 90; 74; 73; 93; En este caso, las calificaciones no están ordenadas numéricamente y no presentan una frecuencia aun cuando hay calificaciones repetidas, por lo que se considera que este conjunto de datos no está agrupado. Ejemplo 2: Un consultorio geriátrico guarda el peso de sus pacientes diario, la muestra obtenida en un día determinado fue la sig.: 60; 66; 77; 70; 66; 68; 57; 70; 66; 52; 75; 65; 69; 71; 58; 66; 67; 74; 61; 63; 69; 80; 59; 66; 70; 67; 78; 75; 64; 71; 81; 62; 64; 69; 68; 72; 83; 56; 65; 74; En la muestra se encuentra el peso de 40 personas, en este caso, los pesos no están clasificados por sexo o edad, ni ordenados, tampoco presentan una frecuencia, por lo que se considera que los datos no están agrupados.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

15

Actividad 2: Frecuencias  En una gasolinera quieren saber cuántos empleados más deben contratar y para qué turnos, para ello, registraron durante dos días la cantidad de litros de diesel que se vende por hora en la gasolinera, el registro que obtuvieron fue el siguiente: 816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830 831 840 844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849 844 840 858 853 837 881 873 889 836 815  Elabora una tabla de frecuencias con los datos. Incluye, en la misma tabla, la frecuencia absoluta, la frecuencia acumulada, la frecuencia relativa y la frecuencia relativa acumulada.

(tabla en la sig. página)

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

16

Valores 810 815 816 830 831 833 835 836 837 839 840 844 849 853 856 858 860 869 873 881 883 884 889

Frecuencia Absoluta 2 2 1 3 1 2 3 2 2 1 3 3 2 2 2 2 1 1 2 2 1 2 6 48

Frecuencia Acumulada 2 4 5 8 9 11 14 16 18 19 22 25 27 29 31 33 34 35 37 39 40 42 48

Frecuencia Relativa 0.04166 0.04166 0.02083 0.06250 0.02083 0.04166 0.06250 0.04166 0.04166 0.02083 0.06250 0.06250 0.04166 0.04166 0.04166 0.04166 0.02083 0.02083 0.04166 0.04166 0.02083 0.04166 0.12500

Frecuencia Relativa Acumulada 0.04166 0.08333 0.10416 0.16666 0.18750 0.22916 0.29166 0.33333 0.37500 0.39583 0.45833 0.52083 0.56250 0.60416 0.64583 0.68750 0.70833 0.72916 0.77083 0.81250 0.83333 0.87500 1.00000

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

17

Actividad 3: Intervalos  En una gasolinera quieren saber cuántos empleados nuevos deben contratar y para qué turnos; para ello registraron durante dos días la cantidad de litros de diesel que se venden por hora en la gasolinera. Dicho registro fue el siguiente: 816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830 831 840 844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849 844 840 858 853 837 881 873 889 836 815

Construye 10 intervalos de clase con los datos proporcionados y elabora la tabla de frecuencias correspondiente. Incluye en la misma tabla la frecuencia absoluta la
frecuencia acumulada la frecuencia relativa y la frecuencia relativa acumulada.

Xn=810 X1=889 R=889-810 R=79 k=10 Amplitud=79/10 Amplitud=7.9 Intervalos 810-817 818-825 826-833 834-841 842-849 850-857 858-865 866-873 874-881 882-889 Frecuencia Absoluta 5 0 6 11 5 4 3 3 2 9 48 Frecuencia Acumulada 5 5 11 22 27 31 34 37 39 48 Frecuencia Frecuencia Relativa Relativa Acumulada 0.10416 0.10416 0 0.10416 0.125 0.22916 0.22916 0.45833 0.10416 0.5625 0.08333 0.64583 0.0625 0.70833 0.0625 0.77083 0.04166 0.8125 0.1875 1

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

18

Actividad 4: Gráficas Los parámetros que has visto hasta aquí, la organización numérica de los datos en tablas y las representaciones gráficas de éstas, pueden ser realizados de forma manual, pero existen programas informáticos como Excel, software libre y programas especializados para estadística, que permiten realizar todos estos trabajos. Realiza la siguiente actividad: 1. Retoma los problemas que realizaste en la Actividad 2: Frecuencias, con los datos de la tabla elabora las gráficas que revisaste en este tema e inclúyelas en el mismo documento. 2. Comparte con tus compañeros(as) el procedimiento que seguiste para graficar los datos del problema, si utilizaste algún software comenta cuál. Agrega una conclusión sobre la utilidad de la representación gráfica de datos.

Procedimiento para crear las gráficas Para hacer las gráficas utilicé Excel 2007. El procedimiento consistió en copiar la tabla donde tengo los valores de las frecuencias desde Word a Excel, después en la pestaña Insertar, seleccione el tipo de gráfica que deseo utilizar y fui seleccionando una por una los cuatro tipos de gráfica. Para dar valores se debe utilizar la pestaña Diseño y allí el botón Seleccionar Datos, allí se seleccionan los valores horizontales y verticales. Este procedimiento se debe repetir por cada una de las gráficas que tengamos. Finalmente copié y pegué cada gráfica desde Excel a Word utilizando la opción Pegar como Imagen JPG, de esta forma ya no es posible modificar la gráfica en Word.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

19

Valores y Frecuencias
Valores 810 815 816 830 831 833 835 836 837 839 840 844 849 853 856 858 860 869 873 881 883 884 889 Frecuencia Absoluta 2 2 1 3 1 2 3 2 2 1 3 3 2 2 2 2 1 1 2 2 1 2 6 48 Frecuencia Acumulada 2 4 5 8 9 11 14 16 18 19 22 25 27 29 31 33 34 35 37 39 40 42 48 Frecuencia Relativa 0.04166 0.04166 0.02083 0.06250 0.02083 0.04166 0.06250 0.04166 0.04166 0.02083 0.06250 0.06250 0.04166 0.04166 0.04166 0.04166 0.02083 0.02083 0.04166 0.04166 0.02083 0.04166 0.12500 1 Frecuencia Relativa Acumulada 0.04166 0.08333 0.10416 0.16666 0.18750 0.22916 0.29166 0.33333 0.37500 0.39583 0.45833 0.52083 0.56250 0.60416 0.64583 0.68750 0.70833 0.72916 0.77083 0.81250 0.83333 0.87500 1.00000

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

20

Histograma

Gráfica de Líneas

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

21

Gráfica de Barras

Gráfica de Áreas

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

22

Conclusiones

El uso de gráficas para representar la información estadística obtenida por medio del muestreo es sumamente útil ya que ayuda a que las personas que verán e interpretaran los datos obtenidos como rangos y frecuencias tengan una mejor comprensión de la información.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

23

Actividad 5: Foro Uso Cotidiano de la Estadística Descriptiva

¿En qué casos de la cotidianeidad se utiliza la estadística descriptiva? La estadística en la vida diaria la usamos muchas veces sin darnos cuenta, por ejemplo, en mi casa mis padres saben en base a la propia experiencia cuanto tiempo dura el tanque de gas, cuanto es lo que llega cada mes (aproximadamente) de electricidad, esto, en base a los datos que han visto en los recibos durante varios años, el hecho de que por varios años el comportamiento de estos servicios sea estable ha hecho que sin darse cuenta hagan uso de la estadística, y con la información que ya tienen en la mente, cada mes hagan un cálculo aproximado de lo que gastarán en servicios del hogar. ¿Has utilizado la estadística descriptiva? ¿Cómo? La he utilizado principalmente en el ambiente laboral, al desarrollar software se tiene que llevar un control estadístico de los errores detectados en los programas, durante el proceso de pruebas un programador debe detectar la cantidad de errores de un programa y relacionarlo con la cantidad de líneas totales del sistema en cuestión, permitiéndose como máximo 4 errores por cada mil líneas de código de programa. Los errores tienen clasificaciones y en base a estas cantidades y clasificaciones son las acciones que se toman para mejorar los sistemas. ¿Cuál es la utilidad de las técnicas de representación numérica y gráfica de datos en la vida cotidiana? Los usos son muy variados, ya que se pueden utilizar tanto en la vida laboral (que forma parte de la vida cotidiana de cada persona), como en los quehaceres diarios. Retomando el ejemplo que di en la pregunta uno, en base a la estadística es posible tener una previsión de los pagos que debemos hacer mes con mes de los servicios del hogar, ya que el comportamiento de estos servicios es siempre estable, salvo en situaciones de emergencia o “atípicas”. Por lo que también es posible graficar el comportamiento de estos servicios mes por mes y hacerlo anualizado.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

24

Evidencia de Aprendizaje 2: Representación de Datos

Representación de datos
Para generar la evidencia de aprendizaje de esta unidad realiza lo siguiente: Retoma los datos de la muestra que obtuviste y organízalos en tablas de la siguiente manera: • Elabora una tabla de frecuencias por intervalos con la variable edad para toda la muestra. • Para la variable carrera, elabora una tabla de frecuencias simple para cada una de las carreras. • Elabora las gráficas correspondientes a cada una de las variables.
Organiza tu trabajo de la siguiente manera: • Incluye una presentación donde describas de dónde se obtuvieron los datos y la finalidad del análisis de los mismos. • El procedimiento que seguiste para obtener la muestra. • Las tablas con una descripción. • Las gráficas con su respectiva descripción.

Tabla de frecuencias por edades
Edad
N/A 17-26 27-36 37-46 47-56 57 o más Total

Frecuencia
3 89 161 74 27 4 358

Representación de datos

Gráfica por Edades

Para obtener los intervalos dese excel donde tengo la muestra copié la columna de edades a una hoja nueva y la ordene de menor a mayor, luego hice el conteo de los intervalos haciendo la tabla que ven en la esquina superior izquierda de esta diapositiva. Para terminar inserte una gráfica de barras y tomé los datos de la tabla que había creado previamente.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

25

Tabla de frecuencias por carreras

Representación de datos
Gráfica por Carreras

Carrera Administración de empresas turísticas Desarrollo comunitario Desarrollo de software Gestión y administración de PYME Matemáticas Mercadotecnia internacional Seguridad pública N/A Total

Frecuencia 58 31 1 144 1 57 64 2 358

Para obtener los intervalos dese excel donde tengo la muestra copié la columna de edades a una hoja nueva y la ordene de alfabéticamente, luego hice el conteo de los intervalos haciendo la tabla que ven en la esquina superior derecha de esta diapositiva. Para terminar inserte una gráfica de barras y tomé los datos de la tabla que había creado previamente.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

26

Autoevaluación Unidad 2
Comenzado el sábado, 30 de julio de 2011, 15:44 Completado el sábado, 30 de julio de 2011, 15:46 Tiempo empleado 1 minutos 39 segundos Puntos 5/8 Calificación 6 de un máximo de 10 (63%) Comentario - Has concluido la autoevaluación, para obtener el máximo aprovechamiento de esta actividad te sugerimos prestar especial atención a la retroalimentación que recibiste, ya que ofrece información que orienta tu proceso de aprendizaje. Continúa esforzándote. Question 1 Puntos: 1 Conjunto de datos comprendidos entre dos números conocidos como límites Seleccione una respuesta. a. Intervalo b. Marca de clase c. Rango d. Frontera de clase Revisa nuevamente la definición de intervalo y los conceptos asociados a ella. El intervalo es el conjunto de números que se encuentran delimitados por otros dos números dados. Incorrecto Puntos para este envío: 0/1. Question 2 Puntos: 1 Es la diferencia entre el límite superior y el límite inferior del intervalo. Seleccione una respuesta. a. Marca de clase b. Amplitud del intervalo c. Frontera de clase d. Intervalo de clase ¡Correcto! La amplitud del intervalo se obtiene al restar el límite superior (Ls-Li). Correcto Puntos para este envío: 1/1. Question 3 Puntos: 1 Este dato se obtiene cuando divides la frecuencia absoluta entre el número total del datos (N). Seleccione una respuesta.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

27

a. Frecuencia relativa b. Frecuencia relativa acumulada c. Intervalo d. Frecuencia acumulada Revisa nuevamente las definiciones de frecuencias. La frecuencia relativa se obtiene cuando divides la frecuencia absoluta entre N. También se puede presentar en términos de porcentaje. Incorrecto Puntos para este envío: 0/1. Question 4 Puntos: 1 Es la suma de las frecuencias hasta el renglón i. Seleccione una respuesta. a. Frecuencia relativa acumulada b. Intervalo c. Frecuencia acumulada d. Amplitud del intervalo ¡Correcto! La frecuencia acumulada es la que se obtiene cuando sumas las frecuencias absolutas hasta el renglón i, esto es, cuando sumas la frecuencia absoluta del segundo renglón con la del primero. Esto se puede apreciar mejor en las tablas de datos. Correcto Puntos para este envío: 1/1. Question 5 Puntos: 1 Es la diferencia entre un histograma y una gráfica de barras: Seleccione una respuesta. a. Las variables que representan b. Separación entre las barras c. Los datos que se grafican d. El ancho de las barras ¡Correcto! El histograma y la gráfica de barras difieren en que, el primero no presenta separación entre las barras y la segunda sí. Correcto Puntos para este envío: 1/1. Question 6 Puntos: 1 Son las tablas en las que se pueden representar los datos relacionados con más de una variable. Seleccione una respuesta.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

28

a. Tablas de doble entrada b. Tablas de intervalos c. Tablas de frecuencia d. Tablas de datos Revisa nuevamente los diferentes tipos de tablas. Incorrecto Puntos para este envío: 0/1. Question 7 Puntos: 1 Es el número de veces que se repite un dato. Seleccione una respuesta. a. Frecuencia absoluta b. Frecuencia acumulada c. Intervalo d. Frecuencia relativa ¡Correcto! El número de veces que se repite un dato, dentro de una serie, se llama frecuencia o frecuencia absoluta. Correcto Puntos para este envío: 1/1. Question 8 Puntos: 1 ¿De qué depende la formación de intervalos? Seleccione una respuesta. a. Del tamaño de la población b. De la magnitud de las frecuencias absolutas c. Del tipo de población que se analiza d. De la decisión de quienes están analizando los datos ¡Correcto! La formación de intervalos depende del tamaño o rango de la población. El número de intervalos que se formarán para analizar los datos lo determinan quienes trabajan esos datos. Correcto Puntos para este envío: 1/1.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

29

Autorreflexiones: Unidad 2 Contesta las siguientes preguntas, guárdalas en el archivo correspondiente y envíalo a través de la herramienta autorreflexiones situada al final de las actividades de la unidad 2. 1.- Describe 2 métodos para recolectar información.   Encuesta: realizar un cuestionario a número determinado de individuos en una población, teniendo todos los individuos de la misma posibilidad de ser seleccionados para la encuesta. Muestra Aleatoria: se determina el tamaño de la muestra y de manera aleatoria son seleccionados los individuos a analizar, en este caso también todos los individuos de una población tienen la misma posibilidad de ser seleccionados para su análisis.

2.- ¿En qué consiste la amplitud de un intervalo y cómo se determina dicha amplitud? La amplitud se obtiene dividiendo el Recorrido de la muestra entre el número de intervalos que se deben tener. Es el dato que nos permite generar un rango para el análisis de los datos obtenidos en la muestra. 3.- ¿Qué es una frecuencia absoluta? Es las veces que un dato se presentó en una muestra o población 4.- ¿Cuál es la diferencia entre datos agrupados y datos no agrupados? Los datos agrupados presentan un ordenamiento así como una frecuencia de cuantas veces fueron identificados en la muestra o población, mientras que los datos no agrupados aunque pueden estar ordenados no presentan frecuencias 5.- ¿Cuál es la utilidad de las tablas de datos? Una tabla de datos muestra los intervalos y frecuencias de una muestra o población, es muy útil para poder deducir el comportamiento de una población ya que los datos agrupados son una generalización de dicho comportamiento.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

30

Unidad 3: Medidas de Tendencia Central y Dispersión
Actividad 1: Medidas de Tendencia Central
NI 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Valores 810 815 816 830 831 833 835 836 837 839 840 844 849 853 856 858 860 869 873 881 883 884 886 889 Frecuencia Absoluta 2 2 1 3 1 2 3 2 2 1 3 3 2 2 2 2 1 1 2 2 1 2 4 2 48 Frecuencia Acumulada 2 4 5 8 9 11 14 16 18 19 22 25 27 29 31 33 34 35 37 39 40 42 46 48 Frecuencia Relativa 0.04166 0.04166 0.02083 0.0625 0.02083 0.04166 0.0625 0.04166 0.04166 0.02083 0.0625 0.0625 0.04166 0.04166 0.04166 0.04166 0.02083 0.02083 0.04166 0.04166 0.02083 0.04166 0.08333 0.125 Frecuencia Relativa Acumulada 0.04166 0.08333 0.10416 0.16666 0.1875 0.22916 0.29166 0.33333 0.375 0.39583 0.45833 0.52083 0.5625 0.60416 0.64583 0.6875 0.70833 0.72916 0.77083 0.8125 0.83333 0.875 0.95833 1

816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830 831 840 844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849 844 840 858 853 837 881 873 889 836 815
(ejercicios en la sig. página)

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

31

Fórmula para calcular la Media de datos agrupados en frecuencias

µ=816+810+856+888+833+839+853+837+881+873+889+836+815+860+830+888+830+844+ 830+831+840+844+840+858+810+888+883+835+884+849+856+888+833+869+835+835+ 884+849+844+840+858+853+837+881+873+889+836+815 .

48
µ=40845/48

µ=850.9 Fórmula para calcular la Mediana de datos agrupados en frecuencias

NI 1 2 3 4 5 6 7 8 9 10

Intervalos 809-817 818-826 827-835 836-844 845-853 854-862 863-871 872-880 881-889 890-898

Frecuencia Absoluta 5 0 9 11 4 5 1 2 11 0 48

Frecuencia Acumulada 5 5 14 25 29 34 35 37 48 48 48

N/2=48/2=24 el intervalo es el número 4 ya que suma 25 e incluye el 24 Li = 836 Fi-1 = 14 fi = 11 ai = 8 Sustitución de valores: Me=836+24-14(8)= 836+10(8)= 836+80=836+7.2=843.2 11 11 11 Me=843.2

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

32

Fórmula para calcular la Moda de datos agrupados en frecuencias

NI 1 2 3 4 5 6 7 8 9 10

Intervalos 809-817 818-826 827-835 836-844 845-853 854-862 863-871 872-880 881-889 890-898

Frecuencia Absoluta 5 0 9 11 4 5 1 2 11 0 48

Frecuencia Acumulada 5 5 14 25 29 34 35 37 48 48 48

Intervalo con mayor frecuencia absoluta 4 y 9, es un conjunto bimodal Primera moda Li = 836 fi = 11 Fi-1 = 9 Fi+1 = 4 ai = 8 Sustitución de valores Mo1=836+ 11- 9 (8)=836+ 2 (8)= 836+ 2 (8)= 836+(0.22(8))= 836+1.77=837.77 (11-9)+(11-4) 2+7 9 Mo1=837.77 Segunda moda Li = 881 fi = 11 Fi-1 = 2 Fi+1 = 0 ai = 8 Sustitución de valores Mo2=881+ 11- 2 (8)=881+ 9 (8)= 881+ 9 (8)= 881+(0.45(8))= 881+3.6=884.6 (11-2)+(11-0) 9+11 20 Mo2=884.6

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

33

Actividad 2: Medidas de Dispersión
NI 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Valores 810 815 816 830 831 833 835 836 837 839 840 844 849 853 856 858 860 869 873 881 883 884 886 889 Frecuencia Absoluta 2 2 1 3 1 2 3 2 2 1 3 3 2 2 2 2 1 1 2 2 1 2 4 2 48 Frecuencia Acumulada 2 4 5 8 9 11 14 16 18 19 22 25 27 29 31 33 34 35 37 39 40 42 46 48 Frecuencia Relativa 0.04166 0.04166 0.02083 0.0625 0.02083 0.04166 0.0625 0.04166 0.04166 0.02083 0.0625 0.0625 0.04166 0.04166 0.04166 0.04166 0.02083 0.02083 0.04166 0.04166 0.02083 0.04166 0.08333 0.125 Frecuencia Relativa Acumulada 0.04166 0.08333 0.10416 0.16666 0.1875 0.22916 0.29166 0.33333 0.375 0.39583 0.45833 0.52083 0.5625 0.60416 0.64583 0.6875 0.70833 0.72916 0.77083 0.8125 0.83333 0.875 0.95833 1

816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830 831 840 844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849 844 840 858 853 837 881 873 889 836 815

(ejercicios en la sig. página)

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

34

Fórmula para calcular el Recorrido en un conjunto de datos Re=889-810=79 Re=79 Fórmula para calcular la Varianza de datos no agrupados Varianza Media

µ=816+810+856+888+833+839+853+837+881+873+889+836+815+860+830+888+830+844+ 830+831+840+844+840+858+810+888+883+835+884+849+856+888+833+869+835+835+ 884+849+844+840+858+853+837+881+873+889+836+815 .

48
µ=40845/48

µ=850.9
=(816-850.9)^2+(810-850.9)^2+(856-850.9)^2+(888-850.9)^2+(833-850.9)^2+(839-850.9)^2+ (853-850.9)^2+(837-850.9)^2+(881-850.9)^2+(873-850.9)^2+(889-850.9)^2+(836-850.9)^2+ (815-850.9)^2+(860-850.9)^2+(830-850.9)^2+(888-850.9)^2+(830-850.9)^2+(844-850.9)^2+ (830-850.9)^2+(831-850.9)^2+(840-850.9)^2+(844-850.9)^2+(840-850.9)^2+(858-850.9)^2+ (810-850.9)^2+(888-850.9)^2+(883-850.9)^2+(835-850.9)^2+(884-850.9)^2+(849-850.9)^2+ (856-850.9)^2+(888-850.9)^2+(833-850.9)^2+(869-850.9)^2+(835-850.9)^2+(835-850.9)^2+ (884-850.9)^2+(849-850.9)^2+(844-850.9)^2+(840-850.9)^2+(858-850.9)^2+(853-850.9)^2+ (837-850.9)^2+(881-850.9)^2+(873-850.9)^2+(889-850.9)^2+(836-850.9)^2+(815-850.9) . 48 =1672.81+1672.81+1288.81+1288.81+1218.01+436.81+436.81+436.81+396.01+320.41+ 320.41+252.81+252.81+252.81+222.01+222.01+193.21+193.21+141.61+118.81+118.81+ 118.81+47.61+47.61+47.61+3.61+3.61+4.41+4.41+26.01+26.01+50.41+50.41+82.81+ 327.61+488.41+488.41+906.01+906.01+1030.41+1095.61+1095.61+1376.41+1376.41+ 1376.41+1376.41+1451.61+1451.61 . 48 = 26716.88/48 =556.60

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

35

Fórmula para calcular la Desviación Estándar en un conjunto de datos

Media
µ=850.9

Varianza
=556.60

Desviación Estándar =sqrt(556.60) =23.69

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

36

Actividad 3: Problemas con Medidas de Tendencia Central y Dispersión Instrucción: Realiza lo siguiente para cada problema.    Elabora las tablas de frecuencias correspondientes para obtener las medidas de tendencia central y dispersión. Medias de tendencia central y dispersión por frecuencias simples, para el problema 1. Medidas de tendencia central y dispersión por intervalos para el problema 2.

1. Un profesor de educación física desea hacer un estudio sobre el desempeño de sus alumnos(as) en la prueba de atletismo de 100 metros planos. Seleccionó una muestra de 20 alumnos(as) y registró los tiempos que éstos marcaron. Los tiempos, en segundos, registrados fueron: 18.71, 21.41, 20.72, 28.1, 19.29, 22.43, 20.17, 23.71, 19.44, 20.55, 18.92, 20.33, 23.00, 22.85, 19.25, 21.77, 22.11, 19.77, 18.04, 21.12. Medidas de Tendencia Central: Media
µ= 18.71+21.41+20.72+28.1+19.29+22.43+20.17+23.71+19.44+20.55+

18.92+20.33+23.00, 22.85+19.25+21.77+22.11+19.77+18.04+21.12 20

µ= 421.69 / 20 µ= 21.0845 Mediana Cantidad de datos par en el conjunto=20, los valores que separan en dos el conjunto son 20.55 y 20.72, suman 41.27, la mediana es 20.64 Me=20.64 Moda El conjunto no tiene datos repetidos por lo que la frecuencia de cada uno de sus elementos es 1, se trata de un conjunto amodal. Mo=amodal

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

37

Medidas de Dispersión Recorrido Re=28.1-18.04 Re=10.06 Varianza
= (18.04-21.0845) ^2+(18.71-21.0845) ^2+(18.92-21.0845) ^2+(19.25-21.0845) ^2+ (19.29- 21.0845) ^2+ (19.44-21.0845) ^2+(19.77-21.0845) ^2+(20.17-21.0845) ^2+ (20.33-21.0845) ^2+(20.55-21.0845) ^2+(20.72-21.0845) ^2+(21.12-21.0845) ^2+ (21.41-21.0845) ^2+(21.77-21.0845) ^2+(22.11-21.0845) ^2+ (22.43-21.0845) ^2+ (22.85-21.0845) ^2+(23-21.0845) ^2+(23.71-21.0845) ^2+(28.1-21.0845) ^2 19 =(-3.0445) ^2+(-2.3745) ^2+(-2.1645) ^2+(-1.8345) ^2+(-1.7945) ^2+(-1.6445) ^2+ (-1.3145) ^2+(-0.9145) ^2+(-0.7545) ^2+(-0.5345) ^2+(-0.3645) ^2+(0.0355) ^2+ (0.3255) ^2+(0.6855) ^2+(1.0255) ^2+(1.3455) ^2+(1.7655) ^2+(1.9155) ^2+ (2.6255) ^2+(7.0155) ^2 . 19 =9.26898025+5.63825025+4.68506025+3.36539025+3.22023025+2.70438025+ 1.72791025+0.83631025+0.56927025+0.28569025+0.13286025+0.00126025+ 0.10595025+0.46991025+1.05165025+1.81037025+3.11699025+3.66914025+ 6.89325025+49.21724025 . 19

=98.770095/19 =5.1984 Desviación Estándar =sqrt(5.1984) =2.28

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

38

2. Un ambientalista está haciendo una investigación sobre la cantidad de basura que se genera en su colonia. Para ello registró cuántos kilos de basura recolectó el camión durante veinte días consecutivos en su calle. Los resultados fueron: 227, 122, 172, 228, 217, 225, 182, 216, 229, 221, 192, 142, 152, 211, 192, 182, 203, 205, 187, 195. Xn X1 R R K Amplitud Amplitud = = = = = = =
Intervalos

122 229 229-122 107 5 107/5 21.4 = 21
Frecuencia Acumulada 2 3 7 12 20 20 Marca de Clase 132.5 154.5 176.5 198.5 220.5

Frecuencia Absoluta 122-143 2 144-165 166-187 188-209 210-231 1 4 5 8 20

7584.1928 1566.5764 1236.2256 97.682 5584.1312 16068.808

Medidas de Tendencia Central: Media
µ=(132.5*2)+(154.5*1)+(176.5*4)+(198.5*5)+(220.5*8) 20 µ=265+154.1+706+992.5+1764 20

µ=3881.6/20 µ=194.08

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

39

Mediana N/2=20/2=10 el intervalo es el número 4 ya que este tiene frecuencia 12 que incluye el número 10 Li = 188 Fi-1 = 22 fi = 5 ai = 21 Sustitución de valores: Me=188+10-22(21)=188+(-12) (21)=188+(-2.4)(21)=188-50.4=137.6 5 5 Me=137.6 Moda Intervalo con mayor frecuencia absoluta 5 con frecuencia 8 Li = 210 fi = 8 Fi-1 = 5 Fi+1 = 0 ai = 21 Sustitución de valores Mo=210+ 8-5 (21)=210+ 3 (21)=210+5.72=215.72 (8-5)+(8-0) 11 Mo=215.72 Medidas de Tendencia Central Recorrido Re=229-121 Re=107 Varianza µ=194.08 = 16068.808/20 = 803.44 Desviación Estándar =sqrt(803.44) =28.35

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

40

Evidencia de Aprendizaje 3: Medidas de Dispersión y Tendencia Central Para elaborar la evidencia de esta unidad, realiza lo siguiente:  Retoma el trabajo que entregaste como evidencia en la Unidad 2. Para la variable edad y la variable carrera, obtén las medidas de tendencia central y dispersión. Para la variable carrera, debes obtener las medidas por carrera, del mismo modo como elaboraste las tablas de frecuencias. Describe brevemente qué significa cada una de las medidas.

Al final de tu trabajo incluye, a manera de conclusión, una reflexión sobre lo siguiente:    ¿Qué tipo de información obtuviste con el análisis de los datos? Si fueras director del campus virtual ¿para qué podrías utilizar esta información? Describe, de manera breve, algunos ejemplos. ¿Cuál es la utilidad de la estadística en tu formación académica, tus actividades profesionales y tu vida personal?

Entrega tu trabajo organizado del mismo modo que lo entregaste en la Unidad 2, es decir:     Incluye una presentación donde describas de dónde se obtuvieron los datos y la finalidad del análisis de los mismos. El procedimiento que seguiste para obtener la muestra. Las tablas, las gráficas, las medidas de tendencia central y dispersión con una descripción. Agrega tu conclusión.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

41

Edades 17-26 27-36 37-46 47-56 57-66

FA 94 152 86 23 3 358

FR 94 246 332 355 358 358

MC 21.5 31.5 41.5 51.5 61.5

Carreras Administración de empresas turísticas Desarrollo comunitario Gestión y administración de PYME Mercadotecnia internacional Seguridad pública 63 27 147 59 62 358

Debido a que se tiene que manejar por intervalos, en las edades, el último de ellos de 57 o más se le agrego el número 66 para poder obtener una marca de clase

Archivo de la presentación

EB_U3_EA_JOSA.ppt x

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

42

Cálculo de Datos por Edades

Edades 17-26 27-36 37-46 47-56 57-66

FA 94 152 86 23 3 358

FR 94 246 332 355 358 358

MC 21.5 31.5 41.5 51.5 61.5

Medidas de Tendencia Central Media

µ=((21.5*94)+(31.5*152)+(41.5*86)+(51.5*23)+(61.5*3))/358 µ=(2021+4788+3569+1184.5+184.5)/358 µ=11747/358 µ=32.81 años Mediana

N/2=358/2=179 el intervalo es el número 2 Li = 27 Fi-1 = 84 fi = 152 ai = 10 Sustitución de valores: Me=27+179-94(10) = 27+(85)(10) = 27+(0.56)*10 = 27+5.6=32.6 152 152 Me=32.6
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

43

Moda

El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 152 repeticiones. Li = 27 fi = 152 Fi-1 = 94 Fi+1 = 86 ai = 10 Sustitución de valores Mo=27+ 152-94 (10)= 27+ 58 (10)=27+(0.464*10)=27+4.64=31.64 (152-94)+(152-86) 58+66 Mo=31.64 años Edades Medidas de Dispersión Recorrido

Re=66-18 Re=48 Varianza

= (32.8-21.5)^2+(32.8-31.5)^2+(32.8-41.5)^2+(32.8-51.5)^2+(32.8-61.5)^2 358 = (127.69)+(1.69)+(75.69)+(349.69)+(823.69) 358 = 1378.45 358 = 3.85
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

44

Desviación Estándar

=sqrt(3.85) =1.96 Cálculos por Carreras Carreras
Administración de empresas turísticas Desarrollo comunitario Gestión y administración de PYME Mercadotecnia internacional Seguridad pública FA 63 27 147 59 62 358

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

45

Resultados por carrera

Administración de Empresas Turísticas

17-26 27-36 37-46 47-56 57-66

29 26 7 1 0 63

29 55 62 63 63

21.5 31.5 41.5 51.5 61.5

Medidas de Tendencia Central Media

µ=((21.5*29)+(31.5*26)+(41.5*7)+(51.5*1)+(61.5*0))/63 µ=(623.5+819+290.5+51.5+0)/63 µ=1784.5/63 µ=28.3 años Mediana

N/2=63/2=31.5 el intervalo es el número 2 ya que 31.5 se encuentra dentro de 55 Li = 27 Fi-1 = 29 fi = 26 ai = 10 Sustitución de valores: Me=27+31.5-29(10) = 27+(2.5)(10) = 27+(0.096)*10 = 27+0.96=27.96 26 26 Me=27.96 años
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

46

Moda

El intervalo con mayor frecuencia absoluta es el 1 (17-26) con 29 repeticiones. Li = 17 fi = 29 Fi-1 = 0 Fi+1 = 55 ai = 10 Sustitución de valores Mo=17+ 29-0 (10)= 17+ 29 (10)=17+(9.6*10)=17+96.6=113.6 (29-0)+(29-55) 29-26 Mo=113.6 años Recorrido Re=66-18 Re=48 Varianza

= (28.3-21.5)^2+(28.3-31.5)^2+(28.3-41.5)^2+(28.3-51.5)^2+(28.3-61.5)^2 63 = (46.24)+(10.24)+(174.24)+(538.24)+(1102.24) 63 = 1861.2 63 = 29.54 Desviación Estándar

=sqrt(29.54) =5.44

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

47

Desarrollo Comunitario
17-26 27-36 37-46 47-56 57-66 4 10 9 2 2 27 4 14 23 25 27 21.5 31.5 41.5 51.5 61.5

Medidas de Tendencia Central Media

µ=((21.5*4)+(31.5*10)+(41.5*9)+(51.5*2)+(61.5*2))/27 µ=(86+315+373.5+103+123)/27 µ=1000.5/27 µ=37.05 años Mediana

N/2=27/2=13.5 el intervalo es el número 2 Li = 27 Fi-1 = 4 fi = 10 ai = 10 Sustitución de valores: Me=27+13.5-4(10) = 27+(9.5)(10) = 27+(0.95)*10 = 27+9.5=36.5 10 10 Me=36.5 años

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

48

Moda

El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 10 repeticiones. Li = 27 fi = 10 Fi-1 = 4 Fi+1 = 23 ai = 10 Sustitución de valores Mo=27+ 10-4 (10)= 27+ 6 (10)=27+(-0.86*10)=27-8.6=18.4 (10-4)+(10-23) 6-13 Mo=18.4 años Medidas de dispersión Recorrido Re=66-18 Re=48 Varianza

= (37.05-21.5)^2+(37.05-31.5)^2+(37.05-41.5)^2+(37.05-51.5)^2+(37.05-61.5)^2 27 = (241.8)+(30.8)+(19.8)+(208.8)+(597.8) 27 = 1099 27 = 40.7 Desviación Estándar

=sqrt(40.7) =6.4
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

49

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

50

Administración y Gestión de PyME

17-26 27-36 37-46 47-56 57-66

30 57 46 13 1 147

30 87 133 146 147

21.5 31.5 41.5 51.5 61.5

Medidas de Tendencia Central Media

µ=((21.5*30)+(31.5*57)+(41.5*46)+(51.5*13)+(61.5*1))/147 µ=(645+1795.5+1909+669.5+61.5)/147 µ=5080.5/147 µ=34.6 años Mediana

N/2=147/2=73.5 el intervalo es el número 2 Li = 27 Fi-1 = 30 fi = 57 ai = 10 Sustitución de valores: Me=27+73.5-30(10) = 27+(43.5)(10) = 27+(0.76)*10 = 27+7.6=34.6 57 57 Me=34.6 años

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

51

Moda

El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 57 repeticiones. Li = 27 fi = 57 Fi-1 = 30 Fi+1 = 133 ai = 10 Sustitución de valores Mo=27+ 57-30 (10)= 27+ 27 (10)=27+(-0.55*10)=27-5.5=21.5 (57-30)+(57-133) 27-76 Mo=21.5 años Medidas de dispersión Recorrido

Re=66-18 Re=48 Varianza

= (34.6-21.5)^2+(34.6-31.5)^2+(34.6-41.5)^2+(34.6-51.5)^2+(34.6-61.5)^2 147 = (171.61)+(9.61)+(47.61)+(285.61)+(723.61) 147 = 1241.05 147 = 8.4 Desviación Estándar

=sqrt(8.4) =2.9
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

52

Mercadotecnia Internacional

17-26 27-36 37-46 47-56 57-66

21 25 10 3 0 59

21 46 56 59 59

21.5 31.5 41.5 51.5 61.5

Medidas de Tendencia Central Media

µ=((21.5*21)+(31.5*25)+(41.5*10)+(51.5*3)+(61.5*1))/59 µ=(451.5+787.5+415+154.5+0)/59 µ=1393.5/59 µ=23.62 años Mediana

N/2=59/2=29.5 el intervalo es el número 2 Li = 27 Fi-1 = 21 fi = 25 ai = 10 Sustitución de valores: Me=27+29.5-21(10) = 27+(8.5)(10) = 27+(0.34)*10 = 27+3.4=30.4 25 25 Me=30.4 años

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

53

Moda

El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 25 repeticiones. Li = 27 fi = 25 Fi-1 = 21 Fi+1 = 56 ai = 10 Sustitución de valores Mo=27+ 25-21 (10)= 27+ 4 (10)=27+(-0.15*10)=27-1.5=25.5 (25-21)+(25-56) 4-31 Mo=25.5 años Medidas de dispersión Recorrido Re=66-18 Re=48 Varianza

= (23.62-21.5)^2+(23.62-31.5)^2+(23.62-41.5)^2+(23.62-51.5)^2+(23.62-61.5)^2 59 = (4.49+62.09+319.69+777.29+1434.89) 59 = 2598.45 59 = 44.04 Desviación Estándar

=sqrt(44.04) =6.6

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

54

Seguridad Pública

17-26 27-36 37-46 47-56 57-66

10 34 14 4 0 62

10 44 58 62 62

21.5 31.5 41.5 51.5 61.5

Medidas de Tendencia Central Media

µ=((21.5*10)+(31.5*34)+(41.5*14)+(51.5*4)+(61.5*0))/62 µ=(215+1071+581+206+0)/62 µ=2073/62 µ=33.44 años Mediana

N/2=62/2=31 el intervalo es el número 2 Li = 27 Fi-1 = 10 fi = 34 ai = 10 Sustitución de valores: Me=27+31-10(10) = 27+(21)(10) = 27+(0.62)*10 = 27+36.2=33.2 34 34 Me=33.2 años

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

55

Moda

El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 34 repeticiones. Li = 27 fi = 34 Fi-1 = 10 Fi+1 = 58 ai = 10 Sustitución de valores Mo=27+ 34-10 (10)= 27+ 24 (10)=27+(0*10)=27+0=27 (34-10)+(34-58) 24-24 Mo=27 años Medidas de dispersión Recorrido Re=66-18 Re=48 Varianza

= (33.44-21.5)^2+(33.44-31.5)^2+(33.44-41.5)^2+(33.44-51.5)^2+(33.44-61.5)^2 62 = (4142.56+3.76+64.96+326.16+787.36) 62 = 5324.8 62 = 85.88 Desviación Estándar

=sqrt(85.88) =9.3

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

56

Conclusiones En la mayoría de los casos el intervalo 1 y el intervalo 2 son los que tienen mayor cantidad de alumnos, es decir la población está compuesta principalmente por personas jóvenes de entre 17 y 36 años de edad, siendo los intervalos de 37 a 66 años los que presentan menor cantidad de frecuencias relativas. Esto me indica que el comportamiento de la población de estudiantes de ESAD es muy parecido al de una universidad tradicional con clases presenciales, en donde la población es principalmente joven, pero con la ventaja que en ESAD se está captando personas de edad considerada maduros-jóvenes (los que se encuentran en sus 30’s) los cuales por lo general representan una frecuencia muy baja en las escuelas tradicionales y en ESAD tienen gran impacto poblacional. Puedo agregar también a esta conclusión, que las carreras administrativas siguen siendo las que mayor demanda presentan en nuestro país, ya que en la muestra que resultó de mis cálculos, la mayoría de los individuos están inscritos en alguna carrera administrativa y ninguno de ellos estuvo dentro de una ingeniería, aunque en la población total a estudiar si había personas inscritas en ingenierías.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

57

Autorreflexiones: Unidad 3 1.- ¿Qué es la media aritmética? La media aritmética es el valor que resulta de la suma de todos los valores de una muestra o población y se divide entre el número de individuos. Este valor nos indica cual es el promedio de valores de dicha población y es un dato de suma importancia al momento de tomar una decisión en base a los datos arrojados por una muestra. 2.- ¿En qué consiste la moda aritmética? La moda representa aquel valor que más veces se presento dentro de una población o muestra, al igual que la media es un valor muy importante ya que permite tener una idea general del comportamiento de una determinada población. 3.- ¿Qué es la mediana y como se determina en datos no agrupados? La mediana es el elemento de la población o muestra que se ubica justo al centro de la misma, es decir deja el 50% de los elementos tanto a la izquierda como a la derecha de la recta que forman los valores de la muestra o población. Se representa con Me y la forma de calcularla en datos no agrupados es la siguiente: a) Si n es impar, la mediana es el valor que ocupa la posición (n+1)/2 una vez que los datos han sido ordenados (en orden creciente o decreciente), porque éste es el valor central. b) Si n es par, la mediana es la media aritmética de las dos observaciones centrales. Cuando n es par, los dos datos que están en el centro de la muestra ocupan las posiciones n/2 y (n/2)+1. Es decir: Me = (Xn/2+(Xn/2+1))/2. 4.- ¿En qué consiste la varianza? La varianza es la diferencia que hay entre el promedio o media aritmética y cada elemento de la población o muestra, es decir que tanto se alejan estos elementos de la media, la varianza se expresa en al cuadrado de la unidad original de la muestra, es decir, si la muestra está en kilómetros la varianza es kilómetros al cuadrado y así con cada tipo de medida.

(continua sig. hoja)

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

58

5.- ¿En qué consiste la desviación estándar? La desviación estándar representa un promedio de alejamiento de los elementos de la muestra respecto a su media, cuando la desviación estándar es un valor muy grande quiere decir que los elementos tienen valores muy alejados de la media 6.- De los temas vistos en el curso, ¿Cuál fue el que más se te complicó y por qué? El más complicado para mí fue la mediana, ya que en un principio no me quedó claro que es y para que se utiliza, aunque después de repasarlo me di cuenta que en realidad es una de las medidas más sencillas de calcular y representar.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

59

Comenzado el Completado el Tiempo empleado Calificación Comentario -

viernes, 26 de agosto de 2011, 13:00 viernes, 26 de agosto de 2011, 13:07 6 minutos 54 segundos 10 de un máximo de 10 (100%) Has concluido la autoevaluación, para obtener el máximo aprovechamiento de esta actividad te sugerimos prestar especial atención a la retroalimentación que recibiste, ya que ofrece información que orienta tu proceso de aprendizaje. Continúa esforzándote.

En una colonia de la Ciudad de México se obtuvo una muestra aleatoria del monto del consumo mensual de energía eléctrica. Los datos obtenidos en pesos son los siguientes: 20, 30, 39, 45, 55, 21, 31, 40, 46, 65, 74, 68, 82, 108, 123, 154, 167, 193, 181, 95, 81, 64, 25, 32, 141, 152, 167, 173, 194, 204, 208, 73, 97, 94, 87, 120, 151, 140, 21, 64, 52, 39, 52, 165, 172, 94, 83, 24, 193, 119 Question 1 Puntos: 2 Media Respuesta:
98.3

Retroalimentación La media o el promedio de los datos es el resultado de la suma de todos los valores entre el número total de datos. La fórmula para calcularla en datos agrupados por intervalos: en una muestra. Correcto Puntos para este envío: 2/2. Question 2 Puntos: 2 Mediana Respuesta:
75.25

, porque se está calculando

Retroalimentación La mediana es el valor que divide a la mitad los datos. La fórmula para calcularla en datos agrupados por intervalos es: Correcto Puntos para este envío: 2/2. Question 3 Puntos: 1 Moda Respuesta:
41

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

60

Retroalimentación La moda es el valor del dato que se repite más veces. En este caso se ocupa la siguiente fórmula: Correcto Puntos para este envío: 1/1. Question 4 Puntos: 1 Recorrido Respuesta:
188

Retroalimentación El rango o recorrido es el resultado de restar el primero y el último valor de la variable. Se calcula con la fórmula: Re = máx xi - min xi Correcto Puntos para este envío: 1/1. Question 5 Puntos: 2 Varianza Respuesta:
3391.0109

Retroalimentación La varianza siempre es mayor o igual a cero y está dada por la media de los cuadrados de las diferencias del valor de los datos, menos la media aritmética de éstos.La fórmula para calcularla es, porque se calcula en una muestra. Correcto Puntos para este envío: 2/2. Question 6 Puntos: 2 Desviación típica Respuesta:
58.2323

Retroalimentación La desviación típica o estándar muestra qué tan alejado está un dato de la media. La fórmula para calcularla es, porque se está calculando en una muestra. Correcto Puntos para este envío: 2/2.

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

61

Examen Final
Intento 1 Completado viernes, 9 de septiembre de 2011, 16:21 Calificación / 100 80

Su calificación final en este cuestionario es 80 / 100

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

62

Literatura Consultada
Estadística, Datos Agrupados. Guillermo Corbacho. Chile. 2009. Ebook. http://upload.wikimedia.org/wikipedia/commons/4/4c/Estad%C3%ADstica_D atos_Agrupados.pdf Datos no Agrupados. Guillermo Corbacho. Chile. 2009. Ebook. http://upload.wikimedia.org/wikipedia/commons/d/df/Estad%C3%ADstica_Da tos_no_agrupados.pdf

Estadística,

Curso

Estadística Básica. Luis Salvaterry. Uruguay. 2000. Ebook. http://guajiros.udea.edu.co/descriptiva/articulos/Curso%20de%20EstadIstica %20Basica.pdf

Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia

63

Sign up to vote on this title
UsefulNot useful