Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. CONCEPTOS GENERALES
1.1 DEFINICIÓN
El término estadística posee varios significados para personas de diversos entornos e intereses. Para algunos es un medio para hacer “trucos”
en los que la persona trata de confundir a otros con información y conclusiones incorrectas. Para otros, es una forma de obtener y presentar
información. Para otro grupo de personas, es una forma de tomar decisiones.
En la vida diaria los individuos se ven rodeados de un gran volumen de información y datos referentes a varios aspectos, estos datos son
suministrados por los periódicos, la televisión, los entes gubernamentales, las empresas entre otros. Sin embargo, para interpretar esta gran
cantidad de información es necesario organizarla y agruparla de acuerdo a unas características comunes que faciliten su análisis, mediante
un método o conjunto de reglas las cuales son fijadas por la estadística.
En términos generales podemos definir estadística como: La herramienta que facilita el estudio de datos grupales, mediante la
aplicación de técnicas que permiten su recolección, organización y análisis; para poder describirlos, compararlos y obtener
conclusiones que faciliten su interpretación y predicción. Ciencia que se encarga de obtener, describir e interpretar los datos.
Partiendo de este concepto y del gran volumen de información que recopilamos en todas las áreas la cual se ha venido extendiendo gracias al
uso de los sistemas, se destaca la importancia de la estadística como una ciencia auxiliar para todas las ramas del saber y en todos los
ámbitos sociales, económicos y políticos
2. DIVISIÓN DE LA ESTADÍSTICA
De acuerdo con la finalidad con la cual se procesen los datos y el origen de los mismos, se puede dividir el estudio de la estadística en DESCRIPTIVA y
en ANALÍTICA, INDUCTIVA O INFERENCIAL
Es la encargada de la recolección, clasificación y descripción de datos muéstrales o poblacionales, para su interpretación y análisis. Implica
la abstracción (considerar por separado las cualidades de un objeto) de varias propiedades de conjuntos de observaciones, mediante el
empleo de métodos gráficos, tabulares o numéricos.
Entre estas propiedades, están la frecuencia con que se dan varios valores en la observación, la noción de un valor típico o usual, la cantidad de
variabilidad en un conjunto de datos observados y la medida de relaciones entre 2 o más variables. La estadística descriptiva sirve como método
para organizar datos y poner de manifiesto sus características esenciales con el propósito de llegar a conclusiones.
La estadística inductiva parte de datos muéstrales y a partir de estos hace inferencia (interpretación de los valores resultantes de las técnicas
descriptivas y la toma de decisiones, así como la obtención de conclusiones relativas a la población.
Por ejemplo la Policía Nacional en su especialidad en tránsito maneja gran variedad de información que va desde datos relacionados con la
cantidad de vehículos que transitan por el territorio nacional, el tipo de carga que se moviliza, las características de las vías en relación a su
infraestructura, al igual que los datos relacionados en materia de accidentalidad, entre otros muchos aspectos que son de su competencia.
1. CONOCER LA REALIDAD DE UNA OBSERVACIÓN O FENÓMENO. Al cuantificar un fenómeno estamos conociendo su situación actual. Es así como
al tener la información diaria, semanal o mensual, se puede evaluar la efectividad de medidas adoptadas. Por ejemplo, a través de la regulación realizada
por la Metropolitana de Bogotá y según las observaciones realizadas por sus miembros a la medida de "Pico y Placa" impuesta a los vehículos
particulares, se puede establecer si existe una reducción real que afecte en forma directa la movilidad en la horas pico y reduzca la congestión en los
sitios neurálgicos. Con la información de los volúmenes vehiculares, se puede hacer un análisis que permita establecer si es necesario
modificar la medida, evaluar su efectividad y determinar la receptividad de la misma.
2. DETERMINAR LO TÍPICO O NORMAL DE ESA OBSERVACIÓN. Cuando se cuantifica la característica de un fenómeno, se obtiene un valor
denominado promedio, ésta es la forma de referirnos al grupo cuantificando así su comportamiento. Si decimos que el promedio de accidentes de
tránsito en los puentes festivos es de 15 en todo el territorio nacional, es una forma de determinar el comportamiento de todos los conductores que
transitan en esos días, pero con este valor típico o normal del conjunto no se puede afirmar que en todos los puentes festivos se presente la
misma cantidad de accidentes; posiblemente existirán fechas en las cuales este valor se incremente o se reduzca. Sin embargo, como parámetro
nos permite evaluar los medidas adoptadas en materia de seguridad vial y comparar los resultados de cada unos de los puentes festivos con
este valor medio.
3. DETERMINAR LOS CAMBIOS QUE PRESENTA EL FENÓMENO. Cualquier fenómeno de carácter estadístico presenta variaciones a través del tiempo,
pero requiere una observación continua para determinar la magnitud del cambio.
Existen ciudades que por sus características se han convertido en sitio de destino para los turistas nacionales, sin embargo, ciudades y
municipios que no tenían una tradición en materia de turismo han generado atracciones para promover el desarrollo económico en este sector,
modificando el comportamiento de los viajeros en época vacacional, quienes buscan otra alternativa y se ven atraídos por los nuevos planes eco-
turísticos que modifican el ingreso y salida de vehículos a los distintos destinos, haciendo necesario replantear tos planes éxodo y retorno por
todas las vías del país; para ello la Policía de Carreteras hace revisión continua del comportamiento del tránsito vehicular y establece la magnitud
del cambio.
4. RELACIONAR DOS O MÁS FENÓMENOS. Desde el punto de vista de correlación, se puede determinar si existe una relación valida entre dos o
más fenómenos. Tal es la relación del incremento de accidentes de tránsito en los que se han visto involucradas las motocicletas con el aumento de
este tipo de vehículos en todo el territorio nacional; o la relación entre el número de viajes que realiza un individuo con los ingresos que percibe.
5. DETERMINAR LAS CAUSAS QUE ORIGINAN EL FENÓMENO. Los cambios que se observan en un fenómeno pueden tener una o varias causas de
origen. El comportamiento de los viajeros en la época decembrina refería su retorno después del puente festivo de reyes, sin embargo, las grandes
congestiones que se presentaban en las vías, en los terminales, aeropuertos, hoteles, playas, etc., ha modificado el comportamiento de los
viajeros, quienes postergan sus vacaciones y retornan a las ciudades en la semana siguiente al puente de reyes, obligando a la Policía de
Carreteras a realizar operativos y ajustar la programación de actividades.
6. HACER ESTIMACIÓN SOBRE EL COMPORTAMIENTO FUTURO DEL FENÓMENO. En numerosas ocasiones se requiere proyectar, para estimar el
comportamiento futuro de un fenómeno. La proyección a dos o tres años de la población de una región, sirve para determinar el requerimiento
potencial de transporte, es decir, estimar la demanda futura que permita evaluar las características que debe tener la infraestructura y las
especificaciones que debe cumplir.
Para reflexionar: La estadística es de gran utilidad, pero su valor radica en la correcta obtención, análisis e interpretación de los
resultados y en la experiencia y buen juicio de quien los utiliza.
Para desarrollar una estadística es necesario conocer el significado de algunos términos que permitirán diferenciar la forma en cómo se
recolecta la información y cómo se evalúa. Dependiendo de las características particulares de la población y del fenómeno a estudiar se
debe establecer el método para observar a la población o la muestra. Entre los principales conceptos que se manejan se encuentran el
significado de población, muestra y variable.
Los elementos que integran la población pueden corresponder a personas, animales, objetos o cosas. Además, el elemento pude ser una
unidad simple (un vehículo), o una entidad compleja que puede estar compuesta de varios elementos (una empresa transportadora).
Dependiendo de las características del fenómeno que estemos estudiando tendremos los elementos que conforman a la población y de
acuerdo a su número podremos dividir la población en finita o infinita.
POBLACIÓN FINITA: Es aquella en la cual el número de elementos es limitado, número de puentes peatonales de una ciudad. Ejemplo:
el número de puentes peatonales de una ciudad, los libros de la Biblioteca Nacional
POBLACIÓN INFINITA: Como su nombre lo indica el número de elementos es ilimitado. Sin embargo si la población tiene un número de
elementos muy grande lo podemos considerar como una población infinita. Ej. El número de pasajeros que se movilizan en modo
terrestre anualmente en el país, los árboles de todo el mundo
Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos
necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.
MUESTRA ESTADÍSTICA: Es un parte de los elementos que conforman una población y sirve para representaría. Para que una muestra sea
representativa debe contener las características de la población en las mismas proporciones y al obtener las conclusiones estas deben ser
un reflejo del comportamiento de toda la población.
Ejemplo: Si se desea conocer el comportamiento de los estudiantes universitarios en la ciudad de Bucaramanga, cuando van a beber y el
acatamiento de las normas de tránsito, para realizar una campaña tendiente a reducir los accidentes de tránsito; se tiene que la población y la
muestra son:
En este caso, aunque la población es finita porque a través de las oficinas de registro de las universidades se puede conocer el número de alumnos
que hay en cada una de ellas, el número de alumnos es muy alto para estudiar a la población completa. Sin embargo, una muestra representativa
nos permitirá inferir el comportamiento de los estudiantes y la forma de actuar frente a las normas de tránsito si se encuentran bebiendo.
CARACTERÍSTICAS
Como se mencionó en las definiciones de población y muestra lo primordial de los elementos que las conforman es que compartan
características comunes. Es importante resaltar que a pesar de definir en forma clara el número de unidades que conforman una población, a la
estadística no le interesa cada elemento en sí, sino su característica.
Todos los elementos de la población poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con
la misma intensidad, es obvio que las características o variables puedan tomar distintos valores. Por lo tanto, estos distintos números
o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable. La variable es una
característica de interés relacionada con cada elemento individual de una población o muestra.
3.3 DISTRIBUCIÓN DE FRECUENCIA. Ordenación tabulada de los datos recopilados en una investigación o estudio. Se representa por medio de tablas.
3.4 LAS VARIABLES (x) Cada una de las características o cualidades que poseen los individuos, animales u objetos de una población.
Las variables dependiendo de su forma de representación pueden ser de dos tipos: cualitativas o atributos o cuantitativas.
La edad de un estudiante que ingresa a la universidad, el color de su cabello, la estatura y su peso son cuatro variables.
VARIABLES CUALITATIVAS O ATRIBUTOS: no se pueden medir numéricamente. La forma de expresar los atributos es mediante palabras, por
ejemplo: profesión (ingeniero, doctor, arquitecto) estado civil (casado, soltero, unión libre), sexo (femenino, masculino) nacionalidad,
color de cabello, estatura, peso, etc.
4
VARIABLES CUANTITATIVAS: son aquellos que pueden ser expresados mediante números. Ejemplo: número de kilómetros recorridos por un
vehículo (30 km), cantidad de accidentes que se presentan en una intersección (50), cantidad de peatones que no utilizan los puentes
peatonales (150), Juan Pérez ingresó a la universidad a los 23 años.
A su vez las variables cuantitativas dependiendo de los VALORES que tome se pude dividir en discretas y continúas.
LAS VARIABLES DISCRETAS: hace referencia a que la variable sólo puede tomar valores enteros y entre dos valores consecutivos no existe un
intermedio decimal. Ejemplo: El número de vehículos automotores que pasan por un peaje en un hora pueden ser 60,80, 145... nótese que en un
reporte de peaje nunca se registrará que pasaron 60.5 vehículos. Cinco jóvenes tienen 15 años.
LAS VARIABLES CONTINUAS: pueden tomar cualquier valor fraccionario o decimal dentro de un intervalo.
Por ejemplo, la velocidad de un vehículo puede ser 94,57 km/h...etc. Los cuadros pueden medir 1,30, 1,50, 1,80, etc.
Dependiendo del NÚMERO DE CARACTERÍSTICAS que le analicemos a un elemento las variables se pueden clasificar en:
VARIABLES UNIDIMENSIONALES: hacen referencia a las que sólo evalúan una sola característica del elemento. Ejemplo: Se encuesta a 6 familias
para saber cuántos hijos tienen.
VARIABLES BIDIMENSIONALES: analizan información sobre dos características de la población. Ejemplo: Se encuesta a 6 familias para saber
cuántos hijos tienen, y cuántas veces al mes van a cine.
VARIABLES PLURIDIMENSIONALES: recogen información sobre tres o más características. Ejemplo: Se encuesta a 6 familias para saber
cuántos hijos tienen, cuántas veces al mes van a cine,, y qué tipo de películas ven.
3.5 DATO: es el valor de la variable asociada a un elemento de una población o muestra. Este valor puede ser un número, o una
palabra. Ejemplo, Juan Pérez ingresó a la universidad a la edad de 23 años, su cabello es café, mide 1.80, su peso es de 83 kilos. Estas
cuatro piezas de datos son los valores de las cuatro variables aplicadas a Juan Pérez.
3.6 DATOS: son el conjunto de valores que se obtienen de la variable a partir de cada uno de los elementos que pertenecen a la
muestra.
3.7 EXPERIMENTO: actividad planeada tanto para seleccionar los elementos como para obtener los valores de los datos.
3.8 PARÁMETRO: es un valor numérico que resume todos los datos de una población completa. Ejemplo: La edad promedio de los estudiantes es de 21 años
OBSERVACIÓN INDIRECTA: es aquella donde la persona que investiga hace uso de datos estadísticos ya conocidos en una investigación anterior,
o de datos observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenómenos.
Según la periodicidad con la cual se registre la información, puede ser:
OBSERVACIÓN CONTINUA: como su nombre lo indica es aquella que se lleva acabo de un modo permanente.
OBSERVACIÓN PERIÓDICA: es aquélla que se lleva a cabo a través de períodos de tiempo constantes. Estos períodos de tiempo pueden ser
semanas, trimestres, semestres, años, etc. Lo que debemos destacar es que los períodos de tiempo tomados como unidad deben tomarse constantes en
lo posible,
OBSERVACIÓN CIRCUNSTANCIAL: es aquella que se efectúa en forma ocasional o esporádica, esta observación hecha más por una necesidad
momentánea, que de carácter regular o permanente.
Según la cobertura, es decir, hasta donde se extienda la investigación, puede ser:
5
OBSERVACIÓN EXHAUSTIVA: cuando la observación es efectuada sobre la totalidad de los elementos de la población se habla de una observación
exhaustiva.
OBSERVACIÓN PARCIAL: dado que las poblaciones en general son grandes, la observación de todos sus elementos se ve imposibilitada.
La solución para superar este inconveniente es observar una parte de esta población.
TALLER 1
1. Mapa conceptual concepto de lo que significa la estadística.
2. Mapa conceptual aplicaciones de la estadística.
3. Mapa conceptual clasificación de la estadística.
4. Escribir 3 ejemplos de variables cuantitativas continuas.
5. Escribir 3 ejemplos de variables cuantitativas discretas..
6. En los siguientes planteamientos seleccionar cuál es la población o universo y cuál la muestra:
De un grupo de 100 adolescentes con problemas de alcoholismo, se encuesta a 30.
De 35 clases de rosas, se seleccionan 15 para ser observadas.
Para la encuesta se seleccionarán 5 clases de frutas, de 20 que son las más apetecidas por los niños.
7. Dé 3 ejemplos de variable cualitativa.
8. Dé un ejemplo de variable unidimensional.
9. Dé un ejemplo de variable bidimensional.
10. Dé un ejemplo de variable pluridimensional.
11. Mapa conceptual DATO y DATOS.
12. Mapa conceptual DISTRIBUCIÓN DE FRECUENCIA.
4. TABLA DE FRECUENCIA PARA DATOS NO AGRUPADOS
PRESENTACIÓN DE DATOS
4. 1. PROCEDIMIENTO PARA DETERMINAR FRECUENCIAS DE DATOS NO AGRUPADOS:
TABLA 1.
X fi Fi % %
VARIABLE FRECUENCIA FRECUENCIA ABSOLUTA hi Hi
ABSOLUTA ACUMULADA FRECUENCIA FRECUENCIA RELATIVA
SIMPLE RELATIVA SIMPLE ACUMULADA
fi/n*100 Fi/n*100
NÚMERO DE
% %
HERMANOS APRENDICES APRENDICES
APRENDICES APRENDICES
0 3 3 10,0 10,00
1 4 7 13,3 23,33
2 8 15 26,7 50,00
3 8 23 26,7 76,77
4 4 27 13,3 90,00
5 3 30 10,0 100,00
Σ30=n Σ100,0
6
TALLER 2
EJERCICIOS DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS NO AGRUPADOS
1. La estatura de las estudiantes del grupo “Procesar la Información “de la sede Venecia ciclo II son las siguientes:
1,70, 1,60, 1,55, 1,55, 1,70, 1,60, 1,62, 1,61, 1,61, 1,60, 1,68, 1,54, 1,59, 1,54, 1,56
1. ¿Cuál es el tamaño de n?
2. ¿Qué tipo de variable es?
3. Elaborar una tabla de frecuencia con gráfica. Gráfico de barras(ver gráfica No. 6)
4. ¿Qué porcentaje de las estudiantes tiene una estatura de 1,55 cms?
5. Hallar moda, Y SACAR CONCLUSIÓN.
6. Hallar la media, Y SACAR CONCLUSIÓN.
7. Hallar mediana, y SACAR CONCLUSIÓN
2. LOS SIGUIENTES RESULTADOS CORRESPONDEN AL NÚMERO DE PALABRAS POR MINUTO obtenidos por un grupo de estudiantes de
Asistente Administrativo del Instituto Británico en una prueba de digitación en el mes de Junio:
65, 60, 61, 62, 65, 70, 72, 68, 65, 68, 61, 60, 70, 59, 58, 58, 56, 40
1. ¿Cuál es el tamaño de n?
2. Si para considerarse un buen digitador se necesita un promedio de 60 palabras por minuto:
3. ¿Cuántas estudiantes no cumplen esta condición?
4. ¿Cuántas estudiantes cumplen y superan este promedio?
5. Elabore la tabla de frecuencias completa con gráfico de barras . (ver gráfica No. 6)
6. Hallar moda, Y SACAR CONCLUSIÓN.
7. Hallar la media, Y SACAR CONCLUSIÓN.
8. Hallar la mediana, y SACAR CONCLUSIÓN
3. SEGÚN LA ASOCIACIÓN DE LUCHA CONTRA LA BULIMIA Y LA ANOREXIA, las pautas culturales han determinado que la delgadez sea
sinónimo de éxito social. Muchos jóvenes luchan para conseguir el “físico ideal” motivados por modelos, artistas o por la publicidad
comercial. Durante el mes de marzo del año 2006, en el colegio “Alcántara” de la ciudad de Talca, después de las vacaciones de verano,
se observó con precaución a 27 alumnos con síntomas de anorexia, registrándose los siguientes signos visibles:
Dieta Severa Miedo Engordar Hiperactividad
Uso Ropa Holgada Dieta Severa Uso Laxantes
Miedo Engordar Dieta Severa Uso Ropa Holgada
Dieta Severa Uso Ropa Holgada Dieta Severa
Dieta Severa Dieta Severa Uso Ropa Holgada
Hiperactividad Uso Laxantes Miedo Engordar
Uso Laxantes Dieta Severa Uso Ropa Holgada
Uso Laxantes Hiperactividad Uso Laxantes
Uso Ropa Holgada Hiperactividad Dieta Severa
1 Resuma la información anterior en una tabla de distribución de frecuencias.
2. ¿Qué tipo de variable es?
3. ¿Qué porcentaje de los jóvenes prefieren usar laxante?
4. ¿Cuál es la población?
5. ¿Cuál es la muestra?
6. Hacer gráfico de barras (ver gráfica 6)
7. Hallar la moda, y SACAR CONCLUSIÓN
4. El Jardín Pequeñuelo hace una encuesta a sus alumnos para saber cuáles son los lápices de color preferidos por ellos para dibujar. El
resultado es el siguiente:
ROJO FUCSIA VERDE AMARILLO ROJO AMARILLO VERDE FUCSIA VERDE AMARILLO
NARANJA NARANJA FUCSIA NARANJA AMARILLO VERDE AMARILLO ROJO ROJO VERDE
8
1. Resumir la información en una tabla de distribución de frecuencias.
2. ¿Qué tipo de variable es?
3. ¿Cuál es la población?
4. ¿Cuál es la muestra?
5. Hacer gráfico PICTOGRAMA
6. Hallar la moda y sacar conclusión.
TABLA No. 2
VELOCIDADES MEDIAS (Km/h) DE 100 AUTOMÓVILES
VÍA TUNJA – BOGOTÁ KILOMETRO 95
Vehícul Velocida Vehícul Velocida Vehícul Velocida Vehículo Velocid
o d o d o d No. ad
No. Km/h No. Km/h No. Km/h Km/h
Como se observa en la tabla existe un gran amplitud entre los datos; por tanto se agruparán en rangos para simplificar el análisis.
Los pasos que se deben realizar para efectuar el análisis son:
9
Primero que todo ordenar los datos de menor a mayor, luego hallar la n (muestra), en este caso es 100
PRIMERO: Determinar el valor mínimo y el valor máximo de la variable, la diferencia entre el valor máximo y el valor mínimo se denomina
rango o recorrido.
m = 1 + 3.3 Log(n)
n: Número de datos o muestra.
Log: Función de logaritmo en base 10
De acuerdo con la clasificación que requiera la variable o la forma en que se ha venido presentando la información.
En la práctica, se determina m atendiendo a varios factores, tales como: finalidad del estudio, grado de variabilidad de los datos,
necesidad de efectuar comparaciones con otros estudios que obligue a mantener los intervalos y su número. Sin embargo, se
recomienda que el número de intervalos, hasta donde sea posible, no sea menor de 5 y mayor de 16.
m = 1 + 3.3 Log10(n)
n = 100 datos
m = 1 + 3.3 Log (100)
m = 7.6 ≈ 7 Intervalos
Es necesario aclarar que el número de intervalos debe ser un valor entero, en este caso lo acercamos a 7, pero se podía realizar la
aproximación por arriba y dejarlo en 8; la aproximación que se realice depende del criterio del investigador quien determinará si es
necesario tener más o menos intervalos.
En el ejemplo:
A = Rango / m A = Rango / m
A = 48 / 7 = 6.87 ≈ 7
Siempre que el resultado de A sea un valor entero con alguna fracción, por pequeña que ésta sea, debe ser aproximada al valor
inmediatamente superior.
10
CUARTO: Se debe realizar la revisión del recorrido o rango y el ajuste de los límites superior e inferior. La revisión se realiza a partir de la
siguiente expresión:
Rango Revisado = m * A
Para el ejemplo:
Rango Revisado = m * A
Rango Revisado = 7 x 7 =49
Para ampliar el recorrido, es necesario distribuir adecuadamente la diferencia entre los rangos, una manera sencilla es dividir la
diferencia entre dos y restarle ese valor al límite inferior y sumársela al límite superior; este procedimiento se puede realizar si la
diferencia es par. Ejemplo: Si la diferencia da 4 (le resto 2 al límite inferior y le sumo 2 al límite superior . En caso de que la diferencia nos
dé un valor impar se divide en dos y se reparte en dos números enteros restando y sumando los respectivos valores. Ejemplo: Si la
diferencia da 3 (le resto 1 al límite inferior y le sumo 2 al límite superior.
NOTA: Si la diferencia de los Rangos da Cero (0), no es necesario ajustar los límites. (Se trabaja con el Xmax (límite superior) y el Xmin
(límite inferior original.
Según el ejemplo:
Como la diferencia obtenida es de 1, se puede restar al límite INFERIOR o sumarla al límite SUPERIOR. Para el caso que nos ocupa se
resta al límite inferior, por tanto:
Límite Inferior = 77 – 1 = 76 Km/h
Límite Superior = 125 Km/h
Rango = 125 – 76 = 49
Para construir los intervalos es necesarios definirlos en forma clara de forma tal que se evite conteos dobles, para ello quien defina los
intervalos deberá especificar si los mismos son abiertos a la derecha o a la izquierda, esto quiere decir si el valor de inicio o final del
intervalo se incluye dentro del conteo. Otra forma es agregando 0,1 al límite inferior, lo que permite una fácil tabulación.
Un aspecto igual de importante a la definición de los intervalos, es el cálculo de la marca de clase, la cual es el punto medio del intervalo y
su utilidad se ve reflejada en la determinación de las medidas de tendencia central.
De acuerdo a lo expuesto se tiene para el problema:
Este procedimiento se continua hasta el último intervalo en el cual el límite superior debe coincidir con el establecido, es decir, 125 Km/h.
Las marcas de clase se determinan sin tener en cuenta si el intervalo es abierto a la derecha o a la izquierda, simplemente se suman los
valores de intervalo y se dividen por dos.
TABLA No. 3
CONSTRUCCIÓN DE INTERVALOS
VELOCIDADES MEDIAS (Km/h)
MARCA
VELOCIDAD DE
CLASE Xi
76 83 79,5
83 90 86,5
90 97 93,5
10
97 100,5
4
11
104 107,5
1
11
111 114,5
8
12
118 121,5
5
Por último, una vez determinados los intervalos se procede hacer el conteo clasificándolos de acuerdo a los datos presentados,
estableciendo el número de datos que tiene cada intervalo.
El resumen de los resultados obtenidos y los cálculos de las frecuencias absolutas y relativas, se presentan en el siguiente cuadro, a partir
del cual se puede concluir el comportamiento de las velocidades en el sector en estudio. Como la evaluación se realiza por rangos de igual
forma se debe realizar el análisis, especificando los datos que se contabilizaron en cada uno.
TABLA No. 4
DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS
VENTA DE LIBROS LIBRERÍAS DE ARGENTINA
VÍA TUNJA – BOGOTÁ KILOMETRO 95
%
Fi % Hi
fi FRECUENCI hi FRECUENCI Xi
x
FRECUENCI A FRECUENCIA A RELATIVA MARCA
VARIABLE
A ABSOLUTA RELATIVA ACUMULAD DE CLASE
ABSOLUTA ACUMULAD SIMPLE A
SIMPLE A fi/n*100 Fi/n*100
INTERVALO
VELOCIDAD VEHÍCULO VEHÍCULO VEHÍCULO VEHÍCULO KM/H
Km /h
76 - 83 16 16 16 16 79,5
83 - 90 11 27 11 27 86,5
90 - 97 17 44 17 44 93,5
97 - 104 25 69 25 69 100,5
104 - 111 13 82 13 82 107,5
111 - 118 8 90 8 90 114,5
118 - 125 10 100 10 100 121,5
SUMAS Σ 100=n Σ 100
12
Las frecuencias se determinaron haciendo el conteo de los datos y clasificándolos, por ejemplo la velocidad de 83 Km/h quedó
contabilizada en el segundo intervalo, ya que en el primero van las velocidades por debajo de este valor.
INTERPRETACIÓN DE DATOS
TALLER 3
EJERCICIOS DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS
NOTA: APLICAR LAS SIGUIENTES INSTRUCCIONES
1. Determinar la muestra (n)
2. Organizar los datos de menor a mayor.
3. Determinar el límite mayor ( Xmax) y el límite menor (Xmin)
4. Hallar el rango o recorrido R = Xmax – X min Rango= Límite mayor - Límite menor
5. Determinar el número de intervalos m = 1+3.3Log(n) Intervalos = 1+3.3logaritmo de la muestra
6. Determinar la amplitud A = R/m Amplitud = Rango/Intervalo
7. Realizar Revisión de Rango o Recorrido RR = m * A Revisión de Rango= Intervalos * Amplitud
8. Hallar la Diferencias de Rangos DR = RR-RO Diferencias de Rangos = Rango Revisado-Rango Original
9. Crear intervalos
10. Hacer tabla de frecuencia para datos agrupados que incluya la marca de clase.
11. Hallar la media
12. Hallar la moda
54 35 45 52 48 58 60 38
32 35 56 48 30 55 49 39
58 50 65 35 56 47 37 56
58 50 47 58 55 39 58 45
1. Elaborar tabla de frecuencia para datos agrupados con gráfica (histograma con frecuencia absoluta simple y acumulada). Ver gráficas
1 y 4.
2. ¿Cuál es el rango original y cuál el nuevo rango?
4. ¿Cuál es la amplitud?
5. ¿Qué valor tiene la muestra?
5. Redactar cuatro conclusiones.
6. Hallar la media, y sacar conclusión.
7. Hallar la moda y sacar conclusión.
13
2. EL MINISTERIO DE TRANSPORTE APLICA ENCUESTA en algunas CIUDADES DE COLOMBIA, para saber cuántas personas
fallecieron en accidente automovilístico, entre el 2014 Y el 2015.
<<
1. Elaborar tabla de frecuencia para datos agrupados y gráfica (histograma con frecuencia absoluta simple y acumulada). Ver
gráficas 1 y 4.. ¿Cuál es el rango original y cuál el nuevo rango?
2. ¿Cuál es la amplitud?
1. Redactar cuatro conclusiones.
2. Hallar la media, y sacar conclusión.
3. Hallar la moda y sacar conclusión
3. LOS SIGUIENTES SON LOS DATOS de la CANTIDAD DE CAJETILLAS DE CIGARRILLO que consumen mujeres entre los 17 y 28 años,
al mes, según encuesta hecha por la Secretaría de Salud.
10 4 10 14 15 12 15 10
12 8 13 16 18 16 14 11
20 10 14 14 11 15 17 13
5 12 17 15 18 20 14 10
11 20 11 10 13 13 11 17
1. Elaborar tabla de frecuencia para datos agrupados y gráfica (histograma con frecuencia absoluta simple y acumulada ) Ver
gráficas 1 y 4.
2. Redactar cuatro conclusiones.
3. Hallar la media y sacar conclusión.
4. Hallar la moda y sacar conclusión.
6. GRÁFICAS
6.3 NORMAS
El histograma se construye dibujando barras contiguas que tienen como base la amplitud de cada intervalo y como alturas las frecuencias
respectivas.
Ejemplo:
6.4.2 Polígono de Frecuencias. Para la construcción de un polígono de frecuencias, se marcan los puntos medios de cada uno los
intervalos en la parte superior de cada barra del histograma de frecuencias, es decir, las marcas de clase, los cuales se unen con
segmentos de recta.
MARC
A DE
CALSE
Xi
79,5
86,5
93,5
100,5
107,5
114,5
121,5
6.4.3 Histograma de Frecuencias Acumuladas. El histograma de frecuencias acumuladas también es obtenido a partir de una distribución
de frecuencias, tomando en el eje horizontal las clases de la variable, y en el eje vertical las frecuencias acumuladas correspondientes a
cada intervalo. Continuando con los datos del mismo ejemplo se tiene:
6.4.4 Ojiva de Frecuencias acumuladas al igual que cuando se obtuvo el polígono de frecuencias uniendo el punto medio de cada
intervalo, se puede realizar el mismo procedimiento y obtener la Ojiva de Frecuencias acumuladas como se muestra en la siguiente
gráfica.
17
GRÁFICA 5. OJIVA DE FRECUENCIAS ABSOLUTAS ACUMULADAS
TALLER 3.2
Los datos de 1995 a 2002 fueron suministrados por la Subdirección de Transporte de Carga- MINTRA. 2003 en adelante por la Dirección
de Tránsito – MINTRA.
El gráfico de barras, como su nombre lo indica está constituido por barras rectangulares de igual ancho, conservando la misma distancia
de separación entre sí. Se utiliza básicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el
tiempo. Estos gráficos suelen ser de barras verticales, aunque se pueden utilizar de forma horizontal.
C OLOR
ADOLESC ENTES
PR EFER IDO
AM AR ILLO 2
COLOR PREFERIDO
M OR ADO 4
ADOLESCENTES
NEGR O 5 10
ADOLESCENTES
R OSADO 8
8
R OJ O 4
6
VER DE 5
28 4
0
COLOR PREFERIDO
6.4.6GRÁFICO DE SECTORES CIRCULARES. Usualmente llamado gráfico de pastel o pie, debido a su forma característica de una dividida en cascos, por
18
medio de radios que dan la sensación de un pastel tajado en porciones. Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se
usa frecuentemente para las variables cualitativas.
M OR ADO 4
NEGR O 5
R OS ADO 8
R OJ O 4
VER DE 5
28
Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente.
En una muestra de 28 adolescentes a 2 les gusta el amarillo; a 4, el morado; a 5, el negro; a 8 el rosado; a 4, el rojo; a 5 el verde. Para hacer la gráfica circular o el
pastel, se aplica la siguiente fórmula: 306/n*fi
360/28*2=25.7 360/28*4=51.4 360/28*5=64.2 360/28*8=102.8 360/28*4=51.4 360/28*=64.2 para hacer esta gráfica en forma manual se utiliza el
transportador.
TALLER 4
7. 1 MODA
7.1.2 MODA (Mo) PARA DATOS NO AGRUPADOS EN TABLA DE FRECUENCIA
TABLA No. 5
VARIABLE
fi Fi
X
ESTUDIANTES ESTUDIANTES
NOTA
0 3 3
1 7 10
2 15 25
3 10 35
4 8 43
5 5 48
6 2 50
50
Mo= Li Extremo inferior del intervalo modal (66) + fi+1 Frecuencia absoluta del
intervalo posterior al modal (27) / entre la fi-1 Frecuencia absoluta del intervalo
anterior al modal (18)+ fi+1 Frecuencia absoluta del intervalo posterior al modal
(27) * la amplitud (3).
TABLA No. 6
X fi
VARIABLE ESTUDIANTES
PESO
[60- 63) 5
[63- 66) 18
[66- 69) 42
[69- 72) 27
[72- 75) 8
100
7.2 MEDIA
Promedio de los datos.
7.2.1 MEDIA ( ) PARA DATOS NO AGRUPADOS TABLA DE FRECUENCIA
20
TABLA No. 7
% % x*fi
VARIABLE
fi Fi hi Hi
x
fi/n*100 Fi/n*100
RESPUESTAS
ESTUDIANTES ESTUDIANTES ESTUDIANTES ESTUDIANTES
INCORRECTAS
0 3 3 6 6 0
1 7 10 14 20 7
2 15 25 30 50 30
3 10 35 20 70 30
4 8 43 16 86 32
5 5 48 10 96 25
6 2 50 4 100 12
50 100 136
=
INSTRUCCIONES PARA HALLAR LA MEDIA.
1. Multiplicar cada valor de la variable por su respectiva frecuencia absoluta simple.
2. Sumar el resultado de multiplicar cada valor de la variable por su respectiva frecuencia simple, y dividir la sumatoria total entre la
muestra o número de observaciones.
=136/50= 2.72 (3)
El promedio de respuestas incorrectas por parte de los estudiantes fue de 2.72 (3)
fi Fi Hi Xi
X FEECUENCIA FRECUENCIA hi MARCA DE
xi · fi
VARIABLE ABSOLUTA SIMPLE ABSOLUTA fi/n*100 Fi/n*100 CLASE
ACUMULADA
MINUTOS % % MINUTOS
DIARIOS NIÑOS NIÑOS NIÑOS NIÑOS DIARIOS
TELEVISIÓN TELEVISIÓN
[10- 20) 1 1 2 2 15 15
[30-40) 10 19 23 44 35 350
[50- 60 8 36 19 84 55 440
[60-70) 4 40 9 93 65 260
42 97 100 1 820
100
I
NSTRUCCIONES PARA HALLAR LA MEDIA.
1. Sacar marca de clase.
2. Multiplicar cada marca de clase por la frecuencia absoluta simple que le corresponda. Ejemplo: 15*1=15
3. Se hace la sumatoria de los valores de multiplicar la variable*frecuencia absoluta simple (xi · fi), en este caso el resultado es
1820
4. Se divide la sumatoria anterior entre la muestra (n), 42. Entonces queda:
CONCLUSIÓN: Los niños dedican un promedio de 43 minutos diarios para ver televisión.
7.3 MEDIANA
TABLA No. 9
VARIABLE
fi
X Fi
ESTUDIANTES
RESPUESTAS INCORRECTAS
0 3 3
1 7 10
2 15 25
3 10 35
4 8 43
5 5 48
6 2 50
50
1. Observar si al dividir por dos el total de observaciones o muestra, el resultado se encuentra en la columna de la FRECUENCIA
ABSOLUTA ACUMULADA. Me= 50/2= 25
2. Si el valor se encuentra en la columna de la FRECUENCIA ABSOLUTA ACUMULADA, se suma la variable correspondiente al VALOR
ENCONTRADO (25), con la variable correspondiente a la frecuencia absoluta acumulada inmediatamente superior (35), al valor
encontrado, y se divide entre 2.
Me= 2+3 = 2.5 = 3
2
Lo cual significa que la mitad (o el 50%) de los estudiantes tuvieron 3 o menos respuestas incorrectas y la otra mitad(o el 50%) tuvieron 3
o más respuestas incorrectas.
TABLA No. 10
VARIABLE
fi
X Fi
ESTUDIANTES
RESPUESTAS INCORRECTAS
0 3 3
1 7 10
2 10 20
3 15 35
4 18 43
5 5 48
6 2 60
60
3. Si en la columna de frecuencia absoluta acumulada no aparece el valor de dividir la muestra entre 2 (25), se busca en esta columna el
valor inmediatamente anterior a 25; en este caso es 20, y el valor inmediatamente posterior a 25, o sea 35. En este caso la mediana será
la variable que corresponda a la frecuencia absoluta acumulada inmediatamente posterior (35).
Me= 3
Lo cual significa que la mitad (o el 50%) de los estudiantes tuvieron 3 o menos respuestas incorrectas y la otra mitad(o el 50%) tuvieron 3
o más respuestas incorrectas
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
TABLA No. 11
23
X fi Fi
MINUTOS PARA JUGAR NIÑOS NIÑOS
[60- 63) 5 5
[63- 66) 18 23
[66- 69) 42 65
[69- 72) 27 92
[72- 75) 8 100
100
Es decir tenemos que buscar el intervalo en el que se encuentre el resultado de dividir la muestra entre
2. n/2
Li-1 :es el límite inferior de la clase donde se encuentra la mediana, en este caso el límite inferior es 66.
n / 2 :es la semisuma de las frecuencias absolutas, en este caso es 50
Fi-1 :es la frecuencia acumulada anterior a la clase mediana, en este caso es 23.
fi : es la frecuencia absoluta del intervalo mediano, en este caso es 42
a :es la amplitud de los intervalos. Se calcula restando el extremo superior menos el inferior del intervalo, en este
caso es: 3
1 . 1 0 0 / 2 = 50
2 . Buscar el resultado de dividir la muestra entre 2, en la columna de la frecuencia absoluta
acumulada simple.
3 . Si el resultado no aparece, se debe ubicar la menor frecuencia acumulada que supere el
resultado de n/2, en el ejemplo sería 65, y luego aplicar la siguiente fórmula:
n - Fi-1
2
Me = Li-1 + ______________ *a
fi
Conclusión: El 50% de los niños dedican 67.93 o menos minutos para jugar, y el otro 50% dedican
67.3 o más minutos para jugar.
24
Si el resultado de dividir la muestra entre 2 (en este caso 100/2=50) aparece en la columna de la
frecuencia absoluta acumulada, la mediana se tomaría de la siguiente forma:
TABLA No. 12
X fi Fi
MINUTOS PARA NIÑOS NIÑOS
JUGAR
[60- 63) 5 5
[63- 66) 20 25
[66- 69) 25 50
[69- 72) 20 70
[72- 75) 30 100
100
La mediana va a ser igual al límite superior del intervalo cuya frecuencia absoluta acumulada es el resultado de dividir la muestra
entre 2. Me= 69
CONCLUSIÓN: El 50% de los estudiantes dedicaron 69 minutos o menos para jugar y el otro 50% , 69 minutos o más.
2. Los siguientes son los valores (en miles de pesos) del impuesto cancelado por algunos de los propietarios de vivienda, que residen en
la ciudad de Bogotá D.C.
8. MEDIDAS DE POSICIÓN
Cuando la distribución contiene un número alto de intervalos o de marcas de clase y se requiere obtener un promedio de una parte de
ella, se puede dividir la distribución en cuatro, en diez o en cien partes. En el primer caso se habla de cuartiles, en el segundo caso deciles
y en el último centiles o percentiles.
8.1 CUARTILES
Las cuartillas o cuartiles son valores posicionales que dividen la información en cuatro partes iguales, el primer cuartil deja el 25% de la
información por debajo de él, y el 75% por encima, el segundo cuartil, divide la información en dos partes iguales, y por último el tercer
cuartil deja el 75% por debajo de sí, y el 25% por encima.
TABLA No. 13
X fi Fi
HIJOS FAMILIAS
FAMILIAS
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
n=100
Q1
26
Se ubica la clase cuartil en la frecuencia absoluta acumulada entre las frecuencias inmediatamente anterior y posterior. El cuartil 25 se
encuentra entre las frecuencias a cumuladas 24 y 39, entonces Q1= 2
Conclusión: El 25% de las familias tienen 2 hijos o menos.
Q2
1. PASO: Ya se halló la frecuencia acumulada.
2. PASO: Hallar la clase cuartil. 2x n 2 x 100 2 x 25= 50.
4 4
3. PASO: Hallar el cuartil.
Se ubica la clase cuartil en la frecuencia absoluta acumulada entre las frecuencias inmediatamente anterior y posterior. El cuartil 50 se
encuentra entre las frecuencias a cumuladas 39 y 65, entonces Q2= 3
Conclusión: El 50% de las familias tienen 3 hijos o menos.
Q3
1. PASO: Ya se halló la frecuencia acumulada.
2. PASO: Hallar la clase cuartil. 3xn 3 X 100 3x 25= 75.
4 4
3. PASO: Hallar el cuartil.
Se ubica la clase cuartil en la frecuencia absoluta acumulada entre las frecuencias inmediatamente anterior y posterior
. El cuartil 75 se encuentra entre las frecuencias a cumuladas 65 y 85, entonces Q3= 4
Conclusión: El 75% de las familias tiene 4 hijos o menos.
Cuando la información se encuentra agrupada en intervalos de igual tamaño la cuartiles se calculan de la siguiente manera:
Seguimos las instrucciones para la siguiente tabla de frecuencia.
TABLA No. 14
Xi fi Fi
SUELDO EMPACADORES
100-120 12 12
120-140 15 27
140-160 18 45
160-180 34 79
180-200 10 89
200-220 7 96
220-240 4 100
CUARTIL 1 (Q1)
CUARTIL 3 (Q3)
1. PASO: ya se halló la frecuencia acumulada.
2. PASO: hallar la clase cuartil 3*100/4= 75
3. Observamos entre qué frecuencias acumuladas (Fi) se encuentra el resultado anterior (75)
75 se encuentra entre las frecuencias acumuladas 45 y 79. Esto nos indica que la línea 160-180 es la clase cuartil 3.
TALLER 6
1. Dulcerías encuestadas para verificar qué tanta demanda tienen las cajas de chocolates para época de amor y amistad.
8.2 DECILES
Son 9 valores que distribuyen la serie de datos, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.
8.3.1 DECILES PARA DATOS NO AGRUPADOS
28
Se calculan de la siguiente manera.
Minutos empleados por digitadoras para escribir 60 palabras en computador.
TABLA No. 15
MINUTOS SECRETARIAS Fi
1 10 10
2 5 15
3 4 19
4 7 26
5 1 27
TABLA No. 16
CARTAS
ESCRITAS SECRETARIAS Fi
100-120 12 12
120-140 15 27
140-160 18 45
160-180 34 79
180-200 10 89
200-220 7 96
220-240 4 100
TALLER 7
1. La Secretaría de Salud, hace una investigación acerca de la edad de las niñas víctimas de la violencia en los campos, que han caído en
la prostitución.
EDAD NIÑAS
8-9 5
9-10 6
10-11 1
11-12 3
12-13 8
13-14 10
14-15 16
15-16 10
Sacar la frecuencia absoluta acumulada, y hallar D1, D4 y D6 , con sus respectivas conclusiones.
2. Crepes & Waffles hace un análisis de sus ventas los fines de semana por puntos de venta (sucursales), en todo el país. Las ventas se
dan en millones de pesos.
VENTAS PUNTOS DE
VENTA
10.000.000 8
12.000.000 9
16.000.000 5
15.000.000 9
22.000.000 9
30.000.000 5
40.000.000 6
Sacar la frecuencia absoluta acumulada, y hallar D7, D8 y D3, con sus respectivas conclusiones.
8.3 PERCENTILES
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
ESTATURA FETOS Fi
CENTÍMETRO
11 10 10
12 5 15
13 4 19
14 7 26
55 1 27
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
8.4.1 PERCENTILES PARA DATOS NO AGRUPADOS AGRUPADOS
HALLAR EL PERCENTIL 80 (equivale al 80%)
1. PASO: Hallar la frecuencia acumulada.
30
2. PASO: Hallar el percentil 80. P80= 80*n/100 P80= 80*27/100 P80= 80*0.27= 21.6
3. PASO: Se ubica el resultado en la tabla de frecuencia acumulada, entre las frecuencias inmediatamente mayor y menor.
El resultado se encuentra entre las frecuencias acumuladas 19 y 26.
Entonces P80= 14
Conclusión: El 80% de los fetos miden 14 centímetros o menos.
8.4.2 PERCENTILES DATOS AGRUPADOS (INTERVALOS)
PESO Kg BEBÉS Fi
10-12 12 12
12-14 15 27
14-16 18 45
16-18 34 79
18-20 10 89
20-22 7 96
HALLAR EL PERCENTIL 33 (equivale al 33%)
1 PASO: Hallar la frecuencia absoluta acumulada (Fi)
2. PASO: Hallar la clase percentil. Teniendo en cuenta la tabla hallar la clase percentil 33. (equivale al 33%)
33*n/100 33*100/100=33
3. PASO: Se ubica la clase percentil 33, en la tabla de frecuencia acumulada, entre las frecuencias inmediatamente mayor y menor.
33 se encuentra entre las frecuencias acumuladas 27 y 45. Esto nos indica que la línea 14-16 18 45 es la
clase percentil.
4. PASO: Aplicar la fórmula:
P330= límite inferior de la clase percentil (LD1) + ( la clase percentil (33*n/100) – la frecuencia absoluta acumulada anterior a la clase
percentil (FP1-1) / entre la frecuencia absoluta de la clase*A
P33= 14 + (33-27)/18*2
P33= 14 + 6/18*2
P33= 14 + 0.333333*2
P33= 14 + 0.666666
P33= 14.66
Conclusión: El 33% de los niños pesan 14 kilogramos o menos.
TALLER 8
La clínica de Colsubsidio hacer un análisis del peso de los bebés atendidos en mayo de 2015.
PESO BEBÉS
11-14 11
14-17 10
17-20 1
20-23 3
23-26 8
26-29 8
29-32 6
32-35 10
35-38 8
Sacar la frecuencia absoluta acumulada, y hallar los percentiles 15, 38 y 27, con sus respectivas conclusiones.
31