Está en la página 1de 35

Guía

Agosto de 2020 Probabilidad y


Estadística

INSTRUCCIONES:
➢ Todas las actividades se envían al correo: facundo.rerjis.ce56@uemstis.sems.gob.mx
con el asunto Cetir56_Probabilidad y Estadística.
➢ Un archivo en pdf o Word por actividad.
➢ El nombre del archivo debe contener número de actividad, nombre y apellido del
alumno.

Facundo Rerjis Ortega


PROFESOR
SECRETARIA DE EDUCACIÓN PÚBLICA, UEMSTIS
Centro de Estudios Tecnológicos, Industrial y de servicio No. 56
RECURSOS DE ESTUDIO DE PROBABILIDAD Y ESTADÍSTICA.
PROFESOR: FACUNDO RERJIS ORTEGA.

HISTORIA DE LA ESTADÍSTICA
Como dijera Huntsberger: "La palabra estadística a menudo nos trae a la mente imágenes de números apilados en grandes
arreglos y tablas, de volúmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, créditos y
así sucesivamente. Huntsberger tiene razón pues al instante de escuchar esta palabra estas son las imágenes que llegan a nuestra
cabeza.
La Estadística es mucho más que sólo números apilados y gráficas bonitas. Es una ciencia con tanta antigüedad como la escritura,
y es por sí misma auxiliar de todas las demás ciencias. Los mercados, la medicina, la ingeniería, los gobiernos, etc. Se nombran
entre los más destacados clientes de ésta.
La ausencia de ésta conllevaría a un caos generalizado, dejando a los administradores y ejecutivos sin información vital a la hora
de tomar decisiones en tiempos de incertidumbre.
La Estadística que conocemos hoy en día debe gran parte de su realización a los trabajos matemáticos de aquellos hombres que
desarrollaron la teoría de las probabilidades, con la cual se adhirió a la Estadística a las ciencias formales.
Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050
antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo con el historiador griego Heródoto, dicho
registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II
hizo un censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos de la
población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de
conocer el número de la población.
También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines
tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica revela
que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística.
Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras
conquistadas. Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la población bajo la autoridad del
imperio.
Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas operaciones Estadísticas, con la notable
excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en el
762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el Conquistador
recopiló el Domesday Book o libro del Gran Catastro para el año 1086, un documento de la propiedad, extensión y valor de las
tierras de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra.
Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la técnica romana, los métodos
estadísticos permanecieron casi olvidados durante la Edad Media.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo, Neper, William Harvey, Sir Francis
Bacon y René Descartes, hicieron grandes operaciones al método científico, de tal forma que cuando se crearon los Estados
Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de aplicarse a los datos económicos.
Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tenía por la peste. Más o
menos por la misma época, en Francia la ley exigió a los clérigos registrar los bautismos, fallecimientos y matrimonios. Durante
un brote de peste que apareció a fines de la década de 1500, el gobierno inglés comenzó a publicar estadística semanales de los
decesos. Esa costumbre continuó muchos años, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los
nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que abarcaban treinta años y efectuó
predicciones sobre el número de personas que morirían de varias enfermedades y sobre las proporciones de nacimientos de
varones y mujeres que cabría esperar. El trabajo de Graunt, condensado en su obra Natural and Political Observations...Made

1
upon the Bills of Mortality (Observaciones Políticas y Naturales ... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo
innovador en el análisis estadístico.
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales, comprensiva de datos
sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el siglo XVII aportó indicaciones más
concretas de métodos de observación y análisis cuantitativo y amplió los campos de la inferencia y la teoría Estadística.
Los eruditos del siglo XVII demostraron especial interés por la Estadística Demográfica como resultado de la especulación sobre si
la población aumentaba, decrecía o permanecía estática.
En los tiempos modernos tales métodos fueron resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y
el potencial humano de sus respectivos países. El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar
en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en Breslau. Este investigador se propuso destruir la
antigua creencia popular de que en los años terminados en siete moría más gente que en los restantes, y para lograrlo hurgó
pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de defunción pudo demostrar que
en tales años no fallecían más personas que en los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo
inglés Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos sirvieron de
base para las tablas de mortalidad que hoy utilizan todas las compañías de seguros.
Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la
teoría de probabilidades. No obstante durante cierto tiempo, la teoría de las probabilidades limitó su aplicación a los juegos de
azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas científicos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que extrajo del término
italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del
gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el término latino status, que significa estado o
situación; Esta etimología aumenta el valor intrínseco de la palabra, por cuanto la estadística revela el sentido cuantitativo de las
más variadas situaciones.
Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la probabilidad para su uso en
las ciencias sociales y resolver la aplicación del principio de promedios y de la variabilidad a los fenómenos sociales. Quételect fue
el primero en realizar la aplicación práctica de todo el método Estadístico, entonces conocido, a las diversas ramas de la ciencia.
Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos matemáticos fundamentales para la teoría Estadística;
la teoría de los errores de observación, aportada por Laplace y Gauss; y la teoría de los mínimos cuadrados desarrollada por
Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por Correlación, que tenía por
objeto medir la influencia relativa de los factores sobre las variables. De aquí partió el desarrollo del coeficiente de correlación
creado por Karl Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que
efectuaron amplios estudios sobre la medida de las relaciones.
Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del cálculo de probabilidades,
particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en
la Física como resultado de las investigaciones atómicas y que este principio se juzga aplicable tanto a las ciencias sociales como a
las físicas.

Fuente: BIBLIOTECA VIRTUAL de Derecho, Economía y Ciencias Sociales


Obtenida de: http://www.eumed.net/libros-gratis/2006a/rmss/00.htm
Autores: David Ruiz Muñoz y Ana María Sánchez Sánchez

Videos que puedes consultar:


1. https://www.youtube.com/watch?v=eqbHjl2vPCw Teoría Estadística Básica Origen e Historia
2. https://www.youtube.com/watch?v=z7EivPfkkn0 Historia de la Estadística
3. https://www.youtube.com/watch?v=AQTIebhMMUY Historia de la estadística

2
CONCEPTOS FUNDAMENTALES DE LA ESTADÍSTICA
La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos,
series de hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados precisos o unas previsiones
para el futuro.
Estadística: Es la rama de las matemáticas que se ocupa de recolectar, organizar, presentar, analizar e interpretar
datos para ayudar a una toma de decisiones más efectiva.
La estadística se clasifica en dos grandes ramas la estadística descriptiva y la estadística inferencial.
Estadística Descriptiva: Conjunto de métodos para organizar, resumir y presentar los datos de manera informativa.
Ejemplo 1: El censo del INEGI reveló que la edad promedio de los mexicanos es de x años.
Ejemplo 2: La producción representativa durante el mes es de 500 toneladas diarias.
Estadística inferencial: Conjunto de métodos probabilísticos y estadísticos utilizados para saber algo acerca de un
todo, basándose en una pequeña parte de este.
Ejemplo 1: La empresa de consulta Mitofsky concluyo que el partido político X es el referido por los mexicanos
después de realizar una encuesta con algunos votantes.
Ejemplo 2: La empresa Nissan decidió rechazar toda la producción de motores del día de hoy al encontrar que un
determinado número de ellos se encontraba defectuoso.
Población Se le llama Población a la cantidad total de cualquier conjunto completo de datos, objetos, individuos o
resultados que tengan alguna característica en común que se va a observar o analizar en un problema o experimento.
Denotaremos al tamaño de la población por “N”.
En nuestro ejemplo 1 se considera como población a todos los conductores de automóviles. Así: N = 750,000
Una Población es Finita cuando existe una cantidad determinada de elementos por analizar; esto es, una cantidad de
elementos, numerable y que en determinado momento finaliza.
Ejemplo: Los habitantes del municipio de Ecatepec.
Una Población es Infinita cuando existe una cantidad indeterminada de elementos por analizar; es decir, una
cantidad de elementos que aunque los enumeráramos nunca terminaríamos de hacerlo.
Ejemplo: Los valores de temperatura durante un día, todos los puntos de una línea, número de alumnos del Cetis del
presente y en el futuro.
Muestra: Se le llama Muestra a cualquier subconjunto de elementos de la población. El interés de la Estadística es
proporcionar métodos que permitan elegir una muestra de datos representativos destinado a suministrar
información acerca de una población, será fundamental que los elementos deben tener todas las características de la
población.
Denotamos al tamaño de la muestra por “n”. En nuestro ejemplo una muestra podría ser: 500 conductores elegidos
al azar, en este caso quedará: Muestra n = 500 y Población N =750,000
Variable: Se le llama Variable a la cualidad o cantidad medible de cualquier suceso o acción que presente o
experimente un cambio, la podemos representar mediante un símbolo (X, Y, Z, α, β, γ, δ) y al cual se le puede asignar
un valor cualquiera de un conjunto determinado de datos.
Variable Aleatoria: Es aquella variable cuyos cambios no pueden ser determinados antes de que estos se presenten;
es decir, están destinados a la suerte. También se le conoce como Variable Probabilista, Cabalística, de Azar o Suerte.
Tipos de variable
Para su estudio, las variables aleatorias se han clasificado según la naturaleza de los valores que toman en:

3
Variables Numéricas o Cuantitativas: Son aquellas que se identifican o se les puede asignar un valor numérico o que
corresponden a aspectos que son medibles.
Ejemplo: Tiempo de uso, precio, tamaño, velocidades, número de hijos de una familia, número de carros que circulan
por determinada calle, alturas, pesos, tallas, temperaturas, tiempo de vida de una persona, cantidad de
azúcar para endulzar un café, medida de sombreros, etcétera.
Variables Discretas: son aquellas que solamente toman valores enteros con rango finito.
Ejemplo: Número de hijos en cada familia de una colonia de la ciudad, talla de calzado de cada alumno de un grupo
escolar, la cantidad de alumnos por grupo, etc.
Variable Continua: Son aquellas que pueden tomar cualquier valor entre dos valores dados. Es decir, el rango
contiene no sólo valores enteros sino un intervalo (finito o infinito) de valores reales (esto es, que puede ser
fraccionario, decimal o irracional).
Ejemplo: El tiempo de vida de una persona, la cantidad de azúcar para endulzar un café, el nivel de hemoglobina de
los habitantes de una colonia, la temperatura ambiental durante un día, etcétera.
Variables Categóricas o Cualitativas: Son aquellas a las que no se les puede asignar o identificar con un valor
numérico, sino con un aspecto, cualidad o característica que las distinga y que no se pueden medir sino solo observar,
a ese aspecto, cualidad o característica se le llama categoría.
Ejemplos: Marca, tipo de sangre, deporte preferido, el estado en general de cualquier cosa, idioma, nacionalidad,
colores, cabello o piel, himnos nacionales, sexo, estado de ánimo, clima, etcétera.
En las variables categóricas, un elemento no puede estar en dos o más categorías a la vez, lo cual las hace excluyentes
y además no puede haber elementos de la población que no pertenezcan a alguna categoría, lo cual las hace
exhaustivas.
Variables Nominales: son aquellas a las que no se les puede asignar un orden, es decir que sólo permite clasificación
en categorías por mención de ésta.
Ejemplo: La nacionalidad de una persona, idioma, sexo, himnos nacionales.
Variables Ordinales: son aquellas que además de clasificar a los elementos en distintas categorías les podemos
asignar un orden o que podemos ordenar de acuerdo a cierta característica.
Ejemplo: El estado de salud de una persona; que podemos ordenarla según la urgencia del caso, el color de algún
objeto según la tonalidad desde muy clara a más oscuro; que podemos ordenarlo de acuerdo a la intensidad
del color, el grado militar, puesto en la empresa, día de la mamá, meses del año, etcétera.
Datos: Son las agrupaciones de cualquier número de observaciones relacionadas. Para que se considere un dato
estadístico debe tener dos características: Que sean comparables entre sí y que tengan alguna relación.
Censo: Es el método de recolección de datos mediante el cual la información se obtiene del estudio de todos los
elementos que componen a la población o universo bajo estudio.
Un censo debe cumplir las condiciones de universalidad (censar a todos los elementos de la población) y
simultaneidad (realizarse en un momento determinado).

4
El término censo no sólo se aplica a aquellos estudios que comprenden todas las unidades del país y que se realizan
con frecuencia de recolección quinquenal o decenal, como es el caso de los censos de población, económicos,
agropecuarios, etcétera, sino también a cualquiera independientemente de su cobertura geográfica, número de
unidades de información, o frecuencia de su recolección, siempre que incluya todas las unidades que componen el
universo que se investiga.
Muestreo: Es el estudio que se hace de una población por medio de muestras representativas, debidamente elegidas
de manera que posea todas las características de una población y de tamaño determinado según la precisión que de
ella se quiere obtener en las decisiones y conclusiones estadísticas posteriores.
Se le llama valores estadísticos, estadísticos muéstrales o simplemente estadísticos a los valores o cantidades
desconocidas que son obtenidas de, o que hacen referencia a las características de una muestra.
Se le llama Parámetro o parámetros poblacionales o simplemente parámetros a los valores o cantidades
desconocidas que son obtenidas de, o que hacen referencia a las características de una población.
Fundamentalmente el muestreo es de los siguientes tipos:
Métodos de muestreo
No probabilística: tipo de muestreo en el que no es posible estimar la probabilidad de que cada individuo o elemento
estará incluido en la muestra, además no permite el cálculo del posible error de la muestra. Pueden ser de tres clases:
Accidental o incidental, por cuotas, intencional por conveniencia o de juicio. Aunque este tipo de muestreo no será
objeto de estudio en este curso.
Probabilístico o aleatorios: tipo de muestreo que se obtiene mediante sorteo de los individuos que la forman
teniendo así, cada individuo la misma posibilidad de pertenecer a la muestra, permitiendo calcular el posible error de
la muestra. De entre los que destacan:
- Muestreo Aleatorio Simple: es el tipo de muestreo en el cual todos y cada uno de los elementos de la población se
elige de tal forma que tengan la misma posibilidad de ser seleccionados y pertenecer a la muestra.
- Muestreo Sistemático: se utiliza cuando el universo es de gran tamaño o ha de extenderse en el tiempo y requiere
de una selección aleatoria inicial de observaciones seguida de otra selección de observaciones, obtenida mediante
una constante denominada constante de sistematización: Cs= N/n;
Donde N = es el tamaño de la población y n = el tamaño de la muestra.
- Muestreo Estratificado: se involucra la división previa de la población en subgrupos, clases o estratos que se
suponen más homogéneos, y a los cuales se les asigna una cuota que determina el número de miembros del estrato
que compondrán la muestra, estos son escogidos mediante muestreo aleatorio simple. Según la cantidad de
elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos técnicas de muestreo
estratificado:
a. Asignación proporcional: el tamaño de cada estrato en la muestra es proporcional a su tamaño en la población.
b. Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más variabilidad. Para ello
es necesario un conocimiento previo de la población.
- Muestreo por Conglomerados: al dividir primero la población en grupos o conglomerados convenientes para el
muestreo, seleccionando de cada uno de ellos una porción, al azar o por un método sistemático. Bajo este método,
aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado.
Estadística Descriptiva
La estadística descriptiva, en general, es la ciencia que trata de la recopilación, clasificación, ordenación, organización
y presentación de datos numéricos de la variable de estudio.
Una vez determinada la variable de estudio, se requiere aplicar la definición de estadística descriptiva:

5
Recopilación de información.
La recopilación o toma de datos se refiere a la recolección de una serie de datos numéricos, los cuales deberán ser
organizados, en base a un orden numérico y a unas categorías, de acuerdo a las características que presenten.
La estadística debe ser exacta y verdadera para ello, la recopilación de los datos debe ser cuidadosa y precisa,
apoyándose en el uso de los medios, recursos y procedimientos que faciliten objetivamente su aglomeración.
Los datos son situaciones o hechos que se representan numéricamente y que forman parte de nuestra vida cotidiana
algunas veces, y otras se encuentran en libros porque han sido recopilados con anterioridad por otras personas. Por
tal motivo los datos pueden ser:
Datos originales.- Estos datos son recopilados y comprobados en forma rigurosa por nosotros mismos.
Datos indirectos.- Estos datos son recopilados en enciclopedias, libros, revistas, periódicos, videos, grabaciones de
audio y por publicaciones por Internet.
Los datos se pueden recopilar por medio de cuestionarios y entrevistas, que dan lugar a los datos originales; y por
medio de consultas en fuentes documentales (originales y fieles), que dan lugar a los datos indirectos.
Clasificación de Datos
Una vez recopilada la información, esta debe escribirse en datos numéricos, de tal manera que los números tengan el
mismo número de cifras significativas, es decir, si son enteros, con décimas, con centésimas, etc.
Para cumplir con lo anterior se tiene el siguiente criterio de redondeo de cifras.
Redondeo.- Es una manera de expresar cierto número de cifras significativas, pero debemos ser cuidadosos al
escribirlas para no caer en errores que en el futuro nos proporcionen posibles sesgos estadísticos.
Para tratar de evitar posibles sesgos, redondearemos a la cifra significativa de la naturaleza de los datos (enteros,
decimas, centésimas o milésimas), de la siguiente manera: si la cifra es mayor que cinco, la cantidad aumentara, si es
menor que cinco, la cantidad se trunca, si es cinco se redondea al número par más próximo que antecede o
consecuente del cinco.
Ejemplo 1: Redondear las siguientes cifras:
Redondear a enteros Redondear a decimas
a) 5.8 Se escribirá 6 d) 48 Se escribirá 48.0
b) 374.4 Se escribirá 374 e) 57.78 Se escribirá 57.8
c) 2.538 Se escribirá 2 f) 0.659 Se escribirá 0.6

Ordenar Datos
Es una técnica o método utilizado en la reunión de datos numéricos, los cuales se pueden ordenar en forma
ascendente (de menor a mayor) o descendente (de mayor a menor).
Si se escriben los datos en una columna, la cantidad menor se coloca arriba y las mayores debajo de está; si se
escriben en un renglón o fila, la cantidad menos se pone a la izquierda y a la derecha de esta se colocan las mayores.
Organización y presentación de Datos
Organizar los datos: Existen muchas formas de clasificarlos, en general pueden ser determinados de acuerdo a cuatro
elementos que son: Tiempo, lugar, cantidad y cualidad.
Presentación de Datos: La información se resume en Tablas Estadísticas con base en arreglos formados de renglones
y columnas, adecuados según cronología, geografía, análisis cuantitativo o cualitativo.
Los principales elementos de una tabla estadística son: Título, unidades, encabezado, cuerpo o contenido, nota de pie
y referencias; la información contenida en una tabla estadística también se puede presentar mediante gráficas,
siendo las más comunes las de líneas, barras, pictográficas, cronogramas, circulares o de pastel, histograma y
polígono de frecuencias.

6
ACTIVIDAD 1
Objetivo: Conocer el origen y evolución de la estadística a través de la historia.
Desarrollo: Leer la Lección “Historia de la estadística” y consultar los siguientes videos y construir una línea de tiempo
sobre la historia de la estadística:
1. https://www.youtube.com/watch?v=eqbHjl2vPCw Teoría Estadística Básica Origen e Historia
2. https://www.youtube.com/watch?v=z7EivPfkkn0 Historia de la Estadística
3. https://www.youtube.com/watch?v=AQTIebhMMUY Historia de la estadística
Entregar la Actividad 1, por correo electrónico. Todas las imágenes correspondientes a la línea de tiempo, pégalas en
un archivo de Word o pdf y enviarlo al correo: facundo.rerjis.ce56@uemstis.sems.gob.mx . El nombre del archivo
debe tener el número de actividad seguido del nombre y apellido del alumno.

Envía sólo un archivo por actividad. No olvides poner dentro del archivo, nombre y grupo.

ACTIVIDAD 2
Objetivo: Usar un lenguaje propio para situaciones que necesiten del estudio con elementos estadísticos.
Desarrollo: Leer la Lección “Conceptos fundamentales” y contestar en forma breve y correcta las siguientes
preguntas:
1. Explica con tus palabras la definición de estadística.
2. ¿Qué es la estadística descriptiva?
3. ¿Qué elementos son básicos en la estadística?
4. ¿Cómo se define la población?
5. Enuncie el concepto de muestra.
6. ¿Qué es un censo?
7. Explicar la diferencia entre datos cualitativos y cuantitativos.
8. ¿Cuál es la diferencia entre la variable continua y la variable discreta?
9. ¿Qué es muestreo?
10. ¿Cuál es la diferencia entre el muestreo no probabilístico y el aleatorio?
11. Menciona tres técnicas de muestreo probabilístico.
12. ¿En qué consiste la recopilación de datos?
13. ¿Cuál es la diferencia entre datos originales y datos indirectos?
14. ¿Cuál es el criterio que se toma para el redondeo de datos?
15. ¿Cuáles son las formas en que se pueden ordenar los datos?

Entregar la Actividad 2, por correo electrónico. Todas las imágenes correspondientes a la actividad, pégalas en un
archivo de Word o pdf y enviarlo al correo: facundo.rerjis.ce56@uemstis.sems.gob.mx . El nombre del archivo debe
tener el número de actividad seguido del nombre y apellido del alumno.

Envía sólo un archivo por actividad. No olvides poner dentro del archivo, nombre y grupo.

7
REPRESENTACIÓN GRÁFICA DE INFORMACIÓN
En la mayoría de los periódicos y revistas presenta información en forma de gráficas de líneas o de barras o circulares,
que hacen que la información sea más atractiva visualmente hablando.
Gráfica de líneas: Suelen representar información de negocios y economía, porque muestran el cambio y las
tendencias de una variable a través del tiempo. La variable de interés, como el número de unidades vendidas o el
valor total de ventas, se colocan a lo largo del eje vertical y el tiempo en el eje horizontal.
Ejemplo: Traza la gráfica de líneas que muestre el comportamiento de los promedios escolares finales de dos alumnos
(Daniel y Blanca) a lo largo de cinco observaciones anuales.
Solución:
Promedio
Año
Daniel Blanca
2004 8.8 9.1

2005 7.6 6.9

2006 9.8 9.7

2007 8.7 8.2

2008 9.1 8.7

Gráfica de barras: Se utiliza para representar información referente a datos nominales y ordinales.
Ejemplo: Realiza una gráfica de barras que represente el número de campeonatos de fútbol que han ganado los
países en las 18 ediciones desde 1930 hasta 2006.
Solución.

País Campeonatos
Francia 1
Inglaterra 1
Argentina 2
Uruguay 2
Alemania 3
Italia 4
Brasil 5

Gráfica circular: es útil para representar información referente a datos nominales, comúnmente expresados en
porcentajes; también recibe el nombre de gráfica de pastel por su semejanza.
Ejemplo: Realizara una gráfica circular que ilustre los gustos musicales de un grupo de cien jóvenes de la Facultad de
Contaduría, donde 25 jóvenes tienen el gusto por el Pop en español, 17 por el Pop en inglés, 35 por el Rock, 3 por el
Jazz, 15 prefieren música bailable y 5 otro tipo de música.

8
Solución:
Música Jóvenes Porcentaje Ángulo
n fr=n/N α=360o fr
Jazz 3 3% 10.8o
Otros 5 5% 18o
Bailable 15 15 % 54o
Pop inglés 17 17 % 61.2o
Pop español 25 25 % 90o
Rock 35 35 % 126o
Total N=100 100 % 360o

Gráfica de puntos: Una gráfica de puntos o dispersión tiene dos ejes de valores, mostrando un conjunto de datos
numéricos en el eje x y otro en el eje y. Combina estos valores en puntos de datos únicos y los muestra en intervalos
uniformes o agrupaciones. Los gráficos de dispersión se utilizan normalmente para mostrar y comparar valores
numéricos, como datos científicos, estadísticos y de ingeniería.
Ejemplo: Traza una gráfica de dispersión que compara temperaturas en un día en la Ciudad de México. En el eje de
horizontal mide la hora de medición y el eje vertical mide las temperaturas previstas y las temperaturas reales.
Solución:
Temperatura oC
Hora
Real Prevista
00:00 10 11
03:00 5 7
06:00 10 9
09:00 13 11
12:00 19 16
15:00 27 24
18:00 22 20
21:00 16 14

Pictogramas: Son imágenes que sirven para representar el comportamiento o la distribución de los datos
cuantitativos de una población, utilizando símbolos de tamaño proporcional al dato representado.
Ejemplo: Realizar un pictograma que represente la población de los Estados Unidos de 1930 a 1990, donde en 1930 se
tenía 12 millones 300 mil habitantes, para 1950 eran 15 millones, en 1970 20 millones 200 mil habitantes y en 1990
25 millones. (Cada figura representa a dos millones de habitantes).
Solución.

Año Habitantes
(Millones)

1930 12.3

1950 15.0

1970 20.2

1990 25.0

9
ACTIVIDAD 3
Objetivo: Representar información en forma gráfica, para resaltar visualmente la información.
Desarrollo: Leer la Lección “Presentación gráfica” y trazar las gráficas correspondientes en cada uno de los problemas
siguientes.
1. La distribución del gasto en alimentación de una familia viene dada por los siguientes porcentajes: carne, 26
%; pescado, 14 %; pastas y cereales, 14 %; patatas y hortalizas, 8 %; frutas, 9 %, y otros 29 %. Construye una
gráfica circular.

2. La tabla resume las 90 horas a la semana, dedicadas a las cinco actividades deportivas de un atleta del
pentatlón. Dibuja una gráfica de barras que represente la información.

Deporte Horas por semana


Esgrima 13
Natación 20
Carrera 17
Tiro 15
Equitación 25

3. De los 220 trabajadores de una empresa han llegado a trabajar 10 minutos antes 65 trabajadores, 5 minutos
antes 16, en su hora exacta 119 trabajadores, 5 minutos tarde 16 y el resto 10 minutos tarde. Construye una
gráfica de líneas que presente la información.

4. Traza una gráfica de dispersión que muestre la cantidad de sueño que se necesita al día dependiendo de la
edad.

Edad 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Sueño
15 14.5 13 12.5 11 11 10.5 10.5 10 9.5 9.5 9 9 9 9 9.5 9.5 9.5 8 8
hrs.

5. Realiza un pictograma que muestre el total de producción de crudo de México para cada año que se señala
en la siguiente tabla. (Miles de barriles diarios Mbd)

Año 1975 1980 1985 1990 1995 2000 2005 2010 2015 2020
Mbd 1000 1800 2600 2500 2600 3000 3300 2600 2300 1700

Entregar la Actividad 3, por correo electrónico. Todas las imágenes correspondientes a la actividad, pégalas en un
archivo de Word o pdf y enviarlo al correo: facundo.rerjis.ce56@uemstis.sems.gob.mx . El nombre del archivo debe
tener el número de actividad seguido del nombre y apellido del alumno.

Envía sólo un archivo por actividad. No olvides poner dentro del archivo, nombre y grupo.

10
TABLA DE FRECUENCIAS
La organización de los datos constituye la primera etapa de su tratamiento, puesto que facilita los cálculos
posteriores y evita posibles confusiones. Al disponer de un conjunto de datos, es necesario dotarlos de alguna
estructura que permita resumirlos y comprenderlos de una forma más o menos sencilla.
La organización va a depender del número de datos (observaciones) distintas que se tengan y de las veces que se
repitan cada una de ellas. En base a lo anterior, se pueden estructurar los datos de dos maneras diferentes:
1. Distribución de frecuencias.
Cuando se tiene un gran número de datos (observaciones), pero muy pocos distintos, se organizan en una
distribución de frecuencias, es decir, cada uno de los valores (datos) acompañado del número veces con el que
aparece. Este es el tipo de tabla que acompaña a una variable discreta.
Esta distribución de frecuencias está compuesta por las siguientes columnas:
➢ Valores de la variable, son los diferentes valores que toma la variable de estudio. Se representa con X
➢ Frecuencia o frecuencia absoluta, es el número de veces que se repite un mismo valor en el grupo de datos.
La sumatoria de las frecuencias absolutas es igual al número de datos (N). Se representa con f.
➢ Frecuencia relativa, es la fracción o proporción de elementos que pertenecen a cada dato (observación). Se
calcula dividiendo la frecuencia absoluta entre el número de datos del estudio. Se representa con fr.
𝑓
𝑓𝑟 = (100 %)
𝑁
➢ Frecuencia acumulada, es el acumulado o suma de las frecuencias absolutas, indica cuantos datos se van
contando hasta ese momento o cuántos datos se van reportando. Se representa con fa.
➢ Frecuencia relativa acumulada, es la proporción de datos respecto al total que se han reportado hasta ese
momento. Es la suma de las frecuencias relativas, y se puede calcular también dividiendo la frecuencia
acumulada entre el número de datos del estudio. Se representa con fra.
𝑓𝑎
(100 %)
𝑓𝑟𝑎 =
𝑁
➢ Frecuencia complementaria, esta frecuencia se obtiene de la diferencia del total de datos y la frecuencia
acumulada de cada clase, se representa con fc.
𝑓𝑐 = 𝑁 − 𝑓𝑎
La Distribución de Frecuencia se elabora colocando en la primera columna los datos diferentes y en la columna
siguiente el número de observaciones que corresponden a cada dato o a cada grupo de datos llamada frecuencia, la
columna siguiente corresponde a frecuencia relativa y así sucesivamente. Para obtener

Frecuencia Frecuencia relativa Frecuencia


Datos diferentes Frecuencia Frecuencia relativa
acumulada acumulada complementaria
X f fr
fa fra Fc

Datos ordenados Usar


de menor a mayor 𝑓
𝑓𝑟 = (100) Usar
𝑁 Usar
Número de veces que 𝑓𝑐 = 𝑁 − 𝑓𝑎
𝑓𝑎
se repite un dato. 𝑓𝑟 = (100)
𝑁

11
Ejemplo 1: El siguiente hecho se refiere a un profesor de la división de procesos de producción, interesado en conocer
la habilidad matemática de los alumnos de nuevo ingreso a la Universidad Tecnológica de Nezahualcóyotl.
Por lo que aplica un examen y los resultados son:
Muy bien = MB Bien = B Regular = R Deficiente = D Muy deficiente = MD
Y los datos obtenidos son los siguientes:
B R R D R D D D MD MD
R B D B D MB B R R B
R D MD D B D R MB D D
D R R R MD D MD D MD R
MD R D MD R B D R B D
La forma de organizar los datos obtenidos en una tabla de frecuencias queda como sigue. Variable “calificación”
X Conteo f fr fa fra fc
MD lllll lll 8 16% 8 16 % 42
D lllll lllll lllll ll 17 34% 25 68 % 25
R lllll lllll lllll 15 30% 40 80 % 10
B lllll lll 8 16% 48 96% 2
MB ll 2 4% 50 100 % 0
TOTALES N=50 * 100%
* En este caso la sumatoria resultó ser 100%, pero habrá ejercicios en los cuales la sumatoria sea un poco mayor o
un poco menor al 100%, por efecto del redondeo de cifras.
Ejemplo 2: Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el número de
empleados que hay en cada una de ellas para un estudio posterior. Las observaciones obtenidas han sido:
12, 10, 10, 11, 15, 16, 10, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12, 16, 17, 17,16,16, 15, 14, 12, 11, 11, 11, 12,
12, 12, 15, 13, 14, 16, 15, 16, 17, 16, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12.
Organizar la información en una distribución de frecuencias. La variable es el “número de empleados”.
X Conteo f fr fa fra fc
10 lllll l 6 12 % 6 12 % 44
11 lllll lllll 10 20 % 16 32 % 34
12 lllll lllll 10 20 % 26 52 % 24
13 lllll 5 10 % 31 62 % 19
14 lll 3 6% 34 68 % 16
15 lllll l 6 12 % 40 80 % 10
16 lllll ll 7 14 % 47 94 % 3
17 lll 3 6% 50 100 % 0
TOTALES N=50 100%
Ejemplo 3: Se ha realizado una encuesta en 30 hogares en la que se les pregunta el número de individuos que
conviven en el domicilio habitualmente. Las respuestas obtenidas han sido las siguientes:
4, 4, 1, 3, 5, 3, 2, 4, 1, 2, 2, 3, 4, 5, 5, 3, 2, 3, 3, 2, 2, 1, 5, 3, 5, 3, 4, 4, 2, 3.
Organizar los datos en una distribución de frecuencias. La variable es “individuos que conviven en el domicilio”.
X Conteo f fr fa fra fc
1 lll 3 10 % 3 10 % 27
2 lllll ll 7 23 % 10 33 % 20
3 lllll llll 9 30 % 19 63 % 11
4 lllll l 6 20 % 25 83 % 5
5 lllll 5 17 % 30 100 % 0
TOTALES N=30 * 100%
Para consultar: Distribución de frecuencias en http://www.frivclassic.com/classic.html

12
Centro de Estudios Tecnológicos, Industrial y de servicio No. 56
RECURSOS DE ESTUDIO DE PROBABILIDAD Y ESTADÍSTICA.
PROFESOR: FACUNDO RERJIS ORTEGA.

ACTIVIDAD 4
Objetivo: Organizar información en una tabla de frecuencias o distribución de frecuencias, para resumir y
comprender de una forma sencilla la información.
Desarrollo: Leer la Lección “Distribución de frecuencias” y organiza la información de cada ejercicio en una
distribución de frecuencias.
1. En una ficha de seguimiento (Hoja de registro) acerca de 20 familias, se ha registrado el número de hijos de
cada familia (variable: “número de hijos”): 4, 3, 4, 2, 0, 4, 1, 3, 2, 3, 4, 3, 2, 3, 1, 2, 4, 3, 2, 3.
Organizar la información en una distribución de frecuencias, donde la variable es el número de hijos.
2. Durante el mes de marzo, en la ciudad de Tizayuca Hidalgo, se han registrado las siguientes temperaturas
máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34,
33, 33, 29, 29.
Organizar la información en una tabla de frecuencias, para la variable “temperatura”.
3. Unos grandes almacenes disponen de un estacionamiento para sus clientes. Los siguientes datos que se
refieren al número de horas que permanecen en el estacionamiento una serie de vehículos: 4, 4, 2, 4, 5, 3, 6,
3, 5, 3, 2, 1, 3, 7, 3, 1, 5, 1, 7, 2, 5, 2, 4, 7, 3, 6, 2, 2, 4, 1, 6, 4, 3, 3, 4, 5, 4, 3, 2, 4, 3, 2, 4, 4, 3, 6, 6, 4, 5, 5, 4, 5,
5, 1, 7, 4, 4, 3, 6, 5.
Obtener la tabla de frecuencias para ese conjunto de datos. ¿Cuál es la variable de estudio?
4. Un dentista observa el número de caries en cada uno de los 100 niños de cierto colegio. La información
obtenida a parecer resumida en la siguiente tabla:
No. Caries 0 1 2 3 4
No. Niños 25 20 35 15 5
Organizar la información en una distribución de frecuencias. ¿Cuál es la variable de estudio?
5. Completar los datos que faltan en la siguiente distribución de frecuencias.
X f fr fa fra fc
1 4 8%
2 4
3 16 % 16
4 7 14 %
5 5 28
6 38
7 7 45
8
TOTALES N= 100%

Alumno: __________________________________ Grupo: ____________ Fecha: ____________


Entregar
Entregar la Actividad 4, por plataforma.
correo electrónico. Todas
(Todas las las imágenes
imágenes correspondientes
correspondientes a la actividad,
a la actividad 4, pégalaspégalas en un
en un archivo
archivo
de Worddey Word
súbelooapdf y enviarlo al
la plataforma delcorreo: facundo.rerjis.ce56@uemstis.sems.gob.mx . El nombre del archivo debe
Cetis 56).
tener el número de actividad seguido del nombre y apellido del alumno.
Sube sólo un archivo por tarea. No olvides poner dentro del archivo, nombre y grupo.
Envía sólo un archivo por actividad. No olvides poner dentro del archivo, nombre y grupo.

13
TABLA DE FRECUENCIAS AGRUPADAS
La organización va a depender del número de datos (observaciones) distintas que se tengan y de las veces que se
repitan cada una de ellas. En base a lo anterior, se pueden estructurar los datos de dos maneras diferentes:
1. Distribución de frecuencias.
Cuando se tiene un gran número de datos (observaciones), pero muy pocos distintos, se organizan en una
distribución de frecuencias, es decir, cada uno de los valores (datos) acompañado del número veces con el que
aparece. Este es el tipo de tabla que acompaña a una variable discreta.
2. Distribución de frecuencias de datos agrupados.
Cuando se dispone de un conjunto muy numeroso de datos es de gran utilidad distribuirlos en forma agrupada en
clases o intervalos y determinar el número de elementos pertenecientes a cada clase, para conjuntar los datos, se
organizan en grupos los valores de la muestra y a cada uno se le conoce como clase o intervalo. Para determinar el
número de intervalos no existe una regla general, pues depende de varios factores, como es el tamaño de la muestra,
la precisión, etc. Sin embargo, se considera que un número de clases óptimo no deberá ser menor de 5 ni mayor de
20, o bien utilizando la regla de Sturges.
Distribución de Frecuencias de datos agrupados, es una tabla en la cual se agrupan los valores posibles para una
variable y se registra el número de valores observado para cada clase o categoría. Este es el tipo de tabla que
acompaña a una variable continua.
Agrupar Datos es la forma de conjuntar los datos en clases o intervalos que posteriormente serán organizados en una
tabla de distribución de frecuencia.
PRIMERO. Para agrupar los datos, se debe considerar los siguientes conceptos:
Total de datos, es el número global de la muestra de
observaciones o tamaño de la muestra. Se denota con n.
Construyendo la agrupación de datos:
Rango es el intervalo donde se encuentra el total de
datos, se obtiene de la diferencia del dato mayor y el
menor. Clases Frecuencia
Dato
R = X máx − X mín mínimo
𝐿𝑖𝑛𝑓 − 𝐿𝑠𝑢𝑝 𝑓
Xmín ̶
donde: R  Rango
̶
Xmáx  Valor máximo de la muestra. Xmín +A
̶ Todas las
Xmín  Valor mínimo de la muestra. frecuencias
Número de clases, es la cantidad de agrupaciones de
𝑘 ̶ diferentes
̶ de cero
todos los datos del problema. Se utilizar la regla de
Sturges: ̶
𝑘 = 1 + 3.322 (𝑙𝑜𝑔 𝑛) ̶
donde: k  Número de intervalos.
n  Tamaño de la muestra. Incluye al
dato máximo
Amplitud de clase, es el número de datos incluidos en
n = Suma de
una clase o intervalo y se obtiene dividiendo el rango y el frecuencias
número de clases o intervalos.
𝑅
𝐴=
𝑘
donde: A  Amplitud de intervalos
R  Rango
k  Número de intervalos

14
SEGUNDO. Una vez agrupados los datos en clases, se continua con la presentación de información en una tabla de
distribución de frecuencias de datos agrupados (distribución de frecuencias agrupadas), para ello se consideran los
siguientes conceptos:
Frecuencia o frecuencia absoluta, es el número de datos que pertenecen a la misma clase o intervalo. La sumatoria
de las frecuencias es igual al número de datos (n). Se representa con f.
Frecuencia relativa, es la fracción o proporción de elementos que pertenecen a cada dato (observación). Se calcula
dividiendo la frecuencia absoluta entre el número de datos del estudio. Se representa con fr.
𝑓
𝑓𝑟 = (100 %)
𝑁
Frecuencia acumulada, es el acumulado o suma de las frecuencias absolutas, indica cuantos datos se van contando
hasta ese momento o cuántos datos se van reportando. Se representa con fa.
Frecuencia relativa acumulada, es la proporción de datos respecto al total que se han reportado hasta ese momento.
Es la suma de las frecuencias relativas, y se puede calcular también dividiendo la frecuencia acumulada entre el
número de datos del estudio. Se representa con fra.
𝑓𝑎
𝑓𝑟𝑎 = (100 %)
𝑁
Frecuencia complementaria, esta frecuencia se obtiene de la diferencia del total de datos y la frecuencia acumulada
de cada clase, se representa con fc.
𝑓𝑐 = 𝑁 − 𝑓𝑎
La Distribución de Frecuencias Agrupadas se elabora colocando en la primera columna las clases donde sus límites ya
están definidos, en la columna siguiente la frecuencia, en la que sigue la frecuencia relativa, posteriormente la
frecuencia acumulada, después frecuencia relativa acumulada, seguida de la frecuencia complementaria, fronteras y
marca de clase. Para obtener
Límites de clase, son los valores inferior y superior de una clase o intervalo. Se denotan con 𝐿𝑖𝑛𝑓 y 𝐿𝑠𝑢𝑝
Fronteras o Límites exactos, son aquellos que delimitan con precisión una clase. Se representan con 𝐵𝑖𝑛𝑓 y 𝐵𝑠𝑢𝑝
𝐿𝑖𝑛𝑓 (𝑐𝑙𝑎𝑠𝑒 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒)−𝐿𝑠𝑢𝑝 𝐿𝑖𝑛𝑓 (𝑐𝑙𝑎𝑠𝑒 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒)−𝐿𝑠𝑢𝑝
𝐵𝑖𝑛𝑓 = 𝐿𝑖𝑛𝑓 − 𝐵𝑠𝑢𝑝 = 𝐿𝑠𝑢𝑝 +
2 2

donde: Binf  Límite inferior exacto de clase o frontera inferior


Bsup  Límite superior exacto de clase o frontera superior
Linf  Límite inferior de clase
Lsup  Límite superior de clase
Marca de clase o punto medio, es el valor localizado a la mitad del intervalo o centro de la amplitud o ancho de clase.
𝐿𝑖𝑛𝑓 + 𝐿𝑠𝑢𝑝
𝑀𝑐 =
2
donde: Mc  Marca de clase
Linf  Límite inferior
Lsup  Límite superior
DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS
Clases Fronteras
𝐿𝑖𝑛𝑓 − 𝐿𝑠𝑢𝑝 𝑓 𝑓𝑟 𝑓𝑎 𝑓𝑟𝑎 𝑓𝑐 𝐵𝑖𝑛𝑓 − 𝐵𝑠𝑢𝑝 𝑀𝑐
̶ ̶
̶ ̶
̶ Usar
̶
Usar
𝑓 Usar 𝑓𝑐 = 𝑁 − 𝑓𝑎 𝐵𝑠𝑢𝑝 = 𝐿𝑠𝑢𝑝 + 0.5 𝑈𝑠𝑎𝑟
𝑓𝑟 = (100) 𝑓𝑎 𝐿𝑖𝑛𝑓 + 𝐿𝑠𝑢𝑝
𝑁 𝑓𝑟 = (100) 𝑀𝑐 =
𝑁 𝐵𝑖𝑛𝑓 = 𝐿𝑖𝑛𝑓 − 0.5 2
15
Ejemplo 1: Un grupo de investigadores pertenecientes a la secretaría de seguridad pública, tomó una muestra
aleatoria de las velocidades (km/h) registradas por 30 vehículos en el trayecto Hermosillo a Ures, con el fin
de establecer nuevos límites máximos de velocidad para una carretera. La muestra arrojo los datos
siguientes: 90, 99, 104, 99, 119, 98, 95, 112, 95, 120, 100, 90, 116, 96, 114, 108, 98, 118, 100, 106, 114,
100, 112, 106, 100, 115, 111, 105, 114, 97
Solución.
PRIMERO. Agrupar datos, para ello se requiere de:
Total de datos 𝑛 = 30 Número de clases 𝑘 = 1 + 3.322(log(30))
Dato máximo 𝑋𝑚á𝑥 = 120 = 1 + 3.322(1.4771)
Dato mínimo 𝑋𝑚í𝑛 = 90 = 1 + 4.907 = 5.907
Rango 𝑅 = 120 − 90 = 30 ≈6
30
Amplitud de clase 𝐴= =5
6
Construyendo las clases
1° clase: El límite inferior es el dato menor 𝐿𝑖𝑛𝑓 = 90, el límite superior es Clases
el límite inferior más la amplitud menos uno 𝐿𝑠𝑢𝑝 = 90 + 5 − 1 = 94. Conteo 𝑓
𝐿𝑖𝑛𝑓 − 𝐿𝑠𝑢𝑝
2° clase: El límite inferior es el dato menor más la amplitud 𝐿𝑖𝑛𝑓 = 90 + 90 ̶ 94 ll 2
5 = 95, el límite superior es el límite superior de la clase anterior más la 95 ̶ 99 lllll lll 8
amplitud 𝐿𝑠𝑢𝑝 = 94 + 5 = 99.
100 ̶ 104 lllll 5
3° clase: El límite inferior es el límite inferior de la clase anterior más la 105 ̶ 109 llll 4
amplitud 𝐿𝑖𝑛𝑓 = 95 + 5 = 100, el límite superior es el límite superior de
la clase anterior más la amplitud 𝐿𝑠𝑢𝑝 = 99 + 5 = 104. 110 ̶ 114 lllll l 6
115 ̶ 120 lllll 5
Se continua de la misma forma hasta completar las seis clases. Verificar
que las clases tienen el mismo tamaño y que la última clase contiene al 𝑛 = 30
dato máximo.
Para encontrar la frecuencia de cada clase, se coloca una columna provisional para conteo, en la cual pondrán
líneas verticales por cada dato que se contenga en la clase, posteriormente se suman las líneas verticales para
obtener la frecuencia. Se verifica sumando las frecuencias que deben coincidir con el total de datos.
SEGUNDO. Completando la tabla de frecuencias agrupadas, para ello se forman las siguientes columnas en tabla
anterior y aplicando la fórmula correspondiente a cada frecuencia, fronteras y marca de clase. Obteniendo
TABLA: DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS
Clases Fronteras
𝑓 𝑓𝑟 𝑓𝑎 𝑓𝑟𝑎 𝑓𝑐 𝑀𝑐
𝐿𝑖𝑛𝑓 − 𝐿𝑠𝑢𝑝 𝐵𝑖𝑛𝑓 − 𝐵𝑠𝑢𝑝
90 ̶ 94 2 7% 2 7% 28 89.5 ̶ 94.5 92
95 ̶ 99 8 26 % 10 33 % 20 94.5 ̶ 99.5 97
100 ̶ 104 5 17 % 15 50 % 15 99.5 ̶ 104.5 102
105 ̶ 109 4 13 % 19 63 % 11 104.5 ̶ 109.5 107
110 ̶ 114 6 20 % 25 83 % 5 109.5 ̶ 114.5 112
115 ̶ 120 5 17 % 30 100 % 0 114.5 ̶ 120.5 117
𝑛 = 30 100 %
Consultar: http://seactuario.com/ContMatematicas/EjercTablaFrecuenciasAgrup.htm

16
ACTIVIDAD 5
Objetivo: Organizar información en una tabla de frecuencias agrupas o distribución de frecuencias agrupadas, para
organizar y presentar de forma sencilla la información.
Desarrollo: Leer la Lección “Distribución de frecuencias agrupadas” y organiza la información de cada ejercicio
agrupando los datos y construyendo la tabla de distribución de frecuencias agrupadas.
1. El siguiente conjunto de datos nos representan los pesos en kilogramos de 40 pacientes sometidos a una
dieta.
49 50 53 54 60 67 69 71 50 50 52 54 55 59 64 69 68 69 70 70
49 51 56 57 60 68 69 72 50 51 51 55 58 58 64 68 63 73 73 72
Los datos se deberán organizarse en una distribución de frecuencias de datos agrupados.

2. Los siguientes datos corresponden a la cantidad de asientos vacíos que reportaron 56 autobuses foráneos en
un domingo. Organizar los datos en una tabla de distribución de frecuencias agrupadas.
12 11 4 6 6 11 3 10 12 6 6 4 4 3
10 1 1 2 4 5 2 4 4 8 9 8 4 7
8 7 8 4 10 4 2 6 2 5 10 9 6 7
9 9 13 13 12 8 1 12 1 7 14 7 6 5

3. Los goles que se han marcado en la última jornada de liga han sido en los siguientes minutos de juego:
20, 11, 89, 3, 20, 4, 2, 35, 50,29,59,30 ,90, 33, 78, 54, 21, 19, 60, 34, 56, 63, 45, 31, 26, 32, 5, 78, 88, 85, 34, 1.
Agrupa los datos en una tabla de distribución de frecuencias.

4. Un grupo de 60 niños, se ha medido el peso, en kilogramos, de cada uno de ellos, obteniendo los siguientes
resultados: 30, 32, 34, 31, 35, 35, 28, 37, 30, 28, 29, 25, 33, 32, 27, 34, 40, 32, 33, 35, 31, 32, 38, 29, 30, 31,
26, 39, 36, 31, 30, 32, 34, 31, 35, 35, 28, 37, 30, 28, 29, 25, 33, 32, 27, 34, 40, 32, 33, 35, 31, 32, 38, 29, 30, 31,
26, 39, 36, 31.
Organizar la información en una distribución de frecuencias de datos agrupados.

5. Las llamadas telefónicas de una empresa, un determinado día, han tenido la siguiente duración, en segundos:
120, 131, 142, 157, 15, 27, 94, 57, 62, 12, 49, 58, 149, 210, 120, 131, 97, 84, 61, 32, 15, 7, 21, 32, 237, 210, 48,
56, 138, 24, 64, 31, 23, 58, 69, 234, 13, 66, 54, 214, 156, 179, 231, 204, 147, 32, 15, 7, 64, 124, 56, 73, 114,
169, 201, 134, 62, 93, 42, 58.
Organizar la información en una distribución de frecuencias de datos agrupados.

Entregar la Actividad 5, por correo electrónico. Todas las imágenes correspondientes a la actividad, pégalas en un
archivo de Word o pdf y enviarlo al correo: facundo.rerjis.ce56@uemstis.sems.gob.mx . El nombre del archivo debe
tener el número de actividad seguido del nombre y apellido del alumno.

Envía sólo un archivo por actividad. No olvides poner dentro del archivo, nombre y grupo.

17
GRÁFICAS ESTADÍSTICAS
La organización de la información en tablas de distribución de frecuencias conlleva una presentación que es la tabla
terminada, la cual se puede presentar su información en forma gráficas, de está manera se puede obtener el
histograma, polígono de frecuencia, gráfica de ojivas y gráficas circulares.
Histograma.
Es una gráfica de barras verticales contiguas, donde la altura de la barra
representa la frecuencia y el ancho de cada barra es la amplitud de
clase.
Se construyen sobre el sistema de coordenadas cartesianas. Se utiliza
cuando la variable de estudio es continua (datos con punto decimal) o
esta agrupada en una tabla de distribución de frecuencia.
En el eje horizontal se identifican los valores de las fronteras de clase y Fronteras

en el eje vertical sé gráfica la frecuencia absoluta o frecuencia.


Polígono de frecuencia
Es una gráfica de líneas donde sus puntos principales están formado
por la marca de clase y la frecuencia. Polígono de Frecuencias

El polígono se puede trazar sobre el histograma, donde en el eje


vertical representa la frecuencia (altura de la barra) y en el eje
horizontal se identifican las marcas de clase (punto medio de cada
barra), formando puntos en lo alto de cada barra, los cuales se unen
por segmentos de recta. Para que el polígono quede cerrado se
considera un punto en la recta horizontal, antes y después de las
anotadas.
Gráficas de ojivas
Es una gráfica de líneas suavizadas (curva), donde sus principales puntos están formados por las fronteras y las
frecuencias acumuladas. Por esta razón la gráfica de ojivas es llamada
gráfica de frecuencias acumuladas.
Es un gráfico que se utiliza para el análisis y representación de variables
continuas, por sus características se construye uniendo con segmentos de
recta, de izquierda a derecha, la primera pareja está formada por el cero y
la frontera inferior de la primera clase, las siguientes parejas ordenadas se
forman, al considerar como abscisa las fronteras superiores de cada clase
(eje horizontal) y como ordenada las frecuencias acumuladas de cada clase
representado (eje vertical)
Gráfica circular
Gráfica formada por las frecuencias relativas. Para construirla se debe multiplicar el Frecuencias relativas
valor de la frecuencia relativa por 360°, para obtener el valor del ángulo central, el
cual nos señala la proporción de la frecuencia relativa en la gráfica.

18
Ejemplo 1: Un grupo de investigadores pertenecientes a la secretaría de seguridad pública, tomó una muestra
aleatoria de las velocidades (km/h) registradas por 30 vehículos en el trayecto Hermosillo a Ures, con el fin
de establecer nuevos límites máximos de velocidad para una carretera. La muestra arrojo los datos
siguientes: 90, 99, 104, 99, 119, 98, 95, 112, 95, 120, 100, 90, 116, 96, 114, 108, 98, 118, 100, 106, 114,
100, 112, 106, 100, 115, 111, 105, 114, 97.
Trazar el histograma, el polígono de frecuencias, la gráfica de ojivas y la gráfica de frecuencias relativas.
Solución.
Primero se organiza la información en una tabla de distribución de frecuencia agrupadas y con la información de
la tabla se construirán las diferentes presentaciones gráficas de la información (Gráficas estadísticas).
TABLA: DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS
Clases Fronteras
𝑓 𝑓𝑟 𝑓𝑎 𝑓𝑟𝑎 𝑓𝑐 𝑀𝑐
𝐿𝑖𝑛𝑓 − 𝐿𝑠𝑢𝑝 𝐵𝑖𝑛𝑓 − 𝐵𝑠𝑢𝑝
90 ̶ 94 2 7% 2 7% 28 89.5 ̶ 94.5 92
95 ̶ 99 8 26 % 10 33 % 20 94.5 ̶ 99.5 97
100 ̶ 104 5 17 % 15 50 % 15 99.5 ̶ 104.5 102
105 ̶ 109 4 13 % 19 63 % 11 104.5 ̶ 109.5 107
110 ̶ 114 6 20 % 25 83 % 5 109.5 ̶ 114.5 112
115 ̶ 120 5 17 % 30 100 % 0 114.5 ̶ 120.5 117
𝑛 = 30 100 %
Para construir el Histograma, se requiere la información de la columna de frecuencia (altura de las barras) eje
vertical y la columna de fronteras eje horizontal.
10
Fronteras
𝑓 𝑀𝑐 8
𝐵𝑖𝑛𝑓 − 𝐵𝑠𝑢𝑝
2 89.5 ̶ 94.5 92
Frecuencia

6
8 94.5 ̶ 99.5 97
4
5 99.5 ̶ 104.5 102
4 104.5 ̶ 109.5 107 2
6 109.5 ̶ 114.5 112
5 114.5 ̶ 120.5 117
89.5

94.5

99.5

104.5

109.5

114.5

120.5

𝑛 = 30
Fronteras
Para construir el polígono de frecuencias, se requiere de
la columna de frecuencias (altura de las barras) eje 1 POLÍGONO DE FRECUENCIA
vertical y de la columna de la marca de clase (punto 0
medio de cada barra) eje horizontal.
Frecuencia

8
Primero colocamos dos puntos sobre la recta horizontal,
uno antes de la primera barra y el otro después de la 6
última barra del histograma.
Se marcan los puntos en medio y en la parte más alta de 4
cada barra.
Posteriormente se unen todos los puntos con segmentos
87

92

97

10
2

10
7

11
2

de recta, obteniendo el polígono de frecuencia. Marca de

19
Para la gráfica de ojivas o gráfica de frecuencias acumuladas, se requiere de las columnas de frecuencia
acumulada y fronteras de la tabla de distribución de frecuencias agrupadas.
Para construirla se agrega un punto con frecuencia acumulada de cero y frontera superior de 89.5, es un punto
sobre el eje horizontal, posteriormente se ubican los demas puntos, por último se unen los puntos con
segmentos de recta, formando la gráfica de ojivas.

35
GRÁFICA DE OJIVAS
Fronteras

Frecuencia Acumulada
𝑓𝑎 30
𝐵𝑖𝑛𝑓 − 𝐵𝑠𝑢𝑝
0 ̶ 89.5 25

2 89.5 ̶ 94.5 20
15
10 94.5 ̶ 99.5
10
15 99.5 ̶ 104.5
5
19 104.5 ̶ 109.5
25 109.5 ̶ 114.5

89.5

94.5

99.5

104.5

109.5

114.5

120.5
30 114.5 ̶ 120.5
Fronteras

La gráfica de frecuencias relativas es una gráfica circular, para construirla sólo se requiere de la columna de
frecuencia relativa y determinar el ángulo para cada sector circulas que representa la frecuencia relativa.
Se traza la circunferencia y su segmento de recta (radio), a partir de este se marcan los ángulos con ayuda de un
transportador y por último se etiquetan con los valores de la frecuencia relativa.
GRÁFICA DE FRECUENCIAS RELATIVAS
𝑓𝑟 𝛼 = 360𝑓𝑟
7%
7% 360(0.07)=25° 17 %

26 % 360(0.26)=94°
26 %
17 % 360(0.17)=61°
13 % 360(0.13)=47° 20 %

20 % 360(0.20)=72°
13 % 17 %
17 % 360(0.17)=61°

ACTIVIDAD 6
1. En un centro escolar, se preguntó a un grupo de alumnos qué número de horas estudia semanalmente, y se
presentó la información en la siguiente tabla de distribución de frecuencias agrupadas. Trazar el histograma,
el polígono de frecuencias, la gráfica de ojivas y la gráfica de frecuencias relativas.
𝑓 𝑓𝑟 𝑓𝑎 𝑓𝑟𝑎 𝑓𝑐 Fronteras 𝑀𝑐
7 18 % 7 18 % 33 2 ̶ 7 4.5
8 20 % 15 38 % 25 7 ̶ 12 9.5
11 27 % 26 66 % 14 12 ̶ 17 14.5
10 25 % 36 91 % 4 17 ̶ 22 19.5
4 10 % 40 100 % 0 22 ̶ 27 24.5
𝑛 = 40 100 %

20
2. La siguiente tabla de distribución de frecuencias registra el peso de 40 estudiantes de una Universidad en
unidades de kg. Realizar el histograma, el polígono de frecuencias, la gráfica de ojivas y la gráfica de
frecuencias relativas.
Clases Frecuencia fr fa fra fc Fronteras Mc
58 – 62 3 8% 3 8% 37 57.5 – 62.5 60
63 – 67 5 13% 8 20% 32 62.5 – 67.5 65
68 – 72 10 25% 18 45% 22 67.5 – 72.5 70
73 – 77 12 30% 30 75% 10 72.5 – 77.5 75
78 – 82 8 20% 38 95% 2 77.5 – 82.5 80
83 – 87 2 5% 40 100% 0 82.5 – 87.5 85

3. La tabla reporta el costo de la electricidad para una muestra de 50 departamentos de dos recamaras en
Nuevo México, durante el mes de mayo del año pasado. Trazar el histograma, el polígono de frecuencias, la
gráfica de ojivas y la gráfica de frecuencias relativas.
Clases f fr fa fra fc Fronteras Mc
81 - 100 4 8% 4 8% 48 80.5 – 100.5 90.5
101 – 120 10 19% 14 27% 38 100.5 – 120.5 110.5
121 - 140 13 25% 27 52% 25 120.5 – 140.5 130.5
141 - 160 16 31% 43 83% 9 140.5 – 160.5 150.5
161 - 180 6 12% 49 94% 3 160.5 – 180.5 170.5
181 - 200 3 6% 52 100% 0 180.5 – 200.5 190.5

4. Los goles que se han marcado en la última jornada de liga han sido en los siguientes minutos de juego:
20, 11, 89, 3, 20, 4, 2, 35, 50,29,59,30 ,90, 33, 78, 54, 21, 19, 60, 34, 56, 63, 45, 31, 26, 32, 5, 78, 88, 85, 34, 1.
Agrupa los datos en una tabla de distribución de frecuencias y trazar el histograma, el polígono de
frecuencias, la gráfica de ojivas y la gráfica de frecuencias relativas.

Clases f

Entregar la Actividad 6, por correo electrónico. Todas las imágenes correspondientes a la actividad, pégalas en un
archivo de Word o pdf y enviarlo al correo: facundo.rerjis.ce56@uemstis.sems.gob.mx . El nombre del archivo debe
tener el número de actividad seguido del nombre y apellido del alumno.

Envía sólo un archivo por actividad. No olvides poner dentro del archivo, nombre y grupo.

21
MEDIDAS DE TENDENCIA CENTRAL (DATOS ENLISTADOS)
Cuando se tiene un grupo de observaciones, se desea describirlo a través de un sólo número. Para tal fin, no se usa el
valor más elevado ni el valor más pequeño como único representante, ya que sólo representan los extremos. Una de
las propiedades más sobresalientes de la distribución de datos es su tendencia a acumularse hacia el centro de la
distribución. Esta característica se denomina tendencia central.
Las medidas de tendencia central más usuales son: la media, la mediana y la moda.
Media
La media aritmética o simplemente media, que denotaremos por 𝑥̅ , es el número obtenido al dividir la suma de todos
los datos (valores de la variable) entre el total de datos (número de observaciones), y se define por la siguiente
expresión:
Sumatoria de datos
∑𝑥
Media 𝑥̅ =
𝑁
Total de datos
Mediana
La mediana es el punto central de una serie de datos ordenados de forma ascendente, que se denota por 𝑀𝑒 .
La mediana también es una medida de posición, por tal razón es importante ordenar los datos antes de determinas la
posición central de la mediana, para ello se utiliza la expresión:
Valor del dato en la posición indicada
Mediana 𝑀𝑒 = 𝑥 𝑁 1
[ + ]
2 2 Calculo para determinar la posición
Moda
La moda de un conjunto de datos numéricos es el valor que más se repite, es decir, el que tiene mayor frecuencia. La
moda puede ser no única e inclusive no existir; se denota con 𝑀𝑜.
La moda es una medida de tendencia central muy importante, porque permite planificar, organizar y producir para
satisfacer las necesidades de la mayoría.

Ejemplo 1
En un grupo de personas hemos preguntado por el número de días que realizan ejercicio a la semana. Las respuestas
han sido las siguientes: 4, 2, 3, 1, 3, 6, 2, 3, 3, 4, 7, 1, 5, 3, 2, 6, 3, 4, 3, y 6. Determinar las medidas de tendencia
central.
Solución.
Se ordenan los datos de menor a mayor.
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 N=20
x 1 1 2 2 2 3 3 3 3 3 3 3 4 4 4 5 6 6 6 7 ∑𝑥= 71
Media: Mediana:
∑ 𝑥 71 𝑀𝑒 = 𝑥 𝑁 1 = 𝑥 20 1 = 𝑥 21
𝑥̅ = = = 3.55 ≈ 4 [ + ]
2 2
[
2
+ ]
2
[
2
]
𝑁 20
3+3 6
= 𝑥[10.5] = = =3
2 2
Moda:
El dato que más se repite es el 3.
𝑀𝑜 = 3

22
Ejemplo 2
En un grupo de 15 alumnos, se les pide su edad, obteniendo los siguientes datos: 14, 15, 13, 15, 13, 12, 12, 12, 12, 13,
15, 16, 14, 16, 14. Calcular las medidas de tendencia central.
Solución
Se ordenan los datos de menor a mayor.
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 N=15
x 12 12 12 12 13 13 13 14 14 14 15 15 15 16 16 ∑𝑥= 206
Mediana: Moda:
Media:
∑ 𝑥 206 𝑀𝑒 = 𝑥 𝑁 1 = 𝑥 15 1 = 𝑥 16 El dato que más se repite es el 12.
[ + ] [ + ] [ ]
𝑥̅ = = = 13.73 ≈ 14 2 2 2 2 2
𝑁 15 𝑀𝑜 = 12
= 𝑥[8] = 14
Ejemplo 3
Los siguientes datos corresponden a la cantidad de asientos vacíos que reportaron 56 autobuses foráneos en un
domingo. Determinar la media, mediana y moda.
5 11 4 6 6 11 3 10 5 6 6 4 4 3
10 1 1 2 4 5 2 4 4 8 9 8 4 7
8 7 8 4 10 4 2 6 2 5 10 9 6 7
9 9 5 5 5 8 1 5 1 7 5 7 6 5
Solución
Cuando se tiene un número considerable de datos, se pueden ordenar los datos en una tabla con frecuencias:
POSICIÓN DATOS FRECUENCIA
fa x f xf
4 1 4 4
8 2 4 8
10 3 2 6
19 4 9 36
29 5 10 50
36 6 7 42
41 7 5 35
46 8 5 40
50 9 4 36
54 10 4 40
56 11 2 22
N=56 ∑ 𝑥𝑓 =319

Mediana: Moda:
Media:
∑ 𝑥𝑓 319 𝑀𝑒 = 𝑥 𝑁 1 = 𝑥 56 1 𝑀𝑜 = 5
[ + ] [ + ]
𝑥̅ = = 2 2 2 2
𝑁 56 Dato con mayor frecuencia.
= 𝑥 57
[ ]
= 5.696 2

≈6 = 𝑥[28.5]
=5

23
MEDIDAS DE DISPERSIÓN (DATOS ENLISTADOS)
La dispersión mide que tan alejados están un conjunto de valores respecto a su media. Así, cuanto menos disperso
sea el conjunto, más cerca del valor medio se encontrarán sus valores. Este aspecto es de vital importancia para el
estudio de investigaciones.
Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto
valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable.
Se trata de coeficientes para variables cuantitativas.
Las medidas de dispersión son: el rango, la desviación media, la varianza y la desviación estándar.
Rango
El rango de una distribución es la diferencia entre el valor máximo (𝑥𝑚á𝑥 ) y el valor mínimo (𝑥𝑚í𝑛 ) de la variable
estadística. Para su cálculo, basta con ordenar los valores de menor a mayor.
Dato máximo
Rango 𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛
Dato mínimo
Desviación Media
Este indicador muestra que tan disperso se encuentran un conjunto de datos a un punto de concentración.
La desviación media o desviación promedio es la división de la sumatoria del valor absoluto de las distancias
existentes entre cada dato y su media entre el número total de datos, su expresión matemática es:
Sumatoria del valor absoluto de
Desviación Media ∑|𝑥 − 𝑥̅ | las diferencias del dato y la media.
𝐷𝑚 =
𝑁
Total de datos.
Varianza
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media. Cuanto mayor sea la
varianza mayor dispersión existirá, por tanto, menor representatividad tendrá la media. La varianza se expresa en las
mismas unidades que la variable analizada, pero elevadas al cuadrado.
La varianza de un conjunto de datos se define como el cociente de la sumatoria de los cuadrados de las desviaciones
de los valores de la variable respecto a su media, entre el total de datos, y está dada por:

Varianza ∑|𝑥 − 𝑥̅ |2
𝑠2 =
𝑁
Total de datos.
Desviación Estándar
La desviación estándar o desviación típica es una medida estadística de la dispersión de un grupo o población. Una
gran desviación estándar indica que la población está muy dispersa respecto de la media. Una desviación estándar
pequeña indica que la población está muy compacta alrededor de la media.
La desviación estándar se define como la raíz cuadrada de la varianza, matemáticamente es:

Desviación Estándar ∑|𝑥 − 𝑥̅ |2 Raiz cuadrada de la varianza.


𝑠=√
𝑁

24
Ejemplo 1
En un grupo de personas hemos preguntado por el número de días que realizan ejercicio a la semana. Las respuestas
han sido las siguientes: 4, 2, 3, 1, 3, 6, 2, 3, 3, 4, 7, 1, 5, 3, 2, 6, 3, 4, 3, y 6. Determinar las medidas de dispersión.
Solución.
∑𝑥 71
Se ordenan los datos de menor a mayor, se calcula la media. 𝑥̅ = = = 3.55 ≈ 4
𝑁 20

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 N=20

x 1 1 2 2 2 3 3 3 3 3 3 3 4 4 4 5 6 6 6 7 ∑𝑥= 71

|𝑥 − 𝑥̅ | 3 3 2 2 2 1 1 1 1 1 1 1 0 0 0 1 2 2 2 3 ∑ = 29

|𝑥 − 𝑥̅ |2 9 9 4 4 4 1 1 1 1 1 1 1 0 0 0 1 4 4 4 9 ∑ = 59
Rango: Desviación Media: Varianza: Desviación estándar:
𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 ∑|𝑥 − 𝑥̅ | ∑|𝑥 − 𝑥̅ |2
𝐷𝑚 = 𝑠2 = ∑|𝑥 − 𝑥̅ |2
𝑅 =7−1 𝑁 𝑁 𝑠=√
29 𝑁
𝑅=6 𝐷𝑚 = 59
20 𝑠2 =
20 𝑠 = √2.95
𝐷𝑚 = 1.45 2
𝑠 = 2.95 𝑠 = 1.71

Ejemplo 2
En un grupo de 15 alumnos, se les pide su edad, obteniendo los siguientes datos: 14, 15, 13, 15, 13, 12, 12, 12, 12, 13,
15, 16, 14, 16, 14. Calcular las medidas de tendencia central.
Solución
∑𝑥 206
Se ordenan los datos de menor a mayor. 𝑥̅ = = = 13.73 ≈ 14
𝑁 15

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 N=15

x 12 12 12 12 13 13 13 14 14 14 15 15 15 16 16 ∑𝑥= 206

|𝑥 − 𝑥̅ | 2 2 2 2 1 1 1 0 0 0 1 1 1 2 2 ∑ = 18

|𝑥 − 𝑥̅ |2 4 4 4 4 1 1 1 0 0 0 1 1 1 4 4 ∑ = 30
Rango: Desviación Media: Varianza: Desviación estándar:
𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 ∑|𝑥 − 𝑥̅ | ∑|𝑥 − 𝑥̅ |2
𝐷𝑚 = 𝑠2 = ∑|𝑥 − 𝑥̅ |2
𝑅 = 16 − 12 𝑁 𝑁 𝑠=√
18 𝑁
𝑅=4 𝐷𝑚 = 30
15 𝑠2 =
15 𝑠 = √2
𝐷𝑚 = 1.45 𝑠 =22
𝑠 = 1.41

25
Ejemplo 3
Los siguientes datos corresponden a la cantidad de asientos vacíos que reportaron 56 autobuses foráneos en un
domingo. Determinar el rango, la desviación media, la varianza y la desviación estándar.
5 11 4 6 6 11 3 10 5 6 6 4 4 3 9 5 1 7 6
10 1 1 2 4 5 2 4 4 8 9 8 4 7 9 5 5 5 5
8 7 8 4 10 4 2 6 2 5 10 9 6 7 5 8 1 7
Solución
Cuando se tiene un número considerable de datos, se pueden ordenar los datos en una tabla con frecuencias:
DATOS FRECUENCIA
𝑥 𝑓 𝑥𝑓 |𝑥 − 𝑥̅ | 𝑓|𝑥 − 𝑥̅ | |𝑥 − 𝑥̅ |2 𝑓|𝑥 − 𝑥̅ |
1 4 4 5 20 25 100
2 4 8 4 16 16 64
3 2 6 3 6 9 18
4 9 36 2 18 4 36
5 10 50 1 10 1 10
6 7 42 0 0 0 0
7 5 35 1 5 1 5
8 5 40 2 10 4 20
9 4 36 3 12 9 36
10 4 40 4 16 16 64
11 2 22 5 10 25 50
N=56 ∑ 𝑥𝑓 =319 ∑ = 123 ∑ = 403

∑ 𝑥𝑓 319
La media: 𝑥̅ = = = 5.69 ≈ 6
𝑁 56

Rango: Desviación Media: Varianza: Desviación Estándar


𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 ∑|𝑥 − 𝑥̅ | ∑|𝑥 − 𝑥̅ |2
𝐷𝑚 = 𝑠2 = ∑|𝑥 − 𝑥̅ |2
𝑅 = 11 − 1 𝑁 𝑁 𝑠=√
𝑁
123 403
𝑅 = 10 𝐷𝑚 = 𝑠2 =
56 56 𝑠 = √7.2
𝐷𝑚 = 2.2 2
𝑠 = 7.2 𝑠 = 2.7

26
ACTIVIDAD 7
Objetivo: Determinar las medidas de tendencia central de datos enlistados (no agrupados).
Desarrollo: Leer la Lección “Medidas de tendencia central (datos enlistados)” y determinar la media, mediana y
moda, para datos enlistados o no agrupados, de cada uno de los ejercicios siguientes.

1. El número de mensajes recibidos por Gonzalo en su móvil durante una quincena ha sido:5, 3, 4, 2, 3, 6, 9, 4, 3,
6, 7, 5, 7, 3, 4. Determinar las medidas de tendencia central.

2. El número de intervenciones que ha realizado el servicio de bomberos a lo largo de un mes ha sido:2, 1, 5, 3,


4, 5, 1, 1, 2, 3, 4, 3, 4, 5, 2, 4, 3, 5, 6, 1, 2, 3, 4, 3, 2, 4, 1, 3, 4, 3. Determina el valor de la media, la mediana y la
moda.

3. Los siguientes son los números de torsiones que se requirieron para cortar 12 barras de aleación forjada: 33,
24, 39, 48, 26, 35, 38, 34, 23, 34, 29 y 27. Determine las medidas de tendencia central.

4. Los valores que se dan son pesos (en onzas) de carnes listadas en el menú de un restaurante como cortes
“Porterhouse de 20 onzas”: 17, 20, 21, 18, 20, 20, 20, 18, 19, 19, 20, 19, 21, 20, 18, 20, 20, 19, 18 y 19.
Determinar las medidas de tendencia central.

5. El número de consultas al dentista de un grupo de alumnos en el último año ha sido: 4, 4, 1, 2, 2, 1, 1, 2, 5, 5,


1, 2, 2, 1, 3, 4, 5, 2, 1, 1, 2, 3, 6, 4, 1, 2, 1, 3, 1, 3, 2, 1, 1, 1, 2, 3, 1, 2, 6, 1, 1, 2, 3, 4, 1, 2, 1, 3, 0, 1. Calcular la
media, mediana y moda.

Entregar la Actividad 7, por correo electrónico. Todas las imágenes correspondientes a la actividad, pégalas en un
archivo de Word o pdf y enviarlo al correo: facundo.rerjis.ce56@uemstis.sems.gob.mx . El nombre del archivo debe
tener el número de actividad seguido del nombre y apellido del alumno.

Envía sólo un archivo por actividad. No olvides poner dentro del archivo, nombre y grupo.

ACTIVIDAD 8
Objetivo: Determinar las medidas de dispersión para datos enlistados (no agrupados).
Desarrollo: Leer la Lección “Medidas de dispersión (datos enlistados)” y determinar el rango, la desviación media, la
varianza y la desviación estándar, para datos enlistados o no agrupados, de cada uno de los ejercicios
anteriores.

Entregar la Actividad 8, por correo electrónico. Todas las imágenes correspondientes a la actividad, pégalas en un
archivo de Word o pdf y enviarlo al correo: facundo.rerjis.ce56@uemstis.sems.gob.mx . El nombre del archivo debe
tener el número de actividad seguido del nombre y apellido del alumno.

Envía sólo un archivo por actividad. No olvides poner dentro del archivo, nombre y grupo.

27
MEDIDAS DE TENDENCIA CENTRAL (DATOS AGRUPADOS)
Cuando se tiene un grupo de observaciones, se desea describirlo a través de un sólo número. Para tal fin, no se usa el
valor más elevado ni el valor más pequeño como único representante, ya que sólo representan los extremos. Una de
las propiedades más sobresalientes de la distribución de datos es su tendencia a acumularse hacia el centro de la
distribución. Esta característica se denomina tendencia central.
Para determinar las medidas de tendencia central para datos agrupados, debemos considerar que la tabla de
distribución de frecuencias nos provee de datos necesarios para ser sustituidos en las fórmulas correspondientes.
Media
La media, que denotaremos por 𝜇, es el valor obtenido al dividir la suma de todos los productos de la frecuencia por
la marca de clase entre el total de datos, su expresión matemática es:

Sumatoria de los productos de la


∑ 𝑓 𝑀𝑐
𝜇= frecuencia por la marca de clase.
Media 𝑛
Total de datos

Mediana
La mediana, se denota por 𝑀𝑒, para obtener su valor, primero se debe de identificar la clase donde se encuentra la
mediana, para ello se necesita la frecuencia acumulada, posteriormente se utiliza la siguiente expresión matemática
con los datos del renglón que contiene a la mediana (clase de la mediana).

Total de datos entre dos

Mediana
𝑛 Frecuencia acumulada, valor
− 𝑓𝑎(𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟) anterior a la clase de la mediana
𝑀𝑒 = 𝐿𝑖𝑛𝑓 + (2 )𝐴
𝑓
Amplitud de clase
Límite inferior de la
clase de la mediana

Moda
Frecuencia correspondiente a la clase de la mediana
La moda se denota con 𝑀𝑜, para obtener su valor, se debe de identificar la clase con mayor frecuencia (clase modal),
posteriormente se aplica la siguiente expresión matemática, utilizando los datos de la clase modal.

Diferencia entre la frecuencia de la clase


Moda modal y la frecuencia de la clase anterior.

𝑑𝑎
𝑀𝑜 = 𝐿𝑖𝑛𝑓 + ( )𝐴
𝑑𝑎 + 𝑑𝑝 Amplitud de clase
Límite inferior de la
clase modal.
Diferencia entre la frecuencia de la clase
modal y la frecuencia de la clase posterior.

28
Ejemplo 1:
En un grupo de personas hemos preguntado por el número de días que realizan ejercicio en una quincena. Las
respuestas se presentan en una tabla de distribución de frecuencias. Determinar las medidas de tendencia central.
No. Días Personas
1–3 6
4–6 9
7–9 10
10 – 12 4
13 – 15 1

Primero se identifican las columnas de la tabla, el dato mínimo, el dato máximo, la amplitud de clase y total de datos.

No. Días Personas


Amplitud de clase 𝑀𝑐 𝑓 𝑀𝑐 𝑓𝑎
Clases frecuencia Producto marca de
𝐴=4−1 clase y frecuencia
=3 1–3 6 2 12 6
Clase de la Mediana
4–6 9 5 45 15 𝑛 30
Diferencia de frecuencias = = 15
2 2
𝑑𝑎 = 10 − 9 = 1 7–9 10 8 80 25

10 – 12 4 11 44 29
Diferencia de frecuencias
𝑑𝑝 = 10 − 4 = 6 13 – 15 1 14 14 30

𝑛 = 30 ∑ 𝑓𝑀𝑐 = 195
Sumatoria de todos
los productos.
Total de datos
Clase Modal
Mayor frecuencia
Media.
Para calcular la media, anexamos dos columnas a la tabla, una para la marca de clase y la otra para el producto de la
marca de clase con la frecuencia. Sustituyendo en la fórmula se tiene:
∑ 𝑓 𝑀𝑐 195
𝜇= = = 6.5 ≈ 7
𝑛 30
Mediana.
Para determinar la mediana, se agrega otra columna a la tabla para la frecuencia acumulada la cual nos ayuda a
ubicar la clase de la mediana, la cual se obtiene dividiendo el total de datos entre dos y el resultado se busca en la
frecuencia acumulada. Sustituyendo en la fórmula los datos de la clase de la media, se tiene:
𝑛 30
− 𝑓𝑎(𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟) −6 15 − 6 9
𝑀𝑒 = 𝐿𝑖𝑛𝑓 + ( 2 )𝐴 = 4 + ( 2 ) (3) = 4 + ( ) (3) = 4 + ( ) (3) = 4 + 3 = 12
𝑓 9 9 9

Moda.
Para calcular la moda, se identifica a la clase o renglón con mayor frecuencia (clase modal) y con los datos de la clase
modal se sustituyen en la fórmula, obteniendo:
𝑑𝑎 1 3
𝑀𝑜 = 𝐿𝑖𝑛𝑓 + ( )𝐴 = 7 + ( ) (3) = 7 + = 7 + 0.43 = 7.43 ≈ 7
𝑑𝑎 + 𝑑𝑝 1+6 7

29
MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS
La dispersión mide que tan alejados están un conjunto de valores respecto a su media. Así, cuanto menos disperso
sea el conjunto, más cerca del valor medio se encontrarán sus valores. Este aspecto es de vital importancia para el
estudio de investigaciones.
Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto
valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable.
Se trata de coeficientes para variables cuantitativas.
Las medidas de dispersión para datos agrupados se determinan a través de la identificación de datos en la tabla de
distribución de frecuencias.
Rango
El rango de una distribución es la diferencia entre el valor máximo (𝑥𝑚á𝑥 ) y el valor mínimo (𝑥𝑚í𝑛 ) de la variable
estadística. Para su cálculo, el dato mínimo es el límite inferior de la primera clase y el dato máximo es al límite
superior de la última clase.
Dato máximo: 𝑥𝑚á𝑥 = 𝐿𝑠𝑢𝑝 ú𝑙𝑡𝑖𝑚𝑎 𝑐𝑙𝑎𝑠𝑒
Rango
𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛
Dato mínimo: 𝑥𝑚í𝑛 = 𝐿𝑖𝑛𝑓 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑐𝑙𝑎𝑠𝑒

Desviación Media
La desviación media es el cociente de la sumatoria de los productos de la frecuencia por el valor absoluto de la
diferencia de la marca de clase y la media, entre el número total de datos, su expresión matemática es:
Desviación Media Sumatoria de los productos de la
∑ 𝑓 |𝑀𝑐 − 𝜇| frecuencia por el valor absoluto.
𝐷𝑚 =
𝑛
Total de datos.

Varianza
Valor absoluto de las diferencias
La varianza es el cociente de la sumatoria de los productos de la frecuencia por el cuadrado de de
de la marca la clase
diferencia de la
y la media.
marca de clase y la media, entre el total de datos menos uno, y está dada por:
Sumatoria de los productos de la frecuencia
Varianza
∑ 𝑓 |𝑀𝑐 − 𝜇|2 por el cuadrado del valor absoluto.
𝜎2 =
Total de datos menos uno.
𝑛−1
Cuadrado del valor absoluto de las
diferencias de la marca de clase y la media.

Desviación Estándar
La desviación estándar es la raíz cuadrada de la varianza, matemáticamente:

Desviación Estándar ∑ 𝑓 |𝑥 − 𝑥̅ |2
𝜎=√ Raíz cuadrada de la varianza.
𝑛−1

30
Ejemplo 1: En un grupo de personas hemos preguntado por el número de días que realizan No. Días Personas
ejercicio en una quincena. Las respuestas se presentan en una tabla de distribución de
1–3 6
frecuencias. Determinar las medidas de dispersión.
4–6 9
7–9 10
10 – 12 4
13 – 15 1

Primero se identifican las columnas de la tabla, el dato mínimo, el dato máximo, la amplitud de clase y total de datos.

Frecuencia por valor absoluto al cuadrado


𝑥𝑚í𝑛 = 1 Frecuencia por valor absoluto

No. Días Personas


Clases frecuencia 𝑀𝑐 𝑓 𝑀𝑐 |𝑀𝑐 − 𝜇| 𝑓 |𝑀𝑐 − 𝜇| |𝑀𝑐 − 𝜇|2 𝑓 |𝑀𝑐 − 𝜇|2

1–3 6 2 12 5 30 25 150

4–6 9 5 45 2 18 4 36

7–9 10 8 80 1 10 1 10

10 – 12 4 11 44 4 16 16 64

13 – 15 1 14 14 7 7 49 49
𝑥𝑚á𝑥 = 15
𝑛 = 30 ∑ 𝑓𝑀𝑐 = 195 ∑ = 81 ∑ = 309
Marca de clase menos media
Total de datos
∑ 𝑓 𝑀𝑐 195
Media: 𝜇= = = 6.5 ≈ 7
𝑛 30
Rango.
Para calcular el rango, se toma como dato mínimo al límite inferior de la primera clase y como dato máximo al límite
superior de la última clase. Sustituyendo en la fórmula se tiene:
𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 = 15 − 1 = 14
Desviación Media.
Para determinar la desviación media, se requiere del valor de la media, (Ver lección anterior) y se anexan dos
columnas a la tabla, una para los valores obtenidos del valor absoluto de la diferencia de la marca de clase y la media
y la otra columna para los valores del producto de la frecuencia por el valor absoluto de la diferencia. Sustituyendo en
fórmula:
∑ 𝑓 |𝑀𝑐 − 𝜇| 81
𝐷𝑚 = = = 2.7
𝑛 30
Varianza.
Para calcular la varianza, se anexan dos columnas más a la tabla, una para los valores del cuadrado de la diferencia
de la marca de clase y la media, y la otra para el producto de la frecuencia por el cuadrado de la diferencia.
sustituyendo en la fórmula se obtiene:
2
∑ 𝑓 |𝑀𝑐 − 𝜇|2 309
𝜎 = = = 10.66
𝑛−1 29
Desviación Estándar.
La desviación estándar es la raíz cuadrada de la varianza, por tanto:
∑ 𝑓 |𝑀𝑐 − 𝜇|2
𝜎=√ = √10.66 = 3.26
𝑛−1

31
ACTIVIDAD 9
Objetivo: Determinar las medidas de tendencia central de datos agrupados.
Desarrollo: Leer la Lección “Medidas de tendencia central (datos agrupados)” y determinar la media, mediana y
moda, para datos agrupados, de cada uno de los ejercicios siguientes.

1. Se aplica una prueba de 90 preguntas a 100 alumnos de primaria, y se obtienen los siguientes resultados
expresados en una tabla de distribución de frecuencias. Calcular las medidas de dispersión.

Aciertos Alumnos
09 – 29 25
30 – 50 30
51 – 71 35
72 – 92 10

2. Una empresa entrevisto a todos sus empleados para determinar qué tan lejos vivían de las oficinas de la
compañía. Los resultados se presentan en la siguiente tabla. Determina las medidas de dispersión.
Distancia Empleados
1–5 4
6 – 10 15
11 – 15 27
16 – 20 18
21 – 25 6

3. La siguiente tabla de distribución de frecuencias registra el peso de 40 estudiantes de una Universidad en


unidades de kg. Determina las medidas de dispersión.
Peso Alumnos
58 – 62 3
63 – 67 5
68 – 72 10
73 – 77 12
78 – 82 8
83 – 87 2

32
4. La tabla reporta el costo de la electricidad para una muestra de 52 departamentos de dos recamaras en
Nuevo México, durante el mes de mayo del año pasado. Calcula las medidas de dispersión.
Costo Departamentos
81 - 100 4
101 – 120 10
121 - 140 13
141 - 160 16
161 - 180 6
181 - 200 3
2

5. En una clase de educación física se ha cronometrado el tiempo, en segundos, que tarda cada alumno en
recorrer una distancia fija. Los datos obtenidos se presentan en la siguiente tabla de distribución de
frecuencias. Determinar las medidas de dispersión.
Tiempo Alumnos
8–9 13
10 – 11 8
12 – 13 5
14 – 15 4

Entregar la Actividad 9, por correo electrónico. Todas las imágenes correspondientes a la actividad, pégalas en un
archivo de Word o pdf y enviarlo al correo: facundo.rerjis.ce56@uemstis.sems.gob.mx . El nombre del archivo debe
tener el número de actividad seguido del nombre y apellido del alumno.

Envía sólo un archivo por actividad. No olvides poner dentro del archivo, nombre y grupo.

ACTIVIDAD 10
Objetivo: Determinar las medidas de dispersión de datos agrupados.
Desarrollo: Leer la Lección “Medidas de dispersión (datos agrupados)” y determinar el rango, la desviación media, la
varianza y la desviación estándar, para datos agrupados, de cada uno de los ejercicios anteriores.

Entregar la Actividad 10, por correo electrónico. Todas las imágenes correspondientes a la actividad, pégalas en un
archivo de Word o pdf y enviarlo al correo: facundo.rerjis.ce56@uemstis.sems.gob.mx . El nombre del archivo debe
tener el número de actividad seguido del nombre y apellido del alumno.

Envía sólo un archivo por actividad. No olvides poner dentro del archivo, nombre y grupo.

33
ENTREGA DE LA GUÍA
Instrucciones:
➢ Se deben de entregar todas las Actividades, resueltas en forma correcta con limpieza y claridad.
(utilizar bolígrafo).
➢ Las respuestas de las actividades se pueden realizar en hojas cuadriculadas o blancas de tamaño
carta, especificando número de actividad y número de reactivo.
➢ Todas las hojas empleadas para resolver los ejercicios de cada actividad, debe tener el nombre
completo del alumno, grupo y fecha.
➢ Se captura la imagen de las hojas con respuestas (fotografías) con la mayor claridad posible (debe
salir el nombre del alumno), se ordenan las imágenes en Word y se guarda como archivo pdf.
➢ Cada actividad contestada debe estar sólo en un archivo, es decir, un archivo por actividad.
➢ El nombre del archivo debe contener número de actividad, nombre y apellido del alumno.
➢ Los archivos pdf, se envían al correo facundo.rerjis.ce56@uemstis.sems.gob.mx sin olvidar poner en
el asunto Cetis56_Probabilidad y Estadística.

34

También podría gustarte