Estadistica Inferencial

COLEGIO DE BACHILLERES
SECRETARÍA ACADÉMICA
COORDINACIÓN DE ADMINISTRACIÓN
ESCOLAR Y DEL SISTEMA ABIERTO
COMPENDIO FASCICULAR
ESTADÍSTICA DESCRIPTIVA
E INFERENCIAL I
FASCÍCULO 1. ANTECEDENTES HISTÓRICOS, FUNCIONES Y
APLICACIONES DE LA ESTADÍSTICA
FASCÍCULO 2. MEDIDAS DESCRIPTIVAS
FASCÍCULO 3. CORRELACIÓN Y REGRESIÓN LINEALES
FASCÍCULO 4. INTRODUCCIÓN A LA PROBABILIDAD

DIRECTORIO
Roberto Castañón Romo

Director General
Luis Miguel Samperio Sánchez

Secretario Académico
Héctor Robledo Galván

Coordinador de Administración
Escolar y del Sistema Abierto
Jorge González Teyssier

Director General
Javier Guillén Anguiano

Coordinador de Administración
Escolar y del Sistema Abierto
el Sistema Abiert
Derechos reservados conforme a la Ley

© 2004, COLEGIO DE BACHILLERES
Prolongación Rancho Vista Hermosa núm. 105
Col. Ex Hacienda Coapa
Delegación Coyoacán, CP 04920, México, D.F.
ISBN 970 632 245-0

PRESENTACIÓN GENERAL
El Colegio de Bachilleres, en respuesta a la inquietud de los estudiantes de contar con

materiales impresos que faciliten y promuevan el aprendizaje de los diversos campos
del saber, ofrece a través del Sistema de Enseñanza Abierta y a Distancia este
compendio fascicular, resultado de la participación activa, responsable y comprometida
del personal académico, que a partir del análisis conceptual, didáctico y editorial
aportaron sus valiosas sugerencias para su enriquecimiento, y aunarse a la propuesta
educativa de la institución.
Este compendio fascicular es producto de un primer esfuerzo académico del Colegio

por ofrecer a todos sus estudiantes un material de calidad que apoye su proceso de
enseñanza-aprendizaje, conformado por fascículos.
Por lo tanto, se invita a la comunidad educativa del Sistema de Enseñanza Abierta y a

Distancia a compartir este esfuerzo y utilizar el presente material para mejorar su
desempeño académico.
DIRECCIÓN GENERAL
PRESENTACIÓN DEL COMPENDIO FASCICULAR
Estudiante del Colegio de Bachilleres, te presentamos este compendio fascicular que te

servirá de base en el estudio de la asignatura “Estadística Descriptiva e Inferencial I” y
funcionará como guía en tu proceso de enseñanza-aprendizaje.
Este compendio fascicular tiene la característica particular de presentarte la información

de manera accesible, propiciando nuevos conocimientos, habilidades y actitudes que te
permitirán el acceso a la actividad académica, laboral y social.
Cuenta con una presentación editorial integrada por fascículos, capítulos y temas que a
partir del estudio de la Estadística, el manejo y análisis de datos para la obtención de
conclusiones para que desarrolles habilidades de análisis y sistematización, tanto a
nivel conceptual como operativo, harán posible que puedas interpretar y explicar la
realidad, y así comprendas la utilidad de la Estadística en el estudio de diversos
problemas.
E INFERENCIAL I
FASCÍCULO 1. ANTECEDENTES HISTÓRICOS,

FUNCIONES Y APLICACIONES
DE LA ESTADÍSTICA
Autores: Hugo García Mancilla

Juan Matus Parra
1
2
ÍNDICE
INTRODUCCIÓN 5
CAPÍTULO 1. ANTECEDENTES HISTÓRICOS,

FUNCIONES Y CLASIFICACIÓN DE
LA ESTADÍSTICA 7
PROPÓSITO 9
1.1 ANTECEDENTES HISTÓRICOS DE LA

ESTADÍSTICA Y SUS FUNCIONES 11
1.1.1 BOSQUEJO HISTÓRICO 11
1.1.2 FUNCIONES DE LA ESTADÍSTICA 18
1.1.3 APLICACIONES 22
1.1.4 CONCEPTOS PRELIMINARES 24
1.1.5 CLASIFICACIÓN DE LA ESTADÍSTICA 29
1.1.6 ESTADÍSTICA DESCRIPTIVA 30
1.1.7 ESTADÍSTICA INFERENCIAL 31
RECAPITULACIÓN 32
ACTIVIDADES INTEGRALES 33
AUTOEVALUACIÓN 34
3
CAPÍTULO 2. CONCEPTOS BÁSICOS PARA EL
ESTUDIO DE LA ESTADÍSTICA 35
PROPÓSITO
.
37
2.1 PRESENTACIÓN DE DATOS 47
2.1.1 DISTRIBUCIÓN DE FRECUENCIAS 47
2.1.2 DISTRIBUCIÓN DE FRECUENCIAS

ABSOLUTAS Y RELATIVAS 49
ACUMULADAS 62
2.2 GRÁFICAS 66
2.2.1 HISTOGRAMA Y POLÍGONO DE

FRECUENCIAS 66
2.2.2 POLÍGONO DE FRECUENCIAS 70
2.2.3 POLÍGONO DE FRECUENCIA

ACUMULADA 72
2.2.4 GRÁFICAS CIRCULARES, DIAGRAMAS 74

DE BARRAS, PICTOGRAMAS Y GRÁFICO
DE LÍNEAS.
RECAPITULACIÓN 85
ACTIVIDADES INTEGRALES 86
AUTOEVALUACIÓN 87
RECAPITULACIÓN GENERAL 90
ACTIVIDADES DE CONSOLIDACIÓN 91
AUTOEVALUACIÓN 94
ACTIVIDADES DE GENERALIZACIÓN 103
BIBLIOGRAFÍA CONSULTADA 104
4
INTRODUCCIÓN
La estadística es una de las herramientas más ampliamente utilizadas en la investigación

científica.
Su aplicación en instituciones gubernamentales y educativas, en los negocios y en la

industria, en la banca y en otros quehaceres diarios hacen de la estadística una
herramienta indispensable.
Sin embargo el término “Estadística” tiene varios significados para diferentes personas;
para la gente común y corriente la estadística solamente significa números. En el
periódico de la mañana se pueden encontrar la estadística más reciente sobre los delitos
de la ciudad; de asesinatos, de robos de automóviles; de asaltos y demás delitos que
hayan sido denunciados en determinado periodo de tiempo; de los nacimientos y
muertes que han ocurrido, o en relación con el deporte, el número de partidos ganados y
perdidos por equipos integrantes de la liga de ese deporte.
Para otras personas es un método para obtener, presentar y escribir grandes cantidades
de datos, y para otras es un método para tomar decisiones en situaciones difíciles.
El objetivo básico de este fascículo es aclarar los significados de Estadística, definir sus
conceptos básicos utilizados con frecuencia y analizar los usos y abusos de los métodos
estadísticos.
Aunque los significados sean diferentes, todos ellos forman parte del concepto total de
“Estadística”. La palabra tiene su sentido más amplio para aquellas personas cuyo
trabajo requiere un conocimiento de los aspectos más técnicos de la estadística. Para
estas personas, la palabra tiene relación con aquellos conceptos y técnicas que se
utilizan en la recopilación, organización, resumen, análisis, interpretación y comunicación
de información numérica.
Estos conceptos y técnicas juegan un papel importante en las actividades que realizan
los profesionales de todas las ciencias.
5
6
CAPÍTULO 1
ANTECEDENTES HISTÓRICOS, FUNCIONES

Y CLASIFICACIÓN DE LA ESTADÍSTICA
1.1 ANTECEDENTES HISTÓRICOS DE LA ESTADÍSTICA Y SUS

FUNCIONES
1.1.1 Bosquejo Histórico

1.1.2 Funciones de la Estadística
1.1.3 Aplicaciones
1.1.4 Conceptos Preliminares
1.1.5 Clasificación de la Estadística
1.1.6 Estadística Descriptiva
1.1.7 Estadística Inferencial
7
8
PROPÓSITO
La estadística es una rama de las matemáticas aplicadas que surgió por la necesidad
concreta que el hombre tiene de conocer la resolución de problemas relacionados con la
recolección, procesamiento, análisis e interpretación de datos numéricos cuyo
conocimiento le permitirá tomar decisiones acertadas.
¿QUÉ APRENDERÁS?
Para el conocimiento de la realidad concreta que al hombre le interesa,

considera tres etapas fundamentales que son:
 Planear la búsqueda y la obtención de la información.

 Sistematizar y organizar la información de tal forma que se pueda
describir y analizar con facilidad.
 Efectuar inferencias sobre la realidad a partir de la información
obtenida, haciendo estimaciones o verificando hipótesis.
¿CÓMO LO LOGRARÁS?
Por interpretación de la información permite obtener conclusiones que

enriquecen nuestro conocimiento de la realidad y nuestra capacidad
para transformarla.
¿PARA QUÉ TE VA A SERVIR?
Para proporcionarte los conocimientos necesarios para llevar a la

práctica las etapas que te permitirán la resolución de cualquier
problema estadístico.
9
10
CAPÍTULO 1
ANTECEDENTES HISTÓRICOS FUNCIONES Y
CLASIFICACIÓN DE LA ESTADÍSTICA
1.1 ANTECEDENTES HISTÓRICOS DE LA ESTADÍSTICA Y SUS

FUNCIONES
Al igual que ha ocurrido con otras muchas disciplinas, a lo largo del tiempo se ha
pensado que la estadística es un procedimiento extraordinariamente complicado.
Cuando leemos artículos en los que aparecen resultados estadísticos nos queda la
impresión de que lo dicho en ellos es una verdad absoluta e incontrovertible que está
apoyada por todo un aparato matemático. Esto no es forzosamente cierto, se puede
adquirir con relativa facilidad un conocimiento básico de la estadística.
1.1.1 BOSQUEJO HISTÓRICO
Iniciaremos el estudio de la estadística con algunos antecedentes históricos, que nos

mostraran sus aplicaciones, por una parte y por otra, su naturalidad en situaciones de la
vida real.
La estadística fue fundada por el londinense John Graunt, “un mercader de mercería”, en
un pequeño libro “Natural and Political Observations made upon the Bells of Mortality”.
Este libro fue el primer intento para interpretar fenómenos biológicos de masa y de la
conducta social: a partir de datos numéricos escribir las cifras brutas de nacimientos y
defunciones en Londres, de 1604 a 1661. El opúsculo de Graunt apareció en 1662.
Treinta años más tarde, la Royal Society publicó en su “Philosophical Transactions” un
artículo sobre tasas de mortalidad escrito por el eminente astrónomo Edmund Halley.
Ambas publicaciones constituyen la base de todo trabajo posterior sobre esperanza de
vida, indispensable para la solvencia de las compañías de seguros de vida.
11
John Graunt nació en 1620 en Berchin Lane, Londres, bajo el signo de las siete
estrellas, donde su padre tenía una tienda y el hogar. Aprendió pronto el oficio de
vendedor de mercería y prosperó en el negocio. El éxito le dio la posibilidad de
dedicarse a ocupaciones más amplias que las de la venta de artículos de mercería.
Aubrey lo describe como “una persona muy ingeniosa y estudiosa... se levantaba muy
temprano para sus estudios antes de abrir la tienda”. Se hizo amigo de Sir William Petty,
más tarde autor de un conocidísimo libro sobre la nueva ciencia de la aritmética política,
y probablemente discutió con él las ideas expresadas en sus “Obervations”.
Las tablas de mortalidad, que atrajeron la atención de Graunt, eran publicadas

semanalmente por la compañía de Sacristanes parroquiales y contenían el número de
muertes acaecidas en cada parroquia, sus causas y también un “Recuento de todos los
entierros y bautizos habidos en la semana” en las cuales anotaban el número de
nacimientos de acuerdo a los que acudían al bautismo y lo mismo sucedía cuando
presentaban sus defunciones (en las parroquias se llevaba el control).
Un ejemplo de las observaciones hechas por Graunt en 1632 fueron las siguientes:
Varones 4,994
Bautizados Hembras 4,590
Total 9,584
Varones 4,932
Enterrados Hembras 4,603
Total 9,535
Con estos datos deducía las siguientes observaciones:
a) Hay más varones que hembras

b) Pocos murieron de hambre
c) Hay pocos asesinatos
d) Los lunáticos son pocos
Las “Observations” impresionaron tan favorablemente a Carlos II, que este propuso
especialmente a Graunt como socio fundador de la recientemente constituida Royal
Society. Para prevenir cualquier posible objeción al hecho de que Graunt era tendero,
“su majestad dio este encargo particular a su Sociedad, de que si encontraban algún
comerciante más de su estilo, lo admitiesen sin más ceremonia”. Graunt fue elegido
socio fundador de la Royal Society en 1662.
El mérito de las “Observations” fue inmediatamente reconocido, y fomentó el estudio de

las estadísticas de vida en el continente. El libro alcanzó varias ediciones. La quinta,
publicada tras la muerte de Graunt fue ampliada por Petty. Los historiadores han
discutido largo tiempo la contribución de Petty al trabajo original. Aubrey que era
malicioso, sólo dice que Graunt fue “inspirado” por Petty, pero implica mucho más.
Parece indudable que el libro es una obra conjunta.
12
Desde luego, Graunt escribió la mayor parte, incluidas las aportaciones científicas más
valiosas. Petty añadió lo que Thomas Browne llamaría “Elegancia”, y así aumentó la
popularidad del libro. Sir William Petty era un hombre presuntuoso y algo engreído,
incapaz de decidir si patrocinar a Graunt o acreditar su trabajo. No hay pruebas de que
alguna vez hubiese entendido la importancia y originalidad de lo que había hecho su
amigo.
Graunt fue miembro del consejo común de la ciudad y desempeñó otros cargos, pero al
convertirse al catolicismo dejó el comercio y cualquier otra obra pública. Graunt tenía
cabeza y talento para el trabajo, y era jocoso y fecundo en su conversación.
Graunt murió de ictericia la víspera de Pascua en 1674 y fue enterrado en la iglesia de

St. Dunston.
John Arbuthnot 1
En los trabajos de Graunt y Halley se basó John Arbuthnot en 1670 para probar la
existencia de Dios. Su argumento dice:
No es posible la suposición de que el sexo está distribuido entre la descendencia

humana en una forma puramente casual; debe intervenir una providencia divina que
controla las proporciones de los sexos.
La demostración de Arbuthnot es el primer ejemplo conocido de inferencia estadística.
Anchenwall un economista, acuñó en 1760 la palabra estadística, que deriva del

término italiano statista. La raíz de la palabra procede del latín status que significa
estado o situación.
1
www_history.mcs.st-andrews.ac.uk/history/pictDisplay/Arbuthnot.html
13
La Ley de los Grandes Números
En el famoso libro de Jacob Bernoulli, Aos Conjectandi, aparece un teorema de

importancia cardinal para la Teoría de Probabilidades, comúnmente llamado Teorema de
Bernoulli, y también conocido como Ley de los grandes números, nombre que le fue
dado por el matemático francés, Simeon Poisson (1781-1840). Este teorema fue el
primer intento para deducir medidas estadísticas a partir de probabilidades individuales.
El tiempo empleado para escribir este libro no fue perdido, si consideramos la
importancia central del resultado. Matemáticos, científicos y filósofos han dedicado más
de veinte años examinando y discutiendo el significado exacto del Teorema y su alcance
en aplicaciones estadísticas.
El teorema es más sencillo de exponer. De hecho, cuando se ve por primera vez, uno se
pregunta cómo Bernoulli pudo preocuparse durante veinte años y cómo ha promovido
tantas controversias posteriormente. El hecho es, que es un conjunto de sutilezas y
artificios; cuando más lo piensa uno, más complicado lo ve. Bernoulli tuvo un trabajo
loco montando el engranaje, lo cual lo distrajo de prever los embrollos lógicos y
filosóficos que planteaba.
“Si la probabilidad de un suceso es p, y si se hace un número infinito de pruebas, la

producción de aciertos es, sin duda p”. Aquí, tienen una simple exposición del Teorema
de Bernoulli: si la probabilidad de que ocurra un hecho en una prueba única es p, y si se
hacen varias pruebas, inmediatamente y en las mismas condiciones, la proporción más
probable de que ocurran los hechos en el número total de pruebas es también p; aún
más, la probabilidad que la porción en cuestión difiere de p en menos que una cantidad
dada, por pequeña que sea, aumenta al mismo tiempo que aumenta el número de
pruebas.
Tirando al aire su discreción matemática “un estudioso del sujeto llega a esta definición
correcta”.
Otra definición más válida: “En un conjunto bastante amplio de “a” elementos es
casi seguro que la frecuencia relativa de “b” elementos se aproximará a la
probabilidad de un elemento “a” estando “b” dentro de cualquier grado de
aproximación deseada”. Aquí la frase “casi seguro” ha de entenderse como un medio
conveniente para decir que hay una probabilidad tan cercana como queramos a 1.
Como una demostración de la importancia de la Ley de los grandes números en asuntos

prácticos es suficiente mencionar los Seguros.
Supongamos que la probabilidad de que un hombre de cierta edad y constitución muera

en el transcurso de un año es 1/10. Si tal individuo decide asegurarse, ésta es la
fracción que ha de tener en cuenta y usar cuando tome su decisión. Pero la compañía
de seguros que se ofrece a cubrir el riesgo de su muerte en este período tiene en
consideración otra probabilidad que se deriva de esta probabilidad. Si hay un gran
número de personas de las mismas características, que aseguran sus vidas en esa
compañía, hay una probabilidad muy elevada de que la compañía no tenga que pagar a
más de, aproximadamente, un décimo de las pólizas. Si, por consiguiente, la compañía
carga en cada caso una prima de más de un décimo del total de la póliza, es muy
probable que tendrá bastante superávit después de pagar todos los derechos, para
cubrir los gastos administrativos y distribuir un dividendo a sus accionistas.
14
Mientras mayor sea el número de personas que se asegura en la compañía, mayor es la
probabilidad de que las finanzas de la compañía sean sanas siempre que las primas
estén calculadas como acabamos de decir. Esta es la consideración fundamental que
distingue el negocio de una compañía de seguros de una apuesta.
2
Girolamo Cardano
Cardano nació en Pravia en 1501 y murió en 1576. Su vida es una serie de actos
incoherentes que pertenecen tanto a la historia de la Matemática como a la de la
Astrología y a la de la Patología. Realizó sus primeros estudios en su ciudad natal y
luego en la Universidad de Padua, donde alcanzó la Licenciatura en Medicina que ejerció
en Sacco y en Milán durante el período de 1524 a 1556. Durante estos años estudió
Matemáticas y publicó sus principales obras. Entre estas destaca el Ars Magna, en la
cual se presentan raíces negativas de una ecuación, algunos cálculos con números
imaginarios y la fórmula de la ecuación cúbica que ha pasado a la historia con el
calificativo de Cardámica, aunque ya se sabe que es de Fortaglia, con quien tuvo una de
las polémicas más agrias en la historia de las Matemáticas.
Se le atribuye la primera discusión sobre “Probabilidad” en su manual para jugadores

“Siber De Ludo Aleae” (Manual para tirar dados).
2
www_history.mcs.st-andrews.ac.uk/history/pictDisplay/Cardan.html
15
3
Karl Fredrich Gauss – (1777-1855) –
Junto con Arquímedes y Newton, Gauss es uno de los tres grandes de la Matemática.
Ellos aportaron conceptos muy útiles en sus distintas ramas tanto en su forma pura como
aplicada.
La precocidad de Gauss fue evidente antes de los tres años de edad. Cuando su padre
hacía la nómina para pago de los trabajadores, sin darse cuenta que su hijo seguía sus
acciones, al terminar, el niño exclamó “Padre el cálculo está equivocado”. Al
comprobarlo notó que el resultado que le dijo el niño era correcto.
Gauss se hizo notable, ya que a los doce años criticó los fundamentos de la Geometría
Euclidiana, a los trece le interesaba la posibilidad de la Geometría No-Euclidiana, a los
quince entendió el concepto de convergencia de líneas y probó el binomio de Newton, a
los dieciocho inventó el método de los mínimos cuadrados, a los diecinueve, el 30 de
marzo de 1796, descubrió la construcción del polígono de 17 lados sólo con regla y
compás.
La ley de Gauss de la distribución normal de errores y su curva en forma de campana

usada por maestros, estadistas, comerciantes, etcétera, se denomina también curva
normal de frecuencias y encuentra sus raíces en la Teoría Matemática de los juegos de
azar.
Su lema fue: Pauca. Sed natura, que significa: “Poco, pero maduro”.
3
www_history.mcs.st-andrews.ac.uk/history/pictDisplay/Gauss.html
16
4
Johann Von Neumann – (1909-1957) –
Epistemólogo austriaco contemporáneo. Von Newsmann llevó a cabo la primera

demostración del Teorema Minimax, base fundamental de la Teoría de juegos, que fue
propuesto primeramente por Emile Borel en 1921. También fue pionero de la Teoría de
Computadoras, habiendo diseñado y construido el llamado MANIAC (analizador
matemático, integrador numérico y computador) en el Instituto para estudios avanzados
de Pinceton, en 1952.
Sus ideas fundamentales sobre la axiomatización de las matemáticas las ha expuesto en

varias memorias especialmente en Eine Axiomatiserung der Mengenlebre, Crelle, 1925 y
Axiomatiserung der Mengenlebre Math, Zaitrehj 1928.
La situación actual de la Estadística se debe al esfuerzo de grandes matemáticos y

científicos. Entre los más famosos se puede mencionar a Laplace, Fermat, Jacques,
Bernoulli y Gauss, quienes intervinieron en el primer y más importante estudio de la
probabilidad en los siglos XVIII y XIX.
El matemático belga Quetelet, los estadísticos escandinavos Charlier y Gram, los

ingleses Pearson, Fisher, Galton, también asociaron sus nombres al progreso de esta
nueva disciplina, a la que dotaron de bases matemáticas sólidas.
Como se observa, la evolución de la Estadística estuvo conformada por una serie de

necesidades que condujeron al hombre a su creación.
4
www_history.mcs.st-andrews.ac.uk/history/pictDisplay/Von_Neumannn.html
17
ACTIVIDAD DE REGULACIÓN
Contesta las siguientes preguntas.
1. ¿Quién fundó la Estadística? _____________________________________________
2. La raíz de la palabra Estadística en latín es status, que significa ______________

o _________________________________________________________________________
3. El Teorema de Bernoulli también es conocido como _____________________________
4. Se le atribuye la primera discusión sobre probabilidad; este estudioso se llamó______

___________________________________________________________________________
5. Junto con Arquímedes y Newton eran los tres grandes de la matemática; éste tercero
se llama___________________________________________________________________
1.1.2 FUNCIONES DE LA ESTADÍSTICA
¿Para qué estudiamos estadística?
Los conceptos y temas de la estadística se utilizan en la actualidad en un gran número

de ocupaciones. Las técnicas estadísticas constituyen una parte integral de las
actividades de investigación en distintas áreas del saber humano.
La persona que comprenda los conceptos estadísticos y su metodología obtendrá mejor

provecho de ellos. Su trabajo tal vez no necesite conocer la estadística sino aquello que
lo faculte para saber cuándo se requieren los servicios de un experto y para poder
comunicarse eficazmente con él.
El profesional, que entiende de estadística puede leer con inteligencia la literatura que
sobre su campo de acción va apareciendo día con día.
Con frecuencia escuchamos en los medios de difusión comentarios como los siguientes:
 Se ha demostrado estadísticamente que el mayor porcentaje de las ventas de
automóviles se registran en el primer trimestre del año.
 La explotación de petróleo crudo en el último trimestre del año de 1993 ascendió a

285 millones de barriles, cuyo producto fue de 3698 millones de dólares.
18
 Estadísticamente se ha demostrado que el huevo produce el colesterol en las
personas que consumen mucho este producto.
 Se ha comprobado estadísticamente, que la pasta dental de mayor aceptación por el

público es la que produce la fábrica Colgate-Palmolive.
Todas estas expresiones nos indican que la Estadística es una herramienta que ayuda a
conocer la realidad. Sin embargo, también puede servir para distorsionar la verdad si no
se tiene cuidado al usar los métodos estadísticos adecuadamente y si la interpretación
de los resultados lo hacen incorrectamente.
Es famoso la frase que en cierta ocasión el ministro inglés Benjamin Disraeli dijo: Hay
tres clases de mentiras que son: “Las simples, las malvadas y las de la Estadística”.
Esta acusación hecha hace muchos años, ha llegado a convertirse en una descripción
adecuada de algunos engaños que se pueden realizar mediante la Estadística.
Sucede algunas veces que en la presentación de resultados de alguna investigación

poco seria, se utiliza la Estadística para dar la impresión de que todo ha sido realizado
en forma científica y al comprobarlo, resulta que la información fue alterada con la
finalidad de obtener un resultado favorable pero falso.
Se debe tener cuidado en los reportes estadísticos en no caer en una falacia; para
evitarlo se debe tener una actitud crítica hacia cualquier escrito que leamos. Así mismo
hacer un análisis cuidadoso que nos indique si el contenido y la interpretación son
correctos o si se ha hecho un mal uso de la Estadística.
Para un análisis crítico de la información contenido en un reporte, debemos contestarnos

las siguientes preguntas:
1) ¿Cómo es la muestra?
La muestra debe ser representativa de la población en estudio.
2) ¿Qué se está midiendo y cómo?
Es importante saber de qué manera se obtienen los datos y si las características de

interés pueden ser medidas.
Ejemplo.
Se desea saber qué tiempo en horas un alumno dedica al estudio, para ello el
encuestador le hace la siguiente pregunta:
Tú estudias dos horas diarias, ¿verdad?
Esta forma de obtener la información es incorrecta toda vez que la respuesta es guiada
por el encuestador y la mayoría van a ser afirmativas.
19
3) ¿Qué se está probando y cómo?
Si el reporte incluye la prueba de alguna hipótesis, entonces hay que buscar el

planteamiento explícito de ésta; haciendo uso de los métodos estadísticos
apropiados y en especial los inferenciables.
4) ¿Se está hablando siempre de lo mismo?
Con frecuencia se usan datos reales para obtener conclusiones falsas.
En algunos estudios las trampas de este tipo pueden estar en proceso de medición,
veamos el siguiente.
Ejemplo.
En un poblado del Estado de México se levantó un censo de todos los habitantes que no
sabían leer para inscribirlos en los cursos de INEA. El encuestador reportó 3000
analfabetos que fueron los que detectó, pero él no sabía que mucha de esta gente no
querían aprender a leer y por lo tanto no se presentaron para su reporte.
En el mismo poblado se anunció por la radio que toda persona que no supiera leer, el
programa de “solidaridad” le otorgaría $ 50,000 pesos mensuales de ayuda por lo tanto
debían anotarse en la presidencia municipal las personas que cubrieran el requisito.
A este anuncio acudieron 7,000 personas que no sabían leer. Esto nos muestra que la
información no siempre va a ser verdadera y en casos como estos, depende del interés
de la gente.
5) ¿Tiene sentido la información?
Esta pregunta nos invita a analizar la información reportada y nosotros debemos ver
si es congruente con el sentido común.
Ejemplo.
Un estudio reporta que la cosecha de frijol en el estado de Hidalgo está en relación

directa con la precipitación pluvial, es decir, si llueve más, hay mayor cosecha. Esto es
cierto en determinados límites toda vez que con demasiada lluvia se arruina la cosecha.
6) ¿Qué información falta?
Existe información que no es estrictamente estadística pero es necesaria para poder

captar la que nos interesa por estar relacionada con ella.
Ejemplo.
En una librería se reportó que en tan sólo un mes se duplicaron las ventas, sin embargo,
no se especificó que se refiere al mes de septiembre que fue el inicio de clases y
además aumentó el costo de los libros debido a la demanda.
20
7) ¿Quién lo dice?
Muchas de las estadísticas que dan los medios de difusión se basan en la

publicidad.
Ejemplo.
Un anuncio de la televisión dice: “K2 su fábrica amiga en tan sólo un mes vendió 50,000
colchones; pero aún nos quedan 1,000 que se rematan a un precio muy bajo, venga y
llévese el suyo. ¿Será cierta esta información, o solamente es un comercial
sensacionalista?
8) ¿Es correcta la representación gráfica que nos muestra la información?
Las representaciones gráficas también pueden ser engañosas toda vez que algunas
veces se toman dos escalas diferentes para graficar el fenómeno, una para el eje
horizontal y otra para el eje vertical, y si esto no se analiza con cuidado, se puede
caer en una inferencia falsa.
De todo lo anterior podemos concluir que algunos reportes, ya sean gráficos o escritos
que incluyen un informe estadístico, puede mentir; pero esto no quiere decir que siempre
sea así.
Generalmente la Estadística se usa correctamente para poder obtener inferencias

verdaderas.
Para no dejarte engañar es necesario que conozcas y manejes los aspectos de la

Estadística y analizar con actitud crítica toda clase de información estadística.
Recorta de periódicos o revistas los artículos referentes a información estadística. Lo

podrás reconocer por la presencia de gráficos de números, como promedios,
porcentajes, etcétera. Posteriormente analiza los recortes obtenidos y escribe en tu
cuaderno las respuestas de las siguientes preguntas.
a) ¿Qué variables se estudian de la población?

b) ¿Qué características se reportan?
c) ¿Cómo crees que se obtuvo la información?
d) ¿Qué inferencia o conclusión se desprende del trabajo estadístico reportado?
Para cualquier duda consulta con tu profesor o asesor quien te indicará si tus respuestas
son correctas.
21
1.1.3 APLICACIONES
¿En qué áreas se aplica la Metodología Estadística?
La metodología estadística se emplea en muchos campos. Se ha visto que la estadística

es una disciplina que ayuda a diseñar el esquema de búsqueda y registro de información
para describirla y analizarla con facilidad y mediante estimaciones, obtener conclusiones
que enriquecen el conocimiento de la realidad.
La estadística día a día gana terreno en su aplicación en toda actividad humana por
simple que ésta sea.
La estadística se aplica en los programas de Gobierno, Ingeniería, Agronomía,

Economía, Medicina, Biología, Psicología, Pedagogía, Sociología, Física, etcétera; no
hay alguna ciencia que no la use o profesión que no la aplique.
Algunos ejemplos del uso de la estadística son:
1) En las agencias gubernamentales, tanto federales como estatales utilizan la

estadística para realizar planes y programas para el futuro.
2) En el campo de la ingeniería se aplica en muchas de sus actividades tales como la

planeación de la producción, el control de calidad, las ventas, etcétera.
3) En la Sociología se aplica para comparar el comportamiento de grupos

socioeconómicos y culturales y en el estudio de su comportamiento.
4) En el campo económico su uso es fundamental para informar el desarrollo

económico de una empresa o de un país que da a conocer los índices económicos
relativos a la producción, a la mano de obra, índices de precios para el consumidor,
las fluctuaciones del mercado bursátil, las tasas de interés, el índice de inflación, el
costo de la vida, etcétera.
Todos estos aspectos que se estudian, se reportan e informan, no solamente

describen el estado actual de la economía sino que trazan y predicen el camino de
las futuras tendencias. Así mismo sirve a los encargados de las agencias, para
tomar decisiones acertadas en sus operaciones.
5) En el campo demográfico la Estadística se aplica en los registros de los hechos de

la vida diaria, tales como nacimientos, defunciones, matrimonios, divorcios,
adopciones, etcétera.
En materia de población los datos aportan una buena ayuda para fijar la política de
estímulos al control de la natalidad, dirigir la inmigración o emigración, establecer los
planes de lucha contra las enfermedades epidémicas o plagas que azotan los
campos, etcétera.
22
6) En el campo educativo la Estadística contribuye al conocimiento de las
condiciones fisiológicas, psicológicas y sociales de los alumnos y de los profesores.
Al perfeccionamiento de los métodos de enseñanza y de evaluación.
7) Industria. La mayor parte de los industriales la utilizan para el control de calidad.
8) Agricultura. Se emplea en actividades como experimentos sobre la reproducción de

plantas y animales entre otras cosas. También se usa la Estadística para determinar
los efectos de clases de semillas, insecticidas y fertilizantes en el campo.
9) Biología. Se emplean métodos estadísticos para estudiar las reacciones de las

plantas y los animales ante diferentes períodos ambientales y para investigar la
herencia. Las leyes de Mendel sobre la herencia en donde los factores hereditarios
se atribuyen a unidades llamadas genes y al estudio sistemático de los
cruzamientos entre individuos portadores de genes diferentes, lo que ha permitido
precisar de qué manera los genes se separan o se reúnen en las generaciones
sucesivas. La verificación de las hipótesis formuladas por Mendel y sus
continuadores necesitó el empleo de la Estadística, la cual en este caso ha lanzado
las primeras luces sobre el mecanismo de la herencia.
10) Medicina. Los resultados que se obtienen sobre efectividad de fármacos se

analizan por medio de métodos estadísticos. Los médicos investigadores se ayudan
del análisis estadístico para evaluar la efectividad de tratamientos aplicados. La
Estadística también se aplica en el establecimiento y evaluación de los
procedimientos de medida o clasificación de individuos con el propósito de
establecer la especificidad y sensibilidad a las enfermedades.
11) Salud. Los técnicos de la salud la utilizan para planear la localización y el tamaño de
los hospitales y de otras dependencias de salud. También se aplica en la
investigación sobre las características de los habitantes de una localidad, sobre el
diagnóstico y la posible fuente de un caso de enfermedad transmisible; sobre la
proporción de personas enfermas en un momento determinado, de ciertos
padecimientos de una localidad, sobre la proporción de enfermos de influenza en
dos grupos, uno vacunado contra el padecimiento y el otro no. También se aplica en
cualquier otro tipo de investigación similar a éste.
12) Psicología. Los psicólogos se valen de los conceptos y técnicas de la estadística

para medir y comparar la conducta, las actitudes, la inteligencia y las aptitudes del
hombre.
13) Negocios. Los hombres de negocios pueden predecir los volúmenes de venta,
medir las reacciones de los consumidores ante los nuevos productos, etcétera.
14) En la Física se utiliza la Estadística para obtener datos y probar hipótesis.
23
1.1.4 CONCEPTOS PRELIMINARES
¿Qué es la Estadística?
La mayor parte de las palabras tienen varios significados. La palabra “Estadística” no es

una excepción. En el lenguaje común, la palabra se emplea para denotar un conjunto de
calificaciones o de números, por ejemplo: una persona puede preguntar “¿has visto las
últimas estadísticas acerca del desempleo?”. El comentarista de deportes puede decir
“estas son las estadísticas para la primera mitad del partido”, o “¿has leído las
estadísticas de accidentes en carreteras durante las vacaciones?”. El término
estadística empleado así significa más que datos numéricos y no debe confundirse con
la misma palabra empleada en este fascículo.
El término “estadística” también se emplea para designar un área de estudio: una

disciplina. Como área de estudio, la Estadística proporciona los métodos que ayudan a
resolver los problemas correspondientes, para ello es necesario conocer los conceptos
básicos que conforman los contenidos de esta materia tales como:
a) Población.
b) Muestra.
c) Variable de Estudio.
d) Datos u observaciones.
e) Parámetros.
f) Estadígrafos o Estadísticos.
Veamos el siguiente ejemplo.
En el plantel 11 del Colegio de Bachilleres se aplicó una encuesta a 50 profesores de las

diferentes áreas acerca de la adquisición anual de libros de la materia que imparten;
para mantenerse actualizados.
Los resultados se muestran en la siguiente tabla:
N° De Libros N° De Profesores
0 4
1 5
2 6
3 10
4 8
5 7
6 6
7 4
Total 50
La población en este caso son todos los profesores del Plantel 11. Cada uno de los
profesores seleccionados y que se les aplicó la encuesta es un elemento, un dato o una
observación y todos ellos forman una muestra representativa de la población.
24
Veamos otro ejemplo.
Iván Jerónimo es un alumno de la UNAM y ha participado en los concursos deportivos

que la Institución organiza cada año. Iván es un corredor de los cien metros planos y
cada vez que corre se impone un nuevo récord.
Los tiempos que ha establecido se muestran en la siguiente tabla:
No. de Participaciones Tiempo en segundos

1 11.2
2 10.8
3 10.7
4 10.6
5 10.5
6 10.4
7 10.3
Analiza el ejemplo de los profesores y con base a los conceptos, contesta las siguientes
preguntas que tienen relación con dicho ejemplo.
- ¿Cuántas observaciones se tienen? ____________________________________________
- ¿Cuántos datos son del problema? ____________________________________________
- ¿Cuántos elementos tiene la muestra? _________________________________________
- ¿Cuál sería la población? _____________________________________________________
De los ejemplos anteriores podemos ver que al realizar un experimento para conseguir
información acerca de un problema, se tiene un conjunto de resultados en que cada uno
corresponde a una observación.
Ejemplo.
Se desea conocer la estatura de cada alumno del Plantel 2 del C.B.
25
Si el número de estudiantes que tiene el Plantel 2 es de 8,000 alumnos; entonces:
- ¿Cuántos elementos tiene la población? ________________________________________
- ¿Cuál es el número máximo de observaciones? _________________________________
- ¿Cuál es el número mínimo de observaciones? __________________________________
- Para no tener que medir a todos ¿qué propondrías? ______________________________
De los ejemplos anteriores habrás notado que los datos se obtienen mediante la
observación del fenómeno que interesa estudiar. También se obtienen de los
documentos donde se reportan los hechos.
Se desea conocer el número de pacientes a quienes se les tomó placas de rayos X en el

Hospital “Primero de Octubre”, en el primer trimestre del año de 1993.
Para recabar esta información hay varias formas que son:
- Preguntarle al médico de guardia.

- Recurrir al expediente de los enfermos.
- Recurrir al informe de los médicos.
- Recurrir al informe del operador de la máquina de rayos X.
Contesta en la línea a ¿cuál de los anteriores recurrirías? __________________________
¿Por qué? ____________________________________________________________________
La información la podemos obtener en las diferentes instituciones que diariamente

reportan su información tales como:
- Los bancos registran datos importantes.

- Las Iglesias registran nacimientos, defunciones y otros.
- Las Escuelas también registran datos importantes que en cualquier momento puede
servir para realizar la investigación deseada.
Actualmente el Instituto Nacional de Estadística, Geografía e Informática (I.N.E.G.I.), es

un auxiliar muy importante para los trabajos estadísticos ya que conserva mucha
información importante que puede ayudar al estudio que se quiera realizar.
Si la información que se desea recabar no se encuentra en alguna dependencia,

entonces es necesario realizar una investigación de campo para obtenerla y en este
caso es necesario definir con precisión qué datos nos interesan para planear la forma de
obtenerlos, ya que no solamente se estudian conjuntos de personas sino de cosas,
objetos, entidades y desde varios puntos de vista; en las cuales será necesario medir
características distintas.
26
Del conjunto de trabajadores de una industria, nos interesaría conocer varias

características tales como:
a) La edad para saber cuántos están próximos a su retiro o para determinar la edad
promedio de los trabajadores.
b) El peso promedio para saber si pueden desarrollar determinado trabajo donde el

peso es importante.
c) El grado de estudios de cada uno para saber si se les puede impartir cursos de
preparación para el trabajo que requieren conocimientos de nivel medio superior,
etcétera.
De lo anterior podemos concluir que de acuerdo con la necesidad, se define la variable

que se va a medir.
Una vez definida la variable se determina la población estadística.
Definición
Población estadística es un conjunto de personas, entidades u objetos del cual

se quiere saber algo que nos interesa para tomar una determinación acertada.
Para facilitar el estudio de las poblaciones éstas se clasifican en:
a) Población finita.
b) Población infinita
Muestra
Una muestra es un conjunto de medidas u observaciones tomadas a partir de una

población dada; es un subconjunto de la población. Desde luego, el número de
observaciones en una muestra es menor que el número de posibles observaciones en la
población, de otra forma, la muestra será la población misma. Las muestras se toman
debido a que no es factible desde el punto de vista económico usar a toda la población.
En algunos casos es imposible recolectar todas las posibles observaciones en la
población.
Por ejemplo, si se desea estimar el gasto promedio anual de los estudiantes del C.B., se
extraería una muestra formada por cierto número de estudiantes, se determinaría el
gasto anual correspondiente a cada uno de ellos y después se obtendría el promedio.
Se utiliza una muestra debido a que simplemente no se tiene el tiempo ni los recursos
para establecer el contacto con todos los estudiantes del C.B., aun cuando es posible
hacerlo.
27
Definición
Muestra representativa es un subconjunto de la población que se estudia para

determinar el parámetro que describe la característica deseada de la misma.
POBLACIÓN
MUESTRA
Todas las muestras son subconjuntos de la población pero no todas son representativas.
Las muestras representativas se seleccionan aleatoriamente.
Definición
Muestra aleatoria es aquella que se obtiene de tal manera que cada posible
observación disponible en la población, tiene la misma probabilidad de ser
seleccionada.
Para poder obtener estas muestras es necesario que no intervenga la preferencia del
investigador por algún elemento de la población; es decir, cada elemento de la población
deberá tener igual oportunidad de ser seleccionado.
Los promedios y proporciones muestrales son características medibles de las muestras

respectivas y se les llama estadísticas o estadígrafos.
Ejemplo.
En un campo de experimentación agrícola se ha desarrollado una variedad de jitomate.

Si se desea determinar el peso promedio de los jitomates de cada planta, entonces
obtener el parámetro de la población y el estadígrafo..
Solución:
El parámetro de la población es el peso promedio de todos los jitomates producidos por

cada planta en una cosecha determinada.
El estadístico o estadígrafo es el peso promedio de todos los jitomates producidos por

planta, en una muestra aleatoria de plantas cultivadas de la cosecha.
28
Del siguiente problema identifica y escribe en la línea cuál es la población, la muestra, el

parámetro y el estadígrafo.
De todos los estados de la República Mexicana se desea saber el ingreso bruto sobre
recaudación de impuestos sobre la renta y el promedio de ingresos de diez de los
estados tomados al azar.
La población es ________________________________________________________________
La muestra es __________________________________________________________________
El parámetro es ________________________________________________________________
El estadígrafo o estadístico es ___________________________________________________
Los especialistas en Estadística emplean estadísticas muestrales para realizar

inferencias acerca de los parámetros de la población.
El número de datos que constituye una muestra se llama tamaño de la muestra y se

simboliza con la letra (n). El número de datos de una población se simboliza con la letra
(N).
1.1.5 CLASIFICACIÓN DE LA ESTADÍSTICA
En base a lo que se ha dicho se concluye, que la Estadística como disciplina o área de

estudio comprende técnicas descriptivas como inferenciales. Incluye la observación y
tratamiento de datos numéricos y el empleo de los datos estadísticos con fines
inferenciales.
Para su estudio se clasifica de la siguiente forma:
Descriptiva
Estadística
Inferencial
29
Definición
La Estadística es el estudio científico relativo al conjunto de métodos

encaminados a la obtención, representación y análisis de observaciones
numéricas, con el fin de describir la colección de datos obtenidos, así como
inferir generalizaciones acerca de las características de todas las observaciones
y tomar las decisiones más acertadas en el campo de su aplicación.
1.1.6 ESTADÍSTICA DESCRIPTIVA
El origen de la Estadística descriptiva puede relacionarse con el interés por mantener

registros gubernamentales hacia fines de la Edad Media. Cuando los estados
nacionalistas empezaron a surgir durante ese período, se volvió necesario obtener
información acerca de los territorios bajo la jurisdicción de cada nación. Esta necesidad
de información numérica acerca de los ciudadanos y recursos lleva al desarrollo de
técnicos para obtener y organizar datos numéricos.
Hacia fines del siglo XVII, ya existían investigaciones semejantes a nuestros censos
modernos. Al mismo tiempo, las compañías de seguros empezaban a recopilar tablas
de mortalidad para determinar las primas de seguros de vida.
En las primeras etapas de desarrollo, la estadística incluía poco más que la obtención,
clasificación y presentación de datos numéricos. Aún hoy en día, estas actividades
siguen siendo una parte importante de la Estadística.
A continuación se da una definición de Estadística Descriptiva.
“La Estadística Descriptiva es el estudio que incluye la obtención, organización,

presentación y descripción de información numérica”.
Ejemplo:
Un director de escuela desea conocer las aptitudes de cinco secretarias que trabajan en
dicha institución.
Se aplica una prueba de aptitudes a las cinco secretarias y las calificaciones son 82, 85,
95, 92 y 91. La medida estadística que emplea el Director es la aptitud promedio o
media aritmética, la cual es la suma de los valores obtenidos dividida por el número de
observaciones. Entonces, la calificación promedio es:
82  85  95  92  91 445
  89
5 5
30
El cálculo de la media aritmética, simple como es, es una parte importante de la
estadística descriptiva. El resultado se limita a los datos obtenidos en este caso
particular y no implica ninguna inferencia o generalización acerca de las aptitudes de
otras secretarias. Este método es de naturaleza descriptiva, debido a que el promedio
condensa y describe la información obtenida, por ejemplo en el caso de las secretarias
significa que el promedio de las aptitudes de las cinco secretarias es 89%.
La descripción de los datos también puede hacerse usando representaciones gráficas

como veremos posteriormente.
1.1.7 ESTADÍSTICA INFERENCIAL
Si el interés del Director de la escuela va más allá de la información obtenida, necesitará

otras técnicas distintas a los métodos descriptivos.
Por ejemplo; podría desear conocer la aptitud promedio de las demás secretarias, pero
carece del tiempo o de los recursos para aplicar una prueba a todas ellas. Podría utilizar
la calificación promedio de las cinco secretarias como base para realizar una inferencia o
estimación acerca de la aptitud promedio de todas las secretarias.
Con ese fin, necesitará conocer otra rama de la Estadística conocida como Estadística
Inferencial o Inferencia Estadística.
Definición
“La inferencia estadística es una técnica mediante la cual se obtienen

generalizaciones o se toman decisiones en base a una información parcial o
completa obtenida mediante técnicas descriptivas”.
Para concluir diremos que existe otra gran división de las técnicas estadísticas:
a) Estadística Paramétrica.
b) Estadística No Paramétrica.
La Estadística Paramétrica es un conjunto de técnicas desarrolladas para niveles altos

de medición como el de intervalos.
Los métodos paramétricos permiten hacer inferencias acerca de parámetros

poblacionales de las distribuciones. Estos métodos fueron los primeros en ser
desarrollados por los investigadores de la Estadística.
31
La Estadística No Paramétrica es un conjunto de técnicas diseñadas para niveles de
medición menores, por ejemplo, el nominal y ordinal, para efectuar estimaciones no
habrá parámetros en estricto sentido.
A los procedimientos estadísticos que no dependen para su validez de la forma funcional

de la distribución original de la población se les denomina procedimientos no
paramétricos o libres de distribución.
Los Procedimientos No Paramétricos disponibles actualmente ofrecen varias ventajas

para el investigador y analista de datos; entre ellos se pueden mencionar los que
estableció Bradley en 1968:
1) La mayoría de los procedimientos no paramétricos se basan en un conjunto mínimo

de suposiciones y esto tiende a reducir la posibilidad de utilizarlos inadecuadamente.
2) Los cálculos aritméticos necesarios para la aplicación de muchos procedimientos no

paramétricos son cortos y fáciles, de manera que con su empleo se puede ahorrar
tiempo.
3) Los procedimientos no paramétricos son por lo general fácilmente comprensibles

para personas no muy formadas matemática o estadísticamente.
4) Se pueden aplicar los procedimientos no paramétricos cuando los datos que se van
a analizar consisten más bien en rangos o conteos de frecuencia tales como
porcentaje de pruebas, estatura, peso, longitud, entre otras.
RECAPITULACIÓN
En este capítulo te presentamos la definición de Estadística partiendo del hecho de que

no sólo es una serie de datos agrupados; también es el análisis de dichos datos y la
obtención de conclusiones lógicas a partir de los mismos.
Partimos de un bosquejo histórico que nos dice que el análisis estadístico se inició con la
obra de un tendero inglés llamado John Graunt, después de este sencillo inicio, muchos
matemáticos, entre ellos algunos muy famosos como Laplace y Gauss, hicieron
importantes contribuciones a las ideas de la estadística.
Finalmente concluimos con la idea de que el análisis de datos numéricos es fundamental

en tantas áreas como la Biología, Geología, Genética y la Evolución.
32
ACTIVIDADES INTEGRALES
Después de haber revisado los contenidos de este capítulo, realiza las siguientes
actividades para que verifiques tu aprendizaje.
1. Hizo el primer ejemplo conocido de inferencia estadística. _____________________
2. La Estadística se usa correctamente para obtener ____________________________
3. La creación de las leyes de la herencia es un ejemplo de la aplicación de la

Estadística en el área de___________________________________________________
4. Se encarga del estudio que incluye la obtención, organización, presentación y

descripción de información numérica: esta definición se refiere a la Estadística
_________________________________________________________________________
5. Los métodos estadísticos tienen como utilidad recopilar _______________________
6. Permiten hacer inferencias acerca de los parámetros poblacionales de las

distribuciones ____________________________________________________________
7. Junto con Arquímedes y Newton eran los tres grandes de las Matemáticas. Nos
referimos a _______________________________________________________________
33
AUTOEVALUACIÓN
A fin de que compruebes los procedimientos que aplicaste para contestar las preguntas
de las actividades integrales, te presentamos a continuación las respuestas.
1. John Arbuthnot
2. Inferencias Verdaderas
3. Biología
4. Estadística Descriptiva
5. Datos
6. Métodos Paramétricos
7. Gauss
34
CAPÍTULO 2
CONCEPTOS BÁSICOS PARA EL ESTUDIO DE LA

ESTADÍSTICA
2.1 PRESENTACIÓN DE DATOS
2.1.1 Distribución de Frecuencias

2.1.2 Distribución de Frecuencias Absolutas y Relativas
2.1.3 Distribución de Frecuencias Acumuladas
2.2 GRÁFICAS
2.2.1 Histograma y Polígono de Frecuencias

2.2.2 Polígono de Frecuencia
2.2.3 Polígono de Frecuencia Acumulada
2.2.4 Gráficas Circulares, Diagramas de Barras, Pictograma y Gráfico de Líneas
35
36
PROPÓSITO
En este capítulo:
¿QUÉ APRENDERÁS?
Planear, sistematizar y organizar la información y efectuar inferencias

verdaderas de la información a partir de la información obtenida.
Por medio de la obtención del rango, número de clases y la amplitud

de clase, y la agrupación de estos en una tabla.
Para obtener conclusiones que enriquecen nuestro conocimiento de

la realidad y nuestra capacidad de transformarla.
37
38
CAPÍTULO 2
CONCEPTOS BÁSICOS PARA EL ESTUDIO DE LA

ESTADÍSTICA
El objetivo de la Estadística como disciplina, es ayudar a:
a) Planear la búsqueda y obtención de la información.

b) Organizar y sistematizar la información para su descripción y análisis.
c) A partir de la información organizada, efectuar inferencias a través de la estimación y
contrastación de hipótesis.
A través de estas etapas que estudiaremos en este fascículo, se obtiene la resolución de

cualquier problema que nos interese. La Estadística nos proporciona los métodos
correspondientes que facilitan la realización de cada una de las etapas que
analizaremos.
Para la planeación de cualquier actividad es necesario dar respuesta a los siguientes

cuestionamientos:
1. ¿Qué problema me interesa resolver?

2. ¿Cómo lo voy a resolver?
3. ¿Para qué lo voy a resolver?
Dar respuesta a la primera pregunta implica determinar la población o muestra y fijar las
variables para su estudio.
Como ya se dijo en párrafos anteriores, para disminuir tiempo y costo en lugar de

trabajar con una población, se determina una muestra representativa de ésta, por lo que
en la planeación se fija la forma de tomar la muestra.
39
Para dar respuesta al segundo cuestionamiento es necesario fijar la variable o variables
de estudio, cómo se van a determinar, si ya existe esa información a quién debe
solicitarse, si no existe entonces cómo se va a buscar, si es necesario una investigación
de campo, elaborar el material necesario para realizarlo. La forma más usual para
recolectar datos es mediante una encuesta, ésta debe elaborarse de tal forma que se
tenga toda la información necesaria y evitar la innecesaria, que solamente dificulta el
trabajo.
¿El para qué?
Nos permite tener presente el problema por resolver con el fin de fijar con precisión las
variables que permitirán la resolución del mismo y con ello estar en posibilidad de tomar
una decisión correcta.
La planeación se concluye con un breve curso informativo que se da los participantes en

el trabajo de campo, con el fin de conocer los materiales que se deban llenar para
recopilar la información.
Al finalizar el curso se procede a la recopilación de la información que se concentra para

el trabajo de gabinete.
Las variables constituyen la herramienta fundamental de la Estadística, por que son la

base esencial del estudio que se desea realizar y por tal motivo analizaremos cómo
pueden ser éstas.
Las variables son:
- Características.
- Atributos.
- Rasgos.
- Cualidades.
Investiga en un diccionario el significado de cada uno de los términos anteriores.
40
La variable es una propiedad intrínseca de individuos, objetos o grupos que interesan
para un determinado estudio científico.
1. Ejemplos de variables:
a) Un grupo de científicos desea conocer el I.Q. de un grupo de niños (variable

“I.Q.”).
b) El director de una obra teatral desea conocer el color de ojos de un grupo

seleccionado para el montaje (variable “color de ojos”).
c) Los cirujanos de una clínica desean conocer el tipo de nariz que tiene cada
habitante de una colonia (variable “tipo de nariz”).
d) El director General del Colegio de Bachilleres desea conocer el índice de

aprovechamiento de los alumnos de un plantel, en la materia de Estadística
(variable “índice de aprovechamiento en Estadística”).
e) El gerente de una empresa desea conocer la dureza de ciertos lingotes de acero

que adquirió en la planta de fundición (variable “dureza del acero”).
De acuerdo a lo que investigaste en el diccionario, analiza cada uno de los ejemplos

anteriores y escribe en la línea la variable en cada caso:
I. ¿A qué tipo corresponde, característica, atributo, rasgo, etcétera?
___________________________________________________________________________
II. De cada uno de los ejemplos explica con tus propias palabras para qué se desea
conocer dicha variable.
___________________________________________________________________________
___________________________________________________________________________
Comenta tus respuestas con tu profesor o asesor.
41
De acuerdo con el tipo de medida que describe cada una de las variables, éstas se
clasifican en dos tipos que son:
1. Variables cualitativas.
2. Variables cuantitativas.
Las variables cualitativas se subdividen en:
a) Nominales
b) Ordinales
Usaremos los siguientes ejemplos para ilustrar estos conceptos:
2. Un empresario desea saber entre las marcas de carro (Ford, Nissan, Chrysler), cuál
es el de preferencia de los habitantes de una ciudad de la República; para ello se
encuesta a 20 personas habiéndose obtenido los siguientes resultados:
F, N, C, F, C, C, N, C, F, N,
N, N, F, C, N, F, N, C, F, N.
Escribe en la línea cuál es la variable: _________________________________________
¿Qué marca es la de mayor preferencia? ______________________________________
Explica con tus propias palabras, ¿cuál es el objetivo de la investigación?
____________________________________________________________________________
____________________________________________________________________________
En este ejemplo los habitantes se agrupan en tres categorías de acuerdo a su

preferencia:
Los que prefieren la marca Ford.

Los que prefieren la marca Nissan.
Los que prefieren la marca Chrysler.
Cuando los valores de una variable permiten únicamente ubicar a cada individuo en
una categoría y no hay orden entre estos valores la variable se llama “Cualitativa”.
3. El maestro del grupo 502 del plantel 2 “Cien Metros”, evaluó el grado de
aprovechamiento en el curso de estadística, bajo la siguiente escala: Excelente, Bien,
Regular, Mal; habiendo obtenido los siguientes resultados:
R, B, M, R, E, M, B, R, R, M, B, E, B, R, B,
B, R, B, B, R, B, M, E, R, R, B, B, E, B, R,
R, R, B, B, R, B, R, R, B, E, M, R, B, R,
42
Del problema anterior constes las siguientes preguntas:
¿Cuál es la variable que se está evaluando? ____________________________________
¿Cuántos alumnos obtuvieron E? ______________________________________________
¿Cuántos alumnos obtuvieron B? ______________________________________________
¿Cuántos alumnos obtuvieron R? ______________________________________________
¿Cuántos alumnos obtuvieron M? _____________________________________________
¿Cuántos elementos tiene la muestra? _________________________________________
¿En cuántas categorías se agrupan los elementos? ______________________________
¿Qué tipo de variable es la que se está evaluando? ______________________________
Cuando los valores de una variable cualitativa se pueden agrupar en un determinado

orden, la variable se conoce como “variable cualitativa ordinal”.
En el ejemplo anterior indica otra forma de ordenar los resultados: __________________

________________________________________________________________________________________________
Define con tus propias palabras las siguientes variables:
a) Variable cualitativa nominal: _____________________________________________

___________________________________________________________________________________________
b) Variable cualitativa ordinal: ______________________________________________

____________________________________________________________________________________________
c) Escribe en tu cuaderno 3 ejemplos donde la variable que se investiga sea:

“Cualitativa nominal”.
d) Escribe 3 ejemplos donde la variable que se investiga sea: “Cualitativa ordinal”.
43
Definición
Variable cualitativa es cuando solamente se busca en ella una cualidad o un

atributo.
Variable cualitativa nominal es aquella que agrupa los elementos en categorías

sin tener un orden.
Variable cualitativa ordinal es cuando las categorías en que se agrupan los

elementos, pueden ser ordenados.
4. El médico de una guardería desea saber el crecimiento que tuvo cada niño a su
cuidado, durante los primeros 6 meses del año, para ello se obtuvieron los siguientes
resultados en centímetros:
8, 8, 7, 5, 4, 3, 4, 7, 5, 9, 3, 4, 7, 6, 5, 7, 3
5, 4, 5, 3, 9, 7, 6, 8, 4, 6, 9, 7, 8, 3, 4, 9, 5
Escribe la variable que se investiga en este ejemplo: ____________________________
¿Qué tipo de variable es? ____________________________________________________
En este ejemplo puedes observar que a la variable (crecimiento en 6 meses) se le

puede asociar un número que la define.
Si a la variable se puede asociar un número mediante el cual podemos hacer

comparaciones u operaciones, esta variable se llama “Cuantitativa o numérica”.
44
Resuelve el siguiente problema.
El director del hospital “1º de Octubre” del ISSSTE desea saber el número de pacientes
atendidos en la sala de Urgencias, en el mes de septiembre, y para ello se obtuvieron los
siguientes datos:
18, 25, 15, 30, 22, 27, 15, 18, 21, 19,
28, 27, 16, 19, 18, 30, 17, 16, 20, 15,
14, 19, 23, 27, 17, 14, 16, 20, 21, 28,
¿Cuál es la variable que se investiga? ____________________________________________

¿Qué tipo de variable es? _______________________________________________________
Si solamente hay dos doctores en la sala, qué decisión tomarías si tu fueras el Director?
_______________________________________________________________________________
¿Por qué? _____________________________________________________________________
_____________________________________________________________________
Definición
Variable cuantitativa es aquella que se puede asociar con un número con el cual
podemos realizar operaciones o comparaciones.
En el ejemplo anterior, la variable es “pacientes atendidos en el día”, a ésta se le asocia

un número que cuantifica a los pacientes atendidos. Esta variable nunca podrá tomar
valores fraccionarios, por que siempre se hablará de personas y no de partes de una
persona; en estos casos en que la variable siempre tomará valores enteros se le llama
variable “discreta”.
Definición
Variable cuantitativa discreta es la que siempre se asocia con valores enteros.
45
En el ejemplo número 4 donde la variable es “crecimiento durante 6 meses”, en los datos
obtenidos podemos ver que la variable toma valores fraccionarios, en estos casos la
variable se llama “Continua”.
Definición
Variable cuantitativa continua es la que se puede asociar con valores de un

intervalo de número reales.
Las variables estudiadas de acuerdo con sus características, se resumen en el siguiente

cuadro:
a) Nominal
CUALITATIVA
b) Ordinal
VARIABLE
a) Discreta
CUANTITATIVA
b) Continua
En el siguiente problema analiza los resultados y escribe en la línea el tipo de variable

que se trate.
Los currícula de los investigadores de la UNAM registran los datos siguientes:
1. Nombre:
__________________________________________________________________________
2. Edad: __________________________ 3. Estatura: _________________________
4. Grado académico: ________________ 5. Número de investigaciones: ________
6. Experiencia en tipos de investigación: _________________________________________
7. Número de conferencias impartidas: ___________________________________________
De los ejemplos anteriores habrás notado la importancia que tienen las variables en el
estudio estadístico de un problema.
46
2.1 PRESENTACIÓN DE DATOS
Una vez que se han obtenido los datos y que se ha hecho el estudio de los valores que
pueden tomar las variables, la primera tarea de la Estadística es la de ordenar y
presentar los datos en tablas que permitan ver la tendencia de los mismos. Ordenados
los datos se facilita su representación en diagramas y gráficas de diferentes tipos.
En esta unidad se verá la forma de describir, presentar, ordenar, resumir la información

en tablas y su presentación en diferentes tipos de gráficas.
Los datos agrupados en tablas, nos permiten ver con facilidad el número de
observaciones iguales o comprendidos en un intervalo, a este número de repeticiones
iguales de la variable se llama frecuencia y se denota por f i. Otros valores relacionados
con la frecuencia son:
La frecuencia relativa que se denota por f r.

La frecuencia acumulada que se denota por Fi.
La frecuencia relativa acumulada que se denota F r.
En esta unidad analizaremos, ejemplificaremos y gratificaremos los datos de estos

conceptos.
Escalas de Medición.
La clasificación que hemos hecho de las variables, depende del nivel de medición de la
característica deseada.
El nivel de medición también denominado escala de medición, lo podemos clasificar en:
1. Nominal.
2. Ordinal.
3. Por intervalo.
De acuerdo con esta clasificación podrás notar que dependen del tipo de variable que se
analiza y por lo tanto reciben el mismo nombre de éstas.
Analiza el siguiente ejemplo.
5. En la carrera de caballos que se realizó el jueves 16 de septiembre corrieron 10

caballos, los cuales se numeraron de la siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
47
Al finalizar la carrera, el primer lugar lo obtuvo el 13, el segundo lugar el 19, y el tercer
lugar el 16. El primer lugar hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el
tercer lugar 15.8 minutos.
Definición de variables:
a) Número de caballo (variable cualitativa nominal).

b) Lugar que ocupó (variable cualitativa ordinal).
c) Tiempo que hizo (variable cuantitativa continua).
Definición de escalas de medición:
a) Nominal (numeración de los caballos).

b) Ordinal (lugar ocupado en la carrera).
c) Por intervalos (tiempo durante el recorrido).
Del ejemplo anterior podemos establecer las siguientes definiciones:
Escala nominal es la que se usa para asignarle una etiqueta a las categorías que
se construyen de la variable con el único fin de distinguir unas de otras.
Escala ordinal es la que permite ordenar o jerarquizar las categorías que se

construyen de la variable que se evalúa.
Escala de medición por intervalos es la que permite clasificar, ordenar y

cuantificar las categorías que se establecen de la variable.
La escala de medición por intervalos es la de mayor nivel de medición e incluye las dos
anteriores; para poder usarse con la precisión deseada es necesario fijar un patrón de
medida que cuantifique a la variable con la misma exactitud, cuantas veces sea medida.
Algunos de los patrones que se usan son: años, kilos, litros, pesos, etcétera.
48
Analiza el siguiente problema y establece todas las variables que consideres

importantes, clasifícalas y determina el tipo de escala que se usaría en cada una.
El 16 de septiembre de un determinado año, se llevó a cabo el maratón de la libertad; en

él participaron 15 mil maratonistas, quienes por su esfuerzo todos recibieron una medalla
de participación y los premios que se repartieron fueron los siguientes:
1er. lugar: $ 10,000,000.00

2do. lugar: una residencia
3er. lugar: un Chevy
4to. lugar: un VW
5to. lugar: una motocicleta
2.1.2 DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS Y RELATIVAS
Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y resumir los
datos obtenidos en la investigación de campo, para ello se concentran en tablas de
frecuencia y éstas pueden ser:
a) Absoluta.
b) Relativa.
c) Acumulada.
Con el análisis de las frecuencias podemos determinar la tendencia de la variable en

estudio que como ya se dijo, ésta puede ser nominal, ordinal o cuantitativa y sus
respectivas escalas de medición: nominal, ordinal o por intervalos, respectivamente.
Analicemos el siguiente ejemplo.
6. La maestra de orientación del Plantel 11 dio una conferencia al grupo 603 sobre las
características y bondades de las carreras de Ingeniería, Química, Metalúrgica y
Actuaría. Al final de la conferencia pidió que llenaran un cuestionario donde
especificaron además de los datos personales, la carrera de preferencia. Se
obtuvieron los siguientes resultados:
I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q,
49
En base a los datos del problema contesta lo siguiente:
a) Establece la variable que se analiza. __________________________________________

b) ¿Qué tipo de variable es? ____________________________________________________
c) ¿Qué tipo de escala define la variable? ________________________________________
La forma en que se obtuvieron los datos, se muestra en la tabla anterior. Como podrás
observar en esta forma es difícil interpretar la información, por lo que elaboramos la
siguiente tabla de frecuencias:
1. Carrera que prefieren los alumnos del grupo 603 del Plantel 11 del Colegio de
Bachilleres.
2. CATEGORÍAS NÚMERO DE ALUMNOS f

I IIII III 8
Q IIII IIII IIII 14
M IIII IIII III 13
A IIII IIII 10
Total 45
De la encuesta realizada por la maestra de orientación del Plantel 11, el 12 de

septiembre de 1993, se establece que el número de columnas de una tabla es variable y
depende de la información que se quiera registrar.
En nuestro ejemplo podemos suprimir la columna 2 que representa el conteo de la

variable el cual se puede realizar en otras hojas de trabajo.
En la tercera columna se registra la frecuencia.
Definición
Frecuencia Absoluta es el número de veces que se repite la misma observación.

Se simboliza con fi.
50
Analiza la tabla anterior y contesta las siguientes preguntas:
a) ¿Cuál categoría es la de mayor frecuencia? _____________________________________
b) ¿Qué información podemos determinar con la categoría de mayor frecuencia?
____________________________________________________________________________
c) ¿Qué carrera es la menos solicitada? __________________________________________
De la tabla del ejemplo anterior puedes notar que las partes de una tabla de frecuencias
debe contener las siguientes partes:
1. Título. Este describe la información más importante del problema como es:
a) La variable.
b) La muestra o población.
c) A quién corresponde la muestra.
2. Encabezado. Este describe el tipo de información que se describe en cada columna.
3. Cuerpo. El cuerpo agrupa el contenido de la información.
4. Final. En el final se registran los totales.
5. Fuente. En esta parte se debe especificar: cómo, quién, en dónde y cuándo se

tomaron los datos.
Estas partes son comunes a todas las tablas que se elaboren en un estudio, para que el
que las analice tenga toda la información y pueda hacer deducciones de los resultados.
Del ejemplo anterior se deduce la siguiente información:
a) Variable: Carrera de preferencia.

b) Tipo de variable: Cualitativa nominal.
c) Tipo de escala: Nominal.
d) Carrera de mayor aceptación: Química.
e) Carrera de menor aceptación: Ingeniería.
51
Analicemos el siguiente ejemplo.
7. Se realiza un torneo relámpago de fútbol entre los planteles del norte del Colegio de
Bachilleres que son el 1, 2, 6, 7, 9, 11, 12, 13, 18, 19. El torneo se realizó en tres
fechas con sede en el Plantel de menor número. En la primera vuelta se sortean los
equipos pares e impares. Para la segunda ronda se sortean para jugar un par con un
impar, y la tercera y última ronda se jugará de acuerdo con el lugar que tengan al final
de la segunda ronda. Se formaron las parejas en el orden siguiente: 1er. lugar con
2do. lugar, 3º. con 4to., etcétera.
Los premios serán hasta el 5to. lugar y serán:
1er. lugar: Diploma y $ 5,000.00

2do. lugar: Diploma y $ 3,000.00
3er. lugar: Diploma y $ 1,000.00
4to. lugar: Diploma y un paquete de libros clásicos para cada uno.
5to. lugar: Diploma.
Los resultados que se obtuvieron al finalizar el torneo son:
RESULTADOS DE CADA EQUIPO
Vuelta Plantel 1 2 6 7 9 11 12 13 18 19
1 Goles 3 5 4 3 2 5 2 4 3 5
2 Goles 2 3 1 0 3 4 2 3 1 3
3 Goles 4 5 0 2 4 3 1 1 0. 2
Totales 9 13 5 5 9 12 5 8 4 10
Con los datos anteriores formamos la siguiente tabla de frecuencias:
1. Resultados obtenidos del torneo relámpago efectuado por los 10 planteles de la zona
norte, efectuado los tres primeros domingos del mes de septiembre de 2000.
2. Plantel Número de goles (fi) Lugar que ocupó

2 13 1º.
11 12 2º.
19 10 3º.
1 9 4º.
9 9 4º.
13 8 5º.
6 5 6º.
7 5 6º.
12 5 6º.
18 4 7º.
Total 80
3. Tabla de posiciones elaborado por el árbitro y los abanderados que participaron en el

torneo relámpago.
52
Del ejemplo anterior contesta las siguientes preguntas:
a) ¿En cuántas categorías se agrupan los elementos del problema?

b) ¿Cuál es la variable del problema?
c) ¿Qué valores toma la variable?
Analicemos el siguiente problema:
8. El gerente de una Empresa, Kimberly preocupado por el pago de energía consumida

solicito al jefe de planta, un estudio del consumo diario durante el mes de agosto.
Los resultados obtenidos. KW/hr (kilowatts por hora) son los siguientes:
Con esta información ordenamos los datos de una tabla de frecuencias:
1. Consumo de energía en KW/hr de la empresa Kimberly correspondiente al mes de

agosto de 1993.
2. Consumo fi
KW/hr
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
3. Investigación elaborada por el jefe de planta, datos tomados del consumo diario del
mes de agosto de 1993.
53
Del problema anterior contesta las siguientes preguntas:
a) Define la variable del problema: ____________________________________________

b) ¿Qué tipo de variable es? _________________________________________________
c) ¿Qué valores toma la variable? ____________________________________________
d) ¿Qué tipo de escala define la variable? _____________________________________
e) ¿Cuál es la mayor frecuencia de la variable? ________________________________
f) ¿Qué frecuencia tiene la variable cuya categoría es 10? ______________________
Respuestas:
a) La variable del problema es “consumo en KW/hr”.

b) La variable es de tipo cuantitativo o numérica continua.
c) Los valores de la variable se encuentran en un rango de 5 a 12 KW/hr.
d) El tipo de escala que define la variable es por intervalos.
e) La mayor frecuencia es 6 y significa en 6 días del mes se tiene consumo de 9 KW/hr.
f) La frecuencia de la categoría 10 es 5 lo cual significa que en 5 días del mes hubo un
consumo de 10 KW/hr.
Ya quedó establecido que el número de veces que se repite la misma observación se

llama frecuencia (fi) o frecuencia absoluta y el conocimiento de esta variable nos permite
inferir otro conocimiento. En nuestro ejemplo podemos ver en cuántos días hubo el
mismo consumo, en cuántos días hubo el menor consumo o en cuántos días hubo el
mayor consumo.
También podemos inferir hacia dónde se carga el mayor o menor consumo.
Otro parámetro importante es la frecuencia relativa que simbolizaremos con “f r”, ésta se
obtiene dividiendo la frecuencia absoluta (f i) entre el número de elementos de la muestra
que simbolizaremos con (n).
fi
La definición matemática es: fr  . . . . . . . . . ( 1)
n
De la ecuación ( 1 ) puedes observar que la frecuencia relativa se puede expresar como

una razón, como una proporción o como un porcentaje ( % ).
54
Veamos el siguiente ejemplo:
9. La puntuación obtenida en un examen que se aplicó a 100 obreros de la fábrica de

vidrio el Fanal, es la que se muestra en la siguiente tabla de frecuencias:
1. Resultados del examen aplicado a 100 obreros de la fábrica de vidrio el Fanal.
2. Frecuencia relativa ( fr )
Puntuación fi Razón Proporción Porcentaje
0 1 1/100 0.01 1%
1 2 2/100 0.02 2%
2 3 3/100 0.03 3%
3 5 5/100 0.05 5%
4 6 6/100 0.06 6%
5 8 8/100 0.08 8%
6 20 20/100 0.20 20 %
7 25 25/100 0.25 25 %
8 15 15/100 0.15 15 %
9 10 10/100 0.10 10 %
10 5 5/100 0.05 5%
Total 100 100/100 1.00 100 %
3. Investigación realizada por el jefe del departamento de capacitación de la fábrica de

vidrio el Fanal, el 5 de septiembre de 1993.
a) ¿Cuál es la variable del problema? _____________________________________________

b) ¿Qué escala define a la variable? ______________________________________________
c) ¿Qué puntuación tiene la mayor frecuencia? ____________________________________
d) ¿Qué porcentaje de obreros reprobó el examen si la calificación aprobatoria es de 6 a
10? ________________________________________________________________________
e) De este resultado, ¿qué puede inferir el jefe del departamento de capacitación?
____________________________________________________________________________
55
Definición
Frecuencia relativa (fr) es la proporción de elementos que pertenecen a una

categoría y ésta se obtiene dividiendo su frecuencia absoluta entre el número
total de elementos de la muestra.
Elabora una tabla de frecuencias de los ejemplos 4, 5, 6 y agrega en la tabla la columna

de frecuencia relativa (fr) en sus tres formas de expresión.
Hasta el momento, en los problemas que hemos analizado las muestras son pequeñas
(n es pequeño). Sin embargo cuando la muestra o población se compone de un
considerable número de elementos, la tabla de frecuencias se elabora agrupando los
datos en clases y ahora la tabla se llama “Tabla de frecuencias con datos agrupados”.
La formación de clases o intervalos de clase que simbolizaremos con (k) es muy variado
y depende generalmente del tamaño del rango de la población o muestra.
Definición
Rango (R) es el intervalo en que se distribuyen los datos en observaciones de

una muestra y se determina restándole al mayor valor el menor valor.
La definición matemática del rango es:
R = Xn – X1 . . . . . . . . . . . . . (2)
Donde:
Xn = valor mayor
X1 = valor menor
56
No existe alguna ley que defina cómo obtener el número de clases; pero la experiencia
recomienda que no sea menor que 5 ni mayor de 20, esto es:
5  k  20 . . . . . . . . . . . . . (3)
Donde: k = número de clases
Una vez definido el número de clases (k), para obtener la amplitud de clase (A)
aplicamos la siguiente ecuación:
R
A . . . . . . . . . . . . . . (4)
K
Otra forma de determinar el número de intervalos de clase (k) es mediante la ecuación

de Sturges y ésta es:
K = 1 + 3.322 (log n) . . . . . (5)
Donde:
K = número de intervalos
n = tamaño de la muestra
log = logaritmo en base 10
10. El gerente de una compañía de ventas al mayoreo de diferentes tipos de mercancías

desea conocer el comportamiento de las llamadas telefónicas durante los meses de
marzo y abril del año en curso; por lo que le encomienda a su secretaria que realice
esa investigación. La secretaria obtuvo los siguientes datos, en número de llamadas
por día:
30, 38, 36, 35, 29, 28, 30, 35, 40, 48, 50, 20, 25, 56, 30
27, 29, 46, 41, 31, 31, 31, 39, 28, 36, 37, 52, 44, 49, 52
56, 58, 40, 39, 38, 40, 27, 24, 30, 32, 35, 38, 26, 25, 24
60, 55, 48, 37, 31, 30, 22, 20, 24, 26, 23, 22, 28, 27, 48
La secuencia de operaciones es la siguiente:
1. Ordenamos la información en sentido creciente.

2. Determinamos X1 y Xn.
3. Calculamos el rango R.
4. Calculamos K mediante la ecuación de Sturges.
5. Determinamos la amplitud de la clase A.
6. Elaboramos la tabla de frecuencias con datos agrupados; para ello colocamos el
primer intervalo en el primer renglón y formamos los siguientes de acuerdo con la
amplitud.
57
Respuestas:
1. 20, 20, 22, 22, 23, 24, 24, 24, 25, 25, 26, 26, 27, 27, 27, 28
28, 29, 29, 30, 30, 30, 30, 30, 31, 31, 31, 32, 35, 35, 35, 36
36, 37, 37, 38, 38, 38, 38, 39, 39, 40, 40, 40, 41, 44, 46, 48
48, 48, 49, 50, 52 ,52, 55, 56, 56, 57, 58, 60
2. X1 = 20 ; Xn = 60
3. R = Xn – X1 = 60 – 20 = 40
4. K = 1 + 3.322 ln (60) = 1 + 3.322 (1.7781) = 1 + 5.9 = 1 + 6 = 7
R 40
5. A = = = 5.7  6 (cada uno de los intervalos de clase debe contener 6 valores
K 7
en total).
6. Determinamos cada intervalo:
1. Número de llamadas telefónicas correspondientes a los meses de marzo y abril.
2. Frecuencia relativa ( fr )
Clases (K) f Razón Proporción Porcentaje
20-25 10 10/60 0.17 17%
26-31 17 17/60 0.28 28%
32-37 8 8/60 0.13 13%
38-43 10 10/60 0.17 17%
44-49 6 6/60 0.10 10%
50-55 4 4/60 0.07 7%
56-61 5 5/60 0.08 8%
Total 60 60/60 1.00 100 %
3. Información investigada y elaborada por la secretaria de la gerencia de la

empresa.
El uso de los intervalos de clase es con la finalidad de condensar la información para

facilitar su manejo.
Los valores extremos de cada clase se conocen como límites aparentes de clase. El
valor menor se llama límite inferior de la clase y el mayor se llama límite superior de
clase.
58
a) Escribe el límite inferior de la clase de mayor frecuencia _________________________

b) Escribe el límite superior de la clase de menor frecuencia ________________________
c) ¿Qué porcentaje representa la clase de mayor frecuencia? _______________________
En el ejemplo anterior la variable es discreta porque las llamadas telefónicas siempre se

toman como valores enteros toda vez que no podemos hablar de fracciones de llamadas
telefónicas.
Si analizamos los intervalos de clase del ejemplo anterior podemos notar lo siguiente:
De un intervalo a otro hay un salto por ejemplo:
1er. intervalo 20 – 25
2do. Intervalo 26 – 31
Veámoslo en una gráfica lineal.
1er. intervalo 2do. intervalo 3er. intervalo
20 25 26 31 32 36
En la gráfica podemos ver que al formar los intervalos de clase hay un valor entre clase y
clase que se pierde.
Como la variable es discreta sabemos que entre estos valores no hay ninguna
información que se pierda; pero ¿qué pasa si la variable es continua?, en estos casos si
hay la posibilidad que entre el 25 y 26 se pierdan los valores comprendidos como es
25.1, 25.3, 25.6, etcétera.
Para evitar este error, si la variable es continua, entonces después de haber determinado
los límites de clase, se fijan otros límites que inician medio punto antes y medio punto
después; de esta forma no hay posibilidad de perder información.
59
A cada uno de estos nuevos límites se le llama “límite real de clase”.
Veamos el mismo ejemplo anterior.
Límites de clase Límites reales de clase
CLASES LÍMITES REALES

20-25 19.5 – 25.5
36-31 25.5 – 31.5
32-37 31.5 – 37.5
38-43 37.5 – 43.5
44-49 43.5 – 49.5
50-55 49.5 – 55.5
56-61 55.5 – 61.5
Si representamos los límites reales de clase en una gráfica lineal podemos observar que
ya no hay saltos entre cada clase:
1er. intervalo 2do. intervalo
19.5 23 25.5 29 31.5 35
Con el análisis de la tabla anterior, contesta las siguientes preguntas:
a) Escribe en la línea el límite real inferior de la tercera clase ______________________

b) Escribe en la línea el límite real superior de la quinta clase ______________________
c) Escribe en la línea el límite superior de la segunda clase ________________________
Al cambiar los límites reales de clase, el valor del intervalo de clase (A) no cambia y para
determinarlo aplicamos la siguiente ecuación:
A = Xs – Xi . . . . . . . . . . . . . . . (6)
Donde: Xs = Límite superior de cualquier clase

Xi = Límite inferior de la misma clase considerada
60
Por ejemplo para la 4ta. clase de la tabla:
Xs = 43.5 Sustituyendo en (6) obtenemos:

Xi = 37.5 A = 43.5 – 37.5 = 6
Apliquemos la misma ecuación para la misma clase si la variable es discreta:
Xs = 43 A = 43 – 38 = 5
Xi = 38
De este resultado se infiere que para la variable discreta debe aplicarse la siguiente
ecuación:
A = Xs – Xi + 1 . . . . . . . . (7)
A = 43 - 38 + 1 = 6
Otra característica importante del intervalo de clase o marca de clase es el punto medio
de clase o marca de clase (Mi).
Definición
La marca de clase es el valor del punto que se localiza a la mitad del intervalo de
cada clase o intervalo real de clase.
Su definición matemática es:
M1 = Xs  X1 . . . . . . . . . . . (8)
2
Determinemos los puntos medios o marcas de clase del mismo ejemplo anterior en los
dos tipos de intervalos.
Límites de clase Límites reales de clase

(variable discreta) (variable continua)
CLASES MI CLASES MI
20-25 22.5 19.5 – 25.5 22.5
36-31 28.5 25.5 – 31.5 28.5
32-37 34.5 31.5 – 37.5 34.5
38-43 40.5 37.5 – 43.5 40.5
44-49 46.5 43.5 – 49.5 46.5
50-55 52.5 49.5 – 55.5 52.5
56-61 58.5 55.5 – 61.5 58.5
De la tabla se deduce que el punto medio de clase (M i) o marca de clase es el mismo en

cada clase para ambas variables (discreta o continua).
61
En el siguiente problema, elabora una tabla de frecuencia de datos agrupados con 5

columnas con el siguiente encabezado:
1. Clases.
2. Límites reales de clase.
3. Punto medio de clase o marca de clase.
4. Frecuencia absoluta (fi).
5. Frecuencia relativa (fr).
Problema.
En una cadena de tiendas, la venta de líquido anticongelante para automóviles, (en

número de litros) en un determinado día de diciembre fue el que se indica:
216, 269, 235, 235, 224, 249, 244, 240, 252, 210, 256
228, 233, 239, 253, 237, 221, 273, 229, 236, 215, 260
230, 228, 230, 255, 245, 244, 230, 231, 240, 222, 223
Hasta el problema anterior hemos mostrado cómo organizar los datos en una tabla de
frecuencia de datos agrupados en clases y también hemos incluido la fracción o
porcentaje de cada clase (fr). Esta información nos ha permitido hacer algunas
inferencias.
A continuación veremos otra característica de la muestra que nos permitirá un análisis

más amplio de los resultados.
2.1.3 DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS.
La frecuencia acumulada (Fi) es otra característica de la muestra que nos permitirá

determinar la posición de un caso particular que nos interese en comparación con el total
de los elementos.
Definición
Frecuencia acumulada (Fi) de una clase es la que se obtiene sumando las

frecuencias de las clases anteriores con la frecuencia de ésta.
62
3
F3 = 
i 1
f1 + f2 + f3
n
Fn = 
i 1
f2 + f2 + . . . fn . . . . . . . . . . (9)
Al calcular la frecuencia acumulada (F1) podemos determinar su frecuencia relativa

acumulada (Fr) en la forma ya explicada mediante la ecuación (1), esto es:
F
Fr  . . . . . . . . (1)
n
Regresemos al problema (10) de las llamadas telefónicas y calculemos la frecuencia

acumulada (f1) y la frecuencia relativa acumulada (Fr).
1 2 3 4 5 6 7
LÍMITES MARCA DE FREC. FREC. FREC. ACUMULADA
CLASES REALES CLASE (MI) ABS. (f1) REL. (FI) FI FR
20-25 19.5-25.5 22.5 10 0.17 10 0.17
26-31 25.5-31.5 28.5 17 0.28 27 0.45
32-37 31.5-37.5 34.5 8 0.13 35 0.58
38-43 37.5-43.5 40.5 10 0.17 45 0.75
44-49 43.5-49.5 46.5 6 0.10 51 0.85
50-55 49.5-55.5 52.5 4 0.07 55 0.92
56-61 55.5-61.5 58.5 5 0.08 60 1.00
Total 60 1.00
La frecuencia acumulada para la 4ta. Clase es F = 45; de este valor se infiere que hasta
esta clase corresponden 45 de las 60 observaciones realizadas.
También se infiere que a esta clase corresponden un número menor o igual a 43

llamadas telefónicas.
La frecuencia relativa de esta clase es F = 0.75. este valor significa que hasta esta clase
corresponde el 75% de todas las llamadas.
63
a) ¿A qué clase corresponde F2 y cuál es su valor? ________________________________

b) Indica el porcentaje de llamadas para F5 _______________________________________
c) ¿Qué número de llamadas telefónicas corresponde a F5? ________________________
Como pudiste notar en la tabla anterior, la frecuencia acumulada nos permite determinar
el número de llamadas menor o igual que el límite superior de la clase correspondiente,
por lo tanto a esta columna la podemos significar con el término menor que.
Si queremos determinar el número de llamadas mayor que, lo que tenemos que hacer es
desacumular la frecuencia y para ello en lugar de sumar restamos al número de
observaciones (n) la frecuencia de la clase (f i) correspondiente.
Veámoslo en la tabla del ejemplo anterior.
1 2 3 4 5 6 7 8
MARCA DE FREC. FREC. Fi ACUMULADA FREC. RELAT.
CLASES CLASE (Mi) ABS. (fi) REL. (fr) menos que más que menos más
20-25 22.5 10 0.17 10 50 0.17 .83
26-31 28.5 17 0.28 27 33 0.45 .55
32-37 34.5 8 0.13 35 25 0.58 .42
38-43 40.5 10 0.17 45 15 0.75 .25
44-49 46.5 6 0.10 51 9 0.85 .15
50-55 52.5 4 0.07 55 5 0.92 .08
56-61 58.5 5 0.08 60 0 1.00 .00
Total 60 1.00
La columna 7 correspondiente a “más que” se interpreta de la siguiente forma: para

F = 15 significa que 15 de los 60 días que se analizan, tuvieron un número de llamadas
mayor o igual a 44 y a este número de llamadas equivale al 25% del total.
Analiza la gráfica y contesta la siguiente pregunta.
Para F=25, ¿cuál es el número de llamadas que le corresponden y a qué porcentaje

pertenecen?
64
En el siguiente problema elabora las 10 columnas de la tabla de frecuencias y explica lo

que se deduce de las clases 3 y 5.
En la caseta de cobro de la autopista a Pachuca ingresaron durante las 48 horas del 19

de septiembre, después del puente, el número de vehículos por hora que a continuación
se indica:
13 19 22 14 13 16 19 21
23 11 27 25 17 17 13 20
23 17 26 20 24 15 20 21
10 22 18 25 16 23 19 20
21 17 18 24 21 20 19 26
Con los ejemplos anteriores pudiste notar que la tabla de frecuencias nos permite inferir
ciertos conocimientos de la variable que se analiza.
Otra forma de analizar la información e inferir ciertos conocimientos, es mediante la

representación gráfica de los mismos.
65
2.2 GRÁFICAS
Al representar en una gráfica la información concentrada en la tabla de frecuencias, ésta

es un recurso visual que nos permite tener una idea clara, precisa, global y rápida acerca
de las observaciones de una muestra o población.
Existen muchos tipos de gráficas en las que se pueden representar la frecuencia

absoluta (fi), relativa (fr) y acumulada (Fi) y con ellas podemos estimar algunos valores
con la simple observación.
Los diferentes tipos de gráfica que podemos usar para representar las observaciones de
un determinado problema y la selección de este tipo, dependen de la variable en estudio.
Si la variable en estudio es del tipo cualitativo, los gráficos pueden ser:
a) De barras; horizontales o verticales.

b) Circulares.
c) Pictogramas, etcétera.
Si la variable en estudio es de tipo cuantitativo, los gráficos que podemos usar para su
representación gráfica son:
a) Histogramas.
b) Polígonos de frecuencias que a continuación analizaremos.
2.2.1 HISTOGRAMA Y POLÍGONO DE FRECUENCIAS.
El histograma es la forma más usual para analizar las características observables de una
variable continua.
Definición
Histograma es la representación gráfica en el plano coordenado de las

características concentradas en la tabla de frecuencias de una variable continua.
Para trazar el histograma, la secuencia de operaciones es:
1. En los ejes coordenados del plano cartesiano representamos los datos de la

siguiente forma:
a) En el eje de las abscisas (horizontal) se representan las clases con sus límites
reales de clase y las marcas de clase (Mi) de cada intervalo.
b) En el eje de las ordenadas (vertical) representamos las frecuencias absolutas en

que ocurre la variable.
66
2. Por los límites reales superior e inferior de cada clase se trazan barras verticales
que se cortan mediante una horizontal que se traza a la altura del punto
correspondiente a la frecuencia de cada clase.
3. Por la naturaleza continua de la variable, los rectángulos se trazan adyacentes, toda

vez que en esta forma se debe dividir el eje horizontal.
4. El área representada por cada barra es equivalente a la proporción de la frecuencia

del intervalo de clase correspondiente con respecto al total.
11. Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la

antigüedad de sus trabajadores, por lo que le indica al gerente de personal que
realice un análisis del problema.
El gerente de personal recabó de los expedientes la siguiente información sobre los

años de antigüedad:
13, 19, 22, 14, 13, 16, 19, 21

23, 11, 27, 25, 17, 17, 13, 20
23, 17, 26, 20, 24, 15, 20, 21
23, 17, 29, 17, 19, 14, 20, 20
10, 22, 18, 25, 16, 23, 19, 20
21, 17, 18, 24, 21, 20, 19, 26
Con esta información decidió representarlos en una gráfica (histograma). Recuerda

la secuencia de operaciones que establecimos:
1. Ordenamos los datos en sentido creciente:
10, 11, 13, 13, 13, 14, 14, 15, 16, 16, 17, 17, 17, 17, 17, 17, 18,
18, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21,
22, 22, 23, 23, 23, 23, 24, 24, 25, 25, 26, 26, 27, 29.
2. Calculamos el rango R, para ello determinamos los valores mayor y menor de las
puntuaciones.
Xn = 29
Xi = 10
3. Calculamos R = Xn – X1 = 29 – 10 = 19
R = 19
67
4. Calculamos el número de clases (K), para ello determinamos (n)
N = 48; K = 1 + 3.322 log48 = 1 + 3.322 (1.68) = 1 + 5.58 = 6.58 K = 7
5. Determinamos la amplitud de cada clase (A)
A= R = 19 = 2.7  A=3
K 7
Se han redondeado los valores de K y A porque el número de clases y la amplitud

de la clase nunca serán fraccionarios.
6. Determinamos cada intervalo de clase y para ello calculamos los límites de clase y
los registramos en la primera columna de la tabla.
Números de años cumplidos de antigüedad de los obreros de la empresa

“Conductores Monterrey”, hasta el 30/IX/1993.
1 2 3 4 5 6 7 8
FRECUENCIA ACUMULADA
LÍMITES P. MEDIO FREC. FREC. F F30
CLASES REALES DE CLASE (fi) (fr) MENOR Q MAYOR Q Fr
(MI)
10-12 9.5-12.5 11 2 0.042 2 46 0.042
13-15 12.5-15.5 14 6 0.125 8 40 0.167
16-18 15.5-18.5 17 10 0.208 18 30 0.375
19-21 18.5-21.5 20 16 0.333 34 14 0.708
22-24 21.5-24.5 23 8 0.167 42 6 0.875
25-27 24.5-27.5 26 5 0.104 47 1 0.979
28-30 27.5-30.5 29 1 0.021 48 0 1.00
Total 48 1.000
Información investigada por el gerente de personal de la empresa.
Trazamos los ejes del plano coordenado, fijamos una escala para cada eje y
representamos en el vertical las frecuencias y en el eje horizontal las clases.
La mayor frecuencia es f4 = 16 por lo que con la escala establecida en cm. Marcamos 16

divisiones en el eje vertical.
En el eje horizontal no es necesario iniciar por el cero, en nuestro ejemplo podemos

iniciar a partir de 9, indicando que se trunca una parte del eje horizontal.
68
fi
15
10
0 x
10 15 20 25 30
Gráfica No. 1
Analiza la gráfica anterior y piensa que eres el gerente general. Explica con tus propias
palabras toda la información sobre la antigüedad de los obreros, que puedas inferir de
ella.
Comenta tus resultados con tu profesor o asesor de contenido.
Las líneas verticales punteadas corresponden al punto medio o marca de clase y éste
nos indica el promedio de las puntuaciones en cada clase.
En nuestro ejemplo para la tercera barra, el promedio en años cumplidos de los obreros
de la empresa ubicados en esa clase es de M3 =17 años y como la frecuencia es f 3 = 10
Obreros con la misma antigüedad.
Otra gráfica que permite describir los datos de una distribución de frecuencias es el
polígono de frecuencias.
69
2.2.2 POLÍGONO DE FRECUENCIAS
El polígono de frecuencia se construye a partir de los datos de la tabla de frecuencias.

Sobre el eje horizontal se levanta por el punto medio segmentos verticales punteados
que terminan a la altura de su frecuencia de clase, se unen los puntos superiores con un
segmento de recta que empieza medio punto antes del límite superior de la última clase.
De nuestro ejemplo anterior obtenemos:
POLÍGONO DE FRECUENCIAS
fi
15
10
0 x
8 10 15 20 25 30
Gráfica No. 2
Otra forma de trazar el polígono de frecuencias es:
a) Sobre el histograma se trazan segmentos punteados que inician en el punto medio de

clase y terminan a la altura del rectángulo.
b) Se unen los puntos finales de éstos segmentos con una línea continua que inicia
medio punto antes del límite inferior de la primera clase y termina medio punto
después del límite superior de la última clase (ver Gráfica No. 1).
Si en la escala vertical en lugar de representar las frecuencias absolutas, representamos

la frecuencia relativa, obtenemos un polígono de frecuencia acumulada.
70
Veámoslo en el mismo ejemplo anterior.
POLÍGONO DE FRECUENCIA ACUMULADA RELATIVA (Fr)

Fr
1.0
0.5
0 x
10 15 20 25 30
Gráfica No. 3
Analiza la gráfica e indica toda la información que puedes obtener.
Si observas las gráficas 2 y 3 harás notado que son muy parecidas y su tamaño
dependerá de la escala que se use.
Si los intervalos de clase se toman cada vez más pequeños, entonces los puntos se
unen con segmentos curvos que van suavizando la forma del polígono de frecuencias
hasta tomar una forma parecida a la siguiente gráfica.
fr
x
0 
Gráfica No. 4
71
Al graficar las columnas 6 y 7 de la tabla de frecuencias de nuestro ejemplo,
correspondientes a la frecuencia acumulada, obtenemos otras gráficas diferentes a las
anteriores.
2.2.3 POLÍGONO DE FRECUENCIA ACUMULADA
La gráfica de la frecuencia acumulada es muy útil porque en ella podemos determinar

cuántas observaciones hay por arriba o por debajo de algún valor que nos interese.
La gráfica que se obtiene de la frecuencia acumulada también se conoce con el nombre

de ojiva.
Para trazar dicha gráfica se procede como en los gráficos anteriores, es decir, en el eje
horizontal se trazan los intervalos de clase y marcas de clase y en el vertical las
frecuencias acumuladas.
De nuestro ejemplo tomando los datos de la tabla y las columnas 6 y 7 obtenemos:
POLÍGONO DE FRECUENCIA ACUMULADA (OJIVA MENOS QUE)

Fi
50
40
30
20
10
Años de
Antigüedad
en la
menos empresa
que 10 15 20 25 30
Gráfica No. 5
Analiza la gráfica y escribe con tus propias palabras la información que puedes deducir
de ella.
72
Ya vimos que al desacumular las frecuencias obtenemos la gráfica mayor que, tomamos
los datos de la columna 7 y obtenemos: la ojiva mayor que.
Fi
50
40
30
20
10
Años de
Antigüedad
en la
más
10 15 20 25 30 empresa
que
Gráfica No. 6
Analiza la gráfica y escribe en la línea el número de trabajadores que tengan una

antigüedad mayor que:
a) 10 años c) 18 años e) 25 años

b) 13 años d) 20 años f) 30 años
La variable del problema que hemos analizado es de tipo cuantitativa continua, si la

variable que analices es cuantitativa discreta, entonces puedes darle el mismo
tratamiento para el trazo de las gráficas o bien puedes prescindir de la columna número
2 y trazar el histograma con los saltos que da la variable de un intervalo a otro.
Traza la gráfica de la columna 8 de nuestro ejemplo (f r) y analiza la información que se

puede determinar de ella.
Ahora analizaremos las gráficas de problemas cuya variable sea cualitativa.
73
2.2.4 GRÁFICAS CIRCULARES, DIAGRAMAS DE BARRAS, PICTOGRAMAS Y
GRÁFICO DE LÍNEAS
Gráficas Circulares.
Una forma de representar datos u observaciones de una variable cualitativa es mediante

un diagrama circular.
Para trazar la gráfica, se hace una distribución proporcional de las frecuencias del
problema con respecto a la circunferencia determinando sectores circulares para cada
categoría.
12. El gobierno de la ciudad de México promocionó cursos dominicales para todas las
personas que quieran aprender alguna habilidad artesanal o artística; los cursos se
realizarán de 8:00 a 12:00 hrs. Las inscripciones quedan abiertas todo el mes de
septiembre.
Al final del mes, la inscripción fue la que se muestra en la siguiente tabla:
CURSOS No. DE PARTICIPANTES (fr)

Música 250
Pintura 350
Danza 200
Tejido 400
Bordado 100
Ajedrez 500
Total 1800
Para distribuir cada clase en la circunferencia se aplica una regla de tres simple
relacionando el total de inscritos (1800) a 360º que tiene la circunferencia y de esta
relación determinamos la parte que le corresponde a cada curso.
El planteamiento de cada distribución es:
1800 es a 360º
como 250 es a x
1800 360º
250 x
74
Recuerda que para hallar el resultado se multiplica como se indica con las flechas y se
despeja la incógnita, obteniendo:
1800x = 360º (250)
360 (2500)
x   50
1800
De la misma forma calcula los demás valores.
Los resultados que debiste obtener son los que se muestran en la tabla:
CATEGORÍAS FRECUENCIA (fI) GRADOS

Música 250 50º
Pintura 350 70º
Danza 200 40º
Tejido 400 80º
Bordado 100 20º
Ajedrez 500 100º
Total 1800 360º
Para representarlos en el círculo, medimos los sectores con un transportador y trazamos

las divisiones.
1. Alumnos inscritos en los cursos dominicales.

2.
Gráfica No 7
Para hacer resaltar las regiones, éstas se sombrean de diferente tono.
75
Una forma más útil de representar las regiones de cada categoría es distribuyéndolos en
un porcentaje y para ello la regla de tres que se plantea, se relaciona 360º representa el
100% y en base a ésta se determina el porcentaje que le corresponde a los grados de
cada categoría (curso); veamos el planteamiento:
360º es a 100 360º es a 100
como 50º es a x como 70º es a x
360º 100 360º 100
50º x 70º x
360ºx = 50º (100) 360ºx = 70º (100)

50 (100) 500 70 (100) 700
x   x  
360 36 360 36
x = 13.9% x = 19.4%
De la misma forma, calcula los demás valores.
Los resultados que debiste obtener son los de la siguiente tabla:
CATEGORÍAS FRECUENCIA (fI) GRADOS %

Música 250 50º 13.9
Pintura 350 70º 19.4
Danza 200 40º 11.1
Tejido 400 80º 22.2
Bordado 100 20º 5.6
Ajedrez 500 100º 27.8
Total 1800 360º 100.0
Para la representación gráfica se divide el círculo con un transportador de acuerdo a los

grados que le corresponde a cada categoría, pero ahora se registra el porcentaje.
76
1. Alumnos inscritos en los cursos dominicales:
Gráfica No. 8
Información obtenida por el coordinador de los cursos dominicales.
Del siguiente problema representa los datos en una gráfica circular indicando el
porcentaje correspondiente a cada categoría.
Un transporte cargó su camión con los siguientes productos:
Producto A – 450 kg.

Producto B – 300 kg.
Producto C – 500 kg.
Producto D – 1600 kg.
Producto E – 1750 kg.
77
Diagramas de Barras
Otra forma de representar gráficamente las puntuaciones de un problema, es mediante

una gráfica de barras.
Para construir una gráfica de barras se trazan ejes coordenados; en el eje horizontal se
representan los valores de la variable y se traza un segmento perpendicular por cada
valor. Si se usan barras, éstas deberán tener el mismo ancho de la base.
En el eje vertical se representa la frecuencia de cada clase usando una escala

conveniente para cada puntuación. La frecuencia marca la altura de cada segmento
perpendicular o barra.
13. El profesor de estadística usa una escala de clasificación del 5 al 10, aprobatoria a
partir de 6. Cualquier calificación reprobatoria se refleja en un 5.
Las calificaciones obtenidas del grupo A son las que se muestran en la tabla
siguiente:
Calificación 5 6 7 8 9 10
No. de Alumnos 3 8 12 8 5 4
Representa la información en una gráfica de barras, usando segmentos y barras.
CALIFICACIÓN DEL GRUPO A

fi
15
10
Calificación
0 5 6 7 8 9 10
Gráfica No. 9
Diagrama de segmentos verticales.
78
CALIFICACIÓN DEL GRUPO A
fi
15
10
Categorías
0 5 6 7 8 9 10
Gráfica No. 10
Diagrama de barras.
Otra forma de representar la información es mediante barras horizontales, en este caso

se invierten las escalas, es decir, en el eje horizontal se representan las frecuencias y en
el vertical los valores de la variable.
Veamos cómo quedaría la gráfica del problema anterior.

CALIFICACIONES DEL GRUPO A
C
10
fi
0
5 10
Gráfica No. 11
79
Representa el mismo problema en una gráfica de barras horizontales y contesta las

siguientes preguntas:
a) ¿Cuál es la variable del problema? ____________________________________________

b) ¿Qué tipo de variable es? ___________________________________________________
c) ¿En cuántas categorías se clasificó la variable? ________________________________
d) ¿Cuál es la frecuencia de la más alta calificación? ______________________________
Pictogramas
Es otra forma de representación gráfica de la información de un determinado problema.
En este tipo de gráfica se usa la imagen de la variable, por ejemplo:
a) Árboles: si la variable representa árboles.

b) Libros: si la variable representa libros.
c) Casas: si la variable representa casas.
d) Figuras de personas: si la variable son personas, etcétera.
14. El regente de la ciudad de México envió a 5 delegaciones el siguiente número de

árboles para reforestar su zona:
1. Gustavo A. Madero 5000 árboles

2. Venustiano Carranza 3000 árboles
3. Cuauhtemoc 4000 árboles
4. Cuajimalpa 6000 árboles
5. Benito Juárez 7000 árboles
80
La representación gráfica de la variable mediante un pictograma es la que se muestra a
continuación:
No. DE ÁRBOLES
DELEGACIÓN (en miles)
Gustavo A. Madero
Venustiano Carranza
Cuauhtemoc
Cuajimalpa
Benito Juárez
Para poder determinar la cantidad de elementos que representa el pictograma, se le

asigna un valor a la figura representativa. En nuestro ejemplo cada árbol representa a
mil de éstos.
En el siguiente problema representa los datos de la variable mediante un pictograma.
Se hizo una investigación del crecimiento poblacional del municipio de Teteles de Ávila
Castillo, Estado de Puebla, la información obtenida de los archivos son:
AÑO No. HABITANTES

1985 8000
1986 9000
1987 10000
1988 11000
1989 12000
1990 13000
81
Gráfico de Líneas
Una forma de representar gráficamente los valores de la variable de un problema en

estudio, es mediante un gráfico de líneas.
Para trazar la gráfica de líneas se usa el plano coordenado; en el eje horizontal se

representa a la variable y en el eje vertical la frecuencia. Se determinan los puntos de
corte del valor de la variable con su frecuencia y se unen estos puntos obteniéndose la
gráfica de línea que nos muestra con claridad los cambios que experimentó la variable.
15. La producción en la segunda semana de septiembre obtenida por un obrero

calificado que opera un torno revólver, con el que produce tornillos de cuerda
milimétrica, es la siguiente:
DÍA CANTIDAD
Lunes (L) 4000
Martes (Ma) 5500
Miércoles (M) 6000
Jueves (J) 6500
Viernes (V) 5500
Producción de tornillos del obrero Pedro Rodríguez obtenida en la segunda semana de

septiembre.
fi
5000
1000
Días de la
semana
L Ma M J V
Gráfica No. 12
Elaboró el jefe de taller de la empresa.
82
a) ¿Cuál es la variable del problema? ____________________________________________
b) ¿Qué tipo de variable es? ____________________________________________________
c) ¿En cuántas categorías se agrupa la variable? __________________________________
d) ¿En qué día hubo mayor producción? _________________________________________
Traza un gráfico de líneas y contesta las preguntas que se plantean.,
El número de adultos alfabetizados en el estado de Hidalgo son los siguientes:
AÑO No. ADULTOS

1985 40,000
1986 50,000
1987 60,000
1988 55,000
1989 50,000
a) ¿Cuál es la variable del problema? __________________________________________
b) ¿Qué tipo de variable es? __________________________________________________
c) ¿En cuántas categorías se agrupa la variable? ________________________________
d) ¿En qué año hubieron mejores resultados? ___________________________________
83
EXPLICACIÓN INTEGRADORA
DATOS AGRUPADOS
FINITA POBLACIÓN INFINITA
MUESTRA
VARIABLE
CUALITATIVA CUANTITATIVA
NOMINAL ORDINAL
DISCRETA CONTINUA
ESCALA ESCALA
NOMINAL ORDINAL
ESCALA POR
GRÁFICOS INTERVALOS
TABLAS DE
FRECUENCIA
CIRCULAR
BARRAS
ABSOLUTA RELATIVA ACUMULADA ACUMULADA
RELATIVA
LÍNEAS
PICTOGRAMA
GRÁFICOS
HISTOGRAMA POLÍGONO DE OJIVA MENOS OJIVA MÁS

FRECUENCIA QUE QUE
84
RECAPITULACIÓN
Hasta aquí hemos visto los conceptos de población, muestra y con ellas los tipos de
variables que nos permiten seleccionar muestras mediante el manejo de tablas para
identificar las situaciones que corresponden a cada tipo de estadística, ya sea inferencial
o descriptiva, para advertir la importancia de las distribuciones de frecuencia de los datos
y conseguir distribuciones de frecuencia simples, con intervalos, acumuladas y
porcentuales acumulativas, para representar gráficamente las distribuciones de
frecuencia dadas.
85
ACTIVIDADES INTEGRALES
Con la finalidad de reafirmar tus conocimientos adquiridos en este capítulo, resuelve los
siguientes ejercicios.
1. Es la muestra que contiene elementos con la misma oportunidad de ser

seleccionados. _____________________________________________________________
2. Es una muestra que conserva las características esenciales de la población

estudiada. _________________________________________________________________
3. Variable que no tiene orden y se ocupa de un atributo. __________________________
4. Es la variable que tiene asociados un valor numérico dentro de un intervalo de

números reales. ____________________________________________________________
5. La siguiente tabla muestra los pesos (en libras), de 40 estudiantes en la Universidad

del Sur de California.
144 146 168 146 161 164 158 126 173 145
150 140 138 142 135 132 147 176 147 142
144 136 163 135 150 125 148 119 153 156
149 152 154 140 145 157 144 165 135 128
Organiza la información anterior mediante datos agrupados con clases y determina
a) Rango, número de intervalos y la amplitud de clase.

b) Concentrado de tabla de frecuencia (fi, fr, Fi, Fr).
c) Histograma y polígono de frecuencias para fi, Fr y Fi menos que.
86
AUTOEVALUACIÓN
Los resultados a los que debiste llegar son los siguientes:
1. Muestra Aleatoria.
2. Muestra Representativa.
3. Variable nominal.
4. Variable continua.
5. a) R = Xn – Xi = 176 – 119 = 57
K = 1 + 3.322 (log 40) = 6.322 ≈ 6
R 57
A= = ≈ 10
K 6
b) CLASES LÍMITES Mi Fi Fr Fi Fr
REALES
119-128 118.5-128.5 123.5 4 0.1 4 0.10
129-138 128.5-138.5 133.5 6 0.15 10 0.25
139-148 138.5-148.5 143.5 14 0.35 24 0.60
149-158 148.5-158.5 153.5 9 0.225 33 0.825
159-168 158.5-168.5 163.5 5 0.125 38 0.950
169-178 168.5-178.5 173.5 2 0.05 40 1.00
TOTAL 40 1.00
87
HISTOGRAMA Y POLÍGONO DE fi
fi
15
10
Límites
0 118.5 128.5 138.5 148.5 158.5 168.5 178.5 reales
POLÍGONO DE Fr
Fr
1.0
0.5
LR
0 118.5 128.5 138.5 148.5 158.5 168.5 178.5
88
OJIVA MENOS QUE
Fi
40
30
20
10
LR
0 118.5 128.5 138.5 148.5 158.5 168.5 178.5
89
RECAPITULACIÓN GENERAL
ANTECEDENTES DE LA ESTADÍSTICA
BOSQUEJO HISTÓRICO
FUNCIONES DE LA APLICACIONES
ESTADÍSTICA
CLASIFICACIÓN DE LA
CONCEPTOS ESTADÍSTICA
PRELIMINARES
CONCEPTOS BÁSICOS
PARA SU ESTUDIO
FINITA POBLACIÓN INFINITA
MUESTRA
VARIABLE
CUALITATIVA CUANTITATIVA
NOMINAL ORDINAL DISCRETA CONTINUA
ESCALA ESCALA ESCALA POR

NOMINAL ORDINAL INTERVALOS
TABLAS DE
FRECUENCIA
GRÁFICOS
ABSOLUTA RELATIVA ACUMULADA ACUMULADA

CIRCULAR
RELATIVA
DE BARRAS
GRÁFICOS
DE LÍNEAS
PICTOGRAMAS HISTOGRAMA POLÍGONO DE OJIVA MENOS OJIVA MÁS

FRECUENCIA QUE QUE
90
ACTIVIDADES DE CONSOLIDACIÓN
Se han preparado estos ejercicios para que reafirmes tus conocimientos adquiridos en
este fascículo, resuélvelos y si tienes alguna duda, consulta a tu profesor o asesor
académico.
1. Se tiene una urna con 50 esferas numeradas progresivamente. El experimento

consiste en sacar una esfera, anotar su número y devolverla a la urna.
a) ¿Cuál es la variable? _________________________________________________________
b) ¿La variable es cualitativa o cuantitativa? _______________________________________
c) Si podemos sacar una esfera por tiempo indefinido, entonces ¿cómo es la población?
____________________________________________________________________________
d) Si únicamente podemos hacer 100 extracciones, entonces, ¿cómo es la población?

____________________________________________________________________________
2. En el Plantel 2 del Colegio de Bachilleres ingresaron 8000 estudiantes. De estos se

seleccionaron 500 para estudiar las características que indican. Escribe en la línea
si la variable asociada está definida por una expresión o un número; determina si es
cualitativa o cuantitativa e indica el tipo de escala.
a) Estado de salud de cada alumno. ____________________________________________

b) Estatura de cada uno. ______________________________________________________
c) Número de estudiantes que ingresan. ________________________________________
d) Sexo de cada estudiante. ___________________________________________________
e) ¿Cuál es y cómo es la población? ____________________________________________
f) ¿Cuál es la muestra? _______________________________________________________
g) Se escogen los 10 primeros lugares en puntuación. ____________________________
91
3. En la Fuerza Aérea Mexicana, los aviadores toman un examen médico general en
cada 150 horas de vuelo, por lo que se analizan los expedientes de cada piloto para
citarlos a su examen. Los resultados obtenidos se muestran en la siguiente tabla,
correspondientes a las horas de vuelo.
222, 220, 199, 212, 201, 217, 214, 213, 212, 215, 214,
196, 192, 208, 207, 212, 214, 209, 202, 206, 196, 202,
219, 194, 206, 204, 194, 211, 216, 209, 212, 216, 206,
201, 201, 210, 200, 206, 201, 205, 217, 219, 212, 207,
211, 204, 212, 212, 205, 207, 214, 211, 220, 205, 201,
218, 193, 199, 206, 209, 205, 205, 221, 216, 211, 204,
215, 203, 213, 207, 209, 197, 197, 199, 208, 209, 218,
204, 207, 202, 209, 195, 207, 209, 205, 210, 197, 209,
211, 208, 211, 198, 217, 209, 199, 192, 218, 193, 208,
209, 194, 211,
a) Ordena los datos en una tabla de frecuencias.
b) Calcula el rango de los datos.
c) Calcula el número de clase mediante la aplicación de la fórmula de Sturges K

= 1 + 3.322 log n
R
d) Calcula la amplitud del intervalo A =
K
e) Determina los límites de clase.
f) Determina los límites reales de clase.
g) Determina los puntos medios de clase Mi
h) Determina la frecuencia fi
i) Determina la frecuencia relativa fr
j) Determina la frecuencia acumulada Fi
k) Determina la frecuencia acumulada relativa.
l) Traza el histograma y el polígono de frecuencia.
m) Traza el polígono de frecuencia acumulada relativa (ojiva).
n) Traza el polígono de frecuencia acumulada menos que.
o) Traza el polígono de frecuencia acumulada más que.
p) Traza un gráfico circular.
92
4. Los subsidios que el gobierno federal distribuyó en el año de 1993 se muestran en la
siguiente tabla.
PARAESTATAL MILLONES EN NUEVOS PESOS

Azúcar 3,000
CONASUPO 4,000
I.M.S.S. 6,000
C.F.E. 8,000
PEMEX 10,000
A.S.A. 8,000
D.I.M. 7,000
F.A.M. 6,000
Ecología 4,000
C.R.M. 2,000
Con los datos de la tabla:
a) Construye un gráfico de barras verticales.

b) Un gráfico de barras horizontales.
5. La venta de libros de la librería de Cristal de los 5 años anteriores fueron los que se
muestran en la siguiente tabla.
1988 1989 1990 1991 1992

Matemáticas 500 1000 1500 2000 3000
Física 1000 500 2500 2000 1500
Química 500 1500 500 500 2000
Filosofía 500 500 1000 500 500
Leyes 1000 1500 2000 1000 500
Con los datos de la tabla elabora un pictograma.
6. El consumo en miles de libros de agua de una industria durante los primeros 10

meses del año de 1993 son los que se muestran en la siguiente tabla.
MES No. DE LITROS EN MILES

Enero 50
Febrero 58
Marzo 62
Abril 70
Mayo 80
Junio 85
Julio 80
Agosto 70
Septiembre 65
Octubre 60
Representa los datos de la tabla en un diagrama lineal.
93
AUTOEVALUACIÓN
Los resultados que debiste obtener en la solución de los problemas anteriores son los
siguientes:
Si algunos resultados no coinciden, entonces regresa a la unidad correspondiente,

repásala y aclara tus dudas con tu profesor o tu consultor académico.
1. a) La variable es el número de la esfera.

b) Es cuantitativa.
c) La población es infinita.
d) La población es finita.
2. a) Se define por una expresión (estado de salud) es de tipo cualitativo, es nominal,

es una variable discreta y la escala con que se cuantifica es nominal.
b) Se define por un número (número de centímetros), es de tipo cuantitativo, es una

variable continua y su escala con que se cuantifica es por intervalos.
c) Se define por un número, es de tipo cualitativo, es una variable discreta y su

escala de medición es por intervalos.
d) Se define por una expresión (sexo) es de tipo cualitativo nominal, es discreta: su

escala de medición es nominal.
e) La población está constituida por 8000 estudiantes, por lo tanto es una población
finita.
f) La muestra está constituida por 500 alumnos.
g) La variable está definida por una expresión (lugar que ocupó), es de tipo
cualitativo ordinal, la escala con que se cuantifica es ordinal y es una variable
discreta.
94
3. DATOS ORDENADOS
a)
192 192 193 193 194 194 194 195 196 196
197 197 197 198 199 199 199 199 200 200
201 201 201 201 201 202 202 202 203 204
204 204 204 205 205 205 205 205 206 206
206 206 206 207 207 207 207 207 207 208
208 208 208 209 209 209 209 209 209 209
209 210 210 211 211 211 211 211 211 211
212 212 212 212 212 212 212 213 213 213
214 214 214 214 215 215 215 216 216 216
217 217 218 218 218 219 219 220 221 222
b) R = Xn – X1 = 222-192 = 30 R = Rango
c) K = 1 + 3.322 log(102) = 1 + 3.322(2.008) = 1 + 6.67 = 7.67  8
K=8 K = Número de clases
R 30
d) A = = = 3.75  4 A = Amplitud de clase
K 8
e) f) g) h) i) j) k)
Límite de Límite real Punto Frecuencia Frecuencia Frecuencia Frecuencia
clase de clase Medio de Absoluta fr Relativa fr Acumulada Relativa
clase Fi Acumulada Fr
192-195 191.5-195.5 193.5 8 0.078 8 0.078
196-199 195.5-199.5 197.5 10 0.098 18 0.176
202-203 199.5-203.5 201.5 10 0.098 28 0.274
204-207 203.5-207.5 205.5 21 0.21 49 0.484
208-211 207.5-211.5 209.5 23 0.23 72 0.714
212-215 211.5-215.5 213.5 15 0.15 87 0.864
216-219 215.5-219.5 217.5 11 0.10 98 0.964
220-223 219.5-223.5 221.5 4 0.036 102 1.00
Total 102 1.00
95
l) HISTOGRAMA Y POLÍGONO DE FRECUENCIA
fi
23
21
15
11
10
8
0 191.5 195.5 199.5 203.5 207.5 211.5 215.5 219.5 223.5
m) POLÍGONO DE FRECUENCIA ACUMULADA RELATIVA
PUNTO MEDIO DE FRECUENCIA FRECUENCIA

CLASE ABSOLUTA RELATIVA
ACUMULADA Fi ACUMULADA FR
191.5 0 0.0
193.5 8 0.078
197.5 18 0.176
201.5 28 0.274
205.5 49 0.484
209.5 72 0.714
213.5 87 0.864
217.5 98 0.964
221.5 102 1.00
96
Fr
1.00
0.5
x
0
191.5 193.5 197.5 201.5 205.5 209.5 213.5 217.5 221.5
n) OJIVA MENOS QUE

CLASE ABSOLUTA fi ABSOLUTA
ACUMULADA Fi
191.5 0 0
193.5 8 8
197.5 10 18
201.5 10 28
205.5 21 49
209.5 23 72
213.5 15 87
217.5 11 98
221.5 4 102
97
Fi
102
98
87
72
49
28
18
8
x
0
191.5 193.5 197.5 201.5 205.5 209.5 213.5 217.5 221.5
menos que  Horas de vuelo
o) OJIVA MÁS QUE

CLASE ABSOLUTA fi ACUMULADA
MÁS QUE
193.5 8 102
197.5 10 94
201.5 10 84
205.5 21 74
209.5 23 53
213.5 15 30
217.5 11 15
221.5 4 4
223.5 0 0
98
Fi
102
94
84
74
53
30
15
4
x
0
193.5 197.5 201.5 205.5 209.5 213.5 217.5 221.5 223.5
más que  Horas de vuelo
p) DIAGRAMA CIRCULAR DE LAS HORAS DE VUELO
202-203
(10)
204-207 196-199
(21) (10)
192-195
(8)
220-223
(4)
208-211 216-219
(23) (11)
212-215
(15)
99
9.8%
20.6% 9.8%
7.8%
3.9%
22.5%
10.8%
14.7%
4. a) GRÁFICO DE BARRAS VERTICALES
$1000
10
0
1 2 3 4 5 6 7 8 9 10
100
b) GRÁFICO DE BARRAS HORIZONTAL
1. Azúcar
2. CONASUPO
1
3. I.M.S.S.
2
4. C.F.E.
3
5. PEMEX
4
6. A.S.A.
5 7. D.I.M.
6
8. F.A.M.
7 9. Ecología
8 10. C.R.M.
9
10
$1000
0
2 4 6 8 10
5) PICTOGRAMA
Cada paquete representa 500 libros

500
1988 1989 1990

Matemáticas
Física
Química
Filosofía
Leyes
101
6) DIAGRAMA LINEAL
N° de lts
en miles
100
50
10
1 2 3 4 5 6 7 8 9 10
1. Enero 6. Junio
2. Febrero 7. Julio
3. Marzo 8. Agosto
4. Abril 9. Septiembre
5. Mayo 10. Octubre
102
ACTIVIDADES DE GENERALIZACIÓN
Realiza los siguientes ejercicios, ya que la solución de éstos te permitirá conocer tu

grado de aprendizaje.
1.- Las siguientes cifras corresponden al peso en kilogramos de 1000 bultos que salen
de una fábrica. Para éste conjunto de datos, realiza lo siguiente:
Clase fi Mi fr Fi menor que Fr

57.5 – 59.5 6
59.5 – 61.5 13
61.5 – 63.5 40
63.5 – 65.5 96
65.5 – 67.5 175
67.5 – 69.5 180
69.5 – 71.5 190
71.5 – 73.5 175
73.5 – 75.5 70
75.5 – 77.5 40
77.5 – 79.5 10
79.5 – 81.5 5
a) Completa la tabla anterior.
b) Construye el histograma y el polígono de frecuencias para fi, Fr y Fi menos que.
103
BIBLIOGRAFÍA CONSULTADA
FREUD E., John, Williams J., Frank, Perles M., Benjamin. Estadística para la
administración. Editorial Prentice Hall Hispanoamericana, S.A. México
G., HOEL Paul. Estadística elemental. Editorial CECSA. México, 1976.
KREYSZING, Erwin. Introducción a la estadística matemática. Editorial Limusa.

México, 1981.
LINCOLN L., Chao. Introducción a la estadística. Editorial CECSA,. México, 1985
MENDENHALL, William. Introducción a la probabilidad y la estadística. Traductor

Segami Carlos.
PARSEN, Emanuel. Teoría moderna de probabilidad y sus aplicaciones. Editorial

Limusa. México, 1973.
SEYMOUR Lipschutz. Ph. D. Teoría y problemas de probabilidad. Editorial McGraw-Hill.

México, 1973.
STEVENSON, William J. Estadística para administración y economía. Editorial Harla.

México, 1981.
TARO, Yamane. Estadística. Editorial Harla, 3ª. edición. México, 1979.
WILLOUGHBY, Stephens. Probabilidad y estadística. Publicaciones Culturales, S.A.

México, 1983.
104
E INFERENCIAL I
FASCÍCULO 2. MEDIDAS DESCRIPTIVAS
Autores: Juan Matus Parral

Carlos Velez Carmona
1
2
ÍNDICE
INTRODUCCIÓN 5
PROPÓSITO 7
CAPÍTULO 1. MEDIDAS DESCRIPTIVAS 9
1.1 MEDIDAS DE TENDENCIA CENTRAL 9
1.1.1 MODA 11
1.1.2 LA MEDIANA 15
1.1.3 LA MEDIA 18
1.1.4 LA MODA DE DATOS AGRUPADOS 20
1.1.5 CÁLCULO DE LA MEDIANA DE DATOS

AGRUPADOS 24
1.1.6 LA MEDIA DE DATOS AGRUPADOS 25
1.2 MEDIDAS DE DISPERSIÓN O

VARIABILIDAD 32
1.2.1 RANGO 32
1.2.2 LA DESVIACIÓN MEDIA 33
1.2.3 LA VARIANZA 40
1.2.4 DESVIACIÓN ESTÁNDAR 44
3
1.3 MEDIDAS DE TENDENCIA CENTRAL Y DE
DISPERSIÓN EN CURVAS DE
FRECUENCIAS 50
1.3.1 CURVAS SIMÉTRICAS 50
1.3.2 MOMENTOS O CURTOSIS 51
1.3.3 CURVAS ASIMÉTRICAS 54
1.3.4 SESGO 56
RECAPITULACIÓN 60
AUTOEVALUACIÓN 62
4
INTRODUCCIÓN
La estadística como una de las ramas de la Matemática, nos ayuda a organizar la

información obtenida en la investigación de campo de una población o muestra.
Una manera de organizar esta información son las tablas de frecuencias. Las tablas de
frecuencia son una síntesis de la información que nos facilita su representación gráfica
en un histograma o polígono de frecuencias.
La gráfica nos facilita el análisis e interpretación de la información, la relación de los

parámetros de tendencia central: Moda (Mo), Mediana (Me) y Media (x) y la relación de
los parámetros de tendencia central con los de dispersión: Desviación media (DM);
2
Rango, Varianza (S ) y desviación estándar (S).
La gráfica también nos muestra con claridad, la íntima relación que hay entre los
parámetros de dispersión y cómo influyen éstos en su forma, dando como resultado
gráficas:
a) Simétricas, o
b) Asimétricas.
La forma e inclinación de la gráfica conocida como curtosis nos permite visualizar hacia
donde se dispersan los datos (el sesgo).
En síntesis: la gráfica nos facilita el análisis y la interpretación de la información al

representarla en forma sencilla y compacta.
En este fascículo aprenderás a cuantificar e interpretar la información de cualquier

problema de investigación.
5
6
PROPÓSITO
La investigación científica y tecnológica ha dejado de ser una actividad de laboratorio.

En la actualidad toda actividad o actitud humana, todo funcionamiento de una máquina
debe estudiarse y analizarse con la finalidad de determinar si el funcionamiento de la
máquina es óptimo, si la actuación o características de las personas son las deseadas.
El conocimiento que se deduce de cada estudio, nos permite hacer correcciones que nos
garanticen el logro de las metas fijadas en las políticas de trabajo de una empresa, de un
laboratorio, etcétera.
¿QUÉ APRENDERÁS?
Los conceptos estadísticos importantes aplicados en el estudio de

cualquier fenómeno.
Por medio de los elementos metodológicos fundamentales que te

permitan abordar el importante estudio de cualquier fenómeno.
7
Para el análisis de cualquier fenómeno en el que quieras incursionar y

conocerlo, para que de ésta forma puedas tomar una decisión
acertada.
Los conceptos que aparecen en el índice te permitirán una aventura agradable e

interesante, pasando momentos satisfactorios como los que vive todo científico cuando
encuentra la comprobación de su hipótesis.
8
CAPÍTULO 1
MEDIDAS DESCRIPTIVAS
1.1 MEDIDAS DE TENDENCIA CENTRAL
LE BOUTIQUE DE
MADAME LAGUSSI
Figura 1.
El sexo femenino suele vestir muy a la moda y esto se refleja en las ventas del mes de
mayo en la casa de modas de Madame Lagussi.
9
M. Lagussi al hacer un balance obtuvo los siguientes resultados:
VENTAS DEL MES DE MAYO
Tipo de vestido No. de vestidos vendidos

Suare 6
Corte de Princesa 8
Traje de Novia 6
Short 2
Maternidad 1
Bermudas 5
Minifaldas 10
Traje sastre 4
Vestido de cocktel 3
De acuerdo con esta información, ¿Qué tipo de ropa crees que esté de moda?
En toda actividad humana se presentan muchos problemas que se pueden analizar y

estudiar en forma sistemática y lógica.
El estudio de estos problemas nos permiten tomar decisiones acertadas que nos
conducen a lograr metas importantes de progreso.
La información que se obtiene de un determinado problema en estudio como el del

ejemplo anterior, se resume mediante adecuadas descripciones estadísticas que
llamamos medidas descriptivas, las cuales se estudian en la estadística descriptiva.
En la estadística descriptiva:
1. Se define cuidadosa y completamente la situación que se está investigando.
2. Se obtiene una muestra de datos de una población apropiada siguiendo un
procedimiento establecido y adecuado.
Las medidas descriptivas son de tres tipos, pero en este fascículo únicamente
estudiaremos los dos primeros tipos.
a) Medidas de Tendencia Central (la moda, la mediana, la media aritmética y el punto

medio de la amplitud).
b) Medidas de Dispersión o de Variación (rango, desviación media, varianza y

desviación estándar).
c) Medidas de posición (cuartil, decil y centil). Sirven para describir la localización de

un dato específico en relación con el resto de la muestra.
10
Medidas de Tendencia Central o de Posición.
Son valores numéricos que tienden a localizar en algún sentido la parte central de un
conjunto de datos. Se les asocia el término promedio a cada una de ellas.
Las medidas de tendencia central son:

a) La Moda (Mo).
b) La Mediana (Me).
c) La Media aritmética X  .
d) Punto medio de la amplitud.
En esta unidad aprenderás el cálculo y aplicación de estas medidas. En estadística se

usa el concepto de Moda (Mo) y representa lo mismo que dedujiste en el problema
anterior.
En este ejemplo, el tipo de ropa con mayor frecuencia de venta es la minifalda, porque la
frecuencia f = 10 es la mayor. En este caso denotamos Mo = minifalda.
Esta variable aleatoria describe una cualidad como en nuestro ejemplo (minifalda); pero
también describe una cantidad representada por un valor numérico, como ya veremos.
1.1.1 MODA
La Moda (Mo) de un conjunto de datos es el valor (o cualidad) de la

variable aleatoria que aparece con mayor frecuencia.
Ejemplos:
1. En la conferencia que se llevó a cabo en el hotel María Isabel Sheraton para altos
ejecutivos, cuyo tema fue: “El tratado de libre comercio”; la asistencia fue la siguiente:
Día No. de personas

Lunes 20
Martes 15
Miércoles 16
Jueves 16
Viernes 18
Sábado 16
Domingo 25
11
a) ¿Cuál es la moda de la asistencia?
b) ¿Qué tipo de variable es esta moda?
c) ¿Qué día fue la moda de asistencia?
d) ¿Qué tipo de variable aleatoria es el día de moda de asistencia?
R.
a) La moda de la asistencia es Mo = 16.
b) El tipo de variable es de cantidad.
c) El día con mayor frecuencia en asistencia fue Mo = domingo.
d) El tipo de variable es de cualidad.
2. En el entrenamiento de un equipo de básquetbol, los 5 jugadores estrella, dentro de

los ejercicios de entrenamiento diario, deberán correr diariamente 5 minutos a toda su
velocidad, tratando de rebasar diariamente su marca. Veamos el kilometraje del
lunes:
Núm. de jugador Recorrido en km

1 8
2 5
3 7
4 3
5 6
¿Cuál es la moda del recorrido?
R.
Como pudiste notar, en este ejemplo no hay moda porque ninguna distancia recorrida se
repite. Esto siempre ocurre; es decir, si tienes un conjunto de datos en el cual cada dato
aparece una sola vez, se dice que no hay moda.
3. El número de libros vendidos en la librería Acuario en la primera semana de clases

del semestre 93B, registró las siguientes cantidades:
Día No. de libros vendidos

Lunes 150
Martes 200
Miércoles 180
Jueves 200
Viernes 275
Sábado 200
Domingo 300
12
a) ¿Qué día fue la moda en ventas?
b) ¿Cuál es la moda en ventas?
R.
a) El día de moda en ventas fue el domingo porque la frecuencia en ventas es la mayor
de todas, Mo = domingo.
b) La moda en ventas es Mo = 200 porque es la cantidad que aparece con mayor

frecuencia.
Como ya quedó definido, la variable aleatoria puede ser de cualidad o de cantidad. En

este ejemplo lo hacemos notar nuevamente: fijaremos la variable dependiendo del
interés que tengamos.
4. En un equipo de fútbol las estaturas del cuadro campeón son:
Delanteros 1.70 1.80 1.85 1.75 mts.

Medios 1.70 1.75 mts.
Defensas 1.75 1.70 1.75 1.70 mts.
Portero 1.88 mts.
¿Cuál es la moda de las estaturas?
R.
Analizamos la frecuencia de cada medida y obtenemos:
Estatura (mts) f
1.70 4 La moda de las estaturas es:
1.75 4
1.80 1 Mo = 1.70 mts.
1.85 1 Mo = 1.75 mts.
1.88 1
De acuerdo a la definición de moda vemos que esta variable aleatoria tiene dos modas
porque dos estaturas diferentes tienen la misma frecuencia y ésta es la mayor. En estos
casos la variable se llama modal.
La variable aleatoria que tiene moda se llama unimodal.

La variable aleatoria que tiene dos modas se llama bimodal.
La variable aleatoria que tiene tres modas se llama trimodal, etc.
13
Por lo tanto en el ejemplo anterior la variable aleatoria es bimodal por tener dos modas.
Multimodal es la variable aleatoria que tiene más de una moda. Es

unimodal si tiene solamente una.
Para cada uno de los ejercicios siguientes contesta las preguntas que se indican:
a) ¿Cuál es la variable aleatoria?

b) La moda es Mo =
c) ¿La moda es de cualidad o cantidad? ¿Por qué?
d) ¿La variable aleatoria es unimodal o multimodal? ¿Por qué?
1. Las calificaciones en estadística descriptiva obtenidas en un grupo de 20 alumnos

son; 7, 9, 10, 8, 6, 5, 4, 7, 9, 8, 5, 10, 9, 6, 7, 5, 4, 8, 9, 7.
2. En la fiesta de graduación de la generación 90-93 del Colegio de Bachilleres Plantel

No. 11, se hizo un análisis sobre el color del vestido, tomando como muestra al azar,
a las primeras 15 damas. Se obtuvieron los siguientes resultados: rojo, negro, azul,
blanco, rojo, verde, blanco, azul, amarillo, verde, gris, rojo, negro, azul, negro.
Recuerda que la moda es una medida de tendencia central porque su valor encuentra en
la proximidad de otros valores que también se localizan en la parte central de los valores
que toma la variable aleatoria. Estas son: la mediana (Me) y la media aritmética X  , de
las cuales nos ocuparemos en las secciones siguientes.
14
1.1.2 LA MEDIANA
GRADUACIÓN DE LA GENERACIÓN 2002

DEL COLEGIO DE BACHILLERES
Figura 2.
En la fiesta de graduación de la Generación 2002 del Colegio de Bachilleres se observó

el color del vestido de las primeras 25 damas que llegaron al salón de fiestas,
obteniéndose los resultados que se muestran en la siguiente tabla:
Color del vestido fi

Blanco 2
Negro 5
Rojo 7
Azul 6
Verde 3
Gris 1
Amarillo 1
total 25
Al ordenar los datos de la tabla en sentido creciente obtenemos: 1, 1, 2, 3, 5, 6, 7
De este ordenamiento puedes observar que el valor que está en el centro de todos los
datos es el número 3; este valor recibe el nombre de mediana. En este caso denotamos
Me = 3. En nuestro ejemplo corresponde al color verde del vestido.
15
Ejemplos:
5. Para el programa “Apoyo a la Universidad”, la Sria. de Hacienda y Crédito público,

publicó una lista de las empresas y el número de universidades del país que
recibieron recursos de aquellas. Dicha lista es:
Empresa A B C D E F G H I J K L M
Universidad 6 19 11 10 11 13 12 9 16 11 16 6 8
Al ordenar en sentido creciente el número de aportaciones por empresa, obtenemos:

6, 6, 8, 9, 10, 11, 11, 11, 12, 13, 16, 16, 19.
De este conjunto ordenado podemos ver que el número que se encuentra en el centro de
los datos es el 11 y por lo tanto Me = 11.
MEDIANA es el valor de la variable aleatoria que se encuentra en el centro

de un conjunto ordenado de datos.
Para determinar el valor de la mediana (Me) de un conjunto con (n) datos, si n es impar,
entonces aplicamos la fórmula:
n 1
(1)
2
En el ejemplo de las donaciones, n = 13, sustituyendo en ( 1 ) obtenemos:

13  1
7
2
El 7 indica el número de orden del elemento que representa la mediana que es Me = 11.
Si el número de datos ( n ) es un número par, entonces la mediana recae en los dos

valores centrales.
6. Para n = 50, sustituyendo en ( 1 )obtenemos:
50  1 51
  25.5
2 2
Este valor nos indica que la mediana se obtiene por la semisuma de los elementos
que ocupan los lugares 25° (vigesimoquinto) y 26° (vigésimo sexto).
16
7. El número de transacciones en dólares, realizadas por el Banco Nacional de México
er
durante los primeros días del mes de julio de 1993, fueron los siguientes: el 1 . día 9,
do
el 2 . día 13 y los siguientes días 12, 8, 3, 7, 14, 16, 18 y 17 respectivamente.
Determina la mediana (Me) de la variable aleatoria.

Al ordenar los datos en sentido creciente obtenemos 3, 7, 8, 9, 12, 13, 14, 16, 17, 18.
10  1 11
Aplicando la fórmula (1) para n= 10 obtenemos:   5.5
2 2
El valor obtenido nos indica que la mediana se obtiene por la semisuma de los
elementos que ocupan los 5º y los 6º Lugares o sea los valores 12 y 13.
12  13 25
Me    12.5
2 2
Me = 12.5
Este valor de la mediana nos indica que el valor central de los datos corresponde a 12.5
y como ya se dijo, si el número de datos es par, para determinar el valor de la mediana
se toma la semisuma de los dos valores centrales. También esto ilustra que la mediana
no es necesariamente un elemento del conjunto en cuestión.
En cada uno de los problemas siguientes determina la moda y la mediana de cada

conjunto de datos. Analiza los resultados e indica tus observaciones.
1. La oficina de correos de la Ciudad de México envió en el mes de julio, a diferentes

estados de la República, el siguiente número de paquetes: 78, 38, 47, 84, 49, 55,
42, 32, 66, 60, 94, 67, 6, 68, 70.
2. Las tallas más comunes de los vestidos que se vendieron en la boutique de Madame
Lagusy, en el mes de julio son: 7, 10, 14, 9, 14, 9, 18, 9, 16, 12, 14, 11, 14.
17
1.1.3 LA MEDIA
LAS DIEZ PRIMERAS FINALISTAS DEL CONCURSO

MISS UNIVERSO
Figura 3.
Las edades de las 10 primeras finalistas del Concurso de Belleza, son: 18, 19, 25, 19,
20, 21, 20, 22, 18 y 18 años, respectivamente. ¿Cuál es la edad del promedio X  de las
diez finalistas?
R.
Para poder determinar la edad promedio, hacemos una suma de las edades y el
resultado lo dividimos entre el número de finalistas.
18  19  2  19  20  21  20  22  18  18
X  20
10
X = 20
Este resultado nos dice que la edad promedio de las 10 finalistas del concurso Miss
Universo es de 20 años.
Ejemplos:
8. En la temporada pasada los equipos de fútbol que más goles anotaron fueron los
siguientes: El Atlante 47, el Pachuca 50, el América 45, el Guadalajara 39, el Cruz
Azul 38, el Necaxa 29, el Universidad 39, la U. de G. 42, el Toluca 44, el Querétaro
43 y el Puebla 46.
¿Cuál fue el promedio de goleo de la temporada pasada?
18
Para determinar la media aritmética X  o promedio de n datos, se suman
y el resultado se divide entre n.
De nuestro ejemplo obtenemos n = 11
47  50  45  39  38  29  39  42  44  43  46
X   42 goles
11
X = 42 goles: Promedio de goleo de la temporada pasada.
Si los valores de la variable los representamos con X 1, X2,.. , Xn entonces la

representación simbólica de la media es:
X1  X 2  . . . . . . .X n
X (2)
n
Esta expresión se puede representar en su forma más compacta si usamos el símbolo

( sigma), para expresar la suma de los valores de la variable, obteniéndose:
n
X
i 1
i
X (3)
n
Esta expresión indica que el numerador del segundo miembro existe una suma de la
variable X, el subíndice ( i ) indica que el valor de X es la variable y la anotación abajo y
arriba de  indica que el subíndice ( i ) toma valores desde i = 1 hasta i = n, es decir; la
suma se hace desde X = X 1 hasta X = X n.
9. En el informe de la sala de Urgencias del Hospital General sobre los pacientes

atendidos en la primera semana de julio, se obtuvieron los siguientes datos: Lunes
25, martes 24, miércoles 20, jueves 30, viernes 26, sábado 35 y domingo 29.
Determinar el promedio de pacientes atendidos en la semana.
Para obtener este promedio sustituimos los datos en la fórmula (3).
7
X1 = 25
X2 = 24
X
i1
i
25  24  20  30  27  35  28
X3 = 20 X    27
7 7
X4 = 30
X5 = 27 X = 27
X6 = 35
X7 = 28 El promedio semanal de atención de pacientes en la sala de urgencias
n=7 es de 27 pacientes.
19
En cada uno de los ejercicios siguientes, determina la Mo, Me y X , analiza tus

resultados, compáralos y expresa tus observaciones.
1. En el departamento de control de calidad se tomó una muestra al azar de 10 focos

para determinar el número de horas de vida de cada foco, obteniéndose los
siguientes datos:
N° de muestra 1 2 3 4 5 6 7 8 9 10
N° de horas 865 850 841 850 820 843 830 848 840 838
2. La producción de tornillos especiales elaborados por un empleado de la fábrica

Mecanican Falk en una de las semanas que se toma de muestra, fue la siguiente:
Día de la semana lunes martes miércoles jueves viernes sábado

No. de tornillos 240 225 215 208 295 230
Hasta este momento, hemos calculado las medidas de tendencia central (Mo = moda,
Me = mediana X = media) de datos no agrupados y esto se puede hacer debido a que
las muestras tomadas de la población son pequeñas. Si la muestra es grande entonces
es necesario agrupar los datos en tablas de frecuencias como ya lo estudiaste en el
fascículo anterior.
Ahora estudiaremos cómo determinar la moda, la mediana y la media para datos

agrupados.
1.1.4 LA MODA DE DATOS AGRUPADOS.
Para determinar la moda se construye una tabla de frecuencia como en el siguiente

ejemplo.
20
10. Un grupo de 40 alumnos, acumuló en un mes 43 retardos reportados en minutos en
la siguiente tabla.
Clase en minutos Frecuencia de retardos

1–3 3
4–6 5
7–9 8
10 – 12 12
13 – 15 6
16 – 18 5
19 – 21 4
Total 43
Con estos datos aplicamos la siguiente ecuación:
 d1 
Mo  Lr  A             ( 4 )
 d1  d 2 
Donde:
A = Intervalo de clase.
Lr = Límite real inferior de la clase modal.
d1 = frecuencia de la clase modal menos la frecuencia de clase anterior a la modal.
d2 = frecuencia de la clase modal menos la frecuencia de la clase siguiente.
Recordarás que la moda es el valor que se repite con mayor frecuencia. Para los datos
agrupados en clases, la moda es el valor que se encuentra en la clase de mayor
frecuencia y a esta clase se le llama clase modal.
Para aplicar la ecuación ( 4 ), el procedimiento es el siguiente:
1) En nuestra tabla de distribución de frecuencias visualizamos la clase modal y la

marcamos con doble raya, para no equivocarnos en la toma de datos, toda vez que
para aplicar la ecuación ( 4 ) toda la información está basada en esta clase.
2) Determinamos el límite real inferior de la clase modal Lr = 9.5
3) Calculamos d1 = 12 – 8 = 4
4) Calculamos d2 = 12 – 6 = 6
5) Calculamos A. Para el cálculo de A se resta al límite superior de cualquier clase,

menos el límite inferior y al resultado se le suma la unidad.
Para la clase modal de nuestro ejemplo: A = 12 – 10 + 1 = 2 + 1 = 3
Se sustituyen los datos en la fórmula y obtenemos:
Mo = 9.5 + 3 ( 4 ) = 9.5 + 1.2 = 10.7

10
21
La fórmula que hemos aplicado tiene su fundamento en el histograma que se obtiene al
graficar los datos; analicemos la siguiente gráfica:
frecuencia
14
13
12
11
10 d1=4
9 d2=6
8
3
A=3
2
X
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 clases
Linf = 9.5 LR Sup = 12.5
Mo = 10.7
Figura 4.
Analizando la gráfica vemos que el rectángulo mayor del histograma se localiza en la

clase modal cuyo límite real inferior de clase es Lr = 9.5
d1 es la distancia entre la frecuencia modal y la frecuencia de la clase anterior.
d2 es la distancia entre la frecuencia mayor y la frecuencia de la clase siguiente a la

modal.
A es intervalo de clase o amplitud de clase.
X es la distancia del límite real de clase al punto donde se localiza la moda; como estas
distancias son proporcionales, podemos establecer la siguiente proporción:
X = d1 d1
A d1 + d2  X=A d +d ........ ..(a)
1 2
22
La moda es igual a la suma de las siguientes distancias:
Mo = Lr + X ............ (b)
Sustituyendo ( a ) en ( b ) obtenemos:
d1
Mo = Lr + A d1 + d2 .................. (c)
Del ejemplo anterior podemos concluir que la moda de datos agrupados se puede
determinar de dos formas:
1. Aplicando la ecuación ( 4 )
2. Cálculo gráfico.
Para el cálculo gráfico, una vez graficado el histograma, se trazan las diagonales
uniendo los puntos superior derecho de los rectángulos de la clase modal y la clase
anterior y los puntos superior izquierdo de la clase modal y la clase siguiente a ésta. En
el punto donde se cortan las diagonales se traza una perpendicular al eje “X”. El punto
donde se cortan la perpendicular y el eje “X” es la moda de los datos agrupados.
En cada uno de los siguientes ejercicios, determina la moda (Mo) mediante la gráfica y
comprueba el resultado, aplicando la fórmula.
1. En un grupo de 60 alumnos se obtuvieron los siguientes resultados en su examen

final que contenía 20 reactivos. Los datos reportados son aciertos.
15,12,18,13,20,14,16,14,18,19,8,15
9,12,17,19,14,13,12,20,17,13,15,18
20,12,15,19,10,0,9,12,20,10,12,13
12,18,14,11, 20,11,10,9,13,18,15,17
19,12, 11,19,17,20,8,15,18,14,17,19
2. Las llamadas telefónicas diarias que una empresa hizo a sus clientes durante los dos
primeros meses del año fueron:
6,12,7,15,13,18,16,20,25,12,10,8
13,15,6,9,18,20,25,12,7,10,11,13
9,12,15,18,20,13,17,23,25,14,18,6
14,16,9,6,10,12,20,13,17,14,25,7
23
1.1.5 CÁLCULO DE LA MEDIANA DE DATOS AGRUPADOS.
La mediana (Me) de un conjunto de observaciones, agrupados en una tabla de

distribución de frecuencias, se puede determinar aplicando la ecuación:
n 
Me  L i  A   F
 2  ...... .. ..... ......... (5)
f
Donde:
L = límite inferior de la clase modal
A = amplitud del intervalo de clase
n = número de observaciones de la muestra
F = frecuencia acumulada hasta la clase anterior a la clase modal
f = frecuencia absoluta de la clase modal
Para aplicar esta ecuación, veamos el siguiente ejemplo:
11. El peso de 50 trabajadores de una empresa se representan en la siguiente tabla de

distribución de frecuencias.
Frecuencia
Intervalo de clase Kg. Frecuencia absoluta
acumulada
53-57 2 2
58-62 7 9
63-67 10 19
68-72 12 31
73-77 9 40
78-82 6 46
83-87 4 50
total 50
Para aplicar la ecuación, procedemos de la siguiente forma:

Sabemos que la mediana se encuentra en el centro de las observaciones, por lo tanto
dividimos los n datos entre dos:
n = 50 = 25
2 2
De este resultado se deduce que la mediana ocupa el 25o. lugar, por lo que vemos en la
frecuencia acumulada en qué clase se ubica, y ésta corresponde a la clase 68-72.
Marcamos esta clase con doble raya para fácil referencia. Para determinar la mediana es
necesario interpretar los datos, dado que no tenemos la mediana a la vista en la tabla
sino que se encuentra entre los 12 valores que están incluidos en la clase 68-72.
24
Determinamos el valor de los parámetros observando los datos en la tabla:
n
 25 , A = 77 – 73 + 1 = 4 + 1 = 5, F = 19, f = 12 y Li = 68.
2
A n2  F
Se aplica la ecuación (5): Me  L i 
f
Sustituyendo en la fórmula obtenemos
Me = 68 + 5 ( 25 – 19 ) = 68 + 5 ( 6 ) = 68 + 2.5 = 70.5
12 12
El valor de Me = 70.5 Kg. representa la mediana de los pesos de los 50 trabajadores de

la empresa.
Determina la mediana en los problemas 1 y 2 de la actividad anterior aplicando la

fórmula (5).
1.1.6 LA MEDIA DE DATOS AGRUPADOS
En tu fascículo anterior ya realizaste tablas de distribución de frecuencia para organizar

los datos obtenidos de un problema. Los datos los agrupaste en clases. Las clases
tienen el mismo intervalo de clase y el punto medio del intervalo de clase se llama marca
de clase (Mi). Para determinar la marca de clase, se suman los extremos de la clase y el
resultado se divide entre 2.
x n  x n1
Mi  . . . . . . . (6)
2
La marca de clase (Mi) es la mediana de las observaciones comprendidas en cada clase

y ésta se obtiene solamente de dos valores como ya se indicó en la fórmula (6). La
marca de clase no es útil porque para obtener el valor de las observaciones
comprendidas en una clase, multiplicamos la frecuencias por la Mi. Este producto define
todas las observaciones comprendidas en una clase. Para el cálculo de la media de
datos agrupados, sumamos estos productos y los dividimos entre el número de
observaciones.
25
La ecuación es la siguiente:
n
M f  Mi f 2  .....Mi fn
M f i i
X i1  i1
n n
n
M f
i 1
i i
X . . . . . . . . . . . . . . (7)
n
Veamos los siguientes ejemplos:
12. Se desea saber la edad promedio de 50 ancianos de un asilo y para ello con la
información se elaboras la siguiente distribución de frecuencias:
Clase años Mi Fi Mi fi
70-72 71 15 1065
73-75 74 11 814
76-78 77 8 616
79-81 80 7 560
82-84 83 4 332
85-87 86 3 258
88-90 89 2 178
total 50  =3823
Sustituyendo los datos en la ecuación ( 7 ) obtenemos:

n
M f
i1
i i
3823
X   76.46 años es la edad promedio en el asilo de ancianos.
n 50
Existe otro método para calcular la media de datos agrupados, lo llamaremos “Método
abreviado para el cálculo de la media”.
Este método consiste en fijar un origen muy aproximado a la media ( X ) de los datos.
Este valor que sirve de origen se resta a cada uno de los valores individuales obtenidos
como diferencia, valores negativos y positivos cuya suma es cero; pero el producto de
cada diferencia por la frecuencia nos da valores cuya suma es diferente de cero, con
estas cantidades aplicamos la siguiente ecuación:
n
 X' f
i1
i
X  X' . . . . . . . . . (8)
n
26
Donde X´ es el valor que se toma como origen.
Se recomienda el valor que se tome como origen (X´) sea un valor próximo a la mediana.
El valor escogido de esta forma, facilita el cálculo y el valor obtenido de la media más
exacta.
13. Las calificaciones obtenidas en la escala de 0 a 10 de un grupo de 50 alumnos se

muestran en la siguiente tabla:
Calif.- origen
Calificación fi X´ fi
Xi – X´ = X´
0 0–5=–5 0 0
1 1–5=–4 0 0
2 2–5=–3 0 0
3 3–5=–2 2 –4
4 4–5=–1 3 –3
X´ (5) 5–5= 0 4 0
6 6–5= 1 14 14
7 7–5= 2 12 24
8 8–5= 3 7 21
9 9–5= 4 4 16
10 10 – 5 = 5 4 20
Total 50 = 88
n
De la tabla se establece que: X´ = 5 , n = 50 y  X' f
i1
i  88
 X' f
i1
i
88
Sustituyendo en la ecuación ( 8 ), obtenemos: X  X' 5  5  1.76
n 50
X = 6.76 promedio de calificaciones del grupo.
Cuando los datos están agrupados por clases en una tabla de frecuencias, se toma
como punto de origen (X´) en un valor intermedio de las marcas de clase.
27
Se calculan las diferencias Mi – X´ = X' y con este resultado se calculan los productos
en X' f i completando las columnas necesarias de la tabla de frecuencias; estos valores
los sustituimos en la fórmula ( 8 ).
Ejemplo:
14. Aplicando la fórmula (8) calculemos la edad promedio de los 50 ancianos del
problema (12), y comparemos los resultados obtenidos con ambos métodos.
Clase
Mi Fi Mi – X´= X´ X´ fi
años
70 – 72 71 15 71 – 77 = – 6 – 90
73 – 75 74 11 74 – 77 = – 3 – 33
X´ = 77 76 – 78 77 8 77 – 77 = 0 0
79 – 81 80 7 80 – 77 = 3 21
82 – 84 83 4 83 – 77 = 6 24
85 – 87 86 3 86 – 77 = 9 27
88 – 90 89 2 89 – 77 = 12 24
Total 50  = – 27
Sustituyendo valores en (8) , obtenemos:
X = 77 + - 27 = 77 – 0.54 = 76.46
50
X = 76.46 años es la edad promedio en el asilo de ancianos.
Al comparar este valor con el calculado por el otro método, podemos observar que el
resultado es el mismo.
Resuelve los siguientes ejercicios como se te indica en cada caso.
1. Calcula la media ( X ) del ejemplo anterior, tomando como punto origen X´ = 80 y

repite los cálculos para X´ = 83. Compara tus resultados con el anterior y expresa tus
conclusiones.
28
2. En el siguiente problema, aplica el método abreviado para calcular la media.
Una zapatería pone en remate 200 pares de zapatos cuyos precios y cantidades de
existencia se indican en la siguiente tabla de frecuencias:
PRECIO EN $ fi
10 – 19 19
20 – 29 46
30 – 39 69
40 – 49 35
50 – 59 22
60 – 69 9
total 200
3. La producción de pantalones de una fábrica de ropa en el mes de julio y agosto fue la

siguiente:
142, 163, 108, 157, 160, 124, 140, 132, 135,

128, 135, 150, 149, 120, 126, 128, 145, 150,
139, 149, 144, 129, 131, 137, 142, 163, 108,
133, 146, 137, 149, 142, 163, 165, 158, 146
120, 126, 150, 159, 160, 148, 120, 108, 110,115
Calcula la media de la producción aplicando las ecuaciones ( 7 ) y ( 8 ) y compara los

resultados. Explica cuál es el más recomendable usar y por qué.
La media de una muestra se simboliza como ya se dijo X (equis testada) y la media de

una población se simboliza como  (letra griega mu).
El nombre que los estadísticos dan para diferenciarlas es:
X (estadística de la muestra)
 (parámetro de la población)
X i
 i1 . . . . . . . . . . . . . (9)
N
Recuerda que población es todo el conjunto de observaciones obtenidas de un cierto

fenómeno, y muestra es una parte representativa de la población.
El total de observaciones de la población se simboliza con ( N ) y los elementos de la

muestra se simbolizan con ( n ).
29
También recordarás que, para que la muestra sea representativa de la población, esta
debe ser una “muestra aleatoria”.
Hasta el momento hemos calculado medidas representativas de un conjunto de datos

concentrados en un valor numérico que describe a todo el conjunto y cuyo valor es
característico del mismo. A estas medidas les hemos llamado medidas de tendencia
central porque su valor se encuentra cerca del centro de observaciones obtenidas al
analizar un determinado problema y éstas son:
a) La Moda (Mo)
b) La Mediana (Me)
c) La Media ( X )
Hay otras características de las observaciones que son importantes conocer, por
ejemplo: ¿Cuánto varían los datos entre sí? ¿Cuál es el grado de dispersión de los
datos? Esta información no la proporcionan las medidas de tendencia central, por lo que
a continuación analizaremos cómo determinar estos nuevos valores.
Analicemos el siguiente ejemplo:
15. Las ventas realizadas en 10 días de uno de los meses por tres vendedores de una
compañía fueron las siguientes:
Ventas de Pedro: 5, 18, 8, 12, 17, 19, 25, 17, 17, 20

Ventas de Andrés: 5, 17, 17, 17, 17, 17, 17, 17, 17, 17
Venta de Carlos: 5, 6, 10, 20, 21, 20, 19, 18, 19, 20
Ordena los datos y calcula las medidas de tendencia central de las ventas de cada
uno.
Ventas de Pedro: Mo Me X
Ventas de Andrés: Mo Me X
Ventas de Carlos: Mo Me X
De acuerdo a tus cálculos, la media de las ventas que obtuviste fue la misma para
los tres:
X = 15.8
¿Qué podrías deducir de estos resultados?

Expresa brevemente tu deducción: _______________________________________________
De acuerdo a los valores de tendencia central de Andrés y Pedro, ¿Qué puedes decir de
estos vendedores? _____________________________________________________________
30
¿Cuál de los tres consideras que es más consistente en sus ventas? .
¿Considera a Pedro y Carlos ¿Quién consideras que es más consistente en sus ventas?
.
Comenta tus resultados con tu asesor de contenido.
Los resultados que debiste obtener son:
Ventas de Pedro: Mo 17; Me 17; X 15.8
Ventas de Andrés: Mo 17; Me 17; X 15.8
Ventas de Carlos: Mo 20; Me 19; X 15.8
Esta información podría hacernos pensar que todo está bien, sin embargo no lo es, por
lo que es necesario tomar alguna medida para mejorar las ventas.
Si observas los resultados anteriores, podrás notar que el valor de la media es el mismo
para los tres, por lo que no nos indica en donde las ventas andan mal.
Un cálculo rápido y sencillo consiste en restar al valor mayor de los datos el valor menor,
este resultado nos indica el rango en que están dispersos los datos.
Calcula el rango de dispersión de cada uno de los vendedores.
Los resultados que debiste obtener son:
Rango de ventas de Pedro 25 – 5 = 20

Rango de ventas de Andrés 17 – 5 = 12
Rango de ventas de Carlos 21 – 5 = 16
Las ventas de Andrés son muy consistentes porque el rango de dispersión es de 12.
Las ventas de Carlos también son consistentes aunque menor que las de Andrés; la
dispersión de los datos es 16.
Las ventas de Pedro registran el mayor rango de dispersión, por lo tanto nos indica que
sus ventas no son consistentes.
Con este análisis debemos recomendar que se haga una investigación de campo para
determinar las causas de la irregularidad de Pedro con el fin de dar una solución para
mejorar.
31
1.2 MEDIDAS DE DISPERSIÓN O VARIABILIDAD
La variabilidad y dispersión de los datos la proporcionan otras medidas que son:
1. El rango
2. La desviación media
3. La desviación estándar
4. La varianza
1.2.1 EL RANGO:
Una forma rápida de conocer la dispersión de los datos determinando el rango o

recorrido de la variable aleatoria.
El rango (R) es la diferencia entre el valor mayor y el menor que toma la

variable.
R = Xn  X1 . . . . . . . . . . . . . (10)
Donde:
R = rango
X1 = el menor valor
Xn = el mayor valor
En el ejemplo anterior obtuvimos los rangos de dispersión de las ventas aplicando la

ecuación (10).
En la variable aleatoria, para determinar el rango de datos agrupados, hay dos formas.
Una de ellas es la diferencia del límite real superior del último intervalo de clase (X n),
menos el límite real inferior del primer intervalo de clase (X 1). La otra forma es la
diferencia de la marca de clase superior, menos la marca de clase inferior.
32
En cada uno de los ejercicios determina el rango, analízalo y da tus conclusiones.
1. El departamento de control de calidad tomó una muestra de 10 flechas al azar, para

medir su diámetro y conocer si la tolerancia está dentro de las especificaciones. Se
obtuvieron los siguientes datos (y las unidades son cm.):
12, 12.05, 12.03, 11.95, 12.01, 12.04, 12, 11.98, 11.99 y 12.03
2. El departamento de control de calidad de una fábrica de baterías tomó una muestra

aleatoria de 10 pilas con el fin de determinar su vida útil. Se obtuvieron los siguientes
resultados:
6.2 hrs., 6.8 hrs., 6.0 hrs., 6.4 hrs., 5.9 hrs., 6.6 hrs.,
5.8 hrs., 6.3 hrs., 6.1 hrs., 6.2 hrs., 6.8 hrs.
El rango es muy útil en el control de calidad porque en esa área manejan diferencias
muy pequeñas (tolerancias). Sin embargo, la media y el rango no permite conocer con
precisión cómo están dispersos los datos, por lo tanto es necesario introducir otra
variable que permita conocer la dispersión y ésta es la desviación media que
introduciremos en la siguiente sección.
1.2.2 LA DESVIACIÓN MEDIA
La desviación (di) que hay de cada observación (Xi) con respecto a la media ( X ) se
obtiene mediante la siguiente ecuación:
di = Xi - X ................ ( 11)
Donde:
di = Desviación de cada observación con respecto a la media
33
La desviación es negativa para valores X i < X y positiva para valores Xi > X . La suma
de todas las desviaciones es igual a cero y se simboliza mediante la siguiente ecuación:
n
D  X
i1
i  X  0 . . . . . . . . . . . . (12)
Este valor D = 0 no nos ayuda en el cálculo; para evitar que la suma sea igual a cero, se
toma el valor absoluto de cada desviación y la ecuación (12) se transforma en:
n n
D  Xi  X
i1
 
i1
di . . . . . . . . . . . . . (13)
La desviación media (DM) de datos no agrupados es la suma de los

valores absolutos de todas las desviaciones dividido entre el número de
datos u observaciones. Aunque esta medida no se usa a menudo, se
considera una medida de dispersión.
 X
i1
i  X
Para una muestra: DM  . . . . . . . . (14)
n

i1
X i   
Para una población: DM  . . . . . . . . (15)
N
Donde:
DM = desviación media
Xi = i–esimo dato u observación
µ = media de la población o media poblacional
X = media muestral
N = número de observaciones de la población
n = número de observaciones de la muestra
 = signo de sumatoria
 = signo del valor absoluto
34
Ejemplo:
16. El gerente de personal entrevistó a 15 personas para su contratación; el tiempo que

duró la entrevista de cada aspirante fue:
37 min. , 30 min. , 23 min. , 46 min. , 18 min.,

40 min. , 58 min. , 43 min. , 39 min. , 55 min.,
64 min. , 42 min. , 28 min. , 20 min. , 57 min.
Determina la desviación media de las entrevistas.
Determinamos la media de los datos:
Xi
n Xi  X Xi  X 
min.
1 18 18 – 40 = -22 22
2 20 20 – 40 = -20 20
3 23 23 – 40 = -17 17
4 28 28 – 40 = -12 12
5 30 30 – 40 = -10 10
6 37 37 – 40 = - 3 3
7 39 39 – 40 = -1 1
8 40 40 – 40 = 0 0
9 42 42 – 40 = 2 2
10 43 43 – 40 = 3 3
11 46 46 – 40 = 6 6
12 55 55 – 40 = 15 15
13 57 57 – 40 = 17 17
14 58 58 – 40 = 18 18
15 64 64 – 40 = 24 24
Total  = 170
Obtenemos la media mediante la aplicación de la fórmula (3).

n
X
i1
i
600
X    40
n 15
Obtenemos la desviación media mediante la aplicación de la fórmula (14).

n
 X
i1
i  X
170
DM    11.3  DM = 11.3 minutos.
n 15
35
El valor de la desviación media de este ejemplo se debe interpretar que la
desviación de los tiempos de cada entrevista es de 11. 3 min. mayor o menor que la
media, es decir el tiempo de cada entrevista se expresa por medio de la media en
X  DM
Esto significa que los datos se distribuyen en torno a la media en:

X  11.3 minutos ( Es una distancia promedio a la media).
Si los datos están agrupados en una tabla de distribución de frecuencias, entonces para
determinar la desviación media DM es necesario multiplicar cada desviación por su
frecuencia y de esto se obtienen otra ecuación de la DM para datos agrupados, la cual
es:
n
 f X
i1
1 i  X
DM  . . . . . . . . . . (16)
n
Donde:
fi = frecuencia absoluta
Ejemplo:
17. La siguiente distribución de frecuencias corresponde al número de aviones que

despegan diariamente en el aeropuerto capitalino tomando como muestra aleatoria
los primeros 20 días de un mes.
Xi fi fi Xi Xi  X  Xi  X  fi  Xi  X 
41 1 41 41 – 46 = -5 5 5
42 2 84 42 – 46 = -4 4 8
44 4 176 44 – 46 = -2 2 8
46 6
48 4
50 2
51 1
20  =0  
Completa la tabla de frecuencias.
36
Procedimiento:
n
X
i1
i
920
a) Determinamos la media de los datos. X   46  X  46
n 20
b) Determinamos la diferencia de cada observación menos la media. Xi  X
c) Determinamos el valor absoluto de las desviaciones.

d) Realizamos el producto fi X i  X y sumamos los productos.
 f X
i1
1 i  X
42
e) Sustituimos valores en la fórmula (15): DM    2.1  2
n 20
El valor de la desviación media (Dm = 2) lo redondeamos al valor entero porque de

acuerdo al problema, no tiene sentido hablar de fracciones de avión que despegan
del aeropuerto.
Este resultado nos indica que los datos están distribuidos en 46  2 aviones a partir de la
media, que despegan diariamente.
Cuando los datos están agrupados en clases, para obtener la diferencia de cada
observación con la media, se toma la Mi (marca de clase), esto es:
Mi  X . . . . . . .. . . . . . . . . . . . . . (17)
con esto obtenemos otra ecuación para la desviación media correspondiente a un

conjunto de datos agrupados en clases:
n
 f M
i1
1 i  X
DM  n
. . . . . . . . . . . . . . . (18)
f
i1
i
Ejemplo:
18. Las estaturas de la compañía de fusileros del batallón de guardias presidenciales se

registran en la siguiente tabla de distribución de frecuencias, calcula la DM de las
estaturas.
37
Intervalo de
Mi fi fi Mi  fi  X  fi Mi  X 
clase
1.54 – 1.56 1.55 5 7.75 1.55 – 1.62= 0.07 0.35
1.56 – 1.58 1.57 6 9.42 1.57 – 1.62= 0.5 0.30
1.58 - 1.60 1.59 8 12.72 1.59 – 1.62= .03 0.24
1.60 – 1.62 1.61 20 32.20 1.61 – 1.62= .01 0.20
1.62 – 1.64 1.63 25 40.75 1.63 – 1.62= .01 0.25
1.64 – 1.66 1.65 16
1.66 – 1.68 1.67 9
1.68 – 1.70 1.69 7
1.70 – 1.72 1.71 3
1.72 – 1.74 1.73 1
Total 100  
Completa la tabla de frecuencias anterior.
Procedimiento:
162.96
a) Calculamos la media. X  1.62 metros
100
b) Calculamos las otras columnas de la tabla.
3.14
c) Aplicamos la ecuación (18). DM   0.0314
100
Este resultado dice que las estaturas se distribuyen en promedio en 0.0314 mts., a uno y
otro lado de la media. Como éste es un valor muy pequeño, se interpreta que los datos
están agrupados muy próximos a la media.
1. En una fábrica no se ha realizado debidamente el programa de mantenimiento por lo

que una máquina está fuera de operación debido a las fallas que a menudo se
presentan. El tiempo de inactividad consecutivo en minutos durante un año se
registran en la siguiente tabla.
Esta información incluye el tiempo inactividad de algunas máquinas cuya falla ocurre
más de una vez al día.
38
32 63 52 62 35 34 74 53 64 80
51 55 48 60 76 51 35 44 45 54
33 45 61 53 21 68 85 60 77 61
42 67 34 53 45 47 52 68 52 69
73 61 55 65 62 54 41 59 53 50
26 58 82 74 41 70 38 50 47 35
36 67 43 28 56 79 84 49 36 65
82 22 62 55 72 68 40 37 78 43
65 73 57 39 46 57 56 60 50 88
45 56 75 40 51 70 74 76 48 59
a) Agrupa los datos en una distribución de frecuencias que contenga 17 clases.

b) Elabora un histograma.
c) Calcula la Mo.
d) Calcula la Me aplicando la ecuación y gráficamente.
e) Calcula la media aritmética X .
f) Calcula el rango.
g) Calcula la DM.
2 2
Otras medidas que describen la dispersión de los datos son la varianza S ó  y la
desviación estándar S o . Donde S es para una muestra y  para una población.
La desviación estándar es la mediada más útil de la variación de los datos. En los

ejemplos hemos podido observar que la dispersión de un conjunto de datos, es pequeña
si los datos se reúnen muy cerca de la media y es grande si estos se dispersan
ampliamente en torno de la media.
Vimos que la suma de las desviaciones medias de datos no agrupados es igual a 0 y

como este valor no nos sirve, para el cálculo de la desviación media (DM) de un conjunto
de datos no agrupados, introdujimos el valor absoluto de las desviaciones X i  X para
eliminar el signo y de esta forma tener siempre un valor positivo en la suma de las
desviaciones.
Otra forma de eliminar el signo de las desviaciones es elevando al cuadrado cada una de
éstas, es decir:
 Xi  X   X
2
i  X . . . . . . . . . .. (19)
2
Recuerda que todo número elevado al cuadrado siempre es positivo.
Para la DM se toma la suma de los valores absolutos para la varianza y la desviación

estándar se toma la suma de las desviaciones elevadas al cuadrado.
39
La ecuación (19) es el cuadrado de las desviaciones, estos valores nos permiten el
2
cálculo de la varianza de la muestra (S ) cuya ecuación matemática se da a
continuación.
n
 X  X
2
i
S2  i1
. . . . . . . . . . (20)
n 1
Donde:
Xi = enésimo elemento de la muestra
X = media de las observaciones
n = número de elementos de la muestra
n
 X  X
2
i = sumatoria del cuadrado de las desviaciones, desde la primera desviación
i1
i = 1 hasta la enésima i = n
El cálculo de la varianza () de una población se determina mediante la siguiente

ecuación:
N
 X i  
2
2  i1
. . . . . . . . . . . . (21)
N
1.2.3 LA VARIANZA
Es una medida de dispersión, en cuyo cálculo interviene el cuadrado de

las desviaciones de cada puntuación. Para obtener su valor, calculamos la
sumatoria de los cuadrados de las desviaciones y el resultado lo dividimos
entre n1 o N.
Ejemplo:
19. En un almacén de fábrica de jeringas, al estibar las cajas en forma incorrecta, se

detectó que algunas se habían roto, por lo que se hizo una inspección. Se tomaron
10 cajas al azar para su revisión habiéndose obtenido la siguiente información:
De la primera caja 2 jeringas rotas, de las siguientes: 3, 1, 0, 4, 2, 1, 3, 0, 2.
Determina la varianza de las jeringas rotas.
40
El procedimiento es el siguiente:
a) Organizamos los datos en una tabla:

2
Xi Xi  X ( Xi  X )
0 0-1.8=-1.8 3.24
0 0-1.8=-1.8 3.24
1 1-1.8=-0.8 0.64
1 1-1.8=-0.8 0.64
2 2-1.8=0.2 0.04
2 2-1.8=0.2 0.04
2 2-1.8=0.2 0.04
3 3-1.8=1.2 1.44
3 3-1.8=1.2 1.44
4 4-1.8=2.2 4.84
18 =0  = 15.60
X1  X 2  ....  X n 18
b) Calculamos la media X    1.8
n 10
c) Calculamos las desviaciones y las registramos en la tabla.
d) Calculamos el cuadrado de las desviaciones.
e) Con los datos de la tabla calculamos la varianza sustituyendo valores en la
n
 X  X
2
i
15.60 15.60
ecuación (20) S2  i1
   1.73  2
n 1 10  1 9
2
La varianza de las jeringas rotas es de S = 2 toda vez que no podemos hablar de
fracciones de jeringa.
Analicemos otro ejemplo:
20. Regresemos al problema de los agentes de ventas (ejemplo 15) y calculemos la

varianza de cada uno:
Pedro Andrés Carlos
2 2 2
Xi Xi  X ( Xi  X ) Xi Xi  X ( Xi - X ) Xi Xi  X ( Xi  X )
5 -10.8 116.64 5 -10.8 116.64 5 -10.8 116.64
8 -7.8 60.84 17 1.2 1.44 6 -9.8 96.04
12 -3.8 14.44 17 1.2 1.44 10 -5.8 33.64
17 1.2 1.44 17 1.2 1.44 18 2.2 4.84
17 1.2 1.44 17 1.2 1.44 19 3.2 10.24
17 1.2 1.44 17 1.2 1.44 19 3.2 10.24
18 2.2 4.84 17 1.2 1.44 20 4.2 17.64
19 3.2 10.24 17 1.2 1.44 20 4.2 17.64
20 4.2 17.64 17 1.2 1.44 20 4.2 17.64
25 9.2 84.64 17 1.2 1.44 21 5.2 27.04
41
La media de cada uno fue: Pedro X = 15.8, Andrés X = 15. 8 y Carlos X = 15.8
Sustituyendo los datos en la ecuación (20), obtenemos la varianza para cada agente de
ventas:
 X  X
2
i
S2  i1
n 1
129.6 313.6 313.6 351.6

S 2A   14.4 ; S p2    34.84 ; 2
SC   39.06
9 10  1 9 9
Como no podemos hablar de ventas fraccionarias, entonces los valores obtenidos se

redondean al entero más próximo, es decir:
S 2A = 14 S P2 = 35 S C2 = 39
El mayor valor de la varianza nos dice que hay mayor dispersión de los datos y esto lo
podemos constatar en las tablas.
La varianza de las ventas de Andrés es menor que las otras dos y de hecho, sólo un
valor se aleja de la media, los demás están simétricamente agrupados alrededor de ésta.
La relación de la varianza de los tres vendedores es: S 2A < S P2 < S C2
a) ¿Cuál de los tres tiene mayor varianza? ________________________________________
b) ¿Qué podemos inferir de este resultado? _______________________________________
c) Si tú fueras el gerente de ventas, ¿Qué medidas dictaminarías? ___________________
_____________________________________________________________________________
Cuando los datos están agrupados en una tabla de frecuencia, entonces el cuadrado de
cada desviación se multiplica por sus frecuencias, obteniéndose la siguiente ecuación:
 f X  X
2
i i
S2  i1
. . . . . . . . . . . . . . (22)
n 1
Analicemos el siguiente ejemplo:
21. Tomamos los datos del ejemplo de las jeringas ( 19 ), los agrupamos en una tabla
de frecuencias y obtenemos:
42
2 2
Xi fi Xi  X ( Xi  X ) fi ( Xi  X )
0 2 -1.8 3.24 6.48
1 2 -1.8 0.64 1.28
2 3 0.2 0.04 0.12
3 2 1.2 1.44 2.88
4 1 2.2 4.84 4.84
2
Con los datos de la tabla calculamos S aplicando la ecuación (22):
 f X  X
2
i i
15.6 15.6
S2  i1
   1.73  2
n 1 10  1 9
2
S = 2 este valor significa que la varianza de las jeringas rotas es 2, toda vez que no
podemos hablar de fracciones de jeringa.
Compara los dos cálculos del problema y explica tus conclusiones.
Cuando los datos están agrupados en clases, entonces la puntuación que se toma para
determinar la desviación de cada uno con respecto a la media, es la marca de clase M i,
obteniéndose la siguiente ecuación:
 f M  X
2
i i
S2  i1
. . . . . . . . . . . . (23)
n 1
Ejemplo:
22. Tomemos los datos del ejercicio VIII referente a la falla de la máquina que
constantemente está fuera de servicio. En este ejercicio debiste haber seguido este
procedimiento de cálculo:
a) Ordenamos los datos de menor a mayor

b) Los distribuimos en siete clases como se indicó
c) Determinamos la marca de clase Mi
d) Determinamos la frecuencia
e) Calculamos la media de los datos multiplicando la Mi por la frecuencia y los
sumamos
f) Calculamos la desviación de cada dato con respecto a la media
g) Elevamos al cuadrado las desviaciones
h) Multiplicamos el cuadrado de las desviaciones por su frecuencia
i) Sumamos este producto
43
Con esta información tomamos los valores de la tabla y los sustituimos en la ecuación
2
(23) para el cálculo de S .
Intervalo 2 2
Mi fi fi Mi Mi  X ( Mi  X ) fi ( Mi  X )
de clase
20-29 24.5 4 98.0 -31.2 973.44 3893.76
30-39 34.5 12 414 -21.2 449.44 5393.28
40-49 44.5 18 801 -11.2 125.44 2257.92
50-59 54.5 26 1417 -1.2 1.44 37.44
60-69 64.5 20 1290 8.8 77.44 1548.80
70-79 74.5 14 1043 18.8 353.44 4948.16
80-89 84.5 6 507 28.8 829.44 4976.64
100 5570 2810.08 23056
M f
i1
i i
5570
Cálculo de la media: X   55.7
n 100
 f M  X
2
i i
23056 23056 2
Cálculo de la varianza: S2  i1
   232.8  S = 233
n 1 100  1 99
La varianza de los tiempos en que la máquina está fuera de servicio por falla es de
2 2
S = 233 min .
Como puedes notar en el resultado, los tiempos están en unidades cuadradas por lo que
no nos da una idea precisa de los tiempos que la máquina está fuera de servicio toda
vez que las unidades de la varianza no coinciden con las unidades de los datos, por lo
que no podemos saber si la dispersión con respecto a la media es muy grande o
pequeña.
Para poder determinar la dispersión de las puntuaciones con la misma unidad de la

variable aleatoria, se usa otra medida de dispersión que se llama desviación estándar (S)
para una muestra o () para una población.
1.2.5 DESVIACIÓN ESTÁNDAR
Es una medida de dispersión que es igual a la raíz cuadrada de la

varianza.
44
Datos no agrupados de una
n
muestra aleatoria.
 X  X
2
i
2 i1
S S  . . . . . . . . . . . . . . . . . . . (24)
n 1
Datos agrupados en frecuencias

n
de una muestra aleatoria.
 f X  X
2
i i
2 i1
S S  . . . . . . . . . . . . . . . . . . (25)
n 1
Datos agrupados en clases de

n
una muestra aleatoria.
 f M  X
2
i i
2 i1
S S  . . . . . . . . . . . . . . . . . . (26)
n 1
Datos agrupados en clases de

N
una muestra población.
2
 f M
i1
i i  
2
   . . . . . . . . . . . . . . . . . . (27)
N
23. Calcula la desviación estándar del ejemplo anterior correspondiente a los tiempos
fuera de servicio de la máquina por descompostura.
R.-
Como ya calculamos la varianza basta con extraerle la raíz cuadrada, obteniéndose:
2 2
S = 233 min .  S  S 2  233  15.26  S = 15.3
Esta información es más comprensible y debemos entender que los tiempos de

descompostura de la máquina se distribuyen a X  15.3 min.
45
En cada uno de los siguientes problemas, calcula la varianza y la desviación estándar.

Interpreta tus resultados y expresa tus deducciones.
1. La oficina de quejas de los microbuses del D.F. recibieron en una semana el

siguiente número de quejas: Lunes 16, martes 10, miércoles 8, jueves 12, viernes
15, sábado 18 y domingo 20.
2. El bufete jurídico de una empresa envió cartas de cobranza a los clientes morosos
del mes de Junio. El primer día del mes envió 64, el segundo día 62 y los siguientes
días 51, 58, 83, 54, 57, 51, 42, 54, 74, 62, 47, 59, 51, 67, 53, 45, 58, 78, 69, 51, 72,
69, 78, 45, 64, 67.
3. La siguiente tabla muestra la distribución de frecuencias de las horas/hombre que

requiere una compañía de pintura para pintar 100 casas clasificadas por el grado de
deterioro.
Horas No. casas

0 – 19 4
20 – 39 5
40 – 59 13
60 – 79 17
80 – 99 24
100 – 119 11
120 – 139 10
140 – 159 7
160 – 179 5
180 – 199 4
Existe una forma simplificada para calcular la desviación estándar y para ello se aplican
las siguientes ecuaciones que se deducen a partir de las fórmulas de la varianza:
Para datos no agrupados.
2
n  n Xi 
 X i2  
 n


i1  i1 
S . . . . . . . . . . . . . . . . . . . . (28)
n 1
46
Para datos agrupados sin clases.
2
n
fi X i2  n
fi X i 
S  fi
 
  n 
. . . . . . . . . . . . . . . . . . (29)
i1  i1
Para datos agrupados con clases.
2
n
fi Mi2  n
fi Mi 
S  fi
 
  n 
. . . . . . . . . . . . . . . . . (30)
i1  i1
En el siguiente problema, calcula la desviación estándar aplicando las dos ecuaciones.
Compara los procedimientos y resultados.
24. Una compañía de computadoras recibió un pedido urgente de computadoras

domésticas para todas las ciudades del país que deberá entregar en un periodo de 6
semanas. De acuerdo con el contrato firmado con los distribuidores, la entrega diaria
es para el primer día 22, para los siguientes días 65, 77, 79,83, 65, 50, 75, 73, 60,
33, 66, 65, 30, 63, 41, 55, 65, 57, 62, 45, 49, 75, 59, 55, 54, 51, 28, 39, 25, 50, 48,
68, 55, 87, 35, 65, 65, 79, 61, 45, 53.
R.-
1. Secuencia de operaciones:
a) Organizamos los datos en clases.

b) Determinamos la marca de clase M i
c) Determina la frecuencia.
d) Calculamos el producto fi Mi
e) Determinamos la media X .
f) Calculamos el producto fi Mi2
g) Calculamos el producto fi X i  X
2
h) Calculamos Mi2
i) Calculamos el producto fi Mi2
47
2. Aplicamos las fórmulas para datos agrupados, la general y la simplificada.
 f M  X
2
i i
Fórmula general S  S2  i1
n
. . . . . . . . . . . . . . . . . (26)
f
i1
i
2
n
fi Mi2  n
fi Mi 
Fórmula simplificada S  fi
 
  n 
. . . . . . . . . . . . . . . . (30)
i1  i1
1 2 3 4 5 6 7 8 9
Mi  X (Mi  X) fi (Mi  X)
2 2
Clase Mi fi fi Mi 2 2
Mi fi Mi
20-29 24.5 3 73.5 -31.9 1017.61 3052.83 600.25 1800.75
30-39 34.5 4 138.0 -21.9 479.61 1918.44 1190.25 4761.00
40-49 44.5 5 222.5 -11.9 141.6 708.05 1980.25 9901.25
50-59 54.5 10 544.0 - 2.0 4.0 40.0 2959.36 29593.60
60-69 64.5 12 774.0 8.1 65.61 787.32 4160.25 49923.00
70-79 74.5 5 447.0 18.1 327.61 1965.66 5550.25 33301.50
80-89 84.5 2 169.0 28.1 789.61 1579.22 7140.25 14280.50
42  2368 10051.62 143561.6
f M
i1
i i
2368
- Cálculo de la media X   56.4  X  56.4
f i
42
 Cálculo de la varianza y la desviación estándar por medio de la fórmula general,

tomando los valores de la columna 3 y 7.
 f M  X
2
i i
10051.52
S  S2  i1
n
 S  239.32  15.46
42
f
i1
i
2
Si S = 15.46, entonces S = 239.32
Si analizamos las columnas de la tabla de frecuencias necesarias para cada ecuación,

vemos que para la ecuación normal debemos elaborar de la primera a la séptima
columna.
48
 Cálculo de la varianza y la desviación estándar con la fórmula simplificada, tomando
los valores de la columna 4 y 9.
2
n
fi Mi2  n
fi Mi 
S  fi
 
  n 
i1  i1
2
143561.6  2368 
S    = 3418.13  (56.38) 2 = 239.32 = 15.46
42  42 
2
Si S = 15.46, entonces S = 239.32
La desviación estándar del problema es S = 15 y este valor significa que el número de

computadoras que se entregan diariamente se dispersa en  15 computadoras alrededor
de la media ( X ), es decir X  15 es la entrega diaria de computadoras.
El valor decimal se ha eliminado toda vez que no podemos pensar que estamos
entregando fracciones de computadora.
Para el cálculo de la desviación estándar con la ecuación simplificada, las columnas que
deben elaborarse son las tres primeras, la 8 y la 9.
Los resultados obtenidos en ambas ecuaciones, son exactamente los mismos por lo
tanto puedes usar para tus cálculos la que consideres que es más sencilla.
Para familiarizarte con la ecuación simplificada, repite los cálculos de los ejercicios
anteriores donde se obtuvo la desviación estándar y compara tus resultados.
Las medidas de posición y las medidas de variación son descripciones estadísticas muy
importantes, porque nos describen cómo se están agrupando o alejando los datos de
una distribución con respecto a las medidas de tendencia central. Existen otras maneras
de describir los datos estadísticos en forma más ilustrativa que un simple número que
describe todo un proceso y que finalmente su interpretación se hace más compleja. La
otra forma de analizar e interpretar los datos, es mediante su representación gráfica que
a continuación estudiaremos.
49
1.3 MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN EN
CURVAS DE FRECUENCIAS.
La representación gráfica de la distribución de frecuencias toma diferentes formas, más
ilustrativas y fácilmente identificables, que nos permite conocer y comparar los
estadísticos o parámetros visualmente.
Las formas en que se presentan las gráficas de una distribución de frecuencias se

pueden generalizar en dos tipos:
a) Curvas simétricas.
b) Curvas asimétricas.
1.3.1 CURVAS SIMÉTRICAS
Curva simétrica es la representación gráfica de una distribución de

frecuencias cuyo eje de simetría es la media X o .
Las curvas simétricas se caracterizan por su curtosis.
Curtosis es la forma característica de la puntiagudez que presenta la parte

superior de la gráfica.
Por su curtosis las curvas simétricas se clasifican en:

1. Platicúrtica (fig. 1)
2. Lepticúrtica (fig. 2)
3. Mesocúrtica (fig. 3)
Las siguientes gráficas muestran la forma característica de cada una de ellas:
f f f
x x x
  
Figura 5. Figura 6. Figura 7.
50
Analiza cada una de las gráficas y contesta las siguientes preguntas:
1. Expresa las características particulares de cada gráfica.
2. ¿Qué características son comunes a las tres gráficas?
R.-
1. Fig. 1. La Plarticúrtica presenta una zona casi horizontal en su punto máximo, su
puntiagudez es casi nula.
Fig. 2. La Lepticúrtica presenta un pico muy agudo.
Fig. 3. La Mesocúrtica es semejante a la curva normal de Gauss.
2. Como podemos ver, las tres gráficas son simétricas con respecto a la media y tienen
forma de campana.
Como ya se dijo, la curtosis es el grado de “puntiagudez” de la gráfica de una distribución

de frecuencias y ésta se simboliza con la letra K.
K = Grado de apuntamiento o puntiagudez de la gráfica de la distribución de frecuencias.
El apuntamiento (K) es el cociente del promedio de las desviaciones con

respecto a la media elevadas a la 4ª. Potencia entre el cuadrado de la
varianza, disminuido en tres unidades.
De la definición de apuntamiento se desprenden nuevos estadígrafos que llamamos

momentos (M).
1.3.2 MOMENTOS O CURTOSIS
Momentos son los promedios de las series de potencias de las

desviaciones de la variable con respecto a la media.
La definición matemática de cada uno de los momentos es:
1. Momento de primer orden o media aritmética:

n
X
i1
i X
X i
M1   . . . . . . . . . . . . . . . . . . (31)
n n
51
2. momento de segundo orden o varianza:
n
 X  X
2
M2  i1
i

X 2
i
 S 2 . . . . . . . . . . . . (32)
n n
3. Momento de tercer orden:

n
 X  X
3
M3  i1
i

X 3
i
. . . . . . . . . . . . . . . . (33)
n n
4. Momento de cuarto orden:

n
 X  X
4
M4  i1
i

X 4
i
. . . . . . . . . . . . . . . . . (34)
n n
5. Momento de orden m:
n
 X  X
5
M5  i1
i

X 5
i
. . . . . . . . . . . . . . . (35)
n n
6. Momento de orden m para datos agrupados:

n
f  X  X
m
i i
i1
Mm  . . . . . . . . . . . . . . . . . . . . . (36)
n
Basándose en los momentos, la definición matemática del apuntamiento (K) es:
M4
K  3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (37)
M2 2
Donde:
M4 = Cuarto momento
M2 = Varianza
52
En el siguiente problema calcula los momentos sucesivos hasta el de cuarto orden y
determina el apuntamiento (K).
23. Se tomaron al azar 20 alumnos para determinar su aptitud en la lectura; para ello se
les dio a leer un texto de 100 palabras, habiéndose obtenido los siguientes tiempos
de lectura en segundos: 70, 78, 60, 58, 80, 70, 75, 78, 60, 65, 70, 85, 78, 80, 75, 60,
55, 58, 78.
R.
Elaboramos la siguiente tabla:
1 2 3 4 5 6 7 8 9 10
2 2 3 3 4 4
Xi fi fi Xi Xi - X (Xi - X) fi (Xi - X) (Xi - X) fi (Xi - X) (Xi - X) fi (Xi - X)
55 2 110 -14.4 207.36 414.72 2985.98 5971.96 42998.17 85996.34
58 2 116 -11.4 129.96 259.92 1481.54 2963.08 16889.60 33779.20
60 3 180 -9.4 88.36 265.08 830.58 2491.74 7807.48 23422.46
65 1 65 -4.4 19.36 19.36 85.18 85.18 374.80 374.80
70 3 210 0.6 0.36 1.08 0.22 0.66 0.13 0.39
75 2 150 5.6 31.36 62.72 175.61 351.22 983.45 1966.90
78 4 312 8.6 73.96 295.84 636.06 2544.24 5470.08 21880.32
80 2 160 10.6 112.36 224.72 1191.02 2382.02 12624.77 25249.54
85 1 85 15.6 243.36 243.36 3796.42 3796.42 59224.09 59224.09
251894.0
 1388 1786.8 20596.52
4
Se calcula la media y los momentos:

n
f i1
i Xi
1388
X   69.4
n 20
Mi = 69.4 M2 = 1786.8 = 89.34 (Varianza)

20
M3 = 205960.52 = 1029.8 M4 = 551894 = 12594.7

20 20
Con estos valores sustituyéndolos en la ecuación (37) podemos calcular el grado de

apuntamiento (K).
M4 12594.7
K 3  K  3  1.57  3  K = 1.4
M2  2
89.342
53
El valor de K define la curtosis de la gráfica, tal que:
=0 La curva es mesocúrtica (curva normal)

E >0 La curva es lepticúrtica
<0 La curva es platicúrtica
En nuestro ejemplo donde K = 1.4 significa que K < 0 por lo tanto si graficamos la tabla
de frecuencia, obtendremos una gráfica similar al de la figura 1 o sea una gráfica
platicúrtica.
Del siguiente problema calcula el valor de K e indica qué tipo de gráfica tiene. Interpreta
el resultado y expresa tus conclusiones.
1. De una guardería infantil se toma una muestra de 36 niños para determinar su altura.
Los resultados obtenidos en centímetros son:
63, 64, 64, 65, 65, 66, 66, 66, 67, 67, 67, 67, 67, 68, 68, 68, 69, 69,
69, 69, 69, 70, 70, 70, 71, 72, 72, 72, 72, 73, 73, 74, 74, 76, 76, 77.
1.3.3 CURVAS ASIMÉTRICAS
Ya se dijo que las medidas de dispersión solamente señalan la magnitud de las

variaciones, pero no dan ninguna información acerca de la dirección hacia la cual se
dispersan.
Las curvas asimétricas son las que nos indican hacia donde se inclina la dispersión de
los datos.
Curva Asimétrica es la representación gráfica de una distribución de

frecuencias, la cual no es simétrica.
54
Estas gráficas se caracterizan por la posición que guardan las medidas de tendencia
central. Podemos generalizar su presentación mediante las siguientes gráficas:
f
x
X
X = Mo = Me
Mo
X  Mo = 0
Me
Figura 8.
x
X Me Mo
X < Me < Mo sesgo a la derecha
X  Mo > 0
Figura 9.
x
Mo Me X
Mo < Me < X sesgo a la izquierda
X  Mo < 0
Figura 10.
55
Analiza cada una de las gráficas anteriores y contesta las siguientes preguntas:
a) ¿Qué características tiene cada una? __________________________________________
______________________________________________________________________________
b) ¿Qué características tienen en común? ________________________________________
______________________________________________________________________________
La asimetría de la gráfica se mide mediante el sesgo.
1.3.4 SESGO
Sesgo es la medida de la asimetría de la gráfica y se calcula por el

cociente de la media menos la moda entre la desviación estándar.
X  Mo
SG  . . . . . . (37)
S
Donde:
X = Media.
Mo = Moda.
S = Desviación estándar
SG  Sesgo de la gráfica.
56
De acuerdo con esta ecuación y analizando el numerador podemos definir el sesgo de la
gráfica de un conjunto de datos de la siguiente forma:
X  Mo
 0 Implica que la curva está centrada con respecto a
S las medidas de tendencia central (curva simétrica)
X  Mo
 0 Implica que la gráfica está sesgada a la derecha.
S
X  Mo
0 Implica que la gráfica está sesgada a la izquierda.
S
Del siguiente problema calcula el apuntamiento (K) y el sesgo (SG), analiza tus
resultados e indica cómo es la gráfica y cómo se distribuyen los datos del problema.
26. El departamento del Distrito Federal recibió varias quejas del público sobre la
contaminación que produce la Planta de óxido de sulfuro. El Departamento envió un
equipo de expertos para investigar el problema.
Para hacer el estudio de la contaminación, los investigadores se establecieron

dentro de la Planta y tomaron una muestra diaria durante 40 días de los humos que
ésta despide. Los resultados obtenidos de la emisión promedio de óxido de sulfuro
en kg. Por día, son los que se indican a continuación:
17 , 15 , 20 , 29 , 19 , 18 , 22 , 25 , 29 , 9 ,
24 , 20 , 17 , 16 , 24 , 14 , 15 , 23 , 24 , 26 ,
19 , 23 , 28 , 19 , 16 , 22 , 24 , 17 , 20 , 13 ,
19 , 10 , 23 , 18 , 31 , 13 , 20 , 17 , 24 , 14 .
R.-
Secuencias de operaciones:
a) Ordenamos los datos en sentido creciente.
9 , 10 , 13 , 13 , 14 ,14 , 15 , 15 , 16 , 16 ,
17 , 17 , 17 , 17 , 18 , 18 , 19 , 19 , 19 , 19 ,
20 , 20 , 20 , 20 , 22 , 22 , 23 , 23 , 23 , 24 ,
24 , 24 , 24 , 24 , 25 , 26 , 27 , 28 , 29 , 31.
b) Los agrupamos en cinco clases y completamos las columnas necesarias para el

cálculo.
57
1 2 3 4 5 6 7 8 9
2 2 4 4
CLASE fi Mi Mi fi Mi - X (Mi - X) fi (Mi - X) (Mi - X) fi (Mi - X)
9-13 4 11 44 -9.125 83.3 333.2 6938.9 27755.6
14-18 12 16 192 -4.125 17.0 204.0 289.0 3468.0
19-23 13 21 273 0.875 0.76 9.95 0.58 7.6
24-28 9 26 234 5.875 34.5 310.5 1190.3 10712.3
29-33 2 31 62 10.875 118.3 236.6 13994.9 27989.8
Total 40  1094.3 69933.3
c) Obtenemos la media ( X ), para ello sustituimos los datos de la tabla en la

ecuación (7):
805
X  20.125
40
d) Calculamos los momentos de segundo y cuarto orden, para ello sustituimos los datos
de la tabla en las ecuaciones (33) y (35):
1094.3 69933.3
M2   27.36 M4   1748.3
40 40
e) Calculamos (K), para ello sustituimos los datos de la tabla en la ecuación (36):
1748.3
K  3  2.3  3   0.66  –0.7  K = –0.7
27.362
Este resultado nos dice que k < 0, por lo tanto la gráfica de la distribución es de tipo
platicúrtica.
f) Calculamos el sesgo (SG). Para este cálculo primero determinamos la moda y la

desviación estándar.
-De la tabla obtenemos que la Moda Mo = 21 porque es el valor de mayor

frecuencia.
-La desviación estándar se obtiene sustituyendo los valores de la tabla en la

ecuación (25):
1094.3
S  27.34  5.23  S  5.23
40
58
Para calcular el sesgo (SG) sustituimos los valores de Mo y S en la ecuación (37):
20.125  21
SG   0.167  SG = –0.2
5.23
Este resultado nos dice que SG < 0 lo cual implica que la gráfica esta cargada a la
izquierda, por lo tanto los datos del problema están dispersos hacia la izquierda de la
media.
Calcula el apuntamiento (K) y el sesgo (SG) en el siguiente problema. Analiza tus

resultados e indica qué tipo de gráfica se obtiene y cómo están dispersos los datos.
1. En el expendio “El huevo de oro” de la Central de Abastos de Iztapalapa, se

vendieron durante los primeros 40 días del año, las siguientes cajas de huevo:
13, 19, 22, 14, 13, 16, 19, 21, 23, 11, 27, 25, 17, 17, 13, 20
23, 17, 26, 20, 24, 15, 20, 21, 23, 17, 29, 17, 19, 14, 20, 20
10, 22, 18, 25, 16, 23, 19, 20
En el primer tema vimos cómo los datos obtenidos pueden condensarse en un solo valor
central alrededor del cual todos los datos muestrales se distribuyen. Por esta razón, a
menudo se denomina un valor central como una medida de tendencia central.
Las medidas centrales utilizadas con mayor frecuencia son: la media, la mediana y la
moda. La medida central se emplea para localizar el centro de un conjunto de
observaciones, sin embargo, con frecuencia resulta igualmente importante describir la
forma en que las observaciones están diseminadas o dispersas a cada lado del centro.
A esta diseminación se conoce como dispersión. Una dispersión pequeña indica un alto
grado de uniformidad en las observaciones; una dispersión grande indica poca
uniformidad. Si un conjunto de observaciones no tiene dispersión, todas las
observaciones son idénticas. Sin embargo, tal uniformidad perfectamente virtual no existe.
En el segundo tema se consideran las técnicas, por lo general empleadas para medir la
dispersión de un conjunto de observaciones.
59
RECAPITULACIÓN
MEDIDAS DE
TENDENCIA CENTRAL
MODA MEDIANA MEDIA

 d1 
Mo  Lr  A  Me  Li  a N / 2F   fM i i RANGO
X i 1 R = Xn  Xi
 d1  d2   f  n
POSITIVA SESGO DESVIACIÓN

SG > 0 X  Mo MEDIA
SG  n
ASIMÉTRICA S2
 f M  X
i1
1 i
DM 
NEGATIVA n
SG < 0
SIMÉTRICA
SG 
M3
2
f
i1
i
SG = 0 M2
M D
E I
MOMENTO DE VARIANZA D S
2o. ORDEN n I P
 f M  X
2
i i D E
MOMENTO DE 2 i1 A R
S 
3er. ORDEN n S S
f
i1
i I
D Ó
MOMENTO DE E N
MESOCURTICA 4o. ORDEN
K=0 DESVIACIÓN
ESTÁNDAR
n 2
LEPTOCURTICA
K>0
C
U APUNTAMIENTO  f M  X
i 1
i i
R M4 S n
K
V
A
M22 f
i 1
i
PLATICURTICA SIMÉTRICAS
K<0
60
Con el fin de afirmar los conceptos que estudiaste en este fascículo, del siguiente
problema realiza lo que se indica:
1. Ordena los datos y agrúpalos en 9 clases.

2. Elabora la tabla de frecuencias.
3. Determina la moda de la muestra.
4. Calcula la mediana.
5. Calcula la media.
6. Traza el polígono de frecuencia.
7. Determina el rango de datos.
8. Calcula la desviación media.
9. Calcula el polígono de frecuencias.
10. Calcula la desviación estándar.
11. Calcula el 2º y 4º momentos.
12. Calcula el valor de K.
13. Calcula el sesgo.
14. Indica el tipo de gráfica que obtuviste.
15. Analiza tus cálculos y expresa tus conclusiones.
PROBLEMA.- Se aplicó una prueba de aptitud a 100 aspirantes de obrero para la

planta de VW de Puebla, habiendo obtenido en los resultado las siguientes
puntuaciones:
60, 25, 47, 61, 54, 78, 36, 67, 40, 51, 49, 53, 44, 94, 51, 65, 55, 61, 48, 70,
42, 58, 69, 40, 51, 88, 54, 83, 79, 14, 13, 72, 57, 27, 46, 62, 43, 51, 82, 45,
64, 52, 71, 82, 53, 41, 65, 62, 75, 60, 49, 64, 40, 61, 73, 80, 71, 53, 36, 90,
60, 59, 41, 29, 86, 57, 61, 85, 44, 92, 27, 56, 39, 43, 54, 35, 59, 59, 89, 60,
61, 71, 53, 58, 26, 77, 68, 62, 62, 57, 48, 69, 76, 52, 49, 45, 54, 41, 77, 85.
Comenta tus resultados con tu asesor o profesor.

Analiza cada una de las gráficas anteriores y contesta las siguientes preguntas:
61
AUTOEVALUACIÓN
A continuación se presentan las respuestas del ejercicio que realizaste en las

actividades de consolidación, compáralos con tus resultados y si encuentras alguna
diferencia entonces revisa tus procedimientos de cálculo y corrige tus resultados.
Si tienes alguna duda, consulta a tu profesor o asesor.
1. Datos ordenados en 9 clases.
13, 14, 25, 26, 27, 27, 29, 35, 36, 36, 39, 40, 40, 40, 41, 41, 41, 42, 43, 43, 44, 44,
45, 45, 46, 47, 48, 48, 49, 49, 49, 51, 51, 51, 51, 51, 52, 52, 53, 53, 53, 53, 54, 54,
54, 54, 54, 55, 56, 57, 57, 57, 58, 58, 59, 59, 59, 60, 60, 60, 61, 61, 61, 61, 62, 62,
62, 62, 62, 64, 65, 65, 67, 68, 69, 69, 70, 71, 71, 71, 72, 73, 75, 76, 77, 77, 78, 79,
80, 82, 82, 83, 85, 85, 86, 88, 89,90, 92, 94.
Clases: (10-19), (20-29), (30-39), (40-49), (50-59), (60-69), (70-79), (80-89), (90-99).
2. Tabla de frecuencias.
1 2 3 4 5 6 7 8 9
2 4 2
CLASE fi Mi Mi fi Mi - X (Mi - X) (Mi - X) fi (Mi - X) fi (Mi - X)
10-19 2 14.5 29 -43 1849 3418801 86 3698
20-29 5 24.5 123 -33 1096 1200361 165 5445
30-39 4 34.5 138 -23 529 279841 92 2116
40-49 20 44.5 890 -13 169 28561 260 3380
50-59 26 54.5 1417 3 9 81 78 234
60-69 19 64.5 1226 7 49 2401 133 931
70-79 12 74.5 894 17 289 83521 204 3468
80-89 9 84.5 760 27 729 531441 243 6561
90-99 3 94.5 283 37 1369 1874169 111 4107
Total 100 5760 6088 7419169 1372 29940
3. Cálculo de la moda: Mo = 49.5 + 10 (6/10) = 54.1
62
 50  31
4. Cálculo de la mediana: Me  50  10   57.3
 26 
5760
5. Calculo de la media: X  57.6
100
6. Polígono de frecuencias:
26
24
22
20
18
16
14
12
10
8
6
4
2
14.5 24.5 34.5 44.5 54.5 64.5 74.5 84.5 94.5
7. Cálculo del rango: R  94  13  81
1372
8. Cálculo de la desviación media: DM   13.7
100
29940
9. Cálculo de la varianza: S 2   299.4 u 2
100
10. Cálculo de la desviación estándar: S  299.4  17.3
29940 7419169
11. Cálculo del 2o y 4o momentos: M2   299.4 y M 4   74191.69
100 100
74191.69
12. Cálculo del apuntamiento: K   3   2.1.
299.42
La curva es platicúrtica, ya que K < 0.
57.6  54.5
13. Cálculo del sesgo: SG   0.2
17.4
14. Tipo de gráfica: La gráfica está cargada a la derecha, ya que SG > 0.
63
A continuación te presentamos estos ejercicios para que ejercites lo aprendido.
1.- La producción de papel reciclado en el mes de Agosto, se presenta en la siguiente

tabla de distribución de frecuencias.
Clases fi
40 – 49 5
50 – 59 8
60 – 69 10
70 – 79 9
80 – 89 8
90 – 99 6
100 - 109 4
Total 50
Determinar:
a) Media, mediana y moda.
b) Desviación estándar y desviación media.
64
FREUND Williams, Perles. Estadística para la Administración. Editorial Prentis HALL

Hispanoamérica, S.A., Ed. Méx. 1990.
G. HOEL, Paul. Estadística Elemental. Editorial CECSA. 2a. Impresión, México, 1976.
KREYSZING, Erwin. Introducción a la Estadística Matemática. Editorial Limusa, México,

1981.
LEVIN, Jack. Fundamentos de Estadística en la Investigación Social. Editorial Harla.

2a. Ed. México, 1979.
LINCOLN L. Chao. Introducción a la Estadística. Editorial CECSA. México, 1985.
LINCOYAN P., Govinden. Curso práctico de Estadística. Editorial McGraw Hill. México,
1985.
LIZÁRRAGA, G., Ignacio M. Estadística. Editorial McGraw Hill. México, 1986.
MENDEHALL, William. Introducción a la Probabilidad y la Estadística. Traductor

Segami Carlos. Grupo Editorial Iberoamericana. México, 1989.
MILLS R., Richard. Estadística para Economía y Administración. Editorial McGraw Hill.
Colombia, 1980.
PERSEN, Emmanuel. Teoría Moderna de Probabilidad y sus Aplicaciones. Editorial

Limusa. México, 1973.
STEVENSON, William J. Estadística para Administración y Economía. Editorial Harla.

México, 1981.
SEYMOUR Lipschutz, Ph. D. Teoría y problemas de probabilidad. Editorial McGraw Hill.

México, 1973.
TARO, Yamane. Estadística. Editorial Harla, 3a. ed. México, 1979.
TURNER, J.C. Matemática Moderna Aplicada. Probabilidades, Estadística e

Investigación Operativa. Alianza Editorial, S.A. Madrid, 1974.
WILLOUGHBY, Stephens. Probabilidad y Estadística. Publicaciones Culturales, S.A.

México, D.F., 1983.
65
E INFERENCIAL I
FASCÍCULO 3. CORRELACIÓN Y REGRESIÓN

LINEALES
Autores: Alejandro Rosas Snell

Juan Zúñiga Contreras
2
ÍNDICE
INTRODUCCIÓN 5
PROPÓSITO 7
CAPÍTULO 1. CORRELACIÓN Y REGRESIÓN

LINEALES 9
1.1 CORRELACIÓN LINEAL 9
1.1.1 Concepto de Correlación 9
1.1.2 Diagramas de Dispersión 11
1.1.3 Coeficiente de Correlación 19
1.2 REGRESIÓN LINEAL 26
RECAPITULACIÓN 42
AUTOEVALUACIÓN 45
3
4
INTRODUCCIÓN
Al iniciar el estudio de la correlación y la regresión lineales, te darás cuenta que en el

campo de la estadística existen situaciones que requieren el análisis de más de una
variable estadística. Por ejemplo, te has preguntado si alguna vez ¿existe una relación
entre la estatura y el peso?, ¿están relacionadas la edad y la resistencia física?,
¿influye la temperatura en el índice de criminalidad?, ¿tienden a tener mayor
escolaridad las personas con altos ingresos en comparación con las de bajos ingresos?
Así también, un profesor puede estar interesado en conocer de qué manera se puede
predecir el rendimiento en álgebra basándose en el puntaje obtenido en una prueba de
aptitud en dicha asignatura. Así mismo, el psicólogo deseará saber si existe alguna
relación entre el concepto que un alumno tiene de sí mismo y su promedio en las
asignaturas. También, el sociólogo puede estar interesado en saber qué clase de
relación existe entre la tasa de delincuencia juvenil que hay en una comunidad y el
grado de hacinamiento de los hogares que ahí se encuentran. Como observarás son
muchas situaciones cotidianas que necesitan analizarse estadísticamente utilizando por
lo menos dos variables estadísticas.
En todos los ejemplos anteriores, deberás analizar los datos valiéndote de la

correlación y la regresión lineales para obtener información acerca de los problemas
planteados. Este análisis lo realizarás apoyándote en diagramas de dispersión, el
cálculo del coeficiente de correlación de Pearson y la ecuación de mejor ajuste.
Cabe destacar un punto esencial en el análisis, como la estudiaste en funciones las

variables involucradas no necesariamente tienen una relación causa-efecto por lo que
deberá tomarse la información obtenida mediante esta herramienta con una óptica
estrictamente estadística.
Todas estas actividades te permitirán resolver problemas donde aplicarás la correlación

y regresión lineales como instrumentos preliminares en la inferencia estadística.
5
6
PROPÓSITO
En los fascículos anteriores de esta asignatura, has aprendido a utilizar eficazmente los
métodos más usuales para organizar, analizar y cuantificar los datos aportados por
observaciones estadísticas, todo ello dentro del contexto de la estadística descriptiva.
De esa manera, tienes ya un panorama general de los elementos básicos de esta rama
importante de la estadística paramétrica.
En este fascículo,
¿QUÉ APRENDERÁS?
Una introducción a los temas de Correlación y Regresión lineales de

datos bivariados, donde aprenderás a calcular, por un lado, en qué
medida se relacionan dos variables estadísticas, a través del
coeficiente de correlación de Pearson y por otro desarrollarás un
método general para calcular la ecuación de regresión lineal que nos
llevará a la recta de mejor ajuste, misma que nos permitirá realizar
ciertas predicciones estadísticas, a partir de los datos registrados en
una tabulación.
Diferenciando entre los objetivos que se buscan con el análisis de la

correlación lineal y los del análisis de regresión.
7
¿PARA QUE TE VA A SERVIR?
Para abordar los temas de la inferencia estadística, que serán

abordados y analizados en el siguiente curso de Estadística.
8
CAPÍTULO 1
CORRELACIÓN Y REGRESIÓN LINEALES
1.1 CORRELACIÓN LINEAL
1.1.1 CONCEPTO DE CORRELACIÓN
En las diferentes áreas del conocimiento existen problemas que requieren el análisis de
más de una variable, como por ejemplo; un sociólogo puede estar interesado en saber
qué clase de relación existe entre la tasa de delincuencia juvenil que hay en la
comunidad y el grado de hacinamiento de los hogares que allí se encuentran; un
profesor puede estar interesado en conocer de qué manera se puede predecir el
rendimiento en álgebra de un estudiante con base en el puntaje obtenido en una prueba
de aptitud en dicha asignatura; un psicólogo desea saber si existe alguna relación entre
el concepto que tiene un alumno de sí mismo y su promedio en el estudio; un agrónomo
desea conocer si existe relación entre la cantidad de lluvia caída y el rendimiento de
ciertos productos agrícolas, es decir, si es afectado desfavorablemente tanto por la
excesiva lluvia (humedad), como por la excesiva sequía del suelo.
Como te habrás dado cuenta, estas relaciones y muchas otras se pueden investigar por
medio del análisis de correlación y/o regresión, simples o lineales, si la relación está
limitada a dos variables (si fueran más de dos variables, este análisis de correlación y
regresión sería múltiple). En donde la correlación lineal tiene como objetivo principal
medir la intensidad de una relación lineal entre dos variables; la correlación lineal sirve
para medir la relación entre dos variables.
Después de leer lo anterior, te preguntarás, ¿cómo es que una medida puede

representar una relación? En realidad el término medida de correlación lineal implica
encontrar un valor numérico que exprese el grado de correspondencia o dependencia
que existe entre dos variables. Por ejemplo:
9
La siguiente tabla muestra las cantidades vendidas (y) por 15 vendedores de una
compañía en un periodo dado. La tabla también muestra el número de periodos (x) de
experiencia que cada vendedor tiene.
Tabla:
VENDEDOR No. DE AÑOS VENTAS

(xi) (yi)
1 3 2
2 4 3
3 4 4
4 5 3
5 5 4
6 6 3
7 6 4
8 7 4
9 7 5
10 7 6
11 8 5
12 9 6
13 9 7
14 10 7
15 10 8
Mostraremos la relación entre estas dos variables, gráficamente, para que te des
cuenta de cómo están relacionadas estas variables. Más adelante, introduciremos el
coeficiente de Pearson, y una fórmula para calcularlo, que nos indicará el grado de
relación de estas variables.
Grafiquemos los puntos para observar la relación entre estas variables.
Y (Monto de venta)
8
7
6
5
4
3
2
1
X (años de experiencia)
0
1 2 3 4 5 6 7 8 9 10
Gráfica No. 1
10
Este diagrama sugiere que a medida que los valores X aumentan, también los valores
Y aumentan. Además, parece que los puntos se agrupan a lo largo de una línea recta.
Por lo mismo decimos que hay una relación lineal entre las variables X y Y.
Al hablar de la correlación lineal de dos variables es necesario distinguir dos casos:

- Correlación Positiva
- Correlación Negativa.
Correlación Positiva. Ocurre cuando al crecer (o decrecer) una de las variables, la otra
también crece (o decrece). Por ejemplo: a medida que se eleva el nivel de vida de una
población, tiende a aumentar el consumo de artículos que no son de primera
necesidad.
Correlación Negativa. Ocurre cuando al crecer alguna de las variables, la otra decrece
o viceversa. Por ejemplo: a medida que se amplían los sistemas de salubridad y
medicina preventiva, decrece el índice de mortalidad de las enfermedades infecto-
contagiosas.
En el ejemplo anterior (las ventas) tenemos una correlación positiva. Estas dos
correlaciones y otras más, se pueden mostrar utilizando los Diagramas de Dispersión,
de los que nos ocuparemos enseguida.
1.1.2 DIAGRAMAS DE DISPERSIÓN
La forma más sencilla que tienen para predeterminar si existe o no correlación entre
dos variables es construir un diagrama de dispersión.
Para construir un diagrama de dispersión tienes que utilizar un sistema de coordenadas

rectangulares, el cual aprendiste en los fascículos de Matemáticas I, II y IV, ¿lo
recuerdas?, bien. El sistema de coordenadas rectangulares, en el eje X (abscisas), es
donde se marca una escala adecuada para registrar los valores de una de las variables
y sobre el eje Y (ordenadas), se marca otra escala adecuada para representar o
registrar los valores de la otra variable. Los dos valores de las variables forman pares
ordenados (X, Y) dispersos en dicho sistema de coordenadas rectangulares. Esta
dispersión de los pares ordenados deben de sugerir una línea recta, (de aquí el nombre
de correlación lineal) como lo muestra el diagrama de dispersión del ejemplo anterior.
La dispersión de estos puntos tienen las siguientes formas generales:
a) Cuando los puntos se van localizando en los ejes coordenados de manera que
veas que si los valores de la variable X aumentan y los valores de la variable Y
también aumentan, entonces existe una Correlación Lineal Positiva. Un ejemplo así
ocurre al correlacionar las edades del marido y de la mujer en las parejas
conyugales. En este caso a mayor edad del marido, mayor edad de la mujer.
11
Y Edad de la Mujer
Correlación Lineal Positiva
X
Edad del Marido
Gráfica No. 2
Como vemos en el diagrama de dispersión anterior, conforme la edad del marido (X)
aumenta, aumenta la edad de la mujer (Y), por lo que tendremos una correlación lineal
positiva.
b) Si los puntos se localizan en los ejes coordenados y observas que los valores de la
variable X aumentan mientras que los valores de la variable Y decrecen, entonces
existe una Correlación lineal negativa. Un ejemplo así ocurre al correlacionar el
número de accidentes de trabajo acaecidos en un periodo de tiempo, con el
número de dispositivos de seguridad operantes en las plantas de una industria. En
este caso a mayor número de dispositivos de seguridad, menor número de
accidentes de trabajo.
Y Número de Accidentes
Correlación Lineal Negativa
X
Número de Dispositivos de Seguridad
Gráfica No. 3
12
c) Cuando los puntos se localizan en los ejes de coordenadas y observes que su
relación no es lineal, es decir, aunque su patrón de dispersión está definido, estas
variables presentan una relación no lineal. Por ejemplo: al correlacionar la cantidad
de lluvia caída y el rendimiento de ciertos productos agrícolas, que es afectado
desfavorablemente tanto por la excesiva sequía, como por la humedad excesiva del
suelo, se tiene una correlación que se denomina Correlación Curvilínea.
3
Y m por hectárea
Correlación
Curvilínea
X
Precipitación Pluvial (mm)
Gráfica No. 4
d) Cuando los valores de X tienen la misma probabilidad de aparecer aparcadas con

valores de Y o con valores pequeños de Y, decimos que no hay relación entre X y
Y. Por ejemplo: ¿habrá alguna relación entre la estatura de los que fuman cigarros,
con el número de cigarros que fuman a diario? No. entre estas dos variables
(estatura de fumadores y números de cigarros que fuman diariamente) no existe
relación.
Y (Estatura de los fumadores)
Correlación Nula (ninguna relación)
X
(Número de cigarros diarios)
Gráfica No. 5
13
Los diagramas de dispersión que acabas de ver te muestran las diferentes relaciones
entre la variable independiente (X) y la variable dependiente (Y), por lo que podemos
señalar que si tanto los valores de X como los valores de Y tienden a seguir un patrón
recto, entonces existe una correlación lineal.
Para mostrar estos tipos de diagramas de dispersión y recordando cómo se localizan

los puntos o parejas ordenadas en los ejes cartesianos, te invito a que resuelvas
gráficamente los problemas que a continuación mencionamos e infieras algún tipo de
correlación.
Ejemplo:
El Departamento de Ventas de una empresa realiza un análisis comparativo entre el

volumen de pedidos levantados y el número de visitas efectuadas por sus 10
vendedores en un cierto periodo de tiempo. Todos los vendedores trabajan en zonas
similares, en lo referente al número de clientes y al potencial de compra de dichos
clientes. Los resultados de la comparación se muestran a continuación:
Considera el número de visitas como la variable (X) y el monto de los pedidos como la
variable (Y), construye el diagrama de dispersión correspondiente e infiere si existe
algún tipo de correlación.
Vendedor Visitas Pedidos en

Número Realizadas (X) Millones ($) (Y)
1 245 13.4
2 172 10.3
3 291 15.1
4 124 6.9
5 191 7.3
6 218 14.2
7 101 5.2
8 259 11.8
9 307 14.3
10 142 5.5
Solución: La tabla de valores nos proporciona los pares para localizarlos en los ejes,
como se muestra en la siguiente gráfica. Verifica estas localizaciones.
14
Y Pedidos ($)
18
16
14
12
10
110 130 150 170 190 210 230 250 270 290 310
0 100 120 140 160 180 200 220 240 260 280 300 320
X
Número de visitas
Gráfica No. 6
El diagrama de dispersión indica que existe una correlación lineal positiva.
¿sabes por qué?
La construcción de diagramas de dispersión es sencilla, si consideras que tienes

antecedentes de este conocimiento desde Matemáticas I cuando graficabas en el plano
cartesiano. Ahora, el siguiente ejemplo te brinda la oportunidad para que tú construyas
la gráfica correspondiente e indiques qué tipo de correlación tiene.
Ejemplo:
Al efectuarse un estudio sobre la marca de cierto producto se encontró que 50

personas habían usado anteriormente dicha marca y la habían cambiado. La relación
entre el tiempo que habían usado la marca, antes de sustituirla por otra, y el número de
exusuarios en cada caso, fue:
Años de
Uso (X) 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
Número de
Exusuarios (Y) 8 6 9 4 6 5 3 2 4 3
15
Solución:
Y número de exusuarios
12
10
0
X
1 2 3 4 5 6
Año de uso
Gráfica No. 7
La tabla del ejemplo te facilitó la localización de los puntos en los ejes y confirmaste
que existe una correlación lineal negativa. A estas alturas te puedes dar cuenta de la
facilidad con que se construye este tipo de diagramas y se reconoce el tipo de
correlación que existe entre las variables.
Te recomiendo realices tú solo el siguiente ejemplo, inténtalo y estoy seguro que lo

lograrás. Si tienes alguna duda, acude con tu profesor o asesor.
Ejemplo:
Para apoyar la venta de un producto de consumo masivo en un mercado altamente

competitivo, una empresa inició a comienzos de año una intensa campaña publicitaria y
promocional. La comparación entre la inversión publicitaria y las ventas del producto en
12 meses se indican en la siguiente tabulación:
Mes Publicidad (X) (miles de $) Ventas (Y) (miles de $)

Enero 200 350
Febrero 250 300
Marzo 300 630
Abril 250 840
Mayo 330 930
Junio 180 1060
Julio 150 1280
Agosto 350 850
Septiembre 240 700
Octubre 250 1160
Noviembre 230 910
Diciembre 170 1500
16
Construye el diagrama de dispersión e indica si existe alguna correlación entre las
variables.
¿De qué tipo es la correlación?
Para que reafirmes cómo se construye un diagrama de dispersión y los tipos de

correlación que puedes deducir, es aconsejable que realices los siguientes ejercicios y
si acaso tuvieses dudas, acude con tu profesor o asesor para que te puedan orientar.
Para cada uno de los siguientes enunciados, dibuja un diagrama de dispersión e infiere
qué tipo de correlación existe.
1) La siguiente tabla muestra los puntajes obtenidos en satisfacción en el trabajo y los

puntajes que obtuviste en una prueba de aptitud al iniciar sus estudios
universitarios en medicina algunos estudiantes.
Puntaje de
58 54 67 64 66 73 70 85 74 85
satisfacción (Y)
Puntaje de
50 55 60 65 70 75 80 85 90 95
aptitud (X)
2) La siguiente tabla muestra el peso de 11 ovejas y el peso de sus madres a la

misma edad.
Puntaje de la
68 63 70 66 81 74 82 76 81 92 85
Oveja (Y)
Paso de la
60 64 68 72 76 80 84 88 92 96 100
Madre (X)
17
3) La siguiente tabla muestra el número de horas por semana que estudiaron diez
universitarios y su promedio de calificaciones acumulativas.
Promedio de
2.1 2.7 2.6 2.5 3.5 3.0 3.5 3.7 2.9 4.0
Calificaciones (Y)
Horas de
5 6 7 8 9 10 11 12 13 14
Estudio (X)
4) La siguiente tabla muestra los siguientes datos de 11 trabajadores de una

empresa, el tiempo en minutos requeridos para completar una tarea y el número
de minutos invertido en aprender la tarea.
Tiempo gastado
30 30 40 40 50 50 60 60 60 70 70
en aprender (X)
Tiempo para hacer

45 35 20 38 17 26 28 22 12 12 5
la tarea (Y)
5) La siguiente tabla muestra los resultados de una prueba para medir el nivel de
seguridad en sí mismo y de otra prueba para medir el nivel de madurez social de
15 estudiantes de preparatoria.
Puntaje de seguridad 5 10 15 15 20 20 25 25 25 32 40 37 45 35 50
en sí mismo (Y)
Puntaje de madurez 5 5 8 20 15 25 20 35 30 30 30 35 35 40 40
social (X)
Recordemos que la obtención de datos para un análisis estadístico es un proceso

integral que incluye las siguientes etapas:
a) Definición de los objetivos del estudio del experimento.

b) Definición de la variable y la población de interés.
c) Definición de los métodos para la obtención y la medición de los datos.
d) Determinación de las técnicas descriptivas o inferenciales que sean apropiadas
para el análisis de datos.
Se sugiere para la recopilación de un conjunto de datos, se empleen técnicas que uno

mismo utilice.
18
La descripción gráfica se realiza mediante el diagrama de dispersión, el cual se
construye localizando los pares ordenados en el plano cartesiano. No olvides que la
disposición de los puntos en el plano X Y sugiere también el tipo de correlación entre
las variables de estudio. Con este tipo de diagramas y con el cálculo del coeficiente de
correlación r de Pearson, podemos decidir si la correlación es positiva (r > 0), negativa
(r < 0) o nula (r = 0).
1.1.3 COEFICIENTE DE CORRELACIÓN
Ahora que has aprendido a construir los diagramas de dispersión y a identificar cuándo
hay correlación (positiva y negativa), y cuándo no hay, podemos empezar a estudiar
cómo se calcula el Coeficiente de Correlación de Pearson.
De los diversos coeficientes de correlación que existen, el más popular y utilizado es el

Coeficiente de Correlación de Pearson. Para su aplicación es indispensable que la
correlación sea lineal.
El coeficiente de correlación de Pearson, que se simboliza con la letra minúscula r, se

calcula dividiendo la suma de los productos de las desviaciones de cada variante de X
e Y, con respecto a sus medias (suma que se denomina covarianza de X e Y), por el
producto de las desviaciones estándar de ambas variables. En forma práctica, el
coeficiente de correlación de Pearson es:
n  n   n 
n  XY  
  X


  Y 
i1  i1   i 1 
r
 n  n 
2   n  n 
2 
n
 X 2
 
  X



n
 Y 2
 
  Y



 i1  i1    i1  i1  
Donde “n” es el número de datos.
Por medio de ejemplos, veremos cómo se utiliza esta fórmula, para que puedas hacer
interpretaciones de este valor.
Ejemplo:
La siguiente tabla muestra los datos registrados en una muestra aleatoria de 10

escuelas para niños superdotados. La razón alumno/maestro es (X) y los estudiantes
que se salen antes de completar el curso es (Y).
X 20 18 16 15 14 12 12 10 8 5
Y 12 16 10 14 12 10 9 8 7 2
19
Solución:
Se recomienda para hacer el cálculo directo del coeficiente r de Pearson, realizar una
tabla como la siguiente:
(1) (2) (3) (4) (5)

2 2
X Y X Y XY
20 12 400 144 240
18 16 324 256 288
16 10 256 100 160
15 14 225 196 210
14 12 196 144 168
12 10 144 100 120
12 9 144 81 108
10 8 100 64 80
8 7 64 49 56
5 2 25 4 10
2 2
 X = 130  Y = 100  X = 1878  Y = 1138  XY = 1440
De la tabla, ves que en las columnas (1) y (2) se han escrito las puntuaciones
originales. En la columna (3) se obtuvieron los cuadrados de las puntuaciones X y en la
columna (4) los cuadrados de las puntuaciones Y. La columna (5) se forma con el
producto de cada X por cada Y, finalmente se suman los valores de las cinco columnas
y se sustituyen en la fórmula que ya conoces, obteniendo el siguiente resultado.
n  n   n 
n  XY  
  X


  Y 
i1  i1   i 1 
r
 n  n 
2   n  n 
2 
n
  X 2
 
  X



n
  Y 2
 
  Y



 i1  i1    i1  i1  
10 (1440)  (130) (100)

r
10 (1878)  (130)  10 (1138)  (100) 
2 2
14400  13000 1400

r 
(18780  16900) (11380  10000) (1880) (1380)
1400
r
2594400
1400
r  0.869180
1610.7141
20
Ahora interpretaremos este valor. Para ello es necesario conocer las siguientes
características del coeficiente de correlación lineal.
 El valor de r es un número que satisface la desigualdad –1  r  1.
 Cuando la relación de dos variables es perfectamente positiva, o sea cuando al

variar la primera, la segunda varía en las mismas proporciones y en la misma
dirección, el coeficiente de correlación es + 1 (unidad positiva).
 Cuando la relación de dos variables es perfectamente negativa, o sea cuando al

variar la primera, la segunda varía en las mismas proporciones pero en dirección
contraria, el coeficiente de correlación es – 1 (unidad negativa).
 Cuando no existe relación entre las dos variables, o sea cuando al variar la primera,
las variaciones de la segunda no reflejan dependencia o conexión alguna con las
variaciones de la primera, el coeficiente de correlación lineal es cero, entonces la
correlación es nula.
Lo anterior significa que, entre 0 y +1 cabe toda una gama de correlaciones positivas,
que serán tanto más directamente proporcionales, cuanto más se acerquen a +1.
Similarmente entre –1 y 0 cabe toda una gama de correlaciones negativas, que serán
tanto más inversamente proporcionales, cuanto más se acerquen a –1. Los coeficientes
de correlación, cuanto más cerca de cero, indican menor correlación.
Con todas estas características, podemos interpretar el resultado que calculamos del
coeficiente r de Pearson. Como r = 0.869180 podemos concluir que la correlación es
fuerte y positiva.
Con base a las características del coeficiente de correlación lineal (r) de Pearson, se
muestra a continuación una tabla que indica cuándo una correlación lineal es débil,
fuerte, positiva o negativa.
Tabla Significado de
Tendencia del agrupamiento con respecto a

la línea de regresión.
r=0 Correlación nula

0 < r << 1, Correlación baja positiva (débil)
1 – r << 1 Correlación alta positiva (fuerte)
1 << r < 0 Correlación baja negativa (débil)
1 + r << 1 Correlación alta negativa (fuerte)
NOTA: 0 < r << 1, Si r está más cerca de 0 que de 1.
21
Como puedes observar, lo único tedioso es la tabla, pero ésta concentra los resultados
para obtenerlos con cierta facilidad. Te invito a que resuelvas el siguiente ejemplo sin
ver los resultados, salvo te aparezcan dudas, ¡inténtalo!
Ejemplo:
Retomemos los valores utilizados del ejemplo de las visitas realizadas y los pedidos
hechos por diez vendedores de un Departamento de Ventas, ¿lo recuerdas?, te
mostraré la tabla de valores que utilizamos; calcula el coeficiente r de Pearson.
Vendedor Visitas realizadas Pedidos en millones (N$)

Número (X) (Y)
1 245 13.4
2 172 10.3
3 291 15.1
4 124 6.9
5 191 7.3
6 218 14.2
7 101 5.2
8 259 11.8
9 307 14.3
10 142 5.5
2 2
X·Y X Y
3283.00 60025 179.56
1771.60 29584 106.09
4394.10 84681 228.01
855.60 15376 47.61
1394.30 36481 53.29
3095.60 47524 201.64
525.20 10201 27.04
3056.20 67081 139.24
4390.10 94249 204.49
781.00 20164 30.25
Solución:
Recuerda que para facilitar este cálculo, se puede elaborar una tabla para mostrar los
totales, la cual está a continuación de la tabla de datos, como observas.
La suma de las visitas realizadas es:  X = 2050

La suma de los pedidos hechos es:  Y = 104
La suma del producto de (X) por (Y) es:  X Y = 23546.70
2
La suma de los cuadrados de (X) es:  X = 465366
2
La suma de los cuadrados de (Y) es:  Y = 1217.22
22
Ahora procedemos a sustituir en la fórmula del coeficiente de correlación de Pearson, r:
10 (23546.6)  213200
r  0.9
10 (465366)  4202500 10 (1217.22)  10816
Si te apoyas en la tabla del significado de r, ves que existe un grado apreciable de

correlación entre las visitas y los pedidos, y ésta resulta ser positiva.
En el cálculo de r se omitieron algunos procedimientos para crear la necesidad en ti de

hacerlo completo e ir aclarando posibles dudas que pudieran surgir. Si no lo entendiste
después de haberlo hecho de nuevo, revisa el primer ejemplo del cálculo del coeficiente
de correlación r de Pearson.
Calcula el coeficiente de correlación r de Pearson para los siguientes problemas.
1) Para poder medir los resultados de un curso de capacitación realizado con 12

técnicos de una empresa, se tomó un examen teórico antes de comenzar el curso y
se realizó una prueba teórica-práctica al final del curso. La calificación máxima de
cada una de dichas pruebas fue de 10 puntos. El grupo estuvo compuesto por 6
técnicos recientemente ingresados a la empresa (No. 1 al 6) y 6 técnicos con mayor
antigüedad (No. 7 al 12). Los resultados de ambas pruebas fueron:
No. Prueba Previa Prueba Final

1 6.0 6.5
2 4.0 5.5
3 3.0 7.0
4 5.0 5.0
5 6.0 7.0
6 4.0 6.5
7 7.0 10.0
8 4.0 5.0
9 6.5 9.0
10 5.5 7.0
11 6.0 8.5
12 5.0 6.0
23
Con estos resultados calcula los coeficientes de correlación r de:
a) Todo el grupo.
b) El grupo de recién ingresados.
c) El grupo de mayor antigüedad.
¿Qué conclusiones obtienes de los incisos anteriores?
2) En dos tests, diez alumnos obtuvieron las siguientes puntuaciones:
Alumno Test 1 Test 2

1 15 12
2 14 14
3 10 9
4 9 10
5 8 8
6 8 7
7 7 8
8 6 4
9 4 6
10 2 4
¿Cuál es el coeficiente de correlación r de Pearson? Interprétalo.
3) A veinte estudiantes se les aplica un test de capacidad mental y otro sobre

conocimientos de francés. Se obtuvieron las siguientes puntuaciones.
Capacidad Mental Francés

54 203
53 196
51 202
50 186
48 204
47 184
47 196
46 182
45 170
45 178
44 181
44 175
44 168
43 174
40 162
38 158
37 170
36 144
34 141
Calcula el coeficiente de correlación r de Pearson e interprétalo.
24
4) La siguiente tabla muestra los valores obtenidos en asistencia a juntas tanto para
hombres como para mujeres.
Asistencia a juntas
Hombres (X) Mujeres (Y)
10 8
10 7
9 7
9 6
8 5
7 6
7 5
7 4
6 4
6 3
5 4
5 3
4 4
4 3
3 2
¿Cuál es el coeficiente de correlación r de Pearson? Interprétalo.
5) Los siguientes pares de valores representan las dimensiones en cms. de las hojas
del árbol del fresno: (2,1), (3,2), (2,3), (3,3), (4,3), (3,5), (5,5) y (6,7)
Si se conoce la anchura (X) y la longitud (Y) de las hojas, ¿habrá alguna relación
entre estas dos variables?, y si la hay, ¿ésta es fuerte o débil? Realiza los cálculos
adecuados para que contestes estas preguntas.
Hasta este punto, aprendimos a describir el comportamiento de dos variables, a través

de la relación que existe entre dos distribuidores para interpretar la información
obtenida y establecer diferentes tipos de consideraciones, como en los coeficientes de
dispersión de Pearson y así establecer juicios de comportamiento de las distribuciones,
partiendo de los datos de dos distribuciones y usando el algoritmo de Pearson.
25
1.2 REGRESIÓN LINEAL
Ahora que has analizado el grado de relación que existe entre dos variables
estadísticas (datos bivariados), a través del cálculo del coeficiente de correlación de
Pearson, es importante dar un contexto adecuado al tema de Regresión Lineal, con el
objeto de ubicar correctamente algunos de los conceptos que se utilizarán en el
proceso de predicción estadística. Es probable que hayas escuchado una expresión
tan popular como “para muestra basta un botón”, que ilustra muy bien lo que sucede en
la inferencia estadística. El proceso inferencial consiste en obtener información acerca
de una Población de objetos cuantitativos (datos), a partir de información contenido en
una parte de esta población llamada Muestra. Cabe preguntarnos ¿por qué no utilizar
todos los datos de una Población? Pongamos por ejemplo que un especialista desea
información acerca de las dimensiones de las alas de la mariposa Monarca que
anualmente hace una emigración desde Canadá hasta México. ¿Será posible estudiar
todas y cada una de las mariposas monarcas que llegan cada año a nuestro país?
Desde luego que no, pues ello implica un enorme gasto de recursos humanos y
materiales entre otros, cosa que haría prácticamente imposible el estudio. Para llevar
adelante su investigación el especialista tomaría una muestra de la población, mediría y
analizaría estadísticamente los datos que le interesan y apoyándose en un modelo
matemático adecuado trataría de deducir las características esenciales de toda la
población de mariposas. Este modo de proceder del especialista lo realizamos todos
cotidianamente, aunque no de manera tan rigurosa. Por ejemplo, una ama de casa en
el supermercado quiere comprar naranjas y sabe por experiencia que no siempre las
más grandes son las más jugosas, escoge unas cuantas para observar su peso,
consistencia, madurez y si es posible prueba una de ellas, sólo después de hacer estas
operaciones toma una decisión. Al hacerlo no fue necesario que probara todas las
naranjas que había en el aparador o en la bodega o en la huerta del productor que
provee al supermercado, sólo le bastó una muestra.
En los ejemplos siguientes, se hará referencia a muestras de datos, esperamos que

con la explicación anterior logres observar que éstas forman parte de poblaciones más
grandes.
Hablemos ahora de la Regresión Lineal. En primer lugar nos surgen interrogantes

como:
 ¿Qué es la regresión lineal?

 ¿En qué consiste el análisis de regresión?
 ¿Qué técnicas se utilizan en el análisis?
 ¿Qué relación existe entre el análisis de regresión y la predicción estadística?
 ¿Existe una diferencia cuantitativa entre lo observado y lo predicho?
Estas y otras preguntas tratarán de ser contestadas en los siguientes párrafos, a fin de
que puedas usar el modelo estadístico de Regresión Lineal para hacer deducciones o
predicciones estadísticas. Las respuestas a cada una de ellas si bien no serán
definitivas sí serán válidas para nuestro análisis, mismo que deberá ser ampliado y
profundizado en estudios posteriores.
26
Dentro de las aplicaciones de la estadística, podemos encontrar problemas que tienen
que ver con procesos de planeación en la administración de recursos materiales y
humanos, tal es el caso del ejemplo que a continuación te presentamos.
Una compañía comercializadora desea contratar vendedores, para lo cual se ha

seleccionado una muestra de ocho aspirantes, tomando en cuenta dos parámetros de
selección que pueden servir de referencia para tomar una decisión sobre otros
aspirantes. Dichas variables son: los años de experiencia (X) y el monto de ventas
promedio (Y). Los datos se incluyen en la tabla de valores siguiente:
VENDEDOR AÑOS (x) MONTO EN

MILES N% (Y)
1 2 12
2 4 18
3 5 25
4 3 23
5 4 27
6 6 19
7 20 32
8 12 26
Tabla
El conjunto de datos que incluye la tabulación, los llevaremos al plano cartesiano para
obtener la gráfica siguiente:
35
30
25
20
15
10
X
2 4 6 8 10 12 14
Gráfica No. 8
27
Los valores de las variables X y Y forman parejas ordenadas (x,y) susceptibles de ser
graficadas en el plano cartesiano. Al exhibir gráficamente los datos de la tabla No. 1
obtenemos el Diagrama de Dispersión. De la tabulación se puede considerar que al
haber pares ordenados (x,y), teóricamente puede existir una relación Funcional entre
las variables X a la que llamaremos variable independiente e Y a la que llamaremos
variable dependiente suponiendo que el problema es saber ¿cómo varía Y en función
de X? Para hacer esto más claro, te pedimos que apoyándote en la tabulación y en la
gráfica escribas en el siguiente cuadro ¿cuánto esperarías que vendiera un aspirante
con tres años de experiencia?, ¿cuánto si tiene siete u ocho años en ventas?
Vendedor con tres años en ventas: __________________________________
Vendedor con siete años en ventas: __________________________________
Vendedor con once años en ventas: __________________________________
Como te habrás dado cuenta, lo que hiciste para contestar las preguntas anteriores fue
apoyarte en la observación de datos conocidos y en tu experiencia, es decir, has hecho
una estimación empírica a partir de cierta información estadística. Esta forma de
proceder ha sido la base del desarrollo de la estadística moderna, pues de esa manera,
los procesos prospectivos o de planeación a futuro tienen una fundamentación teórica
basada en observaciones hechas con anterioridad. Volveremos a este ejemplo para
proponer un método general de análisis, que nos permita hacer predicciones
estadísticas consistentes. Pero ahora te pedimos que analices el siguiente caso donde
encontrarás nuevas interrogantes.
Una Empresa de publicidad, ha sido contratada para llevar a cabo una campaña para
disminuir el consumo de bebidas alcohólicas entre la juventud. Los planificadores de la
empresa estiman que el consumo disminuirá si incrementan el número de anuncios
televisivos con el eslogan “sin alcohol la vida es más placentera”. Para verificar esta
hipótesis toman una muestra de diez personas al azar y hacen una encuesta que arroja
los siguientes resultados:
NOMBRE EDAD (AÑOS) No. ANUNCIOS No. COPAS INGERIDAS EN

VISTOS EN T.V. UNA FIESTA
Jorge 18 3 8
Andrés 19 5 4
Carlos 21 7 5
Sandra 16 10 3
Martha 22 6 3
Ruth 18 10 2
Juan 17 14 1
Pedro 23 9 5
Raúl 19 8 2
Claudia 22 15 1
Tabla No. 9
28
Construye el diagrama de dispersión correspondiente a los valores tabulares tomando a
“x” (variable independiente) como el número de anuncios de T.V. y a “y” (variable
dependiente) como el número de copas ingeridas por persona y compáralo con el que a
continuación te mostramos.
Y Copas ingeridas
8
7
6
5
4
3
2
1
0 X Anuncios en T.V.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Gráfica No. 10
Por el texto del problema, nos percatamos de que los planificadores de esta Empresa
desean analizar teóricamente, la variación entre el consumo de alcohol y el número de
anuncios vistos por el público, tomando como variable independiente o de entrada este
número de anuncios (X) y como variable dependiente o de salida el número de copas
de bebida ingeridas en una fiesta (Y). Ilustramos esto mediante el siguiente esquema:
( X) proceso (Y)
  empírico 
(No. anuncios) (No. copas)
Esquema No. 1
Contesta las preguntas siguientes apoyándote tanto en la tabulación como en el

diagrama de dispersión del ejemplo anterior.
1. ¿Estás de acuerdo con los planificadores, de que la campaña publicitaria influirá

para que el público joven disminuya su consumo de alcohol? Explica.
__________________________________________________________________________
29
2. ¿Se puede aumentar indefinidamente el número de anuncios para garantizar que
una mayor población consuma menos alcohol? Explica.
__________________________________________________________________________
3. ¿Teóricamente es posible alcanzar el objetivo de eliminar absolutamente el

consumo de alcohol entre la juventud que ha visto el anuncio publicitario? Explica.
__________________________________________________________________________
4. ¿Qué método propones para comprobar el impacto del anuncio publicitario con
relación al consumo de bebidas alcohólicas? Explica.
__________________________________________________________________________
Al contestar las preguntas anteriores, habrás observado que lo que teóricamente es

posible, en la práctica no es tan inmediato, es decir, es probable que estadísticamente
exista una relación entre las variables, pero, eso no quiere decir que existe
necesariamente una relación causa-efecto entre ellas, por lo que, se sugiere interpretar
prudentemente las observaciones derivadas del análisis estadístico.
Este ejemplo nos coloca en el centro de la discusión acerca de cómo predecir un

evento, en este caso el número de copas ingeridas (Y) en términos del número de
anuncios vistos por una persona. Surge la necesidad de encontrar un modelo teórico
para realizar predicciones estadísticas, que nos permita a la vez comparar nuestras
observaciones empíricas con respecto a dicho modelo. Para que sea útil, el modelo en
cuestión, deberá poseer ciertas características entre las cuales se deben contar su
sencillez en el manejo y su eficacia para hacer predicciones estadísticas. El comentario
anterior nos pone en evidencia un punto medular en el análisis, que consiste en colocar
nuestras observaciones empíricas a la luz de un modelo estadístico teórico al que
llamaremos CURVA DE REGRESIÓN o CURVA DE PREDICCIÓN o también CURVA
DE MEJOR AJUSTE.
El párrafo anterior, nos indica que el objetivo primordial en el análisis de Regresión es

encontrar la Curva de regresión para que realicemos con ella predicciones y
observemos que para cada valor (Y) registrado en la tabulación existe un valor de

predicción, y , que pertenece a la curva. La sola presencia en el diagrama de
dispersión de una Curva de regresión nos conduce a preguntarnos entre otras cosas
¿cuál es la ecuación algebráica o trascendente que define a esta curva? ¿Cómo saber
si esta curva es la que ofrece las mejores predicciones estadísticas? Observa en
seguida algunas gráficas de dispersión que incluyen diferentes Curvas de Regresión.
30
1. BIOLOGÍA. El crecimiento de una cierta especie de alga marina al aplicarle cierta
dosis de líquido proteínico.
Y (cm)
X (ml)
Gráfica No. 11
2. ECONOMÍA. Los años de antigüedad de un automóvil y su valor de reventa.
Y ($)
X (años)
Gráfica No. 12
31
3. PSICOLOGÍA. La cantidad de fechas memorizadas-recordadas por un sujeto y el
número de días transcurridos.
Y (por fechas)
X (días)
Gráfica No. 13
4. MEDICINA. El ritmo cardiaco de un espectador de basquetball y la edad de los

jugadores de su equipo favorito.
Y (latidos)
X (edad)
Gráfica No. 14
32
Como ya se mencionó, las curvas trazadas sobre el diagrama de dispersión son
llamadas Curvas de ajuste y como se puede notar tienen distintas formas geométricas
dependiendo del tipo de modelo que la define. Así por ejemplo, tenemos que si

y  f ( x ) es la ecuación de predicción, entonces:
f(x) = a + bx es lineal.
2
f(x) = ax + bx + c se llama cuadrática.
x
f(x) = a(b ) se llama exponencial.
f(x) = a logb x es logarítmica.
Si se trata del modelo lineal, entonces la gráfica es una recta a la que llamaremos:
Recta de ajuste o Recta de regresión. En todo caso, los puntos registrados en el
diagrama de dispersión sugieren el tipo de función de regresión que se debe utilizar.
Ver las siguientes figuras:
Y Y
Recta de ajuste
Recta de ajuste
X X
Gráfica No. 15 Gráfica No. 16
Desde luego que encontrar la expresión de esta función, no siempre es sencillo, por lo
que, se propone el modelo de la ecuación lineal:
y = a + bx
como una buena alternativa de solución al problema de la predicción estadística. Por

cierto, recuerdas ¿cuáles son los parámetros que determinan la función lineal, en este
caso a y b? Si no es así coméntalo con tu profesor o asesor.
Es tiempo de contestar las preguntas básicas, ¿cómo encontrar las rectas de ajuste
para un problema en particular?, ¿qué criterio se debe utilizar para asegurar la recta de
mejor ajuste?
33
El ejemplo siguiente, nos muestra un método de trazo rápido (“mano alzada”) de la
recta de ajuste sobre el diagrama de dispersión. No olvidemos que al trazar la recta,
ésta coincidirá con algunos puntos pero en general habrá puntos que se encuentren
arriba o debajo de la recta. Observa la gráfica del siguiente ejemplo.
Ejemplo:
Dibuja en el plano cartesiano un diagrama de dispersión con los datos x,y de la

tabulación dada. Sobre el diagrama de dispersión traza una recta que incluya los datos
si es posible, si no es así, trata de minimizar las distancias entre la recta y los puntos
tabulados. Mide la distancia entre cada punto (x,y) de la tabulación y su
correspondiente punto de predicción (x,y) que pertenece a la recta. Observa la figura.
X Y
0 2
1 4
2 3
3 6
4 5
5 7
6 9
7 8
Tabla
10 (6,9)
8 (5,7)
(3,6) (7,8)
6
(1,4)
4 (4,5)
(0,2) (2,3)
2
0 X
1 2 3 4 5 6 7
Gráfica No. 17
Es adecuado hacer las convenciones prácticas siguientes:


 La recta de ajuste tiene como ecuación y = a + bx
 Si el punto se encuentra arriba de la recta la distancia será positiva.

 Si el punto se encuentra debajo de la recta la distancia será negativa.
34
Esto se ilustra a continuación.
+1
-1
0.7
Gráfica No. 18
¿Cuánto resultó la suma de las distancias que mediste? ___________________________
¿Puede disminuirse la suma de las distancias que hay entre los puntos y la recta de
ajuste? Explica. ______________________________________________________________
______________________________________________________________________________
Cabe mencionar, que la recta trazada puede no ser la de mejor ajuste, entonces ¿cómo

encontrar la de mejor ajuste? Analicemos qué pasa si las distancias (y - y ) son tan
pequeñas como sea posible, es decir, que estas distancias estén cerca de cero.
¿Cómo varía el cuadrado de la diferencia cuando ésta tiende a cero? Observa los
siguientes ensayos hipotéticos.
  2 2
Si ( y – y ) = 0.25 entonces ( y – y ) = (0.25) = 0.0625
  2 2
Si ( y – y ) = 0.12 entonces ( y – y ) = (0.12) = 0.0144
  2 2
Si ( y – y ) = 0.6 entonces ( y – y ) = (0.06) = 0.0036

Como te habrás dado cuenta, cuando las diferencias ( y – y ) son cada vez más
cercanas a cero, el valor del cuadrado de la diferencia también tiende a cero. Esto es
muy importante, ya que si esta diferencia al cuadrado la asociamos a un cierto valor de
ERROR en la predicción entonces decimos que la Curva de mejor ajuste es aquella
en donde la suma de los errores cuadráticos es mínima. Es decir:
35
 2
Si al valor ( yi – y i ) lo llamamos ERROR (el error es la diferencia al cuadrado entre un

valor tabular (yi) y su respectiva predicción ( y ) entonces la curva de regresión óptima
será la que cumpla con un:
ERROR = D = d 12 + d 22 + d 32 + ... d n2 (Mínimo)
 2
Donde: di = ( yi – y i )
Los resultados anteriores nos inducen a pensar por un lado, que existe una recta que
minimiza las distancias que hay entre ésta y los puntos del diagrama de dispersión y
por otro, que la diferencia entre los puntos registrados y la recta nos ofrece una medida
de la “bondad” de la recta de regresión como instrumento de predicción estadística. En

otras palabras, si la diferencia ( y – y ) entre la recta y cada uno de los puntos de la
tabulación es mínima entonces se tendrá un mejor modelo de predicción. Para
determinar este párrafo, diremos que, a cada valor de la tabulación le corresponderá un
valor de predicción obtenido por la ecuación de regresión:

y = a + bx (1)
De lo anterior, tendremos los siguientes valores:
Tabulado Predicho Diferencia
   2
y1 y1 y1 – y 1 ( y1 – y 1 )
   2
Y2 y2 y2 – y 2 ( y2 – y 2 )
   2
Y3 y3 y3 – y 3 ( y3 – y 3 )
   
Diferencia al cuadrado
   
   2
yn yn yn – y n ( yn – y n )
Si ahora tomamos la suma de las diferencias al cuadrado para encontrar la expresión

del error (D) tendremos:
n 2 2 2 2
           
D   y i  y i    y 1  y 1    y 2  y 2   . . .   y n  y n 
i1        
(2)
36

Si sustituimos la ecuación de predicción y = a + bx (1) en la ecuación de error (2)
tenemos:
n 2 n
  
D   y i  y i  
i1  
 y
i1
i  a  bx i 
 y 
n
2
 i  a  bx i (3)
i1
Como te darás cuenta, los valores xi y yi son valores incluidos en la tabulación, por lo
tanto, el error mínimo (D) sólo depende de los valores que tomen los parámetros a y b
que determinan la recta de regresión o predicción. Esto nos conduce a una
conclusión sorprendente, pues el problema de calcular la recta de regresión o
predicción se reduce a calcular los valores de a y b para los cuales el valor del error (D)
es mínimo.
Hasta aquí, hemos preparado el terreno para desarrollar el método general para
encontrar la Recta de regresión, al que llamaremos Método de Mínimos Cuadrados.
Retomaremos la tabulación del ejemplo No. 1, para observar cómo se calcula la recta
de regresión, a la que también llamaremos: Recta de mínimos Cuadrados. En este
2 2
cálculo utilizaremos los valores cuadráticos x , y y xy, así como también las
2
sumatorias correspondientes xi , yi y xi que ya habías utilizado para el cálculo del
coeficiente de correlación (r).
Consideremos la tabulación donde se incluyen los datos correspondientes a los años

de experiencia (X) y Monto en miles N$ de ventas (Y) de un grupo de vendedores. Se
2 2
completa con los valores de X , y y XY, además de las sumatorias ()
correspondientes.
2 2
X Y X Y XY
2 12 4 144 24
4 18 16 324 72
5 25 25 625 125
3 23 9 529 69
4 27 16 729 108
6 19 36 361 114
10 32 100 1024 320
12 26 144 676 312
 46 182 350 4412 1144
37
Número de parejas ordenadas n = 8
Promedio de X = x =
x
n
Promedio de Y = y =
y
n
Como sabemos la ecuación de la recta de mínimos cuadrados


y = a + bx (1)
está definida por su pendiente b y su ordenada al origen a. Cada uno de estos

parámetros se calcularán a partir de los valores de la tabla, en donde se incluyen las
2
sumatorias x, y, xy y x . De hecho algunos de estos valores ya los utilizaste en el
cálculo del coeficiente de correlación (r) de Pearson. Estos valores serán aplicados a
las relaciones siguientes:
b=
1/ n  xy xy
(Pendiente de la recta) (2)
1/ n  x 2  (x)2

Si suponemos que el punto ( x , y ) satisface la ecuación de regresión y = a + bx
entonces: y =a+b x
de donde despejamos el parámetro a, y obtenemos:
a = y – b x (Ordenada al origen) (3)
Solución:
Calculando los promedios x y y tenemos:
x=
 n = 46 = 5.75 y=
 y = 182 = 22.75
n 8 n 8
Sustituyendo los valores anteriores y los de la tabulación en la ecuación de la pendiente

(2) tenemos:
(1/ 8)(1144)  (5.75)( 22.75) 12.1875

b=   1.1403  1.14
(1/ 8)( 350)  (5.75) 2 10.6875
38
Ahora, calculamos la ordenada al origen, mediante la ecuación (3).
a = 22.75 – (1.1403) (5.75) = 16.1932  16.2
Por lo tanto la ecuación de predicción o regresión será:

y = 16.2 + 1.14x RECTA DE MÍNIMOS CUADRADOS
Otra forma de calcular la recta de mínimos cuadrados es mediante las relaciones:
n  xy   x y
b (4)
n  x   x 
2 2
y la ecuación de mínimos cuadrados:
yp = y + b ( x – x ) (5)
sustituyendo valores tenemos:
(8)(1144)  ( 46)(182) 780

b 2
  1.1403
(8)(350)  ( 46) 684
Para la ecuación de regresión sustituimos valores:
yp = 22.75 + 1.1403(x-5.75)
yp = 22.75 + 1.1403x – 6.5570
yp = 16.192 + 1.1403x
la cual corresponde a la ecuación calculada anteriormente. El manejo de los números

decimales y del redondeo cobra gran importancia en este punto, de ahí que se deben
manejar adecuadamente durante los cálculos.
Para terminar el ejemplo, utilizaremos la ecuación de regresión encontrada para realizar

las estimaciones solicitadas en el ejemplo de los vendedores.
- Ventas estimadas para un vendedor con tres años de experiencia.


y = 16.2 + 1.14(3) = 19.62 (miles de $)
- Ventas estimadas para un vendedor con once años de experiencia.


y = 16.2 + 1.14(11) = 28.74 (miles de $)
39
Aún cuando no se mencionó al principio de este problema, nosotros esperaríamos que
un vendedor con más experiencia vendería más que un vendedor con menos
experiencia, los resultados anteriores corroboran esta suposición, ya que según nuestro
modelo, un vendedor con 11 años de experiencia vende más que uno que tiene sólo 3
años en ventas. Por otro lado, si copiamos la gráfica de dispersión del ejemplo 1 y
sobre ésta trazamos la recta que une los dos puntos estimados entonces tenemos el
diagrama completo.
30 Recta de mínimos
cuadrados
(11,28.74)
25
(2,19.62)
20
15
10
X
2 4 6 8 10 12 14
Gráfica No. 19
Un elemento de comprobación de la ecuación de mínimos cuadrados, lo podemos

obtener al sustituir en ésta los valores de x y y con lo cual verificamos que esta pareja
( x , y ) pertenece a la recta de regresión.
En primer término, comprobemos que el punto ( x , y ), pertenece a la recta de regresión

tal y como lo habíamos supuesto.
Si la ecuación de regresión es:
y = 16.2 + 1.14 x
al sustituir x obtenemos:
y = 16.2 + 1.14 x
pero x = 5.75 luego: y = 16.2 + 1.14(5.75) = 16.2 + 6.555 = 22.755  22.75
lo que es el valor de y
40
Que se puede observar en la gráfica siguiente:
30
25
22.75 (5.75,2275)
20
X, Y 
15
10
Gráfica No. 20
Una vez que has desarrollado estos conceptos, te recomendamos que calcules las
ecuaciones de regresión de los ejemplos 2 y 3 de este tema con el fin de que
practiques el desarrollo del método de mínimos cuadrados.
Hasta aquí hemos visto la regresión lineal, tomando los datos de dos distribuciones y
graficándolos en un plano cartesiano, además trazando la recta de mejor ajuste a sus
coordenadas para poder predecir el tipo de regresión y el valor de una variable
dependiente en función de otra variable llamada independiente, encontrando el modelo
de función lineal por medio del método de los mínimos cuadrados, para determinar el
tipo de regresión (positiva o negativa), por último a través de la resolución de problemas
que se puedan modelar con la función lineal, para describir el comportamiento del valor
de dos variables de dos distribuciones distintas y observar cómo están relacionada a fin
de utilizar una para predecir la otra.
41
RECAPITULACIÓN
Un esquema de los temas de correlación y regresión lineales se te presenta a

continuación, compleméntalo y agrega algún resumen de los puntos que consideres
más relevantes de los mismos. Coméntalo con tu profesor o asesor.
REGRESIÓN ESTADÍSTICA
REGRESIÓN LINEAL REGRESIÓN POLINOMIAL O

TRASCENDENTE
PAREJAS ORDENADAS
TABULACIÓN
GRÁFICA DE DISPERSIÓN
RECTA DE REGRESIÓN
O PREDICCIÓN
MÉTODOS DE MÍNIMOS
CUADRADOS
b
n  xy   x  y 
n  x   x 
2 2

y = a + bx
a= y +b(x– x )

yP= x +b(x- x )
GRÁFICA
RESUMEN DE CORRELACIÓN Y REGRESIÓN LINEALES
42
Para reafirmar los conocimientos que adquiriste sobre los temas de Correlación y
Regresión Lineales al estudiar este fascículo, te sugerimos realizar las siguientes
actividades:
1. Los siguientes datos muestran el número de horas (x) dedicadas a estudiar para un
examen y la calificación (y) obtenida en dicha prueba. Observa en el diagrama de
dispersión si existe alguna correlación lineal y en caso de que así sea, calcula el
coeficiente de correlación de Pearson (r).
x (horas-estudio) 2 3 3 4 4 5 5 6 6 6 7 7 7 8 8
y (calificación) 5 5 7 5 7 7 8 6 9 8 7 9 10 8 9
2. Se realizó un estudio para investigar la relación que existe entre el peso (x) en
libras (lb), la presión sanguínea (y), de adultos varones cuyas edades oscilan entre
19 y 30 años. Se obtuvieron los siguientes resultados.
x(lb) 173 178 145 146 157 175 173 137 199 131 152 172 163 170 135 159
2
y(lb/pul ) 76 76 74 70 80 68 90 70 96 80 90 72 76 80 68 72
Calcula el coeficiente de correlación de Pearson (r) e interpreta tu resultado.
3. Se efectuó un experimento para investigar las variables que probablemente

estuvieran relacionadas con el espíritu de iniciativa en las situaciones de resolución
de problemas. Los sujetos formaban parte de una muestra aleatoria de 14
estudiantes de penúltimo año de una prestigiada universidad. Los resultados se
muestran en la tabla. Calcula el coeficiente de Pearson (r) e interprétalo.
Puntaje de auto-
5 6 6 7 8 8 8 9 9 9 10 10 11 12
concepto (y)
Puntaje iniciativa
5 6 8 7 9 11 12 11 12 14 14 16 15 17
personal (x)
4. De acuerdo con lo que has desarrollado en este fascículo, contesta las preguntas
que se encuentran al inicio del tema de regresión y coméntalas con tu profesor o
asesor.
43
5. En una de las Secretarías del gobierno federal se ha implantado el sistema de retiro
voluntario. Para analizar dicho proceso se toma una muestra aleatoria en los
distintos departamentos, donde se relaciona el número de empleados que han
renunciado y el número de años de servicio. Se pretende estimar cuántos
trabajadores renunciarían en función de su antigüedad. Se obtuvieron los
siguientes datos:
No. de años de No. de empleados

servicio (X) que renunciaron (Y)
16 14
9 15
13 16
10 14
15 17
10 10
11 15
12 12
Calcula el coeficiente de correlación de Pearson (r) y obtén la ecuación de regresión.

Estima cuántos empleados renunciarían si tuvieran 14 o 17 años de servicio.
Construye la gráfica de dispersión junto con la recta de mejor ajuste.
6. Te sugerimos realices una lectura comentada de los capítulos siguientes: Relación

entre correlación y regresión lineales páginas 485-491 del libro Estadística
elemental por R. Johnson, de la bibliografía.
El modelo bivariante, páginas 339-347 del libro Estadística con aplicaciones a las
Ciencias Sociales y a la educación por W.W. Daniel, de la bibliografía.
44
AUTOEVALUACIÓN
A continuación te proporcionamos algunas de las respuestas de los problemas que

están redondeadas a dos o tres cifras, de las Actividades de Consolidación.
Complétalos y verifica tus respuestas.
Soluciones:
1) El diagrama de dispersión lo dejamos para que los compares con tus compañeros y
cambies impresiones. El cálculo de r redondeado a tres cifras, da como resultado
0.741.
2) El coeficiente r de Pearson redondeado a tres cifras tiene un valor de 0.453 y como

recuerdas, el tipo de correlación que existe entre las variables se llama….Positiva.
Completa la respuesta, con base a los diferentes diagramas de dispersión e
interpreta dicho resultado.
3) El coeficiente r de Pearson redondeado a tres cifras tiene un valor de 0.95.
4) El coeficiente de Pearson redondeado a tres cifras tiene un valor de 0.999.
Para el tema de Regresión Lineal, se sugiere elaborar un ensayo acerca de los puntos
esenciales del tema, de manera que el profesor o asesor observe el manejo de éstos.
45
El objetivo de las siguientes actividades es el que puedas realizar no sólo cálculos de

correlación sino que también apliques e interpretes tus resultados.
1. En un grupo de observaciones de estaturas de padres e hijos, que obtengas de tu

entorno social (familiares o amistades), comprueba la hipótesis de que si los padres
son altos, entonces sus hijos serán altos también y si los padres son bajos
entonces sus hijos serán bajos. ¿Cuál es el comportamiento de estaturas de los
hijos con relación a la estatura promedio de los padres? Tiene esto que ver con los
conceptos de Correlación y Regresión lineales? Si es así, explica.
(Sugerencia: Construye la gráfica de dispersión. Calcula el coeficiente de correlación y

obtén la recta de mínimos cuadrados para que te sirva de base en el análisis).
2. Explica en forma completa la diferencia entre relaciones causales y relaciones

estadísticas.
3. Explica ampliamente los conceptos de correlación y regresión.
4. Los siguientes resultados muestran las puntuaciones obtenidas por 6 estudiantes

tomados al azar en las asignaturas de idiomas y matemáticas.
Idiomas (Y) 525 515 510 495 430 400

Matemáticas (X) 550 535 535 520 455 420
Construye la gráfica de dispersión. Calcula el coeficiente de correlación de Pearson (r)

y encuentra la ecuación de regresión. Haz una conjetura acerca de ¡cuánto obtendría
en matemáticas un estudiante que hubiera obtenido 480 puntos en idiomas? Si se
considera el aprendizaje de las matemáticas como un problema de lenguaje ¿es
razonable pensar que el buen manejo de otros idiomas facilitaría el manejo del lenguaje
matemático? Explica.

5. Comprueba que la recta y = a + bx puede expresarse como Y = y + b(x - x ).
Te sugerimos encuentres la recta de regresión de los ejemplos desarrollados
durante el fascículo, con esta relación).
46
ARNOL Naiman, R. Rosenfeld, G. Zirkel. Introducción a la Estadística. México, D.F.

Editorial Mc Graw Hill 1987.
Este texto cubre el 100% del programa, manejando el enfoque del mismo. Sobre
el tema incluye una variedad de ejemplos prácticos que permiten una visión
amplia en este terreno.
JOHNSON, Robert. Estadística elemental. México, D.F., grupo Editorial Iberoamérica

1990.
Este texto cubre el 90% del programa, siguiendo el enfoque del mismo. Con
relación al tema su tratamiento es muy adecuado.
N. M. Downie, R. W. Heath. Métodos Estadísticos Aplicados. 3ª. Edición. México, D.F.

Editorial Harla. 1973.
PORTILLA Chimal, E. Estadística (primer curso). México, D.F. Nueva Editorial

Interamericana. 1980.
Este libro aborda el tema de manera muy adecuada, incluye ejemplos muy
ilustrativos.
PROAÑO, Humberto. Estadística Aplicada a la Mercadotecnia. 4ta. Edición. México,

D.F. Editorial Diana. 1983.
Este texto cubre el 80% del curso. El tratamiento de los temas es muy claro,
además de que incluye ejemplos de aplicación práctica.
WAYNE W. Daniel. Estadística con Aplicaciones a las Ciencias Sociales y a la

Educación. México, D.F. Editorial Mc Graw Hill / Interamericana de México.
1988.
47
E INFERENCIAL I
FASCÍCULO 4. INTRODUCCIÓN A LA
PROBABILIDAD
Autores: Alejandro Rosas Snell

Silvino González Mendoza
1
2
ÍNDICE
INTRODUCCIÓN 5
PROPÓSITO 7
CAPÍTULO 1. ELEMENTOS DE LA PROBABILIDAD 9
1.1 FRECUENCIA RELATIVA 11
1.1.1 EXPERIMENTOS 11
1.1.2 ESPACIO MUESTRAL 12
1.1.3 EVENTOS 13
1.1.4 PROPIEDADES DE LA FRECUENCIA

RELATIVA 15
1.2. NOCIONES DE PROBABILIDAD 19
1.2.1 CONCEPTO DE PROBABILIDAD Y SU

EXPRESIÓN ALGEBRÁICA 19
1.2.2 PROBABILIDAD DE EVENTOS

MUTUAMENTE EXCLUYENTES Y NO
MUTUAMENTE EXCLUYENTES 26
a) Eventos Mutuamente Excluyentes 26

b) Eventos No Mutuamente Excluyentes 29
1.2.3 PROBABILIDAD CONDICIONAL E

INDEPENDIENTE 33
1.2.4 EVENTOS INDEPENDIENTES 37
3
1.3 CÁLCULO DE PROBABILIDADES:
PROCEDIMIENTOS ELEMENTALES DE
CONTEO 39
1.3.1 ARREGLOS CON REPETICIÓN Y SIN

REPETICIÓN 39
a) Permutaciones o Arreglos con Repetición 39

b) Permutaciones o Arreglos sin Repetición 41
c) Combinaciones 44
RECAPITULACIÓN 49
AUTOEVALUACIÓN 52
4
INTRODUCCIÓN
Si volteamos a nuestro alrededor nos daremos cuenta que nuestra vida está llena de
afirmaciones que llevan implícito el concepto de probabilidad, como por ejemplo: los
pronósticos meteorológicos nos indican las probabilidades de lluvia; los médicos nos
dicen qué probabilidades hay de que nuestras enfermedades se curen por medio de
determinados tratamientos terapéuticos; los profesores, en la escuela, especulan sobre
nuestras posibilidades de éxito en el bachillerato; el Sr. Cruz, la posibilidad de obtener el
primer premio de la lotería, etc.
Para lograr y facilitar la comprensión del contenido de este fascículo, iniciaremos con un
bosquejo histórico de la probabilidad señalando las causas y motivos que promovieron
su creación. Definiremos lo que es un Experimento, lo que es un Evento; conocerás el
concepto de espacio muestral y las propiedades de la frecuencia relativa; ésta última
servirá como base para definir la probabilidad de ocurrencia de un evento. Todo lo
anterior nos permitirá abordar el cálculo de probabilidad de eventos excluyentes, así
como la probabilidad condicional para llegar a la probabilidad de eventos
independientes. Además, veremos que cuando se calculan probabilidades, se debe
determinar el número de veces que ocurre un evento de interés. Después, estudiaremos
las técnicas de conteo para conocer las probabilidades de ocurrencia en diversos
problemas.
Todo lo anterior es parte de los fundamentos de la Teoría de la Probabilidad (la cual es

una de las ramas de las Matemáticas que se ocupa de los fenómenos que se producen
al azar o fenómenos aleatorios) y base para iniciar el estudio a la introducción de la
Estadística Inferencial; por tales razones, al finalizar el estudio de este fascículo podrás
calcular probabilidades, obtener el número total de resultados posibles de una muestra o
experimento.
Todo lo anterior te servirá como base para estudiar los temas de la siguiente asignatura
EDIN 2 y las distribuciones probabilísticas.
5
6
PROPÓSITO
El mundo real está lleno de incertidumbre. Las situaciones que implican incertidumbre
varían de simples juegos de azar a campos como el de las Ciencias Físicas, Ciencias
Sociales, industria y seguros.
¿QUÉ APRENDERÁS?
Las nociones básicas de la probabilidad partiendo del enfoque

clásico e histórico, planteando problemas relacionados con la
probabilidad, familiarizándonos con conceptos como: frecuencia
relativa, experimentos, espacio muestral y evento.
A través del estudio del comportamiento de fenómenos aleatorios y

del cálculo de sus probabilidades, mediante la aplicación de
teoremas y axiomas.
Para hacer inferencias acerca de fenómenos aleatorios tales como

la presión arterial de una persona o la carga que debe soportar un
puente antes de caer.
7
8
CAPÍTULO 1
ELEMENTOS DE LA PROBABILIDAD
En lenguaje cotidiano, la probabilidad se entiende como una medida de nuestra

confianza de que ocurra un evento futuro, esta declaración es una manera
representativa y práctica de interpretar este concepto, aunque buscamos entender con
más claridad su contexto, cómo se mide y la forma en que contribuye a hacer
inferencias. Este concepto es necesario cuando se trabaja con sucesos físicos,
biológicos o sociales que generan observaciones que no pueden predecirse con certeza,
por ejemplo, la presión arterial de una persona en un momento determinado no puede
predecirse con exactitud.
Los jugadores a lo largo de la historia siempre han recurrido a las probabilidades para
realizar sus apuestas. Aproximadamente por el año 3500 A.C., juegos de azar
practicados con objetos de hueso, que podrían ser consideradas como los precursores
de los dados, fueron ampliamente desarrollados en Egipto y otros lugares. Dados
cúbicos con marcas virtualmente idénticas a los dados modernos se han encontrado en
tumbas egipcias que datan del año 2000 A.C. Sabemos que el juego con dados ha sido
popular desde esa época y que fue parte importante en el primer desarrollo de la Teoría
de la Probabilidad.
Se considera que por el siglo XVII de nuestra era un noble francés, llamado Antonie
Gombauld (1607-1684) puso en tela de juicio el fundamento matemático del éxito y del
fracaso en las mesas de juego. Gombaulod formuló esta pregunta al matemático francés
Blaise Pascal (1623-1662): ¿Cuál es la probabilidad de que salgan dos seises por lo
menos una vez en veinticuatro lanzamientos de un par de dados? Pascal resolvió el
problema, pues la Teoría de la Probabilidad empezaba a interesarle tanto como a
Gombauld.
9
Ambos compartieron sus ideas con el famoso matemático Pierre de Fermat (1601-1665).
Las cartas escritas por los tres constituyen la primera revista académica dedicada a la
Teoría de la Probabilidad. Sin embargo, probabilidades numéricas para ciertas
combinaciones de dados ya habían sido calculadas por Girolamo Cardano (1501-1576) y
por Galileo Galilei (1564-1642).
La Teoría de la Probabilidad toma importancia cuando Jacob Bernoulli (1645-1705),

Abraham D’Moivre (1667-1754), el reverendo Thomas Bayes (1702-1761)y Joseph
Lagrage (1736-1813) inventaron fórmulas y técnicas probabilísticas. En el siglo XIX
Pierre Simón, Marquis de Laplace (1749-1827), unificó esas ideas y formuló la primera
teoría general de la probabilidad.
La Teoría de la Probabilidad se ha desarrollado constantemente desde el siglo XVII y

se ha aplicado ampliamente en diversos campos de estudio. Hoy, la Teoría de la
Probabilidad es una herramienta importante en la mayoría de las áreas de ingeniería,
ciencia y administración.
Como te das cuenta, la Teoría de la Probabilidad tiene muchas aplicaciones formales.

El concepto de Probabilidad aparece también en nuestras vidas y en las
conversaciones cotidianas. Por ejemplo, a menudo oímos y usamos expresiones tales
como: “probablemente lloverá mañana por la tarde”; “es muy probable que el avión
llegue tarde”. Cada una de estas expresiones y otras más están basadas en el concepto
de probabilidad.
A pesar de que el concepto de probabilidad es tan común y natural a nuestra experiencia

cotidiana, no existe una única interpretación científica de término probabilidad aceptada
por todos los estadísticos y autoridades científicas. De hecho, el verdadero significado de
la probabilidad es todavía un tema muy conflictivo por lo que más adelante en este
fascículo descubriremos algunas interpretaciones diferentes de la probabilidad.
Las situaciones que dieron origen al uso del término Probabilidad (problemas
relacionados con la probabilidad) aparece alrededor del año de 1650, cuando sugerido
por los juegos de dados, de cartas, del lanzamiento de una moneda se planteó la
cuestión de determinar la probabilidad de ganar una partida. De esta manera surgieron
los fundamentos del cálculo de probabilidad; Fermat y Pascal, esquematizando las
cuestiones propuestas, dieron en 1654 la primera definición de probabilidad.
10
1.1 FRECUENCIA RELATIVA
1.1.1 EXPERIMENTOS
La Teoría de la Probabilidad tiene que ver con los diversos resultados posibles que
pueden obtenerse y los posibles sucesos que podrían ocurrir cuando se realiza un
experimento. El término experimento se utiliza en la teoría de la probabilidad para
describir virtualmente cualquier proceso cuyos resultados no se conocen de antemano
con certeza. Entonces, un experimento es el proceso mediante el cual se obtiene
una observación (o una medición) de un fenómeno.
Si se realiza un experimento, éste puede tener uno de varios

resultados posibles; si no puede predecirse con seguridad cual
ocurrirá, se dice que el experimento es aleatorio.
Si un experimento tiene un único resultado posible, que al realizarlo

sabemos que ocurrirá, el experimento se llamará determinístico.
Por ejemplo:
Un experimento aleatorio es el siguiente. Si lanzas una moneda legal, cuyo resultado

puede ser, caer águila o caer sol. En este experimento no podemos predecir con
seguridad cuál resultado aparecerá con certeza.
Otro experimento aleatorio es el siguiente. Al lanzar un dado legal, los resultados que se
obtienen pueden ser cualquier número del 1 al 6.
Un experimento determinístico es el siguiente. Extraer una bola de una urna que

contiene únicamente bolas de un sólo color, digamos negras. Si nos fijamos en el color
de la bola extraída sabemos de antemano que es negra.
11
Para reafirmar lo anterior, señala en los siguientes casos cuales son experimentos
aleatorios y cuales determinísticos, si tienes alguna duda, acude con tu profesor o asesor
para que la aclares.
Enunciados:
1) Es un experimento en el cual una moneda se lanza 10 veces, el experimentador está

interesado en determinar la probabilidad de obtener al menos cuatro caras (soles).
2) En un experimento para el cual se va a seleccionar una muestra de 1000 transistores

de un cargamento de artículos similares y en el que se va inspeccionar cada artículo
seleccionado, una persona está interesada en determinar la probabilidad de que no
más de uno de los transistores seleccionados sea defectuoso.
3) A partir de información relacionada con la vida de Thomas Jefferson, alguien desea

establecer la probabilidad de que Jefferson haya nacido en el año de 1741.
1.1.2 ESPACIO MUESTRAL
Antes de desarrollar este tema recordaremos qué es una Muestra: Una Muestra es un
conjunto de medidas u observaciones tomadas a partir de una población dada.
El conjunto de todos los posibles resultados de un experimento se llama “Espacio

muestral” del experimento. El espacio muestral de un experimento puede considerarse
como un conjunto de diferentes resultados posibles, en el que cada resultado puede ser
un punto, un elemento o un evento del espacio muestral. Por ejemplo, al realizar el
experimento de lanzar un dado y observar la cara que aparece hacia arriba, vemos una
serie de resultados posibles: uno, dos, tres, cuatro, cinco o seis; por lo que el espacio
muestral es:
S = 1, 2, 3, 4, 5, 6
12
Otro ejemplo es, si realizamos el experimento; si lanzamos dos monedas al aire,
observamos que los posibles resultados pueden ser: aparecen dos soles; aparece un sol
una águila, aparece una águila y un sol o aparecen dos águilas; por lo que el espacio
muestral es:
T = { (sol, sol), (sol, águila), (águila, sol), (águila, águila) }
Otro ejemplo es, si realizamos el experimento; se lanzan dos dados, los posibles
resultados al observar el número de puntos en ambas caras de los dados es el siguiente
espacio muestral:
(1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)

(2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
(3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
V=
(4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
(5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
(6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Recuerda que el conjunto de los resultados posibles de un experimento se le llama

“Espacio Muestral”, o “Espacio de Eventos”.
1.1.3 EVENTOS
Con base a los experimentos anteriores (lanzar un dado, lanzar dos monedas y lanzar
dos dados), observamos que éstos pueden tener uno o más resultados, a los cuales se
les llama “Eventos” y que se representan mediante letras mayúsculas. Por ejemplo, si un
experimento consiste en registrar el número de los nuevos pedidos que recibe un
fabricante, algunos eventos son los siguientes:
A: no llegan pedidos nuevos.
B: el número de pedidos nuevos es mayor que 50.
C: el número de pedidos nuevos es de 25.
D: el número de pedidos nuevos es menor que 15.
Podríamos hacer una lista de muchos eventos asociados con el experimento, algunos
con más posibilidad de ocurrir que otros. Desde el punto de vista de conjuntos, un
evento es un subconjunto de un espacio muestral.
13
Por ejemplo, en el experimento de tirar un dado se tiene:
{1} es un evento elemental o evento simple
{2,4} es un evento
{1,2,3} es un evento
{1, 2, 3, 4, 5, 6} es un evento
Los subconjuntos constituidos por un único elemento se llaman eventos simples o

eventos elementales. El evento constituido por todos los eventos simples o elementales
del espacio muestral se llama evento seguro. En el ejemplo de la tirada del dado el
evento seguro S es el evento S = {1, 2, 3, 4, 5, 6}, y es un evento seguro porque siempre
ocurre. El evento que nunca ocurre   = Ø se llama evento imposible.
Por ejemplo, se lanza un dado, el evento de que caiga un siete, es imposible.
Los conceptos de espacio muestral y evento que tú ya conoces, están relacionados

con el concepto de Frecuencia relativa. La frecuencia relativa con la que puede
esperarse que ocurra un evento es, la posibilidad del evento. Es decir, la probabilidad de
un evento A es una medida de la creencia en que el experimento resultará de un evento
A.
Para darle sentido a este concepto, concluimos que se generan poblaciones de

observaciones al repetir un experimento de un gran número de veces.
Si el evento A se observa f veces en este gran número N de repeticiones del

experimento, entonces se considera que la probabilidad del evento A es:
f
P (A) 
N
Esta interpretación práctica del significado de la probabilidad se llama “Concepto de

Frecuencia Relativa de la Probabilidad”.
A continuación discutiremos las propiedades de frecuencia relativa que están

relacionadas con los conceptos de espacio muestral y evento, sin omitir la consideración
de que la probabilidad de un evento en términos de la frecuencia relativa es
intuitivamente aceptable pero no proporciona una manera para determinar la
probabilidad de un evento.
14
1. Determina el espacio muestral y cada uno de los eventos que se indican del
experimento de lanzar dos dados y observar el número de puntos en ambos y
determinar.
a) Cuando caen dos caras iguales.

b) Cuando la suma de ambos dados es menor que 5.
2. Determinar el espacio muestral, resultado de lanzar una moneda 3 veces y

determinar los siguientes eventos:
a) Donde el resultado es que dos o más caras aparecen consecutivamente.

b) Donde todos los resultados son iguales.
1.1.4 PROPIEDADES DE LA FRECUENCIA RELATIVA
Si A es un evento de un espacio muestral S asociado a un experimento que puede

repetirse N veces, entonces el evento A puede o no ocurrir en cada repetición. Si f es el
número de veces que ocurre el evento A en las N repeticiones, entonces a “f” se le llama
Frecuencia Relativa. Por ejemplo, en la siguiente tabla se muestran las frecuencias con
que ocurrieron los eventos A (aparece sol) y B (aparece águila) al repetir el experimento
de lanzar 300 veces una moneda.
Frecuencia
Evento f
Relativa
A (sol) 90
90  0.3
300
210
B (águila) 210  0.7
300
15
Con las frecuencias relativas 0.3 y 0.7 del ejemplo anterior, se puede concluir que cerca
de 30 por 100 de las veces que la moneda se tira ocurrirá el evento A (sol); es decir, la
probabilidad de ocurrencia de A (sol) es de 0.3.
Es común calcular la probabilidad de un evento A mediante la expresión:
f Número de veces que ocurre el evento A

P=(A)=
N Número de repeticiones del experimento.
En la vida real no podemos repetir un experimento millones de veces. Es posible sin

embargo, convenir en que la probabilidad de un evento tiene que satisfacer ciertas
propiedades congruentes con el concepto de frecuencia relativa, las cuales son:
“P (A) = 0”, el evento no ocurre

“P (A) = 1”, el evento ocurre seguramente
“P (A) = un valor más cercano a uno, indica mayor probabilidad de
ocurrencia del evento A, y un valor más cercano de cero, indica
menor probabilidad de ocurrencia del evento (A). Con esto se
establece que 0  P(A)  1.
Ejemplo: 1) Un equipo de natación de secundaria, está formado por 5

estudiantes de 3er. grado, 4 de 2do. grado y 3 de 1er. grado. Se
elige un estudiante al azar para ser capitán del equipo, ¿Cuál es la
probabilidad de que el estudiante seleccionado sea:
a) de 2do. grado de secundaria.

b) de 2do. semestre de bachillerato.
c) de cualquier grado de secundaria.

 

El espacio muestral es, S  1
, 2
,
3, 
4,
5, 6
, 7
 , 8
,
9, 10
, 11
,12


 3 Sec 2 Sec 1 Sec 

Solución: a) Si A es elemento “seleccionar un estudiante de 2do. grado de

secundaria” entonces:
4 1
A = cuatro estudiantes por lo que P (A)  
12 3
16
b) Si B es el evento “seleccionar un estudiante de 2do. semestre de
bachillerato”, entonces:
0
B =   = Ø por lo que P (B)  0
12
c) Si C es el evento “seleccionar un estudiante de cualquier grado de

secundaria del equipo de natación”, entonces:
12
C = doce estudiantes por lo que P (C)  1
12
Ejemplo: 2) Sea el experimento de lanzar un dado legal, calcula la probabilidad

de que:
a) salga un dos en la cara superior del dado,

b) salga cualquier número del espacio muestral,
c) salga un nueve en la cara superior del dado.
El espacio muestral es, S = 1, 2, 3, 4, 5, 6 
Solución: 1
a) evento A, que salga un dos es; A = 2, por lo que: PA  
6
b) el evento B, que salga cualquier número es;

6
B = 1, 2, 3, 4, 5, 6 , por lo que: P  B  1
6
c) el evento C, que salga un nueve es; C = { } = Ø, por lo que:

0
PC   0
6
Las propiedades anteriores de la Frecuencia Relativa son muy importantes, por lo que es
necesario que las aprendas.
17
Para que practiques lo aprendido, resuelve el siguiente problema:
1. Mediante un diagnóstico optométrico, una encuesta clasificó a una gran cantidad de

adultos que necesitaban usar gafas para corregir su visión durante la lectura y si los
empleaban para leer. Las proporciones que caen dentro de las cuatro categorías
aparecen en la siguiente tabla:
Utiliza anteojos para leer
Requiere anteojos Si No
Si 0.44 0.14
No 0.02 0.40
Si se elige un adulto del grupo, determina basándote en las propiedades de la frecuencia

relativa, las probabilidades de los eventos que se definen en seguida:
a) El adulto requiere anteojos.
b) El adulto requiere anteojos, pero no los utiliza.
c) El adulto utiliza anteojos, ya sea que los requiera o no.
18
1.2 NOCIONES DE PROBABILIDAD
1.2.1 CONCEPTO DE PROBABILIDAD
Podemos definir el concepto de probabilidad clásica, como el concepto que sostuvieron

Pascal, Fermat y sus sucesores hasta el presente siglo.
Probabilidad Clásica:
“Si en un experimento pueden producirse N resultados igualmente probables

y mutuamente excluyentes, y si dentro de estos N resultados del evento E
puede ocurrir NE veces, entonces la probabilidad del evento E está dada por:
Ne
PE  ”.
N
Esta definición es útil para resolver problemas de juegos de azar para los cuales se creó
originalmente la teoría de la probabilidad.
Supongamos que lanzamos una dado, la probabilidad de obtener un 2 en el espacio

1
muestral (S= 1, 2, 3, 4, 5, 6 , entonces el evento A = 2, por lo que PA   ) es de
6
1
.
6
Supongamos que lanzamos una moneda, la probabilidad de obtener sol, (M=

1 1
águila, sol , entonces el evento B = sol, por lo que PB  ) es de .
2 2
Por último, tomemos un juego de cartas bien barajeado en el que el experimento de

“sacar una carta” hay 52 resultados posibles (un mazo de cartas se compone de 52
4
cartas con cuatro figuras diferentes). La probabilidad del evento “sacar un as” es (G
52
4 1
= 52 cartas, entonces el evento C (cuatro ases), por lo que PC   ).
52 13
A continuación te mostraremos algunos ejemplos del cálculo de probabilidades;
19
Ejemplo: 3) ¿Cuál es la probabilidad de obtener sol al lanzar una moneda?
Espacio muestral S = águila, sol, entonces la probabilidad es:
NE eventos favorables 1
PE   
N número de casos posibles 2
1
¿Sabes porqué al calcular la probabilidad de obtener un águila también es ?
2
En este ejemplo como en el que sigue hemos utilizado la definición de Probabilidad

Clásica:
Probabilidad de un evento = Número de resultados donde ocurre el evento

Número total de posibles resultados
Debemos aclarar que al utilizar la probabilidad clásica, cada uno de los

resultados posibles debe tener la misma probabilidad.
Ejemplo: 4) ¿Cuál es la probabilidad de obtener 3 al lanzar un dado?
Espacio muestral D =  1, 2, 3, 4, 5, 6  para obtener la probabilidad de que

salga un 3, se dividen los eventos favorables entre el número de casos
posibles, entonces:
NE 1
P E  
N 6
En este ejemplo, nos hemos apoyado en el siguiente procedimiento:
1 1 Número de resultados de un lanzamiento

P3  
1 1 1 1 1 1 6 del dado que producirá un 3
Número de resultados posibles de un lanzamiento del

dado (que producirá un 1, un 2, un 3, un 4, un 5 o un 6).
20
Ejemplo: 5) ¿Cuál es la probabilidad de obtener un as de una baraja de 52 cartas?
Un mazo de cartas consta de 52 cartas (espacio muestral), formado con

cuatro figuras diferentes (corazón, trébol, espada y diamante) con trece
cartas cada una, esto quiere decir, que para cada figura habrá un as, por lo
que la probabilidad de obtener un as será:
NE número de ases del mazo de cartas 4 1

PE    
N número de cartas del mazo 52 13
Ejemplo: 6) Una urna tiene 3 bolas rojas, 5 blancas y 4 azules.

¿Cuál es la probabilidad de que al sacar una bola esta sea:
a) roja.
b) blanca.
c) azul.
Utilicemos el mismo procedimiento de los ejemplos anteriores, para calcular

las probabilidades.
a) Sea R el evento “sacar bolas rojas”, (R = R1,R2,R3),
número de bolasrojas 3 1
entonces: P R   
número de bolasen la urna 12 4
b) Sea B el evento “sacar bolas blancas”, B = B1, B2, B3, B4, B5,
número de bolasblancas 5
entonces: PB  
número de bolasen la urna 12
c) Sea A el evento “sacar bolas azules” , A = A1, A2, A3, A4,
número de bolasazules 4 1
entonces: PA    
número de bolasen la urna 12 3
Expresión Algebraica de la Probabilidad.
Con base en las probabilidades anteriores, podemos establecer las expresiones

algebraicas para calcular las probabilidades de un evento o suceso, la cual es:
NE NE
PE   Expresión algebraica de la probabilidad.
N n
21
donde:
NE número de ocurrenciade eventos favorables

 (Probabilidad clásica)
N número de casos posibles
NE número de éxitos
 (Probabilidad según la frecuencia relativa)
n número de resultadosposibles
El cálculo de probabilidades se basa en los siguientes axiomas. Si E indica cualquier

evento para el cual se desea calcular la probabilidad, entonces:
a) PE  0 La probabilidad de cualquier evento debe ser un valor positivo

o cero. Si la probabilidad es cero, el evento no ocurre.
b) P  1 [ P( A )  1] La probabilidad es igual a uno, si el evento ocurre

Todos los siempre.
resultados
c) PE  1 La probabilidad de un evento nunca puede ser mayor que uno.

0  P(E)  1
Realicemos algunos ejemplos para reafirmar el cálculo de probabilidades;
Ejemplo: 7) Un equipo de fútbol de primaria está integrado por 4 alumnos de sexto año,
4 de quinto año, y 3 de cuarto año. Si se elige a un estudiante al azar para
ser capitán, ¿cuál es la probabilidad de que sea:
a) de segundo año?: A = { } = Ø, entonces P (A) = P (Ø) = 0
3
b) de cuarto año?: B = {tres alumnos}, entonces P (B) =
11
en el inciso (a), te das cuenta que no hay alumnos de segundo año en el equipo de
fútbol, es decir, el conjunto de segundo año es vacío [Ø], porque no hay elementos.
Para (b), el conjunto tiene tres elementos, de los once elementos que forman el equipo.
Ejemplo: 8) En una carrera de 10 caballos, tomaron parte 3 del Sr. Ruiz. Si los diez
ejemplares tienen la misma probabilidad de ganar, ¿cuál es la probabilidad
de que el premio lo gane algún caballo del Sr. Ruiz?
22
A es el evento; “gane un caballo del Sr. Ruiz, entonces;
número de caballosque pertenecenal Sr.Ruiz

P( A ) 
número de caballosque participan
3
Por lo que: P (A) =
10
¿Podrás calcular cuál es la probabilidad de que el premio lo gane un caballo que no

pertenezca al Sr. Ruiz?, ¡Inténtalo!, si no lo logras, fíjate en el siguiente procedimiento.
La suma de las probabilidades de éxito y fracaso, siempre dará como resultado la

unidad.
P (  ) = P (A) + P (A´) = 1
Utilizando los diagramas de Venn para plantear el problema

A’ P(A) = 1 – P(A’)
A P(A’) = 1 – P(A)
Donde P (A) es la probabilidad de éxito, o sea, que gane un caballo del Sr. Ruiz, y P
(A´) ( complemento de A) es la probabilidad de fracaso, o sea, que no gane un caballo
del Sr. Ruiz, entonces:
3
Si P (A) = y P (  ) = 1, por lo que si despejamos P ( A´ )
10
tendremos: P (  ) = P (A) + P ( A´ )
3
sustituyendo 1= + P ( A´ )
10
3 7
entonces P ( A´ ) = 1  
10 10
Si conocemos los valores de P (A) y P (A´), tenemos que: P () = P (A) + P (A´).
3 7 10
sustituyendo P () =    1
10 10 10
por lo que P () = 1
23
Acabas de ver que existe una probabilidad de éxito y otra de fracaso y la suma de éstas
siempre es igual a la unidad P  1 .
Hagamos otro ejemplo:
Ejemplo: 9) Consideremos el experimento de extraer una esfera de una urna que

contiene tres esferas negras, dos verdes y cuatro rojas. ¿Cuál es la
probabilidad de extraer una esfera:
a) negra?
b) verde?
c) roja?
d) negra o verde?
e) roja o verde?

 

El espacio muestral del experimento es S  1
,
2,
3, 4
, 5, 6
, 7
 , 8,
 9

 N V R 

a) La probabilidad de extraer una esfera negra de entre nueve esferas que

hay en una urna, es:
3 1
P (N)  
9 3
b) La probabilidad de extraer una esfera verde de entre nueve esferas que

2
P (V) 
9
c) La probabilidad de extraer una esfera roja de entre nueve esferas que

4
P (R) 
9
d) La probabilidad de extraer una esfera negra o verde de entre nueve

esferas que hay en una urna, nos lleva a otro concepto. “Como la
ocurrencia de un evento (extraer una esfera negra) impide la ocurrencia
del otro evento (extraer una esfera verde), es decir, no pueden ocurrir al
mismo tiempo, porqué sólo hay una extracción, entonces la probabilidad
de que ocurra ésfera negra´ o ésfera verde´ será:
Probabilidad de que ocurra P (N U V) = P(N) + P(V)

por lo menos uno de los eventos
24
3 2 5
por lo que P (N U V)    que es la probabilidad de que salga
9 9 9
una esfera negra o una verde.
e) Análogamente con el inciso anterior, la probabilidad de extraer una

esfera roja o verde de entre nueve esferas que hay en la urna, es de:
4 2 6 2
P R U V  P R  PV  , sustituyendo P R U V     
9 9 9 3
que es la probabilidad de que salga una esfera roja o una esfera verde.
Ejemplo: 10) Por descuido se revolvieron 15 focos defectuosos con 25 no defectuosos. Si

se selecciona al azar uno, ¿cuál es la probabilidad de que:
a) sirva?
b) no funcione?
a) si el evento A es “focos no defectuosos”, entonces:
25 5
si A = 25 focos no defectuosos, por lo que P (A)  
40 8
b) si el evento Aés “focos defectuosos”, entonces:
15 3
si A = 15 focos defectuosos, por lo que P (A´)  
40 8
Observemos que los eventos A y A´ (complemento de A) son eventos complementarios,

porque la ocurrencia de uno impide la ocurrencia del otro PA'  1 - P A  y el evento de
unión de estos eventos, es un evento seguro
P A   PA´  PA U A´  1
entonces: P () = P (A) + P (A´)
5 3 8
sustituyendo P ()    1
8 8 8
por lo que P  1
25
Con los ejemplos anteriores, te has percatado de lo sencillo que es aplicar la expresión
algebraica de la probabilidad
NE ne
P E  
N n
Con esto, resulta fácil abordar los siguientes temas.
Resuelve los siguientes ejercicios.
1. Si un experimento tiene 10 posibles resultados igualmente probables, ¿qué

probabilidad tiene cada uno de ellos?
2. La probabilidad que ocurra un evento es 0.83, ¿cuál es la probabilidad de que no

ocurra?
3. Se realizaron 800 lanzamientos de una moneda equilibrada, de los cuales 476 veces
cayó águila (A) y 324 cayó sol (S), la frecuencia relativa de los eventos A y S, es:
1.2.2 PROBABILIDAD DE EVENTOS MUTUAMENTE EXCLUYENTES Y NO

MUTUAMENTE EXCLUYENTES
a) Eventos Mutuamente Excluyentes
Hagamos un ejemplo para llegar a comprender los eventos mutuamente excluyentes:
Ejemplo: 11) En un grupo de 200 estudiantes, 140 (80 mujeres y 60 hombres) son
estudiantes de tiempo completo y 60 (40 mujeres y 20 hombres) son de
medio tiempo:
Tiempo completo Tiempo parcial Total

MUJERES 80 40 120
HOMBRES 60 20 80
TOTAL 140 60 200
26
Considera A como el evento “el estudiante es de tiempo completo” y B como el evento
“el estudiante es de tiempo parcial y además hombre”. Observamos que ningún
estudiante es de “tiempo completo” y de tiempo parcial, simultáneamente, entonces los
eventos A y B son mutuamente excluyentes.
La siguiente figura plantea desde el punto de vista de conjuntos, el ejemplo de elegir

aleatoriamente de entre 200 estudiantes, un estudiante con base a los eventos A y B.

A B
140 20
40
Las probabilidades de estos eventos con base a la expresión algebraica de la

probabilidad son:
140 14 7
P (A)    y
200 20 10
20 2 1
P (B)   
200 20 10
Para obtener la probabilidad del evento A o B (A o B) = (A U B), (U es unión de dos

conjuntos), parece razonable sumar las dos probabilidades anteriores, es decir,
7 1 8 4
P A o B    
1 10 10 5
Si observamos el espacio muestral, vemos que existen 160 estudiantes en total de

tiempo completo (tanto hombres como mujeres), y de tiempo parcial (únicamente
 160 16 8 4
hombres)     .
 200 20 10 5 
por lo tanto:
Si A y B son eventos mutuamente excluyentes o disjuntos (son eventos que no tienen

elementos comunes) como se muestra en la siguiente figura; la probabilidad del evento A
o B es:
27

A B
P (A ó B) = P (A U B) = P (A) + P(B)
Eventos Mutuamente Excluyentes
De la figura anterior, observas que no hay intersección entre los eventos A y B, por lo
que, P (A  B) = 0 ; (A  B = ). Hagamos otro ejemplo:
Ejemplo: 12) Se lanza un dado equilibrado, si A es el evento, “cae un número menor que
3” y B es el evento, “cae un número mayor que 3”. ¿Cuál es la
probabilidad de que ocurra A o B?
Si A = 1, 2 y B = 4, 5, 6, vemos que los eventos son mutuamente excluyentes,
porque no hay elementos comunes entre estos eventos P (A  B) = P () = 0 , por lo
tanto, la probabilidad de que ocurra por lo menos uno de los eventos es:
2 3
P (A) = y P (B) = ;
6 6
2 3 5
entonces: P (A U B) = P (A) + P (B) =  
6 6 6
Los ejemplos anteriores (11 y 12) nos permiten concluir que:
Eventos mutuamente excluyentes “no pueden ocurrir al mismo tiempo”

es decir, si alguno de ellos sucede, los restantes no pueden suceder.
28
b) Eventos No Mutuamente Excluyentes
Cuando los eventos no son mutuamente excluyentes, no pueden obtenerse la

probabilidad de que ocurra uno u otro sumando simplemente las probabilidades
individuales. Utilicemos el ejemplo del grupo de 200 estudiantes, para explicar lo
anterior.
Primeramente definamos un tercer evento, C, “el estudiante seleccionado es mujer”;

consideremos ahora los eventos A (el estudiante seleccionado estudia tiempo completo)
y C. Ya que hay 80 estudiantes que además de estudiar tiempo completo son mujeres,
los eventos A y C no son mutuamente excluyentes, es decir, A y C sí tienen elementos
en común.
Para encontrar P (A  C), debemos de saber cuánto es la probabilidad de A y de C:
140 14 7 120 12 6
P A     y P C   
200 20 10 200 20 10
si sumamos ambas probabilidades, se obtiene:
 7 6  13
P( A )  P(C)       1.3
 10 10  10
la cual es mayor que 1. ¿Recuerdas que la probabilidad nunca debe ser mayor que uno?
Lo que ocurre es que al sumar las probabilidades estamos considerando dos veces a los
80 estudiantes de tiempo completo y mujeres, por lo que debemos de restar esta
intersección.
La siguiente figura plantea desde el punto de vista de los conjuntos, el ejemplo de elegir
aleatoriamente de entre 200 estudiantes, un estudiante con base a los eventos A y C:
A 
C
60 80
e 40
29
Las probabilidades de estos eventos son:
140 14 7
P (A)   
200 20 10
120 12 6
P (C)    y
200 20 10
80 8 4
P (A  C)    ,
200 20 10
7 6 4 9
entonces: P (A U C) = P (A) + P (C) – P (A  C)    
10 10 10 10
Si observamos el espacio muestral, vemos que existen 180 estudiantes que son de
tiempo completo o mujer, en consecuencia, la probabilidad de A o C es:
180 18 9
P (A o C) = P (A U C)   
200 20 10
Por lo tanto:
Si A y B son eventos no mutuamente excluyentes (eventos que si tienen elementos

comunes) como se muestra en la siguiente figura, la probabilidad de que ocurra el
evento A o el evento B o ambas es igual a la probabilidad de que ocurra el evento A más
la probabilidad de que ocurra el evento B menos la probabilidad de que ocurran ambos
eventos A y B.

A B
P ( A U B ) = P ( A ) + P ( B ) – P (A  B)
Eventos no Mutuamente Excluyentes
Realicemos los siguientes ejemplos para aclarar posibles dudas.
30
Ejemplo: 13) Encuentra la probabilidad de que en una tirada de un dado se obtenga el
número 4 ó 5.
Solución: Designaremos el número de elementos de un conjunto encerrando el símbolo

del conjunto entre paréntesis, y anteponiendo a este un n minúscula. Así,
para nuestro ejemplo tendremos que:
A es el evento “cae el número cuatro” y B es el evento “cae el número cinco”,

por lo que:
P (A) = 1 y P (B) = 1,
1 1 2 1
entonces: P (A U B) = P (A) + P (B) =   
6 6 6 3
Observas que los eventos son excluyentes (disjuntos), porque no hay elementos
comunes entre estos eventos.
Ejemplo: 14) Identifiquemos S como el evento de que asistas a un bachillerato estatal y

R el evento de que asistas a un bachillerato privado, considera que no
asistirás a ambos simultáneamente, si la probabilidad de que asistas al
2 1
estatal es y al privado es , ¿Cuál es la probabilidad de:
5 2
a) que asistas ya sea al estatal o al privado? y

b) que no asistas a ninguno de ellos?
2 1
Solución: Si P (S)  y P (P) = ,
5 2
2 1 45 9
entonces: P (S U R) = P (S) + P (R)    
5 2 10 10
Para resolver el inciso (b), ¿recuerdas que la suma de las probabilidades de éxito y
fracaso siempre es la unidad?, es decir, P () = P (A) + P(A´); entonces:
P () = P (asista a cualquier bachillerato) + P (no asista a cualquier bachillerato)
por lo que: 1 = P ( S U R ) + P (no asista a cualquier bachillerato),
despejando P (no asista a cualquier bachillerato): P = 1 – P ( S U R ),
9 10  9 1
entonces: P (no asista a cualquier bachillerato) = 1   
10 10 10
31
Ejemplo: 15) En un salón de clases, 50 aprueban sólo matemáticas, 25 sólo inglés y 10
aprueban ambas asignaturas. ¿Cuál es la probabilidad de que un
estudiante elegido al azar, aprueba matemáticas o inglés?
Solución: Si M es el evento “jóvenes que aprueban matemáticas” e I es el evento

“estudiantes que aprueban inglés”, entonces:
50 25 10
P (M)  , P(I)  y P (M  I)  ;
85 85 85
P (M U I) = P ( M ) + P ( I ) – P (M  I),
50 25 10 65 13
por lo que tendremos: P (M U I) =    
85 85 85 85 17
Ejemplo: 16) Se realizó una encuesta entre jóvenes y se halló que 400 juegan sólo
fútbol, 175 ajedrez y 125 juegan fútbol o ajedrez. ¿Cuál es la probabilidad
de que un joven elegido al azar juegue ambos deportes?
Solución: Si F es el evento “jóvenes que juegan el fútbol” y A es el evento “jóvenes que

juegan ajedrez”, entonces:
400 175 125

P(F)= , P (A) y P(FUA)= ;
700 700 700
P ( F U A ) = P ( F ) + P (A)  P ( F  A )
Como el problema nos pide la intersección de los dos eventos, entonces

despejemos dicha intersección de la expresión anterior:
P ( F  A ) = P ( F ) + P (A)  P ( F U A ),
400 175 125 450 45 9

por lo tanto: P ( F  A ) =     
700 700 700 700 70 14
Como te habrás dado cuenta, los ejemplos están sencillos, para que puedas aclarar
dudas. Continuemos.
32
Hasta ahora hemos visto los antecedentes históricos, su función y sus aplicaciones, las
posibilidades en contra o a favor de un evento determinado, la frecuencia relativa de los
valores de una variable, los experimentos aleatorios y determinísticos, los tipos de
espacios maestrales y las propiedades de la frecuencia relativa.
También explicamos a través de problemas sencillos las nociones de probabilidad, el

concepto de probabilidad a partir de su definición y comparándolas, la expresión
algebraica de la probabilidad para caracterizarla como un comportamiento de los datos
de un fenómeno y por último, la probabilidad de eventos excluyentes y no mutuamente
excluyentes, encontrando la probabilidad de dos eventos cuando haya una intersección.
1.2.3 PROBABILIDAD CONDICIONAL E INDEPENDIENTE
La probabilidad de un evento puede ser afectada por la ocurrencia de otro. En este caso,
los eventos son dependientes (eventos no independientes), por que la ocurrencia de un
evento afecta a la ocurrencia del otro evento. Por ejemplo, si de una urna que contiene
tres bolas rojas y tres negras se extrae al azar una bola, y después otra, los eventos A
“obtener bola negra en la primera extracción” y B ”obtener bola negra en la segunda
extracción”.
Observamos que los eventos son dependientes (no independientes), porque la bola
extraída en la primera extracción no se regresa a la urna antes de la segunda extracción.
Entonces, la probabilidad de B depende de la ocurrencia de A.
Si A no ocurre, (la bola extraída en la primera vez es roja) entonces la probabilidad de B

es:
3 Casos favorables tres negras

P(B)  
5 Totalde resultados dos rojas y tres negras
Ahora, si A ocurre,  P( A )  3  1  la bola extraída en la primera vez es negra y la

 6 2
probabilidad de B es:
2 Casos favorables dos negras

P(B)  
5 Totalde resultados tres rojas y dos negras
33
Como observas, la probabilidad de ocurrencia de un evento depende de la ocurrencia del
otro evento, entonces:
Si A y B son dos eventos dependientes (no independientes), la probabilidad de que

ocurre a tanto A como B es igual al producto de la probabilidad de A multiplicada por la
probabilidad de B, con la condición de que A haya ocurrido, denotado por P (B/A) (se lee:
probabilidad de que ocurra B dado que haya ocurrido A), entonces:
P (A  B) = P (A)  P (B/A)
Por lo que, la probabilidad de un evento cuando ocurre otro se le llama “Probabilidad

Condicional”, denotada por P (B/A).
La probabilidad condicional de cualquier evento es la probabilidad de que este evento

ocurra, con la condición de que otro evento haya ocurrido, por lo que, si despejamos de
la expresión anterior la probabilidad condicional P (B/A), tendremos:
P (A  B)
P (B/A) = donde P (A) > 0
P (A)
Realicemos algunos ejemplos:
Ejemplo: 17) Sea el experimento de extraer dos bolas, una después de otra, de una
urna que contiene cuatro bolas rojas y tres negras. Si A es el evento
“extraer bola negra en la primera ocasión” y B es el evento “extraer bola
negra en la segunda ocasión”. ¿Cuál es la probabilidad de que ocurra A y
B?
Solución: Como nos piden la probabilidad de ocurrencia de los eventos A y B,

tendremos:
P (A) es la probabilidad de obtener bola negra en la primera extracción; es

3
decir: P (A)  .
7
P (B/A) es la probabilidad de obtener bola negra en la segunda extracción, si

2 1
la bola extraída en la primera ocasión fue negra; es decir: P (B/A) =  ,
6 3
P (A  B) es la probabilidad de que ocurra A y B;
3 1 3 1
es decir: P (A  B) = P(A) • P (B/A) = • = 
7 3 21 7
34
Ejemplo: 18) Se lanzan tres monedas, ¿Cuál es la probabilidad de que todos sean
soles, y si la primera de las monedas es sol?
(SSS) (SAS) (SAA) (SSA) 

Solución: El espacio muestral es     , donde S es sol y A
( AAA) ( AAS) ( ASA) ( ASS)
es águila.
¿Sabes como se obtuvo el espacio muestral? ¿No?, Entonces fíjate en el siguiente

razonamiento: los posibles resultados de una moneda son águila o sol, si se lanzan tres
monedas, tenemos;
lanzamientos
3
2 = 8 posible resultado
resultado de lanzar una moneda
Si A es el evento “la primera moneda es sol” condición y B es el evento “las tres sean
soles”, entonces:
4 1
A = (SSS) (SSA) (SAS) (SAA)   P (A) =  ,
8 2
1
B = (SSS)   P (B) = y
8
1
A  B = (SSS)  P (A  B) = , por lo que tenemos;
8
Probabilidad de que ocurra el evento B dado que haya ocurrido el evento A:

PA  B
P (B/A) = ,
P A 
1/ 8 2 1
sustituyendo: P (B/A) =  
1/ 2 8 4
Ejemplo: 19) La probabilidad de que un alumno repruebe Matemáticas es 18%, de que

repruebe Literatura es 16%, de que reprueben ambas asignaturas es 4%.
Si se elige al azar un alumno y éste reprobó Literatura, ¿cuál es la
probabilidad de que haya reprobado también Matemáticas?
Solución: Si M es el evento “reprobó Matemáticas”, L es el evento “reprobó Literatura y M

 L es el evento “reprobó ambas asignaturas”, entonces:
9
P (M) = 0.18 = (el porcentaje se convirtió en decimal, dividiendo el 18 % entre
50
100 y omitiendo el signo de porcentaje).
35
4 1
P (L) = 0.16 = y P (M  L) = 0.04 = .
25 25
La probabilidad de que ocurra el evento M dado que haya ocurrido el evento L, es:
P (M  L) 0.04
P (M/L) = 
P(L) 0.16
Se multiplica por 100 ambas cantidades para expresar el resultado como un cociente de
dos enteros.
0.4100 4 1
P (M/L) =  
0.15100 16 4
Ejemplo: 20) Consideremos experimento de lanzar dos dados, si A es el evento en el

“primer dado aparece un número par” y B es el evento “en el segundo
dado aparece el número 2 ó 3”, ¿cuál es la posibilidad de que ocurra A y
B?
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

 
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)  A
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6) 
Solución: El espacio muestral es    
( 4,1) ( 4,2) ( 4,3) ( 4,4) ( 4,5) ( 4,6) A
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6) 
 
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)  A
B B
Para obtener el espacio muestral, se razonó de la siguiente manera:
lanzamiento de dos dados

2
6 = 36 posible resultado
resultado de lanzar un dado
A es el evento “en el primer dado aparece un número par”, entonces:
A {hay seis 2, hay seis 4 y hay seis 6} = {18} por lo que
18 9 3 1
P (A) =   
36 18 6 2
36
B es el evento “en el segundo dado aparece el número 2 ó 3, entonces:
12 6 1
B = {hay seis 2 y seis 3} = {12} por lo que P (B) =  
36 18 3
P (A  B) es la probabilidad de que ocurra A y B, por lo que tenemos:
A  B = {(2,2) (2,3) (4,2) (4,3) (6,2) (6,3)} por lo que
6 1
P (A  B) = 
36 6
Numéricamente, el ejemplo se resuelve como sigue:
1
P (A  B) = P(A)  P (B/A) , entonces P (A) = (hay 18 elementos)
2
1
y P (B/A) = (hay 12 elementos),
3
1 1 1
sustituyendo: P (B  A) =  
2 3 6
1.2.4 EVENTOS INDEPENDIENTES
Dos eventos son independientes, si la ocurrencia de uno de ellos no afecta a la

ocurrencia del otro.
Ejemplo: 21) Consideremos el experimento de lanzar dos monedas, ¿cuál es la

probabilidad de que en la primera moneda aparezca águila y de que en
la segunda moneda aparezca sol?
Solución: Si A es el evento “aparece águila en la primera moneda” y si B es el evento

“aparece sol en la segunda moneda”,
entonces:  =  (SS) (SA) (AS) (AA) ,
2 1 2 1
A = (AS) (AA)  P (A) =  y B = (SS) (AS)  P (B) =  .
4 2 4 2
Como A y B son eventos independientes, porque la ocurrencia de A no afecta

a la ocurrencia de B y viceversa, entonces:
1 1 1
P (A  B) = P(A)  P (B) sustituyendo: P (A  B) =  
2 2 4
37
Quizá te estés preguntando ¿porqué la expresión de eventos independientes (A  B)
= P (A)  P (B) aparece sin la probabilidad condicional P B/A , siendo que iniciamos
con la expresión P (A  B) = P (A)  P (B/A) ?
La razón es muy simple. Recuerda que en la posibilidad condicional, si ocurre un evento,

sólo que haya ocurrido otro antes, entonces:
P A  B
P (B/A) =  pero si los eventos son independientes, tendremos que
PA 
P (AUB) = P(A) P (B), sustituyendo en la expresión de probabilidad condicional:
P A   PB
P (B/A) =  PB ; lo mismo ocurre cuando:
PA 
P A  B P A   PB
P (A/B) =   PA  , entonces:
PB PB
P (A  B) = P(A)  P (B/A) = P(A)  P(B)
1. Si el espacio muestral es  = {3, 5, 7, 9, 11, 13}, y el evento es E = {x,M,d,x,7,3}.

Entonces el tipo de evento es:
2. Si  es el espacio muestral de un experimento aleatorio y A1, A2 son eventos de ,

además A1 y A2 son eventos:
3. Sea el caso de lanzar un par de dados corrientes. Si la suma es 6, hallar la

probabilidad de que uno de los dados sea 2.
4. Un hombre visita a un matrimonio que tiene dos hijos. Uno de los hijos entra a la
sala. Hallar la probabilidad p de que otro sea también niño si:
a) Se sabe que el otro hijo (o hija) es menor.
b) No se sabe nada del otro hijo.
38
1.3 CÁLCULO DE PROBABILIDADES: PROCEDIMIENTOS
ELEMENTALES DE CONTEO
Los arreglos o permutaciones son útiles para contar el número de todos los diferentes
arreglos u ordenamientos que se pueden hacer con un conjunto de objetos. Podemos
utilizar el concepto de permutación para determinar el número de formas en que se les
pueden asignar a los alumnos los asientos de una clase, el número de formas que se
pueden sentar en un escenario un grupo de conferencistas, el número de maneras en
que se puede organizar un grupo de libros en un anaquel, etc. Entonces:
“Una permutación es uno de los diferentes arreglos u ordenamientos que

se pueden hacer con todos o con parte de los elementos de un conjunto”.
1.3.1 ARREGLOS CON REPETICIÓN Y SIN REPETICIÓN
a) Permutaciones o Arreglos con Repetición
Con frecuencia deseamos saber el número de arreglos que se pueden hacer con un
conjunto de objetos.
Ejemplo: 22) ¿Cuántos números de cuatro cifras se pueden formar, con los números
{6,9}?
Solución: Para formar cantidades de cuatro cifras con los números 6, 9 tenemos que
tomarlos en forma repetida, de la siguiente forma; Para el primer número de la
cantidad de cuatro cifras, habrá dos números, (2), para el segundo número de
la cifra, habrá dos números (2), para el tercer número de la cifra, habrá dos
números (2) y para el cuarto número de la cifra, habrá dos números (2),
entonces:
2  2  2  2  2 4  16
4
Con este resultado (2 = 16), observamos que el número de elementos (n) es dos, que se
van a formar cantidades de cuatro en cuatro (r) y para ese ejemplo, se pueden formar 16
números de cuatro cifras cada uno. Investiga cuáles son estos 16 números.
39
Con base al ejemplo anterior, para referirnos a (números de permutaciones o arreglos
con repeticiones de n objetos tomados de r en r) para el ejemplo, de 4 en 4, utilizaremos
el símbolo:
Permutaciones o Arreglos con repetición:
donde n es número de elementos y r la forma de tomarlos.
Ejemplo: 23) ¿Cuántas placas de auto existen que consta de dos letras y tres cifras en
ese orden, si la primera letra es A y la segunda letra puede ser de la A a la
F?
L L D D D
1ra. letra = A 1
2da. letra = A, B, C, D, E o F 6
1er. dígito = 0 al 9 10
2do. dígito = 0 al 9 10
3er. dígito = 0 al 9 10
3
1  6  10  6000
Entonces los arreglos de las letras pueden ser AA, AB, AC, AD, AE o AF, los cuales son
seis. El número de dígitos que se puede utilizar en la placa será
3 3
10 · 10 · 10 = 10 , entonces: 6 · 10 = 6000 placas.
Es posible que a veces queramos calcular el número de permutaciones o arreglos que

tengan n objetos de los cuales i son de un tipo, j de otro tipo y k también de otro tipo.
Ejemplo: 24) En un salón de clases de kinder hay ocho figuras de plástico: tres
cuadradas, tres triángulos y dos rectángulos, las figuras no se pueden
distinguir de otro modo. ¿De cuántas maneras se pueden ordenar, si se
quiere hacer una fila sobre la mesa con estas figuras?
Solución: En este ejemplo se muestra objetos de los cuales algunos son iguales entre
sí, es decir, hay tres cuadrados ( i ), tres triángulos ( j ) y dos rectángulos (k) y
en total tenemos ocho (n) figuras. Para calcular el número de permutaciones
o arreglos de ocho objetos, de los cuales son de un tipo ( i ), de un tipo ( j ) y
de un tipo (k), se utiliza la siguiente expresión:
40
n! Permutaciones o arreglos de ordenamientos
n Pi, j, k 
i! j! k! distintos con repetición.
El símbolo ( ! ) en matemáticas se llama factorial e indica un producto decreciente, por

ejemplo:
8! = 8·7·6·5·4·3·2·1· = 40320
6! = 6·5·4·3·2·1· = 720
3! = 3·2·1· = 6
entonces para el ejemplo tenemos:
n=8
i=3 8!
8 P 3,3,2   560 maneras
j=3 3! 3! 2!
k=2
Ejemplo: 25) ¿Cuántos arreglos se pueden formar con A, A, A, B, B, B, B, C y C?
Solución: En este caso n = 9, i = 3, j = 4 y k = 2, por lo que, si aplicamos:
n!
n Pi, j, k  , y sustituyendo valores, el resultado será:
i! j! k!
9!
9 P 3,4,2   1260
3! 4! 2!
Si utilizas calculadora para llegar a este resultado, la secuencia de las teclas que debes
oprimir son:
X! 9- 3 X! X 4 X! X 2 X! = 1260
b) Permutaciones o Arreglos sin Repetición
Los arreglos de diferentes objetos, formados todos a la vez, se puede calcular

utilizando un producto decreciente (factorial).
41
Ejemplo: 26) Se planea presentar cinco conferencias en una reunión de padres de
familia y profesores del colegio. El moderador del programa desea saber
cuantas maneras diferentes se pueden situar en el escenario los cinco
conferencistas en fila.
Solución: Cada una de estas maneras diferentes son las posibles permutaciones o
arreglos, por lo que el moderador, en realidad, lo que quiere saber es el
número de permutaciones de cinco objetos tomados todos a la vez.
Visualicemos las cinco sillas (S) en el escenario.
S S S S S
Para ocupar la primera silla existen cinco conferencistas,

Para ocupar la segunda silla existen cuatro conferencistas,
Para ocupar la tercera silla existen tres conferencistas,
Para ocupar la cuarta silla existen dos conferencistas y
Para ocupar la quinta silla existe o queda sólo un conferencista, entonces, habrá 5! =
5·4·3·2·1 formas en que puedan distribuir los cinco conferencistas en el escenario, y son
120 maneras.
El número 120 que acabamos de calcular se llama número de permutaciones de cinco

objetos tomados a la ves, y podemos establecer una regla general (para hallar el número
de permutaciones de n objetos tomados n a la vez, como sigue:
“El número de permutaciones de n objetos diferentes

tomados los n objetos a la vez es igual a n!”.
nP n  n (n  1) (n  2) . . . 3  2  1  n !
Donde n es el número de objetos, tomados a la

vez para cada permutación o arreglo, nPn es el
número total de permutaciones o arreglos de n
objetos, tomados los n objetos (todos) a la vez.
El símbolo n! (se lee “n factorial”) denota el producto de los n primeros enteros positivos,
como se ha visto.
Hagamos otro ejemplo.
Ejemplo: 27) Se desean colocar seis cuadros en línea recta sobre la pared de la
biblioteca. ¿De cuántas maneras diferentes lo pueden hacer?
42
Solución: Debemos encontrar el número de permutaciones o arreglos que podemos
tomar con seis cuadros, entonces, en forma análoga en el razonamiento del
ejemplo anterior, tenemos que:
Si nPn = n!, y si n = 6,
entonces: nPn = 6! = 6·5·4·3·2·1 = 720
Te sugiero para el siguiente ejemplo, pongas mucha atención.
Ejemplo: 28) Un vendedor de autos tiene siete modelos para exhibir en un aparador,
pero éste sólo tiene espacios para cinco autos. ¿Cuántas muestras puede
exhibir?
Solución: El aparador sólo tiene lugar para cinco autos de los siete que existen, es decir
únicamente puede utilizar muestras de cinco en cinco. Entonces debe de
buscar el número de permutaciones de siete objetos, tomados de cinco en
cinco. Recuerda que el primer espacio se ocupar de siete distintas maneras,
el segundo espacio de seis maneras distintas y así sucesivamente, hasta el
quinto espacio que se puede ocupar de tres maneras distintas, entonces; las
muestras posibles son:
7 · 6 · 5 · 4 · 3 · 2 · 1 = 2520
Se puede expresar el cálculo anterior de la siguiente manera:
7·6·5·4·3·2·1 7 ! 7!
7·6·5·4·3·2·1 =  
2·1 2! (7 - 5)!
Con base a la expresión anterior, podemos generalizar la situación haciendo que n sea
el número de objetos disponibles y r el número de espacios para ocupar, por lo que el
número de maneras que se pueda ocupar r espacios cuando se disponen de n objetos
está dado por:
n!
n Pr = n (n-1) (n-2) ... (n-r+1) =
(n - r)!
donde n P r es el número de permutaciones o arreglos de n objetos diferentes tomados

de r en r, y r es el número de objetos, tomados a la vez para cada permutación o arreglo.
43
Realicemos otros ejemplos:
Ejemplo: 29) ¿Cuál es el total de arreglos del conjunto {a, b, c, d, d}, tomados tres a la
vez y dos a la vez?
Solución: Como las muestras son de tres en tres y de dos en dos, debemos calcular el
número en permutaciones de n objetos tomados de r en r, entonces:
4! 4!
n=4yr=3 4P3    24
4  3 ! 1!
4! 4!
n=4yr=2 4P2    12
4  2 ! 2!
por lo que debemos tener 36 arreglos en total.
Ejemplo: 30) Un conferencista dispone de ocho temas sobre los que puede disertar
durante 30 minutos. Se le pide que presente una serie de cinco
conferencias de 30 minutos a un grupo de personas ¿Entre cuántas
secuencias de conferencias puede elegir?
Solución: Si aplicamos la fórmula de las permutaciones o arreglos de n objetos

diferentes formados de r tenemos:
n! 8!
n=8  n Pr =   6720 secuencias
n - r  ! 8  5 !
r=5
c) Combinaciones
Una característica de las permutaciones es que el orden en que se disponen

los objetos es importante.
Ejemplo: 31) Si tenemos cuatro libros: uno de historia (H), uno de matemáticas (M), uno
de Inglés (I) y uno de ciencias (C) y los colocamos en un lugar donde
caben sólo dos libros, entonces el número de permutaciones o arreglos en
que se pueden ocupar los dos espacios, indica para nosotros que es
importante el orden en que quedan los dos libros en los espacios.
44
Solución: Las doce posibles permutaciones son:
HM MH CM IM
4! 4!
HI MI CI IH  4P2 =   12
2! ( 4  2)!
HC MC CH IC
Ahora considera, si el orden de la disposición no importa, es decir, si HM se

considera lo mismo que MH, HI lo mismo que IH y así sucesivamente. Entonces el
número de arreglos se reduce a seis:
HM MI
HI MC
HC IC
A lo anterior lo llamamos el número de combinaciones de cuatro objetos, tomados de

dos en dos. Podemos entonces definir una combinación como sigue:
“Una combinación es un arreglo de cierto número de

objetos formados de un conjunto de n objetos de tal
forma que el orden en que se dispone no importa”.
Para obtener de nuevo las doce permutaciones originales, necesitamos solamente

construir las permutaciones correspondientes originales, necesitamos solamente
construir las permutaciones correspondientes a cada una de las seis combinaciones. En
este caso, para cada combinación hay dos permutaciones. Generalmente, si tenemos n
objetos y los debemos tomar de r en r, podemos construir r! permutaciones sobre cada
una de las posibles combinaciones.
Simbolicemos el número de combinaciones de n objetos tomados de r en r mediante

n
  o nCr. Por consiguiente podemos expresar el número de permutaciones posibles
r
n 
por   r! Es cierto, ya que se demostró en el ejemplo de los libros, que este producto
r 
es igual al número total de permutaciones de n objetos formados de r en r, por lo que
podemos escribir:
n 
nPr =   r!
r 
45
n 
Si resolvemos esta ecuación para   podemos obtener una fórmula para calcular el
r 
número de combinaciones de n objetos de r en r, entonces:
 n  n Pr
 r   r! Es el número de combinaciones de n objetos formados de r en r.
 
n!
Recordamos en nPr = , entonces podemos escribir la expresión anterior en la
n - r !
forma que más se conoce:
n  n!
nCr =  
 r  r! n - r !
donde n es el número total de objetos de un conjunto, r es el número de objetos,

n 
tomados a la vez para cada combinación y nCr o   es el número total de
r 
combinaciones de n objetos tomados de r en r.
Realicemos algunos ejemplos para aplicar la fórmula de combinaciones:
Ejemplo: 32) ¿Cuántas juntas directivas de 5 personas se pueden formar con doce
miembros de una organización?
Solución: Como no importa el orden de la elección de las personas tenemos:
n = 12 n  n!
n=5   r  = r! n - r ! , sustituyendo
 
 12  12! 12.11.10.9.8.7!
    792
 5 5! 12  5 ! 5! 7!
Ejemplo: 33) Un estudiante tiene que contestar de 10 a 12 preguntas de un examen de

Estadística:
a) ¿De cuántas maneras puede elegir estas preguntas?

b) ¿Cuántas maneras hay, si tiene que contestar 7 de las 9 primeras
preguntas?
c) ¿Cuántas maneras hay, si las 4 primeras son obligatorias?
46
Solución:
a) Sin n = 12 y r, sustituimos en la expresión de combinaciones:
n n!  12  12! 12.11.10!

      66
 r  r! n - r !  10  10! 12  10! 10! 2!
b) Si n = 5 y r = 5, (si contesta 7 de 12, quedan 5) y r = 3 (si contesta de 3 en 3, es

decir, 9 de 12), entonces:
n n! 5 5! 5.4.3!

      10
 r  r! n - r !  3  3! 5  3! 3! 2!
c) Si n = 8 (si cuatro son obligatorias, quedan 12 – 4 = 8) y r = 6 (si debe de contestar 10

y 4 son obligatorias, entonces 10-4 = 6), entonces:
8 8! 8.7.6!
    28
 6  6! 8  6 ! 6! 2!
 
Ejemplo: 34) Calcula las siguientes combinaciones: 3C2 y 100C98
Solución: Para realizar estos cálculos, se sugiere utilices la siguiente igualdad, la cual
siempre se cumple.
3
= 3C 2= 3 C 3-2 = 3C1 = =3
1
nCr = Ncn-r
100.99
= 100 C 100-98 = 100 C 2 = = 4950
2.1
47
Resuelve los siguientes ejercicios.
1. Si el dominó consta de 28 fichas, y una mano de juego tiene 7 fichas, ¿cuántas

manos de juego distintas se pueden formar?
2. El número de equipos de básquetbol que se pueden formar de un grupo de 12

personas; considerando que un equipo de básquetbol consta de 5 jugadores, es:
3. ¿De cuántas maneras puede escogerse un comité compuesto de 3 hombres y 2

mujeres, de un grupo de 7 hombres y 5 mujeres?
4. En una clase hay 12 estudiantes. ¿De cuántas maneras los 12 estudiantes pueden
presentar 3 pruebas diferentes, si a cada prueba le corresponden 4 estudiantes?
En esta sección aprendimos a calcular la probabilidad de los eventos dependientes e

independientes, mediante el producto de las probabilidades de cada uno, en el caso de
eventos independientes, y en el caso de dos eventos dependientes multiplicando la
probabilidad de uno por la probabilidad condicional del otro, también abarcamos el tema
de técnicas de conteo, presentando todas la formas en que se puede presentar los
elementos de un fenómeno aleatorio, encontrando las diferentes formas de conteo para
arreglos con repetición y sin repetición.
48
RECAPITULACIÓN
Te presentamos enseguida una síntesis de los aspectos más relevantes de este

fascículo.
Experimento: Es el proceso mediante el cual se obtiene una
observación de un fenómeno.
Espacio muestral: Es el conjunto de posibles resultados de

Frecuencia un experimento.
relativa
Evento: Es un subconjunto del espacio muestral.
P (0) = 0
Propiedad de la frecuencia P () =1
relativa: P (A) = a con 0  a  1
b b
Concepto de Probabilidad: Ne
P(A) =
N
Expresión algebraica de la P(E) = ne

probabilidad: n
Elementos Probabilidad de eventos

de Nociones de mutuamente excluyentes: P (AUB) = P (A) + P (B)
probabilidad probabilidad
Probabilidad de eventos
no mutuamente P(AUB) = P(A) + P(B)  P(A  B)
excluyentes:
P( A  B)
Probabilidad condicional: P(B / A ) 
P( A )
Eventos independientes: P(A  B) = P(A)  P(B)
r n!
Arreglos con repetición: n ; nPi, j, k 
i! j! k !
Cálculo de n!
probabilidades Arreglos sin repetición: nPn  n! ; n Pr 
(n  r ) !
n n!
Combinaciones: nCr    
r
  r ! (n  r) !
49
Los siguientes problemas son actividades de carácter práctico y constructivo del

contenido estúdialos, resuélvelos y si tienes dudas, consulta a tu asesor o profesor.
1. Una empresa llantera tiene 1500 llantas perfectas, 1000 llantas en estado regular y
500 defectuosas. Se efectúa una serie de 4000 elecciones de llantas con remplazo.
¿Cuál es la frecuencia relativa con que aparecen las llantas perfectas o las
regulares?
2. Se tiene una urna con 20 bolas negras, 35 verdes y 30 blancas. Se efectúa una serie
de 200 extracciones con remplazo. ¿Cuál es la frecuencia relativa con que aparece
la bola verde o blanca?
3. En un grupo de matemáticas formado por 70 estudiantes, 20 obtuvieron nueve de

calificación, 18 obtuvieron siete y 8 obtuvieron seis. ¿Cuál es la frecuencia relativa
con la que apareció la calificación seis o siete?
4. Consideremos el experimento “se lanza una moneda dos veces, aparecen dos
águilas, ¿qué tipo de evento es?
5. Consideremos el experimento “se lanza un dado” aparece cualquier número del uno
al seis, ¿qué tipo de evento es?
6. En un comité de 60 miembros, hay 20 ingenieros. Si se elige al azar a un miembro

para representar el comité, ¿cuál es la probabilidad de que el elegido sea ingeniero?
7. Por un error en una farmacia se revolvieron 45 goteros defectuosos con 135 goteros
sin defecto. Si se selecciona uno al azar, ¿cuál es la posibilidad de que el gotero sea
defectuoso?
50
8. Un experimento aleatorio consiste en extraer una esfera de una urna que contiene 6
esferas blancas, 10 esferas azules y 14 esferas moradas. Calcular la probabilidad de
extraer una esfera y ésta sea:
a) Blanca
b) Azul
c) Morada
d) Blanca o Azul
e) Morada o Blanca
f) Azul o Morada
9. En cierto bachillerato 135 estudiantes reprueban solo matemáticas, 75 reprueban

tanto matemáticas como física, ¿cuál es la probabilidad de elegir a uno al azar que
haya reprobado matemáticas o física?
10. Se realizó una encuesta entre jóvenes y se encontró que 400 juegan fútbol, 175
ajedrez. ¿Cuál es la probabilidad de que un joven elegido al azar juegue fútbol o
ajedrez?
11. Se lanza un par de dados. Si los números que resultan sean diferentes, halla la
probabilidad de que la suma sea impar.
12. Se lanza un dado, si el número que resulta es par. ¿Cuál es la posibilidad de que
sea primo?
6 4 2
13. Dados las siguientes probabilidades: P(H) = , P (L) = y P (H  L) = ,
16 18 20
halle P (L/H).
14. Una papelería tiene dos urnas, en la urna A se tiene 18 bolígrafos de los cuales son
siete defectuosos y en la urna b, se tienen 22 bolígrafos de los cuales son 9
defectuosos. Se extrae al azar un bolígrafo de cada urna. ¿Cuál es la probabilidad
de que ningún bolígrafo sea defectuoso?
15. Un lote de 20 artículos tiene 10 defectuosos. Se eligen al azar dos artículos del lote
uno tras otro, ¿cuál es la probabilidad de que éstos no sean defectuosos?
16. ¿Cuántos números de siete dígitos se pueden formar con los dígitos 1, 3, 5, 7 y 9?
17. ¿De cuántas maneras diferentes pueden colocarse ocho libros en un librero?
18. Una tienda ofrece doce estilos diferentes de cacerolas, ¿cuántas maneras diferentes
tiene una señora de elegir, si solo quiere adquirir cinco de ellas?
19. Un estudiante tiene que contestar ocho de diez preguntas en un examen:
a) ¿De cuantas maneras puede elegir las preguntas?

b) ¿Cuántas maneras, si las tres primeras preguntas son obligatorias?
51
AUTOEVALUACIÓN
Aquí encontramos los lineamientos a las respuestas de las actividades de consolidación

que te permitan llegar a tus propias respuestas, así como completar los procedimientos
para encontrar los resultados.
na Número de veces que sucedió el evento A : llantasperfectaso regulares

1) fa = =
n Número de veces que se realizóel evento
2500 5
= =
4000 8
na Número de veces que sucedió el evento A : bola verde o blanca 65

2) fa = = =
n Número de veces que se realizóel experimento 200
na
3) fa = = = 0.37143
n
4) El evento es:
5) El evento es: .
Ne Eventos favorables 20 1
6) P(E) = = = =
N Número de casos posiblesdeocurrencia 60 3
Ne
7) P(E) = =
N
52
6 1
8) a) P(B) = =
30 5
b) P(A) = =
30
c) P(M) =
d) P(BUA) = P(B) + P(A) =

e) P(MUB) = P(M) + P(B) =
f) P(AUM) =
135 75 25
g) P(M) = , P(F) = y P(M  F) = , por lo que:
185 185 100
135 75 25 185
P(MUF) = P(M) + P(F) – P(M  F) =   = =1
185 185 100 185
10) Resuélvelo por ti mismo.
11) El espacio muestral:
(1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)

(2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
(3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
=
(4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
(5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
(6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Si A es el evento “los número que resultan son diferentes” quiere decir que las parejas
30
de número iguales (1,1) (2,2)...(6,6) se descartan, entonces: N(A) = 30 y P(A) =
36
Si B es el evento “su suma sea impar”, quiere decir que al sumar los números de cada
evento (1,2),=1+2=3; (4,5), = 4+5=9 el resultado debe ser un número impar, entonces:
18
N(B) = 18 y P(B) =
36
P( A  B) 18 9 3
Por lo tanto, P(B/A) = = = =
P( A ) 30 15 5
53
3
12)  = 1, 2, 3, 4, 5, 6, A = 2, 4, 6 y B  2, 3, 5, Con esto, P(A) = ,
6
3 1 1
P(B) = y P (A  B) =  P(B/A) = =
6 6 3
13) Inténtalo por ti mismo
14) P(A  B) = P(A)  P(B).
11 13 11 13 143 13
Si P(A) = y P(B) = , entonces P (A  B) =  = =
18 22 18 22 396 36
15) Si D es el evento “defectuoso” y N es el evento “no defectuoso”, entonces

10 1 10 1 10 9 90 9
P(D) = = , P(N) = = y P(N) =  = =
20 2 20 2 20 19 380 38
7
16) 5 =78125 maneras.
17) De 40320 maneras.
n n!
18)      7 92 maneras
r
  r! n - r !
19) a)  
10
8
b)    5! 7! 

54
Para que reafirmes lo aprendido y puedas profundizar sobre los Elementos de

Probabilidad, te invito leas en que consiste la “Partición del espacio Muestral” []” para
que abordes el contenido del “Teorema de Bayes” y logres enriquecer lo aprendido. Te
invito a que también investigues como resolver el siguiente problema:
En un plantel del Colegio de Bachilleres, el 50% de los estudiantes aprueban Química

con seis, el 30% aprueban con siete y el 20% aprueban con ocho. Se sabe que el 4 %
que aprueban con seis, el 5% que aprueban con siete y el 6% que aprueba con ocho, no
estudian pero acreditan la asignatura. Si se elige al azar:
a) ¿Cuál es la posibilidad de que éste no estudie y apruebe la asignatura?

b) ¿Si no estudia, ¿Cuál es la probabilidad de que apruebe la asignatura con seis?
55
ARNOLD NAIMAN, R. Rosenfeld, G. Zirkel. Introducción a la Estadística. México, D. F.

Editorial Mc Graw Hill. 1987
Este texto cubre el 100% del programa, manejando el enfoque del mismo. Sobre
el tema incluye una variedad de ejemplos prácticos que permiten una visión amplia
en este terreno.
JONHSON, Robert. Estadística Elemental. México D.F., grupo. Editorial Iberoamérica

1990.
Este texto cubre el 90% del programa, siguiendo el enfoque del mismo. Con
relación al tema su tratamiento es muy adecuado.
PORTILLA CHIMAL, E. Estadística (primer curso). México, D. F. Nueva Editorial

interamericana. 1980.
Este libro aborda el tema de manera muy adecuada, incluye ejemplos muy
ilustrativos.
PROAÑO, Humberto. Estadística Aplicada a la Mercadotecnia. 4ª. Edición. México, D. F.

Editorial Diana. 1983.
Este texto cubre el 80% del curso. El tratamiento de los temas es muy claro,
además de que incluye ejemplos de aplicación práctica.
SEYMOUR, Lipschutz. Probabilidad. Editorial McGraw Hill. 1987
PARA PROFESORES.
N. M. DOWNIE, R. W. Heat. Métodos Estadísticos Aplicados. 3ª. Edición México, D.

F. Editorial Harla, 1973
WAYNE W., Daniel. Estadística con aplicaciones a las Ciencias Sociales y a la

Educación. México, D. F. Editorial Mc Graw Hill / Interamericana de México. 1988.
56
DIRECTORIO
Dr. Roberto Castañón Romo

Director General
Mtro. Luis Miguel Samperio Sánchez

Secretario Académico
Lic. Filiberto Aguayo Chuc

Coordinador Sectorial Norte
Lic. Rafael Torres Jiménez

Coordinador Sectorial Centro
Biol. Elideé Echeverría Valencia

Coordinadora Sectorial Sur
Dr. Héctor Robledo Galván

Coordinador de Administración Escolar
y del Sistema Abierto
Lic.José Noel Pablo Tenorio Mtro. Jorge González Isassi

Director de Asuntos Jurídicos Director de Servicios Académicos
C.P. Juan Antonio Rosas Mejía Lic. Miguel Ángel Báez López
Director de Programación Director de Planeación Académica
M.A. Roberto Paz Neri Lic. Manuel Tello Acosta

Director Administrativo Director de Recursos Financieros
Lic. Pablo Salcedo Castro

Unidad de Producción Editorial
AGRADECEMOS LA PARTICIPACIÓN DE:
Leonel Bello Cuevas

Javier Darío Cruz Ortiz
Hugo García Mancilla
Ricardo Garnica Juárez
Daniel González Frías
Amado Miguel León Izquierdo
Ernesto Manzano Méndez
Miguel Ángel Marrufo Chan
Armando Martínez Cruz
José Luis Pérez Coss
Juan Angélica Triana Toral

Estadistica Inferencial

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Inferencial

Cargado por

Copyright:

Formatos disponibles

COLEGIO DE BACHILLERES

FASCÍCULO 2. MEDIDAS DESCRIPTIVAS

FASCÍCULO 3. CORRELACIÓN Y REGRESIÓN LINEALES

FASCÍCULO 4. INTRODUCCIÓN A LA PROBABILIDAD

Roberto Castañón Romo

Luis Miguel Samperio Sánchez

Héctor Robledo Galván

Jorge González Teyssier

Javier Guillén Anguiano

Derechos reservados conforme a la Ley

ISBN 970 632 245-0

El Colegio de Bachilleres, en respuesta a la inquietud de los estudiantes de contar con

Este compendio fascicular es producto de un primer esfuerzo académico del Colegio

Por lo tanto, se invita a la comunidad educativa del Sistema de Enseñanza Abierta y a

Estudiante del Colegio de Bachilleres, te presentamos este compendio fascicular que te

Este compendio fascicular tiene la característica particular de presentarte la información

FASCÍCULO 1. ANTECEDENTES HISTÓRICOS,

Autores: Hugo García Mancilla

CAPÍTULO 1. ANTECEDENTES HISTÓRICOS,

1.1 ANTECEDENTES HISTÓRICOS DE LA

1.1.1 BOSQUEJO HISTÓRICO 11

1.1.2 FUNCIONES DE LA ESTADÍSTICA 18

1.1.4 CONCEPTOS PRELIMINARES 24

1.1.5 CLASIFICACIÓN DE LA ESTADÍSTICA 29

1.1.6 ESTADÍSTICA DESCRIPTIVA 30

1.1.7 ESTADÍSTICA INFERENCIAL 31

2.1 PRESENTACIÓN DE DATOS 47

2.1.1 DISTRIBUCIÓN DE FRECUENCIAS 47

2.1.2 DISTRIBUCIÓN DE FRECUENCIAS

2.2.1 HISTOGRAMA Y POLÍGONO DE

2.2.2 POLÍGONO DE FRECUENCIAS 70

2.2.3 POLÍGONO DE FRECUENCIA

2.2.4 GRÁFICAS CIRCULARES, DIAGRAMAS 74

ACTIVIDADES DE GENERALIZACIÓN 103

BIBLIOGRAFÍA CONSULTADA 104

La estadística es una de las herramientas más ampliamente utilizadas en la investigación

Su aplicación en instituciones gubernamentales y educativas, en los negocios y en la

ANTECEDENTES HISTÓRICOS, FUNCIONES

1.1 ANTECEDENTES HISTÓRICOS DE LA ESTADÍSTICA Y SUS

1.1.1 Bosquejo Histórico

Para el conocimiento de la realidad concreta que al hombre le interesa,

 Planear la búsqueda y la obtención de la información.

Por interpretación de la información permite obtener conclusiones que

¿PARA QUÉ TE VA A SERVIR?

Para proporcionarte los conocimientos necesarios para llevar a la

1.1 ANTECEDENTES HISTÓRICOS DE LA ESTADÍSTICA Y SUS

1.1.1 BOSQUEJO HISTÓRICO

Iniciaremos el estudio de la estadística con algunos antecedentes históricos, que nos

Las tablas de mortalidad, que atrajeron la atención de Graunt, eran publicadas

Con estos datos deducía las siguientes observaciones:

a) Hay más varones que hembras

El mérito de las “Observations” fue inmediatamente reconocido, y fomentó el estudio de

Graunt murió de ictericia la víspera de Pascua en 1674 y fue enterrado en la iglesia de

No es posible la suposición de que el sexo está distribuido entre la descendencia

La demostración de Arbuthnot es el primer ejemplo conocido de inferencia estadística.

Anchenwall un economista, acuñó en 1760 la palabra estadística, que deriva del

En el famoso libro de Jacob Bernoulli, Aos Conjectandi, aparece un teorema de

“Si la probabilidad de un suceso es p, y si se hace un número infinito de pruebas, la

Como una demostración de la importancia de la Ley de los grandes números en asuntos

Supongamos que la probabilidad de que un hombre de cierta edad y constitución muera

Se le atribuye la primera discusión sobre “Probabilidad” en su manual para jugadores

La ley de Gauss de la distribución normal de errores y su curva en forma de campana

Epistemólogo austriaco contemporáneo. Von Newsmann llevó a cabo la primera