Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SECRETARÍA ACADÉMICA
COORDINACIÓN DE ADMINISTRACIÓN
ESCOLAR Y DEL SISTEMA ABIERTO
COMPENDIO FASCICULAR
ESTADÍSTICA DESCRIPTIVA
E INFERENCIAL I
FASCÍCULO 1. ANTECEDENTES HISTÓRICOS, FUNCIONES Y
APLICACIONES DE LA ESTADÍSTICA
el Sistema Abiert
DIRECCIÓN GENERAL
PRESENTACIÓN DEL COMPENDIO FASCICULAR
Cuenta con una presentación editorial integrada por fascículos, capítulos y temas que a
partir del estudio de la Estadística, el manejo y análisis de datos para la obtención de
conclusiones para que desarrolles habilidades de análisis y sistematización, tanto a
nivel conceptual como operativo, harán posible que puedas interpretar y explicar la
realidad, y así comprendas la utilidad de la Estadística en el estudio de diversos
problemas.
COLEGIO DE BACHILLERES
ESTADÍSTICA DESCRIPTIVA
E INFERENCIAL I
1
2
ÍNDICE
INTRODUCCIÓN 5
PROPÓSITO 9
1.1.3 APLICACIONES 22
RECAPITULACIÓN 32
ACTIVIDADES INTEGRALES 33
AUTOEVALUACIÓN 34
3
CAPÍTULO 2. CONCEPTOS BÁSICOS PARA EL
ESTUDIO DE LA ESTADÍSTICA 35
PROPÓSITO
.
37
2.2 GRÁFICAS 66
RECAPITULACIÓN 85
ACTIVIDADES INTEGRALES 86
AUTOEVALUACIÓN 87
RECAPITULACIÓN GENERAL 90
ACTIVIDADES DE CONSOLIDACIÓN 91
AUTOEVALUACIÓN 94
4
INTRODUCCIÓN
Sin embargo el término “Estadística” tiene varios significados para diferentes personas;
para la gente común y corriente la estadística solamente significa números. En el
periódico de la mañana se pueden encontrar la estadística más reciente sobre los delitos
de la ciudad; de asesinatos, de robos de automóviles; de asaltos y demás delitos que
hayan sido denunciados en determinado periodo de tiempo; de los nacimientos y
muertes que han ocurrido, o en relación con el deporte, el número de partidos ganados y
perdidos por equipos integrantes de la liga de ese deporte.
Para otras personas es un método para obtener, presentar y escribir grandes cantidades
de datos, y para otras es un método para tomar decisiones en situaciones difíciles.
El objetivo básico de este fascículo es aclarar los significados de Estadística, definir sus
conceptos básicos utilizados con frecuencia y analizar los usos y abusos de los métodos
estadísticos.
Aunque los significados sean diferentes, todos ellos forman parte del concepto total de
“Estadística”. La palabra tiene su sentido más amplio para aquellas personas cuyo
trabajo requiere un conocimiento de los aspectos más técnicos de la estadística. Para
estas personas, la palabra tiene relación con aquellos conceptos y técnicas que se
utilizan en la recopilación, organización, resumen, análisis, interpretación y comunicación
de información numérica.
Estos conceptos y técnicas juegan un papel importante en las actividades que realizan
los profesionales de todas las ciencias.
5
6
CAPÍTULO 1
7
8
PROPÓSITO
La estadística es una rama de las matemáticas aplicadas que surgió por la necesidad
concreta que el hombre tiene de conocer la resolución de problemas relacionados con la
recolección, procesamiento, análisis e interpretación de datos numéricos cuyo
conocimiento le permitirá tomar decisiones acertadas.
¿QUÉ APRENDERÁS?
¿CÓMO LO LOGRARÁS?
9
10
CAPÍTULO 1
ANTECEDENTES HISTÓRICOS FUNCIONES Y
CLASIFICACIÓN DE LA ESTADÍSTICA
Al igual que ha ocurrido con otras muchas disciplinas, a lo largo del tiempo se ha
pensado que la estadística es un procedimiento extraordinariamente complicado.
Cuando leemos artículos en los que aparecen resultados estadísticos nos queda la
impresión de que lo dicho en ellos es una verdad absoluta e incontrovertible que está
apoyada por todo un aparato matemático. Esto no es forzosamente cierto, se puede
adquirir con relativa facilidad un conocimiento básico de la estadística.
La estadística fue fundada por el londinense John Graunt, “un mercader de mercería”, en
un pequeño libro “Natural and Political Observations made upon the Bells of Mortality”.
Este libro fue el primer intento para interpretar fenómenos biológicos de masa y de la
conducta social: a partir de datos numéricos escribir las cifras brutas de nacimientos y
defunciones en Londres, de 1604 a 1661. El opúsculo de Graunt apareció en 1662.
Treinta años más tarde, la Royal Society publicó en su “Philosophical Transactions” un
artículo sobre tasas de mortalidad escrito por el eminente astrónomo Edmund Halley.
Ambas publicaciones constituyen la base de todo trabajo posterior sobre esperanza de
vida, indispensable para la solvencia de las compañías de seguros de vida.
11
John Graunt nació en 1620 en Berchin Lane, Londres, bajo el signo de las siete
estrellas, donde su padre tenía una tienda y el hogar. Aprendió pronto el oficio de
vendedor de mercería y prosperó en el negocio. El éxito le dio la posibilidad de
dedicarse a ocupaciones más amplias que las de la venta de artículos de mercería.
Aubrey lo describe como “una persona muy ingeniosa y estudiosa... se levantaba muy
temprano para sus estudios antes de abrir la tienda”. Se hizo amigo de Sir William Petty,
más tarde autor de un conocidísimo libro sobre la nueva ciencia de la aritmética política,
y probablemente discutió con él las ideas expresadas en sus “Obervations”.
Un ejemplo de las observaciones hechas por Graunt en 1632 fueron las siguientes:
Varones 4,994
Bautizados Hembras 4,590
Total 9,584
Varones 4,932
Enterrados Hembras 4,603
Total 9,535
Las “Observations” impresionaron tan favorablemente a Carlos II, que este propuso
especialmente a Graunt como socio fundador de la recientemente constituida Royal
Society. Para prevenir cualquier posible objeción al hecho de que Graunt era tendero,
“su majestad dio este encargo particular a su Sociedad, de que si encontraban algún
comerciante más de su estilo, lo admitiesen sin más ceremonia”. Graunt fue elegido
socio fundador de la Royal Society en 1662.
12
Desde luego, Graunt escribió la mayor parte, incluidas las aportaciones científicas más
valiosas. Petty añadió lo que Thomas Browne llamaría “Elegancia”, y así aumentó la
popularidad del libro. Sir William Petty era un hombre presuntuoso y algo engreído,
incapaz de decidir si patrocinar a Graunt o acreditar su trabajo. No hay pruebas de que
alguna vez hubiese entendido la importancia y originalidad de lo que había hecho su
amigo.
Graunt fue miembro del consejo común de la ciudad y desempeñó otros cargos, pero al
convertirse al catolicismo dejó el comercio y cualquier otra obra pública. Graunt tenía
cabeza y talento para el trabajo, y era jocoso y fecundo en su conversación.
John Arbuthnot 1
En los trabajos de Graunt y Halley se basó John Arbuthnot en 1670 para probar la
existencia de Dios. Su argumento dice:
1
www_history.mcs.st-andrews.ac.uk/history/pictDisplay/Arbuthnot.html
13
La Ley de los Grandes Números
El teorema es más sencillo de exponer. De hecho, cuando se ve por primera vez, uno se
pregunta cómo Bernoulli pudo preocuparse durante veinte años y cómo ha promovido
tantas controversias posteriormente. El hecho es, que es un conjunto de sutilezas y
artificios; cuando más lo piensa uno, más complicado lo ve. Bernoulli tuvo un trabajo
loco montando el engranaje, lo cual lo distrajo de prever los embrollos lógicos y
filosóficos que planteaba.
Tirando al aire su discreción matemática “un estudioso del sujeto llega a esta definición
correcta”.
Otra definición más válida: “En un conjunto bastante amplio de “a” elementos es
casi seguro que la frecuencia relativa de “b” elementos se aproximará a la
probabilidad de un elemento “a” estando “b” dentro de cualquier grado de
aproximación deseada”. Aquí la frase “casi seguro” ha de entenderse como un medio
conveniente para decir que hay una probabilidad tan cercana como queramos a 1.
14
Mientras mayor sea el número de personas que se asegura en la compañía, mayor es la
probabilidad de que las finanzas de la compañía sean sanas siempre que las primas
estén calculadas como acabamos de decir. Esta es la consideración fundamental que
distingue el negocio de una compañía de seguros de una apuesta.
2
Girolamo Cardano
Cardano nació en Pravia en 1501 y murió en 1576. Su vida es una serie de actos
incoherentes que pertenecen tanto a la historia de la Matemática como a la de la
Astrología y a la de la Patología. Realizó sus primeros estudios en su ciudad natal y
luego en la Universidad de Padua, donde alcanzó la Licenciatura en Medicina que ejerció
en Sacco y en Milán durante el período de 1524 a 1556. Durante estos años estudió
Matemáticas y publicó sus principales obras. Entre estas destaca el Ars Magna, en la
cual se presentan raíces negativas de una ecuación, algunos cálculos con números
imaginarios y la fórmula de la ecuación cúbica que ha pasado a la historia con el
calificativo de Cardámica, aunque ya se sabe que es de Fortaglia, con quien tuvo una de
las polémicas más agrias en la historia de las Matemáticas.
2
www_history.mcs.st-andrews.ac.uk/history/pictDisplay/Cardan.html
15
3
Karl Fredrich Gauss – (1777-1855) –
Junto con Arquímedes y Newton, Gauss es uno de los tres grandes de la Matemática.
Ellos aportaron conceptos muy útiles en sus distintas ramas tanto en su forma pura como
aplicada.
La precocidad de Gauss fue evidente antes de los tres años de edad. Cuando su padre
hacía la nómina para pago de los trabajadores, sin darse cuenta que su hijo seguía sus
acciones, al terminar, el niño exclamó “Padre el cálculo está equivocado”. Al
comprobarlo notó que el resultado que le dijo el niño era correcto.
Gauss se hizo notable, ya que a los doce años criticó los fundamentos de la Geometría
Euclidiana, a los trece le interesaba la posibilidad de la Geometría No-Euclidiana, a los
quince entendió el concepto de convergencia de líneas y probó el binomio de Newton, a
los dieciocho inventó el método de los mínimos cuadrados, a los diecinueve, el 30 de
marzo de 1796, descubrió la construcción del polígono de 17 lados sólo con regla y
compás.
Su lema fue: Pauca. Sed natura, que significa: “Poco, pero maduro”.
3
www_history.mcs.st-andrews.ac.uk/history/pictDisplay/Gauss.html
16
4
Johann Von Neumann – (1909-1957) –
4
www_history.mcs.st-andrews.ac.uk/history/pictDisplay/Von_Neumannn.html
17
ACTIVIDAD DE REGULACIÓN
5. Junto con Arquímedes y Newton eran los tres grandes de la matemática; éste tercero
se llama___________________________________________________________________
El profesional, que entiende de estadística puede leer con inteligencia la literatura que
sobre su campo de acción va apareciendo día con día.
Con frecuencia escuchamos en los medios de difusión comentarios como los siguientes:
Se ha demostrado estadísticamente que el mayor porcentaje de las ventas de
automóviles se registran en el primer trimestre del año.
18
Estadísticamente se ha demostrado que el huevo produce el colesterol en las
personas que consumen mucho este producto.
Todas estas expresiones nos indican que la Estadística es una herramienta que ayuda a
conocer la realidad. Sin embargo, también puede servir para distorsionar la verdad si no
se tiene cuidado al usar los métodos estadísticos adecuadamente y si la interpretación
de los resultados lo hacen incorrectamente.
Es famoso la frase que en cierta ocasión el ministro inglés Benjamin Disraeli dijo: Hay
tres clases de mentiras que son: “Las simples, las malvadas y las de la Estadística”.
Esta acusación hecha hace muchos años, ha llegado a convertirse en una descripción
adecuada de algunos engaños que se pueden realizar mediante la Estadística.
Se debe tener cuidado en los reportes estadísticos en no caer en una falacia; para
evitarlo se debe tener una actitud crítica hacia cualquier escrito que leamos. Así mismo
hacer un análisis cuidadoso que nos indique si el contenido y la interpretación son
correctos o si se ha hecho un mal uso de la Estadística.
1) ¿Cómo es la muestra?
Ejemplo.
Se desea saber qué tiempo en horas un alumno dedica al estudio, para ello el
encuestador le hace la siguiente pregunta:
Esta forma de obtener la información es incorrecta toda vez que la respuesta es guiada
por el encuestador y la mayoría van a ser afirmativas.
19
3) ¿Qué se está probando y cómo?
En algunos estudios las trampas de este tipo pueden estar en proceso de medición,
veamos el siguiente.
Ejemplo.
En un poblado del Estado de México se levantó un censo de todos los habitantes que no
sabían leer para inscribirlos en los cursos de INEA. El encuestador reportó 3000
analfabetos que fueron los que detectó, pero él no sabía que mucha de esta gente no
querían aprender a leer y por lo tanto no se presentaron para su reporte.
En el mismo poblado se anunció por la radio que toda persona que no supiera leer, el
programa de “solidaridad” le otorgaría $ 50,000 pesos mensuales de ayuda por lo tanto
debían anotarse en la presidencia municipal las personas que cubrieran el requisito.
A este anuncio acudieron 7,000 personas que no sabían leer. Esto nos muestra que la
información no siempre va a ser verdadera y en casos como estos, depende del interés
de la gente.
Esta pregunta nos invita a analizar la información reportada y nosotros debemos ver
si es congruente con el sentido común.
Ejemplo.
Ejemplo.
En una librería se reportó que en tan sólo un mes se duplicaron las ventas, sin embargo,
no se especificó que se refiere al mes de septiembre que fue el inicio de clases y
además aumentó el costo de los libros debido a la demanda.
20
7) ¿Quién lo dice?
Ejemplo.
Un anuncio de la televisión dice: “K2 su fábrica amiga en tan sólo un mes vendió 50,000
colchones; pero aún nos quedan 1,000 que se rematan a un precio muy bajo, venga y
llévese el suyo. ¿Será cierta esta información, o solamente es un comercial
sensacionalista?
Las representaciones gráficas también pueden ser engañosas toda vez que algunas
veces se toman dos escalas diferentes para graficar el fenómeno, una para el eje
horizontal y otra para el eje vertical, y si esto no se analiza con cuidado, se puede
caer en una inferencia falsa.
De todo lo anterior podemos concluir que algunos reportes, ya sean gráficos o escritos
que incluyen un informe estadístico, puede mentir; pero esto no quiere decir que siempre
sea así.
ACTIVIDAD DE REGULACIÓN
Para cualquier duda consulta con tu profesor o asesor quien te indicará si tus respuestas
son correctas.
21
1.1.3 APLICACIONES
La estadística día a día gana terreno en su aplicación en toda actividad humana por
simple que ésta sea.
En materia de población los datos aportan una buena ayuda para fijar la política de
estímulos al control de la natalidad, dirigir la inmigración o emigración, establecer los
planes de lucha contra las enfermedades epidémicas o plagas que azotan los
campos, etcétera.
22
6) En el campo educativo la Estadística contribuye al conocimiento de las
condiciones fisiológicas, psicológicas y sociales de los alumnos y de los profesores.
Al perfeccionamiento de los métodos de enseñanza y de evaluación.
11) Salud. Los técnicos de la salud la utilizan para planear la localización y el tamaño de
los hospitales y de otras dependencias de salud. También se aplica en la
investigación sobre las características de los habitantes de una localidad, sobre el
diagnóstico y la posible fuente de un caso de enfermedad transmisible; sobre la
proporción de personas enfermas en un momento determinado, de ciertos
padecimientos de una localidad, sobre la proporción de enfermos de influenza en
dos grupos, uno vacunado contra el padecimiento y el otro no. También se aplica en
cualquier otro tipo de investigación similar a éste.
13) Negocios. Los hombres de negocios pueden predecir los volúmenes de venta,
medir las reacciones de los consumidores ante los nuevos productos, etcétera.
23
1.1.4 CONCEPTOS PRELIMINARES
¿Qué es la Estadística?
a) Población.
b) Muestra.
c) Variable de Estudio.
d) Datos u observaciones.
e) Parámetros.
f) Estadígrafos o Estadísticos.
N° De Libros N° De Profesores
0 4
1 5
2 6
3 10
4 8
5 7
6 6
7 4
Total 50
La población en este caso son todos los profesores del Plantel 11. Cada uno de los
profesores seleccionados y que se les aplicó la encuesta es un elemento, un dato o una
observación y todos ellos forman una muestra representativa de la población.
24
Veamos otro ejemplo.
ACTIVIDAD DE REGULACIÓN
Analiza el ejemplo de los profesores y con base a los conceptos, contesta las siguientes
preguntas que tienen relación con dicho ejemplo.
De los ejemplos anteriores podemos ver que al realizar un experimento para conseguir
información acerca de un problema, se tiene un conjunto de resultados en que cada uno
corresponde a una observación.
Ejemplo.
25
Si el número de estudiantes que tiene el Plantel 2 es de 8,000 alumnos; entonces:
De los ejemplos anteriores habrás notado que los datos se obtienen mediante la
observación del fenómeno que interesa estudiar. También se obtienen de los
documentos donde se reportan los hechos.
26
Veamos el siguiente ejemplo.
a) La edad para saber cuántos están próximos a su retiro o para determinar la edad
promedio de los trabajadores.
c) El grado de estudios de cada uno para saber si se les puede impartir cursos de
preparación para el trabajo que requieren conocimientos de nivel medio superior,
etcétera.
Definición
a) Población finita.
b) Población infinita
Muestra
Por ejemplo, si se desea estimar el gasto promedio anual de los estudiantes del C.B., se
extraería una muestra formada por cierto número de estudiantes, se determinaría el
gasto anual correspondiente a cada uno de ellos y después se obtendría el promedio.
Se utiliza una muestra debido a que simplemente no se tiene el tiempo ni los recursos
para establecer el contacto con todos los estudiantes del C.B., aun cuando es posible
hacerlo.
27
Definición
POBLACIÓN
MUESTRA
Todas las muestras son subconjuntos de la población pero no todas son representativas.
Definición
Muestra aleatoria es aquella que se obtiene de tal manera que cada posible
observación disponible en la población, tiene la misma probabilidad de ser
seleccionada.
Para poder obtener estas muestras es necesario que no intervenga la preferencia del
investigador por algún elemento de la población; es decir, cada elemento de la población
deberá tener igual oportunidad de ser seleccionado.
Ejemplo.
Solución:
28
ACTIVIDAD DE REGULACIÓN
De todos los estados de la República Mexicana se desea saber el ingreso bruto sobre
recaudación de impuestos sobre la renta y el promedio de ingresos de diez de los
estados tomados al azar.
La población es ________________________________________________________________
La muestra es __________________________________________________________________
El parámetro es ________________________________________________________________
Descriptiva
Estadística
Inferencial
29
Definición
Hacia fines del siglo XVII, ya existían investigaciones semejantes a nuestros censos
modernos. Al mismo tiempo, las compañías de seguros empezaban a recopilar tablas
de mortalidad para determinar las primas de seguros de vida.
En las primeras etapas de desarrollo, la estadística incluía poco más que la obtención,
clasificación y presentación de datos numéricos. Aún hoy en día, estas actividades
siguen siendo una parte importante de la Estadística.
Ejemplo:
Un director de escuela desea conocer las aptitudes de cinco secretarias que trabajan en
dicha institución.
Se aplica una prueba de aptitudes a las cinco secretarias y las calificaciones son 82, 85,
95, 92 y 91. La medida estadística que emplea el Director es la aptitud promedio o
media aritmética, la cual es la suma de los valores obtenidos dividida por el número de
observaciones. Entonces, la calificación promedio es:
82 85 95 92 91 445
89
5 5
30
El cálculo de la media aritmética, simple como es, es una parte importante de la
estadística descriptiva. El resultado se limita a los datos obtenidos en este caso
particular y no implica ninguna inferencia o generalización acerca de las aptitudes de
otras secretarias. Este método es de naturaleza descriptiva, debido a que el promedio
condensa y describe la información obtenida, por ejemplo en el caso de las secretarias
significa que el promedio de las aptitudes de las cinco secretarias es 89%.
Por ejemplo; podría desear conocer la aptitud promedio de las demás secretarias, pero
carece del tiempo o de los recursos para aplicar una prueba a todas ellas. Podría utilizar
la calificación promedio de las cinco secretarias como base para realizar una inferencia o
estimación acerca de la aptitud promedio de todas las secretarias.
Con ese fin, necesitará conocer otra rama de la Estadística conocida como Estadística
Inferencial o Inferencia Estadística.
Definición
Para concluir diremos que existe otra gran división de las técnicas estadísticas:
a) Estadística Paramétrica.
b) Estadística No Paramétrica.
31
La Estadística No Paramétrica es un conjunto de técnicas diseñadas para niveles de
medición menores, por ejemplo, el nominal y ordinal, para efectuar estimaciones no
habrá parámetros en estricto sentido.
4) Se pueden aplicar los procedimientos no paramétricos cuando los datos que se van
a analizar consisten más bien en rangos o conteos de frecuencia tales como
porcentaje de pruebas, estatura, peso, longitud, entre otras.
RECAPITULACIÓN
Partimos de un bosquejo histórico que nos dice que el análisis estadístico se inició con la
obra de un tendero inglés llamado John Graunt, después de este sencillo inicio, muchos
matemáticos, entre ellos algunos muy famosos como Laplace y Gauss, hicieron
importantes contribuciones a las ideas de la estadística.
32
ACTIVIDADES INTEGRALES
Después de haber revisado los contenidos de este capítulo, realiza las siguientes
actividades para que verifiques tu aprendizaje.
_________________________________________________________________________
7. Junto con Arquímedes y Newton eran los tres grandes de las Matemáticas. Nos
referimos a _______________________________________________________________
33
AUTOEVALUACIÓN
A fin de que compruebes los procedimientos que aplicaste para contestar las preguntas
de las actividades integrales, te presentamos a continuación las respuestas.
1. John Arbuthnot
2. Inferencias Verdaderas
3. Biología
4. Estadística Descriptiva
5. Datos
6. Métodos Paramétricos
7. Gauss
34
CAPÍTULO 2
2.2 GRÁFICAS
35
36
PROPÓSITO
En este capítulo:
¿QUÉ APRENDERÁS?
¿CÓMO LO LOGRARÁS?
37
38
CAPÍTULO 2
Dar respuesta a la primera pregunta implica determinar la población o muestra y fijar las
variables para su estudio.
39
Para dar respuesta al segundo cuestionamiento es necesario fijar la variable o variables
de estudio, cómo se van a determinar, si ya existe esa información a quién debe
solicitarse, si no existe entonces cómo se va a buscar, si es necesario una investigación
de campo, elaborar el material necesario para realizarlo. La forma más usual para
recolectar datos es mediante una encuesta, ésta debe elaborarse de tal forma que se
tenga toda la información necesaria y evitar la innecesaria, que solamente dificulta el
trabajo.
Nos permite tener presente el problema por resolver con el fin de fijar con precisión las
variables que permitirán la resolución del mismo y con ello estar en posibilidad de tomar
una decisión correcta.
- Características.
- Atributos.
- Rasgos.
- Cualidades.
ACTIVIDAD DE REGULACIÓN
40
La variable es una propiedad intrínseca de individuos, objetos o grupos que interesan
para un determinado estudio científico.
1. Ejemplos de variables:
c) Los cirujanos de una clínica desean conocer el tipo de nariz que tiene cada
habitante de una colonia (variable “tipo de nariz”).
ACTIVIDAD DE REGULACIÓN
___________________________________________________________________________
II. De cada uno de los ejemplos explica con tus propias palabras para qué se desea
conocer dicha variable.
___________________________________________________________________________
___________________________________________________________________________
41
De acuerdo con el tipo de medida que describe cada una de las variables, éstas se
clasifican en dos tipos que son:
1. Variables cualitativas.
2. Variables cuantitativas.
a) Nominales
b) Ordinales
2. Un empresario desea saber entre las marcas de carro (Ford, Nissan, Chrysler), cuál
es el de preferencia de los habitantes de una ciudad de la República; para ello se
encuesta a 20 personas habiéndose obtenido los siguientes resultados:
F, N, C, F, C, C, N, C, F, N,
N, N, F, C, N, F, N, C, F, N.
____________________________________________________________________________
____________________________________________________________________________
Cuando los valores de una variable permiten únicamente ubicar a cada individuo en
una categoría y no hay orden entre estos valores la variable se llama “Cualitativa”.
3. El maestro del grupo 502 del plantel 2 “Cien Metros”, evaluó el grado de
aprovechamiento en el curso de estadística, bajo la siguiente escala: Excelente, Bien,
Regular, Mal; habiendo obtenido los siguientes resultados:
R, B, M, R, E, M, B, R, R, M, B, E, B, R, B,
B, R, B, B, R, B, M, E, R, R, B, B, E, B, R,
R, R, B, B, R, B, R, R, B, E, M, R, B, R,
42
Del problema anterior constes las siguientes preguntas:
ACTIVIDAD DE REGULACIÓN
43
Definición
4. El médico de una guardería desea saber el crecimiento que tuvo cada niño a su
cuidado, durante los primeros 6 meses del año, para ello se obtuvieron los siguientes
resultados en centímetros:
8, 8, 7, 5, 4, 3, 4, 7, 5, 9, 3, 4, 7, 6, 5, 7, 3
5, 4, 5, 3, 9, 7, 6, 8, 4, 6, 9, 7, 8, 3, 4, 9, 5
44
ACTIVIDAD DE REGULACIÓN
El director del hospital “1º de Octubre” del ISSSTE desea saber el número de pacientes
atendidos en la sala de Urgencias, en el mes de septiembre, y para ello se obtuvieron los
siguientes datos:
18, 25, 15, 30, 22, 27, 15, 18, 21, 19,
28, 27, 16, 19, 18, 30, 17, 16, 20, 15,
14, 19, 23, 27, 17, 14, 16, 20, 21, 28,
Si solamente hay dos doctores en la sala, qué decisión tomarías si tu fueras el Director?
_______________________________________________________________________________
¿Por qué? _____________________________________________________________________
_____________________________________________________________________
Definición
Variable cuantitativa es aquella que se puede asociar con un número con el cual
podemos realizar operaciones o comparaciones.
Definición
45
En el ejemplo número 4 donde la variable es “crecimiento durante 6 meses”, en los datos
obtenidos podemos ver que la variable toma valores fraccionarios, en estos casos la
variable se llama “Continua”.
Definición
a) Nominal
CUALITATIVA
b) Ordinal
VARIABLE
a) Discreta
CUANTITATIVA
b) Continua
ACTIVIDAD DE REGULACIÓN
1. Nombre:
__________________________________________________________________________
De los ejemplos anteriores habrás notado la importancia que tienen las variables en el
estudio estadístico de un problema.
46
2.1 PRESENTACIÓN DE DATOS
Una vez que se han obtenido los datos y que se ha hecho el estudio de los valores que
pueden tomar las variables, la primera tarea de la Estadística es la de ordenar y
presentar los datos en tablas que permitan ver la tendencia de los mismos. Ordenados
los datos se facilita su representación en diagramas y gráficas de diferentes tipos.
Los datos agrupados en tablas, nos permiten ver con facilidad el número de
observaciones iguales o comprendidos en un intervalo, a este número de repeticiones
iguales de la variable se llama frecuencia y se denota por f i. Otros valores relacionados
con la frecuencia son:
Escalas de Medición.
La clasificación que hemos hecho de las variables, depende del nivel de medición de la
característica deseada.
1. Nominal.
2. Ordinal.
3. Por intervalo.
De acuerdo con esta clasificación podrás notar que dependen del tipo de variable que se
analiza y por lo tanto reciben el mismo nombre de éstas.
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
47
Al finalizar la carrera, el primer lugar lo obtuvo el 13, el segundo lugar el 19, y el tercer
lugar el 16. El primer lugar hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el
tercer lugar 15.8 minutos.
Definición de variables:
Escala nominal es la que se usa para asignarle una etiqueta a las categorías que
se construyen de la variable con el único fin de distinguir unas de otras.
La escala de medición por intervalos es la de mayor nivel de medición e incluye las dos
anteriores; para poder usarse con la precisión deseada es necesario fijar un patrón de
medida que cuantifique a la variable con la misma exactitud, cuantas veces sea medida.
Algunos de los patrones que se usan son: años, kilos, litros, pesos, etcétera.
48
ACTIVIDAD DE REGULACIÓN
Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y resumir los
datos obtenidos en la investigación de campo, para ello se concentran en tablas de
frecuencia y éstas pueden ser:
a) Absoluta.
b) Relativa.
c) Acumulada.
6. La maestra de orientación del Plantel 11 dio una conferencia al grupo 603 sobre las
características y bondades de las carreras de Ingeniería, Química, Metalúrgica y
Actuaría. Al final de la conferencia pidió que llenaran un cuestionario donde
especificaron además de los datos personales, la carrera de preferencia. Se
obtuvieron los siguientes resultados:
I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q,
49
ACTIVIDAD DE REGULACIÓN
La forma en que se obtuvieron los datos, se muestra en la tabla anterior. Como podrás
observar en esta forma es difícil interpretar la información, por lo que elaboramos la
siguiente tabla de frecuencias:
1. Carrera que prefieren los alumnos del grupo 603 del Plantel 11 del Colegio de
Bachilleres.
Definición
50
ACTIVIDAD DE REGULACIÓN
____________________________________________________________________________
De la tabla del ejemplo anterior puedes notar que las partes de una tabla de frecuencias
debe contener las siguientes partes:
1. Título. Este describe la información más importante del problema como es:
a) La variable.
b) La muestra o población.
c) A quién corresponde la muestra.
Estas partes son comunes a todas las tablas que se elaboren en un estudio, para que el
que las analice tenga toda la información y pueda hacer deducciones de los resultados.
51
Analicemos el siguiente ejemplo.
7. Se realiza un torneo relámpago de fútbol entre los planteles del norte del Colegio de
Bachilleres que son el 1, 2, 6, 7, 9, 11, 12, 13, 18, 19. El torneo se realizó en tres
fechas con sede en el Plantel de menor número. En la primera vuelta se sortean los
equipos pares e impares. Para la segunda ronda se sortean para jugar un par con un
impar, y la tercera y última ronda se jugará de acuerdo con el lugar que tengan al final
de la segunda ronda. Se formaron las parejas en el orden siguiente: 1er. lugar con
2do. lugar, 3º. con 4to., etcétera.
Vuelta Plantel 1 2 6 7 9 11 12 13 18 19
1 Goles 3 5 4 3 2 5 2 4 3 5
2 Goles 2 3 1 0 3 4 2 3 1 3
3 Goles 4 5 0 2 4 3 1 1 0. 2
Totales 9 13 5 5 9 12 5 8 4 10
1. Resultados obtenidos del torneo relámpago efectuado por los 10 planteles de la zona
norte, efectuado los tres primeros domingos del mes de septiembre de 2000.
52
ACTIVIDAD DE REGULACIÓN
2. Consumo fi
KW/hr
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
3. Investigación elaborada por el jefe de planta, datos tomados del consumo diario del
mes de agosto de 1993.
53
ACTIVIDAD DE REGULACIÓN
Respuestas:
Otro parámetro importante es la frecuencia relativa que simbolizaremos con “f r”, ésta se
obtiene dividiendo la frecuencia absoluta (f i) entre el número de elementos de la muestra
que simbolizaremos con (n).
fi
La definición matemática es: fr . . . . . . . . . ( 1)
n
54
Veamos el siguiente ejemplo:
2. Frecuencia relativa ( fr )
Puntuación fi Razón Proporción Porcentaje
0 1 1/100 0.01 1%
1 2 2/100 0.02 2%
2 3 3/100 0.03 3%
3 5 5/100 0.05 5%
4 6 6/100 0.06 6%
5 8 8/100 0.08 8%
6 20 20/100 0.20 20 %
7 25 25/100 0.25 25 %
8 15 15/100 0.15 15 %
9 10 10/100 0.10 10 %
10 5 5/100 0.05 5%
Total 100 100/100 1.00 100 %
ACTIVIDAD DE REGULACIÓN
55
Definición
ACTIVIDAD DE REGULACIÓN
Hasta el momento, en los problemas que hemos analizado las muestras son pequeñas
(n es pequeño). Sin embargo cuando la muestra o población se compone de un
considerable número de elementos, la tabla de frecuencias se elabora agrupando los
datos en clases y ahora la tabla se llama “Tabla de frecuencias con datos agrupados”.
La formación de clases o intervalos de clase que simbolizaremos con (k) es muy variado
y depende generalmente del tamaño del rango de la población o muestra.
Definición
R = Xn – X1 . . . . . . . . . . . . . (2)
Donde:
Xn = valor mayor
X1 = valor menor
56
No existe alguna ley que defina cómo obtener el número de clases; pero la experiencia
recomienda que no sea menor que 5 ni mayor de 20, esto es:
5 k 20 . . . . . . . . . . . . . (3)
Una vez definido el número de clases (k), para obtener la amplitud de clase (A)
aplicamos la siguiente ecuación:
R
A . . . . . . . . . . . . . . (4)
K
Donde:
K = número de intervalos
n = tamaño de la muestra
log = logaritmo en base 10
30, 38, 36, 35, 29, 28, 30, 35, 40, 48, 50, 20, 25, 56, 30
27, 29, 46, 41, 31, 31, 31, 39, 28, 36, 37, 52, 44, 49, 52
56, 58, 40, 39, 38, 40, 27, 24, 30, 32, 35, 38, 26, 25, 24
60, 55, 48, 37, 31, 30, 22, 20, 24, 26, 23, 22, 28, 27, 48
57
Respuestas:
1. 20, 20, 22, 22, 23, 24, 24, 24, 25, 25, 26, 26, 27, 27, 27, 28
28, 29, 29, 30, 30, 30, 30, 30, 31, 31, 31, 32, 35, 35, 35, 36
36, 37, 37, 38, 38, 38, 38, 39, 39, 40, 40, 40, 41, 44, 46, 48
48, 48, 49, 50, 52 ,52, 55, 56, 56, 57, 58, 60
2. X1 = 20 ; Xn = 60
3. R = Xn – X1 = 60 – 20 = 40
R 40
5. A = = = 5.7 6 (cada uno de los intervalos de clase debe contener 6 valores
K 7
en total).
2. Frecuencia relativa ( fr )
Clases (K) f Razón Proporción Porcentaje
20-25 10 10/60 0.17 17%
26-31 17 17/60 0.28 28%
32-37 8 8/60 0.13 13%
38-43 10 10/60 0.17 17%
44-49 6 6/60 0.10 10%
50-55 4 4/60 0.07 7%
56-61 5 5/60 0.08 8%
Total 60 60/60 1.00 100 %
Los valores extremos de cada clase se conocen como límites aparentes de clase. El
valor menor se llama límite inferior de la clase y el mayor se llama límite superior de
clase.
58
ACTIVIDAD DE REGULACIÓN
Si analizamos los intervalos de clase del ejemplo anterior podemos notar lo siguiente:
1er. intervalo 20 – 25
2do. Intervalo 26 – 31
20 25 26 31 32 36
En la gráfica podemos ver que al formar los intervalos de clase hay un valor entre clase y
clase que se pierde.
Como la variable es discreta sabemos que entre estos valores no hay ninguna
información que se pierda; pero ¿qué pasa si la variable es continua?, en estos casos si
hay la posibilidad que entre el 25 y 26 se pierdan los valores comprendidos como es
25.1, 25.3, 25.6, etcétera.
Para evitar este error, si la variable es continua, entonces después de haber determinado
los límites de clase, se fijan otros límites que inician medio punto antes y medio punto
después; de esta forma no hay posibilidad de perder información.
59
A cada uno de estos nuevos límites se le llama “límite real de clase”.
Si representamos los límites reales de clase en una gráfica lineal podemos observar que
ya no hay saltos entre cada clase:
ACTIVIDAD DE REGULACIÓN
Al cambiar los límites reales de clase, el valor del intervalo de clase (A) no cambia y para
determinarlo aplicamos la siguiente ecuación:
A = Xs – Xi . . . . . . . . . . . . . . . (6)
60
Por ejemplo para la 4ta. clase de la tabla:
Xs = 43 A = 43 – 38 = 5
Xi = 38
De este resultado se infiere que para la variable discreta debe aplicarse la siguiente
ecuación:
A = Xs – Xi + 1 . . . . . . . . (7)
A = 43 - 38 + 1 = 6
Otra característica importante del intervalo de clase o marca de clase es el punto medio
de clase o marca de clase (Mi).
Definición
La marca de clase es el valor del punto que se localiza a la mitad del intervalo de
cada clase o intervalo real de clase.
M1 = Xs X1 . . . . . . . . . . . (8)
2
Determinemos los puntos medios o marcas de clase del mismo ejemplo anterior en los
dos tipos de intervalos.
61
ACTIVIDAD DE REGULACIÓN
1. Clases.
2. Límites reales de clase.
3. Punto medio de clase o marca de clase.
4. Frecuencia absoluta (fi).
5. Frecuencia relativa (fr).
Problema.
216, 269, 235, 235, 224, 249, 244, 240, 252, 210, 256
228, 233, 239, 253, 237, 221, 273, 229, 236, 215, 260
230, 228, 230, 255, 245, 244, 230, 231, 240, 222, 223
Hasta el problema anterior hemos mostrado cómo organizar los datos en una tabla de
frecuencia de datos agrupados en clases y también hemos incluido la fracción o
porcentaje de cada clase (fr). Esta información nos ha permitido hacer algunas
inferencias.
Definición
62
Su definición matemática es:
3
F3 =
i 1
f1 + f2 + f3
n
Fn =
i 1
f2 + f2 + . . . fn . . . . . . . . . . (9)
F
Fr . . . . . . . . (1)
n
1 2 3 4 5 6 7
LÍMITES MARCA DE FREC. FREC. FREC. ACUMULADA
CLASES REALES CLASE (MI) ABS. (f1) REL. (FI) FI FR
20-25 19.5-25.5 22.5 10 0.17 10 0.17
26-31 25.5-31.5 28.5 17 0.28 27 0.45
32-37 31.5-37.5 34.5 8 0.13 35 0.58
38-43 37.5-43.5 40.5 10 0.17 45 0.75
44-49 43.5-49.5 46.5 6 0.10 51 0.85
50-55 49.5-55.5 52.5 4 0.07 55 0.92
56-61 55.5-61.5 58.5 5 0.08 60 1.00
Total 60 1.00
La frecuencia acumulada para la 4ta. Clase es F = 45; de este valor se infiere que hasta
esta clase corresponden 45 de las 60 observaciones realizadas.
La frecuencia relativa de esta clase es F = 0.75. este valor significa que hasta esta clase
corresponde el 75% de todas las llamadas.
63
ACTIVIDAD DE REGULACIÓN
Como pudiste notar en la tabla anterior, la frecuencia acumulada nos permite determinar
el número de llamadas menor o igual que el límite superior de la clase correspondiente,
por lo tanto a esta columna la podemos significar con el término menor que.
Si queremos determinar el número de llamadas mayor que, lo que tenemos que hacer es
desacumular la frecuencia y para ello en lugar de sumar restamos al número de
observaciones (n) la frecuencia de la clase (f i) correspondiente.
1 2 3 4 5 6 7 8
MARCA DE FREC. FREC. Fi ACUMULADA FREC. RELAT.
CLASES CLASE (Mi) ABS. (fi) REL. (fr) menos que más que menos más
20-25 22.5 10 0.17 10 50 0.17 .83
26-31 28.5 17 0.28 27 33 0.45 .55
32-37 34.5 8 0.13 35 25 0.58 .42
38-43 40.5 10 0.17 45 15 0.75 .25
44-49 46.5 6 0.10 51 9 0.85 .15
50-55 52.5 4 0.07 55 5 0.92 .08
56-61 58.5 5 0.08 60 0 1.00 .00
Total 60 1.00
64
ACTIVIDAD DE REGULACIÓN
13 19 22 14 13 16 19 21
23 11 27 25 17 17 13 20
23 17 26 20 24 15 20 21
10 22 18 25 16 23 19 20
21 17 18 24 21 20 19 26
Con los ejemplos anteriores pudiste notar que la tabla de frecuencias nos permite inferir
ciertos conocimientos de la variable que se analiza.
65
2.2 GRÁFICAS
Los diferentes tipos de gráfica que podemos usar para representar las observaciones de
un determinado problema y la selección de este tipo, dependen de la variable en estudio.
Si la variable en estudio es de tipo cuantitativo, los gráficos que podemos usar para su
representación gráfica son:
a) Histogramas.
b) Polígonos de frecuencias que a continuación analizaremos.
El histograma es la forma más usual para analizar las características observables de una
variable continua.
Definición
a) En el eje de las abscisas (horizontal) se representan las clases con sus límites
reales de clase y las marcas de clase (Mi) de cada intervalo.
66
2. Por los límites reales superior e inferior de cada clase se trazan barras verticales
que se cortan mediante una horizontal que se traza a la altura del punto
correspondiente a la frecuencia de cada clase.
10, 11, 13, 13, 13, 14, 14, 15, 16, 16, 17, 17, 17, 17, 17, 17, 18,
18, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21,
22, 22, 23, 23, 23, 23, 24, 24, 25, 25, 26, 26, 27, 29.
2. Calculamos el rango R, para ello determinamos los valores mayor y menor de las
puntuaciones.
Xn = 29
Xi = 10
3. Calculamos R = Xn – X1 = 29 – 10 = 19
R = 19
67
4. Calculamos el número de clases (K), para ello determinamos (n)
A= R = 19 = 2.7 A=3
K 7
6. Determinamos cada intervalo de clase y para ello calculamos los límites de clase y
los registramos en la primera columna de la tabla.
1 2 3 4 5 6 7 8
FRECUENCIA ACUMULADA
LÍMITES P. MEDIO FREC. FREC. F F30
CLASES REALES DE CLASE (fi) (fr) MENOR Q MAYOR Q Fr
(MI)
10-12 9.5-12.5 11 2 0.042 2 46 0.042
13-15 12.5-15.5 14 6 0.125 8 40 0.167
16-18 15.5-18.5 17 10 0.208 18 30 0.375
19-21 18.5-21.5 20 16 0.333 34 14 0.708
22-24 21.5-24.5 23 8 0.167 42 6 0.875
25-27 24.5-27.5 26 5 0.104 47 1 0.979
28-30 27.5-30.5 29 1 0.021 48 0 1.00
Total 48 1.000
Trazamos los ejes del plano coordenado, fijamos una escala para cada eje y
representamos en el vertical las frecuencias y en el eje horizontal las clases.
68
fi
15
10
0 x
10 15 20 25 30
Gráfica No. 1
Analiza la gráfica anterior y piensa que eres el gerente general. Explica con tus propias
palabras toda la información sobre la antigüedad de los obreros, que puedas inferir de
ella.
Las líneas verticales punteadas corresponden al punto medio o marca de clase y éste
nos indica el promedio de las puntuaciones en cada clase.
En nuestro ejemplo para la tercera barra, el promedio en años cumplidos de los obreros
de la empresa ubicados en esa clase es de M3 =17 años y como la frecuencia es f 3 = 10
Obreros con la misma antigüedad.
Otra gráfica que permite describir los datos de una distribución de frecuencias es el
polígono de frecuencias.
69
2.2.2 POLÍGONO DE FRECUENCIAS
POLÍGONO DE FRECUENCIAS
fi
15
10
0 x
8 10 15 20 25 30
Gráfica No. 2
b) Se unen los puntos finales de éstos segmentos con una línea continua que inicia
medio punto antes del límite inferior de la primera clase y termina medio punto
después del límite superior de la última clase (ver Gráfica No. 1).
70
Veámoslo en el mismo ejemplo anterior.
0.5
0 x
10 15 20 25 30
Gráfica No. 3
Si observas las gráficas 2 y 3 harás notado que son muy parecidas y su tamaño
dependerá de la escala que se use.
Si los intervalos de clase se toman cada vez más pequeños, entonces los puntos se
unen con segmentos curvos que van suavizando la forma del polígono de frecuencias
hasta tomar una forma parecida a la siguiente gráfica.
fr
x
0
Gráfica No. 4
71
Al graficar las columnas 6 y 7 de la tabla de frecuencias de nuestro ejemplo,
correspondientes a la frecuencia acumulada, obtenemos otras gráficas diferentes a las
anteriores.
Para trazar dicha gráfica se procede como en los gráficos anteriores, es decir, en el eje
horizontal se trazan los intervalos de clase y marcas de clase y en el vertical las
frecuencias acumuladas.
50
40
30
20
10
Años de
Antigüedad
en la
menos empresa
que 10 15 20 25 30
Gráfica No. 5
Analiza la gráfica y escribe con tus propias palabras la información que puedes deducir
de ella.
72
Ya vimos que al desacumular las frecuencias obtenemos la gráfica mayor que, tomamos
los datos de la columna 7 y obtenemos: la ojiva mayor que.
Fi
50
40
30
20
10
Años de
Antigüedad
en la
más
10 15 20 25 30 empresa
que
Gráfica No. 6
ACTIVIDAD DE REGULACIÓN
73
2.2.4 GRÁFICAS CIRCULARES, DIAGRAMAS DE BARRAS, PICTOGRAMAS Y
GRÁFICO DE LÍNEAS
Gráficas Circulares.
Para trazar la gráfica, se hace una distribución proporcional de las frecuencias del
problema con respecto a la circunferencia determinando sectores circulares para cada
categoría.
12. El gobierno de la ciudad de México promocionó cursos dominicales para todas las
personas que quieran aprender alguna habilidad artesanal o artística; los cursos se
realizarán de 8:00 a 12:00 hrs. Las inscripciones quedan abiertas todo el mes de
septiembre.
Para distribuir cada clase en la circunferencia se aplica una regla de tres simple
relacionando el total de inscritos (1800) a 360º que tiene la circunferencia y de esta
relación determinamos la parte que le corresponde a cada curso.
1800 es a 360º
como 250 es a x
1800 360º
250 x
74
Recuerda que para hallar el resultado se multiplica como se indica con las flechas y se
despeja la incógnita, obteniendo:
360 (2500)
x 50
1800
Los resultados que debiste obtener son los que se muestran en la tabla:
Gráfica No 7
75
Una forma más útil de representar las regiones de cada categoría es distribuyéndolos en
un porcentaje y para ello la regla de tres que se plantea, se relaciona 360º representa el
100% y en base a ésta se determina el porcentaje que le corresponde a los grados de
cada categoría (curso); veamos el planteamiento:
50º x 70º x
x = 13.9% x = 19.4%
76
1. Alumnos inscritos en los cursos dominicales:
Gráfica No. 8
ACTIVIDAD DE REGULACIÓN
Del siguiente problema representa los datos en una gráfica circular indicando el
porcentaje correspondiente a cada categoría.
77
Diagramas de Barras
Para construir una gráfica de barras se trazan ejes coordenados; en el eje horizontal se
representan los valores de la variable y se traza un segmento perpendicular por cada
valor. Si se usan barras, éstas deberán tener el mismo ancho de la base.
13. El profesor de estadística usa una escala de clasificación del 5 al 10, aprobatoria a
partir de 6. Cualquier calificación reprobatoria se refleja en un 5.
Las calificaciones obtenidas del grupo A son las que se muestran en la tabla
siguiente:
Calificación 5 6 7 8 9 10
No. de Alumnos 3 8 12 8 5 4
10
Calificación
0 5 6 7 8 9 10
Gráfica No. 9
Diagrama de segmentos verticales.
78
CALIFICACIÓN DEL GRUPO A
fi
15
10
Categorías
0 5 6 7 8 9 10
Gráfica No. 10
Diagrama de barras.
10
fi
0
5 10
Gráfica No. 11
79
ACTIVIDAD DE REGULACIÓN
Pictogramas
80
La representación gráfica de la variable mediante un pictograma es la que se muestra a
continuación:
No. DE ÁRBOLES
DELEGACIÓN (en miles)
Gustavo A. Madero
Venustiano Carranza
Cuauhtemoc
Cuajimalpa
Benito Juárez
ACTIVIDAD DE REGULACIÓN
Se hizo una investigación del crecimiento poblacional del municipio de Teteles de Ávila
Castillo, Estado de Puebla, la información obtenida de los archivos son:
81
Gráfico de Líneas
DÍA CANTIDAD
Lunes (L) 4000
Martes (Ma) 5500
Miércoles (M) 6000
Jueves (J) 6500
Viernes (V) 5500
5000
1000
Días de la
semana
L Ma M J V
Gráfica No. 12
82
a) ¿Cuál es la variable del problema? ____________________________________________
ACTIVIDAD DE REGULACIÓN
83
EXPLICACIÓN INTEGRADORA
DATOS AGRUPADOS
MUESTRA
VARIABLE
CUALITATIVA CUANTITATIVA
NOMINAL ORDINAL
DISCRETA CONTINUA
ESCALA ESCALA
NOMINAL ORDINAL
ESCALA POR
GRÁFICOS INTERVALOS
TABLAS DE
FRECUENCIA
CIRCULAR
BARRAS
ABSOLUTA RELATIVA ACUMULADA ACUMULADA
RELATIVA
LÍNEAS
PICTOGRAMA
GRÁFICOS
84
RECAPITULACIÓN
Hasta aquí hemos visto los conceptos de población, muestra y con ellas los tipos de
variables que nos permiten seleccionar muestras mediante el manejo de tablas para
identificar las situaciones que corresponden a cada tipo de estadística, ya sea inferencial
o descriptiva, para advertir la importancia de las distribuciones de frecuencia de los datos
y conseguir distribuciones de frecuencia simples, con intervalos, acumuladas y
porcentuales acumulativas, para representar gráficamente las distribuciones de
frecuencia dadas.
85
ACTIVIDADES INTEGRALES
Con la finalidad de reafirmar tus conocimientos adquiridos en este capítulo, resuelve los
siguientes ejercicios.
144 146 168 146 161 164 158 126 173 145
150 140 138 142 135 132 147 176 147 142
144 136 163 135 150 125 148 119 153 156
149 152 154 140 145 157 144 165 135 128
86
AUTOEVALUACIÓN
1. Muestra Aleatoria.
2. Muestra Representativa.
3. Variable nominal.
4. Variable continua.
5. a) R = Xn – Xi = 176 – 119 = 57
R 57
A= = ≈ 10
K 6
b) CLASES LÍMITES Mi Fi Fr Fi Fr
REALES
119-128 118.5-128.5 123.5 4 0.1 4 0.10
129-138 128.5-138.5 133.5 6 0.15 10 0.25
139-148 138.5-148.5 143.5 14 0.35 24 0.60
149-158 148.5-158.5 153.5 9 0.225 33 0.825
159-168 158.5-168.5 163.5 5 0.125 38 0.950
169-178 168.5-178.5 173.5 2 0.05 40 1.00
TOTAL 40 1.00
87
HISTOGRAMA Y POLÍGONO DE fi
fi
15
10
Límites
0 118.5 128.5 138.5 148.5 158.5 168.5 178.5 reales
POLÍGONO DE Fr
Fr
1.0
0.5
LR
0 118.5 128.5 138.5 148.5 158.5 168.5 178.5
88
OJIVA MENOS QUE
Fi
40
30
20
10
LR
0 118.5 128.5 138.5 148.5 158.5 168.5 178.5
89
RECAPITULACIÓN GENERAL
ANTECEDENTES DE LA ESTADÍSTICA
BOSQUEJO HISTÓRICO
FUNCIONES DE LA APLICACIONES
ESTADÍSTICA
CLASIFICACIÓN DE LA
CONCEPTOS ESTADÍSTICA
PRELIMINARES
CONCEPTOS BÁSICOS
PARA SU ESTUDIO
MUESTRA
VARIABLE
CUALITATIVA CUANTITATIVA
GRÁFICOS
DE BARRAS
GRÁFICOS
DE LÍNEAS
90
ACTIVIDADES DE CONSOLIDACIÓN
Se han preparado estos ejercicios para que reafirmes tus conocimientos adquiridos en
este fascículo, resuélvelos y si tienes alguna duda, consulta a tu profesor o asesor
académico.
c) Si podemos sacar una esfera por tiempo indefinido, entonces ¿cómo es la población?
____________________________________________________________________________
91
3. En la Fuerza Aérea Mexicana, los aviadores toman un examen médico general en
cada 150 horas de vuelo, por lo que se analizan los expedientes de cada piloto para
citarlos a su examen. Los resultados obtenidos se muestran en la siguiente tabla,
correspondientes a las horas de vuelo.
222, 220, 199, 212, 201, 217, 214, 213, 212, 215, 214,
196, 192, 208, 207, 212, 214, 209, 202, 206, 196, 202,
219, 194, 206, 204, 194, 211, 216, 209, 212, 216, 206,
201, 201, 210, 200, 206, 201, 205, 217, 219, 212, 207,
211, 204, 212, 212, 205, 207, 214, 211, 220, 205, 201,
218, 193, 199, 206, 209, 205, 205, 221, 216, 211, 204,
215, 203, 213, 207, 209, 197, 197, 199, 208, 209, 218,
204, 207, 202, 209, 195, 207, 209, 205, 210, 197, 209,
211, 208, 211, 198, 217, 209, 199, 192, 218, 193, 208,
209, 194, 211,
R
d) Calcula la amplitud del intervalo A =
K
h) Determina la frecuencia fi
92
4. Los subsidios que el gobierno federal distribuyó en el año de 1993 se muestran en la
siguiente tabla.
5. La venta de libros de la librería de Cristal de los 5 años anteriores fueron los que se
muestran en la siguiente tabla.
93
AUTOEVALUACIÓN
Los resultados que debiste obtener en la solución de los problemas anteriores son los
siguientes:
e) La población está constituida por 8000 estudiantes, por lo tanto es una población
finita.
g) La variable está definida por una expresión (lugar que ocupó), es de tipo
cualitativo ordinal, la escala con que se cuantifica es ordinal y es una variable
discreta.
94
3. DATOS ORDENADOS
a)
192 192 193 193 194 194 194 195 196 196
197 197 197 198 199 199 199 199 200 200
201 201 201 201 201 202 202 202 203 204
204 204 204 205 205 205 205 205 206 206
206 206 206 207 207 207 207 207 207 208
208 208 208 209 209 209 209 209 209 209
209 210 210 211 211 211 211 211 211 211
212 212 212 212 212 212 212 213 213 213
214 214 214 214 215 215 215 216 216 216
217 217 218 218 218 219 219 220 221 222
b) R = Xn – X1 = 222-192 = 30 R = Rango
R 30
d) A = = = 3.75 4 A = Amplitud de clase
K 8
e) f) g) h) i) j) k)
Límite de Límite real Punto Frecuencia Frecuencia Frecuencia Frecuencia
clase de clase Medio de Absoluta fr Relativa fr Acumulada Relativa
clase Fi Acumulada Fr
192-195 191.5-195.5 193.5 8 0.078 8 0.078
196-199 195.5-199.5 197.5 10 0.098 18 0.176
202-203 199.5-203.5 201.5 10 0.098 28 0.274
204-207 203.5-207.5 205.5 21 0.21 49 0.484
208-211 207.5-211.5 209.5 23 0.23 72 0.714
212-215 211.5-215.5 213.5 15 0.15 87 0.864
216-219 215.5-219.5 217.5 11 0.10 98 0.964
220-223 219.5-223.5 221.5 4 0.036 102 1.00
Total 102 1.00
95
l) HISTOGRAMA Y POLÍGONO DE FRECUENCIA
fi
23
21
15
11
10
8
96
Fr
1.00
0.5
x
0
191.5 193.5 197.5 201.5 205.5 209.5 213.5 217.5 221.5
97
Fi
102
98
87
72
49
28
18
8
x
0
191.5 193.5 197.5 201.5 205.5 209.5 213.5 217.5 221.5
98
Fi
102
94
84
74
53
30
15
4
x
0
193.5 197.5 201.5 205.5 209.5 213.5 217.5 221.5 223.5
202-203
(10)
204-207 196-199
(21) (10)
192-195
(8)
220-223
(4)
208-211 216-219
(23) (11)
212-215
(15)
99
9.8%
20.6% 9.8%
7.8%
3.9%
22.5%
10.8%
14.7%
$1000
10
0
1 2 3 4 5 6 7 8 9 10
100
b) GRÁFICO DE BARRAS HORIZONTAL
1. Azúcar
2. CONASUPO
1
3. I.M.S.S.
2
4. C.F.E.
3
5. PEMEX
4
6. A.S.A.
5 7. D.I.M.
6
8. F.A.M.
7 9. Ecología
8 10. C.R.M.
9
10
$1000
0
2 4 6 8 10
5) PICTOGRAMA
Física
Química
Filosofía
Leyes
101
6) DIAGRAMA LINEAL
N° de lts
en miles
100
50
10
1 2 3 4 5 6 7 8 9 10
1. Enero 6. Junio
2. Febrero 7. Julio
3. Marzo 8. Agosto
4. Abril 9. Septiembre
102
ACTIVIDADES DE GENERALIZACIÓN
1.- Las siguientes cifras corresponden al peso en kilogramos de 1000 bultos que salen
de una fábrica. Para éste conjunto de datos, realiza lo siguiente:
103
BIBLIOGRAFÍA CONSULTADA
FREUD E., John, Williams J., Frank, Perles M., Benjamin. Estadística para la
administración. Editorial Prentice Hall Hispanoamericana, S.A. México
104
COLEGIO DE BACHILLERES
ESTADÍSTICA DESCRIPTIVA
E INFERENCIAL I
1
2
ÍNDICE
INTRODUCCIÓN 5
PROPÓSITO 7
1.1.1 MODA 11
1.1.2 LA MEDIANA 15
1.1.3 LA MEDIA 18
1.2.1 RANGO 32
1.2.3 LA VARIANZA 40
3
1.3 MEDIDAS DE TENDENCIA CENTRAL Y DE
DISPERSIÓN EN CURVAS DE
FRECUENCIAS 50
1.3.1 CURVAS SIMÉTRICAS 50
1.3.4 SESGO 56
RECAPITULACIÓN 60
ACTIVIDADES DE CONSOLIDACIÓN 61
AUTOEVALUACIÓN 62
ACTIVIDADES DE GENERALIZACIÓN 64
BIBLIOGRAFÍA CONSULTADA 65
4
INTRODUCCIÓN
Una manera de organizar esta información son las tablas de frecuencias. Las tablas de
frecuencia son una síntesis de la información que nos facilita su representación gráfica
en un histograma o polígono de frecuencias.
La gráfica también nos muestra con claridad, la íntima relación que hay entre los
parámetros de dispersión y cómo influyen éstos en su forma, dando como resultado
gráficas:
a) Simétricas, o
b) Asimétricas.
La forma e inclinación de la gráfica conocida como curtosis nos permite visualizar hacia
donde se dispersan los datos (el sesgo).
5
6
PROPÓSITO
¿QUÉ APRENDERÁS?
¿CÓMO LO LOGRARÁS?
7
¿PARA QUÉ TE VA A SERVIR?
8
CAPÍTULO 1
MEDIDAS DESCRIPTIVAS
LE BOUTIQUE DE
MADAME LAGUSSI
Figura 1.
El sexo femenino suele vestir muy a la moda y esto se refleja en las ventas del mes de
mayo en la casa de modas de Madame Lagussi.
9
M. Lagussi al hacer un balance obtuvo los siguientes resultados:
De acuerdo con esta información, ¿Qué tipo de ropa crees que esté de moda?
El estudio de estos problemas nos permiten tomar decisiones acertadas que nos
conducen a lograr metas importantes de progreso.
En la estadística descriptiva:
1. Se define cuidadosa y completamente la situación que se está investigando.
2. Se obtiene una muestra de datos de una población apropiada siguiendo un
procedimiento establecido y adecuado.
Las medidas descriptivas son de tres tipos, pero en este fascículo únicamente
estudiaremos los dos primeros tipos.
10
Medidas de Tendencia Central o de Posición.
Son valores numéricos que tienden a localizar en algún sentido la parte central de un
conjunto de datos. Se les asocia el término promedio a cada una de ellas.
En este ejemplo, el tipo de ropa con mayor frecuencia de venta es la minifalda, porque la
frecuencia f = 10 es la mayor. En este caso denotamos Mo = minifalda.
Esta variable aleatoria describe una cualidad como en nuestro ejemplo (minifalda); pero
también describe una cantidad representada por un valor numérico, como ya veremos.
1.1.1 MODA
Ejemplos:
1. En la conferencia que se llevó a cabo en el hotel María Isabel Sheraton para altos
ejecutivos, cuyo tema fue: “El tratado de libre comercio”; la asistencia fue la siguiente:
11
a) ¿Cuál es la moda de la asistencia?
b) ¿Qué tipo de variable es esta moda?
c) ¿Qué día fue la moda de asistencia?
d) ¿Qué tipo de variable aleatoria es el día de moda de asistencia?
R.
a) La moda de la asistencia es Mo = 16.
b) El tipo de variable es de cantidad.
c) El día con mayor frecuencia en asistencia fue Mo = domingo.
d) El tipo de variable es de cualidad.
R.
Como pudiste notar, en este ejemplo no hay moda porque ninguna distancia recorrida se
repite. Esto siempre ocurre; es decir, si tienes un conjunto de datos en el cual cada dato
aparece una sola vez, se dice que no hay moda.
12
a) ¿Qué día fue la moda en ventas?
b) ¿Cuál es la moda en ventas?
R.
a) El día de moda en ventas fue el domingo porque la frecuencia en ventas es la mayor
de todas, Mo = domingo.
R.
Analizamos la frecuencia de cada medida y obtenemos:
Estatura (mts) f
1.70 4 La moda de las estaturas es:
1.75 4
1.80 1 Mo = 1.70 mts.
1.85 1 Mo = 1.75 mts.
1.88 1
De acuerdo a la definición de moda vemos que esta variable aleatoria tiene dos modas
porque dos estaturas diferentes tienen la misma frecuencia y ésta es la mayor. En estos
casos la variable se llama modal.
13
Por lo tanto en el ejemplo anterior la variable aleatoria es bimodal por tener dos modas.
ACTIVIDAD DE REGULACIÓN
Para cada uno de los ejercicios siguientes contesta las preguntas que se indican:
Recuerda que la moda es una medida de tendencia central porque su valor encuentra en
la proximidad de otros valores que también se localizan en la parte central de los valores
que toma la variable aleatoria. Estas son: la mediana (Me) y la media aritmética X , de
las cuales nos ocuparemos en las secciones siguientes.
14
1.1.2 LA MEDIANA
Figura 2.
De este ordenamiento puedes observar que el valor que está en el centro de todos los
datos es el número 3; este valor recibe el nombre de mediana. En este caso denotamos
Me = 3. En nuestro ejemplo corresponde al color verde del vestido.
15
Ejemplos:
Empresa A B C D E F G H I J K L M
Universidad 6 19 11 10 11 13 12 9 16 11 16 6 8
De este conjunto ordenado podemos ver que el número que se encuentra en el centro de
los datos es el 11 y por lo tanto Me = 11.
Para determinar el valor de la mediana (Me) de un conjunto con (n) datos, si n es impar,
entonces aplicamos la fórmula:
n 1
(1)
2
El 7 indica el número de orden del elemento que representa la mediana que es Me = 11.
50 1 51
25.5
2 2
Este valor nos indica que la mediana se obtiene por la semisuma de los elementos
que ocupan los lugares 25° (vigesimoquinto) y 26° (vigésimo sexto).
16
7. El número de transacciones en dólares, realizadas por el Banco Nacional de México
er
durante los primeros días del mes de julio de 1993, fueron los siguientes: el 1 . día 9,
do
el 2 . día 13 y los siguientes días 12, 8, 3, 7, 14, 16, 18 y 17 respectivamente.
10 1 11
Aplicando la fórmula (1) para n= 10 obtenemos: 5.5
2 2
El valor obtenido nos indica que la mediana se obtiene por la semisuma de los
elementos que ocupan los 5º y los 6º Lugares o sea los valores 12 y 13.
12 13 25
Me 12.5
2 2
Me = 12.5
Este valor de la mediana nos indica que el valor central de los datos corresponde a 12.5
y como ya se dijo, si el número de datos es par, para determinar el valor de la mediana
se toma la semisuma de los dos valores centrales. También esto ilustra que la mediana
no es necesariamente un elemento del conjunto en cuestión.
ACTIVIDAD DE REGULACIÓN
2. Las tallas más comunes de los vestidos que se vendieron en la boutique de Madame
Lagusy, en el mes de julio son: 7, 10, 14, 9, 14, 9, 18, 9, 16, 12, 14, 11, 14.
17
1.1.3 LA MEDIA
Figura 3.
Las edades de las 10 primeras finalistas del Concurso de Belleza, son: 18, 19, 25, 19,
20, 21, 20, 22, 18 y 18 años, respectivamente. ¿Cuál es la edad del promedio X de las
diez finalistas?
R.
Para poder determinar la edad promedio, hacemos una suma de las edades y el
resultado lo dividimos entre el número de finalistas.
18 19 2 19 20 21 20 22 18 18
X 20
10
X = 20
Este resultado nos dice que la edad promedio de las 10 finalistas del concurso Miss
Universo es de 20 años.
Ejemplos:
8. En la temporada pasada los equipos de fútbol que más goles anotaron fueron los
siguientes: El Atlante 47, el Pachuca 50, el América 45, el Guadalajara 39, el Cruz
Azul 38, el Necaxa 29, el Universidad 39, la U. de G. 42, el Toluca 44, el Querétaro
43 y el Puebla 46.
18
Para determinar la media aritmética X o promedio de n datos, se suman
y el resultado se divide entre n.
47 50 45 39 38 29 39 42 44 43 46
X 42 goles
11
X1 X 2 . . . . . . .X n
X (2)
n
X
i 1
i
X (3)
n
Esta expresión indica que el numerador del segundo miembro existe una suma de la
variable X, el subíndice ( i ) indica que el valor de X es la variable y la anotación abajo y
arriba de indica que el subíndice ( i ) toma valores desde i = 1 hasta i = n, es decir; la
suma se hace desde X = X 1 hasta X = X n.
7
X1 = 25
X2 = 24
X
i1
i
25 24 20 30 27 35 28
X3 = 20 X 27
7 7
X4 = 30
X5 = 27 X = 27
X6 = 35
X7 = 28 El promedio semanal de atención de pacientes en la sala de urgencias
n=7 es de 27 pacientes.
19
ACTIVIDAD DE REGULACIÓN
N° de muestra 1 2 3 4 5 6 7 8 9 10
N° de horas 865 850 841 850 820 843 830 848 840 838
Hasta este momento, hemos calculado las medidas de tendencia central (Mo = moda,
Me = mediana X = media) de datos no agrupados y esto se puede hacer debido a que
las muestras tomadas de la población son pequeñas. Si la muestra es grande entonces
es necesario agrupar los datos en tablas de frecuencias como ya lo estudiaste en el
fascículo anterior.
20
10. Un grupo de 40 alumnos, acumuló en un mes 43 retardos reportados en minutos en
la siguiente tabla.
d1
Mo Lr A ( 4 )
d1 d 2
Donde:
A = Intervalo de clase.
Lr = Límite real inferior de la clase modal.
d1 = frecuencia de la clase modal menos la frecuencia de clase anterior a la modal.
d2 = frecuencia de la clase modal menos la frecuencia de la clase siguiente.
Recordarás que la moda es el valor que se repite con mayor frecuencia. Para los datos
agrupados en clases, la moda es el valor que se encuentra en la clase de mayor
frecuencia y a esta clase se le llama clase modal.
3) Calculamos d1 = 12 – 8 = 4
4) Calculamos d2 = 12 – 6 = 6
21
La fórmula que hemos aplicado tiene su fundamento en el histograma que se obtiene al
graficar los datos; analicemos la siguiente gráfica:
frecuencia
14
13
12
11
10 d1=4
9 d2=6
8
3
A=3
2
X
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 clases
Mo = 10.7
Figura 4.
X es la distancia del límite real de clase al punto donde se localiza la moda; como estas
distancias son proporcionales, podemos establecer la siguiente proporción:
X = d1 d1
A d1 + d2 X=A d +d ........ ..(a)
1 2
22
La moda es igual a la suma de las siguientes distancias:
Mo = Lr + X ............ (b)
Sustituyendo ( a ) en ( b ) obtenemos:
d1
Mo = Lr + A d1 + d2 .................. (c)
Del ejemplo anterior podemos concluir que la moda de datos agrupados se puede
determinar de dos formas:
1. Aplicando la ecuación ( 4 )
2. Cálculo gráfico.
Para el cálculo gráfico, una vez graficado el histograma, se trazan las diagonales
uniendo los puntos superior derecho de los rectángulos de la clase modal y la clase
anterior y los puntos superior izquierdo de la clase modal y la clase siguiente a ésta. En
el punto donde se cortan las diagonales se traza una perpendicular al eje “X”. El punto
donde se cortan la perpendicular y el eje “X” es la moda de los datos agrupados.
ACTIVIDAD DE REGULACIÓN
En cada uno de los siguientes ejercicios, determina la moda (Mo) mediante la gráfica y
comprueba el resultado, aplicando la fórmula.
15,12,18,13,20,14,16,14,18,19,8,15
9,12,17,19,14,13,12,20,17,13,15,18
20,12,15,19,10,0,9,12,20,10,12,13
12,18,14,11, 20,11,10,9,13,18,15,17
19,12, 11,19,17,20,8,15,18,14,17,19
2. Las llamadas telefónicas diarias que una empresa hizo a sus clientes durante los dos
primeros meses del año fueron:
6,12,7,15,13,18,16,20,25,12,10,8
13,15,6,9,18,20,25,12,7,10,11,13
9,12,15,18,20,13,17,23,25,14,18,6
14,16,9,6,10,12,20,13,17,14,25,7
23
1.1.5 CÁLCULO DE LA MEDIANA DE DATOS AGRUPADOS.
n
Me L i A F
2 ...... .. ..... ......... (5)
f
Donde:
L = límite inferior de la clase modal
A = amplitud del intervalo de clase
n = número de observaciones de la muestra
F = frecuencia acumulada hasta la clase anterior a la clase modal
f = frecuencia absoluta de la clase modal
Frecuencia
Intervalo de clase Kg. Frecuencia absoluta
acumulada
53-57 2 2
58-62 7 9
63-67 10 19
68-72 12 31
73-77 9 40
78-82 6 46
83-87 4 50
total 50
n = 50 = 25
2 2
De este resultado se deduce que la mediana ocupa el 25o. lugar, por lo que vemos en la
frecuencia acumulada en qué clase se ubica, y ésta corresponde a la clase 68-72.
Marcamos esta clase con doble raya para fácil referencia. Para determinar la mediana es
necesario interpretar los datos, dado que no tenemos la mediana a la vista en la tabla
sino que se encuentra entre los 12 valores que están incluidos en la clase 68-72.
24
Determinamos el valor de los parámetros observando los datos en la tabla:
n
25 , A = 77 – 73 + 1 = 4 + 1 = 5, F = 19, f = 12 y Li = 68.
2
A n2 F
Se aplica la ecuación (5): Me L i
f
Me = 68 + 5 ( 25 – 19 ) = 68 + 5 ( 6 ) = 68 + 2.5 = 70.5
12 12
ACTIVIDAD DE REGULACIÓN
x n x n1
Mi . . . . . . . (6)
2
25
La ecuación es la siguiente:
n
M f Mi f 2 .....Mi fn
M f i i
X i1 i1
n n
n
M f
i 1
i i
X . . . . . . . . . . . . . . (7)
n
12. Se desea saber la edad promedio de 50 ancianos de un asilo y para ello con la
información se elaboras la siguiente distribución de frecuencias:
Clase años Mi Fi Mi fi
70-72 71 15 1065
73-75 74 11 814
76-78 77 8 616
79-81 80 7 560
82-84 83 4 332
85-87 86 3 258
88-90 89 2 178
total 50 =3823
M f
i1
i i
3823
X 76.46 años es la edad promedio en el asilo de ancianos.
n 50
Existe otro método para calcular la media de datos agrupados, lo llamaremos “Método
abreviado para el cálculo de la media”.
Este método consiste en fijar un origen muy aproximado a la media ( X ) de los datos.
Este valor que sirve de origen se resta a cada uno de los valores individuales obtenidos
como diferencia, valores negativos y positivos cuya suma es cero; pero el producto de
cada diferencia por la frecuencia nos da valores cuya suma es diferente de cero, con
estas cantidades aplicamos la siguiente ecuación:
n
X' f
i1
i
X X' . . . . . . . . . (8)
n
26
Donde X´ es el valor que se toma como origen.
Se recomienda el valor que se tome como origen (X´) sea un valor próximo a la mediana.
El valor escogido de esta forma, facilita el cálculo y el valor obtenido de la media más
exacta.
Calif.- origen
Calificación fi X´ fi
Xi – X´ = X´
0 0–5=–5 0 0
1 1–5=–4 0 0
2 2–5=–3 0 0
3 3–5=–2 2 –4
4 4–5=–1 3 –3
X´ (5) 5–5= 0 4 0
6 6–5= 1 14 14
7 7–5= 2 12 24
8 8–5= 3 7 21
9 9–5= 4 4 16
10 10 – 5 = 5 4 20
Total 50 = 88
n
De la tabla se establece que: X´ = 5 , n = 50 y X' f
i1
i 88
X' f
i1
i
88
Sustituyendo en la ecuación ( 8 ), obtenemos: X X' 5 5 1.76
n 50
Cuando los datos están agrupados por clases en una tabla de frecuencias, se toma
como punto de origen (X´) en un valor intermedio de las marcas de clase.
27
Se calculan las diferencias Mi – X´ = X' y con este resultado se calculan los productos
en X' f i completando las columnas necesarias de la tabla de frecuencias; estos valores
los sustituimos en la fórmula ( 8 ).
Ejemplo:
14. Aplicando la fórmula (8) calculemos la edad promedio de los 50 ancianos del
problema (12), y comparemos los resultados obtenidos con ambos métodos.
Clase
Mi Fi Mi – X´= X´ X´ fi
años
70 – 72 71 15 71 – 77 = – 6 – 90
73 – 75 74 11 74 – 77 = – 3 – 33
X´ = 77 76 – 78 77 8 77 – 77 = 0 0
79 – 81 80 7 80 – 77 = 3 21
82 – 84 83 4 83 – 77 = 6 24
85 – 87 86 3 86 – 77 = 9 27
88 – 90 89 2 89 – 77 = 12 24
Total 50 = – 27
X = 77 + - 27 = 77 – 0.54 = 76.46
50
Al comparar este valor con el calculado por el otro método, podemos observar que el
resultado es el mismo.
ACTIVIDAD DE REGULACIÓN
28
2. En el siguiente problema, aplica el método abreviado para calcular la media.
Una zapatería pone en remate 200 pares de zapatos cuyos precios y cantidades de
existencia se indican en la siguiente tabla de frecuencias:
PRECIO EN $ fi
10 – 19 19
20 – 29 46
30 – 39 69
40 – 49 35
50 – 59 22
60 – 69 9
total 200
X (estadística de la muestra)
(parámetro de la población)
X i
i1 . . . . . . . . . . . . . (9)
N
29
También recordarás que, para que la muestra sea representativa de la población, esta
debe ser una “muestra aleatoria”.
a) La Moda (Mo)
b) La Mediana (Me)
c) La Media ( X )
Hay otras características de las observaciones que son importantes conocer, por
ejemplo: ¿Cuánto varían los datos entre sí? ¿Cuál es el grado de dispersión de los
datos? Esta información no la proporcionan las medidas de tendencia central, por lo que
a continuación analizaremos cómo determinar estos nuevos valores.
15. Las ventas realizadas en 10 días de uno de los meses por tres vendedores de una
compañía fueron las siguientes:
Ordena los datos y calcula las medidas de tendencia central de las ventas de cada
uno.
Ventas de Pedro: Mo Me X
Ventas de Andrés: Mo Me X
Ventas de Carlos: Mo Me X
De acuerdo a tus cálculos, la media de las ventas que obtuviste fue la misma para
los tres:
X = 15.8
De acuerdo a los valores de tendencia central de Andrés y Pedro, ¿Qué puedes decir de
estos vendedores? _____________________________________________________________
30
¿Cuál de los tres consideras que es más consistente en sus ventas? .
¿Considera a Pedro y Carlos ¿Quién consideras que es más consistente en sus ventas?
.
Esta información podría hacernos pensar que todo está bien, sin embargo no lo es, por
lo que es necesario tomar alguna medida para mejorar las ventas.
Si observas los resultados anteriores, podrás notar que el valor de la media es el mismo
para los tres, por lo que no nos indica en donde las ventas andan mal.
Un cálculo rápido y sencillo consiste en restar al valor mayor de los datos el valor menor,
este resultado nos indica el rango en que están dispersos los datos.
Las ventas de Andrés son muy consistentes porque el rango de dispersión es de 12.
Las ventas de Carlos también son consistentes aunque menor que las de Andrés; la
dispersión de los datos es 16.
Las ventas de Pedro registran el mayor rango de dispersión, por lo tanto nos indica que
sus ventas no son consistentes.
Con este análisis debemos recomendar que se haga una investigación de campo para
determinar las causas de la irregularidad de Pedro con el fin de dar una solución para
mejorar.
31
1.2 MEDIDAS DE DISPERSIÓN O VARIABILIDAD
1. El rango
2. La desviación media
3. La desviación estándar
4. La varianza
1.2.1 EL RANGO:
R = Xn X1 . . . . . . . . . . . . . (10)
Donde:
R = rango
X1 = el menor valor
Xn = el mayor valor
En la variable aleatoria, para determinar el rango de datos agrupados, hay dos formas.
Una de ellas es la diferencia del límite real superior del último intervalo de clase (X n),
menos el límite real inferior del primer intervalo de clase (X 1). La otra forma es la
diferencia de la marca de clase superior, menos la marca de clase inferior.
32
ACTIVIDAD DE REGULACIÓN
12, 12.05, 12.03, 11.95, 12.01, 12.04, 12, 11.98, 11.99 y 12.03
El rango es muy útil en el control de calidad porque en esa área manejan diferencias
muy pequeñas (tolerancias). Sin embargo, la media y el rango no permite conocer con
precisión cómo están dispersos los datos, por lo tanto es necesario introducir otra
variable que permita conocer la dispersión y ésta es la desviación media que
introduciremos en la siguiente sección.
La desviación (di) que hay de cada observación (Xi) con respecto a la media ( X ) se
obtiene mediante la siguiente ecuación:
di = Xi - X ................ ( 11)
Donde:
di = Desviación de cada observación con respecto a la media
33
La desviación es negativa para valores X i < X y positiva para valores Xi > X . La suma
de todas las desviaciones es igual a cero y se simboliza mediante la siguiente ecuación:
n
D X
i1
i X 0 . . . . . . . . . . . . (12)
Este valor D = 0 no nos ayuda en el cálculo; para evitar que la suma sea igual a cero, se
toma el valor absoluto de cada desviación y la ecuación (12) se transforma en:
n n
D Xi X
i1
i1
di . . . . . . . . . . . . . (13)
X
i1
i X
Para una muestra: DM . . . . . . . . (14)
n
i1
X i
Para una población: DM . . . . . . . . (15)
N
Donde:
DM = desviación media
Xi = i–esimo dato u observación
µ = media de la población o media poblacional
X = media muestral
N = número de observaciones de la población
n = número de observaciones de la muestra
= signo de sumatoria
= signo del valor absoluto
34
Ejemplo:
Xi
n Xi X Xi X
min.
1 18 18 – 40 = -22 22
2 20 20 – 40 = -20 20
3 23 23 – 40 = -17 17
4 28 28 – 40 = -12 12
5 30 30 – 40 = -10 10
6 37 37 – 40 = - 3 3
7 39 39 – 40 = -1 1
8 40 40 – 40 = 0 0
9 42 42 – 40 = 2 2
10 43 43 – 40 = 3 3
11 46 46 – 40 = 6 6
12 55 55 – 40 = 15 15
13 57 57 – 40 = 17 17
14 58 58 – 40 = 18 18
15 64 64 – 40 = 24 24
Total = 170
X
i1
i
600
X 40
n 15
X
i1
i X
170
DM 11.3 DM = 11.3 minutos.
n 15
35
El valor de la desviación media de este ejemplo se debe interpretar que la
desviación de los tiempos de cada entrevista es de 11. 3 min. mayor o menor que la
media, es decir el tiempo de cada entrevista se expresa por medio de la media en
X DM
Si los datos están agrupados en una tabla de distribución de frecuencias, entonces para
determinar la desviación media DM es necesario multiplicar cada desviación por su
frecuencia y de esto se obtienen otra ecuación de la DM para datos agrupados, la cual
es:
n
f X
i1
1 i X
DM . . . . . . . . . . (16)
n
Donde:
fi = frecuencia absoluta
Ejemplo:
Xi fi fi Xi Xi X Xi X fi Xi X
41 1 41 41 – 46 = -5 5 5
42 2 84 42 – 46 = -4 4 8
44 4 176 44 – 46 = -2 2 8
46 6
48 4
50 2
51 1
20 =0
36
Procedimiento:
n
X
i1
i
920
a) Determinamos la media de los datos. X 46 X 46
n 20
f X
i1
1 i X
42
e) Sustituimos valores en la fórmula (15): DM 2.1 2
n 20
Este resultado nos indica que los datos están distribuidos en 46 2 aviones a partir de la
media, que despegan diariamente.
Cuando los datos están agrupados en clases, para obtener la diferencia de cada
observación con la media, se toma la Mi (marca de clase), esto es:
Mi X . . . . . . .. . . . . . . . . . . . . . (17)
f M
i1
1 i X
DM n
. . . . . . . . . . . . . . . (18)
f
i1
i
Ejemplo:
37
Intervalo de
Mi fi fi Mi fi X fi Mi X
clase
1.54 – 1.56 1.55 5 7.75 1.55 – 1.62= 0.07 0.35
1.56 – 1.58 1.57 6 9.42 1.57 – 1.62= 0.5 0.30
1.58 - 1.60 1.59 8 12.72 1.59 – 1.62= .03 0.24
1.60 – 1.62 1.61 20 32.20 1.61 – 1.62= .01 0.20
1.62 – 1.64 1.63 25 40.75 1.63 – 1.62= .01 0.25
1.64 – 1.66 1.65 16
1.66 – 1.68 1.67 9
1.68 – 1.70 1.69 7
1.70 – 1.72 1.71 3
1.72 – 1.74 1.73 1
Total 100
Procedimiento:
162.96
a) Calculamos la media. X 1.62 metros
100
b) Calculamos las otras columnas de la tabla.
3.14
c) Aplicamos la ecuación (18). DM 0.0314
100
Este resultado dice que las estaturas se distribuyen en promedio en 0.0314 mts., a uno y
otro lado de la media. Como éste es un valor muy pequeño, se interpreta que los datos
están agrupados muy próximos a la media.
ACTIVIDAD DE REGULACIÓN
Esta información incluye el tiempo inactividad de algunas máquinas cuya falla ocurre
más de una vez al día.
38
32 63 52 62 35 34 74 53 64 80
51 55 48 60 76 51 35 44 45 54
33 45 61 53 21 68 85 60 77 61
42 67 34 53 45 47 52 68 52 69
73 61 55 65 62 54 41 59 53 50
26 58 82 74 41 70 38 50 47 35
36 67 43 28 56 79 84 49 36 65
82 22 62 55 72 68 40 37 78 43
65 73 57 39 46 57 56 60 50 88
45 56 75 40 51 70 74 76 48 59
2 2
Otras medidas que describen la dispersión de los datos son la varianza S ó y la
desviación estándar S o . Donde S es para una muestra y para una población.
Otra forma de eliminar el signo de las desviaciones es elevando al cuadrado cada una de
éstas, es decir:
Xi X X
2
i X . . . . . . . . . .. (19)
2
39
La ecuación (19) es el cuadrado de las desviaciones, estos valores nos permiten el
2
cálculo de la varianza de la muestra (S ) cuya ecuación matemática se da a
continuación.
n
X X
2
i
S2 i1
. . . . . . . . . . (20)
n 1
Donde:
Xi = enésimo elemento de la muestra
X = media de las observaciones
n = número de elementos de la muestra
n
X X
2
i = sumatoria del cuadrado de las desviaciones, desde la primera desviación
i1
i = 1 hasta la enésima i = n
X i
2
2 i1
. . . . . . . . . . . . (21)
N
1.2.3 LA VARIANZA
Ejemplo:
40
El procedimiento es el siguiente:
X1 X 2 .... X n 18
b) Calculamos la media X 1.8
n 10
c) Calculamos las desviaciones y las registramos en la tabla.
d) Calculamos el cuadrado de las desviaciones.
e) Con los datos de la tabla calculamos la varianza sustituyendo valores en la
n
X X
2
i
15.60 15.60
ecuación (20) S2 i1
1.73 2
n 1 10 1 9
2
La varianza de las jeringas rotas es de S = 2 toda vez que no podemos hablar de
fracciones de jeringa.
Sustituyendo los datos en la ecuación (20), obtenemos la varianza para cada agente de
ventas:
X X
2
i
S2 i1
n 1
S 2A = 14 S P2 = 35 S C2 = 39
El mayor valor de la varianza nos dice que hay mayor dispersión de los datos y esto lo
podemos constatar en las tablas.
La varianza de las ventas de Andrés es menor que las otras dos y de hecho, sólo un
valor se aleja de la media, los demás están simétricamente agrupados alrededor de ésta.
_____________________________________________________________________________
Cuando los datos están agrupados en una tabla de frecuencia, entonces el cuadrado de
cada desviación se multiplica por sus frecuencias, obteniéndose la siguiente ecuación:
f X X
2
i i
S2 i1
. . . . . . . . . . . . . . (22)
n 1
21. Tomamos los datos del ejemplo de las jeringas ( 19 ), los agrupamos en una tabla
de frecuencias y obtenemos:
42
2 2
Xi fi Xi X ( Xi X ) fi ( Xi X )
0 2 -1.8 3.24 6.48
1 2 -1.8 0.64 1.28
2 3 0.2 0.04 0.12
3 2 1.2 1.44 2.88
4 1 2.2 4.84 4.84
2
Con los datos de la tabla calculamos S aplicando la ecuación (22):
f X X
2
i i
15.6 15.6
S2 i1
1.73 2
n 1 10 1 9
2
S = 2 este valor significa que la varianza de las jeringas rotas es 2, toda vez que no
podemos hablar de fracciones de jeringa.
Cuando los datos están agrupados en clases, entonces la puntuación que se toma para
determinar la desviación de cada uno con respecto a la media, es la marca de clase M i,
obteniéndose la siguiente ecuación:
f M X
2
i i
S2 i1
. . . . . . . . . . . . (23)
n 1
Ejemplo:
22. Tomemos los datos del ejercicio VIII referente a la falla de la máquina que
constantemente está fuera de servicio. En este ejercicio debiste haber seguido este
procedimiento de cálculo:
43
Con esta información tomamos los valores de la tabla y los sustituimos en la ecuación
2
(23) para el cálculo de S .
Intervalo 2 2
Mi fi fi Mi Mi X ( Mi X ) fi ( Mi X )
de clase
20-29 24.5 4 98.0 -31.2 973.44 3893.76
30-39 34.5 12 414 -21.2 449.44 5393.28
40-49 44.5 18 801 -11.2 125.44 2257.92
50-59 54.5 26 1417 -1.2 1.44 37.44
60-69 64.5 20 1290 8.8 77.44 1548.80
70-79 74.5 14 1043 18.8 353.44 4948.16
80-89 84.5 6 507 28.8 829.44 4976.64
100 5570 2810.08 23056
M f
i1
i i
5570
Cálculo de la media: X 55.7
n 100
f M X
2
i i
23056 23056 2
Cálculo de la varianza: S2 i1
232.8 S = 233
n 1 100 1 99
La varianza de los tiempos en que la máquina está fuera de servicio por falla es de
2 2
S = 233 min .
Como puedes notar en el resultado, los tiempos están en unidades cuadradas por lo que
no nos da una idea precisa de los tiempos que la máquina está fuera de servicio toda
vez que las unidades de la varianza no coinciden con las unidades de los datos, por lo
que no podemos saber si la dispersión con respecto a la media es muy grande o
pequeña.
44
Su definición matemática es:
Datos no agrupados de una
n
muestra aleatoria.
X X
2
i
2 i1
S S . . . . . . . . . . . . . . . . . . . (24)
n 1
. . . . . . . . . . . . . . . . . . (27)
N
23. Calcula la desviación estándar del ejemplo anterior correspondiente a los tiempos
fuera de servicio de la máquina por descompostura.
R.-
2 2
S = 233 min . S S 2 233 15.26 S = 15.3
45
ACTIVIDAD DE REGULACIÓN
2. El bufete jurídico de una empresa envió cartas de cobranza a los clientes morosos
del mes de Junio. El primer día del mes envió 64, el segundo día 62 y los siguientes
días 51, 58, 83, 54, 57, 51, 42, 54, 74, 62, 47, 59, 51, 67, 53, 45, 58, 78, 69, 51, 72,
69, 78, 45, 64, 67.
Existe una forma simplificada para calcular la desviación estándar y para ello se aplican
las siguientes ecuaciones que se deducen a partir de las fórmulas de la varianza:
2
n n Xi
X i2
n
i1 i1
S . . . . . . . . . . . . . . . . . . . . (28)
n 1
46
Para datos agrupados sin clases.
2
n
fi X i2 n
fi X i
S fi
n
. . . . . . . . . . . . . . . . . . (29)
i1 i1
2
n
fi Mi2 n
fi Mi
S fi
n
. . . . . . . . . . . . . . . . . (30)
i1 i1
R.-
1. Secuencia de operaciones:
c) Determina la frecuencia.
d) Calculamos el producto fi Mi
e) Determinamos la media X .
f) Calculamos el producto fi Mi2
g) Calculamos el producto fi X i X
2
h) Calculamos Mi2
47
2. Aplicamos las fórmulas para datos agrupados, la general y la simplificada.
f M X
2
i i
Fórmula general S S2 i1
n
. . . . . . . . . . . . . . . . . (26)
f
i1
i
2
n
fi Mi2 n
fi Mi
Fórmula simplificada S fi
n
. . . . . . . . . . . . . . . . (30)
i1 i1
1 2 3 4 5 6 7 8 9
Mi X (Mi X) fi (Mi X)
2 2
Clase Mi fi fi Mi 2 2
Mi fi Mi
20-29 24.5 3 73.5 -31.9 1017.61 3052.83 600.25 1800.75
30-39 34.5 4 138.0 -21.9 479.61 1918.44 1190.25 4761.00
40-49 44.5 5 222.5 -11.9 141.6 708.05 1980.25 9901.25
50-59 54.5 10 544.0 - 2.0 4.0 40.0 2959.36 29593.60
60-69 64.5 12 774.0 8.1 65.61 787.32 4160.25 49923.00
70-79 74.5 5 447.0 18.1 327.61 1965.66 5550.25 33301.50
80-89 84.5 2 169.0 28.1 789.61 1579.22 7140.25 14280.50
42 2368 10051.62 143561.6
f M
i1
i i
2368
- Cálculo de la media X 56.4 X 56.4
f i
42
f M X
2
i i
10051.52
S S2 i1
n
S 239.32 15.46
42
f
i1
i
2
Si S = 15.46, entonces S = 239.32
48
Cálculo de la varianza y la desviación estándar con la fórmula simplificada, tomando
los valores de la columna 4 y 9.
2
n
fi Mi2 n
fi Mi
S fi
n
i1 i1
2
143561.6 2368
S = 3418.13 (56.38) 2 = 239.32 = 15.46
42 42
2
Si S = 15.46, entonces S = 239.32
El valor decimal se ha eliminado toda vez que no podemos pensar que estamos
entregando fracciones de computadora.
Para el cálculo de la desviación estándar con la ecuación simplificada, las columnas que
deben elaborarse son las tres primeras, la 8 y la 9.
Los resultados obtenidos en ambas ecuaciones, son exactamente los mismos por lo
tanto puedes usar para tus cálculos la que consideres que es más sencilla.
ACTIVIDAD DE REGULACIÓN
Para familiarizarte con la ecuación simplificada, repite los cálculos de los ejercicios
anteriores donde se obtuvo la desviación estándar y compara tus resultados.
Las medidas de posición y las medidas de variación son descripciones estadísticas muy
importantes, porque nos describen cómo se están agrupando o alejando los datos de
una distribución con respecto a las medidas de tendencia central. Existen otras maneras
de describir los datos estadísticos en forma más ilustrativa que un simple número que
describe todo un proceso y que finalmente su interpretación se hace más compleja. La
otra forma de analizar e interpretar los datos, es mediante su representación gráfica que
a continuación estudiaremos.
49
1.3 MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN EN
CURVAS DE FRECUENCIAS.
La representación gráfica de la distribución de frecuencias toma diferentes formas, más
ilustrativas y fácilmente identificables, que nos permite conocer y comparar los
estadísticos o parámetros visualmente.
a) Curvas simétricas.
b) Curvas asimétricas.
f f f
x x x
50
Analiza cada una de las gráficas y contesta las siguientes preguntas:
1. Expresa las características particulares de cada gráfica.
2. ¿Qué características son comunes a las tres gráficas?
R.-
1. Fig. 1. La Plarticúrtica presenta una zona casi horizontal en su punto máximo, su
puntiagudez es casi nula.
Fig. 2. La Lepticúrtica presenta un pico muy agudo.
Fig. 3. La Mesocúrtica es semejante a la curva normal de Gauss.
2. Como podemos ver, las tres gráficas son simétricas con respecto a la media y tienen
forma de campana.
X
i1
i X
X i
M1 . . . . . . . . . . . . . . . . . . (31)
n n
51
2. momento de segundo orden o varianza:
n
X X
2
M2 i1
i
X 2
i
S 2 . . . . . . . . . . . . (32)
n n
X X
3
M3 i1
i
X 3
i
. . . . . . . . . . . . . . . . (33)
n n
X X
4
M4 i1
i
X 4
i
. . . . . . . . . . . . . . . . . (34)
n n
5. Momento de orden m:
n
X X
5
M5 i1
i
X 5
i
. . . . . . . . . . . . . . . (35)
n n
f X X
m
i i
i1
Mm . . . . . . . . . . . . . . . . . . . . . (36)
n
M4
K 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (37)
M2 2
Donde:
M4 = Cuarto momento
M2 = Varianza
52
En el siguiente problema calcula los momentos sucesivos hasta el de cuarto orden y
determina el apuntamiento (K).
23. Se tomaron al azar 20 alumnos para determinar su aptitud en la lectura; para ello se
les dio a leer un texto de 100 palabras, habiéndose obtenido los siguientes tiempos
de lectura en segundos: 70, 78, 60, 58, 80, 70, 75, 78, 60, 65, 70, 85, 78, 80, 75, 60,
55, 58, 78.
R.
Elaboramos la siguiente tabla:
1 2 3 4 5 6 7 8 9 10
2 2 3 3 4 4
Xi fi fi Xi Xi - X (Xi - X) fi (Xi - X) (Xi - X) fi (Xi - X) (Xi - X) fi (Xi - X)
55 2 110 -14.4 207.36 414.72 2985.98 5971.96 42998.17 85996.34
58 2 116 -11.4 129.96 259.92 1481.54 2963.08 16889.60 33779.20
60 3 180 -9.4 88.36 265.08 830.58 2491.74 7807.48 23422.46
65 1 65 -4.4 19.36 19.36 85.18 85.18 374.80 374.80
70 3 210 0.6 0.36 1.08 0.22 0.66 0.13 0.39
75 2 150 5.6 31.36 62.72 175.61 351.22 983.45 1966.90
78 4 312 8.6 73.96 295.84 636.06 2544.24 5470.08 21880.32
80 2 160 10.6 112.36 224.72 1191.02 2382.02 12624.77 25249.54
85 1 85 15.6 243.36 243.36 3796.42 3796.42 59224.09 59224.09
251894.0
1388 1786.8 20596.52
4
f i1
i Xi
1388
X 69.4
n 20
M4 12594.7
K 3 K 3 1.57 3 K = 1.4
M2 2
89.342
53
El valor de K define la curtosis de la gráfica, tal que:
En nuestro ejemplo donde K = 1.4 significa que K < 0 por lo tanto si graficamos la tabla
de frecuencia, obtendremos una gráfica similar al de la figura 1 o sea una gráfica
platicúrtica.
ACTIVIDAD DE REGULACIÓN
Del siguiente problema calcula el valor de K e indica qué tipo de gráfica tiene. Interpreta
el resultado y expresa tus conclusiones.
1. De una guardería infantil se toma una muestra de 36 niños para determinar su altura.
Los resultados obtenidos en centímetros son:
63, 64, 64, 65, 65, 66, 66, 66, 67, 67, 67, 67, 67, 68, 68, 68, 69, 69,
69, 69, 69, 70, 70, 70, 71, 72, 72, 72, 72, 73, 73, 74, 74, 76, 76, 77.
Las curvas asimétricas son las que nos indican hacia donde se inclina la dispersión de
los datos.
54
Estas gráficas se caracterizan por la posición que guardan las medidas de tendencia
central. Podemos generalizar su presentación mediante las siguientes gráficas:
f
x
X
X = Mo = Me
Mo
X Mo = 0
Me
Figura 8.
x
X Me Mo
X < Me < Mo sesgo a la derecha
X Mo > 0
Figura 9.
x
Mo Me X
Mo < Me < X sesgo a la izquierda
X Mo < 0
Figura 10.
55
ACTIVIDAD DE REGULACIÓN
Analiza cada una de las gráficas anteriores y contesta las siguientes preguntas:
______________________________________________________________________________
______________________________________________________________________________
1.3.4 SESGO
X Mo
SG . . . . . . (37)
S
Donde:
X = Media.
Mo = Moda.
S = Desviación estándar
SG Sesgo de la gráfica.
56
De acuerdo con esta ecuación y analizando el numerador podemos definir el sesgo de la
gráfica de un conjunto de datos de la siguiente forma:
X Mo
0 Implica que la curva está centrada con respecto a
S las medidas de tendencia central (curva simétrica)
X Mo
0 Implica que la gráfica está sesgada a la derecha.
S
X Mo
0 Implica que la gráfica está sesgada a la izquierda.
S
Del siguiente problema calcula el apuntamiento (K) y el sesgo (SG), analiza tus
resultados e indica cómo es la gráfica y cómo se distribuyen los datos del problema.
26. El departamento del Distrito Federal recibió varias quejas del público sobre la
contaminación que produce la Planta de óxido de sulfuro. El Departamento envió un
equipo de expertos para investigar el problema.
17 , 15 , 20 , 29 , 19 , 18 , 22 , 25 , 29 , 9 ,
24 , 20 , 17 , 16 , 24 , 14 , 15 , 23 , 24 , 26 ,
19 , 23 , 28 , 19 , 16 , 22 , 24 , 17 , 20 , 13 ,
19 , 10 , 23 , 18 , 31 , 13 , 20 , 17 , 24 , 14 .
R.-
Secuencias de operaciones:
9 , 10 , 13 , 13 , 14 ,14 , 15 , 15 , 16 , 16 ,
17 , 17 , 17 , 17 , 18 , 18 , 19 , 19 , 19 , 19 ,
20 , 20 , 20 , 20 , 22 , 22 , 23 , 23 , 23 , 24 ,
24 , 24 , 24 , 24 , 25 , 26 , 27 , 28 , 29 , 31.
57
1 2 3 4 5 6 7 8 9
2 2 4 4
CLASE fi Mi Mi fi Mi - X (Mi - X) fi (Mi - X) (Mi - X) fi (Mi - X)
9-13 4 11 44 -9.125 83.3 333.2 6938.9 27755.6
14-18 12 16 192 -4.125 17.0 204.0 289.0 3468.0
19-23 13 21 273 0.875 0.76 9.95 0.58 7.6
24-28 9 26 234 5.875 34.5 310.5 1190.3 10712.3
29-33 2 31 62 10.875 118.3 236.6 13994.9 27989.8
Total 40 1094.3 69933.3
805
X 20.125
40
d) Calculamos los momentos de segundo y cuarto orden, para ello sustituimos los datos
de la tabla en las ecuaciones (33) y (35):
1094.3 69933.3
M2 27.36 M4 1748.3
40 40
e) Calculamos (K), para ello sustituimos los datos de la tabla en la ecuación (36):
1748.3
K 3 2.3 3 0.66 –0.7 K = –0.7
27.362
Este resultado nos dice que k < 0, por lo tanto la gráfica de la distribución es de tipo
platicúrtica.
1094.3
S 27.34 5.23 S 5.23
40
58
Para calcular el sesgo (SG) sustituimos los valores de Mo y S en la ecuación (37):
20.125 21
SG 0.167 SG = –0.2
5.23
Este resultado nos dice que SG < 0 lo cual implica que la gráfica esta cargada a la
izquierda, por lo tanto los datos del problema están dispersos hacia la izquierda de la
media.
ACTIVIDAD DE REGULACIÓN
13, 19, 22, 14, 13, 16, 19, 21, 23, 11, 27, 25, 17, 17, 13, 20
23, 17, 26, 20, 24, 15, 20, 21, 23, 17, 29, 17, 19, 14, 20, 20
10, 22, 18, 25, 16, 23, 19, 20
EXPLICACIÓN INTEGRADORA
En el primer tema vimos cómo los datos obtenidos pueden condensarse en un solo valor
central alrededor del cual todos los datos muestrales se distribuyen. Por esta razón, a
menudo se denomina un valor central como una medida de tendencia central.
Las medidas centrales utilizadas con mayor frecuencia son: la media, la mediana y la
moda. La medida central se emplea para localizar el centro de un conjunto de
observaciones, sin embargo, con frecuencia resulta igualmente importante describir la
forma en que las observaciones están diseminadas o dispersas a cada lado del centro.
A esta diseminación se conoce como dispersión. Una dispersión pequeña indica un alto
grado de uniformidad en las observaciones; una dispersión grande indica poca
uniformidad. Si un conjunto de observaciones no tiene dispersión, todas las
observaciones son idénticas. Sin embargo, tal uniformidad perfectamente virtual no existe.
En el segundo tema se consideran las técnicas, por lo general empleadas para medir la
dispersión de un conjunto de observaciones.
59
RECAPITULACIÓN
MEDIDAS DE
TENDENCIA CENTRAL
SG = 0 M2
M D
E I
MOMENTO DE VARIANZA D S
2o. ORDEN n I P
f M X
2
i i D E
MOMENTO DE 2 i1 A R
S
3er. ORDEN n S S
f
i1
i I
D Ó
MOMENTO DE E N
MESOCURTICA 4o. ORDEN
K=0 DESVIACIÓN
ESTÁNDAR
n 2
LEPTOCURTICA
K>0
C
U APUNTAMIENTO f M X
i 1
i i
R M4 S n
K
V
A
M22 f
i 1
i
PLATICURTICA SIMÉTRICAS
K<0
60
ACTIVIDADES DE CONSOLIDACIÓN
Con el fin de afirmar los conceptos que estudiaste en este fascículo, del siguiente
problema realiza lo que se indica:
60, 25, 47, 61, 54, 78, 36, 67, 40, 51, 49, 53, 44, 94, 51, 65, 55, 61, 48, 70,
42, 58, 69, 40, 51, 88, 54, 83, 79, 14, 13, 72, 57, 27, 46, 62, 43, 51, 82, 45,
64, 52, 71, 82, 53, 41, 65, 62, 75, 60, 49, 64, 40, 61, 73, 80, 71, 53, 36, 90,
60, 59, 41, 29, 86, 57, 61, 85, 44, 92, 27, 56, 39, 43, 54, 35, 59, 59, 89, 60,
61, 71, 53, 58, 26, 77, 68, 62, 62, 57, 48, 69, 76, 52, 49, 45, 54, 41, 77, 85.
61
AUTOEVALUACIÓN
13, 14, 25, 26, 27, 27, 29, 35, 36, 36, 39, 40, 40, 40, 41, 41, 41, 42, 43, 43, 44, 44,
45, 45, 46, 47, 48, 48, 49, 49, 49, 51, 51, 51, 51, 51, 52, 52, 53, 53, 53, 53, 54, 54,
54, 54, 54, 55, 56, 57, 57, 57, 58, 58, 59, 59, 59, 60, 60, 60, 61, 61, 61, 61, 62, 62,
62, 62, 62, 64, 65, 65, 67, 68, 69, 69, 70, 71, 71, 71, 72, 73, 75, 76, 77, 77, 78, 79,
80, 82, 82, 83, 85, 85, 86, 88, 89,90, 92, 94.
Clases: (10-19), (20-29), (30-39), (40-49), (50-59), (60-69), (70-79), (80-89), (90-99).
2. Tabla de frecuencias.
1 2 3 4 5 6 7 8 9
2 4 2
CLASE fi Mi Mi fi Mi - X (Mi - X) (Mi - X) fi (Mi - X) fi (Mi - X)
10-19 2 14.5 29 -43 1849 3418801 86 3698
20-29 5 24.5 123 -33 1096 1200361 165 5445
30-39 4 34.5 138 -23 529 279841 92 2116
40-49 20 44.5 890 -13 169 28561 260 3380
50-59 26 54.5 1417 3 9 81 78 234
60-69 19 64.5 1226 7 49 2401 133 931
70-79 12 74.5 894 17 289 83521 204 3468
80-89 9 84.5 760 27 729 531441 243 6561
90-99 3 94.5 283 37 1369 1874169 111 4107
Total 100 5760 6088 7419169 1372 29940
62
50 31
4. Cálculo de la mediana: Me 50 10 57.3
26
5760
5. Calculo de la media: X 57.6
100
6. Polígono de frecuencias:
26
24
22
20
18
16
14
12
10
8
6
4
2
1372
8. Cálculo de la desviación media: DM 13.7
100
29940
9. Cálculo de la varianza: S 2 299.4 u 2
100
29940 7419169
11. Cálculo del 2o y 4o momentos: M2 299.4 y M 4 74191.69
100 100
74191.69
12. Cálculo del apuntamiento: K 3 2.1.
299.42
La curva es platicúrtica, ya que K < 0.
57.6 54.5
13. Cálculo del sesgo: SG 0.2
17.4
63
ACTIVIDADES DE GENERALIZACIÓN
Clases fi
40 – 49 5
50 – 59 8
60 – 69 10
70 – 79 9
80 – 89 8
90 – 99 6
100 - 109 4
Total 50
Determinar:
a) Media, mediana y moda.
b) Desviación estándar y desviación media.
64
BIBLIOGRAFÍA CONSULTADA
G. HOEL, Paul. Estadística Elemental. Editorial CECSA. 2a. Impresión, México, 1976.
LINCOYAN P., Govinden. Curso práctico de Estadística. Editorial McGraw Hill. México,
1985.
MILLS R., Richard. Estadística para Economía y Administración. Editorial McGraw Hill.
Colombia, 1980.
65
COLEGIO DE BACHILLERES
ESTADÍSTICA DESCRIPTIVA
E INFERENCIAL I
INTRODUCCIÓN 5
PROPÓSITO 7
RECAPITULACIÓN 42
ACTIVIDADES DE CONSOLIDACIÓN 43
AUTOEVALUACIÓN 45
ACTIVIDADES DE GENERALIZACIÓN 46
BIBLIOGRAFÍA CONSULTADA 47
3
4
INTRODUCCIÓN
5
6
PROPÓSITO
En los fascículos anteriores de esta asignatura, has aprendido a utilizar eficazmente los
métodos más usuales para organizar, analizar y cuantificar los datos aportados por
observaciones estadísticas, todo ello dentro del contexto de la estadística descriptiva.
De esa manera, tienes ya un panorama general de los elementos básicos de esta rama
importante de la estadística paramétrica.
En este fascículo,
¿QUÉ APRENDERÁS?
¿CÓMO LO LOGRARÁS?
7
¿PARA QUE TE VA A SERVIR?
8
CAPÍTULO 1
CORRELACIÓN Y REGRESIÓN LINEALES
En las diferentes áreas del conocimiento existen problemas que requieren el análisis de
más de una variable, como por ejemplo; un sociólogo puede estar interesado en saber
qué clase de relación existe entre la tasa de delincuencia juvenil que hay en la
comunidad y el grado de hacinamiento de los hogares que allí se encuentran; un
profesor puede estar interesado en conocer de qué manera se puede predecir el
rendimiento en álgebra de un estudiante con base en el puntaje obtenido en una prueba
de aptitud en dicha asignatura; un psicólogo desea saber si existe alguna relación entre
el concepto que tiene un alumno de sí mismo y su promedio en el estudio; un agrónomo
desea conocer si existe relación entre la cantidad de lluvia caída y el rendimiento de
ciertos productos agrícolas, es decir, si es afectado desfavorablemente tanto por la
excesiva lluvia (humedad), como por la excesiva sequía del suelo.
Como te habrás dado cuenta, estas relaciones y muchas otras se pueden investigar por
medio del análisis de correlación y/o regresión, simples o lineales, si la relación está
limitada a dos variables (si fueran más de dos variables, este análisis de correlación y
regresión sería múltiple). En donde la correlación lineal tiene como objetivo principal
medir la intensidad de una relación lineal entre dos variables; la correlación lineal sirve
para medir la relación entre dos variables.
9
La siguiente tabla muestra las cantidades vendidas (y) por 15 vendedores de una
compañía en un periodo dado. La tabla también muestra el número de periodos (x) de
experiencia que cada vendedor tiene.
Tabla:
Mostraremos la relación entre estas dos variables, gráficamente, para que te des
cuenta de cómo están relacionadas estas variables. Más adelante, introduciremos el
coeficiente de Pearson, y una fórmula para calcularlo, que nos indicará el grado de
relación de estas variables.
Y (Monto de venta)
8
7
6
5
4
3
2
1
X (años de experiencia)
0
1 2 3 4 5 6 7 8 9 10
Gráfica No. 1
10
Este diagrama sugiere que a medida que los valores X aumentan, también los valores
Y aumentan. Además, parece que los puntos se agrupan a lo largo de una línea recta.
Por lo mismo decimos que hay una relación lineal entre las variables X y Y.
Correlación Positiva. Ocurre cuando al crecer (o decrecer) una de las variables, la otra
también crece (o decrece). Por ejemplo: a medida que se eleva el nivel de vida de una
población, tiende a aumentar el consumo de artículos que no son de primera
necesidad.
Correlación Negativa. Ocurre cuando al crecer alguna de las variables, la otra decrece
o viceversa. Por ejemplo: a medida que se amplían los sistemas de salubridad y
medicina preventiva, decrece el índice de mortalidad de las enfermedades infecto-
contagiosas.
En el ejemplo anterior (las ventas) tenemos una correlación positiva. Estas dos
correlaciones y otras más, se pueden mostrar utilizando los Diagramas de Dispersión,
de los que nos ocuparemos enseguida.
La forma más sencilla que tienen para predeterminar si existe o no correlación entre
dos variables es construir un diagrama de dispersión.
a) Cuando los puntos se van localizando en los ejes coordenados de manera que
veas que si los valores de la variable X aumentan y los valores de la variable Y
también aumentan, entonces existe una Correlación Lineal Positiva. Un ejemplo así
ocurre al correlacionar las edades del marido y de la mujer en las parejas
conyugales. En este caso a mayor edad del marido, mayor edad de la mujer.
11
Y Edad de la Mujer
X
Edad del Marido
Gráfica No. 2
Como vemos en el diagrama de dispersión anterior, conforme la edad del marido (X)
aumenta, aumenta la edad de la mujer (Y), por lo que tendremos una correlación lineal
positiva.
b) Si los puntos se localizan en los ejes coordenados y observas que los valores de la
variable X aumentan mientras que los valores de la variable Y decrecen, entonces
existe una Correlación lineal negativa. Un ejemplo así ocurre al correlacionar el
número de accidentes de trabajo acaecidos en un periodo de tiempo, con el
número de dispositivos de seguridad operantes en las plantas de una industria. En
este caso a mayor número de dispositivos de seguridad, menor número de
accidentes de trabajo.
Y Número de Accidentes
X
Número de Dispositivos de Seguridad
Gráfica No. 3
12
c) Cuando los puntos se localizan en los ejes de coordenadas y observes que su
relación no es lineal, es decir, aunque su patrón de dispersión está definido, estas
variables presentan una relación no lineal. Por ejemplo: al correlacionar la cantidad
de lluvia caída y el rendimiento de ciertos productos agrícolas, que es afectado
desfavorablemente tanto por la excesiva sequía, como por la humedad excesiva del
suelo, se tiene una correlación que se denomina Correlación Curvilínea.
3
Y m por hectárea
Correlación
Curvilínea
X
Precipitación Pluvial (mm)
Gráfica No. 4
X
(Número de cigarros diarios)
Gráfica No. 5
13
Los diagramas de dispersión que acabas de ver te muestran las diferentes relaciones
entre la variable independiente (X) y la variable dependiente (Y), por lo que podemos
señalar que si tanto los valores de X como los valores de Y tienden a seguir un patrón
recto, entonces existe una correlación lineal.
Ejemplo:
Considera el número de visitas como la variable (X) y el monto de los pedidos como la
variable (Y), construye el diagrama de dispersión correspondiente e infiere si existe
algún tipo de correlación.
Solución: La tabla de valores nos proporciona los pares para localizarlos en los ejes,
como se muestra en la siguiente gráfica. Verifica estas localizaciones.
14
Y Pedidos ($)
18
16
14
12
10
110 130 150 170 190 210 230 250 270 290 310
0 100 120 140 160 180 200 220 240 260 280 300 320
X
Número de visitas
Gráfica No. 6
Ejemplo:
Años de
Uso (X) 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
Número de
Exusuarios (Y) 8 6 9 4 6 5 3 2 4 3
15
Solución:
Y número de exusuarios
12
10
0
X
1 2 3 4 5 6
Año de uso
Gráfica No. 7
La tabla del ejemplo te facilitó la localización de los puntos en los ejes y confirmaste
que existe una correlación lineal negativa. A estas alturas te puedes dar cuenta de la
facilidad con que se construye este tipo de diagramas y se reconoce el tipo de
correlación que existe entre las variables.
Ejemplo:
ACTIVIDAD DE REGULACIÓN
Para cada uno de los siguientes enunciados, dibuja un diagrama de dispersión e infiere
qué tipo de correlación existe.
Puntaje de
58 54 67 64 66 73 70 85 74 85
satisfacción (Y)
Puntaje de
50 55 60 65 70 75 80 85 90 95
aptitud (X)
Puntaje de la
68 63 70 66 81 74 82 76 81 92 85
Oveja (Y)
Paso de la
60 64 68 72 76 80 84 88 92 96 100
Madre (X)
17
3) La siguiente tabla muestra el número de horas por semana que estudiaron diez
universitarios y su promedio de calificaciones acumulativas.
Promedio de
2.1 2.7 2.6 2.5 3.5 3.0 3.5 3.7 2.9 4.0
Calificaciones (Y)
Horas de
5 6 7 8 9 10 11 12 13 14
Estudio (X)
Tiempo gastado
30 30 40 40 50 50 60 60 60 70 70
en aprender (X)
5) La siguiente tabla muestra los resultados de una prueba para medir el nivel de
seguridad en sí mismo y de otra prueba para medir el nivel de madurez social de
15 estudiantes de preparatoria.
Puntaje de seguridad 5 10 15 15 20 20 25 25 25 32 40 37 45 35 50
en sí mismo (Y)
Puntaje de madurez 5 5 8 20 15 25 20 35 30 30 30 35 35 40 40
social (X)
18
La descripción gráfica se realiza mediante el diagrama de dispersión, el cual se
construye localizando los pares ordenados en el plano cartesiano. No olvides que la
disposición de los puntos en el plano X Y sugiere también el tipo de correlación entre
las variables de estudio. Con este tipo de diagramas y con el cálculo del coeficiente de
correlación r de Pearson, podemos decidir si la correlación es positiva (r > 0), negativa
(r < 0) o nula (r = 0).
Ahora que has aprendido a construir los diagramas de dispersión y a identificar cuándo
hay correlación (positiva y negativa), y cuándo no hay, podemos empezar a estudiar
cómo se calcula el Coeficiente de Correlación de Pearson.
n n n
n XY
X
Y
i1 i1 i 1
r
n n
2 n n
2
n
X 2
X
n
Y 2
Y
i1 i1 i1 i1
Por medio de ejemplos, veremos cómo se utiliza esta fórmula, para que puedas hacer
interpretaciones de este valor.
Ejemplo:
X 20 18 16 15 14 12 12 10 8 5
Y 12 16 10 14 12 10 9 8 7 2
19
Solución:
Se recomienda para hacer el cálculo directo del coeficiente r de Pearson, realizar una
tabla como la siguiente:
De la tabla, ves que en las columnas (1) y (2) se han escrito las puntuaciones
originales. En la columna (3) se obtuvieron los cuadrados de las puntuaciones X y en la
columna (4) los cuadrados de las puntuaciones Y. La columna (5) se forma con el
producto de cada X por cada Y, finalmente se suman los valores de las cinco columnas
y se sustituyen en la fórmula que ya conoces, obteniendo el siguiente resultado.
n n n
n XY
X
Y
i1 i1 i 1
r
n n
2 n n
2
n
X 2
X
n
Y 2
Y
i1 i1 i1 i1
1400
r
2594400
1400
r 0.869180
1610.7141
20
Ahora interpretaremos este valor. Para ello es necesario conocer las siguientes
características del coeficiente de correlación lineal.
Cuando no existe relación entre las dos variables, o sea cuando al variar la primera,
las variaciones de la segunda no reflejan dependencia o conexión alguna con las
variaciones de la primera, el coeficiente de correlación lineal es cero, entonces la
correlación es nula.
Lo anterior significa que, entre 0 y +1 cabe toda una gama de correlaciones positivas,
que serán tanto más directamente proporcionales, cuanto más se acerquen a +1.
Similarmente entre –1 y 0 cabe toda una gama de correlaciones negativas, que serán
tanto más inversamente proporcionales, cuanto más se acerquen a –1. Los coeficientes
de correlación, cuanto más cerca de cero, indican menor correlación.
Con todas estas características, podemos interpretar el resultado que calculamos del
coeficiente r de Pearson. Como r = 0.869180 podemos concluir que la correlación es
fuerte y positiva.
Con base a las características del coeficiente de correlación lineal (r) de Pearson, se
muestra a continuación una tabla que indica cuándo una correlación lineal es débil,
fuerte, positiva o negativa.
Tabla Significado de
21
Como puedes observar, lo único tedioso es la tabla, pero ésta concentra los resultados
para obtenerlos con cierta facilidad. Te invito a que resuelvas el siguiente ejemplo sin
ver los resultados, salvo te aparezcan dudas, ¡inténtalo!
Ejemplo:
Retomemos los valores utilizados del ejemplo de las visitas realizadas y los pedidos
hechos por diez vendedores de un Departamento de Ventas, ¿lo recuerdas?, te
mostraré la tabla de valores que utilizamos; calcula el coeficiente r de Pearson.
Solución:
Recuerda que para facilitar este cálculo, se puede elaborar una tabla para mostrar los
totales, la cual está a continuación de la tabla de datos, como observas.
22
Ahora procedemos a sustituir en la fórmula del coeficiente de correlación de Pearson, r:
10 (23546.6) 213200
r 0.9
10 (465366) 4202500 10 (1217.22) 10816
ACTIVIDAD DE REGULACIÓN
23
Con estos resultados calcula los coeficientes de correlación r de:
a) Todo el grupo.
b) El grupo de recién ingresados.
c) El grupo de mayor antigüedad.
¿Qué conclusiones obtienes de los incisos anteriores?
24
4) La siguiente tabla muestra los valores obtenidos en asistencia a juntas tanto para
hombres como para mujeres.
Asistencia a juntas
Hombres (X) Mujeres (Y)
10 8
10 7
9 7
9 6
8 5
7 6
7 5
7 4
6 4
6 3
5 4
5 3
4 4
4 3
3 2
5) Los siguientes pares de valores representan las dimensiones en cms. de las hojas
del árbol del fresno: (2,1), (3,2), (2,3), (3,3), (4,3), (3,5), (5,5) y (6,7)
Si se conoce la anchura (X) y la longitud (Y) de las hojas, ¿habrá alguna relación
entre estas dos variables?, y si la hay, ¿ésta es fuerte o débil? Realiza los cálculos
adecuados para que contestes estas preguntas.
EXPLICACIÓN INTEGRADORA
25
1.2 REGRESIÓN LINEAL
Ahora que has analizado el grado de relación que existe entre dos variables
estadísticas (datos bivariados), a través del cálculo del coeficiente de correlación de
Pearson, es importante dar un contexto adecuado al tema de Regresión Lineal, con el
objeto de ubicar correctamente algunos de los conceptos que se utilizarán en el
proceso de predicción estadística. Es probable que hayas escuchado una expresión
tan popular como “para muestra basta un botón”, que ilustra muy bien lo que sucede en
la inferencia estadística. El proceso inferencial consiste en obtener información acerca
de una Población de objetos cuantitativos (datos), a partir de información contenido en
una parte de esta población llamada Muestra. Cabe preguntarnos ¿por qué no utilizar
todos los datos de una Población? Pongamos por ejemplo que un especialista desea
información acerca de las dimensiones de las alas de la mariposa Monarca que
anualmente hace una emigración desde Canadá hasta México. ¿Será posible estudiar
todas y cada una de las mariposas monarcas que llegan cada año a nuestro país?
Desde luego que no, pues ello implica un enorme gasto de recursos humanos y
materiales entre otros, cosa que haría prácticamente imposible el estudio. Para llevar
adelante su investigación el especialista tomaría una muestra de la población, mediría y
analizaría estadísticamente los datos que le interesan y apoyándose en un modelo
matemático adecuado trataría de deducir las características esenciales de toda la
población de mariposas. Este modo de proceder del especialista lo realizamos todos
cotidianamente, aunque no de manera tan rigurosa. Por ejemplo, una ama de casa en
el supermercado quiere comprar naranjas y sabe por experiencia que no siempre las
más grandes son las más jugosas, escoge unas cuantas para observar su peso,
consistencia, madurez y si es posible prueba una de ellas, sólo después de hacer estas
operaciones toma una decisión. Al hacerlo no fue necesario que probara todas las
naranjas que había en el aparador o en la bodega o en la huerta del productor que
provee al supermercado, sólo le bastó una muestra.
Estas y otras preguntas tratarán de ser contestadas en los siguientes párrafos, a fin de
que puedas usar el modelo estadístico de Regresión Lineal para hacer deducciones o
predicciones estadísticas. Las respuestas a cada una de ellas si bien no serán
definitivas sí serán válidas para nuestro análisis, mismo que deberá ser ampliado y
profundizado en estudios posteriores.
26
Dentro de las aplicaciones de la estadística, podemos encontrar problemas que tienen
que ver con procesos de planeación en la administración de recursos materiales y
humanos, tal es el caso del ejemplo que a continuación te presentamos.
Tabla
El conjunto de datos que incluye la tabulación, los llevaremos al plano cartesiano para
obtener la gráfica siguiente:
35
30
25
20
15
10
X
2 4 6 8 10 12 14
Gráfica No. 8
27
Los valores de las variables X y Y forman parejas ordenadas (x,y) susceptibles de ser
graficadas en el plano cartesiano. Al exhibir gráficamente los datos de la tabla No. 1
obtenemos el Diagrama de Dispersión. De la tabulación se puede considerar que al
haber pares ordenados (x,y), teóricamente puede existir una relación Funcional entre
las variables X a la que llamaremos variable independiente e Y a la que llamaremos
variable dependiente suponiendo que el problema es saber ¿cómo varía Y en función
de X? Para hacer esto más claro, te pedimos que apoyándote en la tabulación y en la
gráfica escribas en el siguiente cuadro ¿cuánto esperarías que vendiera un aspirante
con tres años de experiencia?, ¿cuánto si tiene siete u ocho años en ventas?
Como te habrás dado cuenta, lo que hiciste para contestar las preguntas anteriores fue
apoyarte en la observación de datos conocidos y en tu experiencia, es decir, has hecho
una estimación empírica a partir de cierta información estadística. Esta forma de
proceder ha sido la base del desarrollo de la estadística moderna, pues de esa manera,
los procesos prospectivos o de planeación a futuro tienen una fundamentación teórica
basada en observaciones hechas con anterioridad. Volveremos a este ejemplo para
proponer un método general de análisis, que nos permita hacer predicciones
estadísticas consistentes. Pero ahora te pedimos que analices el siguiente caso donde
encontrarás nuevas interrogantes.
Una Empresa de publicidad, ha sido contratada para llevar a cabo una campaña para
disminuir el consumo de bebidas alcohólicas entre la juventud. Los planificadores de la
empresa estiman que el consumo disminuirá si incrementan el número de anuncios
televisivos con el eslogan “sin alcohol la vida es más placentera”. Para verificar esta
hipótesis toman una muestra de diez personas al azar y hacen una encuesta que arroja
los siguientes resultados:
Tabla No. 9
28
Construye el diagrama de dispersión correspondiente a los valores tabulares tomando a
“x” (variable independiente) como el número de anuncios de T.V. y a “y” (variable
dependiente) como el número de copas ingeridas por persona y compáralo con el que a
continuación te mostramos.
Y Copas ingeridas
8
7
6
5
4
3
2
1
0 X Anuncios en T.V.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Gráfica No. 10
Por el texto del problema, nos percatamos de que los planificadores de esta Empresa
desean analizar teóricamente, la variación entre el consumo de alcohol y el número de
anuncios vistos por el público, tomando como variable independiente o de entrada este
número de anuncios (X) y como variable dependiente o de salida el número de copas
de bebida ingeridas en una fiesta (Y). Ilustramos esto mediante el siguiente esquema:
( X) proceso (Y)
empírico
(No. anuncios) (No. copas)
Esquema No. 1
ACTIVIDAD DE REGULACIÓN
29
2. ¿Se puede aumentar indefinidamente el número de anuncios para garantizar que
una mayor población consuma menos alcohol? Explica.
__________________________________________________________________________
4. ¿Qué método propones para comprobar el impacto del anuncio publicitario con
relación al consumo de bebidas alcohólicas? Explica.
__________________________________________________________________________
30
1. BIOLOGÍA. El crecimiento de una cierta especie de alga marina al aplicarle cierta
dosis de líquido proteínico.
Y (cm)
X (ml)
Gráfica No. 11
Y ($)
X (años)
Gráfica No. 12
31
3. PSICOLOGÍA. La cantidad de fechas memorizadas-recordadas por un sujeto y el
número de días transcurridos.
Y (por fechas)
X (días)
Gráfica No. 13
Y (latidos)
X (edad)
Gráfica No. 14
32
Como ya se mencionó, las curvas trazadas sobre el diagrama de dispersión son
llamadas Curvas de ajuste y como se puede notar tienen distintas formas geométricas
dependiendo del tipo de modelo que la define. Así por ejemplo, tenemos que si
y f ( x ) es la ecuación de predicción, entonces:
f(x) = a + bx es lineal.
2
f(x) = ax + bx + c se llama cuadrática.
x
f(x) = a(b ) se llama exponencial.
f(x) = a logb x es logarítmica.
Si se trata del modelo lineal, entonces la gráfica es una recta a la que llamaremos:
Recta de ajuste o Recta de regresión. En todo caso, los puntos registrados en el
diagrama de dispersión sugieren el tipo de función de regresión que se debe utilizar.
Ver las siguientes figuras:
Y Y
Recta de ajuste
Recta de ajuste
X X
Desde luego que encontrar la expresión de esta función, no siempre es sencillo, por lo
que, se propone el modelo de la ecuación lineal:
y = a + bx
Es tiempo de contestar las preguntas básicas, ¿cómo encontrar las rectas de ajuste
para un problema en particular?, ¿qué criterio se debe utilizar para asegurar la recta de
mejor ajuste?
33
El ejemplo siguiente, nos muestra un método de trazo rápido (“mano alzada”) de la
recta de ajuste sobre el diagrama de dispersión. No olvidemos que al trazar la recta,
ésta coincidirá con algunos puntos pero en general habrá puntos que se encuentren
arriba o debajo de la recta. Observa la gráfica del siguiente ejemplo.
Ejemplo:
X Y
0 2
1 4
2 3
3 6
4 5
5 7
6 9
7 8
Tabla
10 (6,9)
8 (5,7)
(3,6) (7,8)
6
(1,4)
4 (4,5)
(0,2) (2,3)
2
0 X
1 2 3 4 5 6 7
Gráfica No. 17
+1
-1
0.7
Gráfica No. 18
¿Puede disminuirse la suma de las distancias que hay entre los puntos y la recta de
ajuste? Explica. ______________________________________________________________
______________________________________________________________________________
Cabe mencionar, que la recta trazada puede no ser la de mejor ajuste, entonces ¿cómo
encontrar la de mejor ajuste? Analicemos qué pasa si las distancias (y - y ) son tan
pequeñas como sea posible, es decir, que estas distancias estén cerca de cero.
¿Cómo varía el cuadrado de la diferencia cuando ésta tiende a cero? Observa los
siguientes ensayos hipotéticos.
2 2
Si ( y – y ) = 0.25 entonces ( y – y ) = (0.25) = 0.0625
2 2
Si ( y – y ) = 0.12 entonces ( y – y ) = (0.12) = 0.0144
2 2
Si ( y – y ) = 0.6 entonces ( y – y ) = (0.06) = 0.0036
Como te habrás dado cuenta, cuando las diferencias ( y – y ) son cada vez más
cercanas a cero, el valor del cuadrado de la diferencia también tiende a cero. Esto es
muy importante, ya que si esta diferencia al cuadrado la asociamos a un cierto valor de
ERROR en la predicción entonces decimos que la Curva de mejor ajuste es aquella
en donde la suma de los errores cuadráticos es mínima. Es decir:
35
2
Si al valor ( yi – y i ) lo llamamos ERROR (el error es la diferencia al cuadrado entre un
valor tabular (yi) y su respectiva predicción ( y ) entonces la curva de regresión óptima
será la que cumpla con un:
2
Donde: di = ( yi – y i )
Los resultados anteriores nos inducen a pensar por un lado, que existe una recta que
minimiza las distancias que hay entre ésta y los puntos del diagrama de dispersión y
por otro, que la diferencia entre los puntos registrados y la recta nos ofrece una medida
de la “bondad” de la recta de regresión como instrumento de predicción estadística. En
otras palabras, si la diferencia ( y – y ) entre la recta y cada uno de los puntos de la
tabulación es mínima entonces se tendrá un mejor modelo de predicción. Para
determinar este párrafo, diremos que, a cada valor de la tabulación le corresponderá un
valor de predicción obtenido por la ecuación de regresión:
y = a + bx (1)
2
y1 y1 y1 – y 1 ( y1 – y 1 )
2
Y2 y2 y2 – y 2 ( y2 – y 2 )
2
Y3 y3 y3 – y 3 ( y3 – y 3 )
Diferencia al cuadrado
2
yn yn yn – y n ( yn – y n )
n 2 2 2 2
D y i y i y 1 y 1 y 2 y 2 . . . y n y n
i1
(2)
36
Si sustituimos la ecuación de predicción y = a + bx (1) en la ecuación de error (2)
tenemos:
n 2 n
D y i y i
i1
y
i1
i a bx i
y
n
2
i a bx i (3)
i1
Como te darás cuenta, los valores xi y yi son valores incluidos en la tabulación, por lo
tanto, el error mínimo (D) sólo depende de los valores que tomen los parámetros a y b
que determinan la recta de regresión o predicción. Esto nos conduce a una
conclusión sorprendente, pues el problema de calcular la recta de regresión o
predicción se reduce a calcular los valores de a y b para los cuales el valor del error (D)
es mínimo.
Hasta aquí, hemos preparado el terreno para desarrollar el método general para
encontrar la Recta de regresión, al que llamaremos Método de Mínimos Cuadrados.
Retomaremos la tabulación del ejemplo No. 1, para observar cómo se calcula la recta
de regresión, a la que también llamaremos: Recta de mínimos Cuadrados. En este
2 2
cálculo utilizaremos los valores cuadráticos x , y y xy, así como también las
2
sumatorias correspondientes xi , yi y xi que ya habías utilizado para el cálculo del
coeficiente de correlación (r).
2 2
X Y X Y XY
2 12 4 144 24
4 18 16 324 72
5 25 25 625 125
3 23 9 529 69
4 27 16 729 108
6 19 36 361 114
10 32 100 1024 320
12 26 144 676 312
46 182 350 4412 1144
37
Número de parejas ordenadas n = 8
Promedio de X = x =
x
n
Promedio de Y = y =
y
n
b=
1/ n xy xy
(Pendiente de la recta) (2)
1/ n x 2 (x)2
Si suponemos que el punto ( x , y ) satisface la ecuación de regresión y = a + bx
entonces: y =a+b x
Solución:
x=
n = 46 = 5.75 y=
y = 182 = 22.75
n 8 n 8
38
Ahora, calculamos la ordenada al origen, mediante la ecuación (3).
y = 16.2 + 1.14x RECTA DE MÍNIMOS CUADRADOS
n xy x y
b (4)
n x x
2 2
yp = y + b ( x – x ) (5)
yp = 22.75 + 1.1403(x-5.75)
yp = 22.75 + 1.1403x – 6.5570
yp = 16.192 + 1.1403x
39
Aún cuando no se mencionó al principio de este problema, nosotros esperaríamos que
un vendedor con más experiencia vendería más que un vendedor con menos
experiencia, los resultados anteriores corroboran esta suposición, ya que según nuestro
modelo, un vendedor con 11 años de experiencia vende más que uno que tiene sólo 3
años en ventas. Por otro lado, si copiamos la gráfica de dispersión del ejemplo 1 y
sobre ésta trazamos la recta que une los dos puntos estimados entonces tenemos el
diagrama completo.
30 Recta de mínimos
cuadrados
(11,28.74)
25
(2,19.62)
20
15
10
X
2 4 6 8 10 12 14
Gráfica No. 19
y = 16.2 + 1.14 x
al sustituir x obtenemos:
y = 16.2 + 1.14 x
lo que es el valor de y
40
Que se puede observar en la gráfica siguiente:
30
25
22.75 (5.75,2275)
20
X, Y
15
10
Gráfica No. 20
Una vez que has desarrollado estos conceptos, te recomendamos que calcules las
ecuaciones de regresión de los ejemplos 2 y 3 de este tema con el fin de que
practiques el desarrollo del método de mínimos cuadrados.
EXPLICACIÓN INTEGRADORA
Hasta aquí hemos visto la regresión lineal, tomando los datos de dos distribuciones y
graficándolos en un plano cartesiano, además trazando la recta de mejor ajuste a sus
coordenadas para poder predecir el tipo de regresión y el valor de una variable
dependiente en función de otra variable llamada independiente, encontrando el modelo
de función lineal por medio del método de los mínimos cuadrados, para determinar el
tipo de regresión (positiva o negativa), por último a través de la resolución de problemas
que se puedan modelar con la función lineal, para describir el comportamiento del valor
de dos variables de dos distribuciones distintas y observar cómo están relacionada a fin
de utilizar una para predecir la otra.
41
RECAPITULACIÓN
REGRESIÓN ESTADÍSTICA
PAREJAS ORDENADAS
TABULACIÓN
GRÁFICA DE DISPERSIÓN
RECTA DE REGRESIÓN
O PREDICCIÓN
MÉTODOS DE MÍNIMOS
CUADRADOS
b
n xy x y
n x x
2 2
y = a + bx
a= y +b(x– x )
yP= x +b(x- x )
GRÁFICA
42
ACTIVIDADES DE CONSOLIDACIÓN
Para reafirmar los conocimientos que adquiriste sobre los temas de Correlación y
Regresión Lineales al estudiar este fascículo, te sugerimos realizar las siguientes
actividades:
1. Los siguientes datos muestran el número de horas (x) dedicadas a estudiar para un
examen y la calificación (y) obtenida en dicha prueba. Observa en el diagrama de
dispersión si existe alguna correlación lineal y en caso de que así sea, calcula el
coeficiente de correlación de Pearson (r).
x (horas-estudio) 2 3 3 4 4 5 5 6 6 6 7 7 7 8 8
y (calificación) 5 5 7 5 7 7 8 6 9 8 7 9 10 8 9
2. Se realizó un estudio para investigar la relación que existe entre el peso (x) en
libras (lb), la presión sanguínea (y), de adultos varones cuyas edades oscilan entre
19 y 30 años. Se obtuvieron los siguientes resultados.
x(lb) 173 178 145 146 157 175 173 137 199 131 152 172 163 170 135 159
2
y(lb/pul ) 76 76 74 70 80 68 90 70 96 80 90 72 76 80 68 72
Puntaje de auto-
5 6 6 7 8 8 8 9 9 9 10 10 11 12
concepto (y)
Puntaje iniciativa
5 6 8 7 9 11 12 11 12 14 14 16 15 17
personal (x)
4. De acuerdo con lo que has desarrollado en este fascículo, contesta las preguntas
que se encuentran al inicio del tema de regresión y coméntalas con tu profesor o
asesor.
43
5. En una de las Secretarías del gobierno federal se ha implantado el sistema de retiro
voluntario. Para analizar dicho proceso se toma una muestra aleatoria en los
distintos departamentos, donde se relaciona el número de empleados que han
renunciado y el número de años de servicio. Se pretende estimar cuántos
trabajadores renunciarían en función de su antigüedad. Se obtuvieron los
siguientes datos:
El modelo bivariante, páginas 339-347 del libro Estadística con aplicaciones a las
Ciencias Sociales y a la educación por W.W. Daniel, de la bibliografía.
44
AUTOEVALUACIÓN
Soluciones:
1) El diagrama de dispersión lo dejamos para que los compares con tus compañeros y
cambies impresiones. El cálculo de r redondeado a tres cifras, da como resultado
0.741.
Para el tema de Regresión Lineal, se sugiere elaborar un ensayo acerca de los puntos
esenciales del tema, de manera que el profesor o asesor observe el manejo de éstos.
45
ACTIVIDADES DE GENERALIZACIÓN
5. Comprueba que la recta y = a + bx puede expresarse como Y = y + b(x - x ).
Te sugerimos encuentres la recta de regresión de los ejemplos desarrollados
durante el fascículo, con esta relación).
46
BIBLIOGRAFÍA CONSULTADA
Este texto cubre el 100% del programa, manejando el enfoque del mismo. Sobre
el tema incluye una variedad de ejemplos prácticos que permiten una visión
amplia en este terreno.
Este texto cubre el 90% del programa, siguiendo el enfoque del mismo. Con
relación al tema su tratamiento es muy adecuado.
Este libro aborda el tema de manera muy adecuada, incluye ejemplos muy
ilustrativos.
Este texto cubre el 80% del curso. El tratamiento de los temas es muy claro,
además de que incluye ejemplos de aplicación práctica.
47
COLEGIO DE BACHILLERES
ESTADÍSTICA DESCRIPTIVA
E INFERENCIAL I
FASCÍCULO 4. INTRODUCCIÓN A LA
PROBABILIDAD
1
2
ÍNDICE
INTRODUCCIÓN 5
PROPÓSITO 7
1.1.1 EXPERIMENTOS 11
1.1.3 EVENTOS 13
3
1.3 CÁLCULO DE PROBABILIDADES:
PROCEDIMIENTOS ELEMENTALES DE
CONTEO 39
RECAPITULACIÓN 49
ACTIVIDADES DE CONSOLIDACIÓN 50
AUTOEVALUACIÓN 52
ACTIVIDADES DE GENERALIZACIÓN 55
BIBLIOGRAFÍA CONSULTADA 56
4
INTRODUCCIÓN
Si volteamos a nuestro alrededor nos daremos cuenta que nuestra vida está llena de
afirmaciones que llevan implícito el concepto de probabilidad, como por ejemplo: los
pronósticos meteorológicos nos indican las probabilidades de lluvia; los médicos nos
dicen qué probabilidades hay de que nuestras enfermedades se curen por medio de
determinados tratamientos terapéuticos; los profesores, en la escuela, especulan sobre
nuestras posibilidades de éxito en el bachillerato; el Sr. Cruz, la posibilidad de obtener el
primer premio de la lotería, etc.
Para lograr y facilitar la comprensión del contenido de este fascículo, iniciaremos con un
bosquejo histórico de la probabilidad señalando las causas y motivos que promovieron
su creación. Definiremos lo que es un Experimento, lo que es un Evento; conocerás el
concepto de espacio muestral y las propiedades de la frecuencia relativa; ésta última
servirá como base para definir la probabilidad de ocurrencia de un evento. Todo lo
anterior nos permitirá abordar el cálculo de probabilidad de eventos excluyentes, así
como la probabilidad condicional para llegar a la probabilidad de eventos
independientes. Además, veremos que cuando se calculan probabilidades, se debe
determinar el número de veces que ocurre un evento de interés. Después, estudiaremos
las técnicas de conteo para conocer las probabilidades de ocurrencia en diversos
problemas.
Todo lo anterior te servirá como base para estudiar los temas de la siguiente asignatura
EDIN 2 y las distribuciones probabilísticas.
5
6
PROPÓSITO
El mundo real está lleno de incertidumbre. Las situaciones que implican incertidumbre
varían de simples juegos de azar a campos como el de las Ciencias Físicas, Ciencias
Sociales, industria y seguros.
¿QUÉ APRENDERÁS?
¿CÓMO LO LOGRARÁS?
7
8
CAPÍTULO 1
ELEMENTOS DE LA PROBABILIDAD
Los jugadores a lo largo de la historia siempre han recurrido a las probabilidades para
realizar sus apuestas. Aproximadamente por el año 3500 A.C., juegos de azar
practicados con objetos de hueso, que podrían ser consideradas como los precursores
de los dados, fueron ampliamente desarrollados en Egipto y otros lugares. Dados
cúbicos con marcas virtualmente idénticas a los dados modernos se han encontrado en
tumbas egipcias que datan del año 2000 A.C. Sabemos que el juego con dados ha sido
popular desde esa época y que fue parte importante en el primer desarrollo de la Teoría
de la Probabilidad.
Se considera que por el siglo XVII de nuestra era un noble francés, llamado Antonie
Gombauld (1607-1684) puso en tela de juicio el fundamento matemático del éxito y del
fracaso en las mesas de juego. Gombaulod formuló esta pregunta al matemático francés
Blaise Pascal (1623-1662): ¿Cuál es la probabilidad de que salgan dos seises por lo
menos una vez en veinticuatro lanzamientos de un par de dados? Pascal resolvió el
problema, pues la Teoría de la Probabilidad empezaba a interesarle tanto como a
Gombauld.
9
Ambos compartieron sus ideas con el famoso matemático Pierre de Fermat (1601-1665).
Las cartas escritas por los tres constituyen la primera revista académica dedicada a la
Teoría de la Probabilidad. Sin embargo, probabilidades numéricas para ciertas
combinaciones de dados ya habían sido calculadas por Girolamo Cardano (1501-1576) y
por Galileo Galilei (1564-1642).
Las situaciones que dieron origen al uso del término Probabilidad (problemas
relacionados con la probabilidad) aparece alrededor del año de 1650, cuando sugerido
por los juegos de dados, de cartas, del lanzamiento de una moneda se planteó la
cuestión de determinar la probabilidad de ganar una partida. De esta manera surgieron
los fundamentos del cálculo de probabilidad; Fermat y Pascal, esquematizando las
cuestiones propuestas, dieron en 1654 la primera definición de probabilidad.
10
1.1 FRECUENCIA RELATIVA
1.1.1 EXPERIMENTOS
La Teoría de la Probabilidad tiene que ver con los diversos resultados posibles que
pueden obtenerse y los posibles sucesos que podrían ocurrir cuando se realiza un
experimento. El término experimento se utiliza en la teoría de la probabilidad para
describir virtualmente cualquier proceso cuyos resultados no se conocen de antemano
con certeza. Entonces, un experimento es el proceso mediante el cual se obtiene
una observación (o una medición) de un fenómeno.
Por ejemplo:
Otro experimento aleatorio es el siguiente. Al lanzar un dado legal, los resultados que se
obtienen pueden ser cualquier número del 1 al 6.
11
ACTIVIDAD DE REGULACIÓN
Para reafirmar lo anterior, señala en los siguientes casos cuales son experimentos
aleatorios y cuales determinísticos, si tienes alguna duda, acude con tu profesor o asesor
para que la aclares.
Enunciados:
Antes de desarrollar este tema recordaremos qué es una Muestra: Una Muestra es un
conjunto de medidas u observaciones tomadas a partir de una población dada.
S = 1, 2, 3, 4, 5, 6
12
Otro ejemplo es, si realizamos el experimento; si lanzamos dos monedas al aire,
observamos que los posibles resultados pueden ser: aparecen dos soles; aparece un sol
una águila, aparece una águila y un sol o aparecen dos águilas; por lo que el espacio
muestral es:
Otro ejemplo es, si realizamos el experimento; se lanzan dos dados, los posibles
resultados al observar el número de puntos en ambas caras de los dados es el siguiente
espacio muestral:
1.1.3 EVENTOS
Con base a los experimentos anteriores (lanzar un dado, lanzar dos monedas y lanzar
dos dados), observamos que éstos pueden tener uno o más resultados, a los cuales se
les llama “Eventos” y que se representan mediante letras mayúsculas. Por ejemplo, si un
experimento consiste en registrar el número de los nuevos pedidos que recibe un
fabricante, algunos eventos son los siguientes:
Podríamos hacer una lista de muchos eventos asociados con el experimento, algunos
con más posibilidad de ocurrir que otros. Desde el punto de vista de conjuntos, un
evento es un subconjunto de un espacio muestral.
13
Por ejemplo, en el experimento de tirar un dado se tiene:
{2,4} es un evento
{1,2,3} es un evento
{1, 2, 3, 4, 5, 6} es un evento
f
P (A)
N
14
ACTIVIDAD DE REGULACIÓN
1. Determina el espacio muestral y cada uno de los eventos que se indican del
experimento de lanzar dos dados y observar el número de puntos en ambos y
determinar.
Frecuencia
Evento f
Relativa
A (sol) 90
90 0.3
300
210
B (águila) 210 0.7
300
15
Con las frecuencias relativas 0.3 y 0.7 del ejemplo anterior, se puede concluir que cerca
de 30 por 100 de las veces que la moneda se tira ocurrirá el evento A (sol); es decir, la
probabilidad de ocurrencia de A (sol) es de 0.3.
El espacio muestral es, S 1
, 2
,
3,
4,
5, 6
, 7
, 8
,
9, 10
, 11
,12
3 Sec 2 Sec 1 Sec
16
b) Si B es el evento “seleccionar un estudiante de 2do. semestre de
bachillerato”, entonces:
0
B = = Ø por lo que P (B) 0
12
Solución: 1
a) evento A, que salga un dos es; A = 2, por lo que: PA
6
Las propiedades anteriores de la Frecuencia Relativa son muy importantes, por lo que es
necesario que las aprendas.
17
ACTIVIDAD DE REGULACIÓN
Requiere anteojos Si No
Si 0.44 0.14
No 0.02 0.40
18
1.2 NOCIONES DE PROBABILIDAD
Probabilidad Clásica:
Esta definición es útil para resolver problemas de juegos de azar para los cuales se creó
originalmente la teoría de la probabilidad.
19
Ejemplo: 3) ¿Cuál es la probabilidad de obtener sol al lanzar una moneda?
NE eventos favorables 1
PE
N número de casos posibles 2
1
¿Sabes porqué al calcular la probabilidad de obtener un águila también es ?
2
NE 1
P E
N 6
20
Ejemplo: 5) ¿Cuál es la probabilidad de obtener un as de una baraja de 52 cartas?
número de bolasrojas 3 1
entonces: P R
número de bolasen la urna 12 4
b) Sea B el evento “sacar bolas blancas”, B = B1, B2, B3, B4, B5,
número de bolasblancas 5
entonces: PB
número de bolasen la urna 12
número de bolasazules 4 1
entonces: PA
número de bolasen la urna 12 3
NE NE
PE Expresión algebraica de la probabilidad.
N n
21
donde:
NE número de éxitos
(Probabilidad según la frecuencia relativa)
n número de resultadosposibles
Ejemplo: 7) Un equipo de fútbol de primaria está integrado por 4 alumnos de sexto año,
4 de quinto año, y 3 de cuarto año. Si se elige a un estudiante al azar para
ser capitán, ¿cuál es la probabilidad de que sea:
3
b) de cuarto año?: B = {tres alumnos}, entonces P (B) =
11
en el inciso (a), te das cuenta que no hay alumnos de segundo año en el equipo de
fútbol, es decir, el conjunto de segundo año es vacío [Ø], porque no hay elementos.
Para (b), el conjunto tiene tres elementos, de los once elementos que forman el equipo.
Ejemplo: 8) En una carrera de 10 caballos, tomaron parte 3 del Sr. Ruiz. Si los diez
ejemplares tienen la misma probabilidad de ganar, ¿cuál es la probabilidad
de que el premio lo gane algún caballo del Sr. Ruiz?
22
A es el evento; “gane un caballo del Sr. Ruiz, entonces;
3
Por lo que: P (A) =
10
P ( ) = P (A) + P (A´) = 1
A’ P(A) = 1 – P(A’)
A P(A’) = 1 – P(A)
Donde P (A) es la probabilidad de éxito, o sea, que gane un caballo del Sr. Ruiz, y P
(A´) ( complemento de A) es la probabilidad de fracaso, o sea, que no gane un caballo
del Sr. Ruiz, entonces:
3
Si P (A) = y P ( ) = 1, por lo que si despejamos P ( A´ )
10
tendremos: P ( ) = P (A) + P ( A´ )
3
sustituyendo 1= + P ( A´ )
10
3 7
entonces P ( A´ ) = 1
10 10
Si conocemos los valores de P (A) y P (A´), tenemos que: P () = P (A) + P (A´).
3 7 10
sustituyendo P () = 1
10 10 10
23
Acabas de ver que existe una probabilidad de éxito y otra de fracaso y la suma de éstas
siempre es igual a la unidad P 1 .
a) negra?
b) verde?
c) roja?
d) negra o verde?
e) roja o verde?
El espacio muestral del experimento es S 1
,
2,
3, 4
, 5, 6
, 7
, 8,
9
N V R
3 1
P (N)
9 3
2
P (V)
9
4
P (R)
9
24
3 2 5
por lo que P (N U V) que es la probabilidad de que salga
9 9 9
una esfera negra o una verde.
4 2 6 2
P R U V P R PV , sustituyendo P R U V
9 9 9 3
que es la probabilidad de que salga una esfera roja o una esfera verde.
a) sirva?
b) no funcione?
25 5
si A = 25 focos no defectuosos, por lo que P (A)
40 8
15 3
si A = 15 focos defectuosos, por lo que P (A´)
40 8
5 3 8
sustituyendo P () 1
8 8 8
25
Con los ejemplos anteriores, te has percatado de lo sencillo que es aplicar la expresión
algebraica de la probabilidad
NE ne
P E
N n
ACTIVIDAD DE REGULACIÓN
3. Se realizaron 800 lanzamientos de una moneda equilibrada, de los cuales 476 veces
cayó águila (A) y 324 cayó sol (S), la frecuencia relativa de los eventos A y S, es:
Ejemplo: 11) En un grupo de 200 estudiantes, 140 (80 mujeres y 60 hombres) son
estudiantes de tiempo completo y 60 (40 mujeres y 20 hombres) son de
medio tiempo:
26
Considera A como el evento “el estudiante es de tiempo completo” y B como el evento
“el estudiante es de tiempo parcial y además hombre”. Observamos que ningún
estudiante es de “tiempo completo” y de tiempo parcial, simultáneamente, entonces los
eventos A y B son mutuamente excluyentes.
A B
140 20
40
140 14 7
P (A) y
200 20 10
20 2 1
P (B)
200 20 10
7 1 8 4
P A o B
1 10 10 5
por lo tanto:
27
A B
P (A ó B) = P (A U B) = P (A) + P(B)
De la figura anterior, observas que no hay intersección entre los eventos A y B, por lo
que, P (A B) = 0 ; (A B = ). Hagamos otro ejemplo:
Ejemplo: 12) Se lanza un dado equilibrado, si A es el evento, “cae un número menor que
3” y B es el evento, “cae un número mayor que 3”. ¿Cuál es la
probabilidad de que ocurra A o B?
Si A = 1, 2 y B = 4, 5, 6, vemos que los eventos son mutuamente excluyentes,
porque no hay elementos comunes entre estos eventos P (A B) = P () = 0 , por lo
tanto, la probabilidad de que ocurra por lo menos uno de los eventos es:
2 3
P (A) = y P (B) = ;
6 6
2 3 5
entonces: P (A U B) = P (A) + P (B) =
6 6 6
28
b) Eventos No Mutuamente Excluyentes
140 14 7 120 12 6
P A y P C
200 20 10 200 20 10
7 6 13
P( A ) P(C) 1.3
10 10 10
la cual es mayor que 1. ¿Recuerdas que la probabilidad nunca debe ser mayor que uno?
Lo que ocurre es que al sumar las probabilidades estamos considerando dos veces a los
80 estudiantes de tiempo completo y mujeres, por lo que debemos de restar esta
intersección.
La siguiente figura plantea desde el punto de vista de los conjuntos, el ejemplo de elegir
aleatoriamente de entre 200 estudiantes, un estudiante con base a los eventos A y C:
A
C
60 80
e 40
29
Las probabilidades de estos eventos son:
140 14 7
P (A)
200 20 10
120 12 6
P (C) y
200 20 10
80 8 4
P (A C) ,
200 20 10
7 6 4 9
entonces: P (A U C) = P (A) + P (C) – P (A C)
10 10 10 10
Si observamos el espacio muestral, vemos que existen 180 estudiantes que son de
tiempo completo o mujer, en consecuencia, la probabilidad de A o C es:
180 18 9
P (A o C) = P (A U C)
200 20 10
Por lo tanto:
A B
P ( A U B ) = P ( A ) + P ( B ) – P (A B)
30
Ejemplo: 13) Encuentra la probabilidad de que en una tirada de un dado se obtenga el
número 4 ó 5.
P (A) = 1 y P (B) = 1,
1 1 2 1
entonces: P (A U B) = P (A) + P (B) =
6 6 6 3
Observas que los eventos son excluyentes (disjuntos), porque no hay elementos
comunes entre estos eventos.
2 1
Solución: Si P (S) y P (P) = ,
5 2
2 1 45 9
entonces: P (S U R) = P (S) + P (R)
5 2 10 10
Para resolver el inciso (b), ¿recuerdas que la suma de las probabilidades de éxito y
fracaso siempre es la unidad?, es decir, P () = P (A) + P(A´); entonces:
9 10 9 1
entonces: P (no asista a cualquier bachillerato) = 1
10 10 10
31
Ejemplo: 15) En un salón de clases, 50 aprueban sólo matemáticas, 25 sólo inglés y 10
aprueban ambas asignaturas. ¿Cuál es la probabilidad de que un
estudiante elegido al azar, aprueba matemáticas o inglés?
50 25 10
P (M) , P(I) y P (M I) ;
85 85 85
P (M U I) = P ( M ) + P ( I ) – P (M I),
50 25 10 65 13
por lo que tendremos: P (M U I) =
85 85 85 85 17
Ejemplo: 16) Se realizó una encuesta entre jóvenes y se halló que 400 juegan sólo
fútbol, 175 ajedrez y 125 juegan fútbol o ajedrez. ¿Cuál es la probabilidad
de que un joven elegido al azar juegue ambos deportes?
P ( F U A ) = P ( F ) + P (A) P ( F A )
P ( F A ) = P ( F ) + P (A) P ( F U A ),
Como te habrás dado cuenta, los ejemplos están sencillos, para que puedas aclarar
dudas. Continuemos.
32
EXPLICACIÓN INTEGRADORA
Hasta ahora hemos visto los antecedentes históricos, su función y sus aplicaciones, las
posibilidades en contra o a favor de un evento determinado, la frecuencia relativa de los
valores de una variable, los experimentos aleatorios y determinísticos, los tipos de
espacios maestrales y las propiedades de la frecuencia relativa.
La probabilidad de un evento puede ser afectada por la ocurrencia de otro. En este caso,
los eventos son dependientes (eventos no independientes), por que la ocurrencia de un
evento afecta a la ocurrencia del otro evento. Por ejemplo, si de una urna que contiene
tres bolas rojas y tres negras se extrae al azar una bola, y después otra, los eventos A
“obtener bola negra en la primera extracción” y B ”obtener bola negra en la segunda
extracción”.
Observamos que los eventos son dependientes (no independientes), porque la bola
extraída en la primera extracción no se regresa a la urna antes de la segunda extracción.
Entonces, la probabilidad de B depende de la ocurrencia de A.
33
Como observas, la probabilidad de ocurrencia de un evento depende de la ocurrencia del
otro evento, entonces:
P (A B) = P (A) P (B/A)
P (A B)
P (B/A) = donde P (A) > 0
P (A)
Ejemplo: 17) Sea el experimento de extraer dos bolas, una después de otra, de una
urna que contiene cuatro bolas rojas y tres negras. Si A es el evento
“extraer bola negra en la primera ocasión” y B es el evento “extraer bola
negra en la segunda ocasión”. ¿Cuál es la probabilidad de que ocurra A y
B?
3 1 3 1
es decir: P (A B) = P(A) • P (B/A) = • =
7 3 21 7
34
Ejemplo: 18) Se lanzan tres monedas, ¿Cuál es la probabilidad de que todos sean
soles, y si la primera de las monedas es sol?
lanzamientos
3
2 = 8 posible resultado
resultado de lanzar una moneda
Si A es el evento “la primera moneda es sol” condición y B es el evento “las tres sean
soles”, entonces:
4 1
A = (SSS) (SSA) (SAS) (SAA) P (A) = ,
8 2
1
B = (SSS) P (B) = y
8
1
A B = (SSS) P (A B) = , por lo que tenemos;
8
1/ 8 2 1
sustituyendo: P (B/A) =
1/ 2 8 4
9
P (M) = 0.18 = (el porcentaje se convirtió en decimal, dividiendo el 18 % entre
50
100 y omitiendo el signo de porcentaje).
35
4 1
P (L) = 0.16 = y P (M L) = 0.04 = .
25 25
La probabilidad de que ocurra el evento M dado que haya ocurrido el evento L, es:
P (M L) 0.04
P (M/L) =
P(L) 0.16
Se multiplica por 100 ambas cantidades para expresar el resultado como un cociente de
dos enteros.
0.4100 4 1
P (M/L) =
0.15100 16 4
B B
18 9 3 1
P (A) =
36 18 6 2
36
B es el evento “en el segundo dado aparece el número 2 ó 3, entonces:
12 6 1
B = {hay seis 2 y seis 3} = {12} por lo que P (B) =
36 18 3
6 1
P (A B) =
36 6
1
P (A B) = P(A) P (B/A) , entonces P (A) = (hay 18 elementos)
2
1
y P (B/A) = (hay 12 elementos),
3
1 1 1
sustituyendo: P (B A) =
2 3 6
2 1 2 1
A = (AS) (AA) P (A) = y B = (SS) (AS) P (B) = .
4 2 4 2
37
Quizá te estés preguntando ¿porqué la expresión de eventos independientes (A B)
= P (A) P (B) aparece sin la probabilidad condicional P B/A , siendo que iniciamos
con la expresión P (A B) = P (A) P (B/A) ?
P A B
P (B/A) = pero si los eventos son independientes, tendremos que
PA
P A PB
P (B/A) = PB ; lo mismo ocurre cuando:
PA
P A B P A PB
P (A/B) = PA , entonces:
PB PB
ACTIVIDAD DE REGULACIÓN
4. Un hombre visita a un matrimonio que tiene dos hijos. Uno de los hijos entra a la
sala. Hallar la probabilidad p de que otro sea también niño si:
a) Se sabe que el otro hijo (o hija) es menor.
b) No se sabe nada del otro hijo.
38
1.3 CÁLCULO DE PROBABILIDADES: PROCEDIMIENTOS
ELEMENTALES DE CONTEO
Los arreglos o permutaciones son útiles para contar el número de todos los diferentes
arreglos u ordenamientos que se pueden hacer con un conjunto de objetos. Podemos
utilizar el concepto de permutación para determinar el número de formas en que se les
pueden asignar a los alumnos los asientos de una clase, el número de formas que se
pueden sentar en un escenario un grupo de conferencistas, el número de maneras en
que se puede organizar un grupo de libros en un anaquel, etc. Entonces:
Con frecuencia deseamos saber el número de arreglos que se pueden hacer con un
conjunto de objetos.
Ejemplo: 22) ¿Cuántos números de cuatro cifras se pueden formar, con los números
{6,9}?
Solución: Para formar cantidades de cuatro cifras con los números 6, 9 tenemos que
tomarlos en forma repetida, de la siguiente forma; Para el primer número de la
cantidad de cuatro cifras, habrá dos números, (2), para el segundo número de
la cifra, habrá dos números (2), para el tercer número de la cifra, habrá dos
números (2) y para el cuarto número de la cifra, habrá dos números (2),
entonces:
2 2 2 2 2 4 16
4
Con este resultado (2 = 16), observamos que el número de elementos (n) es dos, que se
van a formar cantidades de cuatro en cuatro (r) y para ese ejemplo, se pueden formar 16
números de cuatro cifras cada uno. Investiga cuáles son estos 16 números.
39
Con base al ejemplo anterior, para referirnos a (números de permutaciones o arreglos
con repeticiones de n objetos tomados de r en r) para el ejemplo, de 4 en 4, utilizaremos
el símbolo:
Ejemplo: 23) ¿Cuántas placas de auto existen que consta de dos letras y tres cifras en
ese orden, si la primera letra es A y la segunda letra puede ser de la A a la
F?
L L D D D
1ra. letra = A 1
2da. letra = A, B, C, D, E o F 6
1er. dígito = 0 al 9 10
2do. dígito = 0 al 9 10
3er. dígito = 0 al 9 10
3
1 6 10 6000
Entonces los arreglos de las letras pueden ser AA, AB, AC, AD, AE o AF, los cuales son
seis. El número de dígitos que se puede utilizar en la placa será
3 3
10 · 10 · 10 = 10 , entonces: 6 · 10 = 6000 placas.
Ejemplo: 24) En un salón de clases de kinder hay ocho figuras de plástico: tres
cuadradas, tres triángulos y dos rectángulos, las figuras no se pueden
distinguir de otro modo. ¿De cuántas maneras se pueden ordenar, si se
quiere hacer una fila sobre la mesa con estas figuras?
Solución: En este ejemplo se muestra objetos de los cuales algunos son iguales entre
sí, es decir, hay tres cuadrados ( i ), tres triángulos ( j ) y dos rectángulos (k) y
en total tenemos ocho (n) figuras. Para calcular el número de permutaciones
o arreglos de ocho objetos, de los cuales son de un tipo ( i ), de un tipo ( j ) y
de un tipo (k), se utiliza la siguiente expresión:
40
n! Permutaciones o arreglos de ordenamientos
n Pi, j, k
i! j! k! distintos con repetición.
8! = 8·7·6·5·4·3·2·1· = 40320
6! = 6·5·4·3·2·1· = 720
3! = 3·2·1· = 6
n=8
i=3 8!
8 P 3,3,2 560 maneras
j=3 3! 3! 2!
k=2
n!
n Pi, j, k , y sustituyendo valores, el resultado será:
i! j! k!
9!
9 P 3,4,2 1260
3! 4! 2!
Si utilizas calculadora para llegar a este resultado, la secuencia de las teclas que debes
oprimir son:
X! 9- 3 X! X 4 X! X 2 X! = 1260
41
Ejemplo: 26) Se planea presentar cinco conferencias en una reunión de padres de
familia y profesores del colegio. El moderador del programa desea saber
cuantas maneras diferentes se pueden situar en el escenario los cinco
conferencistas en fila.
Solución: Cada una de estas maneras diferentes son las posibles permutaciones o
arreglos, por lo que el moderador, en realidad, lo que quiere saber es el
número de permutaciones de cinco objetos tomados todos a la vez.
Visualicemos las cinco sillas (S) en el escenario.
S S S S S
nP n n (n 1) (n 2) . . . 3 2 1 n !
El símbolo n! (se lee “n factorial”) denota el producto de los n primeros enteros positivos,
como se ha visto.
Ejemplo: 27) Se desean colocar seis cuadros en línea recta sobre la pared de la
biblioteca. ¿De cuántas maneras diferentes lo pueden hacer?
42
Solución: Debemos encontrar el número de permutaciones o arreglos que podemos
tomar con seis cuadros, entonces, en forma análoga en el razonamiento del
ejemplo anterior, tenemos que:
Si nPn = n!, y si n = 6,
Ejemplo: 28) Un vendedor de autos tiene siete modelos para exhibir en un aparador,
pero éste sólo tiene espacios para cinco autos. ¿Cuántas muestras puede
exhibir?
Solución: El aparador sólo tiene lugar para cinco autos de los siete que existen, es decir
únicamente puede utilizar muestras de cinco en cinco. Entonces debe de
buscar el número de permutaciones de siete objetos, tomados de cinco en
cinco. Recuerda que el primer espacio se ocupar de siete distintas maneras,
el segundo espacio de seis maneras distintas y así sucesivamente, hasta el
quinto espacio que se puede ocupar de tres maneras distintas, entonces; las
muestras posibles son:
7 · 6 · 5 · 4 · 3 · 2 · 1 = 2520
7·6·5·4·3·2·1 7 ! 7!
7·6·5·4·3·2·1 =
2·1 2! (7 - 5)!
Con base a la expresión anterior, podemos generalizar la situación haciendo que n sea
el número de objetos disponibles y r el número de espacios para ocupar, por lo que el
número de maneras que se pueda ocupar r espacios cuando se disponen de n objetos
está dado por:
n!
n Pr = n (n-1) (n-2) ... (n-r+1) =
(n - r)!
43
Realicemos otros ejemplos:
Ejemplo: 29) ¿Cuál es el total de arreglos del conjunto {a, b, c, d, d}, tomados tres a la
vez y dos a la vez?
Solución: Como las muestras son de tres en tres y de dos en dos, debemos calcular el
número en permutaciones de n objetos tomados de r en r, entonces:
4! 4!
n=4yr=3 4P3 24
4 3 ! 1!
4! 4!
n=4yr=2 4P2 12
4 2 ! 2!
Ejemplo: 30) Un conferencista dispone de ocho temas sobre los que puede disertar
durante 30 minutos. Se le pide que presente una serie de cinco
conferencias de 30 minutos a un grupo de personas ¿Entre cuántas
secuencias de conferencias puede elegir?
n! 8!
n=8 n Pr = 6720 secuencias
n - r ! 8 5 !
r=5
c) Combinaciones
Ejemplo: 31) Si tenemos cuatro libros: uno de historia (H), uno de matemáticas (M), uno
de Inglés (I) y uno de ciencias (C) y los colocamos en un lugar donde
caben sólo dos libros, entonces el número de permutaciones o arreglos en
que se pueden ocupar los dos espacios, indica para nosotros que es
importante el orden en que quedan los dos libros en los espacios.
44
Solución: Las doce posibles permutaciones son:
HM MH CM IM
4! 4!
HI MI CI IH 4P2 = 12
2! ( 4 2)!
HC MC CH IC
HM MI
HI MC
HC IC
n
nPr = r!
r
45
n
Si resolvemos esta ecuación para podemos obtener una fórmula para calcular el
r
número de combinaciones de n objetos de r en r, entonces:
n n Pr
r r! Es el número de combinaciones de n objetos formados de r en r.
n!
Recordamos en nPr = , entonces podemos escribir la expresión anterior en la
n - r !
forma que más se conoce:
n n!
nCr =
r r! n - r !
Ejemplo: 32) ¿Cuántas juntas directivas de 5 personas se pueden formar con doce
miembros de una organización?
n = 12 n n!
n=5 r = r! n - r ! , sustituyendo
12 12! 12.11.10.9.8.7!
792
5 5! 12 5 ! 5! 7!
46
Solución:
8 8! 8.7.6!
28
6 6! 8 6 ! 6! 2!
Solución: Para realizar estos cálculos, se sugiere utilices la siguiente igualdad, la cual
siempre se cumple.
3
= 3C 2= 3 C 3-2 = 3C1 = =3
1
nCr = Ncn-r
100.99
= 100 C 100-98 = 100 C 2 = = 4950
2.1
47
ACTIVIDAD DE REGULACIÓN
4. En una clase hay 12 estudiantes. ¿De cuántas maneras los 12 estudiantes pueden
presentar 3 pruebas diferentes, si a cada prueba le corresponden 4 estudiantes?
EXPLICACIÓN INTEGRADORA
48
RECAPITULACIÓN
P (0) = 0
Propiedad de la frecuencia P () =1
relativa: P (A) = a con 0 a 1
b b
Concepto de Probabilidad: Ne
P(A) =
N
P( A B)
Probabilidad condicional: P(B / A )
P( A )
r n!
Arreglos con repetición: n ; nPi, j, k
i! j! k !
Cálculo de n!
probabilidades Arreglos sin repetición: nPn n! ; n Pr
(n r ) !
n n!
Combinaciones: nCr
r
r ! (n r) !
49
ACTIVIDADES DE CONSOLIDACIÓN
1. Una empresa llantera tiene 1500 llantas perfectas, 1000 llantas en estado regular y
500 defectuosas. Se efectúa una serie de 4000 elecciones de llantas con remplazo.
¿Cuál es la frecuencia relativa con que aparecen las llantas perfectas o las
regulares?
2. Se tiene una urna con 20 bolas negras, 35 verdes y 30 blancas. Se efectúa una serie
de 200 extracciones con remplazo. ¿Cuál es la frecuencia relativa con que aparece
la bola verde o blanca?
4. Consideremos el experimento “se lanza una moneda dos veces, aparecen dos
águilas, ¿qué tipo de evento es?
5. Consideremos el experimento “se lanza un dado” aparece cualquier número del uno
al seis, ¿qué tipo de evento es?
7. Por un error en una farmacia se revolvieron 45 goteros defectuosos con 135 goteros
sin defecto. Si se selecciona uno al azar, ¿cuál es la posibilidad de que el gotero sea
defectuoso?
50
8. Un experimento aleatorio consiste en extraer una esfera de una urna que contiene 6
esferas blancas, 10 esferas azules y 14 esferas moradas. Calcular la probabilidad de
extraer una esfera y ésta sea:
a) Blanca
b) Azul
c) Morada
d) Blanca o Azul
e) Morada o Blanca
f) Azul o Morada
10. Se realizó una encuesta entre jóvenes y se encontró que 400 juegan fútbol, 175
ajedrez. ¿Cuál es la probabilidad de que un joven elegido al azar juegue fútbol o
ajedrez?
11. Se lanza un par de dados. Si los números que resultan sean diferentes, halla la
probabilidad de que la suma sea impar.
12. Se lanza un dado, si el número que resulta es par. ¿Cuál es la posibilidad de que
sea primo?
6 4 2
13. Dados las siguientes probabilidades: P(H) = , P (L) = y P (H L) = ,
16 18 20
halle P (L/H).
14. Una papelería tiene dos urnas, en la urna A se tiene 18 bolígrafos de los cuales son
siete defectuosos y en la urna b, se tienen 22 bolígrafos de los cuales son 9
defectuosos. Se extrae al azar un bolígrafo de cada urna. ¿Cuál es la probabilidad
de que ningún bolígrafo sea defectuoso?
15. Un lote de 20 artículos tiene 10 defectuosos. Se eligen al azar dos artículos del lote
uno tras otro, ¿cuál es la probabilidad de que éstos no sean defectuosos?
16. ¿Cuántos números de siete dígitos se pueden formar con los dígitos 1, 3, 5, 7 y 9?
17. ¿De cuántas maneras diferentes pueden colocarse ocho libros en un librero?
18. Una tienda ofrece doce estilos diferentes de cacerolas, ¿cuántas maneras diferentes
tiene una señora de elegir, si solo quiere adquirir cinco de ellas?
51
AUTOEVALUACIÓN
2500 5
= =
4000 8
na
3) fa = = = 0.37143
n
4) El evento es:
5) El evento es: .
Ne Eventos favorables 20 1
6) P(E) = = = =
N Número de casos posiblesdeocurrencia 60 3
Ne
7) P(E) = =
N
52
6 1
8) a) P(B) = =
30 5
b) P(A) = =
30
c) P(M) =
Si A es el evento “los número que resultan son diferentes” quiere decir que las parejas
30
de número iguales (1,1) (2,2)...(6,6) se descartan, entonces: N(A) = 30 y P(A) =
36
Si B es el evento “su suma sea impar”, quiere decir que al sumar los números de cada
evento (1,2),=1+2=3; (4,5), = 4+5=9 el resultado debe ser un número impar, entonces:
18
N(B) = 18 y P(B) =
36
P( A B) 18 9 3
Por lo tanto, P(B/A) = = = =
P( A ) 30 15 5
53
3
12) = 1, 2, 3, 4, 5, 6, A = 2, 4, 6 y B 2, 3, 5, Con esto, P(A) = ,
6
3 1 1
P(B) = y P (A B) = P(B/A) = =
6 6 3
11 13 11 13 143 13
Si P(A) = y P(B) = , entonces P (A B) = = =
18 22 18 22 396 36
7
16) 5 =78125 maneras.
n n!
18) 7 92 maneras
r
r! n - r !
19) a)
10
8
b) 5! 7!
54
ACTIVIDADES DE GENERALIZACIÓN
55
BIBLIOGRAFÍA CONSULTADA
Este texto cubre el 100% del programa, manejando el enfoque del mismo. Sobre
el tema incluye una variedad de ejemplos prácticos que permiten una visión amplia
en este terreno.
Este texto cubre el 90% del programa, siguiendo el enfoque del mismo. Con
relación al tema su tratamiento es muy adecuado.
Este libro aborda el tema de manera muy adecuada, incluye ejemplos muy
ilustrativos.
Este texto cubre el 80% del curso. El tratamiento de los temas es muy claro,
además de que incluye ejemplos de aplicación práctica.
PARA PROFESORES.
56
DIRECTORIO
C.P. Juan Antonio Rosas Mejía Lic. Miguel Ángel Báez López
Director de Programación Director de Planeación Académica