Está en la página 1de 77

INSTITUTO TECNOLÓGICO DE VERACRUZ

LIBRO CUADERNO TALLER

ESTADÍSTICA AVANZADA

Autores: Toño Remes, Villaraus “La mera Ostia”, Duke, Miss Paso de Ovejas, Raúl
Morales, Mafer kuchau Benmez, La Nelly Nelly, Mandarina 1, Mandarina 2, Luis Burela
“Bizarro”, Juan Luis Gómez, Dechy, Michelle Sosa, Chinta, Tavo “El Cristo”, La Katia,
Acapulqueña, Víctor, Gaby “La China”, Jair Mc, La Meli, Cris Zetina, Erick Acosta,
Susana López, Jesús Ramírez “Coco”, Adán Álvarez Hernández, Sergio “tino”,
Santiago.

VERANO 2020 / 2021


ÌNDICE
DEDICATORIAS ................................................................................................... 3
Unidad 1 ........................................................................................................ 7
Unidad 2 ...................................................................................................... 25
Unidad 3 ...................................................................................................... 30
...................................................................................................... 38
...................................................................................................... 60
Unidad 6 ...................................................................................................... 65
DEDICATORIAS
“A mi familia, a mis amigos y enemigos, a ti que te olvide a mi cristo y a las Chivas”.
Toño Remes

“Para Raquel, la mejor madre que Dios puede ofrecerle a un hijo, gracias porque siempre
me empujas a ser valiente, que el miedo es solo un estado mental, a no desistir, pero
tener dignidad, a que todo es posible en esta vida en la medida que yo lo haga posible,
pero sobre todo gracias porque todos los días me enseñas amar lo que soy”.
Villaraus “La mera Ostia”

“A todos los que no dormirán haciendo estos ejercicios, cuando los encargue Remes”.
Duke

“A mis padres por pagarme las inscripciones y a mi novio, que me soportaba mientras
lloraba en el Domo haciendo los exámenes de Remes”.
Miss paso de ovejas

“Va dedicado para todas aquellas almas que se ganaron ojeras permanentes por hacer
este camotón”.
Raúl Morales

“Le dedico esta obra maestra a mi madre, mi padre y a mis hermanos, a mi gato Minchi
y mi perro pancho, así como también a mi pandilla de la sombra por ser amigas
invaluables, a mi amigo Toño y al negro por aguantarme, los amo se me cuidan xoxo”.

Mafer kuchau Benmez

“Esto va dedicado a las 8 horas de sueño que, por supuesto no tuve por estar haciendo
el cuaderno taller y los fantasmas largas noches, y a mis lágrimas derramadas a las
3:40am. A Dios, a mis padres, amigos y por supuesto a mí, porque me lo merezco”.
La Nelly Nelly

“Esto va dedicado a mi mami bonita y a mi familia, que son mi motor para salir adelante
en cada una de mis materias”.
Mandarina 1

“Va dedicado principalmente a mi abuelo y a la gran familia que me dejo que son uno de
mis mayores impulsos; por último, a mis 3 gatitas que me acompañaron en esas largas
noches de desvelo”.
Mandarina 2
“Este trabajo va dedicado a todas aquellas personas que me aman, a aquellos
que viven en mi irradian apoyo y cariño, a todos mis subscriptores, aunque nunca me
conocerán, y a las personas del futuro que conoceré en este estruendoso camino”.
Luis Burela “Bizarro”

“Esto se lo dedico a mis padres por sus esfuerzos y sacrificios, a mis amigos por su gran
apoyo y a Dios por darme la oportunidad de poder ser parte de esto”.
Juan Luis Gómez

“Esto va dedicado a mi familia por darme los ánimos suficientes mientras lloraba en la
madrugada haciendo los exámenes, a mi chihuahua Polly, a mis amigos y sobre todo a
mí por ser valiente y no darla de baja la materia”.
Dechy

“Va dedicado a mis padres, parejas, amigos y maestros que han aportado su granito de
arena en este escalón llamado universidad. ¡Besos!.”
Michelle sosa

“Esto va dedicado a mi ángel en primer lugar. A mis abuelos que estuvieron llamándome
cada noche para hacer los ejercicios. A mi hermano por el ánimo y a mis amigos que se
desvelaban conmigo cada unidad”.
Chinta

“A mis padres, hermana y abuela por todo el apoyo y animo que me brindaron en este
curso, a mis amigas por su apoyo incondicional, y a mí por partirme la madre en este
semestre y aguantar vara hasta el final y por último a Toño por sus buenas enseñanzas”.
Tavo “El Cristo”

“Dedicado a mis padres, hermanos y amigos por su apoyo incondicional, así como a
todas aquellas almas que no conciliarán la paz durante el curso y para todos aquellos
que las soportarán. Animo”.
La Katia

“Por mi familia que es mi impulso, por mis amigos que son mi esperanza, por mi novio
que es mi fortaleza y por las personas que cruce y mi cruzare en mi camino que son mi
destino”.
Acapulqueña

“Primero le doy gracias a Dios por todo, a mi familia y a aquellas personas que me han
apoyado como en el caso de un gran amigo llamado Portilla. Les deseo lo mejor a
aquellas personas que van a usar este libro y que el profe Remes es un gran profe así
que sáquenle todo lo que puedan (hablando en conocimiento) ya que ha vivido y
aprendido bastante. ¡Que tengan un excelente curso!”.
Víctor
“A mis papas, a mis perritos y a mí”.
Gaby “La China”

“A las horas de sueño que no volverán y a las ojeras que se quedaron en esas horas de
desvelo”.
Jair Mc

“Dedicado a mi familia, a mis nuevas ojeras, a mi amiga Cristina por haber sido apoyo a
lo largo del semestre y a futuros miembros del grupo de estadística”.
La Meli

“Dedicado a mí misma, por cada noche sin dormir, por mi paciencia y persistencia.
Dedicado a Nesme que me ayudo con cada duda que tenía y dedicado a Adrián
Hernández Zapata, quien me demuestra su paciencia, amor y comprensión siempre”.
Cris Zetina

“Dedicatoria para la persona más importante en mi vida Karina Acosta, mi madre y la


persona por la que daré lo mejor de mí para recompensarla”.
Erick Acosta

“Dedicado a mi familia, por ser cada día mi soporte e impulso a superarme. A mi novio
por estar siempre ahí, más en los malos ratos. Pero sin duda dedicado a mí, que deje
lágrimas, desvelos y litros de café para alcanzarlo”.
Susana López

“Agradecido con Dios por cada momento vivido, dedicado a mi madre y mis abuelos, mis
motores de vida, a las persistentes personas que recorrieron este lindo camino, lleno de
esfuerzo, dedicación y mucho aprendizaje. Agradezco a Toño, por cada experiencia
compartida, por el apoyo y la confianza mostrada, inmenso agradecimiento. Éxito en lo
que venga”.
Jesús Ramírez “Coco”

“Dedicado a mi familia por todo el apoyo constante, y a mis amigos por todas las horas
de estudio compartidas”.
Adán Álvarez Hernández

“Dedicado a mis padres, a mis hermanos y mis amigos(as), por apoyarme y ayudarme
incondicionalmente, sobre todo por sus palabras para lograr en ser quien soy y a mí
porque a pesar de los obstáculos nunca me rindo, sino también por siempre persistir
hacia adelante”.
Sergio “tino”
“A mi familia qué me soporto y acompaño en los desvelos por la tarea, a mis
mascotas por distraerme y ayudarme a olvidar los malos momentos y amigos qué me
ayudaron en las buenas y en las malas”.
Santiago
Resumen Unidad 1
ESCALAS DE MEDICIÒN Y MANEJO NUMÈRICO

La estadística se ocupa de los métodos científicos que se utilizan para recolectar,


organizar, resumir, presentar y analizar datos; algunos autores la ubican como la más
seria herramienta que postula alternativas y elije la mejor, se auxilia de cálculo diferencial
e integral.
Dentro de la estadística podemos diferenciar dos tipos: la descriptiva (o deductiva) y la
paramétrica (o inferencial), la primera justifica de la población solo lo que se observa,
únicamente trata de describir y analizar un grupo dado, la segunda usa el análisis
aleatorio de muestras, postula hipótesis y toma de decisiones.
Cualquier investigador se apoya de 4 tipos de escala:

- Escala Nominal (N): Los números se usan como identificadores o nombres. No


tienen valor científico. Ejemplos: N° telefónicos, N° en las playeras de los
jugadores de fútbol, concursos de belleza, etc.

- Escala Orinal (O): Es aquella que se ocupa en una encuesta para saber el
postulado “Esto mayor que aquel, aquel menos fuerte que este”. Ejemplo: Dureza
de metales, grados militares, carreras, etc.

- Escala de Intervalo (I): En esta escala el 0 es arbitrario y no indica carencia total


del objeto de estudio, permite establecer “distancias” entre los individuos y las
operaciones aritméticas. Ejemplo: Temperaturas (C°, K°, F°), sueldos, honorarios,
etc.

- Escala de Razón (R): En esta escala el 0 es absoluto, indica ausencia de la


característica que se está midiendo (carencia total de estudio). Ejemplos
intensidad pluviométrica, fuerza volcánica, peso, kilogramos, estatura en
pulgadas, etc.
Al organizar una gran cantidad de datos se realiza la ordenación de mayor a menor o
bien de menor a mayor. A la diferencia entre el número mayor y el número menor se le
conoce como el rango de datos, LRS (limite real superior) del dato mayor menos LRI
(limite real inferior) del dato menor.
Es de mucha utilidad distribuir estos datos en clases o categorías, que resultan de dividir
el rango, entre el tamaño o ancho de intervalo de la clase (c), este último se obtiene
restando los límites reales que componen cada
categoría. Los números menores acomodados en cada clase o categoría son los Límites
Inferiores (LI) y los números mayores son los Límites Superiores (LS).
NOTA: No es lo mismo Límite Inferior (LI) de clase que Límite Real Inferior (LRI).

7
Para calcular los límites reales, como primero el Límite Real Superior (LRS) se realiza
la suma entre el Limite Superior del intervalo con el Límite Inferior de la clase contigua
superior dividido todo entre dos. El Límite Real Inferior (LRI) se suma el límite inferior
del intervalo con el Limite Superior de la clase contigua anterior y dividida entre dos.
Los datos se llaman frecuencias (f). A la distribución tabular de los datos en clases con
sus respectivas frecuencias se le conoce como distribución de frecuencias o tabla de
frecuencias. A los datos organizados como en una tabla de frecuencias se le llama
datos agrupados.
Para obtener la marca de clase (X), que es el punto medio del intervalo de la clase se
obtiene sumando los límites de la clase inferior y superior y dividiendo entre dos.
En esta tabla se acomodan todos los datos obtenidos, las clases, la frecuencia (f), la
frecuencia relativa (fr) que resulta de la división de cada frecuencia, entre el número
total de datos que son expresados en %; la frecuencia relativa acumulada (fra) que
resulta de la suma porcentual de cada categoría. De igual manera se ponen los Limites
Reales.

LIMITES f Fa LRI LRS X fr fra

Las representaciones graficas de las distribuciones de frecuencia son los histogramas


y polígonos de frecuencias.
Los histogramas de frecuencias consisten en un conjunto
de rectángulos, grafico de barras usualmente irregular,
cuyas alturas en el eje X están representadas por las
FRECUENCIAS, Y el ancho, LOS LIMITES REALES
INFERIORES.

El polígono de frecuencias es un gráfico de línea


punteada, trazado sobre la parte superior de cada barra, de
tal manera que, para iniciar y terminar en un eje, deben
calcularse una marca de clase previa a la primera y una
posterior a la última, se usan los %´s relativos o
porcentuales en las en las alturas. Suele el polígono de
frecuencias ir trazado sobre el Histograma.

8
Ojiva Suavizada o Menos que es un gráfico de barras acumulado,
tan exacto que, uniendo las cotas de los vértices externos de cada
barra, nos dará precisamente una MEDIA CAMPANA; en el eje de
las “X”, deben ir los límites reales inferiores.
Ojiva Suavizada o Más que es aquella el cual
la curva es contraria de la Ojiva Suavizada o menos que, nos dará
físicamente una CAMPANA EXACTA COMPLETA.

Por último, las medidas de posición o también llamadas medidas de dispersión son
otras medidas o métodos que resultan ser más prácticos para precisar ciertas situaciones
en las que se busca describir la variación o dispersión en un conjunto de datos no
agrupados y agrupados.

ESTÁN LOS CUARTILES, DECILES Y PERCENTILES


Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro
partes porcentualmente iguales. Hay tres cuartiles denotados usualmente Q1, Q2, Q3.
El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o
por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión
(ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres
cuartas partes (75%) de los datos.

Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez
partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales, son también un caso particular de los percentiles. Los
deciles se denotan D1, D2, D9, que se leen primer decil, segundo decil, etc.
El cálculo de los percentiles que son los 99 valores que dividen una serie de datos
ordenados en 100 partes iguales. Los percentiles dan los valores correspondientes al
1%, al 2%... y al 99% de los datos.
𝑖𝑥𝑛
− ∑ 𝐹𝐴
𝑃( ) = 𝐿𝑟𝑖 + ⌊ 100 ⌋𝐶
𝐹𝐶

𝑖𝑥𝑛
- = 𝑎𝑟𝑡𝑖𝑓𝑖𝑐𝑖𝑜
100

- ∑ 𝐹𝐴 = 𝑠𝑢𝑚𝑎 𝑓𝑎

- 𝑓𝑐 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒

- 𝑐 = 𝑎𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒

9
EJERCICIOS DE ESCALAS DE MEDICIÒN
Subraya la escala de medición a la que pertenezca el enunciado.

1. Número de hijos en una familia.


A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
2. Número de camiseta de los jugadores de un equipo de fútbol.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
3. El ingreso familiar mensual.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
4. Rangos militares.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
5. Grado de escolaridad.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
6. Temperatura corporal.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
7. Ubicación en una carretera respecto a un punto de referencia.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
8. Los colores del arcoíris.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón

10
9. Preferencia a la compra de productos de consumo
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
10. Coeficiente intelectual.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
11. Goles marcados por un futbolista en un partido.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
12. Litros de agua consumidos por una persona al día.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
13. Madurez de una fruta al momento de su compra.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
14. Escalas de los test psicológicos.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
15. Puntaje obtenido por un equipo en un campeonato deportivo.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
16. Ventas de un producto.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón

11
17. Tiempo de un vuelo.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
18. Género.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
19. Grupos sanguíneos
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
20. Asignación del orden de atención según la llegada de los pacientes a consulta.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
21. Número de control en un Tecnológico.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
22. Días de la semana.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
23. Etapas del desarrollo de un ser vivo.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
24. Sobrepeso respecto a un patrón de comparación.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón

12
25. Nivel de productividad.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
26. Intensidad de corriente eléctrica.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
27. Estado civil.
A. Nominal
B. Ordinal
C. Intervalos
D. De Razón
28. Profesión.
A. Nominal
B. Ordinal
C. De Intervalos
D. De Razón
29. Tipo de escuela (pública o privada).
A. Nominal
B. Ordinal
C. De Intervalos
D. De Razón
30. Calidad de vida en una ciudad.
A. Nominal
B. Ordinal
C. De Intervalos
D. De Razón

13
MANEJO NUMÉRICO
Los datos numéricos se trabajan de acuerdo con el interrogante a resolver y son
utilizados para interpretarlos en base a las características del objeto de estudio.
Independientemente de la escala o escalas que se adopten para la medición de los datos,
es necesario conocer el procedimiento operativo para efectuar la cuantificación.

Es importante la síntesis de datos es para la presentación ordenada y resumida de los


elementos recopilados durante la investigación. “La información que se capta en un
cuestionario o cédula de entrevista o por medio de otro instrumento, difícilmente podría
ser manejado en su presentación original, ya que ello implicaría tiempo y esfuerzos
excesivos. Por esta razón, es necesario sintetizar la información fuente, esto es, reunir,
clasificar, organizar y presentar la información en cuadros estadísticos, gráficas o
relaciones de datos, con el fin de facilitar su análisis e interpretación”.
Para la presentación sintética de estos datos existen diversos modelos, pero nos
enfocaremos en la Tabla de frecuencias, histogramas y ojivas suavizadas.

TABLA DE FRECUENCIAS
La tabla de frecuencias constituye un cuadro numérico que muestra la incidencia de uno
o varios eventos detectados durante la investigación. Las tablas de frecuencia incluyen
los siguientes elementos: Nombre de la tabla (Indicador) Nombre de la categoría
Frecuencia absoluta de cada categoría Frecuencia relativa de cada categoría Suma de
frecuencias absolutas y relativas, etc.

La tabla de frecuencias es una herramienta que nos permite mantener los datos en una
forma ordenada para posteriormente usarlos y darle solución a los problemas.
Comenzamos la agrupación de datos ya sea de menor a mayor o de menor a mayor en
categorías o clases, en una distribución clases del mismo ancho.
Los datos en la parte derecha de la tabla se llaman frecuencias (f) que son la cantidad
de datos con los que cuenta cada clase. Los números menores acomodados en cada
clase son los LIMITES INFERIORES (LI) mientras que los números mayores son los
LIMITES SUPERIORES (LS).

Li - Ls f
50 - 54 4
55 - 59 6
60 - 64 20

14
La suma escalada de frecuencias nos permite obtener la columna llamada
FRECUENCIA ACUMULADA (Fa).

Li - Ls F Fa
50 - 54 4 4
55 - 59 6 10
60 - 64 20 30
Ahora continuaremos con el LIIMTE REAL SUPERIOR E INFERIOR.

Li - Ls f Fa LRi LRs
50 - 54 4 4 49.5 54.5
55 - 59 6 10 54.5 59.5
60 - 64 20 30 59.5 64.5
Para calcular el LIMITE REAL SUPERIOR, debemos sumar el límite superior del
intervalo con el límite inferior de la clase contigua superior y dividirlos entre 2. De la
misma manera para calcular el LIMITE REAL INFERIOR sume el límite inferior del
intervalo con el imite superior de la clase contigua anterior y dividido todo entre 2.

Podemos saber el ancho de la clase restando el LRS (Limite real superior) LRI (Limite
real inferior).
Ejemplo: LIMITES REALES DE LA PRIMER CLASE

54.5 - 49.5 = 5
Tenemos intervalos de clase de ancho 5.
Seguido de esto se incluye la marca de clase.

Li - Ls f Fa LRi LRs x
50 - 54 4 4 49.5 54.5 52
55 - 59 6 10 54.5 59.5 57
60 - 64 20 30 59.5 64.5 62
La marca de clase es el punto medio de cada clase y lo podemos obtener sumando el
límite inferior y superior seguido de dividir esta suma entre 2. Como siguiente paso,
incluiremos la FRECUENCIA RELATIVA (Fr) la cual obtenemos si dividimos cada
frecuencia, entre el número total de datos, dicha operación dará origen a todas las
frecuencias relativas.

Li - Ls f Fa LRi LRs x Fr
50 - 54 4 4 49.5 54.5 52 .133
55 - 59 6 10 54.5 59.5 57 .200
60 - 64 20 30 59.5 64.5 62 .666
Por último, debemos calcular la frecuencia relativa acumulada la cual es el resultado de
dividir la frecuencia acumulada entre el número total de datos.

15
Li - Ls f Fa LRi LRs x Fr Fra
50 - 54 4 4 49.5 54.5 52 .133 .133
55 - 59 6 10 54.5 59.5 57 .200 .333
60 - 64 20 30 59.5 64.5 62 .666 1
30 1
Es la suma escalada porcentual de cada categoría, debiendo ser su sumatoria final de 1
lo que representa el 100%.
Cabe hacer mención del RANGO que obtenemos mediante un proceso similar al ancho
de clase; LRS (del dato mayor) – LRI (del dato menor) y si dividimos el rango obtenido
entre el tamaño o ancho del intervalo de clase, dará un número estimado de clases o
categorías.

CONCEPTOS:
➢ A LO MÁS

Hace referencia a que la recopilación o la suma de datos sean como máximo, el número
ya establecido. En otras palabras, se puedes decir que son los datos o valores menores
o igual al dato dicho. Por ejemplo, la expresión “necesito a las más 5 personas”, esto
quiere decir que el número máximo de personas es 5, y todo menor o igual a 5, es un
valor valido. Se puede representar como X≤Y, donde en el ejemplo anterior seria X≤5,
es decir los valores de 1, 2, 3, 4, y 5 son válidos, los valores mayores no.

➢ AL MENOS
El término “al menos” es un término empleado para indicar el número menor permitido
de un cierto valor, donde todo lo que es mayor al valor indicado en el enunciado es válido.
Por ejemplo, el enunciado “necesito al menos 3 personas para un trabajo” Se puede
representar como X≥Y , donde en el ejemplo anterior se expresa X ≥5, es decir todo valor
mayor o igual de 3 es válido.

➢ POR ARRIBA
Este término nos indica que los valores deben ser mayores a los que menciona en el
enunciado, por ejemplo “los resultados del examen fueron todo por arriba de 50.” Esto
quiere decir que los datos obtenidos son mayores de 50. Se puede representar como
X>Y.

➢ POR DEBAJO
En este caso, se indica lo contrario al término “por arriba”, valga la redundancia, ya que
hace referencia a los valores que son menores de él que es dicho en el enunciado, por
ejemplo “todos los pesos obtenidos en esta muestra están por debajo de 90kg”. En este
caso hace referencia a todos los pesos (datos) menores de 90. Y se puede representar
como X<Y.

16
HISTOGRAMA
Un histograma es una representación gráfica de un valor variable representada en forma
de barra, donde cada barra es proporcional a la frecuencia de valores representados.
Son utilizadas para tener una vista panorámica o “en general” de la distribución de la
población, o de la muestra, respecto a una característica, cuantitativa y continua (como
la longitud o el peso).

Un histograma es una gráfica adecuada para representar variables continuas, aunque


también se puede usar para variables discretas. Es decir, mediante un histograma se
puede mostrar gráficamente la distribución de una variable cuantitativa o numérica. Los
datos se deben agrupar en intervalos de igual tamaño, llamados clases.
Para su elaboración debe introducirse el concepto de altura de histograma, que es un
concepto equivalente al de densidad de probabilidad, y que se calcula dividiendo la
frecuencia relativa de ese intervalo (o sea la superficie que queremos darle) entre la
anchura del intervalo (la base del rectángulo). Ahora las barras tendrán siempre
superficie igual a la frecuencia relativa y la suma de todas esas superficies (de todas las
barras) será 1, o sea el 100%.

TIPOS DE HISTOGRAMAS.
• Diagramas de barras simples.

Representa la frecuencia simple (absoluta


o relativa) mediante la altura de la barra la
cual es proporcional a la frecuencia simple
de la categoría que representa.

17
• Histograma de frecuencias relativas
Representa la frecuencia relativa
mediante la altura de las barras. Igual
que en el caso anterior se usa mucho
en educación no universitaria. La
elaboración del gráfico es más
complicada pues los números ya no son
enteros. Como en el caso anterior sólo
se puede aplicar cuando todos los
intervalos son iguales, ya que en ese
caso las alturas y las superficies son
proporcionales.

• Diagramas de barras agrupadas.


Se usa para representar la información de
una tabla de doble entrada o sea a partir de
dos variables, el cual es representado
mediante un conjunto de barras como se
clasifican respecto a las diferentes
modalidades.

• Polígono de frecuencias

Es un gráfico de líneas que de las frecuencias absolutas


de los valores de una distribución en el cual la altura del
punto asociado a un valor de las variables es proporcional
a la frecuencia de dicho valor.

18
¿CÓMO SE ARMA UN HISTOGRAMA?
Por lo general se tiene una tabla de datos agrupados con todo lo necesario para poder
realizar un histograma, un ejemplo de este es:

En el caso de un histograma de barras simple, los valores en el eje de las x serán las
clases como tal, es decir que el número de clases que hay en la tabla de datos será el
número de barras que hay, asimismo el ancho de clase será el de la tabla. Los valores
del eje de la Y serán las frecuencias.

Cuando se trata de hacer un histograma de frecuencias relativa o frecuencias


relativas acumuladas en el eje de las X irán los valores de los LIMITES REALES
mientras que en el eje de las Y irán los valores de las frecuencias relativas o bien de las
frecuencias relativas acumuladas (dependiendo el caso).

• Paso 1; Determinar el rango de los datos. Rango es igual al dato mayor menos el
dato menor.
• Paso 2; Obtener los números de clases.
Existen varios criterios para determinar el número de clases (o barras) -por ejemplo, la
regla de Sturgess. Sin embargo, ninguno de ellos es exacto. Algunos autores
recomiendan de cinco a quince clases, dependiendo de cómo estén los datos y cuántos
sean. Un criterio usado frecuentemente es que el número de clases debe ser
aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada
de 30 (número de artículos) es mayor que cinco, por lo que se seleccionan seis clases.

• Paso 3; Establecer el ancho de clase.


Es igual al rango dividido por el número de clases.
• Paso 4; Construir los intervalos de clases.
Los intervalos resultan de dividir el rango de los datos con relación al resultado del
paso 2 en intervalos iguales.
• Paso 5; Graficar el histograma.
En caso de que las clases sean todas de la misma amplitud, se hace un gráfico de barras,
las bases de las barras son los intervalos de clases y altura son la frecuencia de las
clases. Si se unen los puntos medios de la base superior de los rectángulos se obtiene
el polígono de frecuencias. El histograma de una imagen representa la frecuencia relativa
de los niveles de gris de la imagen. Las técnicas de modificación del histograma de una
imagen son útiles para aumentar el contraste de imágenes con histogramas muy
concentrados.

19
OJIVA SUAVIZADA “MENOS QUÉ”
Es un gráfico de barras acumulado, la base representa los intervalos de clase y las
alturas de frecuencia absolutas acumuladas menor que Fa tan exacto que, uniendo las
cotas de los vértices externos de cada barra, nos dará precisamente una media
campana. ¿Cómo se hace?; Una vez completado nuestro cuadro general de información,
estamos de acuerdo que tenemos todos los datos para comenzar a trabajar con todo lo
que se nos pida.
Así que para poder hacer la ojiva o menos que:
1. En el eje de las “X” se pondrán los valores de los Limites Reales Inferiores
(LRI) y el ultimo valor de los Limites Reales Superiores (LRS)
2. En el eje de las “Y” se pondrá el valor de las frecuencias acumuladas (a escala)
hasta llegar al número total de datos.
3. Se graficará cada barra, comenzando desde el valor del primer LRI hasta el
primer valor del LRS para la primera barra, desde el valor del segundo valor
del LRI hasta el segundo valor del LRS para el segundo y así sucesivamente
hasta llegar a la última barra, cada uno con su valor correspondiente a la
frecuencia absoluta que va del valor menor al mayor.
4. Se comenzará uniendo con
una línea punteada los
vértices de cada barra
obtenida, comenzando des
el vértice inferior de la
primera barra hasta el
vértice superior de la última
barra.
5. El resultado será una
media campana.

Ojiva “Menos qué”

20
OJIVA SUAVIZADA “MÁS QUÉ”
Es un gráfico de barras acumulado, la base representa los intervalos de clase y las
alturas de frecuencia absolutas acumuladas mayor que Fa tan exacto que, uniendo las
cotas de los vértices externos de cada barra, nos dará precisamente una media
campana. ¿Cómo se hace?; No es muy diferente a la elaboración de la ojiva o menos
qué, pero el resultado si es totalmente diferente, para elaborar la ojiva o más que:

1. En el eje de las “X” se pondrán los valores de los Limites Reales Inferiores (LRI)
y el ultimo valor de los Limites Reales Superiores (LRS).

2. En el eje de las “Y” se pondrá el valor de las frecuencias acumuladas (a escala)


hasta llegar al número total de datos.
3. Se graficará cada barra, comenzando desde el valor del primer LRI hasta el primer
valor del LRS para la primera barra, desde el valor del segundo valor del LRI hasta
el segundo valor del LRS para el segundo y así sucesivamente hasta llegar a la
última barra, cada uno con su valor correspondiente a la frecuencia absoluta que
va del valor mayor al menor. Es decir, se graficará igual que el de la ojiva o
menos que, pero se tendrá que invertir los valores de la frecuencia acumulada, el
ultimo valor pasa a ser el primero, el penúltimo el segundo y así sucesivamente.
4. Se comenzará uniendo con una línea punteada los vértices de cada barra
obtenida, comenzando des el vértice inferior de la primera barra hasta el vértice
superior de la última barra
5. El resultado será una media campana.

CÁLCULO DE PERCENTILES
Un percentil es una medida estadística utilizada para comparar datos. Consiste en un
número de 0 a 100 que indica el porcentaje de datos que son igual o menor que
determinado valor.

Los percentiles son muy conocidos por su uso en los percentiles de crecimiento. Por
ejemplo, si el peso de un bebé está en el percentil 65, quiere decir que el 65% de los
bebés de la misma edad pesan igual o menos.

21
¿Cómo se sacan?

Se calculan con la fórmula:

𝒊𝒙𝒎
[ − ∑𝑭𝑨]
𝐿𝑹𝑰 + 𝟏𝟎𝟎 ∗𝑪
𝑭𝑪
Ejemplo:
1. Cuadro General de Información

LI F Fa LRI LRS X Fr Fra10


LS
2-4 10 10 1.5 4.5 3 0.09 0.09
5-7 15 25 4.5 7.5 6 0.136 0.22
8 - 10 30 55 7.5 10.5 9 0.27 0.5
11 - 13 20 75 10.5 13.5 12 0.181 0.68
14 - 16 25 100 13.5 16.5 15 0.22 0.90
17 - 19 10 110 16.5 19.5 18 0.09 1.00

∑f=110

2. Traza una Ojiva Suavizada “o menos que”.


3. Calcula P25, P50 y P75 y ubícalos en la Ojiva

7.5+0.3=7.8 10.5+1.6=12.1 16.5+0.036=16.53

22
EJERCICIOS FANTASMA
Calcular lo siguiente para los ejercicios a continuación:

1. Completar el cuadro general de información


2. Trace sobre un histograma de frecuencias, la ojiva suavizada o menos que,
calculando P25, P50 y P75.
3. Interpretar textualmente.

✓ Se encuestaron a 40 veracruzanos para conocer la cantidad de tacos que podían


consumir en 10 minutos y se clasificaron en 5 clases.

LÍMITES FRECUENCIAS
2-4
4-6
6-8
8-10
10-12
∑f= 40

✓ En el IMSS 60 pacientes fueron pesadas por una enfermera, la cual los categorizo
en kg. ¿Cuántos pacientes pesaron a lo más 70 Kg?

LÍMITES FRECUENCIAS
50-55
55-60
60-65
65-70
70-75
75-80
∑f= 60

✓ Un pasante de Ingeniería química realizó una encuesta a 50 alumnos del ITVER


de acuerdo con su consumo de Coca Cola al mes. ¿Cuántos alumnos beben a lo
más 12 de estos productos al mes?

LÍMITES FRECUENCIAS
3-6
6-9
9-12
12-15
15-18
∑f= 50
23
✓ 100 alumnos fueron ubicados de acuerdo con las calificaciones de este semestre.
¿Cuántos alumnos obtuvieron a lo menos 50 de promedio semestral?

LÍMITES FRECUENCIAS

∑f= 100

24
Unidad 2
MEDIDAS DE TENDENCIA CENTRAL

1. De la siguiente serie numérica 2 6 8 4 5 5 9 1 3 5 7 5


a) hallar media, mediana y moda.

2. Calcula la media de los siguientes datos; 2 3 6 5 1 4 8 5 2 6 9 5 1 2 9 3 6 5.

3. Las notas de un estudiante de ing. Industrial en seis exámenes fueron 84, 91, 72,
68, 87 y 78. Hallar la media aritmética y la Mediana.

4. Diez medidas del diámetro de un cilindro fueron anotadas por un alumno de


bioquímica como 3.88, 4.09, 3.92, 3.97, 4.02, 3.95, 4.03, 3.92, 3.98 y 4.06 cm. Hallar
la media aritmética de tales medidas

5. De entre 100 números, 20 son cuatros, 40 son 5, 30 son seis y los restantes son
sietes. Hallar su media aritmética y su Moda.

6. Se tiene a continuación las edades de 20 alumnos del Conalep 16 18 20 21 19 19


20 18 17 18 21 16 21 19 16 16 17 18 16 18 se puede decir entonces que la moda
es:
a) Unimodal
b) Bimodal
7. Calcula la media de 30 localidades del estado de Veracruz cuyas temperaturas en
grados c° son:
1-2 5
3-4 4
5-6 12
7-8 8
9-10 1
Ʃ30
8. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su
consulta. Calcular su mediana y media.
1-2
3-4
5-6
7-8
9-10
Ʃ50
9. Encuentra la posición mediana para
a) n=20
b) n=50

25
10. Las siguientes son las calificaciones de 10 estudiantes de estadística.
78,89,98,75,76,96,88,92,79,81,82
a) Obtenga la mediana y cuartiles.

11. Calcular los cuartiles de las series estadísticas.


a) 5 6 5 6 2 1 4 8 9 6
b) 5 6 3 2 1 4 8 9 5 7 5 4 8 6 5 1 4 8
c) 11 2 5 9 6 7 10 12 15 14 17 16 18 13 14 15 14

12. calcular Q1 y Q3.


a) 56 89 74 28 63 15 58 96
b) 15 25 89 63 47 58 12 72 36 23

13. calcula Q3.

10-15
15-20
20-25
25-30
30-35
35-40
Ʃ25

14. FANTASMA A
Calcule e interprete, mediana, moda y media ²Q2 y llévalo a una ojiva “o menos que”.

7-8

Ʃ60

15. FANTASMA B
Calcule e interprete mediana, moda, Q1 y Q3, y llévalo a una ojiva lo “más que”.

Ʃ30

26
MEDIDAS DE DISPERSIÓN

1. Calcular todas las medidas de dispersión para la siguiente distribución.

Xi 5 10 15 20 25
ni 3 7 5 3 2

2. Calcular todas las medidas de dispersión para los datos de la siguiente


distribución.

x 0–100 100–200 200–300 300-800


n 90 140 150 120

3. Una empresa de fabricación de productos cerámicos dispone de tres centros de


producción. En el centro de Alvarado, el más grande y moderno, se hace un estudio
de los m² de azulejo producidos al mes durante el año pasado, obteniéndose una
media de producción mensual x A = 250.000 m², con una desviación típica SA =
15.000 m². Se sabe que el centro de Veracruz, por tener maquinaria más anticuada
que Alvarado, produce cada mes un tercio de la producción de Alvarado, y que el
centro de Córdoba, por tener un horno menos que Veracruz, produce cada mes
25.000 m² menos que Veracruz ¿Cuál es la media y la varianza de la producción
mensual de Córdoba?

4. Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12,


10. Probar que ambos conjuntos de números tienen la misma desviación típica
pero diferentes medias ¿cómo están relacionadas las medias?

5. Multiplicando cada número 3, 6, 2, 1, 7 y 5 por 2 y sumando entonces 5, obtenemos


el conjunto 11, 17, 9 7, 19 15. ¿Cuál es la relación entre la desviación típica de
ambos conjuntos? ¿Y entre las medias?

6. Tenemos una variable X de la que sabemos que: CV = 0,5 y que Sx = 3. ¿Cuál es


el valor de la media de X?

7. El coeficiente de variación de la variable X sabemos que es 1 ¿Qué podemos decir


sobre su media y su varianza?

8. Tenemos dos variables X e Y con el mismo recorrido y media, siendo sus


varianzas 4 y 9 respectivamente. ¿Para cuál de las dos variables el valor de la
media es más representativo?
27
9. Sea una variable con media 8 y desviación típica 0. ¿Qué se puede afirmar sobre
el comportamiento de esta variable?
Días de 1 2 3 4 5 8 15
estancia
Nº de coches 23 12 7 10 3 2 1
nucleares

10. En un taller de reparación de automóviles nucleares recogió datos sobre los días
de permanencia de los vehículos a reparar en él, y obtengo:
a) Calcula el número medio de días de permanencia y una medida de su
representatividad
b) ¿Cuántos días como máximo permanecen en el taller el 75% de los
automóviles nucleares, que menos permanecen en el taller?
Calcula la mediana y la moda

11. Halle la MD de los pesos de 8 niños (en Kg.): 15, 12, 10, 18, 14, 22, 17, 20.

12. Una empresa de fabricación de producción de armamento nuclear dispone de tres


centros de producción. En el centro de Hawái, el más grande y moderno, se hace
un estudio de los m² de armamento producidos al mes durante el año pasado,
obteniéndose una media de producción mensual XA= 500 armamentos, con una
desviación típica SA = 130 de armamento. Se sabe que el centro de Filadelfia,
por tener maquinaria más anticuada que Hawái, produce cada mes un tercio de la
producción de Hawái, y que el centro de Orlando, por tener un horno menos que
Filadelfia, produce cada mes 80 de armamento menos que Filadelfia ¿Cuál es la
media y la varianza de la producción mensual de Orlando

13. Calcular la varianza de la distribución de la tabla:

xi fi xi · fi xi2 · fi

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

28
[40, 50) 45 9 405 18 225

[50, 60 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

14. Calcular P75 y P25, para luego sacar Q.

X X-X (F)(X-X) |X-X|°2

2 1.5 3.7 7.4 13.69

4 3.5 1.7 6.8 2.89

10 5.5 3.0 3.0 0.69

3 7.5 2.3 6.9 5.29

1 9.5 4.3 4.3 18.49

15. Calcular Q sabiendo que P25=4.0 y P75= 6.3

16. Calcular Q sabiendo que P25=4.75 y P75=8.28

17. Calcular Q sabiendo que P25=7.25 y P75=14.75

18. Calcular Q sabiendo que P25=8.0 y P75= 12.6

29
Resumen Unidad 3
A continuación, en respecto a la UNIDAD 3, se abordarán situaciones, en donde se hará
mención de eventos mutuamente excluyentes, eventos o sucesos que no cuentan con
simultaneidad alguna, que no pueden ocurrir al mismo tiempo, donde la probabilidad de
que ocurra cualquiera de los dos, es igual a la suma de sus probabilidades.
Asimismo, probabilidad condicional, la cual determina la probabilidad que ocurra un
evento A, teniendo en cuenta la existencia al mismo tiempo, de un evento B. Para su
mejor ilustración e interpretación, requiere el uso del diagrama de árbol.
De igual forma, Teorema de Bayes, el cual entiende la probabilidad de forma inversa al
teorema de la probabilidad total. En donde, podemos calcular la probabilidad de un
suceso A, sabiendo que, cumple cierta característica que condiciona su probabilidad.
Bayes calcula la probabilidad de A condicionado a B.
Con respecto a la UNIDAD 4, primeramente, la distribución normal, una distribución en
la que se puede medir la desviación de los datos respecto a la media, lo cual permite
comparar la posición relativa de los datos. Estos valores de referencia son la base de
muchas pruebas de hipótesis.
En segundo lugar, la Distribución Binomial, Modelo de Distribución Probabilístico,
empleado cuando la variable aleatoria discreta corresponde al número de éxitos en una
muestra compuesta por n observaciones, en donde, al momento de realizar un
experimento, toma solamente valores de cero y uno, equivalentes al éxito y al fracaso.
Los resultados de cada ensayo son independientes entre sí.
Al mismo tiempo, la Distribución de Poisson, Distribución de Probabilidad Discreta,
que, a partir de una frecuencia de ocurrencia media, expresa la probabilidad de que
ocurra un determinado número de eventos durante cierto período de tiempo.
De la misma manera, el uso de la aproximación normal, su aportación principal consiste
en el apoyo a la distribución binomial, cuando la muestra en esta es mayor a 30, en
donde realiza el cálculo de la media y desviación estándar, para posteriormente, seguir
los parámetros establecidos del cálculo de valores de una distribución normal, conocido,
como prueba ƶ.
En lo que respecta a la UNIDAD 5, hace presencia el muestreo directo, técnica empleada
para la selección de una muestra, cuya función es determinar que parte de una población
debe examinarse, con la finalidad de hacer inferencias sobre dicha población.
Cabe destacar que, los números aleatorios, aquellos obtenidos al azar, corresponden a
todo número que tenga la misma probabilidad de ser elegido y que la elección de uno no
dependa de la elección del otro.
Con relación a la Corrección por continuidad, reside en el ajuste que se realiza cuando
una distribución discreta se aproxima mediante una distribución continua. Por este
motivo, la diferencia entre el escenario de la estadística real y la conceptual, radica en
los límites reales.

30
Unidad iii
ÁNALISIS
COMBINATORIO Y
PROBABILIDAD

31
PROBABILIDAD
EVENTOS MUTUAMENTE EXCLUYENTES
1. Las probabilidades de que Manuela decidiera comprar una falda en tienda
departamental Milano o en Santory son las siguientes:
P(A)= 64%
P(B)= 36%
¿Cuál es la probabilidad de que compre una falda en una de esas dos tiendas?
2. Si un día, el inquieto Goyo revisa una canasta con frutas, (en este caso plátanos
y manzanas); con el fin de comerse una de ellas. ¿Cuál es la probabilidad de que
seleccione una de ellas, si se toma en cuenta que tiene 25% de probabilidad de
escoger plátanos y 50% de escoger manzanas?
3. Al lanzar un dado de seis caras, se busca que salga el número 4 o el número 6,
si la probabilidad de que resulte ser 4, es de ⅙, y de que resulte ser 6 es el mismo
valor, ¿Cuál es la probabilidad de que salga cualquiera de esos dos números?
4. El joven Alfonso está buscando adquirir cierto par de zapatos para una ocasión
especial, por ello, se dispone a comparar precios en cuatro zapaterías distintas
del centro de la ciudad. Si las probabilidades de cada una se muestran a
continuación:
P(A)=17%, P(B)=14%, P(C)=39%, P(D)=30%.
a) Calcular la probabilidad de que Alfonso solo compre el par de zapatos en
una de ellas.
5. La mamá de Clara vende hielitos de tres diferentes sabores (coco, cacahuate y
chocolate), si por traviesa, la niña quiere tomar uno sin permiso, ¿cuál es la
probabilidad de que escoja cualquiera de los tres? Realizar las operaciones
tomando en cuenta los siguientes datos:
a) P(A)=40%
b) P(B)=23%
c) P(C)=33%
6. Si se tira un dado calcular la probabilidad de:
a) Caen 3 puntos o menos.
b) Caen 5 puntos o más.
7. Se tiene una urna con 50 papeles de colores, 15 rojos, 5 morados, 9 verdes, 11
naranjas y 10 azules. Cuál es la probabilidad de:
a) Sale un papelito azul.
b) Sale un papelito rojo
32
.
8. Se tienen cinco libros de distintas materias: Matemáticas, Biología, Química,
Estadística Inferencial y Lenguaje. Si se toma uno de ellos, ¿cuál es la
probabilidad de que este sea de matemáticas o de estadística inferencial?
9. En una bolsa se tienen 3 bolitas verdes, 2 amarillas y 4 naranjas, ¿cuál es la
probabilidad de que, al sacar una bolita, esta sea naranja o verde?
10. En una caja, hay tarjetas numeradas correlativamente del 10 al 30 (10, 11, 12, 27,
28, 29, 30). ¿Cuál es la probabilidad de que, al sacar una tarjeta al azar, la suma
de los dígitos sea 3 o 4?
PROBABILIDAD CONDICIONAL
1. En un centro escolar, los alumnos pueden optar por cursar como lengua
extranjera, inglés o francés. En un determinado curso, el 90% de los alumnos
estudia inglés, y el resto francés. El 30% de los que estudian inglés son chicos, y
de los que estudian francés, son chicos el 40%. Se ha elegido un alumno al azar,
¿cuál es la probabilidad de que sea chica?
2. Lance quiere enviar una carta a Mary. La probabilidad de que Lance escriba la
carta es 0.8; la probabilidad de que el correo no la pierda es 0.9, y la probabilidad
de que el cartero la entregue es 0.9. Si Mary no recibió la carta, ¿cuál es la
probabilidad condicional de que Lance no la haya escrito?
3. Ante un examen de Álgebra Lineal, un alumno sólo ha estudiado 15 de los 25
temas correspondientes a la materia del mismo. Este se realiza extrayendo al azar
dos temas y dejando que el alumno escoja uno de los dos para ser examinado del
mismo. Hallar la probabilidad de que el alumno pueda elegir en el examen uno
de los temas estudiados.
4. Se sabe que el 50% de la población fuma, y que el 10% fuma y es hipertensa.
¿Cuál es la probabilidad de que un fumador sea hipertenso?
5. La clase de Estadística Inferencial de 9 a 10, está formada por 10 chicos y 10
chicas; la mitad de las chicas y la mitad de los chicos han elegido italiano como
asignatura optativa. Hallar la probabilidad de:
a) Una persona elegida al azar sea chico o estudie italiano.
b) Sea chica y no estudie italiano.
6. En un grupo de Estadística, impartido por Toño Remes JR, el 80 % están guapos.
Entre los guapos, el 75 % tiene trabajo. Finalmente, un 5% no están guapos, y
tampoco tienen trabajo.

a) ¿Qué porcentaje no están guapos?


b) Si uno tiene trabajo, ¿qué probabilidad hay de que esté guapo?
c) ¿Qué porcentaje están guapos entre los que no tienen trabajo?

33
7. En una asignatura de primer curso de una titulación universitaria, asisten a clase
regularmente 210 alumnos de los 300 que hay matriculados. Además, se sabe
que aprueban el 80 % de los alumnos que asisten a clase y el 15 % de los que no
asisten. Calcular la probabilidad de los cuatro sucesos siguientes:

a) Se elige al azar un alumno matriculado y resulta que:


i. Ha asistido a clase.
ii. No ha asistido a clase y ha aprobado.
iii. Ha aprobado.
8. En una población hay el doble de mujeres que de hombres. El 25 % de las mujeres
son rubias, y el 10 % de los hombres también son rubios. Calcular:

a) Si se elige al azar una persona y resulta ser rubia, ¿cuál es la probabilidad


de que sea mujer?
b) ¿Cuál es la probabilidad de que una persona elegida al azar sea hombre y
no sea rubio?
9. Una persona cuida de su jardín, pero es bastante distraída y se olvida de regarlo
a veces. La probabilidad de que se olvide de regar el jardín es de 2/3. El jardín no
está en muy buenas condiciones, así que, si se le riega, tiene la misma
probabilidad de progresar que de estropearse, pero la probabilidad de que
progrese si no se le riega es de 0,25. Si el jardín se ha estropeado, ¿cuál es la
probabilidad de que la persona olvidara regarlo?
10. En una biblioteca, hay dos estantes con 150 libros cada uno. En el primero hay 65
libros en mal estado y en el segundo 40. Un estudiante escoge al azar un libro del
primer estante y lo deja en el segundo. ¿Cuál es la probabilidad de que otro
estudiante escoja al azar un libro en buen estado del segundo estante?

TEOREMA DE BAYES
1. La dueña del restaurante MI COMAL, observó que el 65 % de todos sus clientes
consumen salsa verde, el 70 % consume salsa roja y el 80 % consume salsa verde
o roja. ¿Cuál es la probabilidad de que un cliente consuma las dos salsas al
mismo tiempo?
2. La compañía FedEx usa 4 coches de transporte: A1, A2, A3 y A4. Se sabe que
20% de los embarques se asignan a la empresa A1, 25% a la A2, 40% a la A3 y
15% a la A4. Los embarques llegan retrasados a sus clientes en 7% si los entrega
A1, 8%si es A2, 5% si es A3 y 9% si es A4. Si sabemos que el embarque de hoy
fue entregado con retraso, ¿cuál es la probabilidad de que haya sido la empresa
A1 la encargada de hacerlo?

34
3. Un Médico Cirujano, con especialidad en Cirugía Plástica y Reconstructiva. Entre
sus pacientes, el 20% se realizan correcciones faciales, un 35% implantes
mamarios y el restante en otras cirugías correctivas. Se sabe, además, que son
de género masculino el 25% de los que se realizan correcciones faciales, 15%
implantes mamarios y 40% otras cirugías correctivas. Si se selecciona un paciente
al azar, determine:
a) Determine la probabilidad de que sea de género masculino.
4. Tenemos una urna con cuatro bolas amarillas y tres bolas negras .si realizamos
dos extracciones sin reemplazamiento, calcular la probabilidad de:
a) Sabiendo que la primera bola es negra, que la segunda también lo sea.
b) Sabiendo que la segunda bola es negra, que la primera también lo sea.
c) Sabiendo que la segunda bola es negra, que la primera sea amarilla.
d) Sabiendo que la primera bola es negra, que la segunda sea amarilla.
5. Supongamos que, en el Acuario de Veracruz se tienen solo 2 especies de peces.
El 40 % de los peces del acuario son de la especie azul, y el 60% restante, son
de la especie roja. De la especie azul, el 30 % son machos; mientras que, de la
especie roja, el 40% son hembras. Si se selecciona un pez al azar,
a) Si resulta que es hembra, ¿cuál es la probabilidad de que sea de la especie
azul?
b) Si resulta que es macho, ¿cuál es la probabilidad de que sea de la especie
azul?
6. La fábrica de Bershka, que elabora su ropa, posee tres máquinas, las cuales
producen el 50%, 30% y 20% de la ropa respectivamente. El índice de defectos
reportados de las máquinas es del 4%, 3% y 2% respectivamente. Si tomamos
una prenda al azar y resulta ser defectuosa. Calcula la probabilidad de haber
sido producida por la segunda máquina.
7. Tenemos dos urnas: la primera urna con 4 bolas rojas y 6 negras, y la segunda
con 2 bolas rojas y 4 negras. Escogemos una urna al azar, y extraemos una bola
y resulta ser roja, ¿cuál es la probabilidad de haber sido extraída de la primera
urna?
8. En la empresa TAMSA, el 40% de los empleados son egresados del ITVER, y el
20% son egresados de la UV. El 75% de los egresados del ITVER ocupan un
puesto alto, y el 30% de los egresados de la UV también, mientras que los demás
trabajadores, egresados de otras universidades de Veracruz y alrededores,
solamente el 20% ocupa un puesto alto. ¿Cuál es la probabilidad de que un
empleado de puesto alto elegido al azar sea egresado del ITVER?

35
9. Se encuesta a 200 adultos para un estudio oftalmológico, podemos notar que, 40
adultos usan lentes, 50 adultos son hombres y 20 adultos son hombres y usan
lentes. ¿Cuál es la probabilidad de que uno de esos adultos sea mujer y no use
lentes?

a) Se sabe que el 50% de la población fuma, y que el 10% fuma y es hipertenso.


¿Cuál es la probabilidad de que un fumador sea hipertenso?

36
Unidad iv
DISTRIBUCIONES EN
GENERAL

37
38
39
40
41
42
43
44
45
46
1. Dos tratamientos A y B curan una determinada en un 30% y 50% de los casos,
ambos actúan de modo independiente, ¿Cuál de las dos estrategias siguientes
es menor?
a) Aplicar ambos tratamientos a la vez
b) Aplicar primero el tratamiento B, y si no suerte efecto aplicar el tratamiento A.

2. Tenemos una urna con cuatro bolas amarillas y tres bolas negras .si realizamos
dos extracciones sin reemplazamiento, calcular la probabilidad de:
a) Sabiendo que la primera bola es negra que la segunda también lo sea.
b) Sabiendo que la segunda bola es negra que la primera también lo sea.
c) Sabiendo que la segunda bola es negra que la primera sea amarilla.
d) Sabiendo que la primera bola es negra que la segunda sea amarilla.

47
3. En tres máquinas, A, B y C, se fabrican piezas de la misma naturaleza. El
porcentaje de piezas que resultan defectuosas en cada máquina es,
respectivamente, 1%, 2% y 3%. Se mezclan 300 piezas, 100 de cada máquina, y
se elige una pieza al azar, que resulta ser defectuosa. ¿Cuál es la probabilidad
de que haya sido fabricada en la máquina A?

4. En cierto país donde la enfermedad X es endémica, se sabe que un 12% de la


población padece dicha enfermedad. Se dispone de una prueba para detectar la
enfermedad, pero no es totalmente fiable, ya que, da positiva en el 90% de los
casos de personas realmente enfermas; y da positiva en el 5% de personas
sanas. ¿Cuál es la probabilidad de que esté sana una persona a la que la prueba
le ha dado positiva?

5. Una fábrica de tornillos tiene dos máquinas, la que es más antigua, y hace el de
todos los tornillos, y la más nueva pero pequeña, que hace el de los tornillos.
La hace un de tornillos defectuosos, mientras que la tan sólo hace un de tornillos
defectuosos. Si escogemos un tornillo al azar, ¿qué probabilidad hay de que salga
defectuoso?

6. Tenemos tres cajas con bombillas. La primera contiene bombillas, de las cuales
hay cuatro fundidas; en la segunda hay seis bombillas, y tan sólo una fundida, y
en la tercera hay tres bombillas fundidas de un total de ocho. Si cogemos una
bombilla fundida, ¿cuál es la probabilidad de que sea de la caja?

7. En un congreso se reúnen médicos de Europa, de los cuales son alemanes;


franceses, e ingleses. De estos médicos, el de los alemanes, el de los franceses y
el de los ingleses están a favor de utilizar una nueva vacuna para la gripe. Si
escogemos un médico al azar, y está a favor de aplicar la vacuna, ¿cuál es la
probabilidad de que sea francés?

8. Se estima que el 15% de la población adulta padece de hipertensión, pero que


el 75% de todos los adultos creen no tener este problema. Se estima también
que el 6% de la población tiene hipertensión, aunque no es consciente de
padecerla. Si un paciente adulto opina que no tiene hipertensión, ¿cuál es la
probabilidad de que realmente sea hipertenso?
48
9. Un test detecta la presencia de cierto tipo T de bacterias en el agua con
probabilidad 0.9, en caso de haberlas. Si no las hay, detecta la ausencia con
probabilidad de 0.8. Sabiendo que la probabilidad de que una muestra de agua
contenga bacterias del tipo T es 0.2, Calcular la probabilidad de que:
a) Realmente haya presencia de bacterias cuando el test ha dado resultado
positivo.
c) Realmente haya presencia de bacterias cuando el test ha dado resultado
negativo.
d) Haya bacterias y además el test dé positivo.

10. En la enfermera del doctor Martínez no se puede confiar, pues durante la ausencia
del médico la probabilidad de que no le inyecte un suero a un enfermo es de 0.6.
Se sabe que si a un enfermo grave se le inyecta el suero tiene igual probabilidad
de mejorar que de empeorar, pero si no se le inyecta entonces la probabilidad de
que mejore es de 0.25. A su regreso, el Dr. Martínez se encuentra con que un
enfermo ha empeorado. ¿Cuál es la probabilidad de que la enfermera olvidara
inyectar el suero a este paciente?

11. Se sabe que el 50% de la población fuma y que el 10% fuma y es hipertensa.
¿Cuál es la probabilidad de que un fumador sea hipertenso?
A=ser hipertenso
B= ser fumador
A Ç B = ser hipertenso y fumador
p(A|B) = 0,10/0,50 = 0,20

12. Se sabe por estudios previos que el 0,1% de la población tiene problemas
vasculares. Un estudio sobre individuos con problemas vasculares revela que el
20% de ellos son placas de ateroma. Si el 10% de los individuos con placas de
ateroma están expuestos a muerte súbita por desprendimiento de trombos ¿qué
probabilidad tiene un individuo cualquiera de estar expuesto a muerte súbita por
desprendimiento de trombos de una placa de ateroma?

49
13. Una urna contiene 2 bolas rojas, 2 verdes y 2 azules. Se saca una bola y sin
devolverla a la bolsa se saca otra bola. ¿Cuál es la probabilidad de que la
segunda bola sea roja?
a) ¿Si la primera es azul?
b) ¿Si la primera es verde?
c) ¿Si la primera es roja?

14. En un centro escolar los alumnos pueden optar por cursar como lengua extranjera
inglés o francés. En un determinado curso, el 90% de los alumnos estudia inglés
y el resto francés. El 30% de los que estudian inglés son chicos y de los que
estudian francés son chicos el 40%. El elegido un alumno al azar, ¿cuál es la
probabilidad de que sea chica?

15. Ante un examen, un alumno sólo ha estudiado 15 de los 25 temas


correspondientes a la materia del mismo. Éste se realiza extrayendo al azar dos
temas y dejando que el alumno escoja uno de los dos para ser examinado del
mismo. Hallar la probabilidad de que el alumno pueda elegir en el examen uno de
los temas estudiados.

16. Una clase está formada por 10 chicos y 10 chicas; la mitad de las chicas y la
mitad de los chicos han elegido francés como asignatura optativa.
a) ¿Cuál es la probabilidad de que una persona elegida al azar sea chico o
estudie francés?
b) ¿Y la probabilidad de que sea chica y no estudie francés?

17. En una clase en la que todos practican algún deporte, el 60% de los alumnos
juega al fútbol o al baloncesto y el 10% practica ambos deportes. Si además hay
un 60% que no juega al fútbol, cuál será la probabilidad de que escogido al azar
un alumno de la clase:
a) Juegue sólo al fútbol.
b) Juegue sólo al baloncesto.
c) Practique uno solo de los deportes.
d) No juegue ni al fútbol ni al baloncesto.

50
18. En una ciudad, el 40% de la población tiene cabellos castaños, el 25% tiene ojos
castaños y el 15% tiene cabellos y ojos castaños. Se escoge una persona al
azar:
a) Si tiene los cabellos castaños, ¿cuál es la probabilidad de que tenga
también ojos castaños?
b) Si tiene ojos castaños, ¿cuál es la probabilidad de que no tenga cabellos
castaños?
c) ¿Cuál es la probabilidad de que no tenga cabellos ni ojos castaños?

19. En un aula hay 100 alumnos, de los cuales: 40 son hombres, 30 usan gafas, y
15 son varones y usan gafas. Si seleccionamos al azar un alumno de dicho curso:
a) ¿Cuál es la probabilidad de que sea mujer y no use gafas?
b) Si sabemos que el alumno seleccionado no usa gafas, ¿qué probabilidad
hay de que sea hombre?

20. En una estantería hay 60 novelas y 20 libros de poesía. Una persona A elige un
libro al azar de la estantería y se lo lleva. A continuación, otra persona B elige otro
libro al azar.
a) ¿Cuál es la probabilidad de que el libro seleccionado por B sea una
novela?
b) Si se sabe que B eligió una novela, ¿cuál es la probabilidad de que el libro
seleccionado por A sea de poesía?

1. Haciendo uso de la tabla que proporciona áreas a la izquierda de cada valor z de


la distribución normal tipificada, Calcular las probabilidades (áreas) siguientes:
a) Pr(z<-0'338)
b) Pr(z>2'1)
c) Pr(z>-1)
d) Pr(-1'39

2. La temperatura durante setiembre está distribuida normalmente con media 18,7ºC


y desviación estándar 5ºC. Calcule la probabilidad de que la temperatura
durante setiembre esté por debajo de 21ºC.
51
3. En una ciudad se estima que la temperatura máxima en el mes de junio sigue una
distribución normal, con media 23° y desviación típica 5°. Calcular el número
de días del mes en los que se espera alcanzar máximas entre 21° y 27°.

4. La media y los que de los pesos de 500 estudiantes de un colegio es 70 kg y


la desviación típica 3 kg. Suponiendo que los pesos se distribuyen
normalmente, hallar cuántos estudiantes pesan:
a) Entre 60 kg y 75 kg.
b) Más de 90 kg
c) Menos de 64 kg.
d) 64 kg exactamente.

5. Se supone que los resultados de un examen siguen una distribución normal con
una media de 78 y desviación típica 36. Se pide:
a) ¿Cuál es la probabilidad de que una persona que se presenta el examen
obtenga una calificación superior a 72?
b) Si se sabe que la calificación de un estudiante es mayor que 72 ¿cuál es la
prioridad de que su calificación sea, de hecho, superior a 84?

6. Tras un test de cultura general se observa que las puntuaciones obtenidas siguen
una distribución una distribución N (65, 18). Se desea clasificar a los examinados
en tres grupos (de baja cultura general, de cultura general aceptable, de excelente
cultura general) de modo que hay en el primero un 20% la población, un 65% el
segundo y un 15% en el tercero. ¿Cuáles han de ser las puntuaciones que
marcan el paso de un grupo al otro?

7. Varios test de inteligencia dieron una puntuación que sigue una ley normal con
media 100 y desviación típica 15.
a) Determinar el porcentaje de población que obtendría un coeficiente entre 95
y 110.

8. En una ciudad una de cada tres familias posee teléfono. Si se eligen al azar 60
familias, calcular la probabilidad de que entre ellas haya por lo menos 20 tengan.

52
9. En un examen tipo test de 250 preguntas de elección múltiple, cada pregunta tiene
una respuesta correcta y una incorrecta. Se aprueba si se contesta a más de 112
respuestas correctas. Suponiendo que se contesta al azar, calcular la
probabilidad de aprobar el examen.

10. Un estudio ha mostrado que, en un cierto barrio, el 70% de los hogares tienen al
menos dos televisores. Se elige al azar una muestra de 40 hogares en el citado
barrio. ¿Cuál es la probabilidad de que al menos 20 de los citados hogares tengan
cuando menos dos televisores?

11. Los pesos de 1,000 soldados presentan una distribución normal media de 70 kg,
y una varianza típica de 9 kg. Calcula la probabilidad de que un soldado elegido
al azar pese menos de 8 kg.

12. La vida media de los habitantes de un país es de 70 años, con una varianza
típica de 15. Eligiendo una persona al azar, ¿Cuál es la probabilidad de que viva
más de 75 años?

13. El tiempo necesario para llenar un frasco de un producto es una variable que sigue
una distribución con una media de 8 minutos y una desviación típica de 2
minutos. ¿Cuál es la probabilidad de que un frasco tarde en llenarse más de 7
minutos?

14. El consumo anual de cerveza de los habitantes de un país es de 65 litros, con una
varianza de 25 litros. Se supone que se distribuye según una distribución normal,
¿Cuál es la probabilidad de que una persona beba entre 55 y 60 litros al año?

15. Un fabricante de baterías asegura que su duración sigue una distribución normal
con una desviación típica de 0.8 años, y una media de 10 años, ¿Cuál es la
probabilidad de que una batería dure más de 11 años?

16. Los 460 alumnos de un centro tienen 156 cm. de estatura media con una
varianza de 81 cm.
a) Determine el porcentaje de alumnos que miden más de 160 cm.
b) ¿Cuántos alumnos miden entre 140 y 150 cm.?

53
17. Determine la media y la desviación típica de las puntuaciones de un test de
agresividad que se aplicó a 120 individuos, sabiendo que 30 alcanzaron menos
de 40 puntos y que el 60% obtuvieron puntuaciones comprendidas entre 40 y 90
puntos.

18. El percentil 60 de una distribución normal de varianza 80 es igual a 72. ¿Cuál es


su media? Si el número de individuos que la integran es 850, ¿cuántos tienen
entre 50 y 80 puntos?

19. La desviación típica de la distribución de estaturas de los 200 alumnos de un


centro es igual a 4 cm. Si 42 miden menos de 150 cm., Determine el promedio
de la distribución.

20. El 80% de los integrantes de un grupo de personas tienen menos de 30 años.


Sabiendo que la edad media del grupo es de 24 años, Calcule su desviación
típica.

1. El gerente de Bimbo afirma que 35% de la población en Veracruz prefiere el pan


blanco que el integral. Hallar la probabilidad de:
a) Exactamente 80000, personas prefieran el pan blanco.
b) A lo más 40000 personas prefieran el pan blanco.

2. Se realizó un estudio donde se establece que 9% de 200 familias tienen un Ford.


Hallar la probabilidad de que exactamente 4 familias tengan uno.

3. Se realizó un conteo en INEGI donde 100 familias de cada mil tienen casa propia.
Hallar la probabilidad de que a lo más 700 familias seleccionadas al azar no tenga
casa.

4. El gerente de Bonafont dice que 25% de las familias prefieren el natural que el
mineral. Cierto día su asistente visita 44 familias. Hallar la probabilidad de Ñ.
a) 6 familias exactamente prefieran agua natural.
b) Por lo menos 12 familias consuman agua mineral.

54
5. El director de Lala dice que 40% de la población compra leche Entera. Cierto día
el director visita a 80 familias. Hallar la probabilidad de:
a) 10 familias prefieran exactamente leche entera.
b) Por lo menos 12 familias leche deslactosada
c) A lo más 60 hayan comprado leche entera

6. El grupo Walmart dice que 35% de las personas compran cosas más allá de la
canasta básica. Cierta noche el gerente manda a su asistente a visitar a toda la
población de la ciudad de Xalapa. Hallar la probabilidad de:
a) 40000 personas exactamente compren azúcar, arroz, etc.
b) por lo menos 11000 personas compren cosas innecesarias.

7. 200 personas de 2000 realizan ejercicio. Hallar la probabilidad de que


exactamente 100 personas seleccionadas al azar no hagan ejercicios.

8. Algunos estudiantes del ITBOCA realizan su servicio. Hallar la probabilidad de


que a lo más 130 de ellos ya lo hayan hecho.

9. Hallar la probabilidad de que exactamente 50 familias en Veracruz tengan una


camioneta, si se sabe que el 16% de la población lo tiene.

10. El gerente de Yakult Hace un estudio donde se indica que el 18% de las personas
prefiere a la competencia. Va a la población de Piedras Negras donde habitan 7000
personas. Hallar la probabilidad de que haya exactamente 1500 personas que
consuman productos de otra empresa.

1. La compañía de Autopartes Bosch podrá surtir tanto piezas para autos eléctricos
como híbridos. Si la empresa fabrica unas 700 piezas por hora y se conoce que
un 4% de los mismos salen defectuosos. ¿Cuál es la probabilidad de que si
tomamos 170 de las 700 piezas 20 de estas salgan con defecto?

55
2. Las tiendas Yepas del estado de Veracruz afirman que al mes le llegan
160 productos marca Pepsi. Sin embargo, se conoce que al menos 5% llegan
defectuosos, Calcular la probabilidad de que si tomamos 30 productos de los
160 a lo menos 3 salgan defectuosos.

3. La papelería TONY compra por mayoreo un total de 500 libretas, entre ellas
están las de rayas, doble raya, blancas y cuadriculadas. El dueño de la papelería
ha reconocido que el 7% de estas libretas no tienen las 100 hojas completas
¿Cuál es la probabilidad de que si tomas 22 libretas al azar a lo más 7 de ellas
vengan con menos de 100 hojas?

4. La tienda de abarrotes “KIRY” durante la última revisión se percató de que sus


empleados tenían al menos 10 errores por hora durante la acomodación de
mercancía. Identificar la probabilidad:

a) 4 errores en 30 minutos.
b) Al menos 6 errores.
c) Al menos 5 errores en 25 minutos.

5. La empresa Cinépolis reporta que su índice de defectos es del 5%, si compra


120 kg de maíz palomero, Obtener la probabilidad de que existan 14 kg con
defectos.

6. Se conoce que el grupo de Ingeniería química del grupo B son muy regulares en
sus calificaciones, solo el 5% de sus alumnos llevan un promedio perfecto de
100. ¿Cuál es la probabilidad de que si tomamos 25 alumnos de ese grupo 8
tengan promedio de 100?

7. En la tienda de los Six los clientes de la primera caja llegan conforme a una
distribución de Poisson con un promedio de 6 por hora. Calcular la probabilidad
de que:

a) A lo menos paguen 4 clientes

8. En la tienda comercial Chedraui se atienden en promedio por Caja 48 personas


cada 2 horas. Encontrar la probabilidad de que en 30 minutos se atiendan al
menos 14 personas y que en 50 minutos se atiendan a lo más 38.

56
9. En una empresa el 13% de sus registros contables presentan algún
inconveniente, si un auditor toma una muestra de 29 registros calcular la
probabilidad de que existan 7 registros con problemas.

1. El 65% de los alumnos de Tecnológico de Veracruz ya tienen el inglés para


titularse ¿cuál es la probabilidad de que 1,000 estudiantes 100 si tengan el
inglés ya acreditado?

2. La probabilidad de que un paciente se recupere de una rara enfermedad de la


sangre es de 0.4. Si se sabe que 100 personas han contraído esta
enfermedad. Cuál es la probabilidad de que:
a) ¿Al menos 30 sobrevivan?,
b) ¿Más de 46 sobrevivan?,
c) ¿Menos de 50 no sobrevivan?

3. Una fábrica de chocolates produce al día 100,000 chocolates y tiene una


probabilidad de 0.99 de que no produzca esa cantidad al día ¿Cuál es la
probabilidad de que:
a) ¿Más de 50,000 se produzcan?
b) ¿Al menos 90,000 se fabriquen?
c) ¿Menos de 1,000 chocolates no se fabriquen?

4. Una prueba de opción múltiple tiene 200 preguntas, cada una con 4
posibles respuestas, de las cuáles solo una es la correcta ¿cuál es la
probabilidad de que al azar se den de 25 a 30 respuestas correctas para 80
de las 200 preguntas acerca de los cuales el estudiante no tiene
conocimientos?

5. Si 35% de los productos manufacturados en cierta línea de producción es


defectuoso, ¿cuál es la probabilidad de que entre los siguientes 1000
productos manufacturados en esa línea.
a) ¿Menos de 354 productos sean defectuosos?,
b) ¿Entre 342 y 364 productos sean defectuosos?,
c) ¿Exactamente 354 productos sean defectuosos?
57
6. La empresa de asuntos fiscales Theresa Tax Service se especialízala
elaboración de declaraciones de impuestos de clientes profesionales (médicos,
dentistas, contadores, abogados). Una auditoria reciente de las declaraciones
indicó que 5% de las declaraciones del año anterior preparadas por la
empresa tenían algún error. Suponiendo que la tasa continúe en este año, y la
empresa elaboró 60 declaraciones, Cuál es la probabilidad de que cometa
algún error en:
a) ¿Más de 6 declaraciones?
b) ¿Al menos 6 declaraciones?
c) ¿Exactamente 6 declaraciones?

7. Un granjero quiere vender una parte de su ganado de vacas, pero la


probabilidad de venta es de 0.6 y el granjero tiene unas 500 vacas en su
ganado. Cuál es la probabilidad de:
a) De que al menos 75 venda
b) Más de 150 venda
c) ¿Menos de 25 no venda?

8. En una playa llega una probabilidad de 0.77 de capacidad máxima por cada
verano y su capacidad máxima es de 20,000 personas. Cuál es la
probabilidad de que:
a) ¿Más de 10,000 personas vayan a la playa?
b) ¿Al menos 15,000 vayan?
c) ¿Menos de 1,500 no vayan?

9. El 45% de todos los empleados de una dependencia pública poseen título


que los acredita para el puesto. ¿Cuál es la probabilidad de que de los 160
empleados elegidos al azar 75 posean título para el puesto?

10. En una fábrica de Autos se ensamblan 150 autos al día con una probabilidad
de 75% que ninguno tenga ninguna falla ¿Cuál es la probabilidad de que 30
autos vengan con fallas?

58
Unidad v
MUESTREO Y
ESTIMACIÓN

59
60
61
62
63
64
Resumen Unidad 6
PRUEBAS DE HIPÓTESIS EN GENERAL, ANÁLISIS DE
VARIANZA Y CORRELACION

Es frecuente que como profesionistas nos enfrentemos constantemente ante la necesidad de tomar
decisiones estadísticas, es decir, acerca de una población con base en su información muestral.
Donde para poder decidir plantearemos hipótesis sobre la distribución de probabilidad de las
poblaciones que pueden ser o no ciertas, y si su fin es ser rechazadas se conocen como hipótesis
nulas (H0) y en caso de que la hipótesis sea distinta o difiera a la dada se llama hipótesis alternativa
(H1).

Los procedimientos que facilitan el decidir si una hipótesis se acepta o se rechaza o el determinar
si las muestras observadas difieren significativamente de los resultados esperados se llaman
ensayos de hipótesis, ensayos de significación o reglas de decisión, que toman en cuenta el nivel
de confianza (1- α), o bien, el nivel de significancia/error (α); así como el tipo de ensayo (unilateral
o bilateral).

Los 8 pasos metodológicos para resolver problemas de hipótesis son: graficar el dibujo, redactar
H0, redactar H1, delimitar el estadístico de prueba, emplear el modelo matemático, aplicar reglas
de decisión, toma de decisión (se acepta o rechaza H0) y se define decisión.

Prueba de Z para una Media


🙠 Evalúa cuando las muestras son grandes (Ν ≥ 30), las distribuciones muestrales tienen una
distribución normal y les precede un estudio exploratorio de la media muestral () y la
poblacional (μ), donde la desviación poblacional y el tamaño de muestra se emplean para
calcular la desviación típica de una distribución muestral de medias (σΧ), valor que divide
la diferencia entre y μ para dar la puntuación de Z.

Prueba de Z para Diferencia entre 2 Medias


🙠 Tiene las mismas características y condiciones de la prueba anterior, pero con la diferencia
de que se conocen las medias y desviaciones muestrales. Donde la diferencia de las medias
dividida entre la raíz cuadrada de la suma de las desviaciones muestrales entre sus
respectivos tamaños de muestra nos proporcionará la puntuación de Z.

Prueba Z para una Proporción


🙠 Aquí conocemos la proporción de “éxitos” en una muestra (P), donde 𝑝 es la proporción
poblacional de éxitos y 𝑁 es el tamaño de la muestra, y Z surge de la resta de la proporción
muestral menos la proporción poblacional entre 𝜎𝑝 = √𝑝𝑞/𝑁 , donde 𝑞 = 1 − 𝑝.

65
Prueba Z para 2 Proporciones
🙠 El modelo matemático para Z viene de la diferencia de las proporciones muestrales (𝑃1 −
𝑃2 ) entre la raíz cuadrada del producto de la estimación de la proporción poblacional
𝑋 +𝑋
(𝑝𝑞, donde 𝑝 = 𝑁1 +𝑁2 ) por la suma de 1 entre muestras grandes de tamaños 𝑁1 y 𝑁2.
1 2

Prueba t de Student
🙠 A partir de esta prueba trabajamos con muestras chicas (Ν ≤ 30) y emplearemos los grados
de libertad (𝐺. 𝑙. = 𝑁 − 1). El valor del estadístico 𝑡 surge de la diferencia de la media
experimental menos la media histórica entre la desviación dividida por la raíz cuadrada
del tamaño de la muestra experimental menos 1.

Prueba t para diferencia entre 2 medias


🙠 Cuenta con 𝐺. 𝑙. = 𝑁1 + 𝑁2 − 2, tenemos las medias de dos muestras que han de ser
restadas y divididas entre el producto de σ por la raíz cuadrada de la suma de las
𝑁1 𝑆12 +𝑁2 𝑆22
desviaciones muestrales entre sus respectivos tamaños de muestra, donde 𝜎 = √ 𝐺.𝑙

Prueba χ2 para diferencia entre 2 o más proporciones


🙠 𝐺. 𝑙. = (#𝑓𝑖𝑙𝑎𝑠 − 1)(#𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠 − 1). Para cada muestra se calcula χ2, que es la
diferencia elevada al cuadrado del valor de cada muestra o frecuencia observada menos
su frecuencias esperadas o teóricas(ek) sobre su ek. Y la sumatoria de χ2 de todas las
muestras nos da el valor del estadístico.

Prueba F de Fisher
🙠 Se parece a χ2 (sesgada a la derecha) y trabaja con muestras no necesariamente chicas.
Cuenta con distintos modelos matemáticos dependiendo de las hipótesis alternativas.

ANOVA
🙠 Requiere de población necesariamente distribuida y se utiliza cuando nos interesa la
diferencia entre más de dos medias muestrales. Contamos con mediciones, observaciones
o tratamientos (𝑎) con repeticiones (𝑏) a cada muestra, que se acomodan en una tabla de
𝑎 filas por 𝑏 columnas para calcular medias de renglón y posteriormente la gran media.
La variación entre columnas se trata de los cuadrados de las desviaciones de las medias
de los tratamientos X respecto a la gran media por 𝑏. La variación dentro columnas se
trata de los cuadrados de las desviaciones de las X respecto a las medias de los tratamientos
por 𝑏 − 1. 𝐺. 𝑙. 𝐸 = (𝑎 − 1) 𝐺. 𝑙. 𝐷. = 𝑎(𝑏 − 1)

Correlación y Regresión Lineal


🙠 La correlación es el grado de relación entre las variables en consideración, en el que se
busca determinar qué tan bien una ecuación lineal, o de otro tipo, describe o explica la
relación entre las variables, que pueden visualizarse en un diagrama de dispersión. El
proceso de estimación de la variable dependiente a partir de una o más variables
independientes se conoce como regresión. Cuando intervienen sólo dos variables se habla
de correlación simple y de regresión simple o lineal.

66
PRUEBA DE Z PARA 1 MEDIA
1. El supervisor del departamento de lácteos de Chedraui Portal reportó que las
personas en promedio en la semana compran 5L de leche, el gerente de ventas de
Chedraui Portal encuestó a 72 personas, los cuáles afirman que consumen 3L a la
semana, con una desviación típica de 1L.
¿Podemos afirmar que actualmente las personas consumen menos que lo reportado
por el supervisor del departamento de lácteos?; suponer α=0.01.

2. El Sr. Orozco, dueño del restaurante “Mar y Agua”, informa que alrededor de 30
personas en promedio piden comida que no es del mar. La Sra. Margarita, gerente
del lugar encuestó a 50 personas sobre que preferían, si comida que no sea del mar
o que sea del mar; y como resultado obtuvo que son 32 personas que prefieren que
no sean del mar, con una desviación típica de 5.
¿Podemos concluir que, al día de hoy, más personas prefieren que no sean del mar,
a que lo sean?; suponer α=0.05.

3. La Licenciada Juárez, encargada de ventas de productos LALA, en Chedraui Nuevo


Veracruz, reportó el mes pasado que a la quincena en promedio cada familia 3L de
leche deslactosada; Valeria Vázquez, estudiante de marketing, después de
entrevistar a 73 familias afirma que estas consumen 2L de leche deslactosada a la
quincena, con una desviación típica de 0.5L.
Entonces, ¿podemos afirmar que en la actualidad las familias que compran leche
deslactosada en Chedraui consumen menos de lo reportado anteriormente por la
Licenciada Juárez?; suponer α=0.01.

PRUEBA DE Z PARA DIFERENCIA ENTRE 2 MEDIAS


1. En un salón de clases hay 38 niñas y 38 niños, se realiza una encuesta de cuánto
tiempo pasan haciendo la tarea; las niñas en promedio tardan 120 minutos y los
niños 100 minutos, las niñas con una desviación muestral de 12 y los niños con una
desviación muestral de 16.
¿Podemos concluir que las niñas tardan más que los niños haciendo tarea?; suponer
α=0.1.

67
2. De los 50 alumnos de la ESTI78, interesado en algún deporte, se obtiene una estatura
media de 170 cm y una desviación típica de 10 cm, mientras que de los otros
estudiantes que los les interesaba ningún deporte se obtuvo una media de 165 cm y
una desviación típica de 11 cm.
¿Podemos concluir que los alumnos que mostraron desinterés en los deportes son
más chaparros que los que sí?; suponer α=0.1.

3. En el restaurante Farolitos se encuentra trabajando un mesero llamado Octavio


Vergara, y trabaja dos turnos. Por la mañana acuden maestros, y Octavio es muy
amable con ellos, sin embargo, por la tarde acuden parejas de viejitos y con ellos el
trato y atención es mala.

De acuerdo con las entrevistas por su servicio se obtiene lo siguiente:


Matutino Vespertino
N1= 60 N2=60
1=50 2=39
S21=30 S22=20

¿Podemos concluir que existen diferencias en el trato que Octavio tiene con los clientes
en los 2 turnos que trabaja?; suponer α=0.1.

PRUEBA DE Z PARA 1 PROPORCIÒN


1. En una muestra aleatoria de 400 pantalones Levis para caballero, se percatan que
128 de ellos salieron en mal estado, ya que el cierre se encuentra defectuoso.
Se establece una hipótesis nula la cual indica que un 32% del total de muestra está
defectuoso.
¿Podemos afirmar que existen diferencias significativas entre ambos resultados?
X= 128; N= 400; π= 0.32; P=X/N; Suponer α= 10%

2. En una muestra aleatoria de 290 Calculadoras Casio Plus, se observó que 87 de ellas
no funcionan las teclas de ciertos números.
Se establece una hipótesis nula, la cual indica que un 30% del total de muestra esta
defectuoso.
¿Podemos afirmar que existen diferencias significativas entre ambos resultados?
X= 87; N= 290; π= 0.30; P=X/N; Suponer α= 10%

68
3. En la empresa TENARIS TAMSA los trabajadores revisan los tubos elaborados y
escogen de forma aleatoria 500 tubos de acero, en ellos se percatan e informan que
90 tubos tienen algún defecto ya que están mal cortados y no están a la medida. Con
ello se establece una hipótesis nula la cual indica que el 40% del total de la muestra
de 500 tubos tienen algún defecto.
¿Podemos afirmar que existen diferencias significativas entre los resultados
establecidos?
X= 90; N= 500; π= 0.40; P=X/N; Suponer α= 5%

PRUEBA DE Z PARA 2 PROPORCIÒN


1. 80 de 100 personas en U.S.A prefieren el Béisbol, porque según es un deporte más
completo; 70 de 100 personas en México opinan lo mismo.
¿Podemos afirmar que la causa de preferencia es la misma o es distinta?
Suponer α= 5

N1= 100; X1= 80; P1= X1/N1 N2= 100; X2=70; P2=X2/N2 P= N1+N2/X1+X2

2. 95 de 140 Alumnos de Ingeniería Mecánica de La UV les gusta tomar la clase de


Estadística porque se les hace entretenida e interesante; 125 de 150 alumnos de
Ingeniería Industrial opinan lo mismo.
¿Podemos afirmar que la causa de preferencia es la misma o distinta?
Suponer α= 5%

69
N1= 140; X1= 95; P1= X1/N1 N2= 150; X2=125; P2=X2/N2 P= N1+N2/X1+X2

3. 80 de 120 familias de México les gusta beber la leche Lala porque les encanta su
sabor; 90 de 140 familias de Veracruz opinan lo mismo.
¿Podemos afirmar que la causa de preferencia es la misma o distinta?
Suponer α= 5%

N1= 120; X1= 80; P1= X1/N1 N2= 140; X2=90; P2=X2/N2 P= N1+N2/X1+X2

PRUEBA DE T DE STUDENT
1. En la empresa TAMSA famosa por su producción de tubos de acero sin costura para
la industria, afirma que los tubos tienen un largo promedio (Mh)=10m con una (ŝ)=3m.
El inspector de calidad, el Ing. Pedro Pérez durante varias inspecciones afirma que
elige una muestra de 15 tubos de acero, los cuales tiene un largo promedio
(Me=12m).
Probar la Hipótesis de que la producción de tubos no se está llevando de manera
efectiva.
n=15 Mh=10m Me=12m α=5%

70
2. En una empresa encargada de la producción de corcholatas para los envases de
cerveza, el Ing. Torres asegura que el grosor promedio de una tapa es de (Mh)=0.040
pulgadas con una desviación estándar de (ŝ)=0.002 pulgadas. Dicha mañana el
inspector de calidad afirma que, al elegir una muestra de 10 corcholatas, estas tienen
un grosor de Me=0.043 pulgadas.
Probar la hipótesis de que la producción de corcholatas no se está llevando de
manera efectiva.
n=10 tapas Mh=0.040 ME=0.043 pulgadas α=5% ó 0.05

PRUEBA DE T DE STUDENT PARA DIFERENCIA ENTRE 2 MEDIAS


1. El ingeniero Tomas aplicó un examen final de un curso especial para 2 grupos, el
primer grupo con 10 alumnos y el segundo con 18 alumnos. Este examen le
comprobará que tanto han aprendido a lo largo de todo el curso especial.
ẊA=92 ẊB=98 α=0.1
Ŝ1=8 Ŝ2=6
¿Podemos concluir que existen diferencias significativas en los resultados entre los
2 grupos?

2. El entrenador de 2 equipos de futbol les aplica una prueba deportiva para ver cómo
están de condición física y ver si han mejorado su rendimiento. El primer equipo con
9 jugadores y el segundo con 17 jugadores.
ẊA=91 ẊB=97 α=0.1
Ŝ1=7 Ŝ2=5
¿Podemos concluir que existen diferencias significativas en los resultados de la
prueba entre los 2 grupos?

PRUEBA DE X2 PARA DIFERENCIA ENTRE 2 VARIANZAS


1. La St. Louis Metro Bus Company de Estados Unidos, desea dar una imagen de
confiabilidad haciendo que sus conductores sean puntuales en los horarios de llegada
a las paradas. La empresa desea que haya poca variabilidad en dichos tiempos. En
términos de la varianza de los tiempos de llegada de las paradas, la empresa desea
que la varianza sea de 4 minutos o menos. Esta prueba de hipótesis se realiza con
un nivel de significancia de α = 0.05
Asuma que en una muestra aleatoria de 24 llegadas a cierta parada en una
intersección en el centro de la ciudad, la varianza muestral encontrada es s2=4.9

71
2. Una compañía fabrica propulsores para uso en motores de turbina. Al ingeniero de
manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la
rugosidad de la superficie. Para ello toma una muestra de n1=16 partes del primer
proceso, la cual tiene una desviación estándar s1= 4.7 micropulgadas, y una
muestra aleatoria de n2=12 partes del segundo proceso, la cual tiene una desviación
estándar s2= 5.1 micropulgadas. Se desea encontrar un intervalo de confianza del
90% para el cociente de las dos varianzas σ12 /σ22. Suponga que los dos procesos
son independientes y que la rugosidad de la superficie está distribuida de manera
normal.

PRUEBA DE X2 PARA DIFERENCIA ENTRE 2 O MAS PROPORCIONES


1. El Director general de Natury “Pedro Narváez” de acuerdo con un estudio y a través
de una matriz se entrevistaron a 400 personas que trabajan en 3 diferentes hoteles
esto con el motivo de saber si es necesario aumentar el metraje de los rollos de
papales PQL-paja o que permanezca igual.
Con los siguientes datos probar la hipótesis de nulidad y suponer α= 5%

Opinión Hoteles Mediterráneo Hotel mar Hotel


y tierra acuario

No aumentar 60 60 70
tamaño

Aumentar 70 80 60
tamaño

Total = 130 140 130

2. En la empresa Rivero el encargado de producción Juan Gómez realizó una entrevista


a 418 trabajadores de las otras 4 sucursales que hay para saber si están de acuerdo
en reducir los polines para que no se rompan las puntas de estos y tengan una mejor
calidad.
Con los siguientes datos probar la hipótesis de nulidad y suponer α= 5%

Opinión Sucursales Sucursal Sucursal Sucursal Sucursal Df


Amapolas puerto seco Puebla México

Reducir los polines 40 50 60 70

No reducir los 30 60 58 50
polines

Total= 70 110 118 120


72
PRUEBA DE F DE FISHER
1. El director general de BIMBO el Ing. Miguel Ángel Espinoza le comenta al Gerente de
control de calidad que desea averiguar cómo es la calidad del producto que ofrecen.
Para lo cual el Gerente Octavio Arenas extrae 𝟐𝟔 𝒑𝒂𝒏𝒆𝒔 blancos de la 𝑴á𝒒𝒖𝒊𝒏𝒂𝟏
con una 𝒔𝟐 = 𝟒𝟎𝟎 𝒈𝒓 y de la 𝐌á𝐪𝐮𝐢𝐧𝐚 𝟐 extrae 𝟐𝟓 𝒑𝒂𝒏𝒆𝒔 blancos con una 𝒔𝟐 =300 gr.
¿Podemos afirmar con un máximo de 10% de error si existen diferencias significativas
en la producción de los panes blancos de la Máquina 1 con los de la Máquina 2?

2. Una compañía fabrica propulsores para uso en motores de turbina para aviones. Al
ingeniero de manufactura le gustaría seleccionar el proceso que tenga la menor
variabilidad entre la rugosidad de la superficie, para ello toma una muestra de
16 𝑝𝑎𝑟𝑡𝑒𝑠 del primer proceso la cual tiene una 𝒔𝟐 = 𝟒. 𝟕 𝒎𝒊𝒄𝒓𝒐𝒑𝒖𝒍𝒈𝒂𝒅𝒂𝒔, y una
segunda muestra aleatoria de 𝟏𝟓 𝒑𝒂𝒓𝒕𝒆𝒔 del segundo proceso el cual tiene una
𝒔𝟐 =5.1 micropulgadas.
¿Podemos creer con un máximo de 10% de error si existen diferencias significativas
en la variabilidad de las piezas por cada proceso?

ANOVA

1. En un estudio realizado se compararon los efectos en las ventas de tres ofertas en el


Área de Zapatería de la tienda departamental SUBURBIA. A continuación, se
transcriben las ventas unitarias que utilizaron las promociones en 3 distintos meses.

Descuento al pagar 87 81 89
en efectivo.

Meses sin intereses. 91 87 90

3X2 en Zapatos. 78 69 83

a) Calcular las ventas unitarias promedio logradas con cada promoción y luego
determine la gran media.
b) Estime la varianza de la población usando la varianza ENTRE columnas.
c) Estime la varianza de la población usando la varianza DENTRO columnas,
calculada a partir de la varianza de las muestras.
d) Calcule la razón F en el nivel de significancia 0.05, ¿Producen las promociones
diferentes efectos en las ventas de dicha tienda departamental?

73
2. En un estudio se compararon los efectos que tuvieron en las ventas de 3 tipos de
leche LALA de 1LT en la tienda CHEDRAHUI. A continuación, se transcriben las
ventas que se tuvieron en 3 distintos semana.

ENTERA 67 74 81

SEMI 72 87 75
DESCREMADA

DESLACTOSADA 84 73 69

a) Calcular las ventas unitarias promedio logradas con cada promoción y luego
determine la gran media.
b) Estime la varianza de la población usando la varianza ENTRE columnas.
c) Estime la varianza de la población usando la varianza DENTRO columnas,
calculada a partir de la varianza de las muestras.
d) Calcule la razón F en el nivel de significancia 0.05, ¿Producen las promociones
diferentes efectos en las ventas?

PRUEBA CORRELACIÒN Y REGRESIÒN SIMPLE


1. En la empresa cervecera “Grupo Modelo”, se eligen a 9 gerentes para un programa
de capacitación, esto con el fin de verificar el grado de aprendizaje de estas personas
y a su vez su trabajo colaborativo. Sabiendo que dichos gerentes ejecutaron una
prueba de entrada en el mes de Julio y una prueba de salida en el mes de Noviembre.
Obteniendo los siguientes resultados:
GERENTES X Y 𝑿𝟐 𝒀𝟐 XY
1 50 75
2 60 72
3 52 78
4 62 96
5 65 79
6 56 87
7 54 74
8 53 77
9 67 91
TOTALES

a) Trazar el diagrama de dispersión para estos pares de datos.


b) Calcular el coeficiente de correlación lineal.
c) Probar la significación de P con 𝜶=0.05
d) Calcular la línea de mejor ajuste y trazarla en el diagrama de dispersión.
74
2. La familia Arenas Hernandez decide realizar un estudio sobre el nivel de desempeño
académico de los hijos en comparación con el desempeño de los padres dentro de la
familia. Obteniendo los siguientes resultados.
X (CALF. Y (CALIF.
N 𝑿𝟐 𝒀𝟐 XY
PADRES) HIJOS)
1 85 97
2 89 99
3 90 80
4 80 79
5 79 77
6 81 88
7 77 80
8 92 85
9 90 82
TOTALES

a) Trazar el diagrama de dispersión para estos pares de datos.


b) Calcular el coeficiente de correlación lineal.
c) Probar la significación de P con 𝜶=0.05
d) Calcular la línea de mejor ajuste y trazarla en el diagrama de dispersión.

75
76
77

También podría gustarte