Estadística I

APUNTES DE ESTADÍ STI CA I
ESTOS APUNTES PERTENECEN A:
ALEJANDRO VI LLAFAÑA NEGRETE
MATRI CULA 9478 GRUPO 441
LI CENCI ATURA EN MERCADOTECNI A
Estadística I

2
CAPITULO 1
INTRODUCCIÓN A LA ESTADÍSTICA

ANTECEDENTES
Puede decirse que la estadística nació con los primeros Estados, y ésa
es precisamente la etimología de la palabra estadística que deriva del término
latín status (estado).
En efecto, desde la Antigüedad los estados necesitaron recopilar datos
sobre sus respectivos dominios y con diversos propósitos: fiscal, militar,
agrícola, etc. Aunque estas primitivas estadísticas no tenían una finalidad
científica, proporcionaban información numérica útil para el estado, que a partir
del conocimiento estadístico del pasado y del presente podía establecer
hipótesis sobre el futuro que orientasen su acción política.
La palabra estadística la acuño el profesor Gottfried Achenwall (1719-
1772), siendo el Dr. E. A. W. Zimmerman quien introdujo el término en
Inglaterra. Su uso lo divulgó Sir John Sinclair en su obra titulada “Statical
Account of Scotland 1791-1799” (Informe estadístico sobre Escocia 1791-
1799), la verdadera estadística científica comenzó en el siglo XVII con los
trabajos de Pierre Simón Laplace (1749-1827) y de Carl Friedrich Gauss (1777-
1855), quienes obtuvieron importantes resultados a partir de su estudio de la
teoría de los errores y la probabilidad.
A lo largo del siglo XIX, la estadística se consolidó como disciplina
científica, herramienta auxiliar imprescindible para otras ciencias que facilitó
importantes descubrimientos. Ya en el siglo XX, los métodos de inferencia
estadística incorporaron la formulación matemática de las leyes de la
probabilidad.

DEFINICIÓN
Con el fin de estudiar inteligentemente el tema de la estadística
debemos, en primer lugar, comprender lo que el término significa:

ESTADÍSTICA.- Es un conjunto de técnicas mediante las cuales se
recopilan, organizan y analizan datos con el propósito de tomar decisiones.
Es una ciencia que se sirve de conjuntos de datos para obtener, a partir
de ellos, conclusiones basadas en el cálculo de probabilidades.


Las aplicaciones de la estadística en el mundo moderno son
innumerables y está presente como herramienta auxiliar en todas las ramas de
la ciencia, la industria y la economía.
La estadística tiene un gran campo de aplicación en diversas áreas de
estudio. Dentro de las aplicaciones típicas en el área administrativa económica
podemos mencionar:
- Pruebas de calidad
- Administración de personal
Estadística I

3
- Administración de recursos humanos
- Cotizaciones
- Pólizas de garantía
- Oportunidades de crédito
- Nivel de competencia
- Investigación de mercados
- Registros contables
- Análisis de proyectos de inversión
- Seguros de vida
- Accidentes de trabajo
- Presupuestos
- Desempleo
- Niveles de productividad
- Bolsa de valores
- Composición del sector industrial
- Auditorias
- Establecimiento de salarios
- Inventarios
- Predicciones en el nivel de ventas y demanda de productos.

CLASIFICACIÓN DE LA ESTADÍSTICA
La estadística se divide en dos áreas: descriptiva e inferencial.

1. Estadística descriptiva:

Incluye las técnicas y herramientas que nos permiten recolectar, organizar,
ordenar y resumir un conjunto de datos.
Estas técnicas pueden ser de índole distinta: gráficas tabulares o de
cálculo.

Algunas técnicas son:
*Gráficas: Histogramas, polígonos, ojivas.
* Tabulares: Distribuciones de frecuencia
* Cálculo: Obtener medidas de tendencia central y variación.

Ejemplos del uso de la aplicación de la estadística descriptiva:

 Calcular el promedio de artículos en inventario por mes
 Presentar gráficamente el comportamiento de ventas mensuales en una
empresa
 Determinar cuál de dos fábricas presenta una mayor variación en el
número de artículos producidos diariamente
 Calcular el salario medio de un grupo de trabajadores
 Representar gráficamente como está segmentado el mercado de
consumidores de acuerdo con marcas de refresco
 Determinar cuál es la falla más frecuente que se presenta en un grupo
de máquinas
 Clasificar un grupo de trabajadores de acuerdo con: la edad,
productividad, salarios, etc.
Estadística I

4


2. Estadística inferencial:

Comprende aquellas técnicas que nos permiten obtener y deducir
conclusiones acerca de una población basándose en resultados del estudio
de una muestra, con la finalidad de tomar decisiones. Debido a que estas
decisiones normalmente se toman en condiciones de incertidumbre se
requiere el uso de conceptos de probabilidad.

Algunas técnicas son:

 Distribución de muestreo
 Intervalos de confianza
 Pruebas de hipótesis
 Análisis de regresión y correlación
 Pruebas Xi cuadrada

Ejemplos de aplicación de la estadística inferencial:

- Se puede estimar la respuesta de los consumidores acerca de una
campaña publicitaria
- Se puede predecir los porcentajes de votantes que registrará cada
partido político en una elección
- Estimar cuantas de las declaraciones anuales de los contribuyentes
contienen errores o datos falsos
- Predecir el % de artículos defectuosos que se encuentran en un
embarque
- Encontrar si existe alguna relación entre la productividad de los
trabajadores con respecto a una nueva política de trabajo


TAREA: DAR TRES EJEMPLOS DE APLICACIÓN DE LA ESTADÍSTICA DESCRIPTIVA
Y DOS DE LA ESTADÍSTICA INFERENCIAL.

DESCRIPCIÓN Y RESUMEN DE DATOS

Los datos estadísticos se obtienen mediante un proceso que comprende
la observación o medición de conceptos como: ingresos anuales de una
comunidad, calificaciones de exámenes, cantidad de café por sobre,
resistencia a la ruptura de ciertos materiales, porcentaje de azúcar en
cereales, etc. Tales conceptos reciben el nombre de variables, ya que
producen valores que tienden a mostrar un cierto grado de diferencia al
efectuar mediciones sucesivas.
Estadística I

5

Dependiendo de la naturaleza de los datos a medir, las variables se
pueden clasificar de la siguiente manera:



Cualitativas

Variables
Continuas
Cuantitativas
Discretas


Las variables cualitativas (o nominales) permiten arreglar los datos en
categorías por ejemplo: contar cuantos profesores, ingenieros, administradores,
contadores hay en un grupo de personas; determinar si un producto es de
buena, mala o regular calidad; clasificar a los obreros como calificados o no
calificados, etc.

Las variables cuantitativas se determinan mediante valores numéricos
por ejemplo: las ganancias anuales de una empresa, la producción diaria de
petróleo, el tiempo requerido para rellenar un formulario gubernamental o el
valor de un inventario.

Las variables cuantitativas de dividen a su vez en dos tipos: continuas y
discretas.

Se denominan continuas cuando pueden asumir cualquier valor dentro
de un determinado intervalo, por ejemplo:
. El peso de un producto
. La temperatura del día
. La altura de una persona
. Los litros de gasolina vendidos en un día

Las variables discretas por el contrario, sólo pueden asumir ciertos
valores dentro de un intervalo, es decir números enteros, por ejemplo:
. Número de latas en una caja
. Número de máquinas en reparación
. Número de pedidos al día
. Cantidad de facturas en un archivero
. Número de clientes de una compañía
. Número de piezas defectuosas producidas por una máquina


TAREA: PROPORCIONAR 5 EJEMPLOS DE VARIABLE CUALITATIVA, 5 DE
VARIABLE CUANTITATIVA DISCRETA Y 5 DE VARIABLE CUANTITATIVA CONTINUA.
Estadística I

6


CAPITULO 2


ESCALAS DE MEDICIÓN


Una escala de medición nos permite realizar la medición y clasificación
de los datos a estudiar y está directamente relacionada con el tipo de
variable a medir.

Existen cuatro tipos de escala de medición:
1. Nominal
2. Ordinal
3. De intervalo
4. De razón

1.- Escala nominal.- Representa el nivel mínimo de medición y se utiliza
para variables de tipo cualitativo y consiste en categorizar solamente el
tipo de dato en algún grupo o con algún nombre.


Por ejemplo:

Variable.- Marca de zapato deportivo
Marca Número de pares
1 Nike 12
2 Adidas 50
3 New Balance 45
4 Concord 15

Otros ejemplos:
Sexo (masculino, femenino), religión (católico, protestante, testigo, etc.)


2.- Escala ordinal.- Permite además de categorizar los datos, darles un
orden de acuerdo con el grado en el que posean determinado atributo.

Por ejemplo:

Variable.- Calidad de un producto

Calidad Número de productos
1 Excelente 56
2 Buena 30
3 Regular 20
Estadística I

7

Otros ejemplos:
Nivel socioeconómico (bajo, medio, alto); complexión (delgada, media,
gruesa).

3.- Escala de intervalo.- Se utiliza para variables de tipo cuantitativo y
permite además de darle un orden, medir numéricamente las diferencias
que existen entre los datos. Es importante mencionar que no tiene un
cero absoluto, es decir, que sí una variable tiene el valor de cero no
indica que haya ausencia de la característica medida.


Por ejemplo:

Variable.- La edad en años cumplidos

Edad Número de personas
1 0
*
-10 25
2 11-20 30
3 21-30 48
4 Más de 30 5

(*) En este caso 0 años no significa que no tengan edad, sino que no
han cumplido aún un año (Cero Relativo).

Otros ejemplos:
La temperatura del día (0
0
no indica que no haya temperatura),
calificación de desempeño del empleado (0 no indica que no exista
desempeño, sino tal vez un mal desempeño), saldo promedio de una
tarjeta de crédito (0 no significa que no tenga saldo).


4.- Escala de razón.- Tiene las propiedades de una escala por intervalos,
con la excepción de que si posee un cero absoluto, es decir, el cero
indica ausencia total de la característica medida.

Por ejemplo:

Variable.- Número de artículos defectuosos en embarques

Número de artículos
defectuosos
Cantidad de embarques
1 0-20 10
2 21-40 5
3 41-60 1
4 Más de 60 0


Otros ejemplos:
Velocidad de un automóvil, cantidad de cafeína en un producto, número
de de cajas de cigarrillos en exhibición.

Estadística I

8
DISTRIBUCIONES DE FRECUENCIA

Es una tabla de resumen en la cual se agrupan en clases o categorías
los posibles valores de una variable y se registra el número de
observaciones (frecuencia) que corresponde a cada clase.
Las variables pueden ser cualitativas (nominales) o cuantitativas
(numéricas), y si son cuantitativas, las clases de la distribución pueden ser
de punto o de intervalo.

Ejemplos:
Variable Cualitativa





Variable Cuantitativa
Distribución de punto

Edad (Clase) Número de alumnos (frecuencia)
18 4
19 10
20 5
21 1
22 10
23 10
Total 40



Variable Cuantitativa
Distribución por intervalo
De extremo cerrado

Edad (clase) Número de alumnos
(frecuencia)
18-20 19
21-23 21
Total 40

Variable Cuantitativa
Distribución por intervalo
De extremo abierto

Edad (clase) Número de alumnos (frecuencia)
Menos de 20 14
20 o más 26
Total 40
Sexo (clase o categoría) Número de alumnos (frecuencia)
Masculino 25
Femenino 15
Total 40
Estadística I

9



CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS POR
INTERVALO

Una distribución de frecuencias se puede definir como: La tabulaciòn, o
el registro por marcas, del número de veces que se presenta una cierta
medición de una característica, dentro de la muestra o población que se está
examinando.

Para ejemplificar el procedimiento de construcción se tomará el siguiente
ejemplo:
La siguiente es una lista de los salarios diarios a destajo para los 30 obreros
que laboran en una fábrica.
24 28 30 33 26 30
28 24 31 26 29 30
31 28 28 25 26 26
32 32 28 26 24 32
25 28 27 27 29 30
Procedimiento:
1.- Calcular el rango: RANGO= DATO MAYOR – DATO MENOR
(A este procedimiento también se le conoce como Amplitud, Gama o Recorrido,
que es la medida más simple de dispersión).
RANGO= 33 – 24 = 9
2.- Determinar el número de clases con la fórmula siguiente, redondeando a un
valor entero que no sea menos a 4 ni mayor a 15:

Número de clases = Número de datos

# Clases = (30)
1/2
= 5.47 -> 5

Criterio de redondeo > ó = 0.5 hacia arriba y < 0.5 hacia abajo

3.- Determinar el intervalo de clase:

Intervalo= (Rango + 1) / Número de clases

Intervalo= (9+1) = 2
5
El resultado se debe redondear según la resolución de datos, si son enteros a
enteros, si tienen un decimal a un decimal, etc.

4.- Construir la tabla de distribución, anotando para cada clase el límite inferior,
superior y frecuencia (número de datos que incluye). En algunos casos se debe
agregar una clase más a las calculadas para que todos los datos estén en
alguna clase (sucede generalmente cuando el intervalo fue redondeado hacia
abajo en el paso anterior)

Estadística I

10


Número de clase Salario
Limite inferior
Salario
Limite superior
Frecuencia
1 24 25 5
2 26 27 7
3 28 29 8
4 30 31 6
5 32 33 4
Total 30



FRECUENCIA RELATIVA Y ACUMULADA

Clase Limite
inferior
Limite
superior
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
acumulada
Frecuencia
relativa
acumulada
Marca de
clase
1 24 25 5 16.7 % 5 16.7% 25
2 26 27 7 23.3% 12 40.0% 27
3 28 29 8 26.7% 20 66.7% 29
4 30 31 6 20.0% 26 86.7% 31
5 32 33 4 13.3% 30 100% 33

(Nota: Marca de clase: X
c
= Limite inferior + Intervalo)
2



TAREA: LOS DATOS QUE SE DAN A CONTINUACIÓN CORRESPONDEN A LA LONGITUD
MEDIA EN PIES PARA UNA MUESTRA DE 23 LANCHAS PESQUERAS:
66 65 96 80 71
93 66 96 75 61
69 61 51 84 58
73 77 89 69
57 56 55 78



CONSTRUYA UNA DISTRIBUCIÓN DE FRECUENCIAS COMPLETA PARA EL PROBLEMA






Estadística I

11


¿Población o Muestra?

Cuando no es posible trabajar con todos los datos de la población es
necesario trabajar con una muestra representativa. Los expertos en
estadística recogen datos de una muestra y utilizan esa información para
hacer inferencias sobre la población que representa esa muestra.
Así, una población es un todo y una muestra es una fracción o segmento
de ese todo.
La estadística reclama una muestra lo más grande posible a fin de
asegurar la máxima protección. Como resultado, el tamaño de la muestra
apropiado para un análisis, no se decide sobre la base de un cálculo
estadístico fijo, sino que por lo general hay que tomar en cuenta dos
factores:
1. El aspecto económico; o sea, ¿cuánto costará tomar cada
lectura?
2. La exactitud estadística que se requiere; es decir, ¿qué error se
puede permitir en la determinación de los valores de las medidas
de dispersión y de tendencia central de la distribución?.

Por lo tanto, se debe buscar una compensación entre los aspectos
económicos y estadístico.
Un profesionista capaz es aquel que puede llevar a la práctica los
conocimientos de la estadística, la lectura de la información y el cálculo de los
datos obtenidos, para con ello permitir que la toma de decisiones sea más
eficiente y la probabilidad de error disminuya.
La experiencia que se tenga del proceso de que se trate y el sentido común
del personal interesado, juega un papel importante en estas decisiones.
Heriberto Romo muestra una tabla muy práctica con margen de error de
+/- 5%, para determinar tamaños de muestra:
Tamaño del universo Tamaño de la muestra
10 10
20 19
50 44
100 79
200 131
500 216
1000 275
2000 319
5000 353
10 000 366
100 000 378
1 000 000 380
50 000 000 380
Fuente: Galindo Càceres Jesús (Coord.) “Técnicas de investigación en Sociedad, Cultura y
comunicación” México Ed. Pearson 1988, 528 pp

Estadística I

12
CAPITULO 3

REPRESENTACIONES GRÁFICAS.

Gráficas para variables cualitativas.

Gráfica de barras.- Se anotan sobre uno de los ejes las categorías y sobre el
otro eje la frecuencia (conteo) dibujando una barra para cada categoría.




Ejemplos:

Profesión
(clase)
Número de
Personas
(frecuencia)
% de
Personas

Grados
Grados
acumulados
Médico 25 16.7 60° 60°
Contador 10 6.7 24° 84°
Administrador 40 26.7 96° 180°
Ingeniero 50 33.3 120° 300°
Abogado 25 16.7 60° 360°

Total 150 100.1




Estadística I

13
Histograma
25
10
40
50
25
0
10
20
30
40
50
60
Profesión
F
r
e
c
u
e
n
c
i
a
No de personas 25
No de personas 10
No de personas 40
No de personas 50
No de personas 25
Médico Contador Administrador Ingeniero Abogado




Gráfica de Pastel (Pay).- La circunferencia es dividida de acuerdo con el % de
frecuencia (frecuencia relativa) que corresponda a cada categoría sobre la
base de 360°de la circunferencia.


Médico. 16.70%
Contador.
6.70%
Administrador.
26.70%
Ingeniero.
33.30%
Abogado.
16.70%
Médico Contador Administrador Ingeniero Abogado




Estadística I

14


TAREA: Construya una distribución de frecuencias para los alumnos de su
grupo por género (hombres y mujeres) y represéntelos gráficamente.
Construya la distribución de frecuencias y las gráficas para la pregunta 7 del
problema 6 de los ejercicios de la página 19 y 20.


GRÁFICAS PARA VARIABLES CUANTITATIVAS.

Histograma.- El histograma es la forma más común para la presentación de
datos clasificados. Es una gráfica a base de barras sin espacios intermedios
de una distribución de frecuencias. Se construye fabricando sobre el eje
horizontal los límites inferiores de clase y sobre el eje vertical la frecuencia
absoluta o frecuencia relativa. La escala vertical o eje Y generalmente
comienza en cero, mientras que el eje X o la escala horizontal puede iniciarse
con cualquier número adecuado que convenga como punto de partida para
iniciar las clases.

Histograma de frecuencia absoluta
5
7
8
6
4
0
1
2
3
4
5
6
7
8
9
salarios
N
o

d
e

o
b
r
e
r
o
s
salario 5
salario 7
salario 8
salario 6
salario 4
24 26 26 28 28 30 30 32 32 34


Estadística I

15
Histograma de frecuencia relativa
16.70%
23.30%
26.70%
20%
13.30%
0.00%
5.00%
10.00%
15.00%
20.00%
25.00%
30.00%
Salario
%

d
e

o
b
r
e
r
o
s
salario 16.70%
salario 23.30%
salario 26.70%
salario 20%
salario 13.30%
24 26 26 28 28 30 30 32 32 34

Polígono de Frecuencia.- Es una gráfica de líneas de una distribución de
frecuencia, en el eje horizontal se anota las marcas de clase y en el eje vertical
la frecuencia absoluta o relativa. (El polígono de frecuencia también puede
formarse colocando un punto sobre la mitad de la cúspide de cada rectángulo
del histograma y luego uniendo dichos puntos por medio de una línea).
Representan curvas útiles para describir los datos.
0
5
7
8
6
4
0 0
2
4
6
8
10
0 23 23
25
25
27
27
29
29
31
31
33
33
35
Salario
N
o

d
e

o
b
r
e
r
o
s

Los polígonos poseen ciertas ventajas:
1. El polígono de frecuencias es más sencillo que su histograma
correspondiente.
2. Bosqueja con más claridad un perfil del patrón de datos.
Estadística I

16
3. El polígono se vuelve cada vez más suave y parecido a una curva
conforme aumentemos el número de clases y el número de
observaciones. Un polígono como el que se acaba de describir
(suavizado mediante el aumento de datos y de clases puntuales) se
conoce como curva de frecuencia.

Los histogramas y los polígonos de frecuencia son similares

Ojiva.- Es una gráfica de líneas de la frecuencia acumulada, sobre el eje
horizontal se anota los límites inferiores de clase y sobre el eje vertical la
frecuencia acumulada o relativa acumulada. (Muchas de éstas tienen el
aspecto de una “S”). Nos permite ver cuántas observaciones están por encima
de ciertos valores, en lugar de hacer un mero registro del número de elementos
que hay dentro de los intervalos.

Ojiva porcentual (frecuencia relativa acumulada)
0% 0.00%
17%
40.00%
52%
66.70%
76%
87%
100%
52% 52% 52% 52% 52%
76% 76% 76% 76% 76% 76% 76%
-20%
0%
20%
40%
60%
80%
100%
120%
0 24 26 28 29 30 31 32 34
Salario
%

d
e

O
b
r
e
r
o
s


Uso de ojiva (interpolación)

¿Qué porcentaje de trabajadores ganan menos de $29?

R= 52%

¿Qué porcentaje de trabajadores ganan más de $31?

R= 100-76=24%

Estadística I

17


1.- Del problema de las lanchas pesqueras:

a
aa)
))
Construya las gráficas de histogramas, polígonos y ojivas.
b
bb)
))
Usando la ojiva ¿cuántas de las lanchas de la muestra mide menos de
75 pies?
c
cc)
))
Si un artículo del reglamento para construcción de las lanchas especifica
que por lo menos el 20% debe medir más de 90 pies, usando la ojiva
responda si se está cumpliendo con esta disposición.

2.- A continuación se muestra un registro de un superintendente sobre el
tiempo muerto en minutos sobre una muestra de los turnos de operación:

60 72 126 110 91 115 112
80 66 101 75 93 129 105
113 121 93 87 119 111 97
102 116 114 107 113 119 100
110 99 139 108 128 84 99

a
aa)
))
Construya una tabla de distribución de frecuencia absoluta, relativa,
acumulada, relativa acumulada y marca de clase.
b
bb)
))
Dibuje los histogramas, polígonos y ojivas.

3.- Los registros de una empresa sobre el número de trabajadores que han
llegado tarde diariamente durante el último mes se reportan a continuación:

2 3 12 8 15 2
0 11 5 7 5 9
4 10 2 7 9 11
15 12 0 3 7 9
18 16 12 6 8 3

a
aa)
))
Construya una tabla de distribución de frecuencia absoluta, relativa,
acumulada, relativa acumulada y marca de clase.
b
bb)
))
Dibuje los histogramas, polígonos y ojivas.







TAREA: Resuelve los siguient es ejercicios.
Estadística I

18
4.- De los registros escolares sobre el porcentaje de alumnos que reprueban su
primer examen se tomó una muestra aleatoria de 40 grupos de diversas
licenciaturas y los resultados fueron:

20 5 12 8 6 9 15 35 20 6
3 8 9 12 4 15 23 14 11 5
10 12 25 12 16 24 18 10 6 3
12 16 18 14 13 32 20 26 14 18

a
aa)
))
Construya una tabla de distribución de frecuencia absoluta, relativa,
acumulada, relativa acumulada y marca de clase.
b
bb)
))
Dibuje los histogramas, polígonos y ojivas para frecuencias absolutas.

5.- Los registros de tránsito sobre el número de accidentes automovilísticos en
la ciudad durante las primeras 6 semanas de este año indican lo siguiente:

Número de accidentes por día.

semana
5 22 12 16 40 10 8

semana
22 8 16 14 8 11 6

semana
14 10 8 9 14 12 4

semana
18 14 13 21 17 28 8

semana
26 14 5 30 26 35 12

semana
16 18 7 18 26 34 15


a
aa)
))
Construya una tabla de distribución de frecuencia absoluta, relativa,
acumulada, relativa acumulada y marca de clase.
b
bb)
))
Dibuje los histogramas, polígonos y ojivas solo de frecuencias relativas.

6.- Se realizó una encuesta para conocer la opinión de la gente sobre algunos
de los temas que ha tratado el actual gobierno, algunas de las preguntas
fueron:

1
11.
.. Edad.
2
22.
.. Sexo: M (asculino) F (emenino).
3
33.
.. Ingreso mensual.
4
44.
.. ¿Cómo considera que el gobierno manejó el asunto de la liquidación del
SME?

(1) Bien (2) Regular (3) Mal



Estadística I

19

5
55.
.. ¿Está de acuerdo que será bueno para el país el grabar las medicinas
con el IVA?

(1) Si (2) No

6
66.
.. ¿Está de acuerdo con la legalización de autos chocolates?

(1) Si (2) No

7
77.
.. ¿Cómo califica el desempeño del gobierno de Felipe Calderón?

(1) Excelente (2) Bueno (3) Regular (4) Malo


De las encuestas se tomó una muestra de 35 personas con la siguiente
información.

Pregunta 1 2 3 4 5 6 7
Persona Edad Sexo Ingreso SME Medicina Legalización Calif.
1 25 M 3400 2 2 2 3
2 42 M 5200 2 1 1 2
3 18 M 2300 3 2 1 2
4 26 F 3600 1 2 1 1
5 48 M 5800 2 2 2 2
6 52 M 6800 2 2 2 2
7 40 M 12500 2 2 2 3
8 36 F 8450 3 2 2 4
9 21 M 4150 1 1 1 3
10 36 F 6850 1 2 2 4
11 42 F 8900 1 1 1 4
12 58 F 2680 3 1 2 1
13 19 F 4600 2 2 1 1
14 26 M 5800 3 2 2 2
15 32 F 11000 1 2 2 2
16 18 M 3240 1 2 1 2
17 42 F 8600 1 2 1 1
18 47 M 2450 1 2 1 3
19 45 M 2600 2 2 2 2
20 32 M 8500 2 1 2 2
21 22 M 3200 2 2 2 2
22 26 M 2800 3 2 2 2
23 29 F 1600 3 2 2 2
24 40 F 2400 1 2 1 2
25 35 M 4650 1 2 2 1
26 36 F 3220 2 1 2 1
27 22 F 1450 3 1 1 2
28 28 F 3620 3 2 2 2
29 16 F 1100 2 2 2 3
Estadística I

20
30 35 M 3680 1 2 2 1
31 42 M 5700 2 2 1 4
32 48 F 6800 2 1 2 2
33 65 F 1850 3 2 2 1
34 52 M 7400 1 2 2 3
35 32 M 3650 1 2 1 2
a
aa)
))
Realiza una distribución de frecuencias para cada pregunta.
b
bb)
))
Identifica para cada pregunta el tipo de variable y la escala de
medición que se usa.
c
cc)
))
Construye una gráfica de pastel para la pregunta 2.
d
dd)
))
Construye un histograma de frecuencia relativa para la pregunta 3.
e
ee)
))
Construye una ojiva de frecuencia relativa para la pregunta 1.


El análisis exploratorio de datos

Es una técnica que permite revisar muchos datos y resumirlos con rapidez
usando algo tan sencillo como la aritmética básica y unos cuantos diagramas
simples.
Una de las técnicas más útiles es: La gráfica de tallo y hoja.
Ejemplo:
Calificaciones en el primer examen parcial:
79 78 78 67 76 87 85 73
99 84 72 66 57 94 84 72
51 48 61 82 93 100 89 72
Para producir una gráfica de tallo y hoja:
1. Hacer una lista vertical de los tallos
2. Dibujar una línea vertical a la derecha de los tallos
3. Listar las hojas
4. Ordenar las hojas en cada renglón
5. Girar en 90
0
la gráfica, obteniéndose algo que se parece a los
histogramas.

TAREA: Hacer el diagrama de t allo y hoja de los
problemas 2 y 3 de la página 17
Estadística I

21

CAPITULO 4
MEDIDAS DE TENDENCIA CENTRAL (MTC)

El objetivo de las medidas de tendencia central es calcular un valor que
sea representativo del grupo de datos bajo estudio.
¿Por qué se les llama de tendencia central?
Porque el valor calculado es muy similar (tiende) a los valores que
estarían en medio (parte central) del grupo de datos ordenados.
¬ Las medidas de centralización o de tendencia central son valores
que tienden a situarse en el centro de un conjunto de datos
ordenados según su magnitud.
¬ Para usos industriales, las dos medidas de tendencia central más
utilizadas con la media y la mediana.
Principales MTC:
a. Media simple
b. Media aritmética (promedio)
c. Mediana
d. Moda
¿Cómo se calculan las MTC?
Dependiendo como se tengan los datos que se van a procesar:
1) Datos sin agrupar: Se calculan a partir de los valores individuales de los
datos, es decir, se debe conocer cada uno de los valores.
2) Datos agrupados: Se calculan a partir de una tabla de distribución de
frecuencias (resumen), es decir, los datos ya han sido procesados
previamente en una distribución y no se cuenta con los valores
individuales.


1) CALCULO DE MTC PARA DATOS SIN AGRUPAR

a) Media simple:
La media simple es el guarismo intermedio entre la observaciòn menor y la
mayor. Por definición:

Media simple= Observaciòn mayor + Observaciòn menor
2

b) Media aritmética (o promedio):
Es la medida de localización más frecuentemente utilizada, especialmente
en el campo de la comprobación de hipótesis estadísticas.
Fórmulas:

) ( población
N
x
i ¯
= 


Estadística I

22
) (muestra x
n
x
i ¯
=


. población de aritmética media = 

. muestra una de aritmética media x =

( )
¯
+ + = 
2 1
x x valores de Sumatoria x
i

. población la en datos de número N =

. muestra la en datos de número n =

c) Mediana:
La mediana es el valor que ocupa el valor central de toda la distribución de
frecuencias (es el valor que divide a la distribución por la mitad). Esto es, la
mitad de los casos caen por debajo de la mediana y la otra mitad se ubica
por encima de ella. La mediana es una medida de tendencia central propia
de los niveles de medición ordinal, por intervalos y de razón. Primeramente
se deben ordenar los datos (en forma ascendente o descendente) y
después se ubica el valor que esté exactamente en la parte central de la
lista ordenada. Puede ser que existan dos valores centrales, en cuyo caso
se debe calcular un promedio entre ellos.

d) Moda.
Se define como el dato que más se repite en el grupo, es decir, el de mayor
frecuencia. Si solo existe un valor de moda, se dice que los datos tienen
una distribución UNIMODAL, si hay dos valores distintos de moda,
entonces es BIMODAL y si hay más de dos será MULTIMODAL (o
POLIMODAL),

También pueden existir casos donde no haya moda.

Ejemplo: Calcule las MTC en datos sin agrupar para las horas extra
laboradas a la semana por una muestra de 16 empleados tomados de una
empresa, cuyos registros fueron:
2 2.5 3 4
2.5 2 2.5 3
3 1.5 2 3.5
1.5 1 2.5 2.5


1. Calcule las medidas de tendencia central del problema los salarios
diarios a destajo para los 30 obreros de la página 9.
2. Calcule las medidas de tendencia central del problema de las
lanchas pesqueras de la página 10.

TAREA: Resuelve los siguient es ejercicios.
Estadística I

23
2) CALCULO DE MTC PARA DATOS AGRUPADOS.
a
aa)
))
Media Aritmética.

( )
) ( población
i
ci
i
f
X f
¯
¯
= 


( )
) (muestra x
i
ci i
f
X f
¯
¯
=


. clase cada de absoluta frecuencia fi =

. clase cada de marca Xci =








b
bb)
))
Mediana.


) (
2
inf
I L Med
c
aA
i
f
f
f
med

¯
+ =
÷


.
inf
mediana clase de Inferior Límite L
med
=

. mediana la a anterior clase la de acumulada Frecuencia f
aA
=

. mediana clase la de absoluta Frecuencia f
c
=

. clase de Intervalo I =

. datos los de mitad la a igual o mayor sea
acumulda frecuencia cuya clase primer Mediana Clase =



Estadística I

24
c
cc)
))
Moda.


| | ) (
2 1
1
mod inf
I L Mod
d d
d
+
+ =


.
mod inf
Modal clase de Inferior Límite L =
.
1
anterior la y Modal clase la de absoluta frecuencia la entre diferencia d =

.
2
siguiente la y Modal clase la de absoluta frecuencia la entre diferencia d =

. clase de Intervalo I =
( ) datos más absoluta frecuencia mayor con clase Modal Clase =


TAREA:
1. Calcule las MTC para el problema de los salarios en datos agrupados:

Clase L inf L sup f fa Xc
1 24 25 5 5 25
2 26 27 7 12 27
3 28 29 8 20* 29
4 30 31 6 26 31
5 32 33 4 30 33



2. Calcule las MTC para el problema 4 de los registros escolares sobre el
porcentaje de alumnos que reprueban su primer examen en datos
agrupados de la página 18.

3. Calcule las MTC para el problema 5 de los registros de tránsito sobre el
número de accidentes automovilísticos en datos agrupados de la página
18.









Estadística I

25
CAPITULO 5
PERCENTILES
Un percentil es una medida que señala los valores, no necesariamente
en una localización central. Un percentil da información acerca de cómo se
distribuyen los valores sobre el intervalo, desde el menor hasta el mayor. Para
valores que no tienen muchos valores repetidos el p-ésimo (se dice “peésimo”)
percentil divide los datos en dos partes. Más o menos el p por ciento de los
elementos tienen valores menores que el p-ésimo percentil. Aproximadamente
el (100 –p) por ciento de los elementos tienen valores mayores que el p-ésimo
percentil. Este percentil se define como sigue:

Percentil
El p-ésimo percentil es un valor tal que por lo menos un p por ciento de
los elementos tienen dicho valor o menos y, al menos (100 –p) por ciento de los
elementos tienen este valor o más.

Cálculo del p-ésimo percentil
1. Ordenar los datos de manera ascendente
2. Calcular un índice i

i = (p/100) n

En donde p es el percentil de interés y n es la cantidad de elementos.
3. (a) Si i no es entero, se redondea. El valor entero inmediato mayor que i
indica la posición del p-ésimo percentil
(b) Si i sí es entero, el p-ésimo percentil es el promedio de los valores de
los datos ubicados en los lugares i e i+1.

Ejemplo:
1. Determinar el 85º. percentil de los siguientes datos:
2210 2255 2350 2380 2390 2420 2440 2450 2550 2630 2825
2. De los mismos datos calcule el 50º. percentil

CUARTILES
Con frecuencia se dividen los datos en cuatro partes, cada una con
aproximadamente la cuarta parte (25% de los elementos). A los puntos de
división se les llama cuartiles y se definen como sigue:
Q
1
= Primer cuartil ó 25% percentil
Q
2
= Segundo cuartil ó 50% percentil (mediana)
Q
3
= Tercer cuartil ó 75% percentil

Ejemplo:
1. Determinar el segundo cuartil (o la mediana) de los siguientes datos:
2210 2255 2350 2380 2390 2420 2440 2450 2550 2630 2825
2. Determinar de los mismos datos Q
1
y Q
3.

3. De los problemas 2 y 3 de la página 17 determine los valores de Q
1
, Q
2
y
Q
3.


Estadística I

26
DETECCIÓN DE VALORES ATÍPICOS

A veces un conjunto de datos tiene uno o más elementos con valores
demasiado grandes o demasiado pequeños. A los valores extremos como
éstos se les llama valores atípicos.
Las personas con experiencia en estadística, toman sus precauciones al
identificar los valores atípicos y los revisan uno a uno cuidadosamente. Un
valor atípico puede ser un elemento para el cual se haya anotado su valor en
forma errónea. También puede ser uno que por error se incluyó en el conjunto
de datos y debe eliminarse.
El diagrama de caja (blox-pot) es un gráfico a través del cual podemos
representar los datos cuartilicos. Es una forma relativamente reciente para
resumir en una gráfica los datos y detectar valores atípicos.
La base del trazo de un diagrama de caja es el cálculo de la mediana y los
cuartiles Q
1
y Q
3.
También se usa el rango intercuartil (RIC= Q
3
- Q
1
).

1. Se traza un rectángulo con los extremos en el primer y tercer cuartil.
Este rectángulo contiene el 50% intermedio de los datos.
2. En la caja se traza una recta vertical en el lugar de la mediana. Así, la
línea de la mediana divide los datos en dos partes iguales.
3. Se ubican los datos mediante el rango intercuartil, RIC= Q
3
- Q
1
. Los
límites en el diagrama de caja están a 1.5 RIC debajo de Q
1
y a 1.5 RIC
arriba de Q
3
. Se considera que los datos fuera de estos límites son
valores atípicos.
4. Se trazan líneas punteadas que se llaman bigotes de la caja, desde los
extremos de ésta hasta los valores mínimo y máximo dentro de los
límites.
5. Por último se marcan con un asterisco (*) las localizaciones de los
valores atípicos.


TAREA:
1. Se tiene una muestra con los siguientes valores: 27, 25, 20, 15, 30, 34,
28, 15. Trace el diagrama de caja.
2. Trace el diagrama de caja para los siguientes datos: 5, 15, 18, 10, 8, 12,
16, 10 y 6.
3. Un conjunto de datos tiene un primer cuartil de 42 y un tercero de 50.
Calcule los límites inferior y superior. ¿Se debe considerar atípico un
valor de dato 65?
Estadística I

27
CAPÍTULO 6
MEDIDAS DE VARIACIÓN
(DISPERSIÓN)

El objetivo de las medidas de variación es determinar que tanta similitud
o diferencia (variación) existe entre los datos bajo estudio.
Las medidas de dispersión dan idea de la separación de los datos
numéricos alrededor de un valor medio.
Las dos medidas de dispersión de mayor utilidad son la desviación
estándar y la amplitud (“range”).
Las medidas de variación se calculan en base al valor de la media
aritmética y entre las principales podemos mencionar:
a) Desviación media (DM)
b) Varianza y desviación estándar ( o típica)
c) Coeficiente de variación

1) DATOS SIN AGRUPAR
a) Desviación media.-
Es un promedio de las diferencias absolutas que existe entre cada dato del
grupo con respecto a su media aritmética.
. ) (
) (
) (
dato cada y media la entre positiva absoluta Diferencia Xi M
muestra DM
población DM
n
i X x
N
Xi M
= ÷
¯
=
¯
=
÷
÷

b) Varianza y desviación estándar.-
Son las medidas de variación más importantes en estadística y valoran la
diferencia al cuadrado que existe entre cada dato y la media, para eliminar
los efectos que ocasionan datos extremosos (valores que son muy altos o
muy bajos con respecto al resto del grupo).
La desviación estándar o típica es el promedio de desviación de las
puntuaciones con respecto a la media. La varianza es la desviación
estándar elevada al cuadrado.




Varianza
( )
( )
) (
) (
1
2
2
2
2
muestra s
población
n
i X x
N
Xi M
÷
÷
÷
¯
=
¯
= 

Estadística I

28

c) Coeficiente de variación.-
Es útil para comparar la variación de dos grupos de datos cuyos valores
sean de distinta naturaleza. Se expresa como un porcentaje de la
magnitud de la desviación estándar con respecto a su propia media
aritmética.

( )
( ) ) ( 100
) ( 100
muestra Cv
población Cv
x
s
M
=
=


Ejemplo: Determine las medidas de variación en datos sin agrupar para el
problema de las horas extra.
44 . 2 = x
Xi
Xi x ÷
2
Xi x ÷
2 0.44 0.1936
2.5 0.06 0.0036
3 0.56 0.3136
1.5 0.94 0.8836
2.5 0.06 0.0036
2 0.44 0.1936
1.5 0.94 0.8836
1 1.44 2.0736
3 0.56 0.3136
2.5 0.06 0.0036
2 0.44 0.1936
2.5 0.06 0.0036
4 1.56 2.4336
3 0.56 0.3136
3.5 1.06 1.1236
2.5 0.06 0.0036
∑ 9.24 8.9376

Desviación
Estándar o
Típica
) (
) (
2
2
muestra s s
población
=
=  

Estadística I

29
( ) ( ) % 63 . 31 100 100
) ( 7719 . 0 5958 . 0
(var) 5958 . 0
5775 . 0
44 . 2
7719 . 0
2
15
9376 . 8
1
2
16
24 . 9
2
= = =
= =
= =
¯
=
= =
¯
=
÷
÷
÷
x
s
n
Xi x
n
Xi x
Cv
DE hrs s
hrs s
hrs DM




2) DATOS AGRUPADOS
a) Desviación media

| |
| |
.
.
) (
) (
clase cada de Marca Xci
clase cada de absoluta frecuencia fi
muestra DM
población DM
fi
Xci x fi
fi
Xci M fi
=
=
¯
¯
=
¯
¯
=
÷
÷


b) Varianza y desviación estándar.




Varianza
( ) | |
( ) | |
) (
) (
1
2
2
2
2
muestra s
población
fi
Xci x fi
fi
Xci M fi
¯
¯
=
¯
¯
=
÷
÷
÷


Estadística I

30





c) Coeficiente de variación.


( )
( ) ) ( 100
) ( 100
muestra Cv
población Cv
x
s
M
=
=




Ejemplo: Salarios (datos agrupados).
Clase inf L

sup L

f Xc

Xci M ÷

( ) Xci M f ÷

( )
2
Xci M ÷

( )
2
Xci M fi ÷

1 24 25 5 25 3.8 19 14.44 72.2
2 26 27 7 27 1.8 12.6 3.24 22.68
3 28 29 8 29 0.2 1.6 0.04 0.32
4 30 31 6 31 2.2 13.2 4.84 29.04
5 32 33 4 33 4.2 16.8 17.64 70.56

Total 30 63.2 194.8

( ) ( ) % 85 . 8 100 100
55 . 2 $ 49 . 6
49 . 6
11 . 2 $
) ( 80 . 28 $
80 . 28
55 . 2
2
2
30
8 . 194
2
30
2 . 63
= = =
= = =
= =
= =
=
M
Cv
pesos
DM
calculada e previament agrupados datos

 




Desviación
estándar
) (
) (
2
2
muestra s s
población
=
=  

Estadística I

31
TAREA:
1. El departamento de transito de la ciudad de Irapuato está preocupado
por la velocidad a la que los conductores manejan en un tramo de la
carretera principal. Los datos de la velocidad de 45 conductores en
Km / hr son los siguientes:
15 32 45 46 42 39 68 47 18
31 48 49 56 52 39 48 69 61
44 42 38 52 55 58 62 58 48
56 58 48 47 52 37 64 29 55
38 29 62 49 69 18 61 55 49

Calcule:
a. Las medidas de tendencia central y de dispersión de los datos no
agrupados
b. Las medidas de tendencia central y de dispersión de los datos
agrupados
c. El departamento de transporte informa que a nivel nacional, no más del
10% de los conductores excede 55 Km / hr ¿Se comportan los
conductores del municipio de Irapuato de acuerdo con las afirmaciones
del Departamento de Transporte acerca de los patrones de manejo?

2. El administrador de un hospital ordenó un estudio del tiempo que un
paciente debe esperar antes de ser tratado por el personal de la sala de
urgencias. Los datos que se presentan a continuación fueron tomados
durante un día normal:
Tiempo de espera (minutos)
12 26
13 16
21 7
20 14
24 25
11 27
17 15
16 29
18 5
25 13

a) Calcule las medidas de tendencia central de los datos sin agrupar
b) Calcule las medidas de variación de los datos agrupados
c) A partir de una ojiva, establezca cuánto tiempo debe suponerse que el
75% de los pacientes aguarden en la sala de espera.







Estadística I

32
ASIMETRÍA Y LA CURTOSIS

Las medidas de distribución nos permiten identificar la forma en que se
separan o aglomeran los valores de acuerdo a su representación gráfica. Estas
medidas describen la manera como los datos tienden a reunirse de acuerdo
con la frecuencia con que se hallen dentro de la información. Su utilidad radica
en la posibilidad de identificar las características de la distribución sin
necesidad de generar el gráfico. Sus principales medidas son la Asimetría y la
Curtosis.
1. Asimetría
Esta medida nos permite identificar si los datos se distribuyen de forma
uniforme alrededor del punto central (Media aritmética). La asimetría presenta
tres estados diferentes, cada uno de los cuales define de forma concisa como
están distribuidos los datos respecto al eje de asimetría.


Se dice que la asimetría es positiva cuando la mayoría de los datos se
encuentran por encima del valor de la media aritmética, la curva es Simétrica
cuando se distribuyen aproximadamente la misma cantidad de valores en
ambos lados de la media y se conoce como asimetría negativa cuando la
mayor cantidad de datos se aglomeran en los valores menores que la media.

2. Curtosis
Cuando medidos la curtosis de una distribución, estamos midiendo qué tan
puntiaguda es. Es un indicador de lo plana o picuda que es una curva. Mide
cuan 'puntiaguda' es una distribución respecto de un estándar. Este estándar
es una forma acampanada denominada 'normal', y corresponde a una curva de
gran importancia en Estadística. Esta medida determina el grado de
concentración que presentan los valores en la región central de la distribución.
Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran
concentración de valores (Leptocúrtica), una concentración normal
(Mesocúrtica) ó una baja concentración (Platicúrtica).



Estadística I

33
CAPITULO 7
PROBABILIDAD
Jacob Bernoulli (1654-1705), Abraham de Moivre (1667-1754), el
reverendo Thomas Bayes (1702-1761) y Joseph Lagrange (1736-1813)
desarrollaron fórmulas y técnicas para el cálculo de la probabilidad. En el siglo
XIX, Pierre Simón, marqués de Laplace (1749-1827), unificó todas estas ideas
y compiló la primera teoría general de probabilidad.
La teoría de la probabilidad fuè aplicada con éxito en las mesas de juego
y, lo que es más importante a la resolución de problemas sociales y
económicos.
Históricamente se han desarrollado tres enfoques para definir y calcular
la probabilidad:
a) Clásico (axiomático)
b) Frecuencia relativa
c) Subjetivo


Enfoque clásico.-
La probabilidad se determina de la siguiente manera:
Si existen N(A) resultados que son favorables a un evento de un total de
N(S) resultados posibles, y todos los resultados son igualmente probables y
mutuamente excluyentes, entonces la probabilidad de que ocurra el evento
(A) está dada por:

) (
) (
) (
S N
A N
A P =


Se dice que dos resultados son mutuamente excluyentes si no pueden
ocurrir simultáneamente, es decir; que al ocurrir uno de ellos
automáticamente la ocurrencia del otro se anula.







Estadística I

34
Ejemplos de probabilidad clásica:

1. Lanzar una moneda.

( ) % 50 5 . 0
2
1
~ = = sol P

Favorable que caiga sol.

2. Lanzar un dado.
Favorable que caigan 3 puntos.

( ) % 67 . 16 1667 . 0 3
6
1
~ = = ptos P


Probabilidad favorable que caigan más de 4 puntos.
( ) % 33 . 33 3333 . 0
6
2
~ = = puntos Más P


3. Lanzar dos dados.

Probabilidad de que caigan 3 puntos.

Dado A: 6 resultados.
Dado B: 6 resultados.
6*6=36

( ) % 55 . 5 05 . 0 3
36
2
~ = = puntos P














Estadística I

35

4. ¿Cuál es el número más probable que salga?

1 2 3 4 5 6
1 1,1 1,2 1,3 1,4 1,5 1,6
2 2,1 2,2 2,3 2,4 2,5 2,6
3 3,1 3,2 3,3 3,4 3,5 3,6
4 4,1 4,2 4,3 4,4 4,5 4,6
5 5,1 5,2 5,3 5,4 5,5 5,6
6 6,1 6,2 6,3 6,4 6,5 6,6

El número 7.
( ) % 67 . 16 166 . 0 7
36
6
~ = = P





5. Si se lanzan 3 monedas ¿cuál es la probabilidad de que caigan 2
soles?

1 A A A A S S S S
2 A A S S S S A A
3 A S S A S A A S


( ) % 5 . 37 375 . 0 2
8
3
~ = = soles P

















Estadística I

36
FRECUENCIA RELATIVA.

La probabilidad se determina con base en la proporción de veces que se
registra un resultado favorable a un evento de un total de observaciones
registradas. No hay implícita ninguna suposición previa de igualdad de
probabilidades.


Ejemplo:
A continuación se muestra una distribución de frecuencias para las
comisiones mensuales que obtuvieron un grupo de 300 vendedores.

Comisión Mensual No. de vendedores
0-5,000 15
>5,000-10,000 25
>10,000-15,000 35
>15,000-20,000 125
>20,000 100
300

Determine la probabilidad de que al elegir un vendedor, este obtenga una
comisión:
a
aa)
))
Mayor a $10,000.
b
bb)
))
Mayor a $20,000.
c
cc)
))
De $10,000 ó Menor


( )
( )
( ) % 33 . 13 1333 . 0 000 , 10
% 33 . 33 3333 . 0 000 , 20
% 67 . 86 8667 . 0 000 , 10
300
40
300
100
300
260
~ = = s
~ = = >
~ = = >
comisión P
comisión P
comisión P


SUBJETIVO.
La probabilidad esta determinada por el grado de confianza que una
persona tiene en que un evento en particular ocurra, basándose en la evidencia
que tiene disponible.

(Es ampliamente usado).









Estadística I

37
EXPRESIONES DE VALORES DE PROBABILIDAD.

La probabilidad es un valor que varia en un rango de 0 á 1 (0 á 100%).
Si el valor es cero esto indica que es imposible que el evento ocurra,
pero si es uno indica que el evento es seguro que ocurra.


( ) 1 0 s s A P


La probabilidad de que un evento ocurra más la probabilidad de que no
ocurra debe ser igual a uno. (100%)


( ) ( ) 1 ' = + A P A P



( ) ( )
( ) ( ) A P A P
A P A P
÷ =
÷ =
1 '
' 1

P(A)= Probabilidad de que ocurra “A”.
P (A’)= Probabilidad de que no ocurra “A”.


REGLAS DE PROBABILIDAD PARA COMBINACIÓN DE
EVENTOS.

Regla de la suma (adición).

Cuando se quiere calcular la probabilidad de que un evento (A) u otro
(B) ó ambos (A y B) ocurran entonces se aplica la regla de la suma, en
la cual se pueden dar dos casos dependiendo si los eventos son ó no
mutuamente excluyentes.

( ) ( ) ( ) ( )
( ) ( ) ( ) .
.
s excluyente mutuamente Eventos B P A P B ó A P
s excluyente mutuamente No Eventos AB P B P A P B ó A P
+ =
÷ + =




Ejemplo:

Grupo Edad
1 Hombre 30 años
2 Hombre 32
3 Hombre 40
4 Mujer 45
5 Mujer 20
Estadística I

38

a
aa)
))
¿Probabilidad de que sean mujeres ó mayores de 30
años?

( ) ( ) ( )
% 80 8 . 0
30 30
5
4
5
1
5
3
5
2
~ = = ÷ + =
> ÷ > + = y mujer P P mujer P


b
bb)
))
 
|
.
|

\
|
> + <
B A
ó P 40 30


( ) ( )
( ) % 40 4 . 0
40 30
5
2
5
1
5
1
~ = = + =
= < + < = P P


c
cc)
))
Sea hombre ó tenga >35 años.

( ) ( ) ( )
( ) % 80
35 , 35
5
4
5
2
5
3
5
3
= ÷ + =
= ÷ > + = años Hombre P años P Hombre P


d
dd)
))
Sea mujer ó >40 años.

( ) ( ) ( )
( ) % 80
40 , 40
5
4
5
1
5
3
5
2
= ÷ + =
= ÷ > + = años mujer P años P mujer P


e
ee)
))
Sea un hombre >40 años.

( ) ( ) % 40 40 ,
5
2
= > = años Hombre P



f
ff )
))
Sea hombre ó mujer.

( ) ( ) ( ) % 100
5
5
5
2
5
3
= + = + = mujer P Hombre P




g
gg)
))
Tenga >20 años y <28 años.

( ) ( )
0
28 20
=
= < > = años P y años P






Estadística I

39
Otro Ejemplo:
En una fábrica hay un total de 130 técnicos que trabajan en tres
departamentos distintos:

30 en Almacén.

65 en Mantenimiento.

35 en Producción.


En cada departamento existen técnicos calificados y no calificados. En almacén
20 calificados, en mantenimiento 40 y en producción 20.
En base a estos datos determine la probabilidad de:

a
aa)
))
De que al elegir a un técnico este sea No calificado y
trabaje en almacén.

( ) ( ) ( ) % 7 . 7 07 . 0
130
10
= = = = almacén P y calificado no P


b
bb)
))
Calificado y trabaje en producción.

( ) ( ) ( ) % 38 . 15 15 . 0
130
20
= = = = producción P y calificado P

c
cc)
))
Calificado ó trabaje en mantenimiento.

( ) ( ) ( )
( ) % 80 80 . 0
130
105
130
40
130
65
130
80
= = = ÷ + =
= ÷ + = nto mantenimie y calificado P nto mantenimie P calificado P


d
dd)
))
No calificado ó no trabaje en almacén.

( ) ( ) ( )
( ) % 61 . 84 84 . 0
130
110
130
40
130
100
130
50
= = = ÷ + =
= ÷ + = almacén no y calificado no P almacén no P calificado no P


e
ee)
))
Trabaje en mantenimiento ó no sea calificado.

( ) ( ) ( )
( ) % 69 69 . 0
130
90
130
25
130
50
130
65
= = = ÷ + =
= ÷ + = calificado no y nto mantenimie P calificado no P nto mantenimie P



f
ff )
))
No trabaje en producción y no sea calificado.

( ) ( ) ( ) % 92 . 26 2692 . 0
130
35
= = = = calificado no P y producción no P



Depto. Calif. No Calif. Total
Almacén 20 10 30
Mantenimiento 40 25 65
Producción 20 15 35
Total 80 50 130
Estadística I

40
g
gg)
))
Trabaje en mantenimiento.

( ) ( ) % 50 5 . 0
130
65
= = = = nto mantenimie P

h
hh)
))
No trabaje en almacén.

( ) ( ) % 77 76 . 0
130
100
= = = = almacén no P

i
ii )
))
Trabaje en almacén ó producción.

( ) ( ) ( ) % 50 5 . 0
130
65
130
35
130
30
= = = + = + = producción P almacén P




DIAGRAMAS DE VENN EN PROBABILIDAD.

Estos diagramas se utilizan para representar de forma gráfica las
probabilidades en la combinación de eventos que se presentan en la regla de la
suma.

Los eventos se representan mediante círculos, dentro de los cuales se
anotan los valores de probabilidad o bien el número de elementos que
pertenecen al evento, y en un rectángulo se encierran todos los eventos y
elementos que intervienen en el problema.

Algunos de los diagramas más representativos se ilustran a continuación:


P(A ó B) P (AB)

A B A B
Estadística I

41

P (A’)

Ejemplo:


Nota: La suma de probabilidades es igual a la unidad.

Calcule la probabilidad de los siguientes eventos:

a
aa)
))
P(A)= 0.4
b
bb)
))
P(B)= 0.5
c
cc)
))
P(A ó B)= 0.6
d
dd)
))
P(AB)= 0.3
e
ee)
))
P(A’)= 0.6
f
ff )
))
P(A’ ó B)= 0.9
g
gg)
))
P(A’ B)= 0.2
h
hh)
))
P(A’ ó B’)= 0.7
i
ii )
))
P(A’ B’)= 0.4










A
A
B
.1
.3
.2
.4
Estadística I

42
Regla de la Multiplicación.

Para determinar la probabilidad conjunta de dos eventos: P(A B), que pueden
ocurrir simultáneamente ó en sucesión se utiliza la regla de multiplicación la
cual difiere según los eventos sean dependientes ó independientes:

P(A B)= P(A) P (B) eventos independientes.
P(A B)= P(A) P (B/A) eventos dependientes.
P(A B)= Probabilidad conjunta de que ocurran A y B.
P(A)= Probabilidad de que ocurra A.
P (B)= Probabilidad de que ocurra B.
P (B/A)= Probabilidad de que ocurra B dado (si es que) ocurre A.
Probabilidad Condicional.
Ejemplo: En una caja existen 10 refacciones, 8 en buen estado y 2
defectuosas. Si se extraen 2 piezas de la caja, determine la probabilidad de
que:
a
aa)
))
Ambas sean defectuosas.

( ) ( ) ( )( )
( ) ( ) ( ) . sin % 22 . 2 . 1
. % 4 04 . 0 . 2 . 1
90
2
9
1
10
2
1
. 2
100
4
10
2
10
2
reemplazo P def P
reemplazo con def y def P s defectuosa sean Ambas P
def
def
= = = °
= = = ° ° =
°
°

b
bb)
))
La primera sea defectuosa y la segunda en buen estado.

( ) ( )( )
( ) ( ) ( )( ) . sin % 77 . 17 .
. % 16 16 . 0 2 . 1
90
16
9
8
10
2
100
16
10
8
10
2
reemplazo P def P
reemplazo con buen y def P
def
buen
= = =
~ = = = ° °


c
cc)
))
Una pieza esta defectuosa y otra en buen estado.
Resuelva el problema suponiendo primero que la primera pieza es devuelta
antes de extraer la segunda (con reemplazo) y vuelva a resolver suponiendo
que la primera pieza no es devuelta (sin reemplazo).




( ) ( ) ( )( )
( ) ( ) ( )( ) ( )
% 55 . 35 Pr
% 77 . 17
% 77 . 17 . 1 sin
90
16
9
2
10
8
90
16
9
8
10
2
=
= =
= = °
total obabilidad
P buen P
P def P reemplazo
buen
def
def
buen








( )
( ) ( )( )
100
16
10
2
10
8
100
16
. 2 1
2 . 1
= = ° °
= ° °
def y buen P
buen y def P

( )
% 32 32 . 0
. .
100
32
= = =
=
P
bien otra y def P reemplazo con
Estadística I

43
ÁRBOL DE PROBABILIDAD

El diagrama de árbol es un dispositivo gráfico útil para visualizar un
experimento de varias etapas y enumerar los resultados experimentales.
Es un diagrama que nos permite determinar probabilidades conjuntas P (AB),
es decir ilustrar las operaciones para la regla de multiplicación.
Se construye en base a círculos denominados nodos que se unen a través
de líneas denominadas ramas.

En los nodos se anotan las probabilidades conjuntas y sobre las ramas las
probabilidades individuales de los eventos.

Ejemplifíquese sobre el problema anterior (de las refacciones).

Con reemplazo.


NOTA: Es más útil en eventos dependientes.













1

0.8

0.2
.64
.16
.16
0.04
( ) 8 . 0 = buena P
( ) 2 . 0 = def P
( ) 8 . 0 = buena P
( ) 2 . 0 = def P
( ) 8 . 0 = bueno P
( ) 2 . 0 = def P
( ) buena y buena P ° ° 2 1
( ) def y buena P ° ° 2 1
( ) buena y def P ° ° 2 1
( ) def y def P ° ° 2 1
1° Refacción 2° Refacción
Estadística I

44



Sin reemplazo.





















1

0.8

0.2
.6222
.1778
.1778
.0222
( ) 8 . 0 = bueno P
( ) 2 . 0 = def P
( ) ( ) 7778 . 0
1 9
7
=
° buena
buena
P
( ) ( ) 2222 . 0
1 9
2
=
° buena
def
P

( ) ( ) 8889 .
1 9
8
=
° def
buena
P

( ) ( ) 1111 .
1 9
1
=
° def
def
P
( ) buena y buena P ° ° 2 1
( ) def y buena P ° ° 2 1
( ) buena y def P ° ° 2 1
( ) def y def P ° ° 2 1
1° Refacción
2° Refacción
Estadística I

45
TAREA:
1. De los 300 estudiantes de una Universidad:
170 son de Contaduría, 70 son de Administración, 40 son de Comercio
y el resto son de Mercadotecnia.
En cada carrera hay alumnos que cuentan con beca:
50 de Administración, 30 de Contaduría, 10 de Comercio y 15 de
Mercadotecnia.
Determine la probabilidad de que al elegir un estudiante:
a) Sea de Comercio y tenga beca
b) Sea de Contabilidad o tenga beca
c) Sea de Administración o no tenga beca
d) No sea de Mercadotecnia o tenga beca
e) Sea de Comercio o no tenga beca

2. De 100 personas que solicitaron un puesto en una compañía 40 ya
tenían experiencia. De los 100, había 30 que tenían certificado
profesional y de ellos sólo 20 tenían experiencia.
Si se elige a un solicitante del grupo determine la probabilidad de que
a) Tenga certificado y experiencia
b) Tenga experiencia o certificado
c) Tenga certificado o no tenga experiencia
3. En una urna se tienen 50 canicas:
10 rojas
25 azules
15 blancas.
De las rojas hay 5 veteadas, mientras que de las azules 10 y de las
blancas 8.
Si se saca una canica de la urna determine la probabilidad de que:
a) Sea azul o este veteada
b) Sea azul o blanca
c) No sea azul
d) Sea blanca o este veteada
Si se sacan dos canicas sin reemplazo, determine la probabilidad
de que:
e) Ambas sean rojas
f) La primera sea blanca y la segunda azul
g) La primera esté veteada y la segunda no.

4. La probabilidad de que una máquina produzca tuercas hexagonales
aceptables es del 90%. Si las piezas producidas son independientes
encuentre la probabilidad de que:
a) Dos piezas seguidas que no sean aceptables
b) Una pieza aceptable y una no aceptable, en ese orden.
c) Una pieza aceptable y una no aceptable, en cualquier orden.

Sign up to vote on this title
UsefulNot useful