Documentos de Académico
Documentos de Profesional
Documentos de Cultura
E-Book Del Módulo 1
E-Book Del Módulo 1
Investigación Empresarial
MÓDULO I
ÍNDICE
IV. PROBABILIDADES……………………………………….…………. 32
MÓDULO I
I. ESTADÍSTICA DESCRIPTIVA.
Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología,
Educación, Psicología, Administración, Economía, Contabilidad, Medicina, Ciencias
Políticas, Proyectos de tesis, Proyectos de Inversión, entre otras.
3
Las dos grandes ramas en que se divide a la estadística son:
Estadística Descriptiva
Es la parte de la estadística que estudia un grupo de datos dado, sin inferir sus
conclusiones a un grupo mayor.
4
a) La población es finita: es un número determinado de elementos en caso
contrario es infinita. En la práctica una población finita con un gran número de
elementos se considera como una población infinita,
b) La población infinita: es cuando no se conoce el tamaño de ala población,
por otro lado el tamaño de una población va a depender de objetivo trazado
por el investigador.
B. Muestra:
Está constituida por una parte de los individuos o elementos que componen la
población, seleccionada de acuerdo a cierta técnica con el fin de obtener
información acerca de la población, de la cual proviene. La muestra debe ser
seleccionada de manera que sea representativa, es decir tenga características
similares a las de su población.
C. Parámetro:
Es una medida descriptiva que resume una característica de la población, es
decir constituye el valor real, verdadero; su cálculo implica utilizar toda la
información contenida en la población; entre los más conocidos tenemos:
La media poblacional (μ)
La varianza poblacional (σ2)
La proporción poblacional (P) etc.
D. Estadístico:
Es una medida que describe una característica de la muestra, se calcula a partir
de los datos observados en la muestra; es decir constituyen los estimadores de
cada uno de sus respectivos parámetros; entre estos tenemos:
La media muestral (X)
La varianza muestral (S2)
La proporción muestral (p)
5
E. VARIABLE:
Es una característica definida en la población de acuerdo a cierto interés en una
investigación estadística, que puede tomar dos o más valores (cualidades o
números). Puede ser una característica medible (peso, precio, ingresos,
temperatura etc.) o una cualidad no medible (estado civil, calidad, color, sexo
etc.). Se puede representar con las letras X, Y, Z.
6
b) Variables Ordinales: Son aquellas en donde existe un orden
preestablecido entre las categorías de la variable. Ejemplos:
Grado de Instrucción: Primaria, Secundaria, Superior
Orden de Mérito: Primero, Segundo, Tercero etc.
Nivel Socioeconómico: Bajo, Medio, Alto etc.
7
Según la funcionalidad que tienen en la investigación
Ejemplo:
La variación en los precios de un determinado artículo, motiva cambios en las
ventas. En este ejemplo las variables son:
Venta = Y
Precio = X
Precio de venta = Y
Costo de producción = X
Podemos notar que el rol que asuma una determinada variable como
dependiente o independiente en una investigación, va a depender con qué
variable se asocie.
8
Niveles de medición:
A. Escala nominal
B. Escala Ordinal
C. Escala de Intervalos
D. Escala de Razón
Ejemplo:
Ejemplo Nº 1
9
Distribución de frecuencias: es distribuir los datos en clases, determinando el
número de datos pertenecientes a cada clase, denominado frecuencia de clase (f).
Metodología.
Podemos utilizar la siguiente:
0 hijos IIII f1 = 4
1 hijo IIIII f2 = 5
2 hijos IIIIIIII f3 = 8
3 hijos IIIII f4 = 5
4 hijos III f5 = 3
5 hijos IIII f6 = 4
6 hijos I f7 = 1
k=7 f= n = 30
K = clase
10
Procedimiento para construir una Tabla de Frecuencias de Distribución
de una variable agrupada en intervalos
11
a) La determinación del número de intervalos de clase, se emplea uno de
los siguientes métodos:
Es conveniente tener entre 5 y 20 intervalos de clase: Si n 25 k 5 ; Si
n 25 k n
Valor de X
Porcentaj
Marca de fi Fi hi Hi
Clase e 100 hi
clase
[LI1 – LS1> (LI1+ LS1) / 2 F1 F1 h1 H1
[LI2 – LS2> (LI2+ LS2) / 2 F2 F2 h2 H2
. . . . . .
. . . . . .
Los gráficos dan una idea mucho más sintética que los cuadros estadísticos, unas
veces su finalidad es simplemente tratar de demostrar la evolución de un determinado
fenómeno, pues mientras que la interpretación de un cuadro estadístico requiere
ciertos conocimientos, cualquiera puede comprender fácilmente que una línea
ascendente indica un aumento del fenómeno estudiado.
12
Gráficos de Barras: La diferencia reside en que no se necesita mostrar
frecuencias en el eje, sino que puede expresar los datos en cantidades absolutas
e incluso en porcentaje. En un gráfico de barras es posible mostrar más de un
valor a la vez.
13
Histograma: Se parece a un diagrama de barras por lo que no hay espacio entre
las barras. Revela detalles y estructuras que los datos brutos no muestran con
claridad. Es fácil distinguir la frecuencia relativa de cada clase, al mismo tiempo
que su frecuencia absoluta, como no hay espacio entre las barras, que es la
razón por la que el histograma se usa con frecuencia para datos con escala de
intervalos o de razón: Las barras adyacentes indica que se está resumiendo un
intervalo numérico que muestra las frecuencias de clases elegidas
arbitrariamente.
14
Ojiva: La gráfica de una distribución de frecuencias acumuladas se llama ojiva y
se usa para determinar cuántas observaciones hay mayores o menores que un
valor determinado en una distribución.
15
1.2 MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL
Son medidas que permiten determinar el centro o punto central de un conjunto de datos,
su determinación precisa puede variar en función de cómo definimos el centro; se divide
en tres categorías:
a. Las que ayudan a encontrar el centro de la distribución de frecuencias relativa, se
denominan medidas de tendencia central, entre estas tenemos: media aritmética,
mediana y moda de datos agrupados y no agrupados.
b. Las que miden su dispersión: Se denominan medidas de variación: varianza y
desviación típica de datos agrupados y no agrupados.
c. Las que descubren la posición relativa de una observación dentro de un conjunto de
datos: Se denominan medidas de posición relativa: Cuartiles, deciles y percentiles de
datos agrupados y no agrupados.
Mediana Mediana
Moda
Moda
16
PARA DATOS NO AGRUPADOS
LA MEDIA ARITMÉTICA
Simbología.-Fórmulas.
Dependiendo de la información disponible (poblacional o muestral) se puede
tener:
Media o promedio poblacional (u):
x
u=
N
_
Media o promedio muestra (x):
x = x
n
Propiedades:
17
5. Si a cada observación de una muestra se le multiplica por una constante,
el promedio de las nuevas observaciones será igual al promedio de la
muestra original multiplicada por la constante.
Ejemplos:
u = S/. 33,500; u representa el salario medio anual para los miembros de esta
planilla.
LA MEDIA PONDERADA
Fórmula:
upó X P = (px)
donde: p
p = factor de ponderación.
x = datos
Ejemplo
18
X P = S/. 38,67
Interpretación:
Si se elige al azar un vendedor se espera que cobre una comisión de: S/.
38.67 por cada teléfono vendido.
Ejemplo
3. suponga que los costos de producción y las cantidades producidas por tres
sucursales A, B y C son:
Solución
X P = 1,16 soles
Interpretación:
El costo de producción promedio por artículo, para la empresa es de 1,16
soles por cada unidad producida.
LA MEDIANA
Características:
19
Cálculo de la Mediana:
Med = X (n/2 + ½)
Si n es impar.
Ejemplo
Solución
En este caso los datos ordenados son:
5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17 y con
n = 11 se tiene:
Interpretación:
Ejemplo
Solución
3, 4, 5, 5, 6, 7, 8, 9 y con n = 8 se tiene:
20
X (n / 2) X (n / 2 1) X (8 / 2) X (8 / 2 1) X 4 X 5 5 6
Med 5,5
2 2 2 2
LA MEDIA ARITMÉTICA
Donde:
N = Nº de datos de la Población.
n = Nº de datos de la muestra.
Ambas fórmulas señalan que cada punto medio de cada clase (x), se multiplica
por la frecuencia de clase correspondiente (f), luego se suman estos productos
() para después dividir esta suma entre el número total de observaciones (n)
representadas en la distribución de frecuencias.
21
Ejemplos
Total 60 (fx)=1575
Solución
En la misma tabla calculamos la marca de clase (xc), es decir el valor intermedio
de cada clase o intervalo, y (fx), obtenemos:
fx 1575
x = = = 26,25
n 60
x = 26,25
Interpretación:
22
Las medidas de tendencia central son valores en una distribución y las medidas de
variabilidad son intervalos, designan distancias o un número de unidades en la escala
de medición.
Debemos tener en consideración que una medida de dispersión se puede utilizar para
describir con más detalle un conjunto de datos y dar una idea sobre la naturaleza de
las observaciones que han sido recogidas para su análisis, entre estas tenemos:
Ejemplo:
Conocidos los porcentajes o notas (x) de 80 estudiantes de Métodos Cuantitativos 1
se les puede disponer formando una distribución de frecuencias que da una idea más
ordenada de las características de la variable x (calificación o puntos).
1ro se le calcula la media de la variable x. Con este valor se puede representar la
distribución de frecuencias.
Si los puntajes (Notas) son muy altos con respeto a la media la variabilidad será
grande.
Si los puntajes (Notas) son muy próximos a la media, la variabilidad será pequeña.
La Medida de esta variabilidad es lo que se llama Medidas de Variación o Dispersión.
EJEMPLO
7. Durante un mes determinado del verano, 8 vendedores de aparatos eléctricos
vendieron el siguiente Nº de ventiladores:
8, 11, 5, 14, 8, 11, 16, 11. HALLAR
23
LA VARIANZA Y LA DESVIACIÓN ESTÁNDAR
Debido a que se dificulta la interpretación del significado del valor de una varianza,
porque las unidades en que se expresa son valores al cuadrado.
( x u ) 2
Desviación Estándar Poblacional
N
( x x ) 2
Desviación Estándar Muestral s
n 1
Ejemplo:
De acuerdo al ejemplo dado Donde: 8 vendedores vendieron el siguiente Nº de
ventiladores 8, 11, 5, 14, 8, 11, 16, 11.
X x-u (x-u)2
5 -5,5 30,25
8 -2,5 6,25
8 -2,5 6,25
11 0,5 0,25
11 0,5 0,25
11 0,5 0,25
14 3,5 12,25
16 5,5 30,25
Total 86,00
( x u ) 2 86
Desviación Estándar 10,75 3,3unidades
N 8
24
CÁLCULOS ABREVIADOS DE LA VARIANZA YLA DESVIACIÓN ESTÁNDAR.
Para no realizar el cálculo de c/u de las desviaciones con respecto a la Media Grupal,
existen Fórmulas abreviadas equivalentes, las cuales son:
x 2 Nu 2
Varianza Poblacional: 2
N
x 2 Nu 2
Desviación Estándar Poblacional:
N
x 2 n x
2
Varianza Muestral: s
2
n 1
x 2 n x
2
Ejemplo
8. Como verificación de resultados, calcular por fórmula abreviada la desviación
estándar respectiva del problema anterior, siendo x = u = 10,5.
x x2
5 25
8 64
8 64
11 121
11 121
11 121
14 196
16 256
Total 968
x 2 Nu 2 968 8(10,5) 2
10,75 3,3 unidades
N 8
MEDIDAS DE VARIABILIDAD (DISPERSIÓN) ASIMETRÍA Y CURTOSIS DE LOS
DATOS.
25
FIG. ASIMETRÍA DE PEARSON
f f f
x x x
(1) Asimétrica (2) Asimétrica (3) Simétrica
Negativa Positiva (Insesgada)
f f f
x x x
(1) Platikúrtica (2) Leptokúrtica (3) Mesocúrtica
26
Dónde: CV = Coeficiente de Variación
= desviación estándar.
x , u = media.
Ejemplo.
Para 2 Acciones Comunes de Empresas
(Telefónica A –Claro B)
El precio promedio de cierre en la bolsa de un mes fue:
Acción A = $15000 con desviación estándar de 500.
Acción B = $5000, con desviación estándar de 300.
500 300
CV ( A) 0,033 y CV ( B) 0,060
u 15000 5000
Su Fórmula:
3(u Med )
Asimetría Poblacional:
3( x Med )
Asimetría de la Muestra:
S
27
Para una distribución con asimetría (-) la x es siempre < que la Med. => Asimetría =
(-).
u = x =10.5 =
x 84 10,5
n 8
X4 X5
Med = X (5 8 8 11 11 11 14 16) =
2
11 11
Med = 11
2
= 3,3
3(u Med ) 3(10,5 11,0)
Asimetría = 0,45
3,3
(El grado en que están sesgados se refleja en este valor)
Así, la distribución de las unidades vendidas tiene una ligera asimetría negativa, es
decir, está sesgada hacia la izquierda.
ASIMETRÍA DE PEARSON.
f
X
Asimetría Negativa
28
MEDIDAS DE VARIACIÓN PARA DATOS AGRUPADOS
EL RANGO
Para datos agrupados en una Dist. De frecuencias el Rango (R):
Límite Exacto Superior de la clase (intervalo) más alto Ls(A) y el lím ite
exacto inferior de la clase (Intervalo) más baja L I (B)
Así: R= Ls (A)- LI (B)
Ejemplo.
En los siguientes datos agrupados de las salarios mensuales de 100 trabajadores
hallar el rango.
Para los datos agrupados en una distribución de frecuencias, se asume que el punto
medio de cada clase (Intervalo), representa a todas las mediciones incluidas en esa
clase (intervalo); es igual que el cálculo de la media para datos agrupados.
Fórmula Empleada:
DMPOBLACIONAL =
( f ) x u
N
Ejemplo.
Para los datos de salarios diarios del Problema anterior calcular la Desviación Media.
Solución
Pto. Medio
Salario (f) Nº de
de clase f(x) | x u| f x u
Mensual Trabajadores
(Intervalo) x
2400 2599 2499,50 7 17496,50 450 3150
2600 2799 2699,50 20 53990,00 250 5000
2800 2999 2899,50 33 95683,50 50 1650
3000 3199 3099,50 25 77487,50 150 3750
3200 3399 3299,50 11 36294,50 350 3850
3400 3599 3499,50 4 13998,00 550 2200
Total: 100 294950,00 Total: 19600
29
LA VARIANZA YLA DESVIACIÓN ESTANDAR PARA DATOS
AGRUPADOS.
Varianza Poblacional:
2
f x u
2
N
f x x
2
Varianza Muestral: S 2
n 1
f x u
2
f x x
2
Ejemplo.
9. Para los datos de salarios diarios que se presentan a continuación.
Hallar la Desviación Estándar muestral
Pto. Medio
Salario (f) Nº de
de clase f(x) x x x x f x x
2 2
Diario Trabajadores
(Intervalo)x
2400 - 2599 2499,50 7 17496,50 -450 202500 1417500
2600 - 2799 2699,50 20 53990,00 -250 62500 1250000
2800 - 2999 2899,50 33 95683,50 -50 2500 82500
3000 - 3199 3099,50 25 77487,50 150 22500 562500
3200 - 3399 3299,50 11 36294,50 350 122500 1347500
3400 - 3599 3499,50 4 13998,00 550 302500 1210000
Total: 100 294900,50 Total : 5870000
Solución
5to: f x x Tabla
2
30
f x x
2
5870000
6 :Reemplazo de fórmula S
to
59292.93
n 1 99
S 243.50
Varianza Poblacional:
2 f x 2 Nu 2
N
f x nx
2 2
Varianza Muestral: S 2
n 1
fx n x
2 2
Ejemplo.
Del problema anterior calcular la Desviación Estándar resultante probando de
esta manera la Respuesta, usando Fórmulas abreviadas.
875825025 1002949
2
S 243,50
100 1
31
1.4 PROBABILIDADES.
EVENTO
10. En una cantidad de cartas bien barajadas que contiene 4 ases y 48 cartas
de otras tipo, la probabilidad de obtener 1 (as) en una sola extracción es:
N A
P(A) = = 4/52 = 1/13
N S
Solución
a) El Espacio Muestral () = {CCC CCS CSC SCC CSS SCS SSC SSS}
32
P(A)3/8
c) Exactamente 2 sellos?
3/8
d) Exactamente 3 caras
1/8
PROBABILIDAD SUBJETIVA
CONSIDERACIONES GENERALES
1.La Probabilidad de ocurrencia de cada Punto Muestral, debe estar entre 0
y 1.
0 P(A) 1
2.La Suma de las Probabilidades de todos los puntos Muestrales debe ser
igual a 1.
P(A) + P(A’) = 1
Es decir en una observación o experimento dados, el evento debe ocurrir o No.
Por ello la suma de la probabilidad de ocurrencia + la Probabilidad de no
ocurrencia siempre es igual a 1.
(AB = ):
A B P(AB)=PA+PB
Ejemplo
11. Se extrae una carta de una baraja de 52, los eventos “as” (A) y “rey” (R)
son mutuamente excluyentes.
33
Solución
Solución
Solución
34
PROBABILIDAD CONDICIONAL
Definición:
P( AyB ) P( A B)
P( B / A)
P( A) P( A)
Donde:
PROBABILIDAD CONJUNTA:
Definición:
Una Medida de la Probabilidad del acontecer simultáneo de dos o más
eventos se llama probabilidad conjunta. Para los eventos A y B, esta
probabilidad se simboliza por P(AyB) o P(AB).
Solución
35
De la fórmula de Probabilidad Condicional podemos determinar la
probabilidad de obtener un número > que 3 dado que es par.
P A B 2 / 6 2
PB / A
P A 3/ 6 3
Este resultado queda comprobado por el hecho que de los 3 resultados pares
2, 4, 6 sólo 2 son mayores que 3.
MULTIPLICACION DE PROBABILIDADES
36
Uso de Diagramas de árbol para eventos Independientes.
Útiles para ilustrar los posibles eventos asociados con observaciones o ensayos
secuenciales, del ejemplo anterior obtenemos:
Resultado Resultado Evento Probabilidad
4/4 = 1.00
37
Solución
38
Bibliografía
39
La Desviación Estándar Utilizando las fórmulas abreviadas
40