Está en la página 1de 40

Estadística Aplicada a la

Investigación Empresarial

MÓDULO I
ÍNDICE

MÓDULO I: ESTADÍSTICA DESCRIPTIVA Pág.

I. ESTADÍSTICA E INVESTIGACIÓN CIENTÍFICA.


ORGANIZACIÓN Y PRESENTACIÓN DE DATOS ................. 3

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA


II. 16
CENTRAL…………………………………………………………....

III. MEDIDAS DE RESUMEN: MEDIDAS DE DISPERSIÓN.…….. 22

IV. PROBABILIDADES……………………………………….…………. 32
MÓDULO I

I. ESTADÍSTICA DESCRIPTIVA.

1.1. Estadística e investigación científica

La Estadística es la ciencia que estudia los métodos científicos en la toma,


Organización, presentación y análisis de datos, para la deducción de conclusiones y/o
toma decisiones razonables.

Estadística es la ciencia que se ocupa de la creación, desarrollo y aplicación de las


técnicas que permiten hacer un análisis confiable de una población. En términos
generales, se ocupa de la colección, resumen y presentación de información, del
análisis e interpretación de datos y resultados, de modo tal que pueda evaluarse la
confiabilidad y riesgos asociados a las condiciones que se pueden derivar a partir de
la información captada.

Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología,
Educación, Psicología, Administración, Economía, Contabilidad, Medicina, Ciencias
Políticas, Proyectos de tesis, Proyectos de Inversión, entre otras.

3
Las dos grandes ramas en que se divide a la estadística son:

Estadística Descriptiva
Es la parte de la estadística que estudia un grupo de datos dado, sin inferir sus
conclusiones a un grupo mayor.

Estadística Inferencial o inductiva


Es la parte de la estadística que estudia condiciones bajo las cuales las conclusiones
de la muestra son válidas para la población, la Estadística inferencial usa el concepto
de probabilidad, que es la medida de la incertidumbre.

DEFINICIÓN DE TÉRMINOS ESTADÍSTICOS


A. Población:
Es la totalidad de individuos o de elementos (empresas, personas, objetos etc.)
que cumplen o satisfacen la o las características en estudio. Por el número de
elementos que la componen la población se clasifica en finita e infinita.

4
a) La población es finita: es un número determinado de elementos en caso
contrario es infinita. En la práctica una población finita con un gran número de
elementos se considera como una población infinita,
b) La población infinita: es cuando no se conoce el tamaño de ala población,
por otro lado el tamaño de una población va a depender de objetivo trazado
por el investigador.

B. Muestra:
Está constituida por una parte de los individuos o elementos que componen la
población, seleccionada de acuerdo a cierta técnica con el fin de obtener
información acerca de la población, de la cual proviene. La muestra debe ser
seleccionada de manera que sea representativa, es decir tenga características
similares a las de su población.

C. Parámetro:
Es una medida descriptiva que resume una característica de la población, es
decir constituye el valor real, verdadero; su cálculo implica utilizar toda la
información contenida en la población; entre los más conocidos tenemos:
 La media poblacional (μ)
 La varianza poblacional (σ2)
 La proporción poblacional (P) etc.

D. Estadístico:
Es una medida que describe una característica de la muestra, se calcula a partir
de los datos observados en la muestra; es decir constituyen los estimadores de
cada uno de sus respectivos parámetros; entre estos tenemos:
 La media muestral (X)
 La varianza muestral (S2)
 La proporción muestral (p)

5
E. VARIABLE:
Es una característica definida en la población de acuerdo a cierto interés en una
investigación estadística, que puede tomar dos o más valores (cualidades o
números). Puede ser una característica medible (peso, precio, ingresos,
temperatura etc.) o una cualidad no medible (estado civil, calidad, color, sexo
etc.). Se puede representar con las letras X, Y, Z.

Clasificación de las Variables

Según la naturaleza de la variable


 Variables Cualitativas o Categóricas: Son aquellas cuyos valores expresan
cualidades o atributos; estas a su vez pueden ser:

a) Variables Nominales: Son aquellas en donde no existe un orden


preestablecido entre las categorías de las variable. Ejemplos:
 Colores: Azul, rojo, blanco, verde, negro, amarillo etc.
 Distritos: Lima, La Victoria, Breña, Miraflores, San Isidro, Lince etc.
 Sexo: Masculino, femenino.
 Calidad de un producto: Buena, mala.

6
b) Variables Ordinales: Son aquellas en donde existe un orden
preestablecido entre las categorías de la variable. Ejemplos:
 Grado de Instrucción: Primaria, Secundaria, Superior
 Orden de Mérito: Primero, Segundo, Tercero etc.
 Nivel Socioeconómico: Bajo, Medio, Alto etc.

También podemos considerar como variables ordinales por ejemplo


grado de satisfacción de un servicio (1 = Muy insatisfecho; 2 =
Insatisfecho; 3 = Ni satisfecho ni insatisfecho; 4 = Satisfecho; 5 = Muy
satisfecho)

 Variables Cuantitativas: Son aquellas que se obtienen como resultado de


mediciones o conteos numerables, estas a su vez se clasifican en:

a) Variables Discretas: Son aquellas cuyos valores resultan como


consecuencia de conteos, y por tanto solo pueden asumir valores
enteros positivos, incluido el cero. Y está asociado a un periodo.
Ejemplos:
 Número de empresas, número de hospitales, número de trabajadores,
número de comprobantes de pago, número de máquinas, número de
conservas etc.

b) Variables Continuas: Son aquellas cuyos valores se obtienen por


medición, pueden asumir valores decimales, enteros y pertenecen a un
rango o intervalo.
Ejemplos:
 Los sueldos, el precio, la temperatura, el volumen, el tiempo, el peso
de las personas, la estatura, la presión etc.

7
Según la funcionalidad que tienen en la investigación

A. Variable Dependiente: La variable dependiente es determinada por el


investigador para estudiarla en función de otras variables denominadas
independientes. Generalmente se simboliza esta variable con la letra Y.

B. Variable Independiente: La variable independiente es aquella que será


controlada en un experimento por el investigador. Generalmente se simboliza
esta variable con la letra X. En la mayoría de los experimentos el investigador
está interesado en determinar el efecto que tiene la variable X, sobre la
variable Y; para esto el investigador controla los niveles de la variable X y
mide el efecto sobre la otra variable.

Ejemplo:
 La variación en los precios de un determinado artículo, motiva cambios en las
ventas. En este ejemplo las variables son:

Venta = Y
Precio = X

 El costo de producción de un artículo, determina su precio de venta. En este


caso las variables son:

Precio de venta = Y
Costo de producción = X

Podemos notar que el rol que asuma una determinada variable como
dependiente o independiente en una investigación, va a depender con qué
variable se asocie.

8
Niveles de medición:
A. Escala nominal
B. Escala Ordinal
C. Escala de Intervalos
D. Escala de Razón

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS

En una investigación, es necesario organizar los datos obtenidos para el análisis


respectivo.
Toma o recolección de datos
Es la obtención de datos tal como se encuentran en sus fuentes.
Puede ser directamente de la realidad, mediante conteos o mediciones, archivos,
formatos, encuestas, experimentos, etc.

Ordenación: es la colocación de los datos en orden creciente, decreciente, u otro


criterio necesario para el trabajo final.
Rango: es la diferencia entre el dato mayor y el dato menor.

Ejemplo:

Ejemplo Nº 1

Corresponde a una muestra de 30 familias sobre el número de hijos por familia:


A = {1,2,5,3,4,2,0,5,3,2,4,2,1,0,3,2,1,0,3,2,1,0,1,3,5,6,2, 5,4,2,}

En este caso se tiene que n = 30.


n= Tamaño de la muestra.

PRESENTACIÓN DE LA INFORMACIÓN O DATOS

Distribución de Frecuencia de una Muestra Discreta

9
Distribución de frecuencias: es distribuir los datos en clases, determinando el
número de datos pertenecientes a cada clase, denominado frecuencia de clase (f).

Metodología.
Podemos utilizar la siguiente:

1º Se determina el número de clases, de acuerdo a los datos que se disponen.

2º En la primera columna se ordena en forma ascendente los datos u Observaciones


que son diferentes.
3º La segunda columna se utiliza para realizar el conteo de los datos que se repiten
(frecuencia)
4º En la tercera columna, se indica el número de veces (frecuencia) que se repite una
clase

Distribución de Frecuencia de una Muestra Discreta


La tabla de distribución de frecuencias que corresponde al ejemplo Nro. 1 es el
siguiente:

Clases X Conteo Frecuencia (f)

0 hijos IIII f1 = 4
1 hijo IIIII f2 = 5
2 hijos IIIIIIII f3 = 8
3 hijos IIIII f4 = 5
4 hijos III f5 = 3
5 hijos IIII f6 = 4
6 hijos I f7 = 1

k=7 f= n = 30
K = clase

10
Procedimiento para construir una Tabla de Frecuencias de Distribución
de una variable agrupada en intervalos

A. Determinación del Rango:


 Intervalos traslapados: R = valor mayor – valor menor
 Intervalos no traslapados: R = [valor mayor – valor menor] + 1 unidad de
medida

B. Determinación del número de Intervalos de Clase: El intervalo es un


símbolo que define una clase, se fija una determinada amplitud para cada
intervalo, pueden ser:

 Semiabiertos (traslapado) [a,b>; contiene siempre al valor inferior pero no


el superior.
 Intervalos con límites reales de Clase: valores numéricos enteros, los
intervalos de clase no se traslapan. Para transformarlo al intervalo de clase
semiabierto se debe elegir adecuadamente sus límites de clase, sin modificar
sus frecuencias. Los limites reales de los intervalos de clase se obtendrán
restando y sumando 0.5 (mitad de la unidad de medida = 1) al límite inferior y
superior.

11
a) La determinación del número de intervalos de clase, se emplea uno de
los siguientes métodos:
 Es conveniente tener entre 5 y 20 intervalos de clase: Si n  25  k  5 ; Si
n  25  k  n

 Si k =2c  n el número de clases es la potencia c


 Fórmula de Sturges: K = 1 + 3.32 log n
Cuando los resultados para obtener K son números reales con decimales, se
redondean al entero inmediato mayor.

b) La determinación del Tamaño de clase (amplitud)


 Amplitud de Clase: Es la diferencia que hay entre el extremo superior y el
extremo inferior de cada intervalo de clase. Se recomienda que todas las clases
tengan la misma amplitud: c  R /K

Tabla de distribución de frecuencia

Valor de X
Porcentaj
Marca de fi Fi hi Hi
Clase e 100 hi
clase
[LI1 – LS1> (LI1+ LS1) / 2 F1 F1 h1 H1
[LI2 – LS2> (LI2+ LS2) / 2 F2 F2 h2 H2
. . . . . .
. . . . . .

[Lik – LSk> (Lik+ LSk) / 2 Fk Fk = n hk Hk = 1


k k
Total f
i 1
i n h
i 1
i n

Presentación de la Información mediante Gráficos.

Los gráficos dan una idea mucho más sintética que los cuadros estadísticos, unas
veces su finalidad es simplemente tratar de demostrar la evolución de un determinado
fenómeno, pues mientras que la interpretación de un cuadro estadístico requiere
ciertos conocimientos, cualquiera puede comprender fácilmente que una línea
ascendente indica un aumento del fenómeno estudiado.

12
 Gráficos de Barras: La diferencia reside en que no se necesita mostrar
frecuencias en el eje, sino que puede expresar los datos en cantidades absolutas
e incluso en porcentaje. En un gráfico de barras es posible mostrar más de un
valor a la vez.

 Diagrama del Pastel: Es una forma efectiva de desplegar los porcentajes en


que se dividen los datos, es particularmente útil si se quiere hacer hincapié en
los tamaños relativos de los componentes de los datos. Los presupuestos y la
información económica se describen con frecuencia mediante el diagrama del
pastel.

Un círculo completo de 360°, representa el número total de observaciones. El


tamaño de las porciones es proporcional a la frecuencia relativa de cada
categoría. Ejemplo. Si la frecuencia relativa de una categoría es 0.25, esa
porción será el 25 % de 360°, es decir 90° (un cuarto de círculo). El diagrama de
pastel puede representar de manera efectiva datos cuantitativos una vez que
han sido organizados en categorías

13
 Histograma: Se parece a un diagrama de barras por lo que no hay espacio entre
las barras. Revela detalles y estructuras que los datos brutos no muestran con
claridad. Es fácil distinguir la frecuencia relativa de cada clase, al mismo tiempo
que su frecuencia absoluta, como no hay espacio entre las barras, que es la
razón por la que el histograma se usa con frecuencia para datos con escala de
intervalos o de razón: Las barras adyacentes indica que se está resumiendo un
intervalo numérico que muestra las frecuencias de clases elegidas
arbitrariamente.

 Polígono de Frecuencias: Proporciona claramente el perfil del patrón de los


datos. Expresa la distribución de los datos por medio de una sola línea que una
las marcas de clase. Es una práctica corriente de extender ambos extremos del
polígono de frecuencias hasta el eje horizontal en aquellos puntos que serán las
marcas de las clases adyacentes a cada extremo.

14
 Ojiva: La gráfica de una distribución de frecuencias acumuladas se llama ojiva y
se usa para determinar cuántas observaciones hay mayores o menores que un
valor determinado en una distribución.

 Escalas Usadas en el Trazado de un Gráfico: La mayoría de los gráficos se


presentan mediante los “Sistemas de coordenadas rectangulares” que son
aquellos formados por la intersección de dos rectas en ángulo recto. De estas
dos rectas la horizontal o la abscisa se destinará para las diferentes clases de la
variable que se utiliza y la vertical u ordenadas, para anotar la frecuencia. Las
escalas de medida que se usan deben ser de la misma longitud o algo mayor la
horizontal que la vertical. En general, las dos escalas deben guardar una
proporción 1 a 1 y 1 a 2, es decir que si la ordenada mide 10 cm, la abscisa debe
medir entre 10 y 20 cm. Esta exigencia se hace con el fin de no distorsionar el
fenómeno que se estudia.

15
1.2 MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL
Son medidas que permiten determinar el centro o punto central de un conjunto de datos,
su determinación precisa puede variar en función de cómo definimos el centro; se divide
en tres categorías:
a. Las que ayudan a encontrar el centro de la distribución de frecuencias relativa, se
denominan medidas de tendencia central, entre estas tenemos: media aritmética,
mediana y moda de datos agrupados y no agrupados.
b. Las que miden su dispersión: Se denominan medidas de variación: varianza y
desviación típica de datos agrupados y no agrupados.
c. Las que descubren la posición relativa de una observación dentro de un conjunto de
datos: Se denominan medidas de posición relativa: Cuartiles, deciles y percentiles de
datos agrupados y no agrupados.

1.2. Medidas de tendencia central

MEDIDAS DE TENDENCIA CENTRAL

Datos no agrupados Datos agrupados

Media Aritmética Media Aritmética

Mediana Mediana

Moda
Moda

Media Aritmética Media Aritmética


Ponderada Ponderada

Media Geométrica Media Geométrica

16
PARA DATOS NO AGRUPADOS

LA MEDIA ARITMÉTICA

De un conjunto de datos numéricos es la suma de todas las observaciones


del conjunto, dividida entre el número de observaciones.

Simbología.-Fórmulas.
Dependiendo de la información disponible (poblacional o muestral) se puede
tener:
Media o promedio poblacional (u):

x
u=
N
_
Media o promedio muestra (x):

x = x
n

Dónde: x= suma de todos los datos


N = Tamaño de la población (Nro. De datos)

n = Tamaño de la muestra (Nro. De datos)

Propiedades:

1. La Media aritmética es un valor representativo debido a que es el centro


de gravedad o punto de equilibrio de un conjunto de observaciones.

2. Si se sustituye el valor de cada observación por el valor del Promedio


Aritmético no varía la suma de todas las observaciones.

3. La suma de las desviaciones de las observaciones con respecto al


promedio aritmético es igual a cero.

4. Si cada observación de una muestra se le suma una constante el promedio


de las nuevas observaciones será igual al promedio de la muestra original
más la constante.

17
5. Si a cada observación de una muestra se le multiplica por una constante,
el promedio de las nuevas observaciones será igual al promedio de la
muestra original multiplicada por la constante.

Ejemplos:

1 . Tenemos los salarios anuales (en soles) de 7 supervisores.


34,500; 30,700; 32,900; 36,000; 34,100; 33,800; 32,500. Calcular la media (u).

34,500  30,700  32,900  36,000  34,100  33,800  32,500


u
7

u = S/. 33,500; u representa el salario medio anual para los miembros de esta
planilla.

LA MEDIA PONDERADA

Fórmula:

upó X P = (px)

donde: p
p = factor de ponderación.

x = datos

Ejemplo

2. Una empresa comercializadora de teléfonos celulares dispone de tres


vendedores, c/u. de los cuales cobra diferente comisión por teléfono vendido y
realizan diferentes números de ventas. Calcule e interprete el valor medio de la
comisión.

Vendedor Número de Teléfs. Comisión por


Vendidos ( p ) Venta S/. (x)
Manuel 30 30
José 25 40
Richard 20 50

30(30)  25(40)  20(50) 2900


XP  
30  25  20 75

18
X P = S/. 38,67

Interpretación:

Si se elige al azar un vendedor se espera que cobre una comisión de: S/.
38.67 por cada teléfono vendido.

Ejemplo

3. suponga que los costos de producción y las cantidades producidas por tres
sucursales A, B y C son:

Sucursal Costo de Producción (x) Cantidad Producida (p)


A 1,20 500
B 1,60 200
C 1,05 900

Calcular el costo de producción promedio por unidad producida.

Solución

XP = (px) = 500(1,20) + 200(1,60) + 900 (1,05) = 1865


p 500 + 200 + 900 1600

X P = 1,16 soles

Interpretación:
El costo de producción promedio por artículo, para la empresa es de 1,16
soles por cada unidad producida.

LA MEDIANA

La mediana de un conjunto de observaciones ordenadas de acuerdo a su


magnitud, es el valor de la observación que ocupa la posición central de dicho
conjunto.

Características:

1. La mediana divide a un conjunto de observaciones en dos partes iguales.


El 50% con valores mayores a la mediana y el otro 50% con valores
menores a la mediana.

2. Como medida de posición, la mediana es influenciada por el número de


observaciones y no por los valores de las observaciones.

19
Cálculo de la Mediana:

Para determinar la posición de la mediana se usa la siguiente fórmula:

Med = X (n/2 + ½)

Si n es impar.

Para un grupo con un número par de elementos, la mediana se encuentra a


la mitad entre los dos valores adyacentes al centro es decir:

Med = X (n/2) + X(n/2 + 1)


2
Si n es par.

Ejemplo

4. Los siguientes datos se refieren al número de clientes atendidos durante los


últimos 11 días en una tienda de artefactos. Calcule e interprete la mediana.

12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Solución
En este caso los datos ordenados son:
5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17 y con
n = 11 se tiene:

Med = X (n/2 + ½) = X(11/2 + ½) = X6 = 11

Interpretación:

Durante 5 días se atendieron a menos de 11 clientes, y durante 5 días se


atendieron a más de 11 clientes.

Ejemplo

5. Si se tiene las observaciones: 5, 8, 7, 9, 6, 5, 4, 3. Calcular la Mediana.

Solución

En este caso los datos ordenados son:

3, 4, 5, 5, 6, 7, 8, 9 y con n = 8 se tiene:

20
X (n / 2)  X (n / 2  1) X (8 / 2)  X (8 / 2  1) X 4  X 5 5  6
Med      5,5
2 2 2 2

El valor de la mediana se encuentra entre los valores cuarto y quinto de este


conjunto ordenado, es decir 5 y 6 en este caso, la mediana es 5.5.

MODA: De un conjunto de datos, es la que se repite con mayor Frecuencia

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS CON MUESTRAS


DISCRETAS Y DATOS AGRUPADOS

LA MEDIA ARITMÉTICA

Los datos agrupados son datos dados en tablas de frecuencias.


Cuando se agrupan datos en una distribución de frecuencias, se utiliza el punto
medio de cada clase (xc) como aproximación de todos los valores contenidos
en ella.
Fórmulas Usadas:

Media o promedio Poblacional (u)


fx
u=
N

Media o Promedio Muestral ( X )


fx
X =
n

Donde:

x = Marca de clase (Punto medio) de cada clase.

f = frecuencia observada de valores en cada clase respectiva.

N = Nº de datos de la Población.

n = Nº de datos de la muestra.

Ambas fórmulas señalan que cada punto medio de cada clase (x), se multiplica
por la frecuencia de clase correspondiente (f), luego se suman estos productos
() para después dividir esta suma entre el número total de observaciones (n)
representadas en la distribución de frecuencias.

21
Ejemplos

6. La distribución de frecuencias siguiente, representa los puntajes


obtenidos en una evaluación del desempeño aplicado al personal técnico de
una empresa. El puntaje máximo de la prueba es 60. Calcule e interprete en
Media.

Distribución de frecuencias de los puntajes por evaluación de 60 Técnicos

Desempeño Número de Marca de (fx)


(Puntos) Técnicos (f) Clase (x)
12 – 16 4 14 56
17 – 21 8 19 152
22 – 26 15 24 360
27 – 31 23 29 667
32 – 36 10 34 340

Total 60 (fx)=1575

Solución
En la misma tabla calculamos la marca de clase (xc), es decir el valor intermedio
de cada clase o intervalo, y (fx), obtenemos:

fx 1575
x = = = 26,25
n 60
x = 26,25

Interpretación:

Si se elige al azar un técnico se espera que tenga un puntaje de 26.25 en su


evaluación de desempeño.

1.3 MEDIDAS RESUMEN: MEDIDAS DE DISPERSIÓN

Nos indica la dispersión de los datos en la escala de medición, responden a la pregunta


¿En dónde están diseminadas las puntuaciones o valores obtenidos?
Una medida de dispersión indica el grado en que las observaciones individuales se
dispersan o distribuyen en alrededor de su media.

22
Las medidas de tendencia central son valores en una distribución y las medidas de
variabilidad son intervalos, designan distancias o un número de unidades en la escala
de medición.
Debemos tener en consideración que una medida de dispersión se puede utilizar para
describir con más detalle un conjunto de datos y dar una idea sobre la naturaleza de
las observaciones que han sido recogidas para su análisis, entre estas tenemos:

Mientras que las medidas de Tendencia Central identifican el valor “Típico”


representativo en un conjunto de datos en contraste:
Las medidas de variación (dispersión) describen la medida de esta variabilidad según
sea grande o pequeña con respeto a una Medida de Tendencia Central (Media) x o
u.

Ejemplo:
Conocidos los porcentajes o notas (x) de 80 estudiantes de Métodos Cuantitativos 1
se les puede disponer formando una distribución de frecuencias que da una idea más
ordenada de las características de la variable x (calificación o puntos).
 1ro se le calcula la media de la variable x. Con este valor se puede representar la
distribución de frecuencias.
Si los puntajes (Notas) son muy altos con respeto a la media la variabilidad será
grande.
Si los puntajes (Notas) son muy próximos a la media, la variabilidad será pequeña.
La Medida de esta variabilidad es lo que se llama Medidas de Variación o Dispersión.

MEDIDAS DE VARIACIÓN PARA DATOS NO AGRUPADOS

EJEMPLO
7. Durante un mes determinado del verano, 8 vendedores de aparatos eléctricos
vendieron el siguiente Nº de ventiladores:
8, 11, 5, 14, 8, 11, 16, 11. HALLAR

23
LA VARIANZA Y LA DESVIACIÓN ESTÁNDAR

Debido a que se dificulta la interpretación del significado del valor de una varianza,
porque las unidades en que se expresa son valores al cuadrado.

Surge la Desviación estándar (, s), que es la raíz cuadrada de la varianza,


representada mediante la letra griega  o s para una muestra; su fórmula es:

( x  u ) 2
Desviación Estándar Poblacional  
N

( x  x ) 2
Desviación Estándar Muestral s 
n 1

Ejemplo:
De acuerdo al ejemplo dado Donde: 8 vendedores vendieron el siguiente Nº de
ventiladores 8, 11, 5, 14, 8, 11, 16, 11.

2do Tabla: Considerando estas ventas como población:

X x-u (x-u)2
5 -5,5 30,25
8 -2,5 6,25
8 -2,5 6,25
11 0,5 0,25
11 0,5 0,25
11 0,5 0,25
14 3,5 12,25
16 5,5 30,25
 Total 86,00

( x  u ) 2 86
Desviación Estándar     10,75  3,3unidades
N 8

24
CÁLCULOS ABREVIADOS DE LA VARIANZA YLA DESVIACIÓN ESTÁNDAR.

Para no realizar el cálculo de c/u de las desviaciones con respecto a la Media Grupal,
existen Fórmulas abreviadas equivalentes, las cuales son:
x 2  Nu 2
Varianza Poblacional:  2 
N
x 2  Nu 2
Desviación Estándar Poblacional:  
N
x 2  n x
2

Varianza Muestral: s 
2

n 1
x 2  n x
2

Desviación Estándar Muestral: s 


n 1

Ejemplo
8. Como verificación de resultados, calcular por fórmula abreviada la desviación
estándar respectiva del problema anterior, siendo x = u = 10,5.
x x2
5 25
8 64
8 64
11 121
11 121
11 121
14 196
16 256
Total 968

x 2  Nu 2 968  8(10,5) 2
   10,75  3,3 unidades
N 8
MEDIDAS DE VARIABILIDAD (DISPERSIÓN) ASIMETRÍA Y CURTOSIS DE LOS
DATOS.

Formas de Curvas de frecuencias.


Después de haber dibujado el polígono de frecuencias y la curva ojiva para la
distribución de frecuencias acumuladas, también tenemos los siguientes tipos de
curvas:

En términos de ASIMETRÍA (Lados Laterales), una curva de frecuencia puede ser:

(1) Asimétrica Negativa: Asimétrica con la cola hacia la izquierda.


(2) Asimétrica Positiva: Con la “cola” hacia la derecha.
(3) Simétrica.

25
FIG. ASIMETRÍA DE PEARSON
f f f

x x x
(1) Asimétrica (2) Asimétrica (3) Simétrica
Negativa Positiva (Insesgada)

(Esta sesgada (Sesgada hacia

hacia la izquierda) la derecha)


En términos de Kurtosis (vértice superior), una curva de frecuencia puede ser:

(1) Platikúrtica: Plana, con las observaciones distribuidas de manera relativamente


uniforme en todas las clases.
(2) Leptokúrtica: Puntiaguda, con las observaciones concéntricas en un estrecho
rango de valores.
(3) Mesocúrtica: Ni plana ni puntiaguda, en términos de la distribución de los valores
observados.

FIG. 3.2. KURTOSIS

f f f

x x x
(1) Platikúrtica (2) Leptokúrtica (3) Mesocúrtica

EL COEFICIENTE DE VARIACIÓN (C.V.)

Indica la Magnitud relativa de la Media de la Distribución:


Su fórmula es:

Población: CV = x 100
u
s
Muestra: CV = x 100
x

26
Dónde: CV = Coeficiente de Variación
 = desviación estándar.
x , u = media.

Si consideramos 2 o más distribuciones con medios bastantes diferentes o si se


miden en unidades distintas, será peligroso extraer conclusiones sobre la dispersión
a partir de un único valor de la Desviación Estándar. Es como comparar manzanas
con naranjos: por tanto se recurre frecuentemente al uso del C.V.

Se aplica para comparar la variabilidad de 2 conjuntos de datos con respeto al nivel


general de los valores de c/conjunto (y, por ello respeto a la media).

Ejemplo.
Para 2 Acciones Comunes de Empresas
(Telefónica A –Claro B)
El precio promedio de cierre en la bolsa de un mes fue:
Acción A = $15000 con desviación estándar de 500.
Acción B = $5000, con desviación estándar de 300.

Haciendo una comparación absoluta, resultó ser superior la variabilidad en el precio


de la acción A, debido a que muestra una mayor desviación estándar. Pero con
respecto al nivel de precios, deben compararse los respetivos coeficientes de
variación:

 500 300
CV ( A)    0,033 y CV ( B)   0,060
u 15000 5000

Interpretación: El Precio de la acción B ha sido casi 2 veces más variable que la


acción A.
(Con respecto al precio promedio para c/u de las 2).

COEFICIENTE DE ASIMETRÍA DE PEARSON (SESGO)


Mide la desviación de la simetría, expresando la diferencia entre la media y la
mediana con respecto a la desviación estándar del grupo de mediciones.

Su Fórmula:

3(u  Med )
Asimetría Poblacional:

3( x  Med )
Asimetría de la Muestra:
S

Para una distribución Simétrica, el valor del coeficiente de asimetría siempre es = 0,


porque la media y la mediana son iguales.
Para una distribución con asimetría (+), la x es siempre > que la Med. => Asimetría
= (+).

27
Para una distribución con asimetría (-) la x es siempre < que la Med. => Asimetría =
(-).

Ejemplo. Del ejemplo dado en el ejemplo 1de 8 vendedores que vendieron


ventiladores.

u = x =10.5 =
 x  84  10,5
n 8
X4  X5
Med = X (5 8 8 11 11 11 14 16) =
2
11  11
Med =  11
2
 = 3,3
3(u  Med ) 3(10,5  11,0)
 Asimetría =   0,45
 3,3
(El grado en que están sesgados se refleja en este valor)

Así, la distribución de las unidades vendidas tiene una ligera asimetría negativa, es
decir, está sesgada hacia la izquierda.

ASIMETRÍA DE PEARSON.
f

X
Asimetría Negativa

28
MEDIDAS DE VARIACIÓN PARA DATOS AGRUPADOS

EL RANGO
Para datos agrupados en una Dist. De frecuencias el Rango (R):
Límite Exacto Superior de la clase (intervalo) más alto Ls(A) y el lím ite
exacto inferior de la clase (Intervalo) más baja L I (B)
Así: R= Ls (A)- LI (B)

Ejemplo.
En los siguientes datos agrupados de las salarios mensuales de 100 trabajadores
hallar el rango.

Salario Mensual Límites Exactos


$ De Clase
2400 – 2599 2399,50 – 2599,50
2600 – 2799 2599,50 – 2799,50
2800 – 2999 2799,50 – 2999,50
3000 – 3199 2999,50 – 3199,50
3200 – 3399 3199,50 – 3399,50
3400 – 3599 3399,50 – 3599,50

R = Ls(A) – LI(B) = 3599,50 – 2399,50 = 1200

DESVIACIÓN MEDIA PARA DATOS AGRUPADOS

Para los datos agrupados en una distribución de frecuencias, se asume que el punto
medio de cada clase (Intervalo), representa a todas las mediciones incluidas en esa
clase (intervalo); es igual que el cálculo de la media para datos agrupados.

Fórmula Empleada:

DMPOBLACIONAL =
 ( f ) x  u 
N

Ejemplo.
Para los datos de salarios diarios del Problema anterior calcular la Desviación Media.

Solución

Pto. Medio
Salario (f) Nº de
de clase f(x) | x u| f x u
Mensual Trabajadores
(Intervalo) x
2400 2599 2499,50 7 17496,50 450 3150
2600 2799 2699,50 20 53990,00 250 5000
2800 2999 2899,50 33 95683,50 50 1650
3000 3199 3099,50 25 77487,50 150 3750
3200 3399 3299,50 11 36294,50 350 3850
3400 3599 3499,50 4 13998,00 550 2200
Total: 100 294950,00 Total: 19600

29
LA VARIANZA YLA DESVIACIÓN ESTANDAR PARA DATOS
AGRUPADOS.

Se asume que el punto medio de clase (intervalo) representa a todas las


mediciones incluidas en esa clase.
Fórmulas Empleadas:

Varianza Poblacional:  
2  
f x  u 
2

N

  f x  x  
2

Varianza Muestral: S 2

n 1

  f x  u  
2

Desviación Estándar Poblacional:  


N

  f x  x  
2

Desviación Estándar Muestral: S 


n 1

Ejemplo.
9. Para los datos de salarios diarios que se presentan a continuación.
Hallar la Desviación Estándar muestral

Pto. Medio
Salario (f) Nº de
de clase f(x) x  x x  x  f x  x 
2 2
Diario Trabajadores
(Intervalo)x
2400 - 2599 2499,50 7 17496,50 -450 202500 1417500
2600 - 2799 2699,50 20 53990,00 -250 62500 1250000
2800 - 2999 2899,50 33 95683,50 -50 2500 82500
3000 - 3199 3099,50 25 77487,50 150 22500 562500
3200 - 3399 3299,50 11 36294,50 350 122500 1347500
3400 - 3599 3499,50 4 13998,00 550 302500 1210000
Total: 100 294900,50 Total : 5870000

Solución

1ro: Cálculo del Pto. Medio de Intervalo


2do: Cálculo f x 

3ro: Cálculo de la media x 


 f x   294950  2949,50
n 100
4 : x  x  Tabla
to

5to: f x  x   Tabla
2

30
  f x  x   
2
5870000
6 :Reemplazo de fórmula S 
to
 59292.93
n 1 99
S  243.50

FORMULAS ABREVIADAS PARA DATOS AGRUPADOS SON LOS


SIGUIENTES:

Varianza Poblacional:  
2   f x 2   Nu 2
N

Desviación Estándar Poblacional:  


  f x   Nu
2 2

 f x  nx
2 2

Varianza Muestral: S 2

n 1

  fx   n x
2 2

Desviación Estándar Muestral: S 


n 1

Ejemplo.
Del problema anterior calcular la Desviación Estándar resultante probando de
esta manera la Respuesta, usando Fórmulas abreviadas.

Salario Pto. Medio (f) Nº de x2 fx 2


Diario de clase Trabajadores
(Intervalo)x
2400 2599 2499,50 7 6247500,25 43732501,00
2600 2799 2699,50 20 7287300,25 145746005,00
2800 2999 2899,50 33 8407100,25 277434308,25
3000 3199 3099,50 25 9606900,25 240172506,25
3200 3399 3299,50 11 10886700,25 119753702,75
3400 3599 3499,50 4 12246500,25 48986001,00
Total 100 Total: 875825025.00

875825025  1002949
2
S  243,50
100  1

31
1.4 PROBABILIDADES.

Es un número real que expresa la confianza o incertidumbre de un suceso o


evento, cuyo resultado no se puede predecir con certeza.

EXPERIMENTO ALEATORIO (E)

ESPACIO MUESTRAL ()

EVENTO

DEFINICIÓN CLÁSICA DE PROBABILIDAD


Es una fracción cuyo numerador es el No de casos favorables y cuyo denominador
es el número total de los casos posibles.
Fórmula:
N ( A)
P( A) 
N(S )

Donde P(A)= Probabilidad de Ocurrencia del Evento A


N(A)= N° de casos Favorables de ocurrencia del evento A.
N(S) = Todos los casos posibles en el evento A.

10. En una cantidad de cartas bien barajadas que contiene 4 ases y 48 cartas
de otras tipo, la probabilidad de obtener 1 (as) en una sola extracción es:

N A
P(A) = = 4/52 = 1/13
N S 

11. Aparte de los ejemplos dados tenemos:

Si se lanzan 3 monedas. Hallar:

a) El Espacio Muestral, b) P(A) = obtener exactamente 2 caras, c)


Exactamente 2 sellos y d) Exactamente 3 caras.

Solución

a) El Espacio Muestral () = {CCC CCS CSC SCC CSS SCS SSC SSS}

1/8 cada uno.

b) Evento A: obtener exactamente 2 caras.

A= { CCS, CSC. SCC}

1/8 1/8 1/8

32
P(A)3/8

c) Exactamente 2 sellos?
3/8

d) Exactamente 3 caras
1/8

PROBABILIDAD SUBJETIVA

CONSIDERACIONES GENERALES
1.La Probabilidad de ocurrencia de cada Punto Muestral, debe estar entre 0
y 1.
0  P(A)  1
2.La Suma de las Probabilidades de todos los puntos Muestrales debe ser
igual a 1.
P(A) + P(A’) = 1
Es decir en una observación o experimento dados, el evento debe ocurrir o No.
Por ello la suma de la probabilidad de ocurrencia + la Probabilidad de no
ocurrencia siempre es igual a 1.

REGLAS DEPROBABILIDAD:SUMA Ó ADICIÓN DE PROBABILIDADES

1. Para eventos mutuamente excluyentes es decir cuando no tiene


elementos comunes.

(AB = ):

A B  P(AB)=PA+PB

Ejemplo

11. Se extrae una carta de una baraja de 52, los eventos “as” (A) y “rey” (R)
son mutuamente excluyentes.

Hallar la probabilidad de extraer ya sea un as o un rey en una sola


extracción.

33
Solución

De: P(A o R) = P(A) + P(R) = 4/52 + 4/52 = 8/52 = 2/13

2. Reglas de Adición para eventos que no son mutuamente excluyentes.

E7: Un cliente ingresa a una panadería. La Probabilidad de que compre


(a) pan es 0,60, b) Leche es 0,50 y c) Pan y leche es 0,30. ¿Cuál es la
Probabilidad de que compre pan, leche o ambos?.

Solución

P(P) = 0,60 P(PL) = P(P) + P(L) – P(PL)


P(L) = 0,50 P(PL) = 0,60 + 0,50 – 0,30
P(PL) = 0,30 P(PL) = 0,80

Ejemplo.: Cuando se extrae una carta de un mazo de 52 cartas, los


eventos “as” y una espada no son mutuamente excluyentes.
Hallar la Probabilidad de obtener un AS (A) o una Espada (E) o ambos en
una sola extracción.

Solución

P(AoE) = P(A) + P(E) – P(A y E)


= 4/52 + 13/52 – 1/52 = 16/52 = 4/13

EVENTOS DEPENDIENTES E INDEPENDIENTES

Dos eventos son independientes cuando la ocurrencia o no ocurrencia de uno,


no tiene ningún efecto sobre la probabilidad de ocurrencia del otro. Y son
dependientes cuando la ocurrencia o no ocurrencia de uno si afecta la
probabilidad de ocurrencia del otro evento.
Ejemplo. El lanzamiento de una moneda por dos veces se considera eventos
independientes, porque el resultado del primer lanzamiento no tiene ningún
efecto sobre las respectivas probabilidades de que ocurra una cara o sello en
el segundo lanzamiento.
Ejemplo. La extracción de dos cartas sin reemplazo de un mazo de barajas
son eventos dependientes, porque las probabilidades asociadas con la
segunda extracción dependen del resultado de la primera extracción.
Específicamente si saliera un as en la primera extracción entonces la
probabilidad de que salga as en la segunda extracción, es la razón del número
de ases que sigue habiendo en las barajas con respecto al número total de
cartas, o 3/51.

34
PROBABILIDAD CONDICIONAL

Definición:

Una medida de la probabilidad de que ocurra un evento particular, dado el


hecho que otro ya ha ocurrido o de que hay certeza de que ocurra, se llama
probabilidad condicional.

Para dos eventos A y B, dicha probabilidad se denota, siempre por P (A/B) o


P (B/A), lo que se lee como “la probabilidad de A, dado B” o “la probabilidad
de B, dada A” ya que la línea vertical quiere decir “dada” ó “dado”.

Cuando dos eventos son dependientes usamos la siguiente fórmula de


probabilidad condicional.

P( AyB ) P( A  B)
P( B / A)  
P( A) P( A)
Donde:

P(B/A) = Probabilidad de que ocurra el evento B dado que ocurre el evento A.


<<B/A>> no es fracción.
P(AB) = Probabilidad conjunta de 2 eventos.
P(A) = Probabilidad simple no, condicional de un primer evento A.

PROBABILIDAD CONJUNTA:

Definición:
Una Medida de la Probabilidad del acontecer simultáneo de dos o más
eventos se llama probabilidad conjunta. Para los eventos A y B, esta
probabilidad se simboliza por P(AyB) o P(AB).

Solución

Consideramos los siguientes conjuntos.


 = 1, 2, 3, 4, 5, 6 espacio muestral.
A = 2, 4, 6 conjunto de resultados pares.
B = 4, 5, 6 conjunto de resultados mayores que 3.
AB =  4, 6 conjunto de resultados pares mayores que 3.
Como el dado es no cargado, asignamos a cada punto muestral una
probabilidad de 1/6.

P(A) = 3/6, P(AB) = 2/6 = 1/3.

35
De la fórmula de Probabilidad Condicional podemos determinar la
probabilidad de obtener un número > que 3 dado que es par.

P A  B  2 / 6 2
PB / A   
P A 3/ 6 3
Este resultado queda comprobado por el hecho que de los 3 resultados pares
2, 4, 6 sólo 2 son mayores que 3.

MULTIPLICACION DE PROBABILIDADES

REGLA DE LA MULTIPLICACIÓN (AB) : PARA EVENTOS


INDEPENDIENTES.

Los sucesos A y B se consideran independientes cuando la ocurrencia de uno


no influye sobre la probabilidad de ocurrencia del otro (Ejm. Lanzar dos veces
una moneda al aire). Esto significa de que lo que haya ocurrido en A, la
probabilidad asignada a B es siempre la misma. Por Tanto:
P(B/A) = P(B)
Obtenemos la Fórmula:
P(AB) = P(A) .P(B)

Ejemplo.: Cuál es la probabilidad de que en una familia con 2 hijos ambos


sean varones.

P(V1) = 0.5 P(V1V2) = P(V1) . P(V2)


P(V2) = 0.5 = (0.5) (0.5)
= 0.25 = 1/4
Ejemplo: Si se lanza dos veces una moneda la probabilidad de que ambos
eventos sean cara es:
P(AyB) = P(AB) = P(A). P(B) = ½ x ½ = ¼

36
Uso de Diagramas de árbol para eventos Independientes.

Útiles para ilustrar los posibles eventos asociados con observaciones o ensayos
secuenciales, del ejemplo anterior obtenemos:
Resultado Resultado Evento Probabilidad

Primer Lanzamiento 2do.Lanz. Conjunto Del Evento Conjunto


C1 y C2 1/4
1/2 C2
C1
1/2
1/2
S2 C1 y S2 1/4
S1 y C2 1/4
1/2 C2
1/2
S1
1/2 1/4
S2 S1 y S2

4/4 = 1.00

REGLA DE LA MULTIPLICACIÓN: PARA EVENTOS DEPENDIENTES.

Esta dada por la fórmula:


P(AB) = P(A) . P(B/A)
Probabilidad Probabilidad Probabilidad
de ocurrencia de A. de B dado A.
conjunta
de A y B.

En Palabras: Expresa que la probabilidad de que ocurra A y B es


igual a la probabilidad de A multiplicada por la probabilidad de
que ocurra B, dado que A ha ocurrido.

Uso del Diagrama de Árbol para Eve ntos Dependientes.

Ejemplo: Una urna contiene 6 bolitas blancas y 4 negras, se


extraen 2 bolitas sucesivamente y sin resti tución.
a) ¿Cuál es la probabilidad de que amba s bolitas sean blancas?.
b) ¿Cuál es la probabilidad de que la primera sea blanca y la
segunda negra?.
c) ¿Cuál es la probabilidad de que la primera sea negra y la
segunda blanca?.
d) ¿Cuál es la probabilidad de que amba s sean negras?.

37
Solución

P(B 1 B 2 ) = P(B 1 ) . P(B 2 / B 1 )


= 6/10 . 5/9 = 30/90 = 1/3.

P(B 1 N 2 ) = P(B 1 ) . P(N 2 /B 1 )


= 6/10 . 4/9 = 24/90 = 4/15.

P(N 1 B 2 ) = P(N 1 ) . P(B 2 /N 1 )


= 4/10 . 6/9 = 24/90 = 4/15.

P(N 1 N 2 ) = P(N 1 ) . P(N 2 /N 1 )


= 4/10 . 3/9 = 12 /90 = 2/15.

Resumen de Res ultados:

Resultado Probabilidad Probabilidad Probabilidad


Posible Simple Condicional Conj unta
P(A  B)=P(A).P( B/A)
P(A) P(B/A)
B 1 B 2 P(B 1 )=6/10 P(B 2 /B 1 )=5/9 6/10.5/9=30/90
B 1 N 2 P(B 1 )=6/10 P(N 2 /B 1 )=4/9 6/10.4/9 =24/90
N 1 B 2 P(N 1 )=4/10 P(B 2 /N 1 )=6/9 4/10.6/9 =24/90
N 1 N 2 P(N 1 )=4/10 P(N 2 /N 1 )=3/9 4/10.3/9=12/90
1,00

Estos mismos resultados lo expresa mos en el diagrama de árbol


siguiente.

Prob. Si mple x Prob. Condicion al = Prob. Con junta

P(B2/B1)=5/9 B2 B1 y B2 (6/10 . 5/9) = 30/90


B1
B1 y N2 (6/10 . 4/9) = 24/90
P(B1)=6/10
P(N2/B1)=4/9
N2 N1 y B2 (4/10 . 6/9) = 24/90

P(B2/N1)=6/9 B2 N1 y N2 (4/10 . 3/9) = 12/90


P(N1)=4/10
N1
90/90 = 1,00
P(N2/N1)=3/9
N2

38
Bibliografía

 Anderson, D., Sweeney, D., y Williams, T. (2012). Estadística Para Negocios y


economía. 11ª Ed. México: Internacional Thomson Editores S.A
 Barreno, Emma (2000) Estadística aplicada a la Empresa. San Marcos. Perú.
 Kennet R, (2000) Estadística Industrial Moderna. Thomson. México.
 Levin, R., Rubin, D. (2010). Estadística para la Administración y Economía. 7a
Ed.México: Pearson Educación.
 Linás, H. (2006) Estadística y Distribución de Probabilidades. Uninorte.
Colombia.
 Linás, H. (2006) Estadística Inferencial. Uninorte. Colombia
 Lind, D., Marchal, W. G. & Mason, R.(2004). Estadística para administración y
economía. Alfaomega Colombiana, S.A. Colombia.
 Lind, D., Marchal, W., y Wathen, S. (2012). Estadística Aplicada a los Negocios
y la Economía. 15ª Ed. México: McGraw-Hill. Interamericana.
 Mendenhall, W. Estadística para Administración (2000) Grupo Editorial
Iberoamérica. México.
 Mendenhall W, Beaver B, Beaver R. (2010) Introducción a la probabilidad y
estadística. 12a ed. México: Thomson.
 Muñoz, A. (2010). Estadística para Administración y Dirección de Empresas.
Ed.España: Académicas.
 Spiegel M., Schiller J. y Srinivasan A. (2000) Probabilidad y Estadística. Mc Graw
Hill. Bogotá.
 Webster, A, (2000) Estad,stica Aplicada a los Negocios y a la Economía. Irwin
Mc Graw Hill. México.

39
La Desviación Estándar Utilizando las fórmulas abreviadas
40

También podría gustarte