Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA
Docente
Juan Muñoz
Grupo: 30104
Bogotá
2019
1
TABLA DE CONTENIDO
Contenido
DESCRIPCIÓN DEL PRODUCTO...............................................................................................2
MARKETING Y RESPONSABILIDAD SOCIAL.............................................................................3
PLAN DE MERCADO...............................................................................................................5
ANALISIS DE LA SITUACION....................................................................................................5
OBJETIVOS.............................................................................................................................5
ESTRATEGIAS DE MERCADO..................................................................................................5
PROGRAMA DE ACCION.........................................................................................................6
PROGRAMA FINANCIERO......................................................................................................6
PROGRAMA DE CONTROL......................................................................................................6
SEGMENTACIÒN DEL MERCADO...........................................................................................7
SEGMENTACIÒN CONDUCTUAL.............................................................................................8
SEGMENTACIÒN DEMOGRÀFICO..........................................................................................8
PRODUCTO ESPECIALES.........................................................................................................9
2
INTRODUCCIÓN
PROPÓSITO
Que el estudiante se apropie de una visión inicial de la estadística y la probabilidad a
partir de los conceptos básicos y el planteamiento de ejemplos y problemas de su
entorno para apreciar los alcances de la disciplina.
1.-
2.-
3.-
stadístico (o estadísticas)
Es una medida que se utiliza para describir una característica numérica de la muestra,
no de la población. Es un elemento descriptivo de una muestra
Variables
Las características de interés en una población o una muestra se llaman variables.
Como estas características no se mantienen constantes de un individuo a otro, pueden
asumir más de un valor, (de ahí su nombre).
Datos
Son las observaciones, es decir, los valores que asumen las variables en cada uno de
los individuos
EJERCICIOS 0.1
2.- El proceso de utilizar muestras estadísticas para llegar a conclusiones sobre los
parámetros de la población se llama
3.- El total de objetos bajo consideración o investigación del que se selecciona una
muestra se llama
4
a. Parámetro b. Estadístico c. Promedio d. Descripción
Ejercicio 0.2
1.- Selecciona la opción que representa la escala de medición para cada variable
Ejercicios 1.1
1. La cuenta de la luz (en pesos) del mes de marzo de 30 familias escogidas aleatoriamente
se muestra a continuación.
+ 2 56 34 7 89 96 4 34 5 4 12 34 34 55 4
5 0 0 8 0 0 7 0 4 4 0 0 0 0 4
0 0 0 0 0 0
4 los
Organiza 45 datos
67 en8una 43
tabla33 2 81
de distribución 7de frecuencias,
9 36 56 y 112 37 8
+ Escribe algunas frases de la información que proporciona la tabla de distribución de
frecuencias:
a.-
b.-
c.-
d.-
Medidas de Tendencia
Central
2 56 34 7 89 96 4 34 5 4 12 34 34
5 0 0 8 0 0 7 0 4 4 0 0 0
0 0 0 0 0
4 45 67 8 43 33 2 81 7 9 36 56 112
5 0 0 6 0 0 3 0 0 7 0 0 0
0 0 0 0
6
Calcula las central y escribe la información que proporcionan a.-
tres b.-
medidas de c.-
tendencia
7
Coeficiente de Variación
Ejemplo:
1.52 1.52 1.53 1.53 1.57 1.58 1.58 1.60 1.64 1.64 1.64 1.66 1.66 1.74 1.76 1.79
Para realizar los cálculos de la varianza “a mano”, resulta conveniente construir una
tabla como la siguiente
Estatu Frecuenc
xi x (xi x)2 (xi x)2 *
ra ia
xi f fi
1.52 2 -0.1025 0.01051 0.02101
1.53 2 -0.0925 0.00856 0.01711
1.57 1 -0.0525 0.00276 0.00276
1.58 2 -0.0425 0.00181 0.00361
1.6 1 -0.0225 0.00051 0.00051
1.64 3 0.0175 0.00031 0.00092
1.66 2 0.0375 0.00141 0.00281
1.74 1 0.1175 0.01381 0.01381
1.76 1 0.1375 0.01891 0.01891
1.79 1 0.1675 0.02806 0.02806
x = 1.6225 = 0.1095
0.1095
Varianza S2 = 0.0073
15
Desviación Estándar S 0 = 0.08544
.
Coeficiente de Variación CV 0 0.08544
= 100 % = 5.266%
0 1.6225
7
3
Démosle sentido a estos números:
Medidas de Posición
Los cuantiles son medidas de posición “no central” que se utilizan para resumir o
describir las propiedades de conjuntos grandes de datos numéricos. Los cuantiles que
se calculan más a menudo son: cuartiles, deciles y percentiles.
Cuartiles
Son tres valores numéricos que dividen a la muestra ordenada en cuatro partes iguales.
Se denotan por Q1, Q2, Q3.
Primer cuartil, es un valor tal que 25% de las observaciones son menores y 75% son
mayores. Q1 x n1 . Recuerda que el subíndice indica la posición del dato
4
en el conjunto.
Segundo cuartil, es un valor tal que 50% de las observaciones son menores y 50% son
mayores. Coincide con el valor de la Q2 x 2 ( n1)
mediana. 4
Tercer cuartil, es un valor tal que 75% de las observaciones son menores y 25% son
mayores. Q3 x 3( n1)
4
Busca en la bibliografía recomendada, qué son y cómo se calculan los deciles y los
percentiles
A continuación te mostramos un ejemplo sobre el cálculo de los cuartiles.
Ejemplo:
En un grupo de Estadística I del Cch Sur, se observó la estatura de 16 alumnos y se
obtuvieron los siguientes datos (ya ordenados):
1.52 1.52 1.53 1.53 1.57 1.58 1.58 1.60 1.64 1.64 1.64 1.66 1.66 1.74 1.76 1.79
Q1 Q2 Q3
Q1 x1 61 = 1.55
4
“El 25% de los estudiantes miden menos de 1.55 m y el otro 75% mide más”
Q2 x 2 (1 61) = 1.62
4
“El 50% de los estudiantes miden menos de 1.62 y el otro 50% mide más”
Q3 x 3 (1 61) = 1.66
4
“El 75% de los estudiantes miden menos de 1.66 y el otro 25% mide más”
Ejercicios 1.3
2 56 34 7 89 96 4 34 5 4 12 34 34 55 4
5 0 0 8 0 0 7 0 4 4 0 0 0 0 4
0 0 0 0 0 0
4 45 67 8 43 33 2 81 7 9 36 56 112 37 8
5 0 0 6 0 0 3 0 0 7 0 0 0 0 4
0 0 0 0 0
a.-
b.-
c.-
d.-
e.-
f.-
Datos Agrupados
Distribución de frecuencia
Cuando la muestra es grande (n mayor que 30) resulta conveniente organizar los datos
en intervalos de clase para construir su distribución de frecuencias.
27 23 4 38 4 2 3 2 18 2 24
1 4 9 5 6 2
25 36 2 52 3 3 2 4 28 1 20
2 1 0 2 5 8
18 28 4 25 2 2 2 3 21 2 32
4 9 8 4 6 3
26 33 2 27 2 3 3 2 54 3 23
5 5 4 2 3 8
31 23 2 48 1 2 2 3 29 2 28
6 6 7 7 3 9
Aunque, no existe una regla formal para determinar el número de intervalos y el tamaño
de los mismos, existen algunas reglas empíricas que resultan útiles en esta decisión
Intervalo
Frecuenc
de
Clase ia
16 – 22 9
23 – 29 26
30 – 36 11
37 – 43 3
44 – 50 4
51 – 57 2
Se define, igual que en la sección anterior, como la Frecuencia Simple dividida por el
tamaño de muestra.
Intervalo Frecuen
Frecuenci
de cia
Clase a
Relativ
a
9
16 – 22 9 /55 = 0.1636
23 – 29 26 0.4727
30 – 36 11 0.2000
37 – 43 3 0.0545
44 – 50 4 0.0727
51 – 57 2 0.0364
Se construye sumando la frecuencia simple de cada intervalo con las frecuencias de los
intervalos que le preceden.
Ejercicios 1.4
1.- Los siguientes datos muestran el número de vuelos internacionales recibidos en el
aeropuerto de la ciudad de México durante los dos meses anteriores, construye una
tabla de distribución de frecuencias.
71 4 6 67 7 3 6 6 29 5 6 70
7 6 3 8 3 7 4 2
63 3 6 50 5 6 4 4 52 4 4 56
7 8 9 0 5 8 9 8
70 6 6 65 6 4 6 5 63 3 3 43
2 1 2 5 2 6 9 6
49 5 3 41 5 4 7 4 38 6 4 31
0 9 7 9 3 7 1 8
55 5 7 53 4 7 5 5 39 6 5 36
7 2 2 0 6 8 0 3
Frecuenci
Intervalo Frecuen Frecuen Frecuen
a
de cia cia cia
Acumula
Clase Simpl Relativ Acumula
da.
e a da
Relati
va
2.- Escribe algunos ejemplos de la información que se obtiene a partir de cada tipo de
Frecuencia del ejercicio anterior
a.-
b.-
c.-
d.-
3.- Los datos siguientes corresponden a un estudio realizado con 40 personas para
conocer la reacción sistémica a la picadura de abeja. Se toma el tiempo, en minutos, en
el que aparecen las primeras reacciones a la picadura. Construye una tabla de
distribución de frecuencias. (Observa que la precisión de estos datos es de décimas)
a.-
b.-
c.-
d.-
Completa la tabla anterior, y con base en ella proporciona la información que falta:
Moda
La moda se definió como el dato con la mayor frecuencia, de manera similar definimos
ahora la Clase Modal, como aquel intervalo de clase con la mayor frecuencia.
Una vez que identificamos la clase modal, se utiliza la siguiente fórmula para calcular la
moda:
LRinf 1 C
1 2
Para aclarar lo que son los límites reales observa y analiza el siguiente esquema
Límites de Clase
17
moda = 22.5 7 26.2 Intervalo
Frecuenci
de
17 15 Clase a
16 – 22 9
23 – 29 26
30 – 36 11
“La edad más frecuente es de 26.2 años”
37 – 43 3
44 – 50 4
51 – 57 2
Mediana
Una vez que identificamos la clase mediana, se utiliza la siguiente fórmula para calcular
n
1
la mediana: ~x C
LRinf Fa
2 f med
Frecuenc
Intervalo Frecuen
Frecuen ia
de cia Acumula
cia
Clase Acumula da
da Relativa
16 – 9 9 0.1636
22
23 – 26 3 0.6364
29 5
30 – 11 4 0.8364
36 6
37 – 3 4 0.8909
43 9
44 – 4 5 0.9636
50 3
51 – 2 5 0.9999
57 5
55
2
mediana = 22.5
9
7 27.5
26
“El 50% tales personas tienen una edad menor o igual a 27.5 años y el otro 50% tiene
una edad mayor a 27.5 años”
Media
La media igual que antes, se define como el promedio de los datos. Vamos a necesitar
el concepto de marca de clase, el cuál es el punto medio de cada intervalo.
(x i )( fi )
*
Como en otros cálculos, resulta conveniente utilizar una tabla como la siguiente:
xi*
16 – 22 19 9 19 * 9 = 171
23 – 29 26 26 676
30 – 36 33 11 363
37 – 43 40 3 120
44 – 50 47 4 188
51 – 57 54 2 108
= 1626
n
(x )( f
i* i
) 1626
x i1
= 29.6
n 55
Rango
Varianza
(x i x ) f i
*
S 2 i 1
n 1
Desviación estándar
ni* i
(
i1
x
Sigue siendo la raíz cuadrada de la varianza: S n
x
1
)
f
Coeficiente de Variación S
:Se define de la misma forma, como CV 100%
x
Marca
Interv de Frecuen xi * x (x*i x)2 (x* x)2 * f
alo de clase cia i
Clase fi i
xi*
16 – 19 9 - 112.360 1011.2400
22 10. 0
6
23 – 26 26 - 12.9600 336.9600
29 3.6
30 – 33 11 3.4 11.5600 127.1600
36
37 – 40 3 10. 108.160 324.4800
43 4 0
44 – 47 4 17. 302.760 1211.0400
50 4 0
51 – 54 2 24. 595.360 1190.7200
57 4 0
x = 29.6 = 4201.60
Rango 57.5 – 15.5 = 42
4201.60
Varianza S2 = 77.8074
54
Consulta la bibliografía recomendada para saber cómo calcular las medidas de posición
para datos agrupados.
Ejercicios 1.5
1.- Calcula e interpreta las medidas de tendencia central y las medidas de dispersión
para los datos agrupados, correspondientes a
Toda gráfica debe tener: Un título descriptivo, el nombre de la variable que representa,
las unidades de la variable, y en su caso la escala utilizada.
Grafica Circular
Se conoce también como Diagrama de pastel, de sectores y otros. Se divide un círculo
de manera proporcional a la distribución de los valores de la variable. Ayuda a percibir
la importancia relativa de cada categoría respecto al total. Se utiliza también para
representar datos discretos.
9%
20%
Tos Gripa Fractura Diabetes
11%
5%
17%
Gráfica de barras
Los valores de la variable se localizan sobre un eje horizontal y las frecuencias sobre
uno vertical. Las barras son rectángulos cuyo ancho es arbitrario, pero debe ser el
mismo para todas las barras, y cuya longitud es la frecuencia o el porcentaje de
observaciones dentro de la categoría.
La separación de las barras es arbitraria pero debe ser la misma. Las bases de los
rectángulos deben estar centrados sobre los valores de la variable
Histograma
Para datos no agrupados, cada frecuencia se representa por una barra cuya área sea
proporcional a ella. Típicamente, el ancho de cada barra se escoge como 1 y así, la
altura y el área de la barra son iguales a la frecuencia del valor.
Edad de personas
30
25
20
Frecuencia
15
10
0
16 – 22 23 – 29 30 – 36 37 – 43 44 – 50 51 – 57
Edad (años)
30
Polígono de Frecuencias
Para datos no agrupados, se trazan los puntos que corresponden a los valores de la
variable cuantitativa y la frecuencia (absoluta o relativa), a continuación se unen los
puntos mediante segmentos de recta, los extremos se unen con el eje horizontal con el
primer valor menos una unidad y el extremo derecho mas una unidad.
Para datos agrupados los vértices tienen como coordenadas las marcas de clase y las
frecuencias correspondientes. Se debe cerrar sobre el eje horizontal en dos puntos que
corresponden a las marcas de clase de dos intervalos, uno anterior y el otro posterior al
primero y al último intervalo, cuya frecuencia es cero.
Edad de personas
30
25
Frecuencia
20
15
10
0
16 – 22 23 – 29 30 – 36 37 – 43 44 – 50 51– 57
Edad (años)
Ojiva
Para datos agrupados los vértices tienen como abscisa los valores de la variable
representados por los límites reales superiores y como ordenada la frecuencia
acumulada o frecuencia relativa acumulada (ojiva porcentual).
31
Edad de personas
60
Frecuencia acumulada
50
40
30
20
10
0
1015202530354045505560
Edad (años)
Ejercicios 1.6
Edad Número
Géne Tipo Colo Pe
Nombre (años de
ro ( M cumplid
sanguín r Herman so
o F) os) eo favori os (k
to ** g)
Verónica F 17 O + Azul 2 63
Guillermo M 16 O+ Morad 1 67
o
Viviana F 17 O+ Azul 3 60
Nuria F 17 A+ Azul 2 62
Alfredo M 17 O+ Rojo 3 75
Gerson M 17 O+ Negro 6 74
Nohemí F 18 A+ Azul 3 54
Alejandra F 16 O+ Blanco 2 61
Viridiana F 16 O+ Violeta 2 50
Elizabeth F 16 O+ Blanco 3 45
Rogelio M 17 O+ Azul 3 74
Amaranta F 17 A+ Blanco 1 54
Fabiola F 16 O+ Morad 2 54
o
Zicarú F 18 O+ Rosa 3 51
Karla F 18 A+ Turque 2 55
sa
Andrea F 17 O+ Negro 3 60
Alfonso M 17 O+ Azul 3 64
Rubí F 15 B+ Morad 2 62
o
Claudia F 17 O+ Violeta 3 60
Wendi F 17 O+ Negro 3 58
**incluyéndose a sí mismo(a)
Datos bivariados
Se llaman datos bivariados a aquellos que provienen de dos variable medidas al mismo
tiempo sobre cada individuo.
Por ejemplo: Edad y Género, Escolaridad e Ingreso, Peso y Estatura, etc.
Hospi
tal
20 de
Géne Los Médica López
Noviem
ro Ángeles Sur Mateos
bre
Hombr 3 44 43 2
es 6 8
Mujere 3 50 52 5
s 4 3
”
Al sumar las frecuencias absolutas de cada fila y de cada columna, se obtiene la
frecuencia absoluta marginal.
Hospi
tal
20 de López
Género Los Médica To
Noviemb Mateos
Ángeles Sur re tal
Hombres 36 44 43 2
8
Mujeres 34 50 52 5 18
3 9
Total 70 95
Claro!, tendríamos que sumar todas las celdas, lo que es equivalente a sumar la última
columna o el último renglón que agregamos, y concluimos que: “Se hizo el estudio con
n= pacientes”
Frecuencias relativas
“El 10.58% de los pacientes eran hombres y estuvieron hospitalizados en Los Ángeles”
columna? “ ”
Por otro lado, si dividimos los valores de cada renglón por el total del mismo,
obtenemos la Frecuencia Relativa respecto al Genero.
Hospi
tal
20 de
Género Los Médica Sur López
Noviemb
Ángeles re Mateos
36
Hombres /151 =
0.2384
50
Mujeres /189 =
0.2645
Mateos”
Ahora, si dividimos los valores de cada columna sobre el total de la misma, obtenemos
la Frecuencia Relativa respecto al Hospital.
Hospi
tal
20 de López
Género Los Médica Sur
Noviemb Mateos
Ángeles re
36
Hombres /70 =
0.5142
52
Mujeres /95 =
0.5473
De la tabla anterior, obtenemos que:
“De los pacientes que estuvieron en Los Ángeles, el 51.42 % eran mujeres “
Periódico preferido
El La
Estado Excélsi Refor
Univers Jornada
Civil al or ma
Soltero 11 6 7 14
Casado 6 10 10 8
Viudo 5 6 6 9
Separado 7 8 5 12
2.- La siguiente tabla 1 muestra los datos obtenidos al observar el tipo sanguíneo y el
género de 20 personas.
Gene F M F F M M F F F F M F F F F F M F F F
ro
Tip
o O O O A O O A O O O O A O O A O O B O O
+ + + + + + + + + + + + + + + + + + + +
Sang
.
Cuando los datos bivariados provienen de dos variables cuantitativas resulta de interés
estudiar la relación que guarda una con la otra. La relación puede ser de muy distinta
naturaleza: lineal, cuadrática, exponencial, logarítmica, trigonométrica, etc. En
estadística la relación que nos interesa es la Relación Lineal, por lo que se llevan a
cabo Análisis de Correlación Lineal y de Regresión Lineal
El análisis de correlación, se usa para medir la fuerza de asociación entre las variables.
El objetivo medir la covarianza que existe entre esas dos variables numéricas.
Ejemplo
Se decidió examinar la relación entre la estatura, (en metros), y el peso, (en
kilogramos), a partir de una muestra de 12 alumnas de cierta escuela. Los datos se
muestran en la siguiente tabla.
Diagrama de dispersión
Es una grafica donde aparecen los valores muestrales considerados como parejas
ordenadas (x1, y1), (x2, y2), …, (xn, yn).
Si los valores muestrales dan una configuración de puntos como el del diagrama de
dispersión, el modelo se llama de regresión lineal simple.
Diagrama de Dispersión
El objetivo es ver si existe o no una relación de carácter lineal entre las dos variables, y
si existe, entonces medir el grado de intensidad de la linealidad. Esto comúnmente se
realiza calculando el coeficiente de correlación lineal de Pearson:
Un valor cercano a 0, indica que la relación entre las variables es casi nula, es decir, no
hay relación entre ellas.
Un valor cercano a 1 significa que la relación entre las variables es fuertemente lineal.
Análisis de Regresión Lineal
Y*i = mXi + b
donde
Y* = valor pronosticado de Y para cada observación
Xi = valor de X para cada observación
Y* = 87.03 X - 83.06
Utilizando dicha ecuación podemos predecir, por ejemplo, el peso de una alumna cuya
estatura es de 1.55 m
Y* = 87.03(1.55) - 83.06 = 51.83
De acuerdo a este modelo, una alumna cuya estatura fuera de 1.55 m., tendría un peso
de 51.8 kg.
Ejercicios 2.2
c) Si una persona compra 20 piezas de ese artículo, ¿cuál sería el costo por pieza?
2.- La siguiente tabla representa la densidad de un mineral (X) y su contenido de hierro (Y)
PROBABILIDAD
Ejemplo: el resultado probable de una rifa; cuál será el equipo ganador de fútbol en el
próximo campeonato; qué cara quedará arriba al lanzar un dado; si llueve o no llueve
mañana; el tiempo que tardará un árbol en alcanzar 3m de altura etc.
Ejemplos:
1.- Experimento: Se lanza una moneda y se observa la cara superior (es decir, lo que
“cae”).
= { s, a }
Ejemplo
Experimento: Se lanza un dado común y se observa la cara superior.
= { 1, 2, 3, 4, 5, 6 }
Evento A: el número que “cae” es par. A = { 2, 4, 6 }
Evento B: el número que “cae” es primo. B = { 1, 2, 3, 5 }
Ejemplo:
Experimento: Se lanza una moneda tres veces.
Evento compuesto: D: Que salgan dos soles; D = { (S,S,S), (S,S,A), (S,A,S), (A,S,S) },
Probabilidad Clásica
Cómo puedes observar, una función de probabilidad tiene las siguientes verdades
básicas o axiomas.
1. Si E es un evento cualquiera,
entonces 0 PE 1
2. Si o S, es el evento seguro, entonces P 1 P S 1
o
3. Si E1, E2,……Ek son eventos mutuamente excluyentes, entonces
P(E1 o E2 o …. Ek)=P(E1)+P(E2)+…+P(Ek)
Operaciones Básicas con Eventos
Ya que los eventos aleatorios son subconjuntos del conjunto , espacio muestral, se
pueden aplicar las conocidas operaciones con conjuntos, a los eventos, como son la
unión, la intersección y la diferencia de eventos.
A
B A
B
Fig. 1 Fig. 2
a).- Unión:
c).- Diferencia:
A – B = ={ 1, 3, 5 } - { 3, 4 } = { 1, 5 }, N(A – B) = 2
d).- Complemento:
Ac = { 2, 4, 6} = C N( Ac ) = N(C) = 3
1
A 3 B
54
2,6
C
Ejemplo:
La regularidad estadística en el experimento del lanzamiento de monedas, indica que
las frecuencias relativas del evento: que salga sol {s }, se tiende a estabilizar
aproximadamente en 0.5= 1/2.
Ejemplo:
Definición
de A dado E, se define P( A E)
como: P( A E) P(E)
Además, despejando a P(AE), y haciendo (AE) = (EA), se tiene:
Ejemplo
En cierta ciudad, las mujeres representan el 50% de la población y los hombres el otro
50%. Se sabe que el 20% de las mujeres y el 5% de hombres están sin trabajo. Un
economista estudia la situación de empleo, elige al azar una persona desempleada. Si
la población total es de 8000 personas, ¿Cuál es la probabilidad de que la persona
escogida sea?:
2.- En una ciudad hay una alta incidencia de cirrosis entre la población. Se sospecha
que se debe al alto índice de consumo de alcohol. Se hacen estudios estadísticos que
asocian “presencia de la enfermedad” con “consumo de alcohol”. Se encuentra que el
40% de la población consume alcohol, el 20% padece la enfermedad y el 5% consume
alcohol y padece la enfermedad. ¿Se verifica la creencia?
3.- Relaciona ambas columnas, colocando en los paréntesis de la derecha la letra que
corresponda a la aseveración correcta.