Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FUNDAMENTOS DE ESTADÍSTICA
(EST-1100)
CONTENIDO:
Capítulo 1. Introducción.
Referencias bibliográficas.
1
10/2/2022
Capítulo 1. Introducción.
Según el Dr. Mario Triola, la palabra estadística proviene del latín antiguo status
(que significa “Estado o Forma de Gobierno”). Sin embargo, los doctores Richard
Levin y David Rubin, sostiene que la palabra estadística tiene su origen en el
término alemán statistik (que significa “Ciencia del Estado”), el cual proviene de la
palabra italiana statista (que significa “Hombre de Estado o Político”).
Capítulo 1. Introducción.
Por otro lado, en República Dominicana, la estadística tiene sus orígenes desde los primeros
años de su descubrimiento, debido a que existen evidencias sobre informaciones
estadísticas relacionadas al repartimiento de indios en 1514 y sobre un censo que realizó el
gobernador Antonio de Osorio en 1606, el cual contiene un conteo de la población, de
esclavos, de ingenios, de puertos, etc.
No obstante, es a partir del 1935 cuando la estadística en nuestro país logra un importante
desarrollo, debido a que en ese año, el presidente Rafael Leónidas Trujillo promulga la Ley
No. 1023 que crea la Oficina Central de Estadística, siendo su primer director el señor
Vicente Tolentino Rojas, quien llevo a cabo una brillante labor al frente de la misma y por lo
tanto, es considerado como uno de los padres de la Estadística en R.D.
2
10/2/2022
Capítulo 1. Introducción.
Es importante resaltar que a lo largo de la historia, muchas personas fueron
contribuyendo al desarrollo de la estadística, haciendo posible que la estadística se
desarrollara y se convirtiera en una herramienta de vital importancia en la investigación
científica que realizan la mayoría de los campos del conocimiento. En esa medida se
considera una ciencia transversal.
La estadística puede definirse como la ciencia que recolecta, organiza, presenta, analiza
e interpreta datos, que proceden de una población o de una muestra representativa de
ella, con el fin de conocer sus características relevantes, para propiciar una toma de
decisión más efectiva y pertinente. En esta definición surgen tres conceptos muy
importantes en el ámbito de la estadística: datos, población y muestra, los cuales se
explicarán más adelante.
Capítulo 1. Introducción.
• Datos: son la materia prima de la cual se nutre la estadística. Se definen como las
observaciones recolectadas.
• Población: es el conjunto de todos los elementos que estamos estudiando, que poseen
características comunes bien definidas, acerca de los cuales intentamos sacar
conclusiones.
• Muestra: es un subconjunto representativo de la población. Se dice que es
representativo cuando contiene las características relevante de la población en las
mismas proporciones, es decir, cuando es una fotocopia fiel de la población.
Existe una diferencia entre estadísticas y estadística. La primera se refiere a una colección
de información numérica, mientras que la segunda se refiere a la ciencia como tal.
3
10/2/2022
Capítulo 1. Introducción.
La estadística se divide en dos grandes áreas:
• Estadística descriptiva: es un conjunto de métodos y técnicas que se
utilizan para resumir y describir las características importantes de un
conjunto de datos.
• Estadística inferencial: es un conjunto de métodos y técnicas que se
utilizan para hacer inferencias sobre la población, a partir del estudio
de una muestra representativa de ella. Hacer inferencias es sacar
conclusiones, hacer predicciones o tomar decisiones.
Capítulo 1. Introducción.
Las variables son características que pueden cambiar de una observación
a otra. Existen dos tipos básicos de variables:
1) Variables cualitativas: que son aquellas que representan datos
categóricos o atributos, que consisten en nombres o etiquetas. Este
tipo de datos se miden en escala nominal o en escala ordinal.
4
10/2/2022
Capítulo 1. Introducción.
El nivel de medición de los datos rige los cálculos que se llevan a cabo con
el fin de resumir y presentar los datos. También determina las pruebas
estadísticas que se deben realizar. Existen cuatro grandes tipos de niveles o
escalas de medición:
1. Escala nominal: en ella, las observaciones acerca de una variable
cualitativa sólo se clasifican (se colocan en categorías mutuamente
excluyentes y exhaustivas) y se cuentan (frecuencia). No existe una
forma particular para ordenar las etiquetas. Para una mejor
comprensión de lectura, estos conteos suelen convertirse en
porcentajes.
2. Escala ordinal: es similar a la escala nominal, pero con la discrepancia
de que aquí, las categorías o etiquetas pueden colocarse en cierto
orden (alto, medio, bajo), porque se supone que una clasificación se
encuentra en un nivel superior a otra, no obstante, no se puede medir
la magnitud de la diferencia entre categorías, porque carecen de
significado.
Capítulo 1. Introducción.
3. Escala de intervalo: Es para variables numéricas. En ella, los datos se pueden
poner en orden y es posible encontrar diferencias significativas entre ellos.
Los datos en este nivel no tienen un punto de inicio cero natural que
signifique ausencia de la característica, lo que ocasiona que las razones no
tengan sentido. El cero es un punto más de la escala.
4. Escala de razón: contiene las propiedades de la escala de intervalo, pero con
la diferencia de que aquí, si hay un punto de inicio cero natural que significa
ausencia de la característica, por tanto, las razones tienen sentido (es
significativa). En fin los datos medidos en esta escala pueden ser sometidos
a cualquier tratamiento estadístico. Más adelante se presenta una tabla
comparativa de cosas que permite y no permite realizar cada tipo de escala.
5
10/2/2022
Capítulo 1. Introducción.
TABLA COMPARATIVA DE COSAS QUE PERMITEN REALIZAR LOS TIPOS DE ESCALAS.
Capítulo 1. Introducción.
ETAPAS FUNDAMENTALES DE UNA INVESTIGACIÓN ESTADÍSTICA.
6
10/2/2022
Capítulo 1. Introducción.
3) Diseño de la muestra (muestreo): en esta etapa se tiene que definir con
claridad y cuidado, la población que se va a estudiar, el método de
muestreo más apropiado (cuando las muestras son obtenidas por un
adecuado procedimiento estadístico, éstas tienden a representar la
población) y el tamaño adecuado de la muestra (especificando la
magnitud del error deseado, el nivel de confianza, etc.). Los
procedimientos aleatorios son la forma más confiable de selección.
4) Diseño del cuestionario: es el proceso de adaptar los diferentes objetivos
del estudio a preguntas que permitan obtener la información necesaria.
Esta etapa incluye la formulación del tipo de pregunta, número de éstas,
secuencia y los medios para mantener motivada a la persona
encuestada. Aquí es importante probar el cuestionario para evaluar las
preguntas, la calidad de la entrevistas, las posibilidades de
contradicciones que pueden surgir en la investigación, la duración de la
entrevista, etc. Un requisito obligatorio en el diseño del cuestionario es el
respecto a la dignidad y a la privacidad del entrevistado.
Capítulo 1. Introducción.
5) El trabajo de campo: en esta etapa se incluye el reclutamiento de los
entrevistadores, supervisores y otro personal de campo. Además, incluye
la capacitación del personal de campo, preparación de instrucciones
escritas para los entrevistadores sobre el uso del cuestionario, la
recopilación de los datos en el campo y el control de calidad de las
entrevistas, etc.
6) La verificación y la codificación: estos son procesos afines diseñados con
el propósito de transcribir la información registrada en los cuestionarios a
una forma adecuada para el análisis estadístico. La verificación de las
respuestas empieza cuando el entrevistador revisa cada cuestionario en
el campo y continúa con las revisiones que realizan el supervisor de
campo y el personal de oficina. Se hace con el objetivo de eliminar las
respuestas incompletas o inconsistentes, como también los errores en el
uso del cuestionario. La codificación consiste en convertir datos
cualitativos en datos numéricos que puedan ser almacenados, contados
o tabulados con rapidez y facilidad.
7
10/2/2022
Capítulo 1. Introducción.
7) La preparación para el análisis: incluye un conjunto de actividades como:
digitación de los datos, chequeos rutinarios (para descubrir las
inconsistencias en las respuestas y los errores de digitación), y un plan de
tabulación de los datos (diseñar el formato de las tablas).
8) Análisis y preparación del informe: consiste en la presentación e
interpretación de los datos recopilados en la investigación, utilizando tablas
y gráficos. También se hace uso de técnicas sencillas y complejas del
calculo estadístico y se da una interpretación teórica elaborada de los
resultados. El objetivo de esta etapa es proporcionar un resumen de los
datos, capaz de satisfacer los propósitos de la investigación, lo más breve y
comprensible posible. Cuando se prepara el informe debemos tener
presente a quien va dirigido. Si es a especialistas, éste deberá contener
mucho más información sobre los aspectos metodológicos de la
investigación, que cuando es preparado para el publico general. No
obstante, hay que prestarle atención al estilo en que se va a escribir, la
mecánica de presentación del material y la organización de los temas.
Capítulo 1. Introducción.
NOTACIÓN DE SUMATORIA SIMPLE.
Para el calculo de una gran cantidad de indicadores estadísticos, casi siempre
es necesario determinar la suma de un conjunto de valores. Para denotar una
suma, se utiliza la letra griega mayúscula conocida como sigma, que se
simboliza mediante ∑. Haciendo uso de este concepto, la expresión (x1 + x2
+ x3 + x4 + … + xn) se representa matemáticamente como:
n
xi
i=1
𝒙𝒊 = 𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 = 𝟏 + 𝟑 + 𝟓 = 𝟗
𝒊=𝟏
8
10/2/2022
Capítulo 1. Introducción.
A continuación se presenta las tres propiedades generales de la sumatoria
simple:
1) La sumatoria de una constante es igual al producto de la constante por el
número de veces que se presenta. Sea n = 4 y k = 5, entonces:
𝑛
𝑘𝑖 = 𝑘 ∙ 𝑛 = 5 ∗ 4 = 20
𝑖=1
4
𝑘 = 5 + 5 + 5 + 5 = 20
𝑖=1
𝑘 ∙ 𝑥𝑖 = 𝑘 ∙ 𝑥𝑖 = 5 ∗ 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 = 5 ∗ 1 + 3 + 5 + 7 = 5 ∗ 16 = 80
𝑖=1 𝑖=1
Capítulo 1. Introducción.
𝑛
(𝑥𝑖 + 𝑦𝑖 ) = 𝑥𝑖 + 𝑦𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑦1 + 𝑦2 + 𝑦3 + 𝑦4
𝑖=1 𝑖=1 𝑖=1
= 4 + 3 + 5 + 8 + 6 + 4 + 5 + 7 = 20 + 22 = 42
𝑛
(𝑥𝑖 + 𝑦𝑖 ) = 𝑥1 + 𝑦1 + 𝑥2 + 𝑦2 + 𝑥3 + 𝑦3 + 𝑥4 + 𝑦4
𝑖=1
= 4 + 6) + (3 + 4) + (5 + 5) + (8 + 7 = 10 + 7 + 10 + 15 = 42
9
10/2/2022
Tanto las clases (que son para variables numéricas), como las categorías
(que son para las variables cualitativas), deben ser mutuamente excluyentes
(que ningún dato puntual cae en más de una categoría) y exhaustivas (que
todos los datos caen en una u otra categoría). Es importante tener esto en
cuenta, debido a que más adelante se utilizará un tipo de intervalo de clase
que se lee “a menos de”, en el cual las clases no incluyen los datos que
coinciden con el valor de su limite superior.
10
10/2/2022
11
10/2/2022
12
10/2/2022
25
22
20
15
10 8
0
Masculino Femenino
Sexo
26.67%
Masculino
Femenino
73.33%
13
10/2/2022
14
10/2/2022
Distribución de los Clientes, según Edad, en el Banco XX, Febrero del 2020.
Clientes
Edad (años) Conteo fr Fi < Fr < Fi > Fr > Xi
(fi)
25-32 IIII 4 0.20 4 0.20 20 1.00 28.5
32-39 II 2 0.10 6 0.30 16 0.80 35.5
39-46 IIII - I 6 0.30 12 0.60 14 0.70 42.5
46-53 IIII 4 0.20 16 0.80 8 0.40 49.5
53-60 II 2 0.10 18 0.90 4 0.20 56.5
60-67 II 2 0.10 20 1.00 2 0.10 63.5
Total 20 1.00
Fuente: Mtro. Juan Gabriel Avilés Quezada, profesor de estadística de la UASD.
Los limites verdaderos o fronteras de clase son puntos específicos de la escala que
sirven para "separar clases adyacentes". En el intervalo “a menos de”, se obtienen
restando 0.5 tanto al limite inferior como al limite superior de la clase en cuestión.
15
10/2/2022
16
10/2/2022
17
10/2/2022
Xi: 27, 48, 39, 42, 25, 44, 62, 35, 57, 40, 44, 46, 29, 65, 30, 55, 43, 36, 50, 50.
Tallo Hojas
2 5 7 9
3 0 5 6 9
4 0 2 3 4 4 6 8
5 0 0 5 7
6 2 5
18
10/2/2022
19
10/2/2022
Media aritmética.
Es el valor más representativo de un conjunto de datos. Es la más utilizada
por los métodos estadísticos avanzados. Para encontrar la media aritmética,
sumamos los valores y dividimos el resultado entre el número de
observaciones. Su fórmula para datos simples o sueltos es:
Media poblacional Media muestral
σ xi σ xi
μ= xത =
N n
20
10/2/2022
21
10/2/2022
22
10/2/2022
En las imágenes se puede apreciar mejor la relación entre media, moda y mediana
en cada caso. Cabe destacar que esta relación solo permite tener una idea del tipo
de asimetría de la distribución, pero lo que realmente determinará si la distribución es
simétrica, sesgada a la izquierda o sesgada a la derecha será el resultado de la
fórmula del coeficiente de asimetría de Fisher, que es el más utilizado en estadística
ya que es más preciso que el coeficiente de asimetría de Pearson y que el coeficiente
de asimetría de Bowley. A continuación se presenta un ejemplo de una variable que
se distribuye de esa manera.
23
10/2/2022
Media geométrica.
Es la raíz n-esima del producto de todos los números. Es recomendada para
datos de progresión geométrica, para promediar razones, interés compuesto
y índices; en fin, se usa siempre que se desee calcular el cambio porcentual
promedio en el tiempo para alguna variable. Sus fórmulas para datos simples
o sueltos son:
𝐧
σ 𝐥𝐨𝐠 𝐱 𝐢
𝐆= 𝐱𝟏 ∗ 𝐱 𝟐 ∗ 𝐱 𝟑 ∗ ⋯ ∗ 𝐱 𝐧 ó 𝐆 = 𝐚𝐧𝐭𝐢𝐥𝐨𝐠𝐚𝐫𝐢𝐭𝐦𝐨
𝐧
24
10/2/2022
25
10/2/2022
Media aritmética:
σ xi 1100 + 1000 + 980 + 975 + 980 + 1050 6085
xത = = = = 1,014.17 pesos.
n 6 6
El precio promedio de la funda de leche Milex de 2200 gramos en esa muestra de 6
supermercados de la ciudad de Bonao se estima en 1,014.17 pesos.
Media ponderada:
2) Un estudiante universitario obtuvo las siguientes calificaciones durante un
semestre académico. Calcule la media de las calificaciones para ese semestre.
Asignaturas Calificaciones (Xi) Creditos (Wi) Wi . Xi σ wi ∙ x i 1415
xത w = =
Matemáticas 75 4 300 σ wi 18
Física 80 4 320 xത w = 78.61 puntos.
Letras 85 3 255 Interpretación: La calificación
Biología 75 4 300 promedio (índice académico)
Historia 80 3 240 del estudiante universitario
durante ese semestre fue de
Total - 18 1,415 78.61 puntos.
26
10/2/2022
n 5 5
G= x1 ∗ x 2 ∗ x 3 ∗ ⋯ ∗ x n = 3.0 ∗ 4.8 ∗ 2.9 ∗ 4.1 ∗ 3.5 = 599.256 = 3.59%
La tasa de interés promedio pagada por los bancos en cuentas de ahorros es de 3.59%
Xi: 110 km/h 121 km/h 102 km/h 108 km/h 116 km/h.
n n
H= =
1 1 1 1 1
σ + + +⋯+
x i x1 x 2 x 3 xn
5 5
H= = = 111.01 km/h
1 1 1 1 1 0.045039242
+ + + +
110 121 102 108 116
27
10/2/2022
28
10/2/2022
n 20
G= x1 f1 ∗ x 2 f2 ∗ x 3 f3 ∗ ⋯ ∗ x k fk = 35 ∗ 59 ∗ 73 ∗ 92 ∗ 111 = 5.11%
La tasa promedio de crecimiento anual de las ventas de las pequeñas empresas de Bonao
se estima en 5.11%.
29
10/2/2022
Cuartiles.
Son indicadores que dividen el conjunto de datos en cuatro partes iguales, de
manera que, cada parte equivale aproximadamente a un 25% de los datos. Se
identifican como Qk, que se lee cuartil de orden k. CUARTILES Q1 Q2 Q3 Q4
% de datos ≤ Qk 25% 50% 75% 100%
Deciles.
Son indicadores que dividen el conjunto de datos en diez partes iguales, de manera
que, cada parte equivale aproximadamente a un 10% de los datos. Se identifican
como Dk, que se lee decil de orden k.
𝐤(𝐧 + 𝟏)
𝐏𝐃𝐤 =
𝟏𝟎
Posición para datos simples. Posición para datos agrupados.
𝐤(𝐧)
DECILES D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 𝐏𝐃𝐤 =
𝟏𝟎
% de datos ≤ Dk 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Percentiles.
Son indicadores que dividen el conjunto de datos en cien partes iguales, de manera
que, cada parte equivale aproximadamente a un 1% de los datos. Se identifican como
Pk, que se lee percentil de orden k.
30
10/2/2022
PERCENTILES P1 P2 P3 P4 ... P37 … P56 … P79 … P88 … P97 P98 P99 P100
% de datos ≤ Pk 1% 2% 3% 4% ... 37% ... 56% ... 79% ... 88% ... 97% 98% 99% 100%
Método de interpolar: si al calcular la posición del fractil deseado, obtenemos un
número decimal, entonces el valor del fractil deseado se determinará mediante el
método de la interpolación, dando los siguientes pasos:
1. Se divide la posición calculada en dos partes, una parte entera y una parte
decimal (que es un valor entre cero y uno).
2. En los datos ordenados, se ubica la posición calculada y traza una pequeña línea
vertical en ese punto, es decir, si la posición calculada es 5.37, entre la posición 5
y la posición 6 se coloca una línea vertical.
3. El valor del fractil será igual al dato que está a la izquierda de la línea, más la
parte decimal de la posición calculada multiplicada por la diferencia del dato que
esta a la derecha de la línea y el dato que está a la izquierda de la línea:
Posición 5 + 0.37 (Posición 6 – Posición 5)
Cuartil de orden 1 :
Ordenar:
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Datos 48 51 55 59 65 66 67 70 74 77 78 79 80 81 83 88 90 91 91 94
Posición: Interpolar:
k(n + 1) 1(20 + 1) 21 Q1 = 65 + 0.25 66 − 65
PQk = ; PQ1 = = = 5.25 posición.
4 4 4 Q1 = 65.25 puntos.
El 25% de los empleados obtuvieron una puntuación menor o igual a 65.25 puntos en la
prueba de inteligencia emocional y el 75% restante, obtuvieron una puntuación mayor a
65.25 puntos.
31
10/2/2022
Ordenar:
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Datos 48 51 55 59 65 66 67 70 74 77 78 79 80 81 83 88 90 91 91 94
Posición:
k(n + 1) 7(20 + 1) 147
PDk = ; PD7 = = = 14.7 posición.
10 10 10
Interpolar:
D7 = 81 + 0.7 83 − 81 = 82.4 puntos.
El 70% de los empleados obtuvieron una puntuación menor o igual a 82.4 puntos,
mientras que el 30% restante, obtuvieron una puntuación mayor a 82.4 puntos.
Ordenar:
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Datos 48 51 55 59 65 66 67 70 74 77 78 79 80 81 83 88 90 91 91 94
Posición:
k(n + 1) 43(20 + 1) 903
PPk = ; P43 = = = 9.03 posición.
100 100 100
Interpolar:
P43 = 74 + 0.03 77 − 74 = 74.09 puntos.
El 43% de los empleados obtuvieron una puntuación menor o igual a 74.09 puntos,
mientras que el 57% restante, obtuvieron una puntuación mayor a 74.09 puntos.
32
10/2/2022
Cuartil de orden 3 :
Posición − Fi "menos de" anterior
k(n) Q𝑘 = Li + ∗ IC
PQk = fi
4 18.75 − 17
Q3 = 15 + ∗ 2 = 15 + 0.35 ∗ 2
3(25) 75 5
PQ3 = = = 18.75 posición. Q3 = 15 + 0.7 = 15.7 puntos.
4 4
Total 25 -
Decil de orden 2:
Posición − Fi "menos de" anterior
k(n) Dk = Li + ∗ IC
PDk = fi
10
5−3
D2 = 11 + ∗ 2 = 11 + 0.3333 ∗ 2
2(25) 50 6
PD2 = = = 5 posición. D2 = 11 + 0.6666 = 11.67 puntos.
10 10
33
10/2/2022
Percentil de orden 8 :
Posición − Fi "menos de" anterior
k(n) Pk = Li + ∗ IC
PPk = fi
100
2−0
P8 = 9 + ∗ 2 = 9 + 0.6667 ∗ 2 = 9 + 1.3334
8(25) 200 3
PP8 = = = 2 posición. P8 = 10.33 puntos.
100 100
34
10/2/2022
Rango interfractiles (RI): mide la diferencia entre dos medidas de posición. Es más
completo que la desviación intercuartílica (DI) = Q3 – Q1, porque con este indicador
se puede calcular el rango entre dos medidas de posición cualquiera.
Este indicador presenta un inconveniente y es que para la varianza las unidades son
el cuadrado de las unidades de los datos; por ejemplo, “dólares al cuadrado”. Estas
unidades no son muy claras o fáciles de interpretar, por ello surgió un indicador
denominado desviación típica o estándar que resuelve este problema. Su formula
para la población y para la muestra, tanto para datos simples, como para datos
agrupados se presenta a continuación.
35
10/2/2022
σ 𝐱𝐢 − 𝛍 𝟐 σ 𝐱𝐢 − 𝛍 𝟐 ∙ 𝐟𝐢
Población 𝛔= 𝛔= 𝛔 = 𝛔𝟐
𝐍 𝐍
σ 𝐱 𝐢 − 𝐱ത 𝟐 σ 𝐱 𝐢 − 𝐱ത 𝟐 ∙ 𝐟𝐢
Muestra 𝐒= 𝐒= 𝐒= 𝑺𝟐
𝐧−𝟏 𝐧−𝟏
Población Muestra
σ S
CV = ∗ 100 CV = ∗ 100
μ xത
Interpretación del coeficiente.
VALOR DEL CV VARIABILIDAD ESTABILIDAD
Nota: no hay criterios universales para
decir que un valor del CV es “bajo” o CV = 0% Nula Muy alta
“moderado” o “alto”, no obstante, el Mtro. 0% < CV ≤ 20% Baja Alta
Alberto Estrella (exdirector de la Cátedra 20% < CV ≤ 60% Moderada Moderada
de Estadística Especializada de la 60% < CV ≤ 90% Alta Baja
UASD), nos proporciona la siguiente guía.
CV > 90% Muy alta Nula
36
10/2/2022
Desviación media: |5 - 5| = 0
|7 - 5| = 2
σ xi 5 + 7 + 6 + 3 + 4 + 7 + 3 35
xത = = = = 5 años. |6 - 5| = 1
n 7 7 |3 - 5| = 2
σ xi − xത 10 |4 - 5| = 1
DM = = = 1.43 años. |7 - 5| = 2
n 7
|3 - 5| = 2
La variabilidad absoluta promedio de los años de antigüedad de xi − xത = 10
los SUV compactos se estima en 1.43 años de antigüedad.
(5 - 5)^2 = 0
Varianza: (7 - 5)^2 = 4
(6 - 5)^2 = 1
σ xi − xത 2
18 18 (3 - 5)^2 = 4
S2 = = = = 3 años2 .
n−1 7−1 6 (4 - 5)^2 = 1
(7 - 5)^2 = 4
La variabilidad cuadrática promedio de los años de antigüedad (3 - 5)^2 = 4
de los SUV compactos se estima en 3 años de antigüedad 2. 𝑥𝑖 − 𝑥 ҧ 2 = 18
37
10/2/2022
Desviación estándar:
S= S2 = 3 años 2 = 1.73 años. S2 = 3 años 2.
Coeficiente de variación:
S 1.73 xത = 5 años.
CV = ∗ 100 = ∗ 100 = 34.6 %
xത 5
Los siguientes datos corresponden al precio por libra de un producto en una muestra
de supermercados del gran santo domingo, en Marzo, 2020:
Supermercados Fi "menos (𝐱 𝐢 − 𝐱ത 𝟑 ∗ 𝐟𝐢 (𝐱 𝐢 − 𝐱ത 𝟒 ∗ 𝐟𝐢
Precios (RD$) Xi 𝐱 𝐢 ∗ 𝐟𝐢 𝐱 𝐢 − 𝐱ത ∗ 𝐟𝐢 (𝐱 𝐢 − 𝐱ത 𝟐 ∗ 𝐟𝐢
(fi) de"
10 - 12 1 1 11 11 3.9 15.21 -59.319 231.3441
12 - 14 5 6 13 65 9.5 18.05 -34.295 65.1605
14 - 16 9 15 15 135 0.9 0.09 0.009 0.0009
16 - 18 4 19 17 68 8.4 17.64 37.044 77.7924
18 - 20 1 20 19 19 4.1 16.81 68.921 282.5761
Total 20 - - 298 26.8 67.80 12.360 656.8740
Rango:
R = LS (ultima clase) – LI (primera clase) = 20 – 10 = 10 pesos.
La diferencia en pesos entre el precio más caro y el precio más barato del producto,
en la muestra de supermercado del gran santo domingo es de 10 pesos.
38
10/2/2022
σ xi ∙ fi 298
xത = = = 14.9 𝑝𝑒𝑠𝑜𝑠.
n 20
Desviación media:
σ xi − xത ∙ fi 26.8
DM = = = 1.34 pesos.
n 20
39
10/2/2022
Varianza:
σ xi − xത 2 ∙ fi 67.80 67.80
S2 = = = = 3.57 pesos2 .
n−1 20 − 1 19
La variabilidad cuadrática promedio del precio del producto en la muestra de
supermercados de gran santo domingo se estima en 3.57 pesos2.
Supermercados Fi "menos (𝐱 𝐢 − 𝐱ത 𝟑 ∗ 𝐟𝐢 (𝐱 𝐢 − 𝐱ത 𝟒 ∗ 𝐟𝐢
Precios (RD$) Xi 𝐱 𝐢 ∗ 𝐟𝐢 𝐱 𝐢 − 𝐱ത ∗ 𝐟𝐢 (𝐱 𝐢 − 𝐱ത 𝟐 ∗ 𝐟𝐢
(fi) de"
10 - 12 1 1 11 11 3.9 15.21 -59.319 231.3441
12 - 14 5 6 13 65 9.5 18.05 -34.295 65.1605
14 - 16 9 15 15 135 0.9 0.09 0.009 0.0009
16 - 18 4 19 17 68 8.4 17.64 37.044 77.7924
18 - 20 1 20 19 19 4.1 16.81 68.921 282.5761
Total 20 - - 298 26.8 67.80 12.360 656.8740
S2 = 3.57 pesos2.
Desviación estándar:
S= S2 = 3.57 pesos 2 = 1.89 pesos.
40
10/2/2022
S = 1.89 pesos.
Coeficiente de variación:
S 1.89
CV = ∗ 100 = ∗ 100 = 12.68 %
xത 14.9
El tamaño relativo de la variabilidad promedio del precio del producto con relación a
la media se estima en 12.68%. Este valor indica que la variabilidad de los datos es
baja y la estabilidad es alta.
PROBABILIDAD.
41
10/2/2022
42
10/2/2022
Asignación de probabilidades.
Los requisitos básicos son: cada probabilidad debe estar entre 0 y
1 inclusive, y la suma de las probabilidades de todos los eventos
simples en S debe ser igual a 1. Los tres métodos comunes son:
1. Método de la frecuencias relativas (requiere repetir el experimento
un gran número de veces): se realiza un experimento un gran
número de veces y se cuenta el número de veces que ocurre el
evento A. Entonces, P(A) se aproxima de la siguiente manera:
número de veces que ocurrió A fA
𝑃 𝐴 = =
número de veces que se repitió el experimento n
43
10/2/2022
44
10/2/2022
Diagrama de Venn.
A veces es útil visualizar un experimento usando
este diagrama, en el cual, la caja exterior
representa el espacio muestral S, que contiene
todos los eventos simples: S = {1,2,3,4,5,6,7}.
Como un evento es un conjunto de uno o más
eventos simples, estos están representados por
un circulo con la letra que identifica el evento.
A={1,2,4,7}, B={1,2,3,6} y C={1,3,4,5}.
Regla de la adición.
Es útil cuando interesa conocer la probabilidad de que ocurra por lo menos
uno de dos eventos. Es decir, con los eventos A y B nos interesa conocer la
probabilidad de que ocurra el evento A o el evento B, o ambos. Antes de
presentar la regla de la adición, debemos estudiar dos conceptos
relacionados con la combinación de eventos: la unión de eventos y la
intersección de eventos.
45
10/2/2022
A = {1,2,4,7} ; Ac = {3,5,6}
B = {1,2,3,6} ; Bc = {4,5,7}
C = {1,3,4,5} ; Cc = {2,6,7}
A∪B = {1,2,3,4,6,7}
A∪C = {1,2,3,4,5,7}
B∪C = {1,2,3,4,5,6}
A∩B = {1,2} ; A∩C = {1,4} ; B∩C = {1,3}
Para encontrar la P(A∪B), que es lo mismo que P(A o B), sume el número de
formas en que puede ocurrir el evento A y el número de formas en que
puede ocurrir el evento B, pero hágalo de tal manera que cada resultado se
contabilice sólo una vez. Entonces, la P(A∪B) es igual a esa suma, dividida
por el número total de resultados en el espacio muestral.
𝑃 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃 𝐵 − 𝑃(𝐴 ∩ 𝐵)
Cuando dos eventos pueden ocurrir al mismo tiempo se dicen que son no
mutuamente excluyentes, es decir, los contrario a lo planteado más arriba.
46
10/2/2022
Si un sujeto se selecciona al azar de entre los 555 sujetos que fueron sometidos a la
prueba de drogas, encuentre la probabilidad de seleccionar un sujeto con resultado
positivo en la prueba o que use drogas.
47
10/2/2022
48
10/2/2022
Otro ejemplo: sea C el evento de tener cáncer y A el evento de dar positivo en la prueba,
determine:
49
10/2/2022
Regla de la multiplicación.
Mientras que la regla de la suma (ley aditiva) de la probabilidad se utiliza para
calcular la probabilidad de la unión de dos eventos, la regla de la multiplicación se
utiliza para calcular la probabilidad de la intersección de dos eventos. Esta última
regla se basa en la definición de la probabilidad condicional. Las formulas son:
𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 ∙ 𝑃 𝐵|𝐴
o
𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐵 ∙ 𝑃 𝐴|𝐵
Ejemplo 4: un envase contiene 6 bolas azules y 9 bolas verdes. Usted cierra los
ojos y del envase escoge dos bolas una por una y anota sus colores: a) ¿Cuál es
la probabilidad de que la primera bola sea azul y la segunda sea verde? ;
b) ¿Cuál es la probabilidad de que ambas bolas sean verdes?
𝑃 𝐴 ∩ 𝑉 = 𝑃 𝐴 ∙ 𝑃 𝑉|𝐴 𝑃 𝑉 ∩ 𝑉 = 𝑃 𝑉 ∙ 𝑃 𝑉|𝑉
6 9 9 9 8 12
𝑃 𝐴∩𝑉 = ∗ = = 0.2571 𝑃 𝑉∩𝑉 = ∗ = = 0.3429
15 14 35 15 14 35
50
10/2/2022
REFERENCIAS BIBLIOGRÁFICAS
Anderson, D., Sweeney, D., y Williams, T. (2012). Estadística para negocios y
economía. 11 ed. México D.F. México.
Custodio, C. (2007). Estadística Básica. 4 ed. Santo Domingo, R.D.
Familia, C. (2016). Introducción a la Estadística Elemental Aplicada (Tomo I). Santo
Domingo, R.D.
Levin, R. y Rubin, D. (2010). Estadística para Administración y Economía. 7ed. Ciudad
de México, México.
Lind, D., Marchal, W., y Wathen, S. (2012). Estadística Aplicada a los Negocios y la
Economía. 15 ed. Ciudad de México, México.
Mendenhall, W., Beaver, R., y Beaver, B. (2010). Introducción a la Probabilidad y
Estadística. 13 ed. Ciudad de México, México.
Triola, M. (2018). Estadística. 12 ed. Ciudad de México, México.
51