Documentos de Académico
Documentos de Profesional
Documentos de Cultura
COMPENDIO ESTADISTICO
AUTORES:
CURSO:
Estadística General
DOCENTE:
Tarapoto-Perú
2023
3
Introducción
ámbito de estudio partiendo desde la conjetura inicial de recolección de datos hasta la interpretación
de la mismas. En el transcurso del trabajo usted irá reconociendo de manera resolutiva los distintos
temas que se abordaron en el lapso del ciclo correspondiente a la asignatura de Estadística General.
Como punto de partida los integrantes por sugerencia del docente encargado hicimos un
árbol genealógico por cada uno, con el fin de comprender un postulado base estadístico donde se
Cabe recalcar que los trabajos se llevaron a cabo por semana académicas y en cada una de
estas se plantearon ejercicios para mayor profundización y práctica de los integrantes. Temas como
aplicar esta metodología se busca lograr la curiosidad de del lector que desea y tiene ánimos de
poder desarrollarlo en dicho formato. La importancia del trabajo radica en que nosotros como
estudiantes hemos realizado los distintos ejercicios con mucha investigación en son de prudencia
de la veracidad.
Está comprendida en tres unidades de las cuales las primeras dos fueron llevadas en cinco
semanas cada una con el fin de desglosar los temas y vayan desde los meneos complicado a lo de
mayor complejidad. Cada unidad académica tuvo una evaluación del docente y así se cumpla con
toda la organización informativa que presenta este formato, pues se considera necesario que, para
4
poder llegar al lector, se debe inclinar los textos académico de forma interactiva para de este modo
se estimule. Sin nada más que agregar le presentamos el compendio final del área en cuestión para
Índice
Introducción ..................................................................................................................................... 3
Importancia de la Estadística...................................................................................................... 11
Entrevista ................................................................................................................................ 21
Encuestas ................................................................................................................................ 22
Experimentos .......................................................................................................................... 22
La media: ................................................................................................................................ 27
La mediana: ............................................................................................................................ 27
La moda: ................................................................................................................................. 28
La Varianza ............................................................................................................................. 28
Definición ............................................................................................................................... 39
Índice de tablas
Índice de gráficos
Importancia de la Estadística
lo que ha adquirido un papel clave en la investigación. Se usa como un valioso auxiliar y en los
diferentes campos del conocimiento y en las variadas ciencias. Es un lenguaje que permite
Es tan importante que casi no existe actividad humana en que no esté involucrada la
Estadística. Las decisiones más importantes de nuestra vida se toman con base en la aplicación de
la Estadística.
Ejemplos:
decisiones. La estadística es parte esencial de la forma profesional, es hasta cierto punto una parte
Ronald A. Fisher:
ambos campos y estableció muchos de los conceptos y técnicas que se utilizan en la investigación
máxima verosimilitud.
varianza y la creación de la prueba F, una técnica utilizada para comparar las varianzas de dos
poblaciones.
Aporte:
eficientes y precisos, que permiten identificar la relación entre una variable de respuesta y una o
2. Análisis de varianza: Fisher desarrolló el análisis de varianza, una técnica estadística que
permite evaluar la variación entre grupos y dentro de grupos, lo que resulta útil para comparar
parámetros de población y para probar hipótesis acerca de la media y la varianza de una población.
13
análisis de varianza.
Gottfried Achenwall:
conocido como uno de los primeros estadísticos modernos y su trabajo fue fundamental para el
en Alemania y fue el autor de "Estadística de los Estados Alemanes", que fue uno de los primeros
trabajos sobre estadística publicados en Europa. En este trabajo, Achenwall definió la estadística
como la ciencia de recolectar y analizar datos para tomar decisiones informadas. Además,
incluyendo el uso de tablas y gráficos para presentar los datos de manera clara y concisa.
probable" y desarrolló una técnica para estimar la incertidumbre asociada con una medición.
Aporte:
desarrollo de la disciplina como una herramienta para el análisis de datos y la toma de decisiones
incluyendo el uso de tablas y gráficos para presentar los datos de manera clara y concisa. También
definió la estadística como una ciencia que se ocupa de la recolección, análisis e interpretación de
datos.
14
Achenwall fue el autor de "Estadística de los Estados Alemanes", uno de los primeros
trabajos importantes sobre estadística publicados en Europa. En este trabajo, Achenwall desarrolló
técnicas para la recolección y análisis de datos, y estableció el concepto de que los datos podrían
William Petty:
William Petty (1623-1687) fue un economista, filósofo y estadístico inglés que realizó
Nacido en Hampshire, Inglaterra, Petty fue el hijo de un sastre y pasó gran parte de su
infancia en Francia, donde su padre trabajaba para el ejército inglés. A pesar de no haber recibido
una educación formal, Petty demostró un gran interés por la ciencia y las matemáticas desde una
edad temprana. En 1643, Petty se unió al ejército parlamentario durante la Guerra Civil Inglesa y
sirvió como cirujano y cartógrafo. Después de la guerra, Petty estudió medicina en la Universidad
Después de graduarse, Petty se trasladó a Irlanda, donde se convirtió en médico del ejército
inglés y comenzó a interesarse por la economía y la estadística. En 1660, Petty fue nombrado
profesor de anatomía y cirugía en la Universidad de Oxford, pero renunció al año siguiente para
regresar a Irlanda. En 1662, Petty fue nombrado miembro del Parlamento irlandés y se convirtió
en uno de los principales asesores económicos del rey Carlos II. Durante este período, Petty realizó
15
una serie de estudios demográficos y económicos sobre Irlanda, que más tarde se publicaron en su
En "Aritmética política ", Petty utilizó datos sobre la población, la producción y el comercio
defunciones. En 1672, Petty fue nombrado miembro de la Royal Society y se convirtió en uno de
los principales defensores del método científico en la economía y la estadística. En 1682, fue
nombrado presidente de la Royal Society y mantuvo este cargo hasta su muerte en 1687.
Además, Petty fue uno de los primeros en utilizar la estadística para estudiar la economía.
defunciones.
Aporte:
Una de sus principales aportaciones fue la introducción del concepto de estadística como
una disciplina cuantitativa. En su obra "Aritmética política" (1662), Petty argumentaba que la
recolección de datos cuantitativos era esencial para la toma de decisiones políticas y económicas
informadas.
Además, Petty fue uno de los primeros en utilizar la estadística para estudiar la economía.
defunciones.
16
1. Contribuciones al análisis estadístico: Petty fue uno de los primeros en realizar estudios
cuantitativos de la economía. En su obra " Aritmética política ", utilizó datos sobre la población, la
nacimientos y defunciones.
Contributions", propuso la idea de que la distribución de la riqueza sigue una distribución normal,
gráficos y tablas para representar datos cuantitativos. En su obra " Aritmética política ", incluyó
varios gráficos y tablas para representar los datos demográficos y económicos de Inglaterra.
riqueza en Inglaterra y propuso una serie de políticas fiscales para reducir la pobreza y aumentar
Karl Pearson
Nacido en Londres, Pearson, fue educado en casa por su padre, quien era un hombre muy
culto. A los 16 años, ingresó a la Universidad de Cambridge, donde estudió matemáticas y filosofía.
Después de graduarse, se trasladó a Alemania, donde estudió bajo la tutela de Augustus De Morgan
y Francis Galton.
17
biología, y en 1892 publicó su primera obra importante, "The Grammar of Science", que se
biología, que se convirtió en una de las publicaciones más influyentes en su campo. También
correlación y la regresión.
En 1901, Pearson fue nombrado miembro de la Royal Society y se convirtió en uno de los
principales defensores del método científico en la estadística y la biología. Durante este período,
también comenzó a interesarse por la eugenesia, una idea controvertida en su época que propugnaba
ejército británico, donde utilizó sus habilidades estadísticas para analizar los datos de mortalidad y
Aporte:
fuerza y dirección de la relación lineal entre dos variables. Este coeficiente se utiliza ampliamente
18
epidemiología.
para determinar si hay una relación entre dos variables categóricas. Esta técnica es ampliamente
distribución normal. En particular, demostró que muchos fenómenos naturales y sociales siguen
una distribución normal y desarrolló técnicas estadísticas para modelar estos fenómenos.
utiliza para modelar la relación entre dos variables continuas. Esta técnica se utiliza ampliamente
utilizada para comparar la media de tres o más grupos. Esta técnica se utiliza en áreas como la
utilizada para estimar los parámetros de una distribución. Este método se utiliza en áreas como la
Variables Cuantitativas:
Discreta
Es una variable que no puede tomar algunos valores dentro de un mínimo conjunto
Ejemplos:
19
Continua
Son aquellas características que son medidas dentro de un rango continuo infinito de
Ejemplos:
- La presión atmosférica.
Variables Cualitativas:
Nominal
Una variable puede ser tratada como nominal cuando sus valores representan categorías
que no obedecen a una clasificación intrínseca. Es decir, no cuenta con diferencia exacta de datos.
ejemplos:
Ejemplos:
- La población venezolana que labora en el interior del país según su sexo (varones o
mujeres).
Ordinal
Expresa con palabras una cualidad de naturaleza ordenable. Es decir, una variable ordinal
Ejemplos:
…).
- Valor de las monedas de Sudamérica en referencia al dólar (sol peruano, peso mexicano,
…).
Las técnicas de recolección de datos se refieren a los métodos utilizados para recoger y
analizar diferentes formas de datos. Las técnicas habituales de recogida de datos incluyen el
observaciones.
Entrevista
plantea una serie de preguntas o temas de debate a una o varias personas, con el fin de obtener
información específica. Puede realizarse personalmente, por teléfono o de manera virtual. Sin
embargo, en algunos casos es importante la interacción personal con el entrevistado, para poder
tomar nota de la información que brinda la comunicación no verbal. Los instrumentos utilizados
en las entrevistas pueden incluir guiones de entrevistas, grabadoras de audio y notas de campo.
22
Grupos focales
Los grupos focales son una técnica de recolección de datos que implican reunir a un grupo
de personas para discutir un tema o problema específico. Los instrumentos utilizados en los grupos
Análisis de documentos
analizar documentos escritos, como informes, políticas y registros. Los instrumentos utilizados en
análisis de texto.
Encuestas
Las encuestas son una técnica comúnmente utilizada para obtener datos de una muestra de
población. Los instrumentos utilizados en las encuestas pueden incluir cuestionarios, entrevistas
Experimentos
Los experimentos son una técnica de recolección de datos que implican manipular una o
más variables y observar los efectos en una o más variables dependientes. Los instrumentos
observación.
23
TABLA DE FRECUENCIA 1
Tabla 1. N° de trabajadores según estado civil
Estado Civil fi Fi hi Hi hi% Hi%
Casado 75 75 0.28 0.28 28% 28%
Concubino 16 91 0.06 0.34 6% 34%
Conviviente 26 117 0.10 0.44 10% 44%
Divorciado 5 122 0.02 0.46 2% 46%
Soltero 144 266 0.54 0.99 54% 99%
Viudo 2 268 0.01 1.00 1% 100%
Total general 268 1 100%
Fuente: base de datos, Red asistencial-Tarapoto
Interpretaciones:
-Del total del personal de la red asistencia de Tarapoto, 144 se encuentran en el estado civil
de Solteros.
-Del 100% del personal de la red asistencial de Tarapoto, solo el 28% se encuentran en el
-Del total del personal de la red asistencial de Tarapoto, 266 son casados, concubinos,
160 144
140
Casado
120
Concubino
100
75 Conviviente
80
Divorciado
60
26 Soltero
40
16
20 5 Viudo
2
0
Casado Conviviente Soltero
TABLA DE FRECUENCIA 2
Tabla 2. Nº de trabajadores según cargo.
Cargo fi Fi hi Hi hi% Hi%
Jefe de servicio asistencial 1 1 0.00 0.00 0.4% 0%
Prof. Técnico asistencial 26 27 0.10 0.10 9.7% 10%
Enfermera 140 167 0.52 0.62 52% 62%
Técnico de enfermería II 99 266 0.37 0.99 37% 99%
Aux. de serv. Asistencial 1 267 0.00 1.00 0.4% 100%
Aux de conserva y limpieza 1 268 0.00 1 0.4% 100%
Total general 268 1 100%
Fuente: base de datos, Red asistencial-Tarapoto
Interpretaciones:
-Del total del personal de la Red asistencial de Tarapoto, 140 desempeñan el cargo de
enfermera
-Del 100% del personal de la red asistencial de Tarapoto, solo el 9.7% desempeñan el cargo
-Del total del personal de la red asistencial de Tarapoto, 167 desempeñan los cargos de jefe
37% Enfermera
Técnico de enfermería II
10%
Aux. de serv. Asistencial
Aux de conserva y
0% limpieza
1%
0%
TABLA DE FRECUENCIA 3
Tabla 3. N° de trabajadores según intervalo de edad.
Edad Y fi Fi hi Hi hi% Hi%
22-29 25.5 36 36 0.13 0.13 13% 13%
30-37 33.5 77 113 0.29 0.42 29% 42%
38-45 41.5 72 185 0.27 0.69 27% 69%
46-53 49.5 27 212 0.10 0.79 10% 79%
54-61 57.5 16 228 0.06 0.85 6% 85%
62-69 65.5 37 265 0.14 0.99 14% 99%
70-77 73.5 3 268 0.01 1.00 1% 100%
Total general 268 1 100%
Fuente: base de datos, Red asistencial-Tarapoto
Interpretaciones:
edad de 30 a 37 años.
77
80 72
60
36 37
40
27
20
16
3
0
22-29 30-37 38-45 46-53 54-61 62-69 70-77
Edad
TABLA DE FRECUENCIA 4
Tabla 4. N° de trabajadores según intervalo de año de ingreso.
Cargo Y fi Fi hi Hi hi% Hi%
1982-1985 1983.5 4 4 0.01 0.01 1% 1%
1986-1989 1987.5 40 44 0.15 0.16 15% 16%
1990-1993 1991.5 2 46 0.01 0.17 1% 17%
1994-1997 1995.5 1 47 0.00 0.18 0% 18%
1998-2001 1999.5 5 52 0.02 0.19 2% 19%
2002-2005 2003.5 6 58 0.02 0.22 2% 22%
2006-2009 2007.5 25 83 0.09 0.31 9% 31%
2010-2013 2011.5 3 86 0.01 0.32 1% 32%
2014-2017 2015.5 8 94 0.03 0.35 3% 35%
2018-2021 2019.5 174 268 0.65 1.00 65% 100%
Total, general 268 1 100%
Fuente: base de datos, Red asistencial-Tarapoto
Interpretaciones:
-Del total del personal de la Red asistencial de Tarapoto, el mayor ingreso del personal se
-Del total del personal de la Red asistencia de Tarapoto, solo se registró un ingreso, entre
-Del 100% del personal de la Red asistencial de Tarapoto, se registró un ingreso del 15%
200
180 174
160
140
120
100
80
60
40 40
20 25
2 1 5 6 3
4 8
0
1982-1985 1986-1989 1990-1993 1994-1997 1998-2001 2002-2005 2006-2009 2010-2013 2014-2017 2018-2021
Se refieren a una medida estadística que representa un valor típico o central de un conjunto
determinar un valor representativo que se encuentre cerca del centro de la distribución. Son los
siguientes tipos:
La media:
Para calcular la media, se suman todos los valores del conjunto de datos y se dividen entre
el número total de valores. Es decir, la media se obtiene mediante la suma de todos los valores
Σfi xi
x̅ =
N
La mediana:
Se define como el valor que divide al conjunto de datos en dos partes iguales, donde la
mitad de los valores se encuentran por encima y la otra mitad por debajo de la mediana.
Para calcular la mediana, primero se ordenan los datos de forma ascendente o descendente.
número de datos es par, la mediana se obtiene promediando los dos valores centrales.
𝑁
2
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + ∗ 𝐴𝑖
𝑓𝑖
28
La moda:
Representa el valor o valores que aparecen con mayor frecuencia en un conjunto de datos.
En otras palabras, la moda es el valor que tiene la mayor ocurrencia en un conjunto de datos.
La moda es útil para identificar los valores más comunes o populares en una distribución
se determina simplemente identificando los valores que se repiten con mayor frecuencia.
fi − fi−1
Mo = Li + ∗ Ai
(fi − fi−1 ) + (fi − fi+1 )
Medidas de Dispersión
Las medidas de dispersión son números que indican si una variable se mueve mucho, poco,
más o menos que otra. La razón de ser de este tipo de medidas es conocer de manera resumida una
En este sentido, deben acompañar a las medidas de tendencia central. Juntas, ofrecen
información de un sólo vistazo que luego podremos utilizar para comparar y, si fuera preciso, tomar
La Varianza
datos respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado
𝛴[(𝑥𝑖 -𝑥̅ )2 𝑓𝑖 ]
𝜎2 =
N
29
La desviación estándar es una medida que se usa para cuantificar la variación o dispersión
de un conjunto de datos numéricos. Una desviación estándar baja indica que la mayor parte de los
datos de una muestra tienden a estar agrupados cerca de su promedio, mientras que una desviación
estándar alta indica que los datos se extienden sobre un rango de valores más amplio.
𝛴[(𝑥𝑖 -𝑥̅ )2 𝑓𝑖 ]
𝜎=√
N
Error típico
En estadística, el error típico o estándar sirve para indicar el intervalo de confianza con
respecto a la fiabilidad de los cálculos realizados sobre una muestra; en otras palabras, determina
el grado en que la estimación de una muestra puede diferir con respecto al parámetro de una
población.
σ
Et =
√N
Medidas de Posición:
Es una medida que se usa para cuantificar la variación o dispersión de un conjunto de datos
numéricos. Una desviación estándar baja indica que la mayor parte de los datos de una muestra
tienden a estar agrupados cerca de su promedio, mientras que una desviación estándar alta indica
que los datos extienden sobre un rango de valores más amplio. Se divide en.
Coeficiente de Asimetría
de una distribución. Es decir, el coeficiente de asimetría sirve para determinar si una función es
30
Ten en cuenta que la asimetría de una distribución depende de la forma que tiene la curva.
Así pues, los diferentes tipos de asimetría son: Asimetría positiva: la distribución tiene más valores
diferentes a la derecha de la media que a su izquierda. Asimetría negativa: la distribución tiene más
Coeficiente de Curtosis
La curtosis, también llamada apuntamiento, es una medida estadística que indica el grado
cuanto mayor sea la curtosis de una distribución más escarpada (o apuntada) es.
𝛴{[(𝑥 − 𝑥̅ )4 ∗ 𝑓𝑖 }
Cc = −3
𝑁 ∗ 𝜎4
31
TABLA DE FRECUENCIA 5
Tabla 5. Nº de trabajadores por intervalo de edad.
Edad xi fi Fi xi*fi xi-M
23-32 27.5 67 67 1842.5 -15
33-42 37.5 94 161 3525 -5
43-52 47.5 49 210 2327.5 5
53-62 57.5 22 232 1265 15
63-72 67.5 36 268 2430 25
Total general 268 11390
Fuente: base de datos, Red asistencial-Tarapoto
Análisis de datos
Edad
Media 42.50
Error típico 0.80
Mediana 39.41
Moda 36.38
Desviación estándar 13.12
Varianza 172.01
Curtosis -0.72
Coeficiente de asimetría 0.71
Rango 48.00
Mínimo 23.00
Máximo 71.00
Suma 11393.00
Cuenta 268.00
32
𝑵 𝒇𝒊 − 𝒇𝒊−𝟏
𝜮𝒇𝒊 𝒙𝒊 𝟐
− 𝑭𝒊−𝟏
ഥ=
𝒙 𝑴𝒆 = 𝑳𝒊 + ∗ 𝑨𝒊 𝑴𝒐 = 𝑳𝒊 + ∗ 𝑨𝒊
𝑵 𝒇𝒊 (𝒇𝒊 − 𝒇𝒊−𝟏 ) + (𝒇𝒊 − 𝒇𝒊+𝟏 )
11390 268 94 − 67
𝑥̅ = − 67 𝑀𝑜 = 33 + ∗9
268 𝑀𝑒 = 33 + 2 ∗9 (94 − 67) + (94 − 49)
94
𝑥̅ = 42.5 27
134 − 67 𝑀𝑜 = 33 + ∗9
𝑀𝑒 = 33 + ∗9 27 + 45
94
27
603 𝑀𝑜 = 33 + ∗9
𝑀𝑒 = 33 + 72
94
3705 27
𝑀𝑒 = 𝑀𝑜 = 33 +
94 8
𝑀𝑒 = 39.414 291
𝑀𝑜 =
8
𝑀𝑜 =36.375
Coeficiente de asimetría:
ഥ)𝟑 ∗ 𝒇𝒊 }
𝜮{(𝒙 − 𝒙 [(𝒙ഥ − 𝑴𝒆) ∗ 𝟑]
𝑨𝒔 = 𝑨𝒔 =
𝑵 ∗ 𝝈𝟑 𝝈
[(42.5 − 39.414) ∗ 3]
405000 𝐴𝑠 =
𝐴𝑠 = 13.115
268 ∗ 2,255.822
[3.086 ∗ 3]
405000 𝐴𝑠 =
13.115
𝐴𝑠 =
604560.296 𝐴𝑠 = 0.70
𝐴𝑠 = 0.66
Coeficiente de asimetría
100
90
80
70
60
50
40
30
20
10
0
23-32 33-42 43-52 53-62 63-72
En el gráfico se muestra que hay un sesgo hacia la derecha, es así que de deduce y demuestra
mediante calculo que es una asimetría positiva por ser mayor a cero y la formación del sesgo.
34
Curtosis:
ഥ)𝟒 ∗ 𝒇𝒊 }
𝜮{[(𝒙 − 𝒙
𝑪𝒄 = −𝟑
𝑵 ∗ 𝝈𝟒
18657500
𝐶𝑐 = −3
268 ∗ 29585.109
18657500 − 23786427.636
𝐶𝑐 =
7928809.212
−5128927.636
𝐶𝑐 =
7149212.55
𝐶𝑐 = −0.717
Curtosis
16 0.035
14 0.03
12
0.025
10
Frecuencia
0.02
8
0.015
6
0.01
4
2 0.005
0 0
23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 59 61 63 65 67 69 71
El resultado de la curtosis nos da un valor negativo, lo que gráficamente nos indica que la
distribución es más plana que la distribución normal, por lo cual podemos afirmar que es
platicúrtica.
35
TABLA DE FRECUENCIA 6
Tabla 6. Nº de trabajadores por intervalo de tiempo de servicio.
Tiempo de servicio xi fi Fi fi*xi xi-M
1-9 5 171 171 855 -6.6828358
10-18 14 30 201 420 2.3171642
19-27 23 33 234 759 11.317164
28-36 32 33 267 1056 20.317164
37-45 41 1 268 41 29.317164
Total general 268 3131
Fuente: base de datos, Red asistencial-Tarapoto
Análisis de datos
Tiempo de servicio
Media 10.64552239
Error típico 0.730546663
Mediana 3
Moda 2
Desviación estándar 11.95956431
Varianza de la muestra 143.0311784
Curtosis -0.372308919
Coeficiente de asimetría 1.059859469
Rango 39
Mínimo 1
Máximo 40
Suma 2853
Cuenta 268
36
Moda:
Media: Mediana:
𝑵 𝒇𝒊 − 𝒇𝒊−𝟏
𝜮𝒇𝒊 𝒙𝒊 − 𝑭𝒊−𝟏
ഥ=
𝒙 𝑴𝒆 = 𝑳𝒊 + 𝟐 ∗ 𝑨𝒊 𝑴𝒐 = 𝑳𝒊 + ∗ 𝑨𝒊
𝑵 𝒇𝒊 (𝒇𝒊 − 𝒇𝒊−𝟏 ) + (𝒇𝒊 − 𝒇𝒊+𝟏 )
3131 268
𝑥̅ = −0 172 − 0
268 𝑀𝑒 = 1 + 2 ∗8 𝑀𝑜 = 1 + ∗8
171 (172 − 0) + (172 − 30)
𝑥̅ = 11.6828358
172
134 𝑀𝑜 = 1 + ∗8
𝑀𝑒 = 1 + ∗8 172 + 142
171
172
1,072 𝑀𝑜 = 1 + ∗8
𝑀𝑒 = 1 + 314
171
1,376
171 + 1072 𝑀𝑜 = 1 +
𝑀𝑒 = 314
171
𝑀𝑜 = 5.382165605
𝑀𝑒 = 7.23255814
ഥ)𝟐 𝒇𝒊 ]
𝜮[(𝒙𝒊 -𝒙 𝝈
ഥ)𝟐 𝒇𝒊 ]
𝜮[(𝒙𝒊 -𝒙 Et =
𝟐
𝝈 = 𝝈=√ √𝑵
𝑵 𝑵
19.94502
26506.041 𝐸𝑇 =
𝜎2 = 𝜎 = √98.90315 √268
268
𝜎 = 9.9450 9.94502
2
𝐸𝑇 =
𝜎 = 98.9031 16.37
𝐸𝑇 = 0.6075
37
Coeficiente de asimetría:
ഥ)𝟑 ∗ 𝒇𝒊 }
𝜮{(𝒙 − 𝒙 [(𝒙
ഥ − 𝑴𝒆) ∗ 𝟑]
𝑨𝒔 = 𝑨𝒔 =
𝑵 ∗ 𝝈𝟑 𝝈
299127.8411 [(11.6828 − 7.2325 ) ∗ 3]
𝐴𝑠 = 𝐴𝑠 =
268 ∗ 983.5905 9.9450
299127.8411
As = [4.4503 ∗ 3]
263602.12 𝐴𝑠 =
10.938337
As = 1.1347 13.3509
𝐴𝑠 =
9.9450
Coeficiente de asimetría
180
160
140
120
100
80
60
40
20
0
1-9 10-18 19-27 28-36 37-45
En el gráfico se muestra que hay un sesgo hacia la derecha, es así que de deduce y demuestra
mediante calculo que es una asimetría positiva por ser mayor a cero y la formación del sesgo.
38
Curtosis:
ഥ)𝟒 ∗ 𝒇𝒊 }
𝜮{[(𝒙 − 𝒙
𝑪𝒄 = −𝟑
𝑵 ∗ 𝝈𝟒
7244974.638
𝐶𝑐 = −3
268 ∗ 9,781.8083
7244974.638
𝐶𝑐 = −3
2621524.6244
𝐶𝑐 = -0.2363507
Curtosis
100 0.035
90
0.03
80
70 0.025
Frecuencia
60
0.02
50
40
0.015
30 0.01
20
0.005
10
0 0
1 2 3 4 5 6 7 9 10 12 13 14 15 16 17 18 20 21 22 23 24 25 26 32 33 35 36 40
El resultado de la curtosis nos da un valor negativo, lo que gráficamente nos indica que la
distribución es más plana que la distribución normal, por lo cual podemos afirmar que es
platicúrtica.
39
Teorema de Bayes
Definición
matemático inglés Thomas Bayes (1702-1761) y publicada póstumamente en 1763, que expresa
relevancia puesto que vincula la probabilidad de dado con la probabilidad de dado. Es decir, por
ejemplo, que sabiendo la probabilidad de tener un dolor de cabeza dado que se tiene gripe, se podría
saber (si se tiene algún dato más), la probabilidad de tener gripe si se tiene un dolor de cabeza.
Muestra este sencillo ejemplo la alta relevancia del teorema en cuestión para la ciencia en todas
sus ramas, puesto que tiene vinculación íntima con la comprensión de la probabilidad de aspectos
como una probabilidad, debería cambiar racionalmente para tener en cuenta la disponibilidad de
considerada por una autoridad como; "a la teoría de la probabilidad lo que el teorema de
Pitágoras es a la geometría."
40
Ejercicios Propuestos
Ejercicio 1
Supongamos que una empresa produce dos tipos de productos A y B. Se sabe que el 60%
de los productos que produce son del tipo A y el 40% son del tipo B. Además, se sabe que el 5%
de los productos del tipo A son defectuosos y el 10% de los productos de tipo B son defectuosos.
Solución
Para resolver este problema, podemos utilizar el teorema de Bayes. Sea D, el evento “el
producto seleccionado es defectuoso” y sea A el evento “el producto seleccionado sea del tipo A”.
Entones, lo que se nos pide es calcular la probabilidad condicional P(A/D). Por el teorema de Bayes
tenemos.
𝑃(𝐴) ∗ 𝑃(𝐷|𝐴)
𝑃(𝐴|𝐷) =
𝑃(𝐷)
probabilidad de que el producto seleccionado al azar sea del tipo A, y P(D) es la probabilidad de
41
que el producto seleccionado al azar sea defectuoso. Podemos calcular estas probabilidades como
sigue:
P(D/A) = 0.05
P(A) = 0.06
P(D) = P(D|A) P(A) + P(D|B) P(B) = 0.05 * 0.06 + 0.01 * 0.04 = 0.07
0.05∗0.6
𝑃(𝐴|𝐷) =
0.07
=0.43
Por lo tanto, la probabilidad de que el producto seleccionado al azar sea de tipo A, dado que
Ejercicio 2
Supongamos que una empresa tiene dos fábricas, una en Estados Unidos y otra en China.
Se sabe que el 80% de los productos de la empresa son fabricados en Estados Unidos y el 20% son
fabricados en China. Además, se sabe que el 2% de los productos fabricados en Estados Unidos
al azar y se encuentra que es defectuoso. ¿cuál es la probabilidad de que haya sido fabricado en
China?
Solución
𝑃(𝐶) ∗ 𝑃(𝐷|𝐶)
𝑃(𝐶|𝐷) =
𝑃(𝐷)
Donde P (D|C) es la posibilidad de que el producto fabricado en China sea defectuoso, P(C)
es la probabilidad de que el producto seleccionado al azar haya sido fabricado en China, y P(D) es
la probabilidad de que el producto seleccionado al azar sea defectuoso. Podemos calcular estas
P (D|C) = 0.05
P (C) = 0.2
P (D) = P (D|D) P(C) + P(D|U) P(U) = 0.05 * O.2 + 0.02 * 0.8 = 0.024
0.05∗0.2
𝑃(𝐴|𝐷) =
0.024
=0.42
Por lo tanto, la probabilidad de que el producto seleccionado al azar haya sido fabricado en
Datos probabilísticos
espacio muestral; dicho valor esta entre 0 y 1. Para calcularlo se divide el número de casos
Ejemplo: Supongamos en una caja metemos 7 bolas naranjas, 4 bolas verdes y 9 bolas
Solución
El número de eventos favorables son 7, pero como tenemos bolas de diferente color también
7
P (bola naranja) = 7+4+9 = 0,35
Respuesta: Por lo tanto, hay un 35% de probabilidad de sacar al azar una bola naranja de la
caja.
Maestreo sistemático: Se busca enlistar toda una población. Primero tenemos establecer
un intervalo definido a criterio del investigador obviamente tendrá encuentra diferentes criterios
Solución
44
Para ello, dividimos el número total de la población entre 100 fragmentos aleatorios de 10
individuos (muestra).
100
P(m) = = 10
10
Respuesta: La muestra estará dada por los individuos (6, 16, 26, 36, 46, 56, 66, 76, 86, 96,
comporta una característica o variable en una población a través de hacer evidente el cambio de
Ejemplo: En una barriada viven 140 adultos, 91 jóvenes y 84 niños. Se quiere entrevistar a
45 personas de la aldea mediante muestreo estratificado. ¿De Cuántos adultos, jóvenes y niños
Solución
Muestra x y z 45
que se divide una población por grupos, que tienen alto nivel de representatividad de la totalidad,
para después analizar todos o algunos de los elementos de uno o de varios grupos. Los
conglomerados o grupos deben estar previamente divididos, por ejemplo, pueden ser vecindarios,
Solución
Se seleccionan todas las máquinas de las fábricas de una ciudad como población objetivo. Cada
Datos no Probabilísticos:
población.
Muestreo por criterio: Los participantes son seleccionados según un conjunto específico de
criterios establecidos por el investigador, como la edad, el género o la ocupación. Esto puede limitar
la representatividad de la muestra.
46
diferentes subgrupos de la población. Por ejemplo, si se desea obtener una muestra equilibrada por
su probabilidad de selección.
Muestreo por bola de nieve: Los participantes iniciales son seleccionados por
conveniencia y luego se les pide que refieran a otros participantes que cumplan con los criterios de
consumo de café en una determinada ciudad. Debido a limitaciones de tiempo y recursos, decide
en una cafetería popular de la ciudad donde él suele ir a menudo. El objetivo es obtener información
-Definición del objetivo del estudio: El investigador quiere conocer los hábitos de consumo de
café en la ciudad.
clientes que están consumiendo café. Al seleccionarlos, les pide que respondan a un breve
-Análisis de datos: Después de recopilar los cuestionarios, el investigador analiza las respuestas
y tabula la información sobre los diferentes tipos de café que consumen los clientes.
consumo de café en la ciudad basada en los datos recopilados en la cafetería. Sin embargo, es
importante tener en cuenta que los resultados pueden no ser representativos de toda la población
ubicación.
Es esencial tener en cuenta que este ejercicio ilustra un muestreo por conveniencia, el cual
satisfacción de los empleados de una empresa en relación con su ambiente laboral. El investigador
decide utilizar el muestreo por criterio y establece los siguientes criterios para seleccionar a los
participantes de la muestra:
medio).
-Definición del objetivo del estudio: El investigador busca obtener información sobre el nivel de
-Identificación de la población: El investigador identifica que la población objetivo son todos los
empleados de la empresa.
48
-Tamaño de la muestra: El investigador decide que la muestra estará compuesta por 100
-Tamaño de muestra del estrato = (Tamaño del estrato / Tamaño de la población) x Tamaño de
la muestra total
Por ejemplo, si hay 500 empleados en total y el tamaño de la muestra total es de 100, el
100
▪ Empleados directivos: 500 ∗ 100 = 20 empleados.
100
▪ Empleados del departamento de finanzas: 500 ∗ 100 = 20 empleados.
cada estrato utilizando una lista de empleados que cumplan con los criterios establecidos.
-Análisis de datos: Después de recopilar los cuestionarios, el investigador analiza las respuestas
y realiza un análisis estadístico para obtener conclusiones sobre el nivel de satisfacción de los
Muestreo por cuotas: Un experto desea realizar un estudio sobre las preferencias de
compra de teléfonos móviles en una determinada ciudad. El investigador decide utilizar el muestreo
por cuotas y establece los siguientes criterios para seleccionar a los participantes de la muestra:
▪ Edad: 25% jóvenes (18-25 años), 50% adultos (26-45 años), 25% mayores (46 años en
49
adelante).
-Definición del objetivo del estudio: El investigador busca obtener información sobre las
-Tamaño de la muestra: El investigador decide que la muestra estará compuesta por 200
muestra total. Por ejemplo, si la población tiene 500.000 habitantes y el tamaño de la muestra total
cuota utilizando métodos adecuados, como listas de contactos o encuestas en línea, asegurándose
respuestas y realiza un análisis estadístico para obtener conclusiones sobre las preferencias
Muestreo por bola de nieve: Un experto desea realizar un estudio sobre las experiencias
de viaje de personas que han visitado un destino turístico específico. El investigador decide utilizar
visitado el destino turístico y que conoce personalmente como participantes iniciales. Estas
para recopilar información sobre sus experiencias de viaje y solicita recomendaciones de otras
-Contacto con los referidos: Los participantes iniciales proporcionan los contactos de otras
personas que han visitado el destino turístico. El investigador se pone en contacto con estos
-Repetición del proceso: El investigador repite los pasos 3 y 4 varias veces, siguiendo las
etapa.
hasta que se alcanza un nivel de saturación de datos y se considera que se ha obtenido una
-Análisis de datos: El investigador analiza las entrevistas y los datos recopilados, identificando
patrones, temas comunes y conclusiones sobre las experiencias de viaje en el destino turístico.
Ejercicio 1
percepción de los pobladores si están de acuerdo o no, sobre realizar gran fiesta patronal después
de 3 años en pare por la pandemia del COVID-19. Con un 96% de confianza, calcular:
población
𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛=
𝑑2
personas.
𝑁 ∗ 𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛= 2
𝑑 ∗ (𝑁 − 1) + 𝑍 2 ∗ 𝑝 ∗ 𝑞
52
16871 ∗ (2.05)2 * 0.5* 0.5 17,725.0943
𝑛= 2 2
= = 411
(0.05) ∗ (16871 − 1) + (2.05) ∗ 0.5 ∗ 0.5 43.225625
Respuesta: Desconocida el tamaño de la población, pero si la percepción se tendrá que optar por
Ejercicio 2
Se desea calcular el tamaño de muestra óptimo en el distrito de Juan Guerra para conocer
el gasto promedio que invierten en educación, de la muestra piloto se obtuvo una desviación
𝑍2 ∗ 𝜎2
𝑛=
𝑑2
𝑁 ∗ 𝑍2 ∗ 𝜎2
𝑛=
𝑑2 ∗ (𝑁 − 1) + (𝑍 2 ∗ 𝜎 2 )
personas.
Coeficiente de Pearson
En primer momento tenemos que gráfica los valores de modo que se pueda verificar la
forma de correlación.
80
70
60
50
Edad
40
30
20
0 5 10 15 20 25 30 35 40
Tiempo de servicio
En este caso, en nuestro grafíco, los puntos están muy esparcidos por lo que podemos
Análisis de datos
Estadísticas de la regresión
Coeficiente de correlación R -0.030855073
Coeficiente de determinación R^2 0.1%
R^2 ajustado -0.002803784
Error típico 12.74927238
Observaciones 268
Según los resultados obtenidos, existe una correlación nula entre las variables “Tiempo
de servicio” y “edad”. Aproximadamente menos del 0.1% del tiempo de servicio influye en la
edad.
Análisis de varianza
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 1 41.20209139 41.20209139 0.25348278 0.615050023
Residuos 266 43236.6897 162.5439462
Total 267 43277.89179
Como el valor crítico de F es mayor que 0.05, podemos afirmar que no existe relación
Prueba de Hipótesis
En una investigación se desea averiguar si hay una diferencia significativa en los salarios
promedio entre dos ciudades (A y B) en términos de ingresos mensuales. Queremos realizar una
Hipótesis nula (H₀): No hay diferencia significativa en los salarios promedio entre las dos
ciudades. μ₁ = μ₂.
Hipótesis alternativa (H₁): Hay una diferencia significativa en los salarios promedio entre
H0: μ₁ = μ₂
H1: μ₁ ≠ μ₂
Nivel de significación:
Utilizamos la fórmula del estadístico de prueba z para dos medias poblacionales con
Como H1: μ₁ ≠ μ₂ se trata de una prueba de dos colas, siendo la zona de aceptación la
siguiente:
Estadístico de prueba:
Decisión:
rechazo de H0. Por lo tanto, se concluye que los datos proporcionan suficiente evidencia para
rechazar H0.
𝛼 𝛼
= 0.025 = 0.025
2 2
1-𝛼 = 0.95
Se puede concluir que la evidencia aportada por la muestra, apoya como hipótesis que
hay una diferencia significativa en los salarios promedio entre las dos ciudades.