Está en la página 1de 56

1

UNIVERSIDAD NACIONAL DE SAN MARTÍN

FACULTAD DE CIENCIAS ECONÓMICAS

ESCUELA PROFESIONAL DE ECONOMIA

COMPENDIO ESTADISTICO

AUTORES:

Ariana Aranxa Arévalo Aróstegui

Jhonn Lee Azalde Chung

Alexander Santa Cruz Padilla

Jorge Andres Sueldo Yanovich

Aracely Vasquez Rengifo

CURSO:

Estadística General

DOCENTE:

Wilson Torres Delgado

Tarapoto-Perú

2023
3

Introducción

En la actualidad la ciencia estadística ha llegado a abarcar mayores dimensiones en su

ámbito de estudio partiendo desde la conjetura inicial de recolección de datos hasta la interpretación

de la mismas. En el transcurso del trabajo usted irá reconociendo de manera resolutiva los distintos

temas que se abordaron en el lapso del ciclo correspondiente a la asignatura de Estadística General.

Como punto de partida los integrantes por sugerencia del docente encargado hicimos un

árbol genealógico por cada uno, con el fin de comprender un postulado base estadístico donde se

referencia a la proporcionalidad, esto como un pequeño estímulo de bienvenida.

Cabe recalcar que los trabajos se llevaron a cabo por semana académicas y en cada una de

estas se plantearon ejercicios para mayor profundización y práctica de los integrantes. Temas como

medidas estadísticas, simbología distribuciones, etc., se encuentran plasmados en el compendio. Al

aplicar esta metodología se busca lograr la curiosidad de del lector que desea y tiene ánimos de

adentrarse en el ambiente de esta ciencia.

Otro punto importante de mencionar es que las resoluciones fueron insertadas en la

herramienta de Excel que posteriormente se transmitieron al formato Word con la sugestión de

poder desarrollarlo en dicho formato. La importancia del trabajo radica en que nosotros como

estudiantes hemos realizado los distintos ejercicios con mucha investigación en son de prudencia

de la veracidad.

Está comprendida en tres unidades de las cuales las primeras dos fueron llevadas en cinco

semanas cada una con el fin de desglosar los temas y vayan desde los meneos complicado a lo de

mayor complejidad. Cada unidad académica tuvo una evaluación del docente y así se cumpla con

el pronóstico de cada unida.

Por último, pero no menos importante resaltamos la forma estructural y consecuente de

toda la organización informativa que presenta este formato, pues se considera necesario que, para
4

poder llegar al lector, se debe inclinar los textos académico de forma interactiva para de este modo

se estimule. Sin nada más que agregar le presentamos el compendio final del área en cuestión para

su debida verificación y evaluación.


5

Índice
Introducción ..................................................................................................................................... 3

Árbol Genealógico por Integrante .................................................................................................... 7

Unidad I: Generalidades, Recopilación, Presentación y Organización de Datos. .......................... 11

Importancia de la Estadística...................................................................................................... 11

Reseña de Autores y su Aporte a la Estadística .......................................................................... 12

Tipos de Variables: Cuantitativas y Cualitativas ........................................................................ 18

Variables Cuantitativas: .......................................................................................................... 18

Variables Cualitativas: ............................................................................................................ 20

Principales Técnicas de Recolección de Datos .......................................................................... 21

Entrevista ................................................................................................................................ 21

Grupos focales ........................................................................................................................ 22

Análisis de documentos .......................................................................................................... 22

Encuestas ................................................................................................................................ 22

Experimentos .......................................................................................................................... 22

Tipos De Variables en Tablas de Frecuencia y Gráficos Estadísticos ........................................ 23

Variable Cualitativa Nominal: ................................................................................................ 23

Variable Cualitativa Ordinal ................................................................................................... 24

Variable Cuantitativa Discreta ................................................................................................ 25

Variable Cuantitativa Continua .............................................................................................. 26

Unidad II: Medidas Estadísticas y Teorema de Bayes ................................................................... 27

Medidas de Tendencia Central ................................................................................................... 27

La media: ................................................................................................................................ 27

La mediana: ............................................................................................................................ 27

La moda: ................................................................................................................................. 28

Medidas de Dispersión ............................................................................................................... 28


6

La Varianza ............................................................................................................................. 28

Desviación estándar o típica ................................................................................................... 29

Error típico ............................................................................................................................. 29

Medidas de Posición: ................................................................................................................. 29

Coeficiente de Asimetría ........................................................................................................ 29

Coeficiente de Curtosis .......................................................................................................... 30

Aplicación de las medidas estadísticas....................................................................................... 31

Variable cuantitativa: Edad..................................................................................................... 31

Variable cuantitativa: Tiempo de servicio .............................................................................. 35

Teorema de Bayes ...................................................................................................................... 39

Definición ............................................................................................................................... 39

Ejercicios Propuestos ............................................................................................................. 40

Unidad III: Muestreo Probabilístico, Coeficiente de Pearson y Prueba de Hipótesis .................... 43

Datos probabilísticos .................................................................................................................. 43

Datos no Probabilísticos: ............................................................................................................ 45

Ejercicios de Datos no Probabilísticos: .................................................................................. 46

Tamaño de Muestra Para Datos Cuantitativos ........................................................................... 51

Tamaño de Muestra Para Datos Cualitativos ............................................................................. 52

Coeficiente de Pearson ............................................................................................................... 53

Prueba de Hipótesis .................................................................................................................... 54

Prueba de hipótesis para dos medias poblaciones. ................................................................. 54


7

Índice de tablas

Tabla 1. N° de trabajadores según estado civil .............................................................................. 23

Tabla 2. Nº de trabajadores según cargo. ....................................................................................... 24

Tabla 3. N° de trabajadores según intervalo de edad..................................................................... 25

Tabla 4. N° de trabajadores según intervalo de año de ingreso. .................................................... 26

Tabla 5. Nº de trabajadores por intervalo de edad. ........................................................................ 31

Tabla 6. Nº de trabajadores por intervalo de tiempo de servicio. .................................................. 35

Índice de gráficos

Gráfico 1. N° de trabajadores según estado civil. ......................................................................... 23

Gráfico 2. Nº del personal según el cargo desempeñado. ............................................................. 24

Gráfico 3. Nº de personal por intervalo de edad. .......................................................................... 25

Gráfico 4. N° de trabajadores según intervalo de año de ingreso. ................................................ 26

Gráfico 5. Coeficiente de asimetría de la variable edad. ............................................................... 33

Gráfico 6. Curtosis de la variable edad. ........................................................................................ 34

Gráfico 7. Coeficiente de asimetría de la variable tiempo de servicio. ......................................... 37

Gráfico 8. Curtosis de la variable tiempo de servicio. .................................................................. 38

Gráfico 9. Grado de correlación entre la edad y el tiempo de servicio. ........................................ 53

Gráfico 10. Decisión de la prueba de hipótesis. ............................................................................ 56


8

Árbol Genealógico por Integrante


9
10
11

Unidad I: Generalidades, Recopilación, Presentación y Organización de Datos.

Importancia de la Estadística

La estadística resulta fundamental para conocer el comportamiento de ciertos eventos, por

lo que ha adquirido un papel clave en la investigación. Se usa como un valioso auxiliar y en los

diferentes campos del conocimiento y en las variadas ciencias. Es un lenguaje que permite

comunicar información basada en datos cuantitativos y cualitativos.

Es tan importante que casi no existe actividad humana en que no esté involucrada la

Estadística. Las decisiones más importantes de nuestra vida se toman con base en la aplicación de

la Estadística.

Ejemplos:

La estadística es de gran importancia en la investigación científica debido a que:

-Permite una descripción más exacta.

-Permite resumir los resultados de manera significativa y cómoda.

-Nos permite deducir conclusiones generales.

En la estadística se abarca la recolección, presentación y caracterización de información

para ayudar tanto en el análisis e interpretación de datos como en el proceso de la toma de

decisiones. La estadística es parte esencial de la forma profesional, es hasta cierto punto una parte

necesaria para toda profesión.


12

Reseña de Autores y su Aporte a la Estadística

Ronald A. Fisher:

Ronald A. Fisher (1890-1962) fue un estadístico y biólogo británico, considerado uno de

los padres fundadores de la estadística moderna. Su trabajo en estadística y genética revolucionó

ambos campos y estableció muchos de los conceptos y técnicas que se utilizan en la investigación

estadística y biológica en la actualidad.

Fisher es conocido por su trabajo en la inferencia estadística, especialmente por la técnica

de la máxima verosimilitud. También fue el creador de la prueba de hipótesis y la estadística de

significación, técnicas que se utilizan para determinar si un resultado de investigación es

significativo o no. Además, Fisher desarrolló la teoría de la varianza y la teoría de la estimación de

máxima verosimilitud.

Fisher también hizo importantes contribuciones a la genética, y es considerado uno de los

fundadores de la genética estadística. Su trabajo en genética incluyó el desarrollo del análisis de

varianza y la creación de la prueba F, una técnica utilizada para comparar las varianzas de dos

poblaciones.

Aporte:

1. Diseño experimental: Fisher desarrolló métodos estadísticos para diseñar experimentos

eficientes y precisos, que permiten identificar la relación entre una variable de respuesta y una o

varias variables explicativas.

2. Análisis de varianza: Fisher desarrolló el análisis de varianza, una técnica estadística que

permite evaluar la variación entre grupos y dentro de grupos, lo que resulta útil para comparar

tratamientos y evaluar la importancia de las variables explicativas en un modelo.

3. Estimación y prueba de hipótesis: Fisher desarrolló técnicas estadísticas para estimar

parámetros de población y para probar hipótesis acerca de la media y la varianza de una población.
13

4. Distribución de Fisher: Fisher también desarrolló la distribución de Fisher, una

distribución de probabilidad que es ampliamente utilizada en la inferencia estadística y en el

análisis de varianza.

Gottfried Achenwall:

Gottfried Achenwall (1719-1772) fue un historiador y estadístico alemán que hizo

importantes contribuciones al desarrollo de la estadística como una disciplina científica. Es

conocido como uno de los primeros estadísticos modernos y su trabajo fue fundamental para el

desarrollo de la estadística como una herramienta para el análisis de datos.

Achenwall estableció el primer departamento de estadística en la Universidad de Gotinga

en Alemania y fue el autor de "Estadística de los Estados Alemanes", que fue uno de los primeros

trabajos sobre estadística publicados en Europa. En este trabajo, Achenwall definió la estadística

como la ciencia de recolectar y analizar datos para tomar decisiones informadas. Además,

Achenwall estableció los fundamentos para la recolección y análisis de datos estadísticos,

incluyendo el uso de tablas y gráficos para presentar los datos de manera clara y concisa.

Achenwall también hizo importantes contribuciones a la teoría de la probabilidad, en

particular en la teoría de los errores de medición. Achenwall introdujo el concepto de "error

probable" y desarrolló una técnica para estimar la incertidumbre asociada con una medición.

Aporte:

El aporte principal de Gottfried Achenwall a la estadística fue su trabajo pionero en el

desarrollo de la disciplina como una herramienta para el análisis de datos y la toma de decisiones

informadas. Él estableció los fundamentos para la recolección y análisis de datos estadísticos,

incluyendo el uso de tablas y gráficos para presentar los datos de manera clara y concisa. También

definió la estadística como una ciencia que se ocupa de la recolección, análisis e interpretación de

datos.
14

Achenwall fue el autor de "Estadística de los Estados Alemanes", uno de los primeros

trabajos importantes sobre estadística publicados en Europa. En este trabajo, Achenwall desarrolló

técnicas para la recolección y análisis de datos, y estableció el concepto de que los datos podrían

utilizarse para tomar decisiones informadas en una variedad de campos.

Además de sus contribuciones a la recolección y análisis de datos, Achenwall también hizo

importantes contribuciones a la teoría de la probabilidad, particularmente en la teoría de los errores

de medición. Introdujo el concepto de "error probable" y desarrolló técnicas para estimar la

incertidumbre asociada con una medición.

William Petty:

William Petty (1623-1687) fue un economista, filósofo y estadístico inglés que realizó

importantes contribuciones al campo de la estadística. William Petty (1623-1687) fue un

economista, estadístico y filósofo irlandés que realizó importantes contribuciones en el campo de

la economía y la estadística. A continuación, se detallan algunos aspectos clave de su biografía.

Nacido en Hampshire, Inglaterra, Petty fue el hijo de un sastre y pasó gran parte de su

infancia en Francia, donde su padre trabajaba para el ejército inglés. A pesar de no haber recibido

una educación formal, Petty demostró un gran interés por la ciencia y las matemáticas desde una

edad temprana. En 1643, Petty se unió al ejército parlamentario durante la Guerra Civil Inglesa y

sirvió como cirujano y cartógrafo. Después de la guerra, Petty estudió medicina en la Universidad

de Oxford, donde se graduó en 1651.

Después de graduarse, Petty se trasladó a Irlanda, donde se convirtió en médico del ejército

inglés y comenzó a interesarse por la economía y la estadística. En 1660, Petty fue nombrado

profesor de anatomía y cirugía en la Universidad de Oxford, pero renunció al año siguiente para

regresar a Irlanda. En 1662, Petty fue nombrado miembro del Parlamento irlandés y se convirtió

en uno de los principales asesores económicos del rey Carlos II. Durante este período, Petty realizó
15

una serie de estudios demográficos y económicos sobre Irlanda, que más tarde se publicaron en su

obra "Aritmética política" (1665).

En "Aritmética política ", Petty utilizó datos sobre la población, la producción y el comercio

de Inglaterra e Irlanda para realizar estudios demográficos y económicos. También desarrolló

técnicas estadísticas para la estimación de la población a partir de los registros de nacimientos y

defunciones. En 1672, Petty fue nombrado miembro de la Royal Society y se convirtió en uno de

los principales defensores del método científico en la economía y la estadística. En 1682, fue

nombrado presidente de la Royal Society y mantuvo este cargo hasta su muerte en 1687.

Además, Petty fue uno de los primeros en utilizar la estadística para estudiar la economía.

Realizó estudios demográficos y económicos utilizando datos cuantitativos para medir la

población, la producción y la riqueza de Inglaterra. Estos estudios lo llevaron a desarrollar técnicas

estadísticas como la estimación de la población a partir de los registros de nacimientos y

defunciones.

Aporte:

Una de sus principales aportaciones fue la introducción del concepto de estadística como

una disciplina cuantitativa. En su obra "Aritmética política" (1662), Petty argumentaba que la

recolección de datos cuantitativos era esencial para la toma de decisiones políticas y económicas

informadas.

Además, Petty fue uno de los primeros en utilizar la estadística para estudiar la economía.

Realizó estudios demográficos y económicos utilizando datos cuantitativos para medir la

población, la producción y la riqueza de Inglaterra. Estos estudios lo llevaron a desarrollar técnicas

estadísticas como la estimación de la población a partir de los registros de nacimientos y

defunciones.
16

1. Contribuciones al análisis estadístico: Petty fue uno de los primeros en realizar estudios

cuantitativos de la economía. En su obra " Aritmética política ", utilizó datos sobre la población, la

producción y el comercio de Inglaterra para realizar estudios demográficos y económicos. También

desarrolló técnicas estadísticas para la estimación de la población a partir de los registros de

nacimientos y defunciones.

2. Contribuciones al desarrollo de la teoría estadística: Petty hizo importantes

contribuciones al desarrollo de la teoría estadística. En su obra "Treatise of Taxes and

Contributions", propuso la idea de que la distribución de la riqueza sigue una distribución normal,

lo que sentó las bases para la teoría de la distribución de probabilidad.

3. Contribuciones a la visualización de datos: Petty fue uno de los primeros en utilizar

gráficos y tablas para representar datos cuantitativos. En su obra " Aritmética política ", incluyó

varios gráficos y tablas para representar los datos demográficos y económicos de Inglaterra.

4. Contribuciones al análisis económico: Petty es considerado uno de los fundadores de la

economía política. En su obra "Treatise of Taxes and Contributions", analizó la distribución de la

riqueza en Inglaterra y propuso una serie de políticas fiscales para reducir la pobreza y aumentar

la riqueza del país.

Karl Pearson

Karl Pearson (1857-1936) fue un matemático británico que realizó importantes

contribuciones en el campo de la estadística y es considerado uno de los fundadores de la estadística

moderna. A continuación, se detallan algunos de sus aportes más importantes:

Nacido en Londres, Pearson, fue educado en casa por su padre, quien era un hombre muy

culto. A los 16 años, ingresó a la Universidad de Cambridge, donde estudió matemáticas y filosofía.

Después de graduarse, se trasladó a Alemania, donde estudió bajo la tutela de Augustus De Morgan

y Francis Galton.
17

En 1884, Pearson regresó a Inglaterra y se convirtió en profesor de matemáticas en la

Universidad de Cambridge. Durante este período, comenzó a interesarse en la estadística y la

biología, y en 1892 publicó su primera obra importante, "The Grammar of Science", que se

convirtió en un clásico de la literatura científica.

En 1894, Pearson fundó el Departamento de Estadística en la Universidad de Londres,

convirtiéndose en el primer profesor de estadística en Gran Bretaña. En este departamento, Pearson

comenzó a realizar investigaciones en estadística y genética, lo que lo llevó a convertirse en uno

de los fundadores de la genética estadística.

En 1900, Pearson fundó el "Biometrika", una revista dedicada a la estadística aplicada y la

biología, que se convirtió en una de las publicaciones más influyentes en su campo. También

comenzó a desarrollar técnicas estadísticas para el análisis de datos biológicos, incluyendo la

correlación y la regresión.

En 1901, Pearson fue nombrado miembro de la Royal Society y se convirtió en uno de los

principales defensores del método científico en la estadística y la biología. Durante este período,

también comenzó a interesarse por la eugenesia, una idea controvertida en su época que propugnaba

la mejora de la raza humana mediante la selección genética.

Durante la Primera Guerra Mundial, Pearson se desempeñó como oficial médico en el

ejército británico, donde utilizó sus habilidades estadísticas para analizar los datos de mortalidad y

enfermedad de los soldados. Después de la guerra, continuó trabajando en estadística y genética, y

en 1928 publicó una obra importante titulada "The Grammar of Science".

Aporte:

1. Coeficiente de correlación: Pearson desarrolló el coeficiente de correlación, que mide la

fuerza y dirección de la relación lineal entre dos variables. Este coeficiente se utiliza ampliamente
18

en estadística y es fundamental en áreas como la investigación de mercados, la psicología y la

epidemiología.

2. Chi-cuadrado: Pearson desarrolló el test de chi-cuadrado, una técnica estadística utilizada

para determinar si hay una relación entre dos variables categóricas. Esta técnica es ampliamente

utilizada en áreas como la genética, la psicología y la sociología.

3. Distribución normal: Pearson hizo importantes contribuciones al estudio de la

distribución normal. En particular, demostró que muchos fenómenos naturales y sociales siguen

una distribución normal y desarrolló técnicas estadísticas para modelar estos fenómenos.

4. Regresión lineal: Pearson también contribuyó al desarrollo de la regresión lineal, que se

utiliza para modelar la relación entre dos variables continuas. Esta técnica se utiliza ampliamente

en áreas como la econometría, la ingeniería y la ciencia de los materiales.

5. Análisis de varianza: Pearson desarrolló el análisis de varianza, una técnica estadística

utilizada para comparar la media de tres o más grupos. Esta técnica se utiliza en áreas como la

agricultura, la biología y la psicología.

6. Método de momentos: Pearson desarrolló el método de momentos, una técnica estadística

utilizada para estimar los parámetros de una distribución. Este método se utiliza en áreas como la

ingeniería, la física y la econometría.

Tipos de Variables: Cuantitativas y Cualitativas

Variables Cuantitativas:

Discreta

Es una variable que no puede tomar algunos valores dentro de un mínimo conjunto

numerable, quiere decir, no acepta cualquier valor.

Ejemplos:
19

- La edad de los egresados de la carrera de economía.

- La cantidad de ventas realizadas por cada empleado de una tienda.

- La cantidad de animales que hay en las distintas reservas ecológicas de un país.

- La cantidad de ventas realizadas por cada empleado de una tienda.

- La cantidad de anotaciones que hacen los jugadores de baloncesto.

- La cantidad de panes que se fabrican cada día en una panadería.

- La cantidad de propiedades que posee cada ciudadano de un país.

- La cantidad de clientes de una compañía que brinda el servicio de Internet.

- La cantidad de prendas que aparecen en un desfile de moda.

- La cantidad de premios que tiene un actor.

Continua

Son aquellas características que son medidas dentro de un rango continuo infinito de

valores numéricos y se registran con números reales.

Ejemplos:

- La velocidad del viento.

- El tiempo que duran las óperas.

- La temperatura de las comidas.

- La cantidad de energía eléctrica que consumen los electrodomésticos.

- La cantidad (en kilogramos) de bronce que se utiliza para fabricar monumentos.

- El peso de las silobolsas de un campo.

- La presión atmosférica.

- La cantidad de milímetros de agua que caen con las lluvias.

- El valor de las acciones financieras.

- La cantidad (en kilogramos) de basura que se recicle


20

Variables Cualitativas:

Nominal

Una variable puede ser tratada como nominal cuando sus valores representan categorías

que no obedecen a una clasificación intrínseca. Es decir, no cuenta con diferencia exacta de datos.

ejemplos:

Ejemplos:

- Población Económicamente activa (según su edad, sexo, profesión).

- La población venezolana que labora en el interior del país según su sexo (varones o

mujeres).

- Empresas exportadoras de productos agrícolas en el Perú (arroz, plátano, yuca, …).

- Tipo de cambio en monedas extrajeras (euro, dólar, …).

- Aparatos electrónicos importados del continente asiático (teléfonos, computadoras, …).

- Consumo de licores en el Perú (Ron Cartavio, Red Label, Pisco …)

- Departamentos altamente turísticos (San Martin, La libertad, […]. Flora o fauna).

- Personas profesionales desempleadas (doctores, profesores, ingenieros…)

- Población infantil que labora (niños, niñas, intervalo de edad).

- Extracción de metales en las minas del Perú (oro, plata, cobre…).

Ordinal

Expresa con palabras una cualidad de naturaleza ordenable. Es decir, una variable ordinal

es una variable que puede ser ordenada con jerarquía.

Ejemplos:

- Nivel de renta (baja, media, alta).

- Ministerio de economía (ministro, secretario general de estado económico, secretaria

general de tesorería, …).


21

- Decano de la facultad de ciencias económicas (decano, director, …).

- Grado de satisfacción en una empresa (muy satisfechos, regular, insatisfechos).

- Orden jerárquico en una empresa (gerente general, administrador, secretaria general,

…).

- Aprobación de los servicios bancarios en los bancos (1;2;3;4;5;6;7;8;9;10).

- Frecuencia del tipo de inflación (saludable, solapada, galopante, hiperinflación).

- Nivel socioeconómico (no pobre, podre, pobre extremo).

- División de la economía (macroeconomía a microeconomía).

- Valor de las monedas de Sudamérica en referencia al dólar (sol peruano, peso mexicano,

…).

Principales Técnicas de Recolección de Datos

Las técnicas de recolección de datos se refieren a los métodos utilizados para recoger y

analizar diferentes formas de datos. Las técnicas habituales de recogida de datos incluyen el

examen de documentos relacionados con un tema, así como la realización de entrevistas y

observaciones.

Entrevista

La entrevista es, en esencia, una conversación bien planificada. En ella, el investigador

plantea una serie de preguntas o temas de debate a una o varias personas, con el fin de obtener

información específica. Puede realizarse personalmente, por teléfono o de manera virtual. Sin

embargo, en algunos casos es importante la interacción personal con el entrevistado, para poder

tomar nota de la información que brinda la comunicación no verbal. Los instrumentos utilizados

en las entrevistas pueden incluir guiones de entrevistas, grabadoras de audio y notas de campo.
22

Grupos focales

Los grupos focales son una técnica de recolección de datos que implican reunir a un grupo

de personas para discutir un tema o problema específico. Los instrumentos utilizados en los grupos

focales pueden incluir guiones de discusión, grabadoras de audio y notas de campo.

Análisis de documentos

El análisis de documentos es una técnica de recolección de datos que implica examinar y

analizar documentos escritos, como informes, políticas y registros. Los instrumentos utilizados en

el análisis de documentos pueden incluir listas de verificación, hojas de análisis y software de

análisis de texto.

Encuestas

Las encuestas son una técnica comúnmente utilizada para obtener datos de una muestra de

población. Los instrumentos utilizados en las encuestas pueden incluir cuestionarios, entrevistas

telefónicas, entrevistas en persona y encuestas en línea.

Experimentos

Los experimentos son una técnica de recolección de datos que implican manipular una o

más variables y observar los efectos en una o más variables dependientes. Los instrumentos

utilizados en los experimentos pueden incluir equipos de laboratorio, cuestionarios y hojas de

observación.
23

Tipos De Variables en Tablas de Frecuencia y Gráficos Estadísticos

Variable Cualitativa Nominal:

TABLA DE FRECUENCIA 1
Tabla 1. N° de trabajadores según estado civil
Estado Civil fi Fi hi Hi hi% Hi%
Casado 75 75 0.28 0.28 28% 28%
Concubino 16 91 0.06 0.34 6% 34%
Conviviente 26 117 0.10 0.44 10% 44%
Divorciado 5 122 0.02 0.46 2% 46%
Soltero 144 266 0.54 0.99 54% 99%
Viudo 2 268 0.01 1.00 1% 100%
Total general 268 1 100%
Fuente: base de datos, Red asistencial-Tarapoto

Interpretaciones:

-Del total del personal de la red asistencia de Tarapoto, 144 se encuentran en el estado civil

de Solteros.

-Del 100% del personal de la red asistencial de Tarapoto, solo el 28% se encuentran en el

estado civil de Casados.

-Del total del personal de la red asistencial de Tarapoto, 266 son casados, concubinos,

convivientes, divorciados y solteros según su estado civil.

160 144
140
Casado
120
Concubino
100
75 Conviviente
80
Divorciado
60
26 Soltero
40
16
20 5 Viudo
2
0
Casado Conviviente Soltero

Gráfico 1. N° de trabajadores según estado civil.


Fuente: Base de datos, Red asistencial-Tarapoto
24

Variable Cualitativa Ordinal

TABLA DE FRECUENCIA 2
Tabla 2. Nº de trabajadores según cargo.
Cargo fi Fi hi Hi hi% Hi%
Jefe de servicio asistencial 1 1 0.00 0.00 0.4% 0%
Prof. Técnico asistencial 26 27 0.10 0.10 9.7% 10%
Enfermera 140 167 0.52 0.62 52% 62%
Técnico de enfermería II 99 266 0.37 0.99 37% 99%
Aux. de serv. Asistencial 1 267 0.00 1.00 0.4% 100%
Aux de conserva y limpieza 1 268 0.00 1 0.4% 100%
Total general 268 1 100%
Fuente: base de datos, Red asistencial-Tarapoto

Interpretaciones:

-Del total del personal de la Red asistencial de Tarapoto, 140 desempeñan el cargo de

enfermera

-Del 100% del personal de la red asistencial de Tarapoto, solo el 9.7% desempeñan el cargo

de Profesional técnico asistencial

-Del total del personal de la red asistencial de Tarapoto, 167 desempeñan los cargos de jefe

de servicio asistencial, profesional técnico asistencial y enfermera.

52% Jefe de servicio


asistencial
Prof. Técnico asistencial

37% Enfermera

Técnico de enfermería II
10%
Aux. de serv. Asistencial

Aux de conserva y
0% limpieza
1%
0%

Gráfico 2. Nº del personal según el cargo desempeñado.


Fuente: Base de datos, Red asistencial-Tarapoto
25

Variable Cuantitativa Discreta

TABLA DE FRECUENCIA 3
Tabla 3. N° de trabajadores según intervalo de edad.
Edad Y fi Fi hi Hi hi% Hi%
22-29 25.5 36 36 0.13 0.13 13% 13%
30-37 33.5 77 113 0.29 0.42 29% 42%
38-45 41.5 72 185 0.27 0.69 27% 69%
46-53 49.5 27 212 0.10 0.79 10% 79%
54-61 57.5 16 228 0.06 0.85 6% 85%
62-69 65.5 37 265 0.14 0.99 14% 99%
70-77 73.5 3 268 0.01 1.00 1% 100%
Total general 268 1 100%
Fuente: base de datos, Red asistencial-Tarapoto

Interpretaciones:

-Del total del personal de la Red asistencial-Tarapoto, 77 se encuentran en el intervalo de

edad de 30 a 37 años.

-Del 100% del personal de la Red asistencial-Tarapoto, el 27% se encuentran en el intervalo

de edad de 38-45 años.

-Del 100% del personal de la Red asistencial-Tarapoto, sólo el 1% se encuentran en el

intervalo de edad de 70-77 años.

77
80 72

60

36 37
40
27
20
16
3
0
22-29 30-37 38-45 46-53 54-61 62-69 70-77
Edad

Gráfico 3. Nº de personal por intervalo de edad.


Fuente: Base de datos, Red asistencial-Tarapoto
26

Variable Cuantitativa Continua

TABLA DE FRECUENCIA 4
Tabla 4. N° de trabajadores según intervalo de año de ingreso.
Cargo Y fi Fi hi Hi hi% Hi%
1982-1985 1983.5 4 4 0.01 0.01 1% 1%
1986-1989 1987.5 40 44 0.15 0.16 15% 16%
1990-1993 1991.5 2 46 0.01 0.17 1% 17%
1994-1997 1995.5 1 47 0.00 0.18 0% 18%
1998-2001 1999.5 5 52 0.02 0.19 2% 19%
2002-2005 2003.5 6 58 0.02 0.22 2% 22%
2006-2009 2007.5 25 83 0.09 0.31 9% 31%
2010-2013 2011.5 3 86 0.01 0.32 1% 32%
2014-2017 2015.5 8 94 0.03 0.35 3% 35%
2018-2021 2019.5 174 268 0.65 1.00 65% 100%
Total, general 268 1 100%
Fuente: base de datos, Red asistencial-Tarapoto

Interpretaciones:

-Del total del personal de la Red asistencial de Tarapoto, el mayor ingreso del personal se

dio en entre los años 2018-2021 con un total de 174.

-Del total del personal de la Red asistencia de Tarapoto, solo se registró un ingreso, entre

los años 1994-1997.

-Del 100% del personal de la Red asistencial de Tarapoto, se registró un ingreso del 15%

del personal entre los años 1986 a1989.

200
180 174
160
140
120
100
80
60
40 40
20 25
2 1 5 6 3
4 8
0
1982-1985 1986-1989 1990-1993 1994-1997 1998-2001 2002-2005 2006-2009 2010-2013 2014-2017 2018-2021

Gráfico 4. N° de trabajadores según intervalo de año de ingreso.


Fuente: Base de datos, Red asistencial-Tarapoto
27

Unidad II: Medidas Estadísticas y Teorema de Bayes

Medidas de Tendencia Central

Se refieren a una medida estadística que representa un valor típico o central de un conjunto

de datos. Su objetivo es proporcionar una descripción resumida de la distribución de los datos y

determinar un valor representativo que se encuentre cerca del centro de la distribución. Son los

siguientes tipos:

La media:

Es una medida de tendencia central en estadística que representa el valor promedio de un

conjunto de datos. También se conoce como promedio aritmético.

Para calcular la media, se suman todos los valores del conjunto de datos y se dividen entre

el número total de valores. Es decir, la media se obtiene mediante la suma de todos los valores

dividida por la cantidad de valores en el conjunto.

Σfi xi
x̅ =
N
La mediana:

Se define como el valor que divide al conjunto de datos en dos partes iguales, donde la

mitad de los valores se encuentran por encima y la otra mitad por debajo de la mediana.

Para calcular la mediana, primero se ordenan los datos de forma ascendente o descendente.

Si el número de datos es impar, la mediana es el valor que se encuentra en la posición central. Si el

número de datos es par, la mediana se obtiene promediando los dos valores centrales.

𝑁
2
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + ∗ 𝐴𝑖
𝑓𝑖
28

La moda:

Representa el valor o valores que aparecen con mayor frecuencia en un conjunto de datos.

En otras palabras, la moda es el valor que tiene la mayor ocurrencia en un conjunto de datos.

La moda es útil para identificar los valores más comunes o populares en una distribución

de datos. A diferencia de la media y la mediana, la moda no se calcula matemáticamente, sino que

se determina simplemente identificando los valores que se repiten con mayor frecuencia.

fi − fi−1
Mo = Li + ∗ Ai
(fi − fi−1 ) + (fi − fi+1 )

Medidas de Dispersión

Las medidas de dispersión son números que indican si una variable se mueve mucho, poco,

más o menos que otra. La razón de ser de este tipo de medidas es conocer de manera resumida una

característica de la variable estudiada.

En este sentido, deben acompañar a las medidas de tendencia central. Juntas, ofrecen

información de un sólo vistazo que luego podremos utilizar para comparar y, si fuera preciso, tomar

decisiones. Se divide en.

La Varianza

La varianza es una medida de dispersión que representa la variabilidad de una serie de

datos respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado

divididos entre el total de observaciones.

𝛴[(𝑥𝑖 -𝑥̅ )2 𝑓𝑖 ]
𝜎2 =
N
29

Desviación estándar o típica

La desviación estándar es una medida que se usa para cuantificar la variación o dispersión

de un conjunto de datos numéricos. Una desviación estándar baja indica que la mayor parte de los

datos de una muestra tienden a estar agrupados cerca de su promedio, mientras que una desviación

estándar alta indica que los datos se extienden sobre un rango de valores más amplio.

𝛴[(𝑥𝑖 -𝑥̅ )2 𝑓𝑖 ]
𝜎=√
N

Error típico

En estadística, el error típico o estándar sirve para indicar el intervalo de confianza con

respecto a la fiabilidad de los cálculos realizados sobre una muestra; en otras palabras, determina

el grado en que la estimación de una muestra puede diferir con respecto al parámetro de una

población.

σ
Et =
√N

Medidas de Posición:

Es una medida que se usa para cuantificar la variación o dispersión de un conjunto de datos

numéricos. Una desviación estándar baja indica que la mayor parte de los datos de una muestra

tienden a estar agrupados cerca de su promedio, mientras que una desviación estándar alta indica

que los datos extienden sobre un rango de valores más amplio. Se divide en.

Coeficiente de Asimetría

En estadística, el coeficiente de asimetría es un coeficiente que permite calcular la asimetría

de una distribución. Es decir, el coeficiente de asimetría sirve para determinar si una función es
30

asimétrica positiva, asimétrica negativa o simétrica. El coeficiente de asimetría también se puede

llamar índice de asimetría.

Ten en cuenta que la asimetría de una distribución depende de la forma que tiene la curva.

Así pues, los diferentes tipos de asimetría son: Asimetría positiva: la distribución tiene más valores

diferentes a la derecha de la media que a su izquierda. Asimetría negativa: la distribución tiene más

valores diferentes a la izquierda de la media que a su derecha. Simetría: la distribución tiene el

mismo número de valores a la izquierda que a la derecha de la media


Fórmula de Fisher Fórmula de Pearson

Σ{(x − x̅)3 ∗ fi } [(x̅ − Me) ∗ 3]


As = As =
N ∗ σ3 σ

Coeficiente de Curtosis

La curtosis, también llamada apuntamiento, es una medida estadística que indica el grado

de concentración de una distribución alrededor de su media.

Es decir, la curtosis muestra si una distribución es escarpada o achatada. En concreto,

cuanto mayor sea la curtosis de una distribución más escarpada (o apuntada) es.

𝛴{[(𝑥 − 𝑥̅ )4 ∗ 𝑓𝑖 }
Cc = −3
𝑁 ∗ 𝜎4
31

Aplicación de las medidas estadísticas

Variable cuantitativa: Edad

TABLA DE FRECUENCIA 5
Tabla 5. Nº de trabajadores por intervalo de edad.
Edad xi fi Fi xi*fi xi-M
23-32 27.5 67 67 1842.5 -15
33-42 37.5 94 161 3525 -5
43-52 47.5 49 210 2327.5 5
53-62 57.5 22 232 1265 15
63-72 67.5 36 268 2430 25
Total general 268 11390
Fuente: base de datos, Red asistencial-Tarapoto

Análisis de datos

Edad

Media 42.50
Error típico 0.80
Mediana 39.41
Moda 36.38
Desviación estándar 13.12
Varianza 172.01
Curtosis -0.72
Coeficiente de asimetría 0.71
Rango 48.00
Mínimo 23.00
Máximo 71.00
Suma 11393.00
Cuenta 268.00
32

Calculamos los datos:

Media: Mediana: Moda:

𝑵 𝒇𝒊 − 𝒇𝒊−𝟏
𝜮𝒇𝒊 𝒙𝒊 𝟐
− 𝑭𝒊−𝟏
ഥ=
𝒙 𝑴𝒆 = 𝑳𝒊 + ∗ 𝑨𝒊 𝑴𝒐 = 𝑳𝒊 + ∗ 𝑨𝒊
𝑵 𝒇𝒊 (𝒇𝒊 − 𝒇𝒊−𝟏 ) + (𝒇𝒊 − 𝒇𝒊+𝟏 )

11390 268 94 − 67
𝑥̅ = − 67 𝑀𝑜 = 33 + ∗9
268 𝑀𝑒 = 33 + 2 ∗9 (94 − 67) + (94 − 49)
94
𝑥̅ = 42.5 27
134 − 67 𝑀𝑜 = 33 + ∗9
𝑀𝑒 = 33 + ∗9 27 + 45
94
27
603 𝑀𝑜 = 33 + ∗9
𝑀𝑒 = 33 + 72
94
3705 27
𝑀𝑒 = 𝑀𝑜 = 33 +
94 8

𝑀𝑒 = 39.414 291
𝑀𝑜 =
8
𝑀𝑜 =36.375

Desviación estándar: Error típico:


Varianza:
𝝈
ഥ)𝟐 𝒇𝒊 ]
𝜮[(𝒙𝒊 -𝒙 ഥ)𝟐 𝒇𝒊 ]
𝜮[(𝒙𝒊 -𝒙 Et =
𝝈𝟐 = 𝝈=√ √𝑵
𝑵 𝑵
13.115
46100 𝜎 = √172.014 𝐸𝑇 =
𝜎2 = √268
268
𝜎 = 13.115 13.115
𝜎 2 = 172.014 𝐸𝑇 =
16.37
𝐸𝑇 = 0.80
33

Coeficiente de asimetría:

Fórmula de Fisher Fórmula de Pearson

ഥ)𝟑 ∗ 𝒇𝒊 }
𝜮{(𝒙 − 𝒙 [(𝒙ഥ − 𝑴𝒆) ∗ 𝟑]
𝑨𝒔 = 𝑨𝒔 =
𝑵 ∗ 𝝈𝟑 𝝈
[(42.5 − 39.414) ∗ 3]
405000 𝐴𝑠 =
𝐴𝑠 = 13.115
268 ∗ 2,255.822
[3.086 ∗ 3]
405000 𝐴𝑠 =
13.115
𝐴𝑠 =
604560.296 𝐴𝑠 = 0.70
𝐴𝑠 = 0.66

Coeficiente de asimetría
100
90
80
70
60
50
40
30
20
10
0
23-32 33-42 43-52 53-62 63-72

Gráfico 5. Coeficiente de asimetría de la variable edad.


Fuente: Base de datos, Red asistencial-Tarapoto

En el gráfico se muestra que hay un sesgo hacia la derecha, es así que de deduce y demuestra

mediante calculo que es una asimetría positiva por ser mayor a cero y la formación del sesgo.
34
Curtosis:

ഥ)𝟒 ∗ 𝒇𝒊 }
𝜮{[(𝒙 − 𝒙
𝑪𝒄 = −𝟑
𝑵 ∗ 𝝈𝟒

18657500
𝐶𝑐 = −3
268 ∗ 29585.109

18657500 − 23786427.636
𝐶𝑐 =
7928809.212
−5128927.636
𝐶𝑐 =
7149212.55
𝐶𝑐 = −0.717

Curtosis
16 0.035

14 0.03
12
0.025
10
Frecuencia

0.02
8
0.015
6
0.01
4

2 0.005

0 0
23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 59 61 63 65 67 69 71

Gráfico 6. Curtosis de la variable edad.


Fuente: Base de datos, Red asistencial-Tarapoto

El resultado de la curtosis nos da un valor negativo, lo que gráficamente nos indica que la

distribución es más plana que la distribución normal, por lo cual podemos afirmar que es

platicúrtica.
35

Variable cuantitativa: Tiempo de servicio

TABLA DE FRECUENCIA 6
Tabla 6. Nº de trabajadores por intervalo de tiempo de servicio.
Tiempo de servicio xi fi Fi fi*xi xi-M
1-9 5 171 171 855 -6.6828358
10-18 14 30 201 420 2.3171642
19-27 23 33 234 759 11.317164
28-36 32 33 267 1056 20.317164
37-45 41 1 268 41 29.317164
Total general 268 3131
Fuente: base de datos, Red asistencial-Tarapoto

Análisis de datos

Tiempo de servicio

Media 10.64552239
Error típico 0.730546663
Mediana 3
Moda 2
Desviación estándar 11.95956431
Varianza de la muestra 143.0311784
Curtosis -0.372308919
Coeficiente de asimetría 1.059859469
Rango 39
Mínimo 1
Máximo 40
Suma 2853
Cuenta 268
36

Calculamos los datos:

Moda:
Media: Mediana:

𝑵 𝒇𝒊 − 𝒇𝒊−𝟏
𝜮𝒇𝒊 𝒙𝒊 − 𝑭𝒊−𝟏
ഥ=
𝒙 𝑴𝒆 = 𝑳𝒊 + 𝟐 ∗ 𝑨𝒊 𝑴𝒐 = 𝑳𝒊 + ∗ 𝑨𝒊
𝑵 𝒇𝒊 (𝒇𝒊 − 𝒇𝒊−𝟏 ) + (𝒇𝒊 − 𝒇𝒊+𝟏 )
3131 268
𝑥̅ = −0 172 − 0
268 𝑀𝑒 = 1 + 2 ∗8 𝑀𝑜 = 1 + ∗8
171 (172 − 0) + (172 − 30)
𝑥̅ = 11.6828358
172
134 𝑀𝑜 = 1 + ∗8
𝑀𝑒 = 1 + ∗8 172 + 142
171
172
1,072 𝑀𝑜 = 1 + ∗8
𝑀𝑒 = 1 + 314
171
1,376
171 + 1072 𝑀𝑜 = 1 +
𝑀𝑒 = 314
171
𝑀𝑜 = 5.382165605
𝑀𝑒 = 7.23255814

Varianza: Desviación estándar: Error típico:

ഥ)𝟐 𝒇𝒊 ]
𝜮[(𝒙𝒊 -𝒙 𝝈
ഥ)𝟐 𝒇𝒊 ]
𝜮[(𝒙𝒊 -𝒙 Et =
𝟐
𝝈 = 𝝈=√ √𝑵
𝑵 𝑵
19.94502
26506.041 𝐸𝑇 =
𝜎2 = 𝜎 = √98.90315 √268
268
𝜎 = 9.9450 9.94502
2
𝐸𝑇 =
𝜎 = 98.9031 16.37
𝐸𝑇 = 0.6075
37
Coeficiente de asimetría:

Fórmula de Fisher Fórmula de Pearson

ഥ)𝟑 ∗ 𝒇𝒊 }
𝜮{(𝒙 − 𝒙 [(𝒙
ഥ − 𝑴𝒆) ∗ 𝟑]
𝑨𝒔 = 𝑨𝒔 =
𝑵 ∗ 𝝈𝟑 𝝈
299127.8411 [(11.6828 − 7.2325 ) ∗ 3]
𝐴𝑠 = 𝐴𝑠 =
268 ∗ 983.5905 9.9450
299127.8411
As = [4.4503 ∗ 3]
263602.12 𝐴𝑠 =
10.938337
As = 1.1347 13.3509
𝐴𝑠 =
9.9450

Coeficiente de asimetría
180
160
140
120
100
80
60
40
20
0
1-9 10-18 19-27 28-36 37-45

Gráfico 7. Coeficiente de asimetría de la variable tiempo de servicio.


Fuente: Base de datos, Red asistencial-Tarapoto

En el gráfico se muestra que hay un sesgo hacia la derecha, es así que de deduce y demuestra

mediante calculo que es una asimetría positiva por ser mayor a cero y la formación del sesgo.
38
Curtosis:

ഥ)𝟒 ∗ 𝒇𝒊 }
𝜮{[(𝒙 − 𝒙
𝑪𝒄 = −𝟑
𝑵 ∗ 𝝈𝟒
7244974.638
𝐶𝑐 = −3
268 ∗ 9,781.8083
7244974.638
𝐶𝑐 = −3
2621524.6244
𝐶𝑐 = -0.2363507

Curtosis
100 0.035
90
0.03
80
70 0.025
Frecuencia

60
0.02
50
40
0.015

30 0.01
20
0.005
10
0 0
1 2 3 4 5 6 7 9 10 12 13 14 15 16 17 18 20 21 22 23 24 25 26 32 33 35 36 40

Gráfico 8. Curtosis de la variable tiempo de servicio.


Fuente: Base de datos, Red asistencial-Tarapoto

El resultado de la curtosis nos da un valor negativo, lo que gráficamente nos indica que la

distribución es más plana que la distribución normal, por lo cual podemos afirmar que es

platicúrtica.
39

Teorema de Bayes

Definición

El teorema de Bayes, en la teoría de la probabilidad, es una proposición planteada por el

matemático inglés Thomas Bayes (1702-1761) y publicada póstumamente en 1763, que expresa

la probabilidad condicional de un evento aleatorio dado en términos de la distribución de

probabilidad condicional del evento dado y la distribución de probabilidad marginal de solo.

En términos más generales y menos matemáticos, el teorema de Bayes es de enorme

relevancia puesto que vincula la probabilidad de dado con la probabilidad de dado. Es decir, por

ejemplo, que sabiendo la probabilidad de tener un dolor de cabeza dado que se tiene gripe, se podría

saber (si se tiene algún dato más), la probabilidad de tener gripe si se tiene un dolor de cabeza.

Muestra este sencillo ejemplo la alta relevancia del teorema en cuestión para la ciencia en todas

sus ramas, puesto que tiene vinculación íntima con la comprensión de la probabilidad de aspectos

causales dados los efectos observados.

Una de las muchas aplicaciones del teorema de Bayes es la inferencia bayesiana, un

enfoque particular de la inferencia estadística. Cuando se aplican, las probabilidades implicadas en

el teorema pueden tener diferentes interpretaciones de probabilidad. Con la

interpretación probabilidad bayesiana, el teorema expresa cómo un grado de creencia, expresado

como una probabilidad, debería cambiar racionalmente para tener en cuenta la disponibilidad de

pruebas relacionadas. La inferencia bayesiana es fundamental para la estadística bayesiana, siendo

considerada por una autoridad como; "a la teoría de la probabilidad lo que el teorema de

Pitágoras es a la geometría."
40

-Forma operativa “árbol de Bayes”.

Ejercicios Propuestos

Ejercicio 1

Supongamos que una empresa produce dos tipos de productos A y B. Se sabe que el 60%

de los productos que produce son del tipo A y el 40% son del tipo B. Además, se sabe que el 5%

de los productos del tipo A son defectuosos y el 10% de los productos de tipo B son defectuosos.

Si se relaciona un producto al azar y se encuentra que es defectuoso, ¿cuál es la probabilidad que

sea del tipo A?

Solución

Para resolver este problema, podemos utilizar el teorema de Bayes. Sea D, el evento “el

producto seleccionado es defectuoso” y sea A el evento “el producto seleccionado sea del tipo A”.

Entones, lo que se nos pide es calcular la probabilidad condicional P(A/D). Por el teorema de Bayes

tenemos.

𝑃(𝐴) ∗ 𝑃(𝐷|𝐴)
𝑃(𝐴|𝐷) =
𝑃(𝐷)

Donde P (D/A) es la probabilidad de que el producto A sea defectuoso, P(A) es la

probabilidad de que el producto seleccionado al azar sea del tipo A, y P(D) es la probabilidad de
41

que el producto seleccionado al azar sea defectuoso. Podemos calcular estas probabilidades como

sigue:

P(D/A) = 0.05

P(A) = 0.06

P(D) = P(D|A) P(A) + P(D|B) P(B) = 0.05 * 0.06 + 0.01 * 0.04 = 0.07

Sustituyendo en la fórmula del teorema de Bayes obtenemos:

0.05∗0.6
𝑃(𝐴|𝐷) =
0.07
=0.43

Por lo tanto, la probabilidad de que el producto seleccionado al azar sea de tipo A, dado que

es defectuoso, es aproximadamente de 0.43.

Ejercicio 2

Supongamos que una empresa tiene dos fábricas, una en Estados Unidos y otra en China.

Se sabe que el 80% de los productos de la empresa son fabricados en Estados Unidos y el 20% son

fabricados en China. Además, se sabe que el 2% de los productos fabricados en Estados Unidos

son defectuosos y el 5% de los productos fabricados son defectuosos. Si se selecciona un producto

al azar y se encuentra que es defectuoso. ¿cuál es la probabilidad de que haya sido fabricado en

China?

Solución

𝑃(𝐶) ∗ 𝑃(𝐷|𝐶)
𝑃(𝐶|𝐷) =
𝑃(𝐷)

Donde P (D|C) es la posibilidad de que el producto fabricado en China sea defectuoso, P(C)

es la probabilidad de que el producto seleccionado al azar haya sido fabricado en China, y P(D) es

la probabilidad de que el producto seleccionado al azar sea defectuoso. Podemos calcular estas

probabilidades como sigue:


42

P (D|C) = 0.05

P (C) = 0.2

P (D) = P (D|D) P(C) + P(D|U) P(U) = 0.05 * O.2 + 0.02 * 0.8 = 0.024

Sustituyendo en la fórmula de Bayes, obtenemos:

0.05∗0.2
𝑃(𝐴|𝐷) =
0.024
=0.42

Por lo tanto, la probabilidad de que el producto seleccionado al azar haya sido fabricado en

China, dado que es defectuoso, es aproximadamente 0,42.


43

Unidad III: Muestreo Probabilístico, Coeficiente de Pearson y Prueba de Hipótesis

Datos probabilísticos

Muestreo probabilístico simple: Es la probabilidad de que ocurra un evento simple del

espacio muestral; dicho valor esta entre 0 y 1. Para calcularlo se divide el número de casos

favorables entre el número total de posibilidades.

número de casos favorables al evento A


P(A) = número total de casos

Ejemplo: Supongamos en una caja metemos 7 bolas naranjas, 4 bolas verdes y 9 bolas

azules. ¿Cuál es la probabilidad simple de sacar una bola naranja de la caja?

Solución

El número de eventos favorables son 7, pero como tenemos bolas de diferente color también

tendríamos que sumarlas para poder obtener el valor total.

7
P (bola naranja) = 7+4+9 = 0,35

Respuesta: Por lo tanto, hay un 35% de probabilidad de sacar al azar una bola naranja de la

caja.

Maestreo sistemático: Se busca enlistar toda una población. Primero tenemos establecer

un intervalo definido a criterio del investigador obviamente tendrá encuentra diferentes criterios

que elegir, luego elegimos un elemento alzar para la muestra.

Ejemplo: Supongamos que poseemos una población de 1000 individuos y necesitamos

obtener una muestra de 100 de ellos.

Solución
44

Para ello, dividimos el número total de la población entre 100 fragmentos aleatorios de 10

individuos (muestra).

100
P(m) = = 10
10

Luego, seleccionaremos un número al azar entre 1 y 10.

Si el número obtenido al azar es el 6, a partir del individuo 6 de la población se definirá

nuestra muestra. Es decir que, a partir de él se irán complementando intervalos de 10

Respuesta: La muestra estará dada por los individuos (6, 16, 26, 36, 46, 56, 66, 76, 86, 96,

…996). De este modo se conformará la muestra de 100 individuos.

Muestreo estratificado: Es una forma de representación estadística que muestra cómo se

comporta una característica o variable en una población a través de hacer evidente el cambio de

dicha variable en subpoblaciones o estratos en los que se ha dividido.

Ejemplo: En una barriada viven 140 adultos, 91 jóvenes y 84 niños. Se quiere entrevistar a

45 personas de la aldea mediante muestreo estratificado. ¿De Cuántos adultos, jóvenes y niños

estaría compuesta la muestra?

Solución

Adultos Jóvenes Niños Total

Población 140 91 84 315

Muestra x y z 45

Resolvemos para cada tipo de persona

91 315 91∗45 84 315 84∗45


140
=
315
𝑥=
140∗45
= 20 = 𝑦= =13 = 𝑍= = 12
𝑥 45 315 𝑦 45 315 𝑧 45 315
45

Por tanto, debemos entrevistar a 20 adultos, 13 jóvenes y 12 niños.

Muestreo por conglomerado: Es un método de selección de una muestra estadística en el

que se divide una población por grupos, que tienen alto nivel de representatividad de la totalidad,

para después analizar todos o algunos de los elementos de uno o de varios grupos. Los

conglomerados o grupos deben estar previamente divididos, por ejemplo, pueden ser vecindarios,

y tienen que representar la heterogeneidad de la población. Además, es necesario que sean

homogéneos, es decir, que tengan características similares entre sí.

Ejemplo: Un grupo de investigadores quiere estudiar las características de las maquinarias

que se utilizan en distintas fábricas.

Solución

Se seleccionan todas las máquinas de las fábricas de una ciudad como población objetivo. Cada

fábrica será un conglomerado.

-Se calcula que de 87 fábricas se necesitarán 5 conglomerados para elaborar la muestra.

-Se realiza una lista de todas las fábricas.

-Se seleccionan 5 fábricas utilizando un método de sorteo y se analizarán todas las

maquinarias que se encuentren en esas fábricas.

Datos no Probabilísticos:

Muestreo por conveniencia: Los participantes son seleccionados según su disponibilidad

o conveniencia para el investigador. Esto puede llevar a una muestra no representativa de la

población.

Muestreo por criterio: Los participantes son seleccionados según un conjunto específico de

criterios establecidos por el investigador, como la edad, el género o la ocupación. Esto puede limitar

la representatividad de la muestra.
46

Muestreo por cuotas: Se establecen cuotas para seleccionar a los participantes de

diferentes subgrupos de la población. Por ejemplo, si se desea obtener una muestra equilibrada por

género, se seleccionará a un número determinado de hombres y mujeres, independientemente de

su probabilidad de selección.

Muestreo por bola de nieve: Los participantes iniciales son seleccionados por

conveniencia y luego se les pide que refieran a otros participantes que cumplan con los criterios de

la investigación. Este método es útil cuando la población de interés es difícil de alcanzar.

Ejercicios de Datos no Probabilísticos:

Muestreo por conveniencia: Un analista está interesado en estudiar los hábitos de

consumo de café en una determinada ciudad. Debido a limitaciones de tiempo y recursos, decide

realizar un muestreo por conveniencia. El investigador selecciona a los participantes de su muestra

en una cafetería popular de la ciudad donde él suele ir a menudo. El objetivo es obtener información

sobre los diferentes tipos de café que consumen los clientes.

Pasos del ejercicio

-Definición del objetivo del estudio: El investigador quiere conocer los hábitos de consumo de

café en la ciudad.

-Selección de la fuente de muestreo: El investigador decide utilizar una cafetería popular de la

ciudad como fuente de su muestra.

-Compilación de datos: El investigador se sienta en la cafetería y selecciona aleatoriamente a los

clientes que están consumiendo café. Al seleccionarlos, les pide que respondan a un breve

cuestionario sobre los tipos de café que suelen consumir.

-Tamaño de la muestra: Debido a las limitaciones de tiempo y recursos, el investigador decide

recolectar datos de 50 clientes que se encuentren en la cafetería durante su visita.


47

-Análisis de datos: Después de recopilar los cuestionarios, el investigador analiza las respuestas

y tabula la información sobre los diferentes tipos de café que consumen los clientes.

-Interpretación de resultados: El investigador obtiene una visión general de los hábitos de

consumo de café en la ciudad basada en los datos recopilados en la cafetería. Sin embargo, es

importante tener en cuenta que los resultados pueden no ser representativos de toda la población

de la ciudad, ya que el muestreo se basó en la disponibilidad y conveniencia en una única

ubicación.

Es esencial tener en cuenta que este ejercicio ilustra un muestreo por conveniencia, el cual

tiene limitaciones en términos de representatividad y generalización de los resultados.

Muestreo por criterio: Un especialista desea realizar un estudio sobre el nivel de

satisfacción de los empleados de una empresa en relación con su ambiente laboral. El investigador

decide utilizar el muestreo por criterio y establece los siguientes criterios para seleccionar a los

participantes de la muestra:

▪ Empleados que hayan trabajado en la empresa durante al menos 2 años.

▪ Empleados de diferentes niveles jerárquicos (directivos, supervisores, empleados de nivel

medio).

▪ Empleados de diferentes departamentos (finanzas, recursos humanos, producción).

Pasos del ejercicio

-Definición del objetivo del estudio: El investigador busca obtener información sobre el nivel de

satisfacción de los empleados en relación con el ambiente laboral en la empresa.

-Establecimiento de los criterios de selección: El investigador establece los criterios mencionados

anteriormente para seleccionar a los participantes de la muestra.

-Identificación de la población: El investigador identifica que la población objetivo son todos los

empleados de la empresa.
48

-Tamaño de la muestra: El investigador decide que la muestra estará compuesta por 100

empleados, distribuidos proporcionalmente en función de los criterios establecidos.

-Aplicación de la fórmula de muestreo por criterio: Para determinar el tamaño de la muestra de

cada estrato, el investigador puede utilizar la fórmula:

-Tamaño de muestra del estrato = (Tamaño del estrato / Tamaño de la población) x Tamaño de

la muestra total

Por ejemplo, si hay 500 empleados en total y el tamaño de la muestra total es de 100, el

tamaño de la muestra para cada estrato podría ser:


300
▪ Empleados con más de 2 años de experiencia: 500 ∗ 100 = 60 empleados.

100
▪ Empleados directivos: 500 ∗ 100 = 20 empleados.

100
▪ Empleados del departamento de finanzas: 500 ∗ 100 = 20 empleados.

-Selección de los participantes: El investigador selecciona aleatoriamente a los participantes de

cada estrato utilizando una lista de empleados que cumplan con los criterios establecidos.

-Recopilación de datos: El investigador administra un cuestionario de satisfacción laboral a los

participantes seleccionados en cada estrato.

-Análisis de datos: Después de recopilar los cuestionarios, el investigador analiza las respuestas

y realiza un análisis estadístico para obtener conclusiones sobre el nivel de satisfacción de los

empleados en relación con el ambiente laboral.

Muestreo por cuotas: Un experto desea realizar un estudio sobre las preferencias de

compra de teléfonos móviles en una determinada ciudad. El investigador decide utilizar el muestreo

por cuotas y establece los siguientes criterios para seleccionar a los participantes de la muestra:

▪ Sexo: 50% hombres, 50% mujeres.

▪ Edad: 25% jóvenes (18-25 años), 50% adultos (26-45 años), 25% mayores (46 años en
49

adelante).

▪ Nivel socioeconómico: 30% bajo, 40% medio, 30% alto.

Pasos del ejercicio

-Definición del objetivo del estudio: El investigador busca obtener información sobre las

preferencias de compra de teléfonos móviles en la ciudad.

-Establecimiento de los criterios de selección: El investigador establece los criterios

mencionados anteriormente para seleccionar a los participantes de la muestra.

-Identificación de la población: El investigador identifica que la población objetivo son todos

los habitantes de la ciudad.

-Tamaño de la muestra: El investigador decide que la muestra estará compuesta por 200

participantes, distribuidos proporcionalmente en función de los criterios establecidos.

-Aplicación de la fórmula de muestreo por cuotas: Para determinar el tamaño de la muestra de

cada cuota, el investigador puede utilizar la fórmula:

Tamaño de muestra de la cuota = (Proporción de la cuota en la población) x Tamaño de la

muestra total. Por ejemplo, si la población tiene 500.000 habitantes y el tamaño de la muestra total

es de 200 participantes, el tamaño de la muestra para cada cuota podría ser:

▪ Hombres: (50% de 500.000) x 200 = 100 participantes.

▪ Mujeres: (50% de 500.000) x 200 = 100 participantes.

▪ Jóvenes: (25% de 500.000) x 200 = 50 participantes.

▪ Adultos: (50% de 500.000) x 200 = 100 participantes.

▪ Mayores: (25% de 500.000) x 200 = 50 participantes.

▪ Bajo nivel socioeconómico: (30% de 500.000) x 200 = 60 participantes.

▪ Medio nivel socioeconómico: (40% de 500.000) x 200 = 80 participantes.

▪ Alto nivel socioeconómico: (30% de 500.000) x 200 = 60 participantes.


50

Selección de los participantes: El investigador selecciona aleatoriamente a los participantes de cada

cuota utilizando métodos adecuados, como listas de contactos o encuestas en línea, asegurándose

de cumplir con las proporciones establecidas.

-Recopilación de datos: El investigador administra un cuestionario sobre las preferencias

de compra de teléfonos móviles a los participantes seleccionados en cada cuota.

-Análisis de datos: Después de recopilar los cuestionarios, el investigador analiza las

respuestas y realiza un análisis estadístico para obtener conclusiones sobre las preferencias

de compra de teléfonos móviles en la ciudad.

Muestreo por bola de nieve: Un experto desea realizar un estudio sobre las experiencias

de viaje de personas que han visitado un destino turístico específico. El investigador decide utilizar

el muestreo por bola de nieve y establece los siguientes pasos:

-Identificación de los participantes iniciales: El investigador selecciona a 5 personas que han

visitado el destino turístico y que conoce personalmente como participantes iniciales. Estas

personas servirán como punto de partida para el reclutamiento de otros participantes.

-Entrevista a los participantes iniciales: El investigador entrevista a los participantes iniciales

para recopilar información sobre sus experiencias de viaje y solicita recomendaciones de otras

personas que también hayan visitado el destino.

-Contacto con los referidos: Los participantes iniciales proporcionan los contactos de otras

personas que han visitado el destino turístico. El investigador se pone en contacto con estos

referidos y los invita a participar en el estudio.

-Entrevista a los referidos: El investigador entrevista a los referidos, recopilando información

sobre sus experiencias de viaje y solicitando nuevas recomendaciones de otros viajeros.

-Repetición del proceso: El investigador repite los pasos 3 y 4 varias veces, siguiendo las

recomendaciones de los participantes entrevistados y contactando a nuevos referidos en cada


51

etapa.

-Cierre del proceso de reclutamiento: El proceso de reclutamiento de participantes continúa

hasta que se alcanza un nivel de saturación de datos y se considera que se ha obtenido una

variedad suficiente de perspectivas y experiencias de viaje.

-Análisis de datos: El investigador analiza las entrevistas y los datos recopilados, identificando

patrones, temas comunes y conclusiones sobre las experiencias de viaje en el destino turístico.

Tamaño de Muestra Para Datos Cuantitativos

Ejercicio 1

Se desea calcular el tamaño de muestra óptimo en la ciudad de Lamas para conocer la

percepción de los pobladores si están de acuerdo o no, sobre realizar gran fiesta patronal después

de 3 años en pare por la pandemia del COVID-19. Con un 96% de confianza, calcular:

a) Cuando se desconoce el tamaño de la población y el porcentaje de percepción en la

población
𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛=
𝑑2

(2.05)2 *0.5*0.5 4.2025*0.5*0.5 1.050625


𝑛= = = = 421
(0.05)2 0.0025 0.0025

Respuesta: Al desconocer el tamaño de la población se necesitará de un tamaño de muestra de 421

personas.

b) Sabiendo que el tamaño de la población es de 16.871 personas, pero se desconoce el

porcentaje de percepción en la población.

𝑁 ∗ 𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛= 2
𝑑 ∗ (𝑁 − 1) + 𝑍 2 ∗ 𝑝 ∗ 𝑞
52
16871 ∗ (2.05)2 * 0.5* 0.5 17,725.0943
𝑛= 2 2
= = 411
(0.05) ∗ (16871 − 1) + (2.05) ∗ 0.5 ∗ 0.5 43.225625

Respuesta: Si previamente se conoce el tamaño de la población se necesitará de 411 personas.

c) Se desconoce el tamaño de la población, en estudios previos el porcentaje de percepción en

acuerdo fue del 93%


𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛=
𝑑2

(2.05)2 ∗ 0.93 ∗ 0.07 4.2025 ∗ 0.93 ∗ 0.07 0.27358275


𝑛= = = = 110
(0.05)2 0.0025 0.0025

Respuesta: Desconocida el tamaño de la población, pero si la percepción se tendrá que optar por

una muestra de 110 personas.

d) Sabiendo que el tamaño de la población es de 16.871 y el porcentaje de percepción en

acuerdo fue del 93%


𝑁 ∗ 𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛=
𝑑 2 ∗ (𝑁 − 1) + 𝑍 2 ∗ 𝑝 ∗ 𝑞

16871 ∗ (2.05)2 ∗ 0.93 ∗ 0.07 4,615.61457


𝑛= = = 109
(0.05)2 ∗ (16871 − 1) + (2.05)2 ∗ 0.93 ∗ 0.07 42.4485

Respuesta: Conociendo el tamaño de la población y la percepción porcentual se aplicará una

muestra de 109 personas.

Tamaño de Muestra Para Datos Cualitativos

Ejercicio 2

Se desea calcular el tamaño de muestra óptimo en el distrito de Juan Guerra para conocer

el gasto promedio que invierten en educación, de la muestra piloto se obtuvo una desviación

estándar de 3 soles. Con un 90% de confianza, y d = 0.9 soles; encontrar:


53

a) Cuando se desconoce el tamaño de la población.

𝑍2 ∗ 𝜎2
𝑛=
𝑑2

(1.645)2 ∗ (3)2 2.706025 ∗ 9 24.3542


𝑛= = = = 31
(0.9)2 0.81 0.81
Respuesta: Al desconocerse el tamaño de la población se tiene que aplicar una muestra de 31

personas para el plan piloto.

b) Sabiendo que el tamaño de la población es de 517 familias.

𝑁 ∗ 𝑍2 ∗ 𝜎2
𝑛=
𝑑2 ∗ (𝑁 − 1) + (𝑍 2 ∗ 𝜎 2 )

517 ∗ 1.6452 ∗ (3)2 517 ∗ 2.7060 ∗ 9 12,591.018


𝑛= 2 2 2
= = = 29
(0.9) ∗ (517 − 1) + (1.645 ∗ 3 ) 442.314 442.314

Respuesta: Ya conocida la población de Juan Guerra el tamaño de muestra optimo sería de 29

personas.

Coeficiente de Pearson

En primer momento tenemos que gráfica los valores de modo que se pueda verificar la

forma de correlación.

80

70

60

50
Edad

40

30

20
0 5 10 15 20 25 30 35 40
Tiempo de servicio

Gráfico 9. Grado de correlación entre la edad y el tiempo de servicio.


Fuente: Base de datos, Red asistencial-Tarapoto
54

En este caso, en nuestro grafíco, los puntos están muy esparcidos por lo que podemos

deducir con no hay relación entre las dos variables.

Análisis de datos

Estadísticas de la regresión
Coeficiente de correlación R -0.030855073
Coeficiente de determinación R^2 0.1%
R^2 ajustado -0.002803784
Error típico 12.74927238
Observaciones 268

Según los resultados obtenidos, existe una correlación nula entre las variables “Tiempo

de servicio” y “edad”. Aproximadamente menos del 0.1% del tiempo de servicio influye en la

edad.

Análisis de varianza
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 1 41.20209139 41.20209139 0.25348278 0.615050023
Residuos 266 43236.6897 162.5439462
Total 267 43277.89179

Como el valor crítico de F es mayor que 0.05, podemos afirmar que no existe relación

significativa entre las variables.

Prueba de Hipótesis

Prueba de hipótesis para dos medias poblaciones.

En una investigación se desea averiguar si hay una diferencia significativa en los salarios

promedio entre dos ciudades (A y B) en términos de ingresos mensuales. Queremos realizar una

prueba de hipótesis para determinar si la diferencia observada en las muestras es estadísticamente

significativa o si podría ser atribuida al azar.


55
Salarios promedio
Ciudad A Ciudad B
n 200 180
Media 3500 3700
Varianza 500 550

Las hipótesis de investigación son:

Hipótesis nula (H₀): No hay diferencia significativa en los salarios promedio entre las dos

ciudades. μ₁ = μ₂.

Hipótesis alternativa (H₁): Hay una diferencia significativa en los salarios promedio entre

las dos ciudades. μ₁ ≠ μ₂.

Establecemos la hipótesis nula y alternativa:

H0: μ₁ = μ₂

H1: μ₁ ≠ μ₂

Nivel de significación:

Como no se menciona el nivel de significancia, asumiremos que es el 5% o 0.05.


𝛼 = 0.05

Elección de un estadístico de la muestra:

Utilizamos la fórmula del estadístico de prueba z para dos medias poblacionales con

varianzas conocidas y tamaño de muestras grandes.

Establecemos zona de aceptación para H0:

Como H1: μ₁ ≠ μ₂ se trata de una prueba de dos colas, siendo la zona de aceptación la

siguiente:

(𝑥̅1 − 𝑥̅2 ) − (𝑢1 − 𝑢2 )


𝑍=
𝜎1 2 𝜎2 2

𝑛1 + 𝑛2

ZA = {Z/−𝑧(1−𝛼) < 𝑍 < 𝑧(1−𝛼) }


2 2
56

Estadístico de prueba:

(3500 − 3700) − 0 −200 −200


𝑍= = = = −3.694
2 2 √2,930.555 54.134
√500 + 550
200 180
Zona de aceptación:

ZA ={Z/−z(1−α) < Z < z(1−α) } =Z/−z(0.975) < Z < z(0.975) } = {-1.96<Z<1.96}


2 2

Decisión:

Como Z=-3.694<-Z(0.975)=-1.96 el valor del estadístico se encuentra dentro de la zona de

rechazo de H0. Por lo tanto, se concluye que los datos proporcionan suficiente evidencia para

rechazar H0.

𝛼 𝛼
= 0.025 = 0.025
2 2

1-𝛼 = 0.95

−3.694 −1.96 1.96

Zona de rechazo Zona de aceptación Zona de rechazo

Gráfico 10. Decisión de la prueba de hipótesis.

Se puede concluir que la evidencia aportada por la muestra, apoya como hipótesis que

hay una diferencia significativa en los salarios promedio entre las dos ciudades.

También podría gustarte