Está en la página 1de 142

"AÑO DE LA UNIDAD, LA PAZ Y EL DESARROLLO"

UNIVERSIDAD NACIONAL

“SANTIAGO ANTÚNEZ DE MAYOLO”

FACULTAD DE CIENCIAS DEL AMBIENTE

ESCUELA ACADÈMICA PROFESIONAL DE INGENIERÌA AMBIENTAL

TEMA: PROBABILIDADES

ASIGNATURA: ESTADÌSTICA GENERAL

DOCENTE: ARCE ZUÑIGA, Fernando Raùl

PRESENTADO POR: Calvo Villanueva Caterine


Cano Giraldo Yhuliana
Mendoza Chinchay Adolfo
Paucar Evangelista Yessenia

HUARAZ - ANCASH - PERÚ

2023
INDICE

DEDICATORIA ...................................................................................................................... 5
AGRADECIMIENTO .............................................................................................................. 6
INTRODUCCIÓN ................................................................................................................... 7
RESUMEN: ........................................................................................................................... 8
ABSTRACT: .......................................................................................................................... 9
DEFINICIÓN DE ESTADÍSTICA ................................................ Error! Bookmark not defined.
ESTADISTICA....................................................................... Error! Bookmark not defined.
CLASIFICACIÓN DE LA ESTADÍSTICA..................................... Error! Bookmark not defined.
Estadística Descriptiva........................................................... Error! Bookmark not defined.
Estadística Inferencial ............................................................ Error! Bookmark not defined.
3.- DEFINICIÓN DE TÉRMINOS USADOS ................................ Error! Bookmark not defined.
Población .............................................................................. Error! Bookmark not defined.
Universo ............................................................................... Error! Bookmark not defined.
Muestra................................................................................. Error! Bookmark not defined.
Parámetro ............................................................................. Error! Bookmark not defined.
Estadístico. ........................................................................... Error! Bookmark not defined.
Unidad Elemental .................................................................. Error! Bookmark not defined.
Dato...................................................................................... Error! Bookmark not defined.
Muestreo ............................................................................... Error! Bookmark not defined.
Marco Muestral ..................................................................... Error! Bookmark not defined.
Escalas de medición .............................................................. Error! Bookmark not defined.
a.-Nominal ......................................................................... Error! Bookmark not defined.
b.- Ordinal .......................................................................... Error! Bookmark not defined.
c.-. Intervalo ....................................................................... Error! Bookmark not defined.
d.- Razón ........................................................................... Error! Bookmark not defined.
4.- VARIABLE ........................................................................... Error! Bookmark not defined.
Cualitativas ........................................................................... Error! Bookmark not defined.
Escala Nominal: .................................................................... Error! Bookmark not defined.
Escala ordinal: ....................................................................... Error! Bookmark not defined.
Cuantitativas ......................................................................... Error! Bookmark not defined.
Cuantitativa discreta: .......................................................... Error! Bookmark not defined.
Cuantitativa continua: ......................................................... Error! Bookmark not defined.
CONSTANTE ........................................................................ Error! Bookmark not defined.
5.-REDONDEO DE DATOS ...................................................... Error! Bookmark not defined.
NOTACIÓN SUMATORIA ...................................................... Error! Bookmark not defined.
6.-PROPIEDADES DE LA SUMATORIA .................................... Error! Bookmark not defined.
7.-RECOLECCIÓN DE DATOS ................................................. Error! Bookmark not defined.
CENSO ................................................................................. Error! Bookmark not defined.
TIPOS DE MUESTREO ......................................................... Error! Bookmark not defined.
ENCUESTA .......................................................................... Error! Bookmark not defined.
PASOS PARA REALIZAR UNA ENCUESTA .......................... Error! Bookmark not defined.
8.- CLASIFICACIÓN DE DATOS ............................................... Error! Bookmark not defined.
GRÁFICOS ESTADÍSTICOS ..................................................... Error! Bookmark not defined.
Los gráficos de barras ........................................................... Error! Bookmark not defined.
Histograma............................................................................ Error! Bookmark not defined.
Los gráficos sectoriales ......................................................... Error! Bookmark not defined.
Gráfico de líneas ................................................................... Error! Bookmark not defined.
Diagrama de caja .................................................................. Error! Bookmark not defined.
9.- MEDIDAS DESCRIPTIVAS .................................................. Error! Bookmark not defined.
10.- MEDIDAS DE CENTRALIZACIÓN ...................................... Error! Bookmark not defined.
Clases:.................................................................................. Error! Bookmark not defined.
11.-MEDIA ARITMÉTICA .......................................................... Error! Bookmark not defined.
12.-MEDIA GEOMÉTRICA ........................................................ Error! Bookmark not defined.
13.- LA MEDIA ARMÓNICA ...................................................... Error! Bookmark not defined.
14.-MEDIA CUÁDRICA ............................................................. Error! Bookmark not defined.
16.-VARIANZA.......................................................................... Error! Bookmark not defined.
18.-DESVIACIÓN ESTÁNDAR .................................................. Error! Bookmark not defined.
19.-COEFICIENTE DE VARIACIÓN :CV (X) .............................. Error! Bookmark not defined.
22.MEDIDAS DE APUNTAMIENTO........................................... Error! Bookmark not defined.
FRACTILES, CUARTILES, DECILES Y PERCENTILES............. Error! Bookmark not defined.
CASO DE ESTUDIO: PRUEBA DE ESTUDIANTES ................... Error! Bookmark not defined.
DESVIACIÓN MEDIA................................................................ Error! Bookmark not defined.
CASO DE ESTUDIO: EVALUACIÓN DE MATEMÁTICA ............ Error! Bookmark not defined.
PROBABILIDADES: ............................................................................................................. 76
TIPOS DE PROBABILIDAD:................................................................................................. 79
OPERACIONES CON EVENTOS(Álgebra de eventos): ........................................................ 82
ESPACIO PROBABILISTICO: .............................................................................................. 86
TEOREMAS DE PROBABILIDAD: ........................................................................................ 87
5. PERMUTACION .............................................................................................................. 93
COMBINACIONES .............................................................................................................. 94
VARIANZA: ......................................................................................................................... 94
DISTRIBUCIÓN DE PROBABILIDAD ................................................................................... 96
DISTRIBUCIÓN BINOMIAL NEGATIVA (DISTRIBUCIÓN PASCAL) ...................................... 97
DISTRIBUCIÓN DE POISSON ........................................................................................... 102
DISTRIBUCION HIPERGEOMETRICA ............................................................................... 105
DISTRIBUCIÓN MULTINOMIAL ......................................................................................... 108
DISTRIBUCIÓN HIPERGEOMÉTRICA MULTIVARIADA ..................................................... 111
DISTRIBUCIÓN EXPONENCIAL ........................................................................................ 115
DISTRIBUCION NORMAL (Distribución de Gauss o Distribución gaussiana) ....................... 121
DISTRIBUCIONES MUESTRALES..................................................................................... 128
DISTRIBUCIÓN CHI CUADRADO ...................................................................................... 130
DISTRIBUCION T DE STUDENT ....................................................................................... 133
CONCLUSIONES .............................................................................................................. 140
BIBLIOGRAFÍA : ................................................................................................................ 141
DEDICATORIA
Este trabajo monográfico está dedicado especialmente para nuestros padres por ser el
pilar fundamental en todo lo que somos; por haber estado ahí todo el tiempo durante
nuestra educación, tanto académica, como de la vida, por el apoyo incondicional que nos
brindan en cada una de las actividades que hemos venido realizando y que cada día creen
en nosotros. Así mismo, para el profesor ARCE ZUÑIGA, Fernando Raùl que con mucho
empeño y dedicación nos inculca sus conocimientos para que en un futuro todo lo
brindado nos sea beneficioso en el ámbito laboral de nuestra profesión. Todo este trabajo
ha sido posible gracias a ellos.
AGRADECIMIENTO
A nuestros padres, hermanos y familiares que nos han venido apoyando en todo, incluso
en los momentos más difíciles como estudiantes y como parte de nuestra familia. Esta
monografía es el resultado del esfuerzo de cada uno de los integrantes del equipo de
trabajo, agradecemos al docente quien nos está formando brindándonos sus
conocimientos, para ser buenos profesionales de alta competitividad en el futuro.
INTRODUCCIÓN
La estadística ha cobrado gran importancia en el análisis de los datos, no sólo en los asuntos del
Estado (de ahí su nombre), sino también en las facetas del comportamiento humano, expandiendo
su aplicación en las diferentes ciencias y disciplinas tales como la administración, economía,
comunicación, agricultura, medicina, física, ciencias políticas, psicología, sociología, ingeniería,
entre otras. Por tanto, este texto servirá de apoyo para estudiantes y profesionales de áreas que en
su quehacer necesitan de la estadística, puesto que el contenido del libro soporta los conceptos
generales de la estadística descriptiva, muestreo, ordenación de datos, representación gráfica,
medidas de tendencia central, de posición, de dispersión y de forma. El propósito del texto es
ofrecer una guía para la comprensión de los elementos básicos que permiten analizar un conjunto
de datos. Es por ello que, en cada uno de los capítulos, se desarrollan los temas desde lo conceptual,
acompañados de ejemplos prácticos y culminando con ejercicios de aplicación; de esta manera,
siendo una herramienta didáctica, el libro genera motivación y posibilita el aprendizaje del tema
en aquellas personas que ven en la estadística una herramienta para la toma de decisiones.
Por otra parte, todos los campos de la investigación científica seria se pueden beneficiar del análisis
estadístico ya que las técnicas estadísticas se pueden utilizar en casi todos los aspectos de la vida
Se diseñan encuestas para recopilar información previa al día de elecciones y así predecir el
resultado de las mismas. Se seleccionan al azar consumidores para obtener información con el fin
de predecir la preferencia con respecto a ciertos productos y/o servicios. Los responsables de la
toma de decisiones sobre la política económica, asesores presidenciales, ministeriales y otros altos
cargos públicos, tienen en la estadística una herramienta muy valiosa. Los economistas consideran
varios índices de la situación económica durante cierto periodo y utilizan la información para
predecir la situación económica futura. Únicamente con la ayuda del análisis estadístico pueden
tomarse decisiones inteligentes en relación con los tipos tributarios, programas sociales, gastos de
defensas, políticas laborales, inversiones prioritarias.
A lo largo del desarrollo de este documento encontraremos una serie de conceptos los cuales nos
ayudarán a comprender de mejor manera cada procedimiento relacionado a este tema, gracias al
análisis realizado.
En la vida cotidiana aparecen muchas situaciones en las que los resultados observados son
diferentes aunque las condiciones iniciales en las que se produce la experiencia sean las mismas.
Por ejemplo, al lanzar una moneda unas veces resultará cara y otras sello. Estos fenómenos,
denominados aleatorios, se ven afectados por la incertidumbre. En el lenguaje habitual son algunas
frases como "probablemente, es poco probable que...", "hay muchas posibilidades de que..." hacen
referencia a esta incertidumbre.

La teoría de la probabilidad pretende ser una herramienta para modelizar y tratar con situaciones
de este tipo. Por otra parte, cuando aplicamos las técnicas estadísticas a la recogida, análisis e
interpretación de los datos, la teoría de la probabilidad proporciona una base para evaluar la
fiabilidad de las conclusiones alcanzadas y las inferencias realizadas.
RESUMEN:
Los procedimientos y técnicas estadísticas se utilizan prácticamente en todos los campos
de la actividad humana, en combatir una patología con un nuevo fármaco, prevenir
delitos y accidentes, etc. En cada una de estas actividades, cualquier que sea su naturaleza
deben ser operadas de manera científica y objetiva para obtener resultados eficientes.
Sin embargo, nosotros tenemos algo aprendido, casi todos los días hacemos predicciones
sobre eventos futuros en nuestra vida para adivinar lo que sucederá ante nuevas
situaciones o experiencias.
Las cosas que se dicen no tendrían solución objetiva sin procedimientos científicos que
las respalden. Este procedimiento es estadístico, y es claro que con la ayuda de este
procedimiento se pueda funcionar eficazmente en condiciones de incertidumbre.
Las técnicas estadísticas requieren una comprensión matemática consensuada en el nivel
de aplicación más alto o más bajo, no es necesario tener una matemática avanzada, pero
si una intermedia.
Si la información es inadecuada e insuficiente probablemente la elección sea mala, por
muy bueno que sea el procedimiento. por lo cual, para tomar una decisión correcta se
tiene en cuenta dos cosas: información adecuada y suficiente y un procesamiento
conveniente.
La estadística es el estudio de los modos de recolectar y analizar datos con el fin de
establecer conclusiones acerca del medio del cual se han obtenido los datos. Es la ciencia
que trata sobre la toma, organización, recopilación, presentación y análisis de datos para
deducir conclusiones sobre ellos y para tomar decisiones que estén de acuerdo con los
análisis efectuados. La estadística es una disciplina que utiliza recursos matemáticos para
organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir
conclusiones respecto de ellos. Por ejemplo, la estadística interviene cuando se quiere
conocer el estado sanitario de un país, a través de ciertos parámetros como la tasa de
morbilidad o mortalidad de la población.
En este caso la estadística describe la muestra en términos de datos organizados y
resumidos, y luego infiere conclusiones respecto de la población. aplicada a la
investigación científica, también infiere cuando provee los medios matemáticos para
establecer si una hipótesis debe o no ser rechazada. la estadística puede aplicarse a
cualquier ámbito de la realidad, y por ello es utilizada en física, química, biología,
medicina, astronomía, psicología, sociología, lingüística, demografía, etc. y es importante
en todos los contextos desde el estudiantil, de trabajo y profesional por que se aplica en la
vida diaria de cada uno de estos en el estudiantil por ejemplo para sacar tu promedio de
una calificación o para saber la media o cuánto necesitas para ciertas materias.
ABSTRACT:
Statistical procedures and techniques are used in practically all fields of human activity,
in combating a pathology with a new drug, preventing crimes and accidents, etc. In each
of these activities, whatever their nature, they must be operated in a scientific and
objective manner to obtain efficient results.
However, we have learned something, almost every day we make predictions about
future events in our lives to guess what will happen in new situations or experiences.
The things that are said would not have an objective solution without scientific
procedures that support them. This procedure is statistical, and it is clear that with the
help of this procedure one can function effectively under conditions of uncertainty.
Statistical techniques require an agreed mathematical understanding at the highest or
lowest level of application, it is not necessary to have advanced mathematics, but an
intermediate one.
If the information is inadequate and insufficient, the choice is probably wrong, no matter
how good the procedure. Therefore, to make a correct decision, two things are taken into
account: adequate and sufficient information and convenient processing.
Statistics is the study of ways of collecting and analyzing data in order to draw
conclusions about the environment from which the data was obtained. It is the science
that deals with the taking, organization, collection, presentation and analysis of data to
deduce conclusions about them and to make decisions that are in accordance with the
analyzes carried out. Statistics is a discipline that uses mathematical resources to organize
and summarize a large amount of data obtained from reality, and infer conclusions about
them. For example, statistics intervenes when one wants to know the health status of a
country, through certain parameters such as the morbidity or mortality rate of the
population.
In this case, statistics describe the sample in terms of organized and summarized data,
and then draw conclusions about the population. Applied to scientific research, it also
infers when it provides the mathematical means to establish whether or not a hypothesis
should be rejected. Statistics can be applied to any field of reality, and for this reason it is
used in physics, chemistry, biology, medicine, astronomy, psychology, sociology,
linguistics, demography, etc. and it is important in all contexts from the student, work and
professional because it is applied in the daily life of each of these in the student for
example to get your average of a grade or to know the average or how much you need for
certain subjects.
DEFINICIÓN DE ESTADÍSTICA
La Estadística es una ciencia aplicada, que nos proporciona un conjunto de métodos y
técnicas para planificar, recopilar, clasificar, presentar y analizar datos en forma tal, que
nos permita sacar conclusiones e inferencias acerca de la población, a partir de un
conjunto de datos extraídos de la misma llamada muestra.

ESTADISTICA
El término estadística tiene su raíz en la palabra Estado. Surge cuando se hace necesario para sus
intereses cuantificar conceptos. En la mayoría de los casos esta cuantificación se hará en función
de unos fines económicos o militares. El estado quiere conocer censo de personas, de
infraestructura, de recursos en general, para poder obtener conclusiones de esta
información. Actualmente la estadística es una ciencia. No es ya una cuestión reservada al
estado. Podríamos decir que se encuentra en la totalidad del resto de ciencias. La razón es clara:
por una parte la estadística proporciona técnicas precisas para obtener información, (recogida y
descripción de datos) y por otra parte proporciona métodos para el análisis de esta información.

CLASIFICACIÓN DE LA ESTADÍSTICA

Estadística Descriptiva
● Se dedica a los métodos de recolección, descripción, visualización y resumen de datos
originados a partir de los fenómenos de estudio. Los
Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos
de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos
graficos son: histograma, pirámide poblacional, clústers, entre otros.

Estadística Inferencial
● se dedica a la generación de los modelos, inferencias y predicciones asociadas a los
fenómenos en cuestión teniendo en cuenta
la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer
inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma
de respuestas a preguntas si/no (prueba de hipótesis),estimaciones de características
numéricas (estimación),pronósticos de futuras observaciones, descripciones de
asociación(correlación) o modelamiento de relaciones entre variables (análisis de
regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de
datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. Hay también una
disciplina llamada estadística matemática, a la que se refiere a las bases teóricas de la materia.
La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo estadístico a
un
conjunto de datos, como en estadísticas económicas, estadísticas criminales, entre otros.
3.- DEFINICIÓN DE TÉRMINOS USADOS

Población
Es un conjunto de datos proporcionados por las unidades elementales que lo conforman, las
decisiones y conclusiones basadas en ellas pueden hacerse con absoluta certeza, en otras
palabras, si se dispone de información sobre la población en forma completa, el riesgo de las
decisiones incorrectas desaparece; en cambio, una muestra es solo una parte de la población y las
conclusiones hechas en base a ella pueden ser erróneas, en todo caso se hacen con un riesgo.
Ejemplo:
● Todos los alumnos matriculados de un colegio.
● Todos los habitantes de un país.
● Todos los habitantes del departamento de Lima.
● Todos los alumnos de la facultad de Ciencias del Ambiente.

Universo
Es el conjunto de unidades elementales en general, que tienen alguna característica en común,
quienes al ser medidos u observados respecto a una o más características en estudio nos
proporcionan datos, por lo que de un universo se puede obtener una o más poblaciones como
características medibles u observables se tenga. Sin embargo, para los propósitos de este texto,
universo y población tendrán la misma acepción.
Ejemplo:
● Todos los alumnos matriculados en la UNASAM.
● Los continentes de la tierra.
● El conjunto de comisarías del departamento de Ancash.
● Los cantantes de Perú.

Muestra
Es una parte o subconjunto representativo de la población, seleccionados de acuerdo a las
técnicas de muestreo. Cabe recordar que se pueden seleccionar no solo uno, sino varias muestras
de una población, e incluso de diferentes tamaños y no necesariamente coincidentes
Ejemplo:
● 60 alumnos del colegio Luzuriaga matriculados en el año 2023.
● 40 colegios nacionales que funcionarán el 2022.
● 4 alumnos de la Facultad de Ciencias del ambiente.
● 200 personas del departamento de Lima.
Parámetro
Es un valor que describe a alguna característica de la población y para determinarlo mayormente
se necesitan todos los datos de la población; generalmente se les representa con letras griegas
minúsculas.
Ejemplo:
● μ = Media poblacional.
● σ = Desviación estándar poblacional.
● 𝜌 = Coeficiente de correlación poblacional.
● N = Tamaño de la población.
● P = proporción poblacional.

Estadístico.
Es un valor representativo de la muestra, que se obtiene a partir de los datos muestrales y
describe alguna característica de la muestra. Se les representa con letras latinas.
Ejemplo:
● 𝑋 ̅ = Media muestral.
● S= Desviación estándar muestral.
● r = Coeficiente de correlación muestral.
● n = Tamaño de la muestra.
● p = proporción muestral

Unidad Elemental
Se le llama también unidad de análisis, es el ente que proporciona al ser medido u observado, un
dato, correspondiente a la característica que se quiere estudiar; o pueden ser dos o más datos, de
acuerdo a si se quiere medir u observar dos o más características, por lo tanto, los datos pueden
ser unidimensionales, bidimensionales o multidimensionales.
Ejemplo:
● Una persona
● Un animal
● Una planta
● Un auto
Dato
Es el valor que resulta al medirse u observarse una unidad elemental con relación a la
característica que se quiere estudiar; en otras palabras, es la información expresada en forma
cuantitativa o cualitativa de los hechos de la realidad.
Ejemplo:
● El ingreso mensual de una familia (2600 soles)
● El ingreso promedio de un país.
● La temperatura promedio de una zona.
● El número de especies en peligro de extinción.

Muestreo
Es el procedimiento mediante el cual se obtiene la muestra, en el sentido más amplio, es la parte
de la Estadística que se ocupa del estudio de los diferentes métodos y técnicas para seleccionar
las muestras, incluyendo el tamaño que deben tener.
Ejemplos:
● 500 personas en una población de 5000.
● El porcentaje de habitantes de Perú que fuman habitualmente.
● El porcentaje de pescado que se consume en un año de un país.

Marco Muestral
Es la relación ordenada de todas las unidades elementales de la población, del cual se sacará la
muestra.
Ejemplo:
● Si consideramos a la población a todos los habitantes de un caserío, entonces nuestro
marco muestral es la lista de todos los habitantes de ese caserío en un tiempo “x”.

Escalas de medición
El término “medición” puede definirse desde diversos puntos de vista o en términos que no
necesariamente coincidan, pero lo esencial de la acepción, es que por medición se entiende a la
asignación de números o valores a las unidades elementales según determinadas reglas.
a.-Nominal
La medida nominal consiste en asignar membretes (etiquetas) o nombres a cada uno de los
grupos o categorías que tienen las unidades elementales en estudio, en consecuencia, se trata de
agrupar a los datos en clases mutuamente excluyentes.
Ejemplo:
● Estado civil
● Nombre de las personas
● El número de DNI.
● El sexo.

b.- Ordinal
En el caso de que puedan detectarse diversos grados de un atributo o característica en estudio de
una unidad a otra, entonces es necesario diferenciar esta propiedad, asignando a las unidades
elementales en estudio, nombres o números que resalten estas diferencias y sea factible su
ordenación de mayor a menor o viceversa, es decir importa no solo el nombre sino el orden de
las unidades elementales.
Ejemplo:
● El orden de mérito después de una evaluación académica.
● La posición de llegada a la meta en una carrera de autos.
● El número de pisos de un edificio en Madrid.
● El nivel socioeconómico.

c.-. Intervalo
Cuando no sólo es posible distinguir las diferencias entre los diversos grados de propiedad de
una unidad elemental (característica de la medida ordinal), sino también pueden discernirse
diferencias entre dichos grados, entonces se recurre a la medida llamada intervalo. En este caso
el origen es arbitrario y se elige de acuerdo a las conveniencias, por lo tanto, además de
ordenarlos se pueden hacer operaciones aritméticas, en consecuencia, los valores asignados son
numéricos.
Ejemplo:
● La medida de la temperatura.
● Los números asignados a los años de nuestro calendario.
● La edad de las personas.
d.- Razón
Se le llama también de cociente. Esta escala de medición se diferencia del anterior, porque en
este caso, el punto cero u origen ya no es arbitrario y corresponde realmente a una total ausencia
de la propiedad estudiada. Si se observa una carencia total de la propiedad estudiada se le asigna
el valor cero.
Ejemplo:
● La estatura de las personas.
● La edad de las personas.
● El peso de las personas.
● El ingreso mensual de los obreros de una empresa.

4.- VARIABLE
Es la característica que se quiere estudiar, y viene a ser una cualidad o propiedad de las unidades
elementales, de que al ser medidos u observados tomen diferentes valores o atributos.
Tipos de Variables:
Las variables de acuerdo a su naturaleza pueden ser:

Cualitativas
Son las que indican una cualidad o atributo de las unidades elementales, por consiguiente,
pueden ser clasificados solo como poseedoras o no poseedoras de una cualidad o propiedad. Esta
variable resulta de la medición con escalas nominal u ordinal, se les puede asignar números o
códigos para facilitar su manejo.

Escala Nominal:
Las nominales son las que presentan modalidades excluyentes y que no admiten un criterio de
orden.
Ejemplo:
● El estado civil de las personas.
● El número de DNI.
● El color de ojos de las personas.
● La religión de una familia.
Escala ordinal:
Las ordinales presentan modalidades excluyentes pero que sí admiten un orden.
Ejemplo:
● El nivel educativo de las personas.
● Las clasificaciones dadas en la escala de Rensis.
● El nivel socioeconómico de los trabajadores.
● El grado de instrucciones de los empleados públicos.

Cuantitativas
Son los que indican una cantidad, es decir, son los que pueden ser contados o medidos, y resultan
de las escalas de medición de intervalo y de razón. A su vez pueden ser:

Cuantitativa discreta:
Son las que resultan del conteo y por consiguiente, sólo pueden tomar algunos valores dentro de
un intervalo dado, generalmente son los números naturales o enteros.
Ejemplo:
● El número de hijos de una persona.
● El número de cursos aprobados en un semestre.
● El número de vehículos que pasan por la carretera en una determinada hora.
● El número de inasistencias en un trabajo.

Cuantitativa continua:
Son las que resultan de la medición con cualquier unidad de medida, y por lo tanto pueden
tomar cualquier valor dentro de un intervalo dado. Se les representa con números reales.
Ejemplo:
● El peso de las personas
● La talla de las personas
● El ingreso trimestral de las familias.
● La velocidad de los vehículos.

CONSTANTE
Se denomina así a la variable que toma un solo valor. Es un dato que no cambia de valor. Se le
representa con las primeras letras del alfabeto, tales como a, b, c, etc.
Ejemplos:
1. Se realizó una encuesta a 40 hospedajes de la ciudad de Huaraz sobre los precios de una
noche, con el objetivo de hacer un estudio de mercado.
Identifique los parámetros.
Población: Los Hospedajes de la ciudad de Huaraz
Muestra:40 Hospedajes de la ciudad de Huaraz.
Variable de estudio: El precio del hospedaje por una noche
Tipo de variable: Cuantitativa Continua
Escala de medición: Razón
2. Con el objetivo de analizar los ingresos económicos (S/) de las familias de los estudiantes de
la facultad de Ciencia, se encuestó a 50 estudiantes.
Identifique los parámetros.
Población: Los estudiantes de la Facultad de Ciencias de la UNASAM
Muestra:50 estudiantes de la facultad de ciencias de la UNASAM.
Variable de estudio: Los ingresos económicos (S/) de las familias de los estudiantes.
Tipo de variable: Cuantitativa Continua.
Escala de medición: Razón
3. Se realizó una encuesta a los estudiantes de la facultad de administración y turismo para
analizar los gustos musicales de dichos estudiantes, para lo cual se tomó una muestra de 30
estudiantes.
Población: Los estudiantes de la Facultad de Administración y turismo.
Muestra:30 estudiantes de la facultad de administración y turismo.
Variable de estudio: Los Gustos musicales
Tipo de variable: Cualitativa
Escala de medición: Nominal

5.-REDONDEO DE DATOS
La necesidad del redondeo de datos es más por la facilidad de los cálculos o por comodidad de su
manejo, que, por razones prácticas, pues el manejo inadecuado puede traer más errores de los
previstos. El redondeo de un número hasta el entero o decimal más próximo obedece a los
siguientes criterios.
● Si el dígito a redondear es menor que cinco, se le desprecia.
Ejemplo:
Aproximar o redondear a un entero: 5,133 = 5
Aproximar o redondear a un decimal: 5,133 = 5,1
Aproximar o redondear a dos decimales: 5,133 = 5,13
● Si el dígito a redondear es mayor que cinco, al dígito anterior se le agrega una unidad.
Ejemplo:
Aproximar o redondear a un entero: 5,676 = 6
Aproximar o redondear a un decimal: 5,676 = 5,7
Aproximar o redondear a dos decimales: 5,676 = 5,68
Aproximar o redondear a un decimal: 5,7601 = 5,8
● Cuando el último dígito o el dígito a redondear es igual a cinco, entonces se desprecia el
cinco si el dígito anterior es par y se agrega una unidad al dígito anterior si éste es impar.
Ejemplo:
Aproximar o redondear a un entero: 27,500 = 28,0
Aproximar o redondear a un decimal: 27,550 = 27,6
Aproximar o redondear a un decimal: 27,650 = 27,6
Aproximar o redondear a dos decimales: 27,545 = 27,54

NOTACIÓN SUMATORIA
Para describir y analizar los datos, es necesario el manejo más o menos eficiente de las
operaciones aritméticas, en especial el de la suma de los datos; es decir, de la serie: x1 , x2, x3 ,
……, xn, en estudio, para ello se hará una breve descripción de las sumatorias y de sus
propiedades.

6.-PROPIEDADES DE LA SUMATORIA
● Suma de una constante: Es igual a “n” veces la constante, si se inicia con i=1

∑𝑛𝑖=1 𝑎 = 𝑎 + 𝑎 + 𝑎 +. . . . . . . .+ a = n a

Ejemplo:
𝟒

∑ 𝟓 = 𝟓 + 𝟓 + 𝟓 + 𝟓 = 𝟒𝒙𝟓 = 𝟐𝟎
𝒊=𝟏
𝒏

∑ 𝒂 = (𝒏 − 𝒌 + 𝟏)𝒂
𝒊=𝒌

Ejemplo:

∑ 6 = 6 + 6 + 6 + 6 + 6 = (4 − 0 + 1)6 = 5𝑥6 = 18
𝑖=0

● Suma de una constante por una variable. Es igual a la constante por la suma de la
variable.

𝑛 𝑛

∑ 𝑎𝑋𝑖 = 𝑎𝑥1 + 𝑎𝑥2 + 𝑎𝑥3+. . . . 𝑎𝑋𝑛 = 𝑎 ∑ 𝑋𝑖


𝑖=1 𝑖=1

Ejemplo:

4 4

∑ 6𝑋𝑖 = 6𝑥1 + 6𝑥2 + 6𝑥3 + 6𝑋4 = 6 ∑ 𝑋𝑖


𝑖=1 𝑖=1

7.-RECOLECCIÓN DE DATOS
Los datos estadísticos se obtienen como es sabido, midiendo u observando las unidades
elementales, asimismo para el estudio de una o más características de la población no se necesita
de un solo dato, sino de una colección de datos, ya sea los correspondientes a la población o a los
de la muestra, estos datos para ser estudiados necesitan ser recolectados; la misma, se puede
hacer de múltiples maneras, dependiendo de la variable a estudiar.
● De corte transversal: Es decir, del momento, precisamente en este caso, es cuando hay
que obtenerlos, pues en la mayoría de los casos no están disponibles.
● De corte longitudinal: Es decir, los que sucedieron en el pasado en períodos de tiempo
constantes, en estos casos generalmente se encuentran en los archivos de las instituciones.

CENSO
Es el procedimiento por el cual se obtiene información de todos los elementos que conforman la
población, relacionado a la variable o variables que se quiere investigar.
TIPOS DE MUESTREO
Probabilísticos. Son los que se basan en el principio de la equiprobabilidad, es decir, cuando cada
elemento de la población tiene la misma posibilidad de ser seleccionado. Los cuales a su vez son:
● Muestreo aleatorio simple.
● Muestreo aleatorio estratificado.
● Muestreo aleatorio por conglomerados.
● Muestreo aleatorio sistemático.
● Muestreo aleatorio por etapas.
● Muestreo de aceptación.

No probabilísticos. Son los que se basan en el principio de la representatividad, es decir, aquí lo


único que importa es que sea representativo, los criterios son los de los expertos. A su vez
pueden ser:
● Muestreo por cuotas.
● Muestreo de la bola de nieve.
● Muestreo de Expertos.
● Muestreo de casos-tipo
● Muestras casuales.
● Muestreo para poblaciones móviles.

Ventajas del muestreo sobre el censo


El muestreo es un método estadístico diseñado para obtener solo una parte de la población, pero
haciendo que esta parte sea la más representativa posible de la población, a pesar de ello siempre
existirán errores, en comparación con los resultados del censo; sin embargo, existen ciertas
ventajas que lo hacen aplicable, de lo contrario no sería recomendable usar este método. Las
ventajas más importantes son los siguientes:
● Menor Costo.
Como los datos a recolectar y procesar son relativamente pocos en relación a la de la
población estudiada, los gastos que ocasionen serán por consiguiente mucho más
reducidos.
● Menor Tiempo
Como los datos son en menor cuantía que los de la población estudiada, la recolección y
el procesamiento de los mismos se harán en mucho menor tiempo.
● Mayor Posibilidad.
Precisamente por el menor costo y el menor tiempo empleado, así como de la
imposibilidad de practicar un censo en ciertas poblaciones, hacen que el muestreo sea
mucho más factible de realizarse que un censo.
● Mayor Exactitud.
Debido a que el volumen de trabajo es mucho más reducido que cuando se practica un
censo, se puede emplear personal más calificado, e incluso a quienes se les puede
capacitar más eficientemente, por consiguiente, el trabajo realizado por ellos será mucho
más confiable y preciso.

ENCUESTA
Es el procedimiento por el cual se recolecta la información usando un instrumento llamado
cuestionario de preguntas estructuradas o semiestructuradas.
La encuesta según sus objetivos puede clasificarse en dos grandes grupos:
● Descriptivas
Es cuando el objetivo de la misma, es sólo la de obtener información cuantitativa de los
grupos que constituyen la población.
● Analíticas
Es cuando el objetivo de la misma es hacer un análisis cualitativo y comparativo entre los
grupos que conforman la población.

PASOS PARA REALIZAR UNA ENCUESTA


● Plantear objetivos bien precisos y claros.
● Delimitar a la población a estudiar.
● Señalar los datos suficientes y necesarios a recolectarse.
● Indicar el nivel de precisión deseada.
● Determinar la unidad elemental o de análisis.
● En lo posible confeccionar u obtener el marco muestral.
● Determinar el tipo o tipos de muestreo a usar y el tamaño de la misma

Ejemplos
Cuestionario: Encuesta de satisfacción del producto
Caso 1
Un local de venta de mermelada desea saber la satisfacción de sus clientes respecto a su
producto para lo cual realiza la siguiente encuesta.
1. ¿Cuál es tu nivel de satisfacción general con nuestro producto?
a. muy satisfecho
b. Satisfecho
c. Neutral
d. insatisfecho
e. muy insatisfecho
2. ¿Cómo calificarías la calidad de nuestro producto?
a. Excelente
b. Bueno
c. aceptable
d. Regular
e. Deficiente
3. ¿El producto cumple con sus expectativas iniciales?
a. Sí, completamente
b. Sí, en su mayoría
c. Neutral
d. No, en su mayoría
e. No, en absoluto
4. ¿Cuál es el aspecto que más te agrada de nuestro producto?
5. ¿Cuál considera que es el principal aspecto que podemos mejorar en nuestro producto?
6. ¿Ha recomendado nuestro producto a otros?
a. Si
b. No
7. ¿Cómo describirías tu experiencia general con nuestro producto en una sola palabra?
8. ¿Has tenido alguna experiencia negativa con nuestro producto? Si es así, por favor,
descríbela.
9. ¿Tienes algún comentario adicional o sugerencia que desees compartir con nosotros
para mejorar nuestro producto?
10. ¿Recomendarías nuestro producto a otros?
a. Definitivamente sí
b. probablemente sí
c. No estoy seguro/a
d. probablemente no
e. Definitivamente no

Ejemplo 2
Los alumnos de ingeniería de sistemas e informática con el objetivo de saber si es eficaz
el uso de PseInt para aprender programación, para lo cual formularon el siguiente
cuestionario para obtener datos de su población.
¿Cómo describirías tu nivel de habilidad para crear pseudocódigos antes de utilizar el
software PSeInt como herramienta de aprendizaje?
a. No tenía conocimientos previos sobre pseudocódigos
b. Tenía conocimientos básicos sobre pseudocódigos.
c. Tenía conocimientos avanzados sobre pseudocódigos
¿En qué medida el uso del software PSeInt te ayudó a comprender mejor cómo crear
diagramas de flujo?
a. No me ayudó en absoluto.
b. Me ayudó un poco.
c. Me ayudó significativamente.
¿Consideras que es importante elaborar un diagrama de flujo antes de realizar la
codificación?
a. Sí, es necesario.
b. Depende de la complejidad de la codificación.
c. No es necesario.
¿En qué medida consideras que el uso del software PSeInt te ayudó a comprender mejor
cómo realizar operaciones en la creación de algoritmos?
a. No me ayudó en absoluto.
b. Me ayudó un poco.
c. Me ayudó significativamente
¿Cuál de las siguientes herramientas te pareció más útil en el proceso de aprendizaje de la
creación de algoritmos con PSeInt?
a. Pseudocódigos
b. Diagramas de flujo.
c. Funciones, Operaciones, Comandos
¿Consideras que la función de edición de PSeInt es fácil de usar?
a. Sí, es muy fácil de usar.
b. Es más, o menos fácil de usar.
c. No, es difícil de usar.
¿Cuál es la tarea de edición que te resultó más difícil al trabajar con algoritmos en
PSeInt?
a. Cambiar el orden de las líneas de código.
b. Agregar nuevos comandos.
c. Eliminar o modificar comandos existentes.
d. Cambiar el tipo de datos de una variable
¿En qué medida consideras que el uso del software PSeInt te permitió identificar errores
de programación y corregirlos de manera más efectiva?
a. No me ayudó en absoluto
b. Me ayudó un poco.
c. Me ayudó significativamente.
¿Qué función de edición de PSeInt te resultó más útil para mejorar tus habilidades de
programación?
a. Buscar y reemplazar.
b. Resaltar errores de sintaxis.
c. Comprobar el flujo de ejecución del algoritmo.
¿Has utilizado la función de importación de PSeInt para trabajar con algoritmos creados
por otros usuarios?
a. Sí, siempre lo hago.
b. A veces lo hago.
c. Nunca lo he hecho.
¿Consideras que la función de importación de PSeInt es fácil de usar?
a. Sí, es muy fácil de usar
b. Es más, o menos fácil de usar.
c. No, es difícil de usar.
¿Has tenido algún problema al importar algoritmos en PSeInt?
a. Sí, he tenido problemas al importar algoritmos.
b. A veces he tenido dificultades al importar algoritmos.
c. No, nunca he tenido problemas al importar algoritmos
¿Qué tipo de algoritmos has importado en PSeInt?
a. Algoritmos básicos para prácticas de programación.
b. Algoritmos avanzados para proyectos más complejos.
c. Algoritmos creados por otros estudiantes o profesores.
¿Crees que la importación de algoritmos en PSeInt te ha ayudado a aprender nuevos
conceptos de programación?
a. No, no me ha ayudado.
b. Me ha ayudado un poco.
c. Me ha ayudado significativamente.
¿Cómo describirías tu principal método de aprendizaje de programación?
a. Autodidacta
b. Aprendizaje virtual
c. Aprendizaje presencial en aulas
d. Aprendizaje en equipo
Ejemplo 3
A continuación, se presentará el cuestionario de un censo.
8.- CLASIFICACIÓN DE DATOS
Después de recolectar los datos, éstos se encuentran en la forma como fueron compilados; es
decir, no necesariamente ordenados, por lo tanto, en este estado son difíciles de ser analizados y
por consiguiente de ser interpretados, con dificultad se puede obtener el mínimo y el máximo, se
puede sumar los valores cuantitativos y dividirlo entre el número de valores existentes y obtener
así el promedio, pero esto no nos garantiza una descripción completa de los datos, por lo que es
necesario ordenarlos y clasificarlos, ya sea en grupos, categorías o intervalos dependiendo del
tipo o tipos de variables en estudio.
Tabla de frecuencias
Las tablas de frecuencia son herramientas estadísticas que se utilizan para organizar y resumir
datos de manera sistemática. Proporcionan información sobre la distribución y frecuencia de
ocurrencia de varios valores o categorías de una variable.
Construcción de una tabla de frecuencias
Considerando que se tiene “n” datos y una variable cuantitativa continua, la construcción de la
tabla de frecuencias seria de la siguiente manera.
Alcance o recorrido
Es el intervalo definido por el menos y mayor de los datos.

𝑋𝑚𝑎𝑥 - 𝑋𝑚𝑖𝑛
Rango(R)

R=𝑋𝑚𝑎𝑥 - 𝑋𝑚𝑖𝑛
Numero de intervalos(k)
K=1+3.32log(n)
Ancho de clase(w)
w=R/k
Marca de clase (X 'i): Son los puntos medios de los intervalos de clase.
X’=Li+Li+1 /2
Frecuencia absoluta simple (f i): Es el número de datos que cae dentro de un intervalo.
𝒌

𝒏 = ∑ 𝒇𝒊
𝒊=𝟏
Frecuencia absoluta acumulada (Fi): Resulta de sumar sucesivamente las frecuencias absolutas
simples.
𝒊

𝑭𝒊 = ∑ 𝒇𝒊
𝒋=!

Frecuencia relativa simple (hi): Es el cociente entre la frecuencia absoluta simple y el número
de datos.
𝑓𝑖
ℎ𝑖 =
𝑛
𝒌

∑ 𝒉𝒊 = 𝟏
𝒊=𝟏

Frecuencia relativa acumulada (Hi): Resulta de sumar sucesivamente las frecuencias relativas
simples.
𝒊

𝑯𝒊 = ∑ 𝒉𝒋
𝒋=𝟏

Frecuencia porcentual simple (pi%): Resulta de multiplicar las frecuencias relativas simples x
100.
pi = hi x 100%
Frecuencia porcentual acumulada (Pi%): Resulta de sumar sucesivamente las frecuencias
porcentuales simples.
Problemas
Caso 1
Después de una encuesta, que se realizó con el objetivo de analizar los gustos musicales de los
estudiantes de la UNASAM, se obtuvo los siguientes resultados.
Tabla 1
Rock 32
Pop 24

Hip-Hop 20

Electrónica 16

Jazz 14

Otro 14

Construya la tabla de distribución de frecuencias.


Tabla 2
Música fi p%

Rock 32 27%
Pop 24 20%
Hip-Hop 20 16%
Electrónic
16 13%
a
Jazz 14 12%
Otros 14 12%

100
Total 120
%

De la tabla anterior podemos interpretar:


⮚ El 13% de los alumnos escuchan música electrónica
⮚ El 27% de los alumnos escuchan rock.
⮚ La cantidad de personas que escuchan Pop y Electrónica son el 43%.
Caso 2
Después de una consulta a 26 estudiantes de arquitectura de primer ciclo, sobre la cantidad de
hermanos que tienen, se obtuvo las siguientes respuestas.
0 2 1 0 0 4 5 4 3 3
5 3 2 1 1 4 1 0 1 1

0 2 2 3 4 1

A partir de la información dada:


a. Construir la tabla de distribución frecuencias.
b. ¿Qué porcentaje de alumnos son hijos únicos?
c. ¿Qué porcentaje de alumnos tienen 2 o más hermanos?
d. ¿Cuál es la probabilidad de que un alumno tenga 5 hermanos?
Datos Generales
Población: Los estudiantes de arquitectura de primer ciclo.
Muestra:26 estudiantes de arquitectura de primer ciclo.
Variable de estudio: El número de hermanos.
Tipo de variable: Cuantitativa discreta
Escala de medición: Razón
Tabla 3

Numero
de 𝐟𝐢 𝐅𝐢 𝐡𝐢 𝐇𝐢 𝐩𝐢% 𝐏𝐢%
Hermanos
0 5 5 0.2 0.2 20% 20%
1 7 12 0.27 0.47 27% 47%

2 4 16 0.15 0.62 15% 62%

3 4 20 0.15 0.77 15% 77%

4 4 24 0.15 0.92 15% 92%

5 2 26 0.08 1 8% 100%

Total 26 1 100%

De la tabla anterior podemos interpretar:


⮚ El 20% de los estudiantes son hijos únicos.
⮚ El 53% de los estudiantes tienes 2 o más hermanos.
⮚ La probabilidad de que un alumno tenga 5 hermanos es de 0.08
Caso 3
Se consulto 500 personas de la ciudad de Huaraz su género de película favorita y estos
fueron los resultados.

Tabla 4
Romance 60
Acción 120

Comedia 90

Drama 80

Ciencia ficción 110

Terror 40

A partir de la información recopilada, construya la tabla de frecuencias e interprétala.


a. Construir la tabla de distribución frecuencias.
b. ¿Cuál es el género con mayor popularidad?
c. ¿Cuál es la probabilidad de que a una persona le guste el terror?
d. ¿Qué porcentaje de personas prefieren el romance?
Datos Generales
Población: las personas de la ciudad de Huaraz.
Muestra:500 personas de la ciudad de Huaraz.
Variable de estudio: Genero de película favorita.
Tipo de variable: Cualitativa
Escala de medición: Nominal
Tabla 5
Genero
De 𝐟𝐢 𝐅𝐢 𝐡𝐢 𝐇𝐢 𝐩𝐢% 𝐏𝐢%
Película
Romance 60 60 0.12 0.12 12% 12%
Acción 120 180 0.24 0.36 24% 36%

Comedia 90 270 0.18 0.54 18% 54%

Drama 80 350 0.16 0.70 16% 70%

Ciencia ficción 110 460 0.22 0.92 122% 92%

Terror 40 500 0.08 1 8% 100%

Total 500 1 100%

Problemas Propuestos
1. De los siguientes datos realiza la tabla de distribución de frecuencias.
Tabla 6
Samsung 60
Huawei 50

IPhone 40

Motorola 20

Xiaomi 70

Otros 20

2. Después de realizar una encuesta con el objetivo de analizar el nivel educativo de las
personas de la ciudad de Chiquian. Realice la tabla de distribución de frecuencias.
Tabla 7
Primaria 24
Incompleta
Primaria 80
Completa
Secundaria 100
Incompleta
Secundaria 120
Completa
Universidad 90
Incompleta
Universidad 50
completa

3. Con el objetivo de analizar a que países prefieren emigrar los peruanos, se decide analizar
los siguientes datos. Realice la tabla de distribución de frecuencias
Tabla 8
EE. UU 435 000
Chile 240 000

España 226 00

Argentina 197 000

Italia 116 000

Japón 49 000

Venezuela 44 000

Canadá 31 000
GRÁFICOS ESTADÍSTICOS
Hay varios tipos de gráficos estadísticos que se pueden usar para mostrar datos

visualmente y facilitar la interpretación. Para continuar, mencionaré algunos de los gráficos

estadísticos más comunes:

Los gráficos de barras


Se utilizan para mostrar datos categóricos o cuantitativos. Está formado por barras

rectangulares de igual longitud, donde la altura de cada barra representa la frecuencia o porcentaje

de cada categoría. Puede ser un gráfico con barras verticales u horizontales.

Histograma
Un histograma es similar a un gráfico de barras, sin embargo, se utiliza para mostrar datos

cuantitativos continuos. Los datos se organizan en intervalos o clases y se muestra la frecuencia

de las observaciones en cada intervalo. Las barras del histograma se dibujan de forma adyacente y

su altura representa la frecuencia o densidad de cada intervalo.

Los gráficos sectoriales


Se utilizan para transmitir datos cuantitativos o cualitativos discretos en forma de

porcentajes. Un círculo se divide en sectores, cada sector representa una categoría y su tamaño

angular según el porcentaje representado.

Gráfico de líneas
Un gráfico de líneas se utiliza para mostrar la tendencia o evolución de una variable a lo

largo del tiempo o a lo largo de un eje continuo. Los puntos se recopilan y conectan mediante

líneas rectas. Es útil para analizar conjuntos de datos o comparar diferentes variables en función

del tiempo o de una variable independiente.


Diagrama de caja
Se usa un diagrama de caja para representar la distribución y los valores promedio de una

variable cuantitativa. El gráfico muestra el rango intercuartílico, los valores mínimos y máximos,

y cualquier valor inusual.

Problemas

Caso 1

Tiempo de uso de una laptop de un ingeniero de sistemas.

Objetivo: Se desea saber el uso en una semana de los estudiantes de ingeniería de

sistemas. Para ello se realizo una encuesta a 30 estudiantes de la institución “Taller de Artesanos

Bosco”

8 8 10 6 2 4 6 2 4 4

2 6 4 1 4 10 8 2 4 8
0
4 10 8 6 2 2 6 2 8 2

Datos Generales:

Población: 100 estudiantes

Muestra: 30 estudiantes.

Variable de estudio: Horas de uso a una laptop

Tipo de variable: Cuantitativa


Escala de medición: Razón

Resolución

Límite superior:10

Límite inferior:2

Rango:

R=10 – 2

R=8

Numero de Intervalos:

K= 1 + 3.32log(n) n=30

K= 1 + 3.32log(30)

K=5.90

K=6

Amplitud

w= R/k

w=1.5 ≅ 2
Tabla 9

Tiempo que de uso de laptops de los estudiantes de primaria del taller de Jangas.
Tiempo
𝐗𝐢 𝐟𝐢 𝐅𝐢 𝐡𝐢 𝐇𝐢 𝐩𝐢% 𝐏𝐢%
(Horas)
[8 – 9 0 0 0 0 0% 0%
10)
[10 - 11 6 6 0. 0.2 20% 20
12) 2 %
[12 - 13 8 14 0. 0.47 27% 47
14) 27 %
[14 - 15 8 22 0. 0.74 27% 74
16) 27 %
[16 - 17 6 28 0. 0.94 20% 94
18) 2 %
[18 - 19 2 30 0. 1 6% 100
20) 06 %
Total - 30 - 1 - 100 -
%

Media

𝑥̅ = 14.33

En promedio los estudiantes usas 14.33 horas a la semana la laptop.

Mediana

𝑀𝑒 = 14.25
El 50% de los estudiantes usas la laptop mas de 14.25 horas, mientras que el otro 50% usa
menos de 14.25 horas.

Moda

𝑀𝑜 = 14

El tiempo de uso con mayor frecuencia es de 14 horas


Caso 2

“ANALISIS E INTERPRETACION DE DATOS SOBRE LA CANTIDAD DE

INSTITUCIONES EDUCACTIVAS EN LOS DEPARTAMENTOS DEL PERU”

Los siguientes datos representan la cantidad de instituciones educativas que hay por

departamento en el Perú, excluyendo al departamento de lima.

44 51 45 38 21 34 52 47 48 39 47 36 49 49 39 45 22 28
7 2 1 5 3 3 2 5 3 8 7 8 5 7 6 6 5 5
30 31 47 50 48 50 40
2 9 5 0 4 9 3

Resolución

Rango:

R=522-213

R= 309

Numero de Intervalos:

K=1+3.32log(25)

K=5,64

K=6
Ancho de Clase

W=R/K

W=51.5

W=52

0
𝑋𝑚𝑎𝑥 = 𝑘𝑤 + 𝑋𝑚𝑖𝑛
6 ∗ 52 + 213 = 525
525-522=3

3/2=1.5

Repartimos el valor al Límite superior e Inferior.


𝑋𝑚𝑎𝑥 = 524

𝑋𝑚𝑖𝑛 = 211

9.- MEDIDAS DESCRIPTIVAS


En los capítulos anteriores se indicó con bastante claridad, que la distribución de los datos en
cuadros y su respectiva presentación tenía un objetivo, y éste era la de describir en forma
eficiente al conjunto de datos en estudio, asimismo al ordenar y agrupar los datos se pretendía
reducir el conjunto amorfo de observaciones recolectadas, a un reducido número de
características que nos den una idea lo más completa posible de ese conjunto de datos.
Sin embargo, esta reducción todavía puede ser incompleta, si se pretende describir con un solo
un valor las características del conjunto de datos, este único valor se llama estadístico si el
conjunto corresponde a una muestra, y parámetro si el conjunto corresponde a la población.
10.- MEDIDAS DE CENTRALIZACIÓN
Si el conjunto de datos no tienen el mismo valor, entonces existirá un valor mínimo y un valor
máximo, asimismo existirá un valor que no es superior al máximo ni inferior al mínimo; es decir,
un valor intermedio, este valor típico que se empleará para representar a todos los valores
individuales, se llamará promedio o media; por lo tanto, un promedio es una magnitud que
pretende identificar al centro de una distribución, o que centraliza los datos y alrededor del cual
los datos se acumulan, por ello reciben el nombre de medida de tendencia central (tienden al
centro), centralización (centralizan), de localización (lugar) o de posición.

Clases:
Medias fijas: Se les llama también medias o medidas de centralización, ya que se ubican
generalmente en el centro de la distribución y poseen las siguientes características.
● Para la obtención de su valor se usan todos los datos en estudio.
● Son afectados por los valores extremos o aislados de los datos en estudio.
● Pueden ser sometidos a operaciones algebraicas.
Entre las medidas más conocidas tenemos.
Media Aritmética
Media Geométrica
Media Armónica
Media cuadrática

Medias Móviles: Se les llama también no matemáticas o de posición, estas medias tienen
las siguientes características.
● Para obtener su valor, solo se usa algunos valores del conjunto de datos en estudio.
● No son afectados por los valores extremos o aislados del conjunto de datos de estudio.
● No pueden ser sometidos a operaciones algebraicas.
● Entre las medias móviles podemos citar a los siguientes:
Media
Moda
Fractiles: Cuartiles, Deciles y Percentiles.

11.-MEDIA ARITMÉTICA
Es la medida mas conocida, usada y representativa de las medidas o promedios. Su nombre
proviene de lo asignado al promedio de una serie aritmética. Físicamente tiene una acepción
muy importante, que es la de ser el centro de gravedad o punto de equilibrio de toda distribución
de masa de los datos de estudio.
El valor se obtiene dividiendo la suma de todos los valores de los datos en estudio, entre el
número total de los mismos, y se expresa de la siguiente manera:
∑𝑁
𝑖=1 𝑋𝑖
𝜇= . . . . . . . . . . 𝑀𝑒𝑑𝑖𝑎 𝐴𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙.
𝑁
∑𝑛
𝑖=1 𝑋𝑖
𝑥̅ = ………Media Aritmética muestral, para datos no agrupados.
𝑛

∑𝑀
𝑖=1 𝑋𝑖 𝑓𝑖
𝑥̅ = ………Media Aritmética muestral, para datos agrupados.
𝑛

Donde: Xi = es el i-ésimo valor de la variable X, o la i-ésimo marca de clase, en el caso de datos


agrupados.
i = 1 , 2 , 3 , ……., n o N , según sea el caso.
fi = i-ésimo frecuencia absoluta simple.
N = Tamaño de la población.
n = Tamaño de la muestra.
m = Número de intervalos de clase.
En forma general se le puede representar como M(X), media aritmética de la variable X.
Ejemplo 01:
Los siguientes son tallas de alumnos de dos facultades diferentes de la UNASAM.

Sección Variable Tallas


A X 1.78,1.66,169,1.70,1.68
B Y 1.80,1.77,1.66,1.67,1.65

Solución:
∑5𝑖=1 𝑋𝑖 𝑥1+𝑥2+𝑥3+𝑥4+𝑥5 1.68+1.66+1.69+1.70+1.78 8.51
𝑥̅ 𝐴 = = = = =1.702
5 5 5 5

∑5𝑖=1 𝑋𝑖 𝑥1+𝑥2+𝑥3+𝑥4+𝑥5 1.80+1.77+1.66+1.67+1.61 8.55


𝑥̅ 𝐵 = = = = =1.702
5 5 5 5

Como se puede apreciar, ambos promedios son iguales, pero la talla de los alumnos es diferente,
mientras que los alumnos de la facultad A va superándose, los alumnos de la facultad B va
decayendo las tallas. Esto implica que sólo con el promedio no se puede sacar conclusiones
exactas.
Ejemplo 02:
Hay 1 cocinero que quiere saber cuánto tiempo le suele elaborar un asado de pollo en el horno,
contabilizando todo el proceso de preparación de los ingredientes.

Dia Duración en minutos


26 de Enero 110
10 de Febrero 103
2 de Marzo 120
15 de Abril 97
25 de Mayo 114

Solución:
∑5𝑖=1 𝑋𝑖 𝑥1+𝑥2+𝑥3+𝑥4+𝑥5 110+103+120+97+114 544
𝑥̅ = = = = =108.8
5 5 5 5

Este resultado lo dividimos entre 5 y la media aritmética es 108,8 minutos de duración. El tiempo
medio que nos lleva elaborar un asado de pollo con los datos que tenemos, es de 1 hora y 48,8
minutos.
Ejemplo 03:
En una carrera de autos se registraron las siguientes velocidades dadas por 1 vuelta.

Velocidades de los autos: 150 millas, 180 millas ,200 millas , 177 millas , 185 millas

∑5𝑖=1 𝑋𝑖 𝑥1+𝑥2+𝑥3+𝑥4+𝑥5 150+180+200+177+185 892


𝑥̅ = = = = =178.4 millas
5 5 5 5

La suma de todas las velocidades lo dividimos entre 5 y la media aritmética es 178.4 millas.
Ventajas de la media aritmética
● Es un concepto muy familiar para la mayoría de las personas e intuitivamente claro y
usada muy a menudo.
● Es una medida que puede ser calculada y es única. Pues cada conjunto de datos tiene una
y sola una media aritmética.
● Para calcular su valor se usa todos los valores de los datos en estudio.
● Es una medida bastante representativa del conjunto de datos.
● En una gráfica de frecuencias representa el centro de gravedad

Desventajas de la media aritmética


● Se ve afectado por los valores extremos o aislados del conjunto de datos en estudio, por lo
que no es recomendable usarlo en distribuciones muy sesgadas.
● Su cálculo es tedioso, porque se usan todos los valores.
● No se puede calcular la media aritmética para datos agrupados, cuyos intervalos de clase
en los extremos son abiertos.
● Si se emplean variables discretas o casi-cualitativas, la media aritmética puede no
pertenecer al conjunto de valores de la variable.

12.-MEDIA GEOMÉTRICA
Se le representa por Mg. La media geométrica, es la raíz n-ésima del producto de los “n” valores
de los datos en estudio. Se usa como promedio de series geométricas y en ciertos casos
especiales como el índice de precios, tasas de crecimiento poblacional, tasas de interés bancario,
etc. Se puede presentar dedos formas, a saber:
Media geométrica para los datos no agrupados.

𝒏
𝒏
𝒏
𝑴𝒈 = √𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑. . . . . . 𝑿𝒏 = √∏ 𝒙𝒊
𝒊=𝟏

∑𝒏𝒊=𝟏 𝐥𝐨𝐠 𝑿𝒊
𝑴𝒈 = 𝑨𝒏𝒕𝒊 𝐥𝐨𝐠 [ ]
𝒏

Media geométrica para datos agrupados.

𝑛
𝑀𝑔 = √𝑥
∑𝒏𝒊=𝟏 𝐥𝐨𝐠 𝑿𝒊
𝑴𝒈 = 𝑨𝒏𝒕𝒊 𝐥𝐨𝐠 [ ]
𝒏
Ejemplo 01.
Obtener la media aritmética y geométrica de los siguientes temas: (3,5,6).
Solución:
● Media aritmética:

3+5+6 14
𝑥= = =4.666
3 3

● Media geométrica:

3 3
𝑀𝑔 = √3𝑥5𝑥6 = √90=4.48

Ejemplo 02:
Hallar la media geométrica de los siguientes datos dados en el siguiente cuadro.

Puntaje Xi fi Log Xi Ni log Xi


40-50 45 6 1,653212514 9,91927508
2
50-60 55 25 1,740362690 43,5090672
4
60-70 65 24 1,812913357 43,5099205
6
70-80 75 20 1,875061263 37,5012252
7
80-90 85 15 1,929418926 28,9412838
9
90-100 95 10 1,977723605 19,7772360
5
Total --- 100 ---- 183,158008
1
Solución:

183,1580081
Mg = Anti 𝑙𝑜𝑔 𝑙𝑜𝑔 100
= 67,855 pts.

Desventajas y ventajas de la Mg.


Desventajas de la Mg:
● Su cálculo es muy engorroso.
● Si uno o mas valores son iguales a cero, la Mg es cero.
● Esta limitado solo para valores positivos, si hay algún valor negativo, entonces el
resultado podría ser imaginario.
Ventajas de la Mg:
● La Mg de un conjunto de datos es siempre menor o igual a la media aritmética. Mg ≤ 𝑥 .
● La Mg de dos series de datos, es igual al producto de sus medias geométricas.
● Si todos los valores de los datos son iguales a una cantidad determinada, la Mg es a esa
cantidad determinada.

13.- LA MEDIA ARMÓNICA


Se le representa por Mh. La media armónica es el reciproco de la media aritmética del reciproco
de datos. Se usa para obtener el promedio en series armónicas, y en casos especiales como para
obtener el promedio de velocidades, en tiempos dados o de datos inversamente proporcionales.
Se presentan 2 casos, a saber:
Media armónica para datos no agrupados.
𝑛
𝑀ℎ =
𝑛𝑖
∑𝑚
𝑖=1 𝑥𝑖

Media armónica para datos agrupados.


Se les llama también media armónica ponderada, es el reciproco de la media aritmética de la
división de cada frecuencia absoluta entre su respectiva marca de clase.
𝑛
𝑀ℎ =
𝑛𝑖
∑𝑚
𝑖=1 𝑥𝑖
Ejemplo 01:
Obtenga la media aritmética, la media geométrica y la media armónica de los siguientes números
(2,3,5)
2+3+5 11
𝑥= = =3.66
3 3

3 3
𝑀𝑔 = √2𝑥3𝑥5 = √30=3.107
3 3 3𝑥30
𝑀ℎ = 1 1 = 15 + 10 + 6 = = 2.90322
21+3 +5 31
30

Ejemplo 02:
Tenemos los puntajes de 100 alumnos hallar la Media armónica.
Puntaje Xi fi
45-55 50 8
55-65 60 22
65-75 70 25
75-85 80 25
85-95 90 10
95-105 100 10
Total --- 100

Solución:
100 100
𝑀ℎ = 25 25 10 10 = = 71.62 𝑝𝑡𝑠
508+22
60 +70 +80+90 +100 1.396309524
14.-MEDIA CUÁDRICA
Es una medida poco usada y viene a ser la raíz cuadrada de la media aritmética de los cuadrados
de los valores de los datos en estudio. Se puede presentar de dos formas, a saber:
Media cuadrática para datos no agrupados.

∑𝒏𝒊=𝟏 𝑿𝟐 𝒊
𝑴𝒄(𝒙) = √
𝒏

Donde Xi es el valor de cada dato.


Media cuadrática para datos agrupados.

∑𝒎 𝟐
𝒊=𝟏 𝑿 𝒊 𝒇𝒊
𝑴𝒄(𝒙) = √
𝒏

Donde xi es la marca de clases y fi es su frecuencia absoluta correspondiente.


Propiedad.
La media cuadrática es siempre mayor o igual a la media aritmética.
𝑀(𝑋) ≤ 𝑀𝑐(𝑥)
𝑀ℎ ≤ 𝑀𝑔 ≤ 𝑀(𝑥) ≤ 𝑀𝑐(𝑥)

Ejemplo 01:
Hallar la media cuadrática de los datos que se presentan en le siguiente cuadro de velocidad de
100 corredores.
Puntaj Xi fi X2i X2i fi
e
20-30 25 10 625 6250
30-40 35 21 122 25725
5
40-50 45 23 202 46575
5
50-60 55 21 302 63525
5
60-70 65 12 422 50700
5
70-80 75 13 562 73125
5
Total --- 10 ---- 265 900
0

Solución:
25+35+45+55+65+75 300
𝑥= = =50
6 6

100 100
𝑀ℎ = = = 44.42710778 𝑘𝑚/ℎ
2510+21 23 21 12 13
35 +45+55 +65 +75 2.250878011

265 900
𝑀𝑐 (𝑥 ) = √ = √2659 = 51.5654 km/h
100

Ejemplo 02:
Los siguientes datos muestran el numero de accidentes producidos en el panamericana norte
durante 5 días: 11,15,8,13,10. Hallar las medias correspondientes
11+15+8+13+10 57
𝑋= = = 11.4 accidentes por día.
5 5
5 5
Mg = √11𝑥15𝑥8𝑥13𝑥10 = √171600 = 1667.8397 accidentes por día.
5 5
Mg= 1 1 1 1 1 = = 10.881420
+ + + + 0.4594988345
12 16 14 10 8

2
112 +15 +82 +102 +132 760
Mc(X) = √ 5
=√ 5
= √152 = 12.
16.-VARIANZA
La varianza es una medida estadística que indica cuánto varían los valores de un conjunto de
datos con respecto a su media. Es el promedio de las diferencias al cuadrado entre cada valor del
conjunto de datos y su media. Una varianza alta indica que los datos están muy dispersos,
mientras que una varianza baja indica que los datos están agrupados cerca de la media. Esta se
denota de diferente manera para la muestra (𝑆 2 ) y para la población (𝜎 2 ).
Formas de cálculo:

Datos no agrupados:

2
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑆 =
𝑛
𝑛 2
∑ 𝑖=1 (𝑥 𝑖 − 𝑥̅ )
𝜎2 =
𝑛−1

Datos agrupados:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑆2 =
𝑛

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝜎2 =
𝑛−1

18.-DESVIACIÓN ESTÁNDAR
La desviación estándar es una medida estadística que indica cuánto varían los valores de un
conjunto de datos con respecto a la media. Una desviación estándar alta indica que los datos
están muy dispersos, mientras que una desviación estándar baja indica que los datos están
agrupados cerca de la media. La desviación estándar al igual que la media es positiva siempre.
Esta dada por la siguiente forma.

𝑆 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
19.-COEFICIENTE DE VARIACIÓN :CV (X)
Se calcula dividiendo la desviación estándar de los datos entre la media y se expresa en
porcentaje. Se usa para comparar la dispersión de diferentes conjuntos de datos que tienen
diferentes unidades de medida o escalas. Un coeficiente de variación alto indica que los datos
tienen una gran dispersión en relación con su media, mientras que un coeficiente de variación
bajo indica que los datos tienen una dispersión menor en relación con su media.

𝑆
𝑐. 𝑣 = ∗ 100
𝑥

● Si 𝑐. 𝑣 ≤ 15%, los datos tienen una baja variabilidad.

● Si 𝑐. 𝑣 > 15%, los datos tienen una alta variabilidad.

Ejercicios propuestos.

Caso 1
En el artículo científico titulado “Reporte preliminar de las características sociodemográficas y
clínicas de los pacientes con hemopatías malignas: experiencia de un hospital universitario” se
recolectó los siguientes datos sobre el número de pacientes diagnosticados con neoplasias de
origen linfoide que cumplieron con los criterios de inclusión que fue de 129 pacientes (61
corresponden al año de 2019, 42 al 2020 y 26 paciente al año 2021). La Tabla 1 resume los
distintos grupos etarios.

Tabla 1
Reporte preliminar de las características sociodemográficas y clínicas de los pacientes

con hemopatías malignas: experiencia de un hospital universitario

1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2

8 8 8 8 9 9 9 0 0 0 1 1 2 2 2 2 2 2 3 3 3 4 4 5 5 5 6 6 6 6

2 2 2 3 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4

7 7 7 1 7 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 5 5 5 6 7 7 7 0 0
4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 5

0 0 1 1 1 1 3 3 3 4 5 5 6 7 7 8 9 9 0 0 0 1 1 1 1 1 2 2 2 2

5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7

3 3 7 7 8 8 8 9 0 0 1 2 3 4 4 5 5 5 5 5 6 6 6 7 7 8 8 9 9 0

7 7 7 7 7 7 7 7 8

0 1 1 2 2 2 3 6 0

Nota. Grupo etario ordenados ascendentemente.

Se pide realizar la tabla de frecuencias y el cálculo de la varianza, desviación estándar y

coeficiente de variación.

Solución

Tabla 2

Tabla de Frecuencias absolutas simples, absolutas acumuladas, frecuencias relativas,

frecuencias relativas acumuladas, frecuencias porcentuales.

Edades X´i fi Fi hi Hi p% P%

[17 - 25> 21 23 23 0.1782945 0.1782945 17.8% 17.8%

7 7

[25 - 33> 29 14 37 0.1085271 0.2868217 10.9% 28.7%

3 1

[33 - 41> 37 25 62 0.1937984 0.4806201 19.4% 48.1%

5 6
[41 - 49> 45 14 76 0.1085271 0.5891472 10.9% 58.9%

3 9

[49 - 57> 53 16 92 0.1240310 0.7131782 12.4% 71.3%

1 9

[57 - 65> 61 13 105 0.1007751 0.8139534 10.1% 81.4%

9 9

[65 - 73> 69 21 126 0.1627907 0.9767441 16.3% 97.7%

[73 - 81] 77 3 129 0.0232558 1 2.3% 100.0%

Totales 129 1 100.0%

Nota. Fuente realización propia

Media aritmética

5765
𝑥= = 44.689
129
𝑥 = 45 𝑎ñ𝑜𝑠
El promedio de edades de los pacientes con homeopatías malignas en el hospital

universitario es de 45 años.

Tabla

Tabla de frecuencias y respectivas operaciones para las medidas de variación.


X´ (𝑋𝑖 − (𝑋𝑖 −
Edades fi Fi hi Hi p% P%
i 𝑋)2 𝑋)2 𝑓

[17 - 0.1782945 0.1782945


21 23 23 17.80% 17.80% 561.169
25> 7 7 12906.887

[25 - 0.1085271 0.2868217


29 14 37 10.90% 28.70% 246.145
33> 3 1 3446.03

[33 - 0.1937984 0.4806201


37 25 62 19.40% 48.10% 59.121
41> 5 6 1478.025

[41 - 0.1085271 0.5891472


45 14 76 10.90% 58.90% 0.097
49> 3 9 1.358

[49 - 0.1240310 0.7131782


53 16 92 12.40% 71.30% 69.073
57> 1 9 1105.168

[57 - 10 0.1007751 0.8139534


61 13 10.10% 81.40% 266.049
65> 5 9 9 3458.637

[65 - 12 0.9767441
69 21 0.1627907 16.30% 97.70% 590.025
73> 6 9 12390.525

[73 - 12 0.0232558 100.00


77 3 1 2.30% 1044
81] 9 1 % 3132

12 100.00
Totales 1
9 % 26323.632
Varianza poblacional (𝑆 2 )

∑ (𝑥𝑖 − 𝑥)2 ∗ 𝑓𝑖
𝑆2 =
𝑛
𝑆 2 = 204.059 años

Desviación Estándar (𝑠)

𝑆 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝑆 = 14.285 años

Coeficiente de Variación (𝑐. 𝑣)

𝑆
𝑐. 𝑣 = ∗ 100
𝑥

𝑐. 𝑣 = 31.9%
𝑐. 𝑣 > 15%
El gráfico es el siguiente.
Existe una alta variabilidad entre las edades de los pacientes con hemopatías malignas.
Caso 2

En la facultad de ciencias de la universidad nacional Santiago Antúnez de Mayolo se

realiza una encuesta a todos los profesores de matemática sobre las horas que trabaja

semanalmente en la escuela profesional de ingeniería de sistemas e informática. Siendo

los datos expresados en horas: 13, 12, 10, 16, 9, 8, 12, 8, 6, 16.

Solución

Calculamos la media aritmética

110
𝑥=
10
𝑥 = 11

Varianza (𝜎 2 )

∑(𝑥𝑖 − 𝑥̅ )2
𝜎2 =
𝑛−1

104
𝜎2 =
9
𝜎2 = 11. 5̂

Desviación estándar (𝜎)

𝜎 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝜎 = 3.399
Coeficiente de variación (𝑐. 𝑣)

𝜎
𝑐. 𝑣 = ∗ 100
𝑥

𝑐. 𝑣 = 30.9%
𝑐. 𝑣 > 15%
Existen una variación alta entre las horas que los profesores de matemática trabajan en la

escuela profesional de ingeniería de sistemas.


Caso 3

Se desea realizar una investigación en la escuela profesional de ingeniería de sistemas e

informática de la universidad nacional Santiago Antúnez de Mayolo, dicha investigación consiste

en averiguar el peso de los estudiantes, para lo cual se realizará un estudio a 42 estudiantes

escogidos al azar de la carrera.

Los datos recopilados son los siguientes:

45,52,53,60,49,55,55,57,67,70,72,63,80,74,70,70,55,49,48,52,53,53,62,63,62,65,65,57,58,69,72,

74,78,68,67,58,57,47,49,58,70,48

Los cuales se ordenan en la siguiente tabla

Tabla

Tabla de frecuencias del peso de los estudiantes de ingeniería de sistemas e informática

𝑋𝑖 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖 𝑝% 𝑃%

[45, 50) 47.5 7 7 0.17 0.17 17% 17%


[50, 55) 52.5 5 12 0.12 0.29 12% 29%
[55, 60) 57.5 9 21 0.21 0.50 21% 50%
[60, 65) 62.5 5 26 0.12 0.62 12% 62%
[65, 70) 67.5 5 31 0.12 0.74 12% 74%
[70, 75) 72.5 8 39 0.19 0.93 19% 93%
[75, 80] 77.5 3 42 0.07 1 7% 100%
42 1 100%

Se desea saber si los pesos de los estudiantes de ingeniería de sistemas son muy dispersos.
Solución

Promedio (𝑥)

∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖
𝑥̅ =
𝑛

2565
𝑥=
42
𝑥 = 61,31

Varianza (𝜎 2 )

2
∑(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝜎 =
𝑛−1

3840.476
𝜎2 =
41
𝜎2 = 93.67

Desviación estándar (𝜎)

𝜎 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝜎 = 9.678
Coeficiente de variación (𝑐. 𝑣)

𝜎
𝑐. 𝑣 = ∗ 100
𝑥
𝑐. 𝑣 = 14,78%
𝑐. 𝑣 < 15%
El coeficiente de variación no se aleja mucho del 15% por lo que la gráfica es la

siguiente.
Existe una dispersión moderada entre los pesos de los estudiantes de ingeniería.

Caso 3

En la clase de probabilidades en estadística, se lanzan dados 120 veces cuyos resultados se

sumaron y se distribuyen en la tabla.

Tabla

Sumas 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖 𝑝% 𝑃%
2 3 3 0.025 0.025 2.5 2.5
3 8 11 0.0666666 0.0916666 6.6666666 9.1666666
7 7 7 7
4 9 20 0.075 0.1666666 7.5 16.666666
7 7
5 11 31 0.0916666 0.2583333 9.1666666 25.833333
7 3 7 3
6 20 51 0.1666666 0.425 16.666666 42.5
7 7
7 19 70 0.1583333 0.5833333 15.833333 58.333333
3 3 3 3
8 16 86 0.1333333 0.7166666 13.333333 71.666666
3 7 3 7
9 13 99 0.1083333 0.825 10.833333 82.5
3 3
10 11 110 0.0916666 0.9166666 9.1666666 91.666666
7 7 7 7
11 6 116 0.05 0.9666666 5 96.666666
7 7
12 4 120 0.0333333 1 3.3333333 100
3 3

Nota.

Hallamos la media

843
𝑥=
120
𝑥 = 7.025

Hallamos la varianza
∑(𝑥𝑖 − 𝑥̅ )2
𝜎2 =
𝑛−1

490.857
𝜎2 =
119
𝜎2 = 4.125

Hallamos la desviación estándar

𝜎 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝜎 = 2.031
Coeficiente de variación (𝑐. 𝑣)

𝜎
𝑐. 𝑣 = ∗ 100
𝑥
𝑐. 𝑣 = 28.911%
𝑐. 𝑣 > 15%
La gráfica de dispersión se ve de la siguiente manera.
Existe una alta dispersión de los datos lo cual es lógico pues los datos fueron

influenciados por a lo que llamamos suerte.

COEFICIENTE DE ASIMETRÍA
Coeficiente de asimetría de Pearson

Tiene la forma de.

3(𝑥 − 𝑚𝑒 )
𝐴𝑠 =
𝑠
● Si 𝐴𝑠 = 0: La distribución es simétrica

● Si 𝐴𝑠 > 0: La distribución es asimétrica positiva (sesgada hacia la derecha)

● Si 𝐴𝑠 < 0: La distribución es asimétrica negativa (sesgada hacia la izquierda)


Coeficiente de asimetría de Bowley

Tiene la forma de.

𝑄3 − 2𝑚2 + 𝑄1
𝐴𝑠 =
𝑄3 − 𝑄1

22.MEDIDAS DE APUNTAMIENTO
Otra característica importante de una distribución de frecuencias es su curtosis, o sea el grado de
apuntamiento vertical o achatamiento que exhibe un polígono de frecuencias, este grado de
apuntamiento, es consecuencia de la concentración de los datos alrededor de un punto de
referencia, mientras más se concentren los datos, mayor será su apuntamiento y mientras mayor
sea la dispersión de los datos respecto a ese punto, más achatado será su polígono de frecuencias
● Platicúrtica: Es cuando la forma de la distribución es achatada; esto es, cuando la
distribución de los datos es bastante dispersa alrededor del punto de referencia o valores
centrales. Es menos apuntada que la curva normal y tiene la forma de un plato o
aplanada. (Plati ≈ plano)
● Mesocúrtica: Es cuando la forma de la distribución es moderada o mesurada; es decir, la
distribución de los datos es mesurada alrededor del punto de referencia o valores
centrales; por lo tanto, el apuntamiento es similar al de la curva normal correspondiente.
(Meso ≈ mitad)
● Leptocúrtica: Es cuando la concentración de los datos es bastante pronunciada
alrededor del punto de referencia o valores centrales, en consecuencia, la forma de la
distribución es apuntada o levantada; es decir, más pronunciada que la de la curva
normal. (Lepto ≈ apuntado)

El estadígrafo para evaluar el apuntamiento del coeficiente de Kúrtosis tiene la forma.


𝑀4
𝑘= 4
𝑆
Donde:

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )4 ∗ 𝑓𝑖
𝑀4 =
𝑛

𝑀4 : Cuarto momento respecto a la media

Si los datos son no agrupados omitimos la frecuencia absoluta simple (𝑓𝑖 )

𝑆 4 = (𝑆 2 )2
𝑆 2 : Varianza

● 𝑘 = 3: La distribución es mesokurtica.

● 𝑘 < 3: La distribución es platikurtica.

● 𝑘 > 3: La distribución es leptokurtica.

Ejercicios propuestos
Caso 1
Se desea investigar sobre como los estudiantes de ingeniería organizan su tiempo fuera del
estudio para lo cual se realizó una encuesta a los estudiantes del segundo ciclo sobre las horas de
entretenimiento que tienen.
Los datos ordenados son los siguientes:
1, 1, 1, 1.5, 1.5, 2, 2, 2 ,2.5, 2.5, 2.5, 2.5, 3, 3, 3, 3, 3, 3, 3.5, 3.5, 3.5, 3.5, 3.5, 4, 4, 4, 4, 4, 4, 4, 4,
4.5, 4.5, 4.5, 5, 5, 6, 6, 6, 7
Solución
Dibujamos la tabla de frecuencias
Tabla
Horas de entretenimiento de los estudiantes de ingeniería de sistemas
𝑋𝑖 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖 𝑝% 𝑃%

[0-1) 0.5 3 3 0.075 0.075 7.5 7.5


[1-2) 1.5 5 8 0.125 0.2 12.5 20
[2-3) 2.5 10 18 0.25 0.45 25 45
[3-4) 3.5 13 31 0.325 0.775 32.5 77.5
[4-5) 4.5 5 36 0.125 0.9 12.5 90
[5-6) 5.5 3 39 0.075 0.975 7.5 97.5
[6-7] 6.5 1 40 0.025 1 2.5 100
40 1 100

Hallamos la media aritmética, la mediana y la desviación estándar

𝑥 = 3.125

𝑚𝑒 = 3.154
𝑠 = 0.851
Para calcular el coeficiente de Pearson aplicamos la fórmula

3(𝑥 − 𝑚𝑒 )
𝐴𝑠 =
𝑠
3(3.125 − 3.154)
𝐴𝑠 =
0.851
𝐴𝑠 = −0.102
𝐴𝑠 < 0

La distribución es asimétrica negativa.

Ahora veremos la medida de Curtosis (𝑘), para ello hallaremos el Cuarto momento respecto a la

media y la varianza al cuadrado

∑𝑛𝑖=1 (𝑥𝑖 − 𝑥)4 ∗ 𝑓𝑖


𝑀4 =
𝑛
422.158
𝑀4 =
40
𝑀4 = 10.554
𝑆 4 = (𝑆 2 )2
𝑆 4 = (0.7252 )2
𝑆 4 = 0.525
𝑀4
𝑘=
𝑆4
10.554
𝑘=
0.525
𝑘 = 20.101
𝑘>3
La distribución es leptocúrtica.

Con estos resultados podemos decir que el gráfico es el siguiente.

Como se observa en el gráfico, la distribución tiene forma leptocúrtica con sesgo hacia la

derecha.
Caso 2

Se realizó una entrevista en la iglesia Santa Rosa de Lima ubicada en Chambruco, provincia de

Huari, departamento de Ancash; donde se preguntaron las edades de los participantes el cual se

organiza en la siguiente tabla de frecuencias.

Tabla 2

𝑥𝑖 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖 𝑝% 𝑃%
0.0833333 0.0833333 8.3333333 8.3333333
[0-5) 2.5 3 3
3 3 3 3
0.1111111 0.1944444 11.111111 19.444444
[5-10) 7.5 4 7
1 4 1 4
0.1666666 0.3611111 16.666666 36.111111
[10-15) 12.5 6 13
7 1 7 1
0.2777777 0.6388888 27.777777 63.888888
[15-20) 17.5 10 23
8 9 8 9
0.1666666 0.8055555 16.666666 80.555555
[20-25) 22.5 6 29
7 6 7 6
0.1111111 0.9166666 11.111111 91.666666
[25-30) 27.5 4 33
1 7 1 7
0.0833333 8.3333333
[30-35] 32.5 3 36 1 100
3 3
Totales 36 1 100

Hallar las medidas de forma de la distribución.

Solución

Hallamos la media aritmética, la mediana y la desviación estándar

𝑥 = 17.5

𝑚𝑒 = 17.5
𝑠 = 5.769
Para calcular el coeficiente de Pearson aplicamos la fórmula
3(𝑥 − 𝑚𝑒 )
𝐴𝑠 =
𝑠
3(17.5 − 17.5)
𝐴𝑠 =
5.769
𝐴𝑠 = 0
La distribución es simétrica

Ahora veremos la medida de Curtosis (𝑘), para ello hallaremos el Cuarto momento respecto a la

media y la varianza al cuadrado.

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )4 ∗ 𝑓𝑖
𝑀4 =
𝑛

391250
𝑀4 =
36
𝑀4 = 10868.056
𝑆 4 = (𝑆 2 )2
𝑆 4 = (19.4442 )2
𝑆 4 = 378.086
𝑀4
𝑘=
𝑆4
10868.056
𝑘=
378.086
𝑘 = 28.745
𝑘>3
La distribución es leptocúrtica.
Con estos resultados podemos decir que el gráfico es el siguiente.
Se puede apreciar que el gráfico es simétrico y además se nota leptocúrtica.

Caso 3

Para elaborar un análisis de la cantidad de botellas que son recicladas en el pueblo de Uco, se

realizó una encuesta a las 26 familias del lugar en el cual se le preguntó cuántas botellas recicló

durante la última semana. Al ser un número menor que 30 no fue necesario ordenarlos en una

tabla de frecuencias por lo que los datos son los siguientes:

10, 13, 4, 7, 8, 11, 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18

Hallar las medidas de forma.

Solución

Primero ordenamos los datos de manera ascendente.

3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20

Al no estar distribuidos, se nos es más fácil trabajar con cuartiles por lo que usaremos la fórmula

siguiente.

𝑄3 − 2𝑚𝑒 + 𝑄1
𝐴𝑠 =
𝑄3 − 𝑄1
Hallaremos los valores del cuartil 1 (𝑄1 ), la mediana (𝑚𝑒 𝑜 𝑄2 ) y cuartil 3 (𝑄3 )

26
𝑄1 =
4
𝑄1 = 6.5
𝑚𝑒 = 10
26.3
𝑄3 =
4
𝑄3 = 14
Remplazamos

14 − 2(10) + 6.5
𝐴𝑠 =
14 − 6.5
0.5
𝐴𝑠 =
7.5
𝐴𝑠 = 0.667
La distribución es asimétrica positiva.

Tal como se muestra en el gráfico, la distribución tiene sesgo hacia la derecha.


MEDIA, MEDIANA Y MODA

CASO DE ESTUDIO: EDAD DE LOS ESTUDIANTES


Se analiza la edad de un grupo de estudiantes universitarios. Hemos recopilado los siguientes
datos:
19, 21, 20, 22, 19, 20, 21, 23, 20, 21
Vamos a calcular la media, la mediana y la moda para este conjunto de datos.
1. Media:
Para calcular la media, sumamos todos los valores y los dividimos entre el número total
de valores. En este caso, tenemos 10 valores.
Suma = 19 + 21 + 20 + 22 + 19 + 20 + 21 + 23 + 20 + 21 = 206
Media = 206 / 10 = 20.6
Por lo tanto, la media de las edades de los estudiantes es de 20.6 años.

2. Mediana:
Primero, ordenamos los datos de menor a mayor:
19, 19, 20, 20, 20, 21, 21, 21, 22, 23
Como tenemos un número par de datos, debemos calcular la mediana tomando los dos
valores centrales y calculando su media.
Mediana = (20 + 21) / 2 = 20.5
La mediana de las edades de los estudiantes es de 20.5 años.

3. Moda:
La moda es el valor o los valores que se repiten con mayor frecuencia. En este caso, el
valor que se repite con mayor frecuencia es 21, que aparece tres veces. No hay otros
valores con una frecuencia mayor, por lo tanto, la moda es 21.
En resumen, para este caso de estudio, la media de las edades de los estudiantes es de 20.6 años,
la mediana es de 20.5 años y la moda es 21 años. Estas medidas nos proporcionan información
sobre la tendencia central de las edades en este grupo de estudiantes.

FRACTILES, CUARTILES, DECILES Y PERCENTILES

CASO DE ESTUDIO: PRUEBA DE ESTUDIANTES


Se toma un conjunto de datos que representa el tiempo en segundos que toma a un grupo de
estudiantes completar una prueba. Los datos recopilados son los siguientes:
35, 42, 50, 28, 55, 60, 47, 38, 44, 52, 32, 49, 41, 46, 57
Vamos a calcular los cuartiles, deciles y percentiles para este conjunto de datos.
1. Cuartiles:
Para calcular los cuartiles, primero ordenamos los datos de menor a mayor:
28, 32, 35, 38, 41, 42, 44, 46, 47, 49, 50, 52, 55, 57, 60
● Q1 (primer cuartil): Este cuartil corresponde al percentil 25. Calculamos el valor
que deja el 25% de los datos por debajo:
o Q1 = P25 = 38
● Q2 (segundo cuartil): Este cuartil es la mediana, que corresponde al percentil 50.
Calculamos el valor que deja el 50% de los datos por debajo:
o Q2 = P50 = 46
● Q3 (tercer cuartil): Este cuartil corresponde al percentil 75. Calculamos el valor
que deja el 75% de los datos por debajo:
o Q3 = P75 = 52

2. Deciles:
Para calcular los deciles, seguimos el mismo procedimiento. Ordenamos los datos y luego
calculamos los valores que dejan el 10%, 20%, ..., 90% de los datos por debajo.
● D1 (primer decil): Valor que deja el 10% de los datos por debajo:
o D1 = P10 = 32
● D2, D3, D4, D5, D6, D7, D8, D9 (segundo al noveno decil): Se calculan de
manera similar.

3. Percentiles:
Al igual que los cuartiles y deciles, los percentiles se calculan ordenando los datos y
determinando los valores que dejan un cierto porcentaje de datos por debajo.
● P1, P2, ..., P99: Se calculan de manera similar.
En resumen, para este caso de estudio, hemos calculado los cuartiles, deciles y percentiles para el
conjunto de datos del tiempo que toma a los estudiantes completar una prueba. Estas medidas
nos permiten entender cómo se distribuyen los tiempos y nos brindan información sobre
diferentes rangos y porcentajes de los datos. Esto puede ser útil para identificar patrones,
comparar observaciones individuales y comprender la variabilidad en los resultados de la prueba.

DESVIACIÓN MEDIA

CASO DE ESTUDIO: EVALUACIÓN DE MATEMÁTICA


Se está analizando el tiempo en minutos que tardan los estudiantes en completar un examen de
matemáticas. Hemos recopilado los siguientes datos:
25, 32, 28, 35, 30, 33, 29, 27, 31, 34, 36, 26
Vamos a calcular la desviación media para este conjunto de datos.
1. Calculamos la media (promedio) de los datos:
Media = (25 + 32 + 28 + 35 + 30 + 33 + 29 + 27 + 31 + 34 + 36 + 26) / 12 = 31

2. Restamos cada valor de los datos a la media y obtenemos el valor absoluto de cada
diferencia:
|25 - 31| = 6
|32 - 31| = 1
|28 - 31| = 3
|35 - 31| = 4
|30 - 31| = 1
|33 - 31| = 2
|29 - 31| = 2
|27 - 31| = 4
|31 - 31| = 0
|34 - 31| = 3
|36 - 31| = 5
|26 - 31| = 5

3. Sumamos todas las diferencias absolutas:


6 + 1 + 3 + 4 + 1 + 2 + 2 + 4 + 0 + 3 + 5 + 5 = 36

4. Dividimos la suma de las diferencias absolutas entre el número total de valores:


Desviación media = 36 / 12 = 3
Por lo tanto, la desviación media del tiempo de los estudiantes en completar el examen de
matemáticas es de 3 minutos. Esto indica que, en promedio, los tiempos de los estudiantes
difieren alrededor de 3 minutos de media.
La desviación media es útil para medir la dispersión promedio de los datos y entender cuánto
varían los valores con respecto a la media. En este caso, una desviación media de 3 minutos
indica que los tiempos de los estudiantes tienden a estar cerca de la media, con algunas
variaciones.
PROBABILIDADES:
Es el espacio muestral equiprobable: “Todos los sucesos elementales tienen
igual probabilidad de ocurrir”
Para poder comprender mejor de lo que trata este tema tenemos que introducirnos dentro
del campo del cálculo de probabilidades y veremos que existen algunos conceptos que
debemos tener claro.Para comprenderlos mejor mencionaremos algunos de ellos:
TIPOS DE PROBABILIDAD:
a. P. Frecuencial.
Esta se determina acorde a la frecuencia de ocurrencia de un fenómeno, en
un número determinado de eventos auto realizados, donde se procede a
llevar la anotación de las mismas frecuencias.

Por ejemplo, se toma una chapa y se lanza 20 veces al aire, se anota las
veces que la misma ha caído con la cara hacia abajo y las veces que la
misma ha caído con la cara hacia arriba.
b. P. Matemática.

Obedece a un conjunto de operaciones aritméticas que se lleva a cabo, las


cuales ameritan que se calculen en cifras los eventos aleatorios que pueden
suceder en un determinado campo.

Utilizando el ejemplo anterior, se calcularían las veces en las cuales la


chapa cae boca arriba o bien boca abajo.

c. P. Binomial.

En este caso, se calcula la posibilidad de éxito o de fracaso de un


determinado acto, de modo tal, que el cálculo va a residir en la cualidad de
ocurrencia o no del fenómeno.

d. P. Objetiva.

Se conocen de antemano las frecuencias, de forma tal, que solo se


conocerán los casos probables en los que sucederá un fenómeno.

Es decir, acorde a esta probabilidad las condiciones necesarias para la


existencia del hecho ya son previamente conocidas, solamente se
determinará un valor aproximado para los casos posibles en que pueda
acontecer el hecho.

e. P. Geométrica.

Muchos la han catalogado como un subtipo de la probabilidad matemática,


y es aquella en la cual, los científicos pueden conocer con exactitud las
veces o casos favorables en los que puede darse un evento.

f. P. Subjetiva.

Se contrapone a la probabilidad matemática, ya que en esta, solo es


posible de determinar por ciertas eventualidades, que pueden arrogar
cierto grado de posibilidad en la ocurrencia del hecho.
Ejemplo de ello, son las probabilidades que las personas citan en la vida
cotidiana, como es el caso, de indicar que existen probabilidades de que
llueva de noche cuando el cielo se ve despejado.

Tal probabilidad, se funda en evidencias previas de noches que por


coincidencia el cielo está despejado y llovió, pero no por ello, se puede
establecer una probabilidad certera.

g. P. Hipergeométrica.

Aquella que se realiza acorde a la técnica del muestreo, es decir, la


ocurrencia de los eventos se clasifican por la frecuencia de su
acontecimiento, creándo así una serie de grupos de eventos determinados
por su aparición.

Por ejemplo, se lanza un dado, y se anota las veces que sale cada una de
sus caras, hasta establecer una frecuencia de aparición de cada una de
estas.

h. P. Poisson.

Mecanismo de cálculo de probabilidades más complejos, ya que pretende


determinarlas en espacio y en tiempo también.

i. P. Lógica.

Establece la posibilidad de ocurrencia de un hecho de forma inductiva, con


arreglo a las leyes de la lógica.

j. P. Condicionada.

En este caso, se establece la relación de causalidad entre dos hechos, ya


que solo es posible determinar la ocurrencia de uno, si el otro ha sucedido
de forma previa.

Es decir, para que suceda tal acción, es menester que otra se haya
producido con anterioridad.
k. P. De intersección y de la unión.

En este caso, se analiza la relación que puede establecerse entre dos


hechos, es decir, se selecciona un evento y otro, siendo posible considerar
la existencia de un tercer hecho, si estos dos suceden.

Es decir, al igual que la condicionada, se sujeta la existencia de un evento


siempre y cuando dos de los que le antecedan sucedan por igual.

l. P. De espacio muestral.

Son todos los resultados que un experimento aleatorio ha arrogado, estos


se aglomeran en uno solo, acorde a la cantidad de frecuencias de eventos y
la contribución de estos a los resultados positivos y deseados.

m. P. Clásica.

Es aquella que establece la regla de las probabilidades, conforme a la cual,


la cantidad de eventos que sucedan de forma positiva, será la misma
cantidad que favorezca los resultados deseados, es decir,

n. P. Simple o Compuesta.

Aquellas en las que se determinan la posibilidad o no de ocurrencia de un


determinado evento.

OPERACIONES CON EVENTOS(Álgebra de eventos):


OPERACIONES CON SUCESOS:
Propiedades de la unión e intersección de sucesos:

Ejemplo: Sea un experimento aleatorio de lanzar un dado y definimos:


A={par}
B={impar}
C={multiplos de 3}

ESPACIO PROBABILISTICO:
Se llama así a la terna que está formada por un espacio muestral E, el álgebra de
sucesos A y una probabilidad P(E, A, P)
TEOREMAS DE PROBABILIDAD:
4.1. TEOREMA DE LA MULTIPLICACIÓN O PROBABILIDAD
COMPUESTA:
P(A⋂B)=P(A)P(B/A)=P(B)P(A/B), Esta ecuación se lee como la probabilidad
de A dado que B es igual a la probabilidad de A y B dividido entre la probabilidad
de B. Si A y B son independientes, entonces

P(A/B)=P(A), entonces:

P(A∩B)=P(A/B)P(B) se convierte en P(A∩B)=P(A)(B), porque el

P(A/B)=P(A) si A y B son independientes.

Una forma fácil de recordar la regla de la multiplicación es que la palabra "y", que
en este caso se puede sustituir por el símbolo de intersección y significa que el
evento tiene que satisfacer dos condiciones. Por ejemplo, el nombre extraído de la
lista de la clase debe ser tanto una mujer como un estudiante de segundo año. Es
más difícil satisfacer dos condiciones que una sola y, por supuesto, cuando
multiplicamos fracciones el resultado es siempre menor. Esto refleja la creciente
dificultad de satisfacer dos condiciones.

4.2. TEOREMA DE LA PROBABILIDAD TOTAL


Para entender este teorema es necesario saber sobre la probabilidad condicionada, entonces
tenemos que:

PROBABILIDAD CONDICIONADA:
4.3. TEOREMA DE THOMAS BAYES:

Solucion:
4.4. INDEPENDENCIA DE EVENTOS
Sean A y B dos sucesos del espacio muestral. El suceso A se dice independiente
del suceso B si el conocimiento de la ocurrencia de B no modifica la probabilidad
de aparición de A, es decir, si
P (A/B) = P (A) o P(A) = P(A/B)
Dentro de una propiedad, si hablamos de A, B y estas son independientes
entonces decimos que:

A es independiente de B ⇔P[ A∩B]=P[A].P[B]


5. PERMUTACION
a. PERMUTACIONES SIN REPETICIÓN

b. PERMUTACIONES CON REPETICIÓN


Las permutaciones con repetición de elementos donde el primer elemento se repite A
veces, el segundo B veces, el tercero C veces,N
Son los distintos grupos que pueden formarse con esos elementos de forma que:
Sí entran todos los elementos
Sí importa el orden
Sí se repiten los elementos
COMBINACIONES

a. Combinación sin Repetición:

b. Combinación con repetición:

VARIANZA:
Para distinguir la desviación estándar de una población de la desviación estándar de una
muestra obtenida de esa población, empleamos s para la última y σ (sigma) para la
primera. De manera que 𝑠2 y 𝑠2 representan la varianza muestral y poblacional,
respectivamente.
a. Varianza con repetición

b. Varianza sin repetición

7.1. VARIANZA ALE DISCRETA


a. Función de cuantía
En vista de lo dicho, la función de cuantía de una variable aleatoria discreta con
distribución uniforme será:

En nuestro sencillo ejemplo del lanzamiento de un dado, la función de cuantía, es


decir, la probabilidad de que salga un resultado determinado será:
Representación gráfica:

DISTRIBUCIÓN DE PROBABILIDAD
a. Distrib. Uniforme
Se dice eso cuando la probabilidad en todos los puntos de masa probabilística es la
misma; es decir, cuando todos los posibles valores que puede adoptar la variable ( x1,
x2,...,xk) tienen la misma probabilidad.
b. Dist Bernoulli
Para comprender el proceso de Bernouilli pensemos, por ejemplo, en situaciones en las
que sólo hay dos posibles resultados mutuamente excluyentes (verdadero/falso, en un
test; defectuoso/no defectuoso, en los artículos que salen de una fábrica;
aprobado/suspendido, en los resultados de un examen,etc....). Decimos que son
mutuamente excluyentes porque no pueden darse simultáneamente, se da uno de los dos
casos. Una manera común de designar estos dos resultados es como Éxito (E) o Fracaso
(F).
Una segunda característica de los fenómenos que siguen el denominado Proceso de
Bernouilli es que las pruebas de las que se obtienen los éxitos o los fracasos son
independientes. Así, el hecho de que un artículo salga defectuoso en una línea de
producción no tiene que ver con el resultado obtenido en el siguiente artículo que
examinamos.
Por último, una tercera característica de este Proceso es que las probabilidades de Éxito o
Fracaso son constantes. Los fenómenos que en la vida real cumplen estas tres
características pueden ser considerados como Procesos de Bernouilli.
c. Dist Binomial
Una vez visto lo referido a Bernouilli estamos en disposición de abordar el estudio de la
distribución Binomial. Es un experimento aleatorio en el que podemos obtener dos
resultados posibles, mutuamente excluyentes, con probabilidades constantes en el que p
es la probabilidad de éxito. Supongamos que se realizan n pruebas independientes (es
decir, se dan las condiciones de Bernouilli) y tenemos una sucesión de Bernuilli de
tamaño n. Sea X la variable definida como el número de éxitos resultantes en la sucesión
de Bernuilli. X diremos que se distribuye como una distribución binomial.
Ejemplo
En un agente de seguros que tiene como posibles resultados de su gestión hacer un seguro
(éxito) o no hacerlo (fracaso); o en un test que debemos hacer para acceder a un master
con posibles respuestas correctas o incorrectas; o en la posibilidad de que acepten (éxito)
o no acepten (fracaso) un grupo de personas una invitación a cenar; o una máquina
etiquetadora de botellas que pone mal o bien las etiquetas; etc... Todas ellas, si son una
sucesión de Bernuilli de tamaño n, se distribuyen como una distribución binomial de
parámetros n y p, y lo definimos como:
X ´ B(n,p)
En donde n es el tamaño de la sucesión de Bernuilli, el número de veces que se repite el
experimento y p es la probabilidad del éxito.

DISTRIBUCIÓN BINOMIAL NEGATIVA (DISTRIBUCIÓN PASCAL)


Es una distribución de probabilidad discreta que se utiliza para modelar el número de ensayos
independientes hasta que se logra un número determinado de éxitos en un experimento.
AUTORES RELACIONADOS
o Blaise Pascal: Pascal fue un matemático, físico y filósofo francés del siglo XVII. Aunque
no fue el primero en estudiar esta distribución, se le atribuye la denominación
“distribución de Pascal” en su honor. Pascal realizó investigaciones pioneras sobre los
triángulos numéricos que llevan su nombre, los cuales están relacionados con la
distribución binomial negativa.
o Abraham de Moivre: De Moivre fue un matemático francés-británico del siglo XVIII y es
considerado uno de los fundadores del campo de la probabilidad. En su obra “The
Doctrine of Chances” (La Doctrina de las Probabilidades), publicada en 1718, de Moivre
introdujo la distribución binomial negativa y proporcionó una descripción detallada de
sus propiedades y aplicaciones.
o Pierre-Simon Laplace: Laplace fue un matemático y astrónomo francés del siglo XVIII y
principios del XIX. En su obra “Thèorie Analytique des Probabilitès” (Teoría Analítica
de las Probabilidad y profundizó en la distribución binomial negativa, incluyendo su
relación con la distribución binomial y la distribución de Poisson.
Estos autores han contribuido significativamente en el estudio y comprensión de la distribución
negativa, proporcionando importantes fundamentos teóricos y aplicaciones practicas en diversos
campos de la ciencia y la estadística.
Esta distribución se caracteriza por tener dos parámetros:
● El número de éxitos deseados(r)
● La probabilidad de éxito en un ensayo(p)
La función de probabilidad de la distribución binomial negativa se define de la siguiente manera:
P(X = k) = (K – 1)C(r – 1)* p^r* (1 – p) ^ (k -r)
Donde:
K = El número de ensayos necesarios
r = el número de éxitos deseados
p = La probabilidad de éxito en un solo ensayo
C(n, K) = El coeficiente binomial, que se calcula como:
C(n, K) = n! / (K! * (n – K)!)

La media (u) y la varianza (σ^2) de una distribución binomial negativa se pueden calcular de la
siguiente manera:
μ = r * (1 – p) / p
σ^2 = r* (1 – p) / p^2
EJEMPLO 01
Supongamos que un equipo de vóley necesita ganar 5 partidos antes de que finalice la temporada
para clasificar a las finales. La probabilidad de que el equipo gane un partido individualmente es
del 0,6. Calcular la probabilidad de que el equipo necesite jugar exactamente 10 partidos para
clasificar; Además el número total de partidos jugados es 9.
Resolución:
Para ello se utilizará la fórmula de la distribución binomial negativa:
P(X = k) = (K – 1)C(r – 1)* p^r* (1 – p) ^ (k -r)
Paso 01: Calcular el coeficiente binomial, utilizando la siguiente fórmula
C(n, K) = n! / (K! * (n – K)!)
C(9, 4) = 9! / (4! * (9 - 4)!)
= 9! / (4! * 5!)
= (9 * 8 * 7 * 6) / (4 * 3 * 2 * 1)
= 126
Paso 02: Calcular la probabilidad utilizando la fórmula de la distribución binomial negativa:
P(X = k) = (K – 1)C(r – 1)* p^r* (1 – p) ^ (k -r)
P(X = 10) = (10 - 1)C(5 - 1) * (0.6^5) * (1 - 0.6)^(10 - 5)
= 9C4 * (0.6^5) * (0.4^5)
= 126 * 0.07776 * 0.01024
= 0.99615
Por lo tanto, la probabilidad de que el equipo necesite jugar exactamente 10 partidos para
clasificar es de aproximadamente 0.99615, lo que equivale a un 99.615%

Gráfico de la distribución binomial negativa:


Figura 1
Distribución binomial negativa

Nota: Gráfico de la distribución negativa, (MQL5, s.f.)

EJEMPLO 02
Supongamos que estás investigando el número de intentos necesarios para que un estudiante
apruebe un examen. Sabes que la probabilidad de que un estudiante apruebe un intento de
examen es del 0.6. Quieres determinar la probabilidad de que un estudiante necesite exactamente
4 intentos para aprobar el examen.

Paso 1: Identifica los parámetros de la distribución.


En este caso, la distribución binomial negativa tiene dos parámetros:

- r: El número de éxitos requeridos. En este ejemplo, r = 4, ya que queremos saber cuántos


intentos se necesitan para aprobar el examen.
- p: La probabilidad de éxito en cada intento. En este ejemplo, p = 0.6, ya que la
probabilidad de aprobar un intento es del 0.6.
Paso 2: Fórmula la fórmula de distribución.
La fórmula para calcular la probabilidad de la distribución binomial negativa es:

P(X = x) = C(x-1, r-1) * p^r * (1-p)^(x-r)

Donde:

X es la variable aleatoria que representa el número de intentos necesarios para aprobar el


examen.
- x es el valor específico que queremos calcular, en este caso, x = 4.
- C(a, b) es el coeficiente binomial, que se calcula como C(a, b) = a! / (b! * (a-b)!).
- p es la probabilidad de éxito en cada intento.
- r es el número de éxitos requeridos.
Paso 3: Calcula la probabilidad.
Sustituyendo los valores en la fórmula, tenemos:
P(X = 4) = C(4-1, 4-1) * 0.6^4 * (1-0.6)^(4-4)
P(X = 4) = C(3, 3) * 0.6^4 * 0.4^0
P(X = 4) = 1 * 0.6^4 * 0.4^0
P(X = 4) = 0.6^4
P(X = 4) = 0.1296
Por lo tanto, la probabilidad de que un estudiante necesite exactamente 4 intentos para aprobar el
examen es de 0.1296 o 12.96%.
EJEMPLO 03
Supongamos que estás estudiando el número de llamadas telefónicas que una empresa de
servicio al cliente recibe antes de recibir 10 quejas. Sabes que la probabilidad de recibir una
queja en una llamada telefónica es del 0.2. Quieres determinar la probabilidad de que la empresa
reciba exactamente 25 llamadas antes de recibir las 10 quejas necesarias.

Paso 1: Identifica los parámetros de la distribución.


En este caso, la distribución binomial negativa tiene dos parámetros:

- r: El número de éxitos requeridos. En este ejemplo, r = 10, ya que queremos saber


cuántas llamadas se necesitan para recibir las 10 quejas requeridas.
- p: La probabilidad de éxito en cada intento. En este ejemplo, p = 0.2, ya que la
probabilidad de recibir una queja en una llamada es del 0.2.
Paso 2: Fórmula la fórmula de distribución.
La fórmula para calcular la probabilidad de la distribución binomial negativa es:

P(X = x) = C(x-1, r-1) * p^r * (1-p)^(x-r)


Donde:

- X es la variable aleatoria que representa el número de llamadas necesarias para recibir las
10 quejas.
- x es el valor específico que queremos calcular, en este caso, x = 25.
- C(a, b) es el coeficiente binomial, que se calcula como C(a, b) = a! / (b! * (a-b)!).
- p es la probabilidad de éxito en cada intento.
- r es el número de éxitos requeridos.
Paso 3: Calcula la probabilidad.
Sustituyendo los valores en la fórmula, tenemos:
La distribución binomial negativa se utiliza en diversos campos, como:
P(X = 25) = C(25-1, 10-1) * 0.2^10 * (1-0.2)^(25-10)
P(X = 25) = C(24, 9) * 0.2^10 * 0.8^15
P(X = 25) = (24! / (9! * 15!)) * 0.2^10 * 0.8^15

P(X = 25) ≈ 0.1148

Por lo tanto, la probabilidad de que la empresa reciba exactamente 25 llamadas antes de recibir
las 10 quejas necesarias es aproximadamente 0.1148 o 11.48%.
Aplicaciones de la distribución:
o La teoría de cola: La distribución binomial negativa se aplica para modelar el número de
clientes o eventos que deben ocurrir antes de que se produzca un evento específico en el
sistema, como ejemplo el número de llegadas de clientes hasta que se alcance cierta
capacidad del sistema o hasta que se produzca un número determinado de servicios
completados.
o La teoría de juegos: La distribución binomial negativa podría aplicarse para modelar el
número de intentos o ensayos necesarios para alcanzar un cierto objetivo o éxito en un
juego, como ejemplo, se está analizando un juego en el que los jugadores lanzan un dado
y el objetivo es obtener un número específico en el menor número intentos posibles, se
puede utilizar la distribución binomial negativa para calcular la probabilidad de que se
necesite un número determinado de lanzamientos antes de lograr el éxito deseado.

DISTRIBUCIÓN DE POISSON
La distribución de Poisson es una distribución de probabilidad discreta que se utiliza para
modelar eventos raros o poco frecuentes en un intervalo continuo o en un espacio discreto. Se
utiliza comúnmente en situaciones donde se observa el número de ocurrencias de un evento en
un intervalo de tiempo, un área o un volumen determinado.

Características de la distribución de Poisson:


● Modela eventos raros: La distribución de Poisson se aplica cuando los eventos que
estamos interesados en modelar son raros o poco frecuentes.
● Eventos independientes: Se asume que los eventos ocurren de forma independiente y a
una tasa constante en el intervalo considerado.
● Espacio discreto o intervalo continuo: La distribución de Poisson puede utilizarse tanto
en un espacio discreto (por ejemplo, contar el número de llamadas telefónicas en un
período de tiempo específico) como en un intervalo continuo (por ejemplo, medir el
número de partículas radiactivas emitidas en un intervalo de tiempo).
● Parámetro lambda (λ): La distribución de Poisson está completamente determinada por
un único parámetro, λ (lambda), que representa la tasa promedio de ocurrencia del evento
por unidad de tiempo o espacio. Lambda indica cuántas veces esperamos que ocurra el
evento en el intervalo considerado.

Fórmula de la distribución de Poisson:


La función de masa de probabilidad (PMF) de la distribución de Poisson se define mediante la
siguiente fórmula:

P(X = k) = (e^(-λ) * λ^k) / k!


Donde:
● X = La variable aleatoria que representa el número de ocurrencias del evento.
● k = El número de ocurrencias del evento que estamos interesados en modelar.
● e = La constante de Euler (~2.71828).
● λ (lambda) = El parámetro de la distribución de Poisson, que representa la tasa promedio
de ocurrencia del evento en el intervalo considerado.
● k! = La factorial de k.
EJEMPLO 01
Supongamos que estás investigando el número promedio de accidentes automovilísticos que
ocurren en una intersección por semana. Tienes datos históricos que indican que ocurren, en
promedio, 2 accidentes automovilísticos por semana. Quieres determinar la probabilidad de que
en una semana específica ocurran exactamente 3 accidentes automovilísticos en esa intersección.
Paso 1: Identifica el parámetro de la distribución.
En este caso, la distribución de Poisson tiene un parámetro:

- λ (lambda): El número promedio de eventos que ocurren en un intervalo de tiempo


específico. En este ejemplo, λ = 2, ya que el número promedio de accidentes
automovilísticos por semana es 2.
Paso 2: Fórmula la fórmula de la distribución.
La fórmula para calcular la probabilidad de la distribución de Poisson es:
P(X = k) = (e^(-λ) * λ^k) / k!
Donde:
- X es la variable aleatoria que representa el número de eventos que ocurren en un
intervalo de tiempo específico.
- k es el valor específico que queremos calcular, en este caso, k = 3.
- e es la base del logaritmo natural, aproximadamente 2.71828.
- λ es el número promedio de eventos en el intervalo de tiempo.
- Paso 3: Calcula la probabilidad.
Sustituyendo los valores en la fórmula, tenemos:
P(X = 3) = (e^(-2) * 2^3) / 3!
P(X = 3) = (0.1353 * 8) / 6

P(X = 3) ≈ 0.180

Por lo tanto, la probabilidad de que ocurran exactamente 3 accidentes automovilísticos en una


semana específica en esa intersección es aproximadamente 0.180 o 18.0%.
Gráfico sobre la distribución de Poisson:
Figura 1
Distribución de Poisson

Nota: Gráfico de la distribución de Poisson, (R CODER, s.f.)

EJEMPLO 02
Supongamos que estás investigando el número promedio de clientes que llegan a una tienda en
una hora determinada. Según los registros históricos, llegan, en promedio, 5 clientes por hora.
Quieres determinar la probabilidad de que en una hora específica lleguen exactamente 8 clientes
a la tienda.
Paso 1: Identifica el parámetro de la distribución.
En este caso, la distribución de Poisson tiene un parámetro:
- λ (lambda): El número promedio de eventos que ocurren en un intervalo de tiempo
específico. En este ejemplo, λ = 5, ya que el número promedio de clientes que llegan por
hora es 5.
Paso 2: Fórmula la fórmula de la distribución.
La fórmula para calcular la probabilidad de la distribución de Poisson es:
P(X = k) = (e^(-λ) * λ^k) / k!
Donde:
- X es la variable aleatoria que representa el número de eventos que ocurren en un
intervalo de tiempo específico.
- k es el valor específico que queremos calcular, en este caso, k = 8.
- “e “es la base del logaritmo natural, aproximadamente 2.71828.
- λ es el número promedio de eventos en el intervalo de tiempo.
Paso 3: Calcula la probabilidad.
Sustituyendo los valores en la fórmula, tenemos:

P(X = 8) = (e^(-5) * 5^8) / 8!


P(X = 8) = (0.0067 * 390625) / 40320

P(X = 8) ≈ 0.065

Por lo tanto, la probabilidad de que lleguen exactamente 8 clientes a la tienda en una hora
específica es aproximadamente 0.065 o 6.5%.
Autor relacionado con la distribución de Poisson
La distribución de Poisson lleva el nombre del matemático francés Siméon Denis Poisson, quien
la introdujo en 1837. Poisson desarrolló la distribución para modelar la probabilidad de que
ocurrieran eventos específicos en un intervalo de tiempo.
La distribución de Poisson es ampliamente utilizada en diversas disciplinas, como la física, la
biología, la ingeniería, la economía y la estadística, debido a su capacidad para modelar eventos
raros y su simplicidad matemática.

DISTRIBUCION HIPERGEOMETRICA
es una distribución de probabilidad discreta que se utiliza para modelar experimentos en los que
se extraen elementos de un conjunto finito sin reemplazo. Esta distribución es útil cuando
estamos interesados en contar el número de éxitos en una muestra extraída de una población
finita que contiene elementos de dos categorías diferentes.

Características de la distribución hipergeométrica:


Muestreo sin reemplazo: A diferencia de la distribución binomial, la distribución
hipergeométrica se utiliza cuando los elementos se extraen de una población finita sin reemplazo.
Esto significa que cada elemento extraído afecta la probabilidad de éxito o fracaso para los
elementos subsiguientes.
● Población finita: La distribución hipergeométrica se aplica cuando la población de la cual
se extraen los elementos es finita. Esto contrasta con la distribución binomial, que se
utiliza cuando la población es infinita o muy grande en comparación con el tamaño de la
muestra.

● Dos categorías de elementos: En la distribución hipergeométrica, los elementos de la


población se dividen en dos categorías: éxitos y fracasos. Estamos interesados en contar
el número de éxitos en la muestra extraída.
● Parámetros: La distribución hipergeométrica está determinada por tres parámetros: N
(tamaño de la población), K (número total de éxitos en la población) y n (tamaño de la
muestra).
Gráfico sobre la distribución hipergeométrica:
Figura 1
Distribución hipergeométrica

Nota: Grafico sobre la distribución hipergeométrica (Gomez, s.f.)

Fórmula de la distribución hipergeométrica:


La función de masa de probabilidad (PMF) de la distribución hipergeométrica se define mediante
la siguiente fórmula:
P(X = k) = (C(K, k) * C(N - K, n - k)) / C(N, n)
Donde:

X es la variable aleatoria que representa el número de éxitos en la muestra.


k es el número de éxitos en la muestra que estamos interesados en contar.
N es el tamaño total de la población.
K es el número total de éxitos en la población.
n es el tamaño de la muestra extraída.
C(a, b) es el coeficiente binomial, que se calcula como a! / (b! * (a - b)!).

EJEMPLO
Supongamos que estás estudiando una población de 100 estudiantes, de los cuales 60 son
mujeres y 40 son hombres. Quieres determinar la probabilidad de que en una muestra de ta maño
10, haya exactamente 4 mujeres.

Paso 1: Identifica los parámetros de la distribución.


En este caso, la distribución hipergeométrica tiene tres parámetros:

- N: El tamaño de la población total. En este ejemplo, N = 100, ya que hay 100 estudiantes
en total.
- K: El número de elementos en la población que tienen una característica específica. En
este ejemplo, K = 60, ya que hay 60 mujeres en la población.
- n: El tamaño de la muestra. En este ejemplo, n = 10, ya que estamos tomando una
muestra de tamaño 10.
Paso 2: Formula la fórmula de la distribución.
La fórmula para calcular la probabilidad de la distribución hipergeométrica es:
P(X = x) = (C(K, x) * C(N-K, n-x)) / C(N, n)
Donde:
- X es la variable aleatoria que representa el número de elementos con una característica
específica en la muestra.
- x es el valor específico que queremos calcular, en este caso, x = 4.
- C(a, b) es el coeficiente binomial, que se calcula como C(a, b) = a! / (b! * (a-b)!).
- N es el tamaño de la población total.
- K es el número de elementos en la población con la característica específica.
- n es el tamaño de la muestra.
Paso 3: Calcula la probabilidad.
Sustituyendo los valores en la fórmula, tenemos:
P(X = 4) = (C(60, 4) * C(100-60, 10-4)) / C(100, 10)
P(X = 4) = (C(60, 4) * C(40, 6)) / C(100, 10)

P(X = 4) ≈ (15 * 84) / 17310309456440

P(X = 4) ≈ 0.000128

Por lo tanto, la probabilidad de que en una muestra de tamaño 10 haya exactamente 4 mujeres es
aproximadamente 0.000128 o 0.0128%.

Autores relacionados:
La distribución hipergeométrica ha sido estudiada por varios matemáticos a lo largo del tiempo.
Algunos de los autores relacionados incluyen a Pierre-Simon Laplace, Carl Friedrich Gauss,
William Sealy Gosset (conocido como Student) y Ronald Fisher. Estos matemáticos y
estadísticos han contribuido al desarrollo y aplicación de la distribución hipergeométrica en la
teoría de probabilidad y estadística.
La distribución hipergeométrica es ampliamente utilizada en áreas como la genética, el muestreo
de poblaciones finitas y la auditoría de calidad, donde es necesario tener en cuenta el tamaño
finito de la población y el muestreo sin reemplazo.

DISTRIBUCIÓN MULTINOMIAL
Es una distribución de probabilidad discreta que generaliza la distribución binomial y se utiliza
para modelar experimentos en los que se observa el número de ocurrencias de varios resultados
posibles en múltiples ensayos independientes. Esta distribución es útil cuando estamos
interesados en contar el número de ocurrencias en varias categorías diferentes.

Características de la distribución multinomial:


● Múltiples categorías: La distribución multinomial se utiliza cuando estamos interesados
en contar el número de ocurrencias en varias categorías diferentes. Cada categoría tiene
una probabilidad de ocurrencia asociada.

● Experimentos independientes: Se asume que los ensayos son independientes entre sí. Es
decir, el resultado de un ensayo no afecta el resultado de los ensayos subsiguientes.

● Parámetros: La distribución multinomial está determinada por dos parámetros: n (número


total de ensayos) y p1, p2,..., pk (probabilidades de ocurrencia en cada categoría). La
suma de las probabilidades debe ser igual a 1.

● Función de masa de probabilidad: La función de masa de probabilidad (PMF) de la


distribución multinomial se utiliza para calcular la probabilidad de observar un conjunto
específico de ocurrencias en cada categoría.

Grafico:
Figura 1
Distribución multinomial

Nota: Gráfico sobre la estimación de las frecuencias relativas estación Agronomía (Cardenas,
s.f.)

Fórmula de la distribución multinomial:


La fórmula de la función de masa de probabilidad (PMF) de la distribución multinomial es:
P(X = x1, x2, ..., xk) = (n! / (x1! * x2! * ... * xk!)) * (p1^x1) * (p2^x2) * ... * (pk^xk)
Donde:
o X = un vector de variables aleatorias que representan el número de ocurrencias en cada
categoría.
o xi = el número de ocurrencias en la categoría i.
o n = el número total de ensayos.
o pi = la probabilidad de ocurrencia en la categoría i.
o x1! * x2! * ... * xk! = el producto de las factoriales de los números de ocurrencias en cada
categoría.
EJEMPLO
Supongamos que estás investigando las preferencias de color de los estudiantes de una escuela.
Tienes una muestra de 80 estudiantes y les pides que elijan su color favorito de una lista de 5
opciones: rojo, azul, verde, amarillo y blanco. Quieres determinar la probabilidad de que en tu
muestra haya 25 estudiantes que prefieran el color rojo, 20 que prefieran el color azul, 15 que
prefieran el color verde, 10 que prefieran el color amarillo y 10 que prefieran el color blanco.
Paso 1: Identifica los parámetros de la distribución.
En este caso, los parámetros de la distribución multinomial son:

- n: El tamaño de la muestra total. En este ejemplo, n = 80, ya que tienes una muestra de 80
estudiantes.
- p₁, p₂, p₃, p₄, p₅: Las probabilidades de éxito para cada categoría de color. En este caso,
tienes 5 opciones de color, por lo que tendrías p₁, p₂, p₃, p₄ y p₅.
- x₁, x₂, x₃, x₄, x₅: El número de éxitos observados para cada categoría. En este ejemplo, x₁
= 25 (estudiantes que prefieren el color rojo), x₂ = 20 (estudiantes que prefieren el color
azul), x₃ = 15 (estudiantes que prefieren el color verde), x₄ = 10 (estudiantes que prefieren
el color amarillo) y x₅ = 10 (estudiantes que prefieren el color blanco).
Paso 2: Formula la fórmula de la distribución.
La fórmula para calcular la probabilidad de la distribución multinomial es:

P(X₁ = x₁, X₂ = x₂, X₃ = x₃, X₄ = x₄, X₅ = x₅) = (n! / (x₁! * x₂! * x₃! * x₄! * x₅!)) * (p₁^x₁) *
(p₂^x₂) * (p₃^x₃) * (p₄^x₄) * (p₅^x₅)
Donde:
- X₁, X₂, X₃, X₄, X₅ son las variables aleatorias que representan el número de éxitos
observados para cada categoría de color.
- x₁, x₂, x₃, x₄, x₅ son los valores específicos que queremos calcular, en este caso, x₁ = 25,
x₂ = 20, x₃ = 15, x₄ = 10 y x₅ = 10.
- n es el tamaño de la muestra total.
- p₁, p₂, p₃, p₄, p₅ son las probabilidades de éxito para cada categoría de color.
Paso 3: Calcula la probabilidad.
Supongamos que las probabilidades de éxito para cada categoría de color son:
- p₁ = 0.3 (probabilidad de preferir el color rojo)
- p₂ = 0.25 (probabilidad de preferir el color azul)
- p₃ = 0.2 (probabilidad de preferir el color verde)
- p₄ = 0.1 (probabilidad de preferir el color amarillo)
- p₅ = 0.15 (probabilidad de preferir el color blanco)
La fórmula para calcular la probabilidad de la distribución multinomial es:

P(X₁ = 25, X₂ = 20, X₃ = 15, X₄ = 10, X₅ = 10) = (80! / (25! * 20! * 15! * 10! * 10!)) *
(0.3^25) * (0.25^20) * (0.2^15) * (0.1^10) * (0.15^10)
En base a ello se le calcula las factoriales, simplifica los factores, calcula la potencia para
luego multiplicar todos los términos, utilizando una calculadora o software estadístico.

Autores relacionados:
La distribución multinomial ha sido estudiada y utilizada por varios matemáticos y estadísticos a
lo largo del tiempo. Algunos autores relacionados incluyen a William Feller, Karl Pearson,
Ronald Fisher y Jerzy Neyman. Estos matemáticos y estadísticos han realizado contribuciones
significativas en el desarrollo y aplicación de la distribución multinomial en la teoría de
probabilidad y estadística.

La distribución multinomial se utiliza ampliamente en diferentes campos, como la genética, la


investigación de mercados, la encuesta de opiniones y la ciencia de datos, donde se requiere
modelar el número de ocurrencias en múltiples categorías.

DISTRIBUCIÓN HIPERGEOMÉTRICA MULTIVARIADA


DISTRIBUCIÓN UNIFORME
Es una distribución de probabilidad continua que se caracteriza por asignar la misma
probabilidad a todos los valores posibles dentro de un intervalo dado. En otras palabras, todos los
valores dentro del intervalo tienen la misma probabilidad de ocurrir.
Características de la distribución uniforme:
● Rango constante: La distribución uniforme se utiliza cuando todos los valores dentro de
un intervalo tienen la misma probabilidad de ocurrencia. No hay sesgo hacia ningún valor
en particular.

● Probabilidad constante: La probabilidad de que un valor caiga en cualquier subintervalo


del rango dado es proporcional al tamaño de ese subintervalo en relación con el tamaño
total del rango.

● Distribución continua: A diferencia de la distribución discreta, la distribución uniforme es


continua, lo que significa que puede tomar cualquier valor dentro del intervalo
especificado.

● Parámetros: Los parámetros clave de la distribución uniforme son el límite inferior (a) y
el límite superior (b) del intervalo dentro del cual se distribuyen los valores.

Grafico:
Figura 1
Distribución uniforme

Nota: Gráfico de la función de densidad de la distribución uniforme continúa normalizada,


(Lifeder, s.f.)
La fórmula general para la densidad de probabilidad de una distribución uniforme continua es:

- f(x) = 1 / (b - a) para a ≤ x ≤ b
- f(x) = 0 para x < a o x > b

Donde:

o f(x) = la función de densidad de probabilidad.


o a y b son los límites inferior y superior, respectivamente.
EJEMPLO 01
Supongamos que estás estudiando el tiempo de respuesta de un sistema informático, y deseas
analizar la distribución del tiempo que tarda en procesar una solicitud. El sistema tiene un tiempo
mínimo de respuesta de 1 segundo y un tiempo máximo de respuesta de 5 segundos.

Paso 1: Definir la variable aleatoria


En este caso, la variable aleatoria X representa el tiempo de respuesta de una solicitud.
Paso 2: Determinar el rango de la distribución
La distribución uniforme se caracteriza por tener un rango definido de valores. En este ejemplo,
el rango de la distribución es de 1 segundo a 5 segundos.
Paso 3: Calcular el ancho del intervalo
El ancho del intervalo se calcula restando el valor mínimo del valor máximo del rango: Ancho =
Valor máximo - Valor mínimo = 5 - 1 = 4 segundos.
Paso 4: Calcular la función de densidad de probabilidad (PDF)
En la distribución uniforme, la función de densidad de probabilidad es constante dentro del rango
y cero fuera de él. En este caso, la PDF es:

- f(x) = 1 / Ancho = 1 / 4, para x entre 1 y 5.


- f(x) = 0, para x fuera de 1 a 5.

Paso 5: Calcular la función de distribución acumulada (CDF)


La función de distribución acumulada es una medida de la probabilidad acumulada hasta un
determinado valor de la variable aleatoria. En la distribución uniforme, la CDF se calcula
dividiendo la diferencia entre el valor actual y el valor mínimo por el ancho del intervalo. En este
caso, la CDF es:
- F(x) = (x - Valor mínimo) / Ancho = (x - 1) / 4, para x entre 1 y 5.
- F(x) = 0, para x < 1.
- F(x) = 1, para x ≥ 5.

Paso 6: Calcular probabilidades específicas


Si deseas calcular la probabilidad de que el tiempo de respuesta esté en un intervalo específico,
simplemente resta las CDF correspondientes. Por ejemplo, para calcular la probabilidad de que el
tiempo de respuesta esté entre 2 y 4 segundos:

- P(2 ≤ X ≤ 4) = F(4) - F(2) = (4 - 1) / 4 - (2 - 1) / 4 = 3/4 - 1/4 = 2/4 = 0.5.

Autores relacionados:
La distribución uniforme ha sido estudiada y utilizada en diversos campos de la matemática y la
estadística. Algunos autores relacionados con la distribución uniforme son:

o Ronald A. Fisher: Fue un estadístico británico que hizo importantes contribuciones al


desarrollo de la teoría de la probabilidad y las distribuciones de probabilidad, incluida la
distribución uniforme.

o Leonard J. Savage: Fue un estadístico y matemático estadounidense que también realizó


investigaciones en teoría de la probabilidad y distribuciones de probabilidad, incluida la
distribución uniforme.

o Morris H. DeGroot: Fue un estadístico y profesor de la Universidad Carnegie Mellon


que escribió varios libros de estadística y probabilidad, incluyendo temas relacionados
con la distribución uniforme.

Estos autores y otros han contribuido a la teoría y aplicación de la distribución uniforme en


diversos contextos y disciplinas, como la estadística, la teoría de la probabilidad, la econometría
y la física, entre otros.
DISTRIBUCIÓN EXPONENCIAL
Es una distribución de probabilidad continua que se utiliza para modelar el tiempo de espera
entre eventos que ocurren de manera independiente a una tasa constante. Es comúnmente
utilizada en problemas que involucran el tiempo de vida de un objeto, el tiempo de espera en una
cola, o el tiempo entre llegadas de eventos.

Características de la distribución exponencial:

● Tiempo de espera constante: La distribución exponencial se caracteriza por tener un


tiempo de espera constante entre eventos sucesivos. Esto significa que la probabilidad de
que ocurra un evento en un intervalo de tiempo dado es proporcional a la longitud de ese
intervalo.

● Distribución asimétrica: La distribución exponencial es asimétrica positiva, lo que


significa que su cola se extiende hacia la derecha y no tiene límite superior.

● Parámetro de tasa: El parámetro clave de la distribución exponencial es la tasa λ


(lambda), que representa la tasa media de ocurrencia de los eventos. La tasa es el inverso
del valor medio de la distribución (1/λ).

Grafico:
Figura 1
Distribución exponencial

Nota: gráfico de una función de densidad de una distribución exponencial de parámetro,


(Distribución exponencial, s.f.).
Fórmula de la función de densidad de probabilidad: La función de densidad de probabilidad
(PDF) de la distribución exponencial está dada por la fórmula:

- f(x) = λ * exp(-λx) para x ≥ 0


- f(x) = 0 para x < 0
Donde:
f(x) = La función de densidad de probabilidad.
λ = La tasa de ocurrencia de eventos.
x = La variable aleatoria que representa el tiempo de espera.
EJEMPLO 01
Supongamos que estás estudiando el tiempo de espera en una fila de un supermercado. Quieres
analizar la distribución del tiempo que tarda en atender a cada cliente. Sabes que el tiempo
promedio de espera es de 2 minutos.
Paso 1: Definir la variable aleatoria
En este caso, la variable aleatoria X representa el tiempo de espera de un cliente en minutos.
Paso 2: Definir el parámetro de la distribución
La distribución exponencial se caracteriza por un parámetro λ, que representa la tasa media de
ocurrencia de eventos. En este ejemplo, la tasa media es de 1/2 (ya que el tiempo promedio de
espera es de 2 minutos, y λ = 1 / tiempo promedio).
Paso 3: Calcular la función de densidad de probabilidad (PDF)
La función de densidad de probabilidad (PDF) de la distribución exponencial es:

- f(x) = λ * e^(-λx), para x ≥ 0.


- f(x) = 0, para x < 0.

En nuestro caso, f(x) = (1/2) * e^(-x/2), para x ≥ 0.

Paso 4: Calcular la función de distribución acumulada (CDF)


La función de distribución acumulada (CDF) de la distribución exponencial es:
- F(x) = 1 - e^(-λx), para x ≥ 0.
- F(x) = 0, para x < 0.
En nuestro caso, F(x) = 1 - e^(-x/2), para x ≥ 0.

Paso 5: Calcular probabilidades específicas


Si deseas calcular la probabilidad de que el tiempo de espera sea menor o igual a un valor
específico, simplemente evalúa la CDF en ese valor. Por ejemplo, para calcular la probabilidad
de que el tiempo de espera sea menor o igual a 3 minutos:

- P(X ≤ 3) = F(3) = 1 - e^(-3/2).

Paso 6: Calcular valores medios y varianza


El valor medio (esperanza) de la distribución exponencial se calcula como 1 / λ. En nuestro caso,
el valor medio es 1 / (1/2) = 2 minutos.

La varianza de la distribución exponencial es igual a (1 / λ^2). En nuestro caso, la varianza es


(1 / (1/2)^2) = 4 minutos^2.

Autores relacionados:
Varios autores han contribuido al estudio y desarrollo de la distribución exponencial en el campo
de la teoría de la probabilidad y la estadística. Algunos de ellos son:

o Paul Lévy: Fue un matemático francés conocido por sus contribuciones a la teoría de la
probabilidad, incluyendo la distribución exponencial.

o Maurice Fréchet: Fue un matemático francés que realizó investigaciones en estadística y


teoría de la probabilidad, y contribuyó al estudio de la distribución exponencial.

o Ronald A. Fisher: Un estadístico británico que hizo importantes contribuciones a la teoría


de la probabilidad y las distribuciones de probabilidad, incluida la distribución
exponencial.

Estos y otros autores han desempeñado un papel importante en el desarrollo teórico y aplicado de
la distribución exponencial, y sus contribuciones han sido fundamentales para su comprensión y
aplicación en diversos campos, como la física, la economía, la ingeniería y la ciencia de datos.
-FUNCION GAMMA
Es una función matemática que desempeña un papel importante en la teoría de probabilidades y
la estadística. Es una extensión de la noción de factorial a números reales y complejos. La
función Gamma se denota como Γ(z) y se define para números complejos z con una parte real
positiva.

La función Gamma tiene varias propiedades y aplicaciones en probabilidades y estadística:

Relación con la distribución gamma: La función Gamma está estrechamente relacionada con la
distribución gamma. De hecho, la distribución gamma se llama así debido a la función Gamma.
La función de densidad de probabilidad de la distribución gamma contiene la función Gamma
como parte de su expresión.

● Factorial generalizada: La función Gamma generaliza el concepto de factorial. Para


números enteros positivos n, se tiene Γ(n) = (n-1)!, donde (n-1)! denota el factorial de n-
1. Por lo tanto, la función Gamma proporciona una forma de calcular la factorial de
números no enteros o negativos.

● Propiedades de recurrencia: La función Gamma satisface varias propiedades de


recurrencia útiles, como la relación Γ(z+1) = zΓ(z), que permite calcular el valor de la
función Gamma para diferentes valores de z.

● Relación con la distribución de Poisson: La función Gamma también está relacionada con
la distribución de Poisson. En particular, si λ es un parámetro de la distribución de
Poisson, entonces Γ(λ) representa el número esperado de eventos antes de que ocurra el
primer evento en un proceso de Poisson.

● Aplicaciones en estadística: La función Gamma se utiliza en diversas aplicaciones


estadísticas, como la estimación de parámetros, la modelización de datos de
supervivencia, el análisis de colas y el cálculo de probabilidades en distribuciones
continuas.

La fórmula general de la función Gamma es:


Γ(z) = ∫[0, ∞] x^(z-1) * e^(-x) dx

Donde:
● z es un número complejo o real positivo.

La función Gamma tiene varias propiedades y relaciones con otras funciones, como la relación
de recursión:

● Γ(z+1) = z * Γ(z)

Además, la función Gamma está relacionada con la distribución gamma mediante la fórmula de
densidad de probabilidad:

● f(x; α, β) = (1 / (β^α * Γ(α))) * x^(α-1) * e^(-x/β)

donde α y β son los parámetros de la distribución gamma y Γ(α) es la función Gamma evaluada
en α.

EJEMPLO:
Supongamos que quieres calcular el valor de Γ(4).

Paso 1: Identificar el valor de z


En este caso, z es igual a 4.

Paso 2: Aplicar la fórmula de la función Gamma


La fórmula de la función Gamma es:

Γ(z) = ∫[0, ∞] x^(z-1) * e^(-x) dx

En nuestro caso, Γ(4) = ∫[0, ∞] x^(4-1) * e^(-x) dx.


Paso 3: Resolver la integral definida
Para calcular la integral definida, puedes utilizar técnicas de integración, como integración por
partes o sustituciones.
En este caso, la integral se puede resolver de la siguiente manera:

Γ(4) = ∫[0, ∞] x^3 * e^(-x) dx

= [-x^3 * e^(-x)]|₀^∞ + ∫[0, ∞] 3x^2 * e^(-x) dx

= 0 + ∫[0, ∞] 3x^2 * e^(-x) dx

Aplicando el mismo proceso nuevamente:

Γ(4) = 0 + [3 * (-x^2 * e^(-x))]|₀^∞ + ∫[0, ∞] 6x * e^(-x) dx


= 0 + 0 + ∫[0, ∞] 6x * e^(-x) dx

Una vez más:


Γ(4) = 0 + 0 + [6 * (-x * e^(-x))]|₀^∞ + ∫[0, ∞] 6 * e^(-x) dx

= 0 + 0 + 0 + ∫[0, ∞] 6 * e^(-x) dx
= 6 * ∫[0, ∞] e^(-x) dx
= 6 * [-e^(-x)]|₀^∞
= 6 * (0 - (-1))
=6

Por lo tanto, Γ(4) = 6


Autores relacionados:
Varios matemáticos y estadísticos han realizado contribuciones significativas al estudio y
aplicación de la función Gamma en probabilidades y estadística. Algunos autores destacados
son:

o Adrien-Marie Legendre: Fue un matemático francés que hizo importantes


contribuciones al análisis matemático, incluyendo la función Gamma.

o Carl Friedrich Gauss: Fue un matemático alemán que también estudió la función
Gamma y sus propiedades.

o Karl Pearson: Fue un estadístico británico conocido por su trabajo en teoría de la


probabilidad y estadística, y utilizó la función Gamma en sus investigaciones.
o Harold Jeffreys: Fue un estadístico y geofísico británico que realizó
contribuciones significativas al campo de la inferencia estadística y utilizó la
función Gamma en sus investigaciones.

Estos y otros autores han contribuido al estudio y aplicación de la función Gamma en


probabilidades y estadística, y sus trabajos han sido fundamentales para el desarrollo de la teoría
y las aplicaciones de esta función en estos campos.

DISTRIBUCION NORMAL (Distribución de Gauss o Distribución gaussiana)


Es una de las distribuciones de probabilidad más importantes y ampliamente utilizadas en
estadística. Es una distribución continua que se caracteriza por tener una forma de campana
simétrica alrededor de su media, lo que la hace adecuada para modelar muchas variables en la
naturaleza y en los datos observados.
Grafico:
Figura 1
Distribución normal

Nota: Gráfico sobre la función de densidad de una distribución normal, (Rodo, 2019)
Características de la distribución normal:

● Simetría: La distribución normal es simétrica alrededor de su media. Esto significa que


la mitad de la distribución se encuentra a cada lado de la media y la curva de distribución
es simétrica.
● Media, mediana y moda iguales: La media, la mediana y la moda de una distribución
normal son iguales y se encuentran en el centro de la distribución. Este valor central es
también el punto de máxima densidad de probabilidad.
● Distribución definida por dos parámetros: La distribución normal está completamente
definida por su media (μ) y su desviación estándar (σ). La media determina la posición
central de la distribución, mientras que la desviación estándar controla la dispersión de
los valores alrededor de la media.

● Curva de campana: La distribución normal tiene una forma de campana suave y


simétrica. A medida que nos alejamos de la media en cualquier dirección, la densidad de
probabilidad disminuye gradualmente.
● Regla empírica: La distribución normal sigue la regla empírica, también conocida como
regla de tres sigmas, que establece que aproximadamente el 68% de los datos se
encuentran dentro de una desviación estándar de la media, el 95% dentro de dos
desviaciones estándar y el 99.7% dentro de tres desviaciones estándar.

Fórmula de la distribución normal:


La función de densidad de probabilidad (PDF) de la distribución normal está dada por la
fórmula:

f(x) = (1 / (σ√(2π))) * exp(-((x - μ)² / (2σ²)))

Donde:
● f(x) = La función de densidad de probabilidad.
● x = La variable aleatoria que representa el valor en la distribución.
● μ = La media de la distribución.
● σ = La desviación estándar de la distribución.

Autores relacionados:
La distribución normal ha sido estudiada y utilizada por muchos matemáticos y estadísticos a lo
largo de la historia. Algunos autores relacionados con la distribución normal son:
o Carl Friedrich Gauss: Fue un matemático alemán que contribuyó significativamente al
desarrollo de la estadística y la teoría de probabilidades. Gauss es conocido por su trabajo
en la distribución normal y por su método de los mínimos cuadrados.

o Abraham de Moivre: Fue un matemático francés-británico que trabajó en estadística y


teoría de probabilidades. Es conocido por sus contribuciones al desarrollo de la
distribución normal y por su teorema del límite central.

o Pierre-Simon Laplace: Fue un matemático y astrónomo francés que realizó importantes


contribuciones a la teoría de probabilidades. Laplace trabajó en la distribución normal y
en la inferencia estadística

TABLA DE LA DISTRIBUCIÓN NORMAL


Propiedad reproductiva
También conocida como propiedad de la multiplicación, es una propiedad fundamental en la
teoría de probabilidades y estadística que se aplica a la probabilidad conjunta de eventos
independientes. Esta propiedad establece que la probabilidad conjunta de que dos o más eventos
independientes ocurran simultáneamente es igual al producto de sus probabilidades individuales.

Formalmente, si A y B son eventos independientes, la propiedad reproductiva se expresa de la


siguiente manera:

P(A ∩ B) = P(A) * P(B)

Esta propiedad se puede generalizar a más de dos eventos independientes. Si A1, A2, ..., An son
eventos independientes, entonces la probabilidad conjunta de que todos ellos ocurran
simultáneamente es igual al producto de sus probabilidades individuales:

P(A1 ∩ A2 ∩ ... ∩ An) = P(A1) * P(A2) * ... * P(An)

La propiedad reproductiva es útil en el cálculo de probabilidades de eventos conjuntos en


situaciones donde los eventos son independientes entre sí. Permite simplificar el cálculo al
descomponer el evento conjunto en eventos individuales y multiplicar sus probabilidades
correspondientes.

Es importante tener en cuenta que la propiedad reproductiva solo se aplica a eventos


independientes. Si los eventos no son independientes, no se puede utilizar esta propiedad para
calcular la probabilidad conjunta.

La propiedad reproductiva tiene aplicaciones en diversos campos, como el análisis de riesgos, la


teoría de colas, el muestreo aleatorio y la teoría de juegos, donde se requiere calcular la
probabilidad conjunta de múltiples eventos independientes.
En resumen, la propiedad reproductiva en probabilidades y estadística establece que la
probabilidad conjunta de eventos independientes es igual al producto de sus probabilidades
individuales. Esta propiedad es fundamental para simplificar el cálculo de probabilidades
conjuntas en situaciones donde los eventos son independientes entre sí.
Teorema del límite central
Es un teorema fundamental en la teoría de probabilidades y estadística que establece que la suma
o promedio de un gran número de variables aleatorias independientes e idénticamente
distribuidas (IID) tiende a tener una distribución normal, independientemente de la forma de la
distribución original.

Características y aplicaciones del teorema del límite central:

● Independencia e identidad: El teorema del límite central se aplica a variables aleatorias


independientes e idénticamente distribuidas (IID). Esto significa que las variables deben
ser estadísticamente independientes y tener la misma distribución de probabilidad.

● Tamaño de muestra suficientemente grande: El teorema del límite central


establece que el tamaño de muestra debe ser lo suficientemente grande para
que la aproximación normal sea válida. Generalmente, se considera que n ≥
30 es un tamaño de muestra adecuado.
● Aplicaciones en inferencia estadística: El teorema del límite central es fundamental en
la inferencia estadística, ya que proporciona la base teórica para muchas pruebas de
hipótesis y construcción de intervalos de confianza basados en la distribución normal.

● Aproximación de distribuciones no normales: El teorema del límite central permite


aproximar la distribución de una suma o promedio de variables aleatorias a una
distribución normal, incluso si las variables originales no siguen una distribución normal.
Esto facilita los cálculos y el análisis en muchos problemas estadísticos.

● Importancia en muestreo y estimación: El teorema del límite central es esencial en el


muestreo aleatorio y la estimación de parámetros. Permite realizar inferencias sobre una
población utilizando muestras grandes, incluso cuando se desconoce la distribución de la
población.

El teorema del límite central es uno de los resultados más importantes en estadística y ha sido
ampliamente estudiado y aplicado por muchos estadísticos y matemáticos a lo largo de la
historia. Su relevancia y utilidad en diversos campos de la estadística hacen que sea una
herramienta fundamental en el análisis de datos y la inferencia estadística.
Enunciado del teorema del límite central:
Sea X1, X2, ..., Xn una secuencia de variables aleatorias IID con una media μ y una desviación
estándar σ finitas. Si n es lo suficientemente grande, entonces la suma o promedio de estas
variables aleatorias, detonado como S_n = X1 + X2 + ... + Xn o M_n = (X1 + X2 + ... + Xn) / n,
se aproxima a una distribución normal con una media μ y una desviación estándar σ/sqrt(n)
cuando n tiende al infinito.
Las formulaciones más comunes del teorema del límite central para la suma de variables
aleatorias:

Sea X1, X2, ..., Xn una secuencia de variables aleatorias independientes e idénticamente
distribuidas (IID) con una media μ y una varianza finita σ². La suma de estas variables aleatorias
estandarizada, denotada como Z_n, se define como:

Z_n = (X1 + X2 + ... + Xn - nμ) / (σ√n)

El teorema del límite central establece que, cuando n tiende a infinito, la distribución de Z_n se
aproxima a una distribución normal estándar (con media 0 y varianza 1), es decir:

lim(n → ∞) P(Z_n ≤ z) = Φ(z)

Donde Φ(z) es la función de distribución acumulativa de una distribución normal estándar. Esta
formulación del teorema del límite central implica que la suma de variables aleatorias
independientes e idénticamente distribuidas tiende a seguir una distribución normal cuando el
tamaño de muestra es suficientemente grande.

En términos más simples, el teorema del límite central establece que, bajo ciertas condiciones, la
distribución de la suma o promedio de un gran número de variables aleatorias independientes e
idénticamente distribuidas se asemeja a una distribución normal, sin importar cuál sea la forma
de la distribución original. Este resultado es muy útil en la práctica, ya que permite
aproximaciones normales en muchos problemas de muestreo y estimación.

Ley de los grandes números


Es un teorema fundamental en la teoría de probabilidades y estadística que establece que, a
medida que aumenta el número de repeticiones de un experimento aleatorio, la media de los
resultados tiende a converger hacia el valor esperado o valor medio de la distribución de
probabilidad.
La ley de los grandes números se basa en la idea de que, a medida que se realizan más
observaciones o repeticiones de un experimento aleatorio, la variabilidad inherente tiende a
amortiguarse y los resultados se acercan más al valor esperado teórico. Esta ley proporciona una
base sólida para la inferencia estadística y la toma de decisiones basada en datos empíricos.
Existen diferentes formulaciones de la ley de los grandes números, pero todas comparten
características clave:
Independencia e idéntica distribución: La ley de los grandes números se aplica a una secuencia
de variables aleatorias independientes e idénticamente distribuidas (IID). Esto significa que las
variables aleatorias deben ser estadísticamente independientes y tener la misma distribución de
probabilidad.
o Media convergente: La ley de los grandes números establece que, a medida que aumenta
el tamaño de muestra o el número de repeticiones, la media de los resultados se acerca al
valor esperado o valor medio de la distribución de probabilidad. Matemáticamente, esto
se expresa como:

lim(n → ∞) X_n = E(X)

Donde:
● X_n = La media de los primeros n resultados
● E(X) = El valor esperado de la variable aleatoria.

o Convergencia en probabilidad: La ley de los grandes números se refiere a la


convergencia en probabilidad, lo que significa que la probabilidad de que la media se
aleje del valor esperado disminuye a medida que aumenta el tamaño de muestra. En otras
palabras, a medida que se realizan más repeticiones, es menos probable que los resultados
se desvíen significativamente del valor esperado.

o Importancia en la inferencia estadística: La ley de los grandes números es fundamental


para la inferencia estadística, ya que proporciona la base para estimar parámetros
poblacionales basándose en muestras aleatorias. Permite obtener conclusiones confiables
sobre la población utilizando datos limitados.
En resumen, la ley de los grandes números establece que, a medida que aumenta el número de
repeticiones de un experimento aleatorio, la media de los resultados tiende a converger hacia el
valor esperado de la distribución de probabilidad. Esta ley es esencial en la estadística y
proporciona una base para la inferencia estadística y la toma de decisiones basada en
datos empíricos.

DISTRIBUCIONES MUESTRALES
Son distribuciones de probabilidad que describen las propiedades de una estadística muestral
basada en muestras aleatorias de una población. Estas distribuciones son fundamentales en la
inferencia estadística, ya que permiten realizar estimaciones puntuales, intervalos de confianza y
pruebas de hipótesis sobre los parámetros poblacionales.
Características
● Media: La media de una distribución muestral es igual al valor esperado de la estadística
muestral.
● Varianza: La varianza de una distribución muestral es igual a la varianza de la estadística
muestral dividida por el tamaño de muestra.
● Forma asintótica: A medida que el tamaño de muestra aumenta, la distribución muestral
se aproxima a una distribución normal debido al teorema del límite central.
● Fórmula general: La fórmula general para una distribución muestral depende de la
estadística muestral específica que se esté considerando. Por ejemplo, si se está
trabajando con la media muestral, la fórmula general para la distribución muestral de la
media (con una población de media μ y desviación estándar σ) se define como:

Z = (X̄ - μ) / (σ / √n)
Donde:
● Z = Una variable aleatoria que sigue una distribución normal estándar.
● X̄ = La media muestral, μ es la media poblacional.
● σ = La desviación estándar poblacional.
● n = El tamaño de muestra.

Las distribuciones muestrales son esenciales para realizar inferencias sobre los parámetros
desconocidos de una población. Al comprender las características y la fórmula general de las
distribuciones muestrales, los estadísticos pueden realizar estimaciones y pruebas de hipótesis
basadas en las propiedades de las estadísticas muestrales.
Grafico:
Figura 1
Distribuciones muestrales

Nota: Gráfico de medias muestrales e intervalos de confianza para la media, (Gonzalez, s.f.)

EJEMPLO
Supongamos que tienes una población de 1000 estudiantes universitarios y quieres calcular la
media muestral de altura utilizando una muestra de tamaño 50.
Paso 1: Definir la población y la muestra
La población en este caso es el conjunto de 1000 estudiantes universitarios. La muestra es un
subconjunto de la población, en este caso, de tamaño 50.
Paso 2: Recolectar los datos de la muestra
Recopila los datos de altura de los 50 estudiantes seleccionados aleatoriamente de la población.
Supongamos que los datos de altura de la muestra son los siguientes:
170 cm, 165 cm, 175 cm, 180 cm, ..., (hasta llegar a los 50 valores de altura)
Paso 3: Calcular la media muestral
La media muestral se calcula sumando todos los valores de la muestra y dividiendo el resultado
entre el tamaño de la muestra.
En nuestro caso, la media muestral sería:
media muestral = (170 + 165 + 175 + 180 + ... + (hasta llegar a los 50 valores de altura)) / 50
Paso 4: Repetir el proceso de muestreo
La idea de las distribuciones muestrales es obtener múltiples muestras y calcular la estadística de
interés en cada una de ellas. Esto nos permitirá entender la variabilidad de la estadística de
interés.
Supongamos que repetimos el proceso de muestreo 100 veces y obtenemos 100 medias
muestrales.
Paso 5: Calcular la media y la desviación estándar de las medias muestrales
Calcula la media de las medias muestrales obtenidas en el paso anterior. Esta será una estimación
de la media poblacional.
También calcula la desviación estándar de las medias muestrales. Esta medida de dispersión nos
indicará cuánto varían las medias muestrales alrededor de la media de las medias muestrales.
Paso 6: Representar la distribución muestral
Para visualizar la distribución muestral, puedes utilizar un histograma o un gráfico de densidad.
En el eje horizontal, coloca las medias muestrales y en el eje vertical, coloca la frecuencia o la
densidad correspondiente.
Paso 7: Interpretar los resultados
Analiza la distribución muestral obtenida. Observa la forma de la distribución y la dispersión de
las medias muestrales alrededor de la media poblacional. Esto te permitirá hacer inferencias
sobre la población en base a las muestras obtenidas.

DISTRIBUCIÓN CHI CUADRADO


La distribución Chi cuadrado se utiliza para modelar la suma de los cuadrados de variables
aleatorias normales estándar e independientes. Es decir, si X₁, X₂, ..., Xₙ son variables aleatorias
normales estándar e independientes, entonces la variable aleatoria Y definida como:

Y = X₁² + X₂² + ... + Xₙ²

sigue una distribución Chi cuadrado con n grados de libertad, denotada como χ²(n).
Características:
● Forma de la distribución: La distribución Chi cuadrado tiene forma asimétrica y está
sesgada hacia la derecha. La forma de la distribución depende del número de grados de
libertad.
● Grados de libertad: Los grados de libertad en la distribución Chi cuadrado determinan
su forma y dispersión. Cuanto mayor sea el número de grados de libertad, más se
asemejará la distribución a una forma de campana simétrica.
● Utilidad en inferencia estadística: La distribución Chi cuadrado se utiliza para realizar
pruebas de hipótesis sobre la varianza de una población o para construir intervalos de
confianza para la varianza.
● Relación con otras distribuciones: La distribución Chi cuadrado está relacionada con la
distribución normal y la distribución t de Student. Específicamente, si X es una variable
aleatoria normal estándar, entonces X² sigue una distribución Chi cuadrado con 1 grado
de libertad. Además, la distribución t de Student se puede obtener como la raíz cuadrada
de una variable Chi cuadrado dividida por los grados de libertad.
Fórmula:
La fórmula para calcular la función de densidad de probabilidad (pdf) de la distribución Chi
cuadrado es:

f(x) = (1 / (2^(n/2) * Γ(n/2))) * x^((n/2) - 1) * e^(-x/2)

Donde:
● f(x) = La función de densidad de probabilidad de la variable aleatoria Chi cuadrado.
● Γ= representa la función gamma.
● n = El número de grados de libertad.
TABLA DE LA DISTRIBUCIÓN CHI CUADRADO
Nota: Tabla de la distribución chi cuadrado, (Andes, 2014)

Autores relacionados:
La distribución Chi cuadrado ha sido estudiada por varios estadísticos y matemáticos a lo largo
de la historia. Algunos de los autores más destacados relacionados con la distribución Chi
cuadrado son:

o Karl Pearson: Pearson fue un estadístico británico que realizó contribuciones


significativas al desarrollo de la estadística y la distribución Chi cuadrado. Es conocido
por su trabajo en correlación y pruebas de bondad de ajuste, que utilizan la distribución
Chi cuadrado.

o Ronald A. Fisher: Fisher fue un estadístico y biólogo británico que hizo importantes
contribuciones al campo de la estadística. Fue pionero en el uso de la distribución Chi

DISTRIBUCION T DE STUDENT
La distribución t de Student es una distribución de probabilidad que se utiliza cuando se trabaja
con muestras pequeñas y la varianza poblacional es desconocida. Esta distribución se emplea
para realizar pruebas de hipótesis y construir intervalos de confianza para la media poblacional.
Características:
● Forma de la distribución: La distribución t de Student tiene forma simétrica y estándar
en el centro, pero tiene colas más pesadas que la distribución normal. La forma de la
distribución depende del tamaño de la muestra.

● Grados de libertad: Los grados de libertad en la distribución t de Student determinan su


forma y dispersión. Cuanto mayor sea el número de grados de libertad, más se asemejará
la distribución a una forma de campana simétrica similar a la distribución normal.

● Utilidad en inferencia estadística: La distribución t de Student se utiliza cuando se


desconoce la varianza poblacional y se trabaja con muestras pequeñas. Permite realizar
pruebas de hipótesis sobre la media poblacional o construir intervalos de confianza para
la media.
● Relación con otras distribuciones: La distribución t de Student se relaciona con la
distribución normal estándar y la distribución chi cuadrado. Específicamente, si X sigue
una distribución normal estándar y Y sigue una distribución chi cuadrado con n grados de
libertad, entonces la variable aleatoria T, definida como T = X / √(Y/n), sigue una
distribución t de Student con n grados de libertad.
Grafico:
Figura 1
Distribución T de Student

Nota: Gráfico sobre las regiones de aceptación y de rechazo con respecto a H0, (Gosset, 1908)

Fórmula:
La fórmula para calcular la función de densidad de probabilidad (pdf) de la distribución t de
Student es:
f(t) = [Γ((ν + 1) / 2) / (√(νπ) Γ(ν / 2))] * (1 + t² / ν)^(-(ν + 1) / 2)

Donde:
● f(t) = La función de densidad de probabilidad de la variable aleatoria t.
● ν = representa los grados de libertad.
● Γ = Representa la función gamma.
EJEMPLO
Supongamos que quieres comparar las calificaciones promedio de dos grupos de estudiantes, A y
B, para determinar si existe una diferencia significativa entre ellos. Tienes las siguientes
calificaciones en ambos grupos:

- Grupo A: 75, 80, 85, 90, 95


- Grupo B: 70, 72, 75, 78, 80

Paso 1: Calcular la media y la desviación estándar de cada grupo


Calcula la media y la desviación estándar para cada grupo.

- Media del grupo A (x̄₁) = (75 + 80 + 85 + 90 + 95) / 5 = 85


- Desviación estándar del grupo A (s₁) = √(((75-85)² + (80-85)² + (85-85)² + (90-85)² + (95-
85)²) / 4) = 7.07
- Media del grupo B (x̄₂) = (70 + 72 + 75 + 78 + 80) / 5 = 75
- Desviación estándar del grupo B (s₂) = √(((70-75)² + (72-75)² + (75-75)² + (78-75)² + (80-
75)²) / 4) = 4.47
Paso 2: Calcular la estadística de prueba t
La estadística de prueba t se calcula utilizando la fórmula:
- t = (x̄ ₁ - x̄₂) / √((s₁²/n₁) + (s₂²/n₂))
En nuestro ejemplo:

- t = (85 - 75) / √((7.07²/5) + (4.47²/5)) = 2.49

Paso 3: Determinar los grados de libertad


Los grados de libertad (df) se calculan utilizando la fórmula:
- df = n₁ + n₂ - 2
En nuestro ejemplo:
- df = 5 + 5 - 2 = 8
Paso 4: Calcular el valor crítico
El valor crítico de la distribución t se obtiene de las tablas de la distribución t de Student o
utilizando software estadístico. El valor crítico depende del nivel de confianza y los grados de
libertad.
Supongamos que queremos utilizar un nivel de confianza del 95% y tenemos 8 grados de
libertad. El valor crítico para una cola es aproximadamente 2.306.
Paso 5: Comparar la estadística de prueba con el valor crítico
Si la estadística de prueba t es mayor que el valor crítico, podemos rechazar la hipótesis nula y
concluir que hay una diferencia significativa entre los grupos. En caso contrario, no podemos
rechazar la hipótesis nula y no podemos afirmar que haya una diferencia significativa.
En nuestro ejemplo, t (2.49) es mayor que el valor crítico (2.306), por lo que podemos rechazar
la hipótesis nula y concluir que hay una diferencia significativa en las calificaciones promedio
entre los grupos A y B.

Autores relacionados:
La distribución t de Student debe su nombre a William Sealy Gosset, quien publicó su trabajo
bajo el seudónimo "Student" debido a las restricciones impuestas por su empleador en la fábrica
de cerveza Guinness. Gosset desarrolló la distribución t de Student mientras trabajaba en
problemas de calidad de la cerveza Guinness.

- Otros autores relacionados con la distribución t de Student incluyen:

o Ronald A. Fisher: Fisher fue un estadístico y biólogo británico que realizó importantes
contribuciones a la estadística y promovió el uso de la distribución t de Student en
análisis de datos y pruebas de hipótesis.

o Jerzy Neyman: Neyman fue un estadístico polaco que desarrolló métodos estadísticos
fundamentales y aplicó la distribución t de Student.

DISTRIBUCION F
La distribución F es una distribución de probabilidad que se utiliza para comparar la varianza de
dos o más poblaciones. Es el cociente de dos variables aleatorias que siguen una distribución chi
cuadrado, y se utiliza principalmente en análisis de varianza y pruebas de hipótesis.
Características:
● Forma de la distribución: La distribución F tiene una forma asimétrica y sesgada hacia
la derecha. La forma de la distribución depende de los grados de libertad asociados con
las variables chi cuadrado.

● Utilidad en inferencia estadística: La distribución F se utiliza para realizar pruebas de


hipótesis sobre la igualdad de varianzas de dos o más poblaciones. También se emplea en
el análisis de varianza (ANOVA) para comparar las medias de varios grupos.

● Grados de libertad: La distribución F tiene dos conjuntos de grados de libertad: los


grados de libertad del numerador y los grados de libertad del denominador. Estos grados
de libertad están asociados con las variables chi cuadrado utilizadas para calcular el
estadístico F.

● Relación con otras distribuciones: La distribución F está relacionada con la distribución


chi cuadrado y la distribución t de Student. En particular, si X₁ y X₂ son variables
aleatorias independientes que siguen una distribución chi cuadrado con m y n grados de
libertad, respectivamente, entonces el cociente X₁/m dividido por X₂/n sigue una
distribución F con m grados de libertad en el numerador y n grados de libertad en el
denominador.

Fórmula:
La fórmula para calcular la función de densidad de probabilidad (pdf) de la distribución F es:

f(x) = [(df₁/2)^(df₁/2) * (df₂/2)^(df₂/2) * x^((df₁/2)-1)] /


[((df₁/2)+(df₂/2)*x^(df₁/2+df₂/2))^((df₁+df₂)/2) * B(df₁/2, df₂/2)]

Donde:
● f(x) = La función de densidad de probabilidad de la variable aleatoria F.
● df₁ y df₂ = son los grados de libertad asociados con el numerador y el denominador,
respectivamente.
● B(df₁/2, df₂/2) = La función beta.
EJEMPLO:
Supongamos que estás realizando un experimento para comparar la varianza de dos poblaciones
diferentes. Tienes dos conjuntos de datos: A y B.
- Datos del conjunto A: 5, 6, 7, 8, 9
- Datos del conjunto B: 3, 5, 7, 9, 11, 13

Paso 1: Calcular la varianza de cada conjunto


Calcula la varianza muestral de cada conjunto de datos.
Varianza del conjunto A (s₁²):
- Calcula la media del conjunto A: (5 + 6 + 7 + 8 + 9) / 5 = 7
- Calcula la diferencia entre cada valor y la media y súmalo al cuadrado: [(5-7)² + (6-7)² +
(7-7)² + (8-7)² + (9-7)²] = 8
- Divide la suma de las diferencias al cuadrado entre n-1 (n es el tamaño de la muestra): 8 /
(5-1) = 2
Varianza del conjunto B (s₂²):
- Calcula la media del conjunto B: (3 + 5 + 7 + 9 + 11 + 13) / 6 = 8
- Calcula la diferencia entre cada valor y la media y súmalo al cuadrado: [(3-8)² + (5-8)² +
(7-8)² + (9-8)² + (11-8)² + (13-8)²] = 42
- Divide la suma de las diferencias al cuadrado entre n-1: 42 / (6-1) = 8.4
Paso 2: Calcular la relación de varianzas
La relación de varianzas se calcula dividiendo la varianza del primer conjunto entre la varianza
del segundo conjunto.
Relación de varianzas (F) = s₁² / s₂² = 2 / 8.4 = 0.238
Paso 3: Determinar los grados de libertad
Los grados de libertad se calculan utilizando el tamaño de la muestra y se definen como (n₁ - 1,
n₂ - 1), donde n₁ y n₂ son los tamaños de las muestras de los conjuntos A y B, respectivamente.
Paso 4: Calcular el valor crítico
El valor crítico de la distribución F se obtiene de las tablas de la distribución F o utilizando
software estadístico. El valor crítico depende del nivel de confianza y los grados de libertad.

Supongamos que deseamos utilizar un nivel de confianza del 95% y tenemos grados de libertad
(4, 5). El valor crítico para una cola es aproximadamente 6.39.
Paso 5: Comparar la relación de varianzas con el valor crítico
Si la relación de varianzas F es mayor que el valor crítico, podemos rechazar la hipótesis nula y
concluir que hay una diferencia significativa en las varianzas de los conjuntos A y B. En caso
contrario, no podemos rechazar la hipótesis nula y no podemos afirmar que haya una diferencia
significativa.

En nuestro ejemplo, la relación de varianzas F es 0.238 y el valor crítico para un nivel de


confianza del 95% y grados de libertad (4, 5) es aproximadamente 6.39.

Como 0.238 no es mayor que 6.39, no podemos rechazar la hipótesis nula y concluimos que no
hay una diferencia significativa en las varianzas de los conjuntos A y B.

Autores relacionados:

o Ronald A. Fisher: Fisher fue un estadístico y biólogo británico que realizó importantes
contribuciones a la estadística y promovió el uso de la distribución F en análisis de
varianza y pruebas de hipótesis. Es conocido por su trabajo en diseño de experimentos y
su desarrollo de métodos estadísticos.
o William Sealy Gosset: Gosset, también conocido como "Student", fue un estadístico
británico que trabajó en la fábrica de cerveza Guinness. Realizó importantes
contribuciones al desarrollo de la distribución t de Student y también hizo aportes al uso
de la distribución F en análisis de varianza.

o George E. P. Box: Box fue un estadístico británico que realizó importantes


contribuciones a la estadística aplicada y experimental. Fue pionero en el desarrollo de
métodos de análisis de varianza y promovió el uso de la distribución F en este contexto.

o Jerzy Neyman: Neyman fue un estadístico polaco que hizo contribuciones


fundamentales en el área de la inferencia estadística. Trabajó en el desarrollo de pruebas
de hipótesis y promovió el uso de la distribución F en pruebas de significancia y
comparación de varianzas.

Estos son solo algunos de los autores destacados relacionados con la distribución F. A lo largo de
la historia de la estadística, muchos investigadores han contribuido a su desarrollo y aplicaciones
en diferentes áreas de estudio.
CONCLUSIONES

 Cómo conclusión podemos decir que la estadística está y siempre a estado en el ambiente
juntamente a nosotros.
 Existe desde la forma más sencilla hasta algo complejo
 Nos permite hacer el estudio de grandes cantidades, realizar comparaciones y poder
interpretar o predecir resultados
 Es fundamental en la toma de decisiones
BIBLIOGRAFÍA :
1.Montgomery Douglas y Runger George.( 1996), Probabilidad y Estadística aplicada a la
Ingeniería., Mcgraw-Hill, México
2. Montgomery Douglas y Hines William.( 1995), Probabilidad y Estadística aplicada a la
Ingeniería. y Administración, segunda edición ,CECSA, México
3. Mendenhall William, Wackerly Dennis y Scheaffer Richard (1994), Estadística Matemáticas
con Aplicaciones , segunda edición, Grupo Editorial Iberoamérica. M, México
4. Govinden Portus Lincoyan.( 1998), Introducción a la Estadística,. Mcgraw-Hill, Santafé de
Bogotá
5. Webster Allen L.( 1998), Estadística aplicada a la Empresa y a la Economía, segunda edición,
Mcgraw-Hill, Madrid
6. Kohler Heinz.( 1996), Estadística para Negocios y Economía, primera edición ,CECSA,
México
7. Martinez Bencardino Ciro ( 1995), Estadística , sexta edición ,ECOE EDICIONES Santafé de
Bogotá.
8. Alvarez C Ricardo ( 1994), Estadística Fundamental Aplicada, primera edición
,PUBLIADCO, Cali
9. Estadística," Enciclopedia Microsoft® Encarta® 2000. © 1993-1999 Microsoft Corporation.
10. Stockburger David W (1996) Introductory Statistics: Concepts, models an applications, ,
http://www.psychstat.smsu.edu/sbk00.htm
11. (s.f.). Obtenido de Distribucion exponencial:
http://cidecame.uaeh.edu.mx/lcc/mapa/PROYECTO/libro19/52distribucin_exponencial.html
12. Andes, U. P. (15 de Julio de 2014). Tabla chi cuadrado. Obtenido de
https://www.slideshare.net/mayhuasca2/tabla-chi-cuadrado-37003519
13. Cardenas, I. C. (s.f.). ResearchGate. Obtenido de Estimacion de las frecuencias relativas
estacion Agronomia: https://www.researchgate.net/figure/Figura-1-Distribucion-multinomial-
para-una-estacion-pluviometrica-de-Manizales_fig1_232301359
14. Distribucion binomial negativa. (s.f.). Obtenido de
https://www.mql5.com/es/docs/standardlibrary/mathematics/stat/negativebinomial
15. Gomez, F. (s.f.). Distribucion hipergeometrica. Obtenido de
https://www.geogebra.org/m/UGJsyzZ4
16. Gonzalez, L. G. (s.f.). Geogebra. Obtenido de Medias muestrales e intervalos de confianza
para la media: https://www.geogebra.org/m/kqFc2593
17. Gosset, W. S. (1908). Obtenido de Distribucion "T" de Student:
https://estadisticaeninvestigacion.wordpress.com/distribucion-t-de-student/
18. J., A. R. (2012). Estadistica descriptiva, probabilidad e inferencia. Obtenido de
https://repositorio.uchile.cl/bitstream/handle/2250/120284/Rustom_Antonio_Estadistica_descript
iva.pdf
19. Lifeder. (s.f.). Obtenido de Distribucion uniforme continua: caracteristicas, ejemplos,
aplicaciones: https://www.lifeder.com/distribucion-uniforme-continua/
20. MQL5. (s.f.). Obtenido de Distribucion binomial negativa:
https://www.mql5.com/es/docs/standardlibrary/mathematics/stat/negativebinomial
21. R CODER. (s.f.). Obtenido de Distribucion de Poisson en R: https://r-
coder.com/distribucion-poisson-r/
22. Rodo, P. (10 de septiembre de 2019). Economipedia. Obtenido de Distribucion normal:
https://economipedia.com/definiciones/distribucion-normal.html
23. https://www2.ulpgc.es/hege/almacen/download/28/28313/temaprobabilidad.pdf
24. Triola, M. F. (2012). Estadística (10. ª ed.). Pearson Education.

También podría gustarte