Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA
ESTADISTICA
AMBIENTE
ESCUELA PROFESIONAL DE INGENIERÍA
AMBIENTAL
INDICE
Resumen ....................................................................................................................................... 7
Abstract ........................................................................................................................................ 8
Introducción................................................................................................................................. 9
Capítulo 1 ................................................................................................................................... 11
HISTORIA DE LA ESTADÍSTICA .................................................................................... 11
DEFINICIÓN DE ESTADISTICA ...................................................................................... 11
IMPORTANCIA DE LA ESTADÍSTICA EN LA INGENIERÍA.................................... 13
DEFINICIÓN DE TÉRMINOS USADOS .......................................................................... 14
❑ Población ..................................................................................................................... 14
❑ Muestra ........................................................................................................................ 14
❑ Parámetro: ................................................................................................................... 14
❑ Estadístico ................................................................................................................... 15
❑ Unidad elemental......................................................................................................... 15
❑ Datos ........................................................................................................................... 15
❑ Muestreo ...................................................................................................................... 16
❑ Marco muestral ............................................................................................................ 16
❑ Escalas de medición .................................................................................................... 16
❑ Variable ....................................................................................................................... 18
❑ Constante: .................................................................................................................... 20
❑ Redondeo de datos ...................................................................................................... 21
❑ Notación sumatoria ..................................................................................................... 21
❑ Suma de interés ........................................................................................................... 26
Capítulo 2 ................................................................................................................................... 26
RECOLECCIÓN DE DATOS ............................................................................................. 26
a) De corte transversal .................................................................................................. 27
b) De corte longitudinal ................................................................................................. 27
CENSO Y MUESTREO ....................................................................................................... 27
1. Censo ........................................................................................................................... 27
2. MUESTREO ............................................................................................................... 27
VENTAJAS DEL MUESTREO SOBRE EL CENSO ....................................................... 28
❖ Menor Costo............................................................................................................... 29
❖ Menor Tiempo ........................................................................................................... 29
❖ Mayor Posibilidad ..................................................................................................... 29
❖ Mayor Exactitud ........................................................................................................ 29
ENCUESTA ........................................................................................................................... 29
1. Descriptivas ................................................................................................................ 30
2. Analíticas .................................................................................................................... 30
PASOS PARA REALIZAR UNA ENCUESTA ................................................................. 30
CUESTIONARIO ................................................................................................................. 31
EJEMPLO DE UNA HOJA DE ENCUESTA .................................................................... 32
Capítulo 3 ................................................................................................................................... 35
CLASIFICACIÓN DE DATOS ........................................................................................... 35
1) Determinar los límites superior e inferior de la distribución ................................ 36
2) Obtener el Rango de variación: ............................................................................... 36
3) Determinación del Número de Intervalos de Clase (m): ........................................ 36
4) Determinar la amplitud de los intervalos (C) ......................................................... 37
5) Distribución del incremento (∆): .............................................................................. 38
7. Tabulación ................................................................................................................. 39
8) Intervalo de clase ....................................................................................................... 39
9) Límite de Clase (Yi) ................................................................................................... 40
10) Marca de Clase (Yi = Xi) ....................................................................................... 40
11) Frecuencia .............................................................................................................. 41
CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS ...................................................... 47
Capítulo 4 ................................................................................................................................... 50
PRESENTACIÓN DE DATOS ............................................................................................ 50
1) CUADROS ESTADÍSTICOS ................................................................................... 51
2) GRÁFICAS ESTADÍSTICAS: ................................................................................ 54
CLASIFICACIÓN DE LAS GRÁFICAS MAS USADAS................................................. 57
1. Histograma de frecuencias ....................................................................................... 57
2. Polígono de frecuencias ............................................................................................. 57
3. Gráfico de tendencia ................................................................................................. 58
4. Polígono de frecuencias acumuladas. Ojiva ............................................................ 58
5. Pirámide poblacional ................................................................................................ 59
6. Diagrama de barras .................................................................................................. 59
7. Gráfico de bastones ................................................................................................... 60
8. Gráfico de cajas ......................................................................................................... 60
9. Gráfico de sectores .................................................................................................... 61
10. Pictograma ..................................................................................................................... 61
11. Gráfico de Gantt ............................................................................................................ 62
Capítulo 5 ................................................................................................................................... 62
MEDIDAS DESCRIPTIVAS ................................................................................................. 62
MEDIDAS DE CENTRALIZACIÓN .................................................................................... 63
Clases .................................................................................................................................. 63
b) Medias móviles ........................................................................................................... 63
MEDIA ARITMÉTICA “M(X)” ............................................................................................ 64
Propiedades ........................................................................................................................ 65
Ventajas .............................................................................................................................. 66
Desventajas ........................................................................................................................ 67
Media Aritmética Ponderada ........................................................................................... 67
Casos Especiales ................................................................................................................ 68
MEDIA GEOMÉTRICA “Mg” .............................................................................................. 69
1. Media geométrica para datos no agrupados ........................................................... 69
2. Media Geométrica para datos agrupados ............................................................... 69
Desventajas ........................................................................................................................ 70
Propiedades ........................................................................................................................ 70
MEDIA ARMÓNICA “Mh” ................................................................................................... 70
✓ Media Armónica para datos no agrupados ............................................................. 71
✓ Media Armónica para datos agrupados .................................................................. 71
Propiedad ........................................................................................................................... 71
Desventaja .......................................................................................................................... 72
MEDIA CUADRÁTICA “Mc(X)” ......................................................................................... 72
✓ Media Cuadrática para datos no agrupados .......................................................... 72
✓ Media Cuadrática para datos no agrupados .......................................................... 72
Propiedad ........................................................................................................................... 72
Ejemplo ............................................................................................................................... 72
MEDIANA “Me” .................................................................................................................... 73
✓ Para datos no agrupados .......................................................................................... 73
✓ Para datos agrupados................................................................................................ 74
Propiedades ........................................................................................................................ 74
Ventajas .............................................................................................................................. 75
Desventajas ........................................................................................................................ 75
MODA “Mo” .......................................................................................................................... 75
✓ Moda para datos no agrupados................................................................................ 76
✓ Moda Para datos agrupados..................................................................................... 76
Ventajas .............................................................................................................................. 79
Desventajas ........................................................................................................................ 79
FRACTILES ........................................................................................................................... 79
1) CUARTILES (QJ) ....................................................................................................... 79
2) DECILES (DJ) ............................................................................................................ 84
3) PERCENTILES (PJ) ................................................................................................... 86
Capítulo 6 ................................................................................................................................... 89
MEDIDAS DE DISPERSIÓN ................................................................................................ 89
A. Tipos ............................................................................................................................ 90
a) Rango: R .................................................................................................................... 91
b) DESVIACIÓN MEDIA: DM(X) .............................................................................. 93
c) VARIANZA: V(X)..................................................................................................... 94
d) DESVIACIÓN ESTÁNDAR O TÍPICA: SX .......................................................... 97
e) COEFICIENTE DE VARIACIÓN: CV(X) ............................................................ 99
Capítulo 7 ................................................................................................................................. 101
MEDIDAS DE ASIMETRÍA................................................................................................ 101
❖ Simétricas .................................................................................................................. 102
❖ Asimétricas. ............................................................................................................... 102
Coeficiente de Asimetría CS(X) ....................................................................................... 103
Capítulo 8 ................................................................................................................................. 107
MEDIDAS DE APUNTAMIENTO ...................................................................................... 107
a) Platicúrtica ............................................................................................................... 107
b) Mesocúrtica .............................................................................................................. 107
c) Leptocúrtica:............................................................................................................ 107
Capítulo 9 ................................................................................................................................. 110
PROBABILIDADES ............................................................................................................ 110
▪ PROBABLE ............................................................................................................. 110
▪ INCERTIDUMBRE ................................................................................................ 110
▪ EXPERIMENTO ..................................................................................................... 111
DEFINICIÓN DE PROBABILIDADES .............................................................................. 117
Teoremas de probabilidad: ............................................................................................ 120
Probabilidad geométrica: ............................................................................................... 121
Capítulo 10 ............................................................................................................................... 124
TÉCNICAS DE CONTEO .................................................................................................... 124
1. VARIACIONES ...................................................................................................... 124
2. PERMUTACIONES ............................................................................................... 127
3. COMBINACIONES ................................................................................................ 131
Algebra de eventos: ............................................................................................................... 134
• Ley de la identidad .................................................................................................. 134
• Ley de la dominación .............................................................................................. 134
• Ley de la idempotencia ........................................................................................... 134
• Ley conmutativa ...................................................................................................... 135
• Ley asociativa........................................................................................................... 135
PROBABILIDAD CONDICIONAL .................................................................................... 135
DISTRIBUCIONES DE PROBABILIDAD: ........................................................................ 138
Conclusiones y Sugerencias .................................................................................................... 138
I. Conclusiones: ................................................................................................................ 138
II. Sugerencias: .................................................................................................................. 139
Referencias Bibliográficas ...................................................................................................... 140
Resumen
Para ello, se abordará todos los temas propuestos en el sílabo, desde el tema de
Estadística Descriptiva donde se verán subtemas tales como acopio, clasificación y
presentación de los datos, medidas de tendencia central, dispersión, asimetría y
curtosis; como también consideraremos las Probabilidades en las que comprende el
experimento aleatorio, espacio muestral, eventos, Teorema de Bayes; como últimos
temas tendríamos las Variables Aleatorias, las Distribuciones Continuas de
Probabilidad y las Pruebas estadísticas paramétricas para estudios con una sola y de
dos muestras.
Recordemos que la Estadística es esencial para distintas actividades del día, por ello,
añadido a la información que se va a mostrar, consideraremos ejemplos para mejor
entendimiento y comprensión de nuestra investigación.
For this, all the topics proposed in the syllabus will be addressed, from the topic of
Descriptive Statistics where we will see subtopics such as collection, classification and
presentation of data, measures of central tendency, dispersion, asymmetry and kurtosis;
as we will also consider the Probabilities in which includes the random experiment,
sample space, events, Bayes Theorem; as last topics we would have the Random
Variables, the Continuous Probability Distributions and parametric statistical tests for
single and two-sample studies.
Let us remember that Statistics is essential for different activities of the day, therefore, in
addition to the information that will be shown, we will consider examples for better
understanding and comprehension of our research.
Por otro lado, todos nosotros tenemos algo de investigadores o directores, casi a diario
hacemos pronósticos relativos a los acontecimientos futuros de nuestra vida con el fin de
predecir lo que sucederá ante nuevas situaciones o experiencias. A medida que aparecen
estas nuevas situaciones, con frecuencia confirmamos nuestras ideas, pero a veces
tenemos que confrontar desagradables sorpresas y/o consecuencias.
La información ha sido siempre, y con mayor razón hoy en día, muy importante para la
toma de decisiones en todo nivel, por ello las mismas deben ser oportunas y óptimas. Con
mala o insuficiente información posiblemente la decisión sea mala, por muy bueno que
sea el procesamiento que se haya hecho de ésta.
Por el contrario, por muy buena que sea la información si el procesamiento ha sido malo
seguramente también la decisión será equivocada. En consecuencia, un sólido respaldo
para una acertada toma de decisiones, contempla ambos aspectos: información buena y
suficiente, con un procesamiento correcto.
HISTORIA DE LA ESTADÍSTICA
DEFINICIÓN DE ESTADISTICA
A la fecha aún no es factible dar una definición exacta de la Estadística, porque los
conceptos fundamentales no tienen una definición explícita universal, o si lo tienen, no
es ella suficientemente clara para darnos una idea acabada de su significado. Por eso se
tratará de presentar una caracterización conceptual sucinta, tal como sigue:
Estas definiciones nos permiten además distinguir dos áreas que son necesarios
mencionarlos, estos son:
La Estadística es una ciencia que tiene una metodología cíclica de trabajo, empieza
estudiando la población, y cuando no es posible estudiar una población u obtener
información completa de ella, por ser muy grande o por ser a veces infinita, entonces es
necesario extraer muestras representativas de ella, mediante las técnicas de Muestreo, y
usando la información proporcionada por dicha muestra, pero analizados con la ayuda de
la Estadística Descriptiva, se sacan conclusiones e inferencias acerca de la población en
estudio, gracias a la Inferencia Estadística, cuya base es el Cálculo de las Probabilidades,
y este a su vez estudia las características teóricas de la población, todo lo demás gira
alrededor de esta estructura.
Las etapas de una investigación usando la estadística varía de acuerdo a los objetivos del
trabajo, los cuales se pueden resumir a lo siguiente:
Un ingeniero es alguien que cumple una importante función en la sociedad, un rol que
consiste en la aplicación de los principios de la ciencia para la formulación de soluciones
a los problemas enfocados en la satisfacción de las necesidades del entorno al cual
pertenece. Este proceso debe dar solución a un problema se encuentra ligado a un
conjunto de pasos en los cuales se encuentra fundamentado el método científico o método
de la ingeniería que puede resumirse como:
❑ Población
Se le llama población en Estadística al conjunto de valores de las unidades
elementales (personas, animales o cosas) que tienen alguna característica en
común, cuyos datos (valores cualitativos o cuantitativos) son obtenidos de cada
una de dichas unidades elementales, como consecuencia de la medición u
observación de una o más características particulares que se quiere estudiar. La
población es un conjunto especificado y delimitado tanto en el tiempo como en el
espacio, del cual se obtendrá la muestra. A esta población se le conoce también
como población objeto u objetivo. La población puede ser finita o infinita.
Ejemplo:
Todos los ríos afluentes del Amazonas.
Todos los habitantes de la Región Ancash, en el mes de diciembre del 2021.
Todas las municipalidades provinciales del Perú.
❑ Muestra
Es una parte o subconjunto representativo de la población, seleccionados de
acuerdo a las técnicas de muestreo. Cabe recordar que se pueden seleccionar no
solo uno, sino varias muestras de una población, e incluso de diferentes tamaños
y no necesariamente coincidentes.
Ejemplo:
50 alumnos de la UNASAM, matriculados en el semestre 2021-II
85 colegios nacionales del país que funcionaron el 2021.
15 ríos afluentes del río Amazonas.
❑ Parámetro:
Es un valor que describe a alguna característica de la población y para
determinarlo mayormente se necesitan todos los datos de la población;
generalmente se les representa con letras griegas minúsculas.
Ejemplo:
μ = Media poblacional.
σ = Desviación estándar poblacional.
𝜌 = Coeficiente de correlación poblacional.
N = Tamaño de la población. P = proporción poblacional
❑ Estadístico
Es un valor representativo de la muestra, que se obtiene a partir de los datos
muestrales y describe alguna característica de la muestra. Se les representa con
letras latinas.
Ejemplo:
𝑋̅ = Media muestral.
S = Desviación estándar muestral.
r = Coeficiente de correlación muestral.
n = Tamaño de la muestra. p = proporción muestral
❑ Unidad elemental
Se le llama también unidad de análisis, es el ente que proporciona al ser medido
u observado, un dato, correspondiente a la característica que se quiere estudiar; o
pueden ser dos o más datos, de acuerdo a si se quiere medir u observar dos o más
características, por lo tanto, los datos pueden ser unidimensionales,
bidimensionales o multidimensionales. Por su parte las unidades elementales
pueden ser:
1. Simples (son indivisibles), como una persona, un animal, una planta, un auto,
etc.
2. Compuestos, como una familia, un colegio, una granja, una tribu, etc.
❑ Datos
Se le conoce también como observación o registro, es el valor que resulta al
medirse u observarse una unidad elemental con relación a la característica que se
quiere estudiar; en otras palabras, es la información expresada en forma
cuantitativa o cualitativa de los hechos de la realidad, esta información, es lo que
constituye el fundamento básico del análisis estadístico. Sin embargo, es preciso
indicar que a la Estadística no le interesa un dato en particular, sino el conjunto
de datos.
Ejemplo:
La edad de un alumno (20 años).
El ingreso mensual de un profesor (2500 soles).
El número de alumnos de un aula de un colegio (35 alumnos)
❑ Muestreo
En el sentido restringido, es el procedimiento mediante el cual se obtiene la
muestra, en el sentido más amplio, es la parte de la Estadística que se ocupa del
estudio de los diferentes métodos y técnicas para seleccionar las muestras,
incluyendo el tamaño que deben tener.
❑ Marco muestral
Es la relación ordenada de todas las unidades elementales de la población, del cual
se sacará la muestra. Ejemplo, si consideramos población para un estudio
determinado a todos los alumnos matriculados de la UNASAM, entonces el marco
muestral es la lista de todos los alumnos matriculados en la UNASAM en un
semestre determinado.
❑ Escalas de medición
El término “medición” puede definirse desde diversos puntos de vista o en
términos que no necesariamente coincidan, pero lo esencial de la acepción, es que
por medición se entiende a la asignación de números o valores a las unidades
elementales según determinadas reglas.
Ampliando algo más, se puede decir que sin medición no habría estadística.
Stanley Smith Stevens ha escrito mucho sobre tipos de escalas de medición que
se realizan en la ciencia, aun cuando no todos los estadísticos están de acuerdo
con Stevens, él ha ideado cuatro tipos de escalas de medición, a saber:
a) Nominal
Consiste en asignar membretes o nombres a cada uno de los grupos o
categorías que tienen las unidades elementales en estudio, en consecuencia se
trata de agrupar a los datos en clases mutuamente excluyentes, de modo que
todos los que pertenecen a la misma sean equivalentes respecto a la
característica que los distingue, después del cual se les puede asignar nombres
o números a tales clases.
Ejemplo:
El sexo, el estado civil, el nombre de las personas, el número del DNI, los
password, o los números que se les asignan a las personas para un sorteo, etc.
b) Ordinal
En el caso de que puedan detectarse diversos grados de un atributo o
característica en estudio de una unidad a otra, entonces es necesario
diferenciar esta propiedad, asignando a las unidades elementales en estudio,
nombres o números que resalten estas diferencias y sea factible su ordenación
de mayor a menor o viceversa, es decir importa no solo el nombre sino el
orden de las unidades elementales.
Ejemplo:
El orden de mérito asignado a los alumnos después de una evaluación, el grado
de aceptación dado por un juez a un determinado producto alimenticio, etc.
c) Intervalo
Cuando no sólo es posible distinguir las diferencias entre los diversos grados
de propiedad de una unidad elemental (característica de la medida ordinal),
sino también pueden discernirse diferencias entre dichos grados, entonces se
recurre a la medida llamada por intervalo.
En este caso el origen es arbitrario y se elige de acuerdo a las conveniencias,
por lo tanto, además de ordenarlos se pueden hacer operaciones aritméticas,
en consecuencia, los valores asignados son numéricos.
Ejemplo:
La medida de la temperatura, los números asignados a los años de nuestro
calendario, etc.
d) Razón
Se le llama también de cociente. Esta escala de medición se diferencia del
anterior, porque en este caso, el punto cero u origen ya no es arbitrario y
corresponde realmente a una total ausencia de la propiedad estudiada.
Si se observa una carencia total de la propiedad estudiada se le asigna el valor
cero, además a iguales diferencias entre los números corresponden iguales
diferencias en el grado del atributo presente en la unidad elemental en estudio.
Siendo el cero ya no un valor arbitrario, sino un valor absoluto. Podemos decir
que A tiene 2, 3, 4 o más veces la magnitud de la propiedad presente en B.
Ejemplo:
La estatura de las personas, la edad de las personas, etc.
❑ Variable
Es la característica que se quiere estudiar, y viene a ser una cualidad o propiedad
de las unidades elementales, de que al ser medidos u observados tomen diferentes
valores o atributos.
Ejemplo:
La estatura, la edad, el peso, la temperatura, el lugar de nacimiento, el estado civil,
los ingresos económicos mensuales, el grado de instrucción, la profesión, el nivel
del colesterol, etc. de las personas.
1. Cualitativas
Son las que indican una cualidad o atributo de las unidades elementales, por
consiguiente, pueden ser clasificados solo como poseedoras o no poseedoras
de una cualidad o propiedad. Esta variable resulta de la medición con escalas
nominal u ordinal, se les puede asignar números o códigos para facilitar su
manejo. Muchos autores dividen a las variables cualitativas en dos grupos:
i. Nominales:
Son las que presentan modalidades excluyentes y que no admiten un
criterio de orden.
Por ejemplo:
ii. Ordinales:
Presentan modalidades excluyentes pero que si admiten un orden,
como ejemplo el nivel educativo de las personas, en este grupo están
las clasificaciones dadas en las escalas de Rensis Likert (Ej. Muy de
acuerdo, de acuerdo, indiferente, en desacuerdo y totalmente en
desacuerdo).
Ejemplos:
• El estado civil de las personas (N)
• El lugar de nacimiento de las personas (N)
• El grado de instrucción de los empleados públicos. (O)
• El nivel socio-económico de los trabajadores (O)
2. Cuantitativas
Son los que indican una cantidad, es decir, son los que pueden ser contados o
medidos, y resultan de las escalas de medición de intervalo y de razón. A su
vez pueden ser:
i. Discretas:
Son las que resultan del conteo y por consiguiente, sólo pueden tomar
algunos valores dentro de un intervalo dado, generalmente son los
números naturales o enteros.
ii. Continuas:
Son las que resultan de la medición con cualquier unidad de medida, y
por lo tanto pueden tomar cualquier valor dentro de un intervalo dado.
Se les representa con los números reales.
Ejemplos:
A las variables se les representa generalmente con las últimas letras del
alfabeto, tales como X, Y, Z. cuando se quieren distinguir los valores
individuales se usan subíndices, para lo cual se utilizan las letras intermedias
como: i, j, k, l, etc. En ese sentido Xi representa al i-ésimo valor de la variable
X. En la práctica muchas variables continuas son redondeadas a números
enteros, como la edad, por lo que se confunde como si fueran variables
discretas.
A su vez, las variables según su función pueden clasificarse como:
Dependientes, independientes e intervinientes (exógenas, endógenas),
también pueden ser: unidimensionales, bidimensionales, tridimensionales o
multidimensionales (dos o más dimensiones).
❑ Constante:
Se denomina así a la variable que toma un solo valor. Es un dato que no cambia
de valor. Se le representa con las primeras letras del alfabeto, tales como a, b, c,
etc.
Ejemplo:
Si todos los obreros de un centro minero o agrícola tuvieran sus dos padres vivos,
entonces la variable, número de padres vivos por obrero sería el número 2.
Las variables también pueden ser unidimensionales, cuando se estudia solo una
característica de las unidades elementales (ejemplo: la edad de las personas),
bidimensionales si se estudia a la vez dos características de una unidad elemental
(ejemplo: la edad y el peso de las personas), multi o n – dimensionales si se
estudian a la vez más de dos características de las unidades elementales ( ejemplo,
la edad, el peso, la estatura, los ingresos económicos, el grado de estudios, etc. de
las personas)
❑ Redondeo de datos
La necesidad del redondeo de datos es más por la facilidad de los cálculos o por
comodidad de su manejo, que, por razones prácticas, pues el manejo inadecuado
puede traer más errores de los previstos. El redondeo de un número hasta el entero
o decimal más próximo obedece a los siguientes criterios.
a) Si el dígito a redondear es menor que cinco, se le desprecia.
Ejemplo:
• Aproximar o redondear a un entero: 7,234 = 7
• Aproximar o redondear a un decimal: 7,234 = 7,2
• Aproximar o redondear a dos decimales:7,234 = 7,23
❑ Notación sumatoria
Para describir y analizar los datos, es necesario el manejo más o menos eficiente
de las operaciones aritméticas, en especial el de la suma de los datos; es decir, de
la serie: x1, x2, x3, ……, xn, en estudio, para ello se hará una breve descripción de
las sumatorias y de sus propiedades.
La letra griega mayúscula 𝛴, es una notación abreviada para designar una suma,
tal como:
𝑥1 + 𝑥2 + 𝑥3 +. . . +𝑥𝑛
∑ 𝑥𝑖
𝑖=1
Ejemplos:
∑ 𝑋𝑖 = 𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + 𝑋5
𝑖=1
∑ 𝑎 = 𝑎 + 𝑎 + 𝑎 + ⋯ + 𝑎 = 𝑛𝑎
𝑖=1
∑ 𝑎 = (𝑛 − 𝑘 + 1)𝑎
𝑖=𝑘
Ejemplo:
•
4
∑ 7 = 7 + 7 + 7 + 7 = 4 × 7 = 28
𝑖=1
•
4
∑ 3 = 3 + 3 + 3 + 3 + 3 = (4 − 0 + 1)3 = 5 × 3 = 15
𝑖=0
Ejemplo:
5 5
Ejemplo:
4 4
∑ 𝑥𝑖 + 12
𝑖=1
= ∑ 𝑥𝑖 + ∑ 𝑦𝑖 − ∑ 𝑧𝑖
𝑖=1 𝑖=1 𝑖=1
Ejemplo:
4
= ∑ 𝑥𝑖 + ∑ 𝑦𝑖 − ∑ 𝑧𝑖
𝑖=1 𝑖=1 𝑖=1
∑ 𝑥𝑖 𝑦𝑖 ≠ (∑ 𝑥𝑖 ) (∑ 𝑦𝑖 )
𝑖=1 𝑖=1 𝑖=1
Pues:
𝑛
∑ 𝑥𝑖 𝑦𝑖 = 𝑥1 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3 +. . . +𝑥𝑛 𝑦𝑛
𝑖=1
𝑛 𝑛
Ejemplo:
3 3 3
∑ 𝑥𝑖 𝑦𝑖 ≠ (∑ 𝑥𝑖 ) (∑ 𝑦𝑖 )
𝑖=1 𝑖=1 𝑖=1
Pues:
∑ 𝑥𝑖 𝑦𝑖 = 𝑥1 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3
𝑖=1
3 3
(∑ 𝑥𝑖 ) (∑ 𝑦𝑖 ) = (𝑥1 + 𝑥2 + 𝑥3 )(𝑦1 + 𝑦2 + 𝑦3 )
𝑖=1 𝑖=1
∑ 𝑥𝑖 = ∑ 𝑥𝑖 + ∑ 𝑥𝑖
𝑖=1 𝑖=1 𝑖=𝑘+1
Ejemplo:
8
∑ 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 + 𝑥6 + 𝑥7 + 𝑥8
𝑖=1
= (𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 ) + (𝑥5 + 𝑥6 + 𝑥7 + 𝑥8 )
4 8
= ∑ 𝑥𝑖 + ∑ 𝑥𝑖
𝑖=1 𝑖=5
∑ 𝑥𝑖𝑘 ≠ (∑ 𝑥𝑖 ) ∀𝑘 ≠ 1
𝑖=1 𝑖=1
Si 𝑘 = 2
𝑛 𝑛 2
∑ 𝑥𝑖2 ≠ (∑ 𝑥𝑖 )
𝑖=1 𝑖=1
1
Si 𝑘 =
2
𝑛 1
1 𝑛 2
∑ 𝑥𝑖2 ≠ (∑ 𝑥𝑖 )
𝑖=1
𝑖=1
n(n + 1)
n 2 n
c) i =
i =1 2
3
d) (X
i =1
n − X n −1 ) = ( X n − X 0 )
1 1
e) ri =
i =0 1− r
r 1 f) (1 / 2)
i =0
i
=
1 − 1/ 2
=2
r
r2 + r
g) ir i =
i =0 (1 − r ) 2
r 1 h) i 2r i =
i =0 (1 − r ) 3
r 1
1 1
i) ir i −1 =
i =0 (1 − r ) 2
r 1 j) (i + 1)r
i =0
i
=
(1 − r ) 2
r 1
r +1 n
n
k) i 2 r i −1 = (1 − r ) 3
r 1 l) x = 2 n
i =0 x =0
n
n x n− x
xi
m) P Q
x =0 x
=1 P +Q =1 n)
i =0 i!
= ex
Capítulo 2
RECOLECCIÓN DE DATOS
Los datos estadísticos se obtienen como es sabido, midiendo u observando las unidades
elementales, asimismo para el estudio de una o más características de la población no se
necesita de un solo dato, sino de una colección de datos, ya sea los correspondientes a la
población o a los de la muestra, estos datos para ser estudiados necesitan ser recolectados;
la misma, se puede hacer de múltiples maneras, dependiendo de la variable a estudiar.
a) De corte transversal
Es decir, del momento, precisamente en este caso, es cuando hay que obtenerlos,
pues en la mayoría de los casos no están disponibles.
b) De corte longitudinal
Es decir, los que sucedieron en el pasado en períodos de tiempo constantes, en
estos casos generalmente se encuentran en los archivos de las instituciones.
CENSO Y MUESTREO
Los métodos que nos permiten recopilar la información son:
1. Censo
Es el procedimiento por el cual se obtiene información de todos los elementos que
conforman la población, relacionado a la variable o variables que se quiere
investigar. Siempre que no se cometan errores en la recopilación y/o
procesamiento de los datos, los resultados que se obtengan serán los verdaderos y
los que se quiere conocer; sin embargo, se tiene la desventaja de que por lo general
es muy difícil practicar un censo, sobre todo cuando la población es muy grande,
muchas veces infinita o cuando para estudiar a las unidades elementales hay que
sacrificarlos.
Por ejemplo:
Los censos nacionales de población, de vivienda, el económico, el agropecuario,
etc. no se realizan cada año, sino entre cada cinco a diez años. Para analizar la
sangre de una persona no se usa toda su sangre sino una pequeña muestra.
2. MUESTREO
Además de la definición dada en el primer capítulo, se puede decir que el muestreo
es el procedimiento por el cual se obtiene información de solo una parte
representativa de la población. sin embargo, debe entenderse, que este
procedimiento no puede ser usado indiscriminadamente; es decir, sin tener en
cuenta las características de la población y las diferentes reglas que para ello
existen.
Tipos de muestreo:
i. Probabilísticos
Son los que se basan en el principio de la equiprobabilidad, es decir,
cuando cada elemento de la población tiene la misma posibilidad de ser
seleccionado. Los cuales a su vez son:
• Muestreo aleatorio simple.
• Muestreo aleatorio estratificado.
• Muestreo aleatorio por conglomerados.
• Muestreo aleatorio sistemático.
• Muestreo de aceptación
• Muestreo aleatorio por etapas. etc.
ii. No Probabilísticos
Son los que se basan en el principio de la representatividad, es decir, aquí
lo único que importa es que sea representativo, los criterios son los de los
expertos. A su vez pueden ser:
• Muestreo por cuotas.
• Muestreo de la bola de nieve.
• Muestreo de Expertos.
• Muestreo de casos-tipo
• Muestras casuales.
• Muestreo para poblaciones móviles, etc.
❖ Menor Costo
Como los datos a recolectar y procesar son relativamente pocos en relación a la
de la población estudiada, los gastos que ocasionen serán por consiguiente mucho
más reducidos.
❖ Menor Tiempo
Como los datos son en menor cuantía que los de la población estudiada, la
recolección y el procesamiento de los mismos se harán en mucho menor tiempo.
❖ Mayor Posibilidad
Precisamente por el menor costo y el menor tiempo empleado, así como de la
imposibilidad de practicar un censo en ciertas poblaciones, hacen que el muestreo
sea mucho más factible de realizarse que un censo.
❖ Mayor Exactitud
Debido a que el volumen de trabajo es mucho más reducido que cuando se practica
un censo, se puede emplear personal más calificado, e incluso a quienes se les
puede capacitar más eficientemente, por consiguiente, el trabajo realizado por
ellos será mucho más confiable y preciso.
ENCUESTA
Es el procedimiento por el cual se recolecta la información usando un instrumento
llamado cuestionario de preguntas estructuradas o semiestructuradas. En una forma no
del todo correcta se da el nombre de encuesta sólo al cuestionario de preguntas, sin
embargo, la encuesta tiene una acepción mucho más amplia; es decir, es todo el
procedimiento de recolección de datos.
La encuesta es muy usada en la investigación de mercados. Se puede ejecutar usando
diferentes medios como: La entrevista directa o cara a cara, por teléfono, por correo o por
Internet.
1. Descriptivas
Es cuando el objetivo de la misma, es sólo la de obtener información cuantitativa
de los grupos que constituyen la población, así por ejemplo conocer el porcentaje
de personas que están de acuerdo con un determinado proyecto de ley, cuántos
alumnos vieron un determinado programa de TV., etc.
2. Analíticas
Es cuando el objetivo de la misma es hacer un análisis cualitativo y comparativo
entre los grupos que conforman la población, así, por ejemplo, qué opinión tienen
los hombres y las mujeres sobre el proyecto de ley, o del programa de TV. que
vieron.
Cuando se realiza una encuesta es preciso tener en cuenta ciertas recomendaciones, pues
los resultados que se obtendrán mucho dependerán de los datos recolectados. Estas
recomendaciones están dirigidas en primer lugar a las diferentes fases que tiene la
encuesta, así toda investigación en que se use la encuesta como medio de recolección de
datos.
CUESTIONARIO
Es el instrumento, que tiene forma material impresa o digital, utilizado para registrar la
información que proviene de personas que participan en una encuesta; en una entrevista
o en otros procedimientos como son los experimentos.
Por otro lado, debe tenerse en cuenta que toda encuesta tiene su tiempo oportuno para
ejecutarse, las personas a entrevistar no están disponibles a toda hora, ni en el momento
que crea el entrevistador, por lo que la encuesta está sujeta al tiempo disponible del
entrevistado.
Las personas que servirán como encuestadores deben haber sido seleccionados de
acuerdo al perfil que debe tener un entrevistador, de lo contrario se corre el riesgo de ser
rechazado y no obtener la información requerida, en el mejor de los casos la información
no será la verdadera en su totalidad.
El cuestionario de ser validado con expertos y debe tener confiabilidad, si las preguntas
son de tipo Likert, se usa el alfa de Cronbach, si las preguntas son dicotómicas, se usa el
Kuder y Richardson (KR 20).
❑ Mala
❑ Regular
❑ Buena
❑ Muy buena
❑ Excelente
2. ¿Qué opina de la variedad de nuestros platillos?
❑ Son pocos
❑ Regular
❑ ¡Muy surtidos!
❑ Mal
❑ Regular
❑ Bien
❑ Muy bien
❑ Excelente
❑ Desagradable
❑ Puede mejorar
❑ A gusto
❑ Muy agradable
❑ Excelente
❑ Sucios
❑ Limpios
❑ Impecables
6. El servicio de estacionamiento fue:
❑ Muy reducido
❑ Reducido
❑ Regular
❑ Suficiente
❑ Amplio
❑ Altos
❑ No tan altos
❑ Justos
❑ Accesibles
❑ Bajos
❑ Sí
❑ Puede ser
❑ No
9. ¿Recomendaría el lugar?
❑ Sí
❑ Podría ser
❑ No
________________________________________________________________
________________________________________________________________
CLASIFICACIÓN DE DATOS
Después de recolectar los datos, éstos se encuentran en la forma como fueron compilados;
es decir, no necesariamente ordenados, por lo tanto, en este estado son difíciles de ser
analizados y por consiguiente de ser interpretados, con dificultad se puede obtener el
mínimo y el máximo, se puede sumar los valores cuantitativos y dividirlo entre el número
de valores existentes y obtener así el promedio, pero esto no nos garantiza una descripción
completa de los datos, por lo que es necesario ordenarlos y clasificarlos, ya sea en grupos,
categorías o intervalos dependiendo del tipo o tipos de variables en estudio
Para comenzar a clasificar los datos, lo primero que se debe tener en cuenta es el tipo de
variable que se tiene, además usar una sola variable; si la variable es del tipo cualitativo,
no existen mayores recomendaciones ni normas, sino ordenarlos y clasificarlos de
acuerdo al atributo que tiene cada unidad elemental, cuando la variable es del tipo
cuantitativo discreto y la amplitud de la variable es pequeña, el tratamiento es similar a la
de las variables cualitativas, cuando la variable es del tipo cuantitativo, en especial
continuo, se tendrán en cuenta ciertas reglas en el que los diferentes autores no se han
puesto de acuerdo, pero que en el presente caso se dará una secuencia consensuada, por
lo menos por la mayoría de ellos.
Ejemplo 1:
Con fines didácticos se usará un ejemplo como guía, cuya variable es del tipo cuantitativo
continuo, el mismo es el siguiente: con la finalidad de dar una orientación de los hábitos
alimenticios a los niños de su aula un profesor de una zona rural obtuvo el peso en kg. de
cada uno de sus 50 alumnos, que son los que a continuación se dan:
51,2 46,1 38,6 25,1 47,3 37,3 40,8 48,4 39,1 41,3 46,2 31,4 36,0 48,6
44,2 42,3 49,5 59,9 44,5 40,9 41,4 52,3 38,7 33,5 28,4 44,1 54,5 43,9
53,3 44,8 42,6 34,8 26,2 37,2 47,7 43,2 58,4 36,9 52,8 41,6 39,8 43,7
56,0 32,0 46,8 38,1 49,8 30,9 47,2 37,5
Como se puede apreciar no se puede hacer alguna descripción de interés sobre el conjunto
de datos, por lo que es necesario ordenarlos y agruparlos en grupos (intervalos), para lo
cual se sigue los siguientes pasos:
1) Determinar los límites superior e inferior de la distribución
Esto significa obtener el valor más alto y el valor más bajo de los datos.
m = 1 + 3,322 log10(50)
m = 1 + 3,322 (1,69897)
m = 1 + 5,644
m = 6,644
m=7
Esto indica que el número de intervalos para nuestro ejemplo debe ser 7, sin
embargo, esto no impide que pueda ser otro número próximo a 7, pues como se
dijo la fórmula es un aproximador y no una regla infalible, lo importante es tener
el número de intervalos adecuados que con la experiencia se va adquiriendo.
Otra regla para calcular el número de intervalos de clase es sacar la raíz cuadrada
de n si este es menor que 200, en nuestro ejemplo también es 7, pues √𝟓𝟎=7. 071.
34.8
𝐶=
7
𝐶 = 4.97143
R’ = 5 x 7 = 35
∆ = 35,0 – 34,8
∆ = 0,2 kg
Este incremento se debe repartir en ambos lados del rango, en lo posible en forma
equitativa, pero siempre evitando la propagación de los decimales.
7. Tabulación
Después de obtener los verdaderos límites, tanto superior como inferior, se hace
la distribución de los intervalos de clase, los mismos se establecen ya sea en forma
creciente o decreciente según el interés del trabajo en ejecución. Teniendo los
intervalos de clase se hace la tabulación de los datos, que consiste en distribuir
cada dato al intervalo que le corresponde. Si la distribución es manual se usan las
famosas tarjetas u otro mecanismo de conteo de datos, como también se puede
Si la distribución es manual se usan las famosas tarjas u otro mecanismo de co
ordenar los datos en forma creciente o decreciente y contar los datos del intervalo
datos, como también se puede ordenar los datos en forma creciente o decre
correspondiente.
contar los datos del intervalo correspondiente. Para nuestro ejemplo la distr
Para nuestro ejemplo
con lasusdistribución
respectivasestarjas
la siguiente:
es el siguiente:
Pesos en Kg. Número de alumnos
25 – 30 ///
30 – 35 /////
35 – 40 ///// /////
40 – 45 ///// ///// ////
45 – 50 ///// /////
50 – 55 /////
55 - 60 ///
8) Intervalo de clase
Son las categorías o grupos en las que se deben distribuir los datos para una mejor
descripción de las variables cuantitativas. Los intervalos pueden ser cerrados,
cuando las variables son discretas; pueden ser semiabiertos o semicerrados,
cuando las variables son continuas, asimismo los intervalos pueden ser constantes
o variables (de diferente amplitud) como ya se dijo anteriormente.
Cuando existen datos extremos o muy aislados, el primero, el último o ambos
pueden se abiertos, esto es, con la finalidad de no usar demasiados intervalos
innecesariamente, muchos de ellos con frecuencias nulas.
En el caso de las variables cualitativas no se usan intervalos, sino categorías o
atributos excluyentes. Generalmente los intervalos para variables continuas deben
ser semicerrados, cerrados a la izquierda y abiertos a la derecha.
𝐶𝑖 = 𝑌𝑖 − 𝑌𝑖−1
Ejemplo:
𝐶1 = 𝑌1 − 𝑌0
𝐶1 = 30 − 25
𝐶1 = 5
Se obtiene sumando el límite inferior más el límite superior y dividiendo esta suma
entre dos:
𝑌𝑖−1 + 𝑌𝑖
𝑌𝑖 =
2
Ejemplo:
𝑌0 + 𝑌1
𝑌1 =
2
25 + 30
𝑌1 =
2
𝑌1 = 27.5 𝑘𝑔
𝑌1 + 𝑌2
𝑌2 =
2
30 + 35
𝑌2 =
2
𝑌2 = 32.5 𝑘𝑔
11) Frecuencia
Es el valor que representa a la cantidad de datos que pertenecen a cada uno de los
intervalos de clase, categorías o atributos de clasificación.
Tipos:
a. Absolutas
Son los números que representan a la cantidad de datos que pertenecen a cada
una de las categorías o intervalos de clase, tienen la característica de ser
números enteros positivos, a su vez se clasifican en:
∑ 𝑛𝑖 = ∑ 𝑓𝑖 = 𝑛 0 ≤ 𝑛𝑖 ≤ 𝑛
𝑖=1 𝑖=1
Ejemplo:
n1=3, indica que existen 3 alumnos cuyos pesos oscilan entre 25 y 30 kg.
n5=10, indica que existen 10 alumnos cuyos pesos oscilan entre 50 y 55 kg.
0 ≤ 𝑁𝑖 ≤ 𝑛
𝑁1 = 𝑛1
𝑁2 = 𝑛1 + 𝑛2 = 𝑁1 + 𝑛2
𝑁2 = 𝑛1 + 𝑛2 + 𝑛3 = 𝑁2 + 𝑛3
𝑁𝑖 = 𝑁𝑖−1 + 𝑛𝑖
𝑁𝑚 = 𝑛
Ejemplo:
𝑁2 = 3 + 5
𝑁2 = 8
Esto indica que hay 8 estudiantes cuyos pesos fluctúan entre 25 y 35 kg.
𝑁4 = 3 + 5 + 10 + 14
𝑁4 = 32
Esto indica que hay 32 estudiantes con pesos entre 25 y 45 kg o con pesos
menores que 45 kg.
b. Relativas
Son las que resultan de dividir las frecuencias absolutas entre el número total
de datos en estudio, se les llama también tanto por uno, o probabilidades de
ocurrencia de los datos en los intervalos o categorías correspondientes, a su
vez se clasifican en:
i. Simples (hi)
Son los que resultan de dividir una frecuencia absoluta simple entre el
número total de datos, en consecuencia, indican la probabilidad de
ocurrencia de los datos en el intervalo de clase o categoría correspondiente,
se les representa por hi.
𝑛𝑖 𝑓𝑖
ℎ𝑖 = = 0 ≤ ℎ𝑖 ≤ 1
𝑛 𝑛
𝑚
∑ ℎ𝑖 = 1
𝑖=1
Ejemplo:
𝑛2
ℎ2 =
𝑛
5
ℎ2 =
50
ℎ2 = 0.1
𝑛5
ℎ5 =
𝑛
10
ℎ5 =
50
ℎ5 = 0.2
𝑁𝑖 𝑓𝑖
𝐻𝑖 = = 0 ≤ 𝐻𝑖 ≤ 1
𝑛 𝑛
𝑖
𝐻𝑖 = ∑ ℎ𝑗
𝑗=1
𝐻1 = ℎ1
𝐻2 = ℎ1 + ℎ2
𝐻3 = ℎ1 + ℎ2 + ℎ3
𝐻𝑖 = 𝐻𝑖−1 + ℎ𝑖
𝐻𝑚 = 1, 0
Ejemplo:
𝑁3
𝐻3 =
𝑛
18
𝐻3 =
50
𝐻3 = 0.36
𝐻3 = 0.36
𝑁4
𝐻4 =
𝑛
32
𝐻4 =
50
𝐻4 = 0.64
𝐻4 = 0.64
c. Porcentuales
Son los que resultan de multiplicar una frecuencia relativa por cien. Como
quiera que las frecuencias relativas no son usadas por el común de la gente, se
ha preferido utilizar los porcentajes que son más comunes y entendibles. A su
vez se clasifican en:
i. Simples (pi)
Son las que resultan de multiplicar una frecuencia relativa simple por cien, e
indican el porcentaje de datos que corresponden al intercalo de clase o
categoría de clasificación dada. Se les representa por pi.
𝑝𝑖 = ℎ𝑖 × 100% 0 ≤ 𝑝𝑖 ≤ 100%
𝑚
∑ 𝜌𝑖 = 100%
𝑖=1
Ejemplo:
𝑝3 = ℎ3 × 100
𝑝3 = 0.2 × 100
𝑝3 = 20%
𝑝7 = ℎ7 × 100
𝑝7 = 0.06 × 100
𝑝3 = 6%
𝑃1 = 𝐻𝑖 × 100% 0 ≤ 𝑃𝑖 ≤ 100%
𝑃𝑖 = ∑ 𝑝𝑗
𝑗=1
𝑃1 = 𝑝1
𝑃2 = 𝑝1 + 𝑝2
𝑃2 = 𝑝1 + 𝑝2 + 𝑝3
…
𝑃𝑖 = 𝑃𝑖−1 + 𝑝𝑖
…
𝑃𝑚 = 100%
Ejemplo:
Para el ejemplo que se tiene
𝑃2 = 𝐻2 × 100%
𝑃2 = 0.16 × 100%
𝑃2 = 16%
𝑃2 = 6% + 10%
𝑃2 = 16%
Esto indica que el 16% de los alumnos pesan entre 25 y 35 kg.
𝑃5 = 𝐻5 × 100%
𝑃5 = 0.84 × 100%
𝑃5 = 84%
𝑃5 = 84%
Es un cuadro preliminar de trabajo que contiene todas las frecuencias parte del cual, se
usará para la presentación de datos ya sea en cuadros o en gráficas estadísticas, también
se usa para hacer la descripción completa de los datos de estudio.
Es un cuadro preliminar de trabajo que contiene todas las frecuencias, parte del cual
se usará para la presentación de datos ya sea en cuadros o en gráficas estadísticas, también
se usa para hacer la descripción completa de los datos en estudio.
Cuadro de Distribución de Frecuencias
Y '
i −1 − Yi ' ) Yi ni Ni hi Hi pi Pi
Y 0
'
)
− Y1' Y1 n1 N 1 h1 H1 p1 P1
Y '
−Y ) ' Y2 n2 N 2 h2 H2 p2 P2
Y
1 2
2
'
−Y )3
' Y3 n3 N 3 h3 H3 p3 P3
………. … …. …. … …. … ….
Ym' −1 − Ym' ) Ym nm N m = n hm H m = 1,0 pm Pm = 100%
Total n 1,0 100%
Ejemplo:
Ejemplo:
UseUse los datos
los datos del ejemplo
del ejemplo y estudio,enpara
estudio, para
construir construir
el cuadro el cuadrodede distribución
de distribución
de frecuencias correspondiente.
frecuencias correspondiente.
Solución:
Yi −' 1 − Yi ' Yi ) ni Ni hi Hi pi Pi
25 – 30 27,5 3 3 0,06 0,06 6% 6%
30 – 35 32,5 5 8 0,10 0,16 10% 16%
35 – 40 37,5 10 18 0,20 0,36 20% 36%
40 – 45 42,5 14 32 0,28 0,64 28% 64%
45 – 50 47,5 10 42 0,20 0,84 20% 84%
50 – 55 52,5 5 47 0,10 0,94 10% 94%
55 - 60 57,5 3 50 0,06 1,00 6% 100%
Total 50 1,00 100%
Se nota que el alumno con mayor peso es el de 60 kg. y el de menor peso es el de 25 kg,
la distribución de los alumnos según su peso es simétrica, alrededor de los 42,5 kg., la
mayor cantidad de alumnos (28%) pesan entre los 40 a 45 kg. el 36% de los alumnos
pesan menos de 40 kg. y el 84% de los alumnos pesan menos de 50 kg. etc. Este es una
pequeña descripción de la distribución de los alumnos según su peso, es bueno recordar
que cuando todavía no estaba ordenado no pudimos hacer mayores descripciones, que el
peso mínimo y el máximo y esto con gran esfuerzo.
Ejemplo 2:
El siguiente cuadro indica el número de créditos aprobados por 50 alumnos del segundo
ciclo de Estadística
Ls = 44
Li = 10
R = 44 – 10 = 34
C = 34/7 = 4.857 = 5
R’ = 5x7 = 35
∆ = 35 – 34 = 1
LI = 10-0 = 10
LS = 44+1 = 45
Ejemplo 3:
Soltero, soltero, casado, soltero, conviviente, soltero, casado, soltero, casado, divorciado,
casado, soltero, casado, divorciado, viudo, soltero, casado, soltero, casado, divorciado,
Ejemplo 03. A un conjunto de 40 alumnos de la UNASAM se les preguntó sobre su
casado, conviviente, casado, soltero, soltero, soltero, viudo, conviviente, conviviente,
estado civil, a los que contestaron según la serie siguiente:
Soltero, soltero,
soltero,casado,
casado,conviviente, soltero, conviviente,
soltero, conviviente, soltero, soltero,
casado,conviviente, divorciado,
soltero, casado, divorciado,
casado, soltero,soltero,
soltero, casado, divorciado, viudo, soltero, casado, soltero, casado, divorciado,
conviviente.
casado, conviviente, casado, soltero, soltero, soltero, viudo, conviviente, conviviente,
soltero, casado, conviviente, soltero, conviviente, soltero, conviviente, divorciado,
soltero, soltero, conviviente.
En este caso solo son necesarias lar tarjas de contar con facilidad el número de alumnos
Solución:
En este casoestado
por cada sólo civil.
son necesarias las tarjas a fin de contar con facilidad el número de
alumnos por cada estado civil.
Estado ni Ni hi Hi pi Pi
Civil
Soltero 16 16 0,40 0,40 40% 40%
Casado 10 26 0,25 0,65 25% 65%
Conviviente 8 34 0,20 0,85 20,% 85%
Divorciado 4 38 0,10 0,95 10% 95%
Viudo 2 40 0,05 1,00 5% 100,%
Total 40 1,00 100%
Capítulo 4
PRESENTACIÓN DE DATOS
La presentación de los datos, después de haberlos ordenado y clasificado, se puede hacer
de dos maneras: por medio de los cuadros estadísticos y por medio de las gráficas
estadísticas. Sin embargo, cabe aclarar que la mayoría de las gráficas o figuras se utilizan
por razones diferentes que, por la simple presentación de datos, una de esas razones es la
publicidad, a pesar de que, como método para presentar datos, la gráfica es inferior a la
de un cuadro, pues de la gráfica sólo se puede obtener aproximaciones visuales acerca de
la distribución de los datos, en cambio de un cuadro se obtiene la información precisa de
dicha distribución.
1) CUADROS ESTADÍSTICOS
Se le llama también Tabla Estadística, este es un método de presentar
ordenadamente los datos, después de que éstos hayan sido agrupados y
distribuidos en uno o más sistemas de clasificación. Existen diferentes tipos de
tablas, pero lo agruparemos en sólo dos grupos.
a) Cuadros Analíticos
Son los diseñados para ayudar al análisis formal de las relaciones mutuas entre
variables y categorías de clasificación.
b) Cuadros de Referencia
Son los diseñados para servir como depósito de información estadística,
éstos se encuentran generalmente en los apéndices de los informes o
reportes.
b. Título
El título de un cuadro indica el contenido del mismo, y debe responder a las
siguientes preguntas: ¿Qué?, ¿Cuándo?, ¿Dónde? Y ¿Cómo? Están
clasificados los datos. Al redactar un título se debe evitar un enunciado
demasiado extenso, así como una extrema brevedad.
d. Talón
Es la parte de la tabla que contiene al conjunto de encabezados o rótulos de
las hileras, que corresponde a una de las clasificaciones. Está situado al lado
izquierdo del observador. Cada hilera de la tabla debe tener un rótulo que
describa los datos presentados en dicha hilera. Se le llama también columna
matriz.
e. Cajón
Es la parte de la tabla que contiene los encabezados o rótulos de las
columnas. Corresponden a otra de las clasificaciones y está situado al lado
superior derecho del observador, así como en las hileras cada columna debe
tener un rótulo que describa los datos que en ella se presentan. Se le llama
también encabezado del cuadro.
f. Campo
Se le conoce también como el cuerpo de la tabla, y es la parte que contiene
los datos numéricos o estadísticos, cada registro se presenta en una Celda o
Casilla que viene a ser la unidad básica de presentación de la tabla. Una
celda resulta de la intersección de una columna con una hilera, ya que el
significado del dato presentado en ella se indica con la combinación de los
rótulos de la hilera y de la columna correspondiente.
h. Fuente de datos
Estas notas indican el origen de los datos presentados en la tabla, sirven para
identificar o reconocer a la persona o institución que lo confeccionó y lo
publicó; sirve también como una ayuda para evaluar la confiabilidad y
permitir su verificación, así como tener información adicional.
Nº de la Tabla TÍTULO
(Notas en el encabezado)
PARTES:
➢ Número
Toda gráfica debe tener un número que lo identifique, cumple el mismo
objetivo que el de las tablas estadísticas, salvo que sea una sola gráfica la que
se presenta en el reporte.
➢ Título
El título tiene las mismas características que la de una tabla estadística; es
decir, el título es una descripción del contenido de la gráfica, con la diferencia
de que pueden ser colocados ya sean en la parte superior o en la parte inferior
de la gráfica.
➢ Diagrama
Los diagramas, como el cuerpo de una tabla estadística, son usados para
representar los datos mostrados en la gráfica. Se recomienda identificar
claramente las clases o categorías de clasificación, poniendo a cada uno de
ellos el nombre y si es posible el valor que le corresponde.
➢ Escala
Toda gráfica debe proveer una escala que le permita al lector, interpretar el
significado de las magnitudes de las líneas, barras u otras formas que sirvan
para representar tanto a las frecuencias como a las categorías. Las escalas se
ubican generalmente en los ejes cartesianos, cuando las gráficas son
presentadas usando el plano cartesiano, con frecuencia el eje de las X o de las
abscisas son para las variables, en tanto que el eje de las Y o de las ordenadas
son para las frecuencias. El punto cero u origen debe ser indicado con claridad,
en caso de que el origen y la parte de la escala a ser usada sea muy distante se
hace una línea quebrada como:
➢ Fuente de datos
Se debe indicar la fuente de donde se obtuvo los datos para construir el
diagrama o la gráfica, el cual dará mayor formalidad a la presentación.
CLASES
Existe una gamma bastante extensa de diagramas y gráficas para presentar los
datos, de acuerdo a la variable o variables en estudio, los mismo se pueden
clasificar de la forma siguiente:
2) De coordenadas no ortogonales:
De coordenadas polares - En espiral
De coordenadas triangulares.
De coordenadas angulares.
De coordenadas conjugadas. etc.
3) Sin coordenadas:
De superficies – gráfico de sectores.
De volúmenes – cubos, esferas, etc.
De figuras – pictogramas. Gráfico de ta Mapas – cartogramas o carto
diagramas. Etc.
CLASIFICACIÓN DE LAS GRÁFICAS MAS USADAS
1. Histograma de frecuencias
C.Nº 2.
Temperatura en Número
Xi Fi
Grados Centígrados de días
31,5 – 32,5 32,0 3 3
32,5 – 33,5 33,0 6 9
33,5 – 34,5 34.0 10 19
34,5 – 35,5 35.0 15 34
35,5 – 36,5 36.0 8 42
36,5 – 37,5 37,0 6 48
37,5 – 38,5 38.0 4 52
Total 52
14
12
10
8
Número de Alumnos
2
27.5 32.5 37.5 42.5 47.5 52.5 57.5
Peso en kg.
3. Gráfico de tendencia
8,000
NÚMERO DE ALUMNOS
Ejemplo. Se hizo una encuesta a 88 obreros sobre su jornal. Los resultados son l
6,000
siguientes.
C. Nº4,000
4.
4. F.
Polígono de frecuenciasDE
Nº 6. POLÍGONO acumuladas. Ojiva
FRECUENCIAS ACUMULADAS – OJIVA
5. Pirámide poblacional
PIRÁMIDE POBLACIONAL DE ESPAÑA (2020)
6. Diagrama de barras
7. Gráfico de bastones
Ejemplo:
Se hizo una encuesta a 220 alumnos ingresantes a la UNASAM, sobre el promedio
de notas que obtuvieron el quinto de secundaria, los cuales fueron agrupados de acuerdo
a sus ingresos económicos, los resultados se presentan en la siguiente gráfica.
8. GráficoF.
deNºcajas
11. GRÁFICO DE CAJAS
18
17
218
16
15
Puntaje en 5to secundaria
14
13
12
11
10
N= 17 150 55
10. Pictograma
PROMEDIO DE ARBOLES PLANTADOS POR DÍAS EN UNA CIUDAD
11. Gráfico de Gantt
Capítulo 5
MEDIDAS DESCRIPTIVAS
Si se pretende describir con un solo un valor las características del conjunto de datos,
hablaremos del estadístico si el conjunto corresponde a una muestra, y parámetro si el
conjunto corresponde a la población. Puesto que es difícil estudiar poblaciones enteras;
es más frecuente el uso de la muestra; por lo tanto, se incidirá más en el estudio del
estadístico para describir los datos, de ahí que el estadístico tomará el nombre de medida
descriptiva.
Los estadísticos que se estudiarán en esta unidad, son los que describen las siguientes
características:
Clases
a) Medias fijas
Se les llama también medias matemáticas o medidas de centralización, debido
a que se ubican generalmente en el centro de distribución y poseen las
siguientes características:
✓ Para la obtención de su valor se usan todos los datos en estudio.
✓ Son afectados por los valores extremos o aislados de los datos en
estudio.
✓ Pueden ser sometidos a operaciones algebraicas.
b) Medias móviles
Se les llama también medias no matemáticas o de posición, tienen las
siguientes características:
✓ Para obtener su valor, solo se usa algunos valores del conjunto de datos
en estudio.
✓ No son afectados por los valores extremos o aislados del conjunto de
datos en estudio.
✓ No pueden ser sometidos a operaciones algebraicas.
El valor se obtiene dividiendo la suma de todos los valores de los datos en estudio, entre
el número total de los mismos, y se expresa de la siguiente manera:
∑𝑁
𝑖=1 𝑋𝑖
𝑢=
𝑁
Dónde:
EJEMPLO 1:
En una muestra aleatoria de 5 semanas se observó que una agencia de cruceros recibía el
siguiente número de programas semanales especiales de cruceros al Caribe: 20, 73, 75,
80, 82. Calcule la media aritmética.
∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑥̅ =
𝑛
∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛
330
𝑥̅ =
5
𝑥̅ = 66
Propiedades
a) La suma algebraica de las diferencias de cada uno de los valores respecto a su
media aritmética es igual a cero
∑(𝑋𝑖 − 𝑋̅) = 0
𝑖=1
∑(𝑋𝑖 − 𝑋̅)𝑓𝑖 = 0
𝑖=1
c) La media aritmética de una constante por una variable es igual a la constante por
la media aritmética de la variable.
𝑀(𝑋𝐾) = 𝐾 𝑀(𝑋)
d) La media aritmética de una variable más(menos) una constante es igual a la media
aritmética de la variable más(menos) la constante.
𝑀(𝑋 ± 𝐾) = 𝑀(𝑋) ± 𝐾
𝑀(𝑎𝑋 ± 𝑏) = 𝑎𝑀(𝑋) ± 𝑏
f) La suma de los cuadrados de las desviaciones de cada uno de los datos respecto a
su media aritmética es mínima (Teorema de Köning).
Ventajas
❖ Es un concepto muy familiar para la mayoría de las personas e intuitivamente
claro y usada muy a menudo.
❖ Es una medida que puede ser calculada y es única. Pues cada conjunto de datos
tiene una y sola una media aritmética.
❖ Para calcular su valor se usa todos los valores de los datos en estudio.
❖ Es una medida bastante representativa del conjunto de datos.
❖ En una gráfica de frecuencias representa el centro de gravedad
❖ Es sensible a cualquier cambio en los datos (puede ser usado como un detector de
variaciones en los datos).
Desventajas
❖ Se ve afectado por los valores extremos o aislados del conjunto de datos en
estudio, por lo que no es recomendable usarlo en distribuciones muy sesgadas.
❖ Su cálculo es tedioso, porque se usan todos los valores.
❖ No se puede calcular la media aritmética para datos agrupados, cuyos intervalos
de clase en los extremos son abiertos.
❖ Si se emplean variables discretas o cualitativas, la media aritmética puede no
pertenecer al conjunto de valores de la variable.
∑𝑟𝑖=1 𝑋𝑖 𝑤𝑖
𝑋̅ =
∑𝑟𝑖=1 𝑤𝑖
Dónde:
𝑤 = es la ponderación de X
Ejemplo:
Para determinar la nota del alumno debemos hallar la media ponderada con los valores
que nos da el enunciado.
𝑥𝑝 = 7.7
̅̅̅
De modo que la nota final de matemáticas de este alumno será 7,7 porque es el resultado
que se obtiene de la media ponderada.
Casos Especiales
a) La media aritmética para datos agrupados, es una forma particular de la media
aritmética ponderada, pues:
Si:
𝑤𝑖 = 𝑓𝑖 𝑟=𝑚 ∑ 𝑓𝑖 = 𝑛
𝑖=1
∑𝑟𝑖=1 𝑋𝑖 𝑤𝑖 ∑𝑚
𝑖=1 𝑋𝑖 𝑓𝑖 ∑𝑚
𝑖=1 𝑋𝑖 𝑓𝑖
𝑋̅ = = =
∑𝑟𝑖=1 𝑤𝑖 ∑𝑚
𝑖=1 𝑓𝑖 𝑛
𝑋𝑖 = 𝑋̅𝑖 𝑤𝑖 = 𝑓𝑖 ∑ 𝑓𝑖 = 𝑛
𝑖=1
𝑟 𝑟
∑𝑟𝑖=1 𝑋𝑖 𝑤𝑖 ∑𝑖=1 𝑋̅𝑖 𝑓𝑖 ∑𝑖=1 𝑋̅𝑖 𝑓𝑖
𝑋̅ = 𝑟 = =
∑𝑖=1 𝑤𝑖 ∑𝑟𝑖=1 𝑓𝑖 𝑛
MEDIA GEOMÉTRICA “Mg”
Se le representa por Mg. La media geométrica, es la raíz n-ésima del producto de los n
valores de los datos en estudio. Se usa como promedio de series geométricas y en ciertos
casos especiales como el índice de precios, tasas de crecimiento poblacional, tasas de
interés bancario, etc. Se puede presentar de dos formas, a saber:
𝑛 𝑛
𝑀𝑔 = √∏ 𝑋𝑖
𝑖=1
∑𝑛𝑖=1 𝑛𝑖 log 𝑋𝑖
𝑀𝑔 = 𝐴𝑛𝑡ⅈ log [ ]
𝑛
𝑛
𝑀𝑔 = √𝑋1 𝑛1 𝑋2 𝑛2 𝑋3 𝑛3 … 𝑋𝑚 𝑛𝑚
𝑛 𝑚
𝑀𝑔 = √∏ 𝑋𝑖 𝑛𝑖
𝑖=1
∑𝑚
𝑖=1 𝑛𝑖 log 𝑋𝑖
𝑀𝑔 = 𝐴𝑛𝑡ⅈ log [ ]
𝑛
Ejemplo:
Se conocen los resultados económicos de una empresa de los últimos cinco años. El
primer año la empresa generó un 10% de rentabilidad económica, el segundo año el
beneficio llegó al 23%, en el tercer año el dinero ganado fue del 16%, el cuarto año logró
un 7% de rentabilidad económica y la inversión del quintó año supuso una rentabilidad
del 20%. Se pide calcular el promedio de todos los porcentajes.
Como hemos visto, para calcular el promedio de porcentajes no debes utilizar la media
aritmética, sino que tenemos que hacer el cálculo con la media geométrica.
5
𝑀𝑔 = √(1.1)(1.23)(1.16)(1.07)(1.2)
𝑀𝑔 = 1.15
𝑀𝑔 = 15%
Desventajas
• Su cálculo es muy engorroso.
• Está limitado sólo para valores positivos, si hay algún valor negativo, entonces el
resultado podría ser imaginario.
• Si uno o más valores son iguales a cero, la Mg es cero.
Propiedades
• Si todos los valores de los datos son iguales a una cantidad determinada
(constante), la Mg es igual a esa cantidad determinada.
• La media geométrica de dos series de datos, es igual al producto de sus medias
geométricas.
• La media geométrica de un conjunto de datos es siempre menor o igual a la media
aritmética. 𝑀𝑔 ≤ 𝑋
𝑛
𝑀ℎ = 𝑚
𝑛𝑖
∑
𝑖=1 𝑥𝑖
Ejemplos:
Una persona compra acciones de una empresa cada año durante 5 años seguidos. Durante
este periodo el precio de las acciones ha fluctuado bastante: el primero año valía 7€ cada
acción, el segundo año 10€, el tercer año 15€, el cuarto año la empresa tuvo grandes
pérdidas económicas y el precio bajó hasta los 6€ por acción y, finalmente, el quinto año
la compañía hizo una fuerte inversión que provocó un aumento del precio hasta los 11€.
¿Cuál ha sido el precio medio de compra de las acciones?
5
𝑀ℎ =
1 1 1 1 1
+ + + +
7 10 15 6 11
𝑀ℎ = 8.82
Propiedad
La media armónica para datos positivos, es siempre menor o igual que la media
geométrica. Por consiguiente, se presenta la siguiente desigualdad:
𝑀ℎ ≤ 𝑀𝑔 ≤ 𝑀(𝑋)
Desventaja
Cuando por lo menos un valor del conjunto de datos en estudio es cero, la media armónica
para ese conjunto no está definida.
Propiedad
La media cuadrática es siempre mayor o igual a la media aritmética
𝑀(𝑋) ≤ 𝑀𝑐(𝑋)
𝑀ℎ ≤ 𝑀𝑔 ≤ 𝑀(𝑋) ≤ 𝑀𝑐(𝑋)
Ejemplo
En una clase de laboratorio de la universidad, el profesor pide hacer un experimento con
sustancias químicas a sus alumnos. El objetivo del experimento químico es conseguir una
disolución de 3 litros en total. Los grupos de alumnos han obtenido los siguientes datos:
(0.94)2 + (−0.42)2 + (0.51)2 + (1.29)2 + (−0.95)2
𝑀𝑐(𝑋) = √
5
𝑀𝑐(𝑋) = 0.88
MEDIANA “Me”
𝑥1 + 1
𝑀𝑒 =
2
Ejemplo:
Me = 7.
✓ Para datos agrupados
En este caso se usa el cuadro de distribución de frecuencias, aplicando la siguiente
fórmula:
𝑛
− 𝐹𝑖−1
1
𝑀𝑒 = 𝑌𝑖−1 + 𝐶𝑖 [2 ]
𝑓𝑖
Donde:
1
𝑌𝑖−1 : Límite inferior de la clase de la mediana.
Propiedades
La suma de las desviaciones absolutas de los valores de los datos con respecto a la
mediana es mínima. Es decir, es menor que la suma de las desviaciones absolutas con
relación a cualquier otro valor de la distribución.
∑|𝑋𝑖 − 𝑀𝑒 |
𝑖=1
∑|𝑋𝑖 − 𝑀𝑒 |𝑓𝑖
𝑖=1
∑|𝑋𝑖 − 𝑀𝑒 | ≤ ∑|𝑋𝑖 − 𝑎|
𝑖=1 𝑖=1
✓ Donde a es cualquier valor:
𝑚 𝑚
Ventajas
✓ El cálculo de su valor es bastante sencillo sobre todo si los datos no están
agrupados.
✓ No es necesario que todos los intervalos sean cerrados o semiabiertos, para
calcular su valor. Los extremos pueden ser intervalos abiertos, salvo en que el
intervalo de la clase de la mediana sea uno de ellos.
✓ La mediana no es afectada por valores extremos.
✓ No se usan todos los valores para calcular su valor.
Desventajas
• No se puede calcular la mediana para variables cualitativas con escala de medición
nominal, salvo que sea ordinal.
• No se pueden hacer operaciones algebraicas.
• La mediana para valores.
MODA “Mo”
En un conjunto de datos, la moda puede no existir, por no existir ningún dato que se repita
más veces que los demás; por lo tanto, la distribución se llama uniforme. Si el conjunto
de datos tiene una sola moda, a la distribución se le llama unimodal. Si tiene dos o más
modas, la distribución toma el nombre de multimodal, pudiendo ser bimodal, trimodal,
etc.
Ejemplo N° 01:
8 7 0 6 10 9 13 8 0 6 2 6 5 11 10 0 9 8 6 12 3 5 11 1 4 8 10 2 5 7
0 0 0 1 2 2 3 4 5 5 5 6 6 6 6 7 7 8 8 8 8 9 9 10 10 10 11 11 12 13
Mo = {6; 8}
1
𝛥1
𝑀𝑒 = 𝑌𝑖−1 + 𝐶𝑖 [ ]
𝛥1 + 𝛥2
Donde:
𝛥1 = 𝑓𝑖 − 𝑓𝑖−1 𝑜 ℎ𝑖 − ℎ𝑖−1
𝛥2 = 𝑓𝑖 − 𝑓𝑖+1 𝑜 ℎ𝑖 − ℎ𝑖+1
1
𝑌𝑖−1 : Límite inferior de la clase modal.
Ejemplo 1:
Calcular la moda de una distribución estadística que viene dada por la siguiente
tabla:
´
𝑌𝑖−1 =5
𝛥1 = 3
𝐶ⅈ = 3
𝑓ⅈ = 6
Reemplazando en la fórmula:
(10 − 3)
𝑀𝑜 = 5 + ×3
(10 − 3) + (10 − 6)
𝑀𝑜 = 6.27
Ejemplo 2:
´
𝑌𝑖−1 = 42
𝛥1 = 18
𝐶ⅈ = 3
𝑓ⅈ = 27
Reemplazando en la fórmula:
(42 − 18)
𝑀𝑜 = 66 + ×3
(42 − 18) + (12 − 27)
𝑀𝑜 = 67.846
Ventajas
✓ La moda se puede usar como un punto de localización tanto para datos cualitativos
como cuantitativos.
✓ La moda no es afectada por valores extremos.
✓ La moda puede calcularse aun cuando uno o los dos intervalos de los extremos
sean abiertos.
Desventajas
✓ La moda puede no existir y si existe puede haber dos o más modas, por lo que su
interpretación no es sencilla.
✓ La moda no se presta a manipulaciones algebraicas.
FRACTILES
Son estadígrafos de posición, se les conoce también como cuartiles. Son medidas que
dividen a la distribución en tantas partes como se requiera para la descripción de los
mismos. Entre ellos los más conocidos son: los Cuartiles, los Deciles y los Percentiles o
Centiles.
1) CUARTILES (QJ)
Son los que dividen a la distribución en cuatro partes iguales, de tal manera que,
cada parte contiene un 25% de los datos debidamente ordenados en forma
ascendente.
Q1 Me Q3 Q4
LI ¡----------------¡---------------------¡-------------------¡-------------------¡LS
Ejemplo:
1, 3, 4, 5, 6, 7, 11
Como n = 7, entonces:
𝑛+1
𝑄1 =
4
7+1
𝑄1 =
4
𝑄1 = 2
Ejemplo 1:
Determinar Q3
23, 25, 27, 28, 29, 30, 31, 32, 32, 33, 35, 35,36,37
3(𝑛 + 1)
𝑄3 =
4
3(14 + 1)
𝑄3 =
4
𝑄3 = 11.25
Esto significa que el Q3es el onceavo dato más el 75% de la diferencia entre los
valores de las observaciones onceavo y doceava luego:
𝑄3 = 35 + (35 − 35)(0.75)
𝑄3 = 35 𝑠𝑜𝑙𝑒𝑠
iii) Cuartiles para datos agrupados.
En este caso se usará la siguiente fórmula:
𝑗𝑛
− 𝐹ⅈ − 1
𝑄𝑗 = ′
𝑌𝑖−1 + 𝐶𝑖 [ 4 ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎𝑠)
𝑓ⅈ
𝑗
− 𝐻ⅈ − 1
′
𝑄𝑗 = 𝑌𝑖−1 + 𝐶𝑖 [4 ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑟𝑒𝑙𝑎𝑡ⅈ𝑣𝑎𝑠)
ℎⅈ
∀𝑗 = 1,2,3,4
Ejemplos:
𝑓ⅈ 𝐹ⅈ
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
65
1× = 16.25
4
Datos:
′
𝑌𝑖−1 = 60
𝐹ⅈ − 1 = 8
𝑓ⅈ = 10
𝐶𝑖 = 10
16.25 − 8
𝑄1 = 60 + 10 [ ] = 68.25
10
65
2× = 32.25
4
Datos:
′
𝑌𝑖−1 = 70
𝐹ⅈ − 1 = 18
𝑓ⅈ = 16
𝐶𝑖 = 10
32.25 − 18
𝑄1 = 670 + 10 [ ]
16
𝑄1 = 79.0625
65
3∗ = 48.75
4
Después buscamos en la columna de frecuencia acumulada el intervalo que
contiene a 48.75: la clase de 𝑄3 𝑒𝑠 [90, 100)
Datos:
′
𝑌𝑖−1 = 90
𝐹ⅈ − 1 = 48
𝑓ⅈ = 10
𝐶𝑖 = 10
48.75 − 48
𝑄3 = 90 + 10 [ ] = 90.75
10
2) DECILES (DJ)
Son las medidas que dividen a la distribución en 10 partes iguales, de tal manera
que cada parte contiene el 10% de las observaciones o datos.
𝑗𝑛
10 − 𝐹ⅈ − 1
′
𝐷𝑗 = 𝑌𝑖−1 + 𝐶𝑖 [ ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎𝑠)
𝑓ⅈ
𝑗
− 𝐻ⅈ − 1
′
𝐷𝑗 = 𝑌𝑖−1 + 𝐶𝑖 [10 ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑟𝑒𝑙𝑎𝑡ⅈ𝑣𝑎𝑠)
ℎⅈ
Ejemplo:
65
1× = 6.5
10
Datos:
′
𝑌𝑖−1 = 50
𝐹ⅈ − 1 = 0
𝑓ⅈ = 8
𝐶𝑖 = 10
6.5 − 0
𝑄3 = 50 + 10 [ ] = 58.12
8
65
3× = 19.5
10
Después buscamos en la columna de frecuencia acumulada el intervalo que
contiene a 19.5: la clase de 𝐷3 𝑒𝑠 [70, 80)
Datos:
′
𝑌𝑖−1 = 70
𝐹ⅈ − 1 = 18
𝑓ⅈ = 16
𝐶𝑖 = 10
19.5 − 18
𝑄3 = 70 + 10 [ ] = 70.94
16
65
9× = 58.5
10
Datos:
′
𝑌𝑖−1 = 100
𝐹ⅈ − 1 = 58
𝑓ⅈ = 5
𝐶𝑖 = 10
58.5 − 58
𝑄3 = 100 + 10 [ ] = 101
5
3) PERCENTILES (PJ)
Se les llama también centiles. Son las medidas que dividen a la distribución en
100 partes iguales, de tal manera que cada parte contiene el uno por ciento de los
datos. Estas medidas incluyen a los cuartiles y a los deciles, e incluso a los
quintiles. Los percentiles para datos no agrupados son calculados de igual manera
que para los cuartiles, pero como no son muy usados no se les analizará por ahora.
Pj indica que el j% de los datos están incluidos hasta este punto; en otras palabras,
Pj es el valor máximo del j% de los datos.
𝑗𝑛
− 𝐹ⅈ − 1
𝑃𝑗 = ′
𝑌𝑖−1 + 𝐶𝑖 [ 100 ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎𝑠)
𝑓ⅈ
𝑗
− 𝐻ⅈ − 1
′
𝑃𝑗 = 𝑌𝑖−1 + 𝐶𝑖 [ 100 ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑟𝑒𝑙𝑎𝑡ⅈ𝑣𝑎𝑠)
ℎⅈ
Ejemplo:
𝑓ⅈ 𝐹ⅈ
[10, 15) 10 10
[15, 20) 12 22
[20, 25) 6 28
[25, 30) 8 36
[30, 35) 9 45
[35, 40) 11 56
[40, 45) 13 69
n=69
69
35 × = 24.15
100
Después buscamos en la columna de frecuencia acumulada el intervalo que
contiene a 24.15: la clase de 𝑃35 𝑒𝑠 [20, 25)
Datos:
′
𝑌𝑖−1 = 20
𝐹ⅈ − 1 = 22
𝑓ⅈ = 6
𝐶𝑖 = 5
24.15 − 22
𝑄3 = 20 + 5 [ ] = 21.79
6
69
45 × = 31.05
100
Datos:
′
𝑌𝑖−1 = 25
𝐹ⅈ − 1 = 28
𝑓ⅈ = 8
𝐶𝑖 = 5
31.05 − 28
𝑄3 = 25 + 5 [ ] = 26.90625
8
iii) Cálculo del 95 percentil
Buscamos el intervalo donde se encuentre el 95 percentil multiplicando 95 por n
= 69 y dividirlo por 100.
69
95 ∗ = 65.55
100
Datos:
′
𝑌𝑖−1 = 40
𝐹ⅈ − 1 = 56
𝑓ⅈ = 13
𝐶𝑖 = 5
65.55 − 56
𝑄3 = 40 + 5 [ ] = 43.67
13
Capítulo 6
MEDIDAS DE DISPERSIÓN
Ninguna de las medidas de tendencia central o localización es suficiente, por si sola, para
describir a la distribución de un conjunto de datos; pues, a pesar de que dos conjuntos de
datos puedan tener la misma media; sin embargo, esto no implica que sean idénticos, ya
que sus datos pueden ser homogéneos o heterogéneos.
Las medidas de tendencia central tienen como objetivo el de sintetizar los datos en un
valor representativo, alrededor del cual se concentran o centralizan los datos; sin
embargo, los datos no necesariamente se agrupan o concentran alrededor de este punto,
sino que pueden dispersarse de este punto, en algunos casos más que en otros, a las
medidas que indican este grado de concentración o dispersión se les llamará medidas de
dispersión. Estas medidas de dispersión nos dirán hasta qué punto estas medidas de
tendencia central son representativas como síntesis de la información. Las medidas de
dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
distribución respecto al valor central determinado.
Al igual que sucede con cualquier conjunto de datos, las medidas de tendencia central
sólo nos revelan una parte de la información que necesitamos acerca de las características
de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir
también su dispersión, extensión o variabilidad.
Pero debemos tener presente que de todas maneras hay dispersión en la mayoría de los
datos, por lo que debemos estar en capacidad de describirla. Ya que la dispersión ocurre
frecuentemente y su grado de variabilidad es importante conocerlo.
Los datos pueden tener la misma magnitud; es decir, pueden ser constantes o no tener
variabilidad, pueden variar moderadamente e incluso pueden ser muy dispersos unos de
otros o respecto a un valor central, y de acuerdo a ese grado de variabilidad una medida
de tendencia central o posición tiene representatividad o deja de tenerlo.
A. Tipos
Hay dos tipos de medidas de dispersión. A saber:
✓ Absolutas
Son las que vienen expresadas en las mismas unidades de medida de la variable
en estudio, por lo tanto, son afectados por estas unidades y los valores
extremos; dentro de ellas tenemos:
▪ Rango de Variación: R.
▪ Desviación Media: DM(X)
▪ Recorrido Intercuartílico: RIQ(X)
▪ Varianza: V(X)
▪ Desviación Estándar o Típica: Sx
✓ Relativas
Son las que vienen expresadas en términos porcentuales. Por lo tanto, no son
distorsionados por las unidades de medida.
a) Rango: R
Cuando se trata de averiguar el grado de variabilidad o dispersión de los datos en
estudio, lo primero que se piensa es en el campo de variación o dominio de los
mismos, esta amplitud o rango de variación es la diferencia del dato de mayor
valor y el dato de menor valor, se le representa por R, es la medida de variabilidad
más fácil de calcular para datos finitos y sin agrupar, el valor se obtiene de la
siguiente forma:
R = Xmáx.- Xmín
Cuando los datos están agrupados, el rango se obtiene restando el límite superior
del último intervalo de clase menos el límite inferior del primer intervalo de clase;
es decir:
R = LS – LI
Ejemplos:
Se nota que, aunque en promedio las edades son iguales; sin embargo, las
dispersiones de las edades no son iguales. Las edades de las mujeres son más
variables.
El rango, si bien brinda una primera idea acerca de la homogeneidad de los datos,
tiene el inconveniente de que es distorsionado por lo valores extremos, a veces
único; en estos casos el recorrido indica una variación exagerada, para corregir
este inconveniente se usa el rango intercuartílico, que viene a ser la diferencia
entre el tercer cuartil y el primer cuartil: RIQ = Q3 – Q1; o el recorrido
interdecílico: RID = D9 – D1. En estas medidas no se usan los datos extremos
∑𝑛𝑖=1|𝑋1 − 𝑥̅ |
𝐷𝑀(𝑋) = 𝑝𝑎𝑟𝑎 𝑑𝑎𝑡𝑜𝑠 𝑛𝑜 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑛
𝑛
∑𝑖=1|𝑥1 − 𝑋̅|𝑓ⅈ
𝐷𝑀(𝑋) = 𝑝𝑎𝑟𝑎 𝑑𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑛
Ejemplos:
Calcular la desviación media de una distribución estadística que viene dada por la
siguiente tabla:
𝑓ⅈ
[10, 15) 3
[15, 20) 5
[20, 25) 7
[25, 30) 4
[30, 35) 2
Para resolver ello primero:
𝑥ⅈ 𝑥ⅈ ∗ 𝑓ⅈ |𝑥1 − 𝑋̅|𝑓ⅈ
[10, 15) 12.5 37.5 27.857
[15, 20) 17.5 87.5 21.429
[20, 25) 22.5 157.5 5
[25, 30) 37.5 110 22.857
[30, 35) 32.5 65 21.429
457.5 98.571
Hallamos la media:
457.5
𝑋̅ = = 21.786
21
98.57
𝐷𝑀(𝑋) = = 4.69
21
c) VARIANZA: V(X)
𝑛
∑𝑛𝑖=1 (𝑥𝑖 − 𝑋̅)𝑋̅ 2
𝑉(𝑋) = = ∑ 𝑋𝑖2− 𝑋̅ 𝑝𝑎𝑟𝑎 𝑑𝑎𝑡𝑜𝑠 𝑛𝑜 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑁
𝐿=1
𝑛
∑𝑛𝑖=1 (𝑥𝑖 − 𝑋̅)2 𝑓ⅈ
(𝑋) = = ∑ 𝑋𝑖2𝑓𝑖− 𝑋̅ 𝑝𝑎𝑟𝑎 𝑑𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑁
𝐿=1
Ejemplos
Meses Niños
9 1
10 4
11 9
12 16
13 11
14 8
15 1
Completamos la tabla
Xi fi Xi.fi 𝑥𝑖2 𝑓ⅈ
9 1 9 81
10 4 40 400
11 9 99 1089
12 16 192 2304
13 11 143 1859
14 8 112 1568
15 1 15 225
50 610 7526
7526
𝑉(𝑋) = − 12.2(12.2) = 1.68
50
610
𝑥̅ = = 12.2
50
Propiedades de la varianza:
V(X) ≥ 0
V(K) = 0
V (XK) = 𝐾 2 V(X)
Ejemplo:
Calcular la varianza de una distribución estadística que viene dada por la siguiente
tabla.
Xi fi Xi.fi 𝑥𝑖2 𝑓ⅈ
[10, 15) 12.5 3 37.5 468.75
[15, 20) 17.5 5 87.5 1531.25
[20, 25) 22.5 7 157.5 3543.75
[25, 30) 27.5 4 110 3025
[30, 35) 32.5 2 65 2112.5
21 457.5 10681.25
457.5
𝑥̅ = = 21.79
21
10681.25
𝑉(𝑋) = − 21.792 = 33.83
21
Ejemplos:
Grupo 1:
xi xi-𝑥̅ (𝑥 − 𝑥̅ )2
50 -20 400
60 -10 100
70 0 0
80 10 100
90 20 400
n=350 n=70 n=1000
Ejemplo 2:
Xi fi Xi.fi 𝑥𝑖2 𝑓ⅈ
[10, 15) 12.5 3 37.5 468.75
[15, 20) 17.5 5 87.5 1531.25
[20, 25) 22.5 7 157.5 3543.75
[25, 30) 27.5 4 110 3025
[30, 35) 32.5 2 65 2112.5
21 457.5 10681.25
457.5
𝑥̅ = = 21.79
21
10681.25
𝑉(𝑋) = − 21.792 = 33.83
21
𝑠𝑥 = √33.83
𝑠𝑥 = 5.816
En ciertas ocasiones es necesario contar con una medida de dispersión, sin que
esté influenciado por las unidades de medida de la variable; es decir, un número
puro que sirva para comparar varios conjuntos de datos que usan unidades de
medida diferentes unos de otros, pues cuando están con sus unidades de medida
no es posible tal comparación. En ese sentido se ha ideado varias medidas relativas
dividiendo una medida de dispersión absoluta entre una medida de posición y una
de ellas es el coeficiente de variación, que es el cociente entre la desviación
estándar y la media aritmética, lo que significa el número de veces de la desviación
estándar respecto a la media aritmética. Generalmente se le multiplica por cien
para expresarlo en términos porcentuales. Su valor se obtiene usando la siguiente
expresión:
𝑆𝑥
𝐶𝑉(𝑋) = ∗ 100
𝑥̅
Ejemplo:
Se midieron los pesos, en kg, de un grupo de 6 personas: 45, 62, 38, 55, 48, 52.
Se desea conocer el coeficiente de variación de la variable peso. Se inicia por el
cálculo de la media aritmética y la desviación estándar:
45 + 62 + 38 + 55 + 48 + 52
𝑥̅ = = 50
6
8.32
𝐶𝑉(𝑋) = ∗ 100 = 16.64%
50
Ejemplo 2:
Se midieron los pesos, en kg, de los 10 empleados en una oficina postal: 85, 62,
88, 55, 98, 52, 75, 70, 76, 77. Se desea conocer el coeficiente de variación de la
variable peso. Se calcula la media aritmética y la desviación estándar:
85 + 62 + ⋯ + 77
𝑥̅ = = 73.80
10
73.80
𝐶𝑉(𝑋) = ∗ 100 = 19.74%
14.57
Observación:
Las medidas de dispersión son bastante importantes para la determinación del tipo
de distribución que se tiene, especialmente cuando se trata de la medida del
rendimiento de los alumnos, de las inversiones realizadas, de los resultados- de
una investigación científica, etc., en ese sentido es preciso dar algunas
consideraciones que son de importancia para su mejor comprensión e
interpretación, estos son los siguientes:
Capítulo 7
MEDIDAS DE ASIMETRÍA
Las medidas de dispersión sólo indican la magnitud de las variabilidad de los datos, ya
sea en forma absoluta o en forma relativa, pero no indican nada acerca de la dirección
hacia dónde tienden a acentuarse dichas variaciones; para suplir esta deficiencia se
obtienen otras medidas llamadas de asimetría; por tanto, estas deben indicar la existencia
o falta de simetría de la distribución, mostrando la dirección hacia donde se inclina la
distribución, esta asimetría o simetría debe ser respecto a un punto de referencia de la
variable, pudiendo ser la media aritmética. Según su forma las distribuciones pueden ser
de dos formas: simétricas o asimétricas.
❖ Simétricas
❖ Asimétricas.
Positivas
Mo < Me < 𝑋̅
Mo > Me > 𝑋̅
a) Fórmula de Pearson
𝑥̅ − 𝑀𝑜 ̅̅̅̅̅
3(𝑋 − 𝑀𝑜)
𝐶𝑆(𝑋) = 𝐶𝑆(𝑋) =
𝑠𝑥 𝑠𝑥
b) Fórmula de Bowley
𝑀3
𝐶𝑆(𝑋) =
𝑆𝑥3
7𝑛
𝑀3 = ∑𝑛=1(𝑥𝑖 − 𝑋̅)3 /3 para datos no agrupados
7𝑛
𝑀3 = ∑𝑛=1(𝑥𝑖 − 𝑋̅)3 𝑓ⅈ /3 para datos agrupados
Ejemplo:
Del diagrama de dispersión se deduce que los datos pueden tener una tendencia
positiva, o dicho de otra forma, cuando una variable aumenta de valor también
aumenta la otra variable. Para comprobar la correlación vamos a hallar el
coeficiente de Pearson.
Lo primero que debemos hacer es encontrar la media aritmética de cada variable
por separado, que es equivalente a la suma total de los datos entre el número de
observaciones.
∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛
53
𝑥̅ =
10
𝑥̅ = 5.3
∑𝑛𝑖=1 𝑦𝑖
𝑦̅ =
𝑛
71
𝑦̅ =
10
𝑦̅ = 7.1
𝑛
∑𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑉𝑎𝑟(𝑋) =
𝑛
44.1
𝑉𝑎𝑟(𝑋) =
10
𝑉𝑎𝑟(𝑋) = 4.41
𝑛
∑𝑖=1(𝑦𝑖 − 𝑦̅)2
𝑉𝑎𝑟(𝑌) =
𝑛
122.9
𝑉𝑎𝑟(𝑌) =
10
𝑉𝑎𝑟(𝑌) = 12.29
59.7
𝐶𝑜𝑣(𝑋, 𝑌) =
10
𝐶𝑜𝑣(X, 𝑌) = 5.97
Por último, solo nos queda aplicar la fórmula del coeficiente de correlación de
Pearson para obtener su valor:
C𝑜𝑣(𝑋, 𝑌)
𝜌𝑋𝑌 =
√𝑉𝑎𝑟(𝑋) × 𝑉𝑎𝑟(𝑌)
5.97
𝜌𝑋𝑌 =
√4.41 × 12.29
𝜌𝑋𝑌 = 0.81
MEDIDAS DE APUNTAMIENTO
a) Platicúrtica
b) Mesocúrtica
c) Leptocúrtica:
Notas Nº de alumnos
4-6 5
6-8 5
8 - 10 15
10 - 12 30
12 - 14 15
14 - 16 5
16 – 18 5
Total 80
(𝑥𝑖 −
Notas Xi fi Fi Xifi ̅)
(𝑿𝒊 − 𝑿 (𝑥𝑖 − 𝑋̅)2 fi
𝑋̅)4 fi
4-6 5 5 5 25 -6 180 6480
6-8 7 5 10 35 -4 80 1280
8 - 10 9 15 25 135 -2 60 240
10 -
11 30 55 330 0 00 00
12
12 -
13 15 70 195 2 60 240
14
14 -
15 5 75 75 4 80 1280
16
16 – 18 17 5 80 85 6 180 6480
Total 80 880 640 16000
880
𝑋̅ =
80
𝑋̅ = 11
15
𝑀𝑜 = 10 + 2 ( )
15 + 15
𝑀𝑜 = 11
40 − 25
𝑀e = 10 + 2 ( )
30
𝑀e = 11
60 − 55
𝑄1 = 12 + 2 ( )
15
𝑄1 = 12.67
8−5
𝑃10 = 6 + 2 ( )
5
𝑃10 = 7.2
72 − 70
𝑃90 = 12 + 2 ( )
5
𝑃90 = 12.8
640
𝑉(𝑋) =
80
𝑉(𝑋) = 8
𝑆𝑋4 = (8)2
𝑆𝑋4 = 64
16000
𝑀4 =
80
𝑀4 = 200
(12.67 − 7.33)
𝐾=
2(12.8 − 7.2)
5.34
𝐾=
2(5.6)
𝐾 = 0.477 > 0.263
200
𝐾=
64
𝐾 = 3.125 > 3
Entonces la distribución es leptocúrtica.
Capítulo 9
PROBABILIDADES
En la segunda parte del curso hablaremos de cálculo de probabilidades y lo importante
que es en la estadística inferencial, pues sirve para tomar decisiones en estados de
incertidumbre, hacer estimaciones y proyecciones, pruebas de hipótesis, obtener tamaños
de muestra, entre otros temas.
A continuación, vamos a definir algunos términos que nos ayudarán a entender mejor
sobre el cálculo de probabilidades:
▪ PROBABLE
Es un término que es sinónimo de factible, posible, o puede ser; es decir, es algo
que puede suceder o realizarse, pero no está seguro. Ejemplo. Es probable que
apruebe el curso de estadística. Es probable que me infecte con el COVID 19, etc.
▪ INCERTIDUMBRE
Es la falta de certeza para predecir un resultado determinado. En la estadística la
incertidumbre es el resultado de algún fenómeno o proceso de cambio. Sí un
proceso de cambio conduce a dos o más resultados posibles, se dice que los
resultados son inciertos, además un proceso de cambio o fenómeno es considerado
estocástico sí sus resultados son inciertos.
▪ EXPERIMENTO
Es un proceso de cambio, se llama también prueba y viene a ser la realización de
ciertas acciones en condiciones bien determinadas y controladas, en el cual se
observa el fenómeno que se estudia y se espera uno o más resultados; de acuerdo
a ello, el experimento puede ser de dos tipos:
A. EXPERIMENTO DETERMINÍSTICO
Es cuando el proceso de cambio o experimento conduce a un solo resultado,
como los que ocurre en la matemática.
Ejemplo:
• Calcular la distancia recorrida por un vehículo, dado la velocidad y el
tiempo:
▪
e = vt, o el área de un círculo dado la longitud del radio: A = 𝜋 r2
• Si lanzo un balón de futbol al cielo, caerá por efecto de la gravedad.
• Si se lanza una moneda siempre tendremos 2 resultados, cara o sello.
• Saber que si sumamos 8 + 8 el resultado será igual a 16.
B. EXPERIMENTO ALEATORIO
Es cuando el proceso de cambio o experimento conduce a dos o más resultados
y eso implica que cualquier resultado específico no se puede predecir con
certeza antes de realizar el experimento, pero sí es factible conocer el conjunto
de resultados posibles, asimismo se puede repetir en las mismas condiciones.
• Experimento aleatorio es también el proceso de realizar una acción
sobre un fenómeno dado y observar la reacción del fenómeno, pero
cuyos resultados posibles son inciertos.
ESPACIO MUESTRAL
Es el conjunto de resultados posibles o igualmente factibles de un experimento
aleatorio, se le simbolizará como:
Ω = {w1, w2, w3, ………}, también se usa E o S.
(U: conjunto universal en teoría de conjuntos)
Ejemplo 1:
Si se tiene un conjunto de 6 alumnos (a, b, c, d, e, f) de los cuales se quiere
escoger a dos o tres de ellos para realizar un trabajo, determine el espacio
muestral en cada caso: Ω1 = {ab, ac, ad, ae, af, bc, bd, be, bf, cd, ce, cf, de,
df, ef}
Ω2 = {abc, abd, abe, abf, acd, ace, acf, ade, adf, aef, bcd, bce, bcf, bde, bdf,
bef, cde, cdf, cef, def}
Ejemplo 2:
Ejemplo 3:
Ejemplo 4:
Al registrase el sexo de la siguiente persona que nace puede ocurrir que sea
hombre o mujer, así que el espacio muestras sería: Ω1= (H, M)
SUCESO O EVENTO
Es un hecho o acontecimiento que puede ocurrir o no. Es un subconjunto del
espacio muestral, por lo tanto, Ω y Φ también son eventos.
Ejemplo:
i. Suceso elemental
Es cada uno de los resultados posibles o factibles de un experimento
aleatorio.
Ejemplo:
• E1 = {OP}.....................empresas
• E2 = {2} ........................inasistencia a clases
• E3 = {t / t=20, t 𝜖 R} ...... tiempo de vida en años
• E4 = {cs} ......... lanzar una moneda
• E5 = {15} .........edad de un grupo de personas
Ejemplo 1:
Ejemplo 2:
Ejemplo:
Ejemplo:
v. EVENTOS COMPATIBLES:
Es cuando se pueden realizar juntos, es decir, A∩B ≠ Φ
Ejemplo:
Ejemplo:
Ac = {x / x ε Ω, x ∉ A}
Ejemplo:
A – Ac = A
Ac ∆ B = A ∆ Bc
Ωc = Φ; Φc = Ω
A∩Bc = A – B
A = 2, 4, 6
B = 3, 4, 5, 6
AUB= 2, 3, 4, 5, 6
Ejemplo 2:
n(AUB) = n (A – B) + n (B – A) + n(A∩B)
b. Intersección:
Ejemplo 1:
A = 2, 6
B = 5, 6, 7
A∩B= 6
Ejemplo 2:
A∩B = {5, 6, 7, 8}
c. Diferencia:
A - B = {x / x 𝜖 A , x ∉ B } = (A∩Bc) : Se realiza A pero no B
B – A = {1, 2, 3, 4}
d. Diferencia simétrica:
A Δ B = {x / x 𝝐 AꓴB, x ∉ AꓵB }
A Δ B = (AꓴB) – (AꓵB)
A Δ B = (A – B) ꓴ (B – A)
Ejemplo:
Ejemplo:
A∩B = {5, 6, 7, 8}
B – A = {1, 2, 3, 4}
DEFINICIÓN DE PROBABILIDADES
Donde cada caso debe ser igualmente probable y el número de casos debe ser finito.
Ejemplo 1:
n(Ω) = (20
2
) = 190 muestras igualmente probables, n(A) = (81) (12
1
)= 8x12 = 96
Ejemplo 2:
Los estudiantes A y B tienen respectivamente probabilidades 1/2 y 1/5 de suspender un
examen. La probabilidad de que suspendan el examen simultáneamente es de 1/10.
Determinar la probabilidad de que al menos uno de los dos estudiantes suspenda el
examen.
1 1 1 3
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) = + − =
2 5 10 5
Ejemplo 3:
Una clase consta de 10 hombres y 20 mujeres; la mitad de los hombres y la mitad de las
mujeres tienen los ojos castaños. Determinar la probabilidad de que una persona elegida
al azar sea un hombre o tenga los ojos castaños.
Una clase consta de 10 hombres y 20 mujeres; la mitad de los hombres y la mitad de las
mujeres tienen los ojos castaños. Determinar la probabilidad de que una persona elegida
al azar sea un hombre o tenga los ojos castaños.
Hombres Mujer
O. castaños 5 10 15
10 20 30
Aquí debemos observar que hay tanto hombres 10 como de ojos castaños 15, además de
hombres con ojos castaños 5, así que la probabilidad de que sea hombre o tenga ojos
castaños se calcula con la fórmula
10 15 5
(𝐻 ∪ 𝐶) = + −
30 30 30
2
(𝐻 ∪ 𝐶) =
3
Ejemplo 4:
Un grupo de 10 personas se sienta en un banco. ¿Cuál es la probabilidad de que dos
personas fijadas de antemano se sienten juntas?
10
𝑃10 = 10!
Ahora, para saber el total de formas donde 2 seleccionadas previamente se sienten juntas,
podemos pensar en que al sentarse juntas ocupan un lugar de nueve posibles, de esta
manera, las formas en que nueve personas se pueden sentar ocupando 9 lugares es
𝑃99 = 9!
Y como cuando se sientan juntas puede ser de dos maneras posibles: ab ó ba, entonces el
total de formas en que dos personas seleccionadas previamente se pueden sentar juntas
en 10 lugares posibles es , llevándonos a que la probabilidad de que esto ocurra es
Siempre puedes optar por nuestras clases de matemáticas online para obtener tus mejores
resultados.
Teoremas de probabilidad:
P(Φ) = 0
Ejemplo:
La probabilidad de entrevistar a una persona que tenga más de 4 metros de
estatura.
P(Ac) = 1 – P(A)
Ejemplo:
La probabilidad de obtener un número impar al lanzar un dado, es igual a uno
menos la probabilidad de obtener un número par.
• TEOREMA N° 3. Probabilidad de sub eventos.
Sí A ⊆ B → P(A) ≤ P(B)
Sí A ⊆ B → P(A-B) = 0.0
Sí A ⊆ B → P(A ∩ B) = P(A)
Sí A ⊆ B → P(A U B) = P(B)
P(A ∆ 𝑩𝒄 ) = 1 - P(A Δ B)
Probabilidad geométrica:
Ejemplo 1:
̅̅̅̅ .
Encuentre la probabilidad de que un punto escogido al azar esté en 𝐴𝐶
𝐿𝑒𝑛𝑔ℎ𝑡 𝑜𝑓𝐴𝐶
Probabilidad de que el punto esté en ̅̅̅̅
𝐴𝐶 =
𝐿𝑒𝑛𝑔ℎ𝑡 𝑜𝑓 𝐴𝐵
̅̅̅̅
Use el postulado de la suma de segmentos para encontrar la longitud de 𝐴𝐵
AB = AC + CB
AB = 3 + 9
AB = 12
Sustituya.
3 1
Probabilidad de que el punto esté en ̅̅̅̅
𝐴𝐶 = =
12 4
Ejemplo 2:
Respuesta.
n(Ω) = 5 x 5 x 5 = 125
a). n(A) = 5 → P(A) = 5/125 = 0,04
Ejemplo 3:
Cuatro trabajadores Alex, Valeria, Jaqui y Jeremi ha sido contratados por una empresa
manufacturera, los trabajadores son asignados aleatoriamente ya sea al departamento de
embarque o al de recepción. ¿cuál es la probabilidad de que:
Solución:
a. n (𝛺) = 2x2x2x2 = 16
1x1x2x2 = 4
1x1x2x2 = 4
b. n(B) = (42) = 6
TÉCNICAS DE CONTEO
1. VARIACIONES
𝑛!
𝑉𝑟𝑛 =
(𝑛 − 𝑟)!
Ejemplo 1:
Respuesta.
4! 4! 24
𝑉24 = (4−2)!
= = = 12
2! 2
ab, ba, ac, ca, ad, da, bc, cb, bd, db, cd, dc
Ejemplo 2:
¿Cuántos números distintos de tres cifras diferentes se pueden escribir con los
dígitos:
1, 2, 3, 4, 5, 6, 7, 8, 9?
▪ No se pueden repetir.
▪ Influye el orden en el que se coloca.
Ejemplos correctos: 123, 132, 321, 213, 231, …
9! 9.8.7.6.5.4.3.2.1
𝑉9,3 = = = 9.8.7 = 504
(9 − 3)! 6.5.4.3.2.1
Ejemplo 3:
𝑉𝑟𝑛 = 𝑛𝑟
Ejemplo:
Respuesta:
𝑉24 = 42 = 16
ab, ba, ac, ca, ad, da, bc, cb, bd, db, cd, dc, aa, bb, cc, dd
Ejemplo 1:
Por otro lado, en las siguientes dos cifras del número si podemos colocar del
0 al 5, entonces m=6 y n=2
Finalmente, al calcular las variaciones por cada caso y multiplicarlas entre sí,
encontramos la solución:
𝑉𝑅62 = 53 = 125
Por lo tanto, se pueden formar 125 números de tres cifras con los dígitos
indicados. Observa que sí importa el orden, ya que por ejemplo 123 es distinto
al 132, y además es posible la repetición ya que el número 223 es uno de los
125 posibles de construir.
Ejemplo 3:
2. PERMUTACIONES
𝑃𝑛 = n!
Ejemplo 1:
Respuesta:
𝑃4 = 4! = 24
abcd, abdc, acbd, acdb, adbc, adcb, bacd, badc, bcad, bcda, bdac, bdca,
cabd, cadb, cbad, cbda, cdab, cdba, dabc, dacb, dbac, dbca, dcab, dcba
Ejemplo 2:
Solución:
Si n = 7
Pn = n! = 7! = 7 x 6 x 5 x 4 x 3 x 2 x 1
7! = (7 x 6) (5 x 4) (3 x 2) (1)
7! = (42 x 20) (6 x 1)
7! = (840 x 6)
7! = 5.040
Respuesta: 7 personas se pueden disponer en una fila de 5.040 maneras.
Ejemplo 3:
Solución:
Si n = 6
Pn = n! = 6! = 6 x 5 x 4 x 3 x 2 x 1
6! = (6 x 5) (4 x 3) (2 x 1)
6! = (360 x 2)
6! = 720
𝑛!
𝑃𝑛 =
𝑛𝑎 !
𝑛𝑏 ! … . 𝑛𝑟 !
Ejemplo 1:
Respuesta.
4!
𝑃4 = =6
2!2!
Ejemplo 2:
6,42
Calcular las permutaciones con repetición de 𝑃𝑅12
Ejemplo 3:
a = 3, b= 4, c= 2, n= a+b+c= 9
𝑃9 9!
𝑃𝑅93,4,2 = = = 1260
3! 4! 2! 3! 4! 2!
3. COMBINACIONES
3.1. COMBINACIONES SIN REPETICIÓN.
𝑛 𝑛!
𝐶𝑟𝑛 = ( ) =
𝑟 𝑟! (𝑛 − 𝑟)!
Ejemplo 1:
Respuesta.
5 5!
𝐶25 = ( ) = = 10 formas
2 2! (5 − 2)!
Se tienen los 4 ases de una baraja y se quieren tomar al azar dos cartas.
Cuántas y cuáles son las combinaciones que pueden resultar?
Solución:
𝑛! 4! 4! 4𝑥3𝑥2𝑥1 24
𝑛𝐶𝑘 = = = = = =6
𝑘! (𝑛 − 𝑘)! 2! (4 − 2)! 2! 2! (2𝑥1)(2𝑥1) 4
Ejemplo 3:
Solución:
𝑛! 5! 5! 5𝑥4𝑥3𝑥2𝑥1 120
𝑛𝐶𝑘 = = = = = = 10
𝑘! (𝑛 − 𝑘)! 3! (5 − 3)! 3! 2! (3𝑥2𝑥1)(2𝑥1) 12
𝑛+𝑟−1 (𝑛 + 𝑟 − 1)!
𝐶𝑟𝑛 = ( )=
𝑟 𝑟! (𝑛 − 1)!
Ejemplo 1:
Respuesta.
(5+2−1!
𝐶25 = (5+2−1
2
)= = (62) = 15 formas
2!(5−1)!
ab, ac, ad, ae, bc, bd, be, cd, ce, de, aa, bb, cc, dd, ee
Ejemplo 2:
En una bodega hay cinco tipos diferentes de botellas. ¿De cuántas formas
se pueden elegir cuatro botellas?
Solución:
Ejemplo 3:
Algebra de eventos:
• Ley de la identidad
• Ley de la dominación
AꓴΩ = Ω; Aꓵ Φ = Φ
5+4−1 (5 + 4 − 1)! 8!
𝐶𝑅54 = ( )= = = 70
4 4! (5 − 1)! 4! ⋅ 4!
• Ley de la idempotencia
AꓴA = A; AꓵA = A
• Ley conmutativa
• Ley asociativa
A Δ (B Δ C) = (A Δ B) Δ C
1 6+4−1 9!
𝐶𝑅6,4 =( )= = 126
4 4! ⋅ 5!
PROBABILIDAD CONDICIONAL
La probabilidad de que ocurra un evento A, dado que ya ocurrió o sucedió otro evento B,
se llama probabilidad condicional de A dado B y se denota como sigue:
𝑃(𝐴∩𝐵)
P(A/B) = ⍱ P(B) > 0
𝑃(𝐵)
𝑃(𝐴∩𝐵)
P(B/A) = ⍱ P(A) > 0
𝑃(𝐴)
Nota.
Ejemplo 1:
Ante un examen, un alumno sólo ha estudiado 15 de los 25 temas correspondientes a la
materia del mismo. Éste se realiza extrayendo al azar dos temas y dejando que el alumno
escoja uno de los dos para ser examinado del mismo.
Hallar la probabilidad de que el alumno pueda elegir en el examen uno de los temas
estudiados.
Solución:
Ante un examen, un alumno sólo ha estudiado 15 de los 25 temas correspondientes a la
materia del mismo. Éste se realiza extrayendo al azar dos temas y dejando que el alumno
escoja uno de los dos para ser examinado del mismo. Hallar la probabilidad de que el
alumno pueda elegir en el examen uno de los temas estudiados.
10 9
p (al menos un tema) = 1 - p (ningún tema ==1- . = 0,85
25 24
Ejemplo 2:
Al 25% de tus amigos le gusta la fresa y el chocolate, mientras que al 60% le gusta el
chocolate. ¿Cuál es la probabilidad de que a un amigo que le gusta el chocolate, le guste
la fresa?
Solución:
Vamos a trabajar con 2 eventos: que a un amigo le guste la fresa, y que a un amigo le
guste el chocolate.
Ahora calculamos la probabilidad de que a un amigo le guste la fresa, dado que le gusta
el chocolate.
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴|𝐵) =
𝑃(𝐵)
25% 5
𝑝(𝐴|𝐵) = = = 0,4167 = 41, 67 %
60% 12
La probabilidad de que a un amigo le guste la fresa dado que le gusta el chocolate es del
41,67 %
Ejemplo 3:
Solución:
Vamos a trabajar con 2 eventos: aprobar resistencia de materiales, y aprobar estática.
𝑃(𝐵 ∩ 𝐴)
𝑃(𝐴|𝐵) =
𝑃(𝐴)
30% 15
𝑝(𝐴|𝐵) = = = 0,3947 = 39,47 %
76% 38
Distribución de probabilidad de una v.a. es una función que asigna a cada suceso o evento
definido sobre la variable, la probabilidad de que el suceso ocurra; por lo tanto, es una
función matemática que asigna probabilidades, también es definido como el conjunto de
pares ordenados, formado por la variable aleatoria y la probabilidad correspondiente, es
decir, (X, P(X)), al graficar a este conjunto de pares ordenados se obtiene una curva y el
modelo de la curva puede ser expresado como una función matemática. Los modelos son
las funciones de cuantía (caso discreto) o de densidad (caso continuo), estos modelos
sirven para calcular las probabilidades de familias de fenómenos aleatorios.
Conclusiones y Sugerencias
I. Conclusiones:
En la actualidad realizamos diferentes trabajos de investigación y especialmente
como estudiantes, por ello la estadística a constituido una herramienta importante
para el proceso de estos trabajos; por qué nos permite recolectar datos de cualquier
población, representarla, y analizarla de una manera más profunda y así se tome
decisiones buenas.
Se puede decir que las medidas de dispersión sólo indican la magnitud de las
variabilidad de los datos, ya sea en forma absoluta o en forma relativa, pero no
indican nada acerca de la dirección hacia dónde tienden a acentuarse dichas
variaciones; para suplir esta deficiencia se obtienen otras medidas llamadas de
asimetría; por tanto, estas deben indicar la existencia o falta de simetría de la
distribución, mostrando la dirección hacia donde se inclina la distribución, esta
asimetría o simetría debe ser respecto a un punto de referencia de la variable.
Vamos a referirnos también a las probabilidades dentro de la estadística como algo
muy fundamental, por ejemplo, podemos aplicarlo en nuestra misma carrera,
conocer el pronóstico del tiempo o la turbidez del rio quillay un estudio que
podemos realizar, o en que tiempos aumenta el río y así tomar medidas de
seguridad. También debemos concluir que las variables aleatorias nos ayudan
muchísimo porque nos va a permitir el cálculo de las probabilidades de eventos al
estudio de las distribuciones.
II. Sugerencias:
✓ El estudio más profundo de estos temas, ya que después de realizar la
investigación se puede decir que nos ayuda machismo en nuestras vidas, y
saber aplicarla nos hará personas más productivas.
✓ Saber realizar los gráficos puede hacer que tu trabajo de investigación sea
eficiente, conocer cada parte, porque muchas veces se realizan recolección de
datos y a la hora de graficar todo sale muy mal.
✓ Los métodos de recolección de datos conocer ayudará que no tengamos solo
una alternativa, muchas veces pasa sin importancia conocer más métodos para
obtener datos por ello sugerimos que investiguen más de lo que ya conocen,
en este trabajo les presentamos algunos y detalladamente muy explicado.
Referencias Bibliográficas