Está en la página 1de 140

FACULTAD DE CIENCIAS DEL

AMBIENTE
ESCUELA PROFESIONAL DE INGENIERÍA
AMBIENTAL





INDICE
Resumen ....................................................................................................................................... 7
Abstract ........................................................................................................................................ 8
Introducción................................................................................................................................. 9
Capítulo 1 ................................................................................................................................... 11
HISTORIA DE LA ESTADÍSTICA .................................................................................... 11
DEFINICIÓN DE ESTADISTICA ...................................................................................... 11
IMPORTANCIA DE LA ESTADÍSTICA EN LA INGENIERÍA.................................... 13
DEFINICIÓN DE TÉRMINOS USADOS .......................................................................... 14
❑ Población ..................................................................................................................... 14
❑ Muestra ........................................................................................................................ 14
❑ Parámetro: ................................................................................................................... 14
❑ Estadístico ................................................................................................................... 15
❑ Unidad elemental......................................................................................................... 15
❑ Datos ........................................................................................................................... 15
❑ Muestreo ...................................................................................................................... 16
❑ Marco muestral ............................................................................................................ 16
❑ Escalas de medición .................................................................................................... 16
❑ Variable ....................................................................................................................... 18
❑ Constante: .................................................................................................................... 20
❑ Redondeo de datos ...................................................................................................... 21
❑ Notación sumatoria ..................................................................................................... 21
❑ Suma de interés ........................................................................................................... 26
Capítulo 2 ................................................................................................................................... 26
RECOLECCIÓN DE DATOS ............................................................................................. 26
a) De corte transversal .................................................................................................. 27
b) De corte longitudinal ................................................................................................. 27
CENSO Y MUESTREO ....................................................................................................... 27
1. Censo ........................................................................................................................... 27
2. MUESTREO ............................................................................................................... 27
VENTAJAS DEL MUESTREO SOBRE EL CENSO ....................................................... 28
❖ Menor Costo............................................................................................................... 29
❖ Menor Tiempo ........................................................................................................... 29
❖ Mayor Posibilidad ..................................................................................................... 29
❖ Mayor Exactitud ........................................................................................................ 29
ENCUESTA ........................................................................................................................... 29
1. Descriptivas ................................................................................................................ 30
2. Analíticas .................................................................................................................... 30
PASOS PARA REALIZAR UNA ENCUESTA ................................................................. 30
CUESTIONARIO ................................................................................................................. 31
EJEMPLO DE UNA HOJA DE ENCUESTA .................................................................... 32
Capítulo 3 ................................................................................................................................... 35
CLASIFICACIÓN DE DATOS ........................................................................................... 35
1) Determinar los límites superior e inferior de la distribución ................................ 36
2) Obtener el Rango de variación: ............................................................................... 36
3) Determinación del Número de Intervalos de Clase (m): ........................................ 36
4) Determinar la amplitud de los intervalos (C) ......................................................... 37
5) Distribución del incremento (∆): .............................................................................. 38
7. Tabulación ................................................................................................................. 39
8) Intervalo de clase ....................................................................................................... 39
9) Límite de Clase (Yi) ................................................................................................... 40
10) Marca de Clase (Yi = Xi) ....................................................................................... 40
11) Frecuencia .............................................................................................................. 41
CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS ...................................................... 47
Capítulo 4 ................................................................................................................................... 50
PRESENTACIÓN DE DATOS ............................................................................................ 50
1) CUADROS ESTADÍSTICOS ................................................................................... 51
2) GRÁFICAS ESTADÍSTICAS: ................................................................................ 54
CLASIFICACIÓN DE LAS GRÁFICAS MAS USADAS................................................. 57
1. Histograma de frecuencias ....................................................................................... 57
2. Polígono de frecuencias ............................................................................................. 57
3. Gráfico de tendencia ................................................................................................. 58
4. Polígono de frecuencias acumuladas. Ojiva ............................................................ 58
5. Pirámide poblacional ................................................................................................ 59
6. Diagrama de barras .................................................................................................. 59
7. Gráfico de bastones ................................................................................................... 60
8. Gráfico de cajas ......................................................................................................... 60
9. Gráfico de sectores .................................................................................................... 61
10. Pictograma ..................................................................................................................... 61
11. Gráfico de Gantt ............................................................................................................ 62
Capítulo 5 ................................................................................................................................... 62
MEDIDAS DESCRIPTIVAS ................................................................................................. 62
MEDIDAS DE CENTRALIZACIÓN .................................................................................... 63
Clases .................................................................................................................................. 63
b) Medias móviles ........................................................................................................... 63
MEDIA ARITMÉTICA “M(X)” ............................................................................................ 64
Propiedades ........................................................................................................................ 65
Ventajas .............................................................................................................................. 66
Desventajas ........................................................................................................................ 67
Media Aritmética Ponderada ........................................................................................... 67
Casos Especiales ................................................................................................................ 68
MEDIA GEOMÉTRICA “Mg” .............................................................................................. 69
1. Media geométrica para datos no agrupados ........................................................... 69
2. Media Geométrica para datos agrupados ............................................................... 69
Desventajas ........................................................................................................................ 70
Propiedades ........................................................................................................................ 70
MEDIA ARMÓNICA “Mh” ................................................................................................... 70
✓ Media Armónica para datos no agrupados ............................................................. 71
✓ Media Armónica para datos agrupados .................................................................. 71
Propiedad ........................................................................................................................... 71
Desventaja .......................................................................................................................... 72
MEDIA CUADRÁTICA “Mc(X)” ......................................................................................... 72
✓ Media Cuadrática para datos no agrupados .......................................................... 72
✓ Media Cuadrática para datos no agrupados .......................................................... 72
Propiedad ........................................................................................................................... 72
Ejemplo ............................................................................................................................... 72
MEDIANA “Me” .................................................................................................................... 73
✓ Para datos no agrupados .......................................................................................... 73
✓ Para datos agrupados................................................................................................ 74
Propiedades ........................................................................................................................ 74
Ventajas .............................................................................................................................. 75
Desventajas ........................................................................................................................ 75
MODA “Mo” .......................................................................................................................... 75
✓ Moda para datos no agrupados................................................................................ 76
✓ Moda Para datos agrupados..................................................................................... 76
Ventajas .............................................................................................................................. 79
Desventajas ........................................................................................................................ 79
FRACTILES ........................................................................................................................... 79
1) CUARTILES (QJ) ....................................................................................................... 79
2) DECILES (DJ) ............................................................................................................ 84
3) PERCENTILES (PJ) ................................................................................................... 86
Capítulo 6 ................................................................................................................................... 89
MEDIDAS DE DISPERSIÓN ................................................................................................ 89
A. Tipos ............................................................................................................................ 90
a) Rango: R .................................................................................................................... 91
b) DESVIACIÓN MEDIA: DM(X) .............................................................................. 93
c) VARIANZA: V(X)..................................................................................................... 94
d) DESVIACIÓN ESTÁNDAR O TÍPICA: SX .......................................................... 97
e) COEFICIENTE DE VARIACIÓN: CV(X) ............................................................ 99
Capítulo 7 ................................................................................................................................. 101
MEDIDAS DE ASIMETRÍA................................................................................................ 101
❖ Simétricas .................................................................................................................. 102
❖ Asimétricas. ............................................................................................................... 102
Coeficiente de Asimetría CS(X) ....................................................................................... 103
Capítulo 8 ................................................................................................................................. 107
MEDIDAS DE APUNTAMIENTO ...................................................................................... 107
a) Platicúrtica ............................................................................................................... 107
b) Mesocúrtica .............................................................................................................. 107
c) Leptocúrtica:............................................................................................................ 107
Capítulo 9 ................................................................................................................................. 110
PROBABILIDADES ............................................................................................................ 110
▪ PROBABLE ............................................................................................................. 110
▪ INCERTIDUMBRE ................................................................................................ 110
▪ EXPERIMENTO ..................................................................................................... 111
DEFINICIÓN DE PROBABILIDADES .............................................................................. 117
Teoremas de probabilidad: ............................................................................................ 120
Probabilidad geométrica: ............................................................................................... 121
Capítulo 10 ............................................................................................................................... 124
TÉCNICAS DE CONTEO .................................................................................................... 124
1. VARIACIONES ...................................................................................................... 124
2. PERMUTACIONES ............................................................................................... 127
3. COMBINACIONES ................................................................................................ 131
Algebra de eventos: ............................................................................................................... 134
• Ley de la identidad .................................................................................................. 134
• Ley de la dominación .............................................................................................. 134
• Ley de la idempotencia ........................................................................................... 134
• Ley conmutativa ...................................................................................................... 135
• Ley asociativa........................................................................................................... 135
PROBABILIDAD CONDICIONAL .................................................................................... 135
DISTRIBUCIONES DE PROBABILIDAD: ........................................................................ 138
Conclusiones y Sugerencias .................................................................................................... 138
I. Conclusiones: ................................................................................................................ 138
II. Sugerencias: .................................................................................................................. 139
Referencias Bibliográficas ...................................................................................................... 140
Resumen

En la presente investigación monográfica se realizará una explicación y análisis


respecto a los temas tocados en la asignatura de Estadística General, todo esto con el
objetivo de reforzar y demostrar nuestros conocimientos adquiridos en el curso durante
el ciclo académico 2022-II.

Para ello, se abordará todos los temas propuestos en el sílabo, desde el tema de
Estadística Descriptiva donde se verán subtemas tales como acopio, clasificación y
presentación de los datos, medidas de tendencia central, dispersión, asimetría y
curtosis; como también consideraremos las Probabilidades en las que comprende el
experimento aleatorio, espacio muestral, eventos, Teorema de Bayes; como últimos
temas tendríamos las Variables Aleatorias, las Distribuciones Continuas de
Probabilidad y las Pruebas estadísticas paramétricas para estudios con una sola y de
dos muestras.

Recordemos que la Estadística es esencial para distintas actividades del día, por ello,
añadido a la información que se va a mostrar, consideraremos ejemplos para mejor
entendimiento y comprensión de nuestra investigación.

Palabras claves: Estadística, demostración, probabilidades, variables, distribuciones,


pruebas.
Abstract

In this monographic investigation, an explanation and analysis will be made regarding


the topics covered in the General Statistics course, all this with the objective of reinforcing
and demonstrating our knowledge acquired in the course during the academic cycle 2022-
II.

For this, all the topics proposed in the syllabus will be addressed, from the topic of
Descriptive Statistics where we will see subtopics such as collection, classification and
presentation of data, measures of central tendency, dispersion, asymmetry and kurtosis;
as we will also consider the Probabilities in which includes the random experiment,
sample space, events, Bayes Theorem; as last topics we would have the Random
Variables, the Continuous Probability Distributions and parametric statistical tests for
single and two-sample studies.

Let us remember that Statistics is essential for different activities of the day, therefore, in
addition to the information that will be shown, we will consider examples for better
understanding and comprehension of our research.

Key words: Statistics, demonstration, probabilities, variables, distributions


Introducción

Los métodos y las técnicas estadísticas, se emplean en la actualidad, prácticamente en


todas las ramas de la actividad humana. No tiene relevancia si lo que nos interesa es
predecir el estado del tiempo, combatir una enfermedad con un nuevo medicamento,
prevenir el crimen o los accidentes, hacer proyecciones del crecimiento de una población,
predecir el porcentaje de aprobados y desaprobados en una asignatura, evaluar el costo
de vida de las familias, contratar o nombrar un nuevo empleado en una empresa, etc. En
todas estas acciones siempre existirá un nivel de incertidumbre, cualquiera sea su
naturaleza, el cual es necesario manipularlo en una forma científica y objetiva, si se desea
obtener resultados eficientes.

Por otro lado, todos nosotros tenemos algo de investigadores o directores, casi a diario
hacemos pronósticos relativos a los acontecimientos futuros de nuestra vida con el fin de
predecir lo que sucederá ante nuevas situaciones o experiencias. A medida que aparecen
estas nuevas situaciones, con frecuencia confirmamos nuestras ideas, pero a veces
tenemos que confrontar desagradables sorpresas y/o consecuencias.

Lo mencionado no tendría solución objetiva si no existiera un método científico que los


avalara, este método es el estadístico, y precisamente con este método es posible
desempeñarse con eficiencia en estados de incertidumbre. Si el manejo de los datos es
óptimo, los errores que se cometerán al tomar las decisiones serán mínimos.

Las técnicas estadísticas necesitan de un conocimiento matemático de acuerdo al mayor


o menor grado de aplicación que se quiera hacer, en el presente curso la necesidad de un
conocimiento avanzado de las matemáticas no es primordial, pero si un conocimiento
mediano.

La información ha sido siempre, y con mayor razón hoy en día, muy importante para la
toma de decisiones en todo nivel, por ello las mismas deben ser oportunas y óptimas. Con
mala o insuficiente información posiblemente la decisión sea mala, por muy bueno que
sea el procesamiento que se haya hecho de ésta.

Por el contrario, por muy buena que sea la información si el procesamiento ha sido malo
seguramente también la decisión será equivocada. En consecuencia, un sólido respaldo
para una acertada toma de decisiones, contempla ambos aspectos: información buena y
suficiente, con un procesamiento correcto.

La estadística resulta fundamental para conocer el comportamiento de ciertos eventos,


por lo que ha adquirido un papel clave en la investigación. Se usa como una valiosa
herramienta en los diferentes campos del conocimiento y en las variadas ciencias. Es un
lenguaje universal que permite comunicar información verídica de los hechos basada en
datos cuantitativos.
Capítulo 1

HISTORIA DE LA ESTADÍSTICA

Los antecedentes de la estadística abundan en la Antigüedad, especialmente cuando


surgieron los primeros grandes imperios de numerosa población, como Babilonia, Egipto
o China, en los que se impuso la necesidad de contabilizar la población y obtener
información relevante para el Estado, respecto al cobro de impuestos, necesidad de
reforzar el ejército y otras materias similares. Formalmente, la Estadística surgió en el
siglo XIX, cuando se la reconoció como ciencia al conjugarse las probabilidades con lo
que era la Estadística hasta ese entonces “ciencia de los asuntos del Estado (status)”, que
tenía el nombre de Statistik (alemán), traducido al inglés como “aritmética política”

En la actualidad ya con los aportes de numerosos matemáticos, se ha convertido en una


ciencia formal y que sirve como base científica en la investigación científica, lo cual es
usada por todas las áreas del conocimiento humano.

DEFINICIÓN DE ESTADISTICA

A la fecha aún no es factible dar una definición exacta de la Estadística, porque los
conceptos fundamentales no tienen una definición explícita universal, o si lo tienen, no
es ella suficientemente clara para darnos una idea acabada de su significado. Por eso se
tratará de presentar una caracterización conceptual sucinta, tal como sigue:

a) La Estadística es una ciencia aplicada, que nos proporciona un conjunto de


métodos y técnicas para planificar, recopilar, clasificar, presentar y analizar datos
en forma tal, que nos permita sacar conclusiones e inferencias acerca de la
población, a partir de un conjunto de datos extraídos de la misma llamada muestra.
b) En las definiciones que diversos autores dan sobre estadística, ponen especial
énfasis en el hecho de que, la palabra Estadística proviene de la palabra latina
“status” que significa “Estado” y del alemán “statistik”, en la actualidad es una
ciencia, rama de la matemática cuyos métodos permiten tener decisiones respecto
a las características de una población usando solo los datos recopilados de una
muestra representativa de dicha población.

Estas definiciones nos permiten además distinguir dos áreas que son necesarios
mencionarlos, estos son:

1. Estadística Descriptiva: Es la parte de la Estadística que trata de planificar,


recolectar, clasificar, presentar y describir los datos en estudio.
2. Estadística Inferencial: Es la parte de la Estadística que se ocupa de los métodos
que nos permiten sacar conclusiones, generalizaciones o inferencias acerca de las
características de una población, que pueden ser los parámetros o variables
aleatorias, tomando decisiones generales a partir de los datos proporcionados por
la muestra.

La Estadística es una ciencia que tiene una metodología cíclica de trabajo, empieza
estudiando la población, y cuando no es posible estudiar una población u obtener
información completa de ella, por ser muy grande o por ser a veces infinita, entonces es
necesario extraer muestras representativas de ella, mediante las técnicas de Muestreo, y
usando la información proporcionada por dicha muestra, pero analizados con la ayuda de
la Estadística Descriptiva, se sacan conclusiones e inferencias acerca de la población en
estudio, gracias a la Inferencia Estadística, cuya base es el Cálculo de las Probabilidades,
y este a su vez estudia las características teóricas de la población, todo lo demás gira
alrededor de esta estructura.

Las etapas de una investigación usando la estadística varía de acuerdo a los objetivos del
trabajo, los cuales se pueden resumir a lo siguiente:

✓ Determinación del problema.


✓ Plantear objetivos.
✓ Planeamiento del trabajo a realizar. Variables, cuestionario, fuente de
información, muestra, tamaño de muestra, unidad de investigación o elemental,
manual del encuestador, recursos humanos, capacitación de recursos humanos,
cronograma, presupuesto, etc.
✓ Trabajo de campo, aplicación de la encuesta, recopilación de la información.
✓ Clasificación de la información, procesamiento de datos.
✓ Presentación de la información en cuadros y gráficas.
✓ Análisis descriptivo de la información.
✓ Obtención de conclusiones y realizar inferencias.
✓ Presentación del informe final.

IMPORTANCIA DE LA ESTADÍSTICA EN LA INGENIERÍA

Un ingeniero es alguien que cumple una importante función en la sociedad, un rol que
consiste en la aplicación de los principios de la ciencia para la formulación de soluciones
a los problemas enfocados en la satisfacción de las necesidades del entorno al cual
pertenece. Este proceso debe dar solución a un problema se encuentra ligado a un
conjunto de pasos en los cuales se encuentra fundamentado el método científico o método
de la ingeniería que puede resumirse como:

1. Observación: Mirar con atención y seriedad el comportamiento del fenómeno o


problema a estudiar.
2. Análisis: Identificar y analizar las variables que pueden intervenir y jugar un papel
preponderante en la generación del problema, así como en su solución.
3. Hipótesis: Proponer una alternativa o modelo tentativo de solución apoyado en
postulados científicos que expliquen el problema en estudio.
4. Prueba de la hipótesis: teniendo en cuenta la alternativa de solución o la utilización
del modelo propuesto, ejecutar un proceso de experimentación realizando los
ajustes necesarios para mejorar su semejanza con la realidad, obteniendo así
información relevante para el proceso.
5. Demostración o refutación de la hipótesis: Verificar que los resultados obtenidos
son coherentes con la realidad estudiada.
6. Teoría científica o tesis: Generar conclusiones basadas en los resultados obtenidos
de la simulación procurando siempre la solución del problema.

En el proceso de la aplicación del método científico el ingeniero deberá entonces realizar


una toma de datos que luego deberá analizar para encontrar una relación con una teoría
científica o tendencia y así poder formular un modelo el cual puede consistir en un
conjunto de expresiones matemáticas que permiten describir la situación analizada
finalmente realizar una simulación y obtener las respectivas conclusiones.
DEFINICIÓN DE TÉRMINOS USADOS

❑ Población
Se le llama población en Estadística al conjunto de valores de las unidades
elementales (personas, animales o cosas) que tienen alguna característica en
común, cuyos datos (valores cualitativos o cuantitativos) son obtenidos de cada
una de dichas unidades elementales, como consecuencia de la medición u
observación de una o más características particulares que se quiere estudiar. La
población es un conjunto especificado y delimitado tanto en el tiempo como en el
espacio, del cual se obtendrá la muestra. A esta población se le conoce también
como población objeto u objetivo. La población puede ser finita o infinita.
Ejemplo:
Todos los ríos afluentes del Amazonas.
Todos los habitantes de la Región Ancash, en el mes de diciembre del 2021.
Todas las municipalidades provinciales del Perú.

❑ Muestra
Es una parte o subconjunto representativo de la población, seleccionados de
acuerdo a las técnicas de muestreo. Cabe recordar que se pueden seleccionar no
solo uno, sino varias muestras de una población, e incluso de diferentes tamaños
y no necesariamente coincidentes.
Ejemplo:
50 alumnos de la UNASAM, matriculados en el semestre 2021-II
85 colegios nacionales del país que funcionaron el 2021.
15 ríos afluentes del río Amazonas.

❑ Parámetro:
Es un valor que describe a alguna característica de la población y para
determinarlo mayormente se necesitan todos los datos de la población;
generalmente se les representa con letras griegas minúsculas.
Ejemplo:
μ = Media poblacional.
σ = Desviación estándar poblacional.
𝜌 = Coeficiente de correlación poblacional.
N = Tamaño de la población. P = proporción poblacional

❑ Estadístico
Es un valor representativo de la muestra, que se obtiene a partir de los datos
muestrales y describe alguna característica de la muestra. Se les representa con
letras latinas.
Ejemplo:
𝑋̅ = Media muestral.
S = Desviación estándar muestral.
r = Coeficiente de correlación muestral.
n = Tamaño de la muestra. p = proporción muestral

❑ Unidad elemental
Se le llama también unidad de análisis, es el ente que proporciona al ser medido
u observado, un dato, correspondiente a la característica que se quiere estudiar; o
pueden ser dos o más datos, de acuerdo a si se quiere medir u observar dos o más
características, por lo tanto, los datos pueden ser unidimensionales,
bidimensionales o multidimensionales. Por su parte las unidades elementales
pueden ser:
1. Simples (son indivisibles), como una persona, un animal, una planta, un auto,
etc.
2. Compuestos, como una familia, un colegio, una granja, una tribu, etc.

❑ Datos
Se le conoce también como observación o registro, es el valor que resulta al
medirse u observarse una unidad elemental con relación a la característica que se
quiere estudiar; en otras palabras, es la información expresada en forma
cuantitativa o cualitativa de los hechos de la realidad, esta información, es lo que
constituye el fundamento básico del análisis estadístico. Sin embargo, es preciso
indicar que a la Estadística no le interesa un dato en particular, sino el conjunto
de datos.
Ejemplo:
La edad de un alumno (20 años).
El ingreso mensual de un profesor (2500 soles).
El número de alumnos de un aula de un colegio (35 alumnos)

❑ Muestreo
En el sentido restringido, es el procedimiento mediante el cual se obtiene la
muestra, en el sentido más amplio, es la parte de la Estadística que se ocupa del
estudio de los diferentes métodos y técnicas para seleccionar las muestras,
incluyendo el tamaño que deben tener.

❑ Marco muestral
Es la relación ordenada de todas las unidades elementales de la población, del cual
se sacará la muestra. Ejemplo, si consideramos población para un estudio
determinado a todos los alumnos matriculados de la UNASAM, entonces el marco
muestral es la lista de todos los alumnos matriculados en la UNASAM en un
semestre determinado.

❑ Escalas de medición
El término “medición” puede definirse desde diversos puntos de vista o en
términos que no necesariamente coincidan, pero lo esencial de la acepción, es que
por medición se entiende a la asignación de números o valores a las unidades
elementales según determinadas reglas.
Ampliando algo más, se puede decir que sin medición no habría estadística.
Stanley Smith Stevens ha escrito mucho sobre tipos de escalas de medición que
se realizan en la ciencia, aun cuando no todos los estadísticos están de acuerdo
con Stevens, él ha ideado cuatro tipos de escalas de medición, a saber:
a) Nominal
Consiste en asignar membretes o nombres a cada uno de los grupos o
categorías que tienen las unidades elementales en estudio, en consecuencia se
trata de agrupar a los datos en clases mutuamente excluyentes, de modo que
todos los que pertenecen a la misma sean equivalentes respecto a la
característica que los distingue, después del cual se les puede asignar nombres
o números a tales clases.

Ejemplo:
El sexo, el estado civil, el nombre de las personas, el número del DNI, los
password, o los números que se les asignan a las personas para un sorteo, etc.

b) Ordinal
En el caso de que puedan detectarse diversos grados de un atributo o
característica en estudio de una unidad a otra, entonces es necesario
diferenciar esta propiedad, asignando a las unidades elementales en estudio,
nombres o números que resalten estas diferencias y sea factible su ordenación
de mayor a menor o viceversa, es decir importa no solo el nombre sino el
orden de las unidades elementales.
Ejemplo:
El orden de mérito asignado a los alumnos después de una evaluación, el grado
de aceptación dado por un juez a un determinado producto alimenticio, etc.

c) Intervalo
Cuando no sólo es posible distinguir las diferencias entre los diversos grados
de propiedad de una unidad elemental (característica de la medida ordinal),
sino también pueden discernirse diferencias entre dichos grados, entonces se
recurre a la medida llamada por intervalo.
En este caso el origen es arbitrario y se elige de acuerdo a las conveniencias,
por lo tanto, además de ordenarlos se pueden hacer operaciones aritméticas,
en consecuencia, los valores asignados son numéricos.
Ejemplo:
La medida de la temperatura, los números asignados a los años de nuestro
calendario, etc.
d) Razón
Se le llama también de cociente. Esta escala de medición se diferencia del
anterior, porque en este caso, el punto cero u origen ya no es arbitrario y
corresponde realmente a una total ausencia de la propiedad estudiada.
Si se observa una carencia total de la propiedad estudiada se le asigna el valor
cero, además a iguales diferencias entre los números corresponden iguales
diferencias en el grado del atributo presente en la unidad elemental en estudio.
Siendo el cero ya no un valor arbitrario, sino un valor absoluto. Podemos decir
que A tiene 2, 3, 4 o más veces la magnitud de la propiedad presente en B.
Ejemplo:
La estatura de las personas, la edad de las personas, etc.

❑ Variable
Es la característica que se quiere estudiar, y viene a ser una cualidad o propiedad
de las unidades elementales, de que al ser medidos u observados tomen diferentes
valores o atributos.
Ejemplo:
La estatura, la edad, el peso, la temperatura, el lugar de nacimiento, el estado civil,
los ingresos económicos mensuales, el grado de instrucción, la profesión, el nivel
del colesterol, etc. de las personas.

Tipos de Variables de acuerdo a su naturaleza:

1. Cualitativas
Son las que indican una cualidad o atributo de las unidades elementales, por
consiguiente, pueden ser clasificados solo como poseedoras o no poseedoras
de una cualidad o propiedad. Esta variable resulta de la medición con escalas
nominal u ordinal, se les puede asignar números o códigos para facilitar su
manejo. Muchos autores dividen a las variables cualitativas en dos grupos:

i. Nominales:
Son las que presentan modalidades excluyentes y que no admiten un
criterio de orden.
Por ejemplo:

El estado civil de las personas, el Número del DNI, entre otros.

ii. Ordinales:
Presentan modalidades excluyentes pero que si admiten un orden,
como ejemplo el nivel educativo de las personas, en este grupo están
las clasificaciones dadas en las escalas de Rensis Likert (Ej. Muy de
acuerdo, de acuerdo, indiferente, en desacuerdo y totalmente en
desacuerdo).

Ejemplos:
• El estado civil de las personas (N)
• El lugar de nacimiento de las personas (N)
• El grado de instrucción de los empleados públicos. (O)
• El nivel socio-económico de los trabajadores (O)

2. Cuantitativas
Son los que indican una cantidad, es decir, son los que pueden ser contados o
medidos, y resultan de las escalas de medición de intervalo y de razón. A su
vez pueden ser:

i. Discretas:
Son las que resultan del conteo y por consiguiente, sólo pueden tomar
algunos valores dentro de un intervalo dado, generalmente son los
números naturales o enteros.

ii. Continuas:
Son las que resultan de la medición con cualquier unidad de medida, y
por lo tanto pueden tomar cualquier valor dentro de un intervalo dado.
Se les representa con los números reales.

Ejemplos:

• El número de hijos que tiene una persona (D)


• El número de inasistencias en un salón de clase (D)
• El peso de las personas (C)
• La talla de las personas (C)

A las variables se les representa generalmente con las últimas letras del
alfabeto, tales como X, Y, Z. cuando se quieren distinguir los valores
individuales se usan subíndices, para lo cual se utilizan las letras intermedias
como: i, j, k, l, etc. En ese sentido Xi representa al i-ésimo valor de la variable
X. En la práctica muchas variables continuas son redondeadas a números
enteros, como la edad, por lo que se confunde como si fueran variables
discretas.
A su vez, las variables según su función pueden clasificarse como:
Dependientes, independientes e intervinientes (exógenas, endógenas),
también pueden ser: unidimensionales, bidimensionales, tridimensionales o
multidimensionales (dos o más dimensiones).

❑ Constante:
Se denomina así a la variable que toma un solo valor. Es un dato que no cambia
de valor. Se le representa con las primeras letras del alfabeto, tales como a, b, c,
etc.

Ejemplo:

Si todos los obreros de un centro minero o agrícola tuvieran sus dos padres vivos,
entonces la variable, número de padres vivos por obrero sería el número 2.

Las variables también pueden ser unidimensionales, cuando se estudia solo una
característica de las unidades elementales (ejemplo: la edad de las personas),
bidimensionales si se estudia a la vez dos características de una unidad elemental
(ejemplo: la edad y el peso de las personas), multi o n – dimensionales si se
estudian a la vez más de dos características de las unidades elementales ( ejemplo,
la edad, el peso, la estatura, los ingresos económicos, el grado de estudios, etc. de
las personas)
❑ Redondeo de datos
La necesidad del redondeo de datos es más por la facilidad de los cálculos o por
comodidad de su manejo, que, por razones prácticas, pues el manejo inadecuado
puede traer más errores de los previstos. El redondeo de un número hasta el entero
o decimal más próximo obedece a los siguientes criterios.
a) Si el dígito a redondear es menor que cinco, se le desprecia.
Ejemplo:
• Aproximar o redondear a un entero: 7,234 = 7
• Aproximar o redondear a un decimal: 7,234 = 7,2
• Aproximar o redondear a dos decimales:7,234 = 7,23

b) Si el dígito a redondear es mayor que cinco, al dígito anterior se le agrega


una unidad.
Ejemplo:
• Aproximar o redondear a un entero: 7,678 = 8
• Aproximar o redondear a un decimal: 7,678 = 7,7
• Aproximar o redondear a dos decimales: 7,678 = 7,68

c) Cuando el último dígito o el dígito a redondear es igual a cinco, entonces


se desprecia el cinco si el dígito anterior es par y se agrega una unidad al
dígito anterior si éste es impar.
Ejemplo:
• Aproximar o redondear a un entero: 47,500 = 48,0
• Aproximar o redondear a un decimal: 47,550 = 47,6
• Aproximar o redondear a un decimal: 47,650 = 47,6

❑ Notación sumatoria
Para describir y analizar los datos, es necesario el manejo más o menos eficiente
de las operaciones aritméticas, en especial el de la suma de los datos; es decir, de
la serie: x1, x2, x3, ……, xn, en estudio, para ello se hará una breve descripción de
las sumatorias y de sus propiedades.
La letra griega mayúscula 𝛴, es una notación abreviada para designar una suma,
tal como:

𝑥1 + 𝑥2 + 𝑥3 +. . . +𝑥𝑛

Esta suma se puede resumir y expresarla de la forma siguiente:


𝑛

∑ 𝑥𝑖
𝑖=1

Que se lee como la suma de los 𝑋𝑖 de ⅈ = 1 hasta ⅈ = 𝑛, donde ⅈ = 1,2,3, … , 𝑛. El


índice es arbitrario, pues se puede usar, j, k o l. La expresión ⅈ = 1 debajo del
signo 𝛴 indica que uno (puede ser otro) es el valor inicial de ⅈ, a la expresión 𝑋𝑖
colocado después del signo 𝛴 se le llama sumando y representa a cada uno de los
valores de la variable 𝑋.

Ejemplos:

∑ 𝑋𝑖 = 𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + 𝑋5
𝑖=1

Propiedades de las sumatorias:

a) Suma de una constante


Es igual a n veces la constante, si se inicia con ⅈ = 1
𝑛

∑ 𝑎 = 𝑎 + 𝑎 + 𝑎 + ⋯ + 𝑎 = 𝑛𝑎
𝑖=1

∑ 𝑎 = (𝑛 − 𝑘 + 1)𝑎
𝑖=𝑘

Ejemplo:


4

∑ 7 = 7 + 7 + 7 + 7 = 4 × 7 = 28
𝑖=1

4

∑ 3 = 3 + 3 + 3 + 3 + 3 = (4 − 0 + 1)3 = 5 × 3 = 15
𝑖=0

b) Suma de una constante por una variable


Es igual a lo constante por la suma de la variable.
𝑛 𝑛

∑ 𝑎𝑥𝑖 = 𝑎𝑥1 + 𝑎𝑥2 + 𝑎𝑥3 +. . . +𝑎𝑥𝑛 = 𝑎 ∑ 𝑥𝑖


𝑖=1 𝑖=1

Ejemplo:

5 5

∑ 5𝑥𝑖 = 5𝑥1 + 5𝑥2 + 5𝑥3 +. . . +5𝑥𝑛 = 5 ∑ 𝑥𝑖


𝑖=1 𝑖=1

c) Suma de una variable más una constante


Es igual a la suma de la variable más la constante multiplicada por n, si se
inicia en ⅈ = 1.
𝑛 𝑛

∑(𝑥𝑖 + 𝑎) = (𝑥1 + 𝑎) + (𝑥2 + 𝑎) + (𝑥3 + 𝑎)+. . . +(𝑥𝑛 + 𝑎) = ∑ 𝑥𝑖 + 𝑛𝑎


𝑖=1 𝑖=1

Ejemplo:

4 4

∑(𝑥𝑖 + 3) = (𝑥1 + 3) + (𝑥2 + 3) + (𝑥3 + 3) + (𝑥4 + 3) = ∑ 𝑥𝑖 + 4 × 3


𝑖=1 𝑖=1

∑ 𝑥𝑖 + 12
𝑖=1

d) Suma conjunta de variables


Es igual a la suma individual de cada variable.
𝑛

∑(𝑥𝑖 + 𝑦𝑖 − 𝑧𝑖 ) = (𝑥1 + 𝑦1 − 𝑧1 ) + (𝑥2 + 𝑦2 − 𝑧2 ) + (𝑥3 + 𝑦3 − 𝑧3 ) + ⋯ + (𝑥𝑛 + 𝑦𝑛 − 𝑧𝑛 )


𝑖=1

= (𝑥1 + 𝑥2 + 𝑥3 +. . . +𝑥𝑛 ) + (𝑦1 + 𝑦2 + 𝑦3 +. . . +𝑦𝑛 ) − (𝑧1 + 𝑧2 + 𝑧3 +. . . +𝑧𝑛 )


𝑛 𝑛 𝑛

= ∑ 𝑥𝑖 + ∑ 𝑦𝑖 − ∑ 𝑧𝑖
𝑖=1 𝑖=1 𝑖=1

Ejemplo:
4

∑(𝑥𝑖 + 𝑦𝑖 − 𝑧𝑖 ) = (𝑥1 + 𝑦1 − 𝑧1 ) + (𝑥2 + 𝑦2 − 𝑧2 ) + (𝑥3 + 𝑦3 − 𝑧3 ) + (𝑥4 + 𝑦4 − 𝑧4 )


𝑖=1

= (𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 ) + (𝑦1 + 𝑦2 + 𝑦3 + 𝑦4 ) − (𝑧1 + 𝑧2 + 𝑧3 + 𝑧4 )


4 4 4

= ∑ 𝑥𝑖 + ∑ 𝑦𝑖 − ∑ 𝑧𝑖
𝑖=1 𝑖=1 𝑖=1

e) Suma de un producto de variables


𝑛 𝑛 𝑛

∑ 𝑥𝑖 𝑦𝑖 ≠ (∑ 𝑥𝑖 ) (∑ 𝑦𝑖 )
𝑖=1 𝑖=1 𝑖=1

Pues:
𝑛

∑ 𝑥𝑖 𝑦𝑖 = 𝑥1 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3 +. . . +𝑥𝑛 𝑦𝑛
𝑖=1

𝑛 𝑛

(∑ 𝑥𝑖 ) (∑ 𝑦𝑖 ) = (𝑥1 + 𝑥2 + 𝑥3 +. . . +𝑥𝑛 )(𝑦1 + 𝑦2 + 𝑦3 + ⋯ + 𝑦𝑛 )


𝑖=1 𝑖=1

= (𝑥1 𝑦1 + 𝑥1 𝑦2 + 𝑥1 𝑦3 +. . . +𝑥1 𝑦𝑛 ) + (𝑥2 𝑦1 + 𝑥2 𝑦2 + 𝑥2 𝑦3 +. . . +𝑥2 𝑦𝑛 )+. . . +(𝑥𝑛 𝑦1 + 𝑥𝑛 𝑦2 + 𝑥𝑛 𝑦3 +. . . +𝑥𝑛 𝑦𝑛 )

Ejemplo:

3 3 3

∑ 𝑥𝑖 𝑦𝑖 ≠ (∑ 𝑥𝑖 ) (∑ 𝑦𝑖 )
𝑖=1 𝑖=1 𝑖=1

Pues:

∑ 𝑥𝑖 𝑦𝑖 = 𝑥1 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3
𝑖=1

3 3

(∑ 𝑥𝑖 ) (∑ 𝑦𝑖 ) = (𝑥1 + 𝑥2 + 𝑥3 )(𝑦1 + 𝑦2 + 𝑦3 )
𝑖=1 𝑖=1

= (𝑥1 𝑦1 + 𝑥1 𝑦2 + 𝑥1 𝑦3 ) + (𝑥2 𝑦1 + 𝑥2 𝑦2 + 𝑥2 𝑦3 ) + (𝑥3 𝑦1 + 𝑥3 𝑦2 + 𝑥3 𝑦3 )


f) Sumas parciales
𝑛 𝑘 𝑛

∑ 𝑥𝑖 = ∑ 𝑥𝑖 + ∑ 𝑥𝑖
𝑖=1 𝑖=1 𝑖=𝑘+1

Ejemplo:
8

∑ 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 + 𝑥6 + 𝑥7 + 𝑥8
𝑖=1

= (𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 ) + (𝑥5 + 𝑥6 + 𝑥7 + 𝑥8 )
4 8

= ∑ 𝑥𝑖 + ∑ 𝑥𝑖
𝑖=1 𝑖=5

Nota: La suma cuando es tediosa o larga, se puede desdoblar en sub sumas o


sumas parciales, y la suma de estas sumas parciales es igual a la suma total.

g) Sumas con exponentes


𝑛 𝑛 𝑘

∑ 𝑥𝑖𝑘 ≠ (∑ 𝑥𝑖 ) ∀𝑘 ≠ 1
𝑖=1 𝑖=1

Nota: La igualdad se presenta solo en casos especiales, como cuando todos


los valores de la serie sean ceros.
Si 𝑘 = −1
𝑛
1 1
∑ ≠ 𝑛
𝑥𝑖 ∑𝑖=1 𝑥𝑖
𝑖=1

Si 𝑘 = 2
𝑛 𝑛 2

∑ 𝑥𝑖2 ≠ (∑ 𝑥𝑖 )
𝑖=1 𝑖=1

1
Si 𝑘 =
2
𝑛 1
1 𝑛 2
∑ 𝑥𝑖2 ≠ (∑ 𝑥𝑖 )
𝑖=1
𝑖=1

La demostración se deja como ejercicio.


❑ Suma de interés
n
n(n + 1) n
n(n + 1)(2n + 1)
a) i =
i =1 2
b) i
i =1
2
=
6

 n(n + 1) 
n 2 n
c)  i = 
i =1  2 
3
 d) (X
i =1
n − X n −1 ) = ( X n − X 0 )

 
1 1
e) ri =
i =0 1− r
 r 1 f)  (1 / 2)
i =0
i
=
1 − 1/ 2
=2


r 
r2 + r
g)  ir i =
i =0 (1 − r ) 2
 r 1 h) i 2r i =
i =0 (1 − r ) 3
 r 1

 
1 1
i)  ir i −1 =
i =0 (1 − r ) 2
 r 1 j)  (i + 1)r
i =0
i
=
(1 − r ) 2
 r 1


r +1 n
n
k)  i 2 r i −1 = (1 − r ) 3
 r 1 l)   x  = 2 n

i =0 x =0  
n
 n  x n− x 
xi
m)   P Q
x =0  x 
=1  P +Q =1 n) 
i =0 i!
= ex

Capítulo 2

RECOLECCIÓN DE DATOS
Los datos estadísticos se obtienen como es sabido, midiendo u observando las unidades
elementales, asimismo para el estudio de una o más características de la población no se
necesita de un solo dato, sino de una colección de datos, ya sea los correspondientes a la
población o a los de la muestra, estos datos para ser estudiados necesitan ser recolectados;
la misma, se puede hacer de múltiples maneras, dependiendo de la variable a estudiar.

En ciertos casos, los datos se encuentran a disposición del investigador en documentos


oficiales, como los boletines estadísticos, anuarios, memorias, informes, registros
públicos, revistas, etc., solo hay que transcribirlos, en otros casos, hay que obtenerlos en
la misma fuente, para ello, también existen múltiples formas como los obtenidos mediante
la encuesta o por medio de los diseños experimentales.
Puesto que los datos dependen también del tipo de análisis que se quiera hacer, en este
sentido se pueden clasificar en:

a) De corte transversal
Es decir, del momento, precisamente en este caso, es cuando hay que obtenerlos,
pues en la mayoría de los casos no están disponibles.

b) De corte longitudinal
Es decir, los que sucedieron en el pasado en períodos de tiempo constantes, en
estos casos generalmente se encuentran en los archivos de las instituciones.

CENSO Y MUESTREO
Los métodos que nos permiten recopilar la información son:

1. Censo
Es el procedimiento por el cual se obtiene información de todos los elementos que
conforman la población, relacionado a la variable o variables que se quiere
investigar. Siempre que no se cometan errores en la recopilación y/o
procesamiento de los datos, los resultados que se obtengan serán los verdaderos y
los que se quiere conocer; sin embargo, se tiene la desventaja de que por lo general
es muy difícil practicar un censo, sobre todo cuando la población es muy grande,
muchas veces infinita o cuando para estudiar a las unidades elementales hay que
sacrificarlos.
Por ejemplo:
Los censos nacionales de población, de vivienda, el económico, el agropecuario,
etc. no se realizan cada año, sino entre cada cinco a diez años. Para analizar la
sangre de una persona no se usa toda su sangre sino una pequeña muestra.

2. MUESTREO
Además de la definición dada en el primer capítulo, se puede decir que el muestreo
es el procedimiento por el cual se obtiene información de solo una parte
representativa de la población. sin embargo, debe entenderse, que este
procedimiento no puede ser usado indiscriminadamente; es decir, sin tener en
cuenta las características de la población y las diferentes reglas que para ello
existen.

Tipos de muestreo:

i. Probabilísticos
Son los que se basan en el principio de la equiprobabilidad, es decir,
cuando cada elemento de la población tiene la misma posibilidad de ser
seleccionado. Los cuales a su vez son:
• Muestreo aleatorio simple.
• Muestreo aleatorio estratificado.
• Muestreo aleatorio por conglomerados.
• Muestreo aleatorio sistemático.
• Muestreo de aceptación
• Muestreo aleatorio por etapas. etc.

ii. No Probabilísticos
Son los que se basan en el principio de la representatividad, es decir, aquí
lo único que importa es que sea representativo, los criterios son los de los
expertos. A su vez pueden ser:
• Muestreo por cuotas.
• Muestreo de la bola de nieve.
• Muestreo de Expertos.
• Muestreo de casos-tipo
• Muestras casuales.
• Muestreo para poblaciones móviles, etc.

VENTAJAS DEL MUESTREO SOBRE EL CENSO


El muestreo es un método estadístico diseñado para obtener solo una parte de la
población, pero haciendo que esta parte sea la más representativa posible de la población,
a pesar de ello siempre existirán errores, en comparación con los resultados del censo; sin
embargo, existen ciertas ventajas que lo hacen aplicable, de lo contrario no sería
recomendable usar este método. Las ventajas más importantes son los siguientes:

❖ Menor Costo
Como los datos a recolectar y procesar son relativamente pocos en relación a la
de la población estudiada, los gastos que ocasionen serán por consiguiente mucho
más reducidos.

❖ Menor Tiempo
Como los datos son en menor cuantía que los de la población estudiada, la
recolección y el procesamiento de los mismos se harán en mucho menor tiempo.

❖ Mayor Posibilidad
Precisamente por el menor costo y el menor tiempo empleado, así como de la
imposibilidad de practicar un censo en ciertas poblaciones, hacen que el muestreo
sea mucho más factible de realizarse que un censo.

❖ Mayor Exactitud
Debido a que el volumen de trabajo es mucho más reducido que cuando se practica
un censo, se puede emplear personal más calificado, e incluso a quienes se les
puede capacitar más eficientemente, por consiguiente, el trabajo realizado por
ellos será mucho más confiable y preciso.

Como se dijo anteriormente, la recolección de datos se puede hacer de muchas formas,


usando múltiples recursos y empleando técnicas diversas, en la actualidad la tecnología
tiene un avance bastante significativo en este aspecto, muchos de ellos recién se van
aplicando en los países en desarrollo, pero uno de los métodos más tradicionales es el de
la encuesta.

ENCUESTA
Es el procedimiento por el cual se recolecta la información usando un instrumento
llamado cuestionario de preguntas estructuradas o semiestructuradas. En una forma no
del todo correcta se da el nombre de encuesta sólo al cuestionario de preguntas, sin
embargo, la encuesta tiene una acepción mucho más amplia; es decir, es todo el
procedimiento de recolección de datos.
La encuesta es muy usada en la investigación de mercados. Se puede ejecutar usando
diferentes medios como: La entrevista directa o cara a cara, por teléfono, por correo o por
Internet.

La encuesta según sus objetivos puede clasificarse en dos grandes grupos:

1. Descriptivas
Es cuando el objetivo de la misma, es sólo la de obtener información cuantitativa
de los grupos que constituyen la población, así por ejemplo conocer el porcentaje
de personas que están de acuerdo con un determinado proyecto de ley, cuántos
alumnos vieron un determinado programa de TV., etc.

2. Analíticas
Es cuando el objetivo de la misma es hacer un análisis cualitativo y comparativo
entre los grupos que conforman la población, así, por ejemplo, qué opinión tienen
los hombres y las mujeres sobre el proyecto de ley, o del programa de TV. que
vieron.

Cuando se realiza una encuesta es preciso tener en cuenta ciertas recomendaciones, pues
los resultados que se obtendrán mucho dependerán de los datos recolectados. Estas
recomendaciones están dirigidas en primer lugar a las diferentes fases que tiene la
encuesta, así toda investigación en que se use la encuesta como medio de recolección de
datos.

PASOS PARA REALIZAR UNA ENCUESTA

1. Plantear objetivos bien precisos y claros.


2. Delimitar la población a estudiar.
3. Señalar los datos suficientes y necesarios a recolectarse.
4. Indicar el nivel de precisión deseada.
5. Determinar la unidad elemental o de análisis.
6. En lo posible confeccionar u obtener el marco muestral.
7. Determinar el tipo o tipos de muestreo a usar y el tamaño de la misma.
8. Realizar una encuesta piloto para estimar ciertos valores, reestructurar las
preguntas, determinar la confiabilidad del instrumento (cuestionario), entre otros
aspectos.
9. Organizar el trabajo de campo en forma eficiente.
10. Capacitar a los encuestadores proporcionándoles el manual del encuestador y el
material necesario.
11. Ejecutar la encuesta.
12. Consistenciar los datos obtenidos.
13. Procesar la información, haciendo los cuadros resumen por pregunta.
14. Analizar la información procesada.
15. Sacar conclusiones y recomendaciones.
16. Presentar el Informe Final.

CUESTIONARIO
Es el instrumento, que tiene forma material impresa o digital, utilizado para registrar la
información que proviene de personas que participan en una encuesta; en una entrevista
o en otros procedimientos como son los experimentos.

Por otro lado, debe tenerse en cuenta que toda encuesta tiene su tiempo oportuno para
ejecutarse, las personas a entrevistar no están disponibles a toda hora, ni en el momento
que crea el entrevistador, por lo que la encuesta está sujeta al tiempo disponible del
entrevistado.

Las personas que servirán como encuestadores deben haber sido seleccionados de
acuerdo al perfil que debe tener un entrevistador, de lo contrario se corre el riesgo de ser
rechazado y no obtener la información requerida, en el mejor de los casos la información
no será la verdadera en su totalidad.

En lo referente a la persona a entrevistar (unidad elemental), este debe ser la persona


idónea y no reemplazarlo en caso de no encontrarlo. Así mismo las recomendaciones
también alcanzan a las preguntas y hojas del cuestionario, y estas son:

1. Claridad en las preguntas, a fin de que las respuestas no sean ambiguas.


2. Las preguntas deben ser de acuerdo al nivel cultural de los entrevistados.
3. El cuestionario debe ser completo, comprender las preguntas que interesan, pero
sólo las necesarias.
4. Para el diseño de un cuestionario, al igual que otros instrumentos, se debe recurrir
a la operacionalización de variables de la investigación. Se puede tomar un
cuestionario existente y adaptarlo o crear uno nuevo, en cuyo caso debe hacer una
validación previa. En todos los casos el diseño estará determinado por el
procedimiento que se utilizará para abordar a los sujetos. En algunos casos deben
incluirse preguntas de comprobación a las preguntas principales.
5. Si el cuestionario incluye preguntas de carácter confidencial, deben ser anónimas,
esto originará mayor veracidad en las respuestas.
6. Las hojas del cuestionario deber ser atractivas a la vista por la calidad y color del
papel, tipo de letra, diagramación, presentación, etc.
7. Las preguntas deben ser fáciles de contestar, con unas cuantas palabras, o sólo
para hacer marcas. Las preguntas pueden ser: dicotómicas, múltiples o libres
(abiertas). Recuerde que los entrevistados son reacios a cuestionarios muy
extensos, o cuando las preguntas incluyen respuestas libres, es decir, en las que el
entrevistado debe redactar su respuesta.

El cuestionario de ser validado con expertos y debe tener confiabilidad, si las preguntas
son de tipo Likert, se usa el alfa de Cronbach, si las preguntas son dicotómicas, se usa el
Kuder y Richardson (KR 20).

EJEMPLO DE UNA HOJA DE ENCUESTA

ENCUESTA SOBRE EL SERVICIO DE UN RESTAURANTE (Encabezamiento)

Para brindarle un mejor servicio, por favor responda a estas preguntas:

1. ¿Qué le pareció la comida?

❑ Mala

❑ Regular

❑ Buena

❑ Muy buena

❑ Excelente
2. ¿Qué opina de la variedad de nuestros platillos?

❑ Son pocos

❑ Regular

❑ Suficientes para elegir

❑ ¡Muy surtidos!

3. ¿Qué tal le atendió el mesero?

❑ Mal

❑ Regular

❑ Bien

❑ Muy bien

❑ Excelente

4. ¿Qué le parece el lugar?

❑ Desagradable

❑ Puede mejorar

❑ A gusto

❑ Muy agradable

❑ Excelente

5. Si visitó los baños, ¿qué le parecieron?

❑ Dejan mucho qué desear

❑ Sucios

❑ Necesita algo de limpieza

❑ Limpios

❑ Impecables
6. El servicio de estacionamiento fue:

❑ Muy reducido

❑ Reducido

❑ Regular

❑ Suficiente

❑ Amplio

7. Los precios resultaron:

❑ Altos

❑ No tan altos

❑ Justos

❑ Accesibles

❑ Bajos

8. ¿Regresaría a comer aquí?

❑ Sí

❑ Puede ser

❑ No

9. ¿Recomendaría el lugar?

❑ Sí

❑ Podría ser

❑ No

10. ¿Algún comentario adicional que guste dejarnos?

________________________________________________________________
________________________________________________________________

Agradecemos su tiempo, fue un placer servirle. ¡Vuelva pronto!


Capítulo 3

CLASIFICACIÓN DE DATOS

Después de recolectar los datos, éstos se encuentran en la forma como fueron compilados;
es decir, no necesariamente ordenados, por lo tanto, en este estado son difíciles de ser
analizados y por consiguiente de ser interpretados, con dificultad se puede obtener el
mínimo y el máximo, se puede sumar los valores cuantitativos y dividirlo entre el número
de valores existentes y obtener así el promedio, pero esto no nos garantiza una descripción
completa de los datos, por lo que es necesario ordenarlos y clasificarlos, ya sea en grupos,
categorías o intervalos dependiendo del tipo o tipos de variables en estudio

Para comenzar a clasificar los datos, lo primero que se debe tener en cuenta es el tipo de
variable que se tiene, además usar una sola variable; si la variable es del tipo cualitativo,
no existen mayores recomendaciones ni normas, sino ordenarlos y clasificarlos de
acuerdo al atributo que tiene cada unidad elemental, cuando la variable es del tipo
cuantitativo discreto y la amplitud de la variable es pequeña, el tratamiento es similar a la
de las variables cualitativas, cuando la variable es del tipo cuantitativo, en especial
continuo, se tendrán en cuenta ciertas reglas en el que los diferentes autores no se han
puesto de acuerdo, pero que en el presente caso se dará una secuencia consensuada, por
lo menos por la mayoría de ellos.

Ejemplo 1:

Con fines didácticos se usará un ejemplo como guía, cuya variable es del tipo cuantitativo
continuo, el mismo es el siguiente: con la finalidad de dar una orientación de los hábitos
alimenticios a los niños de su aula un profesor de una zona rural obtuvo el peso en kg. de
cada uno de sus 50 alumnos, que son los que a continuación se dan:

51,2 46,1 38,6 25,1 47,3 37,3 40,8 48,4 39,1 41,3 46,2 31,4 36,0 48,6
44,2 42,3 49,5 59,9 44,5 40,9 41,4 52,3 38,7 33,5 28,4 44,1 54,5 43,9
53,3 44,8 42,6 34,8 26,2 37,2 47,7 43,2 58,4 36,9 52,8 41,6 39,8 43,7
56,0 32,0 46,8 38,1 49,8 30,9 47,2 37,5

Como se puede apreciar no se puede hacer alguna descripción de interés sobre el conjunto
de datos, por lo que es necesario ordenarlos y agruparlos en grupos (intervalos), para lo
cual se sigue los siguientes pasos:
1) Determinar los límites superior e inferior de la distribución
Esto significa obtener el valor más alto y el valor más bajo de los datos.

a) Límite Superior (Ls):


Es el valor más alto del conjunto de datos en estudio, en nuestro caso es igual
a 59,9 kg.

b) Límite Inferior (Li):


Es el valor más bajo del conjunto de datos, en nuestro caso es igual a 25,1 kg.

En conclusión, el alumno con mayor peso es el que tiene 59,9 kg y el de menor


peso es el que tiene 25,1 kg.

2) Obtener el Rango de variación:


Rango (R): Es la diferencia entre el mayor valor y el menor valor de los datos.
R = Ls – Li
R = 59,9 – 25,1 = 34,8 kg.

En el caso discreto R = (Ls – Li) + 1


Para el ejemplo, la diferencia en peso entre dos alumnos cualesquiera no pude ser
superior a 34,8 kg., o la diferencia en el peso de los alumnos es máximo 34,8 kg.

3) Determinación del Número de Intervalos de Clase (m):


Para una descripción más detallada, se agrupa a los datos en intervalos más
pequeños, con la única condición de que no se intersequen y que al unirlos deben
coincidir con el rango de variación, las amplitudes de estos intervalos pueden ser
diferentes o constantes, en el caso de ser diferentes no existe mayores requisitos
que los dados por la persona que está haciendo la clasificación, según los intereses
de su investigación.
En el caso de que las amplitudes sean constantes, se tiene la necesidad de conocer
el número de dichos intervalos en primera instancia. Se recomienda que el número
de intervalos (m) no deben ser menores de cinco ni mayores de veinte. Pues al ser
muy pocos intervalos se pierde mucha información, en tanto que al haber muchos
intervalos los cálculos se vuelven muy engorrosos.
Hay varias reglas para calcular el número de intervalos, en este caso usaremos el
de Herbert Sturges, que es un buen aproximador.
m = 1 + log2 (n)
m = 1 + 3,322 log10(n)

Para nuestro ejemplo se tiene:

m = 1 + 3,322 log10(50)

m = 1 + 3,322 (1,69897)

m = 1 + 5,644

m = 6,644

m=7

Esto indica que el número de intervalos para nuestro ejemplo debe ser 7, sin
embargo, esto no impide que pueda ser otro número próximo a 7, pues como se
dijo la fórmula es un aproximador y no una regla infalible, lo importante es tener
el número de intervalos adecuados que con la experiencia se va adquiriendo.

Otra regla para calcular el número de intervalos de clase es sacar la raíz cuadrada
de n si este es menor que 200, en nuestro ejemplo también es 7, pues √𝟓𝟎=7. 071.

4) Determinar la amplitud de los intervalos (C)


Como se dijo anteriormente es necesario conocer la amplitud de los intervalos,
cuando estos son constantes, los cuales se obtienen dividiendo el rango entre el
número de intervalos:
𝑅
𝐶=
𝑚
Para el ejemplo, el valor es el siguiente:

34.8
𝐶=
7

𝐶 = 4.97143

Como los datos del ejemplo están expresados o redondeados a un decimal, el


tamaño de la amplitud interválica, puede ser redondeada también a un decimal,
pero en nuestro caso, el redondeo a un decimal se convierte a un entero (5,0), esto
hace que la distribución sea más manejable, así como se reduzcan algunos detalles,
que con la práctica se harán más comprensibles.

En la mayoría de los casos la división del rango entre el número de intervalos no


es un número exacto, por lo que se necesita redondear, recomendando a que sea
al número de decimales que tienen los datos, si no los tiene será a un entero, pero
el redondeo es siempre a un número mayor, sólo por esta vez no se tendrá en
cuenta las reglas dadas para el redondeo de datos.

5) Distribución del incremento (∆):


Si volvemos a multiplicar el número de intervalos (m) por el valor de la amplitud
interválica (C) establecida, se tendrá un incremento (∆) en el rango, de no haber
habido un redondeo a una cifra mayor no habría tal incremento, en el ejemplo que
se tiene sí debe existir pues hubo redondeo a 5,0; en consecuencia existe un nuevo
rango R’, tal como se puede apreciar:
R’ = C x m = R + ∆
∆ = R’ - R

Para el ejemplo, tenemos:

R’ = 5 x 7 = 35

∆ = 35,0 – 34,8

∆ = 0,2 kg
Este incremento se debe repartir en ambos lados del rango, en lo posible en forma
equitativa, pero siempre evitando la propagación de los decimales.

Si el incremento es par, no habrá inconveniente de repartirlo en partes iguales, y


0,2
distribuirlo en ambos lados del rango, en nuestro ejemplo se debe distribuir =
2

0,1 a cada lado.

7. Tabulación
Después de obtener los verdaderos límites, tanto superior como inferior, se hace
la distribución de los intervalos de clase, los mismos se establecen ya sea en forma
creciente o decreciente según el interés del trabajo en ejecución. Teniendo los
intervalos de clase se hace la tabulación de los datos, que consiste en distribuir
cada dato al intervalo que le corresponde. Si la distribución es manual se usan las
famosas tarjetas u otro mecanismo de conteo de datos, como también se puede
Si la distribución es manual se usan las famosas tarjas u otro mecanismo de co
ordenar los datos en forma creciente o decreciente y contar los datos del intervalo
datos, como también se puede ordenar los datos en forma creciente o decre
correspondiente.
contar los datos del intervalo correspondiente. Para nuestro ejemplo la distr
Para nuestro ejemplo
con lasusdistribución
respectivasestarjas
la siguiente:
es el siguiente:
Pesos en Kg. Número de alumnos
25 – 30 ///
30 – 35 /////
35 – 40 ///// /////
40 – 45 ///// ///// ////
45 – 50 ///// /////
50 – 55 /////
55 - 60 ///

8) Intervalo de clase
Son las categorías o grupos en las que se deben distribuir los datos para una mejor
descripción de las variables cuantitativas. Los intervalos pueden ser cerrados,
cuando las variables son discretas; pueden ser semiabiertos o semicerrados,
cuando las variables son continuas, asimismo los intervalos pueden ser constantes
o variables (de diferente amplitud) como ya se dijo anteriormente.
Cuando existen datos extremos o muy aislados, el primero, el último o ambos
pueden se abiertos, esto es, con la finalidad de no usar demasiados intervalos
innecesariamente, muchos de ellos con frecuencias nulas.
En el caso de las variables cualitativas no se usan intervalos, sino categorías o
atributos excluyentes. Generalmente los intervalos para variables continuas deben
ser semicerrados, cerrados a la izquierda y abiertos a la derecha.

9) Límite de Clase (Yi)


Son las fronteras o limites de cada uno de los intervalos de clase, también existe
un Límite Superior (Yi) y un Límite Inferior (Yi-1), el tamaño o amplitud de cada
uno de estos intervalos se obtiene, además de lo expuesto anteriormente, de la
siguiente manera y si los intervalos son semiabiertos:

𝐶𝑖 = 𝑌𝑖 − 𝑌𝑖−1

Ejemplo:

𝐶1 = 𝑌1 − 𝑌0

𝐶1 = 30 − 25

𝐶1 = 5

Nota: En el caso de variables discretas, se usan los verdaderos límites de clase.

10) Marca de Clase (Yi = Xi)


Se llama también punto medio de clase y sirve para representar al conjunto de
datos que pertenecen al intervalo de clase correspondiente, es decir al valor
supuesto de la variable en este intervalo (este es la razón por la que se pierde la
información original), además se usa para obtener los estadígrafos o parámetros
necesarios para la descripción.

Se obtiene sumando el límite inferior más el límite superior y dividiendo esta suma
entre dos:

𝑌𝑖−1 + 𝑌𝑖
𝑌𝑖 =
2
Ejemplo:

𝑌0 + 𝑌1
𝑌1 =
2

25 + 30
𝑌1 =
2

𝑌1 = 27.5 𝑘𝑔

𝑌1 + 𝑌2
𝑌2 =
2

30 + 35
𝑌2 =
2

𝑌2 = 32.5 𝑘𝑔

11) Frecuencia
Es el valor que representa a la cantidad de datos que pertenecen a cada uno de los
intervalos de clase, categorías o atributos de clasificación.

Tipos:
a. Absolutas
Son los números que representan a la cantidad de datos que pertenecen a cada
una de las categorías o intervalos de clase, tienen la característica de ser
números enteros positivos, a su vez se clasifican en:

i. Simples (ni, fi)


Son los que corresponden a cada uno de los intervalos de clase o categorías
de clasificación, se les representa por ni o fi y tienen la característica de que
la suma de todas ellas debe ser igual a n, es decir:
𝑚 𝑚

∑ 𝑛𝑖 = ∑ 𝑓𝑖 = 𝑛 0 ≤ 𝑛𝑖 ≤ 𝑛
𝑖=1 𝑖=1
Ejemplo:

Para el ejemplo que se tiene

n1=3, indica que existen 3 alumnos cuyos pesos oscilan entre 25 y 30 kg.

n5=10, indica que existen 10 alumnos cuyos pesos oscilan entre 50 y 55 kg.

ii. Acumuladas (Ni, Fi)


Son los que corresponden a uno o más intervalos contiguos, por lo tanto,
corresponden a la suma de las frecuencias absolutas simples de cada uno de
los intervalos que lo forman, se les representa por Ni o Fi.

0 ≤ 𝑁𝑖 ≤ 𝑛

𝑁1 = 𝑛1

𝑁2 = 𝑛1 + 𝑛2 = 𝑁1 + 𝑛2

𝑁2 = 𝑛1 + 𝑛2 + 𝑛3 = 𝑁2 + 𝑛3

𝑁𝑖 = 𝑁𝑖−1 + 𝑛𝑖

𝑁𝑚 = 𝑛

Ejemplo:

Para el ejemplo que se tiene

𝑁2 = 3 + 5

𝑁2 = 8

Esto indica que hay 8 estudiantes cuyos pesos fluctúan entre 25 y 35 kg.

𝑁4 = 3 + 5 + 10 + 14

𝑁4 = 32
Esto indica que hay 32 estudiantes con pesos entre 25 y 45 kg o con pesos
menores que 45 kg.

b. Relativas
Son las que resultan de dividir las frecuencias absolutas entre el número total
de datos en estudio, se les llama también tanto por uno, o probabilidades de
ocurrencia de los datos en los intervalos o categorías correspondientes, a su
vez se clasifican en:

i. Simples (hi)
Son los que resultan de dividir una frecuencia absoluta simple entre el
número total de datos, en consecuencia, indican la probabilidad de
ocurrencia de los datos en el intervalo de clase o categoría correspondiente,
se les representa por hi.

𝑛𝑖 𝑓𝑖
ℎ𝑖 = = 0 ≤ ℎ𝑖 ≤ 1
𝑛 𝑛
𝑚

∑ ℎ𝑖 = 1
𝑖=1

Ejemplo:

Para el ejemplo que se tiene

𝑛2
ℎ2 =
𝑛

5
ℎ2 =
50

ℎ2 = 0.1

0.1 es la probabilidad o proporción de que un alumno tenga un peso entre


30 y 35 kg.

𝑛5
ℎ5 =
𝑛
10
ℎ5 =
50

ℎ5 = 0.2

0.2 es la probabilidad o proporción de que un alumno pese entre 45 y 50 kg.

ii. Acumulada (Hi)


Son las que resultan de dividir una frecuencia absoluta acumulada entre el
número total de datos en estudio, o sumando las frecuencias relativas
simples que los conforman, se les representa por Hi.

𝑁𝑖 𝑓𝑖
𝐻𝑖 = = 0 ≤ 𝐻𝑖 ≤ 1
𝑛 𝑛
𝑖

𝐻𝑖 = ∑ ℎ𝑗
𝑗=1

𝐻1 = ℎ1

𝐻2 = ℎ1 + ℎ2

𝐻3 = ℎ1 + ℎ2 + ℎ3

𝐻𝑖 = 𝐻𝑖−1 + ℎ𝑖

𝐻𝑚 = 1, 0

Ejemplo:

Para el ejemplo que se tiene

𝑁3
𝐻3 =
𝑛

18
𝐻3 =
50
𝐻3 = 0.36

𝐻3 = 0.06 + 0.10 + 0.20

𝐻3 = 0.36

Esto indica que la probabilidad de que un alumno tenga un peso entre 25 y


40 kg es de 0,36.

𝑁4
𝐻4 =
𝑛

32
𝐻4 =
50

𝐻4 = 0.64

𝐻4 = 0.06 + 0.10 + 0.20 + 0.28

𝐻4 = 0.64

Esto indica que la probabilidad o proporción de que un alumno pese entre


25 y 45 kg es igual a 0,64.

c. Porcentuales
Son los que resultan de multiplicar una frecuencia relativa por cien. Como
quiera que las frecuencias relativas no son usadas por el común de la gente, se
ha preferido utilizar los porcentajes que son más comunes y entendibles. A su
vez se clasifican en:

i. Simples (pi)
Son las que resultan de multiplicar una frecuencia relativa simple por cien, e
indican el porcentaje de datos que corresponden al intercalo de clase o
categoría de clasificación dada. Se les representa por pi.

𝑝𝑖 = ℎ𝑖 × 100% 0 ≤ 𝑝𝑖 ≤ 100%
𝑚

∑ 𝜌𝑖 = 100%
𝑖=1

Ejemplo:

Para el ejemplo que se tiene

𝑝3 = ℎ3 × 100

𝑝3 = 0.2 × 100

𝑝3 = 20%

Esto indica que el 20% de los alumnos pesan entre 35 y 40 kg.

𝑝7 = ℎ7 × 100

𝑝7 = 0.06 × 100

𝑝3 = 6%

Esto indica que el 6% de los alumnos pesan entre 55 y 60 kg.

ii. Acumuladas (Pi)


Son las que resultan de multiplicar una frecuencia relativa acumulada por cien.
O de sumar las frecuencias porcentuales simples que lo conforman, e indican
el porcentaje de datos que corresponden a los intervalos acumulados. Se les
representa por Pi.

𝑃1 = 𝐻𝑖 × 100% 0 ≤ 𝑃𝑖 ≤ 100%

𝑃𝑖 = ∑ 𝑝𝑗
𝑗=1

𝑃1 = 𝑝1

𝑃2 = 𝑝1 + 𝑝2

𝑃2 = 𝑝1 + 𝑝2 + 𝑝3

𝑃𝑖 = 𝑃𝑖−1 + 𝑝𝑖

𝑃𝑚 = 100%
Ejemplo:
Para el ejemplo que se tiene
𝑃2 = 𝐻2 × 100%
𝑃2 = 0.16 × 100%
𝑃2 = 16%
𝑃2 = 6% + 10%
𝑃2 = 16%
Esto indica que el 16% de los alumnos pesan entre 25 y 35 kg.

𝑃5 = 𝐻5 × 100%

𝑃5 = 0.84 × 100%

𝑃5 = 84%

𝑃5 = 6% + 10% + 20% + 28% + 20%

𝑃5 = 84%

Esto indica que el 84% de los alumnos pesan entre 25 y 50 kg.

CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS

Es un cuadro preliminar de trabajo que contiene todas las frecuencias parte del cual, se
usará para la presentación de datos ya sea en cuadros o en gráficas estadísticas, también
se usa para hacer la descripción completa de los datos de estudio.
Es un cuadro preliminar de trabajo que contiene todas las frecuencias, parte del cual
se usará para la presentación de datos ya sea en cuadros o en gráficas estadísticas, también
se usa para hacer la descripción completa de los datos en estudio.
Cuadro de Distribución de Frecuencias
Y '
i −1 − Yi ' ) Yi ni Ni hi Hi pi Pi
Y 0
'
)
− Y1' Y1 n1 N 1 h1 H1 p1 P1
Y '
−Y ) ' Y2 n2 N 2 h2 H2 p2 P2
Y
1 2

2
'
−Y )3
' Y3 n3 N 3 h3 H3 p3 P3
………. … …. …. … …. … ….

Ym' −1 − Ym' ) Ym nm N m = n hm H m = 1,0 pm Pm = 100%
Total n 1,0 100%

Ejemplo:

Ejemplo:
UseUse los datos
los datos del ejemplo
del ejemplo y estudio,enpara
estudio, para
construir construir
el cuadro el cuadrodede distribución
de distribución
de frecuencias correspondiente.
frecuencias correspondiente.
Solución:

Yi −' 1 − Yi ' Yi ) ni Ni hi Hi pi Pi
25 – 30 27,5 3 3 0,06 0,06 6% 6%
30 – 35 32,5 5 8 0,10 0,16 10% 16%
35 – 40 37,5 10 18 0,20 0,36 20% 36%
40 – 45 42,5 14 32 0,28 0,64 28% 64%
45 – 50 47,5 10 42 0,20 0,84 20% 84%
50 – 55 52,5 5 47 0,10 0,94 10% 94%
55 - 60 57,5 3 50 0,06 1,00 6% 100%
Total 50 1,00 100%

Se nota que el alumno con mayor peso es el de 60 kg. y el de menor peso es el de 25 kg,
la distribución de los alumnos según su peso es simétrica, alrededor de los 42,5 kg., la
mayor cantidad de alumnos (28%) pesan entre los 40 a 45 kg. el 36% de los alumnos
pesan menos de 40 kg. y el 84% de los alumnos pesan menos de 50 kg. etc. Este es una
pequeña descripción de la distribución de los alumnos según su peso, es bueno recordar
que cuando todavía no estaba ordenado no pudimos hacer mayores descripciones, que el
peso mínimo y el máximo y esto con gran esfuerzo.
Ejemplo 2:

El siguiente cuadro indica el número de créditos aprobados por 50 alumnos del segundo
ciclo de Estadística

Ls = 44

Li = 10

R = 44 – 10 = 34

m = 1+3.322 log (50) = 7

C = 34/7 = 4.857 = 5

R’ = 5x7 = 35

∆ = 35 – 34 = 1

LI = 10-0 = 10

LS = 44+1 = 45
Ejemplo 3:

A un conjunto de 40 alumnos de la UNASAM se les preguntó sobre su estado civil, a


los que contestaron según la serie siguiente:

Soltero, soltero, casado, soltero, conviviente, soltero, casado, soltero, casado, divorciado,
casado, soltero, casado, divorciado, viudo, soltero, casado, soltero, casado, divorciado,
Ejemplo 03. A un conjunto de 40 alumnos de la UNASAM se les preguntó sobre su
casado, conviviente, casado, soltero, soltero, soltero, viudo, conviviente, conviviente,
estado civil, a los que contestaron según la serie siguiente:
Soltero, soltero,
soltero,casado,
casado,conviviente, soltero, conviviente,
soltero, conviviente, soltero, soltero,
casado,conviviente, divorciado,
soltero, casado, divorciado,
casado, soltero,soltero,
soltero, casado, divorciado, viudo, soltero, casado, soltero, casado, divorciado,
conviviente.
casado, conviviente, casado, soltero, soltero, soltero, viudo, conviviente, conviviente,
soltero, casado, conviviente, soltero, conviviente, soltero, conviviente, divorciado,
soltero, soltero, conviviente.
En este caso solo son necesarias lar tarjas de contar con facilidad el número de alumnos
Solución:
En este casoestado
por cada sólo civil.
son necesarias las tarjas a fin de contar con facilidad el número de
alumnos por cada estado civil.
Estado ni Ni hi Hi pi Pi
Civil
Soltero 16 16 0,40 0,40 40% 40%
Casado 10 26 0,25 0,65 25% 65%
Conviviente 8 34 0,20 0,85 20,% 85%
Divorciado 4 38 0,10 0,95 10% 95%
Viudo 2 40 0,05 1,00 5% 100,%
Total 40 1,00 100%

En el caso de las variables cuantitativas discretas, las recomendaciones mayormente


recaen enEnlos
el caso de las variables
intervalos de clase,cuantitativas
estos debendiscretas, las recomendaciones
ser cerrados como ya semayormente
dijo, en cuanto a
los límites y marcas de clase se recomienda que sean números enteros en
recaen en los intervalos de clase, estos deben ser cerrados como ya se dijo, en lo posible,
cuanto a y en
lo referente a las frecuencias, también se obtienen todas las mencionadas.
los límites y marcas de clase se recomienda que sean números enteros en lo posible, y en
lo referente a las frecuencias, también se obtienen todas las mencionadas.

Capítulo 4

PRESENTACIÓN DE DATOS
La presentación de los datos, después de haberlos ordenado y clasificado, se puede hacer
de dos maneras: por medio de los cuadros estadísticos y por medio de las gráficas
estadísticas. Sin embargo, cabe aclarar que la mayoría de las gráficas o figuras se utilizan
por razones diferentes que, por la simple presentación de datos, una de esas razones es la
publicidad, a pesar de que, como método para presentar datos, la gráfica es inferior a la
de un cuadro, pues de la gráfica sólo se puede obtener aproximaciones visuales acerca de
la distribución de los datos, en cambio de un cuadro se obtiene la información precisa de
dicha distribución.

1) CUADROS ESTADÍSTICOS
Se le llama también Tabla Estadística, este es un método de presentar
ordenadamente los datos, después de que éstos hayan sido agrupados y
distribuidos en uno o más sistemas de clasificación. Existen diferentes tipos de
tablas, pero lo agruparemos en sólo dos grupos.

a) Cuadros Analíticos
Son los diseñados para ayudar al análisis formal de las relaciones mutuas entre
variables y categorías de clasificación.

b) Cuadros de Referencia
Son los diseñados para servir como depósito de información estadística,
éstos se encuentran generalmente en los apéndices de los informes o
reportes.

ELEMENTOS ESTRUCTURALES DE UN CUADRO ESTADÍSTICO

El cuadro estadístico debe estructurarse teniendo en cuenta la utilidad que preste


al usuario común, es decir, quien lo diseña debe colocarse en el lugar del que
utilizará la información.

La construcción del mismo es una labor aparentemente sencilla, sin embargo, en


la práctica es necesario tener en cuenta elementos que faciliten la lectura,
comprensión e interpretación de los datos. Por otro lado, siempre hay que tener
en cuenta los lineamientos proporcionados por el ente rector que en este caso es
el INEI.

Los elementos que se presentan a continuación, son los de un cuadro de


clasificación matricial o de clasificación cruzada de dos variables, pudiendo en
algunos casos obviarse de alguno de los elementos dados. Para mayor referencia
leer la Resolución Jefatural Nº 312-2006-INEI de fecha: 25-10-06.
a. Número del Cuadro (Tabla)
Todo cuadro debe tener un número que lo identifique, para facilitar su
referencia. Las tablas se enumeran de acuerdo al orden de su presentación o
aparición en un reporte, salvo que se presente un solo cuadro. Generalmente
se colocan en la parte superior izquierda del cuadro.

b. Título
El título de un cuadro indica el contenido del mismo, y debe responder a las
siguientes preguntas: ¿Qué?, ¿Cuándo?, ¿Dónde? Y ¿Cómo? Están
clasificados los datos. Al redactar un título se debe evitar un enunciado
demasiado extenso, así como una extrema brevedad.

c. Notas en el Encabezado de la tabla


Estas notas se colocan cerca del título, generalmente entre paréntesis y con
letras más pequeñas que las del título. El objetivo de estas notas es
proporcionar información complementaria o adicional al título, si es
necesario por su puesto, como por ejemplo para indicar la unidad de medida
de los datos, la fecha, lugar u otro indicador.

d. Talón
Es la parte de la tabla que contiene al conjunto de encabezados o rótulos de
las hileras, que corresponde a una de las clasificaciones. Está situado al lado
izquierdo del observador. Cada hilera de la tabla debe tener un rótulo que
describa los datos presentados en dicha hilera. Se le llama también columna
matriz.

e. Cajón
Es la parte de la tabla que contiene los encabezados o rótulos de las
columnas. Corresponden a otra de las clasificaciones y está situado al lado
superior derecho del observador, así como en las hileras cada columna debe
tener un rótulo que describa los datos que en ella se presentan. Se le llama
también encabezado del cuadro.
f. Campo
Se le conoce también como el cuerpo de la tabla, y es la parte que contiene
los datos numéricos o estadísticos, cada registro se presenta en una Celda o
Casilla que viene a ser la unidad básica de presentación de la tabla. Una
celda resulta de la intersección de una columna con una hilera, ya que el
significado del dato presentado en ella se indica con la combinación de los
rótulos de la hilera y de la columna correspondiente.

g. Notas al pie de la tabla


Se llaman también notas al calce (footnotes), estas notas o llamadas se usan
muy a menudo para explicar o aclarar un dato o grupo de datos de la tabla;
esto, si es necesario especificar alguna característica particular del dato o
datos presentados, evitando así alguna confusión en su interpretación.

h. Fuente de datos
Estas notas indican el origen de los datos presentados en la tabla, sirven para
identificar o reconocer a la persona o institución que lo confeccionó y lo
publicó; sirve también como una ayuda para evaluar la confiabilidad y
permitir su verificación, así como tener información adicional.
Nº de la Tabla TÍTULO
(Notas en el encabezado)

Encabezado Encabezado Principal (Cajón)


del Talón (Clasificación B)
(Clasificación Rótulo de la Rótulo de la Rótulo de la
………
A) columna: B1 columna: BS columna: Total B
Rótulo de la
hilera: A1
…………..
Celda
Rótulo de la
hilera: AR
Rótulo de la
hilera: Total A
- Notas o llamadas al pie de la tabla.
- Fuente de datos.
2) GRÁFICAS ESTADÍSTICAS:
Tiene la finalidad de ofrecer una visión de conjunto del fenómeno sometido a
investigación en forma tal que sea más rápidamente perceptible que la
observación directa de los datos numéricos; de aquí, que la representación gráfica
sea un medio eficaz para el análisis de las estadísticas, ya que las magnitudes y
las regularidades se aprecian y recuerdan con más facilidad cuando se les examina
gráficamente. Sin embargo, la representación gráfica es sólo un medio auxiliar del
análisis estadístico; puesto que ésta, es netamente numérica. Entre las funciones
que cumplen las gráficas o diagramas se pueden señalar las siguientes:
✓ Hacen más visibles los datos, sistemas y procesos
✓ Ponen de manifiesto sus variaciones y su evolución histórica o espacial.
✓ Pueden evidenciar las relaciones entre los diversos elementos de un
sistema o de un proceso y representar la correlación entre dos o más
variables.
✓ Sistematizan y sintetizan los datos, sistemas y procesos.
✓ Aclaran y complementan las tablas y las exposiciones teóricas o
cuantitativas.

El estudio de su disposición y de las relaciones que muestran pueden sugerir


hipótesis nuevas.

PARTES:
➢ Número
Toda gráfica debe tener un número que lo identifique, cumple el mismo
objetivo que el de las tablas estadísticas, salvo que sea una sola gráfica la que
se presenta en el reporte.

➢ Título
El título tiene las mismas características que la de una tabla estadística; es
decir, el título es una descripción del contenido de la gráfica, con la diferencia
de que pueden ser colocados ya sean en la parte superior o en la parte inferior
de la gráfica.
➢ Diagrama
Los diagramas, como el cuerpo de una tabla estadística, son usados para
representar los datos mostrados en la gráfica. Se recomienda identificar
claramente las clases o categorías de clasificación, poniendo a cada uno de
ellos el nombre y si es posible el valor que le corresponde.

➢ Escala
Toda gráfica debe proveer una escala que le permita al lector, interpretar el
significado de las magnitudes de las líneas, barras u otras formas que sirvan
para representar tanto a las frecuencias como a las categorías. Las escalas se
ubican generalmente en los ejes cartesianos, cuando las gráficas son
presentadas usando el plano cartesiano, con frecuencia el eje de las X o de las
abscisas son para las variables, en tanto que el eje de las Y o de las ordenadas
son para las frecuencias. El punto cero u origen debe ser indicado con claridad,
en caso de que el origen y la parte de la escala a ser usada sea muy distante se
hace una línea quebrada como:

-/\/\/\/- o se corta la línea como: -/ /-

➢ Fuente de datos
Se debe indicar la fuente de donde se obtuvo los datos para construir el
diagrama o la gráfica, el cual dará mayor formalidad a la presentación.

CLASES
Existe una gamma bastante extensa de diagramas y gráficas para presentar los
datos, de acuerdo a la variable o variables en estudio, los mismo se pueden
clasificar de la forma siguiente:

1) Con coordenadas ortogonales.


a) Con divisiones equidistantes
 Histograma de frecuencias.
 Polígono de frecuentas.
 Pirámide poblacional
 Ojivas.
 Diagrama de barras
 Diagrama de bastones.
 Gráfico de tendencia.

b) Con divisiones semi-equidistantes:


 Gráficos logarítmicos.
 Gráficos semilogarítmicos.

2) De coordenadas no ortogonales:
 De coordenadas polares - En espiral
 De coordenadas triangulares.
 De coordenadas angulares.
 De coordenadas conjugadas. etc.

3) Sin coordenadas:
 De superficies – gráfico de sectores.
 De volúmenes – cubos, esferas, etc.
 De figuras – pictogramas. Gráfico de ta Mapas – cartogramas o carto
diagramas. Etc.
CLASIFICACIÓN DE LAS GRÁFICAS MAS USADAS
1. Histograma de frecuencias
C.Nº 2.
Temperatura en Número
Xi Fi
Grados Centígrados de días
31,5 – 32,5 32,0 3 3
32,5 – 33,5 33,0 6 9
33,5 – 34,5 34.0 10 19
34,5 – 35,5 35.0 15 34
35,5 – 36,5 36.0 8 42
36,5 – 37,5 37,0 6 48
37,5 – 38,5 38.0 4 52
Total 52

F. Nº 1. Temperatura en Grados Centígrados en una Ciudad durante 52 días

4.2. Polígono de Frecuencias:


Son polígonos formados uniendo con semirrectas los puntos medios superiores
(Xi, ni) de las barras de un histograma de frecuencias; es decir, las marcas de clase y la
frecuencias correspondientes, para cerrar el polígono, se unen también el punto medi
anterior a la primera clase y el punto medio posterior a la última clase.
Nota. - El área del polígono de frecuencias es igual al del histograma de frecuencias.
Por razones de comparación se ha incluido el polígono de frecuencias al histogram
de frecuencias. Ver F. Nº 2.
2. Polígono de frecuencias
F. Nº 3. POLÍGONO DE FRECUENCIAS
16

14

12

10

8
Número de Alumnos

2
27.5 32.5 37.5 42.5 47.5 52.5 57.5

Peso en kg.
3. Gráfico de tendencia

NÚMERO DE ALUMNOS MATRICULADOS EN UN INSTITUTO POR AÑOS

8,000
NÚMERO DE ALUMNOS

Ejemplo. Se hizo una encuesta a 88 obreros sobre su jornal. Los resultados son l
6,000
siguientes.
C. Nº4,000
4.

2,000 Jornal fi Obreros Fi


[38, 44) 7 7
0
[44, 50) 8 15
2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021
[50, 56) 15 30
[56, 62) AÑOS 25 55
[62, 68) 18 73
[68, 74) 9 82
[74, 80) 6 88

4. F.
Polígono de frecuenciasDE
Nº 6. POLÍGONO acumuladas. Ojiva
FRECUENCIAS ACUMULADAS – OJIVA
5. Pirámide poblacional
PIRÁMIDE POBLACIONAL DE ESPAÑA (2020)

6. Diagrama de barras
7. Gráfico de bastones

Ejemplo:
Se hizo una encuesta a 220 alumnos ingresantes a la UNASAM, sobre el promedio
de notas que obtuvieron el quinto de secundaria, los cuales fueron agrupados de acuerdo
a sus ingresos económicos, los resultados se presentan en la siguiente gráfica.
8. GráficoF.
deNºcajas
11. GRÁFICO DE CAJAS
18

17
218

16

15
Puntaje en 5to secundaria

14

13

12

11

10
N= 17 150 55

Alto Medio Bajo

Nivel socio económico


9. Gráfico de sectores
DISTRIBUCIÓN DEL PRESUPUESTO DE LA COMUNIDAD DE
PUTINA

10. Pictograma
PROMEDIO DE ARBOLES PLANTADOS POR DÍAS EN UNA CIUDAD
11. Gráfico de Gantt

Capítulo 5

MEDIDAS DESCRIPTIVAS
Si se pretende describir con un solo un valor las características del conjunto de datos,
hablaremos del estadístico si el conjunto corresponde a una muestra, y parámetro si el
conjunto corresponde a la población. Puesto que es difícil estudiar poblaciones enteras;
es más frecuente el uso de la muestra; por lo tanto, se incidirá más en el estudio del
estadístico para describir los datos, de ahí que el estadístico tomará el nombre de medida
descriptiva.

Los estadísticos que se estudiarán en esta unidad, son los que describen las siguientes
características:

• La localización puede ser el centro u otro punto de la distribución; es decir,


medidas de centralización y de posición.
• El grado de variación o dispersión de los datos, alrededor de un punto
determinado.
• El grado de asimetría o sesgo respecto al punto de mayor densidad de datos.
• El grado de concentración de los datos alrededor de un punto determinado.
MEDIDAS DE CENTRALIZACIÓN
Si el conjunto de datos no tienen el mismo valor, entonces existirá un valor mínimo y un
valor máximo, asimismo existirá un valor que no es superior al máximo ni inferior al
mínimo; es decir, un valor intermedio, este valor típico que se empleará para representar
a todos los valores individuales, se llamará promedio o media; por lo tanto, un promedio
es una magnitud que pretende identificar al centro de una distribución, o que centraliza
los datos y alrededor del cual los datos se acumulan, por ello reciben el nombre de medida
de tendencia central (tienden al centro), centralización (centralizan), de localización
(lugar) o de posición.

Clases
a) Medias fijas
Se les llama también medias matemáticas o medidas de centralización, debido
a que se ubican generalmente en el centro de distribución y poseen las
siguientes características:
✓ Para la obtención de su valor se usan todos los datos en estudio.
✓ Son afectados por los valores extremos o aislados de los datos en
estudio.
✓ Pueden ser sometidos a operaciones algebraicas.

Entre las medidas más conocidas están:


▪ Media Aritmética
▪ Media Geométrica
▪ Media Armónica
▪ Media Cuadrática, etc.

b) Medias móviles
Se les llama también medias no matemáticas o de posición, tienen las
siguientes características:

✓ Para obtener su valor, solo se usa algunos valores del conjunto de datos
en estudio.
✓ No son afectados por los valores extremos o aislados del conjunto de
datos en estudio.
✓ No pueden ser sometidos a operaciones algebraicas.

Entre las medias móviles más conocidas están:


▪ Mediana
▪ Moda
▪ Fractiles: Cuartiles, deciles y percentiles

MEDIA ARITMÉTICA “M(X)”


Es la medida más conocida, usada y representativa de las medias o promedios. Su nombre
proviene de lo asignado al promedio de una serie aritmética. Físicamente tiene una
acepción muy importante, que es la de ser el centro de gravedad o punto de equilibrio de
toda distribución de masa de los datos en estudio.

El valor se obtiene dividiendo la suma de todos los valores de los datos en estudio, entre
el número total de los mismos, y se expresa de la siguiente manera:

• Media Aritmética Poblacional:

∑𝑁
𝑖=1 𝑋𝑖
𝑢=
𝑁

• Media Aritmética Muestral, para datos no agrupados:


∑𝑛𝑖=1 𝑋𝑖
𝑋̅ =
𝑛
• Media Aritmética Muestral, para datos agrupados:
∑𝑚
𝑖=1 𝑋𝑖 𝑓𝑖
𝑋̅ =
𝑛

Dónde:

• 𝑋𝑖 es el i-esimo valor de la variable, o la i-esima marca de clase, en el caso de


datos agrupados.
• ⅈ = 1,2,3,4, … , 𝑛 𝑜 𝑁
• 𝑓𝑖 es la i-esima frecuencia absoluta simple.
• 𝑁 es el tamaño de la población.
• 𝑛 es el tamaño de la muestra.
• 𝑚 es el número de intervalo de clase.

EJEMPLO 1:

En una muestra aleatoria de 5 semanas se observó que una agencia de cruceros recibía el
siguiente número de programas semanales especiales de cruceros al Caribe: 20, 73, 75,
80, 82. Calcule la media aritmética.

De acuerdo a los datos ingresados la suma de todo el valor es:

∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛

𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑥̅ =
𝑛

∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛

330
𝑥̅ =
5

𝑥̅ = 66

Propiedades
a) La suma algebraica de las diferencias de cada uno de los valores respecto a su
media aritmética es igual a cero

Para datos no agrupados:


𝑛

∑(𝑋𝑖 − 𝑋̅) = 0
𝑖=1

Para datos agrupados:


𝑚

∑(𝑋𝑖 − 𝑋̅)𝑓𝑖 = 0
𝑖=1

b) La media aritmética de una constante es igual a la constante.


𝑀(𝐾) = 𝐾

c) La media aritmética de una constante por una variable es igual a la constante por
la media aritmética de la variable.
𝑀(𝑋𝐾) = 𝐾 𝑀(𝑋)
d) La media aritmética de una variable más(menos) una constante es igual a la media
aritmética de la variable más(menos) la constante.
𝑀(𝑋 ± 𝐾) = 𝑀(𝑋) ± 𝐾
𝑀(𝑎𝑋 ± 𝑏) = 𝑎𝑀(𝑋) ± 𝑏

e) La media aritmética de una suma de variables, es igual a la suma de las medias


aritméticas de cada una de las variables.
𝑀(𝑋 + 𝑌 − 𝑍) = 𝑀(𝑋) + 𝑀(𝑌) − 𝑀(𝑍)

f) La suma de los cuadrados de las desviaciones de cada uno de los datos respecto a
su media aritmética es mínima (Teorema de Köning).

Para datos no agrupados:


𝑛 𝑛

∑(𝑋𝑖 − 𝑋̅)2 ≤ ∑(𝑋𝑖 − 𝑎)2


𝑖=1 𝑖=1

Para datos agrupados:


𝑚 𝑚
̅ )2
∑(𝑋𝑖 − 𝑋 𝑓𝑖 ≤ ∑(𝑋𝑖 − 𝑎)2 𝑓𝑖
𝑖=1 𝑖=1

Ventajas
❖ Es un concepto muy familiar para la mayoría de las personas e intuitivamente
claro y usada muy a menudo.
❖ Es una medida que puede ser calculada y es única. Pues cada conjunto de datos
tiene una y sola una media aritmética.
❖ Para calcular su valor se usa todos los valores de los datos en estudio.
❖ Es una medida bastante representativa del conjunto de datos.
❖ En una gráfica de frecuencias representa el centro de gravedad
❖ Es sensible a cualquier cambio en los datos (puede ser usado como un detector de
variaciones en los datos).

Desventajas
❖ Se ve afectado por los valores extremos o aislados del conjunto de datos en
estudio, por lo que no es recomendable usarlo en distribuciones muy sesgadas.
❖ Su cálculo es tedioso, porque se usan todos los valores.
❖ No se puede calcular la media aritmética para datos agrupados, cuyos intervalos
de clase en los extremos son abiertos.
❖ Si se emplean variables discretas o cualitativas, la media aritmética puede no
pertenecer al conjunto de valores de la variable.

Media Aritmética Ponderada


En muchos casos el valor de un dato de una variable puede no tener el mismo peso que el
de los demás, por lo que es necesario ponderarlo, asignando a cada uno de ellos pesos de
acuerdo a su importancia. La media aritmética obtenida así, se llama media aritmética
ponderada y su valor se obtiene usando la siguiente expresión:

∑𝑟𝑖=1 𝑋𝑖 𝑤𝑖
𝑋̅ =
∑𝑟𝑖=1 𝑤𝑖

Dónde:

𝑤 = es la ponderación de X

Ejemplo:

Un alumno de 1 eso de un instituto ha sacado las siguientes notas en la asignatura de


matemáticas: un 7 en el examen parcial que cuenta 30%, un 9 en el trabajo en grupo que
vale un 20%, un 6 en los ejercicios entregados en clase con una ponderación del 10%, y
un 8 en el examen final que tiene un peso del 40%. ¿Cuál es su nota final de la asignatura?

Para determinar la nota del alumno debemos hallar la media ponderada con los valores
que nos da el enunciado.

Para ello, aplicamos la fórmula de la media ponderada:


(7 × 0.3) + (9 × 0.2) + (6 × 0.1) + (8 × 0.4)
̅̅̅
𝑥𝑝 =
0.3 + 0.2 + 0.1 + 0.4

𝑥𝑝 = 7.7
̅̅̅

De modo que la nota final de matemáticas de este alumno será 7,7 porque es el resultado
que se obtiene de la media ponderada.

Casos Especiales
a) La media aritmética para datos agrupados, es una forma particular de la media
aritmética ponderada, pues:
Si:

𝑤𝑖 = 𝑓𝑖 𝑟=𝑚 ∑ 𝑓𝑖 = 𝑛
𝑖=1

∑𝑟𝑖=1 𝑋𝑖 𝑤𝑖 ∑𝑚
𝑖=1 𝑋𝑖 𝑓𝑖 ∑𝑚
𝑖=1 𝑋𝑖 𝑓𝑖
𝑋̅ = = =
∑𝑟𝑖=1 𝑤𝑖 ∑𝑚
𝑖=1 𝑓𝑖 𝑛

b) La media aritmética ponderada, también se puede obtener usando las frecuencias


relativas simples, pues:
Si:
𝑓𝑖
ℎ𝑖 = 𝑤𝑖 = ℎ𝑖 𝑟=𝑚 ∑ ℎ𝑖 = 1
𝑛
𝑖=1
𝑚
∑𝑟𝑖=1 𝑋𝑖 𝑤𝑖 ∑𝑚
𝑖=1 𝑋𝑖 ℎ𝑖 ∑𝑚
𝑖=1 𝑋𝑖 ℎ𝑖
𝑋̅ = 𝑟 = 𝑚 = = ∑ 𝑋𝑖 ℎ𝑖
∑𝑖=1 𝑤𝑖 ∑𝑖=1 ℎ𝑖 1
𝑖=1

c) La media aritmética ponderada también sirve para obtener el promedio de


promedios:
Si:

𝑋𝑖 = 𝑋̅𝑖 𝑤𝑖 = 𝑓𝑖 ∑ 𝑓𝑖 = 𝑛
𝑖=1
𝑟 𝑟
∑𝑟𝑖=1 𝑋𝑖 𝑤𝑖 ∑𝑖=1 𝑋̅𝑖 𝑓𝑖 ∑𝑖=1 𝑋̅𝑖 𝑓𝑖
𝑋̅ = 𝑟 = =
∑𝑖=1 𝑤𝑖 ∑𝑟𝑖=1 𝑓𝑖 𝑛
MEDIA GEOMÉTRICA “Mg”

Se le representa por Mg. La media geométrica, es la raíz n-ésima del producto de los n
valores de los datos en estudio. Se usa como promedio de series geométricas y en ciertos
casos especiales como el índice de precios, tasas de crecimiento poblacional, tasas de
interés bancario, etc. Se puede presentar de dos formas, a saber:

1. Media geométrica para datos no agrupados


𝑀𝑔 = 𝑛√𝑋1 𝑋2 𝑋3 … 𝑋𝑛

𝑛 𝑛
𝑀𝑔 = √∏ 𝑋𝑖
𝑖=1

∑𝑛𝑖=1 𝑛𝑖 log 𝑋𝑖
𝑀𝑔 = 𝐴𝑛𝑡ⅈ log [ ]
𝑛

2. Media Geométrica para datos agrupados


Se llama también Media Geométrica Ponderada, es la raíz n-ésima del producto
de las marcas de clase elevadas a sus respectivas frecuencias absolutas.

𝑛
𝑀𝑔 = √𝑋1 𝑛1 𝑋2 𝑛2 𝑋3 𝑛3 … 𝑋𝑚 𝑛𝑚

𝑛 𝑚
𝑀𝑔 = √∏ 𝑋𝑖 𝑛𝑖
𝑖=1

∑𝑚
𝑖=1 𝑛𝑖 log 𝑋𝑖
𝑀𝑔 = 𝐴𝑛𝑡ⅈ log [ ]
𝑛

Ejemplo:

Se conocen los resultados económicos de una empresa de los últimos cinco años. El
primer año la empresa generó un 10% de rentabilidad económica, el segundo año el
beneficio llegó al 23%, en el tercer año el dinero ganado fue del 16%, el cuarto año logró
un 7% de rentabilidad económica y la inversión del quintó año supuso una rentabilidad
del 20%. Se pide calcular el promedio de todos los porcentajes.
Como hemos visto, para calcular el promedio de porcentajes no debes utilizar la media
aritmética, sino que tenemos que hacer el cálculo con la media geométrica.

Por lo tanto, aplicamos la fórmula de la media geométrica:

5
𝑀𝑔 = √(1.1)(1.23)(1.16)(1.07)(1.2)

𝑀𝑔 = 1.15

𝑀𝑔 = 15%

Desventajas
• Su cálculo es muy engorroso.
• Está limitado sólo para valores positivos, si hay algún valor negativo, entonces el
resultado podría ser imaginario.
• Si uno o más valores son iguales a cero, la Mg es cero.

Propiedades
• Si todos los valores de los datos son iguales a una cantidad determinada
(constante), la Mg es igual a esa cantidad determinada.
• La media geométrica de dos series de datos, es igual al producto de sus medias
geométricas.
• La media geométrica de un conjunto de datos es siempre menor o igual a la media
aritmética. 𝑀𝑔 ≤ 𝑋

MEDIA ARMÓNICA “Mh”

Se le representa por Mh. La media armónica es el recíproco de la media aritmética del


recíproco de los datos. Se usa para obtener el promedio en series armónicas, y en casos
especiales como para obtener el promedio de velocidades, productividad en tiempos
dados o de datos inversamente proporcionales. Se presentan dos casos, a saber:
✓ Media Armónica para datos no agrupados
𝑛
𝑀ℎ = 𝑛
1

𝑥
𝑖=1 𝑖

✓ Media Armónica para datos agrupados


Se le llama también media armónica ponderada, es el recíproco de la media
aritmética de la división de cada frecuencia absoluta entre su respectiva marca de
clase.

𝑛
𝑀ℎ = 𝑚
𝑛𝑖

𝑖=1 𝑥𝑖

Ejemplos:

Una persona compra acciones de una empresa cada año durante 5 años seguidos. Durante
este periodo el precio de las acciones ha fluctuado bastante: el primero año valía 7€ cada
acción, el segundo año 10€, el tercer año 15€, el cuarto año la empresa tuvo grandes
pérdidas económicas y el precio bajó hasta los 6€ por acción y, finalmente, el quinto año
la compañía hizo una fuerte inversión que provocó un aumento del precio hasta los 11€.
¿Cuál ha sido el precio medio de compra de las acciones?

5
𝑀ℎ =
1 1 1 1 1
+ + + +
7 10 15 6 11

𝑀ℎ = 8.82

Propiedad
La media armónica para datos positivos, es siempre menor o igual que la media
geométrica. Por consiguiente, se presenta la siguiente desigualdad:

𝑀ℎ ≤ 𝑀𝑔 ≤ 𝑀(𝑋)
Desventaja
Cuando por lo menos un valor del conjunto de datos en estudio es cero, la media armónica
para ese conjunto no está definida.

MEDIA CUADRÁTICA “Mc(X)”


Es una medida poco usada y viene a ser la raíz cuadrada de la media aritmética de los
cuadrados de los valores de los datos en estudio. Se puede presentar de dos formas, a
saber:

✓ Media Cuadrática para datos no agrupados


𝑛
∑𝑖=1 𝑋𝑖2
𝑀𝑐(𝑋) = √
𝑛

Donde 𝑋𝑖 es el valor de cada dato.

✓ Media Cuadrática para datos no agrupados


𝑚
∑𝑖=1 𝑋𝑖2 𝑓𝑖
𝑀𝑐(𝑋) = √
𝑛

Donde 𝑋𝑖 es la marca de clase y 𝑓𝑖 es su frecuencia absoluta correspondiente.

Propiedad
La media cuadrática es siempre mayor o igual a la media aritmética

𝑀(𝑋) ≤ 𝑀𝑐(𝑋)

𝑀ℎ ≤ 𝑀𝑔 ≤ 𝑀(𝑋) ≤ 𝑀𝑐(𝑋)

Ejemplo
En una clase de laboratorio de la universidad, el profesor pide hacer un experimento con
sustancias químicas a sus alumnos. El objetivo del experimento químico es conseguir una
disolución de 3 litros en total. Los grupos de alumnos han obtenido los siguientes datos:
(0.94)2 + (−0.42)2 + (0.51)2 + (1.29)2 + (−0.95)2
𝑀𝑐(𝑋) = √
5

𝑀𝑐(𝑋) = 0.88

MEDIANA “Me”

Cuando la media aritmética es un promedio no representativo de los datos en estudio, por


haber sido afectado o distorsionado por lo valores extremos del conjunto de datos, se tiene
que usar otro tipo de promedios y este en primer lugar es la mediana, que viene a ser el
valor que se encuentra en la parte central de una serie ordenada de datos, por lo que se le
puede definir como: el valor que tiene la propiedad de que el número de datos menores
que él, es igual al número de datos mayores que él; por lo tanto, es el valor que divide a
la distribución en dos partes iguales, 50% para cada parte. 50% de datos menores y 50%
de datos mayores. El valor se obtiene teniendo en cuenta lo siguiente:

✓ Para datos no agrupados


El primer paso es ordenar los datos en orden creciente o decreciente.

▪ Si el número de datos es impar.

La mediana es el valor del dato que se encuentra exactamente en la parte central.

𝑥1 + 1
𝑀𝑒 =
2

Ejemplo:

Calcular la mediana de los siguientes datos: 11, 6, 7, 7, 4.

Para solucionar esto primero ordenamos los datos de menor a mayor: 4, 6, 7, 7,


11.

Ahora tomamos el dato que se encuentra al centro: 4, 6, 7, 7, 11.

El valor de la mediana es:

Me = 7.
✓ Para datos agrupados
En este caso se usa el cuadro de distribución de frecuencias, aplicando la siguiente
fórmula:

Usando las frecuencias absolutas.

𝑛
− 𝐹𝑖−1
1
𝑀𝑒 = 𝑌𝑖−1 + 𝐶𝑖 [2 ]
𝑓𝑖

Donde:

1
𝑌𝑖−1 : Límite inferior de la clase de la mediana.

𝐶𝑖 : Amplitud de la clase de la mediana.

𝐹𝑖−1 : Frecuencia absoluta acumulada anterior a la clase de la mediana.

𝑓𝑖 : Frecuencia absoluta simple de la clase de la mediana.

𝑛: Número de datos en estudio.

Propiedades
La suma de las desviaciones absolutas de los valores de los datos con respecto a la
mediana es mínima. Es decir, es menor que la suma de las desviaciones absolutas con
relación a cualquier otro valor de la distribución.

✓ Es mínimo, para datos no agrupados:


𝑛

∑|𝑋𝑖 − 𝑀𝑒 |
𝑖=1

✓ Es mínimo, para datos agrupados:


𝑚

∑|𝑋𝑖 − 𝑀𝑒 |𝑓𝑖
𝑖=1

✓ Donde a es cualquier valor:


𝑛 𝑛

∑|𝑋𝑖 − 𝑀𝑒 | ≤ ∑|𝑋𝑖 − 𝑎|
𝑖=1 𝑖=1
✓ Donde a es cualquier valor:
𝑚 𝑚

∑|𝑋𝑖 − 𝑀𝑒 |𝑓𝑖 ≤ ∑|𝑋𝑖 − 𝑎|𝑓𝑖


𝑖=1 𝑖=1

Ventajas
✓ El cálculo de su valor es bastante sencillo sobre todo si los datos no están
agrupados.
✓ No es necesario que todos los intervalos sean cerrados o semiabiertos, para
calcular su valor. Los extremos pueden ser intervalos abiertos, salvo en que el
intervalo de la clase de la mediana sea uno de ellos.
✓ La mediana no es afectada por valores extremos.
✓ No se usan todos los valores para calcular su valor.

Desventajas
• No se puede calcular la mediana para variables cualitativas con escala de medición
nominal, salvo que sea ordinal.
• No se pueden hacer operaciones algebraicas.
• La mediana para valores.

MODA “Mo”

En toda distribución de datos estadísticos, salvo en raras excepciones existen datos,


categorías o intervalos en los que la incidencia es más acentuada; esto indica que hay
valores o categorías, si así se les quiere llamar, con mayor preferencia que los demás, en
otros casos no puede ser la preferencia, sino la regularidad de los datos por tomar un
determinado valor o categoría. En consecuencia, llamaremos moda o modo, al valor de la
distribución que se repite con mayor frecuencia; es decir, a la posición de mayor densidad
o al valor más común o predominante.

En un conjunto de datos, la moda puede no existir, por no existir ningún dato que se repita
más veces que los demás; por lo tanto, la distribución se llama uniforme. Si el conjunto
de datos tiene una sola moda, a la distribución se le llama unimodal. Si tiene dos o más
modas, la distribución toma el nombre de multimodal, pudiendo ser bimodal, trimodal,
etc.

✓ Moda para datos no agrupados


En este caso la moda se obtiene sólo por conteo.

Ejemplo N° 01:

Calcula la moda del siguiente conjunto de datos:

8 7 0 6 10 9 13 8 0 6 2 6 5 11 10 0 9 8 6 12 3 5 11 1 4 8 10 2 5 7

Primero ponemos los números en orden:

0 0 0 1 2 2 3 4 5 5 5 6 6 6 6 7 7 8 8 8 8 9 9 10 10 10 11 11 12 13

Como puedes comprobar, el número 6 y el número 8 aparecen un total de cuatro


veces, el máximo número de repeticiones. Por lo tanto, en este caso se trata de una
moda bimodal y ambos números son la moda del conjunto de datos:

Mo = {6; 8}

✓ Moda Para datos agrupados.


En este caso la moda se obtiene usando una fórmula, que resulta de la
interpolación de las frecuencias adyacentes a la frecuencia simple de mayor valor.
La fórmula es el siguiente:

1
𝛥1
𝑀𝑒 = 𝑌𝑖−1 + 𝐶𝑖 [ ]
𝛥1 + 𝛥2

Donde:

𝛥1 = 𝑓𝑖 − 𝑓𝑖−1 𝑜 ℎ𝑖 − ℎ𝑖−1
𝛥2 = 𝑓𝑖 − 𝑓𝑖+1 𝑜 ℎ𝑖 − ℎ𝑖+1

1
𝑌𝑖−1 : Límite inferior de la clase modal.

𝐶𝑖 : Amplitud de la clase modal.

𝑓𝑖 : Frecuencia absoluta simple de mayor valor.


ℎ𝑖 : Frecuencia relativa simple de mayor valor.

Ejemplo 1:

Calcular la moda de una distribución estadística que viene dada por la siguiente
tabla:

Intervalo Frecuencia Absoluta (hi)


[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
[10,15) 10 2
𝑛 = 60

En primer lugar, buscamos el intervalo donde se encuentra la moda, que será el


intervalo que tenga la mayor frecuencia absoluta (𝑓ⅈ), la cual es 10. Entonces:

La clase modal es [5, 7)

Aplicaremos la fórmula para el cálculo de la moda para datos agrupados,


extrayendo los siguientes datos:

´
𝑌𝑖−1 =5

𝛥1 = 3

𝐶ⅈ = 3

𝑓ⅈ = 6

Reemplazando en la fórmula:

(10 − 3)
𝑀𝑜 = 5 + ×3
(10 − 3) + (10 − 6)

𝑀𝑜 = 6.27
Ejemplo 2:

El histograma de la distribución correspondiente al peso de 100 alumnos de


Bachillerato es el siguiente:

En primer lugar, buscamos el intervalo donde se encuentra la moda, que será el


intervalo que tenga la mayor frecuencia absoluta (𝑓𝑖 ), la cual es 42. Entonces:

La clase modal es [66, 69)

Aplicaremos la fórmula para el cálculo de la moda para datos agrupados,


extrayendo los siguientes datos:

´
𝑌𝑖−1 = 42

𝛥1 = 18

𝐶ⅈ = 3

𝑓ⅈ = 27

Reemplazando en la fórmula:

(42 − 18)
𝑀𝑜 = 66 + ×3
(42 − 18) + (12 − 27)

𝑀𝑜 = 67.846
Ventajas
✓ La moda se puede usar como un punto de localización tanto para datos cualitativos
como cuantitativos.
✓ La moda no es afectada por valores extremos.
✓ La moda puede calcularse aun cuando uno o los dos intervalos de los extremos
sean abiertos.

Desventajas
✓ La moda puede no existir y si existe puede haber dos o más modas, por lo que su
interpretación no es sencilla.
✓ La moda no se presta a manipulaciones algebraicas.

FRACTILES
Son estadígrafos de posición, se les conoce también como cuartiles. Son medidas que
dividen a la distribución en tantas partes como se requiera para la descripción de los
mismos. Entre ellos los más conocidos son: los Cuartiles, los Deciles y los Percentiles o
Centiles.

1) CUARTILES (QJ)
Son los que dividen a la distribución en cuatro partes iguales, de tal manera que,
cada parte contiene un 25% de los datos debidamente ordenados en forma
ascendente.

a) Primer Cuartil (Q1):


Es el valor que supera a no más de un cuarto de las observaciones y es
superado por no más de las tres cuartas partes de ellas; es decir, es el valor que
separa el 25% de las observaciones menores o iguales a él y al 75% de las
observaciones superiores a él.

b) Segundo Cuartil (Q2 = Me):


Es lo mismo que la mediana.
c) Tercer Cuartil (Q3):
Es el valor que supera a no más de las tres cuartas partes de las observaciones
y es superado por no más de una cuarta parte de ellas; es decir es el valor que
separa al 75% de las observaciones menores que él y al 25% de las
observaciones mayores que él.

d) Cuarto Cuartil (Q4 = LS)


Abarca el 100% de los datos.

Q1 Me Q3 Q4

LI ¡----------------¡---------------------¡-------------------¡-------------------¡LS

25% 25% 25% 25%

i) Q1 para datos no agrupados


Cuando los datos no están en un cuadro de distribución de frecuencias, en primer
lugar se ordenan los datos en forma ascendente, luego se obtiene (n+1)/4 que es
el punto de posición donde debe estar ubicado Q1. Si este valor es entero, entonces
el Q1 es el valor del dato que se encuentra en ese lugar. Si el valor de (n+1)/4 no
es un entero, entonces hacemos una interpolación lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentra la fracción.

Ejemplo:

Al examinar una muestra de 7 facturas de una empresa de luz, se nota que se ha


pagado montos diferentes en miles de dólares para un solo bien a diferentes
lugares, los mismos son los siguientes:4, 3, 5,6, 7,1, 11. Determine Q1.

Se ordenan los datos.

1, 3, 4, 5, 6, 7, 11

Como n = 7, entonces:

𝑛+1
𝑄1 =
4
7+1
𝑄1 =
4

𝑄1 = 2

En consecuencia, Q1 es el segundo valor; es decir, 3.

ii) Q3 para datos no agrupados.


Cuando los datos no están en un cuadro de distribución de frecuencias, en primer
lugar, se ordenan los datos en forma ascendente, luego se obtiene 3(n+1) /4 que
es el punto de posición donde debe estar ubicado Q3. Si este valor es entero,
entonces el Q3es el valor del dato que se encuentra en esa posición. Si el valor de
3(𝑛+1)
no es un entero, entonces hacemos una interpolación lineal entre los dos
4

valores correspondientes a las dos observaciones entre las cuales se encuentra la


fracción.

Ejemplo 1:

Determinar Q3

23, 25, 27, 28, 29, 30, 31, 32, 32, 33, 35, 35,36,37

Como n = 14, entonces:

3(𝑛 + 1)
𝑄3 =
4

3(14 + 1)
𝑄3 =
4

𝑄3 = 11.25

Esto significa que el Q3es el onceavo dato más el 75% de la diferencia entre los
valores de las observaciones onceavo y doceava luego:

𝑄3 = 35 + (35 − 35)(0.75)

𝑄3 = 35 𝑠𝑜𝑙𝑒𝑠
iii) Cuartiles para datos agrupados.
En este caso se usará la siguiente fórmula:

𝑗𝑛
− 𝐹ⅈ − 1
𝑄𝑗 = ′
𝑌𝑖−1 + 𝐶𝑖 [ 4 ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎𝑠)
𝑓ⅈ

𝑗
− 𝐻ⅈ − 1

𝑄𝑗 = 𝑌𝑖−1 + 𝐶𝑖 [4 ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑟𝑒𝑙𝑎𝑡ⅈ𝑣𝑎𝑠)
ℎⅈ

∀𝑗 = 1,2,3,4

Ejemplos:

Calcular los cuartiles de la distribución de la tabla

𝑓ⅈ 𝐹ⅈ
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65

iv) Cálculo del primer cuartil


Buscamos el intervalo donde se encuentre el primer cuartil multiplicando 1 por n
= 65 y dividirlo por 4.

65
1× = 16.25
4

Después buscamos en la columna de frecuencia acumulada el intervalo que


contiene a 16.25: la clase de 𝑄1 𝑒𝑠 [60, 70)

Datos:


𝑌𝑖−1 = 60
𝐹ⅈ − 1 = 8

𝑓ⅈ = 10

𝐶𝑖 = 10

16.25 − 8
𝑄1 = 60 + 10 [ ] = 68.25
10

v) Cálculo del segundo cuartil


Buscamos el intervalo donde se encuentre el segundo cuartil multiplicando 2 por
n = 65 y dividirlo por 4.

65
2× = 32.25
4

Después buscamos en la columna de frecuencia acumulada el intervalo que


contiene a 32.25: la clase de 𝑄2 𝑒𝑠 [70, 80)

Datos:


𝑌𝑖−1 = 70

𝐹ⅈ − 1 = 18

𝑓ⅈ = 16

𝐶𝑖 = 10

32.25 − 18
𝑄1 = 670 + 10 [ ]
16

𝑄1 = 79.0625

vi) Cálculo del tercer cuartil


Buscamos el intervalo donde se encuentre el tercer cuartil multiplicando 3 por n
= 65 y dividirlo por 4.

65
3∗ = 48.75
4
Después buscamos en la columna de frecuencia acumulada el intervalo que
contiene a 48.75: la clase de 𝑄3 𝑒𝑠 [90, 100)

Datos:


𝑌𝑖−1 = 90

𝐹ⅈ − 1 = 48

𝑓ⅈ = 10

𝐶𝑖 = 10

48.75 − 48
𝑄3 = 90 + 10 [ ] = 90.75
10

2) DECILES (DJ)
Son las medidas que dividen a la distribución en 10 partes iguales, de tal manera
que cada parte contiene el 10% de las observaciones o datos.

El cálculo de los deciles para datos no agrupados, es similar a la de los cuartiles;


es decir, en primer lugar, se ordenan los datos en forma ascendente, pero son muy
poco usados, por lo que no se ahondará como en el caso de los cuartiles. En
cambio, para el cálculo de los deciles cuando los datos están agrupados se usa la
siguiente fórmula.

𝑗𝑛
10 − 𝐹ⅈ − 1

𝐷𝑗 = 𝑌𝑖−1 + 𝐶𝑖 [ ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎𝑠)
𝑓ⅈ

𝑗
− 𝐻ⅈ − 1

𝐷𝑗 = 𝑌𝑖−1 + 𝐶𝑖 [10 ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑟𝑒𝑙𝑎𝑡ⅈ𝑣𝑎𝑠)
ℎⅈ

Ejemplo:

Calcular los deciles de la distribución de la tabla:


𝑓ⅈ 𝐹ⅈ
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65

i) Cálculo del primer decil


Buscamos el intervalo donde se encuentre el primer decil multiplicando 1 por n =
65 y dividirlo por 10.

65
1× = 6.5
10

Después buscamos en la columna de frecuencia acumulada el intervalo que


contiene a 6.5: la clase de 𝐷1 𝑒𝑠 [50, 60)

Datos:


𝑌𝑖−1 = 50

𝐹ⅈ − 1 = 0

𝑓ⅈ = 8

𝐶𝑖 = 10

6.5 − 0
𝑄3 = 50 + 10 [ ] = 58.12
8

ii) Cálculo del tercer decil


Buscamos el intervalo donde se encuentre el tercer decil multiplicando 3 por n =
65 y dividirlo por 10.

65
3× = 19.5
10
Después buscamos en la columna de frecuencia acumulada el intervalo que
contiene a 19.5: la clase de 𝐷3 𝑒𝑠 [70, 80)

Datos:


𝑌𝑖−1 = 70

𝐹ⅈ − 1 = 18

𝑓ⅈ = 16

𝐶𝑖 = 10

19.5 − 18
𝑄3 = 70 + 10 [ ] = 70.94
16

iii) Cálculo del noveno decil


Buscamos el intervalo donde se encuentre el noveno decil multiplicando 9 por n
= 65 y dividirlo por 10

65
9× = 58.5
10

Después buscamos en la columna de frecuencia acumulada el intervalo que


contiene a 58.5: la clase de 𝐷9 𝑒𝑠 [100, 110)

Datos:


𝑌𝑖−1 = 100

𝐹ⅈ − 1 = 58

𝑓ⅈ = 5

𝐶𝑖 = 10

58.5 − 58
𝑄3 = 100 + 10 [ ] = 101
5

3) PERCENTILES (PJ)
Se les llama también centiles. Son las medidas que dividen a la distribución en
100 partes iguales, de tal manera que cada parte contiene el uno por ciento de los
datos. Estas medidas incluyen a los cuartiles y a los deciles, e incluso a los
quintiles. Los percentiles para datos no agrupados son calculados de igual manera
que para los cuartiles, pero como no son muy usados no se les analizará por ahora.

En cambio, para datos agrupados, los valores se calculan usando la siguiente


fórmula, que es similar a los ya usados para la mediana, los cuartiles y los deciles.

Pj indica que el j% de los datos están incluidos hasta este punto; en otras palabras,
Pj es el valor máximo del j% de los datos.

𝑗𝑛
− 𝐹ⅈ − 1
𝑃𝑗 = ′
𝑌𝑖−1 + 𝐶𝑖 [ 100 ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎𝑠)
𝑓ⅈ

𝑗
− 𝐻ⅈ − 1

𝑃𝑗 = 𝑌𝑖−1 + 𝐶𝑖 [ 100 ] (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐ⅈ𝑎𝑠 𝑟𝑒𝑙𝑎𝑡ⅈ𝑣𝑎𝑠)
ℎⅈ

𝑃50 = 𝐷5 = 𝑄2 = 𝑀𝑒 𝑃100 = 𝐷19 = 𝑄4 = 𝐿𝑆

Ejemplo:

Calcular los percentiles de la distribución de la tabla

𝑓ⅈ 𝐹ⅈ
[10, 15) 10 10
[15, 20) 12 22
[20, 25) 6 28
[25, 30) 8 36
[30, 35) 9 45
[35, 40) 11 56
[40, 45) 13 69
n=69

i) Cálculo del 35 percentil


Buscamos el intervalo donde se encuentre el 35 percentil multiplicando 35 por n
= 69 y dividirlo por 100.

69
35 × = 24.15
100
Después buscamos en la columna de frecuencia acumulada el intervalo que
contiene a 24.15: la clase de 𝑃35 𝑒𝑠 [20, 25)

Datos:


𝑌𝑖−1 = 20

𝐹ⅈ − 1 = 22

𝑓ⅈ = 6

𝐶𝑖 = 5

24.15 − 22
𝑄3 = 20 + 5 [ ] = 21.79
6

ii) Cálculo del 45 percentil


Buscamos el intervalo donde se encuentre el 45 percentil multiplicando 45 por n
= 69 y dividirlo por 100.

69
45 × = 31.05
100

Después buscamos en la columna de frecuencia acumulada el intervalo que


contiene a 31.05: la clase de 𝑃45 𝑒𝑠 [25, 30)

Datos:


𝑌𝑖−1 = 25

𝐹ⅈ − 1 = 28

𝑓ⅈ = 8

𝐶𝑖 = 5

31.05 − 28
𝑄3 = 25 + 5 [ ] = 26.90625
8
iii) Cálculo del 95 percentil
Buscamos el intervalo donde se encuentre el 95 percentil multiplicando 95 por n
= 69 y dividirlo por 100.

69
95 ∗ = 65.55
100

Después buscamos en la columna de frecuencia acumulada el intervalo que


contiene a 65.55: la clase de 𝑃95 𝑒𝑠 [40, 45)

Datos:


𝑌𝑖−1 = 40

𝐹ⅈ − 1 = 56

𝑓ⅈ = 13

𝐶𝑖 = 5

65.55 − 56
𝑄3 = 40 + 5 [ ] = 43.67
13

Capítulo 6

MEDIDAS DE DISPERSIÓN
Ninguna de las medidas de tendencia central o localización es suficiente, por si sola, para
describir a la distribución de un conjunto de datos; pues, a pesar de que dos conjuntos de
datos puedan tener la misma media; sin embargo, esto no implica que sean idénticos, ya
que sus datos pueden ser homogéneos o heterogéneos.

Las medidas de tendencia central tienen como objetivo el de sintetizar los datos en un
valor representativo, alrededor del cual se concentran o centralizan los datos; sin
embargo, los datos no necesariamente se agrupan o concentran alrededor de este punto,
sino que pueden dispersarse de este punto, en algunos casos más que en otros, a las
medidas que indican este grado de concentración o dispersión se les llamará medidas de
dispersión. Estas medidas de dispersión nos dirán hasta qué punto estas medidas de
tendencia central son representativas como síntesis de la información. Las medidas de
dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
distribución respecto al valor central determinado.

Al igual que sucede con cualquier conjunto de datos, las medidas de tendencia central
sólo nos revelan una parte de la información que necesitamos acerca de las características
de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir
también su dispersión, extensión o variabilidad.

Conocer la dispersión es importante porque:

• Nos proporciona información adicional que permite juzgar la confiabilidad de la


medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la
posición central es menos representativa de los datos.
• Cuando la dispersión es grande es necesario escoger una muestra de tamaño
mayor a que si la dispersión fuera pequeña.
• Cuando existen problemas característicos para datos ampliamente dispersos,
debemos ser capaces de distinguir que presentan esa dispersión antes de abordar
esos problemas.
• Cuando se desee comparar las dispersiones de diferentes muestras. Si no se desea
tener una amplia dispersión de valores con respecto al centro de distribución y si
este presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y
evitar escoger distribuciones que tengan las dispersiones más grandes.

Pero debemos tener presente que de todas maneras hay dispersión en la mayoría de los
datos, por lo que debemos estar en capacidad de describirla. Ya que la dispersión ocurre
frecuentemente y su grado de variabilidad es importante conocerlo.

Los datos pueden tener la misma magnitud; es decir, pueden ser constantes o no tener
variabilidad, pueden variar moderadamente e incluso pueden ser muy dispersos unos de
otros o respecto a un valor central, y de acuerdo a ese grado de variabilidad una medida
de tendencia central o posición tiene representatividad o deja de tenerlo.

A. Tipos
Hay dos tipos de medidas de dispersión. A saber:
✓ Absolutas
Son las que vienen expresadas en las mismas unidades de medida de la variable
en estudio, por lo tanto, son afectados por estas unidades y los valores
extremos; dentro de ellas tenemos:

▪ Rango de Variación: R.
▪ Desviación Media: DM(X)
▪ Recorrido Intercuartílico: RIQ(X)
▪ Varianza: V(X)
▪ Desviación Estándar o Típica: Sx

✓ Relativas
Son las que vienen expresadas en términos porcentuales. Por lo tanto, no son
distorsionados por las unidades de medida.

Coeficiente de Variación: CV(X)

a) Rango: R
Cuando se trata de averiguar el grado de variabilidad o dispersión de los datos en
estudio, lo primero que se piensa es en el campo de variación o dominio de los
mismos, esta amplitud o rango de variación es la diferencia del dato de mayor
valor y el dato de menor valor, se le representa por R, es la medida de variabilidad
más fácil de calcular para datos finitos y sin agrupar, el valor se obtiene de la
siguiente forma:

R = Xmáx.- Xmín

Cuando los datos están agrupados, el rango se obtiene restando el límite superior
del último intervalo de clase menos el límite inferior del primer intervalo de clase;
es decir:

R = LS – LI

Cuando el último intervalo de clase no tiene límite superior o cuando el primer


intervalo de clase no tiene límite inferior, entonces es casi imposible obtener el
rango.

Por otro lado, se debe tener en cuenta las siguientes propiedades:


Propiedades del Rango o Recorrido:
• El recorrido es la medida de dispersión más sencilla de calcular e
interpretar puesto que simplemente es la distancia entre los valores
extremos (máximo y mínimo) en una distribución.
• Puesto que el recorrido se basa en los valores extremos, éste tiende a ser
errático. No es extraño que en una distribución de datos económicos o
comerciales se incluya a unos pocos valores en los extremos pequeños o
grandes. Cuando tal cosa sucede, entonces el recorrido solamente mide la
dispersión con respecto a esos valores anormales, ignorando a los demás
valores de la variable.
• La principal desventaja del recorrido es que está influenciado por los
valores extremos, puesto que no cuenta con los demás valores de la
variable. Por tal razón, siempre existe el peligro de que el recorrido ofrezca
una descripción distorsionada de la dispersión.
• En el control de la calidad se hace un uso extenso del recorrido cuando la
distribución a utilizarse no la distorsiona y cuando el ahorro del tiempo al
hacer los cálculos es un factor de importancia.

Ejemplos:

Los siguientes son las edades de 16 alumnos de la UNASAM (8 mujeres y 8


varones)

Varones: 18, 16, 17, 21, 23, 19, 20, 22

Mujeres: 15, 20, 13, 22, 18, 23, 21, 24

Obtenga el promedio y el rango de variación de las edades, para los varones y


mujeres.

Curso Promedio Rango


Hombres 19.5 23-16=7
Mujeres 19.5 24-13=11

Se nota que, aunque en promedio las edades son iguales; sin embargo, las
dispersiones de las edades no son iguales. Las edades de las mujeres son más
variables.
El rango, si bien brinda una primera idea acerca de la homogeneidad de los datos,
tiene el inconveniente de que es distorsionado por lo valores extremos, a veces
único; en estos casos el recorrido indica una variación exagerada, para corregir
este inconveniente se usa el rango intercuartílico, que viene a ser la diferencia
entre el tercer cuartil y el primer cuartil: RIQ = Q3 – Q1; o el recorrido
interdecílico: RID = D9 – D1. En estas medidas no se usan los datos extremos

b) DESVIACIÓN MEDIA: DM(X)


Por los inconvenientes mencionados al describir el rango, se ha pensado en un
promedio de desviaciones de los datos respecto a un punto central, pero si se usa
el promedio aritmético como punto central, este promedio de desviaciones
|𝑋1 − 𝑥̅ | es igual a cero, por una de las propiedades de la media aritmética. Por
lo que se le ha reemplazado por las desviaciones absolutas, en consecuencia, la
desviación media es el promedio de las desviaciones absolutas|𝑋1 − 𝑥̅ | de cada
uno de los datos respecto a su media aritmética. El valor se obtiene usando las
siguientes fórmulas.

∑𝑛𝑖=1|𝑋1 − 𝑥̅ |
𝐷𝑀(𝑋) = 𝑝𝑎𝑟𝑎 𝑑𝑎𝑡𝑜𝑠 𝑛𝑜 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑛
𝑛
∑𝑖=1|𝑥1 − 𝑋̅|𝑓ⅈ
𝐷𝑀(𝑋) = 𝑝𝑎𝑟𝑎 𝑑𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑛

Ejemplos:

Calcular la desviación media de una distribución estadística que viene dada por la
siguiente tabla:

𝑓ⅈ
[10, 15) 3
[15, 20) 5
[20, 25) 7
[25, 30) 4
[30, 35) 2
Para resolver ello primero:

𝑥ⅈ 𝑥ⅈ ∗ 𝑓ⅈ |𝑥1 − 𝑋̅|𝑓ⅈ
[10, 15) 12.5 37.5 27.857
[15, 20) 17.5 87.5 21.429
[20, 25) 22.5 157.5 5
[25, 30) 37.5 110 22.857
[30, 35) 32.5 65 21.429
457.5 98.571

Hallamos la media:

457.5
𝑋̅ = = 21.786
21

Después la desviación media

98.57
𝐷𝑀(𝑋) = = 4.69
21

c) VARIANZA: V(X)

En vista de que la desviación media no tiene en cuenta los signos de las


desviaciones y que el simple promedio de las desviaciones es igual cero, se ha
ideado otra medida, que es el promedio del cuadrado de las desviaciones de los
datos respecto a la media aritmética, que es mucho más manuable que las
desviaciones absolutas. Esta medida es muy usada en la Estadística Inferencial
como el análisis de varianza, por las propiedades que posee. Su valor se obtiene
usando las siguientes fórmulas:

𝑛
∑𝑛𝑖=1 (𝑥𝑖 − 𝑋̅)𝑋̅ 2
𝑉(𝑋) = = ∑ 𝑋𝑖2− 𝑋̅ 𝑝𝑎𝑟𝑎 𝑑𝑎𝑡𝑜𝑠 𝑛𝑜 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑁
𝐿=1

𝑛
∑𝑛𝑖=1 (𝑥𝑖 − 𝑋̅)2 𝑓ⅈ
(𝑋) = = ∑ 𝑋𝑖2𝑓𝑖− 𝑋̅ 𝑝𝑎𝑟𝑎 𝑑𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑁
𝐿=1
Ejemplos

Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su


consulta en el momento de andar por primera vez. Calcular la varianza.

Meses Niños
9 1
10 4
11 9
12 16
13 11
14 8
15 1

Completamos la tabla

Xi fi Xi.fi 𝑥𝑖2 𝑓ⅈ
9 1 9 81
10 4 40 400
11 9 99 1089
12 16 192 2304
13 11 143 1859
14 8 112 1568
15 1 15 225
50 610 7526

7526
𝑉(𝑋) = − 12.2(12.2) = 1.68
50

610
𝑥̅ = = 12.2
50
Propiedades de la varianza:

▪ La varianza de cualquier conjunto de números (valores de los datos), es


siempre un número no negativo, puesto que las diferencias cuadráticas son
siempre números no negativos.

V(X) ≥ 0

▪ La varianza de una constante es igual a cero, esto significa que si una


variable toma un solo valor entonces no existe variación entre ellos y el
valor de la varianza es igual a cero.

V(K) = 0

▪ La varianza del producto de una variable por una constante, es igual al


cuadrado de la constante por la varianza de la variable.

V (XK) = 𝐾 2 V(X)

▪ La varianza de una variable más una constante, es igual a la varianza de la


variable, por cuanto la dispersión no cambia, sino sólo ha sido trasladado
a otro punto.

V(X ±K) = V(X)

V (aX+b) =𝑎2 V(X)

▪ La varianza de una suma o diferencia de variables, es igual a la suma de


las varianzas más o menos el doble de la covarianza.

V(X±Y) = V(X) + V(Y) ± 2 Cov(X,Y)

Si las variables son independientes, entonces Cov (x, y) = 0

▪ Si se tienen k submuestras, niveles o estratos de tamaños ni, tales


que∑𝑛𝑖=1 𝑛𝑖 = 𝑛, 𝑐 , con medias 𝑋̅ y varianzas, entonces la varianza de la
muestra de tamaño n está dado por la siguiente expresión:
𝐾 𝐾
∑𝑖=1(𝑛𝑖 (−1)𝑠𝑖2 ∑𝑖=1 𝑛𝑖 ((𝑥̅ 𝑖 −𝑥̅ )2 )
𝑆2 = =
𝑛−1 𝑛−1

Donde, la primera componente se llama Intravarianza; es decir, la varianza


de cada estrato, y la segunda componente se llama Intervarianza; es decir,
la varianza entre estratos. (Si se quiere usar sólo n, entonces se reemplaza
(n-1) por n y (ni -1) por ni.

Ejemplo:

Calcular la varianza de una distribución estadística que viene dada por la siguiente
tabla.

Xi fi Xi.fi 𝑥𝑖2 𝑓ⅈ
[10, 15) 12.5 3 37.5 468.75
[15, 20) 17.5 5 87.5 1531.25
[20, 25) 22.5 7 157.5 3543.75
[25, 30) 27.5 4 110 3025
[30, 35) 32.5 2 65 2112.5
21 457.5 10681.25

457.5
𝑥̅ = = 21.79
21

10681.25
𝑉(𝑋) = − 21.792 = 33.83
21

d) DESVIACIÓN ESTÁNDAR O TÍPICA: SX

Nuevamente la varianza como medida de dispersión tiene el inconveniente de que


son valores cuadráticos; por lo tanto, como medida descriptiva no es lo adecuado,
en ese sentido, se ha optado por sacarle la raíz cuadrada positiva y tener una
medida que viene expresada en las mismas unidades de medida de la variable, en
consecuencia, la desviación estándar viene a ser la raíz cuadrada positiva de la
varianza.
𝑠𝑥 = √𝑉(𝑥) …. Desviación estándar de la variable X

𝜎…….. Desviación estándar poblacional

S……...Desviación estándar muestral.

La desviación estándar es la medida absoluta más adecuada para hacer una


descripción del grado de dispersión de un conjunto de datos. Posee las mismas
propiedades que la varianza.

Ejemplos:

Un profesor enseña a dos grandes grupos de introducción al marketing y


selecciona aleatoriamente una muestra de calificaciones de los exámenes
realizados por los dos grupos. Halle la desviación estándar de cada muestra:

Grupo 1: 50, 60, 70, 80, 90

Grupo 2: 72, 68, 70, 74, 66

Para solucionar este problema:

Grupo 1:

De acuerdo a los datos del problema tenemos:

xi xi-𝑥̅ (𝑥 − 𝑥̅ )2
50 -20 400
60 -10 100
70 0 0
80 10 100
90 20 400
n=350 n=70 n=1000

Calculamos la desviación estándar muestral


1000
𝑆𝑋 = √ = 15.8114
4

Ejemplo 2:

Calcular la desviación estándar

Xi fi Xi.fi 𝑥𝑖2 𝑓ⅈ
[10, 15) 12.5 3 37.5 468.75
[15, 20) 17.5 5 87.5 1531.25
[20, 25) 22.5 7 157.5 3543.75
[25, 30) 27.5 4 110 3025
[30, 35) 32.5 2 65 2112.5
21 457.5 10681.25
457.5
𝑥̅ = = 21.79
21

10681.25
𝑉(𝑋) = − 21.792 = 33.83
21

Hallamos la desviación estándar

𝑠𝑥 = √33.83

𝑠𝑥 = 5.816

e) COEFICIENTE DE VARIACIÓN: CV(X)

En ciertas ocasiones es necesario contar con una medida de dispersión, sin que
esté influenciado por las unidades de medida de la variable; es decir, un número
puro que sirva para comparar varios conjuntos de datos que usan unidades de
medida diferentes unos de otros, pues cuando están con sus unidades de medida
no es posible tal comparación. En ese sentido se ha ideado varias medidas relativas
dividiendo una medida de dispersión absoluta entre una medida de posición y una
de ellas es el coeficiente de variación, que es el cociente entre la desviación
estándar y la media aritmética, lo que significa el número de veces de la desviación
estándar respecto a la media aritmética. Generalmente se le multiplica por cien
para expresarlo en términos porcentuales. Su valor se obtiene usando la siguiente
expresión:

𝑆𝑥
𝐶𝑉(𝑋) = ∗ 100
𝑥̅

Ejemplo:

Se midieron los pesos, en kg, de un grupo de 6 personas: 45, 62, 38, 55, 48, 52.
Se desea conocer el coeficiente de variación de la variable peso. Se inicia por el
cálculo de la media aritmética y la desviación estándar:

45 + 62 + 38 + 55 + 48 + 52
𝑥̅ = = 50
6

(42 − 50)2 + ⋯ + (52 − 50)2


𝑠𝑥 = √ = 8.32
6−1

Ahora se sustituye en la formula

8.32
𝐶𝑉(𝑋) = ∗ 100 = 16.64%
50

Ejemplo 2:

Se midieron los pesos, en kg, de los 10 empleados en una oficina postal: 85, 62,
88, 55, 98, 52, 75, 70, 76, 77. Se desea conocer el coeficiente de variación de la
variable peso. Se calcula la media aritmética y la desviación estándar:

85 + 62 + ⋯ + 77
𝑥̅ = = 73.80
10

(85 − 73.80)2 + ⋯ + (77 − 73.80)2


𝑠𝑥 = √ = 14.57
10 − 1
Ahora se sustituye en la fórmula:

73.80
𝐶𝑉(𝑋) = ∗ 100 = 19.74%
14.57

Observación:

Las medidas de dispersión son bastante importantes para la determinación del tipo
de distribución que se tiene, especialmente cuando se trata de la medida del
rendimiento de los alumnos, de las inversiones realizadas, de los resultados- de
una investigación científica, etc., en ese sentido es preciso dar algunas
consideraciones que son de importancia para su mejor comprensión e
interpretación, estos son los siguientes:

• Las medidas de dispersión tienen un valor mínimo que es cero, en este


caso todos los datos tienen el mismo valor; es decir, no existe variabilidad
entre los datos, a medida que el valor de la medida de dispersión crece, los
datos se irán siendo más variables.
• Si la medida de dispersión es grande, significa que los datos son bastante
desiguales o dispersos, esto significa que los datos están mezclados entre
los que tienen menor magnitud y los que tienen mayor magnitud, si estos
datos fueran notas entonces tendríamos alumnos de diferente rendimiento.
• Si la medida de dispersión es pequeña significa que los datos son
homogéneos, este tipo de datos son descritos con bastante certeza, si los
datos fueran notas, entonces estaríamos frente a un conjunto de alumnos
con rendimientos parejos.

Capítulo 7

MEDIDAS DE ASIMETRÍA

Las medidas de dispersión sólo indican la magnitud de las variabilidad de los datos, ya
sea en forma absoluta o en forma relativa, pero no indican nada acerca de la dirección
hacia dónde tienden a acentuarse dichas variaciones; para suplir esta deficiencia se
obtienen otras medidas llamadas de asimetría; por tanto, estas deben indicar la existencia
o falta de simetría de la distribución, mostrando la dirección hacia donde se inclina la
distribución, esta asimetría o simetría debe ser respecto a un punto de referencia de la
variable, pudiendo ser la media aritmética. Según su forma las distribuciones pueden ser
de dos formas: simétricas o asimétricas.

❖ Simétricas

Una distribución es simétrica, cuando los datos están distribuidos equitativamente


en ambos lados del centro de la distribución; por lo tanto, la curva resultante del
polígono de frecuencias suavizado, es semejante al de la curva normal (forma
acampanada), en consecuencia, la media aritmética y la mediana coinciden, la
moda coincidirá con estas medidas si la distribución es unimodal

❖ Asimétricas.

Una distribución es asimétrica, cuando la distribución de los datos no es equitativa


en ambos lados de la distribución, en consecuencia, hay mayor concentración de
los datos es en un lado de la distribución y por ende la media aritmética, la mediana
y la moda son diferentes, esto es: A su vez pueden ser de dos tipos:

 Positivas

Es cuando la acumulación de los datos es mayoritariamente a lado


izquierdo o en la parte inferior y muy suavemente hacia el extremo
superior o derecho de la distribución. En este caso y cuando la distribución
es unimodal, se presenta la siguiente desigualdad:

Mo < Me < 𝑋̅

A este tipo de distribución se les conoce con el nombre de sesgados hacia


la derecha, porque la cola más larga de la distribución se extiende hacia la
derecha o datos con mayor valor.
 Negativas

Es cuando la acumulación de los datos es mayoritariamente a lado derecho


o en la parte superior y muy suavemente hacia el extremo inferior o
izquierdo de la distribución. En este caso y cuando la distribución es
unimodal, se presenta la siguiente desigualdad:

Mo > Me > 𝑋̅

A este tipo de distribución se les conoce con el nombre de sesgados hacia


la izquierda, porque la cola más larga de la distribución se extiende hacia
la izquierda o datos con menor valor.

Si se quiere una visión gráfica de los tres casos, el siguiente es un


indicador, aun cuando, la separación de las medidas no es tanto como se
aprecia.

Coeficiente de Asimetría CS(X)

Las fórmulas para obtener el coeficiente de asimetría son los siguientes:

a) Fórmula de Pearson

𝑥̅ − 𝑀𝑜 ̅̅̅̅̅
3(𝑋 − 𝑀𝑜)
𝐶𝑆(𝑋) = 𝐶𝑆(𝑋) =
𝑠𝑥 𝑠𝑥

b) Fórmula de Bowley

𝑄3 − 2𝑄2 + 𝑄1 𝑃90 − 2𝑃50 + 𝑃10


𝐶𝑆(𝑋) = 𝐶𝑆(𝑋) =
𝑄3 − 𝑄1 𝑃90 − 𝑃10
c) Fórmula de momentos o de Fisher:

𝑀3
𝐶𝑆(𝑋) =
𝑆𝑥3

7𝑛
𝑀3 = ∑𝑛=1(𝑥𝑖 − 𝑋̅)3 /3 para datos no agrupados

7𝑛
𝑀3 = ∑𝑛=1(𝑥𝑖 − 𝑋̅)3 𝑓ⅈ /3 para datos agrupados

𝑆𝑥3 = Es el cubo de la desviación estándar de la variable.

Es última fórmula proporciona una cuantificación más precisa del coeficiente de


sesgo que las demás fórmulas. La interpretación de los valores proporcionados
por estas fórmulas es como sigue:

 Si el CS(X) = 0, entonces la distribución es simétrica.


 Si el CS(X) > 0, entonces la distribución es sesgada hacia la derecha, o
tiene sesgo positivo.
 Si el CS(X) < 0, entonces la distribución es sesgada hacia la izquierda, o
tiene sesgo negativo.

Ejemplo:

Calcula el coeficiente de correlación de Pearson entre las siguientes dos variables


continuas:

Datos ejemplo correlación:

Antes de hacer el cálculo del coeficiente de correlación de Pearson,


representaremos el conjunto de datos en un gráfico de dispersión para analizar la
relación entre las dos variables:

Del diagrama de dispersión se deduce que los datos pueden tener una tendencia
positiva, o dicho de otra forma, cuando una variable aumenta de valor también
aumenta la otra variable. Para comprobar la correlación vamos a hallar el
coeficiente de Pearson.
Lo primero que debemos hacer es encontrar la media aritmética de cada variable
por separado, que es equivalente a la suma total de los datos entre el número de
observaciones.

∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛

53
𝑥̅ =
10

𝑥̅ = 5.3

∑𝑛𝑖=1 𝑦𝑖
𝑦̅ =
𝑛

71
𝑦̅ =
10

𝑦̅ = 7.1

Ahora que ya conocemos el promedio de cada variable, debemos añadir las


siguientes columnas a la tabla de datos:

A partir de los datos calculados en la tabla, determinamos los valores de la


covarianza y de las varianzas (si no recuerdas cómo se hacía tienes dos enlaces
arriba donde se explica detalladamente):

𝑛
∑𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑉𝑎𝑟(𝑋) =
𝑛

44.1
𝑉𝑎𝑟(𝑋) =
10

𝑉𝑎𝑟(𝑋) = 4.41
𝑛
∑𝑖=1(𝑦𝑖 − 𝑦̅)2
𝑉𝑎𝑟(𝑌) =
𝑛

122.9
𝑉𝑎𝑟(𝑌) =
10

𝑉𝑎𝑟(𝑌) = 12.29

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)


𝐶𝑜𝑣(𝑌) =
𝑛

59.7
𝐶𝑜𝑣(𝑋, 𝑌) =
10

𝐶𝑜𝑣(X, 𝑌) = 5.97

Por último, solo nos queda aplicar la fórmula del coeficiente de correlación de
Pearson para obtener su valor:

C𝑜𝑣(𝑋, 𝑌)
𝜌𝑋𝑌 =
√𝑉𝑎𝑟(𝑋) × 𝑉𝑎𝑟(𝑌)

5.97
𝜌𝑋𝑌 =
√4.41 × 12.29

𝜌𝑋𝑌 = 0.81

El coeficiente de correlación de Pearson tiene un valor muy próximo a 1, lo que


significa que estas dos variables tienen una correlación positiva bastante fuerte.

Como has podido ver, para determinar el coeficiente de correlación de Pearson


resulta muy útil usar programas como Excel para hacer los cálculos de las
columnas de manera más rápida.
Capítulo 8

MEDIDAS DE APUNTAMIENTO

Otra característica importante de una distribución de frecuencias es su curtosis, o sea el


grado de apuntamiento vertical o achatamiento que exhibe un polígono de frecuencias,
este grado de apuntamiento, es consecuencia de la concentración de los datos alrededor
de un punto de referencia, mientras más se concentren los datos, mayor será su
apuntamiento y mientras mayor sea la dispersión de los datos respecto a ese punto, más
achatado será su polígono de frecuencias.

La comparación de las distribuciones es teniendo en cuenta a la curva de la distribución


normal, en ese sentido las distribuciones pueden ser de tres tipos:

a) Platicúrtica

Es cuando la forma de la distribución es achatada; esto es, cuando la distribución


de los datos es bastante dispersa alrededor del punto de referencia o valores
centrales. Es menos apuntada que la curva normal y tiene la forma de un plato o
aplanada. (Plati ≈ plano)

b) Mesocúrtica

Es cuando la forma de la distribución es moderada o mesurada; es decir, la


distribución de los datos es mesurada alrededor del punto de referencia o valores
centrales; por lo tanto, el apuntamiento es similar al de la curva normal
correspondiente. (Meso mitad)

c) Leptocúrtica:

Es cuando la concentración de los datos es bastante pronunciada alrededor del


punto de referencia o valores centrales, en consecuencia, la forma de la
distribución es apuntada o levantada; es decir, más pronunciada que la de la curva
normal. (Lepto≈ apuntado)
Ejemplo:

El siguiente cuadro de distribución de frecuencias, corresponde a las notas obtenidas


por 80 alumnos en el curso de Física, determine el tipo de apuntamiento de la
distribución.

Notas Nº de alumnos

4-6 5
6-8 5
8 - 10 15
10 - 12 30
12 - 14 15
14 - 16 5
16 – 18 5
Total 80

Para solucionar este ejemplo primero:

(𝑥𝑖 −
Notas Xi fi Fi Xifi ̅)
(𝑿𝒊 − 𝑿 (𝑥𝑖 − 𝑋̅)2 fi
𝑋̅)4 fi
4-6 5 5 5 25 -6 180 6480
6-8 7 5 10 35 -4 80 1280
8 - 10 9 15 25 135 -2 60 240
10 -
11 30 55 330 0 00 00
12
12 -
13 15 70 195 2 60 240
14
14 -
15 5 75 75 4 80 1280
16
16 – 18 17 5 80 85 6 180 6480
Total 80 880 640 16000
880
𝑋̅ =
80
𝑋̅ = 11

15
𝑀𝑜 = 10 + 2 ( )
15 + 15
𝑀𝑜 = 11

40 − 25
𝑀e = 10 + 2 ( )
30
𝑀e = 11

Por tanto, la distribución es simétrica y unimodal.


20 − 10
𝑄1 = 6 + 2 ( )
15
𝑄1 = 7.33

60 − 55
𝑄1 = 12 + 2 ( )
15
𝑄1 = 12.67

8−5
𝑃10 = 6 + 2 ( )
5
𝑃10 = 7.2

72 − 70
𝑃90 = 12 + 2 ( )
5
𝑃90 = 12.8

640
𝑉(𝑋) =
80
𝑉(𝑋) = 8

𝑆𝑋4 = (8)2
𝑆𝑋4 = 64
16000
𝑀4 =
80
𝑀4 = 200

(12.67 − 7.33)
𝐾=
2(12.8 − 7.2)
5.34
𝐾=
2(5.6)
𝐾 = 0.477 > 0.263

200
𝐾=
64
𝐾 = 3.125 > 3
Entonces la distribución es leptocúrtica.

Capítulo 9

PROBABILIDADES
En la segunda parte del curso hablaremos de cálculo de probabilidades y lo importante
que es en la estadística inferencial, pues sirve para tomar decisiones en estados de
incertidumbre, hacer estimaciones y proyecciones, pruebas de hipótesis, obtener tamaños
de muestra, entre otros temas.

A continuación, vamos a definir algunos términos que nos ayudarán a entender mejor
sobre el cálculo de probabilidades:

▪ PROBABLE
Es un término que es sinónimo de factible, posible, o puede ser; es decir, es algo
que puede suceder o realizarse, pero no está seguro. Ejemplo. Es probable que
apruebe el curso de estadística. Es probable que me infecte con el COVID 19, etc.

▪ INCERTIDUMBRE
Es la falta de certeza para predecir un resultado determinado. En la estadística la
incertidumbre es el resultado de algún fenómeno o proceso de cambio. Sí un
proceso de cambio conduce a dos o más resultados posibles, se dice que los
resultados son inciertos, además un proceso de cambio o fenómeno es considerado
estocástico sí sus resultados son inciertos.

▪ EXPERIMENTO
Es un proceso de cambio, se llama también prueba y viene a ser la realización de
ciertas acciones en condiciones bien determinadas y controladas, en el cual se
observa el fenómeno que se estudia y se espera uno o más resultados; de acuerdo
a ello, el experimento puede ser de dos tipos:

A. EXPERIMENTO DETERMINÍSTICO
Es cuando el proceso de cambio o experimento conduce a un solo resultado,
como los que ocurre en la matemática.
Ejemplo:
• Calcular la distancia recorrida por un vehículo, dado la velocidad y el
tiempo:

e = vt, o el área de un círculo dado la longitud del radio: A = 𝜋 r2
• Si lanzo un balón de futbol al cielo, caerá por efecto de la gravedad.
• Si se lanza una moneda siempre tendremos 2 resultados, cara o sello.
• Saber que si sumamos 8 + 8 el resultado será igual a 16.

B. EXPERIMENTO ALEATORIO
Es cuando el proceso de cambio o experimento conduce a dos o más resultados
y eso implica que cualquier resultado específico no se puede predecir con
certeza antes de realizar el experimento, pero sí es factible conocer el conjunto
de resultados posibles, asimismo se puede repetir en las mismas condiciones.
• Experimento aleatorio es también el proceso de realizar una acción
sobre un fenómeno dado y observar la reacción del fenómeno, pero
cuyos resultados posibles son inciertos.

ESPACIO MUESTRAL
Es el conjunto de resultados posibles o igualmente factibles de un experimento
aleatorio, se le simbolizará como:
Ω = {w1, w2, w3, ………}, también se usa E o S.
(U: conjunto universal en teoría de conjuntos)
Ejemplo 1:
Si se tiene un conjunto de 6 alumnos (a, b, c, d, e, f) de los cuales se quiere
escoger a dos o tres de ellos para realizar un trabajo, determine el espacio
muestral en cada caso: Ω1 = {ab, ac, ad, ae, af, bc, bd, be, bf, cd, ce, cf, de,
df, ef}
Ω2 = {abc, abd, abe, abf, acd, ace, acf, ade, adf, aef, bcd, bce, bcf, bde, bdf,
bef, cde, cdf, cef, def}

Ejemplo 2:

Al lanzar un dado, puede caer cualquiera de sus 6 caras con 1, 2, 3, 4, 5 o 6


puntos, en este caso el espacio muestral sería Ω1= (1, 2, 3, 4, 5, 6).

Ejemplo 3:

Si se lanzan tres monedas al mismo tiempo puede ocurrir cualquiera de 8


resultados posibles, así que el espacio muestral sería: Ω1= (aaa, sss, ass, ssa,
sas, saa, aas, asa)

Ejemplo 4:

Al registrase el sexo de la siguiente persona que nace puede ocurrir que sea
hombre o mujer, así que el espacio muestras sería: Ω1= (H, M)

SUCESO O EVENTO
Es un hecho o acontecimiento que puede ocurrir o no. Es un subconjunto del
espacio muestral, por lo tanto, Ω y Φ también son eventos.

Ejemplo:

• E1 = {OP, OQ, OR, OS} .........empresas


• E2 = {0, 1, 2, 3, 4, 5} ..........inasistencia a clases
• E3 = {t / 10 ≤ t ≤ 20, t e R} ...tiempo de vida en años
• E4 = {cs, ss, sc, ss} ......... lanzar una moneda
• E5 = {12, 15, 13, 18} .........edad de un grupo de personas

i. Suceso elemental
Es cada uno de los resultados posibles o factibles de un experimento
aleatorio.

Ejemplo:

• E1 = {OP}.....................empresas
• E2 = {2} ........................inasistencia a clases
• E3 = {t / t=20, t 𝜖 R} ...... tiempo de vida en años
• E4 = {cs} ......... lanzar una moneda
• E5 = {15} .........edad de un grupo de personas

ii. EVENTO SEGURO. 𝜴:


Es el evento que siempre se va ha realizar. En consecuencia, es similar al
espacio muestral (conjunto universal).

Ejemplo 1:

Se lanza un dado y se quiere sacar cualquier número del uno al seis.

Ejemplo 2:

Se lanza una moneda y se quiere obtener cara o sello.

iii. EVENTO IMPOSIBLE. Φ


Es el evento que nunca se va a realizar, es un evento que no tiene
elementos, es representado por la letra griega φ, o Φ; es similar al
conjunto vacío.

Ejemplo:

Se lanza un dado y se quiere obtener un 7.


iv. EVENTOS INCOMPATIBLES
Son eventos que nunca se realizan juntos. Se les llama también eventos
mutuamente excluyentes, por consiguiente, A∩B = Φ (conjuntos
disjuntos)

Ejemplo:

Ω = {1, 2, 3, 4, 5, 6}; A = {1, 3, 5}, B = {2, 4, 6}, →A∩B = Φ

v. EVENTOS COMPATIBLES:
Es cuando se pueden realizar juntos, es decir, A∩B ≠ Φ

Ejemplo:

Ω = {1, 2, 3, 4, 5, 6}; A = {1, 3, 5}, C = {2, 3, 4, 5, 6}, →A∩C = {3, 5}


≠Φ

vi. SUB EVENTOS.


Dado dos eventos A y B se dice que A es sub evento de B, si todos los
elementos de A están contenidos en B, en otras palabras, si ocurre el
evento A también ocurre el evento B.

Ejemplo:

Ω = {1, 2, 3, 4, 5, 6}; A = {1, 2, 3}, B = {1.2, 3, 4}, → A⊂B

Ω = {X/X ∈ R}; A = {X/X ∈ N}, B = {X/X ∈ Z}, → A⊂B

vii. EVENTOS COMPLEMENTARIOS. (Eventos contrarios)


Se llama evento complementario, al evento que se realiza cuando el
evento original no se realiza.

Ac = {x / x ε Ω, x ∉ A}

Ejemplo:

Ω = {1, 2, 3, 4, 5, 6}; A = {1, 2, 3}, Ac= {4, 5, 6}


AU Ac = Ω; A ∩ Ac = Φ

A – Ac = A

Ac ∆ B = A ∆ Bc

Ωc = Φ; Φc = Ω

A∩Bc = A – B

OPERACIONES CON EVENTOS:


a. Unión:
Ejemplo 1:

Representa la probabilidad de ocurrencia en un espacio muestral que los


elementos de un suceso A y los elementos de un suceso B se unan dadas ciertas
condiciones. Consideremos que el suceso A contempla tres números pares:

A = 2, 4, 6

Luego se establece que el suceso B ha de contener cuatro números mayores


que 2 y consecutivos:

B = 3, 4, 5, 6

¿Cuál sería el resultado? Es la unión de todos los elementos que están en


ambos sucesos.

AUB= 2, 3, 4, 5, 6

Ejemplo 2:

Sí se entrevistan a la las personas que salen de un centro comercial en forma


secuencial, hasta que se entreviste a un extranjero, sea A el evento de que se
entreviste por lo menos a 5 personas y sea B el evento de que se entreviste a
lo más 8 personas, entonces la unión es el evento de entrevistar por lo menos
a una persona.

A = {5, 6, 7, 8, 9…}; B = {1, 2, 3, 4, 5, 6, 7, 8}


AUB = {1, 2, 3, 4, 5, 6, 7, 8, 9…}

n(AUB) = n(A) + n(B) – n(AꓵB)

n(AUB) = n (A – B) + n (B – A) + n(A∩B)

n (A U B U C) = n(A) + n(B) +n (C) – n (A ꓵ B) – n (A ꓵ C) – n (B ꓵ C)


+ n (A ꓵ B ꓵ C)

b. Intersección:
Ejemplo 1:

Representa la probabilidad de ocurrencia en un espacio muestral que los


elementos de un suceso A y los elementos de un suceso B se intercepten dadas
ciertas condiciones. Partiendo de la suma del lanzamiento de los dados, se
establece que el suceso A contemplará dos números pares:

A = 2, 6

El suceso B, solo admite tres valores, mayores a partir de 5:

B = 5, 6, 7

¿Cuál sería el resultado? Es la intersección de los elementos que sean


comunes:

A∩B= 6

Ejemplo 2:

La intersección es entrevistar entre 5 a 8 personas.

A∩B = {5, 6, 7, 8}

c. Diferencia:
A - B = {x / x 𝜖 A , x ∉ B } = (A∩Bc) : Se realiza A pero no B

B - A = {x / x ∉ A , x e B } = (Ac∩B) : se realiza B pero no A


Ejemplo:

En el ejemplo anterior se tiene

A – B = {9, 10, 11, 12……}

B – A = {1, 2, 3, 4}

d. Diferencia simétrica:
A Δ B = {x / x 𝝐 AꓴB, x ∉ AꓵB }

A Δ B = (AꓴB) – (AꓵB)

A Δ B = (A – B) ꓴ (B – A)

Ejemplo:

Es cuando se realiza sólo uno de ellos.

n (A Δ B) = n(A) + n(B) – 2n(A∩B) = n(A-B) + n(B-A)

Ejemplo:

Del ejemplo anterior se tiene:

AUB = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10….}

A∩B = {5, 6, 7, 8}

A Δ B = {1, 2, 3, 4, 9, 10, 11, 12, ……..}

A – B = {9, 10, 11, 12……}

B – A = {1, 2, 3, 4}

DEFINICIÓN DE PROBABILIDADES

Es la medida de la certidumbre o incertidumbre de que ocurra un acontecimiento, evento


o suceso. Existen varias formas de definir la probabilidad de un evento, a saber:
DEFINICIÓN OBJETIVA: Es cuando la probabilidad de un evento es cuantificable con
un valor determinado en forma objetiva.

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴


𝑃(𝐴 ) =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠ⅈ𝑏𝑙𝑒𝑠 𝑑𝑒𝑙 𝑒𝑠𝑝𝑎𝑐ⅈ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 Ω

Donde cada caso debe ser igualmente probable y el número de casos debe ser finito.

Ejemplo 1:

En un almacén hay 20 artículos 8 son importados. Sí se escoge al azar 2 artículos del


almacén, cuál es la probabilidad de que uno de ellos sea importado.

Respuesta: P(A) = 96/190 = 0, 50526

n(Ω) = (20
2
) = 190 muestras igualmente probables, n(A) = (81) (12
1
)= 8x12 = 96

Ejemplo 2:
Los estudiantes A y B tienen respectivamente probabilidades 1/2 y 1/5 de suspender un
examen. La probabilidad de que suspendan el examen simultáneamente es de 1/10.
Determinar la probabilidad de que al menos uno de los dos estudiantes suspenda el
examen.

Podemos decir que, los estudiantes A y B tienen respectivamente probabilidades 1/2 y


1/5 de suspender un examen. La probabilidad de que suspendan el examen
simultáneamente es de 1/10. Determinar la probabilidad de que al menos uno de los dos
estudiantes suspenda el examen.

Son sucesos compatibles, es decir que la probabilidad de eventos simultáneos es distinta


de cero. Calculamos entonces la probabilidad de la siguiente manera

1 1 1 3
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) = + − =
2 5 10 5
Ejemplo 3:
Una clase consta de 10 hombres y 20 mujeres; la mitad de los hombres y la mitad de las
mujeres tienen los ojos castaños. Determinar la probabilidad de que una persona elegida
al azar sea un hombre o tenga los ojos castaños.

Una clase consta de 10 hombres y 20 mujeres; la mitad de los hombres y la mitad de las
mujeres tienen los ojos castaños. Determinar la probabilidad de que una persona elegida
al azar sea un hombre o tenga los ojos castaños.

Hombres Mujer
O. castaños 5 10 15
10 20 30

Aquí debemos observar que hay tanto hombres 10 como de ojos castaños 15, además de
hombres con ojos castaños 5, así que la probabilidad de que sea hombre o tenga ojos
castaños se calcula con la fórmula

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

Luego realizamos el cálculo:

𝑃(𝐻 ∪ 𝐶) = 𝑃(𝐻) − 𝑃(𝐶) − 𝑃(𝐻 ∩ 𝐶)

10 15 5
(𝐻 ∪ 𝐶) = + −
30 30 30

2
(𝐻 ∪ 𝐶) =
3

Ejemplo 4:
Un grupo de 10 personas se sienta en un banco. ¿Cuál es la probabilidad de que dos
personas fijadas de antemano se sienten juntas?

Un grupo de 10 personas se sienta en un banco. ¿Cuál es la probabilidad de que dos


personas fijadas de antemano se sienten juntas.
Para conocer todas las formas que se tienen de colocar a 10 personas en 10 lugares,
usamos la permutación.

10
𝑃10 = 10!

Ahora, para saber el total de formas donde 2 seleccionadas previamente se sienten juntas,
podemos pensar en que al sentarse juntas ocupan un lugar de nueve posibles, de esta
manera, las formas en que nueve personas se pueden sentar ocupando 9 lugares es

𝑃99 = 9!

Y como cuando se sientan juntas puede ser de dos maneras posibles: ab ó ba, entonces el
total de formas en que dos personas seleccionadas previamente se pueden sentar juntas
en 10 lugares posibles es , llevándonos a que la probabilidad de que esto ocurra es

Siempre puedes optar por nuestras clases de matemáticas online para obtener tus mejores
resultados.

Teoremas de probabilidad:

• TEOREMA N° 1: La probabilidad del evento imposible es cero.

P(Φ) = 0

Ejemplo:
La probabilidad de entrevistar a una persona que tenga más de 4 metros de
estatura.

• TEOREMA N° 2: La probabilidad del evento complementario es uno menos la


probabilidad del evento.

P(Ac) = 1 – P(A)

Ejemplo:
La probabilidad de obtener un número impar al lanzar un dado, es igual a uno
menos la probabilidad de obtener un número par.
• TEOREMA N° 3. Probabilidad de sub eventos.

Sí A ⊆ B → P(A) ≤ P(B)

Sí A ⊆ B → P(B-A) = P(B) – P(A)

Sí A ⊆ B → P(A-B) = 0.0

Sí A ⊆ B → P(A ∩ B) = P(A)

Sí A ⊆ B → P(A U B) = P(B)

• TEOREMA N° 4. Probabilidad de la diferencia.

P(A – B) = P(A) - P(A ∩ B)

P(B – A) = P(B) - P(A ∩ B)

P(A Δ B) = P(AUB) - P(A∩B) = P(A) + P(B) - 2P(A ∩ B) = P(A-B) + P(B-A)

P(A Δ B) = P(𝑨𝒄 ∆ 𝑩𝒄 ); P(A Δ A) = 0; P(A ∆ 𝑨𝒄 ) = 1; P(A Δ Ω) = P(𝑨𝒄 );

P(A ∆ 𝑩𝒄 ) = 1 - P(A Δ B)

• TEOREMA N° 5. Probabilidad de la unión.

P(AUB) = P(A) + P(B) - P(A ∩ B)

Probabilidad geométrica:

Ejemplo 1:

̅̅̅̅ .
Encuentre la probabilidad de que un punto escogido al azar esté en 𝐴𝐶
𝐿𝑒𝑛𝑔ℎ𝑡 𝑜𝑓𝐴𝐶
Probabilidad de que el punto esté en ̅̅̅̅
𝐴𝐶 =
𝐿𝑒𝑛𝑔ℎ𝑡 𝑜𝑓 𝐴𝐵

̅̅̅̅
Use el postulado de la suma de segmentos para encontrar la longitud de 𝐴𝐵

AB = AC + CB

AB = 3 + 9

AB = 12

Sustituya.

3 1
Probabilidad de que el punto esté en ̅̅̅̅
𝐴𝐶 = =
12 4

̅̅̅̅ esté en es de 1/4 o 0.25.


La probabilidad de que el punto 𝐴𝐶

Ejemplo 2:

Tres estudiantes de la facultad de Ingeniería Ambiental de la UNSAM, entran al ascensor


de la facultad que tiene 6 plantas o pisos, cada uno de los estudiantes puede salir
indistintamente en cualquiera de las 5 plantas restantes. Hallar la probabilidad de que los
tres alumnos salgan:

a. en una misma planta.


b. en diferentes plantas.
c. dos en un piso y otro en otro piso

Respuesta.

n(Ω) = 5 x 5 x 5 = 125
a). n(A) = 5 → P(A) = 5/125 = 0,04

b) n(B) = 5 x 4 x 3 = 60 → P(B) = 60/125 = 0,48

c) n (C) = 3 x 5 x 4 = 60 → P (C) = 60/125 = 0.48

Ejemplo 3:

Cuatro trabajadores Alex, Valeria, Jaqui y Jeremi ha sido contratados por una empresa
manufacturera, los trabajadores son asignados aleatoriamente ya sea al departamento de
embarque o al de recepción. ¿cuál es la probabilidad de que:

a. Valeria y Jeremi sean asignados a un mismo departamento?

b. Dos a recepción y dos a embarque?

Solución:

a. n (𝛺) = 2x2x2x2 = 16

X: Valeria y Jeremi a embarque

1x1x2x2 = 4

Y: Valeria y Jeremi a recepción

1x1x2x2 = 4

P(A) = P(XUY) = P(X) + P(Y) = 4/16 + 4/16 = 8/16 = 0.5

b. n(B) = (42) = 6

P(B) = 6/16 = 0.375


Capítulo 10

TÉCNICAS DE CONTEO
1. VARIACIONES

1.1.VARIACIONES SIN REPETICIÓN.

Se llama Variación sin repetición de un grupo de n elementos distintos


tomados de r en r, a toda disposición ordenada en la que no hay ninguno
repetido dentro de los r elementos, sólo se tiene en cuenta el orden. Es decir,
importa el orden de los elementos, pero no se pueden repetir.

𝑛!
𝑉𝑟𝑛 =
(𝑛 − 𝑟)!

Ejemplo 1:

Escriba la lista de claves o códigos de dos letras que se pueden obtener de un


conjunto de cuatro letras, que son: a, b, c, d.

Respuesta.

4! 4! 24
𝑉24 = (4−2)!
= = = 12
2! 2

ab, ba, ac, ca, ad, da, bc, cb, bd, db, cd, dc

Ejemplo 2:

¿Cuántos números distintos de tres cifras diferentes se pueden escribir con los
dígitos:
1, 2, 3, 4, 5, 6, 7, 8, 9?

▪ No se pueden repetir.
▪ Influye el orden en el que se coloca.
Ejemplos correctos: 123, 132, 321, 213, 231, …

Ejemplos incorrectos: 111, 222, 333, 112, 122, …

𝑉9,3 = 9(9 − 1) ⋅ (9 − 2) ⋅ (9 − 3) = 9.8.7 = 504

Con la fórmula sería:

9! 9.8.7.6.5.4.3.2.1
𝑉9,3 = = = 9.8.7 = 504
(9 − 3)! 6.5.4.3.2.1

Ejemplo 3:

¿Cuántos números de cinco cifras se pueden formar con los números 1, 2,


3?
Solución:
Primero notemos que se nos pide formar un número con cinco cifras donde
cada cifra solo puede tomar tres valores, esto es n>m, así que asumimos
repetición, ya que de no asumir que los elementos pueden repetirse
tendríamos a lo más números con 3 cifras. También, notemos que se
cumplen las condiciones:
▪ Entran todos los elementos
▪ Sí importa el orden. No es lo mismo 121 que 211.
▪ Sí se repiten los elementos. Es fácil deducirlo.
▪ Así, tenemos variaciones con repetición de 3 elementos tomando
5, esto es m= 3, n= 5, así, la cantidad de números que se pueden
formar está dada por:
𝑉𝑅35 = 35 = 243

1.2.VARIACIONES CON REPETICIÓN.

Se llama Variación con repetición de un grupo de n elementos distintos


tomados de r en r, a toda disposición ordenada en la que algún elemento se
puede repetir dentro de los r elementos escogidos, se tiene en cuenta el orden.
Es decir, Importa el orden, pero, también los elementos se pueden repetir.

𝑉𝑟𝑛 = 𝑛𝑟

Ejemplo:

Escriba la lista de claves o códigos de dos letras que se pueden obtener de un


conjunto de cuatro letras, que son: a, b, c, d.

Respuesta:

𝑉24 = 42 = 16

ab, ba, ac, ca, ad, da, bc, cb, bd, db, cd, dc, aa, bb, cc, dd

Ejemplo 1:

¿Cuántos números de tres cifras se puede formar con los dígitos: 0, 1, 2, 3, 4,


5?

Queremos formar a números de tres cifras, sin embargo, la primera cifra no


puede comenzar con cero, ya que un cero a la izquierda no genera diferencia
(01 es igual a 1), por tal razón en la primera cifra solamente podemos colocar
del 1 al 5, así que m=5 y n=1.

Por otro lado, en las siguientes dos cifras del número si podemos colocar del
0 al 5, entonces m=6 y n=2

Finalmente, al calcular las variaciones por cada caso y multiplicarlas entre sí,
encontramos la solución:

𝑉𝑅51 = 𝑅62 = 5(6)2 = 180


Ejemplo 2:

¿Cuántos números de tres cifras se pueden formar con los dígitos: 1, 2, 3, 4,


5?

Aquí logramos ver que hay cinco elementos m = 5 colocados en tres


posiciones n = 3 aplicando la fórmula obtenemos que:

𝑉𝑅62 = 53 = 125

Por lo tanto, se pueden formar 125 números de tres cifras con los dígitos
indicados. Observa que sí importa el orden, ya que por ejemplo 123 es distinto
al 132, y además es posible la repetición ya que el número 223 es uno de los
125 posibles de construir.

Ejemplo 3:

Si un cuestionario tiene 15 preguntas y cada pregunta tiene tres opciones de


respuesta, ¿cuántas formas distintas posibles existen de resolver el
cuestionario?

Los valores de m = 3 y n = 15, llegando a que el total de combinaciones


posibles de resolver el cuestionario.

𝑉𝑅315 = 315 = 14348907

Por lo tanto, existen 14 348 907 formas distintas de resolver el cuestionario.

2. PERMUTACIONES

Son ordenaciones de todos los elementos, o variaciones de todos contra todos; es


decir, cuando n=r
2.1. PERMUTACIONES SIN REPETICIÓN

Se llama permutación sin repetición a toda disposición ordenada de todos


los n elementos del conjunto, sin que ninguno de ellos se repita, variando
sólo el orden de su presentación.

𝑃𝑛 = n!

Ejemplo 1:

Ordenar a todos los elementos del conjunto A = {a, b, c, d}.

Respuesta:

𝑃4 = 4! = 24

abcd, abdc, acbd, acdb, adbc, adcb, bacd, badc, bcad, bcda, bdac, bdca,
cabd, cadb, cbad, cbda, cdab, cdba, dabc, dacb, dbac, dbca, dcab, dcba

Ejemplo 2:

De cuántas maneras se pueden disponer 7 personas en una fila?

Solución:

Si n = 7

Pn = n! = 7! = 7 x 6 x 5 x 4 x 3 x 2 x 1

7! = (7 x 6) (5 x 4) (3 x 2) (1)

7! = (42 x 20) (6 x 1)

7! = (840 x 6)

7! = 5.040
Respuesta: 7 personas se pueden disponer en una fila de 5.040 maneras.

Ejemplo 3:

De cuántas formas pueden quedar clasificados 6 equipos de fútbol que


participan en un torneo?

Solución:

Si n = 6

Pn = n! = 6! = 6 x 5 x 4 x 3 x 2 x 1

6! = (6 x 5) (4 x 3) (2 x 1)

6! = (30 x 12) (2)

6! = (360 x 2)

6! = 720

Respuesta: 6 equipos de fútbol que participan en un torneo, pueden quedar


clasificados de 720 formas.

2.2. PERMUTACIONES CON REPETICIÓN.

Se llama permutación con repetición a toda disposición ordenada de todos


los n elementos del conjunto, en la que hay r grupos de elementos
idénticos, es decir, 𝑛𝑎 de la clase a, 𝑛𝑏 de la clase b,.., 𝑛𝑟 de la clase r, de
tal manera que: 𝑛𝑎 + 𝑛𝑏 + ......+ 𝑛𝑟 = n

𝑛!
𝑃𝑛 =
𝑛𝑎 !
𝑛𝑏 ! … . 𝑛𝑟 !
Ejemplo 1:

Ordenar a todos los elementos de la palabra mama.

Respuesta.

4!
𝑃4 = =6
2!2!

mama, amam, amma, maam, aamm, mmaa

Ejemplo 2:

6,42
Calcular las permutaciones con repetición de 𝑃𝑅12

Para resolver este problema solo debemos reemplazar los valores a = 6, b


= 4, c= 2, n= 12 en la formula anterior del número de permutaciones.

6,42 𝑃12 12! 12.11.10.9.8.7.6! 11.10.8.7


𝑃𝑅12 = = ⋅= = = 13860
6!4!2! 2!4!2! 6!.4.3.2.2 4

Ejemplo 3:

Con las cifras ; ¿Cuántos números de nueve


cifras se pueden formar?

Primero formemos grupos con los elementos de la misma clase. El primero


es formado por el valor , el segundo por el valor y el ultimo por el

valor . Si denotan el número de valores en cada grupo tenemos


que

a = 3, b= 4, c= 2, n= a+b+c= 9

Las permutaciones de estos elementos cumplen los siguiente

Sí entran todos los elementos


Sí importa el orden

Sí se repiten los elementos

Resolviendo mediante la fórmula tenemos:

𝑃9 9!
𝑃𝑅93,4,2 = = = 1260
3! 4! 2! 3! 4! 2!

3. COMBINACIONES
3.1. COMBINACIONES SIN REPETICIÓN.

Se llama combinaciones sin repetición a la selección de r elementos de un


conjunto de n elementos sin que ninguno de ellos se repita.

𝑛 𝑛!
𝐶𝑟𝑛 = ( ) =
𝑟 𝑟! (𝑛 − 𝑟)!

Ejemplo 1:

Si se tienen un conjunto de 5 personas de los cuales se selecciona a dos


personas para realizar un trabajo, ¿cuántas formas de seleccionar se tiene?

Respuesta.

5 5!
𝐶25 = ( ) = = 10 formas
2 2! (5 − 2)!

Si las personas se identificaran con las letras: a, b, c, d, e, entonces los


seleccionados serían:

ab, ac, ad, ae, bc, bd, be, cd, ce, de


Ejemplo 2:

Se tienen los 4 ases de una baraja y se quieren tomar al azar dos cartas.
Cuántas y cuáles son las combinaciones que pueden resultar?

Solución:

n = 4 = Número cartas para escoger

k = 2 = Número de cartas en cada combinación

𝑛! 4! 4! 4𝑥3𝑥2𝑥1 24
𝑛𝐶𝑘 = = = = = =6
𝑘! (𝑛 − 𝑘)! 2! (4 − 2)! 2! 2! (2𝑥1)(2𝑥1) 4

Respuesta: Pueden resultar 6 combinaciones posibles de 2 cartas con los 4


ases.

Ejemplo 3:

Un alumno decide presentar 3 de las 5 evaluaciones (Aritmética, Español,


Inglés, Religión, Sociales) que tiene pendiente en su colegio.

¿De cuantas maneras diferentes puede elegir esas evaluaciones?


Determines.

Solución:

n = 5 = Número de evaluaciones para escoger

k = 3 = Número de evaluaciones en cada combinación.

𝑛! 5! 5! 5𝑥4𝑥3𝑥2𝑥1 120
𝑛𝐶𝑘 = = = = = = 10
𝑘! (𝑛 − 𝑘)! 3! (5 − 3)! 3! 2! (3𝑥2𝑥1)(2𝑥1) 12

Respuesta. Hay 10 maneras posibles de elegir las 3 evaluaciones, entre las


5
3.2. COMBINACIONES CON REPETICIÓN.

Se llama combinaciones con repetición a la selección de r elementos de un


conjunto de n elementos, pero en la que algún elemento se pueda repetir,
pero no interesa el orden de su selección.

𝑛+𝑟−1 (𝑛 + 𝑟 − 1)!
𝐶𝑟𝑛 = ( )=
𝑟 𝑟! (𝑛 − 1)!

Ejemplo 1:

Si se tienen un conjunto de 5 personas de los cuales se selecciona a dos


personas para otorgarles un premio a cada uno, en este caso una persona
puede recibir dos premios. ¿cuántas formas de seleccionar se tiene?

Respuesta.

(5+2−1!
𝐶25 = (5+2−1
2
)= = (62) = 15 formas
2!(5−1)!

Si las personas se identificaran con las letras: a, b, c, d, e; entonces:

ab, ac, ad, ae, bc, bd, be, cd, ce, de, aa, bb, cc, dd, ee

Ejemplo 2:

En una bodega hay cinco tipos diferentes de botellas. ¿De cuántas formas
se pueden elegir cuatro botellas?

Solución:

No entran todos los elementos. Sólo elije .

No importa el orden. Da igual que elija botellas de anís y de ron,


que de ron y de anís.
Sí se repiten los elementos. Puede elegir más de una botella del mismo
tipo.

Ejemplo 3:

En una pastelería hay 6 tipos distintos de pasteles. ¿De cuántas formas se


pueden elegir 4 pasteles?

Nota: Si nos gusta un pastel lo podemos pedir hasta cuatro veces.


Estamos en el caso en el que no nos importa el orden en que elijamos los
pasteles y podemos repetir, son combinaciones con repetición.

Algebra de eventos:
• Ley de la identidad

AꓴΦ = A; AꓵΩ = A; Aꓴ(AꓵB) = A; Aꓵ(AꓴB) = A;


(Aꓵ𝐵𝑐 )ꓴ(AꓵB) = A

• Ley de la dominación

AꓴΩ = Ω; Aꓵ Φ = Φ

5+4−1 (5 + 4 − 1)! 8!
𝐶𝑅54 = ( )= = = 70
4 4! (5 − 1)! 4! ⋅ 4!

• Ley de la idempotencia

AꓴA = A; AꓵA = A
• Ley conmutativa

AꓴB = BꓴA; AꓵB = BꓵA; AΔB = BΔA

• Ley asociativa

Aꓴ(BꓴC) = (AꓴB)ꓴC; Aꓵ(BꓵC) = (AꓵB)ꓵC;

A Δ (B Δ C) = (A Δ B) Δ C

1 6+4−1 9!
𝐶𝑅6,4 =( )= = 126
4 4! ⋅ 5!

PROBABILIDAD CONDICIONAL

La probabilidad de que ocurra un evento A, dado que ya ocurrió o sucedió otro evento B,
se llama probabilidad condicional de A dado B y se denota como sigue:

𝑃(𝐴∩𝐵)
P(A/B) = ⍱ P(B) > 0
𝑃(𝐵)

Probabilidad condicional de B dado A

𝑃(𝐴∩𝐵)
P(B/A) = ⍱ P(A) > 0
𝑃(𝐴)

Nota.

P(Ac/B) = 1 – P(A/B); P[(AꓵB)/Bc] = 0; P(A/B) = 0, sí A y B son incompatibles


o mutuamente excluyentes.

Ejemplo 1:
Ante un examen, un alumno sólo ha estudiado 15 de los 25 temas correspondientes a la
materia del mismo. Éste se realiza extrayendo al azar dos temas y dejando que el alumno
escoja uno de los dos para ser examinado del mismo.
Hallar la probabilidad de que el alumno pueda elegir en el examen uno de los temas
estudiados.
Solución:
Ante un examen, un alumno sólo ha estudiado 15 de los 25 temas correspondientes a la
materia del mismo. Éste se realiza extrayendo al azar dos temas y dejando que el alumno
escoja uno de los dos para ser examinado del mismo. Hallar la probabilidad de que el
alumno pueda elegir en el examen uno de los temas estudiados.

10 9
p (al menos un tema) = 1 - p (ningún tema ==1- . = 0,85
25 24

Ejemplo 2:

Al 25% de tus amigos le gusta la fresa y el chocolate, mientras que al 60% le gusta el
chocolate. ¿Cuál es la probabilidad de que a un amigo que le gusta el chocolate, le guste
la fresa?

Solución:
Vamos a trabajar con 2 eventos: que a un amigo le guste la fresa, y que a un amigo le
guste el chocolate.

• Evento A: que a un amigo le gusten los fresa. ¿P(A) =?


• Evento B: que a un amigo le guste el chocolate. P(B) = 60 %.
• Evento A y B: que a un amigo le guste la fresa y el chocolate. P(A∩B) = 25
%.

Ahora calculamos la probabilidad de que a un amigo le guste la fresa, dado que le gusta
el chocolate.

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴|𝐵) =
𝑃(𝐵)

25% 5
𝑝(𝐴|𝐵) = = = 0,4167 = 41, 67 %
60% 12
La probabilidad de que a un amigo le guste la fresa dado que le gusta el chocolate es del
41,67 %

Ejemplo 3:

El 76 % de los estudiantes de Ingeniería Civil han aprobado resistencia de materiales y el


45 % aprobaron estática. Además, el 30 % aprobaron resistencia de materiales y estática.
Si Camilo aprobó resistencia de materiales, ¿qué probabilidad tiene de haber aprobado
también estática?

Solución:
Vamos a trabajar con 2 eventos: aprobar resistencia de materiales, y aprobar estática.

• Evento A: aprobar resistencia de materiales. P(A) = 76 %.


• Evento B: aprobar estática. P(B) = 45 %.
• Evento A y B: aprobar resistencia de materiales y estática. P(A∩B) = 30 %, y
es lo mismo que: P(B∩A) = 30 %

𝑃(𝐵 ∩ 𝐴)
𝑃(𝐴|𝐵) =
𝑃(𝐴)

30% 15
𝑝(𝐴|𝐵) = = = 0,3947 = 39,47 %
76% 38

Ahora calculamos la probabilidad de aprobar estática, dado que se aprobó resistencia de


materiales.

Para Camilo, la probabilidad de aprobar estática, dado que aprobó resistencia de


materiales es de 39,47 %.
DISTRIBUCIONES DE PROBABILIDAD:

Distribución de probabilidad de una v.a. es una función que asigna a cada suceso o evento
definido sobre la variable, la probabilidad de que el suceso ocurra; por lo tanto, es una
función matemática que asigna probabilidades, también es definido como el conjunto de
pares ordenados, formado por la variable aleatoria y la probabilidad correspondiente, es
decir, (X, P(X)), al graficar a este conjunto de pares ordenados se obtiene una curva y el
modelo de la curva puede ser expresado como una función matemática. Los modelos son
las funciones de cuantía (caso discreto) o de densidad (caso continuo), estos modelos
sirven para calcular las probabilidades de familias de fenómenos aleatorios.

Conclusiones y Sugerencias
I. Conclusiones:
En la actualidad realizamos diferentes trabajos de investigación y especialmente
como estudiantes, por ello la estadística a constituido una herramienta importante
para el proceso de estos trabajos; por qué nos permite recolectar datos de cualquier
población, representarla, y analizarla de una manera más profunda y así se tome
decisiones buenas.

En el trabajo podemos referirnos a las técnicas de recolección de datos, que


podemos afirmar que nos ayudan demasiado para poder realizar diferentes
trabajos y conocer los datos, además elaborar bien las tablas y gráficos nos
mostraran un panorama más amplio de nuestra investigación y así tomemos
alternativas o responder a alguna problemática.

Se puede decir que las medidas de dispersión sólo indican la magnitud de las
variabilidad de los datos, ya sea en forma absoluta o en forma relativa, pero no
indican nada acerca de la dirección hacia dónde tienden a acentuarse dichas
variaciones; para suplir esta deficiencia se obtienen otras medidas llamadas de
asimetría; por tanto, estas deben indicar la existencia o falta de simetría de la
distribución, mostrando la dirección hacia donde se inclina la distribución, esta
asimetría o simetría debe ser respecto a un punto de referencia de la variable.
Vamos a referirnos también a las probabilidades dentro de la estadística como algo
muy fundamental, por ejemplo, podemos aplicarlo en nuestra misma carrera,
conocer el pronóstico del tiempo o la turbidez del rio quillay un estudio que
podemos realizar, o en que tiempos aumenta el río y así tomar medidas de
seguridad. También debemos concluir que las variables aleatorias nos ayudan
muchísimo porque nos va a permitir el cálculo de las probabilidades de eventos al
estudio de las distribuciones.

La estadística juega un papel muy importante en nuestras vidas, ya que


actualmente ésta se ha convertido en un método muy efectivo para describir con
mucha precisión los valores de datos económicos, políticos, sociales,
psicológicos, biológicos y físicos, además, sirve como herramienta para relacionar
y analizar dichos datos.

II. Sugerencias:
✓ El estudio más profundo de estos temas, ya que después de realizar la
investigación se puede decir que nos ayuda machismo en nuestras vidas, y
saber aplicarla nos hará personas más productivas.
✓ Saber realizar los gráficos puede hacer que tu trabajo de investigación sea
eficiente, conocer cada parte, porque muchas veces se realizan recolección de
datos y a la hora de graficar todo sale muy mal.
✓ Los métodos de recolección de datos conocer ayudará que no tengamos solo
una alternativa, muchas veces pasa sin importancia conocer más métodos para
obtener datos por ello sugerimos que investiguen más de lo que ya conocen,
en este trabajo les presentamos algunos y detalladamente muy explicado.
Referencias Bibliográficas

 CÓRDOVA ZAMORA, Manuel (2014). “Estadística Descriptiva e


Inferencial”. 5ta Edición. Editorial Moshera S.R.L. Lima – Perú.
 MOYA CALDERÓN, Rufino (2010). “Estadística Descriptiva”. Tercera
edición. Editorial San Marcos. Lima - Perú.
 ÁVILA ACOSTA, Roberto (2012). “Estadística Elemental”. Nueva
Edición. Edit. Estudios y Ediciones R.A. Lima – Perú.
 MOYA R. y SARAVIA G. (2016). “Probabilidad e Inferencia Estadística”
Tercera Edición. Editorial San Marcos. Lima – Perú
 MITAC MEZA, Máximo (2014). “Tópicos de Estadística y Probabilidad”.
1er. Edición. Edit. San Marcos. Lima – Perú
 GARCÍA ORÉ, Celestino (2015). “Estadística Descriptiva y
Probabilidades”. Tercera reimpresión. Editorial Princeliness. Lima – Perú.
 UÑA I., SAN MARTÍN J. Y TOMEO V. (2010). “Cálculo de
Probabilidades”. 1ra Edición. Editorial Garceta. Madrid – España.
 ARCE F. y MENDOZA A. (2010). “Cálculo de Probabilidades” 1ra.
Edición. Editorial UNASAM. Huaraz – Perú.
 TOMA J. y RUBIO J. (2008). “Estadística Aplicada”. 1era. Edición.
Editorial Universidad Del Pacífico.
 MONTGOMERY Y RUNGER (2003). “Probabilidad y Estadística
Aplicada a la Ingeniería” 5ta. Edición. Editorial Limusa- Wiley. México.

También podría gustarte