Está en la página 1de 37

Área: Negocios

Probabilidad y estadística

M1 Introducción a la estadística
Módulo: 1
Curso: Probabilidad y estadística

Mapa de Contenido

Introducción a la estadística

Conceptos Medidas de tendencia central Gráficos

Población Media Circular

Muestra Moda Histograma

Variables Mediana Barras

Cáculo de
medidas de Ojiva
tendencia central

Polígono de
Frecuencia
Módulo: 1
Curso: Probabilidad y estadística

Índice

Introducción ............................................................................................................................................................................................................ 5
1. Conceptos ........................................................................................................................................................................................................... 6
1.1 Población ........................................................................................................................................................................... 6
1.2 Muestra ............................................................................................................................................................................. 7
1.2.1 Muestreo aleatorio simple ......................................................................................................................................... 7
1.2.2 Muestreo sistemático ................................................................................................................................................ 8
1.2.3 Muestreo aleatorio estratificado ............................................................................................................................... 9
1.2.4 Muestreo por conglomerados ................................................................................................................................... 9
1.3 Variable ............................................................................................................................................................................. 9
1.3.1 Variable cuantitativa ................................................................................................................................................ 10
1.3.2 Cualitativa ................................................................................................................................................................ 11
2. Medidas de tendencia central................................................................................................................................................................... 12
2.1 Media aritmética ............................................................................................................................................................. 12
2.1.1 Calculo de la media para datos no agrupados ......................................................................................................... 13
2.1.2 Calculo de la media para datos agrupados .............................................................................................................. 14
2.2 Moda ............................................................................................................................................................................... 16
2.2.1 Calculo de la moda para datos no agrupados .......................................................................................................... 16
2.2.2 Calculo de la moda para datos agrupados ............................................................................................................... 17
2.3 Mediana........................................................................................................................................................................... 18
2.3.1 Calculo de la mediana para datos no agrupados ..................................................................................................... 18
2.3.2 Calculo de la mediana para datos agrupados .......................................................................................................... 20
2.4 Práctica en Excel .............................................................................................................................................................. 22
2.4.1 Media ....................................................................................................................................................................... 22
2.4.2 Moda ........................................................................................................................................................................ 25
2.4.3 Mediana ................................................................................................................................................................... 29
Módulo: 1
Curso: Probabilidad y estadística

3. Gráficos .............................................................................................................................................................................................................. 32
3.1 Circular o de torta............................................................................................................................................................ 32
3.2 Barra ................................................................................................................................................................................ 33
3.3 Histograma ...................................................................................................................................................................... 34
3.4 Polígono de frecuencias .................................................................................................................................................. 35
3.5 Ojiva ................................................................................................................................................................................. 36
Cierre ....................................................................................................................................................................................................................... 37
Módulo: 1
Curso: Probabilidad y estadística

Resultado de aprendizaje

Calcula medidas de tendencia central, de forma manual y mediante Excel, diferenciando los
conceptos de población y muestra e identificando y clasificando la variable, en una problemática
determinada.

Introducción
Día a día nos vemos rodeados de datos y números sin siquiera darnos cuenta. Por ejemplo, al momento
de ir al supermercado y tener que observar precios, para posteriormente tomar una decisión de cuál es
el producto que más nos conviene. Algunos se guiarán por la calidad, mientras que otros podrían
comparar los precios, quedándose con el más económico, o el que cumpla en ambas categorías al menos
un cierto nivel, es decir una calidad no tan reducida a un precio no tan caro, por ejemplo.
Pues bien, todos estos datos o números con los que estamos rodeados a diario no nos sirven de nada si
no lo analizamos, por ejemplo, si veo para una cierta marca de azúcar que el kilo vale $600 y el envase
de 3 kilos $1500, y solo me quedo con los valores que veo. En el caso de querer comprar la más económica
me quedaría con la de kilo, pero si voy más allá y analizo estas dos situaciones, comprenderé que
finalmente la más económica y conveniente es la de 3 kilos, dado que el kilo me sale más barato que la
que está a $600 ($1500/3=$500). Es acá en donde entra la Estadística, que consiste en la ciencia que
transforma datos o números en información, la cual nos ayudará en la toma de decisiones.
También por ejemplo para quienes trabajan en control de calidad, quizás en algún momento su jefe les
solicita un informe correspondiente al producto que controlan, supongamos que este sea el caso, usted
esté a cargo del control de calidad de una empresa exportadora de paltas. Podría darse que últimamente
hayan llegado quejas que estas no están cumpliendo con el gramaje mínimo pactado, por lo tanto, se le
solicita a usted información respecto al último lote enviado.
Usted podría, mediante las medidas de tendencia central evaluar el peso promedio del lote enviado, por
el que han presentado quejas y compararlo con la media de lotes enviados en oportunidades anteriores.
Así podría concluir mediante evidencia estadística si este último lote está o no bajo el gramaje promedio
que siempre se envía.
Con estos ejemplos simples, pero reales, que probablemente vivamos a diario, podemos ver y ejemplificar
la importancia de la Estadística para nuestro diario vivir, tanto en pequeñas como grandes decisiones que
debamos tomar.
Es por ello que durante el módulo usted se familiarizará con estos conceptos tan importantes, de manera
tal que al finalizarlo usted dispondrá de las herramientas esenciales para llevar a cabo un buen análisis
de datos, con el cual posteriormente usted podrá transformar simples valores en información valiosa, la
que podrá utilizar tanto en su vida diaria como laboral, también sabrá aplicar mediadas de tendencia
central, a datos tabulados como no tabulados , graficar datos y finalmente lograr identificar que es una
variable y cuál es su clasificación.

Pág. 5
Módulo: 1
Curso: Probabilidad y estadística

1. Conceptos

Cuando hablamos de estadística, nos estamos refiriendo a la ciencia que transforma


datos o números en información valiosa para la toma de decisiones. Esta nos ayuda a
cuantificar la realidad y disponer de elementos que nos permitan realizar un posterior
análisis. Para poder comprender un poco más esta ciencia, se presentarán a
continuación algunos conceptos que nos sonarán con frecuencia durante el curso.

A continuación, se detallan:

1.1 Población
Cuando tenemos un conjunto de datos que queremos analizar, lo primero es saber de dónde viene esta
información. Y es aquí donde surge el primer concepto de estadística que veremos: Población.
Cuando nos referimos a población, estamos hablando del conjunto total de individuos,
objetos o medidas que poseen características comunes observables en un lugar y en un
momento determinado. Es decir, corresponde a todos los elementos que forman cierto
universo en común.

Ejemplo colegio

Podríamos considerar como población, a todos los estudiantes de cierto colegio, en donde podemos
observar que todos comparten una cierta característica en común, que es el estar estudiando en el
mismo establecimiento, o bien a todos los pacientes de cierto hospital, donde la característica en
común sería el estar enfermo o en algún procedimiento médico, además de compartir el lugar de
estadía.

Así podemos encontrar millones de poblaciones como estas, pero demos un paso más, ¿qué pasaría si
yo quiero estudiar alguna característica en particular de alguna población? Para cuando tengo
Poblaciones pequeñas como por ejemplo una escuela rural con tan solo 15 niños no tengo problema,
pero ¿qué pasa si quiero estudiar cierta característica de alguna universidad? Acá, a diferencia de la
escuela rural, no tendremos un número pequeño de estudiantes que formen la población, sino que serán
volúmenes muy grandes, por ejemplo, una universidad promedio tiene aproximadamente 30.000
estudiantes. Si quisiéramos estudiar a cierta universidad sería imposible poder considerar a todos estos
elementos, por un tema de costo y tiempo, es por ello por lo que es acá en donde surge otro importante
concepto de la Estadística: la muestra.

Pág. 6
Módulo: 1
Curso: Probabilidad y estadística

1.2 Muestra
Cuando hablamos de una muestra nos estamos refiriendo a la selección de un subconjunto
representativo de la población. La idea de obtener una muestra es que con una cantidad
menor de información podamos tener conclusiones representativas de todos los elementos
que conforman la población.

Ejemplo

Por ejemplo, en el caso de querer estudiar cierta característica de los estudiantes de una universidad,
en vez de seleccionar a los 30.000 por los que esta se conforma, se seleccionará una muestra que
sea representativa de estos 30.000, podrían ser por ejemplo 3.000. Luego la información de estos
3.000 será representativa de toda la universidad, dado que se habrán escogido mediante alguna
técnica de muestreo que nos garantice que estamos ante la presencia de una muestra
representativa.

Hay diferentes tipos de muestreo para utilizar en la búsqueda de la muestra representativa de la


población, entre ellos los más importantes y utilizados son los siguientes:

1.2.1 Muestreo aleatorio simple


Se conoce como muestreo aleatorio simple al procedimiento de selección de la muestra de tamaño 𝑛, en
la que cada objeto de la muestra tiene la misma probabilidad de ser elegido, sin reposición y sin tener en
cuenta el orden de colocación. Por ejemplo, siguiendo con el ejemplo del colegio, si quisiéramos hacer
un muestreo aleatorio simple para la elección de la muestra podríamos mediante Excel, seleccionar 200
números al azar, que estén entre 1 y 4.000, correspondiente al total de alumnos del colegio. Serán
seleccionados los alumnos que tengan asociados los números que ser obtuvieron.

Pág. 7
Módulo: 1
Curso: Probabilidad y estadística

1.2.2 Muestreo sistemático


Corresponde a la elección de la muestra tomando el primer valor de la población de manera aleatoria y
luego tomando una muestra cada k elementos de esta lista previamente ordenada. El cálculo de este
valor k estará dado por:

Fórmula
𝐍
𝐤=
𝐧

donde,

𝑘: Paso o salto entre muestra y muestra del muestreo sistemático


𝑁: Tamaño de la población
𝑛: Tamaño de la muestra

Ejemplo

Si de nuestro ejemplo queremos realizar un muestreo sistemático tendríamos:

𝑁 = 4000
𝑛 = 200
4.000
k= = 20
200

Es decir, de mi muestra ordenada por nombre del alumno entre 1 𝑦 4.000 tomaré aleatoriamente
como la primera la número 2, por lo tanto, la que sigue será la número 2 + 𝑘, es decir 2 + 20, o sea
22, luego 22 + 𝑘, es decir 22 + 20 = 42 y así sucesivamente hasta completar las 200 muestras que
requiero.

Pág. 8
Módulo: 1
Curso: Probabilidad y estadística

1.2.3 Muestreo aleatorio estratificado


Consiste en dividir una población heterogénea en L estratos homogéneos, y de cada uno de estos estratos
se tomará una muestra correspondiente.
En nuestro ejemplo del colegio, podríamos estratificar a los 4.000 alumnos por curso, esto dado que cada
curso va a ser homogéneo entre sí, dado que por ejemplo todos los niños que compartan curso, y por
ello edades similares, tendrán un rango parecido de peso y estatura entre ellos, siendo grupos
homogéneos pero heterogéneos respecto de los demás, claramente un niño de primero básico tendrá
peso y estatura muy diferente a la de un adolescente de cuarto medio.

1.2.4 Muestreo por conglomerados


Este tipo de muestreo se utiliza cuando no se puede contar con una lista de todos los datos que
componen la población. Por ejemplo en nuestro caso del colegio, no sería necesario este tipo de
muestreo, dado que cada niño está asociado a una lista respectiva de su curso, por lo tanto es posible
identificar a los 4.000 elementos que componen la población, pero supongamos que quisiéramos hacer
una encuesta a las personas católicas de la región Metropolitana, como no tenemos una lista de ellos lo
que si podríamos realizar sería el buscar todas las iglesias católicas que se encuentren ubicadas en la
región, para posteriormente tomar una muestra de estas iglesias, solicitar a ellas listas de fieles que asistan
constantemente y de esas listas, que sería nuestra población tomar una muestra para nuestro posterior
estudio.

1.3 Variable
Siguiendo con los conceptos fundamentales asociados a la estadística podemos encontrar a
la variable.
Cuando hablamos de variable, nos referimos a la característica de los elementos de la
población que queremos estudiar, susceptible de adoptar diferentes valores.

Ejemplo

Por ejemplo, en el caso de los alumnos de cierta universidad, supongamos que queremos investigar
sobre los rangos socioeconómicos de estos, y les aplicamos una encuesta a la muestra que
habremos tomado de la población, esta encuesta podría consultar el ingreso familiar mensual, la
edad del encuestado, el número de integrantes del grupo familiar, entre otras cosas. Cualquier
característica que se mida, como las mencionadas anteriormente, corresponderá a una variable.

Pág. 9
Módulo: 1
Curso: Probabilidad y estadística

Tipos de Variables

Dentro de las variables podemos distinguir diversos tipos, las que se muestran y explican a continuación:

Una variable, que recordemos corresponde a cierta característica de una población o muestra que se
quiere estudiar, puede clasificarse en los siguientes dos grupos principales:

1.3.1 Variable cuantitativa


Cuando nos referimos a una variable cuantitativa, estamos hablando de una característica que será
expresada en valores numéricos. Como, por ejemplo, precio de cierto producto, cantidad de hermanos
que tenga un individuo, inflación del país, en fin, cualquier dato que pueda representarse de manera
numérica.
Dentro de las variables cuantitativas se tienen dos subconjuntos de variables:

a. Cuantitativa – Continua
Nos referimos a variables cuantitativas que podemos expresar con decimales, como por ejemplo el peso
de una persona, podemos decir que esta pesa 80,3 kg, o la temperatura de un día cualquiera que podría
ser de 26,5 °C, entre otras.

b. Cuantitativa – Discreta
Nos referimos a variables cuantitativas que solo se pueden expresar con valores enteros (sin tomar
decimales), como por ejemplo la cantidad de hijos por persona, el número de autos, o de casa, entre
otras cosas.

Pág. 10
Módulo: 1
Curso: Probabilidad y estadística

1.3.2 Cualitativa
Cuando nos referimos a una variable cualitativa, esta corresponde a una característica para la que sus
valores son categóricos, es decir características que no se pueden medir de manera numérica, sino que
deben medirse como atributos, conceptos o cualidades.

Dentro de las variables cualitativas se tienen dos subconjuntos de variables:

a. Cualitativa – Ordinal
Nos referimos a variables cualitativas en las que existe relación de orden en sus categorías, como por
ejemplo la variable nivel socioeconómico, que podría tomar los valores de bajo, medio y alto nivel.
Podemos ver que entre sus cualidades existe un orden de menor a mayor nivel.

b. Cualitativa - Nominal
Nos referimos a variables cualitativas en las que no existe relación de orden en sus categorías, por
ejemplo, con la variable sexo, la que podría ser masculino y femenino. Acá no existe un orden en sus
categorías como en las ordinales.

Pág. 11
Módulo: 1
Curso: Probabilidad y estadística

2. Medidas de tendencia central


Cuando logramos encontrar un valor que resuma un conjunto de datos con los que estemos trabajando,
entonces, estamos haciendo referencia a alguna medida de tendencia central.

Estas corresponden a valores que se ubican en la parte central de un conjunto de datos,


con las cuales podemos resumir nuestra información. .

Ejemplo

Por ejemplo, si tenemos un pallet de paltas y quisiéramos saber cuánto pesa cada una de ellas, sería
muy tedioso pesarlas una a una para indicar el peso por cada palta, en cambio sí calculamos la media
(promedio) de estas, podríamos saber aproximadamente cuánto pesa cada palta de las que están
dentro del pallet estudiado.

Cuando hablamos de medidas de tendencia central podemos identificar tres, las cuales corresponden a:

2.1 Media aritmética


La media aritmética corresponde al promedio del grupo de datos estudiados, es decir si
del grupo cada objeto tuviese asociado un mismo valor, este sería el valor promedio, o
bien si sacamos un objeto al azar, lo más probable es que el valor que nos entregue sea
muy parecido al promedio.

Ejemplo

Por ejemplo, si se desea obtener la media del peso en kilos de los alumnos de primero básico de
cierto colegio, en realidad lo que buscamos es el promedio de estos. En el caso que nos diera 30
kilos, esto significaría que, si todos los niños del curso pesaran lo mismo, este sería el valor de su
peso, o que si elegimos un niño al azar, lo más probable es que su peso se encuentre cercano a los
30 kilos.

Pág. 12
Módulo: 1
Curso: Probabilidad y estadística

Para calcular la media podemos encontrar dos formas distintas, dependiendo si los datos se encuentran
agrupados en una tabla de frecuencia o no:

2.1.1 Calculo de la media para datos no agrupados


Cuando se tengan datos no agrupados, es decir a granel o sin tabular, la forma de calcular la media
será la siguiente:

Fórmula
∑𝑛𝑖=1 𝑋𝑖
𝑋̅ =
𝑛
dónde,

𝑋̅: Media aritmética


𝑋𝑖 : Valor del dato i-ésimo
n: Cantidad total de datos

Ejemplo

Veamos un ejemplo:

Para el examen final de Matemáticas de cierto curso, se han registrado las siguientes calificaciones:

Número del Nota


alumno Examen
1 5.8
2 6.1
3 4.5
4 6.5
5 5.5
6 6.3
7 6.7
8 6.4
9 3.1
10 5.9
11 4.8
12 4.6

Pág. 13
Módulo: 1
Curso: Probabilidad y estadística

Ejemplo

Para calcular la media, se realizará lo siguiente:

∑𝑛𝑖=1 𝑋𝑖 5.8 + 6.1 + 4.5 + 6.5 + 5.5 + 6.3 + 6.7 + 6.4 + 3.1 + 5.9 + 4.8 + 4.6 66.2
𝑋̅ = = = = 5.5
𝑛 12 12

Es decir, el promedio, o media de la nota del examen de Matemáticas corresponde a un 5.5. Si


todos los alumnos se hubiesen sacado la misma nota esta correspondería a un 5.5, o si se toma la
nota de un alumno al azar lo más probable es que esta sea de un 5.5.

2.1.2 Calculo de la media para datos agrupados


Cuando se tengan datos agrupados, es decir tabulados en forma de tablas de frecuencia, la media se
calculará de la siguiente forma:

Fórmula
∑𝑛𝑖=1 𝑀𝑖 ∗ 𝑓𝑖
𝑋̅ =
𝑛
dónde,
𝑋̅: Media aritmética
𝑀𝑖 : Marca de la clase i-ésima
𝑓𝑖 : Frecuencia absoluta de la clase i-ésima
n: Cantidad total de datos

Recordemos que para calcular la marca de clases esta corresponderá al valor medio entre el límite
superior y el límite inferior del intervalo de la clase que estemos estudiando, es decir:

𝐿𝑆 + 𝐿𝐼
𝑀=
2
Dónde:
𝑀: Marca de clase
𝐿𝑆 : Límite Superior
𝐿𝐼 : Límite Inferior

Pág. 14
Módulo: 1
Curso: Probabilidad y estadística

También recordemos que la frecuencia absoluta contará el número de datos que se encuentran en el
intervalo indicado por la clase correspondiente (cada clase estará definida por una fila), es decir,
tenemos lo siguiente para una tabla de frecuencias:

Clase Límite Inferior Límite Superior Marca de Clase Frecuencia absoluta


(i) (𝑳𝑰 ) (𝑳𝑺 ) (𝑴𝒊 ) (𝒇𝒊 )
1 0 10 (0 + 10)/2 = 5 5
2 10 20 (10 + 20)/2 = 15 2
3 20 30 (20 + 30)/2 = 25 3

Ejemplo

Por ejemplo, si esta tabla de frecuencias representara los pesos en kilógramos de los niños de cierto
jardín tendríamos que la primera clase está formada por niños que pesan entre 0 y 10 kg, siendo la
marca de clase 5 kilos (recordemos que esta corresponde al punto medio entre los límites), y
finalmente podemos observar una frecuencia absoluta de 5 niños, es decir encontramos que hay 5
niños que pesan entre 0 y 10 kilos.

Luego tenemos que la segunda clase está formada por niños que pesan entre 10 y 20 kg, siendo la
marca de clase 15 kilos (recordemos corresponde al punto medio entre los límites), y finalmente
podemos observar una frecuencia absoluta de 2 niños, es decir encontramos que hay 2 niños que
pesan entre 10 y 20 kilos.

Para terminar, tenemos que la tercera clase está formada por niños que pesan entre 20 y 30 kg,
siendo la marca de clase 25 kilos (recordemos corresponde al punto medio entre los límites), y
finalmente podemos observar una frecuencia absoluta de 3 niños, es decir encontramos que hay 3
niños que pesan entre 20 y 30 kilos.

Ahora, si quisiéramos calcular la media del peso de los niños de este jardín, la fórmula estaría dada
de la siguiente manera:

∑𝑛𝑖=1 𝑀𝑖 ∗ 𝑓𝑖 5 ∗ 5 + 15 ∗ 2 + 25 ∗ 3 130
𝑋̅ = = = = 13
𝑛 5+2+3 10

Es decir en promedio los niños pesan 13 kilos, o sea si todos los niños pesaran lo mismo, el peso
de cada uno de ellos sería de 13 kilos.

Pág. 15
Módulo: 1
Curso: Probabilidad y estadística

2.2 Moda
La moda corresponde al valor que presenta una mayor frecuencia absoluta, es decir el dato
que más se repite, será el valor más frecuente dentro del conjunto de datos a estudiar.

Para calcular la moda podemos encontrar dos formas distintas, dependiendo si los datos se encuentran
agrupados en una tabla de frecuencia o no:

2.2.1 Calculo de la moda para datos no agrupados


Cuando queremos calcular la moda de un conjunto de datos, simplemente vemos cual es el que más se
repite, o bien presenta mayor frecuencia absoluta, y ese será la moda, si encontramos dos valores
diferentes que sean los más repetidos diremos que el conjunto de datos es bimodal, si tiene tres entonces
diremos que es trimodal, en el caso que hayan 4 le llamaremos cuatrimodal y en el caso de ser 5 o más
le llamamos polimodal.

Ejemplo

Por ejemplo, si se tienen las siguientes edades, las que están asociadas a niños entre 5 y 10 años
que están inscritos en cierto curso de baile:
6, 5, 6, 7, 9, 8, 7, 10 𝑦 7
Podemos ver que la moda es 7, dado que es la edad que más se repite dentro del conjunto de datos
que tenemos.

Pág. 16
Módulo: 1
Curso: Probabilidad y estadística

2.2.2 Calculo de la moda para datos agrupados


Cuando nos encontremos en el caso de datos agrupados mediante una tabla de frecuencias, la forma
de calcular la moda será la siguiente:

Fórmula
𝑓𝑖 − 𝑓𝑖−1
𝑀0 = 𝐿𝐼 + ∗𝑎
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) 𝑖

Dónde:
𝑀0 : Moda
𝐿𝐼 : Límite Inferior
𝑓𝑖 : Frecuencia absoluta clase i-ésima
𝑓𝑖−1 : Frecuencia absoluta clase anterior a la i-ésima
𝑓𝑖+1 : Frecuencia absoluta clase posterior a la i-ésima
𝑎𝑖 : amplitud del intervalo (la diferencia entre los límites, es decir Límite Superior – Límite Inferior)

Esta fórmula será aplicada en la clase modal, es decir la que presente una mayor frecuencia absoluta,
o la mayor cantidad de datos.

Ejemplo

Por ejemplo, se ha recopilado la estatura (en centímetros) de 20 estudiantes de cierta universidad,


consiguiendo la siguiente información tabulada:

Clase Límite Inferior Límite Superior Frecuencia absoluta


1 150 160 8
2 160 170 10
3 170 180 2

Lo primero será identificar la clase modal, que es con la que trabajaremos. En este caso la que
presenta mayor frecuencia absoluta es la clase 2, teniendo a 10 estudiantes con una estatura entre
los 160 y 170 centímetros.

Pág. 17
Módulo: 1
Curso: Probabilidad y estadística

Ya identificada la clase con la que trabajaremos aplicamos la fórmula:

𝑓𝑖 − 𝑓𝑖−1
𝑀0 = 𝐿𝐼 + ∗𝑎
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) 𝑖

10 − 8
𝑀0 = 160 + ∗ (170 − 160) = 162
(10 − 8) + (10 − 2)

Es decir, la moda de los datos tabulados, o mejor dicho la estatura más frecuente de los
estudiantes encuestados es de 162 centímetros.

2.3 Mediana
La mediana corresponde al valor central de un conjunto de datos ordenados de menor a mayor,
y tiene dos interpretaciones. La primera es que el 50% de los datos se encuentra por debajo del
valor de la mediana y la otra interpretación corresponde a que el otro 50% se encuentra por
sobre el valor de la mediana.

Para calcular la mediana podemos encontrar dos formas distintas, dependiendo si los datos se encuentran
agrupados en una tabla de frecuencia o no:

2.3.1 Calculo de la mediana para datos no agrupados


Cuando queremos calcular la mediana de un conjunto de datos, lo primero que debemos hacer es
ordenar nuestros valores de menor a mayor, siendo el valor que quede justo al medio nuestro valor de
la mediana.
Cuando estemos en presencia de un número impar de datos tendremos solo uno a la mitad, pero en el
caso que tengamos un número par simplemente tomamos los dos del medio y la mediana será el
promedio de estos, es decir supongamos que:

Pág. 18
Módulo: 1
Curso: Probabilidad y estadística

Ejemplo

Para ejemplificar el caso de los datos impares se tienen los siguientes valores, correspondientes a
los días de vacaciones que presentan 11 trabajadores:

2 12 14 3 5 8 8 7 10 16 20

Lo primero que debemos hacer es ordenar nuestros datos de menor a mayor:

2 3 5 7 8 8 10 12 14 16 20

Podemos ver que el dato central corresponde al 8 que se ha destacado, es decir esto podría
interpretarse como que el 50% de los trabajadores tienen hasta 8 días de vacaciones, o también que
el 50% de los trabajadores tiene más de 8 días de vacaciones.

Ahora supongamos que se agrega un trabajador a este estudio, de manera de contar con 14 datos,
es decir un número par como se muestra a continuación:

2 12 14 3 5 8 8 7 10 16 20 22 4 17

Lo primero que debemos hacer es ordenar los valores de menor a mayor:

2 3 4 5 7 8 8 10 12 14 16 17 20 22

Acá podemos notar que quedan dos valores en el medio por lo tanto la mediana será el promedio
de estos, es decir:
8 + 10
=9
2

Por lo tanto, la mediana es 9, es decir de este grupo de trabajadores el 50% tiene a los más 9 días
de vacaciones, mientras que el otro 50% tiene a lo menos 9 días de vacaciones.

Pág. 19
Módulo: 1
Curso: Probabilidad y estadística

2.3.2 Calculo de la mediana para datos agrupados


Cuando tenemos datos tabulados y queremos calcular la mediana lo haremos mediante la siguiente
fórmula:

Fórmula

𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝐼 + 2 ∗ 𝑎𝑖
𝑓𝑖

dónde,
𝐿𝐼 : Límite Inferior
𝑛: Total de datos
𝐹𝑖−1 : Frecuencia acumulada anterior a la clase i
𝑓𝑖 : Frecuencia absoluta de la clase i
𝑎𝑖 : Amplitud de la clase i

Recuerda

Recordemos que la frecuencia acumulada va sumando las frecuencias absolutas de las clases
anteriores hasta la que se está estudiando.

También debemos tener claro que se deberá trabajar con la clase mediana, es decir la clase donde
se encuentre el valor central de nuestro conjunto de datos.

Pág. 20
Módulo: 1
Curso: Probabilidad y estadística

Ejemplo

Por ejemplo, supongamos que de un estudio se han recopilado los valores correspondientes a los
sueldos (en miles de pesos) de 100 familias:

Límite Inferior Límite Superior Frecuencia absoluta 𝑓𝑖 Frecuencia acumulada 𝐹𝑖


298 350 60 60
350 450 20 60+20=80
450 560 15 60+20+15=95
560 859 5 60+20+15+5=100

Si quisiéramos sacar la mediana, lo primero que debemos hacer es identificar la clase donde esta se
encuentra, de manera de trabajar con ella. De 100 datos, como es valor par, la mediana será el
promedio entre el dato que ocupa el lugar 50 y 51, por lo tanto, lo primero que debemos identificar
en que clase encontramos estos valores, es decir los que están ubicados en la posición 50 y 51. De
la tabla podemos apreciar que en la primera clase se encuentra hasta el dato que ocupa la posición
60, por lo tanto, es acá donde podemos encontrar nuestros datos, es decir la primera clase será la
clase mediana.

Ya teniendo identificado esto procedemos a reemplazar en la fórmula:

100
−0
𝑀𝑒 = 298 + 2 ∗ (350 − 298) = 341.3
60

La mediana es de 341.3, es decir, el 50% de las familias encuestadas tienen un sueldo de a los más
341.3 (en miles de pesos), y el 50% restante tiene un sueldo de al menos esa cantidad de dinero.

Pág. 21
Módulo: 1
Curso: Probabilidad y estadística

2.4 Práctica en Excel

Luego de haber estudiado las medidas de tendencia central, y ya conociendo su forma de cálculo tanto
para datos agrupados como no agrupados, lo que haremos ahora es lograr realizar estos mismos cálculos,
en el programa Excel.
Esto lo haremos para datos no agrupados, que nos entreguen, en donde para cada medida de tendencia
central utilizaremos una fórmula de Excel distinta.

2.4.1 Media
Para calcular la media la fórmula que se utilizará será “promedio()”. Para esto tendremos que colocar en
alguna celda del Excel +promedio y dentro del paréntesis deberá ir la selección de todas las celdas que
contienen los valores correspondientes al promedio que queremos calcular.
Por ejemplo, supongamos que tenemos el precio (en pesos) de un kilo de pan en 40 panaderías distintas
de la región Metropolitana, valores que se indican a continuación:

B
Precio kg pan
3 1248
4 1005
5 1094
6 1232
7 1194
8 1277
9 900
10 1268
11 1153
12 987
13 1423
14 1234
15 1039
16 1114
17 959
18 1102
19 1224
20 1425
21 1274
22 1468
23 1221
24 1272

Pág. 22
Módulo: 1
Curso: Probabilidad y estadística

25 946
26 1093
27 953
28 936
29 1266
30 1431
31 1323
32 1284
33 1312
34 1410
35 1306
36 1274
37 930
38 1349
39 1281
40 993
41 1370
42 1357

+promedio(B3:B42)

Pág. 23
Módulo: 1
Curso: Probabilidad y estadística

Al aplicar la fórmula indicada y posteriormente presionar enter, nos entregará el valor de 1185,1, es
decir en promedio el kilo de pan vale $1.185,1 pesos en las panaderías de la región metropolitana.

Tendremos algo de la siguiente manera: (ver la imagen que sigue)

Pág. 24
Módulo: 1
Curso: Probabilidad y estadística

A continuación, podemos ver como realizamos este ejercicio en Excel:

Procedimiento

Adjuntar video “Media (Excel)”

2.4.2 Moda
Para calcular la moda la fórmula que se utilizará será “moda()”. Para esto tendremos que colocar en
alguna celda del Excel +moda y dentro del paréntesis deberá ir la selección de todas las celdas que
contienen los valores correspondientes la moda que queremos calcular.

Por ejemplo supongamos que tenemos la cantidad de integrantes de del grupo familiar correspondiente
a 40 familias de Santiago, según se muestra a continuación:

B
Integrantes grupo
familiar
3 1
4 8
5 3
6 1
7 7
8 4
9 2
10 1
11 4
12 6
13 6
14 4
15 3
16 2
17 4
18 1
19 1
20 4
21 8
22 5
23 5
24 4

Pág. 25
Módulo: 1
Curso: Probabilidad y estadística

25 5
26 5
27 3
28 1
29 4
30 6
31 4
32 6
33 4
34 4
35 7
36 7
37 8
38 8
39 5
40 7
41 1
42 1

+moda(B3:B42)

Pág. 26
Módulo: 1
Curso: Probabilidad y estadística

Al aplicar la fórmula indicada y posteriormente presionar enter, nos entregará el valor de 4, es decir la
cantidad de integrantes por grupo familiar más frecuente, es decir que más se repite, es de 4.
Tendremos algo de la siguiente manera: (ver la imagen que sigue)

A continuación, podemos ver como realizamos este ejercicio en Excel:

Pág. 27
Módulo: 1
Curso: Probabilidad y estadística

Procedimiento

Adjuntar video “Moda (Excel)”

Pág. 28
Módulo: 1
Curso: Probabilidad y estadística

2.4.3 Mediana
Para calcular la mediana la fórmula que se utilizará será “mediana()”. Para esto tendremos que colocar
en alguna celda del Excel +mediana y dentro del paréntesis deberá ir la selección de todas las celdas
que contienen los valores correspondientes la mediana que queremos calcular.
Por ejemplo supongamos que tenemos la cantidad de integrantes de del grupo familiar correspondiente
a 40 familias de Santiago, según se muestra a continuación:

B
Integrantes grupo
familiar
3 1
4 8
5 3
6 1
7 7
8 4
9 2
10 1
11 4
12 6
13 6
14 4
15 3
16 2
17 4
18 1
19 1
20 4
21 8
22 5
23 5
24 4
25 5
26 5
27 3
28 1
29 4
30 6
31 4
32 6
33 4
34 4
35 7

Pág. 29
Módulo: 1
Curso: Probabilidad y estadística

36 7
37 8
38 8
39 5
40 7
41 1
42 1

+mediana(B3:B42)
Al aplicar la fórmula indicada y posteriormente presionar enter, nos entregará el valor de 4, es decir el
50% de las familias encuestadas tiene a lo más 4 integrantes en su grupo familiar, mientras que el otro
50% tiene a lo menos 4 integrantes en su grupo familiar.
Tendremos algo de la siguiente manera: (ver la imagen que sigue)

Pág. 30
Módulo: 1
Curso: Probabilidad y estadística

A continuación, podemos ver como realizamos este ejercicio en Excel:

Procedimiento

Adjuntar video “Mediana (Excel)”

Pág. 31
Módulo: 1
Curso: Probabilidad y estadística

3. Gráficos
3.1 Circular o de torta
Se usa para representar variables cualitativas como frecuencia relativa absoluta (es decir la frecuencia
absoluta en porcentaje del total) o en su menor defecto frecuencia absoluta, que si se quisiera podría
utilizarse de esta manera. Cuando se presenta como porcentaje deberá formar el 100% la torta completa,
cuando se presenta como frecuencia absoluta el total de la torta será el n (el total de datos que se tenga)
Por ejemplo, supongamos se ha encuestado a 20 personas sobre su color favorito, y ellos han respondido
lo siguiente:

Vemos que el total de la torta corresponde al 100% de los datos.

Para graficar en Excel debemos ir a insertar y seleccionar tipo de gráfico circular, como se muestra a
continuación:

Pág. 32
Módulo: 1
Curso: Probabilidad y estadística

3.2 Barra
Se utiliza para representar variables cuantitativas y cualitativas, utilizando la frecuencia absoluta, está
constituido por barras rectangulares de igual ancho, conservando cierta separación la una de la otra.
Por ejemplo, si se quiere graficar la preferencia de 20 personas hacia ciertos colores, tendríamos lo
siguiente:

Para graficar en Excel debemos ir a insertar y seleccionar tipo de gráfico Columna, como se muestra a
continuación:

Pág. 33
Módulo: 1
Curso: Probabilidad y estadística

3.3 Histograma

El Histograma es muy parecido al gráfico de barras, con la diferencia que en este solo graficaremos
variables cuantitativas continuas, es decir en vez de tener categorías o valores enteros en el eje horizontal,
tendremos intervalos de valores, por lo tanto no existirá separación entre las barras que formen el gráfico.
Por ejemplo si se quiere graficar el tiempo de espera de clientes en la fila del banco:

Para graficar en Excel debemos ir a insertar y seleccionar tipo de gráfico Columna, como se muestra a
continuación:

Se deberá seleccionar, cuando ya esté armado, sobre cualquier barra con el botón derecho y colocar la
opción Dar formato a la serie de datos, para luego en ancho de intervalo colocarlo en 0%, de esta
manera las barras quedarán sin espacio entre ellas.

Pág. 34
Módulo: 1
Curso: Probabilidad y estadística

3.4 Polígono de frecuencias


Se utiliza para graficar la frecuencia relativa absoluta (es decir la frecuencia absoluta en porcentaje del
total) o absoluta de variables cuantitativas para datos tabulados. Para construirlo en el eje horizontal
debemos colocar la marca de clase y asociada a esta en el vertical marcar el punto correspondiente a la
frecuencia relativa absoluta.
Corresponde al gráfico que se muestra a continuación:

Para graficar en Excel debemos ir a insertar y seleccionar tipo de gráfico Línea, como se muestra a
continuación:

Pág. 35
Módulo: 1
Curso: Probabilidad y estadística

3.5 Ojiva
Muy similar al polígono de frecuencias, con la diferencia que en la ojiva graficaremos frecuencias
acumuladas, ya sea frecuencia acumulada, o frecuencia relativa acumulada. La última categoría graficada
siempre deberá llegan a 1 o 100% (en caso de que hayamos graficado la frecuencia relativa acumulada),
o al total de datos n (en caso de haber graficado la frecuencia acumulada).
La gráfica se verá como se muestra a continuación (siempre en forma creciente, o al menos manteniendo
el mismo valor entre una marca de clase y otra, dado que estamos hablando de valores acumulados, por
lo que no es posible que decrezca):

Para graficar en Excel debemos ir a insertar y seleccionar tipo de gráfico Línea, como se muestra a
continuación:

Pág. 36
Módulo: 1
Curso: Probabilidad y estadística

Cierre
Durante el desarrollo de este primer módulo, nos hemos centrado en el estudio de la Estadística, que
recordemos corresponde a la ciencia que se encarga de transformar datos en información relevante para
la toma de decisiones.
También nos enfocamos en la definición de la población, muestra y muestreo, y como identificarlos en
una situación de la vida diaria, junto con estudiar los distintos tipos de muestreos, correspondientes a los
más utilizados por los investigadores.
Posteriormente, seguimos con el estudio de variables, comprendiendo que son específicamente y
estudiando sus posibles clasificaciones, ya sea cuantitativa (que corresponderá a una variable numérica),
la cual podrá ser discreta (valores enteros) o continua (valores decimales), como las cualitativas (que
corresponden a una variable de cualidad o categoría), la que podrá ser ordinal (presenta un orden) o
nominal (no presenta orden).
También estudiamos las medidas de tendencia central más utilizadas, como lo son la media, que
corresponde al valor representativo de todos los elementos estudiados, es decir si todos los objetos
estudiados tuviesen un mismo valor este correspondería al valor de la media, también estudiamos la
moda, correspondiente al valor más frecuente, es decir el que más se repite dentro de los valores que se
tienen y finalmente vimos la mediana, correspondiente al dato central, es decir el valor que está por
encima y por debajo del 50% del total de datos estudiados. Todo esto lo vimos para datos no agrupados,
y para datos agrupados, es decir tabulados.
Finalmente llevamos estas medidas de tendencia central a Excel, de manera de poder calcularlas mediante
la fórmula +promedio () para la media, +mediana () para la mediana y +moda () para la moda, en donde
dentro del paréntesis seleccionábamos los datos de los que queremos obtener las medidas indicadas.
Finalizamos el módulo estudiando los gráficos más utilizados para representar datos de manera visual,
junto con el cómo poder realizarlos en el Excel mediante el insertado de gráficos.
Lo estudiado en este módulo será de suma importancia para poder tener una visión general del cómo se
comportan los datos, de manera de poder tomar decisiones importantes, basándonos en un sustento
estadístico y visual.

Pág. 37

También podría gustarte