Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Probabilidad y estadística
M1 Introducción a la estadística
Módulo: 1
Curso: Probabilidad y estadística
Mapa de Contenido
Introducción a la estadística
Cáculo de
medidas de Ojiva
tendencia central
Polígono de
Frecuencia
Módulo: 1
Curso: Probabilidad y estadística
Índice
Introducción ............................................................................................................................................................................................................ 5
1. Conceptos ........................................................................................................................................................................................................... 6
1.1 Población ........................................................................................................................................................................... 6
1.2 Muestra ............................................................................................................................................................................. 7
1.2.1 Muestreo aleatorio simple ......................................................................................................................................... 7
1.2.2 Muestreo sistemático ................................................................................................................................................ 8
1.2.3 Muestreo aleatorio estratificado ............................................................................................................................... 9
1.2.4 Muestreo por conglomerados ................................................................................................................................... 9
1.3 Variable ............................................................................................................................................................................. 9
1.3.1 Variable cuantitativa ................................................................................................................................................ 10
1.3.2 Cualitativa ................................................................................................................................................................ 11
2. Medidas de tendencia central................................................................................................................................................................... 12
2.1 Media aritmética ............................................................................................................................................................. 12
2.1.1 Calculo de la media para datos no agrupados ......................................................................................................... 13
2.1.2 Calculo de la media para datos agrupados .............................................................................................................. 14
2.2 Moda ............................................................................................................................................................................... 16
2.2.1 Calculo de la moda para datos no agrupados .......................................................................................................... 16
2.2.2 Calculo de la moda para datos agrupados ............................................................................................................... 17
2.3 Mediana........................................................................................................................................................................... 18
2.3.1 Calculo de la mediana para datos no agrupados ..................................................................................................... 18
2.3.2 Calculo de la mediana para datos agrupados .......................................................................................................... 20
2.4 Práctica en Excel .............................................................................................................................................................. 22
2.4.1 Media ....................................................................................................................................................................... 22
2.4.2 Moda ........................................................................................................................................................................ 25
2.4.3 Mediana ................................................................................................................................................................... 29
Módulo: 1
Curso: Probabilidad y estadística
3. Gráficos .............................................................................................................................................................................................................. 32
3.1 Circular o de torta............................................................................................................................................................ 32
3.2 Barra ................................................................................................................................................................................ 33
3.3 Histograma ...................................................................................................................................................................... 34
3.4 Polígono de frecuencias .................................................................................................................................................. 35
3.5 Ojiva ................................................................................................................................................................................. 36
Cierre ....................................................................................................................................................................................................................... 37
Módulo: 1
Curso: Probabilidad y estadística
Resultado de aprendizaje
Calcula medidas de tendencia central, de forma manual y mediante Excel, diferenciando los
conceptos de población y muestra e identificando y clasificando la variable, en una problemática
determinada.
Introducción
Día a día nos vemos rodeados de datos y números sin siquiera darnos cuenta. Por ejemplo, al momento
de ir al supermercado y tener que observar precios, para posteriormente tomar una decisión de cuál es
el producto que más nos conviene. Algunos se guiarán por la calidad, mientras que otros podrían
comparar los precios, quedándose con el más económico, o el que cumpla en ambas categorías al menos
un cierto nivel, es decir una calidad no tan reducida a un precio no tan caro, por ejemplo.
Pues bien, todos estos datos o números con los que estamos rodeados a diario no nos sirven de nada si
no lo analizamos, por ejemplo, si veo para una cierta marca de azúcar que el kilo vale $600 y el envase
de 3 kilos $1500, y solo me quedo con los valores que veo. En el caso de querer comprar la más económica
me quedaría con la de kilo, pero si voy más allá y analizo estas dos situaciones, comprenderé que
finalmente la más económica y conveniente es la de 3 kilos, dado que el kilo me sale más barato que la
que está a $600 ($1500/3=$500). Es acá en donde entra la Estadística, que consiste en la ciencia que
transforma datos o números en información, la cual nos ayudará en la toma de decisiones.
También por ejemplo para quienes trabajan en control de calidad, quizás en algún momento su jefe les
solicita un informe correspondiente al producto que controlan, supongamos que este sea el caso, usted
esté a cargo del control de calidad de una empresa exportadora de paltas. Podría darse que últimamente
hayan llegado quejas que estas no están cumpliendo con el gramaje mínimo pactado, por lo tanto, se le
solicita a usted información respecto al último lote enviado.
Usted podría, mediante las medidas de tendencia central evaluar el peso promedio del lote enviado, por
el que han presentado quejas y compararlo con la media de lotes enviados en oportunidades anteriores.
Así podría concluir mediante evidencia estadística si este último lote está o no bajo el gramaje promedio
que siempre se envía.
Con estos ejemplos simples, pero reales, que probablemente vivamos a diario, podemos ver y ejemplificar
la importancia de la Estadística para nuestro diario vivir, tanto en pequeñas como grandes decisiones que
debamos tomar.
Es por ello que durante el módulo usted se familiarizará con estos conceptos tan importantes, de manera
tal que al finalizarlo usted dispondrá de las herramientas esenciales para llevar a cabo un buen análisis
de datos, con el cual posteriormente usted podrá transformar simples valores en información valiosa, la
que podrá utilizar tanto en su vida diaria como laboral, también sabrá aplicar mediadas de tendencia
central, a datos tabulados como no tabulados , graficar datos y finalmente lograr identificar que es una
variable y cuál es su clasificación.
Pág. 5
Módulo: 1
Curso: Probabilidad y estadística
1. Conceptos
A continuación, se detallan:
1.1 Población
Cuando tenemos un conjunto de datos que queremos analizar, lo primero es saber de dónde viene esta
información. Y es aquí donde surge el primer concepto de estadística que veremos: Población.
Cuando nos referimos a población, estamos hablando del conjunto total de individuos,
objetos o medidas que poseen características comunes observables en un lugar y en un
momento determinado. Es decir, corresponde a todos los elementos que forman cierto
universo en común.
Ejemplo colegio
Podríamos considerar como población, a todos los estudiantes de cierto colegio, en donde podemos
observar que todos comparten una cierta característica en común, que es el estar estudiando en el
mismo establecimiento, o bien a todos los pacientes de cierto hospital, donde la característica en
común sería el estar enfermo o en algún procedimiento médico, además de compartir el lugar de
estadía.
Así podemos encontrar millones de poblaciones como estas, pero demos un paso más, ¿qué pasaría si
yo quiero estudiar alguna característica en particular de alguna población? Para cuando tengo
Poblaciones pequeñas como por ejemplo una escuela rural con tan solo 15 niños no tengo problema,
pero ¿qué pasa si quiero estudiar cierta característica de alguna universidad? Acá, a diferencia de la
escuela rural, no tendremos un número pequeño de estudiantes que formen la población, sino que serán
volúmenes muy grandes, por ejemplo, una universidad promedio tiene aproximadamente 30.000
estudiantes. Si quisiéramos estudiar a cierta universidad sería imposible poder considerar a todos estos
elementos, por un tema de costo y tiempo, es por ello por lo que es acá en donde surge otro importante
concepto de la Estadística: la muestra.
Pág. 6
Módulo: 1
Curso: Probabilidad y estadística
1.2 Muestra
Cuando hablamos de una muestra nos estamos refiriendo a la selección de un subconjunto
representativo de la población. La idea de obtener una muestra es que con una cantidad
menor de información podamos tener conclusiones representativas de todos los elementos
que conforman la población.
Ejemplo
Por ejemplo, en el caso de querer estudiar cierta característica de los estudiantes de una universidad,
en vez de seleccionar a los 30.000 por los que esta se conforma, se seleccionará una muestra que
sea representativa de estos 30.000, podrían ser por ejemplo 3.000. Luego la información de estos
3.000 será representativa de toda la universidad, dado que se habrán escogido mediante alguna
técnica de muestreo que nos garantice que estamos ante la presencia de una muestra
representativa.
Pág. 7
Módulo: 1
Curso: Probabilidad y estadística
Fórmula
𝐍
𝐤=
𝐧
donde,
Ejemplo
𝑁 = 4000
𝑛 = 200
4.000
k= = 20
200
Es decir, de mi muestra ordenada por nombre del alumno entre 1 𝑦 4.000 tomaré aleatoriamente
como la primera la número 2, por lo tanto, la que sigue será la número 2 + 𝑘, es decir 2 + 20, o sea
22, luego 22 + 𝑘, es decir 22 + 20 = 42 y así sucesivamente hasta completar las 200 muestras que
requiero.
Pág. 8
Módulo: 1
Curso: Probabilidad y estadística
1.3 Variable
Siguiendo con los conceptos fundamentales asociados a la estadística podemos encontrar a
la variable.
Cuando hablamos de variable, nos referimos a la característica de los elementos de la
población que queremos estudiar, susceptible de adoptar diferentes valores.
Ejemplo
Por ejemplo, en el caso de los alumnos de cierta universidad, supongamos que queremos investigar
sobre los rangos socioeconómicos de estos, y les aplicamos una encuesta a la muestra que
habremos tomado de la población, esta encuesta podría consultar el ingreso familiar mensual, la
edad del encuestado, el número de integrantes del grupo familiar, entre otras cosas. Cualquier
característica que se mida, como las mencionadas anteriormente, corresponderá a una variable.
Pág. 9
Módulo: 1
Curso: Probabilidad y estadística
Tipos de Variables
Dentro de las variables podemos distinguir diversos tipos, las que se muestran y explican a continuación:
Una variable, que recordemos corresponde a cierta característica de una población o muestra que se
quiere estudiar, puede clasificarse en los siguientes dos grupos principales:
a. Cuantitativa – Continua
Nos referimos a variables cuantitativas que podemos expresar con decimales, como por ejemplo el peso
de una persona, podemos decir que esta pesa 80,3 kg, o la temperatura de un día cualquiera que podría
ser de 26,5 °C, entre otras.
b. Cuantitativa – Discreta
Nos referimos a variables cuantitativas que solo se pueden expresar con valores enteros (sin tomar
decimales), como por ejemplo la cantidad de hijos por persona, el número de autos, o de casa, entre
otras cosas.
Pág. 10
Módulo: 1
Curso: Probabilidad y estadística
1.3.2 Cualitativa
Cuando nos referimos a una variable cualitativa, esta corresponde a una característica para la que sus
valores son categóricos, es decir características que no se pueden medir de manera numérica, sino que
deben medirse como atributos, conceptos o cualidades.
a. Cualitativa – Ordinal
Nos referimos a variables cualitativas en las que existe relación de orden en sus categorías, como por
ejemplo la variable nivel socioeconómico, que podría tomar los valores de bajo, medio y alto nivel.
Podemos ver que entre sus cualidades existe un orden de menor a mayor nivel.
b. Cualitativa - Nominal
Nos referimos a variables cualitativas en las que no existe relación de orden en sus categorías, por
ejemplo, con la variable sexo, la que podría ser masculino y femenino. Acá no existe un orden en sus
categorías como en las ordinales.
Pág. 11
Módulo: 1
Curso: Probabilidad y estadística
Ejemplo
Por ejemplo, si tenemos un pallet de paltas y quisiéramos saber cuánto pesa cada una de ellas, sería
muy tedioso pesarlas una a una para indicar el peso por cada palta, en cambio sí calculamos la media
(promedio) de estas, podríamos saber aproximadamente cuánto pesa cada palta de las que están
dentro del pallet estudiado.
Cuando hablamos de medidas de tendencia central podemos identificar tres, las cuales corresponden a:
Ejemplo
Por ejemplo, si se desea obtener la media del peso en kilos de los alumnos de primero básico de
cierto colegio, en realidad lo que buscamos es el promedio de estos. En el caso que nos diera 30
kilos, esto significaría que, si todos los niños del curso pesaran lo mismo, este sería el valor de su
peso, o que si elegimos un niño al azar, lo más probable es que su peso se encuentre cercano a los
30 kilos.
Pág. 12
Módulo: 1
Curso: Probabilidad y estadística
Para calcular la media podemos encontrar dos formas distintas, dependiendo si los datos se encuentran
agrupados en una tabla de frecuencia o no:
Fórmula
∑𝑛𝑖=1 𝑋𝑖
𝑋̅ =
𝑛
dónde,
Ejemplo
Veamos un ejemplo:
Para el examen final de Matemáticas de cierto curso, se han registrado las siguientes calificaciones:
Pág. 13
Módulo: 1
Curso: Probabilidad y estadística
Ejemplo
∑𝑛𝑖=1 𝑋𝑖 5.8 + 6.1 + 4.5 + 6.5 + 5.5 + 6.3 + 6.7 + 6.4 + 3.1 + 5.9 + 4.8 + 4.6 66.2
𝑋̅ = = = = 5.5
𝑛 12 12
Fórmula
∑𝑛𝑖=1 𝑀𝑖 ∗ 𝑓𝑖
𝑋̅ =
𝑛
dónde,
𝑋̅: Media aritmética
𝑀𝑖 : Marca de la clase i-ésima
𝑓𝑖 : Frecuencia absoluta de la clase i-ésima
n: Cantidad total de datos
Recordemos que para calcular la marca de clases esta corresponderá al valor medio entre el límite
superior y el límite inferior del intervalo de la clase que estemos estudiando, es decir:
𝐿𝑆 + 𝐿𝐼
𝑀=
2
Dónde:
𝑀: Marca de clase
𝐿𝑆 : Límite Superior
𝐿𝐼 : Límite Inferior
Pág. 14
Módulo: 1
Curso: Probabilidad y estadística
También recordemos que la frecuencia absoluta contará el número de datos que se encuentran en el
intervalo indicado por la clase correspondiente (cada clase estará definida por una fila), es decir,
tenemos lo siguiente para una tabla de frecuencias:
Ejemplo
Por ejemplo, si esta tabla de frecuencias representara los pesos en kilógramos de los niños de cierto
jardín tendríamos que la primera clase está formada por niños que pesan entre 0 y 10 kg, siendo la
marca de clase 5 kilos (recordemos que esta corresponde al punto medio entre los límites), y
finalmente podemos observar una frecuencia absoluta de 5 niños, es decir encontramos que hay 5
niños que pesan entre 0 y 10 kilos.
Luego tenemos que la segunda clase está formada por niños que pesan entre 10 y 20 kg, siendo la
marca de clase 15 kilos (recordemos corresponde al punto medio entre los límites), y finalmente
podemos observar una frecuencia absoluta de 2 niños, es decir encontramos que hay 2 niños que
pesan entre 10 y 20 kilos.
Para terminar, tenemos que la tercera clase está formada por niños que pesan entre 20 y 30 kg,
siendo la marca de clase 25 kilos (recordemos corresponde al punto medio entre los límites), y
finalmente podemos observar una frecuencia absoluta de 3 niños, es decir encontramos que hay 3
niños que pesan entre 20 y 30 kilos.
Ahora, si quisiéramos calcular la media del peso de los niños de este jardín, la fórmula estaría dada
de la siguiente manera:
∑𝑛𝑖=1 𝑀𝑖 ∗ 𝑓𝑖 5 ∗ 5 + 15 ∗ 2 + 25 ∗ 3 130
𝑋̅ = = = = 13
𝑛 5+2+3 10
Es decir en promedio los niños pesan 13 kilos, o sea si todos los niños pesaran lo mismo, el peso
de cada uno de ellos sería de 13 kilos.
Pág. 15
Módulo: 1
Curso: Probabilidad y estadística
2.2 Moda
La moda corresponde al valor que presenta una mayor frecuencia absoluta, es decir el dato
que más se repite, será el valor más frecuente dentro del conjunto de datos a estudiar.
Para calcular la moda podemos encontrar dos formas distintas, dependiendo si los datos se encuentran
agrupados en una tabla de frecuencia o no:
Ejemplo
Por ejemplo, si se tienen las siguientes edades, las que están asociadas a niños entre 5 y 10 años
que están inscritos en cierto curso de baile:
6, 5, 6, 7, 9, 8, 7, 10 𝑦 7
Podemos ver que la moda es 7, dado que es la edad que más se repite dentro del conjunto de datos
que tenemos.
Pág. 16
Módulo: 1
Curso: Probabilidad y estadística
Fórmula
𝑓𝑖 − 𝑓𝑖−1
𝑀0 = 𝐿𝐼 + ∗𝑎
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) 𝑖
Dónde:
𝑀0 : Moda
𝐿𝐼 : Límite Inferior
𝑓𝑖 : Frecuencia absoluta clase i-ésima
𝑓𝑖−1 : Frecuencia absoluta clase anterior a la i-ésima
𝑓𝑖+1 : Frecuencia absoluta clase posterior a la i-ésima
𝑎𝑖 : amplitud del intervalo (la diferencia entre los límites, es decir Límite Superior – Límite Inferior)
Esta fórmula será aplicada en la clase modal, es decir la que presente una mayor frecuencia absoluta,
o la mayor cantidad de datos.
Ejemplo
Lo primero será identificar la clase modal, que es con la que trabajaremos. En este caso la que
presenta mayor frecuencia absoluta es la clase 2, teniendo a 10 estudiantes con una estatura entre
los 160 y 170 centímetros.
Pág. 17
Módulo: 1
Curso: Probabilidad y estadística
𝑓𝑖 − 𝑓𝑖−1
𝑀0 = 𝐿𝐼 + ∗𝑎
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) 𝑖
10 − 8
𝑀0 = 160 + ∗ (170 − 160) = 162
(10 − 8) + (10 − 2)
Es decir, la moda de los datos tabulados, o mejor dicho la estatura más frecuente de los
estudiantes encuestados es de 162 centímetros.
2.3 Mediana
La mediana corresponde al valor central de un conjunto de datos ordenados de menor a mayor,
y tiene dos interpretaciones. La primera es que el 50% de los datos se encuentra por debajo del
valor de la mediana y la otra interpretación corresponde a que el otro 50% se encuentra por
sobre el valor de la mediana.
Para calcular la mediana podemos encontrar dos formas distintas, dependiendo si los datos se encuentran
agrupados en una tabla de frecuencia o no:
Pág. 18
Módulo: 1
Curso: Probabilidad y estadística
Ejemplo
Para ejemplificar el caso de los datos impares se tienen los siguientes valores, correspondientes a
los días de vacaciones que presentan 11 trabajadores:
2 12 14 3 5 8 8 7 10 16 20
2 3 5 7 8 8 10 12 14 16 20
Podemos ver que el dato central corresponde al 8 que se ha destacado, es decir esto podría
interpretarse como que el 50% de los trabajadores tienen hasta 8 días de vacaciones, o también que
el 50% de los trabajadores tiene más de 8 días de vacaciones.
Ahora supongamos que se agrega un trabajador a este estudio, de manera de contar con 14 datos,
es decir un número par como se muestra a continuación:
2 12 14 3 5 8 8 7 10 16 20 22 4 17
2 3 4 5 7 8 8 10 12 14 16 17 20 22
Acá podemos notar que quedan dos valores en el medio por lo tanto la mediana será el promedio
de estos, es decir:
8 + 10
=9
2
Por lo tanto, la mediana es 9, es decir de este grupo de trabajadores el 50% tiene a los más 9 días
de vacaciones, mientras que el otro 50% tiene a lo menos 9 días de vacaciones.
Pág. 19
Módulo: 1
Curso: Probabilidad y estadística
Fórmula
𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝐼 + 2 ∗ 𝑎𝑖
𝑓𝑖
dónde,
𝐿𝐼 : Límite Inferior
𝑛: Total de datos
𝐹𝑖−1 : Frecuencia acumulada anterior a la clase i
𝑓𝑖 : Frecuencia absoluta de la clase i
𝑎𝑖 : Amplitud de la clase i
Recuerda
Recordemos que la frecuencia acumulada va sumando las frecuencias absolutas de las clases
anteriores hasta la que se está estudiando.
También debemos tener claro que se deberá trabajar con la clase mediana, es decir la clase donde
se encuentre el valor central de nuestro conjunto de datos.
Pág. 20
Módulo: 1
Curso: Probabilidad y estadística
Ejemplo
Por ejemplo, supongamos que de un estudio se han recopilado los valores correspondientes a los
sueldos (en miles de pesos) de 100 familias:
Si quisiéramos sacar la mediana, lo primero que debemos hacer es identificar la clase donde esta se
encuentra, de manera de trabajar con ella. De 100 datos, como es valor par, la mediana será el
promedio entre el dato que ocupa el lugar 50 y 51, por lo tanto, lo primero que debemos identificar
en que clase encontramos estos valores, es decir los que están ubicados en la posición 50 y 51. De
la tabla podemos apreciar que en la primera clase se encuentra hasta el dato que ocupa la posición
60, por lo tanto, es acá donde podemos encontrar nuestros datos, es decir la primera clase será la
clase mediana.
100
−0
𝑀𝑒 = 298 + 2 ∗ (350 − 298) = 341.3
60
La mediana es de 341.3, es decir, el 50% de las familias encuestadas tienen un sueldo de a los más
341.3 (en miles de pesos), y el 50% restante tiene un sueldo de al menos esa cantidad de dinero.
Pág. 21
Módulo: 1
Curso: Probabilidad y estadística
Luego de haber estudiado las medidas de tendencia central, y ya conociendo su forma de cálculo tanto
para datos agrupados como no agrupados, lo que haremos ahora es lograr realizar estos mismos cálculos,
en el programa Excel.
Esto lo haremos para datos no agrupados, que nos entreguen, en donde para cada medida de tendencia
central utilizaremos una fórmula de Excel distinta.
2.4.1 Media
Para calcular la media la fórmula que se utilizará será “promedio()”. Para esto tendremos que colocar en
alguna celda del Excel +promedio y dentro del paréntesis deberá ir la selección de todas las celdas que
contienen los valores correspondientes al promedio que queremos calcular.
Por ejemplo, supongamos que tenemos el precio (en pesos) de un kilo de pan en 40 panaderías distintas
de la región Metropolitana, valores que se indican a continuación:
B
Precio kg pan
3 1248
4 1005
5 1094
6 1232
7 1194
8 1277
9 900
10 1268
11 1153
12 987
13 1423
14 1234
15 1039
16 1114
17 959
18 1102
19 1224
20 1425
21 1274
22 1468
23 1221
24 1272
Pág. 22
Módulo: 1
Curso: Probabilidad y estadística
25 946
26 1093
27 953
28 936
29 1266
30 1431
31 1323
32 1284
33 1312
34 1410
35 1306
36 1274
37 930
38 1349
39 1281
40 993
41 1370
42 1357
+promedio(B3:B42)
Pág. 23
Módulo: 1
Curso: Probabilidad y estadística
Al aplicar la fórmula indicada y posteriormente presionar enter, nos entregará el valor de 1185,1, es
decir en promedio el kilo de pan vale $1.185,1 pesos en las panaderías de la región metropolitana.
Pág. 24
Módulo: 1
Curso: Probabilidad y estadística
Procedimiento
2.4.2 Moda
Para calcular la moda la fórmula que se utilizará será “moda()”. Para esto tendremos que colocar en
alguna celda del Excel +moda y dentro del paréntesis deberá ir la selección de todas las celdas que
contienen los valores correspondientes la moda que queremos calcular.
Por ejemplo supongamos que tenemos la cantidad de integrantes de del grupo familiar correspondiente
a 40 familias de Santiago, según se muestra a continuación:
B
Integrantes grupo
familiar
3 1
4 8
5 3
6 1
7 7
8 4
9 2
10 1
11 4
12 6
13 6
14 4
15 3
16 2
17 4
18 1
19 1
20 4
21 8
22 5
23 5
24 4
Pág. 25
Módulo: 1
Curso: Probabilidad y estadística
25 5
26 5
27 3
28 1
29 4
30 6
31 4
32 6
33 4
34 4
35 7
36 7
37 8
38 8
39 5
40 7
41 1
42 1
+moda(B3:B42)
Pág. 26
Módulo: 1
Curso: Probabilidad y estadística
Al aplicar la fórmula indicada y posteriormente presionar enter, nos entregará el valor de 4, es decir la
cantidad de integrantes por grupo familiar más frecuente, es decir que más se repite, es de 4.
Tendremos algo de la siguiente manera: (ver la imagen que sigue)
Pág. 27
Módulo: 1
Curso: Probabilidad y estadística
Procedimiento
Pág. 28
Módulo: 1
Curso: Probabilidad y estadística
2.4.3 Mediana
Para calcular la mediana la fórmula que se utilizará será “mediana()”. Para esto tendremos que colocar
en alguna celda del Excel +mediana y dentro del paréntesis deberá ir la selección de todas las celdas
que contienen los valores correspondientes la mediana que queremos calcular.
Por ejemplo supongamos que tenemos la cantidad de integrantes de del grupo familiar correspondiente
a 40 familias de Santiago, según se muestra a continuación:
B
Integrantes grupo
familiar
3 1
4 8
5 3
6 1
7 7
8 4
9 2
10 1
11 4
12 6
13 6
14 4
15 3
16 2
17 4
18 1
19 1
20 4
21 8
22 5
23 5
24 4
25 5
26 5
27 3
28 1
29 4
30 6
31 4
32 6
33 4
34 4
35 7
Pág. 29
Módulo: 1
Curso: Probabilidad y estadística
36 7
37 8
38 8
39 5
40 7
41 1
42 1
+mediana(B3:B42)
Al aplicar la fórmula indicada y posteriormente presionar enter, nos entregará el valor de 4, es decir el
50% de las familias encuestadas tiene a lo más 4 integrantes en su grupo familiar, mientras que el otro
50% tiene a lo menos 4 integrantes en su grupo familiar.
Tendremos algo de la siguiente manera: (ver la imagen que sigue)
Pág. 30
Módulo: 1
Curso: Probabilidad y estadística
Procedimiento
Pág. 31
Módulo: 1
Curso: Probabilidad y estadística
3. Gráficos
3.1 Circular o de torta
Se usa para representar variables cualitativas como frecuencia relativa absoluta (es decir la frecuencia
absoluta en porcentaje del total) o en su menor defecto frecuencia absoluta, que si se quisiera podría
utilizarse de esta manera. Cuando se presenta como porcentaje deberá formar el 100% la torta completa,
cuando se presenta como frecuencia absoluta el total de la torta será el n (el total de datos que se tenga)
Por ejemplo, supongamos se ha encuestado a 20 personas sobre su color favorito, y ellos han respondido
lo siguiente:
Para graficar en Excel debemos ir a insertar y seleccionar tipo de gráfico circular, como se muestra a
continuación:
Pág. 32
Módulo: 1
Curso: Probabilidad y estadística
3.2 Barra
Se utiliza para representar variables cuantitativas y cualitativas, utilizando la frecuencia absoluta, está
constituido por barras rectangulares de igual ancho, conservando cierta separación la una de la otra.
Por ejemplo, si se quiere graficar la preferencia de 20 personas hacia ciertos colores, tendríamos lo
siguiente:
Para graficar en Excel debemos ir a insertar y seleccionar tipo de gráfico Columna, como se muestra a
continuación:
Pág. 33
Módulo: 1
Curso: Probabilidad y estadística
3.3 Histograma
El Histograma es muy parecido al gráfico de barras, con la diferencia que en este solo graficaremos
variables cuantitativas continuas, es decir en vez de tener categorías o valores enteros en el eje horizontal,
tendremos intervalos de valores, por lo tanto no existirá separación entre las barras que formen el gráfico.
Por ejemplo si se quiere graficar el tiempo de espera de clientes en la fila del banco:
Para graficar en Excel debemos ir a insertar y seleccionar tipo de gráfico Columna, como se muestra a
continuación:
Se deberá seleccionar, cuando ya esté armado, sobre cualquier barra con el botón derecho y colocar la
opción Dar formato a la serie de datos, para luego en ancho de intervalo colocarlo en 0%, de esta
manera las barras quedarán sin espacio entre ellas.
Pág. 34
Módulo: 1
Curso: Probabilidad y estadística
Para graficar en Excel debemos ir a insertar y seleccionar tipo de gráfico Línea, como se muestra a
continuación:
Pág. 35
Módulo: 1
Curso: Probabilidad y estadística
3.5 Ojiva
Muy similar al polígono de frecuencias, con la diferencia que en la ojiva graficaremos frecuencias
acumuladas, ya sea frecuencia acumulada, o frecuencia relativa acumulada. La última categoría graficada
siempre deberá llegan a 1 o 100% (en caso de que hayamos graficado la frecuencia relativa acumulada),
o al total de datos n (en caso de haber graficado la frecuencia acumulada).
La gráfica se verá como se muestra a continuación (siempre en forma creciente, o al menos manteniendo
el mismo valor entre una marca de clase y otra, dado que estamos hablando de valores acumulados, por
lo que no es posible que decrezca):
Para graficar en Excel debemos ir a insertar y seleccionar tipo de gráfico Línea, como se muestra a
continuación:
Pág. 36
Módulo: 1
Curso: Probabilidad y estadística
Cierre
Durante el desarrollo de este primer módulo, nos hemos centrado en el estudio de la Estadística, que
recordemos corresponde a la ciencia que se encarga de transformar datos en información relevante para
la toma de decisiones.
También nos enfocamos en la definición de la población, muestra y muestreo, y como identificarlos en
una situación de la vida diaria, junto con estudiar los distintos tipos de muestreos, correspondientes a los
más utilizados por los investigadores.
Posteriormente, seguimos con el estudio de variables, comprendiendo que son específicamente y
estudiando sus posibles clasificaciones, ya sea cuantitativa (que corresponderá a una variable numérica),
la cual podrá ser discreta (valores enteros) o continua (valores decimales), como las cualitativas (que
corresponden a una variable de cualidad o categoría), la que podrá ser ordinal (presenta un orden) o
nominal (no presenta orden).
También estudiamos las medidas de tendencia central más utilizadas, como lo son la media, que
corresponde al valor representativo de todos los elementos estudiados, es decir si todos los objetos
estudiados tuviesen un mismo valor este correspondería al valor de la media, también estudiamos la
moda, correspondiente al valor más frecuente, es decir el que más se repite dentro de los valores que se
tienen y finalmente vimos la mediana, correspondiente al dato central, es decir el valor que está por
encima y por debajo del 50% del total de datos estudiados. Todo esto lo vimos para datos no agrupados,
y para datos agrupados, es decir tabulados.
Finalmente llevamos estas medidas de tendencia central a Excel, de manera de poder calcularlas mediante
la fórmula +promedio () para la media, +mediana () para la mediana y +moda () para la moda, en donde
dentro del paréntesis seleccionábamos los datos de los que queremos obtener las medidas indicadas.
Finalizamos el módulo estudiando los gráficos más utilizados para representar datos de manera visual,
junto con el cómo poder realizarlos en el Excel mediante el insertado de gráficos.
Lo estudiado en este módulo será de suma importancia para poder tener una visión general del cómo se
comportan los datos, de manera de poder tomar decisiones importantes, basándonos en un sustento
estadístico y visual.
Pág. 37