Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística
“Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de
cualquier otra manifestación de las sociedades humanas” (RAE, 2020).
“La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como
para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis” (R. Spiegel, 1991).
La bioestadística se aplica a diferentes áreas y carreras relacionadas con las ciencias de la vida (Psicología,
Enfermería, Biología, Medicina, Kinesiología, Nutrición).
Conceptos Clave
1. Estadística: Ciencia que permite la recolección, orden, análisis y aplicación de
datos, esto para la toma de decisiones.
Ejemplo: El 45% de las personas odia al Sr. Manguera, mientras el 55% de las
personas no quiere al Sr. Manguera.
Estadística Descriptiva
Describe y sintetiza datos, se dedica a expresar los datos a través de Tablas de Frecuencia, Índices
estadísticos y Métodos Gráficos.
¿Sabían que existe un lugar dónde ver las estadísticas en tiempo real?
https://www.worldometers.info/es/
Tipos de Variables
Variable: Características de los individuos, las cuales se desean observar.
● Preguntas dicotómicas
● Preguntas que deben ser traducidas a un número.
Numéricas o Cuantitativas: Es un carácter numérico, corresponden a números reales y contables.
Niveles de Medición
▪ Categóricas:
Nominales
Ordinales
Cada información a considerar no sigue
Siguen un orden, de menor a mayor.
un orden específico.
Ej: Encuestas de Satisfacción (1-5) Ej: Sexo (Hombre 0, Mujer 1)
▪ Escala:
Se determina en el Nivel de Medición un “0” Existe un “0” Absoluto, por ende 0 toma un
conveniente, el “0” es más bien un punto de significado de “ausencia”.
referencia.
Ej: Grados Kelvin (0° Kelvin, es igual a la ausencia
Ej: Grados Celsius (0° no representa un 0 Absoluto, de movimiento molecular).
sino más bien el punto de fusión).
0 Kgs es igual a la ausencia de Kilos.
Tablas de Frecuencia
Las tablas de frecuencia deben:
1. Entregar información ordenada y fácil de leer.
2. No dar espacio a dudas o confusiones.
3. Facilitar la interpretación de datos.
4. Expresar el 100% de los datos recolectados.
a) Tabla de Nivel I:
Se utiliza para variables Discretas (Cuantitativas).
¿Una pista?
Números sin división.
1,5 Hijos
Exacto, cifras que no se pueden dividir.
ni: Recopilación de datos Xi: 0 Mascotas Ni: Sumatoria de ni del Fi: Sumatoria de la primera
según el valor que tome la primer valor, sumatoria de frecuencia relativa,
1 Mascota
variable ni del primer y segundo sumatoria de la primera y
2 Mascotas valor de la variable… segunda frecuencia
tamaño muestral. relativa… 1.
3 Mascotas
4 Mascotas
5 Mascotas
¿Cómo se puede Interpretar las diferentes informaciones obtenidas de la Tabla de Nivel I?
● Se puede observar que existen 22 de personas censadas sin mascotas en sus hogares.
n: Sumatoria
● Existedeuntodos
36%los
deni.
personas que poseen solo una mascota en sus hogares.
● Se puede observar que 48 personas de esta tabla tienen entre 0 y 3 mascotas en sus hogares
● El 98% de las personas censadas tiene entre 0 y 4 mascotas en sus hogares.
Tabla de nivel II
Se deben armar los intervalos correspondientes Calcular Rango
para hacer el uso de esta tabla. Existen dos
maneras de hacerlo: Se debe restar el valor más alto de la muestra, con el
valor más bajo.
Criterio propio, esto definiendo el tamaño del intervalo
y la amplitud que tendrá este, si no hay experticia en
esto no se recomienda.
Calcular la Cantidad de Intervalos
Aplicación de formula para estimar la cantidad de
intervalos y la amplitud que estos tendrán Se puede aplicar la siguiente fórmula, el resultado debe
ser aproximado.
Se recomienda:
Ejemplo:
Ejemplo
La muestra representa a la clasificación de pesos y tallas de 100 personas.
e) Tabla de Triple Entrada:
Se puede utilizar tanto para variables Cualitativas, como Cuantitativas. En el caso de usar
variables cuantitativas se pueden utilizar intervalos para ordenar la información.
Ejemplo:
MINSAL trabaja en el desarrollo
de una App para prevenir el
desarrollo de obesidad durante
la cuarentena. Para esto, el área
informática necesita hacer un
muestreo de 400 individuos,
indicando SO más utilizados
según edad y género.
3 Medidas características (T.C)
1. Medidas Características
2. de Tendencia Central
3. Media Aritmética
4. Mediana
5. Moda
Medidas Características
Las Medidas o Valores típicos son datos que permiten simplificar la información de cientos de datos,
expresados en uno o más valores.
Las medidas son utilizadas para variables cuantitativas, nos permiten obtener información general, pero
para fines estadísticos es recomendable analizar más de una variable, esto para obtener información útil.
Hay dos panes. Usted se come dos. Yo ninguno. Consumo promedio: un pan por persona.
(Nicanor Parra)
El PIB Chile (2019) per cápita es de $USD 14.896 (Datos del Banco Mundial)
El dólar hoy, fecha de 11 de Mayo corresponde a $696 CLP (Datos del Diario Financiero)
Esto se puede interpretar de la siguiente forma: El ingreso per cápita de un habitante en Chile es de
$10.367.616 CLP anuales.
Si lo dividimos en 12 meses, podemos obtener el ingreso mensual de cada habitante, siendo un total de
$863.968 CLP.
2) Mediana
Es el valor que separa en dos grupos iguales al total de datos obtenidos según sus magnitudes (el valor
que ocupa el lugar central de una serie de números ordenados).
¿Cómo se obtiene el VALOR?
- Se ordenan los números (de menor a mayor).
- Se determina la posición del dato.
- Se verifica si el tamaño de muestra es par o impar.
- Si es impar, solo bastará con tomar el número según la posición.
- Si es par, se tomarán los dos valores centrales y se hará un promedio entre ellos.
No es lo mismo…
Determinar el valor de la Mediana
7+1 = Posición 4.
.2
- Finalmente, revisamos si el tamaño de la muestra es par o impar. Si es impar, no hay que hacer
nada, solo buscar el valor y seleccionarlo.
3,4,5,7,8,11,14 La mediana es 7.
- Finalmente, revisamos si es par o impar la muestra. En este caso es par, por ende tomaremos los
valores centrales y sacaremos un promedio, esta será nuestra mediana.
● Mediana: (7+8)/2
● Mediana: 15/2 4,5,6,7,7,8,9,14,16,24 La mediana es 7,5.
● Mediana: 7,5
Tabla de Nivel I:
Como podemos ver, tenemos un tamaño de nuestra de 50
(n=50).
(50+1)/2= 25,5
El valor de la Mediana es 1.
3) Moda
La moda es el dato que más se repite, es decir, el que tiene mayor frecuencia. Un conjunto de datos
puede tener una sola moda (unimodal), dos modas (bimodal) o más modas (plurimodal). Si todos los
datos se repiten la misma cantidad de veces, entonces es amodal.
¿Cómo se obtiene?
Se ordenan los datos de forma ascendente y se selecciona el dato que visiblemente más se repite.
- Solo hay que ver cual es el dato con mayor frecuencia absoluta.
- Fácil.
- La Moda es 0.
( datos sacados de la tabla nivel 1 de la media)
Mientras que las Medidas de Posición son parámetros estadísticos que permiten dividir la cantidad de
datos en partes porcentuales iguales, y permiten realizar una clasificación para una determinada
muestra.
1) Mediana
Es el valor que separa en dos grupos iguales al total de datos obtenidos según sus magnitudes, valor
que ocupa el lugar central de una serie de números ordenados.
2) Cuartiles
Son aquellos 3 valores de la variable que dividen al conjunto de datos ordenados en cuatro partes
iguales.
Si bien su resolución se traduce a fórmulas, siempre
es necesario hacer una visualización general de los
datos, esto para poder elegir correctamente cuales
son los tres valores que representarán el 25%, el 50%
y el 75% de los datos.
No es lo mismo…
El valor del Cuartil
Ejemplo 2
C2= 1
C3= 1
3) Quintiles
Son aquellos 4 valores que dividen al conjunto de datos ordenados en CINCO partes iguales. Si bien su
resolución se traduce a fórmulas, siempre es necesario hacer una visualización general de los datos. A
diferencia de los Cuartiles estos no involucran el uso de la mediana, por ende deben ser resueltos según
posiciones.
Estos valores que representarán el 20%, 40%, 60% y 80% de los datos respectivamente.
Ejemplo 1 quintiles
2, 3, 5, 8, 10, 11, 13, 16, 19, 20, 24, 28, 31, 33, 35 ¿Cuáles serían los valores respectivos?
Q1= 6,5
Pos (Q1) = 1(15+1)/5 = 3,2 Q2= 12
Pos (Q2) = 2(15+1)/5 = 6,4
Pos (Q3) = 3(15+1)/5 = 9,6 Q3= 19,5
Pos (Q4) = 4(15+1)/5 = 12,8
4) Deciles Q4= 29,5
Son aquellos 9 valores de la variable que dividen al conjunto de
datos ordenados en DIEZ partes iguales.
5) Percentiles
Son los 99 valores que dividen al conjunto ordenado de datos en
CIEN partes iguales.
4 Medidas de dispersión
Medidas de Dispersión
1) Rango o Recorrido
2) Desviación Media
3) Varianza
4) Desviación Estándar
5) Coeficiente de Variación
2) Desviación media
Es un valor que indica el promedio en valor absoluto de las desviaciones de todos los datos respecto a
la media.
¿Cómo se obtiene?
66/6 = 11
X1: |3 – 11| = |-8| = 8+4+2+1+4+9 .
6
X2: |7 – 11| = |-4|
= 28/6
X3: |9 – 11| = |-2|
= 4,67
X4: |12 - 11| = |1|
+ Utilizar la Desviación Media nos permitirá tener un promedio de cuánto se desplazan
certeramente los datos de la media.
- Es una medida de dispersión poco usada debido a la dificultad de hacer cálculos con la función
valor absoluto.
No es lo mismo…
Desviación Media
Desviación Estándar
3) Varianza
- Es el promedio de los cuadrados de las diferencias de cada uno de los datos y la media.
- La varianza NO ES un valor negativo (debido al ser obtenida entre valores elevados al cuadrado).
- El menor valor que puede adquirir es 0, donde se comprende que entre la media y los valores a
considerar no existe ninguna distancia o dispersión.
- Existe una fórmula diferente para calcular varianza de una población (σ 2) y varianza de una
Muestra (s2).
Figura 123
4) Desviación Estándar
- Corresponde a la raíz de la varianza, esto debido a que la varianza está expresada en valores
cuadráticos, por ende, es necesario obtener la raíz de esta.
- Existe una fórmula diferente para calcular D. Estándar de una población (σ) y D. Estándar de una
Muestra (s).
Ejemplo: Tomaremos los siguientes valores:
3, 7, 9, 12, 15, 20
- Si recordamos la varianza del ejercicio anterior tomó un valor de 30,3. Por lo tanto, solo habría que
sacar su raíz
= 30,3
= √30,3
= 5,5
5) Coeficiente de variación
- Es una medida de dispersión relativa, por ende, nos permite saber cuanto es la dispersión del dato
expresado en porcentajes.
- Al igual que en los casos de Varianza y Desviación Estándar, se puede calcular el Coeficiente de
Variación de una población (σ) y el Coeficiente de Variación de una Muestra (s).
3, 7, 9, 12, 15, 20
- Sigamos con el ejemplo anterior, donde se nos mencionó anteriormente los valores del promedio y
desviación estándar.
= 5,5/11
Desviación Estándar: 5,5
= 50%