Está en la página 1de 22

Bioestadı́stica Fundamental

UNIDAD I - Conceptos básicos

Profesor: Fernando Peña-Ramı́rez


Departamento de Estatı́stica - Universidad Nacional de Colombia

Fernando Peña-Ramı́rez 1 / 22
Población y muestra

Definición
Población Es un conjunto de elementos que son de interés para
alguna pregunta o experimento.
Todo y cualquier subconjunto de la población es denominado de
muestra.

Fernando Peña-Ramı́rez 2 / 22
Estadı́stica descriptiva e inductiva

Estadı́stica descriptiva
Son los procedimientos usados para organizar, resumir y presentar los
datos. Podemos describir la información obtenidas, tanto de
poblaciones como de muestras.

Cuidado!!! No todas las muestras son representativas, o sea, no todas


preservan las caracterı́sticas poblacionales.

Estadı́stica inductiva (o inferencial)


Es la colección de métodos y técnicas utilizadas para estudiar una
población basada en muestras que la representan, atendiendo a un
determinado grado de acierto.

Fernando Peña-Ramı́rez 3 / 22
Las variables y sus clasificaciones

Variables
Llamaremos variables a las caracteristicas que pueden ser
observadas (o medidas) en cada elemento de la población, bajo las
mismas condiciones.

−→Intuitivamente: Podemos pensar en variables como “cosas que


varian entre individuos y que pueden ser medidas”

Fernando Peña-Ramı́rez 4 / 22
Fernando Peña-Ramı́rez 5 / 22
Ejemplo 1:
Determine si las siguientes variables son cuantitativas o cualitativas:

a Cantidad de café vendido por la cafeterı́a de la facultad.


b Color de los ojos de los alumnos de la asignatura Bioestadı́stica
Fundamental.
c Producto Interno Bruto (PIB) de los municipios colombianos.
d Número de asaltos ocurridos en Bogotá en el año 2021.
e Peso de los alumnos del curso de Bioestadı́stica Fundamental.
f La palabra más recordada por los alumnos de la asignatura de
Bioestadı́stica Fundamental cuando les preguntan ”¿qué es
estadı́stica?”.

Fernando Peña-Ramı́rez 6 / 22
También podemos clasificar las variables en subgrupos

Fernando Peña-Ramı́rez 7 / 22
1 Variables nominales: no existe orden entre las categorı́as.
2 Variables ordinales: existe un orden entre las categorı́as.

Fernando Peña-Ramı́rez 8 / 22
1 Variables discretas: caracterı́sticas mensurables que pueden
asumir apenas un número finito o infinito contable de valores y,
ası́, solamente toma valores enteros. Generalmente son
resultados de conteos.
2 Variables continuas: caracterı́sticas mensurables que asumen
valores en una escala continua (recta real), para las cuales, los
valores fraccionarios tienen sentido. Usualmente deben ser
medidos a través de algún instrumento.

Fernando Peña-Ramı́rez 9 / 22
Ejemplo 2:
Identifique si las variables presentadas en el Ejemplo 1 son nominales,
ordinales, discretas o continuas.

Fernando Peña-Ramı́rez 10 / 22
Series estadı́sticas.
Serie cronológica, temporal, evolutiva o histórica.
Serie geográfica o de localización.
Serie especı́fica.

Representaciones gráficas.
Gráficos para variables cualitativas.
Gráficos para variables cuantitativas.

Fernando Peña-Ramı́rez 11 / 22
Series estadı́sticas

Podemos representar los datos a través de la construcción de tablas


estadı́sticas. Una tabla debe presentar las siguientes caracterı́sticas:
Encabezado: debe informar lo que se está representado, dónde y cuándo ocurrió.
Cuerpo es representado por columnas y sub-columnas dentro de las cuales
de la tabla es registrada la información
Variable 1 información 1
Variable 2 información 2
Variable 3 información 3
.. ..
. .
Nota al pié: es reservado para observaciones pertinentes a la tabla, como el registro e identificación de la fuente de los datos.

Fernando Peña-Ramı́rez 12 / 22
Serie cronológica, temporal, evolutiva o histórica

Es una serie en la que los datos son observados según la época en


que ocurrieron.

Ejemplo:

Tabla 1: Tasa mensual de incumplimiento de compromisos de las operaciones de


crédito del Sistema Financeiro Nacional en Rio Grande do Sul - Personas fı́sicas
Mes/año Incumplimiento ( %)
ago/2017 2,58
sep/2017 2,59
oct/2017 2,69
nov/2017 2,60
dic/2017 2,43
ene/2018 2,58
Fuente: Banco Central do Brasil - https://www.bcb.gov.br/?SGS. Acceso en 20/03/2018.

Fernando Peña-Ramı́rez 13 / 22
Serie geográfica o de localización

Es la serie en la que los datos son observados según el lugar de


ocurrencia.

Ejemplo:

Tabla 2: Producción de miel de abeja para algunos estados de Brasil en el año de


2016.
Estado Producción (R$ x1000 )
Rio Grande do Sul 81.783
Paraná 67.288
Santa Catarina 62.238
Minas Gerais 51.541
São Paulo 45.066
Fuente: IBGE - https://cidades.ibge.gov.br/. Acceso en 21/03/2018.

Fernando Peña-Ramı́rez 14 / 22
Serie especı́fica

Es la serie en la que los datos son agrupados según alguna


modalidad o categorı́a de ocurrencia.

Ejemplo:

Tabla 3: Matrı́culas de grado tercero en Brasil en 1975 (cı́clo básico).


Área Nº de matrı́culas
Ciencias biológicas 32109
Ciencias exactas y tecnologı́a 65949
Ciencias agrarias 2419
Ciencias humanas 148842
Fuente: Servicio de Estadı́stica de la Educación y Cultura, apud Fonseca (1996).

Fernando Peña-Ramı́rez 15 / 22
Representaciones gráficas

Otra forma de resumir información es a través de representaciones


gráficas. Los gráficos son utilizados para diversos fines, entre ellos:

Buscar patrones y relaciones entre los datos;


Verificar ciertas suposiciones sobre los datos;
Facilitar la visualización de los resultados.

Fernando Peña-Ramı́rez 16 / 22
2Gráficos para variables cualitativas

a) Gráfico de barras
Son usados para describir datos de tipo cualitativo que están
clasificados en variables categóricas (eventualmente puede ser usado
con variables cuantitativas). Para construir el gráfico se crean
categorı́as que son rotuladas y representadas por intervalos de igual
tamaño en un eje horizontal. El conteo o frecuencia dentro de la
categorı́a correspondiente, es representada por una barra de altura
que sea proporcional.

b) Diagrama de Sectores
Para la construcción de un diagrama de sectores, divide un cı́rculo en
sectores de modo que cada sector que representa una categorı́a sea
proporcional al tamaño de la categorı́a.

Fernando Peña-Ramı́rez 17 / 22
Ejemplo 1
Los siguientes datos son los ingresos anuales (en millones) de dólares
de cinco compañı́as: A = 78 B = 92 C = 95 D = 44 E = 102

Fernando Peña-Ramı́rez 18 / 22
Los comandos en R para el gráfico de barras:
ingresos<-c(68 , 82 , 95 , 44 , 102)
barplot(ingresos,
names.arg = c("A","B","C","D","E"),
main="Ingresos anuales (en millones) de
dólares de cinco compañı́as",
xlab = "Compañı́as",
ylab = "Ingresos anuales (en millones) de
dólares")

Fernando Peña-Ramı́rez 19 / 22
Ejemplo 2:
Una live hecha en el perfil de Instagram de la empresa Sigma Jr Consultorı́a
Estadı́stica tuvo 55 participantes. En el formulario de inscripción fueron
recolectados datos sobre el género de los participantes y se verificó que 25
eran de género masculino y 30 de género feminino.
Fuente: https://www.instagram.com/p/CFnhpYcMwzk/

Los comandos en R para el diagrama de sectores:


genero<-c(25,30)
pie(genero,labels = paste0(genero, "%"),col = c(0,3))
legend("topleft", legend = c("Hombres", "Mujeres"),
fill = c(0,3))

Fernando Peña-Ramı́rez 20 / 22
Diagrama de sectores

Figura 1: Diagrama de sectores para os datos de la Tabla 2.


Fernando Peña-Ramı́rez 21 / 22
b) Diagrama de dispersión
Es un gráfico que considera cada observación como un punto en una
lı́nea trazada, de acuerdo con las unidades de medida de la variable.

Los comandos en R para el diagrama de dispersión:


library(MASS)
View(Cars93)
plot(Cars93$EngineSize,
Cars93$Horsepower,
xlab="Tamaño del motor",
ylab = "Caballos de fuerza",
main = "Desempeño")

Fernando Peña-Ramı́rez 22 / 22

También podría gustarte