Está en la página 1de 8

UNIVERSIDAD NACIONAL DE COLOMBIA

FACULTAD DE CIENCIAS, SEDE BOGOTÁ


DEPARTAMENTO DE ESTADÍSTICA
BIOESTADÍSTICA FUNDAMENTAL
Taller 1. Conceptos básicos de estadística y análisis descriptivo.

A. Conceptos básicos en estadística

1. Para cada una de las situaciones de análisis inferencial presentadas a


continuación, determine:
a. La población objetivo
b. La unidad poblacional
c. La muestra
d. La unidad muestral
e. La unidad de observación
f. Si es un estudio longitudinal o transversal y por qué
g. Si es un estudio observacional o experimental y por qué

Situación 1. Unos estudiantes de la Universidad Nacional, sede Bogotá desean


estudiar las características de desplazamiento de los estudiantes del campus desde
sus hogares a la universidad y viceversa. Para ello, seleccionan al azar algunas
materias en el buscador de cursos y van en dicho horario a aplicar un cuestionario a
todos los estudiantes en las clases seleccionadas.

Situación 2. Se desea analizar el impacto de una terapia con animales en niños con
síndrome de Down. Para ello, un grupo de investigadores disponen del listado de
enfermos con síndrome de Down, cuya edad en años cumplidos no supera los 12 años
en la ciudad. Los investigadores seleccionan al azar barrios de la ciudad y deciden
incluir en el estudio a todos los niños con síndrome de Down en dichos barrios. A cada
niño se le asigna una mascota y se monitorea su progreso en visitas periódicas cada
mes.

2. A continuación encontrará un apartado del formulario de recolección de datos que


se piensa utilizar en cada una de las situaciones anteriormente descritas.
Clasifique cada una de las variables que allí se solicitan, de acuerdo con su
naturaleza (cualitativas o cuantitativas), si son cuantitativas especifique si son
discretas o continuas, y finalmente la escala en la que están medidas.

Situación 1.

1. Registre por favor su edad en años cumplidos:___________

2. Indique por favor el ingreso total mensual en su hogar en número de salarios


mínimos legales vigentes: _______
3. ¿Qué medio de transporte prefiere utilizar para desplazarse a la universidad?
a. Transporte público
b. Bicicleta
c. Vehículo particular
d. Otro, ¿cuál?:___________

4. ¿Cómo definiría su nivel de actividad física semanal? (Si realiza actividad entre
0 y 6 horas por semana, indique baja; de 7 a 10 horas por semana, indique media; y
más de 11 horas, indique alta).
a. Alta
b. Media
c. Baja

5. ¿Qué tan de acuerdo está usted con la siguiente frase: “El tiempo de transporte
de la casa al trabajo o a la universidad es un tiempo perdido”. Indique 1 si está muy
en desacuerdo y 5 si está muy de acuerdo.
□1 □2 □3 □4 □5

Situación 2

1. Rango de ingresos del hogar:


a. $0 - $1.000.000
b. $1.000.001 - $2.000.000
c. $2.000.001 - $3.000.000
d. Más de $3.000.000

2. Número de personas con las que habita el menor: _______

3. Edad de diagnóstico e inicio del tratamiento del paciente: _______

4. EPS: _____________

5. ¿Presenta el paciente o alguno de sus miembros alergias a algún tipo de


animales?

□ Sí □ No □ No sabe o no responde

3. Con base en las preguntas incluidas en el cuestionario de cada situación, indique


cuál puede ser un parámetro de interés en cada caso y cuál sería su
correspondiente estadística.

B. Análisis descriptivo de una variable.


1. Para las siguientes variables, complete la representación tabular con la
información faltante.
a. ¿Cómo se interpretan los valores en las celdas sombreadas?
b. Establezca qué se puede concluir sobre el grupo de estudio con la
información allí dada.
Variable 1. Facultades correspondientes a los estudiantes en un estudio realizado con
20 casos de deserción académica.

Facultad Frecuencia absoluta Frecuencia relativa


Ciencias Humanas 8
Ciencias Económicas 15%
Ciencias 5
Otras
TOTAL 20 100%

Variable 2. Estrato socio-económico de los estudiantes relacionados con 20 casos de


deserción académica.

F. abs. acum. F. rel. acum.


Estrato F. absoluta (fi) F. relativa (hi)
(Fi) (Hi)
1 10
2 80%
3 18
4 1
5
6 0
TOTAL 20 100% - -

2. Para las siguientes representaciones gráficas, realice una interpretación del gráfico
resaltando los aspectos más importantes que representan a dicha variable. Si la
representación es de histograma, indique si se tienen indicios de que la
distribución sea unimodal o multimodal, si es simétrica o no (y qué tipo de
asimetría presenta). Si es un diagrama de caja, indique si es simétrica o no (y qué
tipo de asimetría presenta) y si hay datos atípicos.

Variable 1. Tiempo de espera de clientes en un banco (en minutos).

Ilustración 1. Fuente: https://www.universoformulas.com/estadistica/descriptiva/histograma/

Variable 2. Tipo de experiencia negativa con un servidor de pedidos online.


Ilustración 2. Fuente: https://rockcontent.com/es/blog/diagrama-de-pareto/

Variable 3. Años de estudio relacionados para hombres y mujeres. (Analice el caso de


los hombres separado del caso de las mujeres).

Ilustración 3. Fuente: http://www.spssfree.com/curso-de-spss/graficos-en-spss/grafico-diagrama-de-caja-en-


spss.html

C. Análisis descriptivo de varias variables.


1. Dada la siguiente tabla de contingencia (incompleta) con frecuencias absolutas,
establezca la tabla de frecuencias relativas, los perfiles fila y columna e interprete
los resultados obtenidos en cada uno de ellos.

Género vs.
Soltero Casado Divorciado Viudo Total fila
Estado civil
Femenino 60 190 300
Masculino 10 20
Total col. 180 50 500

2. Para las siguientes representaciones gráficas, realice una interpretación del gráfico
resaltando los aspectos más importantes de la relación entre variables que allí se
presenta.

Caso 1. Contenido de azúcar para diferentes marcas de cereal.


Ilustración 4. Fuente: https://nubededatos.blogspot.com/2015/03/multiples-diagramas-de-caja-en-r.html

Caso 2. Relación entre criminalidad, desempleo y población

Ilustración 5. Fuente: https://blog.minitab.com/blog/starting-out-with-statistical-software/introducing-the-


bubble-plot

Caso 3. Relación entre las semanas de experiencia de un empleado y el tiempo en


minutos que tarda en hacer una operación.
Ilustración 6. https://spcgroup.com.mx/diagrama-de-dispersion/

D. Problemas sobre medidas descriptivas para variables cuantitativas.

1. El diagrama de barras de frecuencia relativa que aparece a continuación se


construyó a partir de datos obtenidos de una muestra aleatoria de 25 familias. A
cada una se le preguntó el número de cuartos de galón de leche que habían
comprado la semana previa.

Ilustración 7.

a. Use este diagrama para determinar el número de cuartos de leche comprados


por la proporción más grande de las 25 familias. La categoría asociada con la
frecuencia relativa más grande se denomina categoría modal.
b. ¿Qué proporción de las 25 familias compró más de 2 cuartos de leche?
c. ¿Qué proporción compró más de 0 pero menos de 5 cuartos?
d. Encuentre el rango intercuartílico para el conjunto de datos.

2. En las temporadas que siguieron a la de 2001 en la que implantó récord, Barry


Bonds conectó 46, 45, 45, 5 y 26 cuadrangulares, respectivamente. A continuación
aparecen dos gráficas de caja, una de los cuadrangulares de Bond en 2001 y una
segunda que incluía los años 2002-2006.
Ilustración 8.

Las medidas empleadas para construir estos diagramas se dan en la siguiente tabla.

Tam.
Año Mínimo Cuartil 1 Mediana Cuartil 3 Máximo
muestra
2001 16 25 34 41.5 73 16
2006 5 25 34 45 73 21

a. Calcule los límites superiores e inferiores del diagrama de caja.


b. ¿Tiene un sentido práctico el valor obtenido para los límites inferiores?
c. ¿Puede usted explicar por qué el número récord de cuadrangulares es un
resultado atípico en la gráfica de 2001, pero no en la gráfica de 2006?

3. Se incluyeron 10 individuos que sufren de diabetes en un estudio de un nuevo


medicamento para contrarrestar los efectos de la enfermedad. Se midió el
contenido de azúcar en sangre de cada paciente antes y después de aplicado el
tratamiento y se recogieron los datos que se muestran a continuación.

Medición antes Medición después


Paciente
(mg/dL) (mg/dL)
1 144 121
2 114 124
3 148 131
4 116 92
5 112 83
6 123 133
7 141 112
8 134 117
9 139 117
10 135 139

a. Calcule el promedio y la desviación estándar de las mediciones antes


de aplicar el tratamiento.
b. Calcule el promedio y la desviación estándar de las mediciones
después de aplicar el tratamiento.
c. Compare los valores medios antes y después. Si sólo se tuviera esa
información a la mano, ¿qué podría decirse de la efectividad del
tratamiento en los pacientes tratados?
d. Compare las desviaciones estándar antes y después. ¿Esta información
cambiaría su respuesta en el apartado anterior?
e. Calcule el coeficiente de variación de los datos antes y compárelo con
el coeficiente de variación de los datos después. ¿Cómo se interpretan
esos valores? ¿Qué análisis se podría entonces hacer con respecto a la
efectividad del tratamiento en los pacientes tratados?

También podría gustarte