Está en la página 1de 5

Práctica 2.

Métodos Descriptivos
Estadı́stica. Grado en Enfermerı́a.

2.1. Cuestiones
1. Para ver cómo de bueno es un nuevo método de medición del colesterol
se realizaron por dicho método 10 determinaciones del colesterol que
tiene una cierta persona. La variabilidad de dichas determinaciones se
midió por la varianza, que resultó ser s2 = −0, 0001. ¿Tal varianza
permite afirmar que el método es muy preciso? ¿Por qué? Responder
a la misma pregunta si fuera s2 = 0, 0001.

2. En una publicación se afirma que la mediana de un carácter es 8 y que


el percentil 40 es 9, ¿son compatibles ambos resultados?

3. Se sabe que la duración del parto en primı́paras tiene una mediana


igual a 8 horas. Interpretar el dato.

4. Si se tienen dos muestras diferentes del carácter ”causa de la muerte”,


con modalidades: ”neoplasia”, ”cardiovascular”, ”accidental” y ”otras”
¿Cómo podrı́a representarlas en una misma gráfica con fines compa-
rativos? ¿qué tipo de frecuencia debe ser considerada en el diagrama?

5. Se realizó un estudio sobre los niveles de bilirrubina en 5 individuos


normales, obteniéndose los valores siguientes: 0,38; 0,45; 0,83; 0,84;
0,92 Calculada la media y varianza de dicha muestra se obtuvo una
media de 0,38 y una desviación tı́pica de 0. Sin necesidad de hacer
operaciones, comente estos parámetros muestrales.

6. La distribución por edades de la anemia aplásica presenta dos modas:


la primera entre los 15 y 30 años y la segunda entre los 55 y 70 años
¿Qué significa esto?. Haga un esbozo de un diagrama de frecuencias
que refleje este hecho.

7. Que un recién nacido se encuentre en el percentil 3 del peso de los


recién nacidos, ¿significa que su peso equivale al 3 % del peso de un
recién nacido normal? ¿Por qué?

8. Comente la siguiente afirmación: ”Entre el 1er y el 3er cuartil está el


50 % de la población”.

9. ¿Puede tener una muestra una media de cero y una varianza de cero?
¿Por qué?

1
10. Qué criterio es preferible para seleccionar un método de entre dos (A
y B) para medir la glucosa en sangre de manera rápida si el criterio
fundamental para ello es la precisión del método.

11. Se dispone de dos métodos de medida del porcentaje de grasa corporal,


el Quadscan 4000 y el TBF-300, ambos por impedancia. Realizadas 10
medidas en un mismo individuo el CV del primero fue del 4 % y el del
segundo del 3 % ¿Cuál de los dos métodos serı́a preferido?

12. Un niño y una niña de cuatro años están en el percentil 10 y 25 respec-


tivamente de la talla para su edad y sexo. ¿Qué significan esos datos?
¿Es más alta la niña que el niño, u ocurre al revés?

13. Comente la siguiente tabla de frecuencias. ¿Es correcto decir que en


esta distribución la mediana de la variable sexo es sexo=mujer?

Distribución de los pacientes por sexo (n = 133)


Pacientes n Porcentaje Porcentaje acumulado
Mujeres 58 43.6 % 43.6 %
Hombres 75 56.4 % 100.0 %

2.2. Problemas
1. A continuación se presentan las puntuaciones, en la escala española
del test de Zarit, que evalúa la sobrecarga de n = 15 cuidadores de
personas mayores a 80 años

Cuidador 1 2 3 4 5 6 7 8 9 10
Puntuación 74 54 88 58 63 37 48 36 45 97
Cuidador 11 12 13 14 15
Puntuación 60 82 79 60 79

a) Introduzca estos datos en R y determine sus medidas descriptivas.


b) ¿Entre qué valores se encuentra el 50 % central de los casos?
c) Interprete los valores de la media y de la mediana. En base a ellos
¿cree que existe algún tipo de asimetrı́a en la distribución de las
puntuaciones?
d ) Represente los datos mediante un diagrama de caja e interprételo
convenientemente.

2
s
e) Calcule el coeficiente de variación (CV = × 100 %) de estas

puntuaciones.
f ) Calcule el rango de las puntuaciones

Sugerencias: Utilice el comando summary() o bien el menú de R Commander


Estadı́sticos → Resúmenes → Conjunto de datos activo. En este último caso, los datos
tienen que constituir un data.frame. Para obtener el diagrama de caja, use la opción
de menú de R Commander Gráficas → Diagrama de caja.... Los datos también deben
tener estructura de data.frame. Para obtener el coeficiente de variación, puede
utilizar en la consola de R las funciones mean() y sd(). Análogamente, puede
calcular el rango desde la consola utilizando las funciones max() y min().

2. Descargue el fichero de datos osteo n.RData1 . Utilizando este archivo


a) Familiarı́cese con los datos de osteo visualizando el data.frame
(botón de R Commander Visualizar datos) ¿De qué tipo es, y
como está implementada la variable edad?. ¿De qué tipo es, y
como está implementada la variable peso?
b) Estudie, mediante un histograma, la distribución del nivel de cal-
cio en sangre (variable ca) ¿Cuál cree que es la caracterı́stica más
destacable de esta distribución?
Sugerencia: Use el menú de R Commander Gráficas → Histograma.... Ob-
serve si el perfil de la distribución es aceptablemente simétrico
c) Estudie, mediante un diagrama de barras la distribución de la
variable edad. Observará que R Commander muestra un mensaje
indicando que esta variable tiene 32 valores únicos, ¿por qué cree
que lo hace? ¿cree puede resultar más apropiado otro tipo de
representación?
Sugerencia: Use la opción de menú de R Commander : Gráficas → Dibujar
una variable numérica discreta...
d ) Estudie ahora la distribución de la edad utilizando un histogra-
ma. Compare esta representación con la obtenida en el apartado
anterior ¿Cuál cree que sintetiza mejor los datos?. A la vista de
este histograma ¿qué medida debe tener una magnitud mayor, la
media o la mediana? (compruébelo obtenteniendo ambas medi-
das).
Sugerencia: puede obtener la media y la mediana desde el menú deR Com-
mander o bien escribiendo summary(osteo$edad) en la consola
e) Estudie ahora la distribución de la edad utilizando un diagrama
de caja. Interprete dicho diagrama.
1
Puede descargar el archivo y sus especificaciones través de PRADO, en la sección
Archivos de datos - Formato RData, o bien a través de los siguientes enlaces osteo n.RData
y osteo codificacion

3
Sugerencia: utilice la opción de menú Gráficas → Diagrama de caja... de R
Commander
f ) Defina un factor propiamente dicho a partir de los valores alma-
cenados en la variable sexo. La variable factor debe llamarse fsexo
y sus codificación es 1=Hombre, 2=Mujer. Consulte, a través de
la consola de R, las categorı́as del factor recién creado.
Sugerencia: Utilice la opción del menú de R Commander Datos→Modificar
variables del conjunto de datos activo→Convertir variable numérica en factor....
Una vez hecha la codificación, escriba en la consola osteo$fsexo, o bien localice
el factor en el data.frame mostrando los datos con el editor.
g) Estudie mediante un histograma la distribución de la variable talla
segmentando según los niveles del factor fsexo. A la vista de estos
diagramas ¿se puede pensar que ambos sexos son homogéneos en
términos de la talla?
h) Defina el factor fumador a partir de la variable tabaco. Los códi-
gos son 1=si, 2=no. ¿Cuántos sujetos de la base de datos son
fumadores? ¿Qué proporción representan?
Sugerencia: utilice la opción de menú Estadı́sticos → Resúmenes → Distri-
bución de frecuencias de R Commander
i ) Determine la edad media de los fumadores y de los no fumadores.
Sugerencia: utilice la opción de menú Estadı́sticos → Resúmenes → Tablas
estadı́sticas... de R Commander
j ) Determine la desviación tı́pica de la edad de los fumadores y de
los no fumadores.
Sugerencia: use el mismo procedimiento que en el apartado anterior, eso
sı́, cambiando la medida.
k ) Obtenga un nuevo data.frame denominado fumadores y obtenga
su distribución por sexos y la media y desviación tı́pica de la
edad, según el sexo y también de manera conjunta. Guarde en un
archivo .RData este data.frame.
Sugerencia: con R Commander seleccione la opción de menú Datos→Conjunto
de datos activo→Filtrar conjunto de datos activo.... Debe incluir a todas las va-
riables. La condición de filtro se puede establecer como tabaco==1 o bien
a partir del factor fumadores==”Si” (recuerde que el operador relacional de
igualdad es ”==”). Para las medidas descriptivas, considere las opciones apro-
piadas del menú Estadı́sticos→Resúmenes
l ) Defina una nueva variable llamada grupoevol que agrupe en tres
categorı́as con el mismo número de sujetos a la variable tevol
(que representa el tiempo de evolución de la enfermedad ). Las
categorı́as deberán llamarse ”corto”, ”medio” y ”largo”. Deter-
mine (a) La media y desviación tı́pica de la edad para cada una

4
de las tres categorı́as; (b) El tiempo de evolución mı́nimo medio
y máximo para cada una de las tres categorı́as.
Sugerencia: utilece la opción de menú de R Commander Datos→Modificar
variables del conjunto de datos activo→Segmentar variable numérica.... Para las
medidas descriptivas de cada categorı́a considere la opción de menú de R
Commander Estadı́sticos→ Resúmenes→Resúmenes numéricos indicando Re-
sumir según: grupoevol

3. Probando dos métodos de determinación de la presión diastólica se mi-


dió a una misma persona 15 veces con cada uno de ellos, obteniéndose
que con el método A la media de las 15 medidas fue de 9,4 con una
desviación tı́pica de 1,04, mientras que con el B la media fue de 10,4 y
la desviación tı́pica de 1.10. Explique razonadamente cuál de los dos
métodos serı́a preferible en cuanto a su precisión.

También podría gustarte