Práctica 2 - Estadística Descriptiva

Práctica 2.
Métodos Descriptivos
Estadı́stica. Grado en Enfermerı́a.
2.1. Cuestiones
1. Para ver cómo de bueno es un nuevo método de medición del colesterol
se realizaron por dicho método 10 determinaciones del colesterol que
tiene una cierta persona. La variabilidad de dichas determinaciones se
midió por la varianza, que resultó ser s2 = −0, 0001. ¿Tal varianza
permite afirmar que el método es muy preciso? ¿Por qué? Responder
a la misma pregunta si fuera s2 = 0, 0001.
2. En una publicación se afirma que la mediana de un carácter es 8 y que

el percentil 40 es 9, ¿son compatibles ambos resultados?
3. Se sabe que la duración del parto en primı́paras tiene una mediana

igual a 8 horas. Interpretar el dato.
4. Si se tienen dos muestras diferentes del carácter ”causa de la muerte”,

con modalidades: ”neoplasia”, ”cardiovascular”, ”accidental” y ”otras”
¿Cómo podrı́a representarlas en una misma gráfica con fines compa-
rativos? ¿qué tipo de frecuencia debe ser considerada en el diagrama?
5. Se realizó un estudio sobre los niveles de bilirrubina en 5 individuos

normales, obteniéndose los valores siguientes: 0,38; 0,45; 0,83; 0,84;
0,92 Calculada la media y varianza de dicha muestra se obtuvo una
media de 0,38 y una desviación tı́pica de 0. Sin necesidad de hacer
operaciones, comente estos parámetros muestrales.
6. La distribución por edades de la anemia aplásica presenta dos modas:

la primera entre los 15 y 30 años y la segunda entre los 55 y 70 años
¿Qué significa esto?. Haga un esbozo de un diagrama de frecuencias
que refleje este hecho.
7. Que un recién nacido se encuentre en el percentil 3 del peso de los

recién nacidos, ¿significa que su peso equivale al 3 % del peso de un
recién nacido normal? ¿Por qué?
8. Comente la siguiente afirmación: ”Entre el 1er y el 3er cuartil está el

50 % de la población”.
9. ¿Puede tener una muestra una media de cero y una varianza de cero?
¿Por qué?
1
10. Qué criterio es preferible para seleccionar un método de entre dos (A
y B) para medir la glucosa en sangre de manera rápida si el criterio
fundamental para ello es la precisión del método.
11. Se dispone de dos métodos de medida del porcentaje de grasa corporal,

el Quadscan 4000 y el TBF-300, ambos por impedancia. Realizadas 10
medidas en un mismo individuo el CV del primero fue del 4 % y el del
segundo del 3 % ¿Cuál de los dos métodos serı́a preferido?
12. Un niño y una niña de cuatro años están en el percentil 10 y 25 respec-

tivamente de la talla para su edad y sexo. ¿Qué significan esos datos?
¿Es más alta la niña que el niño, u ocurre al revés?
13. Comente la siguiente tabla de frecuencias. ¿Es correcto decir que en

esta distribución la mediana de la variable sexo es sexo=mujer?
Distribución de los pacientes por sexo (n = 133)

Pacientes n Porcentaje Porcentaje acumulado
Mujeres 58 43.6 % 43.6 %
Hombres 75 56.4 % 100.0 %
2.2. Problemas
1. A continuación se presentan las puntuaciones, en la escala española
del test de Zarit, que evalúa la sobrecarga de n = 15 cuidadores de
personas mayores a 80 años
Cuidador 1 2 3 4 5 6 7 8 9 10
Puntuación 74 54 88 58 63 37 48 36 45 97
Cuidador 11 12 13 14 15
Puntuación 60 82 79 60 79
a) Introduzca estos datos en R y determine sus medidas descriptivas.

b) ¿Entre qué valores se encuentra el 50 % central de los casos?
c) Interprete los valores de la media y de la mediana. En base a ellos
¿cree que existe algún tipo de asimetrı́a en la distribución de las
puntuaciones?
d ) Represente los datos mediante un diagrama de caja e interprételo
convenientemente.
2
s
e) Calcule el coeficiente de variación (CV = × 100 %) de estas
x̄
puntuaciones.
f ) Calcule el rango de las puntuaciones
Sugerencias: Utilice el comando summary() o bien el menú de R Commander

Estadı́sticos → Resúmenes → Conjunto de datos activo. En este último caso, los datos
tienen que constituir un data.frame. Para obtener el diagrama de caja, use la opción
de menú de R Commander Gráficas → Diagrama de caja.... Los datos también deben
tener estructura de data.frame. Para obtener el coeficiente de variación, puede
utilizar en la consola de R las funciones mean() y sd(). Análogamente, puede
calcular el rango desde la consola utilizando las funciones max() y min().
2. Descargue el fichero de datos osteo n.RData1 . Utilizando este archivo

a) Familiarı́cese con los datos de osteo visualizando el data.frame
(botón de R Commander Visualizar datos) ¿De qué tipo es, y
como está implementada la variable edad?. ¿De qué tipo es, y
como está implementada la variable peso?
b) Estudie, mediante un histograma, la distribución del nivel de cal-
cio en sangre (variable ca) ¿Cuál cree que es la caracterı́stica más
destacable de esta distribución?
Sugerencia: Use el menú de R Commander Gráficas → Histograma.... Ob-
serve si el perfil de la distribución es aceptablemente simétrico
c) Estudie, mediante un diagrama de barras la distribución de la
variable edad. Observará que R Commander muestra un mensaje
indicando que esta variable tiene 32 valores únicos, ¿por qué cree
que lo hace? ¿cree puede resultar más apropiado otro tipo de
representación?
Sugerencia: Use la opción de menú de R Commander : Gráficas → Dibujar
una variable numérica discreta...
d ) Estudie ahora la distribución de la edad utilizando un histogra-
ma. Compare esta representación con la obtenida en el apartado
anterior ¿Cuál cree que sintetiza mejor los datos?. A la vista de
este histograma ¿qué medida debe tener una magnitud mayor, la
media o la mediana? (compruébelo obtenteniendo ambas medi-
das).
Sugerencia: puede obtener la media y la mediana desde el menú deR Com-
mander o bien escribiendo summary(osteo$edad) en la consola
e) Estudie ahora la distribución de la edad utilizando un diagrama
de caja. Interprete dicho diagrama.
1
Puede descargar el archivo y sus especificaciones través de PRADO, en la sección
Archivos de datos - Formato RData, o bien a través de los siguientes enlaces osteo n.RData
y osteo codificacion
3
Sugerencia: utilice la opción de menú Gráficas → Diagrama de caja... de R
Commander
f ) Defina un factor propiamente dicho a partir de los valores alma-
cenados en la variable sexo. La variable factor debe llamarse fsexo
y sus codificación es 1=Hombre, 2=Mujer. Consulte, a través de
la consola de R, las categorı́as del factor recién creado.
Sugerencia: Utilice la opción del menú de R Commander Datos→Modificar
variables del conjunto de datos activo→Convertir variable numérica en factor....
Una vez hecha la codificación, escriba en la consola osteo$fsexo, o bien localice
el factor en el data.frame mostrando los datos con el editor.
g) Estudie mediante un histograma la distribución de la variable talla
segmentando según los niveles del factor fsexo. A la vista de estos
diagramas ¿se puede pensar que ambos sexos son homogéneos en
términos de la talla?
h) Defina el factor fumador a partir de la variable tabaco. Los códi-
gos son 1=si, 2=no. ¿Cuántos sujetos de la base de datos son
fumadores? ¿Qué proporción representan?
Sugerencia: utilice la opción de menú Estadı́sticos → Resúmenes → Distri-
bución de frecuencias de R Commander
i ) Determine la edad media de los fumadores y de los no fumadores.
Sugerencia: utilice la opción de menú Estadı́sticos → Resúmenes → Tablas
estadı́sticas... de R Commander
j ) Determine la desviación tı́pica de la edad de los fumadores y de
los no fumadores.
Sugerencia: use el mismo procedimiento que en el apartado anterior, eso
sı́, cambiando la medida.
k ) Obtenga un nuevo data.frame denominado fumadores y obtenga
su distribución por sexos y la media y desviación tı́pica de la
edad, según el sexo y también de manera conjunta. Guarde en un
archivo .RData este data.frame.
Sugerencia: con R Commander seleccione la opción de menú Datos→Conjunto
de datos activo→Filtrar conjunto de datos activo.... Debe incluir a todas las va-
riables. La condición de filtro se puede establecer como tabaco==1 o bien
a partir del factor fumadores==”Si” (recuerde que el operador relacional de
igualdad es ”==”). Para las medidas descriptivas, considere las opciones apro-
piadas del menú Estadı́sticos→Resúmenes
l ) Defina una nueva variable llamada grupoevol que agrupe en tres
categorı́as con el mismo número de sujetos a la variable tevol
(que representa el tiempo de evolución de la enfermedad ). Las
categorı́as deberán llamarse ”corto”, ”medio” y ”largo”. Deter-
mine (a) La media y desviación tı́pica de la edad para cada una
4
de las tres categorı́as; (b) El tiempo de evolución mı́nimo medio
y máximo para cada una de las tres categorı́as.
Sugerencia: utilece la opción de menú de R Commander Datos→Modificar
variables del conjunto de datos activo→Segmentar variable numérica.... Para las
medidas descriptivas de cada categorı́a considere la opción de menú de R
Commander Estadı́sticos→ Resúmenes→Resúmenes numéricos indicando Re-
sumir según: grupoevol
3. Probando dos métodos de determinación de la presión diastólica se mi-

dió a una misma persona 15 veces con cada uno de ellos, obteniéndose
que con el método A la media de las 15 medidas fue de 9,4 con una
desviación tı́pica de 1,04, mientras que con el B la media fue de 10,4 y
la desviación tı́pica de 1.10. Explique razonadamente cuál de los dos
métodos serı́a preferible en cuanto a su precisión.

Práctica 2 - Estadística Descriptiva

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Práctica 2 - Estadística Descriptiva

Cargado por

Copyright:

Formatos disponibles

Práctica 2.

2. En una publicación se afirma que la mediana de un carácter es 8 y que

3. Se sabe que la duración del parto en primı́paras tiene una mediana

4. Si se tienen dos muestras diferentes del carácter ”causa de la muerte”,

5. Se realizó un estudio sobre los niveles de bilirrubina en 5 individuos

6. La distribución por edades de la anemia aplásica presenta dos modas:

7. Que un recién nacido se encuentre en el percentil 3 del peso de los

8. Comente la siguiente afirmación: ”Entre el 1er y el 3er cuartil está el

11. Se dispone de dos métodos de medida del porcentaje de grasa corporal,

12. Un niño y una niña de cuatro años están en el percentil 10 y 25 respec-

13. Comente la siguiente tabla de frecuencias. ¿Es correcto decir que en

Distribución de los pacientes por sexo (n = 133)

a) Introduzca estos datos en R y determine sus medidas descriptivas.

Sugerencias: Utilice el comando summary() o bien el menú de R Commander

2. Descargue el fichero de datos osteo n.RData1 . Utilizando este archivo

3. Probando dos métodos de determinación de la presión diastólica se mi-

También podría gustarte