Está en la página 1de 3

AÑO: 2020 PARCIAL: Segundo

MATERIA: Estadística PROFESOR: Heydi Roa


PERIODO: I FECHA: Agosto 13 de 2020

Proyecto de Estadística
En el presente documento se recogen los lineamientos generales para realizar el proyecto de la
materia, mismo que se desarrollará de forma grupal (Grupos de máx 4 personas). La fuente de
datos que se utilizará para este trabajo corresponde a datos de la sala de Cuidados Intensivos
de un hospital de niños de la ciudad de Guayaquil.

Para el análisis estadístico debe:


• Elegir 3 variables cuantitativas y 5 variables cualitativas, para la presentación del
proyecto.
• Utilizar el software RStudio y Power Bi (opcional)

Para la valoración final, se considerará los siguientes puntos:

1. (20 Puntos) Estadística descriptiva univariante:


a. Para las variables cualitativas: construya tablas de frecuencias y diagramas de barras
b. Para las variables cuantitativas: construya tablas de frecuencias, histogramas, ojivas, diagramas
de cajas y estadísticas descriptivas (medidas de tendencia central, posición y dispersión)

2. (40 Puntos) Estadística descriptiva multivariante:


a. Para todos los pares de variables cuantitativas, grafique una matriz de diagramas de dispersión.
b. En un solo gráfico, muestre las ojivas para cada variable cuantitativa, en colores diferentes.
c. En un solo gráfico, grafique los diagramas de cajas para cada variable cuantitativa.
d. En un solo gráfico, presente los diagramas de cajas de las variables cuantitativas por al menos dos
variables cualitativas (Ej: Diagrama de Cajas Edad por Sexo).
e. Determine la matriz de correlación, para las variables cuantitativas.
f. Construya el intervalo de confianza para la media de una de las variables cuantitativas.
g. Realice una prueba de hipótesis para establecer si existe diferencia entre la proporción de una de
las variables cuantitativas según una de las variables cualitativas.

3. (40 Puntos) Comente los principales hallazgos obtenidos (mínimo dos páginas).
Descripción de las variables de la fuente de datos del proyecto

Fuente de datos: “datamedica.csv” corresponde a un conjunto de datos de 199 pacientes de la


unidad de cuidados intensivos de niños de la ciudad, correspondiente a un año. Consta de 18
variables y una columna que representa al “identificador del paciente”.

Variables:

Tipo_paciente: Registra 5 categorías:


1: Lactante menor [29 días -12 meses)
2: Lactante mayor [12 meses – 24 meses)
3: Pre-escolar [2 años – 5 años]
4: Escolar [6 años – 11 años]
5: Adolescente [12 años -18 años)

Sexo: Variable binaria:


0: Masculino
1: Femenino

Nutricion_Parenteral: Variable binaria que indica si el paciente está siendo alimentado a través de
suero, donde un 0 indica que NO y 1 indica que SI.

Sepsis_Grave: Variable binaria que indica si el paciente presenta sepsis (respuesta inflamatoria
producida por una infección), donde un 0 indica que NO y 1 indica que SI.

Colonizado_Candida_Albicans: Variable binaria que indica si el paciente presenta colonización de


bacterias Cándida Albicans, donde un 0 indica que NO y 1 indica que SI.

ATB_Amplio_espectro: Variable binaria que indica si al paciente se le ha suministrado antibiótico de


amplio espectro para el tratamiento de las bacterias , donde un 0 indica que NO y 1 indica que SI.

Corticoterapia: Variable binaria que indica si al paciente se le está suministrando corticoides, donde
un 0 indica que NO y 1 indica que SI.

Estancia_Hospitalaria_previo_UCIP: Variable binaria que indica si el paciente tuvo una estancia


hospitalaria antes de entra a UCIP (Unidades de Cuidados Intensivos), donde un 0 indica que NO y 1
indica que SI.

Cateter_venoso_central: Variable binaria que indica si el paciente se le ha colocado una sonda que
se introduce en una vena en el pecho y termina en el corazón para suministrar tratamiento para
infección, donde un 0 indica que NO se le ha colocado y 1 indica que SI se le ha colocado.

Cirugia_Abdominal: Variable binaria que indica si el paciente tuvo una cirugía abdominal, donde un
0 indica que NO y 1 indica que SI.
Lim_Puntaje_Candida: Variable binaria que indica si el paciente tuvo un puntaje mayor a 3 en el Score
de Cándida, donde un 0 indica que tuvo ≤3 y 1 indica que tuvo >3.

Lim_Regla de Nebraska: Variable binaria que indica si el paciente tuvo un puntaje mayor a 2.45 en la
Regla de Nebraska, donde un 0 indica que tuvo ≤2.45 y 1 indica que tuvo >2.45.

Especie_Candida_aislada_HMC: Variable que registra la especie de bacteria Cándida que se


encuentra en la hemoglobina del paciente. Hay 4 registros: Sin Crecimiento de cándida (normal),
Cándida Albicans, Cándida Parapsilosis, Cándida Tropicalis

Terapia Antifúngica previa: Variable binaria que indica si al paciente le fue suministrada una terapia
antifúngica (antihongos), donde un 0 indica que NO y 1 indica que SI.

Fallecido: Variable binaria que indica si el paciente falleció, donde un 0 indica que NO y 1 indica que
SI.

Puntaje Cándida: Variable que indica según una valoración de características, el puntaje Cándida
del paciente.

Puntaje_Regla_Nebrasca: Variable que indica según una valoración de características, el puntaje de


Regla de Nebraska del paciente.

Días_Estancia_UCIP: Variable que indica el número de días que el paciente estuvo en UCIP.

También podría gustarte