Está en la página 1de 3

UNIVERSIDAD DE LAS FUERZAS ARMADAS

ESPE SEDE LATACUNGA


CARRERA DE SOFTWARE
INTELIGENCIA ARTIFICIAL II
PRUEBA PRÁCTICA

NOMBRE: ___________________________________________ FECHA: 19-06-2020


TIEMPO: 90 min. PUNTAJE: 5 ptos.

Python: Aprendizaje automático

Un dataset consta de N muestras, entre a un repositorio (puede ser Kaggle) y baje dos datasets (uno
de ellos puede ser iris.cvs) que le permita realizar las siguientes tareas:

1. Escribir un programa Python para cargar los datos de un archivo .csv dado en un marco de datos
e imprimir la forma de los datos, el tipo de datos y las 3 primeras filas.

2. Escriba un programa Python usando Scikit-learn para imprimir los campos, el número de filas-
columnas, los nombres de las características y la descripción de los datos.

3. Escriba un programa Python para obtener el número de observaciones, valores perdidos y


valores NAN.

4. Escriba un programa Python para ver los detalles estadísticos básicos como el percentil, media,
std etc. de los datos.

5. Escriba un programa Python para obtener las observaciones de cada categoría si las tuviera.

6. Escriba un programa Python para eliminar la columna de identificación de un Dataframe e


imprima la parte modificada. Ponga el mismo nombre *.csv para crear el Dataframe.

7. Escriba un programa Python para acceder a las primeras cuatro celdas desde el Dataframe
usando el índex y las etiquetas de las columnas. Llame al dataset para crear el Dataframe

8. Escribir un programa Python para crear un gráfico para obtener una estadística general de los
datos. (utilice DESCRIBRE y PLOT)

9. Escribir un programa Python para crear un gráfico de barras para obtener la frecuencia de las
categorías de los datos.

import seaborn as sns


…….
sns.countplot

10. Escribir un programa Python para crear un gráfico de pastel para obtener la frecuencia de las
tres especies de los datos, si existe.
11. Escribir un programa Python para crear un gráfico para encontrar la relación entre los datos.

12. Escribir un programa Python para crear un gráfico para ver cómo están distribuidos los datos.
Utilice hist

13. Escriba un programa Python para crear una gráfica conjunta que describa las distribuciones
individuales en la misma gráfica entre las variables.
Nota: joinplot - Dibuja un gráfico de dos variables con gráficos bivariable y univariable
import seaborn as sns
sns.joinplot.

14. Escriba un programa Python para crear una gráfica de pares del conjunto de datos del iris y
compruebe qué especie de flores parece ser la más separable.

15. Escribir un programa Python para dividir el conjunto de datos del iris en sus atributos (X) y
etiquetas (y). La variable X contiene las cuatro primeras columnas (es decir, los atributos) e y
contiene las etiquetas del conjunto de datos.

16. Escriba un programa Python usando Scikit-learn para dividir el conjunto de datos del iris en un
70% de datos de tren y un 30% de datos de prueba.

17. Escribir un programa Python usando Scikit-learn para convertir las columnas, de ser el caso, en
una columna numérica para las etiquetas. Imprima el conjunto de datos del 80% de datos del
entrenamiento y el 20% de datos de prueba. Imprimir ambos conjuntos de datos

18. Escriba un programa Python usando Scikit-learn para dividir el conjunto de datos del iris en un
70% de datos de tren y un 30% de datos de prueba. Utilizando el algoritmo K de vecino más
cercano. Utilice 5 como número de vecinos.

19. Escribir un programa Python usando Scikit-learn para dividir el conjunto de datos del iris en un
80% de datos de trenes y un 20% de datos de pruebas. Entrena o ajusta los datos en el modelo
y calcula la precisión del modelo usando el Algoritmo del Vecino Más Próximo K.

20. Escribir un programa Python usando Scikit-learn para dividir el conjunto de datos del iris en un
80% de datos de trenes y un 20% de datos de pruebas. Entrena o ajusta los datos en el modelo
y usando el Algoritmo del Vecino Más Próximo K calcula el rendimiento para diferentes valores
de k.

21. Escribir un programa Python usando Scikit-learn para dividir el conjunto de datos del iris en un
80% de datos de trenes y un 20% de datos de pruebas. Entrene o ajuste los datos en el modelo
y usando el Algoritmo del Vecino Más Próximo K y cree un gráfico para presentar el rendimiento
para diferentes valores de k.

22. Escribir un programa Python usando Scikit-learn para dividir el conjunto de datos del iris en un
80% de datos de trenes y un 20% de datos de pruebas. Entrena o ajusta los datos en el modelo
y usando el Algoritmo del Vecino Más Próximo K y crea un gráfico de valores k frente a la
precisión.
23. Escriba un programa Python para ver algunos detalles estadísticos básicos como el percentil, la
media, std etc. de cada categoría.

24. Escribir un programa Python para crear un gráfico de dispersión usando campos para separar
las categorías.

25. Escribir un programa Python para obtener la precisión (accuracy, matrix de confusión y otra
medida de presición) de la Regresión Logística utilice además otro algoritmo de Machine
Learning.

También podría gustarte