Está en la página 1de 17

ÍNDICE

1.INTRODUCCIÓN A PYTHON
2.INTRODUCCIÓN A MACHINE LEARNING
3.PANDAS DATA FRAME
4.CASO TITANIC
1. INTRODUCCIÓN A PYTHON
¿QUÉ ES Y POR QUÉ PYTHON? PYTHON PARA ANÁLISIS DE DATOS

Python es el lenguaje de programación de elección • Python es ideal para scripts y aplicaciones.


para muchos científicos en gran medida porque • La librería pandas ofrece un gran apoyo.
ofrece una gran cantidad de poder para analizar y • Scraping, web APIs.
modelar datos científicos con relativamente poca • Apoyo computacional de alto rendimiento
sobrecarga en términos de aprendizaje, instalación • Tareas de equilibrios de carga
o tiempo de desarrollo. Es un idioma que se puede • MPI, GPU
recoger en un fin de semana, y utilizar para el resto • MapReduce
de la vida.
• Fuerte apoyo a la abstracción
• Intel MKL
• HDF5
• Ambiente

Fuente: Practical Machine Learning – Alejandro Correa Bahnsen


1. INTRODUCCIÓN A PYTHON
CARACTERÍSTICAS DE PYTHON

• Muy legible y elegante


• Imposible escribir código ofuscado
• Simple y poderoso
• Minimalista: todo aquello innecesario no hay que escribirlo (;, {, }, '\n')
• Muy denso: poco código hace mucho
• Soporta objetos y estructuras de datos de alto nivel: strings, listas, diccionarios, etc.
• Múltiples niveles de organizar código: funciones, clases, módulos, y paquetes
• Python standard library (http://www.python.org/doc/current/lib/lib.html) contiene un sinfín de clases
de utilidad
• De scripting
• No tienes que declarar constantes y variables antes de utilizarlas
• Alta velocidad de desarrollo y buen rendimiento

Fuente: Curso de Python – Dr. Diego Lz. de Ipiña Gz. de Artaza


1. INTRODUCCIÓN A PYTHON
CARACTERÍSTICAS DE PYTHON

• Open source
• Razón por la cual la Python Library sigue Código en C/Java Código en Python
creciendo if (x) { if x:
• De propósito general if (y) { if y:
• Puedes hacer en Python todo lo que puedes f1(); f1()
hacer con C# o Java, o más } f2()
• Python usa tabulación (o espaciado) para mostrar f2();
estructura de bloques }
• Tabula una vez para indicar comienzo de bloque
• Des-tabula para indicar el final del bloque

Fuente: Curso de Python – Dr. Diego Lz. de Ipiña Gz. de Artaza


PYTHON COMO CALCULADORA CADENAS LISTAS

CORTADO

ITERACIÓN

Fuente: Practical Machine Learning – Alejandro Correa Bahnsen


BOOLEANO Y PRUEBAS DE VERDAD FUNCIONES

Fuente: Practical Machine Learning – Alejandro Correa Bahnsen


2. INTRODUCCIÓN A MACHINE
LEARNING
¿QUÉ ES MACHINE LEARNING?

Se dice que un programa de computadora aprende de la experiencia E con respecto a alguna clase de tareas T y
medida de desempeño P, si su desempeño en tareas en T, medido por P, mejora con la experiencia E.
Tom Mitchell

Fuente: Machine Learning Standford University – Andrew Ng


Fuente: Machine Learning Standford University – Andrew Ng
EJEMPLO DE APRENDIZAJE SUPERVISADO

Fuente: Machine Learning Standford University – Andrew Ng


EJEMPLO DE APRENDIZAJE NO SUPERVISADO

Fuente: Machine Learning Standford University – Andrew Ng


3. PANDAS DATA FRAME
Serie
Una serie es un objeto de tipo matriz
unidimensional que contiene una matriz
de datos y una matriz asociada de
etiquetas de datos. Los datos pueden ser
cualquier tipo de datos NumPy y las
etiquetas son el índice de Series.

Data Frame
Un DataFrame es una estructura de datos
tabular que contiene una colección
ordenada de columnas. Cada columna
puede tener un tipo diferente. Los
DataFrames tienen índices de fila y
columna.

Fuente: Practical Machine Learning – Alejandro Correa Bahnsen


3. PANDAS DATA FRAME
Carga de un csv a un Data Frame en Python

*Ruta del archivo*

Fuente: Practical Machine Learning – Alejandro Correa Bahnsen


FUNCIONES EN PANDAS DATA FRAME
df.ix[&indice]  Muestra la fila del índice ingresado
df.T  Muestra la transpuesta del data frame
df.index.name  Nombre de la cabecera de los índices
df.columns.name  Nombre de la cabecera de las columnas
df.values  Muestra los valores del data frame dentro de un array
df.reindex(&lista)  Modifica los índices
df.drop()  Elimina una fila o columna
df.sort_index()  Ordena en función a los índices
df.order()  Ordena en función a los valores
df.rank()  Realiza un ranking de los valores
df.sum()  Calcula la suma de la fila o columna
df.mean()  Calcula la media de la fila o columna
df.max()  Muestra el valor máximo de la fila o columna
df.idxmax  Muestra el índice del valor máximo de la fila o columna
df.head()  Muestra las 5 primeras filas del data frame
df.describe()  Muestra los principales estadísticos del data frame
df.value_counts()  Agrupa los distintos valores y cuenta cuantos hay por cada grupo

Fuente: Practical Machine Learning – Alejandro Correa Bahnsen


GRACIAS..!!
- Me pedían saber de herramientas como python
o r aplicado a machine learning para el puesto 

- ¿Acaso no te invité a la Capacitación Práctica de


UDSC?

También podría gustarte