Está en la página 1de 26

Maestría en Ciencia de Datos

para Negocios (Big DATA &


BUSINESS ANALYTICS)
Asignatura
Las Herramientas del
Científico de Datos
MDCBA101 Unidad 01
Python como Herramienta del
Científico de Datos
Asignatura
Las Herramientas del
Científico de Datos
MDCBA101 Unidad 01
Python como Herramienta del
Científico de Datos

PYTHON COMO HERRAMIENTA DEL CIENTÍFICO DE DATOS....................................03


1.1 FUNDAMENTOS DE PYTHON............................................................................................03
1.2. LIBRERÍAS PARA CIENCIA DE DATOS: NUMPY, PANDAS, ETC. .........................17
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Python como Herramienta del Científico


de Datos

1.1 FUNDAMENTOS DE PYTHON


Antes de meternos de lleno en Python, recordemos un poco sobre los inicios de los funda-
mentos de programación.

Es muy probable que ustedes tengan alguna experiencia en el uso de programas operativos
tales como: Linux, Android, UNIX, Windows, Mac OS, etc. y el manejo con aplicaciones
como lo es la paquetería de Office e incluso las redes sociales y juegos de video.

Hoy en día se está programando con software que puede tomar decisiones, la Inteligencia
Artificial ha tomado auge. Aquí en esta maestría veremos problemas como el cálculo de di-
ferentes estadísticas de una cantidad sorprendente de datos, que nos permitirán tomar deci-
siones asertivas.

Igualmente, a lo largo de la maestría aprenderemos a programar, a buscar la forma como en


programación podremos resolver algoritmos, manejar datos, realizar cálculos, etc. más que
centrarnos en un lenguaje de programación en específico, aunque será nuestro trabajo apren-
der algunos de los más importantes para el manejo y control de miles de datos.

Si ustedes nacieron en los años 50 y 60s es muy probable que se enfrentaran a la programa-
ción con lenguajes como Fortran, lenguaje C, Java, Pascal, etc. Ya desde hace varios años se
ha venido utilizando el lenguaje PYTHON, de alto nivel que permite utilizar una cantidad muy
amplia de “librerías” en un entorno sencillo.

Python es un lenguaje de programación de alto nivel, lo cual significa en palabras sencillas,


que está lo más cercano posible al lenguaje del ser humano y que no depende de la máquina
donde se esté ejecutando.

03
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Como se cita en Griffel & Guetta (2021) el lenguaje de programación


Python recibió su nombre de Monty Python (el grupo de comedia bri-
tánico), no de una serpiente (como mucha gente piensa). Fue creado
en 1991 por Guido Van Rossum. Ha sido conocido en la comunidad de
Python como el “Dictador benevolente de por vida” (BDFL).

Guido trabajó en Google de 2005 a 2012, donde pasó la mitad de su


tiempo desarrollando el lenguaje Python. Curiosamente, gran parte de
la popularidad de Python proviene del hecho de que cuando Sergey
Brin y Larry Page en Stanford concibieron Google por primera vez,
escribieron sus primeros rastreadores web utilizando el relativamente
nuevo Python de Guido. A medida que Google comenzó a crecer, tomaron la decisión co-
mercial inteligente de contratar a Guido.

Google también gastó una gran cantidad de recursos en la creación de herramientas de cien-
cia de datos en Python y las lanzó de forma gratuita a la comunidad de código abierto. Como
resultado, muchos aspirantes a desarrolladores que querían aprender Python de los mejores y
más brillantes fueron atraídos a trabajar en Google. Esto le dio a Google una ventaja comer-
cial competitiva en términos de contratar a los programadores más talentosos.

De hecho casi todas las empresas de tecnología utilizan Python de alguna manera. Los ejem-
plos incluyen Google, Facebook, YouTube, Spotify, Netflix, Dropbox, Yahoo, NASA, IBM,
Instagram y Reddit. La lista sigue y sigue. Python es tan frecuente porque se puede usar para
muchas cosas diferentes y es fácil de usar junto con otros lenguajes de programación. Por
ejemplo, incluso si el producto principal de una empresa no se crea con Python, pueden usar
Python para el aprendizaje automático, la inteligencia artificial (IA) o el análisis de datos entre
bastidores. Como resultado, Python es actualmente el principal lenguaje de programación de
más rápido crecimiento. Según Stack Overflow, una comunidad en línea para desarrolladores,
también se considera el lenguaje de programación más buscado (Griffel & Guetta, 2021).

Su popularidad se debe principalmente a su simplicidad y robustez, aunque hay muchos otros


factores. Como se apunta en Bhasin (2019), hay muchos módulos de terceros para realizar
las tareas anteriores. Por ejemplo Django, un marco web inmensamente popular dedicado al
desarrollo limpio y rápido, se desarrolla en Python. Esto, junto con el soporte para HTML,
correos electrónicos, FTP, etc., lo convierte en una buena opción para el desarrollo web.

Las bibliotecas de terceros también están disponibles para el desarrollo de software. Uno de
los ejemplos más comunes es Scions, que se usa para controles de compilación. Cuando se
combina con las funciones y el soporte incorporados, Python también hace milagros para el
desarrollo de GUI y para el desarrollo de aplicaciones móviles, por ejemplo, Kivy se usa para
desarrollar aplicaciones multitáctiles.

04
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Python también encuentra sus aplicaciones en el análisis científico. SciPy se usa para Inge-
niería y Matemáticas, e IPython se usa para computación paralela. Aquellos de ustedes que
trabajan en estadísticas y aprendizaje automático encontrarán algunas de estas bibliotecas
extremadamente útiles y fáciles de usar. SciPy proporciona funciones similares a las de MAT-
LAB y se puede utilizar para procesar matrices multidimensionales.

Lograr escalabilidad en estas técnicas es lo que hace que el análi-


sis de Big Data sea diferente del análisis de datos tradicional.
La gama de mecanismos analíticos y los términos ambi-
guos para definirlos pueden conducir a una palabra de
moda completamente nueva: ciencia de datos. Téc-
nicas como el análisis de sentimientos, el análisis/
pronóstico de series temporales, el análisis espacial,
la optimización, la visualización o el análisis no es-
tructurado (p. ej., extensión, audio y video) pueden
formar parte de la base de conocimientos de un
científico de datos.

En resumen, Python trabaja básicamente por pa-


quetes agrupados que veremos a detalle en el próximo
tema, de la siguiente forma:

NumPy – Que permite el almacenamiento de matrices multi-


dimensionales

SciPy – Contiene herramientas para realizar cálculos numéricos

Pandas – Los cuales permiten el trabajo con los datos, manipulándolos, filtrándolos, agrupán-
dolos, etc. Permitiendo el acceso a la base de datos que los agrupa

Matplotlib – Herramienta para el diseño de gráficos

Scikit.Learn – Herramientas con algoritmos utilizados para aprendizaje automático

Fortalezas de Python

De acuerdo con Bhasin (2019), éstos son los factores más relevantes de Python:

Facilidad

Python es fácil de aprender y entender. De hecho, si tiene experiencia en programación, lo


encontrará elegante y ordenado. La eliminación de llaves y paréntesis hace que el código sea
corto y sencillo. Además, algunas de las tareas en Python son bastante fáciles.

05
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Por ejemplo, intercambiar números en Python es tan fácil como escribir (a, b)= (b, a).

También se puede afirmar aquí que aprender


algo nuevo es una tarea complicada e intrin-
cada. Sin embargo, la simplicidad de Python lo
hace casi pan comido. Además, aprender fun-
ciones avanzadas en Python es un poco com-
plicado, pero vale la pena el esfuerzo. También
es fácil de entender un proyecto escrito en
Python. El código, en Python, es conciso y
efectivo y por lo tanto comprensible y mane-
jable.

Escribir y ejecutar

En la mayoría de los proyectos, probar algo


nuevo requiere muchos cambios y, por lo tan-
to, recopilaciones y repeticiones. Esto hace
que probar el código sea una tarea difícil y
que requiera mucho tiempo. En Python un
código se puede ejecutar fácilmente. También
proporciona al usuario un entorno interactivo,
en el que se pueden ejecutar comandos inde-
pendientes.

Sintaxis

La sintaxis de Python es fácil; esto facilita el proceso de aprendizaje y comprensión. Según la


mayoría de los autores, las tres características principales que hacen atractivo a Python son
que es simple, pequeño y flexible.

Mezcla

Si uno está trabajando en un gran proyecto, quizás con un gran equipo, podría darse el caso
de que algunos de los miembros del equipo sean buenos en otros lenguajes de programación.
Esto puede llevar a que algunos de los módulos en otros lenguajes deseen integrarse con el
código central de Python, que permite e incluso admite esto.

Escritura dinámica

Python tiene su propia forma de administrar la memoria asociada con los objetos. Cuando se
crea un objeto en Python, la memoria se le asigna dinámicamente. Cuando termina el ciclo
de vida del objeto, se le retira la memoria. Esta gestión de memoria de Python hace que los
programas sean más eficientes.

06
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Portabilidad

Un programa escrito en Python puede ejecutarse en casi todas las plataformas conocidas,
ya sea Windows, Linux o Mac. También se puede afirmar aquí que Python está escrito en C.

Gratuito

Python no es un software propietario. Uno puede descargar compiladores de Python entre


las diversas opciones disponibles. Además, no existen problemas legales conocidos relaciona-
dos con la distribución del código desarrollado en Python.

Paradigmas en Python

Como lo apunta Bhasin (2019) los paradigmas que permite Python son:

Procedimental

En un lenguaje procedimental, un programa es en realidad un conjunto de sentencias que se


ejecutan secuencialmente. La única opción que tiene un programa, en términos de maneja-
bilidad, es dividirlo en pequeños módulos. “C”, por
ejemplo, es un lenguaje procedimental. Python
soporta programación procedimental.

Orientado a objetos

Este tipo de lenguaje se enfoca principalmente en


la instancia de una clase. La instancia de una clase
se llama objeto. Una clase es una entidad real o
virtual que tiene una importancia para el proble-
ma en cuestión y tiene límites físicos definidos.
Por ejemplo, en un programa que se ocupa de la
gestión de estudiantes, “estudiante” puede ser
una clase. Sus instancias están hechas y la tarea en
cuestión se puede lograr comunicándose a través
de métodos. Python está orientado a objetos.

Funcional

Python también es compatible con la programación funcional. Además, Python admite datos
inmutables, optimización de la cola, etc. Esto debe ser música para los oídos de aquellos con
experiencia en programación funcional.

07
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Usos de Python

Python se está utilizando para realizar muchas tareas, las más importantes según Bhasin
(2019) son las siguientes:

• Desarrollo de interfaz gráfica de usuario (GUI)

• Creación de secuencias de comandos de páginas web

• Programación de base de datos

• Prototipos

• Juego de azar

• Programación basada en componentes

Si está trabajando en Unix o Linux, no necesita instalar Python. Esto se debe a que en los
sistemas Unix y Linux, Python generalmente está preinstalado. Sin embargo, si trabaja en
Windows o Mac, debe descargar Python.

Muchos entornos de desarrollo están disponibles para Python. Algunos de ellos son los si-
guientes:

1. PyDev con Eclipse

2. Emacs

3. Vim

4. TextMate

5. Gedit

6. Idle

7. PIDA (Linux)(VIM based)

8. NotePad++ (Windows)

9. BlueFish (Linux)

Empezar a usar Python

Python es un lenguaje con licencia abierta, por lo cual puede instalarse sin costo y de forma
sencilla. El uso del Python, su instalación y el desarrollo de programas utilizándolo, se verán
más adelante en esta maestría ya que se requiere de tiempo y dedicación para su control.
08
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Python se puede descargar desde la página: https://www.python.org

En descargas como seguro lo han realizado varias veces: Downloads

Se puede descargar para sistemas operativos como Microsoft Windows, Mac OS, Linux, etc.

La versión más reciente es la 3.x, la cuál es recomendable descargar.

Para iniciar a utilizarlo, en Phyton se escriben códigos fuentes y posteriormente son ejecu-
tados por “el intérprete”. Esta ejecución se realiza mediante una consola denominada Shell,
como si utilizáramos un ordenador o calculadora.

Su instalación ocupa 155 MB de su computadora, tardará unos pocos minutos dependiendo


de la memoria RAM de tu computadora. Será muy conveniente que lo instale para que pueda
seguir los escritos en sus diferentes asignaturas de esta maestría.

Al término de la instalación podrá observar una ventana con las herramientas y licencia de
Python como la siguiente.

09
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Cuando seleccione el IDLE (Python), aparecerá una ventana como lo que se muestra:

Realicemos un ejemplo muy sencillo:

1. Seleccione el IDLE:

2. Escriba lo que observa en la siguiente pantalla:

Al símbolo >>> se le llama prompt (entrada), éste está ya directo en el IDLE, no tiene que
escribirlo.

10
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Realicemos un ejemplo sencillo al insertar una pequeña fórmula en Python.

Vamos a suponer que queremos calcular el área de un triángulo rectángulo cuyos lados son los
que se indican en la siguiente figura:

En Python, escribiremos el código fuente en el editor. Para ello crearemos una ventana pul-
sando en Edit, posteriormente New Edit y la salvaremos con Save as, bajo el nombre de área
del triángulo, así debemos definir las variables en primer lugar, posteriormente darles su valor
y enseguida generar la fórmula, en este caso del área de un triángulo.

11
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

NOTA: El editor lo localiza en la parte superior del programa:

Posteriormente se ejecuta desde la pestaña RUN, Run mode o puedes pulsar la función F5 y
se genera el resultado en el Shell de Python, en este ejemplo el 15.

Claro, se podría generalizar el programa para que calcule el área de cualquier triángulo rec-
tángulo, para ello la función “input” le permite a Shell leer un dato del teclado en formato
texto, posteriormente con la función int convierte el dato a número entero.

Vamos a realizarlo, para ello vuelva a utilizar el editor o modifique el mismo que ya tiene,
siguiendo las instrucciones de la siguiente figura:

La función input es la que permite que se tome en cuenta el dato del teclado que ingresamos
y la función int es la que lo convierte a un número entero.

12
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

A continuación, sálvelo y pulse RUN, aquí el Shell pedirá que introduzca el primer valor del
l1 que sería 6 y posteriormente el segundo valor l2 que sería 5, vea la figura:

Tipos de Datos

Los lenguajes de programación por lo general clasifican sus tipos de datos. En Python se
utiliza la siguiente clasificación:

1. Datos numéricos – Valores enteros o reales

2. Expresiones lógicas – Falso o verdadero – datos lógicos o booleanos

3. Texto - Caracteres (string)

4. Datos con tablas – matrices, vectores – datos compuestos

Y así sucesivamente.

El siguiente diagrama muestra un resumen de estos:

(tomado de “Fundamentos de Programación en Python, 2018, Pedro Gomis Román.)

13
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Ejemplo con datos simples:

A los datos simples también se les llama escalares y tienen asociado un solo valor que puede
ser entero, real o de coma /float, booleano y carácter.

Vamos con un ejemplo del más sencillo, un dato entero:

Recuerde que los enteros son los números naturales ya sean negativos o positivos: 5. 10.
-4, etc. Los números con decimales no se incluyen.

Python tiene una función interna denominada type que define el tipo de dato, siga este
ejemplo en Python:

Observe cómo regresa la clasificación, en este ejemplo colocamos números enteros, por
tanto, nos dice que son int

Python convierte números a binario para trabajarlos. Por ejemplo, el número 5, que en
binario es: 101 y el número 200 que en binario es 11001000 se representan en Python así:

Para que observe el amplio rango de valores que puede manejar Python, probemos con
número mayor, por ejemplo: 2 elevado a 220, es decir: 2220.

14
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Valores con Números Reales

Recuerde que los números reales son todos aquellos números continuos en una recta nu-
mérica. Estos números presentan cifras decimales, que pueden ser finitas o infinitas.

En programación estos números se denominan de coma o punto flotante (float).

Existe una norma que establece cómo representar estos números ya que algunos tienen
un número de cifras infinitas, esta norma es denominada IEEE754 y utiliza la notación
científica.

Recuerde que la notación científica maneja un valor (mantisa) y un exponente en base 10.
Por ejemplo, si queremos representar 6,000 sería 6e3, y representa a 6 por 10 elevado a
la tercera potencia, es decir, 6 por 1000 que es 6,000.

De esta forma los números decimales pueden también expresarse en notación científica,
por ejemplo: 0.64 sería 64e-2, es decir, 64 multiplicado por 10 elevado a -2, esto es: 1/102,
esto es 64 por 0.01 = 0.64.

Python maneja la nomenclatura con la norma IEEE754, que establece un manejo binario
de los números. La utiliza en doble precisión, esto es: binary64, con 8 bytes (64 bits). Así
Python puede representar números con una precisión increíble, de

10-325 hasta 10308

Observa los siguientes ejemplos en Python, realízelos para practicar.

15
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Valores Booleanos

Para Python los valores lógicos (Verdadero o Falso) se les reconoce como bool. Estos datos
toman el valor 1 cuando es Verdadero (True) y el valor 0 cuando es Falso (False). Observe

los siguientes ejemplos y ejecútelos en Python:

Carácter

Los caracteres en programación utilizan el código ASCII que se muestra a continuación.

16
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Así, por ejemplo, siguiendo este código, la “a” es menor que “b”

Este tipo de carácter se denomina string, como se muestra en la siguiente figura:

Así de esta forma Python utiliza gran variedad de datos como son: matrices, vectores, fun-
ciones, variables, operadores aritméticos, conversiones de datos, etc.

1.2. Librerías para ciencia de datos: Numpy, Pandas, etc.


Librerías para ciencia de datos

Hasta este momento hemos practicado un poco sobre la programación en Python, sin
embargo, la idea de utilizar éste y otros programas de gran capacidad, es lograr simplificar
la tarea de análisis de una cantidad de datos grande o muy grande, elaborar gráficas, orde-
narlos, etc.

Para estas tareas Python tiene ya cargadas una variedad de librerías (también denominadas
módulos) que contienen algoritmos que permiten elaborar este trabajo. Las librerías bási-
camente son paquetes u objetos que contienen la extensión .py.

Python ya tiene asignadas una serie de funciones que siempre están disponibles. Hay que
conocer muy bien su funcionamiento para poder utilizarlas.

Vamos a poner unos ejemplos de éstas y al finalizar anotaremos la lista de estas funciones.

Ejemplo 1:

abs (x)

Regrese el valor absoluto de un número. Si el argumento es un número complejo, regrese


su magnitud.

17
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

bin (x)

Realice la conversión a binario de un número entero, vea los ejemplos:

En este último, regrese como resultado el número 14 en forma binaria (1110)

max (arg1, arg2, arg3, etc.)

Regrese el máximo de una serie de números:

pow (base, exp)

En esta función eleve al exponente indicado la base dada, por ejemplo 43 = 64

round (numero, dígitos)

Esta función redondea el número dado a los dígitos que necesitemos.

Tome en cuenta de 0.5 lo pasa al valor siguiente, por ejemplo: 6.5 lo redondea a 7.

NOTA: Si el valor dado en décima proviene de una fracción el 0.5 se redondea bajándolo.
Esto es debido a que varias fracciones no se pueden expresar de forma exacta ya que con-
tiene un número de decimales infinito.

18
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Veamos el ejemplo:

Son varias las funciones que por defaul ya contiene Python, enlistaremos las mismas. Ya
queda de parte del alumno el que investigue bien cuál le interesa, ya que la explicación de
todas ellas no es objeto del presente estudio.

Funciones de Python (Funciones Built-in):

Las funciones Built-in son las que retoman el diccionario actual o local:

Estos son algunos ejemplos, sin embargo, ya en la biblioteca estándar existen módulos
como:

Módulo OS – Funciones que permiten interactuar con el sistema operativo

Módulo math – Funciones matemáticas: Trigonométricas, logarítmicas, estadísticas, etc.

Medias de rendimiento

Etc.

Existen otras librerías no estándar, es decir, que no forman parte de la biblioteca de Python
y debemos “bajarlas” para poder operarlas.

19
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Estas librerías nos serán muy útiles ya que permiten trabajar con grandes bases de datos
que es el objetivo principal de nuestra asignatura.

Dentro de las más comunes tenemos:

Blaze: Extiende la capacidad de otras librerías como Numpy y Pandas a datos distribuidos
en streaming (procesamiento de datos y análisis de ellos). También permite ingresar a da-
tos de varias fuentes como Bcolz, MongoDB, SQLAlchemy, Apache Spark, PyTables, etc.

Bokeh: Genera gráficos en 3D y aplicaciones web.

Matplotlib: Contiene gráficos, como histogramas hasta líneas o mapas de calor. También
puede utilizarse para anexar expresiones matemáticas a las gráficas.

NumPy: (Numerical Python): Permite el trabajo con martrices de n dimensiones. Ofrece


funciones básicas de álgebra lineal, transformada de Fourier, números aleatorios e integra
herramientas para otros lenguajes como Fortran, C y C++

Pandas: Utilizada para operar y manipular datos estructurados. Se utiliza en el momento


de depurar y preparar datos.

SciPy (Numerical Python): Se basa en la librería NumPy y se utiliza en módulos de inge-


niería y ciencia avanzada.

Scikit Learn: Librería que contiene modelado estadístico como algoritmos de clasificación,
regresión, reducción dimensional, etc.

Statsmodels: Librería utilizada para modelado estadístico que permite exportar datos, rea-
lizar estimaciones de modelos estadísticos y efectuar test estadísticos. Contiene estadísti-
ca descriptiva, funciones, gráfica, etc.

Seaborn: utilizada para dar formato a los gráficos y hacerlos más visuales.

SymPy: Biblioteca que se utiliza para el trabajo con matemáticas, desde aritmética, álge-
bra, cálculo, matemáticas discretas, física cuántica, etc.

A continuación, vamos a trabajar en un ejemplo muy sencillo de creación de un “módulo”.

Como ya lo comentamos, recuerde que un módulo es un archivo con la extensión .py

También existen módulos con extensión. pyc, denominados Python compilado e inclusos
otros escritos con el lenguaje C para Cpython.

Un módulo puede contener variables, funciones y otros módulos en él o submódulos.

20
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Un módulo tiene como fin el organizar y reutilizar nuestro código.

Esto es: modularización y reutilización, que son dos términos orientados a la programación
de objetos.

La reutilización se utiliza ya que la idea es ahorrar tiempo y utilizar los módulos ya diseñados
y no volver a crearlos.

Y la modularización consiste en dividir el código en pequeños archivos llamados módulos,


ya que si se tiene una programación complicada, el dividir el código en módulos permite la
localización y arreglo de errores que de otra forma sería bastante complicado con una serie
de códigos enorme. Por otro lado, permite añadir nuevas características o aplicaciones de
forma más sencilla, que el modificar un archivo que contenga miles de líneas.

Bien, vamos a crear nuestro ejemplo, para ello es conveniente tener un lugar en nuestra
computadora donde coloquemos en una carpeta los archivos que vamos a crear.

En este ejemplo crearemos una carpeta llamada “mis archivos de Python” y dentro de la
misma las subcarpetas a utilizar, cree su carpeta y guárdela en su computadora en un lugar
fácil de encontrar para trabajar con ella:

Dentro de ella crearemos una carpeta que diga “módulos” y es dentro de ella donde tra-
bajaremos.

21
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

A continuación, abriremos Pyhton y crearemos un nuevo archivo, el diagrama a continua-


ción se realizó en MAC, pero se trabaja de igual forma en Windows, sólo recuerde que en
éste se localiza en la misma ventana:

Y este archivo vamos a guardarlo en la carpeta que acabamos de crear bajo el nombre de
funciones_matematicas-py

Ahora vamos a crear nuestro módulo, muy sencillo que realice sumas, restas y multiplica-
ciones.

Ya posteriormente vamos a utilizar estas funciones dentro de un módulo en otro archivo.

Vamos a programar las funciones: sumar dos datos e imprimirlos y del mismo modo el de
restar y multiplicar dos datos como se muestra en la figura.

Hay que ir haciendo este ejercicio en su computadora.

22
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Una vez creado el módulo recuerde salvarlo con la función save: que se localiza en file:

Éste ya es el módulo en Python.

A continuación, vamos a crear otro archivo que va a utilizar éste módulo. Para ello pulsa-
mos en New File y lo guardaremos bajo el nombre de “usos.funciones.py”.

Muy importante es que ambos archivos se encuentren en la misma carpeta, puesto que
trabajarán juntos.

En este ejemplo, en nuestra carpeta que llamamos “módulos”

En el archivo “usos.funciones”, basta con importar el archivo “funciones matemáticas” y


posteriormente anotar las que queremos sumar, restar o multiplicar, vea el siguiente es-
quema y ejecútelo en Python:

Observa que debes utilizar la nomenclatura del punto: funciones_matematicas.sumar(7,5)

A continuación, guarde los cambios y ejecute o pulse run para ver el resultado:

Vea el resultado en azul es la suma.

23
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Lo de arriba es de donde lo está tomando en mi computadora, es decir, localice el archivo


donde se encuentra.

De igual forma podemos utilizar para restar y multiplicar:

Guardar y ejecutar, sin embargo, realizar esto es algo tedioso, el estar escribiendo cada vez
funciones_matematicas, en lugar de ello, bastará con cambiar la instrucción de importar y
posterior a import colocar un * como se ve en el siguiente diagrama:

El * lo que hace es tomar en cuenta todo el módulo, así lo salvamos y corremos o ejecuta-
mos.

24
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos

Véase como ahora ya da todos los resultados de correr el módulo, la suma, resta y multi-
plicaciones señaladas.

Referencias:

Bhasin, H. (2019). Python Basics.

Griffel, M., & Guetta, D. (2021). Python for MBAs. Columbia Business School.

25
Web
www.cesuma.mx

E-mail
info@cesuma.mx

También podría gustarte