Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Es muy probable que ustedes tengan alguna experiencia en el uso de programas operativos
tales como: Linux, Android, UNIX, Windows, Mac OS, etc. y el manejo con aplicaciones
como lo es la paquetería de Office e incluso las redes sociales y juegos de video.
Hoy en día se está programando con software que puede tomar decisiones, la Inteligencia
Artificial ha tomado auge. Aquí en esta maestría veremos problemas como el cálculo de di-
ferentes estadísticas de una cantidad sorprendente de datos, que nos permitirán tomar deci-
siones asertivas.
Si ustedes nacieron en los años 50 y 60s es muy probable que se enfrentaran a la programa-
ción con lenguajes como Fortran, lenguaje C, Java, Pascal, etc. Ya desde hace varios años se
ha venido utilizando el lenguaje PYTHON, de alto nivel que permite utilizar una cantidad muy
amplia de “librerías” en un entorno sencillo.
03
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Google también gastó una gran cantidad de recursos en la creación de herramientas de cien-
cia de datos en Python y las lanzó de forma gratuita a la comunidad de código abierto. Como
resultado, muchos aspirantes a desarrolladores que querían aprender Python de los mejores y
más brillantes fueron atraídos a trabajar en Google. Esto le dio a Google una ventaja comer-
cial competitiva en términos de contratar a los programadores más talentosos.
De hecho casi todas las empresas de tecnología utilizan Python de alguna manera. Los ejem-
plos incluyen Google, Facebook, YouTube, Spotify, Netflix, Dropbox, Yahoo, NASA, IBM,
Instagram y Reddit. La lista sigue y sigue. Python es tan frecuente porque se puede usar para
muchas cosas diferentes y es fácil de usar junto con otros lenguajes de programación. Por
ejemplo, incluso si el producto principal de una empresa no se crea con Python, pueden usar
Python para el aprendizaje automático, la inteligencia artificial (IA) o el análisis de datos entre
bastidores. Como resultado, Python es actualmente el principal lenguaje de programación de
más rápido crecimiento. Según Stack Overflow, una comunidad en línea para desarrolladores,
también se considera el lenguaje de programación más buscado (Griffel & Guetta, 2021).
Las bibliotecas de terceros también están disponibles para el desarrollo de software. Uno de
los ejemplos más comunes es Scions, que se usa para controles de compilación. Cuando se
combina con las funciones y el soporte incorporados, Python también hace milagros para el
desarrollo de GUI y para el desarrollo de aplicaciones móviles, por ejemplo, Kivy se usa para
desarrollar aplicaciones multitáctiles.
04
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Python también encuentra sus aplicaciones en el análisis científico. SciPy se usa para Inge-
niería y Matemáticas, e IPython se usa para computación paralela. Aquellos de ustedes que
trabajan en estadísticas y aprendizaje automático encontrarán algunas de estas bibliotecas
extremadamente útiles y fáciles de usar. SciPy proporciona funciones similares a las de MAT-
LAB y se puede utilizar para procesar matrices multidimensionales.
Pandas – Los cuales permiten el trabajo con los datos, manipulándolos, filtrándolos, agrupán-
dolos, etc. Permitiendo el acceso a la base de datos que los agrupa
Fortalezas de Python
De acuerdo con Bhasin (2019), éstos son los factores más relevantes de Python:
Facilidad
05
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Por ejemplo, intercambiar números en Python es tan fácil como escribir (a, b)= (b, a).
Escribir y ejecutar
Sintaxis
Mezcla
Si uno está trabajando en un gran proyecto, quizás con un gran equipo, podría darse el caso
de que algunos de los miembros del equipo sean buenos en otros lenguajes de programación.
Esto puede llevar a que algunos de los módulos en otros lenguajes deseen integrarse con el
código central de Python, que permite e incluso admite esto.
Escritura dinámica
Python tiene su propia forma de administrar la memoria asociada con los objetos. Cuando se
crea un objeto en Python, la memoria se le asigna dinámicamente. Cuando termina el ciclo
de vida del objeto, se le retira la memoria. Esta gestión de memoria de Python hace que los
programas sean más eficientes.
06
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Portabilidad
Un programa escrito en Python puede ejecutarse en casi todas las plataformas conocidas,
ya sea Windows, Linux o Mac. También se puede afirmar aquí que Python está escrito en C.
Gratuito
Paradigmas en Python
Como lo apunta Bhasin (2019) los paradigmas que permite Python son:
Procedimental
Orientado a objetos
Funcional
Python también es compatible con la programación funcional. Además, Python admite datos
inmutables, optimización de la cola, etc. Esto debe ser música para los oídos de aquellos con
experiencia en programación funcional.
07
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Usos de Python
Python se está utilizando para realizar muchas tareas, las más importantes según Bhasin
(2019) son las siguientes:
• Prototipos
• Juego de azar
Si está trabajando en Unix o Linux, no necesita instalar Python. Esto se debe a que en los
sistemas Unix y Linux, Python generalmente está preinstalado. Sin embargo, si trabaja en
Windows o Mac, debe descargar Python.
Muchos entornos de desarrollo están disponibles para Python. Algunos de ellos son los si-
guientes:
2. Emacs
3. Vim
4. TextMate
5. Gedit
6. Idle
8. NotePad++ (Windows)
9. BlueFish (Linux)
Python es un lenguaje con licencia abierta, por lo cual puede instalarse sin costo y de forma
sencilla. El uso del Python, su instalación y el desarrollo de programas utilizándolo, se verán
más adelante en esta maestría ya que se requiere de tiempo y dedicación para su control.
08
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Se puede descargar para sistemas operativos como Microsoft Windows, Mac OS, Linux, etc.
Para iniciar a utilizarlo, en Phyton se escriben códigos fuentes y posteriormente son ejecu-
tados por “el intérprete”. Esta ejecución se realiza mediante una consola denominada Shell,
como si utilizáramos un ordenador o calculadora.
Al término de la instalación podrá observar una ventana con las herramientas y licencia de
Python como la siguiente.
09
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Cuando seleccione el IDLE (Python), aparecerá una ventana como lo que se muestra:
1. Seleccione el IDLE:
Al símbolo >>> se le llama prompt (entrada), éste está ya directo en el IDLE, no tiene que
escribirlo.
10
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Vamos a suponer que queremos calcular el área de un triángulo rectángulo cuyos lados son los
que se indican en la siguiente figura:
En Python, escribiremos el código fuente en el editor. Para ello crearemos una ventana pul-
sando en Edit, posteriormente New Edit y la salvaremos con Save as, bajo el nombre de área
del triángulo, así debemos definir las variables en primer lugar, posteriormente darles su valor
y enseguida generar la fórmula, en este caso del área de un triángulo.
11
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Posteriormente se ejecuta desde la pestaña RUN, Run mode o puedes pulsar la función F5 y
se genera el resultado en el Shell de Python, en este ejemplo el 15.
Claro, se podría generalizar el programa para que calcule el área de cualquier triángulo rec-
tángulo, para ello la función “input” le permite a Shell leer un dato del teclado en formato
texto, posteriormente con la función int convierte el dato a número entero.
Vamos a realizarlo, para ello vuelva a utilizar el editor o modifique el mismo que ya tiene,
siguiendo las instrucciones de la siguiente figura:
La función input es la que permite que se tome en cuenta el dato del teclado que ingresamos
y la función int es la que lo convierte a un número entero.
12
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
A continuación, sálvelo y pulse RUN, aquí el Shell pedirá que introduzca el primer valor del
l1 que sería 6 y posteriormente el segundo valor l2 que sería 5, vea la figura:
Tipos de Datos
Los lenguajes de programación por lo general clasifican sus tipos de datos. En Python se
utiliza la siguiente clasificación:
Y así sucesivamente.
13
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
A los datos simples también se les llama escalares y tienen asociado un solo valor que puede
ser entero, real o de coma /float, booleano y carácter.
Recuerde que los enteros son los números naturales ya sean negativos o positivos: 5. 10.
-4, etc. Los números con decimales no se incluyen.
Python tiene una función interna denominada type que define el tipo de dato, siga este
ejemplo en Python:
Observe cómo regresa la clasificación, en este ejemplo colocamos números enteros, por
tanto, nos dice que son int
Python convierte números a binario para trabajarlos. Por ejemplo, el número 5, que en
binario es: 101 y el número 200 que en binario es 11001000 se representan en Python así:
Para que observe el amplio rango de valores que puede manejar Python, probemos con
número mayor, por ejemplo: 2 elevado a 220, es decir: 2220.
14
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Recuerde que los números reales son todos aquellos números continuos en una recta nu-
mérica. Estos números presentan cifras decimales, que pueden ser finitas o infinitas.
Existe una norma que establece cómo representar estos números ya que algunos tienen
un número de cifras infinitas, esta norma es denominada IEEE754 y utiliza la notación
científica.
Recuerde que la notación científica maneja un valor (mantisa) y un exponente en base 10.
Por ejemplo, si queremos representar 6,000 sería 6e3, y representa a 6 por 10 elevado a
la tercera potencia, es decir, 6 por 1000 que es 6,000.
De esta forma los números decimales pueden también expresarse en notación científica,
por ejemplo: 0.64 sería 64e-2, es decir, 64 multiplicado por 10 elevado a -2, esto es: 1/102,
esto es 64 por 0.01 = 0.64.
Python maneja la nomenclatura con la norma IEEE754, que establece un manejo binario
de los números. La utiliza en doble precisión, esto es: binary64, con 8 bytes (64 bits). Así
Python puede representar números con una precisión increíble, de
15
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Valores Booleanos
Para Python los valores lógicos (Verdadero o Falso) se les reconoce como bool. Estos datos
toman el valor 1 cuando es Verdadero (True) y el valor 0 cuando es Falso (False). Observe
Carácter
16
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Así, por ejemplo, siguiendo este código, la “a” es menor que “b”
Así de esta forma Python utiliza gran variedad de datos como son: matrices, vectores, fun-
ciones, variables, operadores aritméticos, conversiones de datos, etc.
Hasta este momento hemos practicado un poco sobre la programación en Python, sin
embargo, la idea de utilizar éste y otros programas de gran capacidad, es lograr simplificar
la tarea de análisis de una cantidad de datos grande o muy grande, elaborar gráficas, orde-
narlos, etc.
Para estas tareas Python tiene ya cargadas una variedad de librerías (también denominadas
módulos) que contienen algoritmos que permiten elaborar este trabajo. Las librerías bási-
camente son paquetes u objetos que contienen la extensión .py.
Python ya tiene asignadas una serie de funciones que siempre están disponibles. Hay que
conocer muy bien su funcionamiento para poder utilizarlas.
Vamos a poner unos ejemplos de éstas y al finalizar anotaremos la lista de estas funciones.
Ejemplo 1:
abs (x)
17
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
bin (x)
Tome en cuenta de 0.5 lo pasa al valor siguiente, por ejemplo: 6.5 lo redondea a 7.
NOTA: Si el valor dado en décima proviene de una fracción el 0.5 se redondea bajándolo.
Esto es debido a que varias fracciones no se pueden expresar de forma exacta ya que con-
tiene un número de decimales infinito.
18
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Veamos el ejemplo:
Son varias las funciones que por defaul ya contiene Python, enlistaremos las mismas. Ya
queda de parte del alumno el que investigue bien cuál le interesa, ya que la explicación de
todas ellas no es objeto del presente estudio.
Las funciones Built-in son las que retoman el diccionario actual o local:
Estos son algunos ejemplos, sin embargo, ya en la biblioteca estándar existen módulos
como:
Medias de rendimiento
Etc.
Existen otras librerías no estándar, es decir, que no forman parte de la biblioteca de Python
y debemos “bajarlas” para poder operarlas.
19
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Estas librerías nos serán muy útiles ya que permiten trabajar con grandes bases de datos
que es el objetivo principal de nuestra asignatura.
Blaze: Extiende la capacidad de otras librerías como Numpy y Pandas a datos distribuidos
en streaming (procesamiento de datos y análisis de ellos). También permite ingresar a da-
tos de varias fuentes como Bcolz, MongoDB, SQLAlchemy, Apache Spark, PyTables, etc.
Matplotlib: Contiene gráficos, como histogramas hasta líneas o mapas de calor. También
puede utilizarse para anexar expresiones matemáticas a las gráficas.
Scikit Learn: Librería que contiene modelado estadístico como algoritmos de clasificación,
regresión, reducción dimensional, etc.
Statsmodels: Librería utilizada para modelado estadístico que permite exportar datos, rea-
lizar estimaciones de modelos estadísticos y efectuar test estadísticos. Contiene estadísti-
ca descriptiva, funciones, gráfica, etc.
Seaborn: utilizada para dar formato a los gráficos y hacerlos más visuales.
SymPy: Biblioteca que se utiliza para el trabajo con matemáticas, desde aritmética, álge-
bra, cálculo, matemáticas discretas, física cuántica, etc.
También existen módulos con extensión. pyc, denominados Python compilado e inclusos
otros escritos con el lenguaje C para Cpython.
20
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Esto es: modularización y reutilización, que son dos términos orientados a la programación
de objetos.
La reutilización se utiliza ya que la idea es ahorrar tiempo y utilizar los módulos ya diseñados
y no volver a crearlos.
Bien, vamos a crear nuestro ejemplo, para ello es conveniente tener un lugar en nuestra
computadora donde coloquemos en una carpeta los archivos que vamos a crear.
En este ejemplo crearemos una carpeta llamada “mis archivos de Python” y dentro de la
misma las subcarpetas a utilizar, cree su carpeta y guárdela en su computadora en un lugar
fácil de encontrar para trabajar con ella:
Dentro de ella crearemos una carpeta que diga “módulos” y es dentro de ella donde tra-
bajaremos.
21
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Y este archivo vamos a guardarlo en la carpeta que acabamos de crear bajo el nombre de
funciones_matematicas-py
Ahora vamos a crear nuestro módulo, muy sencillo que realice sumas, restas y multiplica-
ciones.
Vamos a programar las funciones: sumar dos datos e imprimirlos y del mismo modo el de
restar y multiplicar dos datos como se muestra en la figura.
22
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Una vez creado el módulo recuerde salvarlo con la función save: que se localiza en file:
A continuación, vamos a crear otro archivo que va a utilizar éste módulo. Para ello pulsa-
mos en New File y lo guardaremos bajo el nombre de “usos.funciones.py”.
Muy importante es que ambos archivos se encuentren en la misma carpeta, puesto que
trabajarán juntos.
A continuación, guarde los cambios y ejecute o pulse run para ver el resultado:
23
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Guardar y ejecutar, sin embargo, realizar esto es algo tedioso, el estar escribiendo cada vez
funciones_matematicas, en lugar de ello, bastará con cambiar la instrucción de importar y
posterior a import colocar un * como se ve en el siguiente diagrama:
El * lo que hace es tomar en cuenta todo el módulo, así lo salvamos y corremos o ejecuta-
mos.
24
Asignatura. Las Herramientas del Científico de Datos
Unidad 01. Python como Herramienta del Científico de Datos
Véase como ahora ya da todos los resultados de correr el módulo, la suma, resta y multi-
plicaciones señaladas.
Referencias:
Griffel, M., & Guetta, D. (2021). Python for MBAs. Columbia Business School.
25
Web
www.cesuma.mx
E-mail
info@cesuma.mx