Está en la página 1de 2

Glosario

● Data Wrangling: Conocido como manipulación de datos, es el proceso de


limpieza, transformación y preparación de datos crudos para su análisis.
Incluye la corrección de errores, manejo de valores perdidos y transformación
de datos para hacerlos aptos para el análisis y modelado de datos.

● DataFrame: Un DataFrame es una estructura de datos bidimensional en la


biblioteca de Python llamada Pandas. Se organiza en filas y columnas, similar
a una tabla en una base de datos o una hoja de cálculo.

● Dataset: Un conjunto de datos es una colección de DataFrames, a menudo


presentada en un formato estructurado. Se utiliza para realizar análisis,
aprendizaje automático u otras operaciones.

● Feature: En el contexto de machine learning y análisis de datos, una


característica (o feature) es una propiedad o atributo medible de un conjunto
de datos. Las características son utilizadas como variables de entrada en
modelos predictivos.

● índex: En el contexto de bases de datos y estructuras de datos como


DataFrames en Pandas, un índice es una etiqueta o identificador único
asociado a cada fila. Facilita la búsqueda, selección y manipulación de datos
de manera eficiente.

● iloc: En la biblioteca Pandas de Python, iloc es un método utilizado para la


selección de datos por posición. Permite acceder a los elementos de un
DataFrame utilizando índices enteros en lugar de etiquetas.

● Indentado: Se refiere a la práctica de aplicar sangrías o espacios al comienzo


de las líneas de código para indicar la estructura y el bloque de código en la
programación. Es especialmente importante en lenguajes que no utilizan
llaves o palabras clave para delimitar bloques, como Python.
● Lambda: Es una expresión (función anónima), una forma concisa de
representar un fragmento de código pequeño y a menudo temporal. Se utiliza
para operaciones cortas donde no es necesario definir una función completa.

square = lambda x: x ** 2

● Palabra reservada: Es un término que tiene un significado específico (como


lambda) y no puede ser utilizado como un nombre de variable o función, ya
que está reservado para funciones específicas en el lenguaje de
programación.

● Pandas: Es una biblioteca de programación en Python utilizada para


manipulación y análisis de datos. Proporciona estructuras de datos flexibles y
herramientas para trabajar con conjuntos de datos, como DataFrames, que
facilitan la manipulación y análisis de datos tabulares.

También podría gustarte