0 calificaciones0% encontró este documento útil (0 votos)
5 vistas2 páginas
Este documento presenta definiciones breves de varios términos clave relacionados con el análisis y procesamiento de datos, incluyendo data wrangling, DataFrame, dataset, feature, índice, iloc, indentado, lambda, palabra reservada y Pandas. Explica conceptos como la limpieza y transformación de datos crudos, la estructura de datos DataFrame, las características de los conjuntos de datos, y las herramientas para la selección y manipulación de datos como iloc en Pandas.
Este documento presenta definiciones breves de varios términos clave relacionados con el análisis y procesamiento de datos, incluyendo data wrangling, DataFrame, dataset, feature, índice, iloc, indentado, lambda, palabra reservada y Pandas. Explica conceptos como la limpieza y transformación de datos crudos, la estructura de datos DataFrame, las características de los conjuntos de datos, y las herramientas para la selección y manipulación de datos como iloc en Pandas.
Este documento presenta definiciones breves de varios términos clave relacionados con el análisis y procesamiento de datos, incluyendo data wrangling, DataFrame, dataset, feature, índice, iloc, indentado, lambda, palabra reservada y Pandas. Explica conceptos como la limpieza y transformación de datos crudos, la estructura de datos DataFrame, las características de los conjuntos de datos, y las herramientas para la selección y manipulación de datos como iloc en Pandas.
● Data Wrangling: Conocido como manipulación de datos, es el proceso de
limpieza, transformación y preparación de datos crudos para su análisis. Incluye la corrección de errores, manejo de valores perdidos y transformación de datos para hacerlos aptos para el análisis y modelado de datos.
● DataFrame: Un DataFrame es una estructura de datos bidimensional en la
biblioteca de Python llamada Pandas. Se organiza en filas y columnas, similar a una tabla en una base de datos o una hoja de cálculo.
● Dataset: Un conjunto de datos es una colección de DataFrames, a menudo
presentada en un formato estructurado. Se utiliza para realizar análisis, aprendizaje automático u otras operaciones.
● Feature: En el contexto de machine learning y análisis de datos, una
característica (o feature) es una propiedad o atributo medible de un conjunto de datos. Las características son utilizadas como variables de entrada en modelos predictivos.
● índex: En el contexto de bases de datos y estructuras de datos como
DataFrames en Pandas, un índice es una etiqueta o identificador único asociado a cada fila. Facilita la búsqueda, selección y manipulación de datos de manera eficiente.
● iloc: En la biblioteca Pandas de Python, iloc es un método utilizado para la
selección de datos por posición. Permite acceder a los elementos de un DataFrame utilizando índices enteros en lugar de etiquetas.
● Indentado: Se refiere a la práctica de aplicar sangrías o espacios al comienzo
de las líneas de código para indicar la estructura y el bloque de código en la programación. Es especialmente importante en lenguajes que no utilizan llaves o palabras clave para delimitar bloques, como Python. ● Lambda: Es una expresión (función anónima), una forma concisa de representar un fragmento de código pequeño y a menudo temporal. Se utiliza para operaciones cortas donde no es necesario definir una función completa.
square = lambda x: x ** 2
● Palabra reservada: Es un término que tiene un significado específico (como
lambda) y no puede ser utilizado como un nombre de variable o función, ya que está reservado para funciones específicas en el lenguaje de programación.
● Pandas: Es una biblioteca de programación en Python utilizada para
manipulación y análisis de datos. Proporciona estructuras de datos flexibles y herramientas para trabajar con conjuntos de datos, como DataFrames, que facilitan la manipulación y análisis de datos tabulares.