Está en la página 1de 5

Presentación:

Nombre:

Luis Ismael garcia tejada

Matricula:

20220626

Maestro:
Amaurys Bargas

Materia:

Electiva 1

Asignación:

ciclos de vida de proyectos de big data


Regresiones y extensiones lineales y no lineales clásicas en
ciencia de datos

El modelado de datos es esencial en ciencia de datos. Las regresiones son herramientas


estadísticas que nos ayudan a entender cómo se relacionan las variables en nuestros
datos. Son muy útiles para predecir valores, explicar relaciones y descubrir patrones.
Hay dos tipos principales de regresiones: lineales y no lineales.

Las regresiones lineales son como conectar puntos en una línea recta en un gráfico. Esto
significa que asumimos que hay una relación directa y constante entre las variables. Es
como cuando trazas una línea recta para representar cómo cambia una cosa cuando
cambia otra. Si hay más de una variable que afecta a la que queremos predecir, usamos la
regresión lineal múltiple.

Lo bueno de las regresiones lineales es que son fáciles de entender, rápidas de calcular y
bastante resistentes a errores. Pero tienen limitaciones: solo pueden manejar relaciones
en línea recta y pueden ser engañadas por valores extraños en los datos.
Para superar estas limitaciones, existen formas de "estirar" las regresiones lineales para
que se adapten mejor a los datos. Por ejemplo, podemos dar más importancia a ciertos
puntos de datos, hacer que sean menos sensibles a valores extraños o elegir solo las
variables más importantes para nuestro modelo.

Por otro lado, las regresiones no lineales nos permiten modelar relaciones más
complicadas que no son simplemente líneas rectas. Por ejemplo, podríamos tener una
curva, una forma de "U" o incluso un crecimiento exponencial.

En resumen, las regresiones son una herramienta poderosa en ciencia de


datos que nos ayudan a entender y predecir cómo se relacionan las variables
en nuestros datos, ya sea de manera lineal o no. Y hay formas de mejorarlas
para adaptarse mejor a nuestros problemas específicos.
El ciclo de vida de un proyecto de Ciencia de Datos
implica una serie de etapas interconectadas y cíclicas que son fundamentales para su
gestión eficiente y exitosa. Identificar estas etapas es esencial para determinar qué
recursos son necesarios en cada fase y anticipar posibles desafíos, lo que permite estimar
los esfuerzos requeridos y reducir los costos operativos. Además, ayuda a los directivos y
gerentes a comprender el alcance del proyecto, gestionar los riesgos asociados a la nueva
tecnología y abordar los problemas que puedan surgir durante su desarrollo.
Las etapas típicas en el ciclo de vida de un proyecto de Ciencia de Datos son:
Definición del problema: En esta etapa, se identifican y definen claramente los objetivos
del proyecto, así como los problemas o preguntas que se pretenden resolver mediante el
análisis de datos.

Adquisición y preparación de datos: Se recolectan los datos relevantes para el proyecto


desde diversas fuentes, como bases de datos, archivos, sensores, etc. Luego, se realiza un
proceso de limpieza, integración y transformación de los datos para asegurar su calidad y
coherencia.

Exploración de datos: Aquí se lleva a cabo un análisis exploratorio de los datos para
identificar patrones, tendencias, correlaciones u otros insights que puedan ser útiles para
abordar el problema planteado.

Modelado de datos: En esta etapa, se desarrollan y entrenan modelos estadísticos o


algoritmos de aprendizaje automático utilizando los datos preparados. El objetivo es crear
un modelo que pueda predecir o clasificar nuevas observaciones con base en los datos
existentes.

Evaluación del modelo: Se evalúa el rendimiento del modelo utilizando métricas


apropiadas y técnicas de validación para determinar su eficacia y precisión en la
resolución del problema planteado.

Despliegue y puesta en producción: Una vez que se ha validado y refinado el modelo, se


implementa en un entorno de producción para que pueda ser utilizado en la toma de
decisiones o en la automatización de procesos.
Monitoreo y mantenimiento: Se realiza un seguimiento continuo del rendimiento del
modelo en producción para detectar posibles desviaciones o degradaciones en su
desempeño. Además, se realizan ajustes o actualizaciones periódicas para garantizar que
el modelo siga siendo relevante y preciso a lo largo del tiempo.

Evaluación:
Este tema me resultó sumamente fascinante porque nos sumergimos en cada fase del proceso
completo, desde la concepción hasta el mantenimiento de un proyecto de ciencia de datos. Es un
viaje complejo que exige una cuidadosa planificación, una ejecución precisa y una evaluación
constante. El éxito en la gestión de proyectos de big data está determinado por una serie de
elementos cruciales, como el liderazgo efectivo, la comunicación fluida y la colaboración entre
equipos, la promoción de una cultura orientada a los datos, la disponibilidad de recursos y
competencias, y la elección de la metodología más adecuada para abordar los desafíos
específicos que surgen a lo largo del camino.

También podría gustarte