Está en la página 1de 10

Estadística Aplicada

Ciclo I – 2024

Lic. David Cruz dcruz@esen.edu.sv


Ing. Rafael Rugamas rafa.rugamas@outlook.com

Clases – Lunes, Martes, y Jueves 10:25 a.m. (Aula 02)


Ayudantía – Viernes 2:40 p.m. (Laboratorio de Tecnología)
Horas de consulta – Lunes y Miércoles 1:00 p.m. – 2:30 p.m. (Oficina David Cruz)

Descripción del curso


Esta asignatura permite a los estudiantes desarrollar las competencias necesarias para realizar análisis básicos
de datos y plantear estudios y medidas cuantitativas que pueden ser utilizadas en el desarrollo de software o
en los proyectos empresariales. El énfasis de la asignatura está en la interpretación de los resultados
estadísticos y su utilidad para la toma de decisiones. Se presentan las metodologías básicas de análisis
descriptivo e inferencial, incluyendo la prueba de hipótesis y pruebas avanzadas. Junto con las herramientas
conceptuales y metodológicas, los estudiantes también desarrollarán competencias en el uso de un paquete
informático para estadística.

Situación problemática
El análisis de datos es una herramienta fundamental para la toma de decisiones, desde la medición de la
eficiencia o desempeño de una herramienta informática hasta el análisis de proyectos de negocio. Por tal
razón, para las personas que se desempeñan en el campo de los negocios y, en especial los negocios digitales,
es de extrema importancia contar con herramientas básicas que le permitan analizar datos, reconocer patrones,
plantear mediciones de naturaleza estadística, así como conocer las limitaciones de estos análisis.

Función clave
Utilizar el pensamiento analítico para resolver problemas, de forma autónoma, a partir de la información
cuantitativa y/o cualitativa disponible, teniendo en cuenta su contexto.

Competencias
▪ Identificar lo que se desea resolver, discriminando la información disponible para un efectivo
planteamiento de problemas.
▪ Analizar las diferentes opciones y datos con los que se cuenta para generar alternativas de solución a
un problema.
▪ Utilizar herramientas tecnológicas para comunicar información relevante a diferentes audiencias.
Elementos de competencia
▪ Comprende los diferentes tipos de muestreo en el levantamiento de información estadística.
▪ Calcula los estadísticos descriptivos básicos que caracterizan a una población, incluyendo media,
varianza, mediana, entre otros.
▪ Plantea hipótesis estadísticas válidas que pueden ser contrastadas contra los datos.
▪ Realiza inferencias sobre los valores de una población y comprende los conceptos de precisión
estadística y margen de error.
▪ Analiza la asociación entre variables utilizando métodos de regresión y correlación.
▪ Prepara los datos para el análisis estadístico utilizando Python.
▪ Conduce análisis estadísticos exploratorios y descriptivos usando Python.

Metodología

FORMATO. Esta es una asignatura que se impartirá en formato presencial con cuatro sesiones por semana: tres
clases magistrales y una ayudantía.

Clases magistrales: En estas se presentarán los contenidos teóricos básicos del curso, así como una serie
de ejercicios para fortalecer el dominio de dichos contenidos. Para la clase se espera que los y las
estudiantes hayan leído con anterioridad el material asignado (detallado más adelante). Asimismo, en
los contenidos para los que resulte pertinente, se mostrará cómo utilizar el software Excel de MS Office
para ejecutar los algoritmos y outputs que se estudiarán de forma análoga en las clases magistrales, por
lo que el profesor avisará con anticipación en qué sesiones se espera que las y los estudiantes lleven
laptops (ya sean personales o de las provistas por el Centro de Conocimiento).

Ayudantía: La ayudantía consiste en una sesión semanal de 100 minutos de duración en la cual también
se pondrán en práctica los conocimientos teóricos adquiridos durante las clases, pero en este caso,
utilizando el software de programación Python. El contenido a cubrir va desde conceptos básicos de
programación hasta visualización y análisis de datos. Dentro del programa se incluyen evaluaciones que
forman parte de la nota global de la materia y que van a consistir en tareas de programación y
valoración de los conceptos aprendidos durante la ayudantía.

REQUISITOS TECNOLÓGICOS Y SOFTWARE A UTILIZAR. Como estudiantes matriculados en la asignatura,


deben tener acceso a Moodle y acceso a una computadora con webcam, micrófono, auriculares (en caso de ser
requeridos para sesiones virtuales) y conexión a Internet. Como se indicó en la sección anterior, respecto del
software, se utilizarán Excel y Python.

MS Excel: la hoja de cálculo incluida en el paquete de Office 365, provisto por la ESEN a sus estudiantes,
ha sido el estándar académico y profesional por décadas. Dada su ubicuidad, se buscará habilitar a las y
los estudiantes con un manejo básico de la interfaz, las fórmulas y los paquetes específicamente
dirigidos al trabajo estadístico. Esto se cubrirá en las clases magistrales y seguirá la lógica temática de
los contenidos del curso. La intención de mostrar el uso de Excel es familiarizarles con el software, pero
esto no corresponderá con actividades sumativas a la nota global del curso, el software que sí se
evaluará, tanto en las tareas de la ayudantía, como en el proyecto y los exámenes, es Python. Excel
puede configurar una opción más en el kit de herramientas para el trabajo estadístico.

Python: es un lenguaje de programación interpretado de propósito general, de código abierto y de alto


nivel. En los últimos 10 años se ha convertido en una de las opciones más populares entre la
comunidad científica y especialmente en el naciente campo del análisis de datos. El énfasis del lenguaje
está en el uso de una sintaxis clara que garantiza la fácil comprensión y lectura del código. Su base de
código abierto ha permitido la proliferación de diversos paquetes especializados en áreas como la
representación visual de datos, el manejo de estructuras tabulares, o la computación matemática y que
se explorarán en el presente curso. Gracias a que es un lenguaje interpretado es posible desplegarlo en
diversos ambientes (Windows, Unix/Linux, MacOS, Docker, etc.) y para estas ayudantías se utilizará la
plataforma en línea Google Colab que brinda un ambiente de “cuaderno dinámico” utilizando el
paquete Jupyter.

PLATAFORMA INSTITUCIONAL. La plataforma institucional será Moodle (https://moodle.esen.edu.sv) y todos


los recursos (materiales de lectura, enlaces a videos, presentaciones, cuestionarios, evaluaciones, etc.) serán
puestos a disposición en la misma. Los plazos de entrega de actividades o evaluaciones, así como el contenido
a ser incluido en las mismas, serán los que aparezcan en el presente programa y que sean publicados en
Moodle, por lo que una vez definidos, en ningún caso podrán cambiarse, sino bajo autorización del decano.

CONSULTAS. Se pueden realizar de forma presencial en la oficina del profesor David Cruz (lunes y miércoles
entre 1:00 p.m. y 2:30 p.m.), vía zoom previo horario acordado, por correo electrónico, o por la mensajería
interna en Moodle.

RETROALIMENTACIÓN. Todas las evaluaciones realizadas recibirán una retroalimentación clara, concisa y
oportuna, oficialmente notificada, por medio del correo institucional o de la plataforma de Moodle, a fin de
que el estudiante pueda identificar sus áreas de mejora en cada unidad temática. El plazo para la solicitud de
revisión de notas de los y las estudiantes inicia desde el momento en que la pauta o rúbrica aparezca publicada
en el Moodle o haya sido enviada por el correo institucional.

Contenido del Curso


El curso se dividirá en las siguientes cuatro secciones temáticas.

1. Estadística Descriptiva
a. Conceptos básicos de estadística y visualización de datos
b. Distribuciones y sus medidas de posición, dispersión, forma, y asociación

2. Probabilidad
a. Métodos de conteo y fundamentos de probabilidad
b. Distribuciones de probabilidad de variables aleatorias discretas
c. Distribuciones de probabilidad de variables aleatorias continuas

3. Inferencia Estadística
a. Muestreo y distribuciones muestrales
b. Pruebas de hipótesis

4. Correlación y regresión
a. Modelo de regresión lineal simple
b. Modelo de regresión lineal múltiple
A continuación, se presenta el desglose de las secciones anteriores, así como las lecturas asignadas
correspondientes a cada semana del ciclo:

Semana 1. Conceptos básicos de estadística y visualización de datos


Conceptos básicos
▪ Anderson, 2012. Capítulo 1, secciones 1.2, 1.3, 1.4, 1.5
Visualización de datos
▪ Anderson, 2012. Capítulo 2, secciones 2.1, 2.2, 2.4

Semana 2. Distribuciones y sus medidas de posición, dispersión, forma, y asociación


Medidas de posición: media, media ponderada, media de datos agrupados, mediana, moda,
percentiles, cuartiles, diagrama de caja
▪ Anderson, 2012. Capítulo 3, secciones 3.1, 3.4
Medidas de dispersión: rango, rango intercuartil, varianza, varianza de datos agrupados,
desviación estándar, coeficiente de variación
▪ Anderson, 2012. Capítulo 3, sección 3.2
Medidas de forma: valor estandarizado (z), asimetría, curtosis
▪ Anderson, 2012. Capítulo 3, sección 3.3
▪ Lectura complementaria
Medidas de asociación entre dos variables: covarianza, coeficiente de variación
▪ Anderson, 2012. Capítulo 3, sección 3.5

Semana 3. Probabilidad
Métodos de conteo (factoriales, combinaciones, permutaciones) y Probabilidad (definición,
conceptos básicos)
▪ Anderson, 2012. Capítulo 4, sección 4.1
▪ Anderson, 2012. Capítulo 4, sección 4.2
Ley de la adición y ley de la multiplicación de probabilidades (probabilidad condicional)
▪ Anderson, 2012. Capítulo 4, sección 4.3
▪ Anderson, 2012. Capítulo 4, sección 4.4
Teorema de Bayes
▪ Anderson, 2012. Capítulo 4, sección 4.5

Semana 4. Distribuciones de probabilidad de variables aleatorias discretas


Distribución de probabilidad discreta
▪ Anderson, 2012. Capítulo 5, secciones 5.1, 5.2
Valor esperado y varianza
▪ Anderson, 2012. Capítulo 5, sección 5.3
Distribución de probabilidad binomial
▪ Anderson, 2012. Capítulo 5, sección 5.4
Distribución de probabilidad de Poisson
▪ Anderson, 2012. Capítulo 5, sección 5.5
Semana 5. Distribuciones de probabilidad de variables aleatorias continuas
Distribución de probabilidad uniforme
▪ Anderson, 2012. Capítulo 6, sección 6.1
Distribución de probabilidad normal
▪ Anderson, 2012. Capítulo 6, sección 6.2, 6.3

Semana 7. Muestreo y distribuciones muestrales


Muestreo y tipos
▪ Anderson, 2012. Capítulo 7, sección 7.2
▪ Anderson, 2012. Capítulo 7, sección 7.8
Estimación puntual
▪ Anderson, 2012. Capítulo 7, sección 7.3
Distribuciones muestrales: media y proporción
▪ Anderson, 2012. Capítulo 7, sección 7.4, 7.5, 7.6
Propiedades de los estimadores
▪ Anderson, 2012. Capítulo 7, sección 7.7
Margen de error e intervalo de confianza de la media poblacional: desviación conocida y
desconocida
▪ Anderson, 2012. Capítulo 8, sección 8.1, 8.2
Tamaño de la muestra para estimar la media poblacional por intervalo
▪ Anderson, 2012. Capítulo 8, sección 8.3

Semana 8. Pruebas de hipótesis - Parte 1


Hipótesis nula y alternativa
▪ Anderson, 2012. Capítulo 9, sección 9.1
Errores Tipo I y Tipo II
▪ Anderson, 2012. Capítulo 9, sección 9.2
Media poblacional: una cola y dos colas. Desviación conocida y desconocida
▪ Anderson, 2012. Capítulo 9, sección 9.3, 9.4
Proporción poblacional
▪ Anderson, 2012. Capítulo 9, sección 9.5

Semana 9. Pruebas de hipótesis - Parte 2


Diferencia de medias poblacionales (desviaciones conocidas y desconocidas): estimación por
intervalo y prueba de hipótesis
▪ Anderson, 2012. Capítulo 10, secciones 10.1, 10.2
Bondad de ajuste e independencia
▪ Anderson, 2012. Capítulo 12, secciones 12.1, 12.2
Diseño de experimentos y análisis de varianza
▪ Anderson, 2012. Capítulo 13, secciones 13.1, 13.2
Semana 10. Modelo de regresión lineal simple
Modelo de regresión simple
▪ Anderson, 2012. Capítulo 14, sección 14.1
Mínimos Cuadrados
▪ Anderson, 2012. Capítulo 14, sección 14.2
Coeficientes
▪ Anderson, 2012. Capítulo 14, sección 14.3
Supuestos del modelo
▪ Anderson, 2012. Capítulo 14, sección 14.4
Prueba de significancia
▪ Anderson, 2012. Capítulo 14, sección 14.5

Semana 11. Modelo de regresión lineal múltiple


Modelo de regresión múltiple
▪ Anderson, 2012. Capítulo 15, sección 15.1
Mínimos Cuadrados
▪ Anderson, 2012. Capítulo 15, sección 15.2
Coeficientes
▪ Anderson, 2012. Capítulo 15, sección 15.3
Supuestos del modelo
▪ Anderson, 2012. Capítulo 15, sección 15.4
Prueba de significancia
▪ Anderson, 2012. Capítulo 15, sección 15.5

Bibliografía

Libros de texto
▪ Anderson, David R., Sweeney, Dennis J., y Williams, Thomas A. (2012) Estadística para negocios y
economía (11ª ed.) México: McGraw Hill.
▪ Runger, G. y Montgomery, D. (2010). Applied Statistics and Probability for Engineers (5.a ed.). New
Jersey: Wiley.
▪ Triola, Mario F. (2004) Estadística (9a ed.) México: Pearson.

Sitios web
• Python: https://docs.python.org/3/tutorial/index.html
• Pandas:https://pandas.pydata.org/docs/user_guide/index.html#user-guide
• Matplotlib: https://matplotlib.org/stable/users/index.html
• Seaborn: https://seaborn.pydata.org/api.html
• Numpy: https://numpy.org/doc/stable/user/
• Colab: https://medium.com/google-colab
• Excel: https://support.microsoft.com/en-us/excel

Además de las fuentes de información y materiales de apoyo precedentes, en relación con las unidades
temáticas, cuando sea preciso, se proporcionarán a los estudiantes otras fuentes y materiales específicos.
Evaluación

Criterios de evaluación, indicadores de logro e instrumentos de evaluación:

Instrumentos
Criterio de evaluación Indicador de logro
evaluación
Comprende los
• Describe el concepto de distribución y reconoce los Tarea
conceptos principales
diferentes tipos de muestreo, sus ventajas y Examen Parcial
de distribución y
desventajas, y los casos en los que aplica. Proyecto
muestreo

• Calcula la probabilidad asociada a diferentes eventos


Comprende y aplica
• Reconoce en qué casos se utilizan las diferentes Tarea
conceptos básicos de
distribuciones de probabilidad de variables aleatorias Examen Parcial
probabilidad
• Enumera y explica las propiedades de la curva normal

• Enumera y explica las propiedades de un buen


estimador, con énfasis en sesgo, mínima varianza y
consistencia en error cuadrático medio.
Utiliza las medidas • Obtiene estimadores para los estadísticos descriptivos Tarea
básicas de la estadística básicos para un conjunto de datos Examen Final
descriptiva • Estima e interpreta intervalos de confianza para Proyecto
medias, proporciones, diferencias de medias, y
varianzas
• Usa Python para estimar intervalos de confianza

• Conduce pruebas estadísticas de hipótesis utilizando Tarea


Realiza inferencia
niveles de significancia. Utiliza Python para conducir Examen Final
estadística básica
las pruebas de hipótesis. Proyecto

Realiza inferencia • Estima los parámetros de un modelo de regresión por


Examen Final
estadística a través de el método de mínimos cuadrados, evalúa su ajuste,
modelos de regresión predice el valor de la variable explicada.

La nota mínima de aprobación es de 6.0 en la escala de 0.0 a 10.0. Las notas se adjudicarán hasta con un
decimal. La nota de actividades grupales solo se otorga a quienes hayan alcanzado un promedio ponderado de
6.0 o más en las actividades individuales.

Las entregas de tareas que lo ameriten (como el Proyecto), serán sometidas a un software que detecta el plagio
(https://www.compilatio.net/es), por lo que es importante que cumplan todas las normas del Manual de estilo
de trabajos académicos.

El detalle de las evaluaciones y el calendario general del curso se presenta en la siguiente página.

Nota importante: Considere que este programa de estudios, junto con las tareas del curso y las fechas de
entrega están sujetas a cambios, con previo aviso. Además, es responsabilidad del estudiante revisar Moodle
para correcciones o actualizaciones del programa de estudios.
Sección
Semana Contenido Clases Ayudantías Evaluación
temática

1 Conceptos básicos de estadística y


3 1
[Ene15 - Ene19] Estadística visualización de datos

2 Descriptiva Distribuciones y sus medidas de


3 1
[Ene22 - Ene26] posición, dispersión, forma, y asociación

3 Métodos de conteo y fundamentos de


3 1
[Ene29 - Feb2] probabilidad

4 Distribuciones de probabilidad de Tarea 1


Probabilidad 3 1
[Feb5 - Feb9] variables aleatorias discretas (10%)

5 Distribuciones de probabilidad de
3 1
[Feb12 - Feb16] variables aleatorias continuas

6 Examen Parcial
[Feb19 - Feb23] (25%)

7
Muestreo y distribuciones muestrales 3 1
[Feb26 - Mar1]

8 Inferencia
Pruebas de hipótesis - Parte 1 3 1
[Mar4 - Mar8] Estadística

9
Pruebas de hipótesis - Parte 2 3 1
[Mar11 - Mar15]

10 Tarea 2
Modelo de regresión lineal simple 3 1
[Mar18 - Mar22] (10%)
Correlación
[Mar25 - Mar29] Semana Santa
y regresión
11 Entrega Proyecto
Modelo de regresión lineal múltiple 3 1
[Abr1 - Abr5] (20%)

12 Examen Final
[Abr8 - Abr12] (30%)

Participación
(5%)

Tareas 1 y 2 (10% cada una): Serán asignadas en la ayudantía y, aunque cubrirán el contenido visto en clase,
tendrá un componente importante de los conocimientos adquiridos en la ayudantía (uso de Python).

Examen Parcial (25%) y Examen Final (30%): Cubrirán todo el contenido de la primera y segunda mitad del
ciclo, respectivamente. Aunque los formatos específicos se indicarán en fechas cercanas y puede incluirse una
sección virtual, estos exámenes serán esencialmente analógicos (a mano).

Proyecto Grupal (20%): Durante la semana 7 del ciclo se discutirán los detalles de este proyecto grupal que se
entregará y presentará en la semana 11 del ciclo.

Participación (5%): Se espera que todos los alumnos y alumnas participen un mínimo de tres veces en el ciclo.
Se considera “participación” a respuestas a preguntas directas de parte del profesor o instructor, así como todo
aporte o comentario que sintetice, ilustre, o expanda algún concepto discutido en el pleno del salón.
Políticas del curso

PUNTUALIDAD: Las actividades académicas deberán iniciarse a la hora programada y transcurridos diez
minutos será prerrogativa del docente o instructor permitir o no el ingreso de estudiantes. Estas normas están
contenidas en el artículo 25 del Reglamento Académico de la ESEN.

COMUNICACIÓN: Toda comunicación deberá de realizarse a través del correo electrónico institucional o por el
servicio de mensajería de Moodle. Cualquier comunicación proveniente de correos electrónicos no
institucionales será ignorada. Se espera dar respuesta a un correo electrónico en las próximas 48 horas luego
de su recepción.

USO DE CELULARES EN EL AULA: No está permitido el uso de celulares en el transcurso de una clase, salvo que
el docente indique lo contrario. Será prerrogativa del docente o instructor expulsar del salón a quienes
incumplan esta indicación.

COMPROMISO CON LA INTEGRIDAD: Cualquier falta a la integridad académica en cualquier actividad evaluada
(plagio, copia, fraude, etc.) será reportada al comité disciplinario, que abrirá un caso para determinar el curso
de acción a seguir. Todos deben seguir el código de honor de la ESEN:

“Por mi honor y ante mis compañeros, me comprometo a no copiar para que este examen refleje mi
verdadero nivel de conocimientos”.

Solo serán sujetas a revisión las actividades académicas (distintas a exámenes) que incluyan la declaración:

“Por mi honor y ante mis compañeros, me comprometo a que esta actividad académica refleje mi
verdadero nivel de conocimientos, evitando cometer cualquier acto de deshonestidad académica (por
ejemplo, copiar o plagiar)”.

ENTREGAS DE TAREAS, TRABAJOS Y ACTIVIDADES ACADÉMICAS: Deben entregarse en forma impresa de


manera presencial a los docentes o ayudantes, o bien a través de Moodle, según lo indique el docente o
instructor. No se recibirán trabajos tardíos sin justificación válida.

EVALUACIONES DIFERIDAS: No se contempla la realización de evaluaciones diferidas, excepto por


circunstancias de fuerza mayor, por ejemplo, enfermedades con constancia médica o el fallecimiento de un
familiar cercano. No se aceptarán circunstancias recreativas, laborales, o choques con otras asignaturas, como
justificantes para la solicitud de una actividad diferida. Toda actividad diferida, deberá ser aprobada por el
decano de la carrera.

LENGUAJE: El uso de lenguaje soez, y faltas de respeto en general, están estrictamente prohibidos. Su uso
implicará la expulsión de la clase.

ACTIVIDADES NO PERTINENTES A LA CLASE: No está permitido desarrollar actividades ajenas a la materia, esto
incluye trabajos o actividades de otra materia, hacerlo implicará la expulsión de la clase. No está permitido
ingerir alimentos ni bebidas, a excepción de agua, café o té, o si el docente establece lo contrario. En los
laboratorios de informática o de tecnología no habrá excepciones.

CUIDADO DE LA INFRAESTRUCTURA: Los alumnos deben mantener limpios y en perfecto estado todos los
espacios del campus: aulas, auditorios, laboratorios, zonas comunes, zonas verdes, sanitarios, etc.
Sobre uso de la IA

Los estudiantes deben aprender a usar generadores de texto de IA y otros recursos de asistencia basados en IA
(colectivamente, herramientas de IA) para mejorar en lugar de dañar sus habilidades de desarrollo como
escritores, codificadores, comunicadores y pensadores. Los profesores deben garantizar una calificación justa
tanto para aquellos que usan como para aquellos que no usan herramientas de IA, por lo que la siguiente
política de IA enfatiza la transparencia, la equidad, y la honestidad intelectual. Con ese fin, la política adopta
algunas limitaciones de sentido común.

Los estudiantes deberán:

• Dar crédito a las herramientas de IA siempre que se utilicen, aunque solo sea para generar ideas en
lugar de texto o ilustraciones utilizables. Esto implica adjuntar un detalle que explicite el uso que se le
dio a la herramienta, como se desglosa a continuación.
• Cuando use herramientas de IA en las tareas, agregue un apéndice que muestre (a) todo el intercambio,
destacando las secciones más relevantes; (b) una descripción precisa de qué herramientas de IA se
utilizaron (por ejemplo, la versión de suscripción privada de ChatGPT o la versión gratuita DALL-E), (c)
una explicación de cómo se utilizaron las herramientas de IA (por ejemplo, para generar ideas, giros de
frase, elementos de texto, largos tramos de texto, líneas de argumentación, líneas de código, piezas de
evidencia, mapas conceptuales, ilustraciones de conceptos clave, etc.); (d) una explicación de por qué se
utilizaron herramientas de IA (por ejemplo, para ahorrar tiempo, superar el bloqueo del escritor,
estimular el pensamiento, manejar el estrés creciente, aclarar la prosa, traducir texto, experimentar, etc.).
• No utilizar herramientas de IA durante los exámenes o tareas dentro o fuera de la clase, a menos que se
permita e instruya explícitamente.
• Utilice las herramientas de IA de manera inteligente y sabia, con el objetivo de profundizar la
comprensión del tema y apoyar el aprendizaje.

También podría gustarte