Está en la página 1de 34

Estadística Avanzada.

I. Introducción (Sesiones I y II)


Muman Rojas, M. Sc.
Maestría en Sistemas de Información
Universidad ECOTEC
Mayo 2021

Estadística Avanzada / M. Rojas 1


Nuestras sesiones: No olvidar:
Diapositivas
Guías de ejercicios
Variables aleatorias y Códigos de ejemplos
Introducción distribuciones de
(aquí estamos) probabilidad
Distribuciones
1 2 3 4 muestrales
Probabilidad

Estimación e
6 5 intervalos de
Inferencia confianza
Estadística
Estadística Avanzada / M. Rojas 2
Nuestras Fechas de Clase

❑07 al 30 de Mayo de 2021


❑ Viernes (07/14/21/28): 18H30 a 21H30 (2 sesiones)
❑ Sábado (08/15/29): 08H00 a 13H30 (3 sesiones)
❑ Domingo: (16/30) 08H00 a 13H00 (3 sesiones)

3
Sobre los recesos

Se realiza un receso de 15 minutos cada 1.5


horas de clase. Los recesos incluirán un
temporizador que quedará expuesto en
pantalla marcando nuestro regreso a las
actividades

Estadística Avanzada / M. Rojas 4


Vamos a necesitar estas
herramientas Supondremos que la instalación es en
Windows, aunque R se encuentra
disponible también para Mac

1
https://www.r- https://mirror.epn Podemos dar OK
project.org/ .edu.ec/CRAN/
en las opciones
predeterminadas

2
https://www.rst https://download Podemos dar OK
udio.com/ 1.rstudio.org/RSt
en las opciones
udio-1.1.456.exe
predeterminadas

Estadística Avanzada / M. Rojas 5


Instrucciones de participación
❑ Cuando ingrese a la sesión no olvide apagar su micrófono e indique “Presente” en el chat de
Blackboard
❑Cuando se abra el espacio de preguntas utilice la opción “Levantar la mano” en Blackboard
para poder participar.
❑Sin embargo puede participar en todo momento durante la sesión utilizando el Chat, de
forma en que si desea hacer una pregunta de forma inmediata tiene disponible ese medio.
❑Las actividades grupales se realizaran a través de los cuartos de reunión de la misma
herramienta Blackboard.
❑Puede pedirse la participación de un estudiante a través del audio para aportar en el
aprendizaje de las sesiones o que comparta su pantalla para la realización de un ejercicio
conjunto.

Estadística Avanzada / M. Rojas 6


Y nuestras bibliografía base y
complementaria
BIBLIOGRAFÍA BÁSICA (BB)

BB1. Lind, D., Marchal, W., Whaten, S. (2008) Estadística Aplicada a los Negocios y Economía. Décimo Tercera Edición. Mc
Graw Hill Interamericana. ISBN-13: 978-970-10-6674-4, ISBN-10: 970-10-6674-X
BB2. McClave, J., Benson, G., Sincich, T. (2010). A first course in business statistics. Eight Edition. Prentice-Hall Publishers ISBN
10: 0130186791 ISBN 13: 9780130186799.

BIBLIOGRAFÍA COMPLEMENTARIA (BC)


BC1. Torfs, P. & Brauer, C. (2014) A (very) short introduction to R. (https://cran.r-project.org/doc/contrib/Torfs+Brauer-Short-
R-Intro.pdf)
BC2. The personality project (2004). A short guide to R. (http://personality-project.org/r/r.guide.html)
BC3. Grolemund, G. & Wickham, H. (2017) “R for Data Science” (http://r4ds.had.co.nz/)
BC4. Hanke, J. & Reitsch, A. (1997). Estadística para Negocios (2ª edición). McGraw Hill 9788448108311

Estadística Avanzada / M. Rojas 7


Nuestro método de evaluación

Actividad Porcentaje
Exámenes parciales 40%
Ejercicios en clase 30%
Proyecto final 30%
Total 100%

Estadística Avanzada / M. Rojas 8


El Examen

Los exámenes corresponderán evaluaciones individuales de casos


prácticos bajo directrices específicas de análisis que se proporcionarán y
suman el 40% de la calificación. El examen se realizará a través de la
plataforma Blackboard, tengan en cuenta fechas y sesiones:
• 16 de Mayo: I Examen (Sesiones 3-10) (16 %)
• 30 de Mayo: II Examen (Sesiones 12-20) (24 %)

Estadística Avanzada / M. Rojas 9


Los Ejercicios Característica
Entrega en el plazo establecido.
%
30%
Cumplimiento del objetivo del ejercicio (según la
plenaria).
30%

Son actividades puntuales a Redacción de las conclusiones solicitadas 20%


presentarse durante el
desarrollo de las sesiones de Consistencia del análisis. 20%
clase como aplicaciones
100%
prácticas de lo revisado en la
sesión plenaria.

Los ejercicios deben ser copiados


en la carpeta asignada en
Blackboard hasta 1 hora después
de terminada la sesión diaria

Estadística Avanzada / M. Rojas 10


El Proyecto (Problema a analizar)
En el marco de la emergencia sanitaria en Ecuador el uso de TICs para. Para ello iniciaremos una investigación que incluya recopilar
información respecto a:
1. Edad
2. Género
3. Estado Civil
4. Rango de ingresos
5. Nivel de Educación (Bachiller, Pregrado, Postgrado)
6. Si se encuentra cursando algún curso corto o seminario de especialización (webinar o similares) en modalidad virtual.
7. Si se encuentra cursando algún curso de pregrado en modalidad virtual.
8. Si se encuentra cursando algún curso de postgrado en modalidad virtual.
9. Piense en el último curso que recibió o en el que se encuentra asistiendo de forma virtual. ¿Que aplicación se encuentra utilizando u
utilizó de forma principal para recibir el curso en cuestión, incluyendo las aplicaciones de videoconferencia?.
10. Si el curso antes indicado es impartido desde Ecuador o desde otra ubicación geográfica.
11. Si el curso antes indicado es/fue gratuito o si realizó alguna inversión en el mismo.
12. Cuál es el tipo de área de formación (Administración, ciencias sociales, humanísticas, etc.) del curso antes indicado.
13. Que medios utiliza de consulta de información académica para el curso en cuestión.
14. Califique de 1=Más baja calificación a 5=Más alta calificación los siguientes factores respecto a la última aplicación utilizada en su curso:
1. Efectividad: La aplicación me permite alcanzar los objetivos de su curso.
2. Eficiencia: La aplicación tiene los recursos suficientes para funcionar en un dispositivo común.
3. Satisfacción: La experiencia del usuario en el uso de la aplicación.
4. Aprendizaje: La sencillez de aprendizaje del uso de la aplicación para un usuario inexperto.
5. Recordación: La sencillez para que un usuario recuerde el uso primario de la herramienta en el futuro.
6. Funcionamiento: El funcionamiento de la aplicación de forma continua sin errores.

Estadística Avanzada / M. Rojas 11


El Proyecto Característica
Características generales: normas, extensión, formato y ortografía
%
5%

El formato de presentación es de un una


Claridad de la hipótesis a evaluar (el problema siendo investigado) 5%
entrada de blog en Medium donde se ilustre Exposición del método estadístico a aplicar (porque es un problema
como mínimo: descriptivo) 10%
❑Una evaluación descriptiva como parte del
problema sugerido para la clase. Soportes descriptivos de la muestra: gráficos, tablas, etc. 15%
❑Utilización de una o más de las herramientas
descritas en clase. Resultados de evaluación del método estadístico. (comentarios en casa
❑Conclusiones derivadas de la evaluación gráfico o tabla) 15%
realizada.
Interpretación de resultados (hipótesis que pueden asociarse a dichos
resultados de evaluación) 10%
Consistencia de las conclusiones (Los resultados deben arrojar un
aporte sobre el problema investigado) 10%
¡5 estudiantes máximo Síntesis de exposición (Mecanismo ejecutivo de exposición adecuado:
15%
datos y material incluido en las diapositivas)
por grupo! Claridad de exposición (Exposición adecuada de los resultados
relevantes) 15%
100%
Estadística Avanzada / M. Rojas 12
Mecanismos de intercambio de
información

Tendremos asignado un espacio en Blackboard :


• Presentaciones: Donde se ubicará nuestras presentaciones y material de
clase.
• Ejercicios: Donde guardarán cada ejercicio que se realice en el espacio
asignado.
• Proyecto: Donde guardará su proyecto final incluyendo el proyecto y las
diapositivas de exposición.

Estadística Avanzada / M. Rojas 13


Ética y estadística

• Vale la pena leer este


documento a lo largo del http://www.amstat.org/asa/f
iles/pdfs/EthicalGuidelines.p
curso, considerando la df
responsabilidad que tiene
siempre un estadístico. Conversaremos sobre este
documento en algunos
momentos durante nuestro
curso.
Estadística Avanzada / M. Rojas 14
¿Preguntas?

• “Sin datos sólo eres otra


persona más dando su opinión”
W.E. Demming

Estadística Avanzada / M. Rojas 15


!Mucha suerte y bienvenidos!
Sigamos en contacto:
mrojas@dmgs.ecotec.edu.ec
(Usar siempre el prefijo “ECOTEC-EA:” para evitar el filtro de Spam)

Estadística Avanzada / M. Rojas 16


FIN DE SESION I
RECESO
( 10 minutos)

17
Una (rápida) introducción a R

Estadística Avanzada / M. Rojas 18


¿Qué revisaremos en esta sesión?
¿Por qué R? El manejo básico
de R
0 1 2
Instalación y
pantallas El manejo de
datos en R:
Estructuras

5 4 3
Programando en
R: Los scripts

Estadística Avanzada / M. Rojas 19


Bibliografía

❑Torfs, P. & Brauer, C. (2014) A (very) short introduction to R.


(https://cran.r-project.org/doc/contrib/Torfs+Brauer-Short-R-Intro.pdf)

❑The personality project (2004). A short guide to R. (http://personality-


project.org/r/r.guide.html)

❑Grolemund, G. & Wickham, H. (2017) “R for Data Science”


(http://r4ds.had.co.nz/)

Estadística Avanzada / M. Rojas 20


Abramos nuestra pantalla de
Rstudio para empezar

21
Una alternativa en línea: R Snippets

22
Las secciones de pantalla en Rstudio

Estadística Avanzada / M. Rojas 23


Algunas parametrizaciones previas

Estadística Avanzada / M. Rojas 24


Usaremos este símbolo para
Las librerías de R denotar código que debemos
digitar o copiar en el módulo
Consola

¿Cómo instalarlas? ¿Cómo activarlas?

install.packages("geometry“) library("geometry“)

Estadística Avanzada / M. Rojas 25


Ahora hagamos unos ejemplos rápidos en Consola
4
1
10^2 + 36 a<-a+10

a
2
a<-4

a
Cuidado: Esta instrucción
limpia todo lo del ambiente
3 de datos
a*5
rm(list=ls())

Estadística Avanzada / M. Rojas 26


Creemos un vector… y apliquemos funciones base
Dos funciones en
3 4 5 extremo útiles para
saber qué hace y
cómo se plantea una
función son las
1 siguientes:
v<-c(3,4,5,6)
help(mean)
Media
mean(x=v)

Desviación
example(mean)
sd(x=v)
Estándar

Estadística Avanzada / M. Rojas 27


Simulemos un conjunto de datos normales estándar… y
revisemos algunas funciones gráficas
4
1
datos<-rnorm(10,0,1) summary(datos)

3
2 hist (datos)
plot (datos)

Estadística Avanzada / M. Rojas 28


Una estructura de datos formal: El Dataframe
x y z 2

11 19 10
El Dataframe es la
estructura de datos
datos$x
más común y
mayormente utilizada
12 20 9 en las funciones de R
de manejo de datos
3
14 21 7 mean(datos$y)
1
4
datos = data.frame(x =
plot(datos$z)
c(11,12,14), y =
c(19,20,21), z = c(10,9,7))

Estadística Avanzada / M. Rojas 29


Importando Dataframes: Usando R y Excel (1/2)
2
Abra el archivo
Prueba.xlsx y guárdelo en
De click en el botón”Browse” y elija
su Escritorio la ruta donde guardó el archivo

1
Ingrese en la opción “Import
dataset” y elija “From Excel”

Estadística Avanzada / M. Rojas 30


Importando Dataframes: Usando R y Excel (2/2)

5
3
Las opciones de importación Al dar click en “Import” se creará
permiten parametrizar el proceso automáticamente el dataframe
de importación de datos

Este proceso es
similar en caso de
importaciones desde
SPSS, Stata o
4
El código que archivos de texto
plano
generará la
importación se
encuentra
disponible
Estadística Avanzada / M. Rojas 31
Tomando el control: Los Scripts de R
2
1 Pasamos las datos<-rnorm(10,0,1)
Un script permite la trazabilidad funciones de la mean(datos)
de los procesos de importación, consola al script sd(datos)
construcción de datos, cálculos,
3
funciones y demás. Ahora podemos
ejecutarlas en un
solo paso

Seleccionamos las
líneas de código y
damos Ctrl + Enter

Estadística Avanzada / M. Rojas 32


Ahora el universo de R no queda aquí:

Software base adicional (y gratis) Librerías de acceso a datos públicos


❑R Markdown ❑OECD
❑R Shiny ❑WDI
❑rsdmx
❑IMFData
Librerías adicionales importantes
❑ggplot2 Las posibilidades y
aplicaciones son casi
❑rworldmap infinitas considerando
el número de
❑psych interacciones posibles
❑dplyr entre R y las
plataformas
❑stargazer existentes

Estadística Avanzada / M. Rojas 33


FIN DE SESION II
!Gracias por su atención!
Sigamos en contacto:
mrojas@dmgs.ecotec.edu.ec
(Usar siempre el prefijo “ECOTEC-EA:” para evitar el filtro de Spam)

Estadística Avanzada / M. Rojas 34

También podría gustarte