Documentos de Académico
Documentos de Profesional
Documentos de Cultura
net/publication/323366236
CITATION READS
1 1,681
1 author:
Leandro Gonzalez
Universidad de Bogotá Jorge Tadeo Lozano
15 PUBLICATIONS 17 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Leandro Gonzalez on 23 February 2018.
ISBN 978-958-725-226-2
CDD519.5
Editorial Utadeo
Jefe de Publicaciones: Daniel Mauricio Blanco Betancourt
Coordinación gráfica y diseño: Luis Carlos Celis Calderón
Coordinación editorial: Mary Lidia Molina Bernal
Coordinación revistas científicas: Juan Carlos García Sáenz
Distribución y ventas: Sandra Guzmán
Asistente administrativa: Blanca Esperanza Torres
Edición:
Diseño de carátula y pauta gráfica: Juanita Giraldo
Adecuación pauta gráfica: Luis Carlos Celis Calderón
Corrección de estilo: Juan David Ardila Suárez
Coordinación editorial: Mary Lidia Molina Bernal
Diagramación: Francisco Jiménez
2 Impresión: Disonex S.A.
Análisis
exploratorio
de datos
Una introducción a la
estadística descriptiva
y probabilidad
Leandro González Támara
Contenido
Presentación 11
1 Estadística Descriptiva 15
¿Qué es la estadística? 15
Población, muestras y variables 17
Gráficos para resumir datos cualitativos 20
Diagrama de barras y gráfico de sectores 20
Rascacielos 23
Diagrama de barras y mosaicos 24
Gráficos para resumir datos cuantitativos 41
Diagrama de tallo y hojas 41
Diagrama de dispersión y gráfico de puntos 43
Diagrama de líneas 44
Histogramas 46
Pirámides de población 52
Estadísticos de centro 65
La media o promedio 65
Estadísticas de orden 68
5
La mediana m 70
La moda 72
Estadísticos de variabilidad 91
El rango 92
La varianza 92
La desviación estándar muestral 93
El coeficiente de variación CV 97
Conclusiones acerca de la distribución de una variable 113
La desigualdad de Chevyshev 113
Regla para las distribuciones acampanadas o regla empírica 116
Otras medidas de localización 124
Percentiles muestrales 124
Cuartiles 127
Análisis exploratorio de datos. Una introducción a la estadística descriptiva y probabilidad
6
Técnicas de conteo 188
Regla de la multiplicación 188
Contenido
Permutaciones 192
Combinaciones 196
Conceptos básicos de probabilidad 202
Probabilidad 205
Cálculo de probabilidades 216
Eventos mutuamente excluyentes 220
Complemento de un evento 221
Probabilidad condicional y teorema de Bayes 227
Independencia 229
Teorema de Bayes 232
Variables aleatorias 242
Variables aleatorias discretas 243
Variables aleatorias continuas 251
Referencias 321
Análisis exploratorio de datos. Una introducción a la estadística descriptiva y probabilidad
Contenido
Principio 9. Una carga para los encuestados que no sea excesiva 329
Indicadores 329
Principio 10. Relación costo-eficacia 329
Indicadores 329
Principio 11. Pertinencia 330
Indicadores 330
Principio 12. Precisión y fiabilidad 330
Indicadores 330
Principio 13. Oportunidad y puntualidad 331
Indicadores 331
Principio 14. Coherencia y comparabilidad 331
Indicadores 331
Principio 15. Accesibilidad y claridad 332
Indicadores 332
9
Presentación
El libro de Análisis exploratorio de datos es la evolución del libro de Estadística descriptiva y probabilidad
(González, 2013), que ha sido la referencia principal de un curso dirigido a estudiantes de ciencias económico-
administrativas durante cuatro años en la Universidad de Bogotá Jorge Tadeo Lozano. Esta propuesta pone
mayor acento en la exploración de datos y su interpretación. En lugar de hacer un compendio exhaustivo de
la estadística descriptiva y la probabilidad, en el libro se han seleccionado temas generales de estadística des-
criptiva y probabilidad que les permitan a los futuros profesionales producir y comprender un reporte estadís-
tico por medio de la exploración de datos y su interpretación.
Tal como su predecesor, este es el libro guía de un curso universitario introductorio sobre estadística des-
criptiva y probabilidad. Está escrito con un lenguaje sencillo y claro para favorecer el encuentro inicial con los
conceptos básicos y también propone ideas de tipo didáctico a diferentes tipos de profesionales que se dedi-
can a la enseñanza de esta disciplina. Es un libro diseñado para ser seguido en una clase presencial que motive
la discusión de diferentes temáticas; puede ser considerado como texto de transición porque permite acercar
a los estudiantes a los conceptos por medio de aplicaciones, mucho antes de concentrarse en aspectos teó-
ricos. Contiene más de 100 ejemplos solucionados en detalle para guiar a los estudiantes en su aprendizaje
y casi 300 ejercicios prácticos para motivar la discusión de variadas temáticas de estadística y probabilidad.
El libro contiene seis capítulos. El primero, sobre estadística descriptiva, introduce el lenguaje de la esta-
dística y muestra diferentes formas gráficas para resumir datos. El segundo capítulo gira en torno a los es-
tadísticos de centro y dispersión con énfasis en su interpretación. El tercer capítulo hace una introducción al
concepto de regresión y muestra al estudiante cómo puede usar esta técnica. El capítulo cuatro aborda el
concepto de probabilidad como fundamento para el estudio de las variables aleatorias. Las distribuciones de
probabilidad binomial, Poisson e hipergeométrica se tratan en el capítulo cinco. Por último, en el capítulo seis,
se estudia la distribución normal de probabilidad.
Cada capítulo consta de un ejemplo o situación inicial que motiva el estudio de algunos de los conteni-
dos. En lugar de un desarrollo teórico detallado de los temas, se presentan explicaciones breves para que
los detalles sean tema de discusión en las clases. Hay más de un centenar de ejemplos con explicaciones
minuciosas y estrategias para resolver problemas de análisis de datos y de probabilidad, los cuales en su
11
mayoría abordan situaciones de contextos significativos para los estudiantes con el propósito de despertar
su interés. Estos ejemplos también ayudan a quienes de manera individual se acercan al análisis de datos,
pues sirven de modelo para tratar situaciones en las cuales la exploración y la interpretación de datos son
necesarias. Cada concepto tratado se cierra con una sección de ejercicios para afianzar habilidades y para
generar discusión en las clases. Los ejercicios desarrollan en los estudiantes diversas habilidades de análi-
sis estadístico y también pueden ser utilizados por los profesores de un primer curso de estadística y proba-
bilidad para evaluar el aprendizaje. Se espera que los estudiantes puedan realizar la mayoría de los cálculos
aritméticos y gráficas con un programa de computador o una aplicación estadística para teléfono celular,
para que tanto profesores como estudiantes superen con facilidad los procesos de cálculo y puedan enfati-
zar en los significados y las interpretaciones.
Al final del libro se incluye una sección con seis pruebas de conocimiento que son útiles para evaluar
lo aprendido.
Los datos presentados en el libro son en su mayoría reales y fueron obtenidos en páginas web de entida-
Análisis exploratorio de datos. Una introducción a la estadística descriptiva y probabilidad
12
Varios ejercicios hacen referencia a bases de datos que se pueden consultar en la plataforma virtual
Avata de la Universidad de Bogotá Jorge Tadeo Lozano. Su tamaño obliga a un procesamiento con un pro-
Presentación
grama de computador.
Se advierte que se sigue la convención de escribir la coma como separador decimal y el punto como se-
parador de miles, utilizada en Centroamérica, Suramérica y Europa. No obstante, el lector encontrará algunas
gráficas en las cuales esto no ocurre porque el software con el que fueron generadas proviene de un país don-
de el punto es el separador decimal.
13
Referencias
321
Grima, P. (2010). Estadística: enseñar y crear actitudes positivas a través de casos prácticos. Madrid: Revista
Iberoaméricana de Educación Matemática.
Lohr, S. (2010). Sampling: Design and Analysis. Boston: Cengage Learning.
Malinas, G. y Bigelow, J. (2016). Simpson’s Paradox. In E. Zalta (ed.), The Stanford Encyclopedia of Philosophy.
Recuperado de https://plato.stanford.edu/archives/fall2016/entries/paradox-simpson/
Meisel, A., & Vega, M. (2004). La estatura de los colombianos: un ensayo de antropometría histórica 1910-
2002. Cartagena: Banco de la República de Colombia.
Mendenhall, W. (2013). Introduction to Probability and Statistics. Boston: Cengage Learning.
Ministerio de Salud. (2017). Obtenido de https://www.minsalud.gov.co/Paginas/default.aspx
Ministerio de Transporte. (2017). Histórico bases gravables de vehículos comerciales para pago de impuestos.
Recuperado de https://www.mintransporte.gov.co/Publicaciones/atencion_al_ciudadano/servicios_y_
consultas_en_linea/historico_bases_gravables_de_vehiculos_comerciales_para_pago_de_impuestos
Milton, S. (2001). Estadística para biología y ciencias de la salud. Madrid: McGraw-Hill.
Análisis exploratorio de datos. Una introducción a la estadística descriptiva y probabilidad
322
Este libro se terminó de editar en
la Editorial UTADEO en el mes de
diciembre de 2017