Está en la página 1de 9

MAPA CONCEPTUAL

Estadística y Probabilidades

Por:

Henry Andres Cordoba Maldonado

Tutora:

Yeimy Paola Aristizábal Rodriguez

Universidad Piloto de Colombia


Introducción a la gerencia de proyectos,
Especialización en Gerencia de Proyectos.
Bogota, 26 de julio de 2020
Mapa conceptual

ESTADISTICA
Es la rama de las matemáticas que se ocupa de recolectar,
organizar, presentar, analizar e interpretar datos para
ayudar a una toma de decisiones más efectiva.

Se divide en

DESCRIPTIVA INFERENCIAL
Conjunto de métodos para Conjunto de métodos
organizar, resumir y probabilísticos y estadísticos
presentar los datos de utilizados para saber algo
manera informativa acerca de un todo, basándose
en una pequeña parte de este

De manera Permite analizar e Analiza la


informativa interpretar los datos en una

POBLACION MUESTRA
ORGANIZA ANALIZA
DATOS DATOS
Tiene dos
Tipos de variables
PRESENTA
DATOS TABLA DE CUANTITATIVAS CUALITATIVAS
DISTRIBUCION DE *DISCRETAS *NOMINALES
FRECUENCIAS *CONTINUAS *ORDINALES

Usa medidas
de Se representa como
Gráficos Proporciona información
Relevante y se compone
CENTRALES DISPERCIÓN
HISTOGRAMAS
FRECUENCIA
ABSOLUTA (fa)
VARIANZA
MEDIA
DIAGRAMA DE CAJA
FRECUENCIA
ACUMULADA (fac)
MEDIANA COEFICIENTE
DISPERCIÓN DIAGRAMA DE BARRAS

FRECUENCIA
MODA RELATIVA (fr)
DESVIACIÓN
ESTANDAR

FRECUENCIA
1. Definición de Estadística RELATIVA
RANGO ACUMULADA (fra)
La estadística es una disciplina científica que se ocupa de la obtención, orden y
análisis de un conjunto de datos con el fin de obtener explicaciones y
predicciones sobre fenómenos observados.

La estadística consiste en métodos, procedimientos y fórmulas que permiten


recolectar información para luego analizarla y extraer de ella conclusiones
relevantes. Se puede decir que es la Ciencia de los Datos y que su principal
objetivo es mejorar la comprensión de los hechos a partir de la información
disponible.

2. Diferencias entre estadística descriptiva y estadística inferencial

Estadística descriptiva: Se refiere a los métodos de recolección, organización,


resumen y presentación de un conjunto de datos. Se trata principalmente de
describir las características fundamentales de los datos y para ellos se suelen
utilizar indicadores, gráficos y tablas.

Estadística inferencial: Se trata de un paso más allá de la mera descripción. Se


refiere a los métodos utilizados para poder hacer predicciones,
generalizaciones y obtener conclusiones a partir de los datos analizados
teniendo en cuenta el grado de incertidumbre existente.

3. Conceptos más importantes

Población: Es el conjunto sobre el que se realizará el estudio estadístico.


Individuo o Unidad Estadística: Cada uno de los elementos que componen la
población.
Muestra: Conjunto representativo de la población, pero más pequeño que esta.
Muestreo: Es la reunión de los datos sobre una muestra que serán el objeto de
nuestro estudio estadístico.
Valor: Son todos los resultados que podemos obtener. En el caso de una moneda
serían cara y cruz.
Dato: Los distintos valores que obtenemos para cada individuo. Si lanzamos la
moneda al aire tres veces obtendríamos 3 datos; por ejemplo: cruz, cara, cruz.
Universo: Totalidad de individuos o elementos en los cuales puede
presentarse determinada característica susceptible a ser estudiada.

4. Clasificación de variables y un ejemplo de cada una

Variables cuantitativas (numéricas)


a. Discreta (valores aislados)
b. continúa (todos los valores)

Variables cualitativas (no numéricas)

Variables cuantitativas: discretas y continúas


Las variables cuantitativas son las que se expresan con números o
cantidades.

Una variable cuantitativa es una variable discreta cuando sólo admite valores


aislados, es decir, no hay ninguna cantidad intermedia. Por ejemplo, el número
de hijos puede ser 1, 2, 3… pero no puedes tener un valor intermedio.

Una variable cuantitativa es una variable continua cuando puede tomar


cualquier valor entre un intervalo de valores cualquiera. Por ejemplo, la estatura
de una persona puede ser 1,85 m o el peso puede ser 76,8 kg. No tienen por
qué ser valores concretos.

Variables cualitativas
Las variables cualitativas no se expresan con números, sino mediante
una cualidad.
Podemos distinguir 3 tipos de variables cualitativas:

 Variable cualitativa nominal: Son variables cuyas categorías que no


siguen ningún criterio de orden. Por ejemplo: colores de ojos (verdes,
marrones, azules…), profesiones (abogado, médico, carpintero…), etc.
 Variable cualitativa ordinal: Sus categorías siguen un orden. Por
ejemplo, calificaciones (suspenso, aprobado, notable, sobresaliente), puesto en
una carrera (primero, segundo, tercero…), etc.
 Variable cualitativa binaria: Sólo tiene dos categorías. Por ejemplo,
chico y chica, abierto y cerrado, correcto e incorrecto…

5. Medidas de resumen

Las medidas de resumen sirven para describir en forma resumida un conjunto de


datos que constituyen una muestra tomada de alguna población.

Medidas de centro: permiten tener los valores resúmenes de dichas


características con el fin de poder describir el comportamiento de cada una de
ellas en la población y realizar algún tipo de análisis más detallado. Las medidas
de tendencia central.

La media: es la medida más usada para encontrar el promedio. De hecho, la


gente siempre utiliza la palabra "promedio" para referirse a la "media."
Encontrarla es simple: solo suma todos los números en los datos y divídelos
por la cantidad de números.

La mediana: es el número del medio en un grupo de datos. Sin embargo, los


datos deben estar ordenados numéricamente (de mayor a menor o de menor a
mayor) antes de encontrar este promedio. Si el número del medio está entre
dos números, entonces encuentra la media entre esos dos (súmalos y divídelos
entre 2).

La moda: es probablemente la forma menos común de encontrar el promedio,


y en la mayoría de los casos es la menos útil. Para encontrar la moda, solo
encuentra el número que más se repite. Puede haber más de una moda, o
ninguna.

Moda = número que más se repite.


Medidas de dispersión o variabilidad
Son intervalos que indican la dispersión de los datos en la escala de medición.
Una medida de dispersión o variabilidad nos determina el grado de
acercamiento o distanciamiento de los valores de una distribución frente a su
promedio de localización, indicando por medio de un número si las diferentes
puntuaciones de una variable están muy alejadas de la media. Cuanto mayor
sea ese valor, mayor será la variabilidad, y cuanto menor sea, más homogénea
será a la media. Cuando es cero quiere decir que todos los datos son iguales.

Medidas absolutas: se caracterizan por ser números concretos, es decir,


valores expresados en las mismas unidades de la variable en estudio y que por
lo tanto no permiten comparaciones o análisis respecto a la mayor o menor
dispersión de series expresadas en diferentes unidades. Estas medidas son: la
varianza, la desviación estándar y el rango intercuartílico.

Rango intercuartílico: El rango intercuartílico IQR (o rango intercuartil) es una


estimación estadística de la dispersión de una distribución de datos. Consiste
en la diferencia entre el tercer y el primer cuartil. Mediante esta medida se
eliminan los valores extremadamente alejados. El rango intercuartílico es
altamente recomendable cuando la medida de tendencia central utilizada es la
mediana (ya que este estadístico es insensible a posibles irregularidades en los
extremos).

Desviación estándar: Es el promedio de desviación de las puntuaciones con


respecto a la media.  Esta medida se expresa en las unidades originales de
medición de la distribución. Cuanto mayor sea la dispersión de los datos
alrededor de la media, mayor será la desviación estándar.   Se simboliza con s
o mediante la abreviatura DE. 

Varianza: Está relacionada con el tamaño de la diferencia entre cada


puntuación y la media aritmética de la distribución a que pertenece. Es la
desviación estándar elevada al cuadrado y se simboliza s y un 2 como
potencia. Es un concepto estadístico muy importante, ya que muchas de las
pruebas cuantitativas se fundamentan en él. 
Coeficiente de variación: El coeficiente de variación se suele utilizar con
variables que toman valores positivos y cuya media no está próxima al 0, ya
que en caso contrario al dividir por un valor muy cercano a 0, el resultado
puede desvirtuarse. Se calcula para cada una de las distribuciones y los
valores que se obtienen se comparan entre sí.
La mayor dispersión corresponderá al valor del coeficiente de variación mayor

6. Gráficos más utilizados

Histograma: es un tipo de gráfico que tiene amplias aplicaciones en las


estadísticas. Histogramas proporcionan una interpretación visual de los datos
numéricos , indicando el número de puntos de datos que se encuentran dentro
de un rango de valores. Estos rangos de valores se llaman clases o bins. La
frecuencia de los datos que cae en cada clase se representa por el uso de un
bar. Cuanto más alto que la barra es, mayor es la frecuencia de valores de
datos en que bin.

Diagrama de caja: es un gráfico utilizado para representar una variable


cuantitativa (variable numérica). El gráfico es una herramienta que permite
visualizar, a través de los cuartiles, cómo es la distribución, su grado de
asimetría, los valores extremos, la posición de la mediana, etc. Se compone de:
 Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3).
Dentro de la caja una línea indica dónde se encuentra
la mediana (segundo cuartil Q2)
 Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo,
y otro que empieza en el tercer cuartil y acaba en el máximo.
 Los datos atípicos (o valores extremos) que son los valores distintos
que no cumplen ciertos requisitos de heterogeneidad de los datos.

Los diagramas de caja son muy útiles para comparar una variable en


diferentes grupos.

Diagrama de barras: es una forma de resumir un conjunto de datos por


categorías. Muestra los datos usando varias barras de la misma anchura, cada
una de las cuales representa una categoría concreta. La altura de cada barra
es proporcional a una agregación específica (por ejemplo, la suma de los
valores de la categoría que representa). Las categorías podrían ser desde
grupos de edad a ubicaciones geográficas.

Si se aplica al crear el análisis, el gráfico de barras puede mostrar información


adicional en líneas de referencia o varios tipos distintos de curvas. Estas líneas
o curvas podrían, por ejemplo, mostrar si los puntos de los datos se adaptan
bien a un ajuste de curva polinómica determinado, o resumir un conjunto de
puntos de datos de muestra ajustándolos a un modelo que describirá los datos
y mostrará una curva o una línea recta sobre la visualización. La curva
normalmente cambia su aspecto en función de los valores que se hayan filtrado
del análisis. Al pasar por encima el ratón, una sugerencia sobre herramienta
mostrará la forma en que se calcula la curva.

Ejemplo:

Una tabla de datos contiene las cifras de ventas de varias frutas y verduras
distintas. El gráfico de barras puede mostrar la suma total de ventas de varios
años.

También podría gustarte