Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRESENTADO A:
NORMA PATRICIA GUTIERREZ MURILLO
PRESENTADO POR:
OSCAR JULIAN GALINDO JARAMILLO
DANIEL FELIPE URUEÑA MARTINEZ
FACULTAD DE INGENIERIA
UNIVERSIDAD COOPERATIVA DE COLOMBIA
INGENIERIA CIVIL
IBAGUÉ – TOLIMA
2018
CAPITULO UNO
Que es la estadística
Tipos de estadística
Estadística descriptiva
Población
Muestra
Tablas de frecuencia
La tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra
la distribución de los datos mediante sus frecuencias. Se utiliza
para variables cuantitativas o cualitativas ordinales.
La tabla de frecuencias es una herramienta que permite ordenar los datos de
manera que se presentan numéricamente las características de la distribución de
un conjunto de datos o muestra.
Construcción de las tablas de frecuencia
En la primera columna se ordenan de menor a mayor los diferentes valores que
tiene la variable en el conjunto de datos.
En las siguientes columnas (segunda y tercera) se ponen las frecuencias
absolutas y las frecuencias absolutas acumuladas.
Las columnas cuarta y quinta contienen la las frecuencias relativas y
las frecuencias relativas acumuladas.
Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima),
representando la frecuencia relativa y la frecuencia relativa acumulada como tanto
por cien. Estos porcentajes se obtienen multiplicando las dos frecuencias por cien.
Tipos de frecuencia
Frecuencia relativa
La frecuencia relativa (fi) de un valor Xi es la proporción de valores iguales a Xi en
el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa es la frecuencia
absoluta dividida por el número total de elementos N:
Representación grafica
Las tablas estadísticas representan toda la información de modo esquemático y
están preparadas para los cálculos posteriores. Los gráficos estadísticos permiten,
con solo observarlos, entender de qué se habla, ver sus características más
importantes e incluso sacar alguna conclusión sobre el comportamiento de la
muestra donde se está realizando el estudio.
Diagrama de barras
El diagrama de barras (o gráfico de barras) es un gráfico que se utiliza para
representar datos de variables cualitativas o discretas. Está formado
por barras rectangulares cuya altura es proporcional a la frecuencia de cada uno
de los valores de la variable.
Las principales características del diagrama de barras son:
En el eje de abscisas se colocan las cualidades de la variable, si la variable es
cualitativa, o los valores de dicha variable, si es discreta.
En el eje de ordenadas se colocan las barras proporcionales a la frecuencia
relativa o absoluta del dato.
Las barras pueden ser horizontales o verticales, según si los valores de
la variable se reflejan en el eje horizontal o vertical.
Todas las barras deben tener el mismo ancho y no deben superponerse las unas
con las otras.
Tipos de gráficos de barras
Existen cuatro tipos de gráficos de barras según las series de datos y como están
estas representadas:
Diagrama de sectores
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa
frecuentemente para las variables cualitativas.
Los datos se representan en un círculo, de modo que el ángulo de
cada sector es proporcional a la frecuencia absoluta correspondiente.
Natación 3 36°
Fútbol 9 108°
Total 30 360°
Rango
Rango es la diferencia entre el mayor y el menor de los datos de la muestra
R = Xmenor – Xmayor
Ejemplo:
Para la primera muestra (0, 45, 50, 55, 100), el dato menor es 0 y el dato mayor es
100, por lo que sus valores se encuentra en un rango de:
Rango = 100 – 0 = 0
Amplitud
La amplitud total (AT) es la diferencia entre la puntuación de mayor valor y la de
menor valor:
Numero de intervalos
Los intervalos son una medida estadística dentro de la cual se agrupa una cantidad
exacta de datos determinada por un parámetro estadístico de frecuencia. La
amplitud, en este caso, sería la dimensión que corresponde a cada intervalo para
separarlo uno del otro, y la marca de clase en este caso sería aquello que los
delimita en caso de que la medición sea cualitativa.
Histograma
Un histograma es una representación gráfica de datos agrupados mediante
intervalos. Los datos provienen de unas variables cuantitativas continuas. Gracias
a él puedes hacerte rápidamente una idea de la distribución de los datos o muestra.
También cabe emplear variables cualitativas ordinales, siendo necesario que el
número de datos sea alto.
Un histograma es un conjunto de barras rectangulares verticales que su altura es
proporcional a las frecuencias absolutas de cada uno de los intervalos (también se
pueden representar las frecuencias relativas o frecuencias relativas porcentuales).
Los intervalos abarcan todo el conjunto sin cortarse, de manera que un elemento
está solo en un intervalo. La base de cada barra vertical es proporcional a la
amplitud del intervalo.
Construcción de un histograma
Para construir un histograma es necesario previamente construir una tabla de
frecuencias. Lo construiremos siguiendo los siguientes pasos:
En el eje de abscisas (eje horizontal) se colocan los intervalos, de menor a mayor.
En el eje de ordenadas (eje vertical) se representan las frecuencias absolutas de
cada uno de los intervalos. También se suelen representar las frecuencias relativas.
Se dibujan barras rectangulares de anchura igual y proporcional al intervalo. La
altura es la frecuencia absoluta. Las barras rectangulares se dibujan adyacentes la
una a la otra, pero no intersectan entre ellas. Por tanto, todas las barras tocan con
las de al lado, a no ser que un intervalo tenga frecuencia cero (la altura de la barra
será también cero).
CAPITULO DOS
Medidas de tendencia
Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son: media, mediana y moda. Las medidas de dispersión en cambio
miden el grado de dispersión de los valores de la variable. Dicho en otros términos
las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre
sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir
un conjunto de datos entregando información acerca de su posición y su dispersión.
Según este criterio, haremos primero el estudio de las medidas estadísticas para
datos no agrupados y luego para datos agrupados.
Promedio o media
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la
variable que ocupa la posición central, cuando los datos se disponen en orden de
magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a
la mediana y el otro 50% tiene valores iguales o superiores a la mediana.
Moda
La moda de una distribución se define como el valor de la variable que más se repite.
En un polígono de frecuencia la moda corresponde al valor de la variable que está
bajo el punto más alto del gráfico. Una muestra puede tener más de una moda.
Si la variable es de tipo discreto la moda o modo será al valor de la variable (Yi) que
tenga la mayor frecuencia absoluta ( ). En los datos de la tabla 1 el valor de la moda
es 3 ya que este valor de variable corresponde a la mayor frecuencia absoluta =16.
Med= P50
Los cuartiles, Ql, son un caso particular de los percentiles. Hay 3, y se definen
como:
De forma análoga se definen los deciles como los valores de la variable que
dividen a las observaciones en 10 grupos de igual tamaño. Más precisamente,
definimos D1,D2, ..., D9 como:
Cuartiles
Son valores de la variable que dividen los datos ordenados en cuartos; cada
conjunto de datos tiene tres cuartiles. El primer cuartil, Q1, es un número tal que a
lo sumo 25% de los datos son menores en valor que Q1 y a lo sumo 75% son
mayores. El segundo cuartil es la mediana (50%). El tercer cuartil, Q3, es un
número tal que a lo sumo 75% de los datos son menores en valor que Q3 y a lo
sumo 25% son mayores.
Deciles
Son valores de la variable que dividen los datos ordenados en diez partes iguales
(9 divisiones).
Percentiles
Son los valores de la variable que dividen un conjunto de datos clasificados en 100
subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El k-ésimo
percentil, Pk, es un valor que a lo sumo k% de los datos son menores en valor que
Pk y a lo sumo (100 - k) % de los datos son mayores.
Medidas de dispersión
Las medidas de dispersión, variabilidad o variación nos indican si esos datos están
próximos entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se
encuentran los datos. Estas medidas de dispersión nos permiten apreciar la
distancia que existe entre los datos a un cierto valor central e identificar la
concentración de los mismos en un cierto sector de la distribución, es decir, permiten
estimar cuán dispersas están dos o más distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un
conjunto de datos, siendo la media aritmética el dato central más utilizado. Cuando
existe una dispersión pequeña se dice que los datos están dispersos o acumulados
cercanamente respecto a un valor central, en este caso el dato central es un valor
muy representativo. En el caso que la dispersión sea grande el valor central no es
muy confiable. Cuando una distribución de datos tiene poca dispersión toma el
nombre de distribución homogénea y si su dispersión es alta se llama heterogénea.
Para Datos No Agrupados
Se emplea la ecuación:
Ejemplo ilustrativo:
Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18
Solución:
Se calcula la media aritmética.
Cantidad de
Calificación
asignaturas
6 4
7 2
8 3
9 2
10 1
Total 12
Solución:
Se calcula la media aritmética.
Cantidad de
Calificación
estudiantes
2-4 6
4-6 8
6-8 16
8-10 10
Total 40
Solución:
Para calcular la media aritmética se llena la siguiente tabla:
Intervalo f xm f·xm
2-4 6 3 18
4-6 8 5 40
6-8 16 7 112
8-10 10 9 90
Total 40 260
Informa de lo muy dispersados (o no) que están los datos. Una desviación media
elevada implica mucha variabilidad en los datos, mientras que una desviación media
igual a cero implica que todos los valores son iguales y por lo tanto coinciden con la
media.
Desviación estándar
La desviación estándar es la medida de dispersión más común, que indica qué tan
dispersos están los datos con respecto a la media. Mientras mayor sea la desviación
estándar, mayor será la dispersión de los datos.
Coeficiente de variación
Diagrama de dispersión
El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos
asociados de datos que aparecen en pares (por ejemplo, (x, y), uno de cada
conjunto). El diagrama muestra estos pares como una nube de puntos.
Las relaciones entre los conjuntos asociados de datos se infieren a partir de la forma
de las nubes.
Una relación positiva entre x y y significa que los valores crecientes de x están
asociados con los valores crecientes de y.
Una relación negativa significa que los valores crecientes de x están asociados con
los valores decrecientes de y.
¿Para qué se usa un diagrama de dispersión?
Entre sus usos está descubrir y mostrar las relaciones entre dos conjuntos
asociados de datos y confirmar relaciones anticipadas entre dos conjuntos
asociados de datos.
El diagrama de dispersión puede estudiar la relación entre:
Dos factores o causas relacionadas con la calidad.
Dos problemas de calidad.
Un problema de calidad y su posible causa.
Fuente: AEC
Procedimiento para hacer un diagrama de dispersión
Recolectar datos pareados (x, y) a partir de dos conjuntos asociados de datos cuya
relación va a ser objeto de estudio. Es conveniente contar con 30 pares de datos
aproximadamente.
Rotular el eje x y el eje y.
Encontrar los valores mínimo y máximo, tanto para x como para y y utilizar estos
valores para elaborar la escala de los ejes horizontal (x) y vertical (y). Ambos deben
tener aproximadamente la misma longitud.
Plotear los datos pareados (x, y). Cuando haya dos pares de datos que tengan los
mismos valores, dibujar círculos concéntricos al punto ploteado o plotear el segundo
punto a una corta distancia.
Examinar la forma de la nube de puntos para descubrir los tipos y las fuerzas de las
relaciones.
Cuando hablamos de la relación entre dos tipos de acciones nos referimos a una
relación de causa y efecto, a una relación entre una causa y otra, o a una relación
entre una causa y dos o más causas.
Un diagrama de dispersión relaciona las tres condicionantes antes mencionadas.
Bibliografía
https://www.gestiopolis.com/que-es-estadistica-tipos-y-objetivos/#que-es-
estadistica
http://www.universoformulas.com/estadistica/descriptiva/tabla-frecuencias/
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Estadis
tica_3eso/graficos_estadisticos_mgc.html
http://www.universoformulas.com/estadistica/descriptiva/diagrama-barras/
https://www.vitutor.com/estadistica/descriptiva/a_5.html
http://matepedia-estadistica.blogspot.com/p/tablas-con-intervalos-de-clase-
datos.html
https://agenciainteractivaperu.wordpress.com/2012/02/24/matematicas-
estadistica-5-rango-r/
https://www.uv.es/webgid/Descriptiva/32_amplitud.html
https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934
http://matematicas.reduaz.mx/home/Docentes/ltrueba/diplomado/pagina16.
htm
http://cvonline.uaeh.edu.mx/Cursos/Lic_virt/Mercadotecnia/DMKT010/Unida
d%203/3.5_cuartiles.pdf
https://www.monografias.com/trabajos89/medidas-de-dispersion/medidas-
de-dispersion.shtml
https://support.minitab.com/es-mx/minitab/18/help-and-how-
to/statistics/basic-statistics/supporting-topics/data-concepts/what-is-the-
standard-deviation/
https://www.sangakoo.com/es/temas/desviacion-respecto-a-la-media-y-
desviacion-media
http://economipedia.com/definiciones/coeficiente-de-variacion.html
https://aprendiendocalidadyadr.com/diagrama-de-dispersion/