Está en la página 1de 40

Estadística Aplicada a la Ingeniería

Clase 1 – Estadística Descriptiva


(Primera parte)

Grupo A1-D1
2023 - 02

Profesor: Yerly Fabián Martínez Estupiñán


yerfamar@correo.uis.edu.co
@YerlyFMartinez
Qué es la Estadística ?
La estadística es una ciencia y una rama de las
matemáticas a través de la cual se recolecta,
analiza, describe y estudia una serie de
datos a fin de establecer comparaciones o variabilidades
que permitan comprender un fenómeno en particular
(Montgomery, 1996).

Es el estudio de los fenómenos aleatorios para la


obtención de conclusiones basadas en los datos
experimentales.
Los Ingenieros Civiles
necesitamos la estadística ?
 Cálculo de cargas permisibles probables.
 Estimación de esfuerzos admisibles
 Estimación de resistencia basada en
muestras
 Determinación de las cotas de inundación
probables
 Determinación de caudales extremos para
diseño de estructuras
 Curvas de intensidad frecuencia duración para
el diseño de alcantarillados
 Estimación de rendimientos

 Estimación de demanda vehicular.


 Análisis de comportamiento
 Proyecciones de tránsito.
 Estimación de demanda (pasajeros, bici-
usuarios, peatones, automóviles)
 Estimación de vida útil de proyectos
Primeros
pasos
Exactitud
Cuando alguien ejecuta una acción con
exactitud, el resultado obtenido es aquel
que se pretendía. La exactitud implica la
inexistencia del error o del fallo.

En otras palabras:
Que tan cercano se encuentra el valor
medido o calculado del valor
real (medido en términos de cifras
significativas).

Inexactitud = Sesgo
Precisión
Se refiere a que tan cercanos están,
unos de otros, diversos valores que
fueron medidos o calculados.

Imprecisión = Incertidumbre

Es una medida de la DISPERSIÓN de los


resultados.
Cuál es más preciso?

Cuál es más exacto?

Cuál es a su vez preciso y exacto?


Iniciamos…
Qué es la Estadística ?
La estadística es una ciencia y una rama de las
matemáticas a través de la cual se recolecta,
analiza, describe y estudia una serie de
datos a fin de establecer comparaciones o variabilidades
que permitan comprender un fenómeno en particular
(Montgomery, 1996).

Es el estudio de los fenómenos aleatorios para la


obtención de conclusiones basadas en los datos
experimentales.
La estadística entrega herramientas y técnicas que se usan para
describir y comprender la VARIABILIDAD.

Qué es?

VARIABILIDAD Por qué se produce?

Cómo se identifica?
Se produce por diferencias en los materiales de muestras, diferencias en la forma de trabajar de la
Las observaciones
SeEsidentifica
gente,resultado con
deentécnicas
diferencias de un
loslascambios
variables delfenómeno
estadísticas
que proceso,
ocurren o en
tales
en un
que estudiaremos
como
las sistema cualquiera,
en este
encurso.
temperatura,
condiciones presión, nunca
o duración
las cuales se hacen del
proceso, así como diferencias enproducen
los factores el mismo resultado.
ambientales, como la humedad relativa. La variabilidad
las observaciones.
también ocurre debido al sistema de medida empleado.
ALEATORIEDAD

Corresponde a todo proceso cuyo resultado no es previsible más que en


razón de la intervención del azar. El resultado de todo suceso aleatorio no
puede determinarse en ningún caso antes de que este se produzca.

Qué es una variable?


Es una característica que cambia (varía) de ejemplar a ejemplar en un conjunto
de los mismos.
● Toma diferentes valores, dependiendo del ejemplar (individuo).
● Cada individuo tiene un valor de esa característica (Estatura, nacionalidad,
edad, peso, etc)
Qué tipo de variables podemos encontrar?

Discretas: Solo pueden tomar un número determinado de valores


discretos (algunos valores).

Continuas: Pueden tomar cualquier valor dentro de un intervalo


POBLACIÓN O MUESTRA
POBLACIÓN O MUESTRA
Las observaciones son una parte de
un conjunto de datos
correspondiente a la variable de
interés.

Lo que se conoce como MUESTRA


corresponde a un subconjunto que
se encuentra contenido en el
universo correspondiente a la
Muestra: ES UN SUBCONJUNTO TOMADO POBLACIÓN.
ALEATORIAMENTE DE LA POBLACIÓN EN ESTUDIO Y
DEBEN SER REPRESENTATIVAS DE LA POBLACIÓN
POR QUÉ TRABAJAMOS CON
MUESTRAS Y NO CON
POBLACIONES?
ENTONCES, CÓMO SE DETERMINA
UNA MUESTRA?
Muestra y Población

21
Tipos de muestreo
Muestreo No Probabilístico: las muestras se recogen por medio de un proceso que no les brinda a todos los individuos de la
población las mismas oportunidades de ser seleccionados.
 Muestreo por conveniencia
Las muestras de la población se seleccionan solo porque están convenientemente disponibles para el investigador. Estas muestras
se seleccionan solo porque son fáciles de reclutar y porque el investigador no consideró seleccionar una muestra que represente a
toda la población.
 Muestreo consecutivo
El investigador elige una sola persona o un grupo de muestra, realiza una investigación durante un periodo de tiempo, analiza los
resultados y luego pasa a otra asignatura o grupo de sujetos si es necesario.

 Muestreo por cuotas


Los investigadores pueden formar una muestra que involucre a individuos que representan a una población y que se eligen de
acuerdo con sus rasgos o cualidades.

 Muestreo intencional o por juicio


las muestras se seleccionan basándose únicamente en el conocimiento y la credibilidad del investigador. En otras palabras,
los investigadores eligen solo a aquellos que estos creen que son los adecuados (con respecto a los atributos y la representación de
una población) para participar en un estudio de investigación..
 Muestreo bola de nieve
Este tipo de técnica de muestreo ayuda a los investigadores a encontrar muestras cuando son difíciles de localizar. Los
investigadores utilizan esta técnica cuando el tamaño de la muestra es pequeño y no está disponible fácilmente 22
Tipos de muestreo
Muestreo Probabilístico: las muestras son recogidas mediante un proceso que le brinda a todos los
individuos de la población la misma oportunidad de ser seleccionados.

 Muestreo aleatorio simple


Cada individuo se elige al azar y por pura casualidad. En este tipo de muestreo cada individuo tiene la misma probabilidad de ser
elegido en cualquier etapa del proceso.

 Muestreo sistemático
Se hace una selección aleatoria del primer elemento para la muestra, y luego se seleccionan los elementos posteriores utilizando
intervalos fijos o sistemáticos hasta alcanzar el tamaño de la muestra deseado.

 Muestreo estratificado
Se divide a toda la población objetivo en diferentes subgrupos o estratos, y luego selecciona aleatoriamente a los sujetos finales de los
diferentes estratos de forma proporcional.

 Muestreo por conglomerados


Se seleccionan aleatoriamente varios grupos (llamados conglomerados, cúmulos o áreas) conformados por elementos heterogéneos de
la población, pero que tienen algo en común

23
Tamaño muestral

La mayoría de las fórmulas utilizadas para el cálculo del tamaño de muestra, parten del supuesto de
una distribución normal de los valores de las variables en cuestión

2 2
𝑍 ∗𝜎 ∗𝑁
𝑛= 2 2 2
𝑒 ∗ ( 𝑁 +1 ) + 𝑍 ∗ 𝜎

2
𝑍 ∗ 𝑝 ∗𝑞 ∗ 𝑁 2
𝑍 ∗𝑝∗𝑞
𝑛= 2 2 𝑛=
𝑒 ∗ ( 𝑁 +1 ) + 𝑍 ∗ 𝑝 ∗𝑞 𝑒
2

Población Finita Población Infinita

24
Tamaño muestral

Error Muestral:
Surge porque se está trabajando con muestras y estará siempre presente debido a los factores
aleatorios. No afecta los valores esperados de los promedios de los parámetros estimados.

Sesgo Muestral:
Surge debido a equivocaciones cometidas al definir la población de interés, al seleccionar el método
de muestreo, al seleccionar la técnica de recolección.
El error muestral no se evita (únicamente puede minimizarse aumentando el tamaño de la muestra),
el sesgo muestral se elimina si se tiene cuidado en las diversas etapas del diseño muestral

25
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA

Es la rama de la estadística que trata con la organización, el resumen


y la presentación de datos. Puede aplicarse ya sea a poblaciones
enteras o a muestras.
MEDIDAS DE
TENDENCIA CENTRAL
DESCRIPCIÓN NUMÉRICA DE DATOS

PROMEDIO ARITMÉTICO (Media)


La medida más común de tendencia central.

La media muestral para un conjunto “n” observaciones denotadas como 𝑥1, 𝑥2 ...𝑥𝑛
se define como:

∑ 𝑥𝑖
𝑥 1 + 𝑥 2 +… 𝑥 𝑛
𝑖=1
𝑥= =
𝑛 𝑛

Donde “n” corresponde al tamaño del conjunto correspondiente a la muestra.


DESCRIPCIÓN NUMÉRICA DE DATOS

MODA
Valor que más se repite en la muestra
analizada.

Corresponde al dato con mayor frecuencia


relativa absoluta presente en un conjunto de
datos analizados.

El conjunto de datos puede tener una o más


modas.

Hay casos en que ningún dato se repite


entonces no hay moda.
DESCRIPCIÓN NUMÉRICA DE DATOS

MEDIANA

Es el valor que se encuentra en


posición central de los datos ordenados
de menor a mayor.

Corresponde con el percentil 50 (P50)


es decir el 50% de los datos tienen un
valor inferior a la mediana y el 50% un
valor superior.
MEDIDAS DE
DISPERSIÓN
DESCRIPCIÓN NUMÉRICA DE DATOS

RANGO

Es la diferencia entre el valor máximo y


el mínimo de una serie de números o
valores.
DESCRIPCIÓN NUMÉRICA DE DATOS

VARIANZA
Población
Es una medida de variabilidad
(dispersión) que da cuenta del grado de 𝑁

∑ ( 𝑥 ¿¿ 𝑖¿− 𝑥 )2
homogeneidad de un grupo de datos u 𝑉𝑎𝑟 ( 𝑥 )= 𝑠2 = 𝑖 =1 ¿¿
𝑁
observaciones

Muestra
𝑛

∑ ( 𝑥 ¿¿ 𝑖¿− 𝑥 )2
𝑉𝑎𝑟 ( 𝑥 )= 𝑠2 = 𝑖 =1 ¿¿
𝑛 −1
DESCRIPCIÓN NUMÉRICA DE DATOS

DESVIACIÓN ESTÁNDAR


𝑛

∑ (𝑥 ¿¿ 𝑖¿ − 𝑥)
2

𝑠 𝑥 =√ 𝑉𝑎𝑟 ( 𝑥 )=√ 𝑠2 = 𝑖=1


¿¿
𝑛 −1
DESCRIPCIÓN NUMÉRICA DE DATOS

𝑠𝑥
COEFICIENTE DE VARIACIÓN 𝐶𝑉𝑥=
𝑥
Es una indicación de la desviación
estándar como porcentaje de la media
Aritmética.

Permite una mejor interpretación


porcentual del grado de variabilidad que
la desviación típica o estándar.
DESCRIPCIÓN NUMÉRICA DE DATOS

COEFICIENTE DE ASIMETRÍA (FISHER)

Mide el grado de asimetría de la


distribución con respecto a la media.

Un valor positivo indica que la muestra


está sesgada a la izquierda. Un valor 𝑛

negativo indica que la muestra está ∑ ( 𝑥 ¿¿ 𝑖¿− 𝑥 )3

𝑖 =1
sesgada a la derecha
𝑛
𝑔 1= ¿¿
𝑠𝑥3
DESCRIPCIÓN NUMÉRICA DE DATOS

COEFICIENTE DE CURTOSIS
La curtosis (o apuntamiento) es una
medida de forma que mide cuán
escarpada o achatada está una
curva o distribución.

Indica la cantidad de datos que hay


cercanos a la media, de manera que
a mayor grado de curtosis, más -3
escarpada (o apuntada) será la
forma de la curva.
APLIQUEMOS TODO LO ANTERIOR……
El número promedio de bici-usuarios que circulan por la nueva ciclorruta de la Carrera 21 en Bucaramanga
entre las 5:00 PM y 7:00 PM en un día entre semana en sentido sur - norte es de 228.

25 26 42 39 19 25 43 23 27 29

29 32 18 28 41 42 48 31 33 27

La Alcaldía de Bucaramanga para promover y aumentar el uso de este modo de transporte va hacer un sorteo con
l@s ciclistas que pasan por dicho tramo de ciclorruta, sorteo cuyo premio es un año libre de impuestos. Para realizar el
sorteo la Alcaldía escogió al azar 20 bici-usuari@s, cuyas edades se muestran en la tabla. Para hacer el sorteo el equipo
de trabajo de la Alcaldía debe caracterizar primero su muestra de participantes. Es por eso que usted debe ayudarlo
aplicando sus conocimientos de Estadística Descriptiva.
 Una vez realice la caracterización de la muestra, responda: cuál cree usted que sería la edad MÁS PROBABLE de la
persona que tiene más oportunidad de ganarse el sorteo?
 Cómo cambiaría la respuesta anterior si los mayores de 35 años no pueden participar en el sorteo?
ECUACIONES NECESARIAS…

𝑔 1=¿
𝑛

∑ ( 𝑥 ¿¿ 𝑖¿− 𝑥 )2
𝑉𝑎𝑟 ( 𝑥 ) = 𝑠2 = 𝑖 =1 ¿¿
𝑛 −1

𝑠𝑥
𝐶𝑉𝑥=
𝑥 𝐶𝑢𝑎𝑟𝑡𝑖𝑙𝑒𝑠 , 𝑑𝑒𝑐𝑖𝑙𝑒𝑠 𝑦 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙𝑒𝑠
𝑛

∑ ( 𝑥 ¿¿ 𝑖¿− 𝑥 )3
𝑖 =1
𝑛
𝑔 1= 3
¿¿
𝑠𝑥
𝑅𝑎𝑛𝑔𝑜
¿ de Clases= √ 𝑛 Amplitud de la Clas 𝑒=
¿ 𝑑𝑒 𝐶𝑙𝑎𝑠𝑒𝑠

También podría gustarte