Está en la página 1de 31

Estadística para Ingeniería

(Básica)
Escuela Superior Politécnica del Litoral (ESPOL)
Periodo Académico 2018 - 2° Semestre
Instructor: Jacobo Mero Herrera, M.Sc.
Agenda de Inducción

• Contenido de la Asignatura

• Criterios de Evaluación

• Referencias Bibliográficas

• Software de la Asignatura

• Credenciales del Instructor

• Introducción a Estadística Descriptiva


Contenido de la Asignatura Primer Parcial

Técnicas de Probabilidad y
Estadística Estadística
Conteo y Teorema de
Descriptiva Bivariada
Probabilidad Bayes

Variables Variables Variables Variables


Aleatorias Aleatorias Aleatorias Aleatorias
Discretas I Discretas II Continuas I Continuas II
Criterios de Evaluación
• Esquema de Calificación del Primer Parcial
Criterio de Calificación Ponderación Periodicidad
Deberes 10% Semanal
Lecciones 20% Bi-semanal
Proyectos 20% Parcial
Examen 50% Parcial

• Esquema de Calificación del Segundo Parcial


• Esquema de Calificación del Primer Parcial

• Esquema de Calificación del Tercer Parcial


• 100% Examen
Referencias Bibliográficas
Software de la Asignatura
Credenciales Académicas del Instructor
• Ingeniero en Estadística Informática
• Especialización: Ciencias Actuariales

• Master en Seguros y Riesgos Financieros


• Tesis: Plan de Contingencia para el Riesgo de Liquidez en una
Institución Financiera – caso retiro masivo de depósitos

• Master en Investigación de Mercados


• Universidad Internacional De La Rioja – La Rioja, España
• Especialización: Machine Learning (En Proyecto)
Introducción a Estadística Descriptiva
http://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen?language=es
Datos e Información
• Datos: Mediciones no procesadas, sean estas numéricas (cuantitativas) o
categóricas (cualitativas).

• Población Objetivo: Conjunto bien definido de N entes; algunas de cuyas


características nos proponemos investigar.

• Unidades de Investigación: Elementos de la Población Objetivo a los que se


les efectúa las medidas bajo análisis.

• Muestra: Subconjunto de n observaciones efectuadas a igual número de


unidades de investigación tomadas de la Población Objetivo.

• Observación: Cada uno de los valores incluidos en la Muestra.


Caracterización de Muestras
Si representamos por X a una característica de interés de cierta Población
Objetivo, a una Muestra de tamaño n tomada de esta Población, la
representaremos por:

{X1, X2, …, Xn}

Es también válido representar esta Muestra por un vector X en Rn de la


siguiente forma:

XT = (X1, X2, …. Xn)

Donde XT representa al vector transpuesto de X.


Obtención de Información
Información: Conjunto de datos procesados que nos permiten tomar
decisiones racionales

Si nos encontramos frente a una Muestra de tamaño n, ¿Qué es lo que nosotros


necesitamos hacer para que pase a ser material estadísticamente útil? , esto es,
para que pase a ser Información.

Cuatro son las acciones que pueden adoptarse y son:

i. Ordenar los datos


ii. Tabular los datos ordenados
iii. Graficar los datos ordenados utilizando el concepto de Frecuencia Relativa
iv. Calcular a partir de la Muestra, cantidades que representa “peculiaridades”
siempre presentes en las Muestras y que son relevantes para la toma de
decisiones
Ordenamiento de Datos
Para representar una Muestra Ordenada debemos definir qué es lo que se
entiende por un Estadístico de Orden.

Dada una Muestra X de tamaño n, al Primer Estadístico de Orden lo


denotamos por X(1) y lo definimos como el mínimo valor entre los elementos
que constituyen la Muestra, esto es,

X(1) = min {X1, X2, …, Xn}

El Estadístico de Orden n se lo denota como X(n) y lo definimos como el


máximo valor que constituye la Muestra, esto es,

X(n) = max {X1, X2, …, Xn}


Clases y Marcas de Clases
Para tabular datos cuantitativos, y así facilitar la exploración estadística de los
mismos, se requiere definir algunos términos:
• Rango: Diferencia entre el Estadístico de Orden n y Primer Estadístico de
Orden de una Muestra.
• Clases: Dada una Muestra, son intervalos de igual longitud, que deben ser
exhaustivos y mutuamente excluyentes en la Muestra.
• Marca de Clase: Corresponde al valor central de cada una de las Clases
definidas para una Muestra
• Longitud de Clase: Corresponde al cociente entre el Rango de la Muestra y
el número de clases sugeridos para el análisis (k≥7).
Ejercicio de Aplicación
Se tiene una Muestra de tamaño n = 50 datos y el mínimo X(1) es igual a 42 mientras que el
máximo X(50) es 106. Se requiere determinar Clases y Marcas de Clase para la Muestra:

Solución:

Se nos sugiere tomar k=7, de tal manera que consideramos pertinente tomar:

A = {x 𝜖 𝑅 | 40≤ x ≤ 110} = [40, 110]

Esto hace posible que:


Primer Clase = [40, 50)
Segunda Clase = [50, 60)
.
Séptima Clase = [100, 110]

[ 42 ) [ ) [ ) [ 106 ]

40 50 60 70 80 90 100 110
[ ) [ ) [ )
a1 ak+1
Tabulación de Datos
• Frecuencia Absoluta: Numero de observaciones en la Muestra que
pertenecen a cada una de las k Clases.

• Frecuencia Relativa de la Primera Clase: Resulta de dividir el numero de


observaciones de la primera clase f1 sobre el tamaño n de la Muestra.

• Frecuencia Relativa: Toda Frecuencia Relativa es un número mayor o igual a


cero pero menor o igual que uno.

• Frecuencia Acumulada Absoluta de la Primera Clase: F1, la Frecuencia


Acumulada Absoluta de la Primera Clase se la define igual a f1.

• Frecuencia Acumulada de la i-ésima Clase: La Frecuencia Acumulada de la


i-ésima Clase es: Fi = f1 + f2 + …. fi-1 + fi
Ejercicio de Aplicación
Se tiene un conjunto de n = 50 datos que luego de ordenarlos, configuran la siguiente
Muestra:
1 2 4 4
5 6 7 7 9
10 12 12 13 14 14 14
15 15 16 16 17 17 17 18 18 19 19 19
20 21 23 23 23 23 24 24 24
27 28 28 29 29
31 32 33 35 35
36 38 39

Estos cincuenta datos representan “el número de fallas cosméticas y estructurales”


detectadas en los edificios de una comunidad urbana que va a ser regenerada por la
municipalidad del cantón. Construir la correspondiente Tabla de Frecuencias.
Tabla de Frecuencias
Ordinal Clase Marca de Frecuencia Frecuencia F. Absoluta F. Relativa
Clase Absoluta Relativa Acumulada Acumulada
1 [0,5) 2.5 4 0.08 4 0.08
2 [5,10) 7.5 5 0.10 9 0.18
3 [10,15) 12.5 7 0.14 16 0.32
4 [15,20) 17.5 12 0.24 28 0.56
5 [20,25) 22.5 9 0.18 37 0.74
6 [25,30) 27.5 5 0.10 42 0.84
7 [30,35) 32.5 3 0.06 45 0.90
8 [35,40] 37.5 5 0.10 50 1.00

G. Zurita: Probabilidad y Estadística, Fundamentos y Aplicaciones


Histograma de Frecuencia con MS Excel
Histograma de Fallas Cosméticas y Estructurales
0,25

0,2

Frecuencia Relativa
0,15

0,1

0,05

37,500
7,500

12,500

22,500
2,500

27,500

32,500
17,500
Polígono de Frecuencia con MS Excel
Diagrama de Ojiva en MS Excel
Medidas de Tendencia Central
• Media Aritmética: Es el valor característico de una serie de datos
cuantitativos objeto de estudio que parte del principio de la esperanza
matemática o valor esperado, se obtiene a partir de la suma de todos sus
valores dividida entre el número de sumandos.
Medidas de Tendencia Central
• Media Geométrica: Es la raíz n-ésima del producto de todos los números, es
recomendada para datos de progresión geométrica, para promediar
razones, interés compuesto y números índices.
Medidas de Tendencia Central
• Media Armónica: Es igual al recíproco, o inverso, de la media aritmética de
los recíprocos de dichos valores y es recomendada para promediar
velocidades.
Medidas de Tendencia Central
• Mediana: Representa el valor de la variable de posición central en un
conjunto de datos ordenados.

Su formula para datos no agrupados viene definida como:


Medidas de Tendencia Central
• Mediana: Representa el valor de la variable de posición central en un
conjunto de datos ordenados. Su formula para datos agrupados viene
definida como:

Donde:
Li = Límite inferior del intervalo que contiene a la mediana
Fj-1 = Frecuencia absoluta acumulada inferior a n/2
Fj = Frecuencia absoluta acumulada superior a n/2
n = número de observaciones
c = Amplitud del intervalo que contiene a la mediana
Medidas de Tendencia Central
• Moda: Representa el valor con una mayor frecuencia en una distribución de
datos. Para el caso de datos agrupados su formula viene definida como:

Donde:
Li = Límite inferior del intervalo que contiene a la moda.
fj = Mayor frecuencia absoluta simple
fi+1 = Frecuencia absoluta inmediata superior
d1= fj – fi-1
d2= fj – fi+1
c = Amplitud del intervalo que contiene a la mediana
Medidas de Dispersión
• Varianza Muestral: Medida de Dispersión de una variable X con respecto a
su Media Aritmética que se la denota como s2 y su formula tanto para datos
no agrupados como agrupados es es igual a:
w

 ( y − y)
w

(y − y )2 fi
2
i i
S2 = i =1
S2 = i =1

n −1 n −1
• Desviación Estándar o Desviación Típica de la Muestra: Medida de
Dispersión que se la denota por s y se la define igual a la raíz cuadrada
positiva de la Varianza. Su formula para datos no agrupados y agrupados es:

1 w 1 w
S= 
n − 1 i =1
( yi − y ) 2 S= 
n − 1 i =1
( yi − y ) 2 f i

1 n 2 1 n 2
 i  yi fi − n y
2
S=
2
S= y − n y
n − 1 i =1 n − 1 i =1
Medidas de Dispersión
• Coeficiente de Variación: Medida de Dispersión que se la denota como CV y
es utilizada cuando se desea hacer referencia a la relación entre el tamaño
de la media y la variabilidad de la variable en análisis.
El valor puede ser expresado como porcentaje y su fórmula viene dada como:
S
CV = 100%
x
A mayor valor del CV mayor heterogeneidad de los valores de la variable, y
a menor CV, mayor homogeneidad en los valores de la variable.
Ejercicios de Práctica

Estadística Matemática con Aplicaciones

• Capítulo 1. Tratamiento Estadístico de Datos


• Ejercicios Propuestos 1.22 al 1.38
Un Excelente Semana!!!
Todo por
hoy futuros
Ingenieros!
Próxima Clase:

• Medidas de Forma: Coeficientes de


Asimetría y Curtosis
• Cuantiles y Medidas de Dispersión de
Datos
• Otros Diagramas y Representaciones
de una Muestra
• Introducción a la Estadística Descriptiva
Bivariada.
“En un mundo que cambia muy rápido, la única estrategia
que garantiza fallar es no correr riesgos.”
Mark Zuckerberg, 2011

También podría gustarte