Está en la página 1de 57

Conferencia No.

1:
•Introducción al estudio de la Estadística
•Elementos de Estadística Descriptiva.

90

80

70

60

50 Est e
40 Oest e
N ort e
30

20

10

0
1er t r im. 2 d o t r im. 3 er t r im. 4 t o t r im.
Bibliografía:
 Libro de Texto "Probabilidades y
Estadística para Ingenieros" pág. 1 a
4, 5 a 40.
 "Estadística" Caridad Guerra Bustillo
y otros, páginas 9 a 28, 33 a 52.
Sumario:
 Introducción.
 Objeto de estudio de las
Probabilidades y la Estadística.
 Aplicaciones de la Estadística a la
Ingeniería Mecánica.
 Elementos de Estadística
Descriptiva.
El papel de la ESTADÍSTICA en la
investigación, es funcionar como una
herramienta en el diseño de
investigaciones, en el análisis de
datos y en la extracción de
conclusiones a partir de los mismos.
Constituye una poderosa herramienta
de la ciencia de la toma de decisiones
en presencia de la incertidumbre.
Los métodos estadísticos…
permiten tratar tabulaciones
numéricas obtenidas de
observaciones y/o experimentos en
forma de medidas, tomadas de una
fuente o población, con el propósito
de obtener conclusiones de un
sistema o población estudiado.
La ciencia de la Estadística
trata con:
 Colección y compendio de datos.
 Diseños experimentales y reconocimientos.
 Medición de la variación, tanto experimentales
como de reconocimiento.
 Estimación de parámetros de la población y
suministro de varias medidas de exactitud y
precisión de estas estimaciones.
 Ensayo o prueba de hipótesis respecto a
poblaciones.
 Estudio de la relación entre dos o más variables
En el campo de la Ingeniería
Mecánica :
 Demanda mensual de un producto.
 Dimensiones de piezas.
 Rendimiento en Km de un vehículo.
 Tiempo de operación de un equipo.
 Resistencia media a la compresión.
 Eficiencia térmica de motores, etc.
Ramas de la
Estadística

Estadística Estadística
Descriptiva Inferencial

Son aquellas técnicas Son aquellas técnicas


asociadas justamente que permiten la toma
con el tratamiento y de decisiones mediante
procesamiento de un las conclusiones a que
conjunto de datos. se arriben cuando se
analizan características
numéricas.
Análisis descriptivo de un
conjunto de datos.
Escalas de medición y tipos de
datos
Análisis de datos
Si los datos son recoleccionados
adecuadamente, se puede afirmar
que pueden contribuir a:

La toma de decisiones
sobre bases más
objetivas
Escalas de medición y tipos de
datos
Nominal:
Los valores de la variable son nombres o
símbolos que no guardan ninguna relación
de orden, es decir solo diferencia los valores
de la variable. Los datos que se miden en
escalas nominales siempre suelen ser de
tipo cualitativo.
Por ejemplo:
 causas de rotura de un equipo
 sabor de un producto
Escalas de medición y tipos de datos …
Ordinal:
Los valores de la variable pueden ser números
o símbolos que permiten distinguir un orden,
pero no es posible distinguir entre valores
diferentes cuan próximo o alejados se
encuentran. En este tipo de escala los datos
suelen ser cualitativos y cuantitativos. Los
cuantitativos son discretos, es decir, sobre
cantidades o de recuento.
Por ejemplo:
 escalas de orden
 escalas de niveles de gradación
Escalas de medición y tipos de datos …
De Intervalo:
Además de indicar orden, es posible establecer la
distancia entre un valor y otro. El tipo de datos
que suelen medirse en esta escala se denominan
datos continuos, como por ejemplo los que se
refieren a magnitudes de tiempo, peso, longitud
y otros.
Por ejemplo:
 el intervalo [0,10].
 temperatura, presión, resistencia
Recogida de la
información

Por muestreo:
Consiste en observar una muestra de
las variables y anotar sus valores.

 Con un diseño de experimentos:


Consiste en fijar los valores de ciertas
variables y observar las respuestas de
otras.
Análisis de datos:
Los datos recolectados suelen agruparse,
clasificarse, así como definir los descriptores
numéricos globales, para realizar un correcto
el análisis e interpretación de los mismos.
En la realización de esta tarea suelen
utilizarse tablas, gráficos y diferentes valores
numéricos que expresan diversas
características de los datos.
Al agrupar los datos se facilita el análisis,
sin embargo se pierde información.
REPRESENTAR LOS DATOS EN FORMA
DE TABLAS Y/O GRÁFICOS

HISTOGRAMAS DE
TABLAS DE FRECUENCIAS FRECUENCIAS
(GRÁFICOS DE BARRAS O LINEAS)

ANALISIS DE DATOS MEDIANTE


CIERTOS NÚMEROS LLAMADOS:
DESCRIPTORES NUMÉRICOS
1.Medidas de tendencia central:
Son valores numéricos que
caracterizan de forma global la
tendencia central de los datos.
Los descriptores de medidas de
tendencia central más
frecuentemente utilizados son:
promedio o media aritmética,
mediana y moda.
MEDIDAS DE TENDENCIA
CENTRAL
MEDIA O Es el promedio (media aritmética)
PROMEDIO de los argumentos.

Es el valor que se repite con más


MODA frecuencia en una matriz o
rango de datos.

Es el número que se encuentra


en el medio de un conjunto de números,
MEDIANA es decir, la mitad de los números es mayor
que la mediana y la otra mitad es menor.
MEDIANA (1;2;3;4;5) es 3
MEDIANA (1;2;3;4;5;6) es 3,5, el promedio
de 3 y 4.
2. Medidas de variación:
Son valores numéricos que
caracterizan de forma global,
cuan dispersos están los datos
en general y alrededor del
promedio en particular.
Los descriptores de variación más
frecuentemente utilizados son:
varianza, desviación estándar y
rango o amplitud
Es la dispersión de los valores
DESVIACIÓN respecto al valor promedio (media).

VARIANZA Cuadrado de la desviación estándar

Es la diferencia entre el valor máximo y el


RANGO valor mínimo de los datos.
n

x i

1-Media muestral x  i 1
n
n

 x  x
2
i

2- Varianza muestral s2  i 1
n 1

3- Desviación estándar s s 2
o muestral
3. Medidas de simetría, asimetría y
Kurtosis:

Valores numéricos que se refieren a


características de la forma del histograma de
frecuencia de los datos. Algunos de los
descriptores de este tipo son: el coeficiente
de asimetría y el coeficiente de Kurtosis.
Coeficiente de asimetría :
Medida de la simetría o sesgo de la
distribución; es una caracterización del grado
de asimetría de una distribución alrededor de
su media.
Una asimetría de 0 indica que los datos son
simétricamente distribuidos. Los valores
positivos de asimetría indican que la cola
derecha de la curva es más larga que la cola
izquierda; los valores negativos indican que la
cola izquierda es más larga.

q
n
.
n
xi  X 
3

(n  1).( n  2) i 1 S 3
Coeficiente de Kurtosis (k):
La Kurtosis representa la elevación o
achatamiento de una distribución, comparada
con la distribución normal. El coeficiente de
Kurtosis de una distribución normal es cero, por
otra parte, una Kurtosis positiva indica una
distribución relativamente elevada, mientras que
una Kurtosis negativa indica una distribución
relativamente plana.

k
n.(n  1)
.
n
xi  X 
4


3.(n  1)2
(n  1).(n  2).(n  3) i 1 S 4
(n  2).( n  3)
El análisis de tendencia anterior,
complementado con otros
procedimientos, resulta de gran
utilidad para cumplimentar el
objetivo de seleccionar un
modelo teórico que
caracterice el comportamiento
de la distribución de frecuencia
de la variable considerada.
Otros indicadores de interés:
Percentiles y Cuartiles.
Si se divide un conjunto de datos en 4 partes, a los
puntos de división resultantes se les llama cuartiles.

• El primer cuartil, al que se denota por Q1 tiene un


25% (o cuarta parte) de los datos por debajo de él,
•El segundo cuartil coincide con la mediana, que se
denota por Q2 tiene un 50% (o la mitad) de los datos
por debajo de él.
• El tercer cuartil, que se denota por Q3 tiene un 75%
(o las ¾ partes) de los datos por debajo de él.
•El cuarto cuartil, es el valor máximo.
El primer cuartil se denomina el 25vo percentil de la
muestra y se denota por P0.25.
Otros indicadores de interés:
Percentiles y Cuartiles ...

En general, los percentiles se definen de la


siguiente forma:

El p – ésimo percentil de un conjunto de


datos es un valor tal que:
1.- Al menos el 100p% de las observaciones
están en, o por debajo de ese valor.
2.- A lo sumo el 100(1 – p)% están en, o
por encima de ese valor.
Para determinar los estadísticos
correspondientes a los datos mostrados en
la tabla, es posible utilizar un programa
profesional para efectuar los cálculos. Los
resultados se muestran en la siguiente
tabla:
Resumen estadístico de la Variable Consumo
Descriptor Valor Descriptor Valor
Media 150.411 Mínimo 126
Mediana 150 Máximo 173
Moda 147 Rango 47
Varianza 123.84 Asimetría -0.195
Desviación 11.128 Kurtosis -0.803
estándar
¿Cuáles son los elementos
a tener en cuenta para
realizar una tabla de
frecuencias?
• Intervalo de clase: Intervalos que
agrupan los datos de la muestra.
• Marca de clase: Punto medio del
intervalo de clase.
• Frecuencia absoluta (nj): Número de
observaciones en cada intervalo de
clase.
• Frecuencia relativa (fj) : fj= nj/n, donde
n es el número total de observaciones.
• Frecuencia absoluta acumulada N J   ni
J

(Nj): i 1
J
• Frecuencia relativa acumulada (Fj): FJ   f i
i 1
Para datos continuos las clases
son intervalos de valores
denominados intervalos de clases.
Para datos discretos, las clases
son las cantidades, mientras que
en los restantes tipos de datos
las clases son categorías de
clasificación.
Las clases se seleccionan de manera
tal que todo dato pueda ser
totalmente clasificado, es decir, el
mismo pertenece a una y solo una de
las clases. La definición y cantidad de
clases varia en cada caso.
• El número de clases (k) suele seleccionarse
entre 6 y 15,
• El valor de k se recomienda seleccionarlo según
el siguiente criterio práctico:
Cantidad de datos Cantidad de clases (k)
(n)
menos de 50 de 5 a 7
de 50 a 100 de 6 a 10
de 100 a 250 de 7 a 12
más de 250 de 10 a 20
En caso de datos continuos o sobre cantidades, es
frecuente seleccionar las clases con igual amplitud
(h) y se puede determinar a través de la expresión:

donde Xmáx es el mayor valor y Xmín es el menor


valor, de los datos.
Ejemplo No.1:
Para analizar el consumo energético
de un equipo de bombeo sumergible
en agua industrial, se decidió medir el
consumo de este equipo en kwh por
día, durante 90 días. Los resultados
de las mediciones realizadas se
relacionan en la tabla:
135 170 126 156 162 142 152 146 147 157
165 147 160 140 147 131 147 131 146 159
143 131 155 142 140 153 160 129 136 158
151 164 136 149 150 140 160 163 147 155
165 167 167 151 146 150 164 157 164 144
137 134 156 169 156 161 158 138 158 161
134 141 137 162 141 150 148 150 160 159
145 163 163 145 128 158 156 150 162 143
134 173 141 141 149 161 147 163 140 162

Tabla - Consumo diario en kwh (90 mediciones)


El objetivo que se persigue al realizar las
mediciones es efectuar un análisis del
comportamiento del consumo energético
del equipo considerado. La variable
considerada, Consumo diario, es continua y
medida en una escala de intervalo cuya unidad
es kwh.
En este ejemplo limitaremos el análisis a la
construcción de las tablas e histogramas de
frecuencias asociados a la información
disponible.
En correspondencia con la cantidad de 90 datos
y los valores obtenidos para la variable
Consumo, se tomaran 8 clases en el intervalo
[120, 180]. En la Tabla 2 se muestran las tablas
con los diferentes tipos de frecuencias:
No. de Límite Límite Punto fi fri Fi Fri
clases Inferior Superior Medio

Menor que 120 0 0.0000 0 0.0000


1 120 127.5 123.75 1 0.0111 1 0.0111
2 127.5 135.0 131.25 9 0.1000 10 0.1111
3 135.0 142.5 138.75 14 0.1556 24 0.2667
4 142.5 150.0 146.25 23 0.2556 47 0.5222
5 150.0 157.5 153.75 13 0.1444 60 0.6667
6 157.5 165.0 161.25 24 0.2667 84 0.9333
7 165.0 172.5 168.75 5 0.0556 89 0.9889
8 172.5 180 176.25 1 0.0111 90 1.0000
Mayor que 180 - - 0 0.0000 90 1.0000
Gráfico que se compone de un conjunto
de rectángulos que tienen como base el
intervalo de clase y como altura la
frecuencia relativa o la frecuencia
relativa acumulada.

Gráfico que se obtiene al unir los


puntos medios del extremo superior
de cada rectángulo y se unen por
una recta.
Histogramas de frecuencias correspondientes a la
variable Consumo.

41
El análisis de las tablas e histogramas de
frecuencias, así como del resumen
estadístico de los descriptores, facilitan la
caracterización de los datos referente a la
variable estudiada.
Si se aplican los métodos de la estadística
descriptiva, las interpretaciones y
conclusiones sobre el comportamiento de las
variables provienen de los datos observados.
A partir de estos resultados se podría
utilizar un enfoque diferente, o sea, se
podría sugerir cierta teoría, proposiciones
o hipótesis acerca de las variables, las
que serían verificadas a partir de los datos
observados. Este enfoque o rama de la
estadística es la denominada Estadística
Inferencial
Diagrama o Principio de Pareto
 El denominado Principio de Pareto establece
que en muchos fenómenos o procesos, cada
ocurrencia de un cierto efecto E es debido a r
factores o causas C1, C2,...,Cr, de los cuales
solo unas pocas son responsables de la inmensa
mayoría de las veces que ocurre el efecto E; a
este grupo de factores o causas se les suele
denominar los pocos esenciales, mientras
que al resto se les denominan los muchos
triviales.
El Principio de Pareto no es aplicable
a la ocurrencia de todo efecto E.

Un criterio práctico para considerar


aplicable el Principio de Pareto, es que
aproximadamente el 20% de los factores
es responsable de aproximadamente el
80% de la frecuencia de ocurrencia del
efecto E (Criterio del 20 – 80).
Diagrama de Pareto
Histograma de frecuencia, donde la
variable factores o causas de la
ocurrencia del efecto E, son medidas
en una escala nominal con valores C1,
C2, ..., Cr y se contabiliza la frecuencia
de incidencia de cada factor en el
total de las veces que ocurre el efecto
E.
Ejemplo
Un colectivo de profesores, está
interesado en identificar, cuales son las
causas más frecuentes que puedan incidir
en el bajo rendimiento académico de los
estudiantes de un grado, en una
asignatura específica, para ello se
realizaron encuestas y entrevistas a
especialistas y los resultados son los
siguientes:
C1- Problemas en la asistencia a clases
C2- Lejanía a la escuela
C3- Incumplimiento del estudio
independiente
C4- Problemas de atención familiar
C5- Poca motivación por la asignatura
C6- Insuficiente alcance de objetivos del
grado precedente
Causas Frec Abs % % acum.
C3 35 43.75% 43.75%
C5 27 33.75%
33.75% 77.
77. 50%
50%
C1 10 12.50% 90.00%
C2 4 5.00% 95.00%
C4 2 2.50% 97.50%
C6 2 2.50% 100.00%
Total 80
Como se puede apreciar en el gráfico, el
20% de las causas (C3- Incumplimiento
del estudio independiente y C5 - Poca
motivación por la asignatura), son las
responsables del 77.5% de la frecuencia de
ocurrencia del bajo rendimiento académico,
que son las causas pertenecientes al grupo de
los pocas esenciales, mientras que el resto
pertenece al grupo de los muchos triviales.
Cumpliéndose el Criterio del 20/80, por
lo que es aplicable en este caso el
Principio de Pareto.
Orientaciones para el estudio
independiente:
 Estudiar los capítulos 1 y 2 del libro de texto.
 Haga un resumen de los conceptos básicos
estudiados en la conferencia.
 Resolver los siguientes ejercicios del libro de texto:
 Ejercicio 2.1 página 18
 Ejercicio 2.5 página 19
 Ejercicio 2.7 página 19
 Ejercicio 2.25 página 32
 Ejercicio 2.29 página 33
 Ejercicio 2.55 página 38
 Ejercicio 2.65 página 39
Ejemplo (Laboratorio)
En una determinada empresa, se decidió estudiar
el funcionamiento de un compresor de aire.
Se consideró como variable de caracterización
del estudio: la cantidad de fallos del equipo por
meses.
Se analizó un período de 12 meses,
determinándose las causas fundamentales de los
fallos y la frecuencia de ocurrencia de los
mismos.
C1- Fallo del motor eléctrico
C2- Fallos de la trasmisión por correas y
poleas
C3- Fallos en el sistema de enfriamiento
C4- Averías en las válvulas
C5- Desgaste de aros
C6- Fallos rodamientos del conjunto
motor y compresor
C7- Fallos en el sistema de lubricación
C8-Averías en la pizarra eléctrica
C9-Mala alineación del conjunto
Como se puede apreciar en el
gráfico el 20% de las causas
(Rodamiento y lubricación),
son responsables de
aproximadamente el 78% de la
ocurrencia de los fallos;
cumpliéndose el criterio del
20/80, por lo que es aplicable en
este caso el principio de
Pareto.