Está en la página 1de 13

1- Importancia de las estadísticas en la ingeniería

La estadística es una herramienta básica en negocios y producción. Es usada para entender


la variabilidad de sistemas de medición, control de procesos, así como el control
estadístico de procesos, para compilar datos y para tomar decisiones. En estas aplicaciones
es una herramienta clave, y probablemente la única herramienta disponible. La estadística
aplicada en la Ingeniería se hace mediante la rama de la estadística que busca
implementar los procesos probabilísticos y estadísticos de análisis e interpretación de
datos o características de un conjunto de elementos al entorno industrial, a efectos de
ayudar en la toma de decisiones y en el control de los procesos industriales y
organizacionales. La importancia de la estadística en la ingeniería se basa en la
participación de la industria en el aumento de la calidad, ya que las técnicas estadísticas
pueden emplearse para describir y comprender la variabilidad, que es el resultado de
cambios en las condiciones bajo las que se hacen las observaciones. La aplicación de la
estadística dentro de la ingeniería nos permite hacer la interpretación de datos o
características de un conjunto de elementos al entorno industrial de manera tal que nos
facilite la toma de decisiones y el control de los procesos industriales u organizacionales
dentro de la obra respectivamente. Las aplicaciones de la estadística dentro de la
ingeniería actualmente han tomado un rápido y sostenido incremento debido al poder del
cálculo computacional. También permite a los ingenieros interpretar mejor determinada
información, haciéndola más entendible e interesante. &un cuando presentan una
cantidad limitada de datos y cifras aproximadas, permite reforzar los argumentos o
conclusiones de una investigación presente.

2- Organización de datos de acuerdo con escalas de medidas


Escala nominal: son aquellas en que sólo se manifiesta una equivalencia de categorías
entre los diferentes puntos que asume la variable. Es como una simple lista de las
diferentes posiciones que pueda adoptar la variable, pero sin que en ella se defina ningún
tipo de orden o de relación.

Ejemplo:
SEXO: Masculino, Femenino.

Escala ordinal: distinguen los diferentes valores de la variable jerarquizándolos


simplemente de acuerdo con un rango. Establecen que existe una gradación entre uno y
otro valor de la escala, de tal modo que cualquiera de ellos es mayor que el precedente y
menor que el que le sigue a continuación. Sin embargo, la distancia entre un valor y otro
no queda definida, sino que es indeterminada. En otras palabras, tales escalas nos
esclarecen solamente el rango que las distintas posiciones guardan entre sí.

Ejemplo:
Nivel académico: Excelente, Bueno, Regular, Deficiente.

Escala de intervalo: además de poseer la equivalencia de categorías y el ordenamiento


interno entre ellas, como en el caso de las ordinales, tienen las características de que la
distancia entre sus intervalos está claramente determinada y que estos son iguales entre
sí.

Ejemplo:
Termometría: entre 23 y 24 grados centígrados.

Escala de razón o proporción: En ellas se conservan todas las propiedades de los casos
anteriores, pero además se añade la existencia de un valor cero reales, con lo que se
hacen posibles ciertas operaciones matemáticas, tales como la obtención de proporciones
y cocientes.

Ejemplo:
Peso: 0 a 50 kg, 51 a 61 kg.

3- Diagrama de círculos
El diagrama circular (también llamado gráfica circular, gráfica de pastel o diagrama de
sectores) sirve para representar variables cualitativas o discretas. Se utiliza para
representar la proporción de elementos de cada uno de los valores de la variable.

Consiste en partir el círculo en porciones proporcionales a la frecuencia relativa.


Entiéndase como porción la parte del círculo que representa a cada valor que toma la
variable.
Cálculo de los sectores

Uno círculo completo tiene 360º (o 2π radianes). El ángulo de cada porción debe ser
proporcional a la frecuencia de cada valor. Por ejemplo, si un valor representa un 50% del
total de elementos, su sector del círculo tendrá un ángulo de 180º (o π radianes).

Sea (X1,X2,…,XN) un conjunto de elementos. La fórmula para calcular el ángulo de cada


sector es la siguiente:

Fórmula del ángulo de cada sector en grados sexagesimales del diagrama circular.

El ángulo de cada sector se calcula como 360º dividido por el total de sujetos (N) y
multiplicado por la frecuencia absoluta (ni), o bien el producto de la frecuencia relativa (fi)
por 360º. También podemos calcular el ángulo en radianes:

Ejemplo:
Los continentes suponen el 29,1% de superficie de la Tierra, el resto es agua. Supongamos
que se pretende representar mediante un diagrama circular la proporción de superficie de
cada continente respecto a la superficie de todos los continentes.

Para dibujar el diagrama, calcula el ángulo de cada uno de los sectores (que serán Europa,
África, América, Asia, Oceanía, la Antártida). Se obtiene la siguiente tabla:
4- Diagrama de barras
El diagrama de barras (o gráfico de barras) es un gráfico que se utiliza para representar
datos de variables cualitativas o discretas. Está formado por barras rectangulares cuya
altura es proporcional a la frecuencia de cada uno de los valores de la variable.

Las principales características del diagrama de barras son:

 En el eje de abscisas se colocan las cualidades de la variable, si la variable es


cualitativa, o los valores de dicha variable, si es discreta.

 En el eje de ordenadas se colocan las barras proporcionales a la frecuencia relativa


o absoluta del dato.

 Las barras pueden ser horizontales o verticales, según si los valores de la variable
se reflejan en el eje horizontal o vertical.

 Todas las barras deben tener el mismo ancho y no deben superponerse las unas
con las otras.
Tipos de gráficos de barras

Existen cuatro tipos de gráficos de barras según las series de datos y como están estas
representadas:

A. Gráfico de barras sencillo

Representa los datos de una única serie o conjunto de datos.

B. Gráfico de barras agrupado

 Representa los datos de dos o más series o conjuntos de datos.

 Cada serie se representa en un mismo color.

 Las barras se colocan una al lado de la otra por categoría de la variable para
comparar las series de datos.
C. Gráfico de barras apilado

 Representa los datos de dos o más series o conjuntos de datos.

 Cada serie se representa en un mismo color.

 Cada barra representa una categoría de la variable, y se divide en segmentos que


representan cada una de las series de datos.

D. Pirámide de población

Una pirámide de población es un diagrama de barras bidireccional que muestra la


población por sexo y rangos de edad en un momento determinado.

En el eje vertical se representan los intervalos de edades. En el eje horizontal se


representan los porcentajes de población. En una dirección se representarán los hombres
y en el otro las mujeres.

Ejemplo

El jefe de una empresa pregunta a sus empleados cuando prefieren disfrutar de sus
vacaciones. Les ofrece cinco quincenas.

Con las respuestas de los 290 trabajadores, construye una tabla:


Para visualizar mejor los datos, dibuja un diagrama de barras verticales.

Se puede observar como la inmensa mayoría de los trabajadores preferiría las vacaciones
en las quincenas de agosto.

5- Diagrama de tallo y hoja


El diagrama de tallo y hojas (Stem-and-Leaf Diagram) es un semigráfico que permite
presentar la distribución de una variable cuantitativa. Consiste en separar cada dato en el
último dígito (que se denomina hoja) y las cifras delanteras restantes (que forman el tallo).

Es especialmente útil para conjuntos de datos de tamaño medio (entre 20 y 50 elementos)


y que sus datos no se agrupan alrededor de un único tallo. Con él podemos hacernos la
idea de qué distribución tienen los datos, la asimetría, etc.
El nombre de tallo y hojas hace referencia a la ramificación de una planta, siendo los
dígitos delanteros marcan el tallo donde se encuentra el número y el dígito final la hoja.

Este diagrama se utilizaba más en los años 80 y 90, cuando los ordenadores no dibujaban
gráficos, aunque sí que escribían dígitos.

Construcción del diagrama de tallo y hojas.

Para construir el diagrama de tallo y hojas, debemos seguir los siguientes pasos:

A. Ordenar los datos.

B. Redondear los números (en el caso de que no lo estén) hasta tengan las cifran que
queramos. Por ejemplo, si tenemos el número 3,62856 y queremos que tenga 2
dígitos la parte decimal, lo redondeamos a 3,63.

C. Dibujar una tabla con dos columnas, la primera columna para el tallo y la segunda
para las hojas. Disponer todos los tallos en la primera columna en orden
descendente. Cada tallo solo se escribe una vez.

D. Registrar en la segunda columna todas las hojas, en orden creciente, junto al tallo
correspondiente.

Ejemplo

En las pruebas médicas de un instituto, se toma la altura de los cuarenta alumnos de una
clase. El médico está interesado en representar gráficamente la variable y opta por
el diagrama de tallo y hoja.

A. Ordena las alturas en una tabla:

B. Los datos son tomados en centímetros, por lo que tiene tres cifras cada número.
En este caso no se requiere redondear los datos, ya que se parte del número de
dígitos que se desea. Los dos primeros dígitos serán el tallo y el último la hoja.
C. Una vez preparados los datos, procede a construir el diagrama. Dibuja una tabla
con dos columnas. En la primera columna coloca los tallos ordenados de menor a
mayor. En este caso los tallos serán: 14, 15, 16, 17 y 18.

D. Se registra en la segunda columna todas las hojas, debidamente ordenadas, junto


al tallo correspondiente:

Se percibe visualmente la distribución de las alturas.

6- Permutaciones y combinaciones
La permutación es un arreglo ordenado de una cantidad finita de objetos distintos. Es
importante tener en cuenta que las permutaciones se pueden identificar como una
muestra seleccionada sin o con reemplazo, pero siempre en orden.

Permutaciones de 3 letras, sin reemplazo: ACB es un ejemplo de una permutación de las


letras A, B y C. Hay en total 6 permutaciones de estas letras: ABC, ACB, BCA, BAC, CBA y
CAB.

Permutación de 4 letras tomándolas de 2 en 2, sin reemplazo: AC es un ejemplo de una


permutación de las letras A, B, C y D, pero tomando solo dos de ellas. Hay un total de 12
permutaciones de estas 4 letras, tomándolas de 2 en 2.

AB AC AD BA BC BD CA CB CD DA DB DC

Permutaciones de 4 letras si hay letras iguales, con reemplazo: CAC es un ejemplo de


permutación de las letras A, C y C. En total hay tres permutaciones de estas letras: ACC,
CAC, CCA.

Son eventos de tipo multiplicativo, donde el número de posibilidades va disminuyendo y si


importa el orden una permutación es un arreglo de un conjunto de objetos en un orden
definido. El número de permutaciones diferentes de estos objetos es ; esto se vé
fácilmente si pensamos que para la primera alternativa disponemos de los elementos del
conjunto, cada uno de los cuales puede complementarse con los restantes como segunda
opción, y así hasta llegar a la última elección, conformando el producto .
El número de permutaciones posibles al tomar objetos del conjunto de elementos será,
siguiendo el mismo razonamiento.

Combinaciones

una combinación, es un arreglo de elementos en donde no nos interesa el lugar o posición


que ocupan los mismos dentro del arreglo. En una combinación nos interesa formar
grupos y el contenido de los mismos.

La fórmula para determinar el número de combinaciones es:

C
n r = Combinaciones de r objetos tomados de entre n objetos

Donde se observa que,

La expresión anterior nos explica como las combinaciones de r objetos tomados de entre n
objetos pueden ser obtenidas a partir de las permutaciones de r objetos tomados de entre
n objetos, esto se debe a que como en las combinaciones no nos importa el orden de los
objetos, entonces si tenemos las permutaciones de esos objetos al dividirlas entre r!, les
estamos quitando el orden y por tanto transformándolas en combinaciones, de otra
forma, también si deseamos calcular permutaciones y tenemos las combinaciones,
simplemente con multiplicar estas por el r! obtendremos las permutaciones requeridas.

7- Distribución de Poisson
La distribución de Poisson es una distribución de probabilidad discreta que se aplica a las
ocurrencias de algún suceso durante un intervalo especifico. La variable aleatoria x es el
número de ocurrencias de un suceso en un intervalo. El intervalo suele ser normalmente
tiempo, distancia, área, volumen o alguna unidad similar. La probabilidad de que el suceso
ocurra x-veces, durante el intervalo, está dada por la siguiente fórmula:
Donde y µ es el número promedio de resultados por unidad de tiempo y donde la
desviación estándar.

La distribución de Poisson debe cumplir los siguientes requisitos:

La variable aleatoria X es el número de ocurrencias de un suceso durante un intervalo.

Las ocurrencias deben ser aleatorias.

Las ocurrencias tienen que ser independientes entre sí.

Las ocurrencias deben estar uniformemente distribuidas dentro del intervalo que se
emplea.

[adrotate banner=”4″]

Aspectos importantes a tener en cuenta:

La distribución de Poisson sólo se ve afectada por el valor de la media µ, al contrario que la


distribución binomial que se veía afectada por el tamaño de la muestra y la probabilidad.

Los valores permitidos para x en la distribución de Poisson no tienen cota superior


(0,1,2,3…) al contrario que la binomial que si estaba acotada (0,1,2,3…n).

Ejemplo:

Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un día dado, b) 10 cheques
sin fondos en cualquiera de dos días consecutivos?

Solución:

a) x = variable que nos define el número de cheques sin fondo que llegan al banco en
un día cualquiera = 0, 1, 2, 3, ....., etc, etc.

λ = 6 cheques sin fondo por día


e = 2.718

b) x= variable que nos define el número de cheques sin fondo que llegan al banco en dos
días consecutivos = 0, 1, 2, 3, ......, etc., etc.

λ = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos días consecutivos
Nota: l siempre debe de estar en función de x siempre o, dicho de otra forma, debe
“hablar” de lo mismo que x.
Media y varianza de la distribución de Poisson
X ∼ P(λ) ⇒ E[X] = Var[X] = λ

Calculo directo En primer lugar,

obtenemos la expresión de E[X].


+∞ +∞ +∞
λx λ x−1 λy
E [ X ] =∑ x ⅇ− λ =λ ∑ e−λ =[ y =x−1]= λ ∑ e−λ =λ ,
x=0 x! x=1 (x−1)! y=0 y!
y
λ
donde la última igualdad se obtiene teniendo en cuenta que ⅇ− λ , y = 0, 1, . . ., es la
y!
función masa de probabilidad de una variable P(λ), por lo que la suma de esos valores es la
unidad. Vamos a obtener ahora la expresión de Var[X], y como

Var[X] = E[X2 ]-(E[X])2 y E[X2 ] = E[X(X -1)] +E[X],

calculamos en primer lugar E[X(X − 1)].


+∞ +∞ +∞
λx λ x−2 λy
E [ X ( X −1 ) ] =∑ x ( x −1) e−λ
=λ2 ∑ e− λ =[ y=x −2]=λ 2 ∑ e−λ =λ2
x=0 x! x=2 ( x−2)! y=0 y!

Por tanto: E [X 2]=E[ X ( X−1)]+ E[ X ]=λ 2+ λ y Var [ X ]=E [x 2 ]−( E[ X ])2=λ

8- Distribución de hipergeométrica
La distribución hipergeométrica es una distribución discreta que modela el número de
eventos en una muestra de tamaño fijo cuando usted conoce el número total de
elementos en la población de la cual proviene la muestra. Cada elemento de la muestra
tiene dos resultados posibles (es un evento o un no evento). Las muestras no tienen
reemplazo, por lo que cada elemento de la muestra es diferente. Cuando se elige un
elemento de la población, no se puede volver a elegir. Por lo tanto, la probabilidad de que
un elemento sea seleccionado aumenta con cada ensayo, presuponiendo que aún no haya
sido seleccionado.
Utilice la distribución hipergeométrica para muestras obtenidas de poblaciones
relativamente pequeñas, sin reemplazo. Por ejemplo, la distribución hipergeométrica se
utiliza en la prueba exacta de Fisher para probar la diferencia entre dos proporciones y en
muestreos de aceptación por atributos cuando se toman muestras de un lote aislado de
tamaño finito.
La distribución hipergeométrica se define por 3 parámetros: tamaño de la población,
conteo de eventos en la población y tamaño de la muestra.
Por ejemplo, usted recibe un envío de pedido especial de 500 etiquetas. Supongamos que
el 2% de las etiquetas es defectuoso. El conteo de eventos en la población es de 10 (0.02 *
500). Usted toma una muestra de 40 etiquetas y desea determinar la probabilidad de que
haya 3 o más etiquetas defectuosas en esa muestra. La probabilidad de que haya 3 o más
etiquetas defectuosas en la muestra es de 0.0384.

Ejemplo de cálculo de las probabilidades hipergeométricas


Supongamos que hay diez automóviles disponibles para que usted los pruebe (N = 10) y
cinco de ellos tienen motores turbo (x = 5). Si prueba tres de los vehículos (n = 3), ¿cuál es
la probabilidad de que dos de los tres que probará tengan motores turbo?

Elija Calc > Distribuciones de probabilidad > Hipergeométrica.


Elija Probabilidad.
En Tamaño de la población (N), ingrese 10. En Conteo de eventos en la población (M),
ingrese 5. En Tamaño de la muestra (n), ingrese 3.
Elija Constante de entrada e ingrese 2.
Haga clic en Aceptar.
La probabilidad de que seleccione exactamente dos automóviles con motores turbo de
forma aleatoria cuando pruebe tres de los diez vehículos es 41.67%.
Propiedades del modelo Hipergeométrico

1) Esperanza: E(X) = nN1/N

2) Varianza: V(X) = (nN1N2 (N − n))/(N2(N − 1))

La diferencia entre las distribuciones hipergeométrica y binomial

Tanto la distribución hipergeométrica como la distribución binomial describen el número


de veces que un evento ocurre en un número fijo de ensayos. Para la distribución
binomial, la probabilidad es igual para cada ensayo. Para la distribución hipergeométrica,
cada ensayo cambia la probabilidad de cada ensayo subsiguiente porque no hay
reemplazo.

También podría gustarte