Está en la página 1de 18

Universidad Nacional Experimental Estadística

“Francisco de Miranda” Tema 1


Área de Tecnología Prof. Ing. José Raúl Gómez
Complejo Académico “El Sabino”

Tema 1.- Estadistica Descriptiva e Inferencial.


ASPECTOS GENERALES.
RESEÑA HISTÓRICA.
Muchos creen que La Estadística es algo nuevo, ya que hoy en día todo se
fundamenta sobre datos o información estadística, para asombro de todos es tan
antigua como la propia humanidad, según Montgomery D, (1998) hay vestigios de su
inicio antes de Cristo, como en China donde el emperador Yao (2.238 a.C) dispuso la
realización de un censo en su imperio.
La estadística como disciplina de acuerdo a Freíd, Jhon. (2001). tuvo su inicio
en Alemania a mediados del siglo XVII, el reinado de Godofredo de Achenwall (1719 –
1772), utilizo la palabra estadística y la separó de la sociología.
Hoy en día alcanza un alto desarrollo, con la ayuda de tantos investigadores
dedicados a perfeccionar métodos estadísticos modernos, que nos permiten
seleccionar aquellas técnicas más adecuadas para analizar una determinada cantidad
de información, acelerando su proceso de cálculo con la ayuda de los programas de
computación, disminuyendo las probabilidades de error.
La palabra estadística, para algunos proviene de la palabra status cuyo
significado es estado; para otros se deriva del vocablo griego statera que significa
balanza, otra quizás la más confiable, proviene de la palabra alemana stara que
significa estado, encargado de hacer estadísticas.
APLICACIÓN DE LA ESTADÍSTICA.
En la vida diaria los diversos fenómenos de orden económico, social, político,
educacional, climático e incluso biológico entre otros, aparecen, se transforman y
finalmente desaparecen. Para tan abundante y complejo material, es preciso tener un
registro ordenado y continuo a fin de conseguir en un momento dado, los datos
necesarios para el estudio de lo que ha sucedido, sucede o puede suceder.
Para ello se requiere contar con un método, o conjunto de reglas o principios,
que nos permite la observación, el ordenamiento, la cuantificación y el análisis de
dichos fenómenos. Ese método se denomina Estadística.

GOMEZ. J (2007) El campo de la Estadística trata de la recolección,


organización, presentación, análisis y uso de datos para tomar decisiones,
solucionar problemas y diseñar procesos.

Hay dos fases en el campo de la estadística. En primer lugar está la fase que
sólo se limita a la descripción de una serie de datos sin llegar a conclusiones o a
generalizar con respecto a un grupo mayor. Esta (fase) se conoce como Estadística
deductiva o descriptiva. En segundo lugar está la fase de análisis que trata de llegar
a conclusiones acerca de un grupo mayor basado en la información de un grupo menor
o muestra: es esta la Estadística inductiva o de inferencia.
En un principio se consideraba que la función de la Estadística era la descripción
de las características de grupos, actividad que la hacía confundir con el papel que
cumple la historia de observar y describir el hecho. En su origen, las estadísticas eran
históricas, hoy en día, además de ser descriptiva, es analítica, considerándose esta
última como la función más importante que realiza, ya que permite obtener
conclusiones para un grupo mayor, denominado población, partiendo de una
investigación realizada en un grupo menor, conocido como muestra, cuyos elementos,
en la mayoría de casos, se seleccionan aleatoriamente o al azar.

FINALIDAD DE LA ESTADÍSTICA:
 Conocer la realidad de una observación, fenómeno o proceso determinado.
 Determinar lo típico o normal de ese fenómeno o proceso.
 Determinar los cambios o procesos que presento el fenómeno.
 Relacionar 2 o más fenómenos y determinar las causa que lo originan.
 Hacer estimaciones sobre el comportamiento futuro del fenómeno y obtener
conclusiones de un grupo menor (muestra) para hacerlas extensivas a un grupo
mayor (población).
En síntesis, la Estadística facilita una serie de instrumentos o técnicas que, al
ser utilizadas correctamente, permiten determinar el grado, validez y confiabilidad, ya
sea de las predicciones o de las conclusiones obtenidas a partir de muestras.
ASPECTOS BASICOS.
Población: Conjunto completo de elementos o individuos de interés que tienen
en común una cualidad.
 La población puede ser: Finita cuando se conoce su tamaño o infinita cuando
no se conoce su tamaño.
 Se denota con la letra N. Ejemplo:
 Todos los estudiantes de la UNEFM.
 Todos los empleados de PDVSA.
 Todos los habitantes de una comunidad, entre otros.
Muestra: Es un subconjunto o una parte seleccionada de la población y siempre
es finita, su tamaño se denota con la letra n. Ejemplo
 Los estudiantes de una o varias secciones definidas, de ciertas carreras o
complejos académicos de la UNEFM.
Razones del porque se utiliza la muestra en una investigación.
 Si la población es muy grande o infinita, la muestra facilita el trabajo.
 Se ahorra dinero.
 Se ahorra tiempo.
 Minimiza el recurso humano para el desarrollo de la investigación.
 Factibilidad de hacer el estudio cuando la toma de datos implica técnicas
destructivas tales como: Análisis de sangre, control de calidad, etc.

Parámetro: Son todas aquellas medidas que representan numéricamente las


características o elementos que integran una población.
Cualquier medida que se refiera a una población es un parámetro
Estadístico o Estadígrafo: Son medidas que representan numéricamente los
elementos que integran una muestra.
Cualquier medida que se refiera a una Muestra es un estadístico
Variable: Es toda magnitud que varía o elemento de interés que puede tomar
diferentes valores numéricos.
Tipos De Variables:
 Cualitativas.

 Cuantitativas: Discretas.
Continuas.
Variable Cualitativa: Es aquella variable que solo puede clasificarse sin poderse
medir, es decir; es aquella que expresa cualidades.
Ejemplo: Color de la piel. Color del cabello, Color de ojos, sexo, estado civil, etc.
Variable Cuantitativa: Es aquella donde los valores que asume se pueden expresar
en cantidades numéricas, es decir; se puede medir.
Variable Cuantitativa Discreta: Es aquella que se puede medir con números enteros.
Ejemplo: Nº de hijos de una familia, Nº de páginas de un libro, Nº de
estudiantes de una sección, etc.
Variable Cuantitativa Continúa: Es aquella cuyo rango de valores es infinito, es decir;
los valores que asume se pueden representar por números reales. (Admite decimales.)
Ejemplo: Peso, estatura, sueldo, edad, notas, temperatura, presión, etc.
Dato: Es la representación numérica de la variable.
Frecuencia: Es el número de veces que se repite un mismo dato.
Esta Pueden ser:
 Frecuencia Absoluta (f)
 Frecuencia Absoluta acumulada (F)
 Frecuencia Relativa (h)
 Frecuencia Relativa acumulada (H)
Frecuencia Relativa (h): Son las que representan las proporciones o
porcentajes (%) que se obtienen dividiendo la frecuencia absoluta de cada dato o de
cada clase entre el tamaño de la muestra.
Distribución De Frecuencias Es una tabla donde se representan las categorías
numéricas de las variables junto con el número de identidades que se clasifican en
cada categoría, se utilizada en estadística para organizar los datos con sus respectivas
frecuencias.: Se tienen 2 casos:
Caso 1: Se utiliza cuando:
n< 30 datos ó cuando la variable es cualitativa: los datos se organizan
en forma directa o por frecuencia.
Caso 2: Se utiliza cuando:
n ≥ 30 datos y la variable es cuantitativa: es decir; se organizan en forma
de intervalos siguiendo los siguientes pasos:
A. Se determina el número de intervalos, la cual se denota por √ .
B. Se determina el tamaño o la Amplitud de los intervalos a través de la siguiente
ecuación:
donde R= Rango.
R= (X mayor – X menor) + 1
C. Se determina el punto inicial del primer intervalo.
D. Se organizan los datos en una tabla que contenga las siguientes columnas.
Xi - Xs Li - Ls f F H H Xm
Donde: Xinferior - Xsuperior =Limites aparentes Li - Ls =Limites reales
Ejemplo 1: Supóngase que se seleccionaron al azar 5 estudiantes de la sección 11 de
estadística del complejo académico el sabino de la UNEFM y se les pregunto su
respectiva edad, las cuales fueron: 20, 21, 21, 22, 22 años De acuerdo a esta
información
a) ¿Cuál es la población, la muestra, la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
Solución
a) Población: los estudiantes de la UNEFM
Muestra: los 5 estudiantes seleccionados al azar de la sección 11 de
estadística de Ing Industrial del complejo académico el sabino de la UNEFM
Variable: edad
Tipo de variable: cuantitativa continúa
b) Tabla de frecuencia.
X f F h H Comentario [M1]: Estos valores se
obtienen por los cálculos de la formula
20 1 1 0.2 0.2 Comentario [M2]: Significa que un
estudiante de la muestra tiene 20
21 2 3 0.4 0.6 años

22 2 5 0.4 1 Comentario [M3]: Significa que


dos estudiantes tienen 21 años
n = ∑fi = 5 Comentario [M4]: Los valores de
esta columna se obtienen de ir
Ejemplo 2 propuesto: se realizó una encuesta a 100 personas de un sumando en diagonal , los valores
determinado sector de ciudad Punto Fijo para conocer su opinión acerca del servicio de f con F, es decir, la primera
frecuencia absoluta vale 1 lo
eléctrico de su comunidad. De acuerdo a la información recopilada: cual va ser el mismo valor de
la frecuencia absoluta
20 Personas opinaron que el servicio es Bueno, 50 personas opinaron que acumulada. Por lo tanto la
el servicio es Regular y 30 personas opinaron que el servicio es Malo segunda F es igual a 1+2=3

a) ¿Cuál es la población, la muestra, la variable y el tipo de variable?


b) Organice los datos en una tabla de frecuencia.
Ejemplo 3: Cierta compañía de pinturas realizo una encuesta a 32 personas donde se
les preguntaba que indicaran su color favorito, los resultados obtenidos arrojaron que
12 preferían al color rojo, 8 el color verde, 8 el color azul y 4 el amarillo. Distribuya los
resultados de la encuesta en una tabla de frecuencia.
Solución:
X f H F H %
Rojo 12 0.375 12 0.375 37.5
Verde 8 0.25 20 0.625 62.5
Azul 8 0.25 28 0.875 87.5
Amarillo 4 0.125 32 1 100
n = ∑fi =
32
Ejemplo 4: Una fábrica de autos de indicó que durante el último año la
producción ascendió en sus dos plantas, digamos planta I y planta II sin embargo la
compañía ha detectado algunos problemas en su control de calidad y ha tenido
dificultad para cumplir con la demanda de este año, debido al número de errores por
turno de los trabajadores de la planta 1 Los errores son: Comentario [M5]: En todos
los casos 2. la data debe
0 2 3 6 7 8 9 13 16 22 ser ordenada de
menor a mayor
1 2 4 6 7 8 10 14 18 24
1 3 5 6 7 8 10 14 19 26
2 3 5 7 7 9 12 15 20 29
a) Distribuir los errores en una tabla de frecuencia:
Solución:

√ √4 𝑁𝑖 6.32 6 Clases ó Intervalos Comentario [M6]: Para


este caso la tabla que se

Nota: Los valores de


≅ 6 al entero mas próximo
y la A se deben redondear
va a construir tendrá 6
intervalos o filas

Donde R= Rango= (X mayor – X menor) + 1 R = 29 – 0 + 1 R = 30

( )
A= A=5

Xi - Xs Li - Ls f F H H Xm Comentario [M7]: El limite


aparente inferior del primer
0–4 -0.5 – 4,5 10 10 0.25 0.25 2 intervalo en este caso es
cero ya que es el valor del
dato menor para este
5–9 4,5 – 9,5 15 25 0.375 0.625 7 ejercicio.
El limite aparente superior
10 – 14 9,5 – 14,5 6 31 0.15 0.775 12 del primer intervalo en este
caso resulta 4 ya que a partir
15 – 19 14,5 – 19,5 4 35 0.1 0.875 17 del valor Li=0 se cuentan 5
espacios de la amplitud
20 – 24 19,5 – 24,5 3 38 0.075 0.95 22 resultante, es decir,
0-1-2-3-4.
25 - 29 24,5 – 29,5 2 40 0.05 1 27 Para el siguiente intervalo
se inicia con el entero
n = ∑ fi = 40 inmediato al Ls
así de forma sucesiva
Medidas De Tendencia Central: Son los valores que tienden a ubicarse en el centro se van llenando los siguientes
intervalos.
de una distribución
Entre ellas tenemos: Comentario [M8]:
Para el primer intervalo
1. La media aritmética o promedio. Li= Xi - 0,5
2. La mediana. Li= 0 - 0,5 Li= -0,5
Ls= Xs + 0,5
3. La moda. Ls= 4 + 0,5 Ls= 4,5
La Media Aritmética o Promedio: Es el valor más representativo de una serie de De igual forma se
datos. se denota con x barra procede para los
siguientes intervalos
Se utiliza para garantizar la calidad de una investigación o de un determinado proceso Ei 0,5 es un valor
Media muestral: Es la suma de las frecuencias de los datos entre el tamaño estándar

de la muestra si n30 datos. Comentario [M9]: Todos


los valores de esta
-Es el único estadístico que se ve afectado por los extremos columna se obtienen
Ejemplo: de la data. ej
Entre 10 y 14 errores
 Inscripción por promedio hay 6 datos
 Tiempo de duración de acumuladores. etc.
Entre 15 y 19 errores
hay 4 datos
Si n ≥ 30 datos

Ejemplo para n ≥ 30 datos. (Ver página 11)


Ejemplo 1 Supóngase que el número de piezas defectuosas producidas por una
máquina durante una semana (5 días) consecutivos fueron 7, 4, 5, 7 y 3. Encuentre el
promedio de piezas defectuosas que se producen semanalmente.

= = 5,2

La mediana: Es el valor que ocupa el lugar central en una distribución de datos.


La mediana se denota con: Xd
50% Datos 50% Datos

Se utiliza para tener confianza en cualquier investigación o para tener


confianza en un determinado proceso.

Xd = Xi є Li = Lugar. Si n < 30 datos.

( ) Si n ≥ 30 datos.

𝑛
L = : Lugar donde se encuentra la mediana.
Li: Límite inferior real que contiene a Xd.
Fii: Frecuencia absoluta acumulada del intervalo inferior al intervalo
que contiene a Xd
f : Frecuencia absoluta del intervalo que contiene a Xd.
(𝑋 𝑚𝑎𝑦𝑜𝑟 𝑋 𝑚𝑒𝑛𝑜𝑟)
A=
𝑁𝑖
Ejemplo: Supóngase que se han seleccionada 5 estudiantes de las sección 01 y
02 de estadística y le preguntamos su respectiva edad.las cuales fueron: 20, 21,
21, 22,23 años ¿Qué estadístico ocupa el lugar central de los datos

n=5
3 𝐿 3 𝑋𝑑 21
Ejemplo para n ≥ 30 datos. (Ver página 11)

La moda: es el valor que ocurre con mayor frecuencia en una distribución. Se


denota con X0
 Se utiliza para conocer el dato más típico de una distribución.
 Representa, así la primera componente del punto máximo de una serie de
datos.
f
P máx (X0, f mayor)
f mayor

X0 Datos

Para n < 30 datos: X0 = Xi Є frecuencia absoluta mayor


Ejemplo: Se han seleccionado 4 estudiantes y se les preguntó cuál es su
promedio del semestre que acaba de culminar. Los promedios son 12, 11, 12, 15.
¿Qué dato tiene la mayor frecuencia?
.
Xi f
f
11 1 Representa la moda la cual es 12

12 2
Representa la mayor frecuencia .
15 1 P máx (12, 2)
2

13 15 Xi
1 12 14
1 X0

( ) Si n ≥ 30 datos

(𝑋 𝑚𝑎𝑦𝑜𝑟 𝑋 𝑚𝑒𝑛𝑜𝑟)
A=
𝑁𝑖
Li: Límite inferior real del intervalo que contiene la mayor frecuencia.

di : Diferencia inferior = (frecuencia absoluta mayor – frecuencia absoluta del .


intervalo inferior)

ds : Diferencia superior = (frecuencia absoluta mayor – frecuencia absoluta del


intervalo superior)

Ejemplo para n ≥ 30 datos. (Ver página 11)


Medidas de Dispersión: Son aquellos valores que indican el grado de
variabilidad de los datos con respecto a la media.
Entre ellas se tenemos:
Rango: Permite determinar el recorrido que realiza la variable.
R = (X mayor – X menor) + 1
Varianza: Es el valor promedio del cuadrado de la distancia de los datos con
respecto a la media.
Se expresa en unidades cuadradas.
 Para n < 30 datos:
( )
Muestral

( )
Población

 Para n ≥ 30 datos:
( )
Muestral

( )
Poblacional

Desviación Estándar: Es una medida de dispersión que indica el grado de


alejamiento o acercamiento de los datos con respecto al promedio.
.
Se utiliza para mejorar una investigación o un proceso determinado

 Para n < 30 datos:


( )
√ Muestral

( )
√ Poblacional

 Para n ≥ 30 datos:
( )
√ Muestral

( )
√ Poblacional

Coeficiente De Variación: Es una medida de dispersión que expresa la


desviación estándar como un porcentaje (%) de la media.
Se determina mediante la ecuación:

. 1 Coeficiente de variacion muestral.

. 1 Coeficiente de variación poblacional.


Se utiliza para comparar 2 o más grupos y también para saber si la media es o no
representativa

Cv Tipo de Distribución
26% o más Muy heterogéneo, la media no es
representativa
Heterogéneo la media no es
16% al 25%
representativa
Homogéneo la media si es
11% al 15%
representativa
Muy homogéneo la media si es
0% al 10%
representativa

Medidas De Posición: Son las que ocupan un determinado lugar en una


distribución de datos, entre estas medidas tenemos cuantiles o cuartiles y los
percentiles.
Cuantiles O Cuartiles: Son las medidas que surgen cuando se dividen la
distribución en cuatro partes iguales de datos.
Q1= Cuartil uno o primer cuartil
Q2= Cuartil dos o segundo cuartil
Q3= Cuartil tres o tercer cuartil.
Percentiles: Son medidas que surgen si se divide en 100 partes iguales las
distribuciones de los datos y se denota con Xp.
Ejemplo:
 X25 = Percentil 25
 X50 = Percentil 50

Percentil: Es un valor por debajo del cual hay un porcentaje acumulado de


datos.
Ejemplo para n ≥ 30 datos.

( )

𝑛 (𝑋 𝑚𝑎𝑦𝑜𝑟 𝑋 𝑚𝑒𝑛𝑜𝑟)
L= : Lugar (F) A=
𝑁𝑖

n= Tamaño de la muestra
Fii = Frecuencia absoluta Acumulada del intervalo
inferior al que contiene Xp
f= Frecuencia Absoluta del Intervalo que contiene X p

Medidas de Formas: Son aquellas que indican la forma que tiene una
distribución de datos. Dentro de estas medidas tenemos:
 Distribución Simétrica.
 Distribución Asimétrica.
 Curtosis.
Sesgo: Es la forma de la distribución que se origina cuando no podemos fijar un
punto que divida en 2 partes iguales la serie de datos, produciéndose así una mayor
concentración de las observaciones hacia uno de los extremos de la curva.
Distribución Simétrica: Es cuando la media es igual a la moda y a su vez es
igual a la mediana ubicándose en el centro de la distribución.

X = X0 = Xd

Distribución Asimétrica: Es cuando se produce un sesgo en la distribución.


Puede ser asimétrica positiva o asimétrica negativa.
Asimétrica Positiva: Es cuando la media se desplaza a la derecha de la moda,
produciéndose la mayor concentración de datos por debajo de la media, es decir; la
media es mayor que la mediana y mayor que la moda.

X0 < Xd < X

Asimétrica Negativa: Se produce cuando la media se desplaza a la izquierda


de la moda originándose una mayor concentración de datos por encima de la media, es
decir; la media es menor que la mediana y menor que la moda.

X < Xd < X0

Coeficiente De Asimetría: Es el valor que permite determinar si la distribución


tiene un sesgo o no.

𝑋−𝑋
𝐶. 𝐴
𝑆

Caso 1: Si C.A = 0 No hay sesgo.

X
Xo
Xd
Caso 2: Si C.A < 0 Hay sesgo a la izquierda. La distribución es asimétrica negativa.

X Xd Xo

Caso 3: Si C.A > 0 Hay sesgo a la derecha. La distribución es asimétrica positiva.

Xo Xd X

Ejemplo aplicado a la Ingeniería


Los siguientes datos corresponden a las temperaturas diarias medidas en ºC
del chorro de descarga del agua de las torres de enfriamiento de la planta
FERTINITRO ubicada en el oriente del país, realizadas durante 49 días consecutivos
desde el 17/04/07 al 04/06/07.
35 39 40 42 43 45 47 48 51 53
35 39 41 42 44 45 47 48 51 54
36 39 41 42 45 46 47 48 51 55
36 40 42 42 45 46 48 50 51 55
36 40 42 43 45 47 48 51 53

Se pregunta lo siguiente:
1. ¿Cuál es la población, la muestra, la variable y el tipo de variable?
2. Organice los datos en una tabla de frecuencia.
3. ¿Qué estadístico garantiza la calidad del proceso de descarga de la planta?
4. ¿Cuál estadístico se puede utilizar para tener confianza en la investigación?
5. ¿Cuál es la temperatura más típica del proceso y cuál es el punto máximo de
la distribución?
6. ¿Qué temperatura se puede utilizar para mejorar el proceso?
7. Explique si las temperaturas son homogéneas o heterogéneas.
8. Diga si la media es o no representativa
9. Explique si la distribución presenta un sesgo y en qué dirección
10. Construya un histograma
Solución:
1. Población, la muestra, la variable y el tipo de variable:
Comentario [M10]: El limite
aparente inferior del primer
intervalo en este caso es 35
2. Tabla de frecuencia: ya que es el valor del dato
menor para este ejercicio.
El limite aparente superior
del primer intervalo en este
caso resulta 37 ya que a
n = 49 =√ Ni = √4 =7 Número de intervalos partir del valor Li=35 se
cuentan 3 espacios de la
amplitud, es decir, 35 36 37.
Para el siguiente intervalo
se inicia con el entero
( ) ( ) inmediato, quedando
A= A= A = 3 Amplitud de 38 a 40.
así de forma sucesiva.

Comentario [M11]: Esta


frecuencia absoluta de 6
Xi - Xs Li - Ls f F h H Xm f *Xm ( − ) está en el Segundo
intervalo, por lo
tanto es inferior en
5(36 - 44.93)2 =
35 - 37 34.5 – 37.5 5 5 36 180 posicion a la f mayor
398.7245
Comentario [M12]:
6(39 - 44.93)2 = Frecuencia absoluta
38 – 40 37.5 – 40.5 6 11 39 234 mayor, Su valores 10.
210.9894 Esta ubicada
en el tercer intervalo.
10(42 - 44.93)2 =
41 – 43 40.5 – 43.5 10 21 42 420 Comentario [M13]: Esta
85.849
frecuencia absoluta de 8
44 – 46 43.5 – 46.5 8 29 45 360 8(45 - 44.93)2 = 0.039 está en el cuarto intervalo,
por lo tanto es superior en
9(48 - 44.93)2 = posición a la f mayor.
47 – 49 46.5 – 49.5 9 38 48 432
84.824
Comentario [M14]: Este
6(51 - 44.93) 2= valor permite entrar a la
50 – 52 49.5 – 52.5 6 44 51 306 tabla ubicando en las
221.069
columnas de las frecuencias
5(54 - 44.93)2 = absolutas en valor de 24,5
53 - 55 52.5 – 55.5 5 49 54 270 el cual lo
411.0324 ubicamos en el cuarto
intervalo (8 29) ya que
∑fi = n = 49 ∑f*Xm = 2202 ( − ) = 1412.818 está comprendido entre
ellos, de allí seleccionamos
los parámetros de la formula,
excepto Fii el cual se toma
del intervalo inferior.

Comentario [M15]: Para


3. X = 44.938 ºC el cálculo de la moda se
selecciona el intervalo o
fila donde se encuentre la
frecuencia absoluta mayor,
4. ( ) L= 24.5 en este caso esta tiene
un valor de 10, de allí
se toma Li.
Para los valores de di
.
43.5 ( )3 Xd= 44.812 ºC se resta del valor de
10 seleccionado
anteriormente, la
frecuencia absoluta
inferior en posición.
5. ( ) di = 10 – 6 di = 4 Para los valores de ds
se resta del valor de
10 seleccionado
ds = 10 – 8 ds = 2 anteriormente la
frecuencia absoluta
superior posición.
4 .5 ( )3 42.5 ºC

( ) .
6. √ √ 5.425ºC

.
7. . 1 . 1 . 12. 7%
.

. 12. 7 La distribución es Homogénea..

8. La media es representativa

. .
9. . . . .44
.

. .44 > 0 Hay sesgo a la derecha. La distribución es asimétrica positiva .

Es decir: X > Xd > X0


f

Xo Xd X
EJERCICIOS
Tema 1.- ESTADISTÍCA DESCRIPTIVA E INFERENCIAL.
Nota: utilizar como minimo 3 (tres) decimales en los cálculos
1.- Para estudiar la eficacia de un tratamiento sobre las resistencias de un determinado
concreto se han evaluado 55 probetas en el laboratorio de cierta empresa de
fabricación de premezclados, las cuales se les realizaron las mediciones de la
resistencia en MPA, los datos han sido los siguientes:

10 10 10 11 12 12 12 12 14 14 14 15

15 16 16 17 17 18 18 20 20 20 20 20

21 21 22 22 22 22 23 23 24 24 24 25

25 25 26 26 27 27 27 27 28 28 28 28

28 29 29 29 29 30 30
Determinar:
a) ¿Cuál es la muestra, variable y el tipo de variable?
b) Construya una tabla de distribución de frecuencia
c) ¿Qué estadístico garantiza la calidad de procesos?
d) ¿Qué estadístico se puede utilizar para tener confianza en la investigación?
e) ¿Cuál es el valor del dato más típico del proceso?
f) ¿Qué estadístico se puede utilizar para mejorar el proceso?
g) Explique si las mediciones realizadas a las muestrea son homogéneas o
heterogéneas y diga si la media es o no representativa.
h) Explique si la distribución presenta un sesgo e indique la dirección.
i) Construya un histograma

2.- Los siguientes datos corresponden a una serie de mediciones de temperaturas en


ºF realizadas a la salida del vapor de la caldera 7 de planta eléctrica en cierta
Refinería, medidas durante cada hora transcurrida a partir de las 7am del 01/03/2017
hasta las 12pm del 03/03/2017.
573 574 577 583 585 588 590 595 598

573 574 577 583 586 589 593 595 598

573 575 577 585 586 589 593 595 598

573 575 580 585 586 589 593 596 599

573 575 580 585 588 590 593 596 599

574 575 583 585 588 590 595 596 600

Se pregunta lo siguiente:
a) ¿Cuál es la población, la muestra, la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Qué temperatura garantiza la calidad del proceso del vapor de la caldera?
d) ¿Cuál estadístico se puede utilizar para tener confianza en la investigación?
e) ¿Cuál es la temperatura más típica del proceso y cuál es el punto máximo de la
distribución?
f) ¿Qué temperatura se puede utilizar para mejorar el proceso?
g) Explique si las temperaturas son homogéneas o heterogéneas.
h) Explique si la distribución presenta un sesgo y en qué dirección.
i) Construya un histograma.

3.- En el laboratorio de estudios químicos, se le asignó a un de ingeniero químico


analizar las variaciones del volumen en cc del Ácido Clohorhìdrico (HCL) cuando este
es sometido a diferentes temperaturas, el experimento se realizó desde el 05 de enero
del 2019 hasta el 05 de febrero del 2019. En la toma de las muestras se observaron
los siguientes datos en cc:
12 17 22 25 40 41 43 48 52 57

12 20 22 25 40 41 44 48 52 58

15 20 23 30 40 42 45 49 54 58

17 20 23 32 40 43 45 50 55 59

17 20 23 38 41 43 46 51 55 60

Se pregunta lo siguiente:
a) ¿Cuál es la muestra, la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Cuál es el estadístico más representativo?
d) ¿Cuál estadístico se puede utilizar para tener confianza en la investigación?
e) ¿Cuál es el volumen más reiterativo del proceso y cuál es el punto máximo de la
distribución?
f) Explique si los datos son homogéneas o heterogéneas.
g) Explique si la distribución presenta un sesgo y en qué dirección.
h) Construya un histograma

4.- Una Empresa HIDRICA realizo un estudio sobre el caudal en los rotámetros en
Litros (Lit./seg) medidos durante el mes de noviembre del año 2014, en el turno de 5pm
a 11pm en cierto caserío, donde se obtuvieron los siguientes datos:
0 2 8 11 15 23 28 33 36 38 41

1 2 8 11 16 24 29 33 36 38 41

1 4 8 11 17 25 30 33 36 39

1 5 10 12 17 28 30 34 37 39

1 6 11 13 18 28 33 35 38 10
Se pregunta lo siguiente:
a) ¿Cuál es la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Cuál es el caudal promedio del vital líquido en dicho caserío?
d) ¿Cuál estadístico se puede utilizar para tener confianza en la investigación?
e) ¿Cuál es el caudal más típico del proceso?
f) ¿Qué estadístico se puede utilizar para mejorar el proceso?
g) Explique si los caudales son homogéneas o heterogéneas.
h) Explique si la distribución presenta un sesgo y en qué dirección.
i) Construya un histograma

5.- Los siguientes datos corresponden al número de horas hombre (H/H) perdidas por
incidentes por el personal de contratistas que ejecuto labores de paradas de plantas en
cierta refineria durante el periodo de programación de paradas Enero de 2004 hasta
Diciembre de 2008.

Paradas de Planta Enero 2007 – Diciembre 2008

MESES

AÑO ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC

2004 15 20 14 16 18 15 26 30 32 23 16 18

2005 29 22 13 17 10 14 16 13 19 16 17 28

2006 19 26 13 16 22 25 32 24 23 15 18 25

2007 21 19 15 24 31 19 16 11 17 11 13 15

2008 22 16 14 19 21 24 16 15 12 16 19 28

Responda lo siguiente:
a) ¿Cuál es la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Cuál estadístico se puede utilizar para tener confianza en la investigación?
d) ¿Cuál es el número de horas-hombre más reiterativo?
e) ¿Qué estadístico se puede utilizar para mejorar el proceso?
f) Explique si la distribución presenta un sesgo y en qué dirección.
g) Construya un histograma

6.- El sobrecalentador permite cambiar el estado del vapor que sale de una caldera, de
vapor saturado a vapor sobre calentado. En una práctica realizada en cierta
universidad se obtuvieron los siguientes datos correspondientes a las presiones en
(PSI) de salida del vapor. Las medidas obtenidas fueron las siguientes:
44 36 29 31 46 34 32 28 33 41 49

37 35 39 22 27 35 33 32 33 38 30

45 32 37 35 34 30 43 31 50 36 36

45 33 41 35 32 49 37 38 30 47 40

38 27 42 40 34 35 35 37 35 34

43 29 42 32 39 28 29 30 50 43

Se pregunta lo siguiente:
a) ¿Cuál es la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Cuál es la presión más típica de salida del sobrecalentador?
d) Explique si las presiones son homogéneas o heterogéneas.
e) Explique si la distribución presenta un sesgo y en qué dirección.
f) Construya un histograma

7.- Los siguientes datos corresponden a las edades de las personas que viajaron
desde la ciudad de Maracaibo a Punto Fijo en el vuelo 2187 de ConViasa el día 15 de
julio del 2010 con hora de salida a las 4:30pm.
15 18 20 21 23 26 29 32 37 41

15 18 20 21 23 27 30 36 40 42

15 19 20 22 24 27 30 36 40 42

18 19 20 22 26 28 31 36 40 42

18 20 21 23 26 28 31 37 40 42

Se pregunta lo siguiente:
a) ¿Cuál es la población, la muestra, la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Cuál es la edad promedio de los pasajeros de ese vuelo?
d) ¿Cuál es la edad más común del vuelo?
e) Explique si las edades de pasajeros son homogéneas o heterogéneas.
f) ¿Qué porcentaje de edades se encuentran entre 19 y 34 años?
g) Construya un histograma

8.- Los siguientes datos representan las temperaturas en ºR en un proceso de


destilación de cierto producto:
40 41 41 42 43 44 44 45 46 46 46 47
a. Construya una tabla de distribución de frecuencia
b. ¿Cuál es la temperatura más representativa?
c. ¿Qué estadístico se puede utilizar para tener confianza en la investigación?
d. ¿Cuál es el valor del dato más típico del proceso?

Referencias bibliográficas recomendadas:

Bologna, Eduardo. “Estadística aplicada a la educación”.

Kasmier, Leonar J “Estadística aplicada a la economía”.

Levin, Richard. “Estadística para Administradores”.

Miller, Irving y Freíd, Jhon. “Probabilidad y Estadística para Ingenieros”.

Montgomery Douglas: “Probabilidad y Estadística para Ingenieros”.

Spiegel Murray. “Estadística para Ingenieros”.

Walpole, Ronald. “Probabilidad y Estadística para Ingenieros”.

De igual forma cualquier libro en digital aplicado a la ingeniería puede ser utilizado.

Muchas gracias.

También podría gustarte