Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Hay dos fases en el campo de la estadística. En primer lugar está la fase que
sólo se limita a la descripción de una serie de datos sin llegar a conclusiones o a
generalizar con respecto a un grupo mayor. Esta (fase) se conoce como Estadística
deductiva o descriptiva. En segundo lugar está la fase de análisis que trata de llegar
a conclusiones acerca de un grupo mayor basado en la información de un grupo menor
o muestra: es esta la Estadística inductiva o de inferencia.
En un principio se consideraba que la función de la Estadística era la descripción
de las características de grupos, actividad que la hacía confundir con el papel que
cumple la historia de observar y describir el hecho. En su origen, las estadísticas eran
históricas, hoy en día, además de ser descriptiva, es analítica, considerándose esta
última como la función más importante que realiza, ya que permite obtener
conclusiones para un grupo mayor, denominado población, partiendo de una
investigación realizada en un grupo menor, conocido como muestra, cuyos elementos,
en la mayoría de casos, se seleccionan aleatoriamente o al azar.
FINALIDAD DE LA ESTADÍSTICA:
Conocer la realidad de una observación, fenómeno o proceso determinado.
Determinar lo típico o normal de ese fenómeno o proceso.
Determinar los cambios o procesos que presento el fenómeno.
Relacionar 2 o más fenómenos y determinar las causa que lo originan.
Hacer estimaciones sobre el comportamiento futuro del fenómeno y obtener
conclusiones de un grupo menor (muestra) para hacerlas extensivas a un grupo
mayor (población).
En síntesis, la Estadística facilita una serie de instrumentos o técnicas que, al
ser utilizadas correctamente, permiten determinar el grado, validez y confiabilidad, ya
sea de las predicciones o de las conclusiones obtenidas a partir de muestras.
ASPECTOS BASICOS.
Población: Conjunto completo de elementos o individuos de interés que tienen
en común una cualidad.
La población puede ser: Finita cuando se conoce su tamaño o infinita cuando
no se conoce su tamaño.
Se denota con la letra N. Ejemplo:
Todos los estudiantes de la UNEFM.
Todos los empleados de PDVSA.
Todos los habitantes de una comunidad, entre otros.
Muestra: Es un subconjunto o una parte seleccionada de la población y siempre
es finita, su tamaño se denota con la letra n. Ejemplo
Los estudiantes de una o varias secciones definidas, de ciertas carreras o
complejos académicos de la UNEFM.
Razones del porque se utiliza la muestra en una investigación.
Si la población es muy grande o infinita, la muestra facilita el trabajo.
Se ahorra dinero.
Se ahorra tiempo.
Minimiza el recurso humano para el desarrollo de la investigación.
Factibilidad de hacer el estudio cuando la toma de datos implica técnicas
destructivas tales como: Análisis de sangre, control de calidad, etc.
Cuantitativas: Discretas.
Continuas.
Variable Cualitativa: Es aquella variable que solo puede clasificarse sin poderse
medir, es decir; es aquella que expresa cualidades.
Ejemplo: Color de la piel. Color del cabello, Color de ojos, sexo, estado civil, etc.
Variable Cuantitativa: Es aquella donde los valores que asume se pueden expresar
en cantidades numéricas, es decir; se puede medir.
Variable Cuantitativa Discreta: Es aquella que se puede medir con números enteros.
Ejemplo: Nº de hijos de una familia, Nº de páginas de un libro, Nº de
estudiantes de una sección, etc.
Variable Cuantitativa Continúa: Es aquella cuyo rango de valores es infinito, es decir;
los valores que asume se pueden representar por números reales. (Admite decimales.)
Ejemplo: Peso, estatura, sueldo, edad, notas, temperatura, presión, etc.
Dato: Es la representación numérica de la variable.
Frecuencia: Es el número de veces que se repite un mismo dato.
Esta Pueden ser:
Frecuencia Absoluta (f)
Frecuencia Absoluta acumulada (F)
Frecuencia Relativa (h)
Frecuencia Relativa acumulada (H)
Frecuencia Relativa (h): Son las que representan las proporciones o
porcentajes (%) que se obtienen dividiendo la frecuencia absoluta de cada dato o de
cada clase entre el tamaño de la muestra.
Distribución De Frecuencias Es una tabla donde se representan las categorías
numéricas de las variables junto con el número de identidades que se clasifican en
cada categoría, se utilizada en estadística para organizar los datos con sus respectivas
frecuencias.: Se tienen 2 casos:
Caso 1: Se utiliza cuando:
n< 30 datos ó cuando la variable es cualitativa: los datos se organizan
en forma directa o por frecuencia.
Caso 2: Se utiliza cuando:
n ≥ 30 datos y la variable es cuantitativa: es decir; se organizan en forma
de intervalos siguiendo los siguientes pasos:
A. Se determina el número de intervalos, la cual se denota por √ .
B. Se determina el tamaño o la Amplitud de los intervalos a través de la siguiente
ecuación:
donde R= Rango.
R= (X mayor – X menor) + 1
C. Se determina el punto inicial del primer intervalo.
D. Se organizan los datos en una tabla que contenga las siguientes columnas.
Xi - Xs Li - Ls f F H H Xm
Donde: Xinferior - Xsuperior =Limites aparentes Li - Ls =Limites reales
Ejemplo 1: Supóngase que se seleccionaron al azar 5 estudiantes de la sección 11 de
estadística del complejo académico el sabino de la UNEFM y se les pregunto su
respectiva edad, las cuales fueron: 20, 21, 21, 22, 22 años De acuerdo a esta
información
a) ¿Cuál es la población, la muestra, la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
Solución
a) Población: los estudiantes de la UNEFM
Muestra: los 5 estudiantes seleccionados al azar de la sección 11 de
estadística de Ing Industrial del complejo académico el sabino de la UNEFM
Variable: edad
Tipo de variable: cuantitativa continúa
b) Tabla de frecuencia.
X f F h H Comentario [M1]: Estos valores se
obtienen por los cálculos de la formula
20 1 1 0.2 0.2 Comentario [M2]: Significa que un
estudiante de la muestra tiene 20
21 2 3 0.4 0.6 años
( )
A= A=5
= = 5,2
( ) Si n ≥ 30 datos.
𝑛
L = : Lugar donde se encuentra la mediana.
Li: Límite inferior real que contiene a Xd.
Fii: Frecuencia absoluta acumulada del intervalo inferior al intervalo
que contiene a Xd
f : Frecuencia absoluta del intervalo que contiene a Xd.
(𝑋 𝑚𝑎𝑦𝑜𝑟 𝑋 𝑚𝑒𝑛𝑜𝑟)
A=
𝑁𝑖
Ejemplo: Supóngase que se han seleccionada 5 estudiantes de las sección 01 y
02 de estadística y le preguntamos su respectiva edad.las cuales fueron: 20, 21,
21, 22,23 años ¿Qué estadístico ocupa el lugar central de los datos
n=5
3 𝐿 3 𝑋𝑑 21
Ejemplo para n ≥ 30 datos. (Ver página 11)
X0 Datos
12 2
Representa la mayor frecuencia .
15 1 P máx (12, 2)
2
13 15 Xi
1 12 14
1 X0
( ) Si n ≥ 30 datos
(𝑋 𝑚𝑎𝑦𝑜𝑟 𝑋 𝑚𝑒𝑛𝑜𝑟)
A=
𝑁𝑖
Li: Límite inferior real del intervalo que contiene la mayor frecuencia.
( )
Población
Para n ≥ 30 datos:
( )
Muestral
( )
Poblacional
( )
√ Poblacional
Para n ≥ 30 datos:
( )
√ Muestral
( )
√ Poblacional
Cv Tipo de Distribución
26% o más Muy heterogéneo, la media no es
representativa
Heterogéneo la media no es
16% al 25%
representativa
Homogéneo la media si es
11% al 15%
representativa
Muy homogéneo la media si es
0% al 10%
representativa
( )
𝑛 (𝑋 𝑚𝑎𝑦𝑜𝑟 𝑋 𝑚𝑒𝑛𝑜𝑟)
L= : Lugar (F) A=
𝑁𝑖
n= Tamaño de la muestra
Fii = Frecuencia absoluta Acumulada del intervalo
inferior al que contiene Xp
f= Frecuencia Absoluta del Intervalo que contiene X p
Medidas de Formas: Son aquellas que indican la forma que tiene una
distribución de datos. Dentro de estas medidas tenemos:
Distribución Simétrica.
Distribución Asimétrica.
Curtosis.
Sesgo: Es la forma de la distribución que se origina cuando no podemos fijar un
punto que divida en 2 partes iguales la serie de datos, produciéndose así una mayor
concentración de las observaciones hacia uno de los extremos de la curva.
Distribución Simétrica: Es cuando la media es igual a la moda y a su vez es
igual a la mediana ubicándose en el centro de la distribución.
X = X0 = Xd
X0 < Xd < X
X < Xd < X0
𝑋−𝑋
𝐶. 𝐴
𝑆
X
Xo
Xd
Caso 2: Si C.A < 0 Hay sesgo a la izquierda. La distribución es asimétrica negativa.
X Xd Xo
Xo Xd X
Se pregunta lo siguiente:
1. ¿Cuál es la población, la muestra, la variable y el tipo de variable?
2. Organice los datos en una tabla de frecuencia.
3. ¿Qué estadístico garantiza la calidad del proceso de descarga de la planta?
4. ¿Cuál estadístico se puede utilizar para tener confianza en la investigación?
5. ¿Cuál es la temperatura más típica del proceso y cuál es el punto máximo de
la distribución?
6. ¿Qué temperatura se puede utilizar para mejorar el proceso?
7. Explique si las temperaturas son homogéneas o heterogéneas.
8. Diga si la media es o no representativa
9. Explique si la distribución presenta un sesgo y en qué dirección
10. Construya un histograma
Solución:
1. Población, la muestra, la variable y el tipo de variable:
Comentario [M10]: El limite
aparente inferior del primer
intervalo en este caso es 35
2. Tabla de frecuencia: ya que es el valor del dato
menor para este ejercicio.
El limite aparente superior
del primer intervalo en este
caso resulta 37 ya que a
n = 49 =√ Ni = √4 =7 Número de intervalos partir del valor Li=35 se
cuentan 3 espacios de la
amplitud, es decir, 35 36 37.
Para el siguiente intervalo
se inicia con el entero
( ) ( ) inmediato, quedando
A= A= A = 3 Amplitud de 38 a 40.
así de forma sucesiva.
( ) .
6. √ √ 5.425ºC
.
7. . 1 . 1 . 12. 7%
.
8. La media es representativa
. .
9. . . . .44
.
Xo Xd X
EJERCICIOS
Tema 1.- ESTADISTÍCA DESCRIPTIVA E INFERENCIAL.
Nota: utilizar como minimo 3 (tres) decimales en los cálculos
1.- Para estudiar la eficacia de un tratamiento sobre las resistencias de un determinado
concreto se han evaluado 55 probetas en el laboratorio de cierta empresa de
fabricación de premezclados, las cuales se les realizaron las mediciones de la
resistencia en MPA, los datos han sido los siguientes:
10 10 10 11 12 12 12 12 14 14 14 15
15 16 16 17 17 18 18 20 20 20 20 20
21 21 22 22 22 22 23 23 24 24 24 25
25 25 26 26 27 27 27 27 28 28 28 28
28 29 29 29 29 30 30
Determinar:
a) ¿Cuál es la muestra, variable y el tipo de variable?
b) Construya una tabla de distribución de frecuencia
c) ¿Qué estadístico garantiza la calidad de procesos?
d) ¿Qué estadístico se puede utilizar para tener confianza en la investigación?
e) ¿Cuál es el valor del dato más típico del proceso?
f) ¿Qué estadístico se puede utilizar para mejorar el proceso?
g) Explique si las mediciones realizadas a las muestrea son homogéneas o
heterogéneas y diga si la media es o no representativa.
h) Explique si la distribución presenta un sesgo e indique la dirección.
i) Construya un histograma
Se pregunta lo siguiente:
a) ¿Cuál es la población, la muestra, la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Qué temperatura garantiza la calidad del proceso del vapor de la caldera?
d) ¿Cuál estadístico se puede utilizar para tener confianza en la investigación?
e) ¿Cuál es la temperatura más típica del proceso y cuál es el punto máximo de la
distribución?
f) ¿Qué temperatura se puede utilizar para mejorar el proceso?
g) Explique si las temperaturas son homogéneas o heterogéneas.
h) Explique si la distribución presenta un sesgo y en qué dirección.
i) Construya un histograma.
12 20 22 25 40 41 44 48 52 58
15 20 23 30 40 42 45 49 54 58
17 20 23 32 40 43 45 50 55 59
17 20 23 38 41 43 46 51 55 60
Se pregunta lo siguiente:
a) ¿Cuál es la muestra, la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Cuál es el estadístico más representativo?
d) ¿Cuál estadístico se puede utilizar para tener confianza en la investigación?
e) ¿Cuál es el volumen más reiterativo del proceso y cuál es el punto máximo de la
distribución?
f) Explique si los datos son homogéneas o heterogéneas.
g) Explique si la distribución presenta un sesgo y en qué dirección.
h) Construya un histograma
4.- Una Empresa HIDRICA realizo un estudio sobre el caudal en los rotámetros en
Litros (Lit./seg) medidos durante el mes de noviembre del año 2014, en el turno de 5pm
a 11pm en cierto caserío, donde se obtuvieron los siguientes datos:
0 2 8 11 15 23 28 33 36 38 41
1 2 8 11 16 24 29 33 36 38 41
1 4 8 11 17 25 30 33 36 39
1 5 10 12 17 28 30 34 37 39
1 6 11 13 18 28 33 35 38 10
Se pregunta lo siguiente:
a) ¿Cuál es la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Cuál es el caudal promedio del vital líquido en dicho caserío?
d) ¿Cuál estadístico se puede utilizar para tener confianza en la investigación?
e) ¿Cuál es el caudal más típico del proceso?
f) ¿Qué estadístico se puede utilizar para mejorar el proceso?
g) Explique si los caudales son homogéneas o heterogéneas.
h) Explique si la distribución presenta un sesgo y en qué dirección.
i) Construya un histograma
5.- Los siguientes datos corresponden al número de horas hombre (H/H) perdidas por
incidentes por el personal de contratistas que ejecuto labores de paradas de plantas en
cierta refineria durante el periodo de programación de paradas Enero de 2004 hasta
Diciembre de 2008.
MESES
AÑO ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
2004 15 20 14 16 18 15 26 30 32 23 16 18
2005 29 22 13 17 10 14 16 13 19 16 17 28
2006 19 26 13 16 22 25 32 24 23 15 18 25
2007 21 19 15 24 31 19 16 11 17 11 13 15
2008 22 16 14 19 21 24 16 15 12 16 19 28
Responda lo siguiente:
a) ¿Cuál es la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Cuál estadístico se puede utilizar para tener confianza en la investigación?
d) ¿Cuál es el número de horas-hombre más reiterativo?
e) ¿Qué estadístico se puede utilizar para mejorar el proceso?
f) Explique si la distribución presenta un sesgo y en qué dirección.
g) Construya un histograma
6.- El sobrecalentador permite cambiar el estado del vapor que sale de una caldera, de
vapor saturado a vapor sobre calentado. En una práctica realizada en cierta
universidad se obtuvieron los siguientes datos correspondientes a las presiones en
(PSI) de salida del vapor. Las medidas obtenidas fueron las siguientes:
44 36 29 31 46 34 32 28 33 41 49
37 35 39 22 27 35 33 32 33 38 30
45 32 37 35 34 30 43 31 50 36 36
45 33 41 35 32 49 37 38 30 47 40
38 27 42 40 34 35 35 37 35 34
43 29 42 32 39 28 29 30 50 43
Se pregunta lo siguiente:
a) ¿Cuál es la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Cuál es la presión más típica de salida del sobrecalentador?
d) Explique si las presiones son homogéneas o heterogéneas.
e) Explique si la distribución presenta un sesgo y en qué dirección.
f) Construya un histograma
7.- Los siguientes datos corresponden a las edades de las personas que viajaron
desde la ciudad de Maracaibo a Punto Fijo en el vuelo 2187 de ConViasa el día 15 de
julio del 2010 con hora de salida a las 4:30pm.
15 18 20 21 23 26 29 32 37 41
15 18 20 21 23 27 30 36 40 42
15 19 20 22 24 27 30 36 40 42
18 19 20 22 26 28 31 36 40 42
18 20 21 23 26 28 31 37 40 42
Se pregunta lo siguiente:
a) ¿Cuál es la población, la muestra, la variable y el tipo de variable?
b) Organice los datos en una tabla de frecuencia.
c) ¿Cuál es la edad promedio de los pasajeros de ese vuelo?
d) ¿Cuál es la edad más común del vuelo?
e) Explique si las edades de pasajeros son homogéneas o heterogéneas.
f) ¿Qué porcentaje de edades se encuentran entre 19 y 34 años?
g) Construya un histograma
De igual forma cualquier libro en digital aplicado a la ingeniería puede ser utilizado.
Muchas gracias.