Está en la página 1de 28

10/09/2017

ESTADÍSTICA I
Ing. Industrial Miguel Angel Sevillanos Dominguez

Fuentes de información

 Encuesta:
Recopilar los datos mediante el uso
de cuestionarios o entrevistas.

 Experimento:
Procedimiento utilizado en la
investigación científica para obtener
información que permita conocer el
comportamiento de algún proceso.

Ing. Miguel Sevillanos Dominguez 1


10/09/2017

Fuentes de Información

 Investigación Documental:
Procedimiento para obtener
datos mediante la consulta de
información ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.

Redondeo de datos, notación


científica y cifras significativas.
 Redondeo:
El redondeo de datos es un
procedimiento que consiste en escribir un
número que representa a una cantidad
con menos cifras de las que tiene
realmente para tener una idea rápida de
la cantidad.

Ing. Miguel Sevillanos Dominguez 2


10/09/2017

Notación Científica
 Es una manera de escribir en forma breve cifras
muy grandes o pequeñas. La forma general es
n
a x 10 , en donde “a” es un número entre 1 y 9,
“n” es un número entero.

 Ejemplo:
4
El número 25 000 se escribe 2.5 x 10 , o el
número 0.00025 se escribe como 2.5 x 10- 4.

Cifras Significativas
 A los dígitos exactos que se utilizan para escribir
una cifra, a parte de los ceros para localizar el
punto decimal, se les llama cifras significativas.

 Ejemplos:
 3.22 tiene 3 cifras significativas.

-3
 0.0032 = 3.2 x 10 tiene 2 cifras significativas.

-3
 0.00320 = 3.20 x 10 tiene 3 cifras significativas.

Ing. Miguel Sevillanos Dominguez 3


10/09/2017

 La cifra 3.22 se encuentra realmente entre


3.215 y 3.225.

 La cifra 0.0032 es un valor que se encuentra entre


0.00315 y 0.00325.

 La cifra 0.00320 se encuentra entre las cifras


0.003195 y 0.003205

Orden de datos
 La ordenación es el proceso mediante el cual los
datos están acomodados de tal manera que se
establece un orden (ascendente o descendente)
entre ellos.

 Hay dos métodos comunes:


• Listado en orden ascendente
• Método de tallo y hojas

Ing. Miguel Sevillanos Dominguez 4


10/09/2017

Ejemplo
 Considera que la variable de estudio es el peso de
25 estudiantes. Los pesos se encuentran en la
siguiente tabla:

Peso de 25 estudiantes (en kg)

40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58

Listado en orden ascendente


 El proceso consiste en ordenarlos de menor a mayor

Peso de 25 estudiantes (en kg) Peso de 25 estudiantes (en kg)

42 40 48 51 49 40 42 43 44 44
56 44 43 55 52
45 48 49 50 50
52 62 44 50 59
51 51 52 52 55
63 50 56 55 45 55 56 56 57 58
57 66 63 51 58
59 62 63 63 66

Ing. Miguel Sevillanos Dominguez 5


10/09/2017

Método de tallo y hojas

 Si los números de los datos están formados por


dos dígitos, se hace una columna con el primer
dígito (decenas) y a la derecha de cada uno
de ellos se escribe, en fila, sólo el segundo
dígito (unidades) de cada uno de los datos
que tengan el mismo primer dígito.

 Datos sin ordenar: Peso de 25 estudiantes (en kg)

4 2,0,8,9,4,3,4,5 42 40 48 51 49
5 1,6,5,2,2,0,9,0,6,5,7,1,8 56 44 43 55 52
52 62 44 50 59
6 2,3,6,3
63 50 56 55 45
57 66 63 51 58
 Datos ordenados:
4 0,2,3,4,4,5,8,9
5 0,0,1,1,2,2,5,5,6,6,7,8,9
6 2,3,3,6

Ing. Miguel Sevillanos Dominguez 6


10/09/2017

Doble tallo
 Una variante de este método es en lugar de dividir
en un grupo las decenas, se divide en dos grupos. El
primero abarcando los dígitos del 0 al 4 y el
segundo del 5 al 9.

4 0,2,3,4,4
 El ejemplo anterior 4 5,8,9
queda: 5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6

Caso de variables cualitatitivas


 El procedimiento es:

 Se identifican todos los valores diferentes y se


acomodan en columna.

 Se agrega una segunda columna en donde se van


registrando, mediante una línea vertical, la veces
que aparece el valor dado.

Ing. Miguel Sevillanos Dominguez 7


10/09/2017

Ejemplo
 Considera que la variable de estudio es el color de
playera de 25 estudiantes.
Los colores se encuentran en la siguiente tabla:

rosa azul blanco azul rosa


gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde

Color Frecuencia
rosa azul blanco azul rosa Azul IIII
gris blanco café negro blanco Blanco IIII II
rosa azul café blanco blanco Café III
gris azul blanco rosa gris Gris IIII
gris blanco café negro verde Negro II
Rosa IIII
Verde I

Ing. Miguel Sevillanos Dominguez 8


10/09/2017

Tabla de Frecuencia de Datos

 Una vez que se tenga ordenados los datos, se


acomodan en la “Tabla de distribución de
frecuencias o tabla de frecuencias”.

 La tabla es básicamente una tabla de valores


x-y, dónde “x” representa el dato y “y”
representa la frecuencia.

 La frecuencia es el número de veces que aparece


cada dato.

 Hay dos clases de tablas de frecuencias:


 Para datos NO agrupados.
 Para datos agrupados.

Ing. Miguel Sevillanos Dominguez 9


10/09/2017

Tabla de frecuencias para


datos NO agrupados

 Está formada por dos columnas: una para la


variable “xi” y la otra para su frecuencia “f”, a
esta frecuencia se le llama frecuencia absoluta o
frecuencia observada.

Ejemplo
 Tabla de frecuencias de los pesos en kg de 25
alumnos.
xi f xi f
Peso de 25 estudiantes (en kg)
40 1 52 2
42 1 55 2
40 42 43 44 44 43 56
1 2
45 48 49 50 50 44 2 57 1
51 51 52 52 55 45 1 58 1
55 56 56 57 58 48 1 59 1
59 62 63 63 66 49 62
1 1
50 2 63 2
51 2 66 1
Total 25

Ing. Miguel Sevillanos Dominguez 10


10/09/2017

Frecuencia relativa y acumulada


 Por lo regular, se agregan dos columnas: la de la
frecuencia relativa “h” y la de la frecuencia
acumulada “F”.
 La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el número total de
datos, esto es h = f/n.
 La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato
dado.

Ejemplo
1/25
xi f h F xi f h F
40 1 0.04 1 52 2 0.08 14
42 1 0.04 2 55 2 0.08 16
43 1 3 2/25 56 2 0.08 18
0.04
44 2 0.08 5 57 1 0.04 19
45 1 0.04 6 58 1 0.04 20
48 1 0.04 7 59 1 0.04 21 Siempre
49 1 0.04 8 62 1 0.04 22 es el
50 2 10 63 2 número
0.08 0.08 24
total
51 2 0.08 12 66 1 0.04 25
Total 25 1

Siempre es 1

Ing. Miguel Sevillanos Dominguez 11


10/09/2017

Intervalo de clase

En ocasiones es conveniente acomodar los


datos en pequeños grupos de igual tamaño,
llamados intervalos de clase.
 El punto medio o marca de clase “xi”, se
obtiene con:
Marca de clase = Límite inferior + límite superior
2
 El tamaño del intervalo se obtiene mediante
la diferencia de los límites superior e inferior.

Ejemplo

Límite inferior Límite superior Lím inf + Lim sup


2
Intervalo de clase Punto medio “xi”
38 – 42 40
43 – 47 45
48 – 52 50
53 – 57 55
58 – 62 60
63 – 67 65

Ing. Miguel Sevillanos Dominguez 12


10/09/2017

Límite verdadero del intervalo


 Frontera de clase o límite verdadero del intervalo:
Intervalo de clase Punto medio “xi”
37.5 – 42.5 40
40 – 2.5 42.5 – 47.5 40 + 2.5 45
47.5 – 52.5 50
52.5 – 57.5 55
57.5 – 62.5 60
62.5 – 67.5 65

Tabla de intervalos con


límites verdaderos
 Usando símbolos de  Usando paréntesis
Está incluido
y
No está incluido
Está incluido desigualdad corchetes
No está incluido
Intervalo de Punto Intervalo de Punto
clase medio “xi” clase medio “xi”
37.5 ≤ x < 42.5 40 [37.5 , 42.5) 40
42.5 ≤ x < 47.5 45 [42.5 , 47.5) 45
47.5 ≤ x < 52.5 50 [47.5 , 52.5) 50
52.5 ≤ x < 57.5 55 [52.5 , 57.5) 55
57.5 ≤ x < 62.5 60 [57.5 , 62.5) 60
62.5 ≤ x < 67.5 65 [62.5 , 67.5) 65
El tamaño del intervalo es de 5

Ing. Miguel Sevillanos Dominguez 13


10/09/2017

 Si por alguna razón no es fácil decidir el ancho del


intervalo y el número de ellos, se pueden utilizar las
siguientes fórmulas:
 K = 1 + 3.3 log (n)
 Donde K = número aproximado de clases

n = número de datos.
 Amplitud de los intervalos = Rango / K
 Donde Rango = diferencia entre el dato mayor

y el dato menor.

Ejemplo
 Para el ejemplo de los datos de los pesos de 25
alumnos, el valor de K:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6.
Por lo tanto se requieren aproximadamente 6
intervalos.
 Y la amplitud de los intervalos sería:
Amplitud = Rango / K = (66 – 40) / 5.6 = 4.64.
Aproximadamente 5 unidades es la amplitud de los
intervalos.

Ing. Miguel Sevillanos Dominguez 14


10/09/2017

Tabla de distribución de
frecuencias para datos agrupados
 Se elabora con los intervalos de clase, sus puntos
medios y las frecuencias correspondientes para
cada uno de los intervalos.
xi f 52 2 Datos agrupados
Datos sin agrupar

40 1 55 2 Intervalo de Punto medio f


42 1 56 2 clase “xi”
43 1 57 1 38 – 42 40 2
44 2 58 1 43 – 47 45 4
45 1 59 1 48 – 52 50 8
48 1 62 1 53 – 57 55 5
49 1 63 2 58 – 62 60 3
50 2 66 1 63 - 67 65 3
51 2 Total 25 Total 25

 Se agregan las columnas de frecuencia relativa “fr”


y frecuencia acumulada “fa”:
Intervalo Punto f fr Fa 2/25
de clase medio “xi”
4/25
38 – 42 40 2 0.08 2
8/25
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1

Ing. Miguel Sevillanos Dominguez 15


10/09/2017

 Por último se agregan las columnas:


 Frecuencia porcentual, “h%” ó “%h”, se obtiene
multiplicando la frecuencia relativa “h” x 100.
 Frecuencia relativa acumulada “H”, se obtiene
sumando las frecuencias relativas anteriores a un
dato dado.
 Frecuencia porcentual acumulada, “H%”, se
obtiene sumando las frecuencias porcentuales
acumuladas a un dato dado.

Tablas de frecuencias absoluta, 0.08 x


100
relativa y acumulada
0.08 x 2/25
100
Intervalo Punto medio f h h% F H H%
de clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63- 68 65 3 0.12 12 25 1 100
Total 25 1 100

Ing. Miguel Sevillanos Dominguez 16


10/09/2017

Gráfica de Datos
 Existen dos tipos de gráficas mas usuales:
 Polígono de Frecuencias
 Histograma

 Otros gráficos:
 Gráfica de barras
 Pictograma
 Gráfico Circular o de pastel.

Polígono de Frecuencias
 Es la representación mediante un gráfico de
línea. En él se muestra la distribución de
frecuencias y está formado por segmentos de
línea que unen los puntos correspondientes a la
frecuencia de cada una de las clases.
60

50

 El eje “x” representa el dato “xi” 40

30

20

y el eje “y” las frecuencias. 10

Ing. Miguel Sevillanos Dominguez 17


10/09/2017

Ejemplo

9 Polígono de Frecuencias
8
7
6
5
f 4
Intervalo de Punto medio f 3
clase “xi” 2
38 – 42 40 2 1
0
43 – 47 45 4
35 40 45 50 55 60 65 70
48 – 52 50 8 xi
53 – 57 55 5

58 – 62 60 3

63 - 68 65 3

Total 25

 El eje “y” puede ser sustituido por las frecuencias


relativas o porcentuales.
Polígono de Frecuencia Relativa
0,35

0,3

0,25
fr 0,2

0,15

0,1

0,05

0
35 40 45 50 55 60 65 70
xi

Ing. Miguel Sevillanos Dominguez 18


10/09/2017

Polígono de Frecuencia Porcentual

35

30

25

% f 20

15

10

0
35 40 45 50 55 60 65
xi

Histograma
14

 Es la representación gráfica de 12

10

los datos mediante una sucesión 6

de rectángulos. 0
0,95 2,95 4,95

 Está formado por rectángulos cuya anchura

representa a cada uno de los intervalos y la


altura corresponde a la frecuencia.
 En el eje “x” estarán los límites verdaderos, los
puntos medios y en el eje “y” las frecuencias.

Ing. Miguel Sevillanos Dominguez 19


10/09/2017

Intervalo de Punto medio f

Ejemplo clase
38 – 42
“xi”
40 2

43 – 47 45 4

48 – 52 50 8

53 – 57 55 5

58 – 62 60 3
Histograma
63 - 68 65 3
9
Total 25
8
7
6
5
f
4
3
2
1
0
35 40 45 50 55 60 65
xi

 También podemos usar la frecuencia relativa y la


frecuencia porcentual.
Histograma con frecuencias relativas
0,35
0,3
0,25
fr
0,2
0,15
0,1
0,05
0
35 40 45 50 55 60 65
xi

Ing. Miguel Sevillanos Dominguez 20


10/09/2017

Histograma con frecuencias porcentuales


35

30

25

20
%f
15

10

0
35 40 45 50 55 60 65
xi

Pirámide Poblacional
 Una variante en el histograma es colocar en el
eje “x” de tal manera que las columnas
quedarán en forma horizontal, es muy común
en datos poblacionales.

Ing. Miguel Sevillanos Dominguez 21


10/09/2017

Ojiva
 Es la representación gráfica de las frecuencias
acumuladas mediante un gráfico de línea. Se
muestra la distribución de frecuencias
acumuladas de los datos.

 En el eje “x” estarán los puntos medios y en el


eje “y” las frecuencias acumuladas.

Ejemplo

Intervalo Punto f fr fa
de clase medio “xi”
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1

Ing. Miguel Sevillanos Dominguez 22


10/09/2017

Ojiva
30

25 25

22
20 19

fa 15 14

10
6
5
2
0 0
35 40 45 50 55 60 65
xi

 Usando la frecuencia acumulada y la frecuencia


porcentual.
Intervalo Punto medio f fr f% fa fra f%a
de clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63- 68 65 3 0.12 12 25 1 100
Total 25 1 100

Ing. Miguel Sevillanos Dominguez 23


10/09/2017

Ojiva con frecuencia relativa acumulada


1
0,9 0,88

0,8 0,76
0,7
0,6 0,56
fra 0,5
0,4
0,3
0,24
0,2
0,1 0,08

0 0

35 40 45 50 55 60
xi

Ojiva con frecuencia porcentual acumulada


100
90 88

80 76
70
60 56
f%a 50
40
30
24
20
10 8

0 0

35 40 45 50 55 60
xi

Ing. Miguel Sevillanos Dominguez 24


10/09/2017

Gráfico Circular
 También es llamado gráfico de pastel.

 Sólo se representan datos de frecuencias relativas


o frecuencias porcentuales.

 Se debe dividir el área del círculo de manera


proporcional a las frecuencias. 13% 13%
PERRO
17%
PAJARO
HAMSTER
GATO
57%

 Agregaremos una columna a nuestra tabla de


frecuencias “Frecuencia relativa al círculo”,
multiplicando (h)(360°), para mostrar la parte
proporcional de círculo medida en grados que
corresponde a cada intervalo.

Ing. Miguel Sevillanos Dominguez 25


10/09/2017

Ejemplo 1

0.08 x
Intervalo Punto medio f h (h ) (360°) 360°

de clase “xi” 0.16 x


38 – 42 40 2 0.08 28.8° 360°

43 – 47 45 4 0.16 57.6°
48 – 52 50 8 0.32 115.2°
53 – 57 55 5 0.20 72°
58 – 62 60 3 0.12 43.2°
63- 68 65 3 0.12 43.2°
Total 25 1 360°

Gráfico Circular 40
8%
60 65
12% 12% 45
16%

55
20% 50
32%

Ing. Miguel Sevillanos Dominguez 26


10/09/2017

Ejemplo 2

Color Frecuencia Conteo Color de Playera


Azul IIII 4 Azul Blanco Café Gris
Negro Rosa Verde
Blanco IIII II 7 4%
Café III 3 16% 16%
Gris IIII 4 8%
28%
Negro II 2 16%
Rosa IIII 4 12%
Verde I 1

Otros Gráficos
 La gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan
separadas unas de otras.
 La escala en el eje “x” es para mostrar

categorías o intervalos de números NO


consecutivos. 60
Frecuencia absoluta

50

40

30

20

10

0
PERRO PAJARO HAMSTER GATO

Ing. Miguel Sevillanos Dominguez 27


10/09/2017

Carrera Alumnos
Elección de Carrera
Medicina 8
Mecánica 11 11 11
Civil 8 8 8
6
Agronomía 3 3 3
Físico - Matemáticas 3
Leyes 6
Contaduría 11

Pictograma
 Similar al de barras, sólo que se sustituyen por
figuras, generalmente relacionadas con la variable
estudiada.

Ing. Miguel Sevillanos Dominguez 28

También podría gustarte