Está en la página 1de 41

I SEMESTRE

2017
Ciencia de recolectar, describir e interpretar
datos.

Por qu estudiar la estadstica?


Por medio del anlisis estadstico pueden
sentar las bases para tomar decisiones o
elegir acciones.
Estadstica Descriptiva o deductiva: es la que
incluye la recoleccin, presentacin y descripcin
de los datos muestrales.

Estadstica Inferencial o inductiva: se refiere a la


tcnica de interpretacin de los valores resultantes
de las tcnicas descriptivas y a la toma de
decisiones y obtencin de conclusiones sobre la
poblacin muestreada.
Poblacin (N): es el conjunto de todas las mediciones
(o registros de algn rasgo de calidad)
correspondiente a cada unidad en toda la poblacin
de unidades, acerca de la cual se busca informacin.
Caractersticas de la poblacin se le denomina
Parmetros.
Muestra (n): es el subconjunto de mediciones que
realmente se recolectan en el curso de una
investigacin.
Caractersticas de la muestra se le denomina
Estadsticas.
Muestra: probabilstica y no
probabilstica.
Muestra Probabilstica:
Muestreo Aleatorio Simple
Muestro Aleatorio Estratificado
Muestreo Sistemtico
Muestreo no probabilstico.

Muestreo con y sin reemplazo.


Muestreo no probabilstico: tambin llamado
muestreo de juicio o de seleccin intencional. La
persona que selecciona la muestra elige unidades
que considera representativas de la poblacin.

Muestreo probabilstico: cada elemento de


una poblacin tiene cierta probabilidad de ser
elegido como parte de la muestra.
Variable (X): caracterstica de inters
sobre cada elemento individual de una
poblacin o muestra.

Tipos de variables:
Dependiendo del nmero de caractersticas:
Variables unidimensionales
Variables bidimensionales
Variables pluridimensionales o multidimensionales.
Dependiendo del tipo de datos:
Variables cuantitativas: es cuando toma
valores numricos.
Discretas: es la variable cuyos valores numricos se
pueden contar o son finitos en un intervalo cualquiera.
(generalmente valores enteros)
Continuas: se da cuando los valores numricos que
forman la variable en un intervalo cualquiera son
infinitos.
Variables cualitativas: es cuando slo puede
clasificarse en categoras no numricas.
Nominal: se usa como medidas de identidad.
Ordinal: Tiene un orden natural para las
categoras.
Intervalos: Nos permite precisar cuanto se es
mayor o menor las medidas de comparacin. La
unidad de medicin es arbitraria, el cero es
convencional y pueden existir unidades negativas.
De razn: se diferencia de la escala por intervalos
nicamente porque tiene un cero absoluto.
Fuentes para obtener datos:
Fuentes internas
Fuentes externas

Tcnicas para recopilar datos:


Encuesta
Entrevista
Cuestionario
Observacin
Presentacin de datos de una sola variable:
Distribucin de frecuencias:
Es una representacin de la relacin entre un conjunto
de medidas o clases de medidas y la frecuencia de
cada una de ellas.

Al hacer una distribucin de los datos, podemos


clasificar la informacin obtenida en forma:
Cronolgica o histrica
Geogrfica
Cualitativa
Cuantitativa
Esta nos indica la frecuencia con que
aparecen los nmeros, desde el menor del
conjunto hasta el mayor o viceversa.
n: el tamao de la muestra, es el nmero de observaciones.
Xi: la variable; es cada uno de los diferentes valores que se han
observado.
fi: la frecuencia absoluta o solo frecuencia, es el nmero de
veces que se repite la variable Xi.
Fa: la frecuencia acumulada; se obtiene acumulando la
frecuencia absoluta.
fr: frecuencia relativa; es el resultado de dividir c/u de las
frecuencias absolutas por el tamao de la muestra.
Fra: frecuencia relativa acumulada; se obtiene dividiendo la
frecuencia acumulada entre el tamao de la muestra.
f%: frecuencia porcentual: es el resultado de multiplicar la
frecuencia relativa por 100.
F% : Frecuencia porcentual acumulada
Organice en una tabla de distribucin
de frecuencias la siguiente informacin.
13 ovejas comieron una hierba
venenosa. Las horas que tardaron en
morir fueron 24, 24, 27, 29, 36, 36, 36, 36,
36, 44, 44, 44, 120.
Organice en una tabla de distribucin de
frecuencias la siguiente informacin.
Se realiz un estudio a una muestra de 100
personas para determinar a que grupo
sanguneo pertenece.
Grupo A: 42 personas
Grupo B: 12 personas
Grupo AB: 5 personas
Grupo O: 41 personas
Es un mtodo estadstico que se utiliza para
estudiar el comportamiento de un conjunto
de datos y consiste en formar grupos de
valores consecutivos de la variable y poner
cada uno de estos grupos en cada fila.
Ordenar los datos de menor a mayor o viceversa.
Calcular el rango o recorrido. R=Xmax-Xmin
Determinar el nmero de clases: k=1+3.3log(n) frmula de
Sturges
Determinar el intervalo de clase i=R/k
Formar los intervalos (lmites aparentes).
Formar los lmites reales.
Determinar las frecuencias de clase contando el nmero de
observaciones
Determinar marca de clase: media de los intervalos.
De acuerdo con una revista Informes al
consumidor en su nmero de febrero, las cuotas
anuales de 40 compaas para un seguro de $
25 000 para personas de 35 aos de edad son:
82 85 86 87 87
89 89 90 91 91
92 93 94 95 95
95 95 95 97 98
99 99 100 100 101
101 103 103 103 104
105 105 106 107 107
107 109 110 110 111
Realice una distribucin de frecuencias de
valores agrupados para los resultados
obtenidos.
Los siguientes datos son los kilmetros por
galn que registraron 30 vehculos en un
recorrido de 100 km. por la ciudad. Realice
una tabla de distribucin de frecuencias.

16.4 29.6 32.8 34 35.3


18.8 30.8 33.2 34.2 35.5
23.3 30.8 33.4 34.4 36
24.6 31 33.6 34.7 36.1
25.4 31.5 33.7 35 36.8
27.6 31.8 33.9 35.2 37.1
Los siguientes datos son los lapsos, en
minutos, necesarios para que 50 clientes de
un banco comercial, lleven a cabo una
transaccin bancaria. Realice una tabla de
distribucin de frecuencias.
2.3 2.4 3.3 1.8 7.8 3.1 2.4 0.4 4.2 6.3
0.2 4.4 9.7 4.7 0.8 3.7 4.6 1.3 1.2 7.6
2.9 5.8 2.5 0.7 0.9 7.2 3.8 1.1 0.5 1.4
0.4 2.8 5.6 6.2 0.4 1.6 1.5 5.5 6.8 0.5
2.8 3.3 9.5 1.2 1.3 1.9 2.7 3.4 5.2 1.4
Lmites Lmites
aparentes reales Xi f F fr Fr f% F%
0.2-1.5 0.15-1.55 0.85 17 17 17/50 17/50 34 34
1.6-2.9 1.55-2.95 2.25 11 28 11/50 28/50 22 56
3.0-4.3 2.95-4.35 3.65 7 35 7/50 35/50 14 70
4.4-5.7 4.35-5.75 5.05 6 41 6/50 41/50 12 82
5.8-7.1 5.75-7.15 6.45 4 45 4/50 45/50 8 90
7.2-8.5 7.15-8.55 7.85 3 48 3/50 48/50 6 96
8.6-9.9 8.55-9.95 9.25 2 50 2/50 1 4 100
Histograma y polgono de frecuencias
Tiempo de transaccin bancaria
18 17
nmero de clientes

16

14

12 11

10

8 7
6
6
4
4 3
2
2
0 0
0

Tiempo de transaccin (min)


Polgono de frecuencias
fi Xi Tiempo por transaccin bancaria
17 0.85 18
17
16
11 2.25
14
Nmero de clientes

7 3.65
12
6 5.05 11
10
4 6.45 8
7
3 7.85 6 6
2 9.25 4 4
3
2 2
0 0 0
0.3 0.85 2.25 3.65 5.05 6.45 7.85 9.25 10.65
Tiempo promedio por transaccin (min) Marcas de clase
Ojiva ascendente (menor que)
Lmites reales Fa Tiempo por transaccin bancaria
0.15 0
1.55 17
2.95 28
No. de clientes

4.35 35
5.75 41
7.15 45
8.55 48
9.95 50

0.15 1.55 2.95 4.35 5.75 7.15 8.55 9.95


Tempo de transaccin (min)
Ojiva descendente (mayor que)
Tiempo por transaccin bancaria
Lmites reales Fa
60
0.15 50
1.55 33 50
No. de clientes
2.95 22 40
4.35 15
30
5.75 9
7.15 5 20

8.55 2 10
9.95 0
0
0.15 1.55 2.95 4.35 5.75 7.15 8.55 9.95
Tiempo de transaccin (min)
REPRESENTACIN GRFICA
Es la manera de expresar los datos
estadsticos, utilizando los medios de
representacin que proporciona la
Geometra.
Componentes de una grfica:
Ttulo general
Elementos de referencia con expresin de la
variable representada sobre cada uno.
Fuente de procedencia de los datos
representados.
TIPOS DE GRFICOS: GRFICA DE BARRAS
Barras rectangulares de igual ancho, conservando la misma
distancia de separacin entre s.
Se utiliza bsicamente para mostrar y comparar frecuencias de
variables cualitativas.
Pueden ser verticales o en forma horizontal.
GRFICA DE PASTEL, CIRCULARES O SECTORES
Se usan para mostrar como una cantidad total se reparte
en un grupo de categoras.
Variables cualitativas en porcentajes o cifras absolutas.
HISTOGRAMA
Eje horizontal: intervalos de clase (lmites reales)
Eje vertical: frecuencias
Rectngulos unidos cuyos anchos son los de los intervalos de clase.
Variables cuantitativas.
POLGONO DE FRECUENCIAS
Es un grfico de lneas trazado sobre las marcas de
clase.
El polgono empieza y termina en el eje horizontal.
FRECUENCIAS ACUMULADAS U OJIVA
Eje horizontal: lmites reales superiores
Eje vertical: frecuencia acumulada
Para el lmite inferior de la primera clase la frecuencia
acumulada es cero y para el lmite superior de la ltima clase
es igual al total de datos.
GRFICAS LINEALES
Sirven para representar las series de tiempo, porque reflejan la
direccin del cambio.
Eje horizontal: escala de tiempo
GRFICA DE PUNTOS
Muestra pequeos conjunto de datos.
Eje horizontal: valores de la variable estudiada.
Eje vertical: la frecuencia de aparicin de un valor
en el conjunto de datos estudiados.
Constituye un sencillo y grfico mtodo de anlisis que
permite ver entre las causas ms importantes de un problema
(pocos vitales) y las que no lo son (muchos triviales).
Entre sus ventajas es que permite centrarse en los aspectos
cuya mejora tendr ms impacto, optimizando por tanto los
esfuerzos.
Es decir, este diagrama establece que un 20% de las fuentes
causan el 80% de cualquier problema.
En una empresa textil se desea analizar el nmero de
defectos en los tejidos que fabrica. En la tabla siguiente
se muestran los factores que se han identificado como
causantes de los mismos as como el nmero de defectos
asociado a ellos:
Factores No. de defectos
Seda 13
Tul 105
Raso 7
Lana 4
Satn 11
Algodn 171
Tafetn 7
Encaje 8
Lino 9
Viscosa 9
Primero debemos ordenar los datos en forma decreciente:

Factores No. de defectos


Algodn 171
Tul 105
Seda 13
Satn 11
Lino 9
Viscosa 9
Encaje 8
Raso 7
Tafetn 7
Lana 4
Segundo calcular los porcentajes relativos y acumulados.
Factores No. de Porcentaje Porcentaje
defectos relativo acumulado
Algodn 171 50 50
Tul 105 30 80
Seda 13 4 84
Satn 11 3 87
Lino 9 3 90
Viscosa 9 3 93
Encaje 8 2 95
Raso 7 2 97
Tafetn 7 2 99
Lana 4 1 100
En el grfico obtenido se observa que un 20% de los
tejidos(Algodn y Tul) representan aproximadamente un 80%
de los defectos, por lo tanto centrndose la empresa solo en
esos 2 productos reducira en un 80% el nmero de defectos.