Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin
La Estadstica es una ciencia que facilita la solucin de problemas en los cuales necesitamos conocer caractersticas sobre el comportamiento de algn suceso o evento. Nos permite inferir el
comportamiento de sucesos iguales o similares sin necesidad de que estos ocurran.
Esto nos da la posibilidad de tomar decisiones acertadas y a tiempo, as como realizar proyecciones del comportamiento del suceso. Slo se realizan los clculos y el anlisis con los datos obtenidos de una muestra de la poblacin y no con toda la poblacin.
Actualmente el INEGI es el encargado de concentrar y publicar la informacin estadstica del estado y del pas.
Conceptos bsicos
Estadstica: Es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos para despus obtener conclusiones. Se divide en Estadstica Descriptiva y Estadstica Inferencial. Estadstica descriptiva: Se encarga de la recoleccin, organizacin, presentacin y anlisis de los datos de una poblacin.
Estadstica inferencial: Se encarga de analizar la informacin presentada por la estadstica descriptiva mediante tcnicas que nos ayuden a conocer, con determinado grado de confianza, a la poblacin. Lo que nos permite tomar decisiones.
Poblacin: Conjunto definido de TODOS los INDIVIDUOS, de donde se observa cierta caracterstica. Al nmero de integrantes de la poblacin se llama tamao de la poblacin y se representa con la letra N.
Poblacin Estadstica: Conjunto de TODOS los DATOS que se obtienen al realizar la medicin de una variable en los elementos de una poblacin. Muestra: Subconjunto de una poblacin, que intenta reflejar las caractersticas de la poblacin lo mejor posible. El nmero de individuos que integran la muestra, llamado tamao de la muestra se representa con la letra n.
Individuo: Es el elemento de la poblacin o de la muestra que aporta informacin sobre lo que se estudia. Variable: Caracterstica o propiedad de los individuos que se desea estudiar y se puede medir o calificar; cambia o vara con el tiempo en un individuo dado, o cambia o vara de elemento a elemento. Ej. Edad, peso, sexo, estado civil, nmero de
Dato: Valor que se obtiene al realizar la medicin de la caracterstica de la variable en estudio. Pueden ser univariados, bivariados o multivariados. La naturaleza de los datos pueden ser datos cuantitativos o datos cualitativos.
Datos Cuantitativos (nmeros): Valores obtenidos al medir peso, estatura, temperatura, nmero de hijos. Datos Cualitativos (categoras): Se obtienen al calificar la caracterstica en cuestin como el sexo, estado civil, grado mximo de estudios.
Variable Dicotmica: Slo puede tomar dos valores (s no, 0 1, hombre mujer, bueno malo, encendido apagado).
Variable Continua: Si la variable puede tomar cualquier nmero real entre dos valores dados (decimal o entero). Ej. El peso de un individuo. Variable Discreta: Si la variable slo puede tomar nmeros enteros. Ej. El nmero de hijos de un individuo.
Escalas de Medicin
Escala Nominal
Escala Ordinal
Escala de Intervalo
Escala de Razn
Escala Nominal: Est asociada a variables cualitativitas y es denominada de este modo si no se pueden hacer operaciones aritmticas entre sus valores, pues stos son nicamente ETIQUETAS.
Ejemplo: sexo, cdigo postal, estado civil, nmero telefnico, nmero al correr en un maratn, deporte favorito, carrera a estudiar, etc.
Escala Ordinal: Los valores de la variable que tienen un ORDEN con un nivel especfico, pero no se pueden hacer operaciones aritmticas entre ellas. Ejemplo: Psimo Malo Regular Bueno Excelente Primaria Secundaria Preparatoria Licenciatura
Escala de Intervalo: En ella existe un orden entre los valores de la variable y adems una NOCIN DE DISTANCIA aunque no se puedan realizar operaciones. El cero o punto de inicio no es nico, es ms bien un punto de referencia. Ejemplo: Escalas de temperatura, la edad de la Tierra, la lnea del tiempo de la humanidad.
Escala de Razn: La magnitud tiene SENTIDO FSICO, existe el cero absoluto, existe orden, se puede determinar cuntas veces es mayor uno que otro. Ejemplo: peso, estatura, edad, distancia, dinero, etc.
Fuentes de informacin
Experimento: Procedimiento utilizado en la investigacin cientfica para obtener informacin que permita conocer el comportamiento de algn proceso.
Fuentes de Informacin
Investigacin Documental: Procedimiento para obtener datos mediante la consulta de informacin ya escrita y concentrada en documentos que se localicen en libros o revistas en bibliotecas, hemerotecas, o en centros virtuales.
Redondeo: El redondeo de datos es un procedimiento que consiste en escribir un nmero que representa a una cantidad con menos cifras de las que tiene realmente para tener una idea rpida de la cantidad.
Notacin Cientfica
Es una manera de escribir en forma breve cifras muy grandes o pequeas. La forma n general es a x 10 , en donde a es un nmero entre 1 y 9, n es un nmero entero.
4 Ejemplo: - ,4o el El nmero 25 000 se escribe 2.5 x 10 nmero 0.00025 se escribe como 2.5 x 10 .
Cifras Significativas
A los dgitos exactos que se utilizan para escribir una cifra, a parte de los ceros para localizar el punto decimal, se les llama cifras significativas. Ejemplos:
3.22
0.0032
0.00320
La cifra 3.22 se encuentra realmente entre 3.215 y 3.225. La cifra 0.0032 es un valor que se encuentra entre 0.00315 y 0.00325. La cifra 0.00320 se encuentra entre las cifras 0.003195 y 0.003205
Orden de datos
La ordenacin es el proceso mediante el cual los datos estn acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos. Hay dos mtodos comunes:
Ejemplo
Considera que la variable de estudio es el peso de 25 estudiantes. Los pesos se encuentran en la siguiente tabla:
Peso de 25 estudiantes (en kg) 40 56 52 63 57 43 44 62 50 66 48 42 44 56 63 51 55 50 55 51 49 52 59 45 58
Si los nmeros de los datos estn formados por dos dgitos, se hace una columna con el primer dgito (decenas) y a la derecha de cada uno de ellos se escribe, en fila, slo el segundo dgito (unidades) de cada uno de los datos que tengan el mismo primer dgito.
4 5 6
Datos ordenados:
4 5 6
Doble tallo
Una variante de este mtodo es en lugar de dividir en un grupo las decenas, se divide en dos grupos. El primero abarcando los dgitos del 0 al 4 y el segundo del 5 al 9. El ejemplo anterior queda:
4 4 5 5 6 6 0,2,3,4,4 5,8,9 0,0,1,1,2,2, 5,5,6,6,7,8,9 2,3,3 6
El procedimiento es:
Se
identifican todos los valores diferentes y se acomodan en columna. agrega una segunda columna en donde se van registrando, mediante una lnea vertical, la veces que aparece el valor dado.
Se
Ejemplo
Considera que la variable de estudio es el color de playera de 25 estudiantes. Los colores se encuentran en la siguiente tabla:
rosa azul blanco azul rosa
Color
Frecuencia
rosa blanco
IIII
azul caf blanco blanco azul blanco rosa gris blanco caf negro verde
Una vez que se tenga ordenados los datos, se acomodan en la Tabla de distribucin de frecuencias o tabla de frecuencias.
La tabla es bsicamente una tabla de valores x-y, dnde x representa el dato y y representa la frecuencia.
La frecuencia es el nmero de veces que aparece cada dato. Hay dos clases de tablas de frecuencias:
Para
Est formada por dos columnas: una para la variable xi y la otra para su frecuencia f, a esta frecuencia se le llama frecuencia absoluta o frecuencia observada.
Ejemplo
40 45 51 55 59
42 48 51 56 62
43 49 52 56 63
44 50 52 57 63
44 50 55 58 66
56
57 58 59 62
63
66 Total
Por lo regular, se agregan dos columnas: la de la frecuencia relativa fr y la de la frecuencia acumulada fa. La frecuencia relativa se obtiene mediante el cociente de la frecuencia y el nmero total de datos, esto es fr = f/n. La frecuencia acumulada se obtiene sumando las frecuencias anteriores a las frecuencias de un dato dado.
Ejemplo
1/25
xi
40 42 43
f
1 1 1
fr
0.04
fa 1 2
3 2/25
xi 52 55 56 57 58 59 62 63 66 Tota l
f 2 2 2 1 1 1 1 2 1 25
fr
fa
0.08
14
0.04
0.04 0.08 0.04
16 18
19 20
44
45 48 49
2
1 1 1
5
6 7 8 10 12
0.04
0.04 0.08 0.08
0.04
0.04 0.08 0.04
21
22 24 25
50
51
2
2
1
Siempre es 1
Intervalo de clase
En ocasiones es conveniente acomodar los datos en pequeos grupos de igual tamao, llamados intervalos de clase. El punto medio o marca de clase xi, se obtiene con: Marca de clase Lmite inferior + lmite 2 superior =
Ejemplo
Lmite inferior Lmite superior Lm inf + Lim sup 2
Intervalo de clase 38 42 43 47 48 52 53 57 58 62 63 67
Punto medio xi 40 45 50 55 60 65
Frontera de clase o lmite verdadero del intervalo: de clase Intervalo Punto medio xi
37.5 42.5 42.5 47.5 47.5 52.5 52.5 57.5 57.5 62.5 62.5 67.5
40 + 2.5
40 2.5
40 45 50 55 60 65
y corchetes
Intervalo de clase [37.5 , 42.5) [42.5 , 47.5) [47.5 , 52.5) [52.5 , 57.5) [57.5 , 62.5) [62.5 , 67.5) Punto medio xi 40 45 50 55 60 65
Intervalo de clase 37.5 x < 42.5 42.5 x < 47.5 47.5 x < 52.5 52.5 x < 57.5 57.5 x < 62.5 62.5 x < 67.5
Punto medio xi 40 45 50 55 60 65
Si por alguna razn no es fcil decidir el ancho del intervalo y el nmero de ellos, se pueden utilizar las siguientes frmulas: K = 1 + 3.3 log (n) Donde K = nmero aproximado de clases n = nmero de datos. Amplitud de los intervalos = Rango / K Donde Rango = diferencia entre el dato mayor y el dato menor.
Ejemplo
Para el ejemplo de los datos de los pesos de 25 alumnos, el valor de K: K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6. Por lo tanto se requieren aproximadamente 6 intervalos. Y la amplitud de los intervalos sera:
Amplitud = Rango / K = (66 40) / 5.6 = 4.64. Aproximadamente 5 unidades es la amplitud de los intervalos.
Se elabora con los intervalos de clase, sus puntos medios y las frecuencias correspondientes para cada uno de los Datos agrupados xi f 2 intervalos. 52
40
42 43 44
1
1 1 2
55
56 57 58
2
2 1 1
Intervalo de clase
38 42 43 47 48 52 53 57 58 62 63 - 67
Punto medio xi
40 45 50 55 60 65 Total
f
2 4
45
48 49 50
1
1 1 2
59
62 63 66
1
1 2 1
8
5 3 3
51
Total
25
25
Punto medio xi
40 45 50 55 60 65 Total
fr
Fa
2 4 8 5 3 3 25
2 6 14 19 22 25
Por ltimo se agregan las columnas: Frecuencia porcentual, f% %f, se obtiene multiplicando la frecuencia relativa fr x 100. Frecuencia relativa acumulada fra, se obtiene sumando las frecuencias relativas anteriores a un dato dado. Frecuencia porcentual acumulada, f%a, se obtiene sumando las frecuencias porcentuales acumuladas a un dato dado.
fa
fra
f%a
2 4
0.08 0.16
8 16 32 20 12
2 6
0.08
48 52
53 57 58 62 63 - 68
50
55 60 65
8
5 3 3
0.32
0.20 0.12 0.12
14
19 22 25
Total
25
12 100
Grfica de Datos
Existen dos tipos de grficas mas usuales: Polgono de Frecuencias Histograma Otros grficos: Grfica de barras Pictograma Grfico Circular o de pastel.
Polgono de Frecuencias
Es la representacin mediante un grfico de lnea. En l se muestra la distribucin de frecuencias y est formado por segmentos de lnea que unen los puntos correspondientes a la frecuencia de cada una de las clases. El eje x representa el dato xi y el eje y las frecuencias.
Ejemplo
9 8 7 6 5 f 4 3 2 1 0
Polgono de Frecuencias
Intervalo de clase 38 42 43 47 48 52 53 57 58 62 63 - 68
f 2 4 8 5 3 3 25
35
40
45
50
55
60
65
70
xi
fr 0.2
0.15 0.1 0.05 0 35 40 45 50 55 60 65 70
xi
% f 20
15 10 5 0
35
40
45
50
55
60
65
xi
Histograma
14
Es la representacin grfica de los datos mediante una sucesin de rectngulos. Est formado por rectngulos cuya anchura representa a cada uno de los intervalos y la altura corresponde a la frecuencia. En el eje x estarn los lmites verdaderos, los puntos medios y en el eje y las frecuencias.
Ejemplo
Intervalo de clase
Punto medio xi
38 42
43 47 48 52 53 57 58 62
40
45 50 55 60 65 Total
2
4 8 5 3 3 25
Histograma
9 8 7 6 5 f 4 3 2 1 0 35 40 45 50 xi 55 60
63 - 68
65
0.05
0
35 40 45 50 55 60 65
xi
Pirmide Poblacional
Una variante en el histograma es colocar en el eje x de tal manera que las columnas quedarn en forma horizontal, es muy comn en datos poblacionales.
Ojiva
Es la representacin grfica de las frecuencias acumuladas mediante un grfico de lnea. Se muestra la distribucin de frecuencias acumuladas de los datos. En el eje x estarn los puntos medios y en el eje y las frecuencias acumuladas.
Ejemplo
Intervalo de clase 38 42 Punto medio xi 40 f fr fa
0.08
43 47
48 52 53 57 58 62
45
50 55 60
4
8 5 3
0.16
0.32 0.20 0.12
6
14 19 22
63 - 68
65
Total
3
25
0.12
1
25
Ojiva
30 25
22 25
20
19
fa 15
10 5
2 6
14
35
40
45
50
55
60
65
xi
Intervalo de clase
38 42 43 47 48 52 53 57 58 62 63- 68
40 45 50 55 60 65 Total
2 4 8 5 3 3 25
8 16 32 20 12 12 100
2 6 14 19 22 25
0.76
0.56
0.24
0.08
35
40
45
50
55
60
xi
56
24
8 0
35
40
45
50
55
60
xi
Grfico Circular
Tambin es llamado grfico de pastel. Slo se representan datos de frecuencias relativas o frecuencias porcentuales. Se debe dividir el rea del crculo de manera proporcional a las frecuencias.
13% 13% 17% PERRO PAJARO HAMSTER 57% GATO
Agregaremos una columna a nuestra tabla de frecuencias Frecuencia relativa al crculo, multiplicando (fr)(360), para mostrar la parte proporcional de crculo medida en grados que corresponde a cada intervalo.
Ejemplo 1
Intervalo de clase 38 42 43 47 48 52 53 57 58 62 Punto medio xi 40 45 50 55 60 f 2 4 8 5 3 fr 0.08 0.16 0.32 0.20 0.12 (fr ) (360) 28.8 57.6 115.2 72
0.08 x 360 0.16 x 360
63- 68
65 Total
3 25
0.12 1
45 16%
55 20% 50 32%
Ejemplo 2
Color
Frecuenci a
Conteo
Color de Playera
Azul Negro Blanco Rosa Caf Verde Gris
4 7 3
Gris
Negro Rosa Verde
4 8%
2 4 1
Otros Grficos
La grfica de barras se traza similar al Histograma, slo que las barras se dibujan separadas unas de otras. La escala en el eje x es para mostrar categoras o intervalos de nmeros NO consecutivos.
Frecuencia absoluta
Carrera
Medicina Mecnica
Alumnos
8 11
Eleccin de Carrera
11
11
Civil
Agronoma Fsico - Matemticas Leyes Contadura
8
3 3 6 11
8 3 3
Pictograma
Similar al de barras, slo que se sustituyen por figuras, generalmente relacionadas con la variable estudiada.