Está en la página 1de 9

COLEGIO CRISTIANO LA ESPERANZA

Certificados en el Nivel de Acceso segn el Modelo Europeo de Excelencia EFQM


Comprometidos con la Excelencia 2 Estrellas
rea: Matemticas Fecha:
Tema/Actividad: Curso:
Gua No 1 Conceptos bsicos de Estadstica Organizacin de datos
Nombre:
Docente: DANIEL E. LLINS RAMREZ
http://profedanielllinas.blogspot.com.co/

Contenidos:
Qu es la Estadstica?, estadstica descriptiva e inferencial. Conceptos bsicos: variable, constante, dato, frecuencia, poblacin,
muestra. Representacin tabular (Distribucin de frecuencias).
Aprendizaje Esperado:
Trabajar algunos conceptos bsicos de la estadstica: muestra, poblacin, variables. Tablas de distribucin de frecuencias.
Ordenar y analizar la informacin.

ESTADSTICA:
La Estadstica es la ciencia que se encarga de recoger, organizar e interpretar los datos. Es la ciencia de los datos. En la vida diaria somos bombardeados
continuamente por datos estadsticos: encuestas electorales, economa, deportes, datos meteorolgicos, calidad de los productos, audiencias de TV. Necesitamos una
formacin bsica en Estadstica para evaluar toda esta informacin. Pero la utilidad de la Estadstica va mucho ms all de estos ejemplos. La Estadstica es
fundamental para muchas ramas de la ciencia desde la medicina a la economa. Pero, sobre todo, y en lo que a nosotros importa, es esencial para interpretar los datos
que se obtienen de la investigacin cientfica. Es necesario leer e interpretar datos, producirlos, extraer conclusiones, en resumen, saber el significado de los datos. Es
por lo tanto una herramienta de trabajo profesional.
Gorgas Garca, J., Cardiel Lpez, N., & Zamorano Calvo, J. (2011)

Es la ciencia de recoger, clasificar, describir y analizar datos numricos que sirvan para deducir conclusiones y tomar
decisiones de acuerdo a esos anlisis.

La Estadstica se divide en dos grandes reas:


Estadstica Descriptiva o Deductiva dedicada a la recoleccin, clasificacin y ordenamientos de datos.
Estadstica Inductiva o Inferencial que interpreta los datos recogidos en la primera etapa y obtiene conclusiones a partir
de ellos.

Aclaramos algunos conceptos relativos a trminos que debemos utilizar.


Poblacin: es el conjunto completo de individuos, medidas u objetos a observar y que tienen una caracterstica en
comn.
Muestra(N): es un subconjunto de la poblacin donde se realizar un estudio estadstico. No siempre es posible observar
todos los elementos de una poblacin.
Aleatoriedad y representatividad de la muestra: La muestra asociada a un estudio debe ser representativa y aleatoria.
Representativa, pues debe estar formada por un nmero razonable de elementos y aleatoria porque debe ser escogida al
azar, de tal manera que quien realiza el estudio no pueda influir en la eleccin de los individuos por encuestar.
Cada elemento de la poblacin debe tener la misma oportunidad de ser seleccionado.
Variable estadstica: es una caracterstica o atributo que se observa en cada elemento de la poblacin. Pueden ser:
Cuantitativas (Discretas o Continuas) y Cualitativas.
Las variables cualitativas son aquellas que se expresan mediante palabras, tales como: sexo (masculino, femenino),
grado (primero, segundo, tercero, etc.); aficiones (canto, lectura, deporte, teatro, etc.); y las variables cuantitativas son
aquellas que se expresan en forma numrica, tales como: peso, edad, estatura, etc. Las variables se clasifican en discretas
y continuas. Si la variable puede tomar cualquier valor real, se dice que la variable es continua; en caso que pueda tomar
slo valores enteros se dice que la variable es discreta.
Dato: es el valor de la variable para cada elemento perteneciente a la poblacin o a la muestra.
Rango: es la diferencia entre el dato mayor y el dato menor.

Ejemplo: Queremos conocer, cul es el color de tapas de cuadernos ms usados por los alumnos primaria del CCLE.
Poblacin: _______________________ Muestra: _______________________
Variable estadstica: ____________________ Datos: ________________________________

El principio de la sabidura es el temor de Dios; los insensatos desprecian la sabidura y la enseanza. Proverbios 1:7
ACTIVIDAD No 1

1. Utilizando como poblacin los estudiantes de mi plantel, identifico 10 caractersticas. Digo cules son cuantitativas y
cules cualitativas. En las variables cuantitativas distingo las discretas y las continuas.

2. Sealo con una (A) las series constituidas por datos cualitativos y con una (V) las que son cuantitativas:

a) Nacionalidad b) Nmero de tornillos producidos


c) Temperatura d) Filiacin poltica
e) Estado civil f) Gastos en alimentacin
g) Profesin h) Llamadas diarias

3. Los directivos de una fbrica estudian un programa de vivienda para sus empleados y solicitan informacin a un grupo
de 30 de ellos de un total de 350 empleados, sobre el nmero de habitaciones que requerir su vivienda, en el caso de
salir favorecido en el programa. Es de aclarar que la investigacin se hace nicamente a aquellos que tienen ms de 4
aos de antigedad y en la actualidad no tienen vivienda.

Determina:

a) Poblacin b) muestra
c) Variable d) Tipo de variable

4. En cada uno de los casos sealados, en la siguiente lista, indico cuantitativa o cualitativa.

a) Biologa: Peso de un ser vivo


b) Agricultura: Cultivo de legumbres
c) Economa: ventas efectuadas por una empresa
d) Transporte: Transporte en ferrocarril (en Km.)
e) Demografa: nmero de hijos de una familia
f) Estado civil

5. Digo de las siguientes variables cules son continuas y cules discretas:

a) La altura de las personas


b) La medida de la cantidad de lluvia cada en una localidad en un mes
c) La edad de las personas, en aos cumplidos
d) El nmero de alumnos de cada curso en un colegio

El principio de la sabidura es el temor de Dios; los insensatos desprecian la sabidura y la enseanza. Proverbios 1:7
ORGANIZACIN DE LOS DATOS

Al recoger la informacin obtenemos un gran nmero de datos que conviene presentar en forma resumida en una tabla
llamada tabla de distribucin de frecuencia.

Como recordars, la Estadstica Descriptiva se encarga de la organizacin, presentacin y descripcin de los datos
recolectados, para luego obtener informacin a partir de ellos.
El objetivo de la organizacin de datos es acomodarlos en forma til para revelar sus caractersticas esenciales y
simplificar ciertos anlisis.

Cuando el tamao de muestra es menor a 30, los datos pueden tratarse individualmente, y en este caso se organizan de
manera no agrupada (Datos no agrupados). Sin embargo, cuando la muestra es grande (n > 30), es laborioso hacerlo de
esta forma, por lo que se lleva a cabo algn tipo de agrupacin preliminar para realizar el tratamiento adecuado a los
datos. En este ltimo caso, se les llama Datos Agrupados.

DATOS NO AGRUPADOS

Lo primero que podemos hacer es ordenar los datos, en forma ascendente o descendente. Una vez ordenados los datos
de la muestra se organizan en una tabla de frecuencias.

Una Tabla de Frecuencias, tambin llamada de Distribucin de Frecuencias, est formada por las categoras o valores de
la variable y sus correspondientes frecuencias.
Utilicemos un ejemplo para identificar cada elemento de una distribucin de Frecuencias.

En un grupo de Estadstica del CCLE, se observ la estatura de 16 alumnos y se obtuvieron los siguientes datos (en
metros):
1.58 1.64 1.79 1.58 1.64 1.53 1.64 1.66
1.53 1.52 1.76 1.57 1.60 1.74 1.66 1.52

Datos ordenados: 1.52 1.52 1.53 1.53 1.57 1.58 1.58 1.6 1.64 1.64 1.64 1.66 1.66 1.74 1.76 1.79
Tamao de la Muestra (N) = 16

La frecuencia, tambin llamada frecuencia simple o absoluta, se define como el nmero de veces
que aparece un dato xi, y se denota por f o ni.

La frecuencia relativa es la razn entre la frecuencia absoluta y el nmero total de elementos N. Se representa con fr o fi,
y se tiene que: fr = f/N. La suma de las fr debe ser igual a 1.

El principio de la sabidura es el temor de Dios; los insensatos desprecian la sabidura y la enseanza. Proverbios 1:7
La frecuencia absoluta acumulada de un valor xi es la suma de las frecuencias absolutas de todos los valores menores o
iguales al valor xi, y se representa por Fa o Ni.
La frecuencia acumulada relativa de un valor xi es la suma de las frecuencias relativas de todos los valores menores o
iguales al valor xi, (o dividiendo las frecuencias acumuladas entre el tamao de muestra), y se representa por Far o Fi.

Podemos agregar una columna que corresponda al porcentaje de la frecuencia de cada dato, que se haya multiplicando
por 100 al cociente indicado de la frecuencia relativa. De igual modo para la frecuencia acumulada relativa.

Resultando finalmente la siguiente tabla de Distribucin de frecuencias.

Ahora, ya que tenemos la distribucin de frecuencias, qu informacin podemos obtener acerca de las estaturas de los
alumnos?
Interpretemos algunos valores de cada columna:

f Tres estudiantes de 16 miden 1.64 m de estatura


fr El 12.50% de los estudiantes miden 1.66 m de estatura
Fa 8 de 16 estudiantes miden mximo 1.60 m de estatura
Far El 87.5% de los estudiantes miden hasta 1.74 m de estatura

PRACTICA
El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido respecto de la dcada anterior. Para
ello ha encuestado a 50 familias respecto al nmero de hijos, y ha obtenido los siguientes datos:
00111122222222222222222222233333333333333344444456
Se pide:
a. Construir la tabla de frecuencias absolutas
b. Cul es el nmero de familias que tiene como mximo dos hijos?
c. Cuntas familias tienen ms de 1 hijo pero como mximo 3?
d. Qu porcentaje de familias tiene ms de 3 hijos?

El principio de la sabidura es el temor de Dios; los insensatos desprecian la sabidura y la enseanza. Proverbios 1:7
ACTIVIDAD No 2

1. Una agencia de noticias quiere saber cul es el medio de comunicacin por el cual se informan las personas,
sobre las noticias del pas. Para ello, realiz un estudio a un grupo de personas a quienes se les pregunt por su
medio de informacin de noticias preferido. Se obtuvo la siguiente lista de datos.

Construya una tabla de distribucin de frecuencias y obtenga por lo menos 3 conclusiones.

2. Los siguientes datos son las calificaciones obtenidas en una asignatura por un grupo de 30 alumnos.
7-5 -4 -7 -2 -5 -4 -3 -6 -4 -5 -6 -2 -3 -7 -5 -6 -5 -4 -3 -4 -5 -3 -7 -6 -5 -4 -2 -3 -1

Construya una tabla de distribucin de frecuencias y obtenga por lo menos 3 conclusiones.

3. En una muestra de 40 familias, el nmero de hijos se distribuye segn la tabla:


Variable Frecuencia
a) Construya una tabla de distribucin de frecuencias
(N de (N de
b) Cuntas familias tienen menos de 4 hijos? hijos) familias)
c) Cuntas familias tienen 5 hijos?
d) Cuntas familias tienen 5 hijos o menos? 1 2
e) Cul es la frecuencia relativa de las familias de 2 hijos?
f) Obtenga tres conclusiones. 2 8

3 12

4 14

5 3

6 1

4. Los pesos de cada uno de los 11 jugadores de un equipo de ftbol son los siguientes:
70 -79 -70 -69 -70 -73 -73 -78 -79 -70 -68

a) Construya una tabla de distribucin de frecuencia.


b) Cuntos jugadores pesan menos de 70 kg?
c) Sume las frecuencias absolutas. Qu valor obtienes?
d) Qu valor se obtiene al sumar las frecuencias relativas?
e) Indique la frecuencia relativa de los jugadores que pesan 79 kg.
f) Cuntos jugadores pesan 73 kg o menos?
g) Obtenga tres conclusiones.

El principio de la sabidura es el temor de Dios; los insensatos desprecian la sabidura y la enseanza. Proverbios 1:7
DATOS AGRUPADOS

Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se encuentran ordenados en clases y
con la frecuencia en cada clase; es decir, los datos originales de varios valores se combinan para formar un intervalo
de clase. No existen normas establecidas para determinar cundo es apropiado utilizar datos agrupados o datos no
agrupados; sin embargo, se sugiere que cuando el nmero total de datos (N) es igual o superior a 30, entonces, se
utilizar la distribucin de frecuencia para datos agrupados, tambin se utilizar este tipo de distribucin cuando se
requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o la ojiva.

La razn fundamental para utilizar la distribucin de frecuencia de clases es proporcionar mejor comunicacin
acerca del patrn establecido en los datos y facilitar la manipulacin de los mismos. Los datos se agrupan en clases
con el fin de sintetizar, resumir, condensar o hacer que la informacin obtenida de una investigacin sea manejable
con mayor facilidad.

La Tabla de Distribucin de Frecuencia con DATOS AGRUPADOS, es aquella que en la variable los datos se presentan en
intervalos tambin llamados clases.

Componentes de una distribucin de frecuencias con datos agrupados


- Clase o Intervalo de clase: Son divisiones o categoras en las cuales se agrupan un conjunto de datos ordenados
con caractersticas comunes. Para organizar los valores de la serie de datos hay que determinar un nmero de
clases que sea conveniente. A las fronteras del intervalo, la llamaremos, lmites inferior y superior de la clase.
- Punto medio o Marca de clase: Es la semisuma del lmite inferior y superior de una clase, dividida entre dos.
Corresponde al trmino central de un intervalo o clase, es el representante de la clase.
- Amplitud, Longitud o Tamao del Intervalo: Los intervalos de clases pueden ser de tres tipos: Clases de igual
tamao, clases de tamaos desiguales y clases abiertas. En trminos generales, las clases de igual tamao son los
ms utilizados y recomendados para los clculos estadsticos. Se designa por la letra A.

En la construccin de la distribucin de frecuencias se deben responder a estos interrogantes fundamentales:


Cuntos intervalos de clase crear?, Cul debe ser el tamao de cada intervalo?

Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas generales:
Existen diversos criterios para determinar el nmero de clases o intervalos, ante tanta diversidad de criterios, se ha
considerado que lo ms importante es dar un ancho o longitud de clases a todos los intervalos de tal manera que
respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la prctica.
Cada observacin (dato) debe estar incluida en una y solo una clase o intervalo.
El valor ms pequeo y ms grande deben entrar en la clasificacin.
No deben existir brechas o vacos entre clases sucesivas.
Los intervalos o clases no se deben sobreponer.
En la medida de lo posible, se debe utilizar la misma amplitud para todos los intervalos. Recuerda que la Regla no es
una Ley, slo es un gua para el clculo. Lo importante es que el ltimo intervalo de clase cubra al dato mayor de la
muestra.

Procedimiento para construir una distribucin de frecuencias agrupada en intervalos


1. Determinar el mximo y mnimo entre los valores que tenemos en la muestra y calcular el recorrido de la variable o
rango, es decir, R=Xmax-Xmin
2. Determinar el nmero de clases o intervalos a utilizar. Lo denotamos con la letra (k).
3. Hallar el ancho o amplitud del intervalo de clase (A). Los intervalos de clase tienen por lo general el mismo ancho, de
modo que al fijarse el nmero de clases se obtiene ste por una operacin aritmtica simple: A=R/k, donde R es el rango
o recorrido y k es el nmero de clases. Si este cociente no es un entero, conviene redondear al entero superior.
4. Fijar los lmites reales de los intervalos de clase y su respectiva marca de clase. El lmite inferior del primer intervalo
debe ser el menor valor de la muestra. Tenga en cuenta que el extremo superior de cada intervalo ha de coincidir con el
extremo inferior del siguiente.

El principio de la sabidura es el temor de Dios; los insensatos desprecian la sabidura y la enseanza. Proverbios 1:7
Luego, construir la tabla de frecuencias de acuerdo a los parmetros establecidos en la seccin anterior.
Quedando as la tabla de frecuencias para datos agrupados:

RECUERDA
Intervalo abierto (a, b) es el conjunto de todos los nmeros reales mayores que a y menores que b.
(a, b) = {a < x < b}
Intervalo cerrado [a, b] es el conjunto de todos los nmeros reales mayores o iguales que a y menores o iguales que b.
[a, b] = {a x b}
Intervalo semiabierto por la izquierda (a, b] es el conjunto de todos los nmeros reales mayores que a y menores o iguales que b.
(a, b] = {a < x b}
Intervalo semiabierto por la derecha [a, b) es el conjunto de todos los nmeros reales mayores o iguales que a y menores que b.
[a, b) = {a x < b}

Ejemplo
Construya una tabla de distribucin de frecuencias con datos agrupados haciendo uso de 6 intervalos de clase.

Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente
investiga los precios por habitacin de 40 hoteles de la misma categora de esta ciudad. Los datos obtenidos (en miles de
pesos) fueron:
3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2
4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5
4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1
5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1
Procedimiento:

1. El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8.

2. k = 6 intervalos

3. A = 2.8 / 6 = 0.467 0.5 tamao de los intervalos

4. As pues los intervalos de clase seran los siguientes:

5. Calcula la marca de clase para cada intervalo y termina la tabla de distribucin de frecuencias.

El principio de la sabidura es el temor de Dios; los insensatos desprecian la sabidura y la enseanza. Proverbios 1:7
ACTIVIDAD No 3

1. Construya una tabla de distribucin de frecuencias con datos agrupados para los siguientes datos correspondientes a
la edad de 55 personas. Use 5 intervalos de clase. Obtenga tres conclusiones.
27 23 41 38 44 29 35 26 18 22 24
25 36 22 52 31 30 22 45 28 18 20
18 28 44 25 29 28 24 36 21 23 32
26 33 25 27 25 34 32 23 54 38 23
31 23 26 48 16 27 27 33 29 29 28

2. Los siguientes datos muestran el nmero de vuelos internacionales recibidos en el aeropuerto de la ciudad de Mxico
durante los dos meses anteriores, construye una tabla de distribucin de frecuencias con datos agrupados.
71 47 66 67 73 38 63 67 29 54 62 70
63 37 68 50 59 60 45 48 52 49 48 56
70 62 61 65 62 45 62 56 63 39 36 43
49 50 39 41 57 49 73 47 38 61 48 31
55 57 72 53 42 70 56 58 39 60 53 36

3. Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de estudiantes de 11.
Construya una tabla de distribucin de frecuencia con datos acumulados, usando 6 intervalos. Obtenga tres
conclusiones.

4. Los datos siguientes corresponden a un estudio realizado con 40 personas para conocer la reaccin sistmica a la
picadura de abeja. Se toma el tiempo, en minutos, en el que aparecen las primeras reacciones a la picadura.
Construye una tabla de distribucin de frecuencias. (Observa que la precisin de estos datos es de dcimas)

10.5 11.2 9.9 11.4 12.7 16.5 15.0 10.1 12.7 11.4 11.6 7.9 8.3 10.9 6.2 8.1 3.8 10.5 11.7 12.5 11.2 9.1 8.4 10.4 9.1 13.4
12.3 11.4 8.8 7.4 5.9 8.6 13.6 14.7 11.5 10.9 9.8 12.9 11.5 9.9

5. Estas son las notas obtenidas por los 100 candidatos que se presentaron a un concurso:

38 51 32 65 25 28 34 12 29 43
71 62 50 37 8 24 19 47 81 53
16 62 50 37 4 17 75 94 6 25
55 38 46 16 72 64 61 33 59 21
13 92 37 43 58 52 88 27 74 66
63 28 36 19 56 84 38 6 42 50
98 51 62 3 17 43 47 54 58 26
12 42 34 68 77 45 60 31 72 23
18 22 70 34 5 59 20 68 55 49
33 52 14 40 38 54 50 11 41 76

Presenta dichos datos en una tabla de intervalos de clase y obtn tres conclusiones.

El principio de la sabidura es el temor de Dios; los insensatos desprecian la sabidura y la enseanza. Proverbios 1:7
6. En una cierta ciudad del Magdalena, se registra el nmero de nacimientos ocurridos por semana durante las 52
semanas del ao, siendo los siguientes los datos obtenidos:

6 4 2 8 18 16 10 6 7 5 12 8 9
12 17 11 9 16 19 18 18 16 14 12 7 10
3 11 7 12 5 9 11 15 9 4 1 6 11
7 8 10 15 3 2 13 9 11 17 13 12 8

Confecciona una tabla de intervalos de clase y obtn tres conclusiones.

7. Las edades de veinte chicos son 12, 13, 14, 10, 11, 12, 11, 13, 14, 12, 10, 12, 11, 13, 12, 11, 13, 12, 10 y15. Organiza
los datos en una tabla de frecuencias.
Qu porcentaje de chicos tienen 12 aos?
Cuntos chicos tienen menos de 14 aos?

8. Los siguientes datos muestran el nmero de vuelos internacionales recibidos en el aeropuerto de la ciudad de Mxico
durante los dos meses anteriores.

a. Construye una tabla de distribucin de frecuencias con 6 clases.


b. Obtn 3 conclusiones relevantes del estudio.

9. Los datos siguientes corresponden a un estudio realizado con 40 personas para conocer la reaccin sistmica a la
picadura de abeja. Se toma el tiempo, en minutos, en el que aparecen las primeras reacciones a la picadura.
Construye una tabla de distribucin de frecuencias. (Observa que la precisin de estos datos es de dcimas)

a. Construye una tabla de distribucin de frecuencias con 4 clases.


b. Obtn 3 conclusiones relevantes del estudio.

El principio de la sabidura es el temor de Dios; los insensatos desprecian la sabidura y la enseanza. Proverbios 1:7

También podría gustarte