Está en la página 1de 41

CONCEPTOS

PRELIMINARES
UNIDAD UNO
OBJETIVOS DE LA UNIDAD:

ORIGEN

La estadstica es una ciencia que surge de la teora de las probabilidades


nace de un juego de azar, en las cartas, en los dados en la probabilidad
de perder o ganar esta el origen de la estadstica.
DEFINICION
La

estadstica,

es

la

ciencia

dedicada

la

coleccin,

anlisis,

interpretacin y representacin de las conclusiones extradas de datos


numricos y muchas veces cualitativas.
Por ejemplo: para estudiar el grado de desercin de un colegio se toman
datos de varios aos y que reposan en los archivos del colegio mientras
la informacin necesaria no este recolectada el estudio y el anlisis
estadstico no comienza, la informacin no puede ser parcial.
CAMPO DE ACCION
La aplicacin de la estadstica en la direccin de procesos enfatiza en la
toma de decisiones. La necesidad de resolver problemas pone de
manifiesto la aplicabilidad de la estadstica. La aplicabilidad se extiende
a todo el universo social,

biolgico, fsico, ingenierl, educacional,

mdico, de negocios y leyes, en fin a casi todas las fases de la vida.


El campo de la estadstica es una disciplina dirigida a lograr un mejor
entendimiento del mundo que nos rodea, con el objetivo final que todos
tengamos una vida ms completa y con un mayor entendimiento de la
misma. No hay parte de nuestro ambiente que no sea una fuente de
datos (nosotros mismos, otros individuos, la familia, sociedades,
culturas, ciudades, pases, planetas, escuelas, colegios religiones, etc),
en pocas palabras cada aspecto de nuestra existencia.

Por ejemplo en un colegio podemos obtener los siguientes datos que en


el caso especfico de abordar un problema seran necesarios y la
necesidad de resolver este problema hace que nosotros busquemos la
fuente:
En la universidad los procesos investigativos, la tabulacin de
resultados de procesos, los rendimientos acadmicos. La utilidad de la
estadstica no mira el tipo de datos que referencie una investigacin, por
ejemplo, desde la estadstica se han dado solucin a proyectos
relacionados con: Evaluacin docente, implementacin de competencias
en el aula de clase, identificacin de perfiles docentes investigativos.
DIVISIN
La estadstica se divide en dos grandes ramas de estudio que:

Se encarga de la recoleccin, clasificacin y descripcin de datos mustrales o poblacionales, para su interpretacin y a

Estadstica descriptiva:

Desarrolla modelos tericos que se ajusten a una determinada realidad con cierto grado de confianza.

Estadstica inferencial:

ESTUDIOS ESTADISTICOS
Un estudio estadstico es una de las aplicaciones mas importantes para
cualquier profesional llmese, ingeniero, profesor, medico, contador,

administrador, etc. En los diferentes informes resultados de las


investigaciones requieren de la estadstica ya sea en la descripcin de
los datos, o en la demostracin de inferencias propuestas.
Todo estudio estadstico parte de la observacin de un fenmeno. La
observacin implica un proceso de anlisis, de interpretacin del medio
o del contexto en donde vive inmerso el problema a solucionar. La
observacin es una vivencia un acto de compartir experiencia entre el
investigador y el investigado. Toda observacin se registra sobre

una

carpeta de datos.
La observacin nos permite conocer la poblacin, sus caractersticas, su
forma de vida, sus problemas y priorizar sus necesidades. De la
Observacin se puede partir a

Plantear un problema que priorice las

necesidades de un comunidad. Conocido el problema y como producto


de la buena observacin se procede a formular objetivos, e hiptesis. De
la observacin tambin podemos determinar el tamao de la poblacin
y la muestra, un margen de error del que partimos a recolectar datos de
la muestra. Los datos se levantan utilizando diferentes instrumentos
entre los que podemos destacar: Encuestas, entrevistas, Chat, correos
electrnicos, paginas Web, etc. Despus de la recoleccin de los datos
se procede a clasificar y ordenar dichos datos, para entrar por ultimo a
la etapa de la tabulacin, de la presentacin y anlisis de la informacin.
La publicacin del resultado final se hace siguiendo las pautas de las
normas ICONTEC.

UTILIZACION DEL R EN LA ESTADSTICA


R- es un software de libre distribucin, apropiado para el anlisis de
datos cuantitativos o cualitativos. El poder de esta aplicacin no solo
radica en la forma precisa como entrega los resultados si no como los
grfica. R es un aplicativo de amplia difusin y por tanto ofrece una

infinidad de ayudas en lnea, incluyendo la ayuda que pueden ofrecer


comunidades

virtuales

dedicadas

al

enriquecimiento

de

esta

herramienta.
INSTALACION DE R
1. Entrar en la pgina web: http://www.r-project.org/ , La pgina tiene el siguiente
aspecto (Ver figura 1)
2. Pulsar el conector CRAN bajo la referencia Download. Aparecen un conjunto de
direcciones web en el mundo (mirrors, espejos) donde est disponibles copias del
software para ser descargadas.

Figura 1: Aspecto de la pgina proyecto R


Por proximidad se puede elegir la de Espaa, asociada al CSIC: http://cran.es.rproject.org/ (Ver figura 2)

Figura 2: conjunto de direcciones web en el mundo para descarga de R en


espaol

3. En el recuadro Download and Install R, seleccionar Windows, si es el caso,


para descargar una versin precompilada binaria del sistema R. Resulta una
pgina con el ttulo R for Windows (Ver figura 3)

Figura 3: Recuadro Dowloand de instalacin de R


En la ventana anterior pulsar base, para descargar el paquete bsico. Resulta una
pgina con el ttulo R-2-13-2 for Windows. En ella, elegir el hipervnculo R-2.13.2win32.exe, con lo que nos saldr la ventana de dilogo. (Figura 4)

Figura 4: Escogiendo la opcin para windows R 2.13.2


Elegimos Guardar, es el programa ejecutable (.exe) instalador del sistema R
bsico. Lo descargamos en la carpeta que nos convenga, por ejemplo en el
Escritorio. Lo ejecutamos con doble clic, y en la ventana de dilogo que resulta
elegimos ejecutar, teniendo en cuenta:

Figura 5: Ventana ejecutar

Elegimos Guardar, es el programa ejecutable (.exe) instalador del sistema R


bsico. Lo descargamos en la carpeta usual, o en el Escritorio. Lo ejecutamos con
doble clic, y en la ventana de dilogo que resulta elegimos Ejecutar, teniendo en
cuenta:
a. Cuando pregunta si deseamos establecer opciones de instalacin, escogemos
S, se elige la opcin de espaol, (figura 6)

Figura 6: Eleccin del Idioma


b. En la aprobacin de las opciones de R se elige en la siguiente ventana
Instalacin completa

Figura 7: Instalacin completa


Para el modo de presentacin (MDI o SDI), escoger SDI. Continu con la
instalacin aceptando las opciones que le ofrece el programa en esta etapa

INICIANDO R
Ejecute el programa R, una vez instalado. Lo haremos pulsando un icono que es
una letra R grande que al instalar nos habr generado en nuestro escritorio.
Tambin eligiendo el programa por la va >>Inicio>Programas>R> R 2.13.2

Figura 8: Instalacin de paquetes


Al ejecutar R aparece la ventana bsica R Consol. En el men Paquetes, oprimir
en Seleccionar espejo CRAN. En el cuadro de dilogo, escoger Spain (Madrid),
France (Toulouse), Portugal o algn otro cercano, y pulsa OK.
En el men Paquetes, oprimir en Instalar paquete(s). As se va a completar la
instalacin instalando paquetes de programas adicionales al paquete base. Este
proceso de Instalar paquetes se hace slo la primera vez. (Ver Grfico 8)
Escoger fBasics y Rcmdr y aceptar. Si nos dice que le hace falta instalar otros
paquetes que complementan a los anteriores, aceptar la propuesta. Con estas
opciones al ingresar nuevamente al contexto de R, aparecer la ventana de RComander.
R- COMO HERRAMIENTA MATEMTICA
El poder de R est en el procesamiento de la informacin para el proceso
estadstico de la misma, sin embargo es posible darle un buen uso para mucho de
los procesos matemticos que incluyen otros paquetes como Matlab, de tal

manera que se puede darle tratamiento a R como una calculadora, como un


paquete para la solucin de matrices, o para hacer grficos de funciones reales.
Cabe resaltar que el software estadstico R es de uso libre en el dominio pblico,
y resulta del esfuerzo cooperativo de personas e instituciones acadmicas
relevantes relacionadas con la Estadstica y la Computacin en todo el mundo.
Para tal efecto R incluye una serie de comandos que representan las operaciones
matemticas. Ver tabla 1
Aritmticos
+

Suma

Resta

/
^

Multiplicacin
Divisin
Potencia

%/%
entera

Comparativos

Lgicos

== igualdad
!= Diferente de

& Y lgico
! No lgico

<

Menor que

O lgico

> Mayor que


<= Menor o igual

Divisin >= Mayor o igual

Tabla 1: Operadores aritmticos en R


De la misma manera R establece una serie de comandos para el manejo de las
funciones matemticas. Se agrega en la tabla elementos que corresponden a
comandos propios de la estadstica como la varianza, la media, entre otros. Ver
tabla 2.
Operaciones
Descriptivos
Raz cuadrada de x
Media
sqrt(x)
mean(x)
Exponencial de x
exp(x) Desv. Tpica
Logaritmo neperiano
log(x) Varianza
N de elementos de un vector x Mediana
length(x)
median(x)
Suma los elementos del vector x Quantiles
sum(x)
quantile(x,p)
Seno de x
sin(x) Mximo y Mnimo
Coseno
de
x Ordenacin
cos(x)
Tangente de x
tan(x) Resumen de todos

sd(x)
var(x)

range(x)
sort(x)
summary

Tabla 2: Comandos de R para el manejo de funciones y medidas estadsticas

Ejemplos
1.
Problema

B 4 B5
B6

Solucin en R

; Donde B4= 8; B5=10;

B6=-3

> B4=8
> B5=10
> B6=-3
> (B4+B5)/B6
[1] -6

2.
Problema
5

Solucin en R

( B 3 B 2) 5
LOG ( B 2 B 4)

Donde B2 =
10
B3= 2; B4 =
6

> B2=10
> B3=2
> B4=6
> (((B3+B2)^5)/(log(B2+B4)))^1/5
[1] 17949.43

EJERCICIOS PARA PRACTICAR EN R


1. Se tiene una poblacin de 1500 estudiantes en un colegio. Se plantea
el problema de desnutricin en los primeros grados (De primero a
Quinto) en donde existes 500 estudiantes. La poblacin vulnerada es
fcil de entrevistar y los padres estn en disposicin de brindar mucha
informacin. Calcule en R el tamao de la muestra sobre la que se har
el estudio sabiendo que el margen de error es del 1% mediante la
n

frmula:

N
1 N 2

2. desarrollar el polinomio
A1=5,

A2=-2

A 1+ A 2
3

A3
A 4+ A 5

A3=5,

A4=8,

A5=7

TERMINOLOGIA
UNIDAD DOS
ESPECIFICA
OBJETIVOS DE LA UNIDAD:

TERMINOLOGIA

POBLACIN:

La poblacin no hace referencia

nicamente a los seres vivos; una

poblacin puede estar constituida

por los peces de un estanque, por

animales de una determinada raza, as como por los establecimientos


educativos de una ciudad o de un ncleo educativo.
POBLACIONES FINITAS:
En este tipo de poblacin el nmero de unidades observables es
contable, es decir un nmero conocido de elementos del conjunto
llamado poblacin:
Por ejemplo:
a. Alumnos Matriculados en el ao 2005 en un colegio de la capital.
b. Cantidad de estudiantes que proceden de provincias a un colegio de
la capital
POBLACIONES INFINITAS:
En este tipo de poblacin el conteo de unidades observables se hace un
poco difcil. El trmino de infinito en

estadstica no se ajusta a una

definicin semntica.
Por ejemplo:
a. La cantidad de ensayos que hace un estudiante en un experimento de
laboratorio repetido indefinidamente.
b. Nmero de hijos de todas las familias que conforman la gran
comunidad educativa en un colegio.

MUESTRA:
Se define como la mejor representacin de la poblacin. La muestra es
un subconjunto de la poblacin a la cual se le efecta la medicin con el
fin de estudiar las propiedades del conjunto del cual es obtenida.
El

tamao

de

la

poblacin,

la

disponibilidad

de

recursos,

la

homogeneidad de los elementos y de los datos que la conforman le da la


importancia suficiente al uso adecuado de la muestra.
Un buen conocimiento de la poblacin permite encontrar una buena
muestra representativa. Existen muestras tomadas al azar y sin seguir
ningn modelo de muestreo que llevan a conclusiones inadecuadas y
por tanto a tomas de decisiones que no corresponden a la solucin de un
problema planteado al interior de conjunto.
PARMETROS:
Son medidas utilizadas para realizar descripciones cuantitativas de los
conjuntos de datos, o poblaciones suelen estar representadas con letras
griegas (por ejemplo y .
ESTADSTICOS
Son medidas que describen cuantitativamente a una muestra son
representados por letras de nuestro alfabeto (por ejemplo, x o y).
VARIABLE:
Es el conjunto de caractersticas de las entidades que interesan en una
investigacin. Como por ejemplo, Tamao, edad, precios, rendimiento
acadmico, Indicadores econmicos.

VARIABLES ENTERAS O DISCRETA:


Los elementos que se visualizan estn representados por nmeros
enteros:
Ejemplo:
Nmero de estudiantes en la universidad.
Nmero de computadores encendidos, en una sala de sistemas.
Nmero de crditos acadmicos escogidos por un estudiante en un
semestre determinado.
VARIABLES REALES O CONTINUAS:
Es aquella que tericamente puede tomar cualquier valor dentro de un
intervalo de valores, ella se mide uniformemente. Dentro de la escala de
los conjuntos numricos representan a los nmeros Reales.
Ejemplo:
Estatura de los estudiantes de dcimo grado de un colegio.
Salarios devengados por los docentes de un ncleo educativo.
Temperaturas a ciertas horas del da.
Edad exacta de una persona.
VARIABLES CUALITATIVAS:
Representan caractersticas propias de las cualidades de los objetos que
conforman la muestra o la poblacin.
Ejemplo:

Sexo

Origen

Color de piel

Las variables cualitativas se dejan expresar en niveles de categora

Ejemplo:

Sexo: masculino- Femenino

Origen: Colombiano Venezolano Panameo

Color de piel: Blanco Negro Amarillo.

VARIABLES DEPENDIENTES E INDEPENDIENTES:


Una variables se hace independiente cuando puede tomar en forma
particular cualquier valor, la variable se hace dependiente cuando esta
sujeta a los valores que tome la variable independiente.
Para poder hablar de dependencia se hace necesario tener dos variables
correlacionadas entre si.
Ejemplo:
En la pareja de variables representadas por la edad y peso de los
alumnos de un colegio con respecto

a la variable independiente y

dependiente podemos decir que:


Sea X Edad:
Variable Independiente: Significa que podemos tomar estudiantes de
cualquier edad
Sea Y Pesos:
Las estaturas van a estar sujetas a la edad de los estudiantes.
La relacin en el ejemplo puede ser inversa; es decir que el peso sea
independiente para que los valores de la edad dependan del peso que
tengan los alumnos. En todo estado de relacin debemos elegir cual es
la variable independiente la otra queda sujeta a esta eleccin.
COMO DECLARAR VARIABLES EN R-ESTADISTICO

Las variables en estadstica son representaciones simblicas que


asumen diferentes valores. Para definirlas en R se presentan las
siguientes caractersticas
La variable puede
Comenzar con letras

Escritura en R

Llevar nmeros
Separar los valores y letras
por medio de puntos
Empezar con puntos.

> Estatura=150
> Estatura
[1] 150
> Ingresos2005=150000
> Ingresos2005
[1] 150000
> Estatura.nio.1=140
> Estatura.nio.1
[1] 140
> .Edad=15
> .Edad
[1] 15

Cuando se le pide a R ejecutar la accin la variable debe ser escrita tal


como se la declaro, por ejemplo la variable Ingresos2005 comienza con
mayscula si la digita todas en minsculas el programa emite un
mensaje de error.
> ingresos2005
Error: objeto 'ingresos2005' no encontrado

RECORDANDO LAS VARIABLES EN R


Existen momentos en que olvidamos las variables que se han declarado,
para tal caso se digita sobre la consola de R el comando ls( ).
> ls()
[1] "estatura"
"Ingresos2005"
[5] "nombre"

"Estatura"

"Estatura.nio.1"

Tambin existe el comando history( ), que permite ver las variables y las
operaciones que se han realizado con ellas en ventana flotante (ver
grfico 11)

Figura 7: ventana flotante del comando history( )

Pidiendo Ayuda:

R posee en idioma ingles una amplia ayuda en lnea que permite guiarse
en el camino de las diferentes operaciones que se estn realizando, para
ello se digita sobre la consola el comando?, seguido de la expresin que
se requiere ayuda. Por ejemplo pidamos ayuda del comando solve
?solve
starting httpd help server ... done

Inmediatamente enva a la pgina en donde aparece todo lo relacionado


con el comando solve. El entorno R tambin ofrece ayuda al usuario
mediante el men Ayuda en la barra de la ventana R Consola o en otras
ventanas especficas

GRAFICANDO FUNCIONES REALES EN R:


El grafico matemtico es una de los problemas que con mayor facilidad
resuelve el R-Estadstico. En R se pueden graficar, Funciones Lineales,
funciones cuadrticas, funciones polinmicas en general, funciones
exponenciales, etc.
Como ejemplo empecemos graficando la funcin cuadrtica
y 3 X 2 5 * X 16

Comandos en R

Resultado Grafico

curve(x^2-5*x+16,
-5, 10)

Bajo el mismo comando Curve, se pueden realizar curvas ms


complejas que en otro paquete se realizaran con dificultad, por ejemplo
el grafico de la tangente.
Comandos en R

Resultado Grafico

curve(tan, -2*pi,
2*pi)

EJERCICIOS PARA PRACTICAR EN R


1. Realice el grafico de las siguientes funciones:
y
a.

x2
x2 1

x2

2
x

y ln
b.

y 2 x 4 5 x3 3
c.

FRECUENCIAS:
Para comprender el concepto de frecuencia partimos de una situacin
real que a diario sucede en las aulas de clase con un grupo de
estudiantes de educacin primaria.
Un Profesor de geografa tienen registrado en su informe de logros la
informacin de 20 estudiantes con los siguientes resultados.
E

FRECUENCIAS

S
E
D
A

UNIDAD TRES
Los datos de los logros obtenidos se pueden registrar en la siguiente
tabla.

Logro No
La tabla muestra en
resultados

de

los D
de estudiantes que I
A
determinada
S
respecto
podemos E

de

estudiantes
4
3
5
5
3

forma organizada los


logros y la cantidad
alcanzaron

una

valoracin.

Al

decir:

4 estudiantes obtuvieron D en geografa


3 estudiantes obtuvieron I en geografa
5 estudiantes obtuvieron A en geografa
5 estudiantes obtuvieron S en geografa
3 estudiantes obtuvieron E en geografa
Esta lectura de la cantidad de estudiantes que alcanzaron una
valoracin determinada es lo que se llama FRECUENCIA. Al listado de
logros dispuestos en forma aleatoria se le llama distribucin de datos, a
la forma de organizarlos en una tabla se le denomina tabla de
frecuencias.

CLASES DE FRECUENCIAS
FRECUENCIA ABSOLUTAS: (f)
Resultan del conteo directo, de los datos que se repiten en una
distribucin. La suma de todas las frecuencias absolutas es el tamao de
la muestra.
fi = n
f = f1 + f2 + f3 + ... + fn = n; n es el tamao de la muestra.
Para nuestro ejemplo la tabla de frecuencias absolutas quedara.
Logro

s
D
I
A
S
E

4
3
5
5
3

20

Algunos datos de esta tabla tienen la siguiente lectura:


3 Estudiantes reaprobaron el examen con una valoracin de I
(Insuficiente)
5 Estudiantes aprobaron el examen con una valoracin de A (Aceptable)
3 Estudiantes aprobaron el examen con una valoracin de E (Excelente)

FRECUENCIAS ACUMULADAS:(F)
Se obtiene de la acumulacin sucesiva de las frecuencias absolutas. El
ltimo dato acumulado es el tamao de la muestra.
Su clculo se obtiene as:
F1 = 4
F2 = f1+f2 = 4 + 3 =7
F3 = f1 + f2 +f3 =4 + 3 + 5 = 12
F4 = f1 + f2 + f3 + f4 = 4 + 3 + 5 + 5 = 17
F5 = f1 + f2 + f3 + f4 + f5 = 4 + 3 + 5 + 5 + 3 = 20
En una tabla de frecuencias se observara as:

Logro

4
3
5
5
3
20

4
7
12
17
20

s
D
I
A
S
E

Algunos datos de esta tabla para las frecuencias acumuladas tienen la


siguiente lectura:
12 Estudiantes reaprobaron el examen con una valoracin inferior a A
7 Estudiantes presentan valoraciones inferiores a A.
FRECUENCIA ABSOLUTA RELATIVA: (h)

Corresponde a una porcin de

distribucin. Se

obtiene dividiendo la

frecuencia absoluta de cada dato entre el total de elementos que


conforman la muestra.

hi

f
n

La suma de todas las frecuencias relativas representa al 100% de la


poblacin y equivale a 1 (Uno).
h = 100% = 1
En nuestro ejemplo de referencia.
h1 = 4 / 20 = 0.2 = 20%
h2 = 3 /20 = 0.15 = 15%
h3 = 5 /20 = 0.25 = 25%
h4 = 5 /20 = 0.25 = 25%
h5 = 3/20 =0.15 = 15%
En una tabla de frecuencias se observara as:

Logro

s
D
I
A
S
E

4
3
5
5
3

4 0.2
7 0.1
12 5
17 0.2
20 5
0.2
5
0.1
5

20

Algunos datos de esta tabla tienen la siguiente lectura:


El 15% de los Estudiantes reaprobaron el examen con una valoracin de
I (Insuficiente)
El 25% de los Estudiantes aprobaron el examen con una valoracin de A
(Aceptable)
El 15% de los Estudiantes aprobaron el examen con una valoracin de E
(Excelente)
FRECUENCIAS RELATIVA ACUMULADAS: (H).
Se obtiene de la acumulacin sucesiva de las frecuencias relativas. El
ltimo dato acumulado es el 100% de la muestra.
Su clculo se obtiene as:
H1 = 0.2
H2 = h1+h2 = 0.2 + 0.15 =0.35
H3 = h1 + h2 +h3 =0.2 + 0.15 + 0.25 = 0.6
H4 = h1 + h2 + h3 + h4 = 0.2 + 0.15 + 0.25 + 0.25 = 0.85
H5 = h1 + h2 + h3 + h4 + h5 = 0.2 + 0.15 + 0.25 + 0.25 + 0.15 = 1
El ltimo dato acumulado equivale al 100% de la muestra. En una tabla
de frecuencias se observara as:

Logro
s

D
I
A
S
E

4
3
5
5
3

20

4
7
12
17
20

0.2
0.1
5
0.2
5
0.2
5
0.1
5
1

0.2
0.3
5
0.6
0.8
5
1

Algunos datos de esta tabla para las frecuencias relativas acumuladas


tienen la siguiente lectura:
El 60% de los estudiantes reaprobaron el examen con una valoracin
inferior a A
El 35% de los estudiantes presentan valoraciones inferiores a A.

EJEMPLO DE APLICACIN:
La siguiente distribucin de datos representa los salarios de 40
trabajadores de un colegio privado de la ciudad de Villavicencio en
donde se requiere que el docente trabaje bajo la figura de docente
catedrtico. Para el caso se asigna un valor por la hora trabajada de
acuerdo a un grado de escalafn emitido el ministerio de educacin
nacional.
Los valores de los salarios corresponden en miles de pesos.
30

25

20

40

28

35

40

25

45

20

40

30

15

30

25

20

50

50

50

30

50

15

30

45

40

15

20

28

35

40

30

15

20

45

50

15

10

20

28

30

La siguiente tabla muestra los datos organizados con su respectiva


frecuencia. La interpretacin de algunos datos queda como tarea para el
estudiante.
SALARIOS
(En miles de $)
10
15
20
25
28
30
35
40
45
50

1
5
6
3
3
7
2
5
3
5
40

1
6
12
15
18
25
27
32
35
40

0,025
0,125
0,15
0,075
0,075
0,175
0,05
0,125
0,075
0,125
1

0,025
0,15
0,3
0,375
0,45
0,625
0,675
0,8
0,875
1

FRECUENCIAS PARA DATOS REALES: (Distribuciones para Datos


agrupados)
El pagador de un colegio ha organizado una pequea cooperativa de
ahorro para docentes la participacin es libre y voluntaria. La siguiente
tabla muestra los ahorros de 25 docentes.
200

190

150

148

152

158

100

174

187

188

160

178

153

151

128

137

174

199

103

168

188

127

150

130

175

El dato ms pequeo es 100 y el mayor es 200 Entre estos dos valores


es difcil saber si los dems datos se encuentran ms cerca del 100 o del
200 La dificultad radica en que los datos no se encuentran organizados.
Para ello establezcamos un orden en los datos propuestos.
100

137

152

174

188

103

148

153

174

188

127

150

158

175

190

128

150

160

178

199

130

151

168

187

200

Como los datos corresponden al ahorro de


ponerlos

en

orden

de

tamao

no

diferentes profesores, al

estamos

perdiendo

ninguna

informacin de importancia. Si los datos correspondieran a un cdigo u


orden estipulado, se perdera informacin valiosa.

Hay una tcnica un poco ms sofisticada para acomodar los datos y


poder apreciar la forma en que se encuentran repartidos, denominada:
TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS.
Para determinar las frecuencias para datos agrupados se debe seguir los
siguientes pasos que involucran clculos matemticos y la utilizacin de
algunas formulas de aproximacin utilizada en forma reiterada por
muchos autores y con las cuales nos identificaremos en este curso de
estadstica.
RANGO:
Es el dato calculado mediante la diferencia entre el dato mximo y
mnimo.
R = Xmax Xmin
Para el ejemplo propuesto
R = 200 - 100 = 100
NMERO DE INTERVALOS:
Representado por la letra m y se define mediante la formula.
m = 1 + 3,3*log(n)
Donde n es el tamao de la muestra. El nmero de intervalos no puede
ser inferior a 5 ni superior a 16.
5 m 16
n
Algunos utilizan la formula m =
La aproximacin de m se puede hacer por defecto o por exceso

m = 1 + 3,3*log(25) 5.6
Aqu m se puede trabajar con 6 y seria una aproximacin por exceso, o a
5 y seria una aproximacin por defecto.
AMPLITUD DEL INTERVALO:
Determina la distancia que existe entre un dato y otro, se simboliza por
C, depende del criterio establecido para presentar la informacin, puede
variar la amplitud en cada intervalo, pero se recomienda tener a C
constante a lo largo de toda la distribucin de frecuencias, se calcula
mediante las formula.

C=

X max X min
m

Rango
m

100
6 = 17

Los intervalos de clase se clasifican como:


INTERVALOS APARENTEMENTE NOMINALES:
Son los intervalos utilizados en la clase que utilizamos, tal como resulta
en el clculo de la amplitud C
INTERVALOS REALES:
Se obtienen a partir de los lmites de los Intervalos nominales restando
0,5 al lmite inferior y sumando 0,5 al lmite superior en todas las clases.
Para tal caso se redefine el rango haciendo
Rango = C * m
Y se compara con el rango original,

Si la diferencia es de 2 unidades o decimales se puede restar solo al


dato menor el excedente y se trabaja con limites reales, si la diferencia
es mayor a 2 se resta 2 al dato menor y se suman el resto al dato mayor
con el objetivo de equilibrar la diferencia dada por el nuevo rango.
Para nuestro caso tenemos que:
Rango= 17*6 = 102
Rango original = 100
Diferencia con el nuevo rango = 2
Xmin 2 = 98
Entonces la distribucin organizada en intervalos, tomara la siguiente
forma:
Ahorros
f
98.5 _ 115 2

F
2

h
0.08

H
0.08

115.5
132.5
149.5
166.5

3
2
7
5

5
7
14
19

0.12
0.08
0.28
0.2

0.2
0.28
0.56
0.76

183.5_ 200 6

25

0.24

Total

_
_
_
_

132
149
166
183

25

FRECUENCIAS PARA DATOS ENTEROS: (Distribuciones para Datos


no agrupados)
Corresponde a una organizacin de los datos en donde se recurre a la
formacin de intervalos. Por lo general se trabaja para datos enteros.
Cuando los datos continuos son menos de 20 se pueden organizar como
datos no agrupados.
EJEMPLO.

A la rectora del colegio han llegado 15 cajas con libros de diferentes


editoriales para ser revisados y evaluados por los docentes. El
encargado de abrir las cajas es el rector del colegio. El deber
seleccionar los libros por reas para entregarlos a los respectivos
profesores. En el transporte de los libros desde la editorial hasta la
rectora sufrieron algunos daos. Los siguientes datos representan las
cajas y la cantidad de libros que se han daado por caja.
C1=1

C2=2

C3=0

C6=3

C7=1

C8= 4

C11=0

C12=3

C13=1

C4=5

C5=2

C9=3

C10=1

C14=0

C15=5

El rector del colegio desea brindar un informe detallado a los profesores


sobre el estado de los libros. El profesor de estadstica le brinda la
siguiente tabla de frecuencias para que el informe sea ms claro y
sencillo.
No de Libros No

de F

3
7
9
12
13

0.2
0.26
0.13
0.2
0.06

0.2
0.46
0.59
0.79
0.58

15

6
6
0.13 1
1

defectuosos cajas
0
1
2
3
4
5

f
3
4
2
3
1
2
15

IMPORTACION DE LOS DATOS DE EXCEL


Lo primero es orientar la direccin de los datos a analizar hacia una
carpeta de trabajo ubicada en nuestro disco duro. Para este caso la

carpeta recibe el nombre de ArchivoCompendio. La figura orienta el


proceso de dicho direccionamiento.

En data deben estar ubicados los archivos vlidos y que pueden ser
llevados a R. Una vez cambiado el directorio para el reconocimiento de la ruta, el
archivo que se quiere exportar de Excel se le debe guardar como texto delimitado
por tabulaciones en la carpeta destino. Los comandos para exportar son:
Comandos en R

Resultado de la tabla

datos=read.delim("Tasas.txt")
attach(datos)
datos

Tal como aparece en R los datos exportados bajo el comando read.delim,


no es posible aun acceder a estos datos. El comando attach () facilita
dicho acceso de tal manera que se pueden hacer operaciones
directamente desde el programa. Ahora que los datos estn atachados es
posible traerlos mediante la opcin editar del men y editor de datos.

Al digitar esta opcin nos

lleva

una

ventana en donde se digita el nombre de la tabla que se quiere editar y corregir


datos.

Con esto ya se tiene la tabla en donde se pueden hacer todas las correcciones
pertinentes.

IMPORTACION DE ARCHIVOS TXT

Si los datos no se encuentran en un archivo Excel, se pueden grabar en un


archivo txt, en la carpeta destino de trabajo. Los archivos txt tiene el siguiente
aspecto

En R, se pueden visualizar con los siguientes comandos

Comandos en R

Resultado de la tabla

datos=read.table("Nombres.txt")
attach(datos)
datos

EJERCICIOS DE APLICACION
Ejercicio 1
En las aulas del colegio ha brotado un virus. La alcalda en compaa con
el hospital de la regin han levantado un estudio para evitar que el virus
se expanda en toda la comunidad. La droga que ataca el virus requiere
de una dosis que esta sujeta a un peso. Con el objetivo de obtener un
peso promedio y brindar la dosis adecuada a todos los estudiantes se ha
tomado una muestra de 20 estudiantes y se obtuvieron los siguientes
resultados.
30,3 32,1 50,2 52,3 34,2 36,4 54,2 56,3 38,1 40,2
58,2 60,4 42,3 43,3 62,5 64,1 45,2 46,3 65,2 67,3
Determine para el problema una tabla de frecuencia para datos
agrupados y realice interpretacin de algunos resultados, de la misma
manera llvelos a un archivo txt y crguelos en el programa R.
Ejercicio 2
Los siguientes datos representan 50 (en miles de pesos) salarios de los
empleados de la secretaria de educacin. Para tal distribucin de datos
realizar la tabla de intervalos de clase.
50

300

178

320

350

280

145

220

145

220

200

400

392

235

289

400

230

400

220

256

100

400

270

187

400

175

400

189

100

187

120

180

125

248

400

300

178

256

400

200

150

230

280

300

220

276

235

400

386

400

De

la misma manera llvelos a un archivo txt y crguelos en el

programa R
Ejercicio 3
Complete el siguiente cuadro
Intervalos

Intervalos con f

de Clases
20 _ 24

limites reales

3
2
5
3
4
1
2
3
2

_56
Total

Cuando el cuadro este completo realice cargue la tabla desde un archivo


Excel.
Ejercicio 4
Un corto circuito dao dos monitores de la sala de sistemas del colegio,
se consult en 30 almacenes de la ciudad el precio de monitores para
computador y se obtuvo los siguientes resultados en miles de pesos.
100

101

120

115

130

150

112

145

138

121

126

115

140

137

143

118

147

149

150

115

100

127

135

149

146

137

122

118

135

129

Elabore

una

distribucin

de

frecuencias,

para

datos

agrupados,

indicando los valores de los lmites reales. De la misma manera llvelos


a un archivo txt y crguelos en el programa R.