Documentos de Académico
Documentos de Profesional
Documentos de Cultura
APUNTES SOBRE ESTADISTICA Junio 2010 PDF
APUNTES SOBRE ESTADISTICA Junio 2010 PDF
Santo domingo, D. N.
Junio 2010
I. INTRODUCCION
2. Estudios por Muestreo: Son estudios en los cuales solo se estudia una
parte de la población, es decir una muestra. Los estudios por muestreo tienen
las ventajas de que proporcionan información útil y confiable sobre una
1
William Dillon, Thomas J. Madden y Neil H. Firtle: “La Investigación de Mercados. Entornos de
Marketing”
Las fuentes secundarias son aquellas en las cuales los datos se encuentran
publicados en forma de reportes. Las fuentes de datos secundarias pueden ser
externas o internas. Las fuentes secundarias internas son aquellas en las
cuales los reportes son el resultado del registro de las actividades de quien
lleva a cabo la investigación, en cambio las fuentes secundarias externas son
aquellas en las cuales los datos se encuentran en reportes o publicaciones
realizados por entidades ajenas a quien o quienes realizan la investigación.
En cada una de estas variables tendremos una medición en cada uno de los
elementos estudiados, así por ejemplo, para la edad nos referiremos a los años
cumplidos y por lo tanto tendremos medidas numéricas, (23, 21, 19, 35,…..),
para la variable sexo podríamos asignarle un número por ejemplo uno para
masculino y dos para femenino o viceversa, pero de igual forma podríamos
asignarle una letra, M para los masculinos y F para las femeninas o un símbolo
para diferenciar cada sexo, de la siguiente manera ♂ para los masculinos y ♀
para las femeninas
2
Wayne W., Daniel & James C. Terrell: “Estadística para Administración y Economía” Tomo I. Editora
McGraw-Hill. 7ª. Edición. Junio 2000.
servicios como muy malos y cinco una percepción de que los servicios son
excelentes.
Análisis y Recolección
presentación de datos
Procesa-
miento
Aunque estos pasos pueden y varían atendiendo a los criterios del investigador
en términos generales estos pasos representan el proceso lógico de una
investigación aunque reciban diferentes nombres. A continuación se hace una
descripción breve de cada uno de estos.
3
Ver a Lincoln L. Chao: “Estadística para las Ciencias Administrativas.” Tercera Edición. Editora
McGraw-Hill
1. Nombre y apellidos del estudiante Rodolfo Peña 1. Nombre y apellidos del estudiante Raúl Arias
2. Edad 15 2. Edad 12
4. Con quien vive el estudiante: Con padre y madre 4. Con quien vive el estudiante: con ambos padres
1. Nombre y apellidos del estudiante Paola Moción 1. Nombre y apellidos del estudiante: Yordi González
2. Edad 10 2. Edad 11
4. Con quien vive el estudiante Tía 4. Con quien vive el estudiante: con la madre
1. Nombre y apellidos del estudiante Ashley Ciprián 1. Nombre y apellidos del estudiante Vicente Mejía
4. Con quien vive el estudiante ambos padres 4. Con quien vive el estudiante con la madre
1. Nombre y apellidos del estudiante Cándida Beatriz 1. Nombre y apellidos del estudiante Manuel Fontana
4. Con quien vive el estudiante ambos padres 4. Con quien vive el estudiante con una tía
1. Nombre y apellidos del estudiante Charly Cepeda 1. Nombre y apellidos del estudiante Helena Parache
4. Con quien vive el estudiante ambos padres 4. Con quien vive el estudiante con ambos padres
En el caso que nos ocupa para la organización podemos por ejemplo asignar un
número a cada instrumento completado. Para la codificación, el trabajo se
reduce significativamente, ya que el instrumento diseñado tiene cada pregunta
pre-codificada, por ejemplo, para el sexo se le asigna el número uno a los de
sexo masculino y el dos a las de sexo femenino, de igual forma a los y las
estudiantes de escuelas públicas se le asigna el número uno y los y las de
colegios privados el número dos.
asignados son: el número uno para los y as que viven con ambos padres,
(padre y madre), el dos para los y las que viven solo con la madre, el tres para
los y las que viven solo con el padre y el cuatro para los y las que viven con
otro familiar.
Para la digitación se podría colocar los datos en una matriz, colocando cada
variable en las columnas y cada fila para los elementos estudiados. En este
caso vamos a utilizar la hoja de cálculo de Excel para la digitación como se
muestra en la figura número cinco. (Es preciso aclarar que existen numerosos
programas en los que se puede hace la digitación, se ha elegido el Excel por la
disponibilidad y facilidad del mismo)
El proceso de edición de los datos sería imprimir los datos digitados y luego
verificar si el proceso de digitación se ha hecho correctamente.
2.7 Anexos: en esta parte del informe se incluye toda información que sea
relevante para el estudio que se realiza y que por alguna razón no se incluyó en
el cuerpo del trabajo, por ejemplo cuadros, copia del o los instrumentos de
recolección de datos utilizados, cronograma de actividades, fotografías, copias
de artículos, de leyes, entre otros.
Se x o d e l o s e s t u d i a n t e s d e Es t -x x x , s e c c i ó n
00
26.5%
73.5%
MASCU LIN O F EMEN IN O
Por ejemplo, al
observar un recibo Comparación mensual de su consumo
de la facturación 700
de la electricidad,
600
se muestra un
gráfico como el que 500
vemos a nuestra 400
derecha,
300
observamos como
ha variado el 200
consumo, si se ha 100
consumido más o
0
se ha consumido
Abr May Jun Jul Ago Se p Oct Nov Dic Ene Fe b Mar Abr
menos.
Ahora podemos fijarnos una idea más acabada sobre el rendimiento de los y
las estudiantes de las escuelas públicas y privadas, por ejemplo, observamos
que más de un tercio tiene un rendimiento promedio inferior a los 70.0
puntos, que solo cinco de los 133 estudiantes estudiados tienen un
rendimiento superior a 90.0 puntos y así sucesivamente.
Los datos que provienen de un censo, una encuesta por muestreo, diseño
experimental y aquellos que provienen de fuente secundarias que no han sido
agrupados o condensados, como por ejemplo la revisión de un expediente
clínico, se presentan en la mayoría de los casos en una Distribución de
frecuencia, ya sea para una o para múltiples variables. Una distribución de
frecuencia es un arreglo matricial, (arreglo de filas y columnas) donde se
presenta los valores o atributos de una variable y su respectivas frecuencias.
Para estos datos, el dato masculino, (M) se repite 11 veces por lo tanto esa es
su frecuencia y el dato femenino, (F) se repite 39 veces, que es su frecuencia.
2.3.1 Frecuencia absoluta simple, (fi): se define como el número de veces que
se repite un dato u observación. Comúnmente se le denomina con el nombre de
frecuencia. Por ejemplo, en el cuadro anterior el dato masculino tiene una
frecuencia absoluta simple de 11, mientras que el dato femenino presenta una
frecuencia absoluta simple de 39.
Calificación
≤ 12.0
12.0 – 13.9
14.0 – 15.9
16.0 – 17.9
18.0 – 20.0
TOTAL
Calificación fi
≤ 12.0 11
12.0 – 13.9 10
14.0 – 15.9 10
16.0 – 17.9 12
18.0 – 20.0 7
TOTAL 50
Calificación fi %
≤ 12.0 11 22.0
12.0 – 13.9 10 20.0
14.0 – 15.9 10 20.0
16.0 – 17.9 12 24.0
18.0 – 20.0 7 14.0
TOTAL 50 100.0
Calificación fi % FA
≤ 12.0 11 22.0 11
12.0 – 13.9 10 20.0 21
14.0 – 15.9 10 20.0 31
16.0 – 17.9 12 24.0 43
18.0 – 20.0 7 14.0 50
TOTAL 50 100.0
Calificación fi % FA FRA
Una vez que han calculado las frecuencias se procede a completar el cuadro
de manera adecuada, es decir, poner el título, se elimina la columna del
conteo, (si se ha incluido), y se coloca la fuente de los datos.
El dato menor que aparece en los datos es el valor cero y el mayor es el cinco
de forma tal que esta variable en esta muestra toma seis valores diferentes:
cero, uno, dos, tres, cuatro y cinco. Para organizar los datos en una
distribución de frecuencia simple o tipo I colocamos los diferentes valores de
2.5.3 Distribución Frecuencia con Clase o Tipo II: Este tipo de distribución
se utiliza para variables cuantitativas continuas y para aquellas variables
cuantitativas discretas, cuyo rango de valor sea mayor de diez.
Los pasos que se presentan a continuación son solo una guía de cómo
organizar los datos en una distribución de frecuencia con clase, puesto que la
forma de presentar los datos muchas veces depende de lo que se quiera
mostrar en la distribución. Pero cuando no se tiene una idea de cómo agrupar
los datos, los siguientes pasos son una buena guía y estos pasos son:
RV = Xmayor - Xmenor
RV
Ï , n representa el total de datos o tamaño de la muestra
1 (3.322x log n)
3. Establecer los límites de cada clase: para establecer los límites de cada
clase o intervalo, se inicia con el dato menor y se le suma el intervalo y así se
continúa hasta llegar al dato mayor observado. Es importante tener en
consideración que los límites se deben establecer de forma excluyentes, esto es,
que los valores en los límites no deben ser iguales, por ejemplo, si una clase va
de 30 a 40, como el 40 no va incluido en esa clase lo aconsejable es establecer
como limite superior el resultado de la suma disminuido en una unidad, lo que
nos daría una clase con los siguientes límites; 30 a 39, así, la siguiente clase
iniciaría con 40 y de esta forma los valores del límite superior de una clase y el
inferior de la siguiente no van a ser iguales.
4
Herbert A. Sturges: “The Choice of a Class Interval”, Journal of the American Statistical
Association. Marzo 1926
Ejemplo:
21 24 33 29 35 26 26 25 44 32
40 21 31 28 20 26 21 33 32 41
22 20 22 23 43 50 47 45 26 38
26 22 24 39 38 35 20 46 20 25
Iniciamos con los cinco pasos para construir una distribución de frecuencia
con clase:
1. Rango de la variable:
RV = Xmayor - Xmenor
RV = 50 – 20
RV = 30
RV
2. Ï
1 ( 3 . 322 log n )
30 30 30 30
Ï 4.75 5
1 (3 .322 log 40 ) 1 (3.322 1.6021) 1 5.3221 6.3221
EDAD
20-24
25-29
30-34
35-39
40-44
45-50
Obsérvese que la primera clase inicia con el 20 que es el dato menor y termina
en 24 ya que el intervalo de la distribución es de cinco. El lector podrá
preguntarse porque la primera la clase no termina en 25 que es resultado de
sumar el intervalo al dato menor y la respuesta es que el 20 como dato menor
va incluido en el intervalo de la clase y si contamos teneos 20, 21, 22, 23 y 24
que son los cinco valores del intervalo.
También se puede decir, que el 90.0% de las personas que asistieron al estreno
de la película tienen menos de 45 años.
Para este caso tenemos un total de 29 personas con menos de 38 años, luego el
porcentaje de persona con menos de 38 años es de (29/40)*100, es decir
72.5%
26 36 33 19 28 26 20 22 8 30 30 20 5 34
20 25 29 40 17 32 20 6 18 31 19 4 19 32
20 17 6 28
2.75 3.53 2.42 3.00 3.85 3.71 2.25 2.96 3.00 3.00
3.50 3.06 3.09 2.22 2.47 3.20 3.02 2.00 2.05 3.60
24 44 38 22 29 27 48 31 30 27 21 37 42
39 38 16 32 28 60 10 23 12 17 24 18
Yi
Xi Y1 Y2 Y3 TOTAL
X1 C11 C12 C13 Total X1
X2 C21 C22 C23 Total X2
X3 . . . .
X4 . . . .
X5 C51 C52 C53 Total X5
Total
TOTAL Total Y1 Total Y2 Total Y3
general
El cuadro indica dos renglones para el total, esto es debido a que estamos
presentando solo dos variables, así, en el total de la última fila representa el
En las celdas que se forman, se colocarán los datos que tienen las dos
características del cuadro. Por ejemplo, en la celda C 11, se colocan los
elementos que son comunes a X1 y a Y1, en la columna C12 se colocan los
elementos que son comunes a X1 y a Y2 y así sucesivamente.
Para este caso tenemos dos variables, una variable cuantitativa, (calificación
matemática) y una cualitativa, (sexo de los/as estudiantes). La variable sexo
tiene dos categorías, masculino y femenino, y la calificación en matemática es
continua y su rango es mayor de 10 por lo tanto hay que hacer una
distribución con clases. Para ello vamos a dividir esta variable en cuatro
categorías, los estudiantes con menos de 70 puntos, los que tienen entre 70 y
80 puntos, los que tienen entre 80 y 90 y los que tienen 90 o más puntos.
Luego de esta clasificación el cuadro queda como se ilustra a continuación:
Sexo
Calificación Masculino Femenino Total
60 - 69 /// ///
70 - 79 ///////////// ///
80 - 89 // /////
90 - 100 /
Total
Preguntas
Ejercicio:
Con los datos que se presentan en la tabla siguiente crear un pequeño reporte
indicando la relación entre el rendimiento académico y el sexo de los
estudiantes, entre el número de asignatura por sexo, así como el gasto en
transporte por sexo y número de asignaturas cursadas. Finalmente incluya un
pequeño análisis de la relación entre la edad de los estudiantes y el número de
asignaturas cursadas.
Para el índice académico divida esta variable en tres categorías, los que tienen
menos de 75 puntos, los que tienen entre 75 y 80 puntos y los que tienen más
de 80 puntos. En el caso del número de asignaturas, divídala en tres
categorías, los que cursan menos de cuatro asignaturas, los que están
cursando cuatro asignaturas y los que cursan más de cuatro.
Para la edad divida esta variable en tres categorías, los que tienen entre 20 y
23 años, los que están entre 24 y 27 años y los que tienen de 28 y más años.
En el caso del gasto en transporte haga una división en categorías, si lo
considera necesario y ser así, divida la variable a su conveniencia.