Está en la página 1de 38

Apuntes sobre Estadística

APUNTES SOBRE ESTADISTICA


(Borrador para corrección)

Héctor Medina Disla

Santo domingo, D. N.
Junio 2010

Elaborado por H. Medina Disla. Junio 2010. 1


Apuntes sobre Estadística

I. INTRODUCCION

Estadística: Es una metodología científica que permite recolectar, organizar y


procesar datos que proporcionen información que sirvan de base para la
toma de decisión. Por ejemplo aplicar una encuesta para conocer la preferencia
del electorado, aplicar un tratamiento especial a un grupo de personas y
observar el resultado, buscar datos sobre la matrícula estudiantil, u otro tema
en particular. En cambio, cuando hablamos de Estadísticas nos referimos a
un conjunto de medidas o indicadores que describen el comportamiento de
un fenómeno de interés en un momento determinado. Por ejemplo, el
porcentaje de lectores que prefieren a un candidato en particular, el tiempo
necesario para realizar unas tarea, las unidades producidas diariamente por
una empresa, las ventas de una empresa, etc.

Es decir que las estadísticas representan el fin u objetivo que buscamos y


la Estadística el medio para conseguirlo.

1.1 DIVISION DE LA ESTADISTICA

La Estadística como metodología científica se divide en dos ramas, la


Estadística Descriptiva y la Estadística Inferencial

Estadística Descriptiva: Es un conjunto de métodos y técnicas que


permiten describir un conjunto específico de datos. La Estadística Descriptiva
como su nombre lo indica, describe un grupo particular. Sus principales
herramientas son.
1) Cálculo de porcentaje y tasas
2) Presentación tabular, (cuadros y tablas)
3) Presentación gráfica
4) Cálculo de medidas de Medidas de Tendencia Central, (promedios)
5) Cálculo de medidas de dispersión o variabilidad
6) Cálculo de números índice.
7) Otras técnicas descriptivas.

Estadística Inferencial: Se refiere a un conjunto de métodos y técnicas que


permite obtener información acerca de una población completa, con solo
estudiar una parte de ella (muestra). La Estadística Inferencial nos permite
llevar los resultados obtenidos en una muestra a la población. Sus principales
herramientas son: Cálculo de probabilidades, muestreo y distribución
muestral, estimación, prueba de hipótesis, análisis de varianza, análisis de
regresión y correlación, otras.

1.2. Conceptos y Definiciones

Elaborado por H. Medina Disla. Junio 2010. 2


Apuntes sobre Estadística

1. Población: Es un conjunto de elementos con características parecidas o


similares y que son de interés para la realización de un estudio. En términos
estadísticos una población se define de acuerdo a lo que se desea investigar o
estudiar. Por ejemplo si queremos conocer el rendimiento escolar de los/as
niños/as de la educación básica, entonces nuestra población va a estar
definida por la cantidad de niños/as inscrito en los curso de la educación
básica o si queremos evaluar la calidad de la producción de una empresa,
nuestra población estará formada por todas las unidades producidas por la
empresa durante el periodo de interés.

Muestra: Es un subconjunto de la población que se toma para fines de


desarrollar una investigación. Cuando un estudio se hace a partir de una
muestra, esta debe ser representativa y significativa.

Se dice que una muestra es representativa cuando los elementos que


componen dicha muestra contienen las mismas características que los
elementos en la población de la cual se tomó dicha muestra, el concepto de
representatividad se refiere a los aspectos cualitativos de la muestra. Por
ejemplo si quisiéramos conocer la preferencia política de los estudiantes de la
UASD una muestra sería representativa si en la misma se incluyen estudiantes
de todas las edades, de todas las carreras, de ambos sexo, de todos los centros
regionales, etc. de forma tal que al observar la muestra es como si
observáramos la población en miniatura.

Por su parte el concepto de significación tiene que ver con la cantidad de


elementos que conforma la muestra. En este sentido, no existe un número de
elementos específico para que una muestra sea significativa, sino, que la
cantidad de elementos necesarios para que la muestra sea significativa varía
de acuerdo a la características de la población. Si la población a estudiar es
muy variable, se requerirá de un mayor número de elementos para que la
muestra sea significativa que si la población tiende a ser homogénea, en cuyo
caso un muestra pequeña puede ser significativa.

2. Parámetro: Es una medida de referencia la cual se calcula a partir de


datos de una población completa. El parámetro se refiere a la medida de una
variable en la población. Por ejemplo, cuando se aplican las Pruebas
Nacionales y se obtiene el promedio de las calificaciones, esta medida es un
parámetro de las calificaciones de los estudiantes.

3. Estimador o Estadígrafo: Es una medida calculada a partir de los datos


obtenidos en una muestra y se utiliza para estimar el valor del parámetro, ya
que en la mayoría de los casos, se hace difícil y muy costoso conocer el valor
real o verdadero de la variable. Por ejemplo cuando se toma una muestra para
conocer la preferencia política de la población, los porcentajes que se obtienen
a partir de la encuesta son estimadores del porcentaje de real de preferencia de
todos/as las votantes.

Elaborado por H. Medina Disla. Junio 2010. 3


Apuntes sobre Estadística

1.3 FUENTES DE DATOS

Ya se ha dicho que la Estadística es una metodología científica que permite


obtener datos que al ser procesados se convierten en estadísticas o indicadores
relacionados a una o múltiples variables. Podemos decir entonces que el
quehacer de la Estadística se centra en dar respuestas a una serie de
preguntas o interrogantes que surgen en un momento determinado sobre un
tema en particular, por ejemplo, ¿Cuál es la bebida gaseosa preferida por la
población?, ¿por qué las personas prefieren un banco en particular para
depositar sus ahorros?, ¿qué porcentaje de la producción está saliendo
defectuoso?, ¿cuál será el nivel de precios para el próximo semestre?, ¿Cómo
podemos motivar a los/as estudiantes?, ¿cuál método de enseñanza es más
efectivo para lograr el aprendizaje en los/as estudiantes? y así sucesivamente.

Para dar respuestas a estas preguntas debemos recurrir a la búsqueda de


datos y en tal sentido debemos de responder a las siguientes preguntas ¿cuáles
son las fuentes para obtener datos? O ¿de donde obtendremos datos para dar
respuesta a nuestra pregunta?

En primer lugar vamos a clasificar las fuentes de datos atendiendo al origen de


los datos y en este sentido las fuentes de datos pueden ser primarias y
secundarias. Las fuentes de datos primarias son aquellas en las cuales los
datos son generados por quien o quienes realizan la investigación, es decir que
son datos de primera mano, hechos “a la medida” como lo señala Dillon1, es
decir que las fuentes primarias se utilizan para cubrir una necesidad de
información específica.

1.3.1 Fuentes primarias de datos

Las principales fuentes primarias de datos son el Censo, La Encuesta o


Estudios por Muestreo y Los Experimentos.

1. Censo: Es un tipo de investigación en la cual se estudian todos los


elementos de una población determinada. El censo tiene las ventajas de que
proporciona información sobre una población completa, con un bajo
margen de error y además permite la ubicación física de cada uno de los
miembros de la población. Tiene la desventaja de que resulta muy costoso en
términos económicos, de tiempo y de materiales.

2. Estudios por Muestreo: Son estudios en los cuales solo se estudia una
parte de la población, es decir una muestra. Los estudios por muestreo tienen
las ventajas de que proporcionan información útil y confiable sobre una

1
William Dillon, Thomas J. Madden y Neil H. Firtle: “La Investigación de Mercados. Entornos de
Marketing”

Elaborado por H. Medina Disla. Junio 2010. 4


Apuntes sobre Estadística

población en corto tiempo y además resultan menos costosos que un censo.


Tienen las desventajas de que no proporcionan información sobre la ubicación
física de de los elementos de una población y de que si no se diseña de manera
adecuada puede proporcionar información distorsionada sobre el
comportamiento del fenómeno que se está estudiando.

3. Experimentos: Son estudios especializados en los cuales un grupo de


elementos de la población es sometido a un tratamiento o condición especial y
los resultados obtenidos con dicho tratamiento se comparan con los
resultados de otro grupo que no ha sido sometido al tratamiento o con los del
mismo grupo cuando no ha sido sometido al tratamiento o condición especial.
El grupo sometido al tratamiento recibe el nombre de grupo experimental y el
grupo con el cual se comparan los resultados recibe el nombre de grupo de
control.

El objetivo principal de los diseños experimentales es conocer el efecto que


tiene en la población estudiada la exposición de esta a un tratamiento o
condición especial.

1.3.2 Fuentes secundarias de datos

Las fuentes secundarias son aquellas en las cuales los datos se encuentran
publicados en forma de reportes. Las fuentes de datos secundarias pueden ser
externas o internas. Las fuentes secundarias internas son aquellas en las
cuales los reportes son el resultado del registro de las actividades de quien
lleva a cabo la investigación, en cambio las fuentes secundarias externas son
aquellas en las cuales los datos se encuentran en reportes o publicaciones
realizados por entidades ajenas a quien o quienes realizan la investigación.

Las principales fuentes secundarias de datos son los registros internos de la


empresa y los reportes de datos de otras organizaciones o externos.

1. Registros internos de la organización: son fuentes secundarias de


datos y se refieren al conjunto de datos que se origina como resultado
del registro continuo y sistemático de las actividades de una
organización.
2. Reportes de datos externos: es un conjunto de datos que pueden ser de
interés para dar respuesta a nuestras interrogantes y que han sido
generado por organizaciones o entidades externas a quien realiza la
investigación.

Los registros externos como fuente de información tienen las ventajas de


que son de fácil acceso, tienen un costo más bajo que las demás fuentes de
datos y además están disponibles en el momento requerido. Tienen la
desventaja de que quien realiza la investigación no dispone de los
mecanismos de control para garantizar la calidad y la confiabilidad de los

Elaborado por H. Medina Disla. Junio 2010. 5


Apuntes sobre Estadística

datos incluidos en los reportes, así como el formato y la cantidad de datos


existentes no siempre se corresponde con los requeridos por el investigador.

1.4 VARIABLES Y SU CLASIFICACIÓN

Una Variable es una característica que puede variar de un elemento a otro en


la población estudiada. Ejemplos: peso corporal de las personas, tamaño las
aulas universitarias, estatura de las personas, número de asignaturas
cursadas por los estudiantes por semestre, etc.

Las variables se dividen en dos grupos: Cualitativas y Cuantitativas

Variables cualitativas: son aquellas variables que describen una cualidad o


atributo en el elemento estudiado, estas variables responden la pregunta
¿cuál?, ejemplos de estas variables pueden ser: religión que profesan los
dominicanos, partido político preferido, color de la piel, sexo de los y las
estudiantes, raza, carrera estudiada, etc.

Variables cuantitativas: son aquellas variables que describen una cantidad


en el elemento estudiado. Las variables cuantitativas responden la pregunta
¿cuánto?, por ejemplo: número de estudiante por aula, venta diaria de una
empresa, número de hijos por familia, estatura de los estudiantes que cursan
estadística en este semestre, etc.

Las variables cuantitativas se dividen en dos categorías: Continuas y


discontinuas o discretas.

Variables cuantitativas continuas: son aquellas variables cuantitativas


cuyos resultados pueden expresarse en números fraccionarios o decimales.
Estas variables provienen de un proceso de medición, por ejemplo el nivel
de ingreso de las personas, consumo familiar, estatura de las personas, gasto
diario de los estudiantes, etc.

Variables cuantitativas discontinuas o discretas: son aquellas variables


cuantitativas cuyos resultados se expresan en números enteros, es decir que
no admiten valores decimales. Las variables cuantitativas discontinuas o
discretas provienen de un proceso de conteo, por ejemplo número de
asignaturas por estudiante, número de estudiantes por aula, número de
personas que llega a un restaurante de comida rápida, etc.

Obsérvese que las variables cuantitativas continuas pueden expresarse en


número fraccionarios y las discretas o discontinuas se expresan en números
enteros, por lo que, aunque en muchas ocasiones expresamos una variable en
número enteros, no significa que sea discreta, por ejemplo, el gasto en
transporte, mayormente lo expresamos en número entero, sin embargo, es una

Elaborado por H. Medina Disla. Junio 2010. 6


Apuntes sobre Estadística

variable continua, pues el resultado admite valores fraccionarios, pero el


número de asignaturas cursada por ejemplo solo se expresa en número enteros
pues no admite valores fraccionarios.

1.5 MEDICION Y ESCALA DE MEDICIÓN

Daniel2 señala “cuando la mayoría de las personas escuchan o leen la palabra


medición piensan en actividades tales como usar cintas métricas para
determinar la longitud, anchura o circunferencia de algún objeto, pesar un
objeto o persona, y determinar el volumen de alguna sustancia como cuando
un cocinero mezcla las cantidades de ingredientes específicas de una receta. A
la palabra medición, sin embargo, puede dársele una definición más científica
que la acostumbrada”

En efecto la medición va más allá de determinar cantidad, longitud, volumen o


cualquier otra medida de interés. En el ámbito de la Estadística cuando nos
referimos a medición llegamos un poco más profundo, así por ejemplo
hablamos de la medición de la personalidad, de la medición de los niveles de
tolerancia, los niveles de preferencia por un servicio o un producto, etcétera.

Para el desarrollo de este curso enteremos por Medición al proceso mediante el


cual se le asigna un numeral (número, letra o símbolo) a una variable. Por
ejemplo si estamos realizando una investigación sobre las características de la
población estudiantil podremos incluir variables como la edad, el sexo, el
número de asignaturas cursadas el gasto diario, percepción sobre los servicios
de la biblioteca, las asignaturas más preferidas y muchas otras variables.

En cada una de estas variables tendremos una medición en cada uno de los
elementos estudiados, así por ejemplo, para la edad nos referiremos a los años
cumplidos y por lo tanto tendremos medidas numéricas, (23, 21, 19, 35,…..),
para la variable sexo podríamos asignarle un número por ejemplo uno para
masculino y dos para femenino o viceversa, pero de igual forma podríamos
asignarle una letra, M para los masculinos y F para las femeninas o un símbolo
para diferenciar cada sexo, de la siguiente manera ♂ para los masculinos y ♀
para las femeninas

De igual forma para la variable número de asignaturas de registraría el número


que representa la cantidad de asignaturas inscrita, por ejemplo, 3, 6, 5, 4,……
y par la variable gasto también se registraría el número que representa el
monto del gasto diario, 100, 150, 60, 180, ……. y la variable relacionada con la
percepción sobre los servicios de la biblioteca podemos asignarle una
calificación desde cero a cinco, tomando el cero como una percepción de los

2
Wayne W., Daniel & James C. Terrell: “Estadística para Administración y Economía” Tomo I. Editora
McGraw-Hill. 7ª. Edición. Junio 2000.

Elaborado por H. Medina Disla. Junio 2010. 7


Apuntes sobre Estadística

servicios como muy malos y cinco una percepción de que los servicios son
excelentes.

Para la variable relacionada con las asignaturas más preferidas, podríamos


establecer un registro en orden de importancia, para que la persona estudiada
nos diga en orden de preferencia cuales son las asignaturas preferidas, en tal
sentido podríamos establecer el primer lugar para la más preferida, el segundo
para la segunda más preferida y así, sucesivamente.

Lo que se quiere señalar es que hay diferente forma en como podemos


establecer la medición para una variable, es decir que hay diferente tipo de
escala para medir una o múltiples variables, pudiendo entonces establecer una
definición para la escala de medición.

Escala de Medición: Es la forma en como se mide una variable, es decir


que la escala de medición es el proceso mediante el cual se le asigna un
numeral a cada variable. Existen cuatro tipos de escala de medición:
nominal, ordinal, de intervalo y de razón o proporción.

Escala Nominal: Es aquella escala de medición en la cual los numerales


asignados a cada valor o atributo no representa ningún orden de jerarquía,
de importancia o preferencia. En este tipo de escala los numerales solo se
utilizan para identificar los valores o atributos de cada variable. Ej.: los
numerales o códigos asignados a las variables cualitativas, los números
asignados a los integrantes de un equipo béisbol, la matrícula estudiantil, etc.

Escala Ordinal: Es aquella escala en la cual los numerales se asignan a cada


variable de acuerdo a un orden de jerarquía, importancia o de preferencia.
En este tipo de escala, cada numeral representa un tramo jerárquico, de
preferencia o de importancia. Ej.: los códigos asignados a los cargos en una
empresa, preferencia de un producto según su orden de importancia, el
número asignado a las placas de los vehículos oficiales, etc.

Tanto la escala ordinal como la nominal se usan en la medición de variables


cualitativas.

Escala de Intervalo: Es una escala cuantitativa cuya característica principal,


es que no parte de un cero absoluto, es decir que el punto a partir del cual se
empieza a medir es arbitrario. En este tipo de escala la presencia del cero
como de medida de la variable no representa ausencia de la variable. Ej.: Las
escalas usadas para medir la temperatura, la intensidad de un temblor de
tierra, coeficiente inteligente, etc.

Escala de Razón o Proporción: Es una escala cuantitativa cuya característica


principal es que el proceso de medición de inicia a partir de un cero absoluto,
es decir, que la presencia del cero como medida de la variable significa la

Elaborado por H. Medina Disla. Junio 2010. 8


Apuntes sobre Estadística

ausencia de esta. A este tipo de escala corresponden la mayoría de las


variables con que trabajamos a diario, ejemplo, peso corporal, tamaño de las
personas, consumo familiar, ventas de una empresa, distancia recorrida,
unidades producidas, distancia recorrida diariamente, etc.

1.6 PASOS DE UNA INVESTIGACIÓN ESTADÍSTICA

Cuando nos planteamos una interrogante sobre un tema en particular, nos


vemos en la necesidad de buscar datos que nos proporcionen las informaciones
necesarias para dar respuesta a dicha interrogante, este proceso de búsqueda
de datos conlleva la realización de una investigación la cual requiere de cinco
pasos fundamentales3: planeación, diseño de la investigación, recolección de
datos, procesamiento y análisis y presentación de resultados.

Figura no. 1: Pasos de una investigación

Planeación Diseño del


Estudio

Análisis y Recolección
presentación de datos

Procesa-
miento
Aunque estos pasos pueden y varían atendiendo a los criterios del investigador
en términos generales estos pasos representan el proceso lógico de una
investigación aunque reciban diferentes nombres. A continuación se hace una
descripción breve de cada uno de estos.

1. Planeación: Es la fase en la cual se definen los aspectos administrativo y


operativos de la investigación. Esta fase comprende entre otras actividades, el
establecimiento de los objetivos: general y específicos, alcance de la
investigación, población de estudio, presupuesto necesario, cronograma de
actividades y plan de análisis o resultados esperados.

2. Diseño del estudio: En esta fase se define y se diseña el instrumento de


recolección de datos (cuestionario, entrevistas, observación, entre otros) y se

3
Ver a Lincoln L. Chao: “Estadística para las Ciencias Administrativas.” Tercera Edición. Editora
McGraw-Hill

Elaborado por H. Medina Disla. Junio 2010. 9


Apuntes sobre Estadística

define además, la metodología a seguir para la aplicación del instrumento de


recolección de datos.

3. Recolección de datos: Es la fase que requiere de más tiempo y consiste en


la aplicación del instrumento de recolección de datos definido en el diseño del
estudio de acuerdo a la metodología establecida. En esta fase la persona a
cargo de la investigación y su equipo de trabajo se lanzan al terreno para
recolectar los datos que una vez procesados darán respuestas a los objetivos de
la investigación.

4. Procesamiento de datos: Es la fase en la cual se obtienen los cuadros y


tablas, así como las medidas o indicadores estadísticas que permiten describir
el comportamiento de la población estudiada, así como dar respuestas a los
objetivos planteados en la fase de planeación. La fase de procesamiento de los
datos conlleva cuatro actividades esenciales previas: Limpieza y organización
de los datos, codificación, digitación y edición.

La limpieza y organización de los datos se refiera al proceso mediante el cual se


verifican la calidad de los datos obtenidos, se enumeran los instrumentos de
recolección de datos utilizados, verificación del cumplimiento de las metas en
cuanto a la cantidad y calidad. La codificación por su parte es la actividad que
permite asignar un código numérico a cada respuesta del instrumento de
recolección de datos. Esto se hace con la finalidad de facilitar el proceso de
digitación.

La digitación es el proceso mediante el cual los datos son introducidos al


computador con el fin de que el procesamiento sea más eficiente. La edición por
su parte es un proceso de verificación, es decir, con la edición de los datos
verificamos que se haya digitado lo que realmente se ha respondido en el
instrumento de recolección de datos.

5. Análisis y presentación de resultados: Es la fase es la cual se analizan


los resultados obtenidos, estableciendo descripción de la población estudiada,
comparaciones y asociaciones entre variables, inferencias muestrales, entre
otras. En la fase de procesamiento y además se dan a conocer los resultados
obtenidos en la investigación.

Veamos un ejemplo relacionado con el proceso de investigación. En el semestre


2006-1 de la UASD, el trabajo final de un grupo de estudiantes fue medir el
rendimiento, (tomando para ello el promedio de las calificaciones) de un grupo
de estudiantes tanto en las escuelas públicas como en las escuelas privadas.
De esta forma la población estaba definida, así como los objetivos del trabajo
de investigación.

Elaborado por H. Medina Disla. Junio 2010. 10


Apuntes sobre Estadística

Como se podrán imaginar, el presupuesto era pequeño y no predeterminado,


pero tengan por seguro que aquellas personas que no pasaron de curso se lo
encontraron más costoso, pero bueno, ese no es el caso ahora.

El instrumento de recolección de datos fue un cuestionario, el cual se muestra


en la figura número dos y la metodología consistió en tomar una muestra de
estudiantes de las escuelas públicas y otra muestra en colegios privados.

El cuestionario utilizado como instrumento de recolección de datos se muestra


en la figura número dos de la página siguiente.

Figura no. 2. Instrumento de recolección de datos utilizado en el estudio


Universidad Autónoma de Santo Domingo
Estudio sobre el rendimiento escolar
Formulario de recolección de datos

1. Nombre y apellidos del estudiante __________________________

2. Edad ______ 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante _____________________________

5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 1. Promovido 2. Repitiente


7. Calificación en Matemáticas ______
8. Calificación en Español ______
9. Calificación en Sociales ______
10. Calificación en Naturales _____

La metodología consistió en tomar una muestra de treinta estudiantes de la


escuela pública y treinta de la escuela privada. La fuente de datos utilizada fue
el registro de cada estudiante en la escuela, procediendo a completar el
instrumento de recolección de datos diseñado

A continuación se presenta una muestra del instrumento de recolección de


datos completado durante la tercera fase del estudio. Por conveniencia las
respuestas se han subrayado de forma que se puedan identificar fácilmente.

Nótese que los cuestionarios no están numerados y si lo estuvieran no


representan una jerarquía o importancia, sino que el numeral asignado es una
escala nominal.

Elaborado por H. Medina Disla. Junio 2010. 11


Apuntes sobre Estadística

Figura no. 3: Instrumentos de recolección de datos completados


Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo
Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos

1. Nombre y apellidos del estudiante Rodolfo Peña 1. Nombre y apellidos del estudiante Raúl Arias

2. Edad 15 2. Edad 12

3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante: Con padre y madre 4. Con quien vive el estudiante: con ambos padres

5. Tipo de escuela: 1. Pública 2. Privada 5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 6. Condición del estudiante:


1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 69 7. Calificación en Matemáticas 67
8. Calificación en Español 75 8. Calificación en Español 69
9. Calificación en Sociales 72 9. Calificación en Sociales 64
10. Calificación en Naturales 71 10. Calificación en Naturales 69
Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo
Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos

1. Nombre y apellidos del estudiante Paola Moción 1. Nombre y apellidos del estudiante: Yordi González

2. Edad 10 2. Edad 11

3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante Tía 4. Con quien vive el estudiante: con la madre

5. Tipo de escuela: 1. Pública 2. Privada 5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 6. Condición del estudiante:


1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 80 7. Calificación en Matemáticas 70
8. Calificación en Español 78 8. Calificación en Español 68
9. Calificación en Sociales 76 9. Calificación en Sociales 65
10. Calificación en Naturales 80 10. Calificación en Naturales 65

Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo


Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos

1. Nombre y apellidos del estudiante Ashley Ciprián 1. Nombre y apellidos del estudiante Vicente Mejía

2. Edad 9 años 2. Edad 13 años

3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante ambos padres 4. Con quien vive el estudiante con la madre

5. Tipo de escuela: 1. Pública 2. Privada 5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 6. Condición del estudiante:


1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 85 7. Calificación en Matemáticas 65
8. Calificación en Español 80 8. Calificación en Español 70
9. Calificación en Sociales 82 9. Calificación en Sociales 78
10. Calificación en Naturales 78 10. Calificación en Naturales 70

Elaborado por H. Medina Disla. Junio 2010. 12


Apuntes sobre Estadística

Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo


Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos

1. Nombre y apellidos del estudiante Cándida Beatriz 1. Nombre y apellidos del estudiante Manuel Fontana

2. Edad 11 años 2. Edad 10 años

3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante ambos padres 4. Con quien vive el estudiante con una tía

5. Tipo de escuela: 1. Pública 2. Privada 5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 6. Condición del estudiante:


1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 83 7. Calificación en Matemáticas 88
8. Calificación en Español 90 8. Calificación en Español 90
9. Calificación en Sociales 89 9. Calificación en Sociales 89
10. Calificación en Naturales 91 10. Calificación en Naturales 85
Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo
Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos

1. Nombre y apellidos del estudiante Charly Cepeda 1. Nombre y apellidos del estudiante Helena Parache

2. Edad 13 años 2. Edad 11 años

3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante ambos padres 4. Con quien vive el estudiante con ambos padres

5. Tipo de escuela: 1. Pública 2. Privada 5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 6. Condición del estudiante:


1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 77 7. Calificación en Matemáticas 77
8. Calificación en Español 78 8. Calificación en Español 72
9. Calificación en Sociales 83 9. Calificación en Sociales 81
10. Calificación en Naturales 78 10. Calificación en Naturales 65

Una vez agotada la tercera fase, la recolección de datos, nos dedicamos a


cuarta fase, el procesamiento de los datos, recordando que esta fase incluye la
organización, codificación, digitación y edición, para luego obtener los cuadros
y tablas, así como las medidas estadísticas que nos permitan dar respuestas a
los objetivos planteados.

En el caso que nos ocupa para la organización podemos por ejemplo asignar un
número a cada instrumento completado. Para la codificación, el trabajo se
reduce significativamente, ya que el instrumento diseñado tiene cada pregunta
pre-codificada, por ejemplo, para el sexo se le asigna el número uno a los de
sexo masculino y el dos a las de sexo femenino, de igual forma a los y las
estudiantes de escuelas públicas se le asigna el número uno y los y las de
colegios privados el número dos.

Sin embargo, en el caso de la pregunta relacionada a con quien vive el o la


estudiante, es recomendable establecer un código numérico para las posibles
respuestas, ya que en el instrumento esta es una pregunta abierta. Los códigos

Elaborado por H. Medina Disla. Junio 2010. 13


Apuntes sobre Estadística

asignados son: el número uno para los y as que viven con ambos padres,
(padre y madre), el dos para los y las que viven solo con la madre, el tres para
los y las que viven solo con el padre y el cuatro para los y las que viven con
otro familiar.

La importancia de asignar un código numérico es que el proceso de digitación


se hace más eficiente y se cometen menos errores. Un ejemplo se muestra a
continuación con los dos primeros instrumentos

Figura no. 4: instrumentos de datos completados y codificados


Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo
Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos
No. 1 No. 2
1. Nombre y apellidos del estudiante Rodolfo Peña 1. Nombre y apellidos del estudiante Raúl Arias
2. Edad 15 2. Edad 12
3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino
4. Con quien vive el estudiante: 1 4. Con quien vive el estudiante: 1
5. Tipo de escuela: 1. Pública 2. Privada 5. Tipo de escuela: 1. Pública 2. Privada
6. Condición del estudiante: 6. Condición del estudiante:
1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 69 7. Calificación en Matemáticas 67
8. Calificación en Español 75 8. Calificación en Español 69
9. Calificación en Sociales 72 9. Calificación en Sociales 64
10. Calificación en Naturales 71 10. Calificación en Naturales 69

Como se muestra en la figura anterior, a la derecha aparece el número


asignado al instrumento y en la pregunta de con quien vive el o la estudiante
se ha asignado como respuesta el número uno ya que en ambos casos los
estudiantes viven con ambos padres.

Para la digitación se podría colocar los datos en una matriz, colocando cada
variable en las columnas y cada fila para los elementos estudiados. En este
caso vamos a utilizar la hoja de cálculo de Excel para la digitación como se
muestra en la figura número cinco. (Es preciso aclarar que existen numerosos
programas en los que se puede hace la digitación, se ha elegido el Excel por la
disponibilidad y facilidad del mismo)

Elaborado por H. Medina Disla. Junio 2010. 14


Apuntes sobre Estadística

Figura no. 5: Ilustración de la digitación en Excel

El proceso de edición de los datos sería imprimir los datos digitados y luego
verificar si el proceso de digitación se ha hecho correctamente.

Una vez que se ha realizado el proceso de digitación y edición de los datos, se


procede a obtener los cuadros y tablas, así como las medidas estadísticas que
nos permitan dar respuesta a los objetivos del trabajo de investigación, pero
sobre este particular volveremos a tratarlo en los capítulos siguientes.

1.7 PRESENTACIÓN DE RESULTADOS

Una vez que se ha completado el proceso de investigación con el análisis de los


resultados, el paso siguiente consiste en presentar dichos resultados a la
entidad interesada. Para hacerlo existen cinco formas que describiremos
brevemente a continuación:

Elaborado por H. Medina Disla. Junio 2010. 15


Apuntes sobre Estadística

1. Presentación oral: Cuando los resultados de la investigación se presentan


en forma de discurso. Por ejemplo, muchas organizaciones, (empresas, partidos
políticos, ONG`s, entre otras) convocan a una rueda de prensa o a un
encuentro con el objetivo de dar a conocer los resultados de una investigación
determinada.

La presentación oral tiene la ventaja de que es fácil de preparar y su costo es


bajo, sin embargo, presenta la desventaja de que quien recibe la información va
olvidando los primeros datos en la medida en que se avanza con el suministro
de información.

2. Presentación escrita: Es aquella en la cual los resultados de una


investigación se presentan en un informe en forma de texto. La presentación de
los resultados de una investigación presentados en un informe, requieren de
una mayor formalidad y de un esfuerzo mayor. Un informe con los resultados
de una investigación consta de seis partes esenciales.

2.1 Hoja y/o carta de presentación: en esta parte se presenta de manera


formal los resultados de la investigación.

2.2 Índice de contenido: en esta parte del informe se establece o describe la


ubicación física de cada una de las partes contenidas en el informe.

2.3 Resumen ejecutivo: como lo indica su nombre, es un resumen que


contiene los principales resultados de la investigación. Su objetivo
fundamental es describir el comportamiento de la población estudiada
de manera rápida y precisa sin adentrarse en detalles.

2.4 Cuerpo del trabajo: En esta parte se describen de manera detallada


todos los resultados de la investigación, incluye la presentación de
cuadros, tablas, gráfico, descripción textual, así como el cálculo de
medidas estadísticas.

2.5 Conclusiones: las conclusiones representan el juicio extraído de los


resultados de la investigación. Se refieren a los puntos a los cuales llega
quien o quienes realizan el estudio después de analizar de manera
detallada los resultados obtenidos. Las conclusiones dan respuestas a
las interrogantes establecidas y a los objetivos planteados en la fase de
planeación.

2.6 Recomendaciones: se refiere al conjunto de sugerencias o curso de


acción que se sugieren seguir a partir de los resultados de la
investigación.

Elaborado por H. Medina Disla. Junio 2010. 16


Apuntes sobre Estadística

2.7 Anexos: en esta parte del informe se incluye toda información que sea
relevante para el estudio que se realiza y que por alguna razón no se incluyó en
el cuerpo del trabajo, por ejemplo cuadros, copia del o los instrumentos de
recolección de datos utilizados, cronograma de actividades, fotografías, copias
de artículos, de leyes, entre otros.

3) Presentación tabular: es aquella es la que los resultados de una


investigación se presentan en forma de cuadros o tablas. Un cuadro o tabla
estadística se compone de tres partes esenciales y una opcional.

3.1 Título: en este se detalla de manera clara, precisa y lo más corto


posible los datos incluidos en el cuadro. El título es de vital importancia
a fin de edificar a la persona interesada sobre la información que se
presenta en el cuadro o la tabla de que se trate.

3.2 Cuerpo o armazón: es un arreglo matricial, (arreglo de filas y


columnas) en el cual se detallan los datos especificados en el título. El
cuerpo o armazón está compuesto de dos partes:

3.2.1 La columna principal, en la cual se describe la variable o las


variables a presentar en el cuadro.

3.2.2 Las columnas secundarias, es las cuales se describen los valores


relacionados a cada valor o atributo de la variable.

3.3 Fuente: es la parte del cuadro en la cual se específica el origen de los


datos presentados en dicho cuadro. La importancia de la fuente es que
al informar sobre el origen de los datos descrito en la tabla, permite, de
alguna manera, evaluar la calidad y confiabilidad de los mismos.

Nota aclaratoria: se utiliza para Cuadro No: Sexo de los estudiantes


especificar cualquier detalle o de Est-XXX, sección XX
aclaración referente a los datos
SEXO No. %
incluidos en el cuadro. Por ejemplo, en
el cuadro que se muestra a MASCULINO 9 26.5
continuación se podría incluir una FEMENINO 25 73.5
nota aclaratoria para indicar que solo TOTAL 34 100.0
se incluyen a los estudiantes que Fuente: Clase 17/01/2004
asistieron ese día a la clase o que
incluye a otros “colados” de otra sección de la que se trate.

4) Presentación gráfica: es aquella en la cual los resultados de una


investigación se presentan en forma de gráfico. La importancia de la
presentación gráfica es que permite observar el comportamiento de una
variable sin entrar en detalles, solo con observar el cuadro.

Elaborado por H. Medina Disla. Junio 2010. 17


Apuntes sobre Estadística

Se x o d e l o s e s t u d i a n t e s d e Es t -x x x , s e c c i ó n
00

26.5%

73.5%
MASCU LIN O F EMEN IN O

Fuente: clase del 7/01/2004

Por ejemplo, al
observar un recibo Comparación mensual de su consumo
de la facturación 700
de la electricidad,
600
se muestra un
gráfico como el que 500
vemos a nuestra 400
derecha,
300
observamos como
ha variado el 200
consumo, si se ha 100
consumido más o
0
se ha consumido
Abr May Jun Jul Ago Se p Oct Nov Dic Ene Fe b Mar Abr
menos.

Una presentación gráfica contiene los mismos elementos que un cuadro o


tabla, es decir: título, cuerpo, fuente y nota aclaratoria.

5) Presentación Mixta: es aquella en la cual quien o quienes realizan la


investigación utilizan para la presentación de los resultados del estudio dos o
más formas de presentación de datos.

Elaborado por H. Medina Disla. Junio 2010. 18


Apuntes sobre Estadística

II. ORGANIZACIÓN Y PRESENTACIÓN DE LOS DATOS

2.1 ORGANIZACIÓN SIMPLE

El objetivo fundamental de la organización de los datos es conocer el


comportamiento y las características de las variables estudiadas, sin una
organización de los datos se hace un tanto difícil el análisis de los mismos.
Supongamos que tenemos los datos relacionados con el rendimiento
académico de 133 estudiantes y los mismos se muestran en el recuadro
siguiente:

82.5 73.8 73.0 76.8 81.5 79.5 67.8


88.5 68.3 60.5 71.0 77.5 63.0 70.5
70.8 85.5 60.0 81.3 82.0 81.0 61.0
80.3 70.8 69.5 61.3 78.8 62.8 61.8
81.0 81.8 64.8 71.5 71.0 75.0 68.8
86.3 77.0 67.5 82.0 84.5 82.3 71.8
77.8 79.5 72.3 71.5 69.5 84.8 67.3
85.0 87.8 67.0 81.3 72.8 69.8 71.0
79.0 78.8 67.0 76.0 72.8 67.0 69.0
91.3 87.3 62.0 83.5 78.5 68.8 91.8
88.8 73.8 66.5 84.0 69.3 65.3 67.8
88.5 84.5 69.0 68.5 72.0 58.0 61.5
88.5 83.3 66.0 84.3 67.8 66.8 63.0
93.0 71.8 71.3 82.8 70.3 56.5 83.5
85.0 81.3 65.8 92.5 70.3 63.8 81.8
95.3 80.8 69.8 72.5 89.8 70.0 66.8
88.0 90.8 72.8 70.5 70.5 72.0 77.8
82.0 71.0 61.3 78.5 77.8 56.8 64.5
85.0 70.5 64.8 67.0 90.8 84.3 63.5

Como se puede observar, tenemos datos suficientes como para dar un


diagnóstico sobre el rendimiento de los y las estudiantes, sin embargo, sin
una organización esto se hace poco aplicable. Una forma sencilla de iniciar
una exploración de los datos, para conocer sus características es organizando
los mismos en orden ascendente como se ilustra a continuación.

Este procedimiento no nos proporcionará mucha información sobre las


características relevantes de la variable, nos permite conocer por ejemplo cual
es el rendimiento mayor y el menor y permite además observar si existe un
valor que se repita con una frecuencia mayor que los demás, etc.

Elaborado por H. Medina Disla. Junio 2010. 19


Apuntes sobre Estadística

56.5 65.3 69.0 71.0 76.8 81.3 84.8


56.8 65.8 69.0 71.3 77.0 81.3 85.0
58.0 66.0 69.3 71.5 77.5 81.5 85.0
60.0 66.5 69.5 71.5 77.8 81.8 85.0
60.5 66.8 69.5 71.8 77.8 81.8 85.5
61.0 66.8 69.8 71.8 77.8 82.0 86.3
61.3 67.0 69.8 72.0 78.0 82.0 87.3
61.3 67.0 70.0 72.0 78.5 82.0 87.8
61.5 67.0 70.3 72.3 78.5 82.3 88.0
61.8 67.0 70.3 72.5 78.8 82.5 88.5
62.0 67.3 70.5 72.8 78.8 82.8 88.5
62.8 67.5 70.5 72.8 79.0 83.3 88.5
63.0 67.8 70.5 72.8 79.5 83.5 88.8
63.0 67.8 70.5 73.0 79.5 83.5 89.8
63.5 67.8 70.8 73.8 80.3 84.0 90.8
63.8 68.3 70.8 73.8 80.8 84.3 90.8
64.5 68.5 71.0 75.0 81.0 84.3 91.3
64.8 68.8 71.0 75.0 81.0 84.5 91.8
64.8 68.8 71.0 76.0 81.3 84.5 92.5

Ahora podemos fijarnos una idea más acabada sobre el rendimiento de los y
las estudiantes de las escuelas públicas y privadas, por ejemplo, observamos
que más de un tercio tiene un rendimiento promedio inferior a los 70.0
puntos, que solo cinco de los 133 estudiantes estudiados tienen un
rendimiento superior a 90.0 puntos y así sucesivamente.

2.2 DISTRIBUCIONES DE FRECUENCIA

Los datos que provienen de un censo, una encuesta por muestreo, diseño
experimental y aquellos que provienen de fuente secundarias que no han sido
agrupados o condensados, como por ejemplo la revisión de un expediente
clínico, se presentan en la mayoría de los casos en una Distribución de
frecuencia, ya sea para una o para múltiples variables. Una distribución de
frecuencia es un arreglo matricial, (arreglo de filas y columnas) donde se
presenta los valores o atributos de una variable y su respectivas frecuencias.

Antes de entrar en detalles sobre los diferentes tipos de distribuciones de


frecuencias, vamos a definir el concepto de frecuencia y los diferentes tipos de
frecuencias. La Frecuencia, en términos estadísticos, se define como el
número de veces que se repite un dato u observación. Por ejemplo, al observar
el sexo de 50 estudiantes de un curso de Estadística, se observaron los datos
que se presentan en la tabla siguiente

Elaborado por H. Medina Disla. Junio 2010. 20


Apuntes sobre Estadística

Tabla 1: Sexo de 50 estudiantes de un curso de Estadística


M F F F M F F M F F
F F F M F F F F F M
M F F F M M F M F F
F F F F F F F F F F
F F M F F F F F F M

Para estos datos, el dato masculino, (M) se repite 11 veces por lo tanto esa es
su frecuencia y el dato femenino, (F) se repite 39 veces, que es su frecuencia.

2.3 TIPOS DE FRECUENCIA

Existen cuatro tipos de frecuencias: la absoluta simple, la relativa simple, la


absoluta acumulada y la absoluta relativa acumulada.

2.3.1 Frecuencia absoluta simple, (fi): se define como el número de veces que
se repite un dato u observación. Comúnmente se le denomina con el nombre de
frecuencia. Por ejemplo, en el cuadro anterior el dato masculino tiene una
frecuencia absoluta simple de 11, mientras que el dato femenino presenta una
frecuencia absoluta simple de 39.

2.3.2 Frecuencia absoluta acumulada, (FA): consiste en la suma continua y


subsecuente de la frecuencia absoluta simple. La frecuencia absoluta
acumulada expresa la cantidad de elementos que se encuentra por debajo de
un valor específico.

2.3.3 Frecuencia relativa simple, (fr o %): consiste en expresar la frecuencia


absoluta simple, (fi) como una proporción con aspecto al total de frecuencia.

2.3.4 Frecuencia relativa acumulada, (FRA o % acumulado): Expresa la


frecuencia absoluta acumulada, (FA) como un porcentaje con respecto al total
de frecuencia y representa la proporción de elementos que se encuentran por
debajo de un valor determinado. La FRA se puede obtener de dos formas:

a) Sumando de manera continua y subsecuente la frecuencia relativa simple.


b) Dividiendo cada frecuencia absoluta acumulada entre el total de frecuencia.

2.4 Clase: Es un rango de valor en el cual se incluye un conjunto de datos que


para fines de análisis se consideras homogéneos.

Veamos un ejemplo sobre como se obtienen las diferentes frecuencias que


conforma una distribución de frecuencia. Para la ilustración vamos a tomar la
calificación obtenida por 50 estudiantes en una prueba parcial de Estadística,
los datos se ilustran en la tabla número dos a continuación.

Elaborado por H. Medina Disla. Junio 2010. 21


Apuntes sobre Estadística

Tabla 2: Calificación obtenida por 50 estudiantes de Estadística en una prueba


parcial
14 14 19 15 10 12 13 14 9 12
13 14 8 16 14 16 16 12 18 15
17 18 10 14 16 10 19 19 13 15
16 16 13 17 16 9 13 17 11 11
12 12 19 10 8 17 6 18 14 16

Para ordenar estos datos, lo primero que vamos a hacer es colocar en la


primera columna la variable, en este caso la calificación obtenida, pero como
puede tomar múltiple valores, se clasifica en cinco categorías, la primer, los/as
que obtuvieron menos de 12 puntos, la segunda los/as estudiantes que
obtuvieron entre 12 y menos de 14 puntos, la tercera los/as estudiantes que
obtuvieron entre 14 y menos de 16 puntos, la cuarta clase está compuesta por
los/as estudiantes que obtuvieron entre 16 y menos de 18 puntos y la quinta
clase, está formada por aquellos/as estudiantes que obtuvieron entre 18 y 20
puntos.

De esta forma, la primera columna queda como se ilustra a continuación:

Calificación

≤ 12.0
12.0 – 13.9
14.0 – 15.9
16.0 – 17.9
18.0 – 20.0
TOTAL

El segundo paso es determinar la cantidad de estudiantes que cae dentro de


cada una de estas categorías o clases. Para esto, sencillamente se cuenta en la
tabla dos, la cantidad de calificaciones que está dentro de cada uno de los
límites de cada categoría o clase.

Para determinar la cantidad de datos en cada categoría o clase se puede hacer


contando de manera directa cada valor o a partir de un proceso de conteo
detallado, colocando una raya, un punto o un símbolo en cada categoría cada
vez que aparece un valor que se corresponda con esta.

Al observar los datos sueltos de la tabla dos, en la primera categoría, las


calificaciones menores de 12 puntos, hay 11 estudiantes, con calificación

Elaborado por H. Medina Disla. Junio 2010. 22


Apuntes sobre Estadística

menor a 12 puntos. De igual forma se observa que hay 10 estudiantes con


calificación entre 12 y menos de 14 puntos, igual cantidad, 10 estudiantes con
calificación entre 14 y menos de 16 puntos.

De igual forma se observa que hay 12 estudiantes con calificación entre 16 y


menos de 18 puntos y finalmente, siete estudiantes con calificación entre 18 y
20 puntos. En la segunda columna de la distribución se coloca la frecuencia de
cada clase o categoría, por lo que la tabla quedaría como se ilustra a
continuación:

Calificación fi

≤ 12.0 11
12.0 – 13.9 10
14.0 – 15.9 10
16.0 – 17.9 12
18.0 – 20.0 7
TOTAL 50

A partir de esta frecuencia absoluta simple, se obtienen las demás frecuencias.


La frecuencia relativa, por ejemplo se obtiene al dividir cada frecuencia
absoluta entre el total de frecuencia. Si esta frecuencia se desea expresar como
un porcentaje, entonces se multiplica por 100. La primera frecuencia relativa
es [(11/50) x 100]= 22.0%, la segunda frecuencia relativa es [(10/50) x 100]=
20.0% y así sucesivamente, la tercera frecuencia relativa es [(10/50) x 100]=
20.0%, la cuarta frecuencia relativa es [(12/50) x 100]= 24.0% y la quinta y
última frecuencia relativa de esta distribución es [(17/50) x 100]= 14.0% El
resultado de calcular cada una de la frecuencia relativa se muestra en la tabla
siguiente:

Calificación fi %

≤ 12.0 11 22.0
12.0 – 13.9 10 20.0
14.0 – 15.9 10 20.0
16.0 – 17.9 12 24.0
18.0 – 20.0 7 14.0
TOTAL 50 100.0

Elaborado por H. Medina Disla. Junio 2010. 23


Apuntes sobre Estadística

De igual forma, a partir de la frecuencia absoluta simple se obtiene la


frecuencia absoluta acumulada. Esta frecuencia es el resultado de sumar las
frecuencias absoluta simple de cada clase. En términos generales, la frecuencia
absoluta acumulada de una clase o categoría en particular es igual a la
frecuencia acumulada hasta la clase anterior más la frecuencia absoluta
simple de la clase o categoría de que se trate.

Así, la frecuencia absoluta acumulada de la primera clase o categoría es igual a


frecuencia absoluta simple, para nuestro ejemplo, la frecuencia absoluta
acumulada de la primera clase es igual a 12. La frecuencia absoluta
acumulada en la segunda clase o categoría es la suma de la frecuencia
acumulada en la primera clase más la frecuencia absoluta simple de la
segunda clase, es decir (11 + 10)= 21.

El procedimiento se sigue de manera similar hasta determinar la frecuencia


acumulada para cada clase o categoría. De esta forma la frecuencia acumulada
de la tercera clase es igual a la frecuencia acumulada de la segunda clase más
la frecuencia absoluta simple de la tercera clase, en este caso (21 + 10)= 31, la
frecuencia acumulada de la cuarta clase es igual a la frecuencia acumulada
hasta la tercera clase más la frecuencia absoluta simple de la cuarta, esto es
(31 + 12)= 43 y la frecuencia acumulada de la quinta clase o es igual a la
frecuencia acumulada hasta la cuarta clase más la frecuencia simple de la
quinta clase, es decir (43 + 7)= 50. El resultado de las sumas se muestra en la
tabla siguiente:

Calificación fi % FA

≤ 12.0 11 22.0 11
12.0 – 13.9 10 20.0 21
14.0 – 15.9 10 20.0 31
16.0 – 17.9 12 24.0 43
18.0 – 20.0 7 14.0 50
TOTAL 50 100.0

Una vez que se ha determinado la frecuencia absoluta acumulada el siguiente


paso es calcular la frecuencia relativa acumulada o porcentaje acumulado.
Este porcentaje puede obtenerse de dos formas, o se acumula la el porcentaje
simple o se divide cada frecuencia absoluta acumulada entre el total. El
procedimiento de acumular el porcentaje simple, simplifica los cálculos.

El porcentaje acumulado de la primera clase es igual porcentaje simple de la


misma. Para nuestro ejemplo, el porcentaje acumulado de la primera clase o

Elaborado por H. Medina Disla. Junio 2010. 24


Apuntes sobre Estadística

categoría es igual a 22.0%. El porcentaje acumulado en la segunda clase o


categoría es la suma del porcentaje acumulado en la primera clase más el
porcentaje simple de la segunda clase, es decir (22.0 + 20.0)= 42.0%.

Al igual que en la frecuencia absoluta acumula, procedimiento se sigue de


manera similar hasta determinar la porcentaje acumulado para cada clase o
categoría. De esta forma la porcentaje acumulado de la tercera clase es igual al
porcentaje acumulado de la segunda clase más el porcentaje simple de la
tercera clase, en este caso es (42.0 + 20.0)= 62.0%, el porcentaje acumulado
de la cuarta clase es igual al porcentaje acumulado hasta la tercera clase más
el porcentaje simple de la cuarta, esto es (62.0 + 24.0)= 86.0% y el porcentaje
acumulado de la quinta clase o es igual al porcentaje acumulado hasta la
cuarta clase más el porcentaje simple de la quinta clase, es decir (86.0 + 14.0)=
100.0%. El resultado de las sumas se muestra en la tabla siguiente:

Calificación fi % FA FRA

≤ 12.0 11 22.0 11 22.0


12.0 – 13.9 10 20.0 21 42.0
14.0 – 15.9 10 20.0 31 62.0
16.0 – 17.9 12 24.0 43 86.0
18.0 – 20.0 7 14.0 50 100.0
TOTAL 50 100.0

Una vez que han calculado las frecuencias se procede a completar el cuadro
de manera adecuada, es decir, poner el título, se elimina la columna del
conteo, (si se ha incluido), y se coloca la fuente de los datos.

Cuadro No : Calificación de 50 estudiantes de


un curso de estadística en una prueba parcial
Calificación fi % FA FRA

≤ 12.0 11 22.0 11 22.0


12.0 – 13.9 10 20.0 21 42.0
14.0 – 15.9 10 20.0 31 62.0
16.0 – 17.9 12 24.0 43 86.0
18.0 – 20.0 7 14.0 50 100.0
TOTAL 50 100.0
Fuente: Tabla 2

Elaborado por H. Medina Disla. Junio 2010. 25


Apuntes sobre Estadística

2.5 TIPOS DE DISTRIBUCIÓN DE FRECUENCIA

Para agrupar los datos existen tres tipos de distribución de frecuencia, la


cuales se utilizarán de acuerdo al tipo de datos que estemos tratando.

2.5.1 Distribución de frecuencia para datos cualitativos: cuando se tienen


datos cualitativos, el procedimiento se simplifica, pues solo se requiere
colocar las diferentes categorías de la variable y la frecuencia asociada con
dada una de ellas, como se muestra en el ejemplo siguiente:

Cuadro No.: Personas con quienes viven los/as


estudiantes de las escuelas públicas y de la privadas
Con quien vive fi %
Ambos padres 106 79.7
Con la madre 15 11.3
Con el padre 5 3.8
Otro familiar 7 5.3
Total 133 100.0
Fuente: Estudio de mayo del 2006

2.5.2 Distribución Frecuencia Simple o Tipo I: es un tipo de distribución


de frecuencia que se utiliza para presentar una variable cuantitativa discreta,
cuyo rango de valor sea menor o igual de diez. Es decir se utiliza para
variables cuantitativas discretas que toman pocos valores diferentes.

Ejemplos de estas variables son número de hijos/as por familia, número de


asignaturas cursadas por los estudiantes de la UASD, número de cursos
realizados por los empleados y empleadas de una empresa, entre otros.

Ejemplo: Se les preguntó a cincuenta profesores sobre el número de


estudiantes reprobados que tenía en su curso, los datos son:

Tabla 3: Número de estudiantes reprobados/as por curso


3 1 4 5 3 2 2 4 2 2
5 4 2 4 5 3 2 3 3 1
3 5 3 1 2 2 4 2 1 0
2 4 4 5 4 3 1 2 3 1

El dato menor que aparece en los datos es el valor cero y el mayor es el cinco
de forma tal que esta variable en esta muestra toma seis valores diferentes:
cero, uno, dos, tres, cuatro y cinco. Para organizar los datos en una
distribución de frecuencia simple o tipo I colocamos los diferentes valores de

Elaborado por H. Medina Disla. Junio 2010. 26


Apuntes sobre Estadística

la variable en la primera columna y luego se cuenta el número de veces que se


repite cada dato, como se muestra en la distribución de frecuencia siguiente:

Cuadro No.: Cantidad de estudiantes reprobados/as por curso


# de estudiantes fi . % FA % Acum.
0 1 2.5 1 2.5
1 6 15.0 7 17.5
2 11 27.5 18 45.0
3 9 22.5 27 67.5
4 8 20.0 35 87.5
5 5 12.5 40 100.0
Total 40 100.0
Fuente: Encuesta a 40 profesores noviembre 2006

2.5.3 Distribución Frecuencia con Clase o Tipo II: Este tipo de distribución
se utiliza para variables cuantitativas continuas y para aquellas variables
cuantitativas discretas, cuyo rango de valor sea mayor de diez.

Siempre que se trate de datos cuantitativos continuos se hace necesario el


uso de este tipo de distribución. La razón para ello es que los datos
cuantitativos continuos pueden diferir uno del otro por milésima de datos, lo
que, de tener los diferentes valores con sus respectivas frecuencias se podría
tener tantas clases como valores individuales se tenga, perdiéndose de esta
manera la esencia de la agrupación de los datos, “proporcionar información
sobre las características de las variables estudiadas”

Un ejemplo de este tipo de distribución de frecuencia se muestra a


continuación

Cuadro No : Calificación de 50 estudiantes de


un curso de estadística en una prueba parcial
Calificación fi % FA FRA

≤ 12.0 11 22.0 11 22.0


12.0 – 13.9 10 20.0 21 42.0
14.0 – 15.9 10 20.0 31 62.0
16.0 – 17.9 12 24.0 43 86.0
18.0 – 20.0 7 14.0 50 100.0
TOTAL 50 100.0
Fuente: Tabla 2

2.6 Pasos para construir una distribución de frecuencia con clase.

Elaborado por H. Medina Disla. Junio 2010. 27


Apuntes sobre Estadística

Los pasos que se presentan a continuación son solo una guía de cómo
organizar los datos en una distribución de frecuencia con clase, puesto que la
forma de presentar los datos muchas veces depende de lo que se quiera
mostrar en la distribución. Pero cuando no se tiene una idea de cómo agrupar
los datos, los siguientes pasos son una buena guía y estos pasos son:

1. Calcular el rango de la variable: El rango de una variable se define como la


diferencia entre dato mayor y el dato menor y el mismo indica los diferentes
valores posibles que puede tomar la variable

RV = Xmayor - Xmenor

2. Calcular el intervalo o ancho de la clase: El intervalo o ancho de la clase


es la diferencia que existe entre el límite inferior y el límite superior de cada
clase y el mismo se puede obtener por tanteo o se puede establecer de acuerdo
a los objetivos de quien está presentado la información. Una forma de obtener
el intervalo de cada clase es a partir de la regla sugerida por Sturges4 la cual
establece que el ancho o intervalos de clases en una distribución de frecuencia
puede aproximarse a partir de la siguiente fórmula:

RV
Ï , n representa el total de datos o tamaño de la muestra
1  (3.322x log n)

A partir de esta fórmula se obtiene un intervalo de igual dimensión para todas


las clases lo que facilita el análisis.

3. Establecer los límites de cada clase: para establecer los límites de cada
clase o intervalo, se inicia con el dato menor y se le suma el intervalo y así se
continúa hasta llegar al dato mayor observado. Es importante tener en
consideración que los límites se deben establecer de forma excluyentes, esto es,
que los valores en los límites no deben ser iguales, por ejemplo, si una clase va
de 30 a 40, como el 40 no va incluido en esa clase lo aconsejable es establecer
como limite superior el resultado de la suma disminuido en una unidad, lo que
nos daría una clase con los siguientes límites; 30 a 39, así, la siguiente clase
iniciaría con 40 y de esta forma los valores del límite superior de una clase y el
inferior de la siguiente no van a ser iguales.

Este procedimiento ayuda a que quien lea u organice la información no tenga


dudas sobre donde colocar por ejemplo el 40, además de que este
procedimiento facilita un mayor entendimiento del comportamiento de los
datos.

4
Herbert A. Sturges: “The Choice of a Class Interval”, Journal of the American Statistical
Association. Marzo 1926

Elaborado por H. Medina Disla. Junio 2010. 28


Apuntes sobre Estadística

4. Realizar el conteo y establecer las frecuencias: El conteo consiste es


determinar cuantos valores de la variable pertenecen a cada clase o intervalo

Ejemplo:

1. Los datos que se muestran a continuación representan las edades de un


grupo de 40 personas que asistieron al estreno de una película

21 24 33 29 35 26 26 25 44 32
40 21 31 28 20 26 21 33 32 41
22 20 22 23 43 50 47 45 26 38
26 22 24 39 38 35 20 46 20 25

A partir de los datos desarrolle las siguientes preguntas:

a) Construir una distribución de frecuencia


b) Determinar el porcentaje de personas que tiene menos de 30 años
c) Interprete el resultado de la frecuencia relativa simple de la tercera clase
d) Interprete el resultado de la frecuencia relativa acumulada de la quinta
clase.
e) ¿Qué porcentaje de las personas que asistieron al curso de estadística
tiene menos de 38 años?

Iniciamos con los cinco pasos para construir una distribución de frecuencia
con clase:

1. Rango de la variable:

RV = Xmayor - Xmenor
RV = 50 – 20
RV = 30

RV
2. Ï 
1  ( 3 . 322  log n )

30 30 30 30
Ï      4.75  5
1  (3 .322  log 40 ) 1  (3.322  1.6021) 1  5.3221 6.3221

3. Establecer los límites de cada clase: recordemos que para la primera


clase se suma el intervalo al dato menor y así sucesivamente, como se
muestra a continuación:

Elaborado por H. Medina Disla. Junio 2010. 29


Apuntes sobre Estadística

EDAD
20-24
25-29
30-34
35-39
40-44
45-50

Obsérvese que la primera clase inicia con el 20 que es el dato menor y termina
en 24 ya que el intervalo de la distribución es de cinco. El lector podrá
preguntarse porque la primera la clase no termina en 25 que es resultado de
sumar el intervalo al dato menor y la respuesta es que el 20 como dato menor
va incluido en el intervalo de la clase y si contamos teneos 20, 21, 22, 23 y 24
que son los cinco valores del intervalo.

4. Por último establecemos la frecuencia de cada de una de las clases. Un


procedimiento recomendado es hacer un conteo, tomando en consideración los
límites de cada clase. Así por ejemplo, si tomamos los valores de la primera
columna observamos que estos son: 21, 40, 22 y 26 por lo que el primer valor
corresponde a la primera clase porque es un valor que esta entre 20 y 24, el
segundo valor corresponde es el 40 y corresponde la quinta clase que va de 40
a 44, el tercer valor es 22 y corresponde a la primera clase porque este valor
está entre 20 y 24 y el cuarto valor es el 26 y pertenece a la segunda claro
porque este valor esta entre 25 y 29 que son los límites de esta clase. Este
procedimiento se sigue hasta incluir todos los valores de la variable en la clase
o intervalo correspondiente. El resultado de dicho proceso se muestra a
continuación:

Cuadro No.: Edad de las personas que asistieron al estreno de la película.


EDAD fi % FA % Acum.
20-24 13 32.5 13 32.5
25-29 9 22.5 22 55.0
30-34 5 12.5 27 67.5
35-39 5 12.5 32 80.0
40-44 4 10.0 36 90.0
45-50 4 10.0 40 100.0
Total 40 100.0
Fuente: Encuesta hecha a los/as asistentes al cine

Elaborado por H. Medina Disla. Junio 2010. 30


Apuntes sobre Estadística

b) Determinar el porcentaje de personas que tiene menos de 30 años:


Como se muestra en la tabla anterior menor a 30 años hay un 55.0% que son
las personas que tienen entre 20 y 24 años y las que tienen entre 25 y 29 años.

c) Interprete el resultado de la frecuencia relativa simple de la tercera


clase: La tercera clase es la que va de 30 a 34 y el resultado indica que el
12.5% de las personas que asistieron al estreno de la película tienen entre 30 y
34 años.

d) Interprete el resultado de la frecuencia relativa acumulada de la quinta


clase. El resultado de la frecuencia relativa acumulada de la quinta clase es
90.0% y el mismo indica que el 90.0% de las personas que asistieron al estreno
de la película tienen 44 años o menos.

También se puede decir, que el 90.0% de las personas que asistieron al estreno
de la película tienen menos de 45 años.

e) ¿Qué porcentaje de las personas que asistieron al estreno de la película


tiene menos de 38 años? Como el 38 no aparece en ninguno de los límites, se
hace necesario determinar en los datos sueltos cuantas personas tienen menos
de 38 años y esta cantidad la dividimos entre el total y se multiplica por 100
para determinar el porcentaje.

Para este caso tenemos un total de 29 personas con menos de 38 años, luego el
porcentaje de persona con menos de 38 años es de (29/40)*100, es decir
72.5%

Ejercicios para el aula

1. El tamaño de un grupo de viviendas, expresado en ciento de m 2, se muestra


en la tabla siguiente.

26 36 33 19 28 26 20 22 8 30 30 20 5 34
20 25 29 40 17 32 20 6 18 31 19 4 19 32
20 17 6 28

a) Construir una distribución de frecuencia.


b) ¿Qué por ciento de las viviendas tienes un tamaño inferior a los 25 m 2?
c) ¿Qué por ciento de las viviendas tiene un espacio mayor a 30 m2?
d) Interpretar el resultado de la cuarta clase de la frecuencia relativa
acumulada.
e) Interpretar el resultado de la frecuencia relativa simple de la tercera clase.

Elaborado por H. Medina Disla. Junio 2010. 31


Apuntes sobre Estadística

2. Los datos que se presentan a continuación representan el índice de


calificación de un grupo de estudiantes de preparatoria.

2.75 3.53 2.42 3.00 3.85 3.71 2.25 2.96 3.00 3.00
3.50 3.06 3.09 2.22 2.47 3.20 3.02 2.00 2.05 3.60

a) Construir una distribución de frecuencia con cinco clases.


b) Interpretar el resultado de la frecuencia relativa simple de la tercera clase.
c) Interpretar el resultado de la frecuencia absoluta acumulada de la cuarta
clase.
d) ¿Qué porcentaje de estudiantes tiene un índice de calificación menor a 3.00
puntos?

3. La escolaridad de 35 padres de familia (expresado en años de educación) se


presenta como sigue.
14 16 13 14 16 12 12 13 12 15 16 14 16 17
16 16 13 12 15 12 16 14 12 12 15 14 13 17
13 14 16 12 15 16 18

a) Organice los datos en una distribución de frecuencia.


b) ¿Qué porcentaje de padres de familia, tiene menos de 15 años de
educación?
c) ¿Qué porcentaje de padres de familia tiene 12 años de educación?

4. El ingreso quincenal, en cientos de RD$ de un grupo de empleados de la


empresa K.G. se muestra en los datos siguientes.

24 44 38 22 29 27 48 31 30 27 21 37 42
39 38 16 32 28 60 10 23 12 17 24 18

a) Organice los datos en una distribución de frecuencia con un intervalo de


RD$10.
b) ¿Qué porcentaje de los empleados ganan menos de $20?
c) ¿Qué porcentaje gana entre 30 y 40?
d) Interpretar el resultado de la frecuencia relativa simple de la segunda clase.

5) El área de estudio de un grupo de 30 estudiantes se presenta a


continuación.

1. Administración 11. Indeciso 21. Administración


2. Economía 12. Indeciso 22. Computación
3. Contabilidad 13. Economía 23. Mercadeo
4. Contabilidad 14. Mercadeo 24. Economía
5. Mercadeo 15. Indeciso 25. Indeciso
6. Economía 16. Administración 26. Administración
7. Mercadeo 17. Economía 27. Computación

Elaborado por H. Medina Disla. Junio 2010. 32


Apuntes sobre Estadística

8. Administración 18. Mercadeo 28. Mercadeo


9. Mercadeo 19. Indeciso 29. Economía
10. Economía 20. Computación 30. Mercadeo

a. Construir una distribución de frecuencia.


b. Calcular el porcentaje de estudiante por área de estudio.

Elaborado por H. Medina Disla. Junio 2010. 33


Apuntes sobre Estadística

2.7 TABULACIÓN CRUZADA

También se le llama tabla de doble entrada y se utiliza para presentar dos o


más variables en un solo cuadro. La Tabulación Cruzada proporciona una
descripción básica de la interrelación que hay entre las variables que se
tabulan en el cuadro, de igual forma ayuda a buscar patrones de interacción
siempre que la frecuencia de cada celda represente un número significativo con
respecto al total.

Para realizar un cuadro de doble entrada se sigue el mismo procedimiento que


para construir una distribución de frecuencia con una variable. Es decir que se
debe tomar en consideración las variables a incluir en el cuadro de doble
entrada, (cualitativa o cuantitativa y en el caso de las variables cuantitativas,
se debe tomar en cuenta si estas son continuas o discontinuas).

2.7.1 TABULACIÓN CRUZADA PARA DOS VARIABLES

Para la construcción de un cuadro de doble entrada con dos variable, se coloca


una de las variables en la primera columna o columna principal y la otra
variable en la primera fila, de forma tal que se forme una celda común para
cada una de las categorías de las variables incluidas. La variable que se coloca
en la primera fila generalmente es aquella que tienen un mayor número de
categorías.

Para ilustrar lo que se ha dicho, suponga que estamos interesados en conocer


la relación que existe entre dos variables, digamos X e Y. Suponga además que
la variable X tiene cinco categorías, X1, X2, X3, X4 y X5 y que la variable Y tiene
tres categorías, Y1, Y2, Y3, si queremos presentar estas dos variables en un solo
cuadro, el cuadro tendría la forma siguiente:

Yi
Xi Y1 Y2 Y3 TOTAL
X1 C11 C12 C13 Total X1
X2 C21 C22 C23 Total X2
X3 . . . .
X4 . . . .
X5 C51 C52 C53 Total X5
Total
TOTAL Total Y1 Total Y2 Total Y3
general

El cuadro indica dos renglones para el total, esto es debido a que estamos
presentando solo dos variables, así, en el total de la última fila representa el

Elaborado por H. Medina Disla. Junio 2010. 34


Apuntes sobre Estadística

total de cada columna, mientras que el total de la última columna representa el


total de cada fila del cuadro.

En las celdas que se forman, se colocarán los datos que tienen las dos
características del cuadro. Por ejemplo, en la celda C 11, se colocan los
elementos que son comunes a X1 y a Y1, en la columna C12 se colocan los
elementos que son comunes a X1 y a Y2 y así sucesivamente.

Ejemplo: Se evaluó el sexo y la calificación final de treinta estudiantes de una


escuela primaria para conocer la relación entre la calificación en matemáticas y
el sexo de los/as estudiantes. Los datos se muestran en la tabla siguiente.

No. Sexo Calif. No. Sexo Calif. No. Sexo Calif.


1 Masc. 68 11 Masc. 70 21 Fem 87
2 Fem 86 12 Fem 91 22 Masc. 76
3 Masc. 74 13 Masc. 72 23 Masc. 81
4 Masc. 72 14 Fem 70 24 Masc. 77
5 Masc. 72 15 Masc. 65 25 Fem 77
6 Fem 85 16 Fem 82 26 Masc. 73
7 Fem 66 17 Fem 68 27 Fem 60
8 Fem 79 18 Masc. 86 28 Masc. 60
9 Masc. 70 19 Masc. 71 29 Masc. 71
10 Masc. 72 20 Fem 82 30 Masc. 73

Para este caso tenemos dos variables, una variable cuantitativa, (calificación
matemática) y una cualitativa, (sexo de los/as estudiantes). La variable sexo
tiene dos categorías, masculino y femenino, y la calificación en matemática es
continua y su rango es mayor de 10 por lo tanto hay que hacer una
distribución con clases. Para ello vamos a dividir esta variable en cuatro
categorías, los estudiantes con menos de 70 puntos, los que tienen entre 70 y
80 puntos, los que tienen entre 80 y 90 y los que tienen 90 o más puntos.
Luego de esta clasificación el cuadro queda como se ilustra a continuación:

Como se muestra en el cuadro siguiente, el primer alumno es de sexo


masculino y tiene una calificación de 68 puntos, por lo tanto se coloca en la
columna de masculino y en la primera fila, ya que aquí de colocan los que
tienen calificación entre 60 y 69 puntos. El segundo estudiante es una
estudiante y tiene una calificación de 86 puntos, por lo tanto se coloca en la
columna de sexo femenino y en la tercera fila, ya que aquí se deben colocar los
estudiantes que tienen entre 80 y 89 puntos.

El tercer estudiante es sexo masculino y tiene una calificación de 72 puntos,


por lo que se coloca en la columna de masculino y en la segunda fila, ya que en

Elaborado por H. Medina Disla. Junio 2010. 35


Apuntes sobre Estadística

esta se colocan los estudiantes con calificación entre 70 y 79 puntos. El


procedimiento se continúa hasta tabular los datos de la tabla como se ilustra a
continuación

Sexo
Calificación Masculino Femenino Total
60 - 69 /// ///
70 - 79 ///////////// ///
80 - 89 // /////
90 - 100 /
Total

Luego del conteo de las frecuencias, los datos son

Cuadro No. Calificación en matemáticas y sexo de


los estudiantes
Sexo
Calificación Total
Masculino Femenino
60 - 69 3 3 6
70 - 79 13 3 16
80 - 89 2 5 7
90 - 100 0 1 1
Total 18 12 30
Fuente: Registro de la escuela

Preguntas

1. Determinar el porcentaje de estudiante por sexo


2. Calcular el porcentaje de estudiantes con menos de 80 puntos
3. De los que tienen menos de 90 puntos, ¿qué porcentaje es femenino?
4. Del grupo femenino ¿qué porcentaje tiene menos de 90 puntos?
5. Que porcentaje de estudiantes tiene entre 80 y 89 puntos

Ejercicio:

Con los datos que se presentan en la tabla siguiente crear un pequeño reporte
indicando la relación entre el rendimiento académico y el sexo de los
estudiantes, entre el número de asignatura por sexo, así como el gasto en
transporte por sexo y número de asignaturas cursadas. Finalmente incluya un
pequeño análisis de la relación entre la edad de los estudiantes y el número de
asignaturas cursadas.

Elaborado por H. Medina Disla. Junio 2010. 36


Apuntes sobre Estadística

Para el índice académico divida esta variable en tres categorías, los que tienen
menos de 75 puntos, los que tienen entre 75 y 80 puntos y los que tienen más
de 80 puntos. En el caso del número de asignaturas, divídala en tres
categorías, los que cursan menos de cuatro asignaturas, los que están
cursando cuatro asignaturas y los que cursan más de cuatro.

Para la edad divida esta variable en tres categorías, los que tienen entre 20 y
23 años, los que están entre 24 y 27 años y los que tienen de 28 y más años.
En el caso del gasto en transporte haga una división en categorías, si lo
considera necesario y ser así, divida la variable a su conveniencia.

Datos personales de 30 estudiantes de Informática


# DE INDICE GASTO EN
No. EDAD SEXO ASIG. ACAD. TRANSP.
1 22 M 3 80.0 20
2 24 F 3 77.8 50
3 23 M 4 75.6 60
4 25 M 5 74.6 30
5 21 M 3 82.1 30
6 25 F 3 74.3 50
7 22 M 3 77.7 40
8 21 F 6 80.1 40
9 28 F 3 70.3 40
10 28 F 4 70.3 40
11 29 M 5 73.5 40
12 25 F 3 74.3 20
13 20 M 4 79.8 40
14 30 F 2 73.3 20
15 28 F 3 81.5 40
16 24 F 4 74.4 40
17 28 F 3 78.6 40
18 24 F 6 76.7 40
19 21 F 4 77.7 20
20 24 M 3 79.4 20
21 35 M 2 75.7 40
22 21 F 4 83.0 40
23 24 M 3 81.2 50
24 22 F 3 76.8 60
25 21 F 4 80.7 30
26 26 F 3 70.8 50
27 25 F 4 71.3 20
28 24 M 5 74.9 80
29 29 M 3 82.6 30
30 25 F 5 80.6 20
FUENTE: ENCUESTA EN EL AULA EST-211 SEC-01. 24/02/2007.

Elaborado por H. Medina Disla. Junio 2010. 37


Apuntes sobre Estadística

Elaborado por H. Medina Disla. Junio 2010. 38

También podría gustarte