Está en la página 1de 31

INSTITUTO DE ESTUDIOS SUPERIORES METROPOLITANO

DIRECCIÓN DE EDUCACIÓN SUPERIOR

MAESTRÍA EN EDUCACIÓN

ESTADÍSTICA APLICADA A LA
INVESTIGACIÓN EDUCATIVA

SEGUNDO CUATRIMESTRE

TITULAR DE LA MATERIA
MTRO. JUAN CARLOS ESPINOSA GUTIÉRREZ.
ÍNDICE GENERAL

INTRODUCCIÓN III

1. ESTADÍSTICA EN EDUCACIÓN. 1
1.1. ¿Estadística y Educación? . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Relación entre Estadística e Investigación. . . . . . . . . . . . . . . . 4
1.3. Las áreas de la Estadística. . . . . . . . . . . . . . . . . . . . . . . . . 4

2. ESTADÍSTICA DESCRIPTIVA. 7
2.1. Terminología estadística. . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Datos agrupados. Gráficas y distribución de frecuencias. . . . . . . . . 9
2.2.1. Gráfica circular (o de sectores). . . . . . . . . . . . . . . . . . 9
2.2.2. Gráfica de barras . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.3. Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.4. Polígono de frecuencias. . . . . . . . . . . . . . . . . . . . . . 12
2.3. Tablas de distribución de frecuencias. . . . . . . . . . . . . . . . . . . 12
2.3.1. Medidas de tendencia central. . . . . . . . . . . . . . . . . . . 19
2.3.1.1. Mediana (M e) . . . . . . . . . . . . . . . . . . . . . 20
2.3.2. Moda (M o) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.3. Media aritmética (x̄) . . . . . . . . . . . . . . . . . . . . . . . 21

3. PROBABILIDAD 25
3.1. La esencia de la probabilidad . . . . . . . . . . . . . . . . . . . . . . 25
3.2. Algunas ideas fundamentales de la teoría de conjuntos. . . . . . . . . 26

I
II ÍNDICE GENERAL
INTRODUCCIÓN

Algunos estudiantes comienzan por abordar sus problemas de tarea y leen el


texto sólo si se bloquean en un ejercicio. Sugiero que un plan mucho mejor es leer
y comprender una sección del texto antes de enfrentar los ejercicios. En particular,
debe leer con cuidado las definiciones para ver el significado exacto de cada término.
Antes de leer cada ejemplo, le sugiero que llegue a la solución tratando de resolver
el problema usted mismo. Obtendrá mucho más que mirando la solución si es que
lo hace.

Parte del objetivo de este curso es inducir el pensamiento lógico. Es muy impor-
tante aprender a escribir las soluciones de los ejercicios de una manera articulada,
paso a paso, con comentarios explicativos, no sólo una cadena de ecuaciones o fór-
mulas desconectadas.

Algunos ejercicios piden una explicación verbal, interpretación o descripción. En


tales casos no hay una única forma correcta de expresar la respuesta, por lo que no se
preocupe si no ha encontrado la respuesta definitiva. Además, a menudo hay varias
formas diferentes para expresar una respuesta numérica o algebraica, así que si su
respuesta aparenta ser diferente a la mía, no asuma
√ inmediatamente que se equivo- √
có. Por ejemplo, si la respuesta dada al final es 2 − 1 y usted obtuvo 1/(1 + 2),
entonces está usted en lo correcto y racionalizar el denominadordemostrará que las
respuestas son equivalentes.

Le recomiendo que conserve esta guía para fines de consulta después de terminar
el curso. Es probable que olvide algunos de los detalles específicos de las Matemáticas
financieras, por lo que la guía servirá como una referencia útil cuando sea necesario
utilizar las ecuaciones en algún tipo de cálculo financiero. Puesto que esta guía con-
tiene más material del que es posible cubrir en todo un curso, también puede servir
como un valioso recurso para un trabajo científico o de ingeniería.

Al final del curso el alumno aplicará en forma adecuada la toma de decisiones.


Como especialista en los conceptos matemáticos aplicables a la contaduría y finan-
zas. Considerando la evolución de la administración científica y la investigación de

III
IV INTRODUCCIÓN

operaciones a través del análisis matemático con el uso de la tecnología logrando ser
asesores y usuarios de estas herramientas.

Antes de que el alumno pueda aplicar con confianza las ecuaciones, debe dominar
las técnicas de resolución y tener un mínimo de conocimiento de la teoría que la fun-
damenta. Buscamos combinar una exposición sólida y precisa de la teoría elemental
de las matemáticas financieras, con bastante material sobre metodos de resolución,
análisis y aproximación que han probado su utilidad en una amplia variedad de apli-
caciones. Pusimos atención especial en aquellos métodos de mayor aplicación.

Este manual busca ser una referencia introductoria para los procedimientos es-
tadísticos básicos que más se usan en Psicología, Educación y otras Ciencias Sociales.

El tratamiento de los temas no supone que se haya estudiado Estadística con


anterioridad, por lo que puede considerarse accesible a cualquier estudiante univer-
sitario. El texto no busca desarrollar habilidades de cálculo, sino comprensión del
razonamiento que sostiene a cada procedimiento. No se trata de aprender a hacer
operaciones aritméticas, porque eso se hace con un programa diseñado a ese efecto,
que automatiza las cuentas. Nuestro trabajo será el de entender para qué sirve un
procedimiento, cuándo corresponde usarlo y cómo se lee el resultado, ya que ese es
el uso que se hará de la estadística en el desempeño profesional o en investigación.
CAPÍTULO 1
ESTADÍSTICA EN EDUCACIÓN.

El objetivo central del presente capítulo es que el lector sea capaz de ubicar a la
estadística dentro del contexto de la ciencia y la investigación.

De igual forma, al término del mismo el lector podrá:

∗ Reconocer que la ciencia ha facilitado el desarrollo de las teorías que exponen


la realidad.

∗ Comprender la conceptualización del empirismo y del positivismo en el proceso


de acumulación del conocimiento.

∗ Explicar la forma en la que las teorías constituyen simplemente la organización


lógica de las leyes empíricas.

∗ Enunciar la forma que tiene el empirismo de entender la ciencia.

∗ Reconocer que toda teoría, todo modelo y toda ley científica son una conjetura
acerca de cómo es la realidad.

∗ Diferenciar el punto de vista de los positivistas y los justificacionistas con


relación a la ciencia.

1.1. ¿Estadística y Educación?


La ciencia es una de las empresas más humanas y productivas que haya desarro-
llado el hombre. Si lo que caracteriza al ser humano es su excepcional inteligencia,
la cual le ha dotado de lenguaje y le ha permitido servirse de él para crear una sin-
gular organización social, de insólita eficacia, para dominar la naturaleza, entonces
la ciencia es el logro humano más perfecto y contundente, el cual señala la cúspide
de los frutos de su intelecto, único en el Sistema Solar y tal vez en el universo mismo.

1
2 CAPÍTULO 1. ESTADÍSTICA EN EDUCACIÓN.

La Estadística nos ayudará a entender comportamientos, procesos y fenómenos


individuales y sociales, y lo hará desde una perspectiva que puede parecer un tanto
ajena a quienes se inician en el estudio de carreras de Ciencias Sociales. Cuando
se aplica a fenómenos sociales, la Estadística cumple la función de tomar distancia
de aquello que se observa. La Estadística no analiza individuos aisladamente, sino
conjuntos de ellos, conjuntos a los que define de acuerdo a ciertas características
que elige deliberadamente. Grupos de personas de determinada edad, clase social,
nivel de educación, nivel de inteligencia, hábitos, etc. y es entre esos grupos que hace
comparaciones y busca similitudes y diferencias. Usa estas clasificaciones y las com-
paraciones entre los grupos a fin de identificar factores que expliquen las diferencias
entre individuos.

¿Cómo puede aportar la Estadística a la Educación, si ésta es ciencia de lo


particular, si cada persona es única? ¿Qué de la especificidad de cada experiencia
individual de aprendizaje? Para entender esto se debe, en primer lugar, recordar
que cada hecho social o individual que se considera y que demanda explicación, está
determinado por un conjunto de factores muy amplio, se trata de lo que llamamos
multicausalidad. Es decir, no hay hechos psicológicos, educativos, ni sociales que
puedan explicarse a partir de una única “causa”.

En segundo lugar, el conjunto de factores que explican un hecho, puede dividirse


en aquellos que afectan al individuo de modo exclusivo y aquellos de carácter colec-
tivo. Los individuales hacen de cada sujeto un caso único, los colectivos ubican al
individuo en similitud con quienes comparte un grupo o diversos grupos.

La dificultad de un niño para estudiar Matemática puede explicarse por el modo


en que la materia se enseña, por la actitud de sus padres hacia la matemática, por sus
propias creencias acerca de la dificultad intrínseca de la materia y por otros factores
más íntimos relacionados con su historia personal. Algunas de estas explicaciones
pueden analizarse de manera colectiva, buscando mejores métodos para enseñar Ma-
temática, investigando de qué manera la actitud de los padres o las creencias de los
estudiantes pueden incidir en su desempeño en la materia. El estudio de estos fac-
tores colectivos se ve auxiliado por la Estadística, que permite tratar con conjuntos
de individuos y ver las regularidades que solo se aprecian cuando se los considera
agrupados.

Veamos cómo se materializa este cambio en la mirada desde el individuo hacia


el grupo. La siguiente es una lista de las materias que tienen aprobadas algunos
alumnos de segundo año de una carrera universitaria:
1.1. ¿ESTADÍSTICA Y EDUCACIÓN? 3

La lista los individualiza, los reconoce por su nombre, nos dice cuántas materias
aprobó cada uno. Si transformamos esa lista en una tabla:

Leemos ahora que con cuatro materias aprobadas hay dos alumnos, con cinco
hay seis y solo uno tiene seis materias aprobadas. Las personas desaparecieron, ya
no hay nombres, hemos abstraído para referirnos a las materias aprobadas, no a los
alumnos. En la tabla vemos que lo más frecuente es que tengan cinco materias apro-
badas y que seis es excepcional. Hemos pasado de la lista de individuos a la tabla
de valores. Nos despegamos de los casos a fin de buscar la regularidad en el conjunto.

En Educación, el campo de aplicación de la Estadística es tanto o más vasto


que en Psicología, porque los organismos gubernamentales y no gubernamentales
producen grandes cantidades de datos, muy valiosos para detectar problemas de de-
terminados sectores de la población, o para comparar entre países, entre sistemas
educativos diferentes.

Eso hace la Estadística, es una operación muy importante en la Psicología y en


Educación, porque está dirigida a ver el modo en que los factores generales afectan
lo que se observa, más allá de los casos particulares, para después volver al caso
individual.

La ciencia basada en un proceso analítico y crítico produce el conocimiento que


ha permitido una mejor comprensión de la realidad circundante. Asimismo, ha facul-
tado al hombre para penetrar en los secretos más profundos del mundo, incluido el
ser del hombre mismo. La ciencia ha facilitado el desarrollo de teorías que exponen
la realidad, con base en un examen de la relación entre los intentos de explicación
teórica, evidencia empírica y congruencia lógica, tanto interna a la explicación como
en lo relativo a otras teorías con las que tienen vínculos conceptuales. Esto ha impli-
cado que el científico pruebe sus teorías confrontándolas con la evidencia existente
que, con el objeto de evaluar la teoría de que se trata, se acumula con procedimientos
rigurosos.
4 CAPÍTULO 1. ESTADÍSTICA EN EDUCACIÓN.

1.2. Relación entre Estadística e Investigación.


El tema de este capítulo es examinar el papel que tiene la estadística en la inves-
tigación educativa. La estadística es una rama de las matemáticas que se dedica a
entender los fenómenos que tienen un cierto grado de azar. En la ciencia se enfren-
ta el problema de que los fenómenos son multicausales y existe una diversidad de
aspectos de los que sólo se tiene un grado de control relativo. Frente a esta proble-
mática, resulta útil emplear un método que permita lidiar con datos con una cierta
dosis de incertidumbre. En realidad la estadística es un instrumento muy valioso
para organizar la información científica y para tomar decisiones acerca de ella; sería
imposible concebir la investigación científica moderna sin dicha estadística.

La investigación, con muy raras excepciones, se refiere a grupos de datos e incluso


a grupos de objetos, plantas, animales o personas. Un investigador en astronomía
puede tomar varios registros de la distancia a la que se encuentra la Luna o algún
objeto lejano con una técnica específica (por ejemplo, usando un radar) para contro-
lar el error de medida, y luego usar la estadística para decidir si su nueva medición es
igual o diferente a la que tuvo usando un método más primitivo. Un psicólogo, puede
medir la ejecución de una tarea por tres grupos de sujetos en un experimento que
difieran en la cantidad de alcohol que han ingerido, para ver el efecto sobre una tarea
consistente en colocar palitos en agujeros hechos en una tabla. En este caso, es posi-
ble usar la estadística para establecer si hay diferencias entre estos grupos de sujetos.

La ciencia busca establecer hechos para determinar qué tan verdaderas son las
teorías, es decir, para ponerlas a prueba. Por lo común, esto se da en el contexto
de la competencia entre teorías explicativas de un ámbito de la realidad. La cohe-
rencia lógica de las teorías, así como su congruencia con otras y con los hechos, es
lo que determina su utilidad. La capacidad de las teorías para permitir la aventu-
ra en zonas desconocidas de la realidad es otro factor importante para su evaluación.

Los experimentos son una manera rigurosa de establecer los hechos. La estadís-
tica ayuda a la experimentación a obtener conclusiones útiles, claras y válidas; por
tanto, existe una relación íntima entre estadística e investigación, la estadística per-
mite lograr dichas conclusiones. Incluso, para entender los informes de investigación,
es indispensable saber estadística.

En este capítulo se muestra la importancia de la estadística para el desarrollo


científico y profesional de los psicólogos, pedagogos, sociólogos, antropólogos y otros
especialistas en las áreas de ciencias del comportamiento.

1.3. Las áreas de la Estadística.


Dos amplios conjuntos de procedimientos constituyen el aporte que la Estadís-
tica hace a la construcción de conocimiento: el resumen de un conjunto grande de
información y la extensión de las conclusiones que se observan en ciertos sujetos, a
1.3. LAS ÁREAS DE LA ESTADÍSTICA. 5

otros sujetos que no han sido observados. Estas dos grandes funciones son considera-
das como dos áreas de la Estadística, a las que se denomina descriptiva e inferencial
respectivamente.

Antes de señalar los objetivos que se persiguen en cada una de estas áreas, con-
viene hacer una breve referencia a la distinción entre muestra y población —aunque
volveremos sobre ella en el capítulo dedicado al muestreo—, ya que ella articula las
dos áreas. Los datos que recogemos están limitados en su alcance a las posibilidades
de nuestro estudio; si el objetivo es generalizar los resultados, esos casos que ob-
servemos serán una fracción de un universo mayor. Cuando analizamos la ansiedad
frente a los exámenes en estudiantes universitarios, no está dentro de nuestras posi-
bilidades observar a todos los estudiantes universitarios. Por el contrario, habremos
de seleccionar a algunos de ellos. Ese conjunto de estudiantes que seleccionamos se
llama muestra y nos aportará la información sobre la que trabajaremos. Según el
modo en que la muestra haya sido seleccionada, los resultados se podrán extender a
una población de referencia, que en este ejemplo podría ser la del total de estudiantes
de una universidad (de la que se extrajo la muestra). Las condiciones para que esta
generalización sea posible serán expuestas en detalle en el capítulo correspondiente.

La Estadística descriptiva

Debido a que en estadística no trabajamos con individuos aislados sino con con-
juntos de ellos, siempre es necesario resumir la información, para presentarla de
manera accesible a la lectura y para extraer significado.

Una gran tabla proveniente de registros hospitalarios que muestre las edades de
madres primerizas no puede leerse de manera directa; es necesario buscar indicadores
de síntesis, uno de ellos, muy frecuente, es el promedio. Sucede del mismo modo si
contamos con los puntajes de una prueba de memoria aplicada a muchas personas.
O también si tenemos el listado de alumnos de una escuela y de cada uno sabemos
si repite o no el curso. En esos casos podemos resumir esa información indicando el
promedio.

También es posible indicar cuántas personas tienen un valor menor a cierta cifra
o mayor a otra: ¿Cuántas de las madres primerizas son menores de 20 años?, ¿re-
piten de grado con igual frecuencia los varones que las mujeres?. O bien expresar
los valores a través de gráficos, que suelen aportar mucha información de manera
abreviada (aunque a veces también pueden ser engañosos).

Cuando de cada alumno de una escuela conocemos si repite el curso o no, es


conveniente calcular una tasa de repitencia para cada curso o para cada escuela, en
lugar de indicar la condición de repitente o no de cada alumno.

Así, la Estadística descriptiva nos proveerá de una serie de procedimientos diri-


gidos a resumir, a sintetizar información, a volverla manejable para que podamos
interpretarla y extraer conclusiones a partir del conjunto de datos que, de otra ma-
6 CAPÍTULO 1. ESTADÍSTICA EN EDUCACIÓN.

nera, serían ininteligibles.

La inferencia estadística

Una vez que disponemos de una síntesis de la información que hemos recogido de
un conjunto de individuos, nos interesa otro problema: el de preguntarnos si eso que
observamos vale también para otros, a los que no hemos observado. Si hemos visto a
muchas personas, algunas exigentes consigo mismo y otras que no lo son y hallamos
que las primeras manifiestan más ansiedad en los exámenes que las segundas, ¿pode-
mos decir que la autoexigencia incide en la ansiedad?, es decir, ¿podemos generalizar
nuestro resultado? La Estadística inferencial se ocupará de esto, de decirnos bajo
qué condiciones se pueden extender nuestros hallazgos a casos no observados.

Si encontramos niños de madres que han tomado bebidas alcohólicas durante el


embarazo y niños de madres que no bebieron y descubrimos que, en promedio, los
hijos de madres bebedoras tienen niveles de desarrollo motor más bajo que los hijos
de madres no bebedoras ¿podemos afirmar que beber alcohol durante el embarazo
retrasa el desarrollo motor de los hijos? Según cuántos niños hayamos observado,
según qué tan grande sea la diferencia entre el promedio de desarrollo motor de los
hijos de bebedoras y no bebedoras, según qué tan variable sea el desarrollo entre los
niños, tendremos o no argumentos para generalizar el resultado y afirmar que existe
o no una relación entre consumo de alcohol durante el embarazo y desarrollo motor
del niño.

En todos los casos, cuando sea posible hacer generalizaciones, éstas estarán limi-
tadas a un contexto específico. El análisis que se haga, de la relación entre pobreza
y educación en Argentina, puede no ser válido para la población de Brasil. Es decir,
debe estar explícita cuál es la población de referencia a la cual es válido extender
los resultados que se obtienen.

Puede considerarse a la descripción como una etapa anterior a la inferencia, ya


que esta última no puede lograrse sin una adecuada descripción previa de la infor-
mación. Pero la descripción tiene entidad propia y, como se verá en Metodología de
la Investigación, un estudio puede plantearse objetivos exclusivamente descriptivos,
que no se dirijan a generalizar los resultados obtenidos.

En estos ejemplos, el resultado estadístico se halla en el origen de la indagación,


en la construcción del problema de investigación y no (solamente) en el análisis pos-
terior de los datos recogidos. Esto muestra el carácter herramental de la Estadística:
su uso siempre estará al servicio de la producción de conocimiento validado.
CAPÍTULO 2
ESTADÍSTICA DESCRIPTIVA.

El objetivo central del presente capítulo es que el lector sea capaz de explicar y
realizar las diferentes representaciones gráficas, distribuciones de frecuencia con sus
respectivas curvas y aplicar los procedimientos para calcular las medidas de tenden-
cia central y dispersión, tanto para datos agrupados como no agrupados.

De igual forma, al término del mismo el lector podrá:

∗ Diseñar y construir una distribución de frecuencias.

∗ Interpretar la información que se representa en las siguientes gráficas: de ba-


rras, circulares, polígonos de frecuencias, histogramas, ojivas, diagramas de
tallo y hojas, diagramas de Pareto y graficas de cajas.

∗ Diferenciar los procedimientos para el cálculo de las medidas de tendencia cen-


tral y de dispersión, tanto para datos agrupados como para los no agrupados.

∗ Interpretar el significado de la media aritmética, de la mediana, moda, ran-


go, desviación estándar, varianza, coeficiente de variación, de asimetría y de
curtosis.

∗ Reconocer la importancia de la obtención de la desviación estándar además de


la media aritmética.

∗ Diferenciar el punto de vista de los positivistas y los justificacionistas con


relación a la ciencia.

2.1. Terminología estadística.


Llegados a este punto, vamos a definir algunos términos fundamentalesque se
utilizaran en esta guía. Daremos solamente el vocabulario estadístico básico de esta
sección pues los demás términos se definiran a medida que se vayan presentando.

7
8 CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA.

Entidad. En el análisis estadístico se considera la atención en un conjunto de


personas, lugares o cosas. Un educador puede mostrar interés por aquellos estudian-
tes que han aprendido a leer empleando determinando método. Vamos a utilizar la
palabra entidad como término general para referirnos a un miembro individual de
un grupo de personas, lugares o cosas.

Variable. Es el conjunto de caracterísiticas de las entidades que interesan en


una investigación científica. El educador le puede llamar la atención el rendimiento
en la lectura de los estudiantes que han aprendido a leer con método determina-
do. En virtud de que cualquier caracterísitica, por regla general, presenta un valor
diferente cuando se observa en diferentes entidades, ella recibe el nombre de variable.

Variable aleatoria. Si los valores numéricos que toman una variable provienen
de factores fortuitos y si un determinado valor no se puede predecir exactamente
con anticipación, esa variable se denomina variable aleatoria.

Para representar las variables aleatorias utilizaremos letras mayúsculas como X,


Y y Z. De esta manera, podremos referirnos a la variable aleatoria “edad” como X
o a la variable aleatoria “estatura” como Y . Los valores individuales de una variable
aleatoria se representarán con letras minúsculas tales como x, y y z.

Fuera de esto, las variables se pueden clasificar según sean continuas o discre-
tas o según sean cuantitativas o cualitativas.

Variable continua. Una variable continua es aquella que teóricamente puede


tomar cualquier valor dentro de un intervalo de valores. Un ejemplo de variable con-
tinua es la estatura humana, sin tener en cuenta qué tan próxima sea la estatura de
dos personas, es posible teóricamente encontrar otra persona más alta que la más
baja y a la vez más baja que la más alta de las dos.

Variable discreta. Cuando los valores que pude tomar una variable están se-
parados entre sí por una determinada cantidad, la variable se denomina variable
discreta. Como ejemplo: el número de estudiantes de primer año en un sistema es-
colar determinado.

Variable cuantitativa. Se dice que una variable es una variable cuantitativa


siempre que los valores que puedan asumir sean los resultados de medidas númericas.
Alguno de estos es la estatura, el peso, temperatura, etc.

Variable cualitativa. Hay muchos casos en que no es posible hacer medidas


numéricas. Si la entidades de interés son estudiantes universitarios y si la variable
de interés es “curso” la variable puede asumir los valores cualitativos de primero,
segundo, tercero, etc.

Población. El conjunto más grande de valores (de una variable), por el cual
existe algún interés.
2.2. DATOS AGRUPADOS. GRÁFICAS Y DISTRIBUCIÓN DE FRECUENCIAS.9

Muestra. Es una parte de la población. Puede ser necesario o conveniente exa-


minar solo una vfracción (muestra) de la población.

2.2. Datos agrupados. Gráficas y distribución de


frecuencias.
Para la mayoría de las personas cuando los datos se presentan en forma numérica,
tienen poco significado o carecen de él. En cambio, si se representan gráficamente,
resultan muy eficaces para facilitar la comprensión y permiten extraer conclusiones
acerca del comportamiento real de la variable. Pero es necesario que el impacto vi-
sual de la representación gráfica resuma la información, en forma clara, concisa y
atractiva.

2.2.1. Gráfica circular (o de sectores).


Este método gráfico es uno de los más simples y usuales, y un instrumento au-
xiliar de análisis y presentación de la información, que resulta muy valioso para el
investigador. Éste, como un diagrama en forma de círculo, es particularmente útil
para visualizar las diferencias de frecuencia entre algunas categorías de nivel nominal.

Ejemplo 1:

En la figura se representa una población (en determinado año) de 5000 estudian-


tes de la Facultad de Psicología de la Universidad Nacional Autónoma de México
(UNAM), considerando únicamente la variable sexo.

En esta gráfica 2.1 se representa la correspondencia entre los 360 grados de cir-
cunferencia, es decir, el círculo completo, con 100 % de las observaciones, por tanto,
para hacer esta gráfica es necesario tener los datos en porcentajes.

En los 5000 estudiantes, 64 % está constituido por mujeres y 36 % por hombres;


para obtener la proporción de grados (el círculo tiene 360◦ ), aplique una regla de tres
en la siguiente forma, tomando, en este caso, el dato del porcentaje de las mujeres
360 x
100
= 64 despejando x la cantidad de grados correspondientes al 64 % es igual a
230. 4◦ .

Se ubica esta cantidad en un círculo y obtiene lo siguiente:

2.2.2. Gráfica de barras


Consiste en un conjunto de columnas separadas que representan la frecuencia o
el porcentaje de cada uno de los valores o categorías de la variable de interés.
10 CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA.

Figura 2.1: Gráfica circular.

Según el caso anterior, donde 64 % son mujeres y 36 % hombres, la gráfica de


barras sería la que se muestra en la figura 2.2, donde el eje horizontal (x) representa
la variable de interés (sexo) y el eje vertical (y) representa la frecuencia (número de
casos).

Figura 2.2: Gráfica de barras.

Ejemplo 2:

En una empresa se entrevistó a todos los empleados que estaban por cumplir 20
años de servicio; entre las preguntas de dicha entrevista, considere únicamente la
que hace referencia el número de hijos que tienen.

A continuación, aparecen los datos obtenidos, organizados en una tabla de dis-


2.2. DATOS AGRUPADOS. GRÁFICAS Y DISTRIBUCIÓN DE FRECUENCIAS.11

tribución de frecuencias. Una forma común de organizar un conjunto de datos, es


agrupándolos en intervalos, categorías o clases, indicando la frecuencia o número de
casos de cada uno de ellos.

Con estos datos, se ha construido una gráfica de barras (Figura 2.3).

Cuando la variable de interés es discreta, como en este ejemplo, una primera


medida de tendencia central que puede analizarse es la moda, en otras palabras, el
dato que tiene la mayor frecuencia de ocurrencia. En este caso, la frecuencia mayor
es 25 y la moda 3, que representa 25 % de casos.

Figura 2.3

2.2.3. Histograma
Este diagrama es útil cuando se trata de representar distribuciones de frecuencia
cuya variable es continua, y viene dada en intervalos o clases; dicha gráfica se define
y construye como la gráfica de barras, con la diferencia de que las columnas no están
separadas, sino unidas, lo que le da continuidad.
12 CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA.

Figura 2.4: Modelo de histograma

2.2.4. Polígono de frecuencias.


Es una gráfica lineal y se construye uniendo, por medio de segmentos, los pun-
tos medios superiores (marcas de clase) de cada una de las columnas que forman
el histograma. El polígono de frecuencias puede contener una amplia variedad de
categorías o intervalos y tiende a destacar la continuidad a lo largo de una escala;
por tanto, es útil para representar puntuaciones ordinales y de intervalos.

Figura 2.5: Representación de un polígono de frecuencia.

2.3. Tablas de distribución de frecuencias.


El procedimiento para elaborar una distribución de frecuencias, y su tabla respec-
tiva, se describirá con base en un ejemplo. En un programa de autocontrol personal
del peso, aplicado a 90 alumnos de una escuela, los kilogramos que éstas perdieron
al terminar dicho programa se muestran a continuación:
2.3. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS. 13

Figura 2.6: Tabla de autocontrol personal del peso.

Paso 1. Agrupamiento u ordenación. Se forma una tabla ordenando progre-


sivamente los datos, aunque se repitan:

Figura 2.7: Tabla de autocontrol personal del peso.

Paso 2. Marcas de repetición. Después de ordenar los datos, se forma otra


tabla en la que se indican con rayas (/) las veces que se repite cada dato:
14 CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA.

Figura 2.8: Tabla de autocontrol personal del peso.

Paso 3. Frecuencias. La siguiente tabla que se forma será similar a la anterior,


pero en lugar de rayas o marcas, se pondrá el número de ellas. Los números obtenidos
se llaman frecuencias, puesto que indican las veces que se repite un dato. En esta
tabla, x representa los datos (kilogramos perdidos) y f su frecuencia.
2.3. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS. 15

Figura 2.9: Tabla de autocontrol personal del peso.

Paso 4a. Clasificación en forma práctica. Los datos se agrupan en intervalos


o clases, que pueden ser de longitudes: 2, 3, 5, etc. A continuación se muestra para
cada una de ellas:

Figura 2.10: Muestra de clase tamaño 2.

Paso 4b. Clasificación en forma analítica. En el ejemplo, el tamaño de clase


será 5 y la serie de datos irá en forma creciente, es decir, de 6 a 44 (aunque puede
agruparse también en forma decreciente, de 44 a 6). Ahora se determina la amplitud
de variación de la siguiente manera:

Amplitud(A) = P untuación máxima − P untuación mínima

De modo que
A = 44 − 6 = 38
16 CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA.

Figura 2.11: Muestra de clase tamaño 3 y 5.

Por tanto,

Número de intervalos o clases 38


5
= 7. 6, en este texto se denotará por k(k = 7. 6).
Y este valor se redondea al entero próximo (k = 8).

En este caso, para tratar de aproximar lo más posible y obtener el intervalo más
exacto, se lleva a cabo el siguiente procedimiento: se aumenta un punto en el extremo
superior y se disminuye un punto en el extremo inferior de los datos de la tabla (la
frecuencia para estos datos agregados es de 0).
Por tanto, la amplitud queda com0

A = 45 − 5 = 40

Por consiguiente:

Tamaño del intervalo donde k = 8 y el tamaño del intervalo se denotará por a,


a = 5.
2.3. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS. 17

De este modo, la tabla quedará finalmente así:

Figura 2.12: Frecuencia con marca de clase

Y su representación gráfica será:

Figura 2.13: Representación gráfica del tamaño de clases.

Paso 5. Marcas de clase (MC) e intervalo modal (IM). La marca de clase,


o punto medio de clase, (promedio del intervalo) se obtiene mediante la siguiente
fórmula:
LI + LS
x=
2
Para la totalidad de las clases resulta, entonces:
18 CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA.

El intervalo modal (IM) es el que contiene la mayor frecuencia. En consecuencia:

Paso 6 Límites inferior y superior reales. Como se observa, hay puntuacio-


nes que no están comprendidas. En los intervalos determinados en los pasos 4a y b,
por ejemplo, si un dato cayera en 9, 4, o 14.3, no habría clase dónde ubicarlo, por lo
que es necesario tomar límites más amplios para cada intervalo. Tales valores son el
límite inferior real (LIR) y el límite superior real (LSR), y se obtienen de la manera
siguiente:
2.3. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS. 19

Una vez obtenidos el LIR y el LSR, se marcarán en la gráfica. Al señalarlos, el


diagrama se convierte en una gráfica de barras y se observa que las mismas ya están
unidas, lo que da un histograma. Tomando el punto medio en la parte superior de
cada una de las barras y uniéndolas por líneas, se obtiene un polígono de frecuencias.

Figura 2.14: Histograma y gráfica de polígonos.

Paso 7. Frecuencia relativa y frecuencia relativa acumulada. Se ordenan


todas las columnas obtenidas anteriormente, y se agregan dos más, que son las de
frecuencia relativa (fr ) y de frecuencia relativa acumulada (fra ).

La columna de fr se obtiene tomando el porcentaje de la frecuencia de cada


intervalo y asignando 100 % al número total de frecuencias (en este caso, 90 es
100 %). La fra se obtiene sumando la frecuencia relativa de un intervalo a la del
anterior (en el último intervalo siempre será 100 %):

2.3.1. Medidas de tendencia central.


En ocasiones es necesario considerar o disponer de valores que sean representa-
tivos de la distribución del conjunto de datos que forman las puntuaciones, a fin de
20 CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA.

poder contestar preguntas como las siguientes:

¿En qué forma es posible dividir en dos intervalos un conjunto de mediciones


de valores, de manera que un grupo contenga la mitad superior del intervalo
(50 %) y el otro la mitad inferior (el restante 50 %)?

¿Cuál sería la puntuación promedio de dichos datos (los dos grupos o el total
de la muestra)?

¿Cuál es la puntuación más común (la que ocurre con más frecuencia en los
datos)?
Las preguntas anteriores pueden ser contestadas utilizando las medidas de ten-
dencia central. Estos valores estadísticos, por lo general, se encuentran en el centro
de la distribución, cuando se observa una concentración de casos en el centro. Las
tres medidas de tendencia central utilizadas principalmente, y que responden a las
tres preguntas anteriores son la mediana (M e), la moda (M o) y la media aritmética
(x̄) .

2.3.1.1. Mediana (M e)
Se define como el punto medio geométrico de la distribución de datos agrupados,
o sea, el punto que divide a dicha distribución en dos mitades respecto de las fre-
cuencias. Esta medida de tendencia central es de gran utilidad cuando se desconocen
las puntuaciones extremas, y se considera la forma de la distribución de frecuencias.
Su fórmula de cálculo es la siguiente:
n
" ! #
2
− faa
M e = LIR + a
f
donde:
LIR = Límite inferior real del intervalo, donde fra está cerca del 50 %.
n = Número de casos.
faa = Frecuencia acumulada anterior al intervalo, donde cae la mediana (50 %).
f = Frecuencia absoluta donde cae la mediana.
2.3. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS. 21

a = Tamaño del intervalo.

2.3.2. Moda (M o)
Es el dato que ocurre más veces (que tiene la mayor frecuencia de ocurrencia).
Para datos agrupados se obtiene utilizando la siguiente fórmula:
" ! #
fp
M o = LIR + a
fa + fp
donde:
LIR = Límite inferior real del intervalo modal.
fp = Frecuencia absoluta posterior a la frecuencia del intervalo modal.
fa = Frecuencia absoluta anterior a la frecuencia del intervalo modal.
a = Tamaño del intervalo.

2.3.3. Media aritmética (x̄)


Esta medida suele recibir también el nombre de media o promedio, y es el valor
estadístico de tendencia central más utilizado, su confiabilidad depende de la forma
de su distribución y de la existencia o no de valores extremos. Por lo general, es una
buena representación de un conjunto de datos y se le puede considerar como el punto
de equilibrio (o “centro de gravedad”) de un conjunto de mediciones o puntuaciones;
en el caso de que no se encuentren agrupadas en intervalos, se define como la suma
de todas ellas, dividida entre el total de casos.

La fórmula para datos no agrupados es:


n
P
xi
i=1
x̄ =
n
En el caso de los datos agrupados, la definición varía, ya que intervienen conceptos
nuevos como marca de clase y frecuencia, pero el concepto de media prevalece. La
marca de clase se obtiene sumando el límite inferior y el límite superior de cada
intervalo y dividiendo dicha suma entre 2 (se obtiene así un promedio por cada
clase). Tal promedio es multiplicado por su frecuencia correspondiente. Una vez que
se obtiene esto para cada intervalo o clase, se suman todos los resultados y se divide
la suma entre el número total de casos, que equivale a la suma de las frecuencias.
Es decir:
LI + LS LIR + LSR
Marca de clase = =x=
2 2
De manera que:
q
P
(fi xi )
i=1
x̄ = Pq
fi
i=1
22 CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA.

donde:
q = número de clases.
x̄= media aritmética para datos agrupados.

Ejemplo

Considerando los datos del ejercicio del programa de autocontrol para pérdida
de peso, aplicado a 90 personas, calcule a continuación tanto media como mediana
y moda, cuando a = 5.

a) Cálculo de la media aritmética.

Paso 1. Se calcula la marca de clase para cada uno de los intervalos:


5+9
=7
2

Paso 2. Se hacen las operaciones para obtener la columna f x:

P P
Paso 3. Se determina f y (f x) con los resultados anteriores:
X
f = 9 + 19 + . . . + 2 = 90
X
(f x) = 63 + 228 + . . . + 84 = 1600

Paso 4. Se sustituye en la fórmula de la media aritmética y se obtiene así:


1600
x̄ = = 17. 7778
90

b) Para calcular las otras medidas de tendencia central, la mediana y moda, aplique,
respectivamente, las siguientes fórmulas a la tabla que se presenta después:
2.3. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS. 23

n
" ! #
2
− faa
M e = LIR + a
f
" ! #
fp
M o = LIR + a
fa + fp

En la tabla anterior se localizan todos los elementos que se requieren para calcu-
lar tanto la mediana (M e) como la moda (M o).

Para obtener la mediana:

LIR = 14. 5, ya que 50 % está contenido en la fra = 67. 77 %

donde:

n
n = 90, 2
= 45 , a = 5, faa = 28 y f = 33
24 CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA.

Sustituya en la fórmula:
45 − 28
  
M e = 14. 5 + (5) = 17. 076
33

Para obtener la moda:

LIR = 14. 5, ya que 33 es la frecuencia más alta, fp = 15, fa = 19 y a = 5.

Sustituya en la fórmula:
15
  
M o = 14. 5 + (5) = 16. 706
19 + 15
CAPÍTULO 3
PROBABILIDAD

En nuestra diaria comuniación nos hemos acostubrado a hacer y a oir afirmacio-


nes que llevan implicito el concepto de probabilidades: los pronósticos meteorológicos
nos señalan las probabilidades de lluvia; los médicos nos dicen que probabilidades
hay de que nuestras enfermedades se curen por medio de determindados tratamientos
terapéuticos; los consejeros escolares, en el colegio, especualan nuestras posibilidades
de éxito en la universidad.

3.1. La esencia de la probabilidad


Podemos definir en forma muy simple la probabilidad comoun número, de 0 a 1,
que le asignemos a un fenómeno para indicar su posibilidaad de ocurrir. Le asigna-
mos una probabilidad de 0 a un fenómeno que no puede ocurrir y una probabilidad
de 1 a un fenómeno que con certeza ocurrirá.

Con el fin de facilitar la comprensión de lo que sigue, definiremos algunos térmi-


nos. El primero de ellos es experimento cuya definición será: proceso o actividad
que conduce un resultado u observación. A cada uno de los posibles resultados de
un experimento se le denomina evento.

Por ejemplo un experimento sería aplicar un examen a un estudiante y uno de los


eventos podría ser una calificación numérica de 0 a 10 o bien podría ser dos eventos
nada más que serían pasar o reprobar.

Decimos que dos o más eventos son mutuamente excluyentes, si en caso de


ocurrir uno de los otros no pueden ocurrir. Los eventos pasa y reprobar son mutua-
mente excluyentes.

Definición: Si en un experimento pueden producirse N resultados igualmente


probables y mutuamente excluyentes y si dentro de estos N resultados el evento E

25
26 CAPÍTULO 3. PROBABILIDAD

puede ocurrir NE veces, la probabilidad del evento E, que se escribe P (E), está dado
por
NE
P (E) =
N
.

3.2. Algunas ideas fundamentales de la teoría de


conjuntos.
Definición: Un conjunto es una colección bien definida de objetos.

A los objetos de que está compuesto un conjunto le damos el nombre de ele-


mentos.

Un conjunto se puede describir de dos maneras diferentes: por el método de lista


o por el método de regla.

También podría gustarte