La Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los

datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población. Según se haga el estudio sobre todos los elementos de la población o sobre un grupo de ella, vamos a diferenciar dos tipos de Estadística: Estadística descriptiva. Realiza el estudio sobre la población completa, observando una característica de la misma y calculando unos parámetros que den información global de toda la población. Estadística inferencial. Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la población. Veamos dos ejemplos que nos aclaren estos dos tipos de Estadística: Ejemplo 1. Cuando van a llegar cualquier tipo de elecciones, por ejemplo, las elecciones generales, es muy frecuente que los medios de comunicación, nos adelanten los resultados de encuestas o sondeos en los que se nos indica el resultado final de dichas elecciones con una precisión y con un error determinado. Estos sondeos son realizados por distintas técnicas sobre un grupo (muestra) más o menos numeroso de personas. Naturalmente, cuanto mayor sea el número de individuos con derecho a voto, encuestados, mayor será la confiabilidad de la encuesta, pero también mayor será el costo del sondeo. El estudio de esta muestra se haría mediante estadística descriptiva, pero lo que nos interesa no es el resultado de este estudio reducido sino el resultado final de las elecciones. El paso de generalizar los resultados de la muestra a toda la población, se hace mediante técnicas de Estadística inferencial. La elección de la muestra debe hacerse mediante métodos de muestreo para que el estudio resulte lo más confiable posible. Ejemplo 2. Supongamos que estamos en un instituto con un número muy elevado de alumnos y alumnas, por ejemplo 500, y queremos hacer un estudio estadístico sobre su altura. Un método sería pasar clase por clase y medirlos a todos, esto podría llevar un tiempo considerable pero sería la forma más exacta de hacer dicho estudio, aunque es fácil encontrarnos con ausencias y tendríamos que volver varios días y pasar lista para conseguir la estatura de todo el alumnado. Una vez que tengamos todos los datos en nuestro poder los resultados los obtendríamos mediante Estadística descriptiva.

Otra posibilidad podría ser pasar clase por clase, decirle a los alumnos y alumnas que anoten su estatura en un papel y recogerlos todos. También así tendríamos un estudio de Estadística descriptiva, aunque seguramente menos fiable que con el método anterior, pues casi con toda seguridad, y lo digo por experiencia, algunos alumnos escriban su estatura a cálculo y otros, con ganas de bromas, muy por encima o muy por debajo de la realidad. Y otra posibilidad sería escoger una muestra, es decir un grupo, por ejemplo, 50 personas, hacer el estudio descriptivo sobre ellas y después generalizarlo a todo el instituto con Estadística inferencial. En este caso, comprobaríamos por una parte que cuanto mayor sea la muestra más trabajo tendremos, pero más confiable será el resultado final y por otra, que la elección de la muestra debe hacerse de manera que permita también fiarnos del resultado obtenido. Si estamos en segundo de bachillerato, ¿podríamos coger como muestra los 50 alumnos de este curso? ¿Por qué? ¿Qué forma de elegir la muestra se te ocurre? En cualquiera de los dos ejemplos, ¿cuáles serían los resultados más confiables? Conceptos básicos. Ya hemos hablado de ellos en los ejemplos anteriores, en cualquier estudio estadístico aparecerán los conceptos: individuo, observación o dato, cada uno de los elementos, personas u objetos que se van a estudiar; población, que es el conjunto formado por todos los elementos a los que les vamos a hacer el estudio; muestra, el subconjunto de la población que elegimos para hacer un estudio más reducido. 2. VARIABLES ESTADÍSTICAS.

Al hacer un estudio de una determinada población, observamos una característica o propiedad de sus elementos o individuos. Por ejemplo, con los alumnos y alumnas de nuestra clase, podemos estudiar el lugar de residencia, el número de hermanos, la estatura, etc. Cada una de estas características estudiadas se llama variable estadística. Aunque este es el concepto que vamos a utilizar, también reciben el nombre de carácter estadístico. Dependiendo de la característica podemos distinguir varios tipos de variables:

Variable cualitativa. Es aquella característica que no podemos expresar con números y hay que expresarla con palabras. Por ejemplo, el lugar de residencia. Variable cuantitativa. Es cualquier característica que se puede expresar con números. Por ejemplo, el número de hermanos o la estatura. Dentro de esta variable podemos distinguir dos tipos: Variable cuantitativa discreta. Es aquella variable que puede tomar únicamente un número finito de valores. Por ejemplo, el número de hermanos. Variable cuantitativa continua . Es aquella variable que puede tomar cualquier valor dentro de un intervalo real. Por ejemplo, la estatura. Naturalmente, siempre que hacemos un estudio estadístico en una población, el número de individuos será muy pequeño o muy grande, pero siempre será un número finito. Por tanto, podríamos decir que todas las variables son discretas. Sin embargo, mientras que al estudiar el número de hermanos en un instituto de 500 alumnos y alumnas, nos vamos a encontrar entre cinco y diez valores distintos; al estudiar la estatura de todos con dos cifras decimales, nos podemos encontrar muchos más. En este último caso, aunque podamos tener 30 valores distintos, que es un número finito, hablaremos de variable continua. Esto se debe a que para trabajar con estos datos resulta mucho más fácil agruparlos en intervalos que hacerlo de forma aislada. Para hacer cálculos con una variable continua, utilizaremos el punto medio de cada intervalo, al que llamaremos marca de clase. Ahora, en tu tiempo independiente, Indica otros ejemplos de distintos tipos de variables estadísticas.

3. FRECUENCIAS. TABLAS ESTADÍSTICAS.

Para hacer un estudio estadístico de una característica de una población, necesitamos elegir dicha característica y después hacer un recuento. Uno de los primeros recuentos que hacemos en clase es en la elección del delegado o delegada del curso. Este recuento puede resultar más o menos fácil dependiendo del número de alumnos y alumnas que tengamos, ¿cuántas veces nos ha pasado

que no nos coincide el recuento final de los votos con el número de personas que hay? Una vez que hemos realizado el recuento, hay que organizar los datos y expresarlos de forma simplificada para que su interpretación sea fácil y rápida. Esto se hace disponiendo los datos por columnas o filas formando lo que llamamos una tabla estadística. Valores de la variable Número de veces que aparecen f1 f2 ... fn N: Número total de datos

x1 x2 ... xn

En primer lugar la tabla estará formada por estas dos columnas, pero más tarde iremos añadiendo más según los cálculos que necesitemos. Sin hacer muchos cálculos, podemos ir completando la tabla con las frecuencias, que definimos a continuación: Frecuencia absoluta. Es el número de veces que aparece cualquier valor de la variable. Se representa por f i. En algunos libros de texto nos la encontraremos representada por ni. Frecuencia absoluta acumulada. Es la suma de la frecuencia absoluta de un valor de la variable con todos los anteriores. Se representa por F i. Frecuencia relativa. Es el cociente entre la frecuencia absoluta y el número de datos (N). Se representa por fr. Al multiplicarla por 100 obtenemos el porcentaje de individuos que presentan esta característica.

Frecuencia relativa acumulada. Es la suma de la frecuencia relativa de un valor de la variable con todos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta acumulada y el número total de datos. Se representa por Far. Vamos a realizar tres estudios estadísticos entre nuestros alumnos y alumnas, cada uno de ellos correspondiente a un tipo de variable estadística: lugar de residencia, número de hermanos y estatura. Preguntamos uno a uno sobre estas características y obtenemos: Lugar de residencia: Antímano, P.A., P.A., P.A., P.A., P.A., P.A., P.A., P.A., Caricuao, Campo Alegre. Número de hermanos: 2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2. Estatura: 1.59, 1.75, 1.71, 1.85, 1.64, 1.62, 1.66, 1.60, 1.63, 1.76, 1.66. En las siguientes escenas puedes construir la tabla de frecuencias para variables discretas y continuas. Como puedes observar no se han tenido en cuenta las variables cualitativas. Esto se debe a que al no trabajar con números no se pueden hacer operaciones. Únicamente tendría sentido en la tabla construir las columnas de frecuencias absolutas y relativas, pero no las acumuladas. En el siguiente apartado de gráficos estadísticos también se podrían representar, pero para los apartados de cálculo de parámetros no podremos trabajar con ellas. si tienes interés en alguna representación, sustituye los valores la variable por los números que quieras y represéntalas o construye la tabla.

4. GRÁFICOS ESTADÍSTICOS.

Una vez construida la tabla de frecuencias, vamos a representar mediante distintos gráficos el estudio realizado. Entre los gráficos más utilizado podemos destacar: Diagrama de barras o rectángulos . Consiste en un sistema de coordenadas rectangulares y una barra o rectángulo para cada valor de la variable. Normalmente, se suele colocar en el eje horizontal los valores de la variable (aunque también se puede hacer en el vertical). El otro eje se gradúa

según los valores de las frecuencias. los rectángulos aparecen pegados en la representación gráfica. coloreando con distintos colores cada una de las regiones representadas en el estudio. Cartograma. ahora llega el momento de hacer un estudio de los mismos. La amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente. Después de haber representado los datos gráficamente. Representamos los puntos que tiene por primera coordenada el valor de la variable y por segunda el valor de la frecuencia. La representación gráfica consiste en dibujar una barra o un rectángulo para cada uno de los valores de la variable de altura igual a su frecuencia. Cuando el estudio estadístico se hace sobre una zona geográfica. Es un caso particular del diagrama anterior en el caso de variables continuas. la representación gráfica se puede hacer sobre un mapa. hay que hacer coincidir el área del rectángulo con la frecuencia del intervalo. Además de este dato existen otros datos (que llamaremos parámetros) que van a representar a toda la población o que nos van a indicar si la población está muy concentrada o muy dispersa. Consiste en la representación gráfica del estudio realizado utilizando dibujos alusivos a los distintos valores de la variable estadística. Representamos dos ejes rectangulares y representamos en el horizontal los valores de la variable y en el vertical las frecuencias. En caso de que la amplitud de los intervalos no se igual para todos. . 5. Pictograma. PARÁMETROS ESTADÍSTICOS. Si los intervalos son correlativos. Si estamos estudiando la estatura de todos los alumnos y alumnas del instituto y necesitamos dar información de este estudio. y que representa la estatura de todo el alumnado estudiado. Un ejemplo muy utilizado de histograma es una pirámide de población. Histograma de frecuencias. al que denominaremos media aritmética. Consiste en dividir un círculo en tantos sectores como valores de la variable. Polígono de frecuencias. Diagrama de sectores. parece razonable determinar un dato. Uniendo todos los puntos obtenemos una línea poligonal que es la representación que buscamos.

Parámetros o medidas estadísticos . es decir. Son datos que representan de forma global a toda la población. si hacemos un examen en la clase y queremos tener una idea global del resultado de dicho examen. Pueden ser de dos tipos: Parámetros o medidas de tendencia central o de centralización .1. lo que todos conocemos como calculando la media. Se representa por x Para calcular la media aritmética utilizaremos la siguiente fórmula X = ∑x N i . Por ejemplo. Parámetros o medidas de dispersión . Son datos que representan de forma global a toda la población. la moda y la mediana. la desviación media. ¿cómo lo podríamos hacer? Parece evidente que sumando todas las notas y dividiendo el resultado por el número de alumnos. 5. Entre ellos vamos a estudiar la media aritmética. Por ejemplo el recorrido. la varianza y la desviación típica. MEDIDAS DE TENDENCIA CENTRAL. Media aritmética. Se define la media aritmética como la suma de todos los _ datos dividida por el número de datos. Son datos que resumen el estudio realizado en la población. Son datos que informan de la concentración o dispersión de los datos respecto de los parámetros de centralización. Parámetros o medidas de tendencia central o de centralización .

Si la variable es discreta. vemos cuál es la mayor y la moda será el valor de la variable correspondiente a dicha frecuencia. . + ( xn )(fn ) N Si la variable es continua. En la siguiente escena podemos calcular la moda de una variable discreta. Vamos a distinguir para el cálculo de la moda entre variables discretas y continuas. podemos simplificar el cálculo de la media aritmética con la fórmula: X = ∑( x )(f ) i i N = ( x1 )(f1 ) + ( x 2 )(f2 ) + ( x3 )(f3 ) + . únicamente observamos las frecuencias. . es el decir. Por tanto. podemos observar que aparecen datos repetidos y que en un estudio estadístico tenemos los datos agrupados en una tabla en la que aparecen las frecuencias. el cálculo se hace de la misma forma pero utilizando las marcas de clase. Se define la moda como el valor de la variable que más se repite.Sin embargo. . el cálculo de la moda no presenta ninguna dificultad. Moda. aquél que tiene mayor frecuencia absoluta. Se representa por Mo.

Sin embargo si la variable es continua la mayor frecuencia absoluta corresponde a un intervalo. aplicamos la siguiente fórmula: en la que Li representa el límite inferior del intervalo modal. c es la amplitud del intervalo y fMo. habrá un sólo valor central. Si ordenamos todos los valores de la variable de menor a mayor. la mediana será el dato que ocupe el lugar central. Pero si queremos calcular un único valor de la variable para la moda. . fMo-1 y fMo+1 son las frecuencias del intervalo modal. Si la variable es discreta y el número de datos es impar. También vamos a distinguir para su cálculo entre variable discreta y variable continua. Aquí tenemos que comprender que si hay un número impar de valores. Mediana. del que decimos que es el intervalo modal. mientras que si hay un número par de valores habrá dos valores centrales. el anterior y el posterior. Se representa por Me. se define la mediana como el valor de la variable que está en el centro.

Deciles. C2 y C3. Los vamos a representar por C 1. Cuartiles. Son valores que dividen a la población en diez partes iguales. Lógicamente el segundo cuartil coincidirá con la mediana. tendremos un intervalo para la mediana. la mediana será la media aritmética de los dos valores centrales. Igual que se ha hecho con la moda podemos suponer que los datos se distribuyen uniformemente en los intervalos y calcular la mediana con la siguiente fórmula: en la que N representa el número de datos y F se refiere a la frecuencia absoluta acumulada. Cuartiles. deciles y percentiles . Entre cada dos de ellos estará el 25 % de los datos. Son valores que dividen a la población en cuatro partes iguales. Los .Si la variable es discreta y el número de datos es par. Entre las medidas de centralización y de dispersión podemos citar éstas que tienen el cálculo similar al de la mediana. Si la variable es continua. no distinguiremos si el número de datos es par o impar.

se hace de forma similar al cálculo de la mediana. El cálculo de estos parámetros. Si la variable es continua aplicamos la siguiente fórmula muy similar a la utilizada para el cálculo de la mediana: 5. Son datos que informan de la concentración o . Evidentemente los percentiles 25. el percentil buscado será la media aritmética entre el valor de la variable correspondiente y el siguiente. para calcular un percentil. 50 y 75 coinciden con los cuartiles. . 90 coinciden con los deciles. . Percentiles. Parámetros de dispersión . Si la variable es discreta. Si este valor no coincide con ninguna de las frecuencias absolutas acumuladas.representaremos por Dn.. El quinto decil coincide también con la mediana. cogemos el primer valor de la variable cuya frecuencia absoluta acumulada supera este dato. tanto para variables discretas como para variables continuas. Son valores que dividen a la población en cien partes iguales.. 20 . es decir para calcular el percentil de orden "p". Pero si este valor coincide con una frecuencia absoluta acumulada. PARÁMETROS O MEDIDAS DE DISPERSIÓN. Los representamos por Pn. calcularemos el porcentaje de datos que corresponde a dicho percentil.2. Y los percentiles 10. calcularemos p·N/100.

hace falta otros parámetros que informen sobre la mayor o menor concentración de los datos. un 5. la mitad de los alumnos ha sacado un 0 y la otra mitad un 10. Por ejemplo. Se representa por R I (RI=C3-C1) y representa la amplitud del intervalo en el que se encuentra el 50% central de los datos.dispersión de los datos respecto de los parámetros de centralización. Al calcular la media. Podemos definir la desviación media como la media aritmética de todas las desviaciones. ¿Cuál es la media en los dos casos? ¿Se pueden considerar los dos grupos iguales si la media coincide? Parece entonces que no es suficiente con las medidas de centralización. Se define el recorrido como la diferencia entre el mayor y el menor de los valores de la variable. A veces puede ocurrir que hay valores de la variable. todos los alumnos han sacado la misma nota. Es la diferencia entre los cuartiles tercero y primero. ¿Por qué? . podemos ver la diferencia que hay entre este parámetro y cada valor de la variable. Para estos casos es más útil el siguiente parámetro. excesivamente pequeños o grandes que hacen que la información que proporciona el recorrido sea equivocada. en otro. En uno. pero si la calculamos nos llevaremos la sorpresa de que vale 0. vamos a suponer que hemos realizado el mismo examen en dos grupos distintos. Nos indica un intervalo en el cual están comprendidos todos los datos. Recorrido. Se representa por R. por ejemplo si en la estatura tenemos todos los alumnos y alumnas con una estatura normal y uno o una mide alrededor de dos metros. Desviación media. Recorrido intercuartílico. a la que llamaremos desviación.

Para calcularla. aplicamos la fórmula: Si desarrollamos esta fórmula. La podremos calcular con la fórmula: Varianza. se define la desviación media como la media aritmética de los valores absolutos de las desviaciones respecto de la media. Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto de la media.Para evitar esta situación. podemos encontrar otra expresión más sencilla para el cálculo de la varianza: .

ESTUDIO DE MEDIA Y DESVIACIÓN TÍPICA. La media aritmética es el centro de gravedad de la distribución estadística.Desviación típica. Se define la desviación típica como la raíz cuadrada positiva de la varianza. Vamos a hacer un estudio conjunto de ambas para entender mejor su significado. De todos los parámetros estudiados. 6. Como ya hemos comentado. Si nos imaginamos el diagrama de barras o el histograma de frecuencias apoyado en un punto del eje horizontal de forma que quedase en equilibrio. el valor de este punto en dicho eje sería el valor de la media. los más significativos son la media para las medidas de centralización y la desviación típica para las medidas de dispersión. no es suficiente con un parámetro de .

25 Por tanto. es más homogéneo el conjunto de las vacas.1 Vp = 10/40 = 0. Puntuaciones normalizadas. Si antes hemos comparado variables. no podemos acudir a la desviación típica para ver la mayor o menor homogeneidad de los datos. Y este parámetro de dispersión va a ser la desviación típica. también podemos estar interesados en comparar datos de distribuciones distintas . y queremos comparar resultados. Si hemos realizado un estudio estadístico en dos poblaciones diferentes. y si los datos están más dispersos la desviación típica será mayor. en una exposición de ganado estudiamos un conjunto de vacas con una media de 500 kilos y una desviación típica de 50 kilos. pero si calculamos el coeficiente de variación para ambos: Vv = 50/500 = 0. llamado coeficiente de variación y que se define como el cociente entre la desviación típica y la media. Por ejemplo. es necesario un parámetro de dispersión que nos indique si los datos estudiados están más concentrados o más dispersos. Lógicamente si los datos están más concentrados la desviación típica será menor. Coeficiente de variación. Y observamos también un conjunto de perros con una media de 40 kilos y una desviación típica de 10 kilos. sino a otro parámetro nuevo. ¿Qué grupo de animales es más homogéneo? Un razonamiento falso sería decir que el conjunto de perros es más homogéneo porque su desviación típica es más pequeña.centralización.

suele suceder que la mediana esté comprendida entre la moda . si en la exposición de ganado anterior. Sin embargo existe también medidas que indican de la simetría o asimetría de la distribución y del achatamiento o no de la misma.y saber. es decir. entonces las tres medidas de centralización coinciden. cuál destaca más o menos dentro de su grupo según la característica observada. es lógico pensar que si la distribución tiene una única moda y es simétrica. Por ejemplo. MEDIDAS DE ASIMETRÍA. tiene más peso el animal que tiene mayor puntuación normalizada. escogemos una vaca que pesa 550 kilos y un perro que pesa 55 kilos. Hasta ahora se han estudiado los parámetros de centralización y de dispersión que son las medidas más frecuentes que se calculan en cualquier estudio estadístico. el perro. Si no es simétrica. Esto lo vamos a hacer tipificando la variable con la fórmula: Obteniendo así una nueva variable estadística de media 0 y desviación típica 1. Empezando con la simetría.5 Como las dos variables tipificadas tienen la misma media y la misma desviación típica. con la que resultará más fácil poder comparar los datos. 7. Tipificamos ambos valores y obtenemos: zv = (550-500)/50 =1 zp = (55-40)/10 = 1. ¿cuál tiene más peso dentro de su grupo? Naturalmente no vale decir la vaca que pesa mucho más.

y si es asimétrica a la izquierda. la distribución se llama leptocúrtica. Miden la mayor o menor concentración de datos alrededor de la media. Se suele medir con el coeficiente de curtosis: Si este coeficiente es nulo. la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica. es positivo.y la media. sería más achatada que la . si es asimétrica a la derecha. Existen dos medidas de este tipo: Índice de simetría de Pearson: Si la distribución es simétrica. el índice es igual a 0. es negativo. la distribución se llama platicúrtica y hay una menor concentración de datos en torno a la media. Miden la mayor o menor simetría de la distribución. Si el coeficiente es positivo. más puntiaguda que la anterior. Medidas de simetría o asimetría. Si el coeficiente es negativo. Hay una mayor concentración de los datos en torno a la media. Medidas de curtosis.

Así se ha desarrollado la estadística analítica o inferencial basada en la teoría de probabilidades que trata de obtener leyes generales a partir de la observación de algunos datos. Lo que posibilitó el cálculo de probabilidades fue. precisamente.primera. la palabra estadística procede de la palabra estado. Sin embargo las conclusiones extraídas se agotan en el propio conjunto de datos observados. Ya en la antigüedad los romanos y los egipcios hicieron intentos por tener un conocimiento preciso del número de sus habitantes y de sus posesiones. el desarrollo de un conjunto de métodos para extrapolar las conclusiones a entidades no observadas. representaciones gráficas. etc. Apuntes de Estadística Capítulo 1. Es decir. Para ello hicieron recolecciones de datos que posteriormente tenían que resumir de una forma comprensiva y que permitiera proporcionar informaciones útiles. por conocer el estado de sus naciones (de ahí la raíz del término). Sin embargo los auténticos fundadores de estas técnicas fueron KarlPearson (1857-1936) y Sir Ronald Fisher (1890-1962). Este tipo de estudios dio lugar a la estadística descriptiva cuya misión consiste en describir situaciones y proceso dados. para ello se sirve de tablas. proporcionó el instrumento adecuado para poder hacer inferencias acerca de grandes cantidades de observaciones potenciales a partir de unas pocas observaciones reales. que se encontraron en el siglo XIX. es decir. pues el objetivo consistía en hacerse una idea clara de lo que había. la antigua estadística y el cálculo de probabilidades. . Ahora se puede dar una definición de Estadística en la que aparecen algunos términos no definidos lo cual no impedirá entender su significado.. números índice y medidas típicas. La Estadística actual es el producto del encuentro y la propia fecundación de dos ramas distintas del saber. proporciones. y lo que había se contaba y se medía. Precisamente este fundamento probabilístico condiciona el que los resultados obtenidos se vean sujetos a unos márgenes de error. Estas técnicas tuvieron su fundamento en el desarrollo de la curva normal por Gauss. Etimológicamente.Introducción Las dos grandes funciones de la Estadística (descripción de datos y realización de inferencias) reflejan la propia historia del desarrollo de esta ciencia. en su aplicación por Galton a los problemas de herencia. Conceptos generales 1.

2ª Conocimiento de la clase El profesorse enfrenta a la tarea de la educación de unos alumnos ubicados en una clase.. que van a interaccionar con sus características personales. Por tanto.... 3. El conocimiento profundo de este contexto en el que está involucrado el alumno resulta de vital importancia para el educador y no será posible sin el análisis estadístico de los datos individuales de los elementos del contexto.La Estadística como herramienta para el profesor Dentro del ambiente educativo la Estadística es necesaria al menos para llevar a cabo estas cuatro tareas: 1ª Lectura de literatura profesional La investigación en Ciencias de la Educación emplea la Estadística como herramienta habitual en la realización de cualquier experimento. 4ª Investigación y predicción El profesor puede estar interesado en averiguar si una nueva técnica didáctica es realmente más efectiva de cara al rendimiento de sus alumnos que la usada por él hasta ahora. a la hora de tomar decisiones acerca de sus alumnos. 3ª Diagnosis didáctica El profesor. Estas tareas requieren tratamientos estadísticos simples de los datos de los alumnos. O en saber el efecto que producen variables familiares. 2. Este tipo de trabajos requieren el uso de métodos estadísticos.Estadística es la ciencia que se ocupa de la ordenación y análisis de datos procedentes de muestras. el profesor que quiera estar al día respecto a la enseñanza de su disciplina debe estar en condiciones de poder comprender textos de investigación en Ciencias de la Educación. y de la realización de inferencias acerca de las poblaciones de lasque éstas proceden. contará con el apoyo del análisis comparativo de la situación relativa de cada individuo en su clase.Primeros conceptos . centro escolar y contexto social concreto. También la propia actividad del profesor puede verse mejorada tras un análisis del rendimiento escolar del grupo en su conjunto. rasgos psicológicos en la destreza del alumno en realizar tal o cual tarea. distintas asignaturas y distintas variables psico-sociológicas.

La población es en estos momentos de alrededor de 25.B. a su vez. parámetro y estadístico . muestra.B.A.Un estadístico es una propiedad descriptiva de la muestra. Esta población suele ser demasiado extensa (razones económicas) o poco definida (votantes) como para estudiarla al completo.Un parámetro es una propiedad descriptiva de la población. Pongamos ahora algunos ejemplos que nos permitan identificar los conceptos que hemos definido: 1º.-Supongamos que estamos interesados en saber cómo es la actitud de los estudiantes de la U. el investigador desea conocer un parámetro o característica de los elementos de una población. Este parámetro sería estimado por el valor del correspondiente estadístico en la muestra que hemos seleccionado. Parece obvio que preguntarles a todos ellos acerca de esta actitud resultaría bastante costoso por lo que decidimos seleccionar algunos de ellos para realizar la consulta.A.A. una estimación del parámetro de la población. por el tanto por ciento de alumnos con actitud positiva en la muestra. es decir.C. Entonces se lleva cabo una selección (o muestreo) del que se obtiene una muestra de elementos que sea una representación de la misma. 2º. Se mide a estos sujetos de la muestra la característica buscada y se calcula el valor de esa característica para esa muestra. Relación entre los conceptos de población.B. .Población estadística es el conjunto de todos los elementos que cumplen una o varias características o propiedades. que tienen una actitud positiva hacia la práctica deportiva continuada. En este estudio uno de los parámetros podría ser el tanto por ciento de alumnos de la U.C. . .Una muestra es un subconjunto de los elementos de una población. podremos generalizar sobre la actitud de todos los alumnos de la U. hacia la práctica deportiva continuada.000 estudiantes.Normalmente. En primer lugar confecciona una prueba de conocimientos previos de un tema de la asignatura y la .-Un profesor de historia quiere medir la eficacia del uso sistemático de la hemeroteca para la enseñanza de la Historia de Venezuela de 3º de Educación Media. así que decide hacer un experimento con dos clases de las que él mismo es profesor.C. Esa medida es un estadístico muestral que es. Este profesor no puede realizar un estudio que implique a todos los alumnos de 3º de Educación Media de Venezuela. Con los resultados obtenidos a partir de estos alumnos seleccionados (muestra).

Para hacernos una idea global de cómo realiza la tarea nuestro sujeto. Ante uno de ellos el sujeto deberá presionar un botón tan rápido como pueda.. aparte de la habitual lección magistral. Para ello. resultaría muy costoso preguntar a todos los votantes por su intención de voto por lo que seleccionamos 3000 venezolanos (muestra) que consideramos representativos y les preguntamos por el sentido de su voto ante el referéndum. con ayuda de la Estadística. Ahora. pide a sus alumnos que lean algunos periódicos que reflejen algún aspecto del tema. En este caso la población la componen todas las5realizaciones de la tarea que potencialmente puede realizar nuestro sujeto experimental. En este caso estamos interesados en el tiempo que necesita un sujeto en concreto para realizar una tarea. 4º. La población en este caso está poco definida porque no todas las personas que pueden votar lo hacen realmente y. El porcentaje de nuestra muestra que responde SI es un estadístico. decidimos administrarle 30 ensayos con lo que obtenemos 30 datos.Variables y su clasificación . Cuando acaba la explicación del tema examina a sus alumnos. En la clase B se limita a dar su lección magistral.-Queremos estudiar el procesamiento de información en tareas simples. El porcentaje de individuos de la población que responderían SI es un parámetro.pasa a sus alumnos. una estimación de ese parámetro. En la clase A. La muestra la constituyen los treinta ensayos. para lo cual se ha utilizado tradicionalmente como medida el tiempo de reacción. El estadístico podría ser la media del tiempo empleado en los ensayos. se presentan al sujeto en cada ensayo uno de dos posibles estímulos. además. puede responder a algunas preguntas como: ¿Obtienen mejores notas los alumnos de la clase A que los de la clase B? ¿Partían del mismo nivel de conocimientos previos? ¿Podría este hecho influir sobre los resultados del experimento? ¿Se pueden generalizar los resultados del experimento de este profesor? 3º.-Tratamos de hacer un sondeo acerca del resultado de un referéndum que se celebrará próximamente en España. mientras que no debe dar respuesta alguna ante el otro. cada uno de ellos representando el tiempo invertido por el sujeto en cada uno de los ensayos. 4.

B.Nota obtenida por los alumnos en la prueba de conocimientos previos.A través de estos ejemplos se ve que cuando estudiamos las entidades que conforman una población nos interesamos por algunas de las propiedades de sus elementos.Nota obtenida por los alumnos en la prueba final. . normalmente son valores entre 0 y 10. .En el segundo los estudios cursados (3º de EDUCACIÓN MEDIA).Empleo del tiempo de ocio Ahora estamos en condiciones de definir el concepto de variable como la característica de los elementos de una población que toma ó puede tomar valores distintos encada uno de ellos. Podemos señalar como ejemplo algunas de las características y modalidades de los alumnos de Enseñanza Secundaria: . .Una característica es una propiedad o cualidad de un individuo. .Una modalidad es cada una de las maneras como se presenta una característica. En contraposición a éste aparece el concepto de constante que es una característica de la población que sólo puede tomar un valor para todos los elementos de la población.A.Actitud de los estudiantes de la U.Motivación ante la asignatura . . .Voto del referéndum. .Rendimiento académico en las asignaturas cursadas que adopta distintas modalidades. Las variables que aparecen en los ejemplos son: .Lugar de procedencia . . hacia la práctica continuada del deporte.Tiempo de realización de la tarea.En el primero el nivel de estudios de los encuestados (todos son universitarios). y esas propiedades adoptan distintas variedades: .Sexo que adopta dos modalidades: varón y mujer. .C.En el cuarto la nacionalidad de los encuestados (venezolana). Las constantes que aparecen en los ejemplos son: .

tenemos que tener en cuenta la precisión del instrumento de medida que estamos usando. profesión. sexo. sentido del voto en unas elecciones. En el ejemplo hemos asignado letras pero podíamos haber optado por números: 1 → azul. si utilizamos el metro como unidad de medida.Las variables se pueden clasificar según el número de valores que puedan tomar como variables discretas y variables continuas.Medición y escalas Llamamos medición al proceso Media de atribuir números a las variables. V → verde. simplemente podemos asegurar si dos sujetos tienen el mismo o distinto color de ojos. M → marrón y N →negro. la talla. nivel socioeconómico.65 queremos decir que mide entre 1. la duración de un suceso. Cuando tratamos con variables continuas y las definimos como variables que pueden tomar cualquier valor. A este tipo de variables medidas con escala nominal se les puede asignar a cada categoría cualquier tipo de símbolos. 5. de intervalo y de razón. Una variable discreta es aquella que adopta valores aislados. Otros ejemplos: nacionalidad. Usando una escala nominal podemos decidir si un sujeto es igual o diferente a otro. no podemos conocer su valor exacto. etc. En realidad una variable continua nunca puede medirse con total precisión.. Ejemplo: número de asignaturas aprobadas en el curso pasado. ordinales. Por ejemplo. Por ejemplo: el peso Media. 3 → marrón y 4 → negro . sino su valor informado. El conjunto de reglas o modelos desarrollados para la asignación de números a las variables es lo que se denomina escala. cuando decimos que una persona mide 1.655. con aproximación de centímetros.645 y 1. número de alumnos de una clase. La clasificación de las escalas más usada es la propuesta por Stevens (1946) que divide las escalas en: nominales. sexo. Por ejemplo: si medimos el color de los ojos podemos establecer la siguiente escala: A → azul. 2 → verde. que es el que nos proporciona el instrumento de medida. pero no podemos establecer relaciones de orden respecto a esa característica. etc. ni relaciones de cantidad ni de diferencia. el tiempo empleado en la ejecución de una tarea. Escala nominal: nos permite identificar sujetos como "iguales" o "diferentes". Una variable continua es la que puede tomar todos los valores de un intervalo. No podemos ordenar los sujetos de mayor a menor o viceversa.

temperatura en grados Kelvin (que sí tiene cero absoluto). también podemos hacer afirmación es acerca de las diferencias en la cantidad del atributo de unos y otros objetos. porque el valor cero no representa el comienzo del tiempo sino que. Escala de intervalo: Con esta escala. Es decir. los objetos se pueden ordenar. Es decir. aunque en este caso el cero sea un punto arbitrario en la escala. Escala de razón: También se llama de proporción o de cociente. de los sujetos se puede decir cual presenta una mayor o menor magnitud de la característica medida. que significa ausencia del atributo o característica medida. Otros ejemplos: la medición de las temperaturas en grados centígrados. Ni que el que tenga nivel 3 tenga3 veces más de nivel de estudios que el que tiene nivel 1. 3 a estudios universitarios. en nuestro calendario se eligió el año del nacimiento de Cristo como año 1. además de poder identificar un objeto y establecer relaciones del tipo mayor que y menor que. es decir. 2 a estudios secundarios. Otros ejemplos de escala ordinal: posición relativa en la clase. de intervalo y de razón. Una vez descritas estas escalas podemos volver a clasificar las variables según la escala usada para medirlas. las calificaciones escolares. ordinales. Pero no podemos afirmar que hasta el año 1000 haya pasado el doble de tiempo que hasta el año 500. la escala de los test de inteligencia. podemos afirmar que un objeto que mide 10 cm. duración de un suceso.Escala ordinal: Esta escala no sólo permite la identificación y diferenciación de los sujetos sino que además permite establecer relaciones del tipo "mayor que" o "menor que". la longitud. escala de dureza de los minerales. También se pueden clasificar atendiendo al tipo de información que proveen en cualitativas y cuantitativas. Por ejemplo. el valor 3 es mayor que el 2 y el 1. disponemos de una unidad de medida. Podemos ordenar a los sujetos según el nivel de estudios. podemos afirmar que ha transcurrido el mismo tiempo entre1960 y 1966 que entre 1980 y 1986 porque contamos con una unidad de medida llamada año. Un ejemplo típico es el calendario. Ejemplo: nivel de estudios se puede asignar 1 a estudios primarios. contamos con una unidad de medida con cero absoluto. Otros ejemplos: peso. Es decir. Aunque no podemos afirmar que la diferencia existente entre el 2y el 1 sea la misma que la que existe entre el 3 y el 2. podemos hablar de variables nominales. no indica ausencia total de la cantidad de atributo. es decir. . Además de las características de las otras tres escalas. tiene el doble de longitud que uno que mide 5 cm.

una vez que el profesor o investigador ha recabado información acerca de sus alumnos ó de la muestra elegida en su caso. número de escolarizados. tasa de aprobados por especialidad.Distribución de frecuencias. el tiempo utilizado para ejecutar una tarea. . por ejemplo. Capítulo 2. ordinales o de intervalo. etc. Por ejemplo: peso. en principio. el IQ = (edad mental / edad cronológica) ⋅ 100.. etc. temperaturas. En la mayoría de las investigaciones educativas las variables manejadas se miden con escalas nominales. tiempo empleado en realizar una tarea. salvo que se use. a través de test. 1. dureza de los minerales. talla. número de asignaturas aprobadas. nivel socioeconómico. En general. de una lista de datos. Si se han observado pocos valores es posible que la simple inspección visual de . nivel cultural. exámenes.Variables cualitativas son aquellas que se miden según una escala nominal u ordinal. Organización y representación de datos. que provienen de un proceso de conteo: número de nacimientos. probabilidad de pertenecer a un grupo dentro de un determinado curso Ratios o números índice. probabilidades: porcentaje de aprobados en un centro. cuestionarios o encuestas dispone. talla.Datos que provienen de la medición de variables: peso. número de matriculados en un curso. rendimiento académico. que son números que provienen de un cociente: el índice de precios al consumo. calificación en la última evaluación de la asignatura X. Informan más bien de una cualidad del sujeto: sexo. De alguna forma dan cuenta de la cantidad de atributo o característica que el individuo posee. Son escasamente utilizadas las de razón o proporción. . color de ojos. histograma y polígono de frecuencias. Variables cuantitativas son aquellas que se miden según una escala de intervalo o de razón.Datos que reflejan porcentajes. En el capítulo anterior ha quedado claro el hecho de que la Estadística trabaja con datos de muy diversa índole: .Datos que son frecuencias de categorías.

2. 1. 4. 2. 1. 1. La letra X mayúscula con subíndices. 1. Supongamos que un profesor pasa a sus alumnos una encuesta en la que. en esta definición vamos a establecer una notación: la letra X mayúscula representará a la variable con la que estamos trabajando. 1. Las respuestas de sus treinta alumnos son: 1. Un instrumento para conseguir esta ordenación de los datos es lo que llamamos distribución de frecuencias. 2. En este caso se trata de una variable discreta que sólo toma los valores 1. 3. entonces tendremos que poner en orden nuestros datos de forma que podamos interpretarlos. 1.. Si queremos. entre otras cosas. 2. por ejemplo. y se simboliza por fi al número de veces que se repite el valor Xi en la muestra. si los estudiantes se agrupan en las posiciones extremas o en las centrales o están dispersos. 1. servirá para representar un valor concreto de la variable X en el sujeto 1. 2. 3. 2.. 2. 4. 3 y 4. después de un examen saber cuál es la puntuación del estudiante típico. Pero esto no es nada frecuente. 4. 1.los mismos sea suficiente para poder describir el fenómeno estudiado. 2. 2. El número de elementos que componen la muestra será n. una representación de la relación entre un conjunto de medidas o clases de medidas mutuamente exclusivas y exhaustivas y la frecuencia de cada una de ellas. En segundo lugar se cuenta cuántas veces aparece cada uno de ellos. X1 X2 X3. Estos datos se colocan en una tabla de la forma siguiente: .. 2. 1. a su vez. Se llama frecuencia de un valor Xi. 3. Una distribución de frecuencias es.Cuando queramos referirnos a un valor concreto cualquiera de la variable X escribiremos Xi. que además de ésta función debe cumplir otras dos más: ofrecer la información necesaria para hacer representaciones gráficas y facilitar los cálculos para obtener los estadísticos muestrales. 3. según Hays (1988). 3. se les pregunta por el número de hermanos. Para definir el término frecuencia que aparece.3. 1. Ahora vamos a seguir los pasos para la construcción de una tabla de distribución de frecuencias con un ejemplo sencillo. 1. Para construir la tabla de distribución de frecuencias se inspeccionan en primer lugar los valores que toma la variable.2. 1. cuál es el rango en que varían las puntuaciones.

73. 63. 54. 73. 68. 33. 91. 32. que consiste en formar grupos de valores consecutivos de la variable y poner cada uno de estos grupos en cada fila. 85. que en tanto por ciento sobre 30 representan el 73. 65. ya podemos extraer algunas conclusiones. 78. Una vez construida esta tabla y a pesar de su simplicidad. por ejemplo. 42. Este es un ejemplo de tabla de distribución de frecuencias muy simple debido fundamentalmente a que la variable sólo toma cuatro valores diferentes. 57. 13 + 9 son 22 familias. 75. En estos casos se recurre a lo que se denomina la agrupación en intervalos de clase. 73. Vamos a poner otro ejemplo algo más complejo: un profesor pasa un test de hábitos de estudio a sus treinta alumnos. 55. 71. 72. Si sumamos la frecuencia de éstas y la de las familias de dos hijos. El valor más pequeño es 32 y el mayor 93. 61. en lugar de poner una sola puntuación. los resultados son los siguientes: 37. 51. 49. 46. 58. Para agrupar las puntuaciones de la variable se suelen establecer estas dos reglas: .3% de la muestra. 77. 83. Si construyésemos una tabla de distribución de frecuencias como la anterior tendríamos una lista demasiado extensa (62 números) y muchas de las frecuencias serían cero. 85. 93. que las familias con un único hijo son las más frecuentes. 63.Valores de la variable Frecuencia Xi 1 2 3 4 N fi 13 9 5 3 30 Tabla 1: Distribución de frecuencias de la variable “Número de hermanos”. 77.

así que el primer intervalo de clase contendrá las puntuaciones 30.1º. 3. A partir de un número que sea múltiplo del tamaño de los intervalos de clase y que se aproxime lo más posible a la medida observada menor. La siguiente pregunta es ¿a partir de qué número empezamos a contar en la escala?. 2º. 32. decidimos hacer intervalos de clase de amplitud 5.1. 31. Nos fijamos en la regla nº 2 y dividimos 62/10=6. Son preferibles los intervalos de clase que contengan 1. En nuestro ejemplo 32 es el valor más pequeño y 30 el múltiplo de 5 más cercano. es decir. si las agrupamos de 3 en 3 tendremos alrededor de 20 intervalos. 5.2 y62/20=3. 10 ó 20 unidades de la escala. Esto quiere decir que si agrupamos las puntuaciones de 6 en 6 tendremos 10intervalos. Atendiendo a la regla nº 1. El número de intervalos o grupos debe variar entre 10 y 20. su rango ó amplitud total es 93-32+1=62. La tabla de distribución de frecuencias agrupada sería la siguiente: Xi 30 34 35 39 40 44 45 49 50 55 55 59 60 64 fi 2 1 1 2 2 3 3 . En nuestro ejemplo. la variable toma valores entre 32 y 93. 33 y 34 y el último 90. 91. 93 y 94. 2. 92.

Así pues los límites exactos del intervalo 30-34 son 29. es decir. resultado de (60 + 64) / 2 ó de (59.5 y así sucesivamente de forma que el límite superior exacto de un intervalo coincida con el límite inferior exacto del siguiente. el punto medio del intervalo 60-64 es el punto 62. Aunque en la práctica esto es así porque el test usado para medir hábitos de estudio notiene la precisión suficiente para obtener valores como 44. Por otra parte. es decir.5-39.5 o 59. Según esta tabla de distribución de frecuencias agrupadas. A partir de los límites informados o de los límites exactos se puede definir el punto medio del intervalo como el punto que resulta de la suma del extremo superior yel extremo inferior dividida por dos.65 69 70 74 75 79 80 – 84 85 89 90 94 N 2 5 4 1 2 2 30 Tabla 2: Distribución de frecuencias con los datos agrupados en intervalos de clase de la variable puntuaciones obtenidas en un test de hábitos de estudio. la variable puntuación del test de hábitos de estudio no puede tomar valores entre 44 y 45 o entre 59 y 60. puede tomar cualquier valor entre 30 y 94.5 + 64. . Por ejemplo.5. los del intervalo 35-39 son 34. como su media.8. les llamaremos límites informados.5) /2.5-34. a los límites de los intervalos que aparecen en la Tabla 2. en teoría tenemos que considerar esta variable como continua en el intervalo.

94. Una vez construida la tabla de distribución de frecuencias.La amplitud del intervalo se define como la diferencia entre el límite superior exacto y el límite inferior exacto.5 74.5 89.84.5 5 4.5 .89.79 80 – 84 85 .5 .5 .59 60 .39.34. para usarla más adelante en las representaciones gráficas.5 59.49.5 39.39 40 . En este momento volveremos a escribir nuestra tabla de distribución de frecuencias añadiendo los límites exactos de los intervalos y sus puntos medios. límites exactos.5 .5 64.5 79.5 .5 44.69 70 .34 35 .74.5 .55 55 .5 .44.49 50 .5 .54.79.5 49.44 45 .64.5 34. estamos en condiciones de hacer algunas representaciones gráficas que nos ayudarán a interpretar la situación de los alumnos en cuanto al test de hábitos de estudio.5 .5 . .5 84.69.94 N Límites Reales 29.5 Xi 32 37 42 47 52 57 62 67 72 77 82 87 92 fi 2 1 1 2 2 3 3 2 5 4 1 2 2 30 Tabla 3: Intervalos de clase. a la que hemos añadido los límites exactos de los intervalos y sus puntos medios.5 69.64 65 . Clases 30 . puntos medios y frecuencias de las puntuaciones obtenidas en el test de hábitos de estudio.5 .74 75 .89 90 .59.5 .5 .

construiremos un polígono de frecuencias. En primer lugar queda claro que. Las observaciones dentro de un intervalo de clase están distribuidas uniformemente entre sus límites exactos. partiendo de los mismos datos y teniendo en cuenta las dos reglas citadas anteriormente. tenemos que tener en cuenta que se nos pueden presentar situaciones en las que sea difícil aplicar estas reglas sin perder gran parte de la información. se pueden hacer muchas tablas distintas. todas ellas igualmente válidas. Sobre cada uno de estos intervalos se dibuja un rectángulo cuya base está delimitada por los límites exactos y su altura es la frecuencia de ese intervalo. Ahora vamos a hacer algunas consideraciones respecto a las dos normas para la construcción de tablas de distribuciones de frecuencia. obtendremos el polígono de frecuencias. Esto es así porque se puede construir el segundo a partir del primero sin más que unir los puntos medios de las bases superiores de los rectángulos del histograma. En el eje de abcisas representaremos los puntos medios de cada intervalo y en el de ordenadas la frecuencia de cada intervalo. En segundo lugar. tendremos una mayoría de valores concentrados en torno avalores . Polígono de frecuencias Si nos encontramos en la segunda situación. es decir. es decir. Es evidente que el histograma y el polígono de frecuencias ofrecen una imagen muy similar de la distribución de frecuencias de los datos.Para hacer las representaciones gráficas de las tablas de distribución de frecuencias podemos considerar dos situaciones distintas: 1ª. 2ª. Histograma de los datos Si nos encontramos en la primera situación haremos un histograma o diagrama de barras o columnas. si consideramos que las observaciones dentro de cada intervalo se concentran en su punto medio. Por ejemplo. que cumplen los requisitos para los cuales se han diseñado: la ordenación de una manera clara y sistemática de nuestros datos. Las observaciones dentro de un intervalo de clase están concentradas en su punto medio. Uniendo estos puntos de forma consecutiva mediante segmentos de recta. si estamos trabajando con la variable "ingresos mensuales". En el eje de abcisas (eje de las x) se representan los límites exactos de los intervalos de clase y en el eje de ordenadas (eje de las y) la frecuencia de cada intervalo.

De la misma forma se calculan porcentajes de frecuencias acumuladas. la inmensa mayoría de los datos estarían concentrados en uno o dos intervalos. Para evitar eso se utiliza lo que se denomina intervalos abiertos. La frecuencia acumulada se calcula de forma inmediata a partir de la frecuencia de cada intervalo de clase. casos u observaciones dentro de dicho intervalo. más todos aquellos contenidos en intervalos inferiores en la escala. ya que así compararemos dos distribuciones con cien observaciones. Por ejemplo. la frecuencia acumulada del último intervalo será igual al número de observaciones de la distribución..centrales y unos pocos que se desvían de éstos mucho por arriba. en los cuales no se considera límite superior o límite inferior. Si en un caso así se hiciera un número de intervalos en torno a diez. como el número de datos. Definiremos frecuencia acumulada hasta un intervalo de clase.000" y el último "más de 500. Para el primero de éstos ambas frecuencias coinciden. Cuando trabajamos con variables distintas o con la misma variable medida en muestras de distinto tamaño resulta difícil comparar las frecuencias absolutas. ahora haremos referencia a la distribución de frecuencias acumuladas que se usa cuando se tiene interés en el número de observaciones que se sitúan por debajo de un cierto punto de la escala de medición. el primer intervalo podría ser "menos de 50. polígono de frecuencias acumuladas y polígono de porcentajes de frecuencia acumulada Hasta el momento hemos presentado una de las formas de representación y tabulación de datos. Una forma de resolver este problema es calcular los porcentajes de frecuencias de cada intervalo de clase.000" . para construir la tabla de la distribución de frecuencias acumuladas calculando los porcentajes de frecuencias acumuladas. . para los siguientes. y de amplitud constante. la frecuencia acumulada es igual a su frecuencia más la acumulada del intervalo anterior. 2. Así. Volvamos al ejemplo de los datos del test de hábitos de estudio.Distribución de frecuencias acumuladas.

89.5 .5 44. .67 36.5 89.64 65 . Estos dos polígonos tienen exactamente la misma forma.79.49.5 .34.94 N Límites Reales 29.74.67 46.5 .5 49.54. A partir de esta tabla podemos representar gráficamente el polígono de frecuencias acumuladas y el polígono de porcentajes de frecuencias acumuladas.33 100.5 64.33 20.59. Estos gráficos nos permiten conocer cuántas observaciones o qué porcentaje se sitúan por debajo de un intervalo de clase.34 35 .33 70.5 .5 . Distribución de frecuencias acumuladas y porcentaje de frecuencias acumuladas de las puntuaciones en el test de hábitos de estudio.55 55 .67 93.89 90 .5 .5 .5 .67 10.00 Tabla 4.39 40 .69 70 .5 79.44 45 .00 13.59 60 .5 34.79 80 – 84 85 .74 75 .64.5 .5 59.5 .00 26.5 .5 Xi 32 37 42 47 52 57 62 67 72 77 82 87 92 fi 2 1 1 2 2 3 3 2 5 4 1 2 2 30 Fa 2 3 4 6 8 11 14 16 21 25 26 28 30 Fa% 6.5 69.5 84.00 83. representando en el eje de abcisas los límites superiores exactos de los intervalos de clase y en el de ordenadas las correspondientes frecuencias acumuladas o porcentajes de frecuencias acumuladas respectivamente.5 74.94.33 86.5 5 4.39.5 .49 50 .Clases 30 .5 .5 39. difieren únicamente en la escala del eje de ordenadas.84.69.44.67 53.

En ocasiones. Un pictograma es una representación gráfica de una variable en forma de círculo que está dividido en tantos sectores como valores distintos tome la variable. variabilidad o dispersión. C y D. cuando se quiere destacar una de las secciones en particular se separa del resto para captar la atención del lector en esa modalidad particular.3. o las medias de la asignatura de Matemáticas de 1º de EDUCACIÓN MEDIA en los grupos A. una marca por cada asignatura o una marca para cada uno de los grupos. Todas ellas tienen sus correspondientes medidas.. Otra forma de .Características generales de una distribución de frecuencias Hasta este momento hemos visto cómo construir tablas y representar gráficamente un conjunto de datos. En los ejemplos. En el eje de ordenadas se representan las puntuaciones alcanzadas en distintas variables o parámetros. Le podríamos responder presentándole las tablas de distribuciones de frecuencias o incluso las listas con los nombres de los alumnos. grupo o variable medida.Otras representaciones gráficas De entre las distintas representaciones gráficas que se pueden hacer con nuestros datos haremos sólo referencia a los pictogramas y los perfiles por su uso más extendido. pero estas técnicas todavía no son suficientes para hacer comparaciones entre distintas distribuciones de frecuencias. todos ellos medidos con la misma unidad. B. sus indicadores que obtenemos mediante una serie de cálculos a partir de los datos de una tabla de distribución de frecuencias. Además la superficie de los mismos es proporcional a la frecuencia de cada modalidad de la variable. Por ejemplo: las calificaciones de un alumno en cuatro asignaturas distintas medidas de uno a diez. Y en el eje de abcisas se coloca una marca por cada sujeto. Para ello es necesario definir algunas características de las distribuciones de frecuencias que llamamos: tendencia central.. sus calificaciones y tiempos. Supongamos que el jefe de estudios del centro nos pregunta: ¿Cuál es el rendimiento de la clase A en tu asignatura? ¿Cuánto tiempo han empleado tus alumnos en recorrer el circuito?. Los perfiles se usan bastante en informes psicopedagógicos o de rendimiento. sesgo y curtosis. pero casi con toda seguridad le costaría un gran esfuerzo entresacar de esos datos respuestas precisas. 4. es decir.

las dos mitades se superponen. Un ejemplo: si ponemos a nuestros alumnos un examen muy fácil. dedicaremos a su cálculo. desviación media. en los valores inferiores al promedio. estaremos ante una distribución con sesgo positivo puesto que la mayoría de los alumnos obtendrían notas bajas y sólo algunos destacarían con nota saltas. El sesgo o asimetría se refiere al grado en que los datos tienden a concentrarse en los valores centrales. Si por el contrario el examen es difícil. Una distribución será simétrica cuando. Esta propiedad es independiente de la tendencia central. que se refieren al centro de la distribución de frecuencias. al dividirla en dos a la altura de la media. Las medidas de variabilidad o dispersión más frecuentes son: las desviación típica. se agrupan en torno a su promedio. La variabilidad o dispersión se refiere al grado de concentración de las observaciones en torno al promedio. su significado y sus propiedades una parte del capítulo siguiente. dos distribuciones pueden tener la misma media y distinta variabilidad y viceversa.por tanto. podríamos confundir. Una distribución tiene asimetría positiva cuando la mayor concentración de puntuaciones se produce en la parte baja de la escala mientras que algunas puntuaciones son altas. Las medidas de tendencia central más utilizadas son la media.responder a las preguntas más claramente sería calcular algunas medidas de tendencia central de esas distribuciones. Una distribución de frecuencias será homogénea o poco variable si los datos difieren poco entre sí y . porque si prescindiésemos de ella. esta independencia es la causa de la importancia de la variabilidad. por tener el mismo rendimiento medio. la distribución de frecuencias de sus calificaciones tendrá sesgo negativo puesto que la mayoría de los alumnos obtendrían calificaciones altas. Por el contrario será heterogénea o muy variable si los datos se dispersan mucho respecto al promedio. También podemos decir que hace referencia al grado en que los datos se reparten equilibradamente por encima y por debajo de la tendencia central. la varianza. Si el examen es de . una clase con alumnos de rendimiento medio muy similar con otra que tuviera alumnos de rendimiento máximo y alumnos de rendimiento mínimo. el rango y la amplitud semi intercuartil. Por su importancia. a la puntuación que representa a todas las demás. o en los valores superiores a éste. que precisamente son representaciones del valor "típico" o "promedio" de la variable. es decir. Una distribución tiene asimetría negativa cuando la mayor parte de las observaciones se sitúan en la parte alta de la escala mientras que se produce alguna observación en la parte baja. Precisamente. la mediana y la moda.

Respecto a la inspección gráfica. Las distribuciones que tienen mayor grado de apuntamiento que la normal se llaman leptocúrticas y las que lo tienen menor platicúrticas. La distribución A es simétrica. Generalmente el grado de curtosis de una distribución se compara con un modelo de distribución que estudiaremos más adelante que es la llamada campana de Gauss o distribución normal.Q1) tiene sesgo negativo. El criterio tiene que ver con las diferencias entre cuartiles y es el siguiente: Si (Q3 . las distribuciones que tienen el mismo grado de apuntamiento que la normal se llaman mesoacúrticas.Q1) entonces la distribución tiene sesgo positivo.dificultad media.. lo más probable es que la distribución sea simétrica. La A es simétrica. comparados con su utilización.(Q3 . Figura 9: Ejemplos de distribuciones con distinto tipo de sesgo. más bien podemos dar un criterio aún cuando la podemos apreciar mediante la inspección visual del polígono de frecuencias. El concepto de curtosis sólo se aplica a distribuciones unimodales (distribuciones que tienen un único “pico”) y se refiere al empinamiento de la curva en la proximidad de la moda. Medidas de tendencia central 1. B y C. la B asimétrica positiva y la C asimétrica negativa. Se denota por la misma letra que la variable con una barra horizontal encima. Si tenemos n valores de la variable X su media se calcula utilizando la siguiente fórmula: x= _ Σ fix i N .Q2) > (Q2 . Los índices empleados habitualmente para calcular la curtosis son demasiado complicados. La media de una variable se define como la suma de todos los valores observados dividida por el número de ellos. Si (Q3 . por lo que en estas notas no haremos referencia a ellos.Q1) la distribución será simétrica . en la Figura 9 aparecen las gráficas de tres grupos A.Q2) < (Q2 . Así. la B tiene sesgo positivo y la C negativo.La media. La curtosis se usa para saber cómo es de escarpado o plano un polígono de frecuencias. Si. Para esta característica no vamos a estudiar ningún índice porque normalmente los cálculos son laboriosos.Q2) = (Q2 .3 Capitulo 3.

en este caso el sumatorio tiene tantos sumandos como X = ∑( x )(f ) i i N = ( x1 )(f1 ) + ( x 2 )(f2 ) + ( x3 )(f3 ) + . 3. 3.7 También podemos calcular la media a partir de la distribución de frecuencias: Veamos ahora cómo podemos usar la tabla de distribución de frecuencias. Por tanto.7.Por ejemplo. Su media se calcula : ( 1+2+2+3+3+3+4+4+4+5+5+5+5+5+6+6+7+7+8+9 ) / 20 = 94 / 20 = 4. 5. La media será el cociente entre la suma de la columna de los f ixi y la suma de la columna de las frecuencias o sea N. y ordenadas de menor a mayor son : 1. 5. calcularemos la media como: Hay que tener en cuenta que en las otras fórmulas el sumatorio se extendía a lo largo de todas las puntuaciones observadas y a lo largo de las puntuaciones distintas observadas. 4. lo cual no siempre es así. 8 y 9. 5. 6. . para aplicar la fórmula anterior del cálculo de la media. inmediatamente le viene a la mente la idea de complicados cálculos numéricos. 6. 5. fue lo que dio origen a lo que hoy conocemos como estadística. En la . empleando los datos del ejemplo. respectivamente. 4. 7. . añadimos una columna más a la tabla de distribución de frecuencias en la que escribimos precisamente cada uno de estos sumandos. Como en el numerador aparece la suma de los productos de cada puntuación por su frecuencia. 5. las notas obtenidas por una clase de 20 alumnos en un examen de Historia. para calcular la media en lugar de los datos observados trabajaremos con los puntos medios de los intervalos de clase y la frecuencia de cada uno de ellos. 2. si denotamos como Xmi el punto medio del intervalo i-ésimo y fi la frecuencia del mismo. 2. + ( xn )( fn ) N Conceptos y Definiciones La necesidad que siempre ha tenido el hombre de clasificar la informa-ción que haya podido obtener en las múltiples actividades desarrolladas. así como la búsqueda constante del perfeccionamiento de los métodos inventados para lograr esa organización o clasificación de la información obtenida. Si estamos ante una distribución de frecuencias agrupadas y por tanto no disponemos de los datos observados. Cuando uno oye la palabra estadística. 4. 3.

con la finalidad de evaluar los resultados obtenidos y poder hacer proyecciones a futuro”. 1954). “La Estadística es la ciencia que trata de la recolección.mayoría de los casos lo menos que ocurre dentro de la actividad relacionada con la estadística es la aplicación de complicados cálculos. cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados indi-viduales o particulares”. sobreentendiéndose que tales datos numéricos. es decir. 1973). entendiendo como tales. descripción y comparación de los fenómenos” (Yude y Kendal. . lo más frecuente es la clasificación y ordenamiento de información.. que posteriormente será estudiada y a la que se le aplicará una determinada metodología en la que posiblemente estarán involucrados algunos cálculos. 1953). aquellos fenómenos naturales. se encarga de coleccionar. clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación. “La Estadística en su acepción más común. y se define la Estadística (en mayúscula) como una ciencia que estudia el comportamiento de los fenómenos de masa. que producirá una información más elaborada que facilitará la toma de decisiones. han de estar presentados de manera ordenada y sistemática. sino que estudia siempre grupos. no se detiene en el estudio del comportamiento de un caso aislado. económicos sociales. (Gini. conjuntos o colectivos de casos”. de modo de poder sacar conclusiones válidas que permitan tomar decisiones razonables. etc. Definición A continuación se presentan algunas definiciones sobre este concepto: “La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivos. organizar y analizar datos. es considerada como la ciencia cuyo objeto es ordenar y clasificar información obtenida de situacio-nes que han ocurrido. (Barbacho. La Estadística como ciencia. “Se entiende a la estadística como una colección de datos numéricos.

y esto no es otra cosa que la aplicación de métodos estadísticos. se puede calcular cuál será la demanda futura de un determinado producto. Analizar la información obtenida y establecer las características comu-nes observadas. ampliamente. como son: Recolectar. Todo lo anterior nos hace pensar en una primera clasificación de la Estadística en: Descriptiva. clasificar y describir la información obtenida a cerca de un fenómeno determinado. En la industria.Mediante la aplicación de métodos estadísticos. vemos que la estadística tiene variadas finalidades. Campo de Aplicación Hoy en día. Decimos con bastante aproximación y no con absoluta seguridad. vemos que prácticamente en todas está incluida en algún momento la asignatura estadística. la estadística es aplicada en casi todos los campos del saber humano. Si las condiciones se mantienen. cada uno de estos conceptos). (Investigar. Si observamos los diferentes planes de estudio de las distintas carreras que se ofrecen en las Universidades. esto no es casual ni caprichoso. necesitamos métodos estadísticos para compro-bar hasta qué punto se ajusta el supuesto a la realidad. mediante el análisis estadístico. a partir de una observación determinada. las probabilidades de acierto son grandes. Deducir. porque cualquier estudio estadístico se basa en la tendencia. . Cuando hacemos una investigación y formulamos una hipótesis. las leyes que lo rigen. una vez observado el fenómeno. lo cual permitirá hacer las predicaciones correspondientes. para poder hacer investigación es necesario poseer las herramientas básicas que permitan la recolección y clasificación de información. Resumiendo. Analítica e Inductiva. podemos hacer predic- ciones con bastante aproximación. se debe básicamente al hecho que para la mayoría de las ciencias. No hay disciplina académica donde no encontremos incluida la estadística como herramienta fundamental. no así si cambian las condiciones.

Cuando hagamos referencia al término muestra. debemos mantener clara la idea de que sea representativa. sino que su comportamiento depende en gran medida del azar. cuando al repetirse una canti-dad n de veces. son fenómenos aleatorios. desde el punto de vista estadístico. recibe el nombre de población o universo. o la demanda de un determinado producto. hará que surja un nuevo concepto. En los próximos párrafos vamos a estudiar esos conceptos. es el lanzamiento de un dado honrado. Lo más seguro es que cada vez que lancemos el dado obtengamos resultados diferentes. pues no podemos ejercer control absoluto sobre ellos. como lo es el de probabilidades. La población puede ser finita o infinita. un dado que no este cargado. Población y Muestra Cuando tratamos de estudiar una serie de datos. Cuando así sucede. Cuando hacemos esto. Fenómenos como el descrito anteriormente. estamos en presencia de una inferencia estadística. podemos inferir importantes conclusiones sobre la población. Un ejemplo clásico de lo que es un fenómeno aleatorio. así como muchos otros. las edades de los alumnos de una determinada Universidad. la cual por no ser del todo exacta. que recibe el nombre de muestra. En los fenómenos aleatorios existe una marcada influencia del azar. en igualdad de condiciones. tiene que comenzar por una serie de conceptos que son indispensables para profundizar en ese campo inmenso que es la Estadística.Cualquier persona que desee iniciarse en el estudio de la estadística. que estudiaremos en futuras unidades. se acostumbra estudiar una pequeña parte del grupo. Fenómeno Aleatorio Un fenómeno es considerado aleatorio. los resultados obtenidos son diferentes. como es el caso del lanzamiento de una moneda. o sea. En lugar de estudiar al grupo completo que. por ejemplo. a partir del análisis que hagamos de la muestra. . dependiendo del tamaño o la cantidad de los integrantes de la misma. puede ser compli-cado o poco práctico observar al grupo en su totalidad.

3. utilizamos para su estudio una parte de ella. En el ejemplo anterior. recibe el nombre de dato. 4.El conjunto formado por todas las observaciones posibles de un determinado fenómeno. Las continuas pueden tomar cual-quier valor. Masa de sucesos: Para su definición es necesaria la referencia a un período de tiempo. Masa fija: Aquella que para su definición se requiere hacer referencia a un instante. Por ejemplo. Es importante dejar claro que una masa estadística abarca una cantidad finita de unidades estadísticas (elementos) Cuando estamos realizando la observación de un fenómeno objeto de un estudio estadístico. la cual puede ser: 1. .4. Por ejemplo. Las variables se refieren a características de carácter cuantitativas. 1. El objeto formal de la descripción estadística es la masa estadística.3. 2. Así. Las características a su vez se clasifican en: variables y atributos. si consideramos los resultados obtenidos sin repetición. 3. si los resultados observados fueron 1. Por ejemplo. o sea. 3. le daremos como nombre características. universo o masa estadística. porque las unidades de que consta pueden extenderse en el tiempo. número de calificaciones obtenidas en la asignatura estadística durante el año escolar 1998 -1999. la información que nos interesa y de la cual tomamos nota.3. 3. ya que las unidades de que consta se consideran como sucesos susceptibles de puntuación. mientras que los atributos son características cualitativas y se subdividen en variables continuas y variables discretas. por ejemplo. recibe el nombre de población.4. Cuando el número de elementos que forman una población es muy grande. las edades de todos los estudiantes del Ciclo Básico del Instituto. el número de estudiantes de nuestra Universidad. cuando lanzamos un dado al aire en cinco oportunidades. a la que llamaremos muestra.3. los datos son 1. mientras que las discretas sólo pueden tomar valores enteros.

Las estaturas de tres estudiantes. se dice que es una variable discreta. Cuando utilizamos el término variable. Por ejemplo. el carácter de una persona. y. las características de cada dato. por lo tanto es una variable bidimensional. tres. de hijos.. los cuales pueden tomar un conjunto de valores. que constituyen el dominio de la variable. por lo tanto es una variable unidimensional. se dice que la variable es continua. mientras que si ocurre lo contrario. Ningún alumno será masculino y femenino al mismo tiempo. en cuyo caso recibe el nombre de constante. sobre todo en la investigación científico-social. Conviene también. los datos referentes a colores. distinguir entre características acumulables y características no acumula-bles. Características no acumulables: A cada unidad de una masa esta-dística puede imputarse una sola expresión de una característica.. el número de pupitres que hay en un aula son variables discretas. es un atributo. las estaturas de los estudiantes de esta sección. son atributos. María es ama de casa y abogado al mismo tiempo. etc. z. dos. mientras que la estatura y peso de tres estudiantes. Si la variable puede tomar cualquier valor entre dos valores dados. bidimensionales.De acuerdo a lo anterior. el No. etc. Puede suceder que la variable pueda tomar un solo valor. estatura y peso. Las características de investigación pueden ser: Cualitativas De rango Cuantitativas . etc. son variables discretas. tiene una sola característica que es el peso. tridimensionales. Por ejemplo. dependiendo que sean una. sexo. Características acumulables: A las unidades de una masa estadística pueden imputarse varias expresiones de una característica. Las variables también pueden ser: unidimensionales. nos referimos a símbolos tales como x. son variables continuas. posee dos caracterís-ticas.

cara. La frecuencia absoluta la denotamos por f. la cantidad de veces que se repite recibe el nombre de frecuencia. Podemos entonces definir frecuencia a la cantidad de veces que se repite un determinado dato. que son atributos. sello. por ser características cualitativas. Si la frecuencia relativa la multiplicamos por 100 obtenemos la frecuencia relativa porcentual. Después que hemos obtenido los datos referidos a una población. Las características de los datos obtenidos son cara y sello. Las características cualitativas. universo o masa estadística determinada. Cuando en una población. lo cual no debe olvidarse nunca. una característica se repite varias veces. de modo que hablaremos de: métrica nominal en las características cualitativas. supon-gamos que lanzamos seis veces una moneda y obtenemos los resultados: cara. . de manera que podamos obtener una primera información de ellos. Vemos que la frecuencia del atributo cara es 4. es necesario que se ordenen. cara. Por ejemplo. cara.Los intervalos de las expresiones de estas características se miden con ayuda de una métrica. sello. mientras que la de sello es 2. métrica ordinal en las características de rango métrica cardinal en las características cuantitativas. La frecuencia absoluta es la cantidad de datos de una determinada población. que poseen la misma característica. La frecuencia relativa es el resultado de dividir la frecuencia absoluta entre el total de los datos de la población. universo o masa estadística cualquiera. cuantitativas y de rango son mutua-mente excluyentes.

Modelo de tabla general Cuando se examina una característica de una masa estadística pueden advertirse dos cosas: Que en la masa se manifiestan distintas modalidades de la caracterís-tica. usualmente se utilizan cuadros formados por filas y columnas. Cuando se indican en la tabla de distribución todas y cada una de las expresiones de la característica. se habla de distribución de datos indivi-duales o datos no agrupados. las calificaciones comprendidas entre 12-15). Que esas modalidades aparecen. o sea matrices. que se conocen como tablas estadísticas. Cuando se resumen varias de esas expresiones en una clase (por ejemplo. Semestre del Instituto Universitario responden a la pregunta: ¿Qué piensas de la cogestión escolar? Las respuestas pueden ser: “pienso que es necesaria”. o “considero que es innecesaria” o “no opino”. con frecuen-cias diferentes. En este caso tenemos que: Unidad estadística: cada uno de los alumnos entrevistados . la mayoría de las veces. Ejemplos: Característica cualitativa Cien alumnos de 1º.Para una mejor visualización de los datos que hemos obtenido. se habla de distribu-ción con datos agrupados.

por ser características cualitativas.00 Cuando en una población.22 0. Características de identificación: objetiva: alumnos de 1º. una característica se repite varias veces. cara. que son atributos. mientras que la de sello es 2. universo o masa estadística determinada. cara. Vemos que la frecuencia del atributo cara es 4.Masa estadística: los 100 alumnos. sello.78 0. innecesaria. Semestre espacial: el Instituto Universitario de la ciudad de Los Teques temporal: el 11-03-97 Características de investigación: postura ante la cogestión escolar. sello. Modalidades de la característica de investigación : necesaria. la cantidad de veces que se repite recibe el nombre de frecuencia. supon-gamos que lanzamos seis veces una moneda y obtenemos los resultados: cara. Las características de los datos obtenidos son cara y sello. Variable Discreta y Variable Continua . cara. Por ejemplo. Podemos entonces definir frecuencia a la cantidad de veces que se repite un determinado dato. no opino Expresión de la característica Ai A1 : necesaria A2 : innecesaria A3 : no opino Frecuencia absoluta fi 78 22 0 Frecuencia relativa fr 0.

Si la variable puede tomar cualquier valor entre dos valores dados. en cuyo caso recibe el nombre de constante. una nominal en la que no se tiene un orden preestablecido.Cuando utilizamos el término variable. o datos no agrupados. cuestionarios. etc. etc. como por ejemplo. las clases sociales. y que se esté considerando como objeto de estudio. Usualmente. se entiende por medición. pueden ser recolecta-dos mediante distintas técnicas.. y. la cual puede ser de una manera simple. mientras que si ocurre lo contrario. etc. Puede suceder que la variable pueda tomar un solo valor. se dice que la variable es continua. depen-diendo del punto de vista del observador. Formas de recolección de información La información. nos referimos a símbolos tales como x. Medición de la información El término medición tiene distintas maneras de ser definido. y otra ordinal en la que se establece un determinado orden. o mediante una agrupación de datos. Formas de representación de una serie de datos La información (datos) obtenidos mediante la aplicación de una determinada técnica de recolección. sabor. que constituyen el dominio de la variable. y de las necesidades de informa-ción que se requiera. datos o elementos estadísticos. al número que se asigna a un elemento determinado para expresar como una cantidad alguna de las propiedades que posea. de pueden representar mediante un cuadro que se conoce como tabla de distribución de frecuencias. entre las que se pueden citar. las encuestas. se dice que es una variable discreta. El . z. Las variables pueden ser consideradas también como una expresión cualitativa. Estas variables tiene dos tipos de escalas. entrevistas. y pueden ser descritas de acuerdo a su color. los cuales pueden tomar un conjunto de valores.

Lo más común es que no estén ordenados. Los datos que se obtienen mediante la observación de una población determinada. . cronológicos y geográfi-cos. la tabla se refiere a datos agrupados. si se quiere obtener información útil. La frecuencia se refiere a la cantidad de veces que se repite un dato. existen cuatro escalas de medición: Datos estadísticos Los datos estadísticos es la información que se obtiene mediante la observación a las personas o cosas que constituyen la población objeto de estudio. pero que conviene recordar nuevamente. Si se está midiendo el peso de una persona. mientras que si se está tomando la medida de un segmento de recta.significado del número va a depender del sistema de referencia que se esté utilizando. En la serie de datos del ejemplo anterior. Esto se conoce como frecuencia absoluta. Dependiendo de las formas de utilización de los números asignados. Puede ser que los dos números sean iguales. del cual ya se ha hablado. estos datos pueden obtenerse en forma ordenada o no. de manera rápida y eficiente. clasificación y orden de los datos que se estén estudiando. cuantitativos. el número asignado se refiere a la cantidad de kilogramos que marca la balanza. pueden ser: cualitativos. La distribución de frecuencias puede ser para datos agrupados o para datos no agrupados. el número es la distancia que hay entre sus dos extremos. Evidentemente. Se observa que aparece un término nuevo: frecuencia. lo conveniente es organizar la información. pero dependiendo del sistema de referencia que se esté utilizando. por lo que. tendrán significados diferentes. Esto se logra mediante la organización.

74 23 03 58 29 63 55 65 88 60 52 03 08 07 19 05 49 89 50 62 23 27 56 42 29 09 88 45 40 09 58 61 11 40 88 32 77 22 79 69 87 03 56 70 88 29 11 10 47 58 Al observar la manera como están distribuidos estos datos. la siguiente el resultado de multiplicar la anterior por 100. Tenemos que buscar alguna forma de simplificar la manera en . donde en la primera columna se anotarán las distintas calificaciones obtenidas en el grupo (clases). considérese el siguiente ejemplo. en la tercera el resultado de dividir cada frecuencia entre el total de los datos (frecuencia relativa). Otras columnas para las frecuencias acum. la siguiente el resultado de multiplicar la anterior por 100 (frecuencia relativa porcentual) . que nos permita sacar algún tipo de conclusiones. resulta muy difícil. Para datos agrupados. a simple vista. lograr alguna información. en la segunda las veces que se repitió cada calificación (frecuencias). conformada por filas y columnas.-ladas. correspondiente a las calificaciones de una prueba de castellano aplicada a un grupo de 30 estudiantes: 15 12 10 10 11 10 12 10 12 08 12 15 18 15 14 14 18 10 10 18 13 05 15 18 18 14 08 18 13 05 Se puede construir una matriz. consistente en las calificaciones de un test aplicado a 50 individuos. considérese la siguiente serie de datos. frecuencias acumuladas relativas y frecuencias acumuladas porten-tual.Para un ejemplo de distribución de frecuencias con datos no agrupados.

3 = 85 2. una clase es un intervalo de valores comprendido entre dos valores correctamente definidos. Estos intervalos deben tener. igual longitud. Por lo general la cantidad de clases no debe ser menor de cinco (5) ni mayor que veinte (20). Se puede calcular de distintas maneras: una puede ser estableciendo un número conveniente que divida de la manera más exacta posible a R. ic = # de intervalos de clases R . Esto no descarta la posibilidad de que puedan existir intervalos de diferente longitud o amplitud. Se determina el rango (R). ni mayor que 20. Una técnica de lograr información a partir de los datos originales. longitud o amplitud. el número de intervalos es igual a 1 más 3.que se presentan los datos. El resultado de dividir R entre el número de clases es lo que se conoce como amplitud del intervalo. Esta cantidad no debe ser menor que 5.32 veces el logaritmo de N. en forma de intervalos de clases. Lo que si existen son acuerdos. que constituyen los límites de la clase o del intervalo de clase. R = 88 . Se establece el número de intervalos de clase. No existen formas predeterminadas de determinar la cantidad de clases que deban formarse y su tamaño. es agruparlos convenientemente. Esto se logra obteniendo la diferencia entre el mayor y el menor de los datos. que usualmente se denota por ic. por conveniencia. Eso reduce el campo visual de la información. Desde el punto de vista estadístico. según la cual. permi-tiendo verla más en conjunto. otra es aplicando la fórmula de Sturges. El proceso que usualmente se realiza para la construcción de una tabla de distribución de frecuencias para datos agrupados es el siguiente: 1.

Este valor corresponde a la amplitud aparente. se redondeará el valor ic por exceso. No se rompe la continuidad. Este procedimiento tiene las siguien-tes ventajas: 1. . 2. Se elimina la posibilidad que un valor caiga en la frontera. de acuerdo a la unidad que se esté utilizando para la variable. Para encontrar la amplitud real. 3. No se altera el punto medio o representante de clase.

Sign up to vote on this title
UsefulNot useful