La Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los

datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población. Según se haga el estudio sobre todos los elementos de la población o sobre un grupo de ella, vamos a diferenciar dos tipos de Estadística: Estadística descriptiva. Realiza el estudio sobre la población completa, observando una característica de la misma y calculando unos parámetros que den información global de toda la población. Estadística inferencial. Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la población. Veamos dos ejemplos que nos aclaren estos dos tipos de Estadística: Ejemplo 1. Cuando van a llegar cualquier tipo de elecciones, por ejemplo, las elecciones generales, es muy frecuente que los medios de comunicación, nos adelanten los resultados de encuestas o sondeos en los que se nos indica el resultado final de dichas elecciones con una precisión y con un error determinado. Estos sondeos son realizados por distintas técnicas sobre un grupo (muestra) más o menos numeroso de personas. Naturalmente, cuanto mayor sea el número de individuos con derecho a voto, encuestados, mayor será la confiabilidad de la encuesta, pero también mayor será el costo del sondeo. El estudio de esta muestra se haría mediante estadística descriptiva, pero lo que nos interesa no es el resultado de este estudio reducido sino el resultado final de las elecciones. El paso de generalizar los resultados de la muestra a toda la población, se hace mediante técnicas de Estadística inferencial. La elección de la muestra debe hacerse mediante métodos de muestreo para que el estudio resulte lo más confiable posible. Ejemplo 2. Supongamos que estamos en un instituto con un número muy elevado de alumnos y alumnas, por ejemplo 500, y queremos hacer un estudio estadístico sobre su altura. Un método sería pasar clase por clase y medirlos a todos, esto podría llevar un tiempo considerable pero sería la forma más exacta de hacer dicho estudio, aunque es fácil encontrarnos con ausencias y tendríamos que volver varios días y pasar lista para conseguir la estatura de todo el alumnado. Una vez que tengamos todos los datos en nuestro poder los resultados los obtendríamos mediante Estadística descriptiva.

Otra posibilidad podría ser pasar clase por clase, decirle a los alumnos y alumnas que anoten su estatura en un papel y recogerlos todos. También así tendríamos un estudio de Estadística descriptiva, aunque seguramente menos fiable que con el método anterior, pues casi con toda seguridad, y lo digo por experiencia, algunos alumnos escriban su estatura a cálculo y otros, con ganas de bromas, muy por encima o muy por debajo de la realidad. Y otra posibilidad sería escoger una muestra, es decir un grupo, por ejemplo, 50 personas, hacer el estudio descriptivo sobre ellas y después generalizarlo a todo el instituto con Estadística inferencial. En este caso, comprobaríamos por una parte que cuanto mayor sea la muestra más trabajo tendremos, pero más confiable será el resultado final y por otra, que la elección de la muestra debe hacerse de manera que permita también fiarnos del resultado obtenido. Si estamos en segundo de bachillerato, ¿podríamos coger como muestra los 50 alumnos de este curso? ¿Por qué? ¿Qué forma de elegir la muestra se te ocurre? En cualquiera de los dos ejemplos, ¿cuáles serían los resultados más confiables? Conceptos básicos. Ya hemos hablado de ellos en los ejemplos anteriores, en cualquier estudio estadístico aparecerán los conceptos: individuo, observación o dato, cada uno de los elementos, personas u objetos que se van a estudiar; población, que es el conjunto formado por todos los elementos a los que les vamos a hacer el estudio; muestra, el subconjunto de la población que elegimos para hacer un estudio más reducido. 2. VARIABLES ESTADÍSTICAS.

Al hacer un estudio de una determinada población, observamos una característica o propiedad de sus elementos o individuos. Por ejemplo, con los alumnos y alumnas de nuestra clase, podemos estudiar el lugar de residencia, el número de hermanos, la estatura, etc. Cada una de estas características estudiadas se llama variable estadística. Aunque este es el concepto que vamos a utilizar, también reciben el nombre de carácter estadístico. Dependiendo de la característica podemos distinguir varios tipos de variables:

Variable cualitativa. Es aquella característica que no podemos expresar con números y hay que expresarla con palabras. Por ejemplo, el lugar de residencia. Variable cuantitativa. Es cualquier característica que se puede expresar con números. Por ejemplo, el número de hermanos o la estatura. Dentro de esta variable podemos distinguir dos tipos: Variable cuantitativa discreta. Es aquella variable que puede tomar únicamente un número finito de valores. Por ejemplo, el número de hermanos. Variable cuantitativa continua . Es aquella variable que puede tomar cualquier valor dentro de un intervalo real. Por ejemplo, la estatura. Naturalmente, siempre que hacemos un estudio estadístico en una población, el número de individuos será muy pequeño o muy grande, pero siempre será un número finito. Por tanto, podríamos decir que todas las variables son discretas. Sin embargo, mientras que al estudiar el número de hermanos en un instituto de 500 alumnos y alumnas, nos vamos a encontrar entre cinco y diez valores distintos; al estudiar la estatura de todos con dos cifras decimales, nos podemos encontrar muchos más. En este último caso, aunque podamos tener 30 valores distintos, que es un número finito, hablaremos de variable continua. Esto se debe a que para trabajar con estos datos resulta mucho más fácil agruparlos en intervalos que hacerlo de forma aislada. Para hacer cálculos con una variable continua, utilizaremos el punto medio de cada intervalo, al que llamaremos marca de clase. Ahora, en tu tiempo independiente, Indica otros ejemplos de distintos tipos de variables estadísticas.

3. FRECUENCIAS. TABLAS ESTADÍSTICAS.

Para hacer un estudio estadístico de una característica de una población, necesitamos elegir dicha característica y después hacer un recuento. Uno de los primeros recuentos que hacemos en clase es en la elección del delegado o delegada del curso. Este recuento puede resultar más o menos fácil dependiendo del número de alumnos y alumnas que tengamos, ¿cuántas veces nos ha pasado

que no nos coincide el recuento final de los votos con el número de personas que hay? Una vez que hemos realizado el recuento, hay que organizar los datos y expresarlos de forma simplificada para que su interpretación sea fácil y rápida. Esto se hace disponiendo los datos por columnas o filas formando lo que llamamos una tabla estadística. Valores de la variable Número de veces que aparecen f1 f2 ... fn N: Número total de datos

x1 x2 ... xn

En primer lugar la tabla estará formada por estas dos columnas, pero más tarde iremos añadiendo más según los cálculos que necesitemos. Sin hacer muchos cálculos, podemos ir completando la tabla con las frecuencias, que definimos a continuación: Frecuencia absoluta. Es el número de veces que aparece cualquier valor de la variable. Se representa por f i. En algunos libros de texto nos la encontraremos representada por ni. Frecuencia absoluta acumulada. Es la suma de la frecuencia absoluta de un valor de la variable con todos los anteriores. Se representa por F i. Frecuencia relativa. Es el cociente entre la frecuencia absoluta y el número de datos (N). Se representa por fr. Al multiplicarla por 100 obtenemos el porcentaje de individuos que presentan esta característica.

Frecuencia relativa acumulada. Es la suma de la frecuencia relativa de un valor de la variable con todos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta acumulada y el número total de datos. Se representa por Far. Vamos a realizar tres estudios estadísticos entre nuestros alumnos y alumnas, cada uno de ellos correspondiente a un tipo de variable estadística: lugar de residencia, número de hermanos y estatura. Preguntamos uno a uno sobre estas características y obtenemos: Lugar de residencia: Antímano, P.A., P.A., P.A., P.A., P.A., P.A., P.A., P.A., Caricuao, Campo Alegre. Número de hermanos: 2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2. Estatura: 1.59, 1.75, 1.71, 1.85, 1.64, 1.62, 1.66, 1.60, 1.63, 1.76, 1.66. En las siguientes escenas puedes construir la tabla de frecuencias para variables discretas y continuas. Como puedes observar no se han tenido en cuenta las variables cualitativas. Esto se debe a que al no trabajar con números no se pueden hacer operaciones. Únicamente tendría sentido en la tabla construir las columnas de frecuencias absolutas y relativas, pero no las acumuladas. En el siguiente apartado de gráficos estadísticos también se podrían representar, pero para los apartados de cálculo de parámetros no podremos trabajar con ellas. si tienes interés en alguna representación, sustituye los valores la variable por los números que quieras y represéntalas o construye la tabla.

4. GRÁFICOS ESTADÍSTICOS.

Una vez construida la tabla de frecuencias, vamos a representar mediante distintos gráficos el estudio realizado. Entre los gráficos más utilizado podemos destacar: Diagrama de barras o rectángulos . Consiste en un sistema de coordenadas rectangulares y una barra o rectángulo para cada valor de la variable. Normalmente, se suele colocar en el eje horizontal los valores de la variable (aunque también se puede hacer en el vertical). El otro eje se gradúa

parece razonable determinar un dato. La representación gráfica consiste en dibujar una barra o un rectángulo para cada uno de los valores de la variable de altura igual a su frecuencia. Diagrama de sectores. los rectángulos aparecen pegados en la representación gráfica. Es un caso particular del diagrama anterior en el caso de variables continuas. al que denominaremos media aritmética. Cuando el estudio estadístico se hace sobre una zona geográfica. . En caso de que la amplitud de los intervalos no se igual para todos.según los valores de las frecuencias. Después de haber representado los datos gráficamente. PARÁMETROS ESTADÍSTICOS. Un ejemplo muy utilizado de histograma es una pirámide de población. hay que hacer coincidir el área del rectángulo con la frecuencia del intervalo. Representamos los puntos que tiene por primera coordenada el valor de la variable y por segunda el valor de la frecuencia. coloreando con distintos colores cada una de las regiones representadas en el estudio. Pictograma. la representación gráfica se puede hacer sobre un mapa. ahora llega el momento de hacer un estudio de los mismos. Uniendo todos los puntos obtenemos una línea poligonal que es la representación que buscamos. Consiste en la representación gráfica del estudio realizado utilizando dibujos alusivos a los distintos valores de la variable estadística. Si los intervalos son correlativos. y que representa la estatura de todo el alumnado estudiado. Polígono de frecuencias. Además de este dato existen otros datos (que llamaremos parámetros) que van a representar a toda la población o que nos van a indicar si la población está muy concentrada o muy dispersa. Cartograma. Histograma de frecuencias. La amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente. Representamos dos ejes rectangulares y representamos en el horizontal los valores de la variable y en el vertical las frecuencias. 5. Si estamos estudiando la estatura de todos los alumnos y alumnas del instituto y necesitamos dar información de este estudio. Consiste en dividir un círculo en tantos sectores como valores de la variable.

Son datos que resumen el estudio realizado en la población. la varianza y la desviación típica. Son datos que representan de forma global a toda la población. si hacemos un examen en la clase y queremos tener una idea global del resultado de dicho examen. es decir. Son datos que informan de la concentración o dispersión de los datos respecto de los parámetros de centralización. MEDIDAS DE TENDENCIA CENTRAL.Parámetros o medidas estadísticos . Se define la media aritmética como la suma de todos los _ datos dividida por el número de datos. ¿cómo lo podríamos hacer? Parece evidente que sumando todas las notas y dividiendo el resultado por el número de alumnos. 5. la desviación media. Parámetros o medidas de tendencia central o de centralización . Parámetros o medidas de dispersión . la moda y la mediana. Media aritmética. Por ejemplo el recorrido. Por ejemplo. lo que todos conocemos como calculando la media. Son datos que representan de forma global a toda la población. Entre ellos vamos a estudiar la media aritmética.1. Pueden ser de dos tipos: Parámetros o medidas de tendencia central o de centralización . Se representa por x Para calcular la media aritmética utilizaremos la siguiente fórmula X = ∑x N i .

+ ( xn )(fn ) N Si la variable es continua. .Sin embargo. Si la variable es discreta. . . vemos cuál es la mayor y la moda será el valor de la variable correspondiente a dicha frecuencia. Vamos a distinguir para el cálculo de la moda entre variables discretas y continuas. el cálculo de la moda no presenta ninguna dificultad. el cálculo se hace de la misma forma pero utilizando las marcas de clase. Por tanto. aquél que tiene mayor frecuencia absoluta. podemos simplificar el cálculo de la media aritmética con la fórmula: X = ∑( x )(f ) i i N = ( x1 )(f1 ) + ( x 2 )(f2 ) + ( x3 )(f3 ) + . podemos observar que aparecen datos repetidos y que en un estudio estadístico tenemos los datos agrupados en una tabla en la que aparecen las frecuencias. únicamente observamos las frecuencias. es el decir. Moda. Se define la moda como el valor de la variable que más se repite. Se representa por Mo. En la siguiente escena podemos calcular la moda de una variable discreta.

Si ordenamos todos los valores de la variable de menor a mayor. Si la variable es discreta y el número de datos es impar. la mediana será el dato que ocupe el lugar central. Pero si queremos calcular un único valor de la variable para la moda. aplicamos la siguiente fórmula: en la que Li representa el límite inferior del intervalo modal. Se representa por Me. También vamos a distinguir para su cálculo entre variable discreta y variable continua. habrá un sólo valor central. fMo-1 y fMo+1 son las frecuencias del intervalo modal. mientras que si hay un número par de valores habrá dos valores centrales. el anterior y el posterior. del que decimos que es el intervalo modal. se define la mediana como el valor de la variable que está en el centro. . Aquí tenemos que comprender que si hay un número impar de valores. Mediana.Sin embargo si la variable es continua la mayor frecuencia absoluta corresponde a un intervalo. c es la amplitud del intervalo y fMo.

Son valores que dividen a la población en diez partes iguales. C2 y C3. deciles y percentiles . Los vamos a representar por C 1. Son valores que dividen a la población en cuatro partes iguales. Entre cada dos de ellos estará el 25 % de los datos. tendremos un intervalo para la mediana. Los . Lógicamente el segundo cuartil coincidirá con la mediana. Entre las medidas de centralización y de dispersión podemos citar éstas que tienen el cálculo similar al de la mediana. la mediana será la media aritmética de los dos valores centrales. no distinguiremos si el número de datos es par o impar. Igual que se ha hecho con la moda podemos suponer que los datos se distribuyen uniformemente en los intervalos y calcular la mediana con la siguiente fórmula: en la que N representa el número de datos y F se refiere a la frecuencia absoluta acumulada. Cuartiles. Cuartiles. Si la variable es continua.Si la variable es discreta y el número de datos es par. Deciles.

. 20 . es decir para calcular el percentil de orden "p". Parámetros de dispersión . PARÁMETROS O MEDIDAS DE DISPERSIÓN. tanto para variables discretas como para variables continuas. cogemos el primer valor de la variable cuya frecuencia absoluta acumulada supera este dato.representaremos por Dn. Si la variable es continua aplicamos la siguiente fórmula muy similar a la utilizada para el cálculo de la mediana: 5. 50 y 75 coinciden con los cuartiles.. se hace de forma similar al cálculo de la mediana.2. Los representamos por Pn.. calcularemos p·N/100. calcularemos el porcentaje de datos que corresponde a dicho percentil. Evidentemente los percentiles 25. El quinto decil coincide también con la mediana. Pero si este valor coincide con una frecuencia absoluta acumulada. Si este valor no coincide con ninguna de las frecuencias absolutas acumuladas. 90 coinciden con los deciles. para calcular un percentil. Y los percentiles 10. Si la variable es discreta. el percentil buscado será la media aritmética entre el valor de la variable correspondiente y el siguiente. Percentiles. Son datos que informan de la concentración o . . El cálculo de estos parámetros. Son valores que dividen a la población en cien partes iguales.

En uno. Se define el recorrido como la diferencia entre el mayor y el menor de los valores de la variable. vamos a suponer que hemos realizado el mismo examen en dos grupos distintos. a la que llamaremos desviación. un 5. podemos ver la diferencia que hay entre este parámetro y cada valor de la variable. Recorrido. en otro. todos los alumnos han sacado la misma nota. por ejemplo si en la estatura tenemos todos los alumnos y alumnas con una estatura normal y uno o una mide alrededor de dos metros. Es la diferencia entre los cuartiles tercero y primero. A veces puede ocurrir que hay valores de la variable. ¿Cuál es la media en los dos casos? ¿Se pueden considerar los dos grupos iguales si la media coincide? Parece entonces que no es suficiente con las medidas de centralización. Nos indica un intervalo en el cual están comprendidos todos los datos. hace falta otros parámetros que informen sobre la mayor o menor concentración de los datos. excesivamente pequeños o grandes que hacen que la información que proporciona el recorrido sea equivocada. pero si la calculamos nos llevaremos la sorpresa de que vale 0. Por ejemplo. Recorrido intercuartílico. Para estos casos es más útil el siguiente parámetro. Desviación media. Se representa por R. ¿Por qué? . la mitad de los alumnos ha sacado un 0 y la otra mitad un 10. Al calcular la media. Podemos definir la desviación media como la media aritmética de todas las desviaciones.dispersión de los datos respecto de los parámetros de centralización. Se representa por R I (RI=C3-C1) y representa la amplitud del intervalo en el que se encuentra el 50% central de los datos.

Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto de la media. aplicamos la fórmula: Si desarrollamos esta fórmula. La podremos calcular con la fórmula: Varianza. se define la desviación media como la media aritmética de los valores absolutos de las desviaciones respecto de la media.Para evitar esta situación. Para calcularla. podemos encontrar otra expresión más sencilla para el cálculo de la varianza: .

Como ya hemos comentado. los más significativos son la media para las medidas de centralización y la desviación típica para las medidas de dispersión. 6. el valor de este punto en dicho eje sería el valor de la media. Si nos imaginamos el diagrama de barras o el histograma de frecuencias apoyado en un punto del eje horizontal de forma que quedase en equilibrio. no es suficiente con un parámetro de .Desviación típica. Vamos a hacer un estudio conjunto de ambas para entender mejor su significado. La media aritmética es el centro de gravedad de la distribución estadística. Se define la desviación típica como la raíz cuadrada positiva de la varianza. ESTUDIO DE MEDIA Y DESVIACIÓN TÍPICA. De todos los parámetros estudiados.

Por ejemplo. es necesario un parámetro de dispersión que nos indique si los datos estudiados están más concentrados o más dispersos. y si los datos están más dispersos la desviación típica será mayor. Si antes hemos comparado variables. no podemos acudir a la desviación típica para ver la mayor o menor homogeneidad de los datos. Lógicamente si los datos están más concentrados la desviación típica será menor. y queremos comparar resultados. llamado coeficiente de variación y que se define como el cociente entre la desviación típica y la media. Coeficiente de variación.25 Por tanto. Puntuaciones normalizadas.centralización. Y este parámetro de dispersión va a ser la desviación típica. Si hemos realizado un estudio estadístico en dos poblaciones diferentes.1 Vp = 10/40 = 0. pero si calculamos el coeficiente de variación para ambos: Vv = 50/500 = 0. sino a otro parámetro nuevo. ¿Qué grupo de animales es más homogéneo? Un razonamiento falso sería decir que el conjunto de perros es más homogéneo porque su desviación típica es más pequeña. Y observamos también un conjunto de perros con una media de 40 kilos y una desviación típica de 10 kilos. en una exposición de ganado estudiamos un conjunto de vacas con una media de 500 kilos y una desviación típica de 50 kilos. es más homogéneo el conjunto de las vacas. también podemos estar interesados en comparar datos de distribuciones distintas .

es lógico pensar que si la distribución tiene una única moda y es simétrica. el perro.y saber. Si no es simétrica. Hasta ahora se han estudiado los parámetros de centralización y de dispersión que son las medidas más frecuentes que se calculan en cualquier estudio estadístico. escogemos una vaca que pesa 550 kilos y un perro que pesa 55 kilos. ¿cuál tiene más peso dentro de su grupo? Naturalmente no vale decir la vaca que pesa mucho más. suele suceder que la mediana esté comprendida entre la moda . cuál destaca más o menos dentro de su grupo según la característica observada. Tipificamos ambos valores y obtenemos: zv = (550-500)/50 =1 zp = (55-40)/10 = 1. Por ejemplo. es decir. Sin embargo existe también medidas que indican de la simetría o asimetría de la distribución y del achatamiento o no de la misma. entonces las tres medidas de centralización coinciden. 7. Esto lo vamos a hacer tipificando la variable con la fórmula: Obteniendo así una nueva variable estadística de media 0 y desviación típica 1. tiene más peso el animal que tiene mayor puntuación normalizada. Empezando con la simetría.5 Como las dos variables tipificadas tienen la misma media y la misma desviación típica. con la que resultará más fácil poder comparar los datos. MEDIDAS DE ASIMETRÍA. si en la exposición de ganado anterior.

Si el coeficiente es positivo. Miden la mayor o menor simetría de la distribución. Existen dos medidas de este tipo: Índice de simetría de Pearson: Si la distribución es simétrica. el índice es igual a 0. la distribución se llama leptocúrtica. Medidas de simetría o asimetría. y si es asimétrica a la izquierda. Medidas de curtosis. sería más achatada que la . Hay una mayor concentración de los datos en torno a la media. es negativo. Miden la mayor o menor concentración de datos alrededor de la media. Se suele medir con el coeficiente de curtosis: Si este coeficiente es nulo. la distribución se llama platicúrtica y hay una menor concentración de datos en torno a la media. la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica. Si el coeficiente es negativo.y la media. es positivo. si es asimétrica a la derecha. más puntiaguda que la anterior.

Lo que posibilitó el cálculo de probabilidades fue.. Apuntes de Estadística Capítulo 1. Etimológicamente. . la antigua estadística y el cálculo de probabilidades. Conceptos generales 1. la palabra estadística procede de la palabra estado. Precisamente este fundamento probabilístico condiciona el que los resultados obtenidos se vean sujetos a unos márgenes de error. por conocer el estado de sus naciones (de ahí la raíz del término). Ya en la antigüedad los romanos y los egipcios hicieron intentos por tener un conocimiento preciso del número de sus habitantes y de sus posesiones. Así se ha desarrollado la estadística analítica o inferencial basada en la teoría de probabilidades que trata de obtener leyes generales a partir de la observación de algunos datos. Sin embargo las conclusiones extraídas se agotan en el propio conjunto de datos observados. proporcionó el instrumento adecuado para poder hacer inferencias acerca de grandes cantidades de observaciones potenciales a partir de unas pocas observaciones reales. La Estadística actual es el producto del encuentro y la propia fecundación de dos ramas distintas del saber. pues el objetivo consistía en hacerse una idea clara de lo que había. en su aplicación por Galton a los problemas de herencia. Este tipo de estudios dio lugar a la estadística descriptiva cuya misión consiste en describir situaciones y proceso dados. proporciones. es decir. que se encontraron en el siglo XIX. Ahora se puede dar una definición de Estadística en la que aparecen algunos términos no definidos lo cual no impedirá entender su significado. para ello se sirve de tablas.primera. precisamente. el desarrollo de un conjunto de métodos para extrapolar las conclusiones a entidades no observadas. números índice y medidas típicas. Sin embargo los auténticos fundadores de estas técnicas fueron KarlPearson (1857-1936) y Sir Ronald Fisher (1890-1962).Introducción Las dos grandes funciones de la Estadística (descripción de datos y realización de inferencias) reflejan la propia historia del desarrollo de esta ciencia. y lo que había se contaba y se medía. etc. representaciones gráficas. Estas técnicas tuvieron su fundamento en el desarrollo de la curva normal por Gauss. Para ello hicieron recolecciones de datos que posteriormente tenían que resumir de una forma comprensiva y que permitiera proporcionar informaciones útiles. Es decir.

que van a interaccionar con sus características personales. Estas tareas requieren tratamientos estadísticos simples de los datos de los alumnos. Por tanto.La Estadística como herramienta para el profesor Dentro del ambiente educativo la Estadística es necesaria al menos para llevar a cabo estas cuatro tareas: 1ª Lectura de literatura profesional La investigación en Ciencias de la Educación emplea la Estadística como herramienta habitual en la realización de cualquier experimento. centro escolar y contexto social concreto. distintas asignaturas y distintas variables psico-sociológicas.. contará con el apoyo del análisis comparativo de la situación relativa de cada individuo en su clase. 2. el profesor que quiera estar al día respecto a la enseñanza de su disciplina debe estar en condiciones de poder comprender textos de investigación en Ciencias de la Educación.. 4ª Investigación y predicción El profesor puede estar interesado en averiguar si una nueva técnica didáctica es realmente más efectiva de cara al rendimiento de sus alumnos que la usada por él hasta ahora.. O en saber el efecto que producen variables familiares. a la hora de tomar decisiones acerca de sus alumnos. rasgos psicológicos en la destreza del alumno en realizar tal o cual tarea. El conocimiento profundo de este contexto en el que está involucrado el alumno resulta de vital importancia para el educador y no será posible sin el análisis estadístico de los datos individuales de los elementos del contexto. 3.Primeros conceptos . 2ª Conocimiento de la clase El profesorse enfrenta a la tarea de la educación de unos alumnos ubicados en una clase.. y de la realización de inferencias acerca de las poblaciones de lasque éstas proceden.Estadística es la ciencia que se ocupa de la ordenación y análisis de datos procedentes de muestras. También la propia actividad del profesor puede verse mejorada tras un análisis del rendimiento escolar del grupo en su conjunto. 3ª Diagnosis didáctica El profesor. Este tipo de trabajos requieren el uso de métodos estadísticos.

que tienen una actitud positiva hacia la práctica deportiva continuada. a su vez. parámetro y estadístico .Población estadística es el conjunto de todos los elementos que cumplen una o varias características o propiedades.Un estadístico es una propiedad descriptiva de la muestra. Esta población suele ser demasiado extensa (razones económicas) o poco definida (votantes) como para estudiarla al completo. Parece obvio que preguntarles a todos ellos acerca de esta actitud resultaría bastante costoso por lo que decidimos seleccionar algunos de ellos para realizar la consulta.-Supongamos que estamos interesados en saber cómo es la actitud de los estudiantes de la U. por el tanto por ciento de alumnos con actitud positiva en la muestra.Un parámetro es una propiedad descriptiva de la población. . muestra.A.C. es decir. 2º. así que decide hacer un experimento con dos clases de las que él mismo es profesor.A. Pongamos ahora algunos ejemplos que nos permitan identificar los conceptos que hemos definido: 1º.A. . Relación entre los conceptos de población. La población es en estos momentos de alrededor de 25. En primer lugar confecciona una prueba de conocimientos previos de un tema de la asignatura y la .Una muestra es un subconjunto de los elementos de una población.B. Con los resultados obtenidos a partir de estos alumnos seleccionados (muestra). una estimación del parámetro de la población.-Un profesor de historia quiere medir la eficacia del uso sistemático de la hemeroteca para la enseñanza de la Historia de Venezuela de 3º de Educación Media.Normalmente. Este parámetro sería estimado por el valor del correspondiente estadístico en la muestra que hemos seleccionado.000 estudiantes. En este estudio uno de los parámetros podría ser el tanto por ciento de alumnos de la U. Entonces se lleva cabo una selección (o muestreo) del que se obtiene una muestra de elementos que sea una representación de la misma. hacia la práctica deportiva continuada. .C. Este profesor no puede realizar un estudio que implique a todos los alumnos de 3º de Educación Media de Venezuela.C. podremos generalizar sobre la actitud de todos los alumnos de la U.B.B. Esa medida es un estadístico muestral que es. Se mide a estos sujetos de la muestra la característica buscada y se calcula el valor de esa característica para esa muestra. el investigador desea conocer un parámetro o característica de los elementos de una población.

pasa a sus alumnos. una estimación de ese parámetro.. con ayuda de la Estadística. puede responder a algunas preguntas como: ¿Obtienen mejores notas los alumnos de la clase A que los de la clase B? ¿Partían del mismo nivel de conocimientos previos? ¿Podría este hecho influir sobre los resultados del experimento? ¿Se pueden generalizar los resultados del experimento de este profesor? 3º.Variables y su clasificación . El porcentaje de individuos de la población que responderían SI es un parámetro. El estadístico podría ser la media del tiempo empleado en los ensayos. En la clase B se limita a dar su lección magistral. Ahora. mientras que no debe dar respuesta alguna ante el otro. resultaría muy costoso preguntar a todos los votantes por su intención de voto por lo que seleccionamos 3000 venezolanos (muestra) que consideramos representativos y les preguntamos por el sentido de su voto ante el referéndum. En este caso la población la componen todas las5realizaciones de la tarea que potencialmente puede realizar nuestro sujeto experimental. Cuando acaba la explicación del tema examina a sus alumnos. 4º. 4. cada uno de ellos representando el tiempo invertido por el sujeto en cada uno de los ensayos. se presentan al sujeto en cada ensayo uno de dos posibles estímulos. Para ello. El porcentaje de nuestra muestra que responde SI es un estadístico. Para hacernos una idea global de cómo realiza la tarea nuestro sujeto.-Tratamos de hacer un sondeo acerca del resultado de un referéndum que se celebrará próximamente en España. La muestra la constituyen los treinta ensayos. La población en este caso está poco definida porque no todas las personas que pueden votar lo hacen realmente y. pide a sus alumnos que lean algunos periódicos que reflejen algún aspecto del tema.-Queremos estudiar el procesamiento de información en tareas simples. En este caso estamos interesados en el tiempo que necesita un sujeto en concreto para realizar una tarea. aparte de la habitual lección magistral. En la clase A. Ante uno de ellos el sujeto deberá presionar un botón tan rápido como pueda. para lo cual se ha utilizado tradicionalmente como medida el tiempo de reacción. además. decidimos administrarle 30 ensayos con lo que obtenemos 30 datos.

Voto del referéndum.En el segundo los estudios cursados (3º de EDUCACIÓN MEDIA). . . .Una característica es una propiedad o cualidad de un individuo.Actitud de los estudiantes de la U.Lugar de procedencia .B. Las variables que aparecen en los ejemplos son: .Motivación ante la asignatura . .A través de estos ejemplos se ve que cuando estudiamos las entidades que conforman una población nos interesamos por algunas de las propiedades de sus elementos.Empleo del tiempo de ocio Ahora estamos en condiciones de definir el concepto de variable como la característica de los elementos de una población que toma ó puede tomar valores distintos encada uno de ellos.Una modalidad es cada una de las maneras como se presenta una característica.Rendimiento académico en las asignaturas cursadas que adopta distintas modalidades.A. . .Sexo que adopta dos modalidades: varón y mujer. normalmente son valores entre 0 y 10. . y esas propiedades adoptan distintas variedades: . Las constantes que aparecen en los ejemplos son: . Podemos señalar como ejemplo algunas de las características y modalidades de los alumnos de Enseñanza Secundaria: .En el primero el nivel de estudios de los encuestados (todos son universitarios). . . hacia la práctica continuada del deporte.Nota obtenida por los alumnos en la prueba final.Nota obtenida por los alumnos en la prueba de conocimientos previos.En el cuarto la nacionalidad de los encuestados (venezolana).C.Tiempo de realización de la tarea. En contraposición a éste aparece el concepto de constante que es una característica de la población que sólo puede tomar un valor para todos los elementos de la población.

no podemos conocer su valor exacto. etc. Una variable discreta es aquella que adopta valores aislados. pero no podemos establecer relaciones de orden respecto a esa característica. sino su valor informado. En realidad una variable continua nunca puede medirse con total precisión. sexo.655. la duración de un suceso. A este tipo de variables medidas con escala nominal se les puede asignar a cada categoría cualquier tipo de símbolos. Cuando tratamos con variables continuas y las definimos como variables que pueden tomar cualquier valor.65 queremos decir que mide entre 1. que es el que nos proporciona el instrumento de medida. tenemos que tener en cuenta la precisión del instrumento de medida que estamos usando. 5. profesión. No podemos ordenar los sujetos de mayor a menor o viceversa. Una variable continua es la que puede tomar todos los valores de un intervalo. si utilizamos el metro como unidad de medida. 2 → verde.645 y 1. Por ejemplo. número de alumnos de una clase. Ejemplo: número de asignaturas aprobadas en el curso pasado. M → marrón y N →negro. V → verde. Usando una escala nominal podemos decidir si un sujeto es igual o diferente a otro. 3 → marrón y 4 → negro .Medición y escalas Llamamos medición al proceso Media de atribuir números a las variables. Otros ejemplos: nacionalidad. el tiempo empleado en la ejecución de una tarea. Por ejemplo: el peso Media. sentido del voto en unas elecciones. El conjunto de reglas o modelos desarrollados para la asignación de números a las variables es lo que se denomina escala. simplemente podemos asegurar si dos sujetos tienen el mismo o distinto color de ojos. etc.. nivel socioeconómico. La clasificación de las escalas más usada es la propuesta por Stevens (1946) que divide las escalas en: nominales. En el ejemplo hemos asignado letras pero podíamos haber optado por números: 1 → azul. ni relaciones de cantidad ni de diferencia. Escala nominal: nos permite identificar sujetos como "iguales" o "diferentes". sexo. ordinales. Por ejemplo: si medimos el color de los ojos podemos establecer la siguiente escala: A → azul. con aproximación de centímetros.Las variables se pueden clasificar según el número de valores que puedan tomar como variables discretas y variables continuas. de intervalo y de razón. la talla. cuando decimos que una persona mide 1.

además de poder identificar un objeto y establecer relaciones del tipo mayor que y menor que. Otros ejemplos de escala ordinal: posición relativa en la clase. escala de dureza de los minerales. Otros ejemplos: la medición de las temperaturas en grados centígrados. Escala de razón: También se llama de proporción o de cociente. Ejemplo: nivel de estudios se puede asignar 1 a estudios primarios. podemos afirmar que ha transcurrido el mismo tiempo entre1960 y 1966 que entre 1980 y 1986 porque contamos con una unidad de medida llamada año. Podemos ordenar a los sujetos según el nivel de estudios. Es decir. Aunque no podemos afirmar que la diferencia existente entre el 2y el 1 sea la misma que la que existe entre el 3 y el 2. Una vez descritas estas escalas podemos volver a clasificar las variables según la escala usada para medirlas. ordinales. también podemos hacer afirmación es acerca de las diferencias en la cantidad del atributo de unos y otros objetos. de intervalo y de razón. podemos afirmar que un objeto que mide 10 cm. También se pueden clasificar atendiendo al tipo de información que proveen en cualitativas y cuantitativas. los objetos se pueden ordenar. que significa ausencia del atributo o característica medida. aunque en este caso el cero sea un punto arbitrario en la escala. la longitud. la escala de los test de inteligencia. . Es decir. 3 a estudios universitarios. es decir. Es decir. Un ejemplo típico es el calendario. es decir. duración de un suceso. temperatura en grados Kelvin (que sí tiene cero absoluto). Ni que el que tenga nivel 3 tenga3 veces más de nivel de estudios que el que tiene nivel 1. podemos hablar de variables nominales.Escala ordinal: Esta escala no sólo permite la identificación y diferenciación de los sujetos sino que además permite establecer relaciones del tipo "mayor que" o "menor que". porque el valor cero no representa el comienzo del tiempo sino que. Además de las características de las otras tres escalas. en nuestro calendario se eligió el año del nacimiento de Cristo como año 1. 2 a estudios secundarios. Otros ejemplos: peso. Escala de intervalo: Con esta escala. no indica ausencia total de la cantidad de atributo. tiene el doble de longitud que uno que mide 5 cm. Por ejemplo. disponemos de una unidad de medida. el valor 3 es mayor que el 2 y el 1. de los sujetos se puede decir cual presenta una mayor o menor magnitud de la característica medida. contamos con una unidad de medida con cero absoluto. Pero no podemos afirmar que hasta el año 1000 haya pasado el doble de tiempo que hasta el año 500. las calificaciones escolares.

En general. .. histograma y polígono de frecuencias. rendimiento académico. que son números que provienen de un cociente: el índice de precios al consumo. en principio. talla.Variables cualitativas son aquellas que se miden según una escala nominal u ordinal. una vez que el profesor o investigador ha recabado información acerca de sus alumnos ó de la muestra elegida en su caso. nivel socioeconómico. número de escolarizados. 1. nivel cultural. Son escasamente utilizadas las de razón o proporción. probabilidad de pertenecer a un grupo dentro de un determinado curso Ratios o números índice. el IQ = (edad mental / edad cronológica) ⋅ 100. temperaturas. probabilidades: porcentaje de aprobados en un centro. tasa de aprobados por especialidad.Datos que son frecuencias de categorías.Distribución de frecuencias. calificación en la última evaluación de la asignatura X. Informan más bien de una cualidad del sujeto: sexo.Datos que reflejan porcentajes. salvo que se use. de una lista de datos. dureza de los minerales. En el capítulo anterior ha quedado claro el hecho de que la Estadística trabaja con datos de muy diversa índole: . etc. exámenes. cuestionarios o encuestas dispone. que provienen de un proceso de conteo: número de nacimientos. Variables cuantitativas son aquellas que se miden según una escala de intervalo o de razón. etc. tiempo empleado en realizar una tarea. ordinales o de intervalo. Organización y representación de datos. talla. número de matriculados en un curso.Datos que provienen de la medición de variables: peso. el tiempo utilizado para ejecutar una tarea. De alguna forma dan cuenta de la cantidad de atributo o característica que el individuo posee. número de asignaturas aprobadas. . Por ejemplo: peso. En la mayoría de las investigaciones educativas las variables manejadas se miden con escalas nominales. a través de test. por ejemplo. Si se han observado pocos valores es posible que la simple inspección visual de . Capítulo 2. color de ojos.

1.. 2. si los estudiantes se agrupan en las posiciones extremas o en las centrales o están dispersos. servirá para representar un valor concreto de la variable X en el sujeto 1. 2. X1 X2 X3. según Hays (1988). Pero esto no es nada frecuente. El número de elementos que componen la muestra será n. 2. La letra X mayúscula con subíndices. 2. 1. 1.los mismos sea suficiente para poder describir el fenómeno estudiado. 1. Las respuestas de sus treinta alumnos son: 1. 3. entre otras cosas. después de un examen saber cuál es la puntuación del estudiante típico. cuál es el rango en que varían las puntuaciones. 3. Ahora vamos a seguir los pasos para la construcción de una tabla de distribución de frecuencias con un ejemplo sencillo. 3. 2. 4. 2. En este caso se trata de una variable discreta que sólo toma los valores 1. y se simboliza por fi al número de veces que se repite el valor Xi en la muestra. En segundo lugar se cuenta cuántas veces aparece cada uno de ellos. 1. Para definir el término frecuencia que aparece. 3. 2. 1. 1.Cuando queramos referirnos a un valor concreto cualquiera de la variable X escribiremos Xi. una representación de la relación entre un conjunto de medidas o clases de medidas mutuamente exclusivas y exhaustivas y la frecuencia de cada una de ellas. 1. 4. 2. se les pregunta por el número de hermanos. Se llama frecuencia de un valor Xi. entonces tendremos que poner en orden nuestros datos de forma que podamos interpretarlos. 3 y 4. que además de ésta función debe cumplir otras dos más: ofrecer la información necesaria para hacer representaciones gráficas y facilitar los cálculos para obtener los estadísticos muestrales. Estos datos se colocan en una tabla de la forma siguiente: . en esta definición vamos a establecer una notación: la letra X mayúscula representará a la variable con la que estamos trabajando. 2. 3. a su vez. 1.. 1. Una distribución de frecuencias es. 2. Un instrumento para conseguir esta ordenación de los datos es lo que llamamos distribución de frecuencias. 4.3.2. por ejemplo. 1. 1. Si queremos. Para construir la tabla de distribución de frecuencias se inspeccionan en primer lugar los valores que toma la variable.. Supongamos que un profesor pasa a sus alumnos una encuesta en la que.

los resultados son los siguientes: 37. Si sumamos la frecuencia de éstas y la de las familias de dos hijos. 85. 91. 63. Una vez construida esta tabla y a pesar de su simplicidad. 73. 51. 68. Para agrupar las puntuaciones de la variable se suelen establecer estas dos reglas: . 46.3% de la muestra. 72. por ejemplo. que en tanto por ciento sobre 30 representan el 73. 55. Vamos a poner otro ejemplo algo más complejo: un profesor pasa un test de hábitos de estudio a sus treinta alumnos. 78. 77. 93. 61. 71. 63. 13 + 9 son 22 familias. 75. 83. 57. que consiste en formar grupos de valores consecutivos de la variable y poner cada uno de estos grupos en cada fila. 58. 65. 32. 42. en lugar de poner una sola puntuación. Este es un ejemplo de tabla de distribución de frecuencias muy simple debido fundamentalmente a que la variable sólo toma cuatro valores diferentes. que las familias con un único hijo son las más frecuentes. 54. 49. El valor más pequeño es 32 y el mayor 93. 77. ya podemos extraer algunas conclusiones.Valores de la variable Frecuencia Xi 1 2 3 4 N fi 13 9 5 3 30 Tabla 1: Distribución de frecuencias de la variable “Número de hermanos”. Si construyésemos una tabla de distribución de frecuencias como la anterior tendríamos una lista demasiado extensa (62 números) y muchas de las frecuencias serían cero. 85. 73. En estos casos se recurre a lo que se denomina la agrupación en intervalos de clase. 33. 73.

1. Atendiendo a la regla nº 1. su rango ó amplitud total es 93-32+1=62. la variable toma valores entre 32 y 93. 2º. así que el primer intervalo de clase contendrá las puntuaciones 30. La tabla de distribución de frecuencias agrupada sería la siguiente: Xi 30 34 35 39 40 44 45 49 50 55 55 59 60 64 fi 2 1 1 2 2 3 3 . es decir. En nuestro ejemplo. 32.2 y62/20=3. 31. En nuestro ejemplo 32 es el valor más pequeño y 30 el múltiplo de 5 más cercano. Esto quiere decir que si agrupamos las puntuaciones de 6 en 6 tendremos 10intervalos. Son preferibles los intervalos de clase que contengan 1. Nos fijamos en la regla nº 2 y dividimos 62/10=6. 3. 5. 93 y 94.1º. 2. El número de intervalos o grupos debe variar entre 10 y 20. 10 ó 20 unidades de la escala. 92. 91. La siguiente pregunta es ¿a partir de qué número empezamos a contar en la escala?. 33 y 34 y el último 90. decidimos hacer intervalos de clase de amplitud 5. A partir de un número que sea múltiplo del tamaño de los intervalos de clase y que se aproxime lo más posible a la medida observada menor. si las agrupamos de 3 en 3 tendremos alrededor de 20 intervalos.

Según esta tabla de distribución de frecuencias agrupadas. Aunque en la práctica esto es así porque el test usado para medir hábitos de estudio notiene la precisión suficiente para obtener valores como 44. A partir de los límites informados o de los límites exactos se puede definir el punto medio del intervalo como el punto que resulta de la suma del extremo superior yel extremo inferior dividida por dos.5 o 59.5 + 64. a los límites de los intervalos que aparecen en la Tabla 2.8. el punto medio del intervalo 60-64 es el punto 62. Por ejemplo.5-34. como su media. es decir. la variable puntuación del test de hábitos de estudio no puede tomar valores entre 44 y 45 o entre 59 y 60. puede tomar cualquier valor entre 30 y 94. es decir. resultado de (60 + 64) / 2 ó de (59. .65 69 70 74 75 79 80 – 84 85 89 90 94 N 2 5 4 1 2 2 30 Tabla 2: Distribución de frecuencias con los datos agrupados en intervalos de clase de la variable puntuaciones obtenidas en un test de hábitos de estudio. los del intervalo 35-39 son 34. les llamaremos límites informados.5.5) /2. Así pues los límites exactos del intervalo 30-34 son 29.5-39. en teoría tenemos que considerar esta variable como continua en el intervalo.5 y así sucesivamente de forma que el límite superior exacto de un intervalo coincida con el límite inferior exacto del siguiente. Por otra parte.

5 .5 .64. para usarla más adelante en las representaciones gráficas.44.5 .34.79 80 – 84 85 .5 59.5 .69 70 . En este momento volveremos a escribir nuestra tabla de distribución de frecuencias añadiendo los límites exactos de los intervalos y sus puntos medios.49. a la que hemos añadido los límites exactos de los intervalos y sus puntos medios. puntos medios y frecuencias de las puntuaciones obtenidas en el test de hábitos de estudio.5 74.55 55 .5 49.94 N Límites Reales 29.5 64.5 5 4.5 .5 44. estamos en condiciones de hacer algunas representaciones gráficas que nos ayudarán a interpretar la situación de los alumnos en cuanto al test de hábitos de estudio.34 35 .5 .5 . .64 65 .59.69.5 .54.5 69.39.5 .5 Xi 32 37 42 47 52 57 62 67 72 77 82 87 92 fi 2 1 1 2 2 3 3 2 5 4 1 2 2 30 Tabla 3: Intervalos de clase.5 39.94.44 45 .79.5 .La amplitud del intervalo se define como la diferencia entre el límite superior exacto y el límite inferior exacto.74 75 .89 90 . límites exactos.39 40 .5 79.74.89.59 60 .5 .5 34.5 . Clases 30 .49 50 .5 84.84.5 .5 89. Una vez construida la tabla de distribución de frecuencias.

Las observaciones dentro de un intervalo de clase están concentradas en su punto medio. Histograma de los datos Si nos encontramos en la primera situación haremos un histograma o diagrama de barras o columnas.Para hacer las representaciones gráficas de las tablas de distribución de frecuencias podemos considerar dos situaciones distintas: 1ª. En segundo lugar. Es evidente que el histograma y el polígono de frecuencias ofrecen una imagen muy similar de la distribución de frecuencias de los datos. tendremos una mayoría de valores concentrados en torno avalores . se pueden hacer muchas tablas distintas. partiendo de los mismos datos y teniendo en cuenta las dos reglas citadas anteriormente. 2ª. es decir. obtendremos el polígono de frecuencias. que cumplen los requisitos para los cuales se han diseñado: la ordenación de una manera clara y sistemática de nuestros datos. Por ejemplo. si estamos trabajando con la variable "ingresos mensuales". si consideramos que las observaciones dentro de cada intervalo se concentran en su punto medio. En primer lugar queda claro que. Esto es así porque se puede construir el segundo a partir del primero sin más que unir los puntos medios de las bases superiores de los rectángulos del histograma. todas ellas igualmente válidas. es decir. Ahora vamos a hacer algunas consideraciones respecto a las dos normas para la construcción de tablas de distribuciones de frecuencia. tenemos que tener en cuenta que se nos pueden presentar situaciones en las que sea difícil aplicar estas reglas sin perder gran parte de la información. Uniendo estos puntos de forma consecutiva mediante segmentos de recta. Las observaciones dentro de un intervalo de clase están distribuidas uniformemente entre sus límites exactos. En el eje de abcisas (eje de las x) se representan los límites exactos de los intervalos de clase y en el eje de ordenadas (eje de las y) la frecuencia de cada intervalo. Polígono de frecuencias Si nos encontramos en la segunda situación. Sobre cada uno de estos intervalos se dibuja un rectángulo cuya base está delimitada por los límites exactos y su altura es la frecuencia de ese intervalo. construiremos un polígono de frecuencias. En el eje de abcisas representaremos los puntos medios de cada intervalo y en el de ordenadas la frecuencia de cada intervalo.

Así. Definiremos frecuencia acumulada hasta un intervalo de clase. casos u observaciones dentro de dicho intervalo.000" . ya que así compararemos dos distribuciones con cien observaciones. Por ejemplo. en los cuales no se considera límite superior o límite inferior. para construir la tabla de la distribución de frecuencias acumuladas calculando los porcentajes de frecuencias acumuladas. Volvamos al ejemplo de los datos del test de hábitos de estudio. ahora haremos referencia a la distribución de frecuencias acumuladas que se usa cuando se tiene interés en el número de observaciones que se sitúan por debajo de un cierto punto de la escala de medición.Distribución de frecuencias acumuladas. el primer intervalo podría ser "menos de 50. 2. la frecuencia acumulada es igual a su frecuencia más la acumulada del intervalo anterior. para los siguientes. Para el primero de éstos ambas frecuencias coinciden.000" y el último "más de 500. Cuando trabajamos con variables distintas o con la misma variable medida en muestras de distinto tamaño resulta difícil comparar las frecuencias absolutas. y de amplitud constante. más todos aquellos contenidos en intervalos inferiores en la escala. Si en un caso así se hiciera un número de intervalos en torno a diez. . La frecuencia acumulada se calcula de forma inmediata a partir de la frecuencia de cada intervalo de clase. la inmensa mayoría de los datos estarían concentrados en uno o dos intervalos.. como el número de datos. Para evitar eso se utiliza lo que se denomina intervalos abiertos.centrales y unos pocos que se desvían de éstos mucho por arriba. Una forma de resolver este problema es calcular los porcentajes de frecuencias de cada intervalo de clase. la frecuencia acumulada del último intervalo será igual al número de observaciones de la distribución. polígono de frecuencias acumuladas y polígono de porcentajes de frecuencia acumulada Hasta el momento hemos presentado una de las formas de representación y tabulación de datos. De la misma forma se calculan porcentajes de frecuencias acumuladas.

5 .59.5 39.00 26.5 .69.5 79.34 35 .5 44. Estos dos polígonos tienen exactamente la misma forma.54.79.5 34.5 .79 80 – 84 85 .5 .5 89.44.59 60 .34.64 65 . Estos gráficos nos permiten conocer cuántas observaciones o qué porcentaje se sitúan por debajo de un intervalo de clase.69 70 .5 64.5 5 4.5 74.39.00 Tabla 4.5 .5 .49 50 .67 10.00 13.5 .64. representando en el eje de abcisas los límites superiores exactos de los intervalos de clase y en el de ordenadas las correspondientes frecuencias acumuladas o porcentajes de frecuencias acumuladas respectivamente. A partir de esta tabla podemos representar gráficamente el polígono de frecuencias acumuladas y el polígono de porcentajes de frecuencias acumuladas.74 75 .44 45 .33 20.5 84.5 . difieren únicamente en la escala del eje de ordenadas.5 Xi 32 37 42 47 52 57 62 67 72 77 82 87 92 fi 2 1 1 2 2 3 3 2 5 4 1 2 2 30 Fa 2 3 4 6 8 11 14 16 21 25 26 28 30 Fa% 6.5 .5 . .89 90 .39 40 .55 55 .33 86.33 100.74.5 .67 93.67 46.5 59.5 .67 36.89.33 70.Clases 30 .00 83.94 N Límites Reales 29.5 .67 53.49.84.5 69. Distribución de frecuencias acumuladas y porcentaje de frecuencias acumuladas de las puntuaciones en el test de hábitos de estudio.5 49.94.

Un pictograma es una representación gráfica de una variable en forma de círculo que está dividido en tantos sectores como valores distintos tome la variable. cuando se quiere destacar una de las secciones en particular se separa del resto para captar la atención del lector en esa modalidad particular. sesgo y curtosis. Supongamos que el jefe de estudios del centro nos pregunta: ¿Cuál es el rendimiento de la clase A en tu asignatura? ¿Cuánto tiempo han empleado tus alumnos en recorrer el circuito?. Por ejemplo: las calificaciones de un alumno en cuatro asignaturas distintas medidas de uno a diez. Para ello es necesario definir algunas características de las distribuciones de frecuencias que llamamos: tendencia central. es decir.Características generales de una distribución de frecuencias Hasta este momento hemos visto cómo construir tablas y representar gráficamente un conjunto de datos. Y en el eje de abcisas se coloca una marca por cada sujeto. Los perfiles se usan bastante en informes psicopedagógicos o de rendimiento. B. 4.. Otra forma de . En los ejemplos.Otras representaciones gráficas De entre las distintas representaciones gráficas que se pueden hacer con nuestros datos haremos sólo referencia a los pictogramas y los perfiles por su uso más extendido. C y D. una marca por cada asignatura o una marca para cada uno de los grupos. todos ellos medidos con la misma unidad.3. En el eje de ordenadas se representan las puntuaciones alcanzadas en distintas variables o parámetros. o las medias de la asignatura de Matemáticas de 1º de EDUCACIÓN MEDIA en los grupos A. pero estas técnicas todavía no son suficientes para hacer comparaciones entre distintas distribuciones de frecuencias. En ocasiones. pero casi con toda seguridad le costaría un gran esfuerzo entresacar de esos datos respuestas precisas. sus calificaciones y tiempos. Todas ellas tienen sus correspondientes medidas. Le podríamos responder presentándole las tablas de distribuciones de frecuencias o incluso las listas con los nombres de los alumnos. sus indicadores que obtenemos mediante una serie de cálculos a partir de los datos de una tabla de distribución de frecuencias.. Además la superficie de los mismos es proporcional a la frecuencia de cada modalidad de la variable. grupo o variable medida. variabilidad o dispersión.

se agrupan en torno a su promedio. las dos mitades se superponen. Si por el contrario el examen es difícil. el rango y la amplitud semi intercuartil. Un ejemplo: si ponemos a nuestros alumnos un examen muy fácil. la mediana y la moda. El sesgo o asimetría se refiere al grado en que los datos tienden a concentrarse en los valores centrales. una clase con alumnos de rendimiento medio muy similar con otra que tuviera alumnos de rendimiento máximo y alumnos de rendimiento mínimo. estaremos ante una distribución con sesgo positivo puesto que la mayoría de los alumnos obtendrían notas bajas y sólo algunos destacarían con nota saltas. desviación media. Por el contrario será heterogénea o muy variable si los datos se dispersan mucho respecto al promedio. La variabilidad o dispersión se refiere al grado de concentración de las observaciones en torno al promedio. su significado y sus propiedades una parte del capítulo siguiente. Las medidas de variabilidad o dispersión más frecuentes son: las desviación típica.por tanto. podríamos confundir. dedicaremos a su cálculo. Precisamente. Una distribución tiene asimetría negativa cuando la mayor parte de las observaciones se sitúan en la parte alta de la escala mientras que se produce alguna observación en la parte baja. por tener el mismo rendimiento medio. que precisamente son representaciones del valor "típico" o "promedio" de la variable. Las medidas de tendencia central más utilizadas son la media. Si el examen es de . la distribución de frecuencias de sus calificaciones tendrá sesgo negativo puesto que la mayoría de los alumnos obtendrían calificaciones altas.responder a las preguntas más claramente sería calcular algunas medidas de tendencia central de esas distribuciones. porque si prescindiésemos de ella. Una distribución de frecuencias será homogénea o poco variable si los datos difieren poco entre sí y . a la puntuación que representa a todas las demás. o en los valores superiores a éste. al dividirla en dos a la altura de la media. la varianza. También podemos decir que hace referencia al grado en que los datos se reparten equilibradamente por encima y por debajo de la tendencia central. Por su importancia. Esta propiedad es independiente de la tendencia central. Una distribución será simétrica cuando. Una distribución tiene asimetría positiva cuando la mayor concentración de puntuaciones se produce en la parte baja de la escala mientras que algunas puntuaciones son altas. que se refieren al centro de la distribución de frecuencias. esta independencia es la causa de la importancia de la variabilidad. es decir. dos distribuciones pueden tener la misma media y distinta variabilidad y viceversa. en los valores inferiores al promedio.

Para esta característica no vamos a estudiar ningún índice porque normalmente los cálculos son laboriosos. La curtosis se usa para saber cómo es de escarpado o plano un polígono de frecuencias.(Q3 .La media. B y C.3 Capitulo 3.Q2) = (Q2 . en la Figura 9 aparecen las gráficas de tres grupos A. Figura 9: Ejemplos de distribuciones con distinto tipo de sesgo. Las distribuciones que tienen mayor grado de apuntamiento que la normal se llaman leptocúrticas y las que lo tienen menor platicúrticas.. más bien podemos dar un criterio aún cuando la podemos apreciar mediante la inspección visual del polígono de frecuencias. la B tiene sesgo positivo y la C negativo.dificultad media. Si (Q3 . La A es simétrica. El concepto de curtosis sólo se aplica a distribuciones unimodales (distribuciones que tienen un único “pico”) y se refiere al empinamiento de la curva en la proximidad de la moda. Medidas de tendencia central 1. la B asimétrica positiva y la C asimétrica negativa. El criterio tiene que ver con las diferencias entre cuartiles y es el siguiente: Si (Q3 . comparados con su utilización. Generalmente el grado de curtosis de una distribución se compara con un modelo de distribución que estudiaremos más adelante que es la llamada campana de Gauss o distribución normal. Así.Q2) < (Q2 . Si tenemos n valores de la variable X su media se calcula utilizando la siguiente fórmula: x= _ Σ fix i N . La distribución A es simétrica.Q2) > (Q2 . lo más probable es que la distribución sea simétrica.Q1) la distribución será simétrica .Q1) tiene sesgo negativo. por lo que en estas notas no haremos referencia a ellos. Se denota por la misma letra que la variable con una barra horizontal encima. Si. La media de una variable se define como la suma de todos los valores observados dividida por el número de ellos. Los índices empleados habitualmente para calcular la curtosis son demasiado complicados. Respecto a la inspección gráfica. las distribuciones que tienen el mismo grado de apuntamiento que la normal se llaman mesoacúrticas.Q1) entonces la distribución tiene sesgo positivo.

así como la búsqueda constante del perfeccionamiento de los métodos inventados para lograr esa organización o clasificación de la información obtenida. las notas obtenidas por una clase de 20 alumnos en un examen de Historia. 4. En la . en este caso el sumatorio tiene tantos sumandos como X = ∑( x )(f ) i i N = ( x1 )(f1 ) + ( x 2 )(f2 ) + ( x3 )(f3 ) + . 5. Como en el numerador aparece la suma de los productos de cada puntuación por su frecuencia. 5. 5.Por ejemplo. . fue lo que dio origen a lo que hoy conocemos como estadística. 3. Su media se calcula : ( 1+2+2+3+3+3+4+4+4+5+5+5+5+5+6+6+7+7+8+9 ) / 20 = 94 / 20 = 4. calcularemos la media como: Hay que tener en cuenta que en las otras fórmulas el sumatorio se extendía a lo largo de todas las puntuaciones observadas y a lo largo de las puntuaciones distintas observadas.7 También podemos calcular la media a partir de la distribución de frecuencias: Veamos ahora cómo podemos usar la tabla de distribución de frecuencias. para calcular la media en lugar de los datos observados trabajaremos con los puntos medios de los intervalos de clase y la frecuencia de cada uno de ellos. . añadimos una columna más a la tabla de distribución de frecuencias en la que escribimos precisamente cada uno de estos sumandos. Por tanto. 3. 5. 7. + ( xn )( fn ) N Conceptos y Definiciones La necesidad que siempre ha tenido el hombre de clasificar la informa-ción que haya podido obtener en las múltiples actividades desarrolladas. 3.7. para aplicar la fórmula anterior del cálculo de la media. si denotamos como Xmi el punto medio del intervalo i-ésimo y fi la frecuencia del mismo. Cuando uno oye la palabra estadística. 6. 4. La media será el cociente entre la suma de la columna de los f ixi y la suma de la columna de las frecuencias o sea N. empleando los datos del ejemplo. Si estamos ante una distribución de frecuencias agrupadas y por tanto no disponemos de los datos observados. 2. 8 y 9. inmediatamente le viene a la mente la idea de complicados cálculos numéricos. lo cual no siempre es así. respectivamente. y ordenadas de menor a mayor son : 1. 5. 4. 2. 6.

que producirá una información más elaborada que facilitará la toma de decisiones. (Gini. cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados indi-viduales o particulares”. 1953). con la finalidad de evaluar los resultados obtenidos y poder hacer proyecciones a futuro”. no se detiene en el estudio del comportamiento de un caso aislado. sino que estudia siempre grupos. (Barbacho. que posteriormente será estudiada y a la que se le aplicará una determinada metodología en la que posiblemente estarán involucrados algunos cálculos. es considerada como la ciencia cuyo objeto es ordenar y clasificar información obtenida de situacio-nes que han ocurrido. “Se entiende a la estadística como una colección de datos numéricos. aquellos fenómenos naturales. sobreentendiéndose que tales datos numéricos. han de estar presentados de manera ordenada y sistemática. 1954). Definición A continuación se presentan algunas definiciones sobre este concepto: “La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivos. organizar y analizar datos. conjuntos o colectivos de casos”. clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación. se encarga de coleccionar. lo más frecuente es la clasificación y ordenamiento de información. y se define la Estadística (en mayúscula) como una ciencia que estudia el comportamiento de los fenómenos de masa. etc. . descripción y comparación de los fenómenos” (Yude y Kendal. es decir. “La Estadística es la ciencia que trata de la recolección. “La Estadística en su acepción más común. entendiendo como tales. de modo de poder sacar conclusiones válidas que permitan tomar decisiones razonables.mayoría de los casos lo menos que ocurre dentro de la actividad relacionada con la estadística es la aplicación de complicados cálculos. 1973). económicos sociales. La Estadística como ciencia..

vemos que la estadística tiene variadas finalidades. las leyes que lo rigen. clasificar y describir la información obtenida a cerca de un fenómeno determinado. Resumiendo. Deducir. Decimos con bastante aproximación y no con absoluta seguridad. (Investigar. una vez observado el fenómeno. mediante el análisis estadístico. Si las condiciones se mantienen. Todo lo anterior nos hace pensar en una primera clasificación de la Estadística en: Descriptiva. En la industria. cada uno de estos conceptos). Si observamos los diferentes planes de estudio de las distintas carreras que se ofrecen en las Universidades. no así si cambian las condiciones. las probabilidades de acierto son grandes. para poder hacer investigación es necesario poseer las herramientas básicas que permitan la recolección y clasificación de información. Analizar la información obtenida y establecer las características comu-nes observadas. se puede calcular cuál será la demanda futura de un determinado producto. . vemos que prácticamente en todas está incluida en algún momento la asignatura estadística. podemos hacer predic- ciones con bastante aproximación. No hay disciplina académica donde no encontremos incluida la estadística como herramienta fundamental. esto no es casual ni caprichoso. ampliamente. la estadística es aplicada en casi todos los campos del saber humano. lo cual permitirá hacer las predicaciones correspondientes. Analítica e Inductiva. porque cualquier estudio estadístico se basa en la tendencia. Campo de Aplicación Hoy en día.Mediante la aplicación de métodos estadísticos. a partir de una observación determinada. y esto no es otra cosa que la aplicación de métodos estadísticos. Cuando hacemos una investigación y formulamos una hipótesis. necesitamos métodos estadísticos para compro-bar hasta qué punto se ajusta el supuesto a la realidad. como son: Recolectar. se debe básicamente al hecho que para la mayoría de las ciencias.

Un ejemplo clásico de lo que es un fenómeno aleatorio. las edades de los alumnos de una determinada Universidad. estamos en presencia de una inferencia estadística. se acostumbra estudiar una pequeña parte del grupo. a partir del análisis que hagamos de la muestra. Cuando hacemos esto. o sea. por ejemplo. . recibe el nombre de población o universo. En los próximos párrafos vamos a estudiar esos conceptos. podemos inferir importantes conclusiones sobre la población. en igualdad de condiciones. como es el caso del lanzamiento de una moneda. cuando al repetirse una canti-dad n de veces. En lugar de estudiar al grupo completo que. es el lanzamiento de un dado honrado. En los fenómenos aleatorios existe una marcada influencia del azar. un dado que no este cargado. sino que su comportamiento depende en gran medida del azar. o la demanda de un determinado producto. la cual por no ser del todo exacta. como lo es el de probabilidades. debemos mantener clara la idea de que sea representativa.Cualquier persona que desee iniciarse en el estudio de la estadística. Fenómeno Aleatorio Un fenómeno es considerado aleatorio. son fenómenos aleatorios. Lo más seguro es que cada vez que lancemos el dado obtengamos resultados diferentes. los resultados obtenidos son diferentes. La población puede ser finita o infinita. Fenómenos como el descrito anteriormente. dependiendo del tamaño o la cantidad de los integrantes de la misma. pues no podemos ejercer control absoluto sobre ellos. puede ser compli-cado o poco práctico observar al grupo en su totalidad. tiene que comenzar por una serie de conceptos que son indispensables para profundizar en ese campo inmenso que es la Estadística. que recibe el nombre de muestra. Cuando así sucede. hará que surja un nuevo concepto. así como muchos otros. desde el punto de vista estadístico. Cuando hagamos referencia al término muestra. que estudiaremos en futuras unidades. Población y Muestra Cuando tratamos de estudiar una serie de datos.

3. recibe el nombre de población. la información que nos interesa y de la cual tomamos nota. mientras que las discretas sólo pueden tomar valores enteros. ya que las unidades de que consta se consideran como sucesos susceptibles de puntuación. Así. le daremos como nombre características. recibe el nombre de dato. Las características a su vez se clasifican en: variables y atributos. 3. la cual puede ser: 1.4. Por ejemplo. 1. o sea. los datos son 1. Las continuas pueden tomar cual-quier valor.3. 3. Por ejemplo. número de calificaciones obtenidas en la asignatura estadística durante el año escolar 1998 -1999. 4. 2. Las variables se refieren a características de carácter cuantitativas. Por ejemplo. El objeto formal de la descripción estadística es la masa estadística. mientras que los atributos son características cualitativas y se subdividen en variables continuas y variables discretas.El conjunto formado por todas las observaciones posibles de un determinado fenómeno.3. utilizamos para su estudio una parte de ella. las edades de todos los estudiantes del Ciclo Básico del Instituto. si los resultados observados fueron 1. cuando lanzamos un dado al aire en cinco oportunidades. porque las unidades de que consta pueden extenderse en el tiempo. En el ejemplo anterior. por ejemplo. si consideramos los resultados obtenidos sin repetición. Es importante dejar claro que una masa estadística abarca una cantidad finita de unidades estadísticas (elementos) Cuando estamos realizando la observación de un fenómeno objeto de un estudio estadístico. universo o masa estadística.3. Masa fija: Aquella que para su definición se requiere hacer referencia a un instante. a la que llamaremos muestra. el número de estudiantes de nuestra Universidad.3. Cuando el número de elementos que forman una población es muy grande. .4. Masa de sucesos: Para su definición es necesaria la referencia a un período de tiempo.

z. en cuyo caso recibe el nombre de constante. es un atributo. que constituyen el dominio de la variable. por lo tanto es una variable bidimensional. son variables continuas. los cuales pueden tomar un conjunto de valores. y. Las estaturas de tres estudiantes. Por ejemplo. mientras que si ocurre lo contrario. los datos referentes a colores. bidimensionales. posee dos caracterís-ticas. Características no acumulables: A cada unidad de una masa esta-dística puede imputarse una sola expresión de una característica. distinguir entre características acumulables y características no acumula-bles. Cuando utilizamos el término variable. el número de pupitres que hay en un aula son variables discretas. de hijos. etc. María es ama de casa y abogado al mismo tiempo. Ningún alumno será masculino y femenino al mismo tiempo. se dice que la variable es continua.. etc. Conviene también. las estaturas de los estudiantes de esta sección. el carácter de una persona. Las variables también pueden ser: unidimensionales. estatura y peso. son atributos. son variables discretas. dos. sobre todo en la investigación científico-social. etc. tres. tridimensionales. dependiendo que sean una.De acuerdo a lo anterior. Las características de investigación pueden ser: Cualitativas De rango Cuantitativas . Características acumulables: A las unidades de una masa estadística pueden imputarse varias expresiones de una característica. Si la variable puede tomar cualquier valor entre dos valores dados.. Puede suceder que la variable pueda tomar un solo valor. se dice que es una variable discreta. las características de cada dato. tiene una sola característica que es el peso. nos referimos a símbolos tales como x. mientras que la estatura y peso de tres estudiantes. por lo tanto es una variable unidimensional. sexo. el No. Por ejemplo.

Cuando en una población. sello. cara. Las características cualitativas.Los intervalos de las expresiones de estas características se miden con ayuda de una métrica. Las características de los datos obtenidos son cara y sello. . por ser características cualitativas. La frecuencia absoluta es la cantidad de datos de una determinada población. La frecuencia absoluta la denotamos por f. cara. que son atributos. universo o masa estadística determinada. sello. La frecuencia relativa es el resultado de dividir la frecuencia absoluta entre el total de los datos de la población. Por ejemplo. Si la frecuencia relativa la multiplicamos por 100 obtenemos la frecuencia relativa porcentual. mientras que la de sello es 2. métrica ordinal en las características de rango métrica cardinal en las características cuantitativas. que poseen la misma característica. es necesario que se ordenen. Vemos que la frecuencia del atributo cara es 4. cuantitativas y de rango son mutua-mente excluyentes. lo cual no debe olvidarse nunca. de modo que hablaremos de: métrica nominal en las características cualitativas. Después que hemos obtenido los datos referidos a una población. la cantidad de veces que se repite recibe el nombre de frecuencia. supon-gamos que lanzamos seis veces una moneda y obtenemos los resultados: cara. Podemos entonces definir frecuencia a la cantidad de veces que se repite un determinado dato. cara. de manera que podamos obtener una primera información de ellos. universo o masa estadística cualquiera. una característica se repite varias veces.

o “considero que es innecesaria” o “no opino”. Cuando se indican en la tabla de distribución todas y cada una de las expresiones de la característica.Para una mejor visualización de los datos que hemos obtenido. se habla de distribución de datos indivi-duales o datos no agrupados. Cuando se resumen varias de esas expresiones en una clase (por ejemplo. En este caso tenemos que: Unidad estadística: cada uno de los alumnos entrevistados . o sea matrices. Semestre del Instituto Universitario responden a la pregunta: ¿Qué piensas de la cogestión escolar? Las respuestas pueden ser: “pienso que es necesaria”. con frecuen-cias diferentes. Que esas modalidades aparecen. se habla de distribu-ción con datos agrupados. las calificaciones comprendidas entre 12-15). Modelo de tabla general Cuando se examina una característica de una masa estadística pueden advertirse dos cosas: Que en la masa se manifiestan distintas modalidades de la caracterís-tica. que se conocen como tablas estadísticas. Ejemplos: Característica cualitativa Cien alumnos de 1º. usualmente se utilizan cuadros formados por filas y columnas. la mayoría de las veces.

sello. cara. innecesaria. Por ejemplo. la cantidad de veces que se repite recibe el nombre de frecuencia. Modalidades de la característica de investigación : necesaria. una característica se repite varias veces.78 0. por ser características cualitativas. supon-gamos que lanzamos seis veces una moneda y obtenemos los resultados: cara. cara.00 Cuando en una población.Masa estadística: los 100 alumnos. Podemos entonces definir frecuencia a la cantidad de veces que se repite un determinado dato. no opino Expresión de la característica Ai A1 : necesaria A2 : innecesaria A3 : no opino Frecuencia absoluta fi 78 22 0 Frecuencia relativa fr 0. sello. Variable Discreta y Variable Continua . Las características de los datos obtenidos son cara y sello. mientras que la de sello es 2. Vemos que la frecuencia del atributo cara es 4. Características de identificación: objetiva: alumnos de 1º. cara. Semestre espacial: el Instituto Universitario de la ciudad de Los Teques temporal: el 11-03-97 Características de investigación: postura ante la cogestión escolar. universo o masa estadística determinada. que son atributos.22 0.

una nominal en la que no se tiene un orden preestablecido. etc. de pueden representar mediante un cuadro que se conoce como tabla de distribución de frecuencias. al número que se asigna a un elemento determinado para expresar como una cantidad alguna de las propiedades que posea. pueden ser recolecta-dos mediante distintas técnicas. en cuyo caso recibe el nombre de constante. se dice que es una variable discreta. entrevistas. los cuales pueden tomar un conjunto de valores. Las variables pueden ser consideradas también como una expresión cualitativa. mientras que si ocurre lo contrario. y pueden ser descritas de acuerdo a su color. o datos no agrupados. Formas de representación de una serie de datos La información (datos) obtenidos mediante la aplicación de una determinada técnica de recolección. y. como por ejemplo. y de las necesidades de informa-ción que se requiera. y otra ordinal en la que se establece un determinado orden. depen-diendo del punto de vista del observador. que constituyen el dominio de la variable. las clases sociales. Si la variable puede tomar cualquier valor entre dos valores dados. sabor.Cuando utilizamos el término variable. las encuestas. etc. se entiende por medición.. etc. se dice que la variable es continua. Puede suceder que la variable pueda tomar un solo valor. z. entre las que se pueden citar. datos o elementos estadísticos. nos referimos a símbolos tales como x. Usualmente. o mediante una agrupación de datos. Medición de la información El término medición tiene distintas maneras de ser definido. Estas variables tiene dos tipos de escalas. cuestionarios. Formas de recolección de información La información. El . y que se esté considerando como objeto de estudio. la cual puede ser de una manera simple.

En la serie de datos del ejemplo anterior. mientras que si se está tomando la medida de un segmento de recta. el número es la distancia que hay entre sus dos extremos. lo conveniente es organizar la información. de manera rápida y eficiente. la tabla se refiere a datos agrupados. estos datos pueden obtenerse en forma ordenada o no. el número asignado se refiere a la cantidad de kilogramos que marca la balanza. Lo más común es que no estén ordenados. pero que conviene recordar nuevamente. clasificación y orden de los datos que se estén estudiando. Esto se logra mediante la organización.significado del número va a depender del sistema de referencia que se esté utilizando. cronológicos y geográfi-cos. pueden ser: cualitativos. existen cuatro escalas de medición: Datos estadísticos Los datos estadísticos es la información que se obtiene mediante la observación a las personas o cosas que constituyen la población objeto de estudio. del cual ya se ha hablado. por lo que. Puede ser que los dos números sean iguales. Evidentemente. Se observa que aparece un término nuevo: frecuencia. cuantitativos. Si se está midiendo el peso de una persona. si se quiere obtener información útil. pero dependiendo del sistema de referencia que se esté utilizando. . La distribución de frecuencias puede ser para datos agrupados o para datos no agrupados. Esto se conoce como frecuencia absoluta. Los datos que se obtienen mediante la observación de una población determinada. tendrán significados diferentes. La frecuencia se refiere a la cantidad de veces que se repite un dato. Dependiendo de las formas de utilización de los números asignados.

consistente en las calificaciones de un test aplicado a 50 individuos. Para datos agrupados. lograr alguna información. en la segunda las veces que se repitió cada calificación (frecuencias).Para un ejemplo de distribución de frecuencias con datos no agrupados. Otras columnas para las frecuencias acum. la siguiente el resultado de multiplicar la anterior por 100. conformada por filas y columnas. considérese la siguiente serie de datos. Tenemos que buscar alguna forma de simplificar la manera en . en la tercera el resultado de dividir cada frecuencia entre el total de los datos (frecuencia relativa). considérese el siguiente ejemplo. correspondiente a las calificaciones de una prueba de castellano aplicada a un grupo de 30 estudiantes: 15 12 10 10 11 10 12 10 12 08 12 15 18 15 14 14 18 10 10 18 13 05 15 18 18 14 08 18 13 05 Se puede construir una matriz. donde en la primera columna se anotarán las distintas calificaciones obtenidas en el grupo (clases). que nos permita sacar algún tipo de conclusiones. la siguiente el resultado de multiplicar la anterior por 100 (frecuencia relativa porcentual) .-ladas. frecuencias acumuladas relativas y frecuencias acumuladas porten-tual. 74 23 03 58 29 63 55 65 88 60 52 03 08 07 19 05 49 89 50 62 23 27 56 42 29 09 88 45 40 09 58 61 11 40 88 32 77 22 79 69 87 03 56 70 88 29 11 10 47 58 Al observar la manera como están distribuidos estos datos. resulta muy difícil. a simple vista.

Por lo general la cantidad de clases no debe ser menor de cinco (5) ni mayor que veinte (20). otra es aplicando la fórmula de Sturges. Una técnica de lograr información a partir de los datos originales. Se establece el número de intervalos de clase.3 = 85 2. ni mayor que 20. El resultado de dividir R entre el número de clases es lo que se conoce como amplitud del intervalo.32 veces el logaritmo de N. permi-tiendo verla más en conjunto. Lo que si existen son acuerdos. R = 88 . Se puede calcular de distintas maneras: una puede ser estableciendo un número conveniente que divida de la manera más exacta posible a R. igual longitud. longitud o amplitud. Esto se logra obteniendo la diferencia entre el mayor y el menor de los datos. Se determina el rango (R). que constituyen los límites de la clase o del intervalo de clase. una clase es un intervalo de valores comprendido entre dos valores correctamente definidos. el número de intervalos es igual a 1 más 3. por conveniencia. Esta cantidad no debe ser menor que 5. No existen formas predeterminadas de determinar la cantidad de clases que deban formarse y su tamaño.que se presentan los datos. según la cual. El proceso que usualmente se realiza para la construcción de una tabla de distribución de frecuencias para datos agrupados es el siguiente: 1. Desde el punto de vista estadístico. Esto no descarta la posibilidad de que puedan existir intervalos de diferente longitud o amplitud. Estos intervalos deben tener. ic = # de intervalos de clases R . que usualmente se denota por ic. es agruparlos convenientemente. en forma de intervalos de clases. Eso reduce el campo visual de la información.

No se rompe la continuidad. No se altera el punto medio o representante de clase. Se elimina la posibilidad que un valor caiga en la frontera. 3. de acuerdo a la unidad que se esté utilizando para la variable. Este procedimiento tiene las siguien-tes ventajas: 1. 2. . se redondeará el valor ic por exceso. Para encontrar la amplitud real.Este valor corresponde a la amplitud aparente.

Sign up to vote on this title
UsefulNot useful