P. 1
Nociones básicas de Estadística

Nociones básicas de Estadística

|Views: 5|Likes:
Publicado porEmmy Is

More info:

Published by: Emmy Is on Apr 30, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

03/20/2015

pdf

text

original

La Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los

datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población. Según se haga el estudio sobre todos los elementos de la población o sobre un grupo de ella, vamos a diferenciar dos tipos de Estadística: Estadística descriptiva. Realiza el estudio sobre la población completa, observando una característica de la misma y calculando unos parámetros que den información global de toda la población. Estadística inferencial. Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la población. Veamos dos ejemplos que nos aclaren estos dos tipos de Estadística: Ejemplo 1. Cuando van a llegar cualquier tipo de elecciones, por ejemplo, las elecciones generales, es muy frecuente que los medios de comunicación, nos adelanten los resultados de encuestas o sondeos en los que se nos indica el resultado final de dichas elecciones con una precisión y con un error determinado. Estos sondeos son realizados por distintas técnicas sobre un grupo (muestra) más o menos numeroso de personas. Naturalmente, cuanto mayor sea el número de individuos con derecho a voto, encuestados, mayor será la confiabilidad de la encuesta, pero también mayor será el costo del sondeo. El estudio de esta muestra se haría mediante estadística descriptiva, pero lo que nos interesa no es el resultado de este estudio reducido sino el resultado final de las elecciones. El paso de generalizar los resultados de la muestra a toda la población, se hace mediante técnicas de Estadística inferencial. La elección de la muestra debe hacerse mediante métodos de muestreo para que el estudio resulte lo más confiable posible. Ejemplo 2. Supongamos que estamos en un instituto con un número muy elevado de alumnos y alumnas, por ejemplo 500, y queremos hacer un estudio estadístico sobre su altura. Un método sería pasar clase por clase y medirlos a todos, esto podría llevar un tiempo considerable pero sería la forma más exacta de hacer dicho estudio, aunque es fácil encontrarnos con ausencias y tendríamos que volver varios días y pasar lista para conseguir la estatura de todo el alumnado. Una vez que tengamos todos los datos en nuestro poder los resultados los obtendríamos mediante Estadística descriptiva.

Otra posibilidad podría ser pasar clase por clase, decirle a los alumnos y alumnas que anoten su estatura en un papel y recogerlos todos. También así tendríamos un estudio de Estadística descriptiva, aunque seguramente menos fiable que con el método anterior, pues casi con toda seguridad, y lo digo por experiencia, algunos alumnos escriban su estatura a cálculo y otros, con ganas de bromas, muy por encima o muy por debajo de la realidad. Y otra posibilidad sería escoger una muestra, es decir un grupo, por ejemplo, 50 personas, hacer el estudio descriptivo sobre ellas y después generalizarlo a todo el instituto con Estadística inferencial. En este caso, comprobaríamos por una parte que cuanto mayor sea la muestra más trabajo tendremos, pero más confiable será el resultado final y por otra, que la elección de la muestra debe hacerse de manera que permita también fiarnos del resultado obtenido. Si estamos en segundo de bachillerato, ¿podríamos coger como muestra los 50 alumnos de este curso? ¿Por qué? ¿Qué forma de elegir la muestra se te ocurre? En cualquiera de los dos ejemplos, ¿cuáles serían los resultados más confiables? Conceptos básicos. Ya hemos hablado de ellos en los ejemplos anteriores, en cualquier estudio estadístico aparecerán los conceptos: individuo, observación o dato, cada uno de los elementos, personas u objetos que se van a estudiar; población, que es el conjunto formado por todos los elementos a los que les vamos a hacer el estudio; muestra, el subconjunto de la población que elegimos para hacer un estudio más reducido. 2. VARIABLES ESTADÍSTICAS.

Al hacer un estudio de una determinada población, observamos una característica o propiedad de sus elementos o individuos. Por ejemplo, con los alumnos y alumnas de nuestra clase, podemos estudiar el lugar de residencia, el número de hermanos, la estatura, etc. Cada una de estas características estudiadas se llama variable estadística. Aunque este es el concepto que vamos a utilizar, también reciben el nombre de carácter estadístico. Dependiendo de la característica podemos distinguir varios tipos de variables:

Variable cualitativa. Es aquella característica que no podemos expresar con números y hay que expresarla con palabras. Por ejemplo, el lugar de residencia. Variable cuantitativa. Es cualquier característica que se puede expresar con números. Por ejemplo, el número de hermanos o la estatura. Dentro de esta variable podemos distinguir dos tipos: Variable cuantitativa discreta. Es aquella variable que puede tomar únicamente un número finito de valores. Por ejemplo, el número de hermanos. Variable cuantitativa continua . Es aquella variable que puede tomar cualquier valor dentro de un intervalo real. Por ejemplo, la estatura. Naturalmente, siempre que hacemos un estudio estadístico en una población, el número de individuos será muy pequeño o muy grande, pero siempre será un número finito. Por tanto, podríamos decir que todas las variables son discretas. Sin embargo, mientras que al estudiar el número de hermanos en un instituto de 500 alumnos y alumnas, nos vamos a encontrar entre cinco y diez valores distintos; al estudiar la estatura de todos con dos cifras decimales, nos podemos encontrar muchos más. En este último caso, aunque podamos tener 30 valores distintos, que es un número finito, hablaremos de variable continua. Esto se debe a que para trabajar con estos datos resulta mucho más fácil agruparlos en intervalos que hacerlo de forma aislada. Para hacer cálculos con una variable continua, utilizaremos el punto medio de cada intervalo, al que llamaremos marca de clase. Ahora, en tu tiempo independiente, Indica otros ejemplos de distintos tipos de variables estadísticas.

3. FRECUENCIAS. TABLAS ESTADÍSTICAS.

Para hacer un estudio estadístico de una característica de una población, necesitamos elegir dicha característica y después hacer un recuento. Uno de los primeros recuentos que hacemos en clase es en la elección del delegado o delegada del curso. Este recuento puede resultar más o menos fácil dependiendo del número de alumnos y alumnas que tengamos, ¿cuántas veces nos ha pasado

que no nos coincide el recuento final de los votos con el número de personas que hay? Una vez que hemos realizado el recuento, hay que organizar los datos y expresarlos de forma simplificada para que su interpretación sea fácil y rápida. Esto se hace disponiendo los datos por columnas o filas formando lo que llamamos una tabla estadística. Valores de la variable Número de veces que aparecen f1 f2 ... fn N: Número total de datos

x1 x2 ... xn

En primer lugar la tabla estará formada por estas dos columnas, pero más tarde iremos añadiendo más según los cálculos que necesitemos. Sin hacer muchos cálculos, podemos ir completando la tabla con las frecuencias, que definimos a continuación: Frecuencia absoluta. Es el número de veces que aparece cualquier valor de la variable. Se representa por f i. En algunos libros de texto nos la encontraremos representada por ni. Frecuencia absoluta acumulada. Es la suma de la frecuencia absoluta de un valor de la variable con todos los anteriores. Se representa por F i. Frecuencia relativa. Es el cociente entre la frecuencia absoluta y el número de datos (N). Se representa por fr. Al multiplicarla por 100 obtenemos el porcentaje de individuos que presentan esta característica.

Frecuencia relativa acumulada. Es la suma de la frecuencia relativa de un valor de la variable con todos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta acumulada y el número total de datos. Se representa por Far. Vamos a realizar tres estudios estadísticos entre nuestros alumnos y alumnas, cada uno de ellos correspondiente a un tipo de variable estadística: lugar de residencia, número de hermanos y estatura. Preguntamos uno a uno sobre estas características y obtenemos: Lugar de residencia: Antímano, P.A., P.A., P.A., P.A., P.A., P.A., P.A., P.A., Caricuao, Campo Alegre. Número de hermanos: 2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2. Estatura: 1.59, 1.75, 1.71, 1.85, 1.64, 1.62, 1.66, 1.60, 1.63, 1.76, 1.66. En las siguientes escenas puedes construir la tabla de frecuencias para variables discretas y continuas. Como puedes observar no se han tenido en cuenta las variables cualitativas. Esto se debe a que al no trabajar con números no se pueden hacer operaciones. Únicamente tendría sentido en la tabla construir las columnas de frecuencias absolutas y relativas, pero no las acumuladas. En el siguiente apartado de gráficos estadísticos también se podrían representar, pero para los apartados de cálculo de parámetros no podremos trabajar con ellas. si tienes interés en alguna representación, sustituye los valores la variable por los números que quieras y represéntalas o construye la tabla.

4. GRÁFICOS ESTADÍSTICOS.

Una vez construida la tabla de frecuencias, vamos a representar mediante distintos gráficos el estudio realizado. Entre los gráficos más utilizado podemos destacar: Diagrama de barras o rectángulos . Consiste en un sistema de coordenadas rectangulares y una barra o rectángulo para cada valor de la variable. Normalmente, se suele colocar en el eje horizontal los valores de la variable (aunque también se puede hacer en el vertical). El otro eje se gradúa

Un ejemplo muy utilizado de histograma es una pirámide de población. los rectángulos aparecen pegados en la representación gráfica. hay que hacer coincidir el área del rectángulo con la frecuencia del intervalo. Diagrama de sectores. Consiste en dividir un círculo en tantos sectores como valores de la variable. Además de este dato existen otros datos (que llamaremos parámetros) que van a representar a toda la población o que nos van a indicar si la población está muy concentrada o muy dispersa. Representamos los puntos que tiene por primera coordenada el valor de la variable y por segunda el valor de la frecuencia. Histograma de frecuencias.según los valores de las frecuencias. Es un caso particular del diagrama anterior en el caso de variables continuas. Representamos dos ejes rectangulares y representamos en el horizontal los valores de la variable y en el vertical las frecuencias. parece razonable determinar un dato. Después de haber representado los datos gráficamente. Cuando el estudio estadístico se hace sobre una zona geográfica. Pictograma. y que representa la estatura de todo el alumnado estudiado. La amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente. la representación gráfica se puede hacer sobre un mapa. ahora llega el momento de hacer un estudio de los mismos. Si los intervalos son correlativos. Consiste en la representación gráfica del estudio realizado utilizando dibujos alusivos a los distintos valores de la variable estadística. Si estamos estudiando la estatura de todos los alumnos y alumnas del instituto y necesitamos dar información de este estudio. En caso de que la amplitud de los intervalos no se igual para todos. La representación gráfica consiste en dibujar una barra o un rectángulo para cada uno de los valores de la variable de altura igual a su frecuencia. Cartograma. 5. PARÁMETROS ESTADÍSTICOS. coloreando con distintos colores cada una de las regiones representadas en el estudio. Polígono de frecuencias. . Uniendo todos los puntos obtenemos una línea poligonal que es la representación que buscamos. al que denominaremos media aritmética.

la moda y la mediana. la desviación media. Pueden ser de dos tipos: Parámetros o medidas de tendencia central o de centralización . Por ejemplo. Se define la media aritmética como la suma de todos los _ datos dividida por el número de datos.Parámetros o medidas estadísticos . Son datos que resumen el estudio realizado en la población.1. Se representa por x Para calcular la media aritmética utilizaremos la siguiente fórmula X = ∑x N i . MEDIDAS DE TENDENCIA CENTRAL. Son datos que representan de forma global a toda la población. Parámetros o medidas de dispersión . es decir. 5. Media aritmética. Entre ellos vamos a estudiar la media aritmética. lo que todos conocemos como calculando la media. Por ejemplo el recorrido. Son datos que representan de forma global a toda la población. la varianza y la desviación típica. si hacemos un examen en la clase y queremos tener una idea global del resultado de dicho examen. Parámetros o medidas de tendencia central o de centralización . ¿cómo lo podríamos hacer? Parece evidente que sumando todas las notas y dividiendo el resultado por el número de alumnos. Son datos que informan de la concentración o dispersión de los datos respecto de los parámetros de centralización.

Sin embargo. . es el decir. Se define la moda como el valor de la variable que más se repite. En la siguiente escena podemos calcular la moda de una variable discreta. Se representa por Mo. vemos cuál es la mayor y la moda será el valor de la variable correspondiente a dicha frecuencia. Vamos a distinguir para el cálculo de la moda entre variables discretas y continuas. el cálculo de la moda no presenta ninguna dificultad. el cálculo se hace de la misma forma pero utilizando las marcas de clase. podemos simplificar el cálculo de la media aritmética con la fórmula: X = ∑( x )(f ) i i N = ( x1 )(f1 ) + ( x 2 )(f2 ) + ( x3 )(f3 ) + . + ( xn )(fn ) N Si la variable es continua. únicamente observamos las frecuencias. Moda. Por tanto. Si la variable es discreta. aquél que tiene mayor frecuencia absoluta. podemos observar que aparecen datos repetidos y que en un estudio estadístico tenemos los datos agrupados en una tabla en la que aparecen las frecuencias. . .

Sin embargo si la variable es continua la mayor frecuencia absoluta corresponde a un intervalo. el anterior y el posterior. Se representa por Me. También vamos a distinguir para su cálculo entre variable discreta y variable continua. habrá un sólo valor central. se define la mediana como el valor de la variable que está en el centro. c es la amplitud del intervalo y fMo. . Pero si queremos calcular un único valor de la variable para la moda. aplicamos la siguiente fórmula: en la que Li representa el límite inferior del intervalo modal. Si la variable es discreta y el número de datos es impar. fMo-1 y fMo+1 son las frecuencias del intervalo modal. Aquí tenemos que comprender que si hay un número impar de valores. Si ordenamos todos los valores de la variable de menor a mayor. mientras que si hay un número par de valores habrá dos valores centrales. la mediana será el dato que ocupe el lugar central. del que decimos que es el intervalo modal. Mediana.

la mediana será la media aritmética de los dos valores centrales. Cuartiles. no distinguiremos si el número de datos es par o impar. Lógicamente el segundo cuartil coincidirá con la mediana. Los . deciles y percentiles . Son valores que dividen a la población en cuatro partes iguales. Entre las medidas de centralización y de dispersión podemos citar éstas que tienen el cálculo similar al de la mediana. Los vamos a representar por C 1. tendremos un intervalo para la mediana. Entre cada dos de ellos estará el 25 % de los datos. Son valores que dividen a la población en diez partes iguales. C2 y C3. Cuartiles.Si la variable es discreta y el número de datos es par. Igual que se ha hecho con la moda podemos suponer que los datos se distribuyen uniformemente en los intervalos y calcular la mediana con la siguiente fórmula: en la que N representa el número de datos y F se refiere a la frecuencia absoluta acumulada. Deciles. Si la variable es continua.

Si la variable es continua aplicamos la siguiente fórmula muy similar a la utilizada para el cálculo de la mediana: 5. . Son datos que informan de la concentración o . es decir para calcular el percentil de orden "p". . Si este valor no coincide con ninguna de las frecuencias absolutas acumuladas. Son valores que dividen a la población en cien partes iguales. calcularemos p·N/100.2. se hace de forma similar al cálculo de la mediana.. Los representamos por Pn. Percentiles. tanto para variables discretas como para variables continuas. calcularemos el porcentaje de datos que corresponde a dicho percentil. Si la variable es discreta.. cogemos el primer valor de la variable cuya frecuencia absoluta acumulada supera este dato. Pero si este valor coincide con una frecuencia absoluta acumulada. 20 . El quinto decil coincide también con la mediana. para calcular un percentil. PARÁMETROS O MEDIDAS DE DISPERSIÓN. El cálculo de estos parámetros. 90 coinciden con los deciles.representaremos por Dn. Evidentemente los percentiles 25. Parámetros de dispersión . 50 y 75 coinciden con los cuartiles. Y los percentiles 10. el percentil buscado será la media aritmética entre el valor de la variable correspondiente y el siguiente.

Por ejemplo. excesivamente pequeños o grandes que hacen que la información que proporciona el recorrido sea equivocada.dispersión de los datos respecto de los parámetros de centralización. Al calcular la media. Podemos definir la desviación media como la media aritmética de todas las desviaciones. En uno. pero si la calculamos nos llevaremos la sorpresa de que vale 0. ¿Por qué? . Para estos casos es más útil el siguiente parámetro. todos los alumnos han sacado la misma nota. Es la diferencia entre los cuartiles tercero y primero. Se representa por R. por ejemplo si en la estatura tenemos todos los alumnos y alumnas con una estatura normal y uno o una mide alrededor de dos metros. un 5. Recorrido intercuartílico. en otro. a la que llamaremos desviación. la mitad de los alumnos ha sacado un 0 y la otra mitad un 10. vamos a suponer que hemos realizado el mismo examen en dos grupos distintos. A veces puede ocurrir que hay valores de la variable. Se define el recorrido como la diferencia entre el mayor y el menor de los valores de la variable. Recorrido. Se representa por R I (RI=C3-C1) y representa la amplitud del intervalo en el que se encuentra el 50% central de los datos. Nos indica un intervalo en el cual están comprendidos todos los datos. ¿Cuál es la media en los dos casos? ¿Se pueden considerar los dos grupos iguales si la media coincide? Parece entonces que no es suficiente con las medidas de centralización. Desviación media. podemos ver la diferencia que hay entre este parámetro y cada valor de la variable. hace falta otros parámetros que informen sobre la mayor o menor concentración de los datos.

aplicamos la fórmula: Si desarrollamos esta fórmula. podemos encontrar otra expresión más sencilla para el cálculo de la varianza: . Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto de la media.Para evitar esta situación. se define la desviación media como la media aritmética de los valores absolutos de las desviaciones respecto de la media. La podremos calcular con la fórmula: Varianza. Para calcularla.

Si nos imaginamos el diagrama de barras o el histograma de frecuencias apoyado en un punto del eje horizontal de forma que quedase en equilibrio. De todos los parámetros estudiados. Como ya hemos comentado.Desviación típica. Vamos a hacer un estudio conjunto de ambas para entender mejor su significado. 6. La media aritmética es el centro de gravedad de la distribución estadística. el valor de este punto en dicho eje sería el valor de la media. Se define la desviación típica como la raíz cuadrada positiva de la varianza. ESTUDIO DE MEDIA Y DESVIACIÓN TÍPICA. no es suficiente con un parámetro de . los más significativos son la media para las medidas de centralización y la desviación típica para las medidas de dispersión.

es necesario un parámetro de dispersión que nos indique si los datos estudiados están más concentrados o más dispersos.centralización.1 Vp = 10/40 = 0. Y observamos también un conjunto de perros con una media de 40 kilos y una desviación típica de 10 kilos. y si los datos están más dispersos la desviación típica será mayor. no podemos acudir a la desviación típica para ver la mayor o menor homogeneidad de los datos. Y este parámetro de dispersión va a ser la desviación típica. Lógicamente si los datos están más concentrados la desviación típica será menor. sino a otro parámetro nuevo. también podemos estar interesados en comparar datos de distribuciones distintas . Si hemos realizado un estudio estadístico en dos poblaciones diferentes. pero si calculamos el coeficiente de variación para ambos: Vv = 50/500 = 0. es más homogéneo el conjunto de las vacas. y queremos comparar resultados. en una exposición de ganado estudiamos un conjunto de vacas con una media de 500 kilos y una desviación típica de 50 kilos. Por ejemplo. Si antes hemos comparado variables. Coeficiente de variación. ¿Qué grupo de animales es más homogéneo? Un razonamiento falso sería decir que el conjunto de perros es más homogéneo porque su desviación típica es más pequeña. Puntuaciones normalizadas.25 Por tanto. llamado coeficiente de variación y que se define como el cociente entre la desviación típica y la media.

y saber. Por ejemplo. MEDIDAS DE ASIMETRÍA. Si no es simétrica. Hasta ahora se han estudiado los parámetros de centralización y de dispersión que son las medidas más frecuentes que se calculan en cualquier estudio estadístico. con la que resultará más fácil poder comparar los datos. si en la exposición de ganado anterior. entonces las tres medidas de centralización coinciden. Esto lo vamos a hacer tipificando la variable con la fórmula: Obteniendo así una nueva variable estadística de media 0 y desviación típica 1. ¿cuál tiene más peso dentro de su grupo? Naturalmente no vale decir la vaca que pesa mucho más. cuál destaca más o menos dentro de su grupo según la característica observada. 7. escogemos una vaca que pesa 550 kilos y un perro que pesa 55 kilos. Sin embargo existe también medidas que indican de la simetría o asimetría de la distribución y del achatamiento o no de la misma.5 Como las dos variables tipificadas tienen la misma media y la misma desviación típica. el perro. es lógico pensar que si la distribución tiene una única moda y es simétrica. tiene más peso el animal que tiene mayor puntuación normalizada. Empezando con la simetría. es decir. suele suceder que la mediana esté comprendida entre la moda . Tipificamos ambos valores y obtenemos: zv = (550-500)/50 =1 zp = (55-40)/10 = 1.

sería más achatada que la . Medidas de curtosis. Si el coeficiente es negativo. Miden la mayor o menor concentración de datos alrededor de la media. la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica.y la media. Hay una mayor concentración de los datos en torno a la media. el índice es igual a 0. Medidas de simetría o asimetría. Si el coeficiente es positivo. es positivo. más puntiaguda que la anterior. Miden la mayor o menor simetría de la distribución. la distribución se llama platicúrtica y hay una menor concentración de datos en torno a la media. y si es asimétrica a la izquierda. es negativo. Se suele medir con el coeficiente de curtosis: Si este coeficiente es nulo. Existen dos medidas de este tipo: Índice de simetría de Pearson: Si la distribución es simétrica. la distribución se llama leptocúrtica. si es asimétrica a la derecha.

primera. proporciones. para ello se sirve de tablas. Conceptos generales 1. Sin embargo las conclusiones extraídas se agotan en el propio conjunto de datos observados. Ahora se puede dar una definición de Estadística en la que aparecen algunos términos no definidos lo cual no impedirá entender su significado. Este tipo de estudios dio lugar a la estadística descriptiva cuya misión consiste en describir situaciones y proceso dados. Para ello hicieron recolecciones de datos que posteriormente tenían que resumir de una forma comprensiva y que permitiera proporcionar informaciones útiles. pues el objetivo consistía en hacerse una idea clara de lo que había. Ya en la antigüedad los romanos y los egipcios hicieron intentos por tener un conocimiento preciso del número de sus habitantes y de sus posesiones. Sin embargo los auténticos fundadores de estas técnicas fueron KarlPearson (1857-1936) y Sir Ronald Fisher (1890-1962). precisamente. Es decir. y lo que había se contaba y se medía. Apuntes de Estadística Capítulo 1. Estas técnicas tuvieron su fundamento en el desarrollo de la curva normal por Gauss. que se encontraron en el siglo XIX.Introducción Las dos grandes funciones de la Estadística (descripción de datos y realización de inferencias) reflejan la propia historia del desarrollo de esta ciencia. en su aplicación por Galton a los problemas de herencia. el desarrollo de un conjunto de métodos para extrapolar las conclusiones a entidades no observadas. La Estadística actual es el producto del encuentro y la propia fecundación de dos ramas distintas del saber. números índice y medidas típicas. la antigua estadística y el cálculo de probabilidades.. proporcionó el instrumento adecuado para poder hacer inferencias acerca de grandes cantidades de observaciones potenciales a partir de unas pocas observaciones reales. Precisamente este fundamento probabilístico condiciona el que los resultados obtenidos se vean sujetos a unos márgenes de error. Etimológicamente. . Así se ha desarrollado la estadística analítica o inferencial basada en la teoría de probabilidades que trata de obtener leyes generales a partir de la observación de algunos datos. la palabra estadística procede de la palabra estado. etc. Lo que posibilitó el cálculo de probabilidades fue. es decir. por conocer el estado de sus naciones (de ahí la raíz del término). representaciones gráficas.

O en saber el efecto que producen variables familiares. contará con el apoyo del análisis comparativo de la situación relativa de cada individuo en su clase. También la propia actividad del profesor puede verse mejorada tras un análisis del rendimiento escolar del grupo en su conjunto... Estas tareas requieren tratamientos estadísticos simples de los datos de los alumnos. y de la realización de inferencias acerca de las poblaciones de lasque éstas proceden. Por tanto. a la hora de tomar decisiones acerca de sus alumnos. El conocimiento profundo de este contexto en el que está involucrado el alumno resulta de vital importancia para el educador y no será posible sin el análisis estadístico de los datos individuales de los elementos del contexto.Estadística es la ciencia que se ocupa de la ordenación y análisis de datos procedentes de muestras. Este tipo de trabajos requieren el uso de métodos estadísticos. que van a interaccionar con sus características personales. centro escolar y contexto social concreto. 3ª Diagnosis didáctica El profesor.. distintas asignaturas y distintas variables psico-sociológicas..La Estadística como herramienta para el profesor Dentro del ambiente educativo la Estadística es necesaria al menos para llevar a cabo estas cuatro tareas: 1ª Lectura de literatura profesional La investigación en Ciencias de la Educación emplea la Estadística como herramienta habitual en la realización de cualquier experimento. 4ª Investigación y predicción El profesor puede estar interesado en averiguar si una nueva técnica didáctica es realmente más efectiva de cara al rendimiento de sus alumnos que la usada por él hasta ahora. 3.Primeros conceptos . rasgos psicológicos en la destreza del alumno en realizar tal o cual tarea. 2ª Conocimiento de la clase El profesorse enfrenta a la tarea de la educación de unos alumnos ubicados en una clase. 2. el profesor que quiera estar al día respecto a la enseñanza de su disciplina debe estar en condiciones de poder comprender textos de investigación en Ciencias de la Educación.

Esta población suele ser demasiado extensa (razones económicas) o poco definida (votantes) como para estudiarla al completo. .Normalmente.A.B.C. . podremos generalizar sobre la actitud de todos los alumnos de la U.B.Una muestra es un subconjunto de los elementos de una población. La población es en estos momentos de alrededor de 25. Entonces se lleva cabo una selección (o muestreo) del que se obtiene una muestra de elementos que sea una representación de la misma. Se mide a estos sujetos de la muestra la característica buscada y se calcula el valor de esa característica para esa muestra.-Un profesor de historia quiere medir la eficacia del uso sistemático de la hemeroteca para la enseñanza de la Historia de Venezuela de 3º de Educación Media. así que decide hacer un experimento con dos clases de las que él mismo es profesor.B. En primer lugar confecciona una prueba de conocimientos previos de un tema de la asignatura y la . .-Supongamos que estamos interesados en saber cómo es la actitud de los estudiantes de la U. muestra. que tienen una actitud positiva hacia la práctica deportiva continuada.Un parámetro es una propiedad descriptiva de la población. es decir.Población estadística es el conjunto de todos los elementos que cumplen una o varias características o propiedades. hacia la práctica deportiva continuada. Con los resultados obtenidos a partir de estos alumnos seleccionados (muestra). a su vez. 2º.A.C. Parece obvio que preguntarles a todos ellos acerca de esta actitud resultaría bastante costoso por lo que decidimos seleccionar algunos de ellos para realizar la consulta. Esa medida es un estadístico muestral que es. En este estudio uno de los parámetros podría ser el tanto por ciento de alumnos de la U. Este profesor no puede realizar un estudio que implique a todos los alumnos de 3º de Educación Media de Venezuela. Este parámetro sería estimado por el valor del correspondiente estadístico en la muestra que hemos seleccionado. parámetro y estadístico .Un estadístico es una propiedad descriptiva de la muestra. por el tanto por ciento de alumnos con actitud positiva en la muestra. Pongamos ahora algunos ejemplos que nos permitan identificar los conceptos que hemos definido: 1º.A. Relación entre los conceptos de población.C. el investigador desea conocer un parámetro o característica de los elementos de una población.000 estudiantes. una estimación del parámetro de la población.

Variables y su clasificación . En este caso la población la componen todas las5realizaciones de la tarea que potencialmente puede realizar nuestro sujeto experimental. puede responder a algunas preguntas como: ¿Obtienen mejores notas los alumnos de la clase A que los de la clase B? ¿Partían del mismo nivel de conocimientos previos? ¿Podría este hecho influir sobre los resultados del experimento? ¿Se pueden generalizar los resultados del experimento de este profesor? 3º. con ayuda de la Estadística. una estimación de ese parámetro. El estadístico podría ser la media del tiempo empleado en los ensayos. mientras que no debe dar respuesta alguna ante el otro.pasa a sus alumnos. Para hacernos una idea global de cómo realiza la tarea nuestro sujeto. Ahora. además.-Queremos estudiar el procesamiento de información en tareas simples. pide a sus alumnos que lean algunos periódicos que reflejen algún aspecto del tema. Ante uno de ellos el sujeto deberá presionar un botón tan rápido como pueda. 4. La población en este caso está poco definida porque no todas las personas que pueden votar lo hacen realmente y. Cuando acaba la explicación del tema examina a sus alumnos. resultaría muy costoso preguntar a todos los votantes por su intención de voto por lo que seleccionamos 3000 venezolanos (muestra) que consideramos representativos y les preguntamos por el sentido de su voto ante el referéndum.. aparte de la habitual lección magistral. El porcentaje de individuos de la población que responderían SI es un parámetro. Para ello. decidimos administrarle 30 ensayos con lo que obtenemos 30 datos. La muestra la constituyen los treinta ensayos. 4º. En este caso estamos interesados en el tiempo que necesita un sujeto en concreto para realizar una tarea. para lo cual se ha utilizado tradicionalmente como medida el tiempo de reacción. El porcentaje de nuestra muestra que responde SI es un estadístico. se presentan al sujeto en cada ensayo uno de dos posibles estímulos. En la clase A.-Tratamos de hacer un sondeo acerca del resultado de un referéndum que se celebrará próximamente en España. En la clase B se limita a dar su lección magistral. cada uno de ellos representando el tiempo invertido por el sujeto en cada uno de los ensayos.

En el primero el nivel de estudios de los encuestados (todos son universitarios).En el segundo los estudios cursados (3º de EDUCACIÓN MEDIA). .A través de estos ejemplos se ve que cuando estudiamos las entidades que conforman una población nos interesamos por algunas de las propiedades de sus elementos.Nota obtenida por los alumnos en la prueba de conocimientos previos.Una característica es una propiedad o cualidad de un individuo.Empleo del tiempo de ocio Ahora estamos en condiciones de definir el concepto de variable como la característica de los elementos de una población que toma ó puede tomar valores distintos encada uno de ellos. . . Las variables que aparecen en los ejemplos son: . .Una modalidad es cada una de las maneras como se presenta una característica. En contraposición a éste aparece el concepto de constante que es una característica de la población que sólo puede tomar un valor para todos los elementos de la población.B.C. Podemos señalar como ejemplo algunas de las características y modalidades de los alumnos de Enseñanza Secundaria: .Tiempo de realización de la tarea. .A.Sexo que adopta dos modalidades: varón y mujer.En el cuarto la nacionalidad de los encuestados (venezolana). . . . y esas propiedades adoptan distintas variedades: . hacia la práctica continuada del deporte.Voto del referéndum. Las constantes que aparecen en los ejemplos son: . normalmente son valores entre 0 y 10.Lugar de procedencia .Motivación ante la asignatura . .Nota obtenida por los alumnos en la prueba final.Rendimiento académico en las asignaturas cursadas que adopta distintas modalidades.Actitud de los estudiantes de la U.

Medición y escalas Llamamos medición al proceso Media de atribuir números a las variables. que es el que nos proporciona el instrumento de medida. etc. si utilizamos el metro como unidad de medida. M → marrón y N →negro. cuando decimos que una persona mide 1. de intervalo y de razón. Una variable discreta es aquella que adopta valores aislados. el tiempo empleado en la ejecución de una tarea. ni relaciones de cantidad ni de diferencia. no podemos conocer su valor exacto. V → verde. nivel socioeconómico. Ejemplo: número de asignaturas aprobadas en el curso pasado.65 queremos decir que mide entre 1. con aproximación de centímetros. ordinales. Otros ejemplos: nacionalidad. Por ejemplo. número de alumnos de una clase. En realidad una variable continua nunca puede medirse con total precisión. 5. Por ejemplo: si medimos el color de los ojos podemos establecer la siguiente escala: A → azul.Las variables se pueden clasificar según el número de valores que puedan tomar como variables discretas y variables continuas. El conjunto de reglas o modelos desarrollados para la asignación de números a las variables es lo que se denomina escala. sentido del voto en unas elecciones.655. sexo. 2 → verde.645 y 1. No podemos ordenar los sujetos de mayor a menor o viceversa. sino su valor informado. Cuando tratamos con variables continuas y las definimos como variables que pueden tomar cualquier valor. pero no podemos establecer relaciones de orden respecto a esa característica.. etc. Por ejemplo: el peso Media. profesión. simplemente podemos asegurar si dos sujetos tienen el mismo o distinto color de ojos. Usando una escala nominal podemos decidir si un sujeto es igual o diferente a otro. tenemos que tener en cuenta la precisión del instrumento de medida que estamos usando. sexo. Escala nominal: nos permite identificar sujetos como "iguales" o "diferentes". la duración de un suceso. la talla. A este tipo de variables medidas con escala nominal se les puede asignar a cada categoría cualquier tipo de símbolos. En el ejemplo hemos asignado letras pero podíamos haber optado por números: 1 → azul. 3 → marrón y 4 → negro . Una variable continua es la que puede tomar todos los valores de un intervalo. La clasificación de las escalas más usada es la propuesta por Stevens (1946) que divide las escalas en: nominales.

Otros ejemplos: la medición de las temperaturas en grados centígrados. Por ejemplo. Otros ejemplos de escala ordinal: posición relativa en la clase. podemos hablar de variables nominales. aunque en este caso el cero sea un punto arbitrario en la escala. en nuestro calendario se eligió el año del nacimiento de Cristo como año 1. escala de dureza de los minerales. es decir. duración de un suceso. Aunque no podemos afirmar que la diferencia existente entre el 2y el 1 sea la misma que la que existe entre el 3 y el 2. no indica ausencia total de la cantidad de atributo. Podemos ordenar a los sujetos según el nivel de estudios. tiene el doble de longitud que uno que mide 5 cm. Escala de razón: También se llama de proporción o de cociente. Pero no podemos afirmar que hasta el año 1000 haya pasado el doble de tiempo que hasta el año 500. Escala de intervalo: Con esta escala. También se pueden clasificar atendiendo al tipo de información que proveen en cualitativas y cuantitativas. las calificaciones escolares. Un ejemplo típico es el calendario. los objetos se pueden ordenar. . podemos afirmar que ha transcurrido el mismo tiempo entre1960 y 1966 que entre 1980 y 1986 porque contamos con una unidad de medida llamada año. porque el valor cero no representa el comienzo del tiempo sino que. disponemos de una unidad de medida. Es decir. 2 a estudios secundarios. además de poder identificar un objeto y establecer relaciones del tipo mayor que y menor que. que significa ausencia del atributo o característica medida.Escala ordinal: Esta escala no sólo permite la identificación y diferenciación de los sujetos sino que además permite establecer relaciones del tipo "mayor que" o "menor que". la longitud. de los sujetos se puede decir cual presenta una mayor o menor magnitud de la característica medida. podemos afirmar que un objeto que mide 10 cm. Otros ejemplos: peso. contamos con una unidad de medida con cero absoluto. Ejemplo: nivel de estudios se puede asignar 1 a estudios primarios. es decir. Es decir. la escala de los test de inteligencia. Una vez descritas estas escalas podemos volver a clasificar las variables según la escala usada para medirlas. también podemos hacer afirmación es acerca de las diferencias en la cantidad del atributo de unos y otros objetos. temperatura en grados Kelvin (que sí tiene cero absoluto). Además de las características de las otras tres escalas. el valor 3 es mayor que el 2 y el 1. ordinales. de intervalo y de razón. Es decir. 3 a estudios universitarios. Ni que el que tenga nivel 3 tenga3 veces más de nivel de estudios que el que tiene nivel 1.

el IQ = (edad mental / edad cronológica) ⋅ 100.Datos que son frecuencias de categorías. ordinales o de intervalo. De alguna forma dan cuenta de la cantidad de atributo o característica que el individuo posee. a través de test. salvo que se use. 1. número de escolarizados. . etc. tiempo empleado en realizar una tarea. Si se han observado pocos valores es posible que la simple inspección visual de . en principio. color de ojos. tasa de aprobados por especialidad. En el capítulo anterior ha quedado claro el hecho de que la Estadística trabaja con datos de muy diversa índole: . talla. Son escasamente utilizadas las de razón o proporción. dureza de los minerales. calificación en la última evaluación de la asignatura X. probabilidad de pertenecer a un grupo dentro de un determinado curso Ratios o números índice. Organización y representación de datos. . el tiempo utilizado para ejecutar una tarea. cuestionarios o encuestas dispone. En general. que son números que provienen de un cociente: el índice de precios al consumo. Variables cuantitativas son aquellas que se miden según una escala de intervalo o de razón. rendimiento académico. número de asignaturas aprobadas. que provienen de un proceso de conteo: número de nacimientos. Capítulo 2. histograma y polígono de frecuencias. nivel socioeconómico. por ejemplo.Datos que provienen de la medición de variables: peso. de una lista de datos. Por ejemplo: peso. En la mayoría de las investigaciones educativas las variables manejadas se miden con escalas nominales. etc.Datos que reflejan porcentajes. nivel cultural. número de matriculados en un curso.Distribución de frecuencias. temperaturas. exámenes.Variables cualitativas son aquellas que se miden según una escala nominal u ordinal. probabilidades: porcentaje de aprobados en un centro. Informan más bien de una cualidad del sujeto: sexo. una vez que el profesor o investigador ha recabado información acerca de sus alumnos ó de la muestra elegida en su caso.. talla.

Para definir el término frecuencia que aparece. 3. 2. 1. cuál es el rango en que varían las puntuaciones. Un instrumento para conseguir esta ordenación de los datos es lo que llamamos distribución de frecuencias. a su vez. 1. después de un examen saber cuál es la puntuación del estudiante típico. Para construir la tabla de distribución de frecuencias se inspeccionan en primer lugar los valores que toma la variable.2. La letra X mayúscula con subíndices. Las respuestas de sus treinta alumnos son: 1. En segundo lugar se cuenta cuántas veces aparece cada uno de ellos.los mismos sea suficiente para poder describir el fenómeno estudiado. 3. 1. 1.. X1 X2 X3. según Hays (1988). 2.3. 2. El número de elementos que componen la muestra será n. 2. por ejemplo. entonces tendremos que poner en orden nuestros datos de forma que podamos interpretarlos. 1. que además de ésta función debe cumplir otras dos más: ofrecer la información necesaria para hacer representaciones gráficas y facilitar los cálculos para obtener los estadísticos muestrales. 4. Estos datos se colocan en una tabla de la forma siguiente: . 3. 4.. Ahora vamos a seguir los pasos para la construcción de una tabla de distribución de frecuencias con un ejemplo sencillo. servirá para representar un valor concreto de la variable X en el sujeto 1. Se llama frecuencia de un valor Xi. 1. 2. 1. una representación de la relación entre un conjunto de medidas o clases de medidas mutuamente exclusivas y exhaustivas y la frecuencia de cada una de ellas.Cuando queramos referirnos a un valor concreto cualquiera de la variable X escribiremos Xi. 2. 3 y 4. 1. 3. Pero esto no es nada frecuente. entre otras cosas. 2. si los estudiantes se agrupan en las posiciones extremas o en las centrales o están dispersos. Supongamos que un profesor pasa a sus alumnos una encuesta en la que. Una distribución de frecuencias es. Si queremos. y se simboliza por fi al número de veces que se repite el valor Xi en la muestra. 1. 2. en esta definición vamos a establecer una notación: la letra X mayúscula representará a la variable con la que estamos trabajando. 4. 1.. 1. 2. 1. 3. En este caso se trata de una variable discreta que sólo toma los valores 1. se les pregunta por el número de hermanos. 2.

77. que las familias con un único hijo son las más frecuentes. Este es un ejemplo de tabla de distribución de frecuencias muy simple debido fundamentalmente a que la variable sólo toma cuatro valores diferentes. 58. 54. Para agrupar las puntuaciones de la variable se suelen establecer estas dos reglas: . 85. 73. 55. 91. 61. El valor más pequeño es 32 y el mayor 93. que consiste en formar grupos de valores consecutivos de la variable y poner cada uno de estos grupos en cada fila. 46. 51. los resultados son los siguientes: 37. 71. 33. Una vez construida esta tabla y a pesar de su simplicidad. 13 + 9 son 22 familias. En estos casos se recurre a lo que se denomina la agrupación en intervalos de clase. 63. 93. Si construyésemos una tabla de distribución de frecuencias como la anterior tendríamos una lista demasiado extensa (62 números) y muchas de las frecuencias serían cero. ya podemos extraer algunas conclusiones. 42. 85. 77.3% de la muestra. que en tanto por ciento sobre 30 representan el 73. 78. 75. 49.Valores de la variable Frecuencia Xi 1 2 3 4 N fi 13 9 5 3 30 Tabla 1: Distribución de frecuencias de la variable “Número de hermanos”. en lugar de poner una sola puntuación. Si sumamos la frecuencia de éstas y la de las familias de dos hijos. 73. 65. 32. 72. 68. 83. Vamos a poner otro ejemplo algo más complejo: un profesor pasa un test de hábitos de estudio a sus treinta alumnos. por ejemplo. 73. 57. 63.

En nuestro ejemplo. 92. 2º. la variable toma valores entre 32 y 93. 91. 31.1. 10 ó 20 unidades de la escala. es decir. 93 y 94. decidimos hacer intervalos de clase de amplitud 5.2 y62/20=3. 3.1º. así que el primer intervalo de clase contendrá las puntuaciones 30. El número de intervalos o grupos debe variar entre 10 y 20. 33 y 34 y el último 90. si las agrupamos de 3 en 3 tendremos alrededor de 20 intervalos. La tabla de distribución de frecuencias agrupada sería la siguiente: Xi 30 34 35 39 40 44 45 49 50 55 55 59 60 64 fi 2 1 1 2 2 3 3 . Nos fijamos en la regla nº 2 y dividimos 62/10=6. 32. 5. A partir de un número que sea múltiplo del tamaño de los intervalos de clase y que se aproxime lo más posible a la medida observada menor. Atendiendo a la regla nº 1. Son preferibles los intervalos de clase que contengan 1. Esto quiere decir que si agrupamos las puntuaciones de 6 en 6 tendremos 10intervalos. su rango ó amplitud total es 93-32+1=62. 2. La siguiente pregunta es ¿a partir de qué número empezamos a contar en la escala?. En nuestro ejemplo 32 es el valor más pequeño y 30 el múltiplo de 5 más cercano.

en teoría tenemos que considerar esta variable como continua en el intervalo. . la variable puntuación del test de hábitos de estudio no puede tomar valores entre 44 y 45 o entre 59 y 60.5 o 59.5-39. A partir de los límites informados o de los límites exactos se puede definir el punto medio del intervalo como el punto que resulta de la suma del extremo superior yel extremo inferior dividida por dos. Aunque en la práctica esto es así porque el test usado para medir hábitos de estudio notiene la precisión suficiente para obtener valores como 44. les llamaremos límites informados. Por otra parte. es decir.5) /2.8. como su media. Según esta tabla de distribución de frecuencias agrupadas. puede tomar cualquier valor entre 30 y 94. Así pues los límites exactos del intervalo 30-34 son 29. es decir.5.65 69 70 74 75 79 80 – 84 85 89 90 94 N 2 5 4 1 2 2 30 Tabla 2: Distribución de frecuencias con los datos agrupados en intervalos de clase de la variable puntuaciones obtenidas en un test de hábitos de estudio. a los límites de los intervalos que aparecen en la Tabla 2.5 + 64. los del intervalo 35-39 son 34. el punto medio del intervalo 60-64 es el punto 62. resultado de (60 + 64) / 2 ó de (59. Por ejemplo.5-34.5 y así sucesivamente de forma que el límite superior exacto de un intervalo coincida con el límite inferior exacto del siguiente.

5 5 4. Una vez construida la tabla de distribución de frecuencias.5 64.34 35 . En este momento volveremos a escribir nuestra tabla de distribución de frecuencias añadiendo los límites exactos de los intervalos y sus puntos medios.5 .5 Xi 32 37 42 47 52 57 62 67 72 77 82 87 92 fi 2 1 1 2 2 3 3 2 5 4 1 2 2 30 Tabla 3: Intervalos de clase.5 44.5 89.5 74.84.5 .55 55 .34. para usarla más adelante en las representaciones gráficas.5 .5 59.59.49 50 . Clases 30 .39.94 N Límites Reales 29.5 .5 . a la que hemos añadido los límites exactos de los intervalos y sus puntos medios.69.5 .74.39 40 .5 84. estamos en condiciones de hacer algunas representaciones gráficas que nos ayudarán a interpretar la situación de los alumnos en cuanto al test de hábitos de estudio.79 80 – 84 85 .74 75 .5 .54. límites exactos.49.59 60 .5 79. puntos medios y frecuencias de las puntuaciones obtenidas en el test de hábitos de estudio.44.89 90 .89.5 .5 49.5 39.5 .64 65 .La amplitud del intervalo se define como la diferencia entre el límite superior exacto y el límite inferior exacto.69 70 . .64.5 .5 .5 .5 .44 45 .94.79.5 34.5 69.

si estamos trabajando con la variable "ingresos mensuales". se pueden hacer muchas tablas distintas. En el eje de abcisas representaremos los puntos medios de cada intervalo y en el de ordenadas la frecuencia de cada intervalo. que cumplen los requisitos para los cuales se han diseñado: la ordenación de una manera clara y sistemática de nuestros datos. En segundo lugar. Sobre cada uno de estos intervalos se dibuja un rectángulo cuya base está delimitada por los límites exactos y su altura es la frecuencia de ese intervalo. tenemos que tener en cuenta que se nos pueden presentar situaciones en las que sea difícil aplicar estas reglas sin perder gran parte de la información. es decir. 2ª. Por ejemplo. todas ellas igualmente válidas. Es evidente que el histograma y el polígono de frecuencias ofrecen una imagen muy similar de la distribución de frecuencias de los datos. Uniendo estos puntos de forma consecutiva mediante segmentos de recta.Para hacer las representaciones gráficas de las tablas de distribución de frecuencias podemos considerar dos situaciones distintas: 1ª. partiendo de los mismos datos y teniendo en cuenta las dos reglas citadas anteriormente. si consideramos que las observaciones dentro de cada intervalo se concentran en su punto medio. Las observaciones dentro de un intervalo de clase están distribuidas uniformemente entre sus límites exactos. Histograma de los datos Si nos encontramos en la primera situación haremos un histograma o diagrama de barras o columnas. construiremos un polígono de frecuencias. Las observaciones dentro de un intervalo de clase están concentradas en su punto medio. Ahora vamos a hacer algunas consideraciones respecto a las dos normas para la construcción de tablas de distribuciones de frecuencia. es decir. En el eje de abcisas (eje de las x) se representan los límites exactos de los intervalos de clase y en el eje de ordenadas (eje de las y) la frecuencia de cada intervalo. Esto es así porque se puede construir el segundo a partir del primero sin más que unir los puntos medios de las bases superiores de los rectángulos del histograma. tendremos una mayoría de valores concentrados en torno avalores . Polígono de frecuencias Si nos encontramos en la segunda situación. En primer lugar queda claro que. obtendremos el polígono de frecuencias.

como el número de datos.Distribución de frecuencias acumuladas. para los siguientes. Una forma de resolver este problema es calcular los porcentajes de frecuencias de cada intervalo de clase. para construir la tabla de la distribución de frecuencias acumuladas calculando los porcentajes de frecuencias acumuladas. De la misma forma se calculan porcentajes de frecuencias acumuladas.. casos u observaciones dentro de dicho intervalo. y de amplitud constante. . La frecuencia acumulada se calcula de forma inmediata a partir de la frecuencia de cada intervalo de clase. en los cuales no se considera límite superior o límite inferior. la inmensa mayoría de los datos estarían concentrados en uno o dos intervalos.000" y el último "más de 500. Si en un caso así se hiciera un número de intervalos en torno a diez. Por ejemplo. polígono de frecuencias acumuladas y polígono de porcentajes de frecuencia acumulada Hasta el momento hemos presentado una de las formas de representación y tabulación de datos. Así. ahora haremos referencia a la distribución de frecuencias acumuladas que se usa cuando se tiene interés en el número de observaciones que se sitúan por debajo de un cierto punto de la escala de medición. Cuando trabajamos con variables distintas o con la misma variable medida en muestras de distinto tamaño resulta difícil comparar las frecuencias absolutas. la frecuencia acumulada es igual a su frecuencia más la acumulada del intervalo anterior. Volvamos al ejemplo de los datos del test de hábitos de estudio.000" . el primer intervalo podría ser "menos de 50. más todos aquellos contenidos en intervalos inferiores en la escala. 2. Definiremos frecuencia acumulada hasta un intervalo de clase. Para el primero de éstos ambas frecuencias coinciden.centrales y unos pocos que se desvían de éstos mucho por arriba. la frecuencia acumulada del último intervalo será igual al número de observaciones de la distribución. ya que así compararemos dos distribuciones con cien observaciones. Para evitar eso se utiliza lo que se denomina intervalos abiertos.

33 70.89 90 .89.67 46.39.94 N Límites Reales 29.74 75 .5 89.33 86.64.5 74.59 60 .49.67 93. Estos gráficos nos permiten conocer cuántas observaciones o qué porcentaje se sitúan por debajo de un intervalo de clase.84.5 .5 .00 26.5 .5 . representando en el eje de abcisas los límites superiores exactos de los intervalos de clase y en el de ordenadas las correspondientes frecuencias acumuladas o porcentajes de frecuencias acumuladas respectivamente.67 36.67 53. A partir de esta tabla podemos representar gráficamente el polígono de frecuencias acumuladas y el polígono de porcentajes de frecuencias acumuladas.64 65 .5 59.5 34.34.5 .44 45 .79.5 49. Distribución de frecuencias acumuladas y porcentaje de frecuencias acumuladas de las puntuaciones en el test de hábitos de estudio.5 44.74.5 69.5 .59.00 13.39 40 .5 64.33 20.5 5 4.5 .5 .49 50 .33 100.5 . Estos dos polígonos tienen exactamente la misma forma.Clases 30 .69.00 Tabla 4.5 79.5 .5 84.54.67 10.55 55 . difieren únicamente en la escala del eje de ordenadas.5 Xi 32 37 42 47 52 57 62 67 72 77 82 87 92 fi 2 1 1 2 2 3 3 2 5 4 1 2 2 30 Fa 2 3 4 6 8 11 14 16 21 25 26 28 30 Fa% 6.69 70 .94.5 39.00 83.5 . .79 80 – 84 85 .34 35 .5 .44.5 .

C y D. Además la superficie de los mismos es proporcional a la frecuencia de cada modalidad de la variable. Para ello es necesario definir algunas características de las distribuciones de frecuencias que llamamos: tendencia central. sus indicadores que obtenemos mediante una serie de cálculos a partir de los datos de una tabla de distribución de frecuencias. En ocasiones. pero estas técnicas todavía no son suficientes para hacer comparaciones entre distintas distribuciones de frecuencias. pero casi con toda seguridad le costaría un gran esfuerzo entresacar de esos datos respuestas precisas.. B. una marca por cada asignatura o una marca para cada uno de los grupos. Los perfiles se usan bastante en informes psicopedagógicos o de rendimiento. o las medias de la asignatura de Matemáticas de 1º de EDUCACIÓN MEDIA en los grupos A. En los ejemplos. Otra forma de . En el eje de ordenadas se representan las puntuaciones alcanzadas en distintas variables o parámetros. Un pictograma es una representación gráfica de una variable en forma de círculo que está dividido en tantos sectores como valores distintos tome la variable. Le podríamos responder presentándole las tablas de distribuciones de frecuencias o incluso las listas con los nombres de los alumnos. 4. Y en el eje de abcisas se coloca una marca por cada sujeto.Características generales de una distribución de frecuencias Hasta este momento hemos visto cómo construir tablas y representar gráficamente un conjunto de datos. es decir. Supongamos que el jefe de estudios del centro nos pregunta: ¿Cuál es el rendimiento de la clase A en tu asignatura? ¿Cuánto tiempo han empleado tus alumnos en recorrer el circuito?. sesgo y curtosis. todos ellos medidos con la misma unidad. sus calificaciones y tiempos.3. Por ejemplo: las calificaciones de un alumno en cuatro asignaturas distintas medidas de uno a diez.. Todas ellas tienen sus correspondientes medidas.Otras representaciones gráficas De entre las distintas representaciones gráficas que se pueden hacer con nuestros datos haremos sólo referencia a los pictogramas y los perfiles por su uso más extendido. grupo o variable medida. cuando se quiere destacar una de las secciones en particular se separa del resto para captar la atención del lector en esa modalidad particular. variabilidad o dispersión.

responder a las preguntas más claramente sería calcular algunas medidas de tendencia central de esas distribuciones. Una distribución de frecuencias será homogénea o poco variable si los datos difieren poco entre sí y . podríamos confundir. Si por el contrario el examen es difícil. es decir. Una distribución tiene asimetría negativa cuando la mayor parte de las observaciones se sitúan en la parte alta de la escala mientras que se produce alguna observación en la parte baja. Por el contrario será heterogénea o muy variable si los datos se dispersan mucho respecto al promedio. que precisamente son representaciones del valor "típico" o "promedio" de la variable. Precisamente. Las medidas de variabilidad o dispersión más frecuentes son: las desviación típica. la distribución de frecuencias de sus calificaciones tendrá sesgo negativo puesto que la mayoría de los alumnos obtendrían calificaciones altas. se agrupan en torno a su promedio. por tener el mismo rendimiento medio. dos distribuciones pueden tener la misma media y distinta variabilidad y viceversa. esta independencia es la causa de la importancia de la variabilidad. dedicaremos a su cálculo. La variabilidad o dispersión se refiere al grado de concentración de las observaciones en torno al promedio. También podemos decir que hace referencia al grado en que los datos se reparten equilibradamente por encima y por debajo de la tendencia central. la varianza. Las medidas de tendencia central más utilizadas son la media. Un ejemplo: si ponemos a nuestros alumnos un examen muy fácil. Una distribución tiene asimetría positiva cuando la mayor concentración de puntuaciones se produce en la parte baja de la escala mientras que algunas puntuaciones son altas. que se refieren al centro de la distribución de frecuencias. a la puntuación que representa a todas las demás. al dividirla en dos a la altura de la media. o en los valores superiores a éste. el rango y la amplitud semi intercuartil. porque si prescindiésemos de ella. Esta propiedad es independiente de la tendencia central. Una distribución será simétrica cuando. Si el examen es de . la mediana y la moda. una clase con alumnos de rendimiento medio muy similar con otra que tuviera alumnos de rendimiento máximo y alumnos de rendimiento mínimo. desviación media. en los valores inferiores al promedio. estaremos ante una distribución con sesgo positivo puesto que la mayoría de los alumnos obtendrían notas bajas y sólo algunos destacarían con nota saltas. su significado y sus propiedades una parte del capítulo siguiente. Por su importancia. las dos mitades se superponen. El sesgo o asimetría se refiere al grado en que los datos tienden a concentrarse en los valores centrales.por tanto.

El criterio tiene que ver con las diferencias entre cuartiles y es el siguiente: Si (Q3 .dificultad media. en la Figura 9 aparecen las gráficas de tres grupos A. El concepto de curtosis sólo se aplica a distribuciones unimodales (distribuciones que tienen un único “pico”) y se refiere al empinamiento de la curva en la proximidad de la moda. La curtosis se usa para saber cómo es de escarpado o plano un polígono de frecuencias. Para esta característica no vamos a estudiar ningún índice porque normalmente los cálculos son laboriosos. Medidas de tendencia central 1. Respecto a la inspección gráfica. lo más probable es que la distribución sea simétrica.(Q3 . La distribución A es simétrica.Q2) < (Q2 . Figura 9: Ejemplos de distribuciones con distinto tipo de sesgo..Q1) tiene sesgo negativo. Si. Generalmente el grado de curtosis de una distribución se compara con un modelo de distribución que estudiaremos más adelante que es la llamada campana de Gauss o distribución normal.Q2) > (Q2 .Q1) la distribución será simétrica . la B asimétrica positiva y la C asimétrica negativa. Los índices empleados habitualmente para calcular la curtosis son demasiado complicados. B y C. las distribuciones que tienen el mismo grado de apuntamiento que la normal se llaman mesoacúrticas.Q2) = (Q2 . La media de una variable se define como la suma de todos los valores observados dividida por el número de ellos. Las distribuciones que tienen mayor grado de apuntamiento que la normal se llaman leptocúrticas y las que lo tienen menor platicúrticas.La media. La A es simétrica. Se denota por la misma letra que la variable con una barra horizontal encima. por lo que en estas notas no haremos referencia a ellos. más bien podemos dar un criterio aún cuando la podemos apreciar mediante la inspección visual del polígono de frecuencias. Si (Q3 . comparados con su utilización.3 Capitulo 3. la B tiene sesgo positivo y la C negativo. Así. Si tenemos n valores de la variable X su media se calcula utilizando la siguiente fórmula: x= _ Σ fix i N .Q1) entonces la distribución tiene sesgo positivo.

. respectivamente. Como en el numerador aparece la suma de los productos de cada puntuación por su frecuencia. las notas obtenidas por una clase de 20 alumnos en un examen de Historia. 4. 2. Si estamos ante una distribución de frecuencias agrupadas y por tanto no disponemos de los datos observados. así como la búsqueda constante del perfeccionamiento de los métodos inventados para lograr esa organización o clasificación de la información obtenida. y ordenadas de menor a mayor son : 1.Por ejemplo. 7. + ( xn )( fn ) N Conceptos y Definiciones La necesidad que siempre ha tenido el hombre de clasificar la informa-ción que haya podido obtener en las múltiples actividades desarrolladas. 6. Su media se calcula : ( 1+2+2+3+3+3+4+4+4+5+5+5+5+5+6+6+7+7+8+9 ) / 20 = 94 / 20 = 4. si denotamos como Xmi el punto medio del intervalo i-ésimo y fi la frecuencia del mismo. 3.7. añadimos una columna más a la tabla de distribución de frecuencias en la que escribimos precisamente cada uno de estos sumandos. 4. 6. 8 y 9.7 También podemos calcular la media a partir de la distribución de frecuencias: Veamos ahora cómo podemos usar la tabla de distribución de frecuencias. La media será el cociente entre la suma de la columna de los f ixi y la suma de la columna de las frecuencias o sea N. lo cual no siempre es así. 3. empleando los datos del ejemplo. para aplicar la fórmula anterior del cálculo de la media. en este caso el sumatorio tiene tantos sumandos como X = ∑( x )(f ) i i N = ( x1 )(f1 ) + ( x 2 )(f2 ) + ( x3 )(f3 ) + . para calcular la media en lugar de los datos observados trabajaremos con los puntos medios de los intervalos de clase y la frecuencia de cada uno de ellos. 5. fue lo que dio origen a lo que hoy conocemos como estadística. En la . 5. 5. 5. 2. Por tanto. Cuando uno oye la palabra estadística. calcularemos la media como: Hay que tener en cuenta que en las otras fórmulas el sumatorio se extendía a lo largo de todas las puntuaciones observadas y a lo largo de las puntuaciones distintas observadas. . 5. 3. 4. inmediatamente le viene a la mente la idea de complicados cálculos numéricos.

han de estar presentados de manera ordenada y sistemática. “Se entiende a la estadística como una colección de datos numéricos. conjuntos o colectivos de casos”. entendiendo como tales. organizar y analizar datos. Definición A continuación se presentan algunas definiciones sobre este concepto: “La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivos. que posteriormente será estudiada y a la que se le aplicará una determinada metodología en la que posiblemente estarán involucrados algunos cálculos. clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación. aquellos fenómenos naturales. 1973). “La Estadística en su acepción más común. 1953).. 1954). que producirá una información más elaborada que facilitará la toma de decisiones. (Barbacho. y se define la Estadística (en mayúscula) como una ciencia que estudia el comportamiento de los fenómenos de masa.mayoría de los casos lo menos que ocurre dentro de la actividad relacionada con la estadística es la aplicación de complicados cálculos. económicos sociales. cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados indi-viduales o particulares”. lo más frecuente es la clasificación y ordenamiento de información. es decir. etc. “La Estadística es la ciencia que trata de la recolección. con la finalidad de evaluar los resultados obtenidos y poder hacer proyecciones a futuro”. . sino que estudia siempre grupos. (Gini. es considerada como la ciencia cuyo objeto es ordenar y clasificar información obtenida de situacio-nes que han ocurrido. se encarga de coleccionar. sobreentendiéndose que tales datos numéricos. de modo de poder sacar conclusiones válidas que permitan tomar decisiones razonables. La Estadística como ciencia. descripción y comparación de los fenómenos” (Yude y Kendal. no se detiene en el estudio del comportamiento de un caso aislado.

la estadística es aplicada en casi todos los campos del saber humano. Todo lo anterior nos hace pensar en una primera clasificación de la Estadística en: Descriptiva. No hay disciplina académica donde no encontremos incluida la estadística como herramienta fundamental. Campo de Aplicación Hoy en día. En la industria. una vez observado el fenómeno. mediante el análisis estadístico. y esto no es otra cosa que la aplicación de métodos estadísticos. porque cualquier estudio estadístico se basa en la tendencia. esto no es casual ni caprichoso. podemos hacer predic- ciones con bastante aproximación. las probabilidades de acierto son grandes. Cuando hacemos una investigación y formulamos una hipótesis. a partir de una observación determinada. clasificar y describir la información obtenida a cerca de un fenómeno determinado. Analítica e Inductiva. vemos que prácticamente en todas está incluida en algún momento la asignatura estadística. (Investigar. necesitamos métodos estadísticos para compro-bar hasta qué punto se ajusta el supuesto a la realidad. Si observamos los diferentes planes de estudio de las distintas carreras que se ofrecen en las Universidades. lo cual permitirá hacer las predicaciones correspondientes. para poder hacer investigación es necesario poseer las herramientas básicas que permitan la recolección y clasificación de información. ampliamente. Deducir. se puede calcular cuál será la demanda futura de un determinado producto.Mediante la aplicación de métodos estadísticos. se debe básicamente al hecho que para la mayoría de las ciencias. Si las condiciones se mantienen. . como son: Recolectar. cada uno de estos conceptos). no así si cambian las condiciones. las leyes que lo rigen. Resumiendo. Analizar la información obtenida y establecer las características comu-nes observadas. vemos que la estadística tiene variadas finalidades. Decimos con bastante aproximación y no con absoluta seguridad.

pues no podemos ejercer control absoluto sobre ellos. En los fenómenos aleatorios existe una marcada influencia del azar. En lugar de estudiar al grupo completo que. como lo es el de probabilidades. Lo más seguro es que cada vez que lancemos el dado obtengamos resultados diferentes. en igualdad de condiciones. los resultados obtenidos son diferentes. puede ser compli-cado o poco práctico observar al grupo en su totalidad. desde el punto de vista estadístico. recibe el nombre de población o universo. Fenómenos como el descrito anteriormente. hará que surja un nuevo concepto. Cuando hagamos referencia al término muestra. que estudiaremos en futuras unidades. Población y Muestra Cuando tratamos de estudiar una serie de datos. Fenómeno Aleatorio Un fenómeno es considerado aleatorio. la cual por no ser del todo exacta. o sea. a partir del análisis que hagamos de la muestra. se acostumbra estudiar una pequeña parte del grupo. . que recibe el nombre de muestra. sino que su comportamiento depende en gran medida del azar. Un ejemplo clásico de lo que es un fenómeno aleatorio. como es el caso del lanzamiento de una moneda. podemos inferir importantes conclusiones sobre la población. debemos mantener clara la idea de que sea representativa. es el lanzamiento de un dado honrado. así como muchos otros. cuando al repetirse una canti-dad n de veces. En los próximos párrafos vamos a estudiar esos conceptos. son fenómenos aleatorios. tiene que comenzar por una serie de conceptos que son indispensables para profundizar en ese campo inmenso que es la Estadística. o la demanda de un determinado producto. dependiendo del tamaño o la cantidad de los integrantes de la misma. un dado que no este cargado. las edades de los alumnos de una determinada Universidad. Cuando así sucede. por ejemplo. estamos en presencia de una inferencia estadística. La población puede ser finita o infinita. Cuando hacemos esto.Cualquier persona que desee iniciarse en el estudio de la estadística.

universo o masa estadística.3. mientras que las discretas sólo pueden tomar valores enteros. si consideramos los resultados obtenidos sin repetición. Las características a su vez se clasifican en: variables y atributos. 1.El conjunto formado por todas las observaciones posibles de un determinado fenómeno. o sea. 4. recibe el nombre de dato.3. 3. 2. mientras que los atributos son características cualitativas y se subdividen en variables continuas y variables discretas. los datos son 1. Masa fija: Aquella que para su definición se requiere hacer referencia a un instante. Por ejemplo. número de calificaciones obtenidas en la asignatura estadística durante el año escolar 1998 -1999. utilizamos para su estudio una parte de ella. por ejemplo.4. recibe el nombre de población. la información que nos interesa y de la cual tomamos nota. porque las unidades de que consta pueden extenderse en el tiempo.3. el número de estudiantes de nuestra Universidad. Cuando el número de elementos que forman una población es muy grande. Por ejemplo. Por ejemplo. Es importante dejar claro que una masa estadística abarca una cantidad finita de unidades estadísticas (elementos) Cuando estamos realizando la observación de un fenómeno objeto de un estudio estadístico. cuando lanzamos un dado al aire en cinco oportunidades. le daremos como nombre características.3. las edades de todos los estudiantes del Ciclo Básico del Instituto. 3.4. si los resultados observados fueron 1. ya que las unidades de que consta se consideran como sucesos susceptibles de puntuación. Las continuas pueden tomar cual-quier valor. 3. Masa de sucesos: Para su definición es necesaria la referencia a un período de tiempo. la cual puede ser: 1. El objeto formal de la descripción estadística es la masa estadística. a la que llamaremos muestra. Así. Las variables se refieren a características de carácter cuantitativas. En el ejemplo anterior. .

los cuales pueden tomar un conjunto de valores. las características de cada dato. el carácter de una persona. dos. etc.. Puede suceder que la variable pueda tomar un solo valor. sobre todo en la investigación científico-social. nos referimos a símbolos tales como x. Las variables también pueden ser: unidimensionales. por lo tanto es una variable bidimensional. se dice que es una variable discreta. Las estaturas de tres estudiantes. de hijos. z. tres. dependiendo que sean una. Cuando utilizamos el término variable. por lo tanto es una variable unidimensional. etc. se dice que la variable es continua. sexo. estatura y peso. distinguir entre características acumulables y características no acumula-bles. Características no acumulables: A cada unidad de una masa esta-dística puede imputarse una sola expresión de una característica. María es ama de casa y abogado al mismo tiempo. los datos referentes a colores. bidimensionales. las estaturas de los estudiantes de esta sección. posee dos caracterís-ticas. el número de pupitres que hay en un aula son variables discretas. en cuyo caso recibe el nombre de constante. son atributos. Ningún alumno será masculino y femenino al mismo tiempo. Si la variable puede tomar cualquier valor entre dos valores dados. Por ejemplo. son variables discretas. tiene una sola característica que es el peso. mientras que si ocurre lo contrario. etc.De acuerdo a lo anterior. el No. Conviene también. y.. Características acumulables: A las unidades de una masa estadística pueden imputarse varias expresiones de una característica. tridimensionales. mientras que la estatura y peso de tres estudiantes. son variables continuas. es un atributo. Por ejemplo. Las características de investigación pueden ser: Cualitativas De rango Cuantitativas . que constituyen el dominio de la variable.

cara. sello. supon-gamos que lanzamos seis veces una moneda y obtenemos los resultados: cara. Podemos entonces definir frecuencia a la cantidad de veces que se repite un determinado dato. La frecuencia absoluta la denotamos por f. La frecuencia relativa es el resultado de dividir la frecuencia absoluta entre el total de los datos de la población. lo cual no debe olvidarse nunca. una característica se repite varias veces. Las características de los datos obtenidos son cara y sello. cara. mientras que la de sello es 2. Cuando en una población. la cantidad de veces que se repite recibe el nombre de frecuencia. La frecuencia absoluta es la cantidad de datos de una determinada población. Después que hemos obtenido los datos referidos a una población. Las características cualitativas. Si la frecuencia relativa la multiplicamos por 100 obtenemos la frecuencia relativa porcentual. . por ser características cualitativas. Vemos que la frecuencia del atributo cara es 4. sello. de modo que hablaremos de: métrica nominal en las características cualitativas. de manera que podamos obtener una primera información de ellos. es necesario que se ordenen. Por ejemplo. que son atributos. cuantitativas y de rango son mutua-mente excluyentes. cara. que poseen la misma característica. universo o masa estadística determinada. universo o masa estadística cualquiera.Los intervalos de las expresiones de estas características se miden con ayuda de una métrica. métrica ordinal en las características de rango métrica cardinal en las características cuantitativas.

Para una mejor visualización de los datos que hemos obtenido. Ejemplos: Característica cualitativa Cien alumnos de 1º. se habla de distribución de datos indivi-duales o datos no agrupados. Cuando se resumen varias de esas expresiones en una clase (por ejemplo. Que esas modalidades aparecen. se habla de distribu-ción con datos agrupados. las calificaciones comprendidas entre 12-15). que se conocen como tablas estadísticas. o “considero que es innecesaria” o “no opino”. con frecuen-cias diferentes. En este caso tenemos que: Unidad estadística: cada uno de los alumnos entrevistados . Modelo de tabla general Cuando se examina una característica de una masa estadística pueden advertirse dos cosas: Que en la masa se manifiestan distintas modalidades de la caracterís-tica. la mayoría de las veces. usualmente se utilizan cuadros formados por filas y columnas. o sea matrices. Semestre del Instituto Universitario responden a la pregunta: ¿Qué piensas de la cogestión escolar? Las respuestas pueden ser: “pienso que es necesaria”. Cuando se indican en la tabla de distribución todas y cada una de las expresiones de la característica.

Características de identificación: objetiva: alumnos de 1º.00 Cuando en una población. cara. Por ejemplo.78 0. que son atributos.Masa estadística: los 100 alumnos. Variable Discreta y Variable Continua . innecesaria. Vemos que la frecuencia del atributo cara es 4. universo o masa estadística determinada. Modalidades de la característica de investigación : necesaria. cara. mientras que la de sello es 2. la cantidad de veces que se repite recibe el nombre de frecuencia. Las características de los datos obtenidos son cara y sello. Podemos entonces definir frecuencia a la cantidad de veces que se repite un determinado dato. por ser características cualitativas. Semestre espacial: el Instituto Universitario de la ciudad de Los Teques temporal: el 11-03-97 Características de investigación: postura ante la cogestión escolar. sello. una característica se repite varias veces. supon-gamos que lanzamos seis veces una moneda y obtenemos los resultados: cara. no opino Expresión de la característica Ai A1 : necesaria A2 : innecesaria A3 : no opino Frecuencia absoluta fi 78 22 0 Frecuencia relativa fr 0.22 0. cara. sello.

Formas de representación de una serie de datos La información (datos) obtenidos mediante la aplicación de una determinada técnica de recolección. pueden ser recolecta-dos mediante distintas técnicas. que constituyen el dominio de la variable.Cuando utilizamos el término variable. Las variables pueden ser consideradas también como una expresión cualitativa. las encuestas. Formas de recolección de información La información. de pueden representar mediante un cuadro que se conoce como tabla de distribución de frecuencias. depen-diendo del punto de vista del observador. cuestionarios. se dice que la variable es continua. Usualmente.. y pueden ser descritas de acuerdo a su color. Estas variables tiene dos tipos de escalas. Medición de la información El término medición tiene distintas maneras de ser definido. entrevistas. etc. o datos no agrupados. etc. nos referimos a símbolos tales como x. los cuales pueden tomar un conjunto de valores. y de las necesidades de informa-ción que se requiera. sabor. Puede suceder que la variable pueda tomar un solo valor. y que se esté considerando como objeto de estudio. z. etc. mientras que si ocurre lo contrario. en cuyo caso recibe el nombre de constante. al número que se asigna a un elemento determinado para expresar como una cantidad alguna de las propiedades que posea. entre las que se pueden citar. o mediante una agrupación de datos. datos o elementos estadísticos. la cual puede ser de una manera simple. las clases sociales. una nominal en la que no se tiene un orden preestablecido. se dice que es una variable discreta. Si la variable puede tomar cualquier valor entre dos valores dados. se entiende por medición. El . como por ejemplo. y. y otra ordinal en la que se establece un determinado orden.

En la serie de datos del ejemplo anterior. existen cuatro escalas de medición: Datos estadísticos Los datos estadísticos es la información que se obtiene mediante la observación a las personas o cosas que constituyen la población objeto de estudio. Se observa que aparece un término nuevo: frecuencia. Esto se conoce como frecuencia absoluta. La frecuencia se refiere a la cantidad de veces que se repite un dato. el número es la distancia que hay entre sus dos extremos. clasificación y orden de los datos que se estén estudiando. lo conveniente es organizar la información. por lo que. Lo más común es que no estén ordenados. el número asignado se refiere a la cantidad de kilogramos que marca la balanza. si se quiere obtener información útil. . del cual ya se ha hablado. Esto se logra mediante la organización. cuantitativos. Evidentemente. la tabla se refiere a datos agrupados. mientras que si se está tomando la medida de un segmento de recta. estos datos pueden obtenerse en forma ordenada o no. Los datos que se obtienen mediante la observación de una población determinada.significado del número va a depender del sistema de referencia que se esté utilizando. La distribución de frecuencias puede ser para datos agrupados o para datos no agrupados. Dependiendo de las formas de utilización de los números asignados. tendrán significados diferentes. pero dependiendo del sistema de referencia que se esté utilizando. Si se está midiendo el peso de una persona. cronológicos y geográfi-cos. pero que conviene recordar nuevamente. de manera rápida y eficiente. Puede ser que los dos números sean iguales. pueden ser: cualitativos.

Tenemos que buscar alguna forma de simplificar la manera en . correspondiente a las calificaciones de una prueba de castellano aplicada a un grupo de 30 estudiantes: 15 12 10 10 11 10 12 10 12 08 12 15 18 15 14 14 18 10 10 18 13 05 15 18 18 14 08 18 13 05 Se puede construir una matriz. conformada por filas y columnas. Otras columnas para las frecuencias acum.-ladas. en la tercera el resultado de dividir cada frecuencia entre el total de los datos (frecuencia relativa).Para un ejemplo de distribución de frecuencias con datos no agrupados. resulta muy difícil. donde en la primera columna se anotarán las distintas calificaciones obtenidas en el grupo (clases). frecuencias acumuladas relativas y frecuencias acumuladas porten-tual. consistente en las calificaciones de un test aplicado a 50 individuos. la siguiente el resultado de multiplicar la anterior por 100 (frecuencia relativa porcentual) . considérese la siguiente serie de datos. lograr alguna información. que nos permita sacar algún tipo de conclusiones. a simple vista. la siguiente el resultado de multiplicar la anterior por 100. considérese el siguiente ejemplo. en la segunda las veces que se repitió cada calificación (frecuencias). 74 23 03 58 29 63 55 65 88 60 52 03 08 07 19 05 49 89 50 62 23 27 56 42 29 09 88 45 40 09 58 61 11 40 88 32 77 22 79 69 87 03 56 70 88 29 11 10 47 58 Al observar la manera como están distribuidos estos datos. Para datos agrupados.

igual longitud. Esto se logra obteniendo la diferencia entre el mayor y el menor de los datos. Por lo general la cantidad de clases no debe ser menor de cinco (5) ni mayor que veinte (20). una clase es un intervalo de valores comprendido entre dos valores correctamente definidos. No existen formas predeterminadas de determinar la cantidad de clases que deban formarse y su tamaño. según la cual. longitud o amplitud. ic = # de intervalos de clases R . R = 88 . que usualmente se denota por ic. en forma de intervalos de clases. Esto no descarta la posibilidad de que puedan existir intervalos de diferente longitud o amplitud. Esta cantidad no debe ser menor que 5. otra es aplicando la fórmula de Sturges. Se puede calcular de distintas maneras: una puede ser estableciendo un número conveniente que divida de la manera más exacta posible a R. que constituyen los límites de la clase o del intervalo de clase. ni mayor que 20. Se determina el rango (R). Se establece el número de intervalos de clase.32 veces el logaritmo de N. Lo que si existen son acuerdos. el número de intervalos es igual a 1 más 3. es agruparlos convenientemente. permi-tiendo verla más en conjunto. Eso reduce el campo visual de la información. Una técnica de lograr información a partir de los datos originales.que se presentan los datos.3 = 85 2. Desde el punto de vista estadístico. El proceso que usualmente se realiza para la construcción de una tabla de distribución de frecuencias para datos agrupados es el siguiente: 1. Estos intervalos deben tener. por conveniencia. El resultado de dividir R entre el número de clases es lo que se conoce como amplitud del intervalo.

Este valor corresponde a la amplitud aparente. Este procedimiento tiene las siguien-tes ventajas: 1. se redondeará el valor ic por exceso. Se elimina la posibilidad que un valor caiga en la frontera. No se altera el punto medio o representante de clase. 3. 2. Para encontrar la amplitud real. . No se rompe la continuidad. de acuerdo a la unidad que se esté utilizando para la variable.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->