Primera Investigacion

DISTRIBUCIÓN DE FRECUENCIAS
Es una tabla que representa el número de elementos que pertenecen a

cada una de las clases o categorías en las que se haya dividido el
conjunto de datos para su estudio.
Ejemplo: Quieren conocer si un grupo de individuos está a favor o en

contra de la exhibición de imágenes violentas por televisión, para lo cual
han recogido los siguientes datos:
La inspección de los datos originales no permite responder fácilmente a

cuestiones como cuál es la actitud mayoritaria del grupo, y resulta
bastante más difícil determinar la magnitud de la diferencia de actitud
entre hombres y mujeres.
Datos
El término dato refiere a la información que brinda acceso a un

conocimiento preciso y concreto. Estadístico, por su parte, es aquello
vinculado a la estadística: la especialidad de la matemática que apela a
cifras para generar inferencias o para reflejar cuantitativamente un
fenómeno.
Los datos estadísticos, en este marco, son los valores que se obtienen al
llevar a cabo un estudio de tipo estadístico. Se trata del producto de la
observación de aquel fenómeno que se pretende analizar.
Los datos agrupados
Son aquellos datos que pertenecen a un tamaño de muestra mayor a 20 o más

elementos, por lo que para ser analizados requieren ser agrupados en clases a partir
de ciertas características.
Los datos no agrupados
Son aquellos datos cuya que pertenecen a una muestra menor a 20

elementos, por lo que para ser analizados, no requieren ser agrupados.
Clase.
Es el número de subconjuntos en que se han agrupado los datos. Cada

clase se puede denominar mediante una letra, un número o alguna
característica del subconjunto.
Intervalo de clase.
Es un conjunto de elementos que forman a una clase, conteniendo un

límite inferior y un límite superior.
La frecuencia absoluta
Es muy utilizada en estadística descriptiva y es útil para saber acerca de

las características de una población y/o muestra. Esta medida se puede
utilizar con variables cualitativas o cuantitativas siempre que estas se
puedan ordenar.
La frecuencia absoluta se puede usar para variables discretas (las

variables se ordenan de menor a mayor) y para variables continuas (las
variables se ordenan de menor a mayor agrupadas por intervalos). La
frecuencia absoluta se utiliza para calcular la frecuencia relativa.
La suma de las frecuencias absolutas es igual al número total de datos de

la muestra o población.
Ejemplo de frecuencia absoluta (fi) para una variable discreta
Supongamos que las notas de 20 alumnos del primer curso de economía

son las siguientes:
1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10.
A simple vista se puede observar que de los 20 valores, 10 de ellos son

distintos y los demás se repiten al menos una vez. Para elaborar la tabla
de frecuencias absolutas, en primer lugar, se ordenarían los valores de
menor a mayor y se calcularía la frecuencia absoluta para cada uno.
Por tanto tenemos:
Xi = Variable aleatoria estadística, nota del examen del primer curso de

economía.
N = 20
fi = Frecuencia absoluta = Número de veces que se repite el suceso (en

este caso, la nota del examen).
Xi fi
1 1
2 2
3 1
4 1
5 4
6 2
7 2
8 3
9 1
10 3
N 20
Como se puede observar, la suma de todas las frecuencias absolutas es

igual al total de datos utilizados del experimento (en este caso, es el
número total de alumnos que asciende a 20).
La frecuencia acumulada
Es el resultado de sumar sucesivamente las frecuencias absolutas o
relativas, desde el menor al mayor de sus valores.
Para calcular la frecuencia acumulada hay que ordenar los datos de

menor a mayor. Para un cálculo más sencillo y una imagen más visual,
estos se colocan en una tabla. Tras tener los datos ordenados y
tabulados, la frecuencia acumulada se obtiene simplemente de ir
sumando una clase o grupo de la muestra con la anterior (primer grupo +
segundo grupo, primer grupo + segundo grupo + tercer grupo y así
sucesivamente hasta llegar a acumular del primer grupo al último).
Frecuencia absoluta acumulada
La frecuencia absoluta nos da información acerca de la cantidad de veces

que se repite un suceso al realizar un número determinado de
experimentos aleatorios. Para hallar la frecuencia absoluta acumulada, no
tendríamos más que acumular las frecuencias absolutas. Esta se
denomina con las letras Fi.
Frecuencia relativa acumulada
La frecuencia relativa se calcula como el cociente de la frecuencia

absoluta de algún valor de la población/muestra (fi) entre el total de
valores que componen la población/muestra (N). Para hallar la frecuencia
relativa acumulada no tendríamos más que ir acumulando las frecuencias
relativas. Esta se denomina con las letras Hi.
Supongamos que las notas de 20 alumnos de primer curso de economía

son las siguientes: 1,2,8,5,8,3,8,5,6,10,5,7,9,4,10,2,7,6,5,10.
Por tanto tenemos:
Xi = Variable aleatoria estadística, nota del examen de primer curso de

economía.
N = 20
fi = Número de veces que se repite el suceso (en este caso, la nota del
examen).
Hi = Proporción que representa el valor i-ésimo en la muestra.
Xi fi hi HI
1 1 5% 5%
2 2 10% 15%
3 1 5% 20%
4 1 5% 25%
5 4 20% 45%
6 2 10% 55%
7 2 10% 65%
8 3 15% 80%
9 1 5% 85%
10 3 15% 100%
Los gráficos estadísticos
Son las distintas maneras de representar series de datos estadísticos de

diverso tipo y origen para mostrar de manera visual cómo evoluciona una
o más variable en comparación con otras.
Los histogramas
Representan datos cuantitativos continuos en barras verticales u

horizontales. Su uso radica en su potencial para mostrar distribuciones de
datos cuantitativos. No hay que confundir los histogramas con los gráficos
de barras, puesto que estos últimos sirven para comparar categorías de
una variable.
Las principales características de los histogramas son:
 Solamente se representa una sola variable.
 La variable representada debe ser cuantitativa continua.
 A cada intervalo de la variable le pertenece una única barra.
 Cada barra tiene el mismo ancho concreto.
 El alto de la barra para cada intervalo dependerá del valor de su

frecuencia.
 El gráfico puede adoptar un formato vertical u horizontal.
 En un histograma (a la inversa para la versión horizontal):
 El eje X (abcisas) representa a cada intervalo de la variable.
 El eje Y (ordenadas) representa la frecuencia de cada

intervalo de la variable.
Un polígono de frecuencias
Es una herramienta gráfica que se emplea a partir de un histograma de

frecuencia (es decir, otro tipo de gráfico que expresa las frecuencias
mediante columnas verticales). Para ello, se unen con una línea los
distintos puntos medios de las columnas del histograma, sin dejar espacio
entre una y otra, logrando así una forma geométrica o polígona.
Con esta herramienta gráfica pueden representarse variables

cuantitativas o distribuciones diferentes, cosa que tradicionalmente no
hace un histograma, de un modo rápido y sencillo. Además cuenta con la
virtud de ser apreciable a simple vista.
Por esta razón es sumamente empleado dentro de las ciencias sociales y

ciencias económicas, permitiendo así establecer comparaciones útiles
entre los distintos resultados de un mismo proceso.
Características del polígono de frecuencias
Los polígonos de frecuencia se conforman uniendo los puntos medios de

cada fase o columna mediante segmentos de recta, de modo que
consisten en un tipo de representación visual de la información
cuantitativa. Los datos de la tabla se hallan siempre por debajo de la
curvatura del polígono, y su punto más alto es siempre el de mayor
frecuencia del conjunto.
Ojiva
En estadística, una ojiva es un gráfico que muestra la curva de una
función de distribución acumulativa dibujada a mano o en software de
computadora. Los puntos trazados son el límite de la clase superior y la
frecuencia acumulativa correspondiente. La ojiva para la distribución
normal se asemeja a un lado de un arco arabesco u ojival. El término
también se puede usar para referirse a la función empírica de distribución
acumulativa. Este es un tipo de gráfico de frecuencia y también se
denomina polígono de frecuencia acumulada. Sirve para dar el número (o
proporción) de observaciones más pequeño o igual a un valor particular.
El promedio
El promedio es una cantidad que representa a un conjunto de datos. Está

cantidad está comprendida entre el menor y el mayor de los datos.
Entonces el promedio es una medida de tendencia central.

Menor cantidad ≤ promedio ≤ mayor cantidad

Como una aplicación tenemos el promedio de notas de un alumno en la
escuela, que representa a todas las notas obtenidas.
El promedio aritmético
La media aritmética, también llamada promedio o media, es un conjunto

infinito de números, es el valor característico de una serie de datos
cuantitativos, objeto de estudio que parte del principio de la esperanza
matemática o valor esperado, se obtiene a partir de la suma de todos sus
valores dividida entre el número total de sumandos. Cuando el conjunto
es una muestra aleatoria, recibe el nombre de media, siendo uno de los
principales estadístico muéstrales. Ejemplo 8+3+8+9+2=30. 30÷5=6
Aplicación 1
Hallar el promedio aritmético de 12, 14, 18 y 20 Solución: Como el

número de datos es 4 = Sumamos los datos y dividimos entre 4
La media geométrica
Es un tipo de media que se calcula como la raíz del producto de un

conjunto de números estrictamente positivos.
Se calcula como un producto conjunto. Es decir, que todos los valores se

multiplican entre sí. De modo que si uno de ellos fuera cero, el producto
total sería cero. Por ello, debemos siempre tener en cuenta que a la hora
de calcular la media geométrica necesitamos números que sean
únicamente positivos.
La fórmula de la media geométrica es la siguiente:
 N: Se trata del número total de observaciones. Por ejemplo, si

tenemos el crecimiento de los beneficios de una empresa durante 4
periodos, N será 4.
 x: La variable X es sobre la que calculamos la media geométrica.

Siguiendo el ejemplo anterior, el crecimiento de los beneficios
estará expresado en porcentaje y será la variable X.
 i: Representa la posición de cada observación. En este ejemplo,

podríamos ponerle un número cada periodo. Un 1, al periodo 1, un
2 al periodo 2, etc. De manera que x 1 es el crecimiento de los
beneficios en el periodo 1, x 2 el crecimiento de los beneficios en el
periodo 2, x3 el crecimiento de los beneficios en el periodo 3 y x 4 el
crecimiento de los beneficios en el periodo 4.
La media armónica
Es igual al número de elementos de un grupo de cifras entre la suma de

los inversos de cada una de estas cifras.
En otras palabras, la media armónica es una medida estadística recíproca

a la media aritmética, que es la suma de un conjunto de valores entre el
número de observaciones.
La fórmula de la media armónica (H) de un conjunto de números x 1, x2, x3,
…, xn, es la siguiente:
Ejemplo de cómo se calcula:
Supongamos que una persona decide salir a correr 10km. Los primeros 2
km corre a 15 km/h, los siguiente 2km, a 17 km/h, los siguientes 2km, a
14 km/h, y los otros dos tramos de 2km, a 13 km/h y 12 km/h,
respectivamente.
En este ejemplo, la media armónica se calcularía de la siguiente manera:
La moda estadística
Es aquel valor que, dentro de un conjunto de datos, se repite el mayor

número de veces.
La determinación de la moda estadística en un conjunto de datos que no
están agrupados no requiere ningún tipo de cálculo, sino tan solo el
conteo de las variables. Otra forma de determinar la moda en datos no
agrupados consiste en verificar cuál es el valor de mayor frecuencia en
una tabla de frecuencias absolutas.
Las variables que involucran la ecuación anterior son:
 Li: límite inferior del intervalo donde está ubicada la moda.

 fi-1: frecuencia absoluta del intervalo anterior donde está ubicada
la moda.
 fi: frecuencia absoluta del intervalo donde está ubicada la moda.
 fi+1: frecuencia absoluta del intervalo siguiente donde está ubicada
la moda.
 Ai: amplitud del intervalo donde está la moda.
Ejemplo moda unimodal
Número de hijos que poseen los empleados. Luego de realizar la

pregunta a 20 empleados, el conjunto de datos es el siguiente: [ 0, 2, 2, 0,
3, 5, 1, 2, 3, 1, 0, 2, 6, 4, 3, 4, 2, 0, 1, 2].
La moda del conjunto es 2, ya que este valor se repite 6 veces, mientras
que el resto de los valores se repite un número de veces inferior.
Ejemplo moda bimodal
Edad de los empleados. Luego de realizar la pregunta a 20 empleados, el

conjunto de datos es el siguiente: [25, 27, 25, 30, 28, 25, 30, 25, 32, 42,
51, 25, 27,30, 33, 30, 42, 40, 51, 30].
Así, la moda del conjunto es 25 y 30, ya que ambos se repiten 5 veces

mientras que el resto de los valores se repite un número de veces inferior.
Ejemplo moda multimodal
Número de habitaciones que poseen sus viviendas. Luego de realizar la

pregunta a 20 empleados, el conjunto de datos es el siguiente: [2, 3, 2, 2,
4, 1, 3, 3, 2, 3, 6, 5, 4,4, 2, 1, 1, 4, 4, 3].
La moda del conjunto es 2, 3 y 4, ya que estos valores se repiten 5 veces,

mientras que el resto se repite un número de veces inferior.
La mediana
Es un estadístico de posición central que parte la distribución en dos, es

decir, deja la misma cantidad de valores a un lado que a otro.
Para calcular la mediana es importante que los datos estén ordenados de

mayor a menor, o al contrario de menor a mayor. Esto es, que tengan un
orden.
La mediana, junto con la media y la varianza es un estadístico muy
ilustrativo de una distribución. Al contrario que la media que puede estar
desplazada hacia un lado o a otro, según la distribución, la mediana
siempre se sitúa en el centro de esta.
Una vez definida la mediana vamos a pasar a calcularla. Para ello,

necesitaremos una fórmula.
La fórmula no nos dará el valor de la mediana, lo que nos dará es la

posición en la que está dentro del conjunto de datos. Debemos tener en
cuenta, en este sentido, si el número total de datos u observaciones que
tenemos (n) es par o impar. De tal forma que la fórmula de la mediana es:
 Cuando el número de observaciones es par:
Mediana = (n+1) / 2 → Media de las observaciones
 Cuando el número de observaciones es impar:
Mediana = (n+1) / 2 → Valor de la observación
Es decir, que si tenemos 50 datos ordenados preferiblemente de menor a

mayor, la mediana estaría en la observación número 25,5. Esto es el
resultado de aplicar la fórmula para un conjunto de datos par (50 es
número par) y dividir entre 2. El resultado es 25,5 ya que dividimos entre
50+1. La mediana será la media entre la observación 25 y la 26.
Ejemplo de cálculo de la mediana
Imaginemos que tenemos los siguientes datos: 2,4,12,6,8,14,16,10,18.

En primer lugar los ordenamos de menor a mayor con lo que tendríamos
lo siguiente:
2,4,6,8,10,12,14,16,18.
Pues bien, el valor de la mediana, como indica la fórmula, es aquel que

deje la misma cantidad de valores tanto a un lado como a otro. ¿Cuántas
observaciones tenemos? 9 observaciones. Calculamos la posición con la
fórmula de la mediana correspondiente.
Mediana = 9+1 / 2 = 5
¿Qué quiere decir este 5? Nos dice que el valor de la mediana, se

encuentra en la observación cuya posición es la quinta.
Por lo tanto la mediana de esta sería de datos sería el número 10, ya que
está en la posición quinta. Además, podemos comprobar cómo tanto a la
izquierda del 5 hay 4 valores (2, 4, 6 y 8) y a la derecha del 10 hay otros 4
valores (12, 14, 16 y 18).
Como se relacionan el promedio, la mediana y la moda
La media (promedio) de un conjunto de datos se encuentra al sumar

todos los números en el conjunto de datos y luego al dividir entre el
número de valores en el conjunto. La mediana es el valor medio cuando
un conjunto de datos se ordena de menor a mayor. La moda es el número
que se presenta con más frecuencia en un conjunto de datos.
Las medidas de posición
Son indicadores estadísticos que permiten resumir los datos en uno solo,
o dividir su distribución en intervalos del mismo tamaño.
Las medidas de posición, por tanto, sirven para medir y para dividir.
De esta forma, unos resumirán los diferentes valores en uno que, en este
caso, sea representativo. Por ejemplo, un promedio. Mientras los otros
dividirán el conjunto de los datos en partes iguales, más sencillas de
interpretar; estaríamos hablando de los cuantiles.
Son el primer paso que debe darse en el análisis descriptivo. Cuando

queremos conocer información sobre un fenómeno, comenzamos
recopilando datos.
Histograma
Se utiliza cuando se estudia una variable continua, como franjas de

edades o altura de la muestra, y, por comodidad, sus valores se agrupan
en clases, es decir, valores continuos. En los casos en los que los datos
son cualitativos (nonuméricos), como sexto grado de acuerdo o nivel de
estudios, es preferible un diagrama de sectores.
Las ojivas
Son especialmente útiles para estimar los percentiles en una distribución. Por
ejemplo, podemos conocer el punto central para que el 50% de las observaciones
estén por debajo de este punto y el 50% por encima.
Los polígonos de frecuencia
Se suelen usar cuando se pretende retratar varias distribuciones distintas

o la clasificación cruzada de una variable cuantitativa continua con una
cualitativa o cuantitativa discreta en el mismo dibujo.
El punto de más altura de un polígono de frecuencia equivale a la mayor

frecuencia, mientras que el área que se sitúa debajo de la curva incluye
todos los datos que existen. Cabe recordar que la frecuencia es la
repetición mayor o menor de un evento, o el número de veces que un
acontecimiento periódico se reitera en una unidad temporal.
UNIVERSO.
En estadística es el nombre especifico que recibe particularmente la

investigación social la operación dentro de la delimitación del campo de
investigación que tienen por objeto la determinación del conjunto de
unidades de observaciones del conjunto de unidades de observación que
van a ser investigadas. Para muchos investigadores él termino universo y
población son sinónima.
Una población estadística
Es el total de individuos o conjunto de ellos que presentan o podrían

presentar el rasgo característico que se desea estudiar. Quizá, la
definición teórica de población estadística sea un poco abstracta. Por eso,
sin renunciar a la rigurosidad y precisión que requieren las variables
cuantitativas, vamos a intentar abordar el concepto de población
estadística de la forma más sencilla posible.
Una muestra estadística
Es un subconjunto de datos perteneciente a una población de datos.

Estadísticamente hablando, debe estar constituido por un cierto número
de observaciones que representen adecuadamente el total de los datos.
Una unidad
Es la abstracción matemática de una "variable aleatoria". Los ejemplos

comunes de una unidad serían una sola persona, animal, planta, artículo
manufacturado o país que pertenece a una colección más grande de
dichas entidades que están siendo estudiadas.
Una variable estadística
Es una característica de una muestra o población de datos que puede

adoptar diferentes valores. Cuando hablamos de variable estadística
estamos hablando de una cualidad que, generalmente adopta forma
numérica. Por ejemplo, la altura de Juan es de 180 centímetros. La
variable estadística es la altura y está medida en centímetros.
Los gráficos estadísticos
Son potentes herramientas para la visualización de datos que permiten

representar de manera accesible información compleja. Consiguen
presentar la información al usuario o lector de manera clara y precisa,
facilitando la comparación y la comprensión de la evolución de distintas
variables.

Primera Investigacion

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Primera Investigacion

Cargado por

Copyright:

Formatos disponibles

DISTRIBUCIÓN DE FRECUENCIAS

Es una tabla que representa el número de elementos que pertenecen a

Ejemplo: Quieren conocer si un grupo de individuos está a favor o en

La inspección de los datos originales no permite responder fácilmente a

El término dato refiere a la información que brinda acceso a un

Los datos agrupados

Son aquellos datos que pertenecen a un tamaño de muestra mayor a 20 o más

Los datos no agrupados

Son aquellos datos cuya que pertenecen a una muestra menor a 20

Es el número de subconjuntos en que se han agrupado los datos. Cada

Es un conjunto de elementos que forman a una clase, conteniendo un

Es muy utilizada en estadística descriptiva y es útil para saber acerca de

La frecuencia absoluta se puede usar para variables discretas (las

La suma de las frecuencias absolutas es igual al número total de datos de

Ejemplo de frecuencia absoluta (fi) para una variable discreta

Supongamos que las notas de 20 alumnos del primer curso de economía

1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10.

A simple vista se puede observar que de los 20 valores, 10 de ellos son

Por tanto tenemos:

Xi = Variable aleatoria estadística, nota del examen del primer curso de

fi = Frecuencia absoluta = Número de veces que se repite el suceso (en

Como se puede observar, la suma de todas las frecuencias absolutas es

Para calcular la frecuencia acumulada hay que ordenar los datos de

Frecuencia absoluta acumulada

La frecuencia absoluta nos da información acerca de la cantidad de veces

Frecuencia relativa acumulada

La frecuencia relativa se calcula como el cociente de la frecuencia

Supongamos que las notas de 20 alumnos de primer curso de economía

Xi = Variable aleatoria estadística, nota del examen de primer curso de

Hi = Proporción que representa el valor i-ésimo en la muestra.

Son las distintas maneras de representar series de datos estadísticos de

Representan datos cuantitativos continuos en barras verticales u

Las principales características de los histogramas son:

 Solamente se representa una sola variable.

 La variable representada debe ser cuantitativa continua.

 A cada intervalo de la variable le pertenece una única barra.

 Cada barra tiene el mismo ancho concreto.

 El alto de la barra para cada intervalo dependerá del valor de su

 El gráfico puede adoptar un formato vertical u horizontal.

 En un histograma (a la inversa para la versión horizontal):

 El eje X (abcisas) representa a cada intervalo de la variable.

 El eje Y (ordenadas) representa la frecuencia de cada

Es una herramienta gráfica que se emplea a partir de un histograma de

Con esta herramienta gráfica pueden representarse variables

Por esta razón es sumamente empleado dentro de las ciencias sociales y

Características del polígono de frecuencias

Los polígonos de frecuencia se conforman uniendo los puntos medios de

El promedio es una cantidad que representa a un conjunto de datos. Está

Menor cantidad ≤ promedio ≤ mayor cantidad

La media aritmética, también llamada promedio o media, es un conjunto

Hallar el promedio aritmético de 12, 14, 18 y 20 Solución: Como el

Es un tipo de media que se calcula como la raíz del producto de un

Se calcula como un producto conjunto. Es decir, que todos los valores se

La fórmula de la media geométrica es la siguiente:

 N: Se trata del número total de observaciones. Por ejemplo, si

 x: La variable X es sobre la que calculamos la media geométrica.

 i: Representa la posición de cada observación. En este ejemplo,

Es igual al número de elementos de un grupo de cifras entre la suma de

En otras palabras, la media armónica es una medida estadística recíproca

Ejemplo de cómo se calcula:

En este ejemplo, la media armónica se calcularía de la siguiente manera:

Es aquel valor que, dentro de un conjunto de datos, se repite el mayor

Las variables que involucran la ecuación anterior son: