Está en la página 1de 60

Curso:
Laboratorio de Técnicas de Estudio e Investigación
de una sola variable >
DATOS

Los datos son colecciones de cualquier cantidad de observaciones. Una colección de datos se
conoce como conjunto de datos y una sola observación es un punto de dato.

ORDENAMIENTO DE DATOS :

Es la colocación de los datos numéricos tomados, en orden creciente o decreciente de


magnitud
de una sola variable >

Distribución de frecuencias
La información estadística puede constar de un gran número
de observaciones y mientras mayor sea el número, mayor
puede ser la conveniencia y necesidad de presentarla en
forma resumida, la cual puede permitir algunos detalles pero
en cambio puede revelar la naturaleza general de la
información. Un resumen de tal distribución se denomina
Distribución de Frecuencias. Puede decirse también, que una
distribución es el patrón de variabilidad mostrado por los
datos de una variable. La distribución muestra la frecuencia
de cada valor de la variable
de una sola variable >

DISTRIBUCIONES DE FRECUENCIAS
Las distribuciones o tablas de frecuencias permiten resumir los datos en
una tabla que recoge:

• valores de la variable o modalidades del atributo,


• frecuencia absoluta o número de veces que aparece cada valor o
modalidad en la muestra,
• porcentaje de veces que aparece cada valor de la variable o modalidad
del atributo sobre el total de observaciones,
• porcentaje acumulado hasta cada uno de los valores de la variable
ordenados de menor a mayor. Este porcentaje tiene interpretación sólo en
los casos en que la variable sea susceptible de medida por lo menos en una
escala ordinal.
de una sola variable >
TABLAS DE FRECUENCIAS ( DISTRIBUCION DE FRECUENCIAS )
La tabla de frecuencias es una herramienta que permite ordenar los datos de
manera que se presentan numéricamente las características de la distribución
de un conjunto de datos o muestra
de una sola variable >
Construcción de la tabla de frecuencias
Tabla de frecuencias con datos no agrupados.
Tabla de frecuencias con datos agrupados

Construcción de una tabla de frecuencias


con datos no agrupados
1.En la primera columna se ordenan de menor a mayor los diferentes valores que tiene
la variable en el conjunto de datos.
2.En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas y
las frecuencias absolutas acumuladas.
3.Las columnas cuarta y quinta contienen las frecuencias relativas y las frecuencias
relativas acumuladas.
4.Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima),
representando la frecuencia relativa y la frecuencia relativa acumulada como tanto por
cien. Estos porcentajes se obtienen multiplicando las dos frecuencias por cien.
de una sola variable >
Construcción de una tabla de frecuencias
con datos agrupados
1.Obtener el rango R de los datos. Es la diferencia entre el dato mayor y el menor del
conjunto de valores que toma la variable a tabular. Se llama también amplitud total.
R = Xmáx – Xmín
2.Fijar cuántos intervalos o clases se desea.
3.Determinar la amplitud del intervalo o clase
4.Formar los diferentes intervalos o clases, partiendo del valor mínimo del
nuevo rango R’. Cada intervalo tendrá unos extremos a y b separados por la amplitud
de clase o intervalo I
5.Cada intervalo está representado por la llamada marca de clase.
6.A partir de la columna de las clases, se formarán las columnas de las frecuencias,
de una sola variable >
TIPOS DE FRECUENCIAS
de una sola variable >
TIPOS DE FRECUENCIAS
de una sola variable >
TIPOS DE FRECUENCIAS
de una sola variable >
TIPOS DE GRÁFICAS
Una gráfica es la representación de datos, generalmente numéricos, mediante líneas, superficies o símbolos, para ver
la relación que esos datos guardan entre sí. Sirven para analizar el comportamiento de un proceso, o un conjunto de
elementos o signos que permiten la interpretación de un fenómeno.

GRÁFICAS DE LÍNEAS
Gráfica simple de líneas
Muestran la relación entre dos variables cuantitativas. En el eje horizontal (x) se gráfica la variable independiente en el
eje vertical (y). Las marcas de los cuadrantes en los ejes marcan las unidades de medida; las escalas en los ejes pueden
ser lineales, logarítmicas o ambas.
de una sola variable >
Polígono de frecuencias
Otra forma de representación de uso menos común, y muy parecida a las gráficas de líneas, es el polígono de
frecuencias. La diferencia fundamental entre ambas es que en el polígono de frecuencias se añaden dos clases
con frecuencias cero: una antes de la primera clase con datos y otra después de la última. El resultado es que se
"sujeta" la línea por ambos extremos al eje horizontal y lo que podría ser una línea separada del eje se
convierte, junto con éste, en un polígono.
de una sola variable >
GRÁFICAS DE BARRAS O HISTOGRAMAS
Se emplea cuando la variable independiente es categórica. Cada barra sólida, ya sea vertical u horizontal representa un
tipo de dato. Cuando es necesario representar divisiones de datos se utiliza un gráfica de barras subdivididas.
Los histogramas no muestran frecuencias acumuladas, son preferibles para el tratamiento de datos cuantitativos y la
barra con mayor altura representa la mayor frecuencia. La sumatoria de las alturas de las columnas equivale al 100%
de los datos.
de una sola variable >
GRÁFICAS CIRCULARES
Denominadas también gráfica de pastel, se utilizan para mostrar porcentajes y proporciones. El número de elementos
comparados dentro de un gráfico circular, no deben ser más de 7, ordenando los segmentos de mayor a menor, iniciando
con el más amplio a partir de las 12 como en un reloj. Una manera sencilla de diferenciar los segmentos es
sombreándolos con colores contrastantes.
Este tipo de gráficas es muy útil cuando lo que se desea es resaltar las proporciones que representan algunos
subconjuntos con respecto al total, es decir, cuando se está usando una escala categórica
Descriptiva >
de una sola variable >

Medidas de posición:

Las medidas de posición facilitan información sobre la serie


de datos que se está analizando.
Estas medidas permiten conocer diversas características de
la serie de datos.

Medidas de Dispersion:

Son números que indican si una variable se mueve mucho,


poco, más o menos que otra.
de una sola variable >

Medidas de tendencia central:


Informan sobre los valores medios del conjunto de datos.
Son indicadores usados para señalar que porcentaje de
datos dentro de una distribución de frecuencias superan
estas expresiones, cuyo valor representa el valor del dato
que se encuentra en el centro de la distribución de
frecuencia, es por esto que se les llama "Medidas de
Tendencia Central".
de una sola variable >

Medidas de tendencia central


• Media
• Mediana
• Moda
de una sola variable >

Medidas de tendencia central


• Media: La media o promedio es una medida de posición
que proporciona una descripción compacta de cómo están
centrados los datos y una visualización más clara del nivel
que alcanza la variable, puede servir de base para medir o
evaluar valores extremos y brinda mayor facilidad para
efectuar comparaciones.
• Mediana
• Moda
de una sola variable >

Medidas de tendencia central


• Media:

7, 9, 12, 15
de una sola variable >

Medidas de tendencia central


• Media:

7, 9, 12, 15
7+9+12+15 = 43
de una sola variable >

Medidas de tendencia central


• Media:

7, 9, 12, 15
7+9+12+15 = 43
43/4 =
de una sola variable >

Medidas de tendencia central


• Media:

7, 9, 12, 15
7+9+12+15 = 43
43/4 = 10.75

10.75
de una sola variable >

Medidas de tendencia central


• Media
• Mediana: Es el valor de la observación que ocupa la
posición central de un conjunto de datos ordenados según
su magnitud. Es el valor medio o la media aritmética de los
valores medios.
• Moda
de una sola variable >

Medidas de tendencia central


• Mediana:

7, 9, 12, 15, 20
de una sola variable >

Medidas de tendencia central


• Mediana:

7, 9, 12, 15, 20
de una sola variable >

Medidas de tendencia central


• Mediana:

7, 9, 12, 15, 20, 33


de una sola variable >

Medidas de tendencia central


• Mediana:

7, 9, 12, 15, 20, 33

promedio
de una sola variable >

Medidas de tendencia central


• Media
• Mediana
• Moda: Es el valor de un conjunto de datos que ocurre más
frecuentemente, se considera como el valor más típico de
una serie de datos.
de una sola variable >

• Moda:

7, 9, 12, 15, 15, 20


de una sola variable >

• Moda:

7, 9, 12, 15, 15, 20


de una sola variable >

Distribución de frecuencias
de una sola variable >

Intervalos, marcas de clase y frecuencias


La dificultad de resumir un conjunto de datos, puede ser
superada agrupando los diversos valores en un número
reducido de clases llamados intervalos de clase. Cada una de
las clases tiene un extremo o límite superior y uno inferior; el
extremo inferior es el menor valor que puede caer
en esta clase y el superior el mayor valor.
de una sola variable >

El punto medio entre el límite superior de una clase y el límite


inferior de la siguiente clase es la frontera superior o límite
real superior de la clase y la frontera inferior o límite real
inferior de la siguiente clase.
En una clase dada todos los valores deben ser mayores a la
frontera inferior y menores a la frontera superior. Para evitar
ambigüedades, las fronteras se expresan con una cifra
decimal más que los extremos.
de una sola variable >
6.5 13.5

El punto medio entre el límite superior de una clase y el límite


inferior de la siguiente clase es la frontera superior o límite
real superior de la clase y la frontera inferior o límite real
inferior de la siguiente clase.
En una clase dada todos los valores deben ser mayores a la
frontera inferior y menores a la frontera superior. Para evitar
ambigüedades, las fronteras se expresan con una cifra
decimal más que los extremos.
de una sola variable >
6.5 13.5

La diferencia entre las fronteras superior e inferior de una


clase se denomina amplitud de clase.
El punto medio entre los dos extremos (o las dos fronteras)
de una clase se denomina marca de clase.
El número de datos incluidos en un intervalo de clase se
denomina frecuencia de la clase.
de una sola variable >

Construcción de una distribución de


frecuencias para datos cuantitativos
el número de clases no debe ser ni muy grande ni muy
pequeño; un número pequeño de clases puede ocultar la
naturaleza general de los datos y uno muy grande puede ser
demasiado detallado como para relevar alguna información
útil. Como regla general, se recomienda que el número de
clases esté entre 5 y 20. La llamada regla de Sturges puede
dar una aproximación razonable para el número de clases,
siendo esta:
de una sola variable >
6.5 13.5
de una sola variable >
de una sola variable >
de una sola variable >
de una sola variable >

|…Clases...|

K=7
de una sola variable >
de una sola variable >
de una sola variable >
|…Clases...|

K=7
A=7
de una sola variable >

• Una vez construidos los diversos intervalos de clase, se


cuenta el número de elementos que cae en cada uno,
obteniéndose así las respectivas frecuencias.
de una sola variable >

• Distribución de frecuencia relativa


La distribución de frecuencias es una tabla resumen en la
que los datos originales se condensan o agrupan para
facilitar el análisis de los datos. Sin embargo, para ampliar el
análisis, es deseable formar la distribución de frecuencia
relativa o la distribución de porcentaje, dependiendo de
si se prefieren fracciones o porcentajes.
La frecuencia relativa (fr) es la relación entre la frecuencia de
un intervalo y el número total de datos:
de una sola variable >

La frecuencia porcentual (fr%) es la expresión en porcentaje


de la frecuencia relativa:
de una sola variable >

Xi
Marca de Clase:

(Limite Inferior de cada clase + Limite superior de cada clase)


2
de una sola variable >

f * Xi
Frecuencia Absoluta * Marca de Clase
de una sola variable >

Media Aritmética:

Para calcular la media aritmética o promedio, trabajamos con


la tabla encontrando la Marca de clase o Punto Medio y se
calcula a través de la ecuación:
de una sola variable >

acumulada
de una sola variable >

Lmo: es el limite inferior de la clase modal


Da: es la diferencia entre la frecuencia absoluta de la clase modal y la clase anterior
Db: es la diferencia entre la frecuencia absoluta de la clase modal y la clase siguiente
a: Amplitud (intervalo de clase)
de una sola variable >

Medias de Position
de una sola variable >
de una sola variable >
de una sola variable >
de una sola variable >

La varianza es una medida de dispersión que representa la variabilidad de


una serie de datos respecto a su media
de una sola variable >
Gracias

También podría gustarte