Está en la página 1de 6

1.- Distribuciones de frecuencia.

1.1 Conceptos de estadística y su clasificación.


CONCEPTO
La Estadística es la rama de las matemáticas que se encarga de recolectar,
describir, organizar e interpretar datos con el objeto de tomar decisiones.

CLASIFICACIÓN DE LA ESTADÍSTICA

La estadística para su mejor estudio se ha dividido en dos ramas las cuales son:
estadística descriptiva y estadística inferencial.

 ESTADÍSTICA DESCRIPTIVA: Consiste en la presentación de datos en


forma de tablas y gráficas. Esta comprende cualquier actividad para resumir
o describir los mismos factores pertinentes adicionales, esto se refiere a no
intentar nada que vaya más allá de los datos.
 ESTADISTICA INFERENCIAL: Se deriva de las observaciones hechas solo
a una parte de un conjunto numeroso de elementos; implicando así que su
análisis requiera de generalizaciones que van más allá de los datos, como
consecuencia la característica más importante del crecimiento de la
estadística ha sido un cambio en el énfasis de los métodos que sirven para
generalizarlas. En otras palabras la estadística inferencial investiga y
analiza una población partiendo de una muestra tomada.

1.2 Recopilación de datos.


La recolección o recopilación de datos es el momento en el cual el
investigador se pone en contacto con los sujetos, objetos o elementos
sometidos a estudios con el propósito de obtener los datos o respuestas de las
variables consideradas; a partir de estos datos se prepara la información
estadística y se calcula las medidas de resumen e indicadores para el análisis
estadístico.
Las 5 principales técnicas de recolección de datos son:
1. Entrevistas
La entrevista es una conversación dirigida, con un propósito especifico y que usa
un formato de preguntas y respuestas.
2. La encuesta
Una encuesta es un conjunto de preguntas normalizadas dirigidas a una muestra
representativa de la población o instituciones, con el fin de conocer estados de
opinión o hechos específicos. La intención de la encuesta no es describir los
individuos particulares quienes, por azar, son parte de la muestra sino obtener un
perfil compuesto de la población. Una "encuesta" recoge información de una
"muestra." Una "muestra" es usualmente sólo una porción de la población bajo
estudio.
3. La observación
La observación es otra técnica útil para el analista en su proceso de investigación,
consiste en observar a las personas cuando efectúan su trabajo. La observación
es una técnica de observación de hechos durante la cual el analista participa
activamente actúa como espectador de las actividades llevadas a cabo por una
persona para conocer mejor su sistema. El propósito de la observación es
múltiple, permite al analista determinar que se está haciendo, como se está
haciendo, quien lo hace, cuando se lleva a cabo, cuánto tiempo toma, donde se
hace y porque se hace.
4. Diccionario de datos
Un diccionario de datos es una lista de todos los elementos incluido en el conjunto
de los diagramas de flujo de datos que describen un sistema. Los elementos
principales en un sistema, estudiados en las secciones anteriores, son el flujo de
datos, el almacenamiento de datos y los procesos. El diccionario de datos
almacena detalles y descripciones de estos elementos.
5. Diagrama de flujo
Es una representación pictórica de los pasos en proceso. Útil para determinar
cómo funciona realmente el proceso para producir un resultado. Los diagramas de
flujo se pueden aplicar a cualquier aspecto del proceso desde el flujo de
materiales hasta los pasos para hacer la venta u ofrecer un producto.
1.3 Distribución de frecuencias.
Las distribuciones de frecuencias son tablas en que se dispone las modalidades
de la variable por filas. En las columnas se dispone el número de ocurrencias por
cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es
facilitar la obtención de la información que contienen los datos.
1.3.1 Polígonos de frecuencia, histogramas y ojivas.
Un Polígono de Frecuencia es el nombre
que recibe una clase de gráfico que se crea
a partir de un histograma de frecuencia. Los
histogramas emplean columnas verticales
para reflejar las frecuencias, los polígonos
de frecuencia se forman uniendo los puntos
más altos de cada una de las columnas del
Histograma.
Un
Histograma es la representación gráfica de una
tabla de frecuencias. El histograma puede ser: de
frecuencias absolutas, de frecuencias relativas,
de frecuencias absolutas acumuladas y de
frecuencias relativas acumuladas.
Más profundamente, el histograma de frecuencias
es una representación visual de los datos en
donde se evidencian fundamentalmente tres
características: forma, acumulación o tendencia posicional y dispersión o
variabilidad.
Una Ojiva se utiliza para representar la
frecuencia acumulada. Similar al Polígono de
frecuencia, se forma o se construye uniendo los
puntos más altos de cada columna pero de un
Histograma que represente las Frecuencia s
Acumuladas.
Al estar construido en función de las frecuencias
acumuladas permite ver cuántas observaciones
se encuentran por encima o debajo de ciertos
valores, en lugar de solo exhibir los números
asignados a cada intervalo.
1.4 Medidas de tendencia central para un conjunto de datos y datos
agrupados.

1.4.1 Media, media ponderada.


La media aritmética consiste en multiplicar cada frecuencia por el promedio del
intervalo. Luego se suman todos estos resultados, y por último se divide entre el
total de datos.
Utilizando el ejemplo anterior se obtendría que la media aritmética es igual a:
(4*2 + 4*4 + 6*6 + 4*8) / 18 = (8+16+36+32)/18 = 5,11111
Esto indica que el valor medio de los datos de la tabla es 5,11111.
Media ponderada.
Es una medida de tendencia central, que es apropiada cuando en un conjunto de
datos cada uno de ellos tiene una importancia relativa (o peso) respecto de los
demás datos. Se obtiene multiplicando cada uno de los datos por su ponderación
(peso) para luego sumarlos, obteniendo así una suma ponderada; después se
divide esta entre la suma de los pesos, dando como resultado la media ponderad.

1.4.2 Mediana
Para calcular la mediana de un conjunto de datos primero se ordenan todos los
datos de menor a mayor. Se pueden presentar dos casos:
– Si el número de datos es impar, entonces la mediana es el dato que está justo
en el centro.
– Si el número de datos es par, entonces la mediana es el promedio de los dos
datos que quedan en el centro.
Cuando se trata de datos agrupados, el cálculo de la mediana se hace de la
siguiente forma:
– Se calcula N/2, donde N es el total de datos.
– Se busca el primer intervalo donde la frecuencia acumulada (la suma de las
frecuencias) sea mayor que N/2, y se selecciona el límite inferior de este intervalo,
llamado Li.
La mediana viene dada por la siguiente fórmula:
Me = Li + (Ls-Li)*(N/2 – Frecuencia Acumulada antes de Li) / frecuencia de [Li,Ls)
Ls es el límite superior del intervalo mencionado anteriormente.
Si se utiliza la tabla de datos anterior se tiene que N/2 = 18/2 = 9. Las frecuencias
acumuladas son 4, 8, 14 y 18 (una para cada fila de la tabla).
Por lo tanto, se debe seleccionar el tercer intervalo, dado que la frecuencia
acumulada es mayor que N/2=9.
De modo que Li=5 y Ls=7. Aplicando la fórmula descrita anteriormente se tiene
que:
Me = 5 + (7-5)*(9-8)/6 = 5+2*1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
1.4.3 Moda
La moda es el valor que tiene mayor frecuencia entre todos los datos agrupados;
es decir, es el valor que se repite más veces en el conjunto de datos inicial.
Cuando se tiene una cantidad de datos muy grande, para calcular la moda de los
datos agrupados se utiliza la siguiente fórmula:
Mo = Li + (Ls-Li)*(frecuencia de Li – Frecuencia de L(i-1)) / ((frecuencia de Li –
Frecuencia de L(i-1)) + (frecuencia de Li – Frecuencia de L(i+1)))
El intervalo [Li,Ls) es el intervalo donde se encuentra la frecuencia mayor. Para el
ejemplo hecho en este artículo se tiene que la moda viene dada por:
Mo = 5 + (7-5)*(6-4)/((6-4)+(6-4)) = 5 + 2*2/4 = 5+1 = 6.
Otra fórmula que se utiliza para obtener un valor aproximado a la moda es la
siguiente:
Mo = Li + (Ls-Li)*(frecuencia L(i+1))/(frecuencia L(i-1) + frecuencia L(i+1)).
Con esta fórmula, las cuentas quedan como sigue a continuación:
Mo = 5 + (7-5)*4/(4+4) = 5 + 2*4/8 = 5+1 = 6.
1.4.4 Relación entre media, mediana y moda.
• Si media=moda=mediana, la distribución es simétrica
• Si media > mediana, la distribución es asimétrica con cola a la derecha (sesgada
a la derecha).
• Si media < mediana, la distribución es asimétrica con cola a la izquierda
(sesgada a la izquierda).
1.5 Medidas de dispersión para un conjunto de datos y datos agrupados.
1.5.1 Rango.
Es la medida de variabilidad o dispersión más simple. Se calcula tomando la
diferencia entre el valor máximo y el mínimo observado. Rango = Máximo –
Mínimo.
1.5.2 Desviación media.
1.5.3 Varianza.
1.5.4 Desviación estándar