Está en la página 1de 70

Introducción a la

Estadística
Docente: Lic. Elvis Moises Jaime Tito
Asignatura: Estadística descriptiva
Gestión: 2022

Tarija - Bolivia
Introducción
Introducción
• Con frecuencia aparece en los periódicos y revistas el siguiente tipo de información:
• La asociación de agentes inmobiliarios informó que la mediana del precio de venta de una casa
en Estados Unidos es de $215 000 (The Wall Street Journal, 16 de enero de 2006).
• Durante el Super Bowl de 2006 el costo promedio de un spot publicitario de 30 segundos en
televisión fue de $2.5 millones (USA Today, 27 de enero de 2007).
• En una encuesta de Jupiter Media se encontró que 31% de los hombres adultos ven más de 10
horas de televisión a la semana. Entre las mujeres sólo 26% (The Wall Street Journal, 26 de
enero de 2004).
• General Motors, uno de los líderes automotrices en descuentos en efectivo da, en promedio,
$4300 de incentivo en efectivo por vehículo (USA Today, 27 de enero de 2006).
• El promedio industrial Dow Jones cerró en 11 577 (Barron’s, 6 de mayo de 2006).

A los datos numéricos de las frases anteriores se les llama estadísticas. En este sentido el término
estadística se refiere a datos numéricos, tales como promedios, medianas, porcentajes y números
índices que ayudan a entender una gran variedad de negocios y situaciones económicas. Sin
embargo, como se verá, el campo de la estadística es mucho más que datos numéricos.
Definición de estadística
La estadística se define como el arte y la ciencia de reunir datos, analizarlos,
presentarlos e interpretarlos.

La estadística se ocupa de los métodos científicos que se utilizan para


recolectar, organizar, resumir, presentar y analizar datos, así como para obtener
conclusiones válidas y tomar decisiones razonables con base en este análisis.

La Estadística es una ciencia que proporciona un conjunto de métodos que se


utilizan para recolectar, resumir, clasificar, analizar e interpretar el
comportamiento de los "datos" con respecto a una característica materia de
estudio o investigación. En primera instancia se encarga de obtener información,
describirla y luego usa esta información a fin de predecir "algo" respecto a la fuente
de información.
Clasificación de la estadística
El campo de la Estadística generalmente está dividido en dos grandes
áreas:
Estadística Descriptiva y Estadística Inferencial.

La estadística descriptiva incluye las técnicas que se relacionan con el


resumen y la descripción de datos numéricos. Estos métodos pueden ser
gráficos o pueden incluir análisis mediante cálculos.

Estadística descriptiva es el conjunto de métodos que implican la


recolección, presentación y caracterización de un conjunto de datos a fin
de describir en forma apropiada las diversas características de estas. Es
decir, un estudio estadístico se considera "descriptivo" cuando sólo
se analiza y describe los datos.
Clasificación de la estadística: E. Descriptiva
EJEMPLO
Un gerente de personal desca conocer las aptitudes de cinco secretarias que trabajan en
una dependencia particular de una compañía. Se aplica una prueba de aptitudes a las
cinco secretarias y las calificaciones son 85, 90, 93, 82 y 95 puntos.
Supongamos que la medida estadística que emplea el gerente de personal es la aptitud
promedio o media aritmética, la cual es la suma de los valores observados dividida entre
el número de observaciones. Entonces, la calificación promedio es:
(85 + 90 + 93 + 82 + 95)/5=89
el gerente está usando estadística para describir aptitudes de las secretarias de esa
oficina. Este método es de naturaleza descriptiva, debido a que el promedio condensa y
describe la información obtenida. Los gráficos, tablas y mapas que muestra datos de tal
forma que sean más fáciles de entender son todos ejemplos del uso de Estadística
Descriptiva.
Clasificación de la estadística
El campo de la Estadística generalmente está dividido en dos grandes áreas:
Estadística Descriptiva y Estadística Inferencial.

La Estadística inferencial o Inferencia Estadística es el conjunto de métodos o técnicas


que posibilitan la generalización o toma de las decisiones en base a una información
parcial obtenida mediante técnicas descriptivas. Es decir, un estudio estadístico, se
considera inferencial cuando se pretende inferir o predecir conclusiones que atañen a
toda la fuente de información de donde proviene los datos.

La inferencia estadística comprende aquellas técnicas por medio de las cuales se


toman decisiones sobre una población estadística basadas en una muestra o
en juicios de los administradores. Debido a que esas decisiones se toman en
condiciones de incertidumbre, se requiere el uso de conceptos de probabilidad.
Considerando que las características medidas en una muestra se denominan
estadísticas muéstrales, las características medidas en una población estadística, o
universo, se llaman parámetros poblacionales.
Clasificación de la estadística: E. Inferencial
Ejemplo:
Suponga ahora en el ejemplo anterior, que el
gerente de personal desea conocer la aptitud
promedio de todas las secretarias de la
compañía, pero carece de tiempo o de los
recursos para aplicar una prueba de aptitud a
todas ellas. Entonces decide usar la aptitud
promedio de las cinco secretarias para estimar
la aptitud promedio de todas las secretarias
de la compañía. El proceso de estimar esta
aptitud promedio global será un problema de
Inferencia Estadística.
Población y
muestra
POBLACIÓN
La palabra "población" tiene
varios significados. En el
uso común, se refiere a
todas las personas de una
región, localidad o país.
(La población de Lima es
6 millones; la población
de China es 900 millones,
etc).
Población
● El concepto de "población",
estadísticamente hablando, es un
concepto más amplio de lo que se tiene
al referirse a los habitantes de un
Departamento o un País; población
desde el punto de vista estadístico se
define como sigue.
Población (N) es la colección de todos los
individuos, objetos u observaciones que
poseen al menos una característica
común. Los términos población y
universo, suelen usarse indistintamente.
Población
● Cuando se recolectan datos sobre las
características de un grupo de individuos
o de objetos, por ejemplo, estatura y peso
de los estudiantes de una universidad o
cantidad de pernos defectuosos y no
defectuosos producidos en determinado
día en una fábrica, suele ser imposible o
poco práctico observar todo el grupo, en
especial si se trata de un grupo grande.
En vez de examinar todo el grupo, al que se
le conoce como población o universo, se
examina sólo una pequeña parte del grupo,
al que se le llama muestra.
Población
● Ejemplos:
a. Las edades de los estudiantes de Bolivia.
b. Las edades de los alumnos del sistema
universitario boliviano.
c. Los diámetros de la producción diaria de
tuercas.
d. Los pesos de los melones de una cosecha
de la cooperativa los "meloneros".
e. Las placas de los automóviles que circulan
en un país.
POBLACIÓN
POBLACIÓN POBLACIÓN
FINITA INFINITA

Una población
Una población finita infinita es aquella
es aquella que tiene que no tiene límite o
un número limitado cotas, es decir, tiene
de elementos. un número infinito
de elementos.
POBLACIÓN
POBLACIÓN FINITA
• Cantidad de estudiantes de un colegio.
• Cantidad de miembros de una familia.
• Nómina de una empresa.
• Habitantes de una parroquia.
• Número de computadoras en un cyber-café.
• Número de mediciones de altura de un conjunto de
estudiantes.
• Población de animales en una zona.
• Cantidad de productos elaborados en una hora.
• Cantidad de autos en una fábrica.
• Cantidad de votantes en una elección.
POBLACIÓN
POBLACIÓN INFINITA
• Cantidad de peces en el mar.
• Cantidad de estrellas.
• Cantidad de litros de agua en un mar.
• Cantidad de granos de arena en la playa.
• Cantidad de hormigas de un hormiguero.
• Cantidad de espermatozoides en esperma.
• Conjunto de números racionales (los números son infinitos)
• Cantidad de granos en un kilo de sal.
• Cantidad de células en nuestro cuerpo.
• Cantidad de páginas webs creadas en la historia.
MUESTRA
Obviamente es imposible calcular el verdadero valor de cualquier parámetro de una
población infinita. En la mayor parte de los casos tampoco resulta práctico (o económico)
calcular el verdadero valor de cualquier parámetro de una población finita. Por tanto,
resulta necesario realizar inferencias acerca de los parámetros de la población, a partir
de la información contenida en una parte de la población.
Muestra es una parte o un subconjunto representativo de la población.
Y al proceso de obtener la muestra se llama muestreo.
Desde luego, el número de observaciones en una muestra es menor que el número de
observaciones posibles en la población, de otra forma, la muestra sería la población misma.
La selección y el estudio de una muestra, tiene por objeto la extracción de conclusiones que
sean válidas para la población del cual se obtuvo dicha muestra. En otras palabras, nuestro
propósito es conocer la población, para lo cual se extrae una muestra de ésta.
MUESTRA
Por ejemplo, si se desea estimar el gasto promedio anual
de los estudiantes universitarios de Bolivia, se extraería
una muestra formada por cierto número de estudiantes,
en seguida se determinará el gasto anual
correspondiente a cada uno de ellos y después s
obtendría el promedio de estos gastos.
Se utiliza una muestra debido a que simplemente no
se tiene el tiempo y los recursos para establecer
contacto con todos los estudiantes universitarios del
país, aun cuando es posible hacerlo.
En base al promedio de la muestra (promedio muestral)
obtenido de esta forma, se realiza una inferencia acerca
del gasto promedio de todos los estudiantes
universitarios de Bolivia.
POBLACIÓN Y MUESTRA

POBLACIÓN MUESTRA

La población es el
conjunto de todos
La muestra es un
los elementos de
subconjunto de la
interés en un
población.
estudio
determinado.
MUESTRA
TIPOS DE MUESTRA O MUESTREO
Existen básicamente dos clases de muestras: muestra no probabilística y muestra
probabilística.
• MUESTRA NO PROBABILÍSTICAS
Llamada también muestras de conveniencia o de juicio, se basan en el conocimiento y la
opinión personal para identificar los elementos de la población que van a incluirse en la
muestra. Una muestra seleccionada a juicio se basa en el conocimiento de la población por
parte de una persona que generalmente es un experto en la materia.

• MUESTRAS PROBABILÍSTICAS
Son aquellas en que todos los elementos de la población tienen una posibilidad (una
probabilidad conocida) de ser incluida en la muestra. Naturalmente no es necesario que
todos tengan la misma posibilidad, basta que tengan alguna posibilidad.
MUESTRA
MÉTODOS PARA OBTENER MUESTRAS
PROBABILÍSTICAS
Ya sabemos que las muestras probabilísticas son
aquellas en que todos los elementos de la
población tienen una probabilidad conocida de
ser seleccionados. A continuación veremos
algunos de los procedimientos más usuales para
la selección de muestras probabilísticas. Existen
al menos cuatro métodos comúnmente utilizados:
Muestreo aleatorio simple, Muestreo
sistemático, Muestreo estratificado y Muestreo
por conglomerados.
MÉTODOS PARA OBTENER M. PROBABILÍSTICAS
MUESTREO ALEATORIO SIMPLE
Este método o esquema de muestreo, se caracteriza porque todos los elementos de
la población tiene la misma probabilidad de ser incluidos en la muestra, o en otros
términos, porque todas las posibles muestras de un tamaño fijo son igualmente
probables.
Una muestra aleatoria simple es aquélla en la que los elementos se escogen en forma
individual y al azar de la totalidad de la población. Esta selección al azar es similar a la que
se realiza en la extracción aleatoria de números en una lotería.
Sin embargo, en el muestreo estadístico, por lo general se utiliza un programa
computarizado de tabla de números aleatorios o un generador de números aleatorios para
identificar los elementos numerados de la población que se eligen para la muestra.
MÉTODOS PARA OBTENER M. PROBABILÍSTICAS
MUESTREO SISTEMÁTICO
Una muestra sistemática es una muestra aleatoria en la cual se eligen lo elementos de la
población a intervalos uniformes, a partir de un listado ordenado, tal como elegir cada
décima cuenta por cobrar para la muestra. La primera de las cuentas de la muestra se
elegirla al azar (quizá utilizando una tabla de números aleatorios).
Un problema específico del muestreo sistemático es la existencia de cualquier factor
periódico o cíclico en la lista dé la población que pudiera conducir a un error sistemático en
los resultados muestrales.
MÉTODOS PARA OBTENER M. PROBABILÍSTICAS
MUESTREO ESTRATIFICADO
Esta se usa cuando la población no es homogénea, sino que pueden en ella identificarse
clases definidas por algún atributo o característica relacionada con la variable que se
estudia. Este procedimiento implica dividir la población en clases o grupos homogéneos
relativos a las características que van a estudiarse, llamados estratos. Después se toma
una submuestra de cada estrato de una de las formas posibles: O bien seleccionamos al
azar en cada estrato un número especificado de elementos a la proporción del estrato de
la población total o bien extraemos un número igual de elementos de cada estrato y
damos un peso a los resultados de acuerdo con la proporción del estrato en la población
total. En uno y otra forma, el muestreo estratificado garantiza que todos los elementos
de la población tengan una posibilidad de ser seleccionados.
MÉTODOS PARA OBTENER M. PROBABILÍSTICAS
MUESTREO POR CONGLOMERADOS
Se usa en poblaciones grandes y muy dispersos desde el punto de vista geográfico,
y en las cuales el muestreo aleatorio simple sería poco económico debido a que daría
lugar a muestras igualmente dispersas.
En este tipo de muestreo, en lugar de seleccionar directamente los elementos de
la población se hace una selección inicial de grupos o conglomerados, que son agrupaciones
de elementos que deben ser lo más heterogéneo posible a diferencia de los estratos, de
suerte que cada una de ellas resulte una réplica reducida de la población, la muestra general
está formado por todas o por una submuestra de las unidades en cada conglomerado.
Fuentes de
información
Fuentes de información
Es el lugar, la
institución, la
persona donde están
los datos que se
necesitan para cada
una de las variables
o aspectos de la
investigación.
Fuentes de información
Las fuentes de datos pueden ser:
• FUENTE DE DATOS INTERNOS: Es la información recopilada por la empresa (o la
institución) de los resultados de su propia gestión. Son pues las observaciones que
constantemente realizan los departamentos, administrativos, contables, comerciales,
técnicos, etc. Estas pueden ser, por ejemplo:
a. Reportes financieros.
b. Reportes de operaciones, que están dadas por la información de la producción,
ventas, compras, estados de pérdidas y ganancias.
c. Reportes especiales, es información adicional para análisis específico.
• FUENTE DE DATOS EXTERNOS: Son informaciones estadísticas elaboradas por
instituciones de investigación, ya sean públicos o privados, o dependencias
especializadas, generalmente requeridos a nivel nacional o sectorial.
Fuentes de información
Las fuentes de datos pueden ser:
• FUENTES PRIMARIAS
Cuando la información estadística es obtenida directamente de la unidad de observación.
Por ejemplo, los resultados de los censos de población y vivienda, índices de precios al
consumidor, etc.
• FUENTES SECUNDARIAS
Cuando se obtiene información estadística elaborada a base de los datos de fuentes
primarias.
El organismo oficial fundamental de datos estadísticos es el Instituto Nacional de Estadística
(INE). Se encarga de formular y desarrollar el sistema Estadístico Nacional, levanta los
censos nacionales de población y vivienda cada 10 años y los censos económicos cada diez
años, etc.
Fuentes de información
MÉTODOS DE RECOLECCIÓN
Cuando es utilizada una fuente primaria para
recolectar información se distinguen dos
procedimientos fundamentales a saber: la
observación y el interrogatorio.

MÉTODOS DE INTERROGATORIOS
El interrogatorio puede hacerse mediante dos
métodos:
Método directo (se efectúa por medio de entrevistas)
Método indirecto (se efectúa por medio de
cuestionarios o encuestas).
Fuentes de información
ENCUESTA: Es el procedimiento de obtención
de información estructurada según criterios
previos de sistematización, que se efectúa con
un propósito específico (y que tiene alcance
restringido) en un sector de la población.

CENSO DE POBLACIÓN: Se llama al proceso


de recolectar, completar y publicar datos
demográficos, económicos y sociales
pertenecientes a un tiempo específico y
datos de todas las personas en un país o un
territorio determinado.
Datos:
Variables
DATOS
Datos: son hechos/informaciones y cifras que se recogen, analizan y resumen
para su presentación e interpretación. A todos los datos reunidos para un
determinado estudio se les llama conjunto de datos para el estudio.
TIPOS DE DATOS
Sea cual fuere la fuente de la que obtenemos la información, esta puede estar
referida a características cualitativas o cuantitativas. Las primeras se refieren a
cualidades tales como, color: blanco, azul, etc.; estado civil: casado, soltero, etc.
profesión: economista, ingeniero, etc.; calidad de un producto: bueno, regular,
etc. Los segundos se refieren a cantidades tales como: estatura en cm., salario
en dólares, número de hijos de una familia, número de dormitorios por vivienda,
etc.
VARIABLES

VARIABLE: Es una característica de la población que se va investigar y que


puede tomar diferentes valores.
Así, por ejemplo, una variable sería, las horas extras trabajadas por los
trabajadores de una empresa y los valores de esta variable vendrían dadas por
las diferentes horas trabajadas por cada trabajador fuera de la jornada normal:
ninguna, una, dos, tres,...

Las variables se clasifican en: CUALITATIVAS Y CUANTITATIVAS.


VARIABLES: V. CUALITATIVA

VARIABLE CUALITATIVA: Se llama así, cuando la variable está asociada a una


característica cualitativa. Es decir, son variables cuyos valores son cualidades que presenta
la población.
Las variables cualitativas se clasifican en: Nominales y ordinales.

VARIABLE CUALITATIVA NOMINAL: Son aquellas que establecen la distinción de los


elementos en las categorías sin implicar orden entre ellas.

VARIABLE CUALITATIVA ORDINAL: Son aquellas que agrupan a los objetos,


individuos, en categorías ordenadas, para establecer relaciones comparativas. Es decir,
son susceptibles de ordenación, pero no de medición cuantitativas.
VARIABLES: V. CUALITATIVA - EJEMPLOS
VARIABLE CUALITATIVA NOMINAL:
- Clasificar un grupo de individuos por sexo: masculino, femenino; por
su estado civil: soltero, casado, viudo, etc.
VARIABLE CUALITATIVA ORDINAL
- Clasificar a un grupo de personas por su hábito de fumar. Se procede así:
• No fumadores
• Fumadores leves
• Fumadores moderados
• Fumadores severos
- Clasificar un grupo de individuos por su grado de instrucción. Se procede como
• sigue:
• Analfabeto
• Primaria
• Secundaria
• Superior
VARIABLES: V. CUANTITATIVA
VARIABLE CUANTITATIVA: Se llama así, cuando la variable está asociada a una
característica cuantitativa. Es decir, estas surgen cuando se puede establecer cuánto o
en qué cantidad se posee una determinada característica.

Las variables cuantitativas se dividen en discretas y continuas.

VARIABLE DISCRETA: Son aquellas que surgen por el procedimiento de conteo.


Es decir, las variables estadísticas discretas suelen tomar valores enteros.

VARIABLE CONTINUA: Son aquellas que surgen cuando se mide alguna característica. Es
decir, las variables continuas, pueden tomar al menos teóricamente cualquier valor dentro
de un intervalo.
VARIABLES: V. CUANTITATIVA – EJEMPLOS
VARIABLE CUANTITATIVA: Son variables cuantitativas: ingreso por familia, número de
accidentes de tránsito, longitud, tiempo, etc.

VARIABLE DISCRETA:
Por ejemplo, el número de hijos por familia; el número de estudiantes por colegio;
el número de automóviles que pasan por una avenida en una hora; el número de
habitantes por distrito; etc., son variables discretas.

VARIABLE CONTINUA:
Por ejemplo, el peso, la estatura, la tensión arterial de las personas, los ingresos,
el tiempo de servicio, etc., son variables estadísticas continuas
Variables cuantitativas:
Discretas y continuas

Asumamos el ejemplo de la edad


de las personas.
¿Es una variable cuantitativa
discreta o continua?
Descripción de la
información muestral
Distribución de frecuencias,
representaciones gráficas y cruce de
variables
Distribución de frecuencias
Frente a un conjunto de datos, el primer paso a dar, debe
ser expresarlo y clasificarlo de acuerdo a criterios
convenientes, en alguna forma simple que permita ver
rápidamente todas las características posibles para
obtener conclusiones útiles, ya sea directamente o por
medio de cálculos posteriores.
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
Si los datos que se dispone son numerosos, es
indispensable clasificarlos en un cuadro o tabla resumen
de las observaciones originales, a las que en adelante
llamaremos: Tabla de distribución de frecuencias o
simplemente Tabla de frecuencias.
Distribución de frecuencias
DATOS EN BRUTO
Los datos en bruto son los datos recolectados que aún no se han organizado. Por ejemplo,
las estaturas de 100 estudiantes tomados de la lista alfabética de una universidad.
ORDENACIONES
Ordenación se le llama a los datos numéricos en bruto dispuestos en orden creciente o
decreciente de magnitud. A la diferencia entre el número mayor y el número menor se le
conoce como el rango de los datos. Por ejemplo, si la estatura mayor en los 100 estudiantes
es 74 pulgadas (in) y la menor es 60 in, el rango es 74 − 60 = 14 pulgadas (in).
DISTRIBUCIONES DE FRECUENCIA
Al organizar una gran cantidad de datos en bruto, suele resultar útil distribuirlos en clases o
categorías y determinar la cantidad de datos que pertenece a cada clase; esta cantidad se
conoce como la frecuencia de clase. A la disposición tabular de los datos en clases con sus
respectivas frecuencias de clase se le conoce como distribución de frecuencias
o tabla de frecuencias.
Tablas de frecuencias
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
• FRECUENCIA ABSOLUTA:
Es la cantidad de veces que aparece el valor en el estudio. La sumatoria de las
frecuencias absolutas es igual al número de datos.
Se llama frecuencia absoluta del valor y al número de veces que aparece este
valor en el conjunto de observaciones.
• FRECUENCIA ABSOLUTA ACUMULADA
Es el acumulado o suma de las frecuencias absolutas, indica cuantos datos se
van contando hasta ese momento o cuántos datos se van reportando.
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
- Se realiza una encuesta a un conjunto de 16 familias sobre el número de hijos.
Los resultados en el orden obtenido son:
2 1 3 1 2 1 3 0
2 1 2 3 4 1 1 2
- Construya una tabla de distribución de frecuencia absoluta y absoluta
acumuladas para estos datos.

Número de hijos Frecuencia Absoluta Frecuencia Absoluta


(fi) Acumulada (Fi)
0
1
2
3
4
TOTAL
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
- Se realiza una encuesta a un conjunto de 16 familias sobre el número de hijos.
Los resultados en el orden obtenido son:
2 1 3 1 2 1 3 0
2 1 2 3 4 1 1 2
- Construya una tabla de distribución de frecuencia absoluta y absoluta
acumuladas para estos datos.

Número de hijos Frecuencia Absoluta Frecuencia Absoluta


(fi) Acumulada (Fi)
0 1 1
1 6 7
2 5 12
3 3 15
4 1 16
TOTAL 16 -
Tablas de frecuencias
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
• FRECUENCIA RELATIVA:
Es la fracción o proporción de elementos que pertenecen a una clase o categoría.
Se calcula dividiendo la frecuencia absoluta entre el número de datos del
estudio.
• FRECUENCIA RELATIVA ACUMULADA
Es la proporción de datos respecto al total que se han reportado hasta ese
momento. Es la suma de las frecuencias relativas, y se puede calcular también
dividiendo la frecuencia acumulada entre el número de datos del estudio.
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
- Del anterior ejemplo, Construya una tabla de distribución de frecuencias
relativa y relativa acumulada para esos datos.

Frecuencia Frecuencia
Número de Frecuencia Absoluta Frecuencia relativa
hijos Absoluta (fi) Acumulada relativa (hi) acumulada
(Fi) (Hi)
0 1 1
1 6 7
2 5 12
3 3 15
4 1 16
TOTAL 16 -
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
- Del anterior ejemplo, Construya una tabla de distribución de frecuencias
relativa y relativa acumulada para esos datos.

Frecuencia Frecuencia
Número de Frecuencia Absoluta Frecuencia relativa
hijos Absoluta (fi) Acumulada relativa (hi) acumulada
(Fi) (Hi)
0 1 1 0,06 0,06
1 6 7 0,38 0,44
2 5 12 0,31 0,75
3 3 15 0,19 0,94
4 1 16 0,06 1,00
TOTAL 16 - 1 -
Tablas de frecuencias
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
• FRECUENCIA PORCENTUAL:
Es el porcentaje de elementos que pertenecen a una clase o categoría. Se puede
calcular rápidamente multiplicando la frecuencia relativa por 100%.
• FRECUENCIA PORCENTUAL ACUMULADA
Es el porcentaje de datos respecto al total que se han reportado hasta ese
momento. Se puede calcular rápidamente multiplicando la frecuencia relativa
acumulada por 100%.
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
- Del anterior ejemplo, Construya una tabla de distribución de frecuencias
porcentual y porcentual acumulada para esos datos.

Frecuencia Frecuencia Frecuencia


Frecuencia Frecuencia
Número Frecuencia Absoluta relativa Porcentual
relativa Porcentual
de hijos Absoluta (fi) Acumulada acumulada acumulada
(hi) (pi)
(Fi) (Hi) (Pi)
0 1 1 0,06 0,06
1 6 7 0,38 0,44
2 5 12 0,31 0,75
3 3 15 0,19 0,94
4 1 16 0,06 1,00
TOTAL 16 - 1 -
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
- Del anterior ejemplo, Construya una tabla de distribución de frecuencias
porcentual y porcentual acumulada para esos datos.

Frecuencia
Frecuencia Frecuencia Frecuencia Frecuencia
Número Frecuencia Absoluta
relativa relativa Porcentual Porcentual
de hijos Absoluta (fi) Acumulada
(hi) (Hi) (pi) (Pi)
(Fi)
0 1 1 0,06 0,06 6,25% 6,25%
1 6 7 0,38 0,44 37,50% 43,75%
2 5 12 0,31 0,75 31,25% 75,00%
3 3 15 0,19 0,94 18,75% 93,75%
4 1 16 0,06 1,00 6,25% 100,00%
TOTAL 16 - 1 - 100,00% -
PROPIEDADES DE LAS T. DE FRECUENCIAS

A continuación se exponen algunas de las propiedades de las tablas de frecuencias.

PROPIEDAD 1: Las frecuencias absolutas y las frecuencias acumuladas son siempre


enteros no negativos.
PROPIEDAD 2: La suma de todas las frecuencias absolutas es igual al número total
del conjunto de observaciones.
PRODIEDAD 3: Las frecuencias relativas y las frecuencias relativas acumuladas son
siempre números fraccionarios no negativos, no mayores que uno.
TABLA DE FRECUENCIA DE DATOS AGRUPADOS
Los datos organizados en una distribución de frecuencias se denominan datos
agrupados.
Se llama clases a cada uno de los grupos en que se divide el conjunto.
El primer paso a dar para resolver este problema de clasificación, es decidir
cuáles y cuantas han de ser las clases a considerarse. Para ello normalmente
se empieza por determinar la observación que tiene el valor máximo, y la
observación que tiene el valor mínimo.
Estos valores extremos definen el recorrido o RANGO del conjunto de
observaciones.
Posteriormente, se divide el recorrido del conjunto de datos en tantos
intervalos como clase se desee, que en adelante llamaremos intervalos de
clase (o simplemente clase).
TABLA DE FRECUENCIA DE DATOS AGRUPADOS
Intervalos de Clase: Son los intervalos en los que se agrupan y ordenan los
valores observados. Cada uno de estos intervalos está delimitado (acotado) por
dos valores extremos que les llamamos límites. Limiste Inferior y Limite Superior
de clase.

Un intervalo de clase, que al menos teóricamente no tiene límite inferior o


superior se llama intervalo de clase abierto. Ejemplo: Estudiantes menores a 18
años. Estudiantes mayores a 65 años.

Amplitud de clase: Es la longitud del intervalo que define la clase.

La marca de clase: Es el punto medio del intervalo que representa a dicha clase.
REGLA GENERAL PARA ELABORAR LAS
DISTRIBUCIONES DE FRECUENCIA
1. Decidir el número “m” de clases a considerar, de acuerdo con la regla de Sturges.

2. Determinar el recorrido o RANGO de los datos del recorrido.

3. Determinar, la amplitud o longitud de los intervalos de clase. En lo posible es


conveniente que los intervalos de clase sean de igual amplitud, la cual está dado
por Amplitud=Rango/Numero de clases.

4.Determinar los límites de clase, de manera que cada observación se clasifique sin
ambigüedades en una sola clase.

5. Se determina las marcas de clases.

6. Finalmente se hallan las frecuencias


TABLA DE FRECUENCIA DE DATOS “AGRUPADOS”
- Se consulto a 50 personas sobre cuál era su edad y se obtuvo los siguientes resultados:

38 15 10 12 62 46 25 56 27 24
23 21 20 25 38 27 48 35 50 65
59 58 47 42 37 35 32 40 28 14
12 24 66 73 72 70 68 65 54 48
34 33 21 19 61 59 47 46 30 30
1. Número de clases o intervalos a considerar por medio de la regla de Sturges:
m=1+3,322*Log(50)=7
2. Rango = Valor Max. – Valor Min.
Rango = 73 – 10 = 63
3. Amplitud = Rango/Numero de clases.
Amplitud=63/7=9
TABLA DE FRECUENCIA DE DATOS “AGRUPADOS”
4. Determinación de los límites de clase o construcción de intervalo.
5. Determinación de las marcas de clase.
38 15 10 12 62 46 25 56 27 24
23 21 20 25 38 27 48 35 50 65
59 58 47 42 37 35 32 40 28 14
12 24 66 73 72 70 68 65 54 48
34 33 21 19 61 59 47 46 30 30

Límite Inferior Límite Superior Marca de clase


TABLA DE FRECUENCIA DE DATOS “AGRUPADOS”
4. Determinación de los límites de clase o construcción de intervalo.
5. Determinación de las marcas de clase.
38 15 10 12 62 46 25 56 27 24
23 21 20 25 38 27 48 35 50 65
59 58 47 42 37 35 32 40 28 14
12 24 66 73 72 70 68 65 54 48
34 33 21 19 61 59 47 46 30 30

Límite Inferior Límite Superior Marca de clase

[10 19) 14,5


[19 28) 23,5
[28 37) 32,5
[37 46) 41,5
[46 55) 50,5
[55 64) 59,5
[64 73] 68,5
TABLA DE FRECUENCIA DE DATOS “AGRUPADOS”
6. Cálculo de frecuencias.
38 15 10 12 62 46 25 56 27 24
23 21 20 25 38 27 48 35 50 65
59 58 47 42 37 35 32 40 28 14
12 24 66 73 72 70 68 65 54 48
34 33 21 19 61 59 47 46 30 30

Frecuencia Frecuencia
Frecuencia Frecuencia
Intervalo Marca de Frecuencia Frecuencia relativa Porcentual
Absoluta Porcentual
de Clase clase Absoluta (fi) relativa (hi) acumulada acumulada
Acumulada (Fi) (pi)
(Hi) (Pi)
10 - 19 14,5
19 - 28 23,5
28 - 37 32,5
37 - 46 41,5
46 - 55 50,5
55 - 64 59,5
64 - 73 68,5
TOTAL
TABLA DE FRECUENCIA DE DATOS “AGRUPADOS”
6. Cálculo de frecuencias.
38 15 10 12 62 46 25 56 27 24
23 21 20 25 38 27 48 35 50 65
59 58 47 42 37 35 32 40 28 14
12 24 66 73 72 70 68 65 54 48
34 33 21 19 61 59 47 46 30 30

Frecuencia Frecuencia
Frecuencia Frecuencia
Intervalo Marca de Frecuencia Frecuencia relativa Porcentual
Absoluta Porcentual
de Clase clase Absoluta (fi) relativa (hi) acumulada acumulada
Acumulada (Fi) (pi)
(Hi) (Pi)
10 - 19 14,5 5 5 0,10 0,10 10% 10%
19 - 28 23,5 11 16 0,22 0,32 22% 32%
28 - 37 32,5 8 24 0,16 0,48 16% 48%
37 - 46 41,5 5 29 0,10 0,58 10% 58%
46 - 55 50,5 8 37 0,16 0,74 16% 74%
55 - 64 59,5 6 43 0,12 0,86 12% 86%
64 - 73 68,5 7 50 0,14 1,00 14% 100%
TOTAL 50 - 1,00 - 100% -
Representaciones
gráficas
Representaciones gráficas
La aplicación de gráficos para la representación del fenómeno estadístico, se
le atribuye a WILLIAM PLAYFAIR, a fines del siglo XVIII.

Un gráfico es la representación de un fenómeno estadístico por medio de


figuras geométricas, (puntos, líneas, rectángulos, paralelepípedos, etc.) cuyas
dimensiones son proporcionales a la magnitud de los datos representados. Su
objeto principal es la representación de los datos de forma gráfica, que
permita de un solo golpe de vista darse cuenta del conjunto de elementos
presentados y de evidenciar sus variaciones y características.

El gráfico es un auxiliar del cuadro estadístico, no lo sustituye, sino que lo


complementa.
Principales tipos de gráficos
1. Diagrama de barras: sencillas, dobles, múltiples, proporcionales.
2. Pictogramas.
3. Gráficas de sectores o pastel.
4. Diagramas de frecuencias.
5. Histograma de frecuencias.
6. Polígono de frecuencias absolutas y relativas.
7. Polígono de frecuencias acumuladas u ojivas.
8. Gráficos de línea o aritmético simple.
9. Gráficos de pirámides.
10. Cartogramas, etc.
Principales tipos de gráficos
GRÁFICO DE BARRAS

Es aquel en la cual el fenómeno


que se estudia queda
representado por una serie de
rectángulos, barras o
paralelepípedos, los cuales
pueden dibujarse horizontal o
verticalmente. Este gráfico se
utiliza para representar variables
de tipo cualitativo o cuantitativo.
Principales tipos de gráficos
PICTOGRAMA O PICTÓGRAFOS

Un pictograma es la
representación de las series
estadísticas por medio de
símbolos que por su forma
sugieren la naturaleza de los
datos. Consiste en tomar como,
unidad un símbolo arbitrario para
el que debemos fijar previamente
el valor que le asignamos como
tal unidad.
Principales tipos de gráficos
GRÁFICOS DE SECTORES O PASTEL

Este sistema de representación es de


la misma naturaleza que el gráfico de
barras.
Se utiliza para representar datos
cualitativos o cuantitativos.
Su uso más frecuente es con fines
comparativos; cuando se quiere
mostrar las diversas componentes de
una serie de valores de la variable
comparada con el total.
Principales tipos de gráficos
DIAGRAMA DE FRECUENCIAS

Se usa para representar los diferentes tipos de distribuciones de


frecuencias de datos.
Edad de 50 personas encuestadas Edad de 50 personas encuestadas
12
68,5

10
59,5

8
50,5

41,5 6

32,5
4

23,5
2

14,5
0
0 2 4 6 8 10 12 14,5 23,5 32,5 41,5 50,5 59,5 68,5
Principales tipos de gráficos
HISTOGRAMA DE FRECUENCIAS

Se usa para representar gráficamente las distribuciones de frecuencias absolutas o relativas


de datos cuantitativos continuos agrupados en clases. El fenómeno estudiado queda
representado por una serie de rectángulos semejantes a los del diagrama de barras; sin
embargo, las barras del histograma se colocan sólo verticalmente y deben ir uno al lado
de las otras sin que haya un espacio que las separe. La base de cada rectángulo es la
amplitud de la clase de la variable correspondiente.

POLÍGONOS DE FRECUENCIAS

Los polígonos de frecuencias absolutas o relativas, se obtienen uniendo los puntos medios de
las bases superiores de los rectángulos en el histograma de frecuencias
absolutas o relativas, respectivamente.
Principales tipos de gráficos
HISTOGRAMA DE FRECUENCIAS & POLÍGONOS DE FRECUENCIAS

Edad de 50 personas encuestadas


12

10

0
14,5 23,5 32,5 41,5 50,5 59,5 68,5
GRACIAS

También podría gustarte