Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística
Docente: Lic. Elvis Moises Jaime Tito
Asignatura: Estadística descriptiva
Gestión: 2022
Tarija - Bolivia
Introducción
Introducción
• Con frecuencia aparece en los periódicos y revistas el siguiente tipo de información:
• La asociación de agentes inmobiliarios informó que la mediana del precio de venta de una casa
en Estados Unidos es de $215 000 (The Wall Street Journal, 16 de enero de 2006).
• Durante el Super Bowl de 2006 el costo promedio de un spot publicitario de 30 segundos en
televisión fue de $2.5 millones (USA Today, 27 de enero de 2007).
• En una encuesta de Jupiter Media se encontró que 31% de los hombres adultos ven más de 10
horas de televisión a la semana. Entre las mujeres sólo 26% (The Wall Street Journal, 26 de
enero de 2004).
• General Motors, uno de los líderes automotrices en descuentos en efectivo da, en promedio,
$4300 de incentivo en efectivo por vehículo (USA Today, 27 de enero de 2006).
• El promedio industrial Dow Jones cerró en 11 577 (Barron’s, 6 de mayo de 2006).
A los datos numéricos de las frases anteriores se les llama estadísticas. En este sentido el término
estadística se refiere a datos numéricos, tales como promedios, medianas, porcentajes y números
índices que ayudan a entender una gran variedad de negocios y situaciones económicas. Sin
embargo, como se verá, el campo de la estadística es mucho más que datos numéricos.
Definición de estadística
La estadística se define como el arte y la ciencia de reunir datos, analizarlos,
presentarlos e interpretarlos.
Una población
Una población finita infinita es aquella
es aquella que tiene que no tiene límite o
un número limitado cotas, es decir, tiene
de elementos. un número infinito
de elementos.
POBLACIÓN
POBLACIÓN FINITA
• Cantidad de estudiantes de un colegio.
• Cantidad de miembros de una familia.
• Nómina de una empresa.
• Habitantes de una parroquia.
• Número de computadoras en un cyber-café.
• Número de mediciones de altura de un conjunto de
estudiantes.
• Población de animales en una zona.
• Cantidad de productos elaborados en una hora.
• Cantidad de autos en una fábrica.
• Cantidad de votantes en una elección.
POBLACIÓN
POBLACIÓN INFINITA
• Cantidad de peces en el mar.
• Cantidad de estrellas.
• Cantidad de litros de agua en un mar.
• Cantidad de granos de arena en la playa.
• Cantidad de hormigas de un hormiguero.
• Cantidad de espermatozoides en esperma.
• Conjunto de números racionales (los números son infinitos)
• Cantidad de granos en un kilo de sal.
• Cantidad de células en nuestro cuerpo.
• Cantidad de páginas webs creadas en la historia.
MUESTRA
Obviamente es imposible calcular el verdadero valor de cualquier parámetro de una
población infinita. En la mayor parte de los casos tampoco resulta práctico (o económico)
calcular el verdadero valor de cualquier parámetro de una población finita. Por tanto,
resulta necesario realizar inferencias acerca de los parámetros de la población, a partir
de la información contenida en una parte de la población.
Muestra es una parte o un subconjunto representativo de la población.
Y al proceso de obtener la muestra se llama muestreo.
Desde luego, el número de observaciones en una muestra es menor que el número de
observaciones posibles en la población, de otra forma, la muestra sería la población misma.
La selección y el estudio de una muestra, tiene por objeto la extracción de conclusiones que
sean válidas para la población del cual se obtuvo dicha muestra. En otras palabras, nuestro
propósito es conocer la población, para lo cual se extrae una muestra de ésta.
MUESTRA
Por ejemplo, si se desea estimar el gasto promedio anual
de los estudiantes universitarios de Bolivia, se extraería
una muestra formada por cierto número de estudiantes,
en seguida se determinará el gasto anual
correspondiente a cada uno de ellos y después s
obtendría el promedio de estos gastos.
Se utiliza una muestra debido a que simplemente no
se tiene el tiempo y los recursos para establecer
contacto con todos los estudiantes universitarios del
país, aun cuando es posible hacerlo.
En base al promedio de la muestra (promedio muestral)
obtenido de esta forma, se realiza una inferencia acerca
del gasto promedio de todos los estudiantes
universitarios de Bolivia.
POBLACIÓN Y MUESTRA
POBLACIÓN MUESTRA
La población es el
conjunto de todos
La muestra es un
los elementos de
subconjunto de la
interés en un
población.
estudio
determinado.
MUESTRA
TIPOS DE MUESTRA O MUESTREO
Existen básicamente dos clases de muestras: muestra no probabilística y muestra
probabilística.
• MUESTRA NO PROBABILÍSTICAS
Llamada también muestras de conveniencia o de juicio, se basan en el conocimiento y la
opinión personal para identificar los elementos de la población que van a incluirse en la
muestra. Una muestra seleccionada a juicio se basa en el conocimiento de la población por
parte de una persona que generalmente es un experto en la materia.
• MUESTRAS PROBABILÍSTICAS
Son aquellas en que todos los elementos de la población tienen una posibilidad (una
probabilidad conocida) de ser incluida en la muestra. Naturalmente no es necesario que
todos tengan la misma posibilidad, basta que tengan alguna posibilidad.
MUESTRA
MÉTODOS PARA OBTENER MUESTRAS
PROBABILÍSTICAS
Ya sabemos que las muestras probabilísticas son
aquellas en que todos los elementos de la
población tienen una probabilidad conocida de
ser seleccionados. A continuación veremos
algunos de los procedimientos más usuales para
la selección de muestras probabilísticas. Existen
al menos cuatro métodos comúnmente utilizados:
Muestreo aleatorio simple, Muestreo
sistemático, Muestreo estratificado y Muestreo
por conglomerados.
MÉTODOS PARA OBTENER M. PROBABILÍSTICAS
MUESTREO ALEATORIO SIMPLE
Este método o esquema de muestreo, se caracteriza porque todos los elementos de
la población tiene la misma probabilidad de ser incluidos en la muestra, o en otros
términos, porque todas las posibles muestras de un tamaño fijo son igualmente
probables.
Una muestra aleatoria simple es aquélla en la que los elementos se escogen en forma
individual y al azar de la totalidad de la población. Esta selección al azar es similar a la que
se realiza en la extracción aleatoria de números en una lotería.
Sin embargo, en el muestreo estadístico, por lo general se utiliza un programa
computarizado de tabla de números aleatorios o un generador de números aleatorios para
identificar los elementos numerados de la población que se eligen para la muestra.
MÉTODOS PARA OBTENER M. PROBABILÍSTICAS
MUESTREO SISTEMÁTICO
Una muestra sistemática es una muestra aleatoria en la cual se eligen lo elementos de la
población a intervalos uniformes, a partir de un listado ordenado, tal como elegir cada
décima cuenta por cobrar para la muestra. La primera de las cuentas de la muestra se
elegirla al azar (quizá utilizando una tabla de números aleatorios).
Un problema específico del muestreo sistemático es la existencia de cualquier factor
periódico o cíclico en la lista dé la población que pudiera conducir a un error sistemático en
los resultados muestrales.
MÉTODOS PARA OBTENER M. PROBABILÍSTICAS
MUESTREO ESTRATIFICADO
Esta se usa cuando la población no es homogénea, sino que pueden en ella identificarse
clases definidas por algún atributo o característica relacionada con la variable que se
estudia. Este procedimiento implica dividir la población en clases o grupos homogéneos
relativos a las características que van a estudiarse, llamados estratos. Después se toma
una submuestra de cada estrato de una de las formas posibles: O bien seleccionamos al
azar en cada estrato un número especificado de elementos a la proporción del estrato de
la población total o bien extraemos un número igual de elementos de cada estrato y
damos un peso a los resultados de acuerdo con la proporción del estrato en la población
total. En uno y otra forma, el muestreo estratificado garantiza que todos los elementos
de la población tengan una posibilidad de ser seleccionados.
MÉTODOS PARA OBTENER M. PROBABILÍSTICAS
MUESTREO POR CONGLOMERADOS
Se usa en poblaciones grandes y muy dispersos desde el punto de vista geográfico,
y en las cuales el muestreo aleatorio simple sería poco económico debido a que daría
lugar a muestras igualmente dispersas.
En este tipo de muestreo, en lugar de seleccionar directamente los elementos de
la población se hace una selección inicial de grupos o conglomerados, que son agrupaciones
de elementos que deben ser lo más heterogéneo posible a diferencia de los estratos, de
suerte que cada una de ellas resulte una réplica reducida de la población, la muestra general
está formado por todas o por una submuestra de las unidades en cada conglomerado.
Fuentes de
información
Fuentes de información
Es el lugar, la
institución, la
persona donde están
los datos que se
necesitan para cada
una de las variables
o aspectos de la
investigación.
Fuentes de información
Las fuentes de datos pueden ser:
• FUENTE DE DATOS INTERNOS: Es la información recopilada por la empresa (o la
institución) de los resultados de su propia gestión. Son pues las observaciones que
constantemente realizan los departamentos, administrativos, contables, comerciales,
técnicos, etc. Estas pueden ser, por ejemplo:
a. Reportes financieros.
b. Reportes de operaciones, que están dadas por la información de la producción,
ventas, compras, estados de pérdidas y ganancias.
c. Reportes especiales, es información adicional para análisis específico.
• FUENTE DE DATOS EXTERNOS: Son informaciones estadísticas elaboradas por
instituciones de investigación, ya sean públicos o privados, o dependencias
especializadas, generalmente requeridos a nivel nacional o sectorial.
Fuentes de información
Las fuentes de datos pueden ser:
• FUENTES PRIMARIAS
Cuando la información estadística es obtenida directamente de la unidad de observación.
Por ejemplo, los resultados de los censos de población y vivienda, índices de precios al
consumidor, etc.
• FUENTES SECUNDARIAS
Cuando se obtiene información estadística elaborada a base de los datos de fuentes
primarias.
El organismo oficial fundamental de datos estadísticos es el Instituto Nacional de Estadística
(INE). Se encarga de formular y desarrollar el sistema Estadístico Nacional, levanta los
censos nacionales de población y vivienda cada 10 años y los censos económicos cada diez
años, etc.
Fuentes de información
MÉTODOS DE RECOLECCIÓN
Cuando es utilizada una fuente primaria para
recolectar información se distinguen dos
procedimientos fundamentales a saber: la
observación y el interrogatorio.
MÉTODOS DE INTERROGATORIOS
El interrogatorio puede hacerse mediante dos
métodos:
Método directo (se efectúa por medio de entrevistas)
Método indirecto (se efectúa por medio de
cuestionarios o encuestas).
Fuentes de información
ENCUESTA: Es el procedimiento de obtención
de información estructurada según criterios
previos de sistematización, que se efectúa con
un propósito específico (y que tiene alcance
restringido) en un sector de la población.
VARIABLE CONTINUA: Son aquellas que surgen cuando se mide alguna característica. Es
decir, las variables continuas, pueden tomar al menos teóricamente cualquier valor dentro
de un intervalo.
VARIABLES: V. CUANTITATIVA – EJEMPLOS
VARIABLE CUANTITATIVA: Son variables cuantitativas: ingreso por familia, número de
accidentes de tránsito, longitud, tiempo, etc.
VARIABLE DISCRETA:
Por ejemplo, el número de hijos por familia; el número de estudiantes por colegio;
el número de automóviles que pasan por una avenida en una hora; el número de
habitantes por distrito; etc., son variables discretas.
VARIABLE CONTINUA:
Por ejemplo, el peso, la estatura, la tensión arterial de las personas, los ingresos,
el tiempo de servicio, etc., son variables estadísticas continuas
Variables cuantitativas:
Discretas y continuas
Frecuencia Frecuencia
Número de Frecuencia Absoluta Frecuencia relativa
hijos Absoluta (fi) Acumulada relativa (hi) acumulada
(Fi) (Hi)
0 1 1
1 6 7
2 5 12
3 3 15
4 1 16
TOTAL 16 -
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
- Del anterior ejemplo, Construya una tabla de distribución de frecuencias
relativa y relativa acumulada para esos datos.
Frecuencia Frecuencia
Número de Frecuencia Absoluta Frecuencia relativa
hijos Absoluta (fi) Acumulada relativa (hi) acumulada
(Fi) (Hi)
0 1 1 0,06 0,06
1 6 7 0,38 0,44
2 5 12 0,31 0,75
3 3 15 0,19 0,94
4 1 16 0,06 1,00
TOTAL 16 - 1 -
Tablas de frecuencias
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
• FRECUENCIA PORCENTUAL:
Es el porcentaje de elementos que pertenecen a una clase o categoría. Se puede
calcular rápidamente multiplicando la frecuencia relativa por 100%.
• FRECUENCIA PORCENTUAL ACUMULADA
Es el porcentaje de datos respecto al total que se han reportado hasta ese
momento. Se puede calcular rápidamente multiplicando la frecuencia relativa
acumulada por 100%.
TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS
- Del anterior ejemplo, Construya una tabla de distribución de frecuencias
porcentual y porcentual acumulada para esos datos.
Frecuencia
Frecuencia Frecuencia Frecuencia Frecuencia
Número Frecuencia Absoluta
relativa relativa Porcentual Porcentual
de hijos Absoluta (fi) Acumulada
(hi) (Hi) (pi) (Pi)
(Fi)
0 1 1 0,06 0,06 6,25% 6,25%
1 6 7 0,38 0,44 37,50% 43,75%
2 5 12 0,31 0,75 31,25% 75,00%
3 3 15 0,19 0,94 18,75% 93,75%
4 1 16 0,06 1,00 6,25% 100,00%
TOTAL 16 - 1 - 100,00% -
PROPIEDADES DE LAS T. DE FRECUENCIAS
La marca de clase: Es el punto medio del intervalo que representa a dicha clase.
REGLA GENERAL PARA ELABORAR LAS
DISTRIBUCIONES DE FRECUENCIA
1. Decidir el número “m” de clases a considerar, de acuerdo con la regla de Sturges.
4.Determinar los límites de clase, de manera que cada observación se clasifique sin
ambigüedades en una sola clase.
38 15 10 12 62 46 25 56 27 24
23 21 20 25 38 27 48 35 50 65
59 58 47 42 37 35 32 40 28 14
12 24 66 73 72 70 68 65 54 48
34 33 21 19 61 59 47 46 30 30
1. Número de clases o intervalos a considerar por medio de la regla de Sturges:
m=1+3,322*Log(50)=7
2. Rango = Valor Max. – Valor Min.
Rango = 73 – 10 = 63
3. Amplitud = Rango/Numero de clases.
Amplitud=63/7=9
TABLA DE FRECUENCIA DE DATOS “AGRUPADOS”
4. Determinación de los límites de clase o construcción de intervalo.
5. Determinación de las marcas de clase.
38 15 10 12 62 46 25 56 27 24
23 21 20 25 38 27 48 35 50 65
59 58 47 42 37 35 32 40 28 14
12 24 66 73 72 70 68 65 54 48
34 33 21 19 61 59 47 46 30 30
Frecuencia Frecuencia
Frecuencia Frecuencia
Intervalo Marca de Frecuencia Frecuencia relativa Porcentual
Absoluta Porcentual
de Clase clase Absoluta (fi) relativa (hi) acumulada acumulada
Acumulada (Fi) (pi)
(Hi) (Pi)
10 - 19 14,5
19 - 28 23,5
28 - 37 32,5
37 - 46 41,5
46 - 55 50,5
55 - 64 59,5
64 - 73 68,5
TOTAL
TABLA DE FRECUENCIA DE DATOS “AGRUPADOS”
6. Cálculo de frecuencias.
38 15 10 12 62 46 25 56 27 24
23 21 20 25 38 27 48 35 50 65
59 58 47 42 37 35 32 40 28 14
12 24 66 73 72 70 68 65 54 48
34 33 21 19 61 59 47 46 30 30
Frecuencia Frecuencia
Frecuencia Frecuencia
Intervalo Marca de Frecuencia Frecuencia relativa Porcentual
Absoluta Porcentual
de Clase clase Absoluta (fi) relativa (hi) acumulada acumulada
Acumulada (Fi) (pi)
(Hi) (Pi)
10 - 19 14,5 5 5 0,10 0,10 10% 10%
19 - 28 23,5 11 16 0,22 0,32 22% 32%
28 - 37 32,5 8 24 0,16 0,48 16% 48%
37 - 46 41,5 5 29 0,10 0,58 10% 58%
46 - 55 50,5 8 37 0,16 0,74 16% 74%
55 - 64 59,5 6 43 0,12 0,86 12% 86%
64 - 73 68,5 7 50 0,14 1,00 14% 100%
TOTAL 50 - 1,00 - 100% -
Representaciones
gráficas
Representaciones gráficas
La aplicación de gráficos para la representación del fenómeno estadístico, se
le atribuye a WILLIAM PLAYFAIR, a fines del siglo XVIII.
Un pictograma es la
representación de las series
estadísticas por medio de
símbolos que por su forma
sugieren la naturaleza de los
datos. Consiste en tomar como,
unidad un símbolo arbitrario para
el que debemos fijar previamente
el valor que le asignamos como
tal unidad.
Principales tipos de gráficos
GRÁFICOS DE SECTORES O PASTEL
10
59,5
8
50,5
41,5 6
32,5
4
23,5
2
14,5
0
0 2 4 6 8 10 12 14,5 23,5 32,5 41,5 50,5 59,5 68,5
Principales tipos de gráficos
HISTOGRAMA DE FRECUENCIAS
POLÍGONOS DE FRECUENCIAS
Los polígonos de frecuencias absolutas o relativas, se obtienen uniendo los puntos medios de
las bases superiores de los rectángulos en el histograma de frecuencias
absolutas o relativas, respectivamente.
Principales tipos de gráficos
HISTOGRAMA DE FRECUENCIAS & POLÍGONOS DE FRECUENCIAS
10
0
14,5 23,5 32,5 41,5 50,5 59,5 68,5
GRACIAS