1 Estadistica PDF

También podría gustarte

Está en la página 1de 41

Estadística Aplicada

Conceptos Estadísticos
Fundamentales

Estadística Aplicada
 CONTENIDOS:

• Tratamiento y análi si s de datos


• Di stribuciones de probabilidades
• Obtención de inform ación y métodos de muestreo
• Di stribución de variables aleatorias
• Cartas o diagramas de control
• Capacidad de procesos
• Muestreo para aceptación

1
Estadística Aplicada
 PLAN DE EVALUACION:

• Tarea previ a a parci al 1: 15%

• Parcial 1: 25%
• Tarea previ a a parci al 2: 15%

• Parcial 2: 20%
• Trabajo de campo: 15%
• Asi stencia: 10%

Antecedentes
 Para distinguir entre conocimiento e
información, podría decirse:

• Elconocimiento implica la formulación


de conclusiones con cierto grado de
certidumbre, derivada de información
obtenida a partir de un número limitado
de individuos, objetos o experiencias
pasadas, mediante la aplicación de
técnicas estadísticas.

• La información de partida, en este caso,


se conoce como datos estadísticos y se
asemejan a la materia prima de un
proceso de manufactura.

2
Antecedentes
 En muchos casos es necesario trabajar con experiencias o
procesos que generan un número muy grande de datos o
resultados numéricos, es decir, espacios muestrales con un
número infinito o muy grande de elementos.

 Por lo que se usa la Estadística como herramienta.

Antecedentes
 Los orígenes de la estadística, aunque no se sabe con exactitud cuándo
se comenzó a utilizar, pueden estar ligados al antiguo Egipto como a los
censos chinos que se realizaron hace unos 4000 años,
aproximadamente.

 Sin duda, fueron los romanos, maestros de la organización política,


quienes mejor supieron ocupar la estadística.

• Cada cinco años realizaban un censo de la población, cuyos datos de:


• Nacimientos,
• Defunciones y
• Matrimonios
• Eran esenciales para estudiar los avances del imperio; sin olvidar los
recuentos de ganancias y las riquezas que dejaban las tierras.

3
Antecedentes
 En 1662, John Graunt, un mercader Inglés, publicó un libro sobre los
nacimient os y defunciones ocurridos en Londres; donde concluía acerca
de algunos factores relacionados con estos eventos. Esta obra es
considerada como el punto de partida de la e stadí stica moderna.

 La palabra e stadística comenzó a usarse en el siglo XVIII, en Alemania,


relacionándos e al estudios de los grandes números, que constituían
datos, de importancia para el estado. Sin embargo, la estadística
moderna se desarrolló en el siglo XX a partir de los estudios de Karl
Pearson.

 Hoy la estadística tiene gran importancia, no sólo por que presenta


información, sino que además permite inferir y predecir lo que va a
ocurrir, y por lo tanto, es una herramienta fundamental a la hora de
tomar decisiones.

Conceptos Fundamentales
 La estadística es la ciencia de la inducción lógica, ayuda a generar
conclusiones de carácter general a partir de un reducido número de
observaciones.

 La inducción permite formular generalizaciones acerca de la naturaleza


o característica de una determinada clase de objetos, a partir de
observaciones realizadas sobre una cantidad limitada de tales objet os.

 Al contrario que la deducción la cual conduce a establecer, sobre la


base de premisas generales de las propiedades de cualquier objeto, si
todos los objetos considerados poseen tales características.

 Se dice que la deducción es un razonamiento a priori, mientras de la


inducción es un razonamiento en base a la evidencia empírica.

4
Conceptos Fundamentales
 Por ejemplo:

• La estadística aporta herramientas que permiten utilizar una cantidad lim itada
o incompleta de información, para formular conclusiones acerca de causas y
efectos de algún fenómeno estudiado.

• Esto ayuda a comprobar teorías o determinar las relaciones existentes entre


datos iniciales y resultados finales.

• En las ciencias sociales, las técnicas estadísticas se usan para predecir el


resultado de unas elecciones o la probabilidad de éxito o fracaso de un cierto
negocio.

• En el campo médico, los métodos estadísticos se aplican en pruebas


experimentales realizadas a los nuevos fármacos, para evaluar su efectividad
en el tratamiento de algún tipo de enfermedad o en busca de relación causal
directa o indirecta entre el consumo de cigarrillos y el cáncer pulmonar.

Estadística Descriptiva

Todo estudio estadístico debe considerar


diferentes tipos de variables:
Variables

Variables cualitativas
Variables Cuantitativas

5
Estadística Descriptiva

Variables cualitativas:
Relacionadas con características
no numéricas de un individuo
por ejemplo: atributos de una
persona, nacionalidad, color de
la piel, sexo, religión.

Estadística Descriptiva

Variables Cuantitativas: Relacionadas con


características numéricas del individuo por
ejemplo: edad, precio de un producto,
ingresos anuales.
Las variables cuantitativas pueden ser:
Discretas (aquellas que pueden tomar solo
algunos valores en un intervalo y no valores
intermedio, ejemplo: edad, número de
hermanos que puede ser 1, 2, 3....,etc, pero,
por ejemplo, nunca podrá ser 3,45)
Continuas (aquellas que pueden tomar
cualquier valor en un intervalo real, ejemplo:
alturas, la velocidad de un vehículo puede ser
80,3 km/h, 94,57 km/h...etc.).

6
Estadística Descriptiva
•Dicotóm icas
•Policotóm inas
Cualitativas
•Generales Por su
•Intermedias naturaleza
Cuantitativas
•Discretas
•Continuas

Por su nivel
de
Variables Con relación
abstracción
al fin de la
investigación

•Independientes
•Dependientes
•Intervinientes
Individuales •Extrañas
Por su
Colectivas am plitud •Ambientales
•Conexas
•Actuación y presencia del investigador
•Actuación de los sujetos investigados

Estadística Descriptiva

 En la estadística, la información de partida son los datos


estadísticos, análogo a la materia prima de un proceso de
manufactura.

 Los datos se obtienen de alguna fuente, se aplican las


operaciones estadísticas apropiadas y se obtiene como
resultado un producto terminado bajo la forma de
estimaciones o conclusiones.

 Estas conclusiones sirven de base para tomar


decisiones, permitiendo elegir uno entre varios cursos de
acción, con el propósito de alcanzar con la mayor
efectividad posible un objetivo predeterminado.

7
Estadística Descriptiva
 Los datos pueden provenir de fuentes internas o externas.
• En una empresa las fuente s internas están conformados por
registros de ventas, producción, nómina, personal y los asientos
contables.
• Las fuente s externas están fuera de la organización que los usa, se
obtienen a través de publicaciones, pueden ser de dos tipos:
• Fuentes primarias, son datos publicados por quienes los
recolectaron y/o produjeron originariamente (censos de
población, estadísticas de ingresos, reportes anuales de
actividad industrial, etc.)
• Fuentes secundarias, como los diarios, revistas, libros y otros
medios de comunicación, que publican información elaborada
por las fuentes primarias.
 Es preferible obtener la información de fuentes primarias, por las
imprecisiones que pueden enc ontrarse en dat os provenientes de
fuentes secundarias (errores de trascripción, datos incompletos,
ausencia de not as aclaratorias, etc.).

Estadística Descriptiva

 Manejo de los datos:


• Aproximación de números
• En la mayor parte de los casos resulta más conveniente usar
datos aproximados en lugar de valores exactos.
• Redondeo de cifras
• Una regla arbitraria, pero prácticamente de uso universal,
establece lo siguiente: si el último dígito que se desea conservar
es par, entonces se redondea por defecto o se descartan los
demás dígitos a la derecha. Si el último dígito a conservar es
impar, se redondeará por exceso al dígito par más cercano.
• Dígitos significativos
• Consiste en la cantidad de dígitos del número original que haya
sido conservada.
•Ej. 3.420,0 las cifras significativas son cinco. Para números
menores que 1, se cuentan los dígitos que aparezcan a la
derecha del último cero decimal; así 0,000190 tiene tres dígitos
significativos, lo mismo que 0,0320 o 0,00255.

8
Estadística Descriptiva

 A un conjunto muy grande de datos numéricos para


analizar se denomina Universo o Población de
observaciones.

Generadores
Eléctricos Diesel

Muestra

Universo de Generadores Eléctricos en Venezuela

Estadística Descriptiva

30 29
26
29 30 31
31
33 32
29 27 29 30
27 26 28 30
25 27
32
31
28 32
30 31
29 30 30
31 28
34
33 31

Población o Universo

9
Estadística Descriptiva
 Cada dato numérico es un elemento de la población o
universo.
 Una Muestra es un subconjunto pequeño de observaciones
extraídas de un universo o población.

Pobl ación o Uni verso


Se toma un dato
26 30 29 de la Población
29 30 31
31
33 32
29 27 29 30
27 26 30
28 30
25 27
32
31
28 29 32
30 31
30 34 28
31
33 31 30

Estadística Descriptiva

30 29
26
29 30 31
31
33 32 28
29 27 29 30
27 26 29
28 30 31
25 27
32 30
31 34
28 32
30 31
29 30 30
31 28
34 Muestra de
33 31
5 datos
Población o Universo

10
Estadística Descriptiva

 La Estadística trabaja con poblaciones de datos y con


muestras extraídas de las mismas.

 Los conceptos de población y muestra a veces resultan


ambiguos en su aplicación práctica.

Estadística Descriptiva
 En una ciudad de 5.000 habitantes se
realiza un censo médico en el cual se mide
el peso, la altura y relevándose otros datos
de todos los habitantes de la ciudad.

 Podría referirse al universo o población


censada teniendo en mente el conjunto de
los habitantes de la ciudad.

 Pero cuando se habla en términos


estadísticos, se refiere a poblaciones o
universos de datos.

11
Estadística Descriptiva
 Por ejemplo,
• El conjunto de t odas las mediciones de altura (de los habitantesde la
ciudad) es un conjunto de datos y por lo tanto constituye un uni verso
o población de datos desde el punto de vista estadístico.

• Otro universo o población de dat os son los pesos medidos (de los
habitantes de la ciudad).

• La población de habitantes, es decir, las personas que habit an la


ciudad no son la población (objeto de estudio) a la que se refiere
desde el punto de vista estadístico.

Estadística Descriptiva
 El tratamiento estadístico considera dos categorías principales de datos:
• Variables y constantes.
• Las variables se denotan usualmente por medio de las últimas letras del alfabeto,
tales como x, y, o z.
• Dentro de esta categoría se incluyen también los estadísticos y los parámetros.
•Un estadístico es una característica medida u observada en una muestra y
usualmente se denota mediante una letra específic a.
• La media aritmética de una muestra se denota mediante Ẋ
• La característica o parámetro correspondiente a la población o universo al
cual pertenece la muestra seleccionada se denota mediante µ.
• Generalmente los estadísticos de una muestra se denotan mediante letras del
alfabeto latino, mientras los parámetros de la población correspondiente se
denotan mediante letras griegas Por ejemplo,
• El conjunto de todas las mediciones de altura (de los habitantes de la ciudad) es un
conjunto de datos y por lo tanto constituye un universo o población de datos desde el
punto de vista estadístico.
• Otro universo o población de datos son los pesos medidos (de los habitantes de la
ciudad).
• La población de habitantes, es decir, las personas que habitan la ciudad no son la
población (objeto de estudio) a la que se refiere desde el punto de vista estadístico.

12
Estadística Descriptiva
 Con respecto a las constantes, existen dos tipos: Ordinarias
y “naturales”.
• Las constante s ordinarias se denotan mediante las primeras letras
minúsculas del alfabeto, es decir a, b, c, …
• También en este caso, es necesario distinguir entre constantes
basadas en la observación de una muestra y los parámetros de la
población correspondiente.
•Por ejemplo la siguiente relación entre dos variables X y Y
observada en una muestra:
• Y = a + bX.
•La ecuación correspondiente a la población o universo sería:
• Y = α + βX.
• En el ejemplo, a y b son estadísticos de la muestra mientras que α
y β son los parámetros de la respectiva población.
• Por constante s “naturales” se entienden los valores espec íficos
usados en las matemáticas, siendo el número irracional e =
2,71828..... y π = 3,14159... dos de las constantes naturales más
frecuent ement e utilizadas.

Estadística Descriptiva
 Por ejemplo si una empresa se fabrica un lote muy grande, de 10
toneladas de un producto químico, y un técnico debe controlar la
calidad del mismo.

 El técnico toma una pequeña porción, por ejemplo, 100 gramos, lo


cual es una muestra del producto para analizar en el laboratorio.

 Hasta el momento, la muestra no fue analizada y por lo tanto no se


dispone de ningún dato numérico.

13
Estadística Descriptiva
 Cuando el laborat orio efectúa algún ensayo en la muestra y obtiene
un resultado numérico, recién ahí se tiene un dato que puede ser
analizado desde el punto de vista estadístico.

Estadística Descriptiva
 Si el técnico continuara sacando otras muestras del producto, hasta
agotar el lote y cada una es ens ayada en el laboratorio, el cual da los
resultados.

 Como se tenían 10 toneladas de producto y las muestras son


aproximadamente de 100 gr, el técnico seguramente extraerá
alrededor de 100.000 muestras y el laboratorio entregará alrededor
de 100.000 resultados.

 Este conjunto de datos numéricos es el universo o población de


datos.

14
Estadística Descriptiva
 Si se toman al azar 10 de esos resultados, se dice tener una
muestra de 10 elementos de ese universo o población.

 No debe confundirse esta muestra (Desde el punto de vista


estadístico) con la primera muestra de material que extrajo el
técnico para ser analizada en laboratorio.

 Muchas veces el universo o población de datos a veces no


existe en la realidad, sino que es un concepto o abstracción
que se usa para referirse al universo o población que
hipotéticamente podría existir.

Estadística Descriptiva
 Del ejemplo anterior, si el técnico toma solamente 5 muestras
del lote original y las envía para analizar al laboratorio.

 El laboratorio enviará sólo 5 resultados, y se tiene una muestra


de datos extraída del universo o población de datos total.

 Y se piensa en el universo o población que tendría si se


hubieran extraído y analizado las 100.000 muestras de
material.

 Muchas veces resulta difícil imaginarse cual es el universo del


cual se extraen los datos.

15
Estadística Descriptiva
 Si se tiene una máquina que produce
piezas de plástico en serie y un
técnico toma 5 piezas sucesivas y les
mide la altura con un calibre.

 Se cuenta con 5 resultados, es decir


una muestra de 5 elementos.

 ¿Cuál es el universo al cual


pertenece esa muestra de datos?.

Estadística Descriptiva
 Debe considerarse lo siguiente:

• Si la máquina continuara trabajando en las mismas condiciones:


• A la misma velocidad,
• Con las mismas materias primas,
• A la misma temperat ura,
• Manejada por el mismo operario, etc. ...
 ... y a cada pieza que produce se le mide la altura, se tiene un conjunto
muy grande de result ados numéric os.

 Ese conjunto muy grande de res ultados num éricos que no existe, pero
que lo podría obtenerse en esas condiciones es el universo o
población del cual se extrae la muestra de 5 observaciones.

16
Estadística Descriptiva
 En otro caso, el sindicato de la industria textil desea saber
cual es el sueldo promedio que gana un operario en esa
industria.

 Entonces, encarga una encuesta a una empresa


especializada, que entrevista a 20 operarios de la industria
textil y averigua sus salarios.

 Estos datos son una muestra de 20 observaciones del


universo o población formado por los salarios de todos los
operarios de la industria textil del país.

Estadística Descriptiva
 Aunque el encuestador no disponga de esos datos, se sabe
que existen miles de trabajadores que ganan un salario
determinado y por lo tanto puede hablarse de un universo o
población cuyos elementos son los salarios de los
trabajadores de la industria textil en el país.

 Además, esa población de datos es seguramente diferente


de la población de salarios de los operarios de la industria
textil ecuatoriana o brasileña (Usando una misma moneda
de referencia).

 Entonces,

•¿Qué representa una Población de datos?

17
Estadística Descriptiva
 El análisis estadístico de una población o universo de
datos tiene como objetivo final descubrir las características
y propiedades de aquello que generó los datos.

Estadística Descriptiva
 Por ejemplo, se tiene una población de escolares
(Población física, población humana) y se les mide la altura.
 El conjunto de datos de altura constituye una población o
universo estadístico.
 El análisis de estos datos de altura (Universo estadístico)
sirve para caracterizar y estudiar a la población de
estudiantes (Que no es una Población estadística).

Población real Población estadística

18
Estadística Descriptiva
 Un instituto dedicado a estudios económicos ha realizado
una encuesta de ingresos en el país.

 El universo de datos generados por la encuesta sirve a los


fines de caracterizar a la población física, a la población real
del país, desde un punto de vista económico.

Estadística Descriptiva

Salarios (Bs.)
800
1250
950
2150
1780
1340
1500
2100
...
Población real

Población estadística

19
Estadística Descriptiva
 Un ingeniero controla un proceso industrial, que genera a
diario muchos lotes de un producto (Población de lotes).

 Para cada lote se mide una característica de calidad,


obteniéndose una gran cantidad de resultados numéricos
(Población de datos).

Estadística Descriptiva

Proceso
Muestra

Producto

Medición

Resultados
Numéricos

20
Estadística Descriptiva
 A través de esos datos numéricos se puede evaluar el comportamiento
del proceso, que es lo que realmente le interesa.

 Es importante destacar que detrás de un universo o población de datos


se encuentra una población fí sica subyacente, formada por elementos
de la realidad, de la cual, a través de algún tipo de medición, se
obtuvieron los datos numéricos.

 Es esa población física subyacente (Elementos de la realidad, seres


humanos, lotes de material, máquinas, etc.) la que se estudia y
caracteriza por medio del análisis estadístico de los datos obtenidos.

Estadística Descriptiva
 La población estadística representa una población física o
natural formada por elementos de la realidad, con respecto a
una característica o propiedad de esa población física.

 Al utilizar métodos estadísticos, no confundir la población


física, formada por elementos de la realidad estudiada con la
población o universo de datos generados a partir de la
primera.

 En adelante, cuando se use los términos población o


universo sin otro aditamento se estará refiriendo a
población o universo de datos numéricos (También
llamados observaciones o mediciones o valores).

21
Distribución de Frecuencias
 Una Población o Universo de dat os es un conjunto muy grande de
números.

 Estos números pueden estar en un gran listado o puede ser un conjunto


hipotético.

 Puede imaginars e los números pero no se tienen realmente.

 Una gran tabla de números ordenados al azar prácticament e no muestra


información acerca de la población de datos.

 Suponiendo que se tienen los datos del univers o

• ¿Cómo pueden clasificarse y ordenarse los números


para obtener más información acerca de ese universo
de datos?

Distribución de Frecuencias
 Gráficos Estadísticos
• La información contenida en las tablas de frecuencias resulta más
accesible y fácil de interpretar si se representan por medio de gráficos
estadísticos.

Diagrama de barras Histograma

En él se asocia a cada v alor de la v ariable una Está f ormado por rectángulos, cuy as bases
barra, cuy a longitud es igual o proporcional a su corresponden con los interv alos de clase y sus
f recuencia. áreas son iguales o proporcionales a sus
f recuencias.

22
Distribución de Frecuencias
 Gráficos Estadísticos
• Lainformación contenida en las tablas de frecuencias resulta más
accesible y fácil de interpretar si se representan por medio de gráficos
estadísticos.

Polígono de frecuencias Diagrama de sectores

Es una línea poligonal que une los vértices Es un gráf ico f ormado por un círculo
superiores de las barras de un diagr ama de div idido en sectores circulares cuy as
barras, o los puntos medios de las bases amplitudes son proporcionales a las
superiores de los rectángulos de un f recuencias de los datos
histograma. representados.

Distribución de Frecuencias
 Gráficos Estadísticos
• Lainformación contenida en las tablas de frecuencias resulta más
accesible y fácil de interpretar si se representan por medio de gráficos
estadísticos.

Pictogramas Gráfico de líneas

Los pictogramas son gráf icos similares a En este tipo de gráf ico se representan los
los gráf icos de barras, pero empleando un v alores de los datos en dos ejes cartesianos
dibujo en una determinad a escala para ortogonales entre sí.
expresar la unidad de medida de los datos. Se pueden usar para representar: una serie o
Generalmente este dibujo debe cortarse más series
para representar los datos. Se usan para
lograr el interés masiv o del público.

23
Distribución de Frecuencias
 Una forma sería escribir los números desde el menor hasta
el mayor y colocar encima de cada uno tantas cruces como
veces que figure repetido en la población:

Ordenando la Información
Al ordenar datos muy numerosos, es usual
agruparlos en clases o categorías.
Al determinar cuántos pertenecen a cada
clase, se tiene la fre cuencia.
Se Construye así una tabla de datos llamada
tabla de frecuencias.

Distribución de Frecuencias

Población o Universo

30 29
26
29 30 31
31
33 32
29 27 29
27 26 28 30 27 x
25
28 32 31 x x
28 32 x x x
30
29 30 31 x x x
31 30 x x x x x x
30 34
33 31 x x x x x x x x
x x x x x x x x x x
24 25 26 27 28 29 30 31 32 33 34 35

24
Distribución de Frecuencias
 …o utilizar cuadrados en vez de cruces:

Población o Universo
30 29
26
29
31 30 31
33 32
29 27 29
27 26 28 30 27
32 25
28 31
28 30 32
31
29 31 30 30
30 34
33 31

24 25 26 27 28 29 30 31 32 33 34 35

Distribución de Frecuencias

¿Para qué se construyen las tablas de frecuencias ?


• ORDENAR
• AGRUP AR
• RES UMIR información

24 25 26 27 28 29 30 31 32 33 34 35

25
Distribución de Frecuencias
 El número de veces que aparece repetido cada dato es la
frecuencia de dicho valor.

 Esta representación gráfica se denomina Distribución de


Frecuencias de la población.

 La representación gráfica permite ver información que antes


no aparecía tan evidente.

 Por ejemplo, sin hacer ningún cálculo puede verse donde


está aproximadamente el promedio de la población.

Distribución de Frecuencias

Población o Universo

30 29 Promedio
26
29 30 31
31
33 32
29 27 29
27 26 28 30 27
25
28 32 31
28 30 32
29 30 31
31 30
30 34
33 31
24 25 26 27 28 29 30 31 32 33 34 35

26
Distribución de Frecuencias
 También muestra cuales son los valores máximo y mínimo de la
población, es decir, el rango:

31 30
26 29
29
31 30 31
31 33 32
29 27 29
27 26 28 30 27
32 25
28 31
28 30 32
29 31 30 30
30 33 34

24 25 26 27 28 29 30 31 32 33 34 35

Rango
Recorrido o intervalo total

Distribución de Frecuencias

 En la siguiente tabla se presenta el motivo de la


consulta médica, durante una semana.

Motivo Consulta Número de pacientes


Bronquitis 19

Otitis 13

Heridas 7

Fracturas 18

Vacunas 20

27
Distribución de Frecuencias
 Tipos de frecuencias
1. Frecuencia o Frecuencia Absoluta: Es el número de veces que se
presenta un valor o categoría de una variable. Se repres enta por fi.
2. Frecuencia Relativa: La frecuencia relativa se puede expresar en
términos de porcentaje o de proporción y se representa por fr. (Es
la razón entre la frecuencia absoluta y el total de datos)

El formato general de una tabla estadística , llamada también TABLA


DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE FRECUENCIAS es
la siguiente:

Nombre de la variable Frecuencia

Categorías o Frecuencias
Recorrido de la variable Observadas

TOTAL n

Distribución de Frecuencias

Los siguientes datos corresponden a las notas obtenidas por


un curso de 24 alumnos en un trabajo de matemáticas:

3,2 4,2 5,6 6,0 2,8 3,9 4,2 4,2 5,0


5,0 3,9 3,9 3,2 3,2 4,2 5,6 6,0 6,0
3,2 6,0 4,2 5,0 5,6 5,0

Se Orde nan estos datos en una tabla conside rando:

• Nombre de variable : Nota


• Frecuencia Absoluta fi

• Frecuencia re lativa fr

Si el resultado es un decimal, se pueden usar 3 dígitos


después de la coma

28
Distribución de Frecuencias

Tabla de frecuencias de datos agrupados

Nota Frecuencia Frecuencia Frecuencia Relativa


Obtenida Absoluta Relativa Porcentual (%)

2,8

3,2

3,9

4,2

5,0

5,6

6,0

Distribución de Frecuencias

Tabla de frecuencias de datos agrupados

Nota Frecuencia Frecuencia Frecuencia Relativa


Obtenida Absoluta Relativa Porcentual (%)

2,8 1 0,041 4,166

3,2 4 0,166 16,666

3,9 3 0,125 12,500

4,2 5 0,208 20,833

5,0 4 0,166 16,666

5,6 3 0,125 12,500

6,0 4 0,166 16,666

29
Distribución de Frecuencias
 Hasta el momento sólo se ha trabajado con una pequeña cantidad de
datos.
• ¿Cómo se procede si se tiene muchos datos?
 Tabla de Distribución de Frecuencias agrupadas con
intervalos de clase o categorías
 En ocasiones, conviene agrupar los datos en intervalos, esto ayuda a
realizar un mejor análisis.
 Definiciones:
• Rango: Diferencia entre el máximo y el mínimo valor de una variable,
también denominado recorrido o intervalo total.

• Marca de clase: Representante de un intervalo, y corresponde al promedio


entre los extremos de éste.

• Tamaño de un intervalo: Es la fracción entre el valor del rango (intervalo


total) y la cantidad de intervalos que se desea obtener. Se recomienda
tomar como longitud de los intervalos un valor entero que sea mayor o igual
al cuociente obtenido.

Distribución de Frecuencias
 Una manera de caracterizar una población es construir una tabla distribución de
frecuencias o gráfico de frecuencias, siguiendo los siguientes pasos:

1. Se anota el valor máximo y el valor mínimo de la serie de datos que se está estudiando.

2. El número de clases o categorías se obtiene div idiendo la dif erencia del máximo y el mínimo
(rango o interv alo total) entre el tamaño del interv alo de clase (ic) deseado,

 número de clases=Rango/ic

3. El tamaño del interv alo de clase (ic) debe ser tal que no hay a ni excesiv as clases ni muy pocas,
puede usarse la Regla de Sturge.

Rango
Tamaño de ic 
1  3,322 log( N )

Rango, recorrido o intervalo total


Valor Mínimo

Valor Máximo

Tamaño del ic

30
Distribución de Frecuencias

4. También puede decidirse a priori en cuántas clases desean agruparse los datos,
entonces el tamaño del intervalo de clase es:

 Tamaño ic = Rango/número de clases

5. Se cuenta el número de datos que se encuentra dentro de cada intervalo


(frecuencia). Por ejemplo, si en el intervalo i hay ni observaciones, entonces ( ni =
N).

6. Para construir el gráfico, se coloca en el eje de horizontal los intervalos y se levanta


en cada intervalo un rectángulo de altura proporcional al número ni de datos dentro
del mis mo.

Distribución de Frecuencias

Los siguientes datos, expresados en metros, correspondientes


a las estaturas de 80 estudiantes de Cuarto año de Educación
Media.

1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92


1,75 1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77
1,73 1,75 1,78 1,77 1,67 1,83 1,83 1,72 1,71
1,85 1,84 1,93 1,82 1,69 1,70 1,81 1,66 1,76
1,75 1,80 1,79 1,84 1,86 1,80 1,77 1,80 1,76
1,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,75
1,78 1,77 1,74 1,73 1,83 1,76 1,83 1,77 1,75
1,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,76
1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77

31
Distribución de Frecuencias
Estatura Mayor: 1,93 metros
Estatura Me nor: 1,66 metros
Rango: 1,93 metros - 1,66 metros = 0,27 metros = 27 cm.
Se decide formar 6 clases o categorías – Cantidad de
intervalos
Para calcular el tamaño de inte rvalo se divide el Rango
27cm entre 6, obteniendo finalmente 4,5 ~ 5cm
Luego los intervalos de la tabla son:
Frecuencia
Intervalo Marca de Clase
Absoluta
1 ,65 – 1 ,69 n1
1 ,70 – 1 ,74 n2
1 ,75 – 1 ,79 n3
1 ,80 – 1 ,84 n4
1 ,85 – 1 ,89 n5
1 ,90 – 1 ,94 n6
Total N

Distribución de Frecuencias
1,66 1,66 1,67 1,67 1,67 1,7 1,71 1,72 1,72

1,69 1,72 1,73 1,73 1,74 1,75 1,75 1,75 1,76 Marca de
Intervalo Fi Fr
clase
1,72 1,73 1,74 1,75 1,75 1,75 1,76 1,77 1,78
1,65 1,69 1,67 6 0,075
1,74 1,75 1,76 1,76 1,77 1,77 1,77 1,79 1,79
1,70 1,74 1,72 12 0,150
1,76 1,77 1,77 1,77 1,79 1,79 1,8 1,8 1,81 1,75 1,79 1,77 30 0,375

1,76 1,77 1,78 1,79 1,8 1,81 1,82 1,82 1,83 1,80 1,84 1,82 22 0,275
1,85 1,89 1,87 8 0,100
1,77 1,79 1,8 1,83 1,83 1,83 1,83 1,84 1,84 1,90 1,94 1,92 2 0,025
1,81 1,83 1,83 1,84 1,84 1,84 1,85 1,86 1,92 80 1,000

1,84 1,86 1,87 1,87 1,88 1,88 1,88 1,93

Gráfico de Distribución de Frecuencias

35
Frecuencia Absoluta

30
25
20
15
10
5
0
1,65 – 1,69 1,70 – 1,74 1,75 – 1,79 1,80 – 1,84 1,85 – 1,89 1,90 – 1,94
Estatura (m)

32
Distribución de Frecuencias
 Hi stograma de Frecuencias “Peso de varones adultos”:
 Si se hace el área de cualquier rectángulo sobre el intervalo i-ésimo
igual a la frecuencia relativa fr = ni /N, el área total bajo el histograma
será igual a la unidad:

ni  ni  N
Area Total   Ai     1
N N N
Gráfico de Distribución de Frecuencias
0,20
0,18
0,16
Frecuencia Relativa

0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
60 66 72 78 84 90 96

Pe so Kg.

Distribución de Frecuencias
 El Histograma obtenido muestra la distribución de
frecuencias de la población, peso de varones adultos.

 Esta distribución de frecuencias muestra las características


de una población, por ejemplo, si hay resultados que son
mas frecuentes que otros.

 Muestra si los valores están ubicados alrededor de un valor


central, si están muy dispersos o poco dispersos.

 Se observar que fracción de todas las mediciones cae entre


el rango de 70 y 80 Kg. (Zona rayada en el gráfico):

33
Distribución de Frecuencias

Gráfico de Distribución de Frecuencias


0,20
0,18
0,16
Frecuencia Relativa

0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
60 66 72 78 84 90 96

Pe s o Kg.

Distribución de Frecuencias
 Si se elige una persona del grupo y se le pesa, el resultado
es un dato que pertenece a la población de datos
representada en el gráfico.

• Se dice estar extrayendo un dato de la población de datos.


 Pero hay distintas maneras de elegir la persona, es decir,
distintas maneras de realizar la extracción del dato.

 Si el observador se coloca frente al grupo y elige una


persona, se podría seleccionar al más gordo, al más flaco o
al más alto (y por lo tanto pesa más que otros), de acuerdo a
criterios subjetivos que no se pueden evitar.

34
Distribución de Frecuencias

 En cambio, si se escribe los nombres


de todas las personas en una
etiqueta, y se introducen todas las
etiquetas en una caja y luego se
retira una etiqueta, la selección no
estará influida por la del observador
subjetividad.

Juan
 En este caso, se dice que la
extracción es aleatoria.

Distribución de Frecuencias
 Una extracción aleatoria es aquella en que cada miembro
de la población tiene la misma posibilidad de ser elegido.

 Si se realiza una extracción aleatoria de la población


anterior y se obtiene el valor y.

 Entonces:

1. La probabilidad P (y<70) de que y sea menor que 70 Kg. es igual al


área del histograma a la izquierda de 70 Kg.

2. La probabilidad P (y>70) de que y sea mayor que 70 Kg. es igual al


área del histograma a la derecha de 70 Kg.

3. La probabilidad P (y>70, y< 80) de que y sea mayor que 70 Kg.


pero menor que 80 Kg. es igual al área del histograma entre 70 y
80 Kg.

35
Distribución de Frecuencias
No. Dato 1 Dato 2 Dato 3 Dato 4 Dato 5
1 10.7 10.7 10.7 10.7 10.9
 Asignación 1: 2 10.8 10.9 10.8 10.9 10.7

 En una empresa durante 24 3 10.8 10.8 10.8 10.7 10.8


4 10.6 10.7 10.7 10.8 10.7
días se han anotado 5 5 10.7 10.8 10.7 10.9 10.8
observaciones de una variable 6 10.6 10.8 10.8 10.9 10.7
dada, obtener: 7 10.6 10.8 10.7 10.8 10.8
8 10.6 10.8 10.7 10.8 10.7
• Má ximo dato obtenido
9 10.7 10.8 10.9 10.9 10.8
• Menor dato obtenido 10 10.6 10.7 10.6 10.8 10.7
• Rango 11 10.8 10.8 10.9 10.5 10.9
• Dato que más se repite 12 10.9 10.8 10.9 10.7 10.7
• Construir tabla de 13 10.7 10.7 10.8 10.8 10.7
14 10.7 10.7 10.9 10.8 10.6
frecuencias con 7 intervalos.
15 10.8 10.8 10.8 10.8 10.7
• Construir Histograma de 16 10.9 10.8 10.8 10.8 10.9
frecuencias. 17 10.8 10.7 10.9 10.7 10.8
• Cuál es la probabilidad que 18 10.8 10.7 10.6 10.7 10.6
un dato sea mayor a 10,7 19 10.7 10.7 10.9 10.7 10.7
20 10.6 10.6 10.7 10.6 10.7
• Cuál es la probabilidad que
21 10.5 10.0 10.7 10.8 10.8
esté comprendido entre 10,4 22 10.8 10.7 10.8 10.7 10.7
y 10,6 23 10.7 10.6 10.7 10.6 10.7
24 10.7 10.7 10.7 10.6 10.7

Distribución de Frecuencias
 Asignación 2:
• En su lugar de trabajo seleccionar una población física a estudiar.
• Describirla y delimitarla.
• Especificar la poblaciones estadísticas que serán objeto de estudio.
• De esta, seleccione las variables a caracterizar estadísticamente.
• Tipo de variable, valores que toma.
• Datos a rec oger para caracterizar la(s) variable(s) objeto de estudio
• Tipo de datos
• Procedencia de los datos.
• Reglas para su expresión.
• Formas de obtención y manejo.
• Parámetros y estadísticos de interés.

36
Medidas de Tendencia Central
 Las medidas de tendencia central son:
• Promedio aritmético simple - Media
• Promedio geométrico simple
• Promedio armónico simple
• Mediana
• Modo
• Promedio aritmético en distribución de frecuencias
• Mediana en distribución de frecuencias
 Medidas de posición
• Cuartiles
• Percentiles
 La media, mediana y modo describen alrededor de cuáles
valores se agrupan los datos.

Medidas de Tendencia Central


 Promedio aritmético simple: n

x1  x 2  x3  .....  x n x
i1
i
X 
n n

 Promedio geométrico simple:


__
X g  n x1. x 2. x 3 ... x n

 Promedio armónico simple:


__
n n
Xh  n
1 1 1 1 1
  ...
x1 x 2 x3 x n  i 1 x i

Dados 3, 2, 3, 6, 4, 5
__ __ __
Calcular X , X g , X h , la mediana y el modo

37
Medidas de Tendencia Central
 Promedio aritmético distribución de frecuencias
n

x
i 1
i fi
X n

f
i 1
i

70 66 72 68 70 68 69 68 70 71 75 76
70 69 73 66 70 70 71 65 66 71 69 71 Li Ls xi fi
62 64 63 5
70 73 74 70 70 69 72 74 69 71 73 67
65 67 66 14
67 70 66 64 71 72 63 66 69 72 69 70
68 70 69 43
68 64 73 74 66 72 71 73 71 71 69 65
71 73 72 27
68 67 71 71 67 70 70 72 67 70 68 68
74 76 75 7
70 68 67 64 70 71 68 68 64 68 72 69
N = 96
70 72 76 70 69 71 70 72 69 69 70 75

__
63 * 5  66 * 14  69 * 43  72 * 27  75 * 7 6675
X    69 ,53
96 96

Medidas de posición
 Cuartiles
• Son los valores de la distribución de frecuencias que la dividen en 4
partes iguales.
• Q1 es el primer cuartil:
•25% de las frecuencias se encuentran por debajo de él.
•75% de las frecuencias se encuentran por encima de él.
• Q2 es el segundo cuartil (mediana)
•50% de las frecuencias se encuentran por debajo de él.
•50% de las frecuencias se encuentran por encima de él.
• Q3 es el tercer cuartil:
•75% de las frecuencias se encuentran por debajo de él.
•25% de las frecuencias se encuentran por encima de él.
 p. N 
  f a1 
Q p  Li   4 .ic donde p  1, 2 ó 3
 fi 
 
 

38
Medidas de Dispersión
 Las medidas de dispersión son:
• Rango
• Desviación Media
• Varianza
• Desviación típica o estándar.
 Estas medidas indican qué tan agrupados alrededor de un valor se
encuentran los datos.
 Permiten medir la variabilidad de los datos obtenidos con respecto al
valor central representativo.
 En qué medida se alejan los valores individuales del promedio

Medidas de Dispersión
 Datos no agrupados o en series simples
 Recorrido, intervalo total o rango:
• Valor mayor – Valor menor

 La desviación media __
x i x
DM 
N

 Varianza __
2  ( xi  x ) 2
S 
N

 La desviación típica o estándar __


( xi  x) 2
S
N

39
Medidas de Dispersión
 Datos agrupados en distribución de frecuencias

 Recorrido, intervalo total o rango:


• Valor mayor – Valor menor

 La desviación media __
x i  x * fi
DM 
N

 Varianza __
 ( x i  x )2 * f i
2
S 
N

 La desviación típica o estándar __


( xi  x) 2 * f i
S
N

Medidas de Dispersión
 Desviación típica en Distribución de Frecuencias
70 66 72 68 70 68 69 68 70 71 75 76
70 69 73 66 70 70 71 65 66 71 69 71 __ 63 * 5  66 *14  69 * 43  72 * 27  75 * 7 6675
X   69,53
70 73 74 70 70 69 72 74 69 71 73 67 96 96
67 70 66 64 71 72 63 66 69 72 69 70
68 64 73 74 66 72 71 73 71 71 69 65
68 67 71 71 67 70 70 72 67 70 68 68
70 68 67 64 70 71 68 68 64 68 72 69
70 72 76 70 69 71 70 72 69 69 70 75

Li Ls xi Fi Fr Fa Fra xi.Fi xi-ẋ (xi-ẋ)2 (xi-ẋ)2.Fi


62 65 63,5 5 0,052 5 0,052 315 -6,53 42,64 213,20
65 68 66,5 14 0,146 19 0,198 924 -3,53 12,46 174,45
68 71 69,5 43 0,448 62 0,646 2967 -0,53 0,28 12,08
71 74 72,5 27 0,281 89 0,927 1944 2,47 6,10 164,72
74 76 75,5 7 0,073 96 1,000 525 5,47 29,92 209,45
N= 96 6675 773,91

__
 ( x i  x) 2 * f i 773,91
S   8,06  2,84
N 96

40
Medidas de Tendencia Central y Dispersión

70 66 72 68 70 68 69 68 70 71 75 76
70 69 73 66 70 70 71 65 66 71 69 71 __ 63 * 5  66 *14  69 * 43  72 * 27  75 * 7 6675
X   69,53
70 73 74 70 70 69 72 74 69 71 73 67 96 96
67 70 66 64 71 72 63 66 69 72 69 70
68 64 73 74 66 72 71 73 71 71 69 65
__
68 67 71 71 67 70 70 72 67 70 68 68
( x i  x ) 2 * f i 773 ,91
70 68 67 64 70 71 68 68 64 68 72 69 S   8, 06  2,84
70 72 76 70 69 71 70 72 69 69 70 75 N 96

N 96
Min 63
Max 76
Rango 13
IC 1,63
Solución Excel
No. Clases 7,97
Ẋ 69,61
Md 70
Mo 70
S 2,71

Medidas de Tendencia Central y Dispersión


Asignación 3 :
Los siguientes datos corresponden al peso de 80 personas en kilogramos,
que han sido ordenados. Se requiere:

1. Especificar la población estadística, variable de estudio, su


definición y unidad de medida.
2. Ordenarlos en una tab la de distribución de frecuencias.
3. Cuáles son los valores mínimo y máximo registrados.
4. Qué porcentaje de la población pesa menos de 50 Kg.
5. Cuál es el peso promedio de la población.
6. Cuál es la mediana de la población y el modo.
7. Qué valor separa el 75% superior de la distribución de frecuencias.
8. Cuál es la desviación típica de la pob lación.

41

También podría gustarte