1 Estadistica PDF

Estadística Aplicada
Conceptos Estadísticos
Fundamentales
 CONTENIDOS:
• Tratamiento y análi si s de datos

• Di stribuciones de probabilidades
• Obtención de inform ación y métodos de muestreo
• Di stribución de variables aleatorias
• Cartas o diagramas de control
• Capacidad de procesos
• Muestreo para aceptación
1
 PLAN DE EVALUACION:
• Tarea previ a a parci al 1: 15%
• Parcial 1: 25%
• Tarea previ a a parci al 2: 15%
• Parcial 2: 20%
• Trabajo de campo: 15%
• Asi stencia: 10%
Antecedentes
 Para distinguir entre conocimiento e
información, podría decirse:
• Elconocimiento implica la formulación

de conclusiones con cierto grado de
certidumbre, derivada de información
obtenida a partir de un número limitado
de individuos, objetos o experiencias
pasadas, mediante la aplicación de
técnicas estadísticas.
• La información de partida, en este caso,

se conoce como datos estadísticos y se
asemejan a la materia prima de un
proceso de manufactura.
2
Antecedentes
 En muchos casos es necesario trabajar con experiencias o
procesos que generan un número muy grande de datos o
resultados numéricos, es decir, espacios muestrales con un
número infinito o muy grande de elementos.
 Por lo que se usa la Estadística como herramienta.
Antecedentes
 Los orígenes de la estadística, aunque no se sabe con exactitud cuándo
se comenzó a utilizar, pueden estar ligados al antiguo Egipto como a los
censos chinos que se realizaron hace unos 4000 años,
aproximadamente.
 Sin duda, fueron los romanos, maestros de la organización política,

quienes mejor supieron ocupar la estadística.
• Cada cinco años realizaban un censo de la población, cuyos datos de:

• Nacimientos,
• Defunciones y
• Matrimonios
• Eran esenciales para estudiar los avances del imperio; sin olvidar los
recuentos de ganancias y las riquezas que dejaban las tierras.
3
Antecedentes
 En 1662, John Graunt, un mercader Inglés, publicó un libro sobre los
nacimient os y defunciones ocurridos en Londres; donde concluía acerca
de algunos factores relacionados con estos eventos. Esta obra es
considerada como el punto de partida de la e stadí stica moderna.
 La palabra e stadística comenzó a usarse en el siglo XVIII, en Alemania,

relacionándos e al estudios de los grandes números, que constituían
datos, de importancia para el estado. Sin embargo, la estadística
moderna se desarrolló en el siglo XX a partir de los estudios de Karl
Pearson.
 Hoy la estadística tiene gran importancia, no sólo por que presenta

información, sino que además permite inferir y predecir lo que va a
ocurrir, y por lo tanto, es una herramienta fundamental a la hora de
tomar decisiones.
Conceptos Fundamentales
 La estadística es la ciencia de la inducción lógica, ayuda a generar
conclusiones de carácter general a partir de un reducido número de
observaciones.
 La inducción permite formular generalizaciones acerca de la naturaleza

o característica de una determinada clase de objetos, a partir de
observaciones realizadas sobre una cantidad limitada de tales objet os.
 Al contrario que la deducción la cual conduce a establecer, sobre la

base de premisas generales de las propiedades de cualquier objeto, si
todos los objetos considerados poseen tales características.
 Se dice que la deducción es un razonamiento a priori, mientras de la

inducción es un razonamiento en base a la evidencia empírica.
4
Conceptos Fundamentales
 Por ejemplo:
• La estadística aporta herramientas que permiten utilizar una cantidad lim itada
o incompleta de información, para formular conclusiones acerca de causas y
efectos de algún fenómeno estudiado.
• Esto ayuda a comprobar teorías o determinar las relaciones existentes entre

datos iniciales y resultados finales.
• En las ciencias sociales, las técnicas estadísticas se usan para predecir el

resultado de unas elecciones o la probabilidad de éxito o fracaso de un cierto
negocio.
• En el campo médico, los métodos estadísticos se aplican en pruebas

experimentales realizadas a los nuevos fármacos, para evaluar su efectividad
en el tratamiento de algún tipo de enfermedad o en busca de relación causal
directa o indirecta entre el consumo de cigarrillos y el cáncer pulmonar.
Estadística Descriptiva
Todo estudio estadístico debe considerar

diferentes tipos de variables:
Variables
Variables cualitativas
Variables Cuantitativas
5
Variables cualitativas:
Relacionadas con características
no numéricas de un individuo
por ejemplo: atributos de una
persona, nacionalidad, color de
la piel, sexo, religión.
Variables Cuantitativas: Relacionadas con

características numéricas del individuo por
ejemplo: edad, precio de un producto,
ingresos anuales.
Las variables cuantitativas pueden ser:
Discretas (aquellas que pueden tomar solo
algunos valores en un intervalo y no valores
intermedio, ejemplo: edad, número de
hermanos que puede ser 1, 2, 3....,etc, pero,
por ejemplo, nunca podrá ser 3,45)
Continuas (aquellas que pueden tomar
cualquier valor en un intervalo real, ejemplo:
alturas, la velocidad de un vehículo puede ser
80,3 km/h, 94,57 km/h...etc.).
6
•Dicotóm icas
•Policotóm inas
Cualitativas
•Generales Por su
•Intermedias naturaleza
Cuantitativas
•Discretas
•Continuas
Por su nivel
de
Variables Con relación
abstracción
al fin de la
investigación
•Independientes
•Dependientes
•Intervinientes
Individuales •Extrañas
Por su
Colectivas am plitud •Ambientales
•Conexas
•Actuación y presencia del investigador
•Actuación de los sujetos investigados
 En la estadística, la información de partida son los datos

estadísticos, análogo a la materia prima de un proceso de
manufactura.
 Los datos se obtienen de alguna fuente, se aplican las

operaciones estadísticas apropiadas y se obtiene como
resultado un producto terminado bajo la forma de
estimaciones o conclusiones.
 Estas conclusiones sirven de base para tomar

decisiones, permitiendo elegir uno entre varios cursos de
acción, con el propósito de alcanzar con la mayor
efectividad posible un objetivo predeterminado.
7
 Los datos pueden provenir de fuentes internas o externas.
• En una empresa las fuente s internas están conformados por
registros de ventas, producción, nómina, personal y los asientos
contables.
• Las fuente s externas están fuera de la organización que los usa, se
obtienen a través de publicaciones, pueden ser de dos tipos:
• Fuentes primarias, son datos publicados por quienes los
recolectaron y/o produjeron originariamente (censos de
población, estadísticas de ingresos, reportes anuales de
actividad industrial, etc.)
• Fuentes secundarias, como los diarios, revistas, libros y otros
medios de comunicación, que publican información elaborada
por las fuentes primarias.
 Es preferible obtener la información de fuentes primarias, por las
imprecisiones que pueden enc ontrarse en dat os provenientes de
fuentes secundarias (errores de trascripción, datos incompletos,
ausencia de not as aclaratorias, etc.).
 Manejo de los datos:

• Aproximación de números
• En la mayor parte de los casos resulta más conveniente usar
datos aproximados en lugar de valores exactos.
• Redondeo de cifras
• Una regla arbitraria, pero prácticamente de uso universal,
establece lo siguiente: si el último dígito que se desea conservar
es par, entonces se redondea por defecto o se descartan los
demás dígitos a la derecha. Si el último dígito a conservar es
impar, se redondeará por exceso al dígito par más cercano.
• Dígitos significativos
• Consiste en la cantidad de dígitos del número original que haya
sido conservada.
•Ej. 3.420,0 las cifras significativas son cinco. Para números
menores que 1, se cuentan los dígitos que aparezcan a la
derecha del último cero decimal; así 0,000190 tiene tres dígitos
significativos, lo mismo que 0,0320 o 0,00255.
8
 A un conjunto muy grande de datos numéricos para

analizar se denomina Universo o Población de
observaciones.
Generadores
Eléctricos Diesel
Muestra
Universo de Generadores Eléctricos en Venezuela
30 29
26
29 30 31
31
33 32
29 27 29 30
27 26 28 30
25 27
32
31
28 32
30 31
29 30 30
31 28
34
33 31
Población o Universo
9
 Cada dato numérico es un elemento de la población o
universo.
 Una Muestra es un subconjunto pequeño de observaciones
extraídas de un universo o población.
Pobl ación o Uni verso

Se toma un dato
26 30 29 de la Población
29 30 31
31
33 32
29 27 29 30
27 26 30
28 30
25 27
32
31
28 29 32
30 31
30 34 28
31
33 31 30
30 29
26
29 30 31
31
33 32 28
29 27 29 30
27 26 29
28 30 31
25 27
32 30
31 34
28 32
30 31
29 30 30
31 28
34 Muestra de
33 31
5 datos
10
 La Estadística trabaja con poblaciones de datos y con

muestras extraídas de las mismas.
 Los conceptos de población y muestra a veces resultan

ambiguos en su aplicación práctica.
 En una ciudad de 5.000 habitantes se
realiza un censo médico en el cual se mide
el peso, la altura y relevándose otros datos
de todos los habitantes de la ciudad.
 Podría referirse al universo o población

censada teniendo en mente el conjunto de
los habitantes de la ciudad.
 Pero cuando se habla en términos

estadísticos, se refiere a poblaciones o
universos de datos.
11
 Por ejemplo,
• El conjunto de t odas las mediciones de altura (de los habitantesde la
ciudad) es un conjunto de datos y por lo tanto constituye un uni verso
o población de datos desde el punto de vista estadístico.
• Otro universo o población de dat os son los pesos medidos (de los
habitantes de la ciudad).
• La población de habitantes, es decir, las personas que habit an la

ciudad no son la población (objeto de estudio) a la que se refiere
desde el punto de vista estadístico.
 El tratamiento estadístico considera dos categorías principales de datos:
• Variables y constantes.
• Las variables se denotan usualmente por medio de las últimas letras del alfabeto,
tales como x, y, o z.
• Dentro de esta categoría se incluyen también los estadísticos y los parámetros.
•Un estadístico es una característica medida u observada en una muestra y
usualmente se denota mediante una letra específic a.
• La media aritmética de una muestra se denota mediante Ẋ
• La característica o parámetro correspondiente a la población o universo al
cual pertenece la muestra seleccionada se denota mediante µ.
• Generalmente los estadísticos de una muestra se denotan mediante letras del
alfabeto latino, mientras los parámetros de la población correspondiente se
denotan mediante letras griegas Por ejemplo,
• El conjunto de todas las mediciones de altura (de los habitantes de la ciudad) es un
conjunto de datos y por lo tanto constituye un universo o población de datos desde el
punto de vista estadístico.
• Otro universo o población de datos son los pesos medidos (de los habitantes de la
ciudad).
• La población de habitantes, es decir, las personas que habitan la ciudad no son la
población (objeto de estudio) a la que se refiere desde el punto de vista estadístico.
12
 Con respecto a las constantes, existen dos tipos: Ordinarias
y “naturales”.
• Las constante s ordinarias se denotan mediante las primeras letras
minúsculas del alfabeto, es decir a, b, c, …
• También en este caso, es necesario distinguir entre constantes
basadas en la observación de una muestra y los parámetros de la
población correspondiente.
•Por ejemplo la siguiente relación entre dos variables X y Y
observada en una muestra:
• Y = a + bX.
•La ecuación correspondiente a la población o universo sería:
• Y = α + βX.
• En el ejemplo, a y b son estadísticos de la muestra mientras que α
y β son los parámetros de la respectiva población.
• Por constante s “naturales” se entienden los valores espec íficos
usados en las matemáticas, siendo el número irracional e =
2,71828..... y π = 3,14159... dos de las constantes naturales más
frecuent ement e utilizadas.
 Por ejemplo si una empresa se fabrica un lote muy grande, de 10
toneladas de un producto químico, y un técnico debe controlar la
calidad del mismo.
 El técnico toma una pequeña porción, por ejemplo, 100 gramos, lo

cual es una muestra del producto para analizar en el laboratorio.
 Hasta el momento, la muestra no fue analizada y por lo tanto no se

dispone de ningún dato numérico.
13
 Cuando el laborat orio efectúa algún ensayo en la muestra y obtiene
un resultado numérico, recién ahí se tiene un dato que puede ser
analizado desde el punto de vista estadístico.
 Si el técnico continuara sacando otras muestras del producto, hasta
agotar el lote y cada una es ens ayada en el laboratorio, el cual da los
resultados.
 Como se tenían 10 toneladas de producto y las muestras son

aproximadamente de 100 gr, el técnico seguramente extraerá
alrededor de 100.000 muestras y el laboratorio entregará alrededor
de 100.000 resultados.
 Este conjunto de datos numéricos es el universo o población de

datos.
14
 Si se toman al azar 10 de esos resultados, se dice tener una
muestra de 10 elementos de ese universo o población.
 No debe confundirse esta muestra (Desde el punto de vista

estadístico) con la primera muestra de material que extrajo el
técnico para ser analizada en laboratorio.
 Muchas veces el universo o población de datos a veces no

existe en la realidad, sino que es un concepto o abstracción
que se usa para referirse al universo o población que
hipotéticamente podría existir.
 Del ejemplo anterior, si el técnico toma solamente 5 muestras
del lote original y las envía para analizar al laboratorio.
 El laboratorio enviará sólo 5 resultados, y se tiene una muestra

de datos extraída del universo o población de datos total.
 Y se piensa en el universo o población que tendría si se

hubieran extraído y analizado las 100.000 muestras de
material.
 Muchas veces resulta difícil imaginarse cual es el universo del

cual se extraen los datos.
15
 Si se tiene una máquina que produce
piezas de plástico en serie y un
técnico toma 5 piezas sucesivas y les
mide la altura con un calibre.
 Se cuenta con 5 resultados, es decir

una muestra de 5 elementos.
 ¿Cuál es el universo al cual

pertenece esa muestra de datos?.
 Debe considerarse lo siguiente:
• Si la máquina continuara trabajando en las mismas condiciones:

• A la misma velocidad,
• Con las mismas materias primas,
• A la misma temperat ura,
• Manejada por el mismo operario, etc. ...
 ... y a cada pieza que produce se le mide la altura, se tiene un conjunto
muy grande de result ados numéric os.
 Ese conjunto muy grande de res ultados num éricos que no existe, pero
que lo podría obtenerse en esas condiciones es el universo o
población del cual se extrae la muestra de 5 observaciones.
16
 En otro caso, el sindicato de la industria textil desea saber
cual es el sueldo promedio que gana un operario en esa
industria.
 Entonces, encarga una encuesta a una empresa

especializada, que entrevista a 20 operarios de la industria
textil y averigua sus salarios.
 Estos datos son una muestra de 20 observaciones del

universo o población formado por los salarios de todos los
operarios de la industria textil del país.
 Aunque el encuestador no disponga de esos datos, se sabe
que existen miles de trabajadores que ganan un salario
determinado y por lo tanto puede hablarse de un universo o
población cuyos elementos son los salarios de los
trabajadores de la industria textil en el país.
 Además, esa población de datos es seguramente diferente

de la población de salarios de los operarios de la industria
textil ecuatoriana o brasileña (Usando una misma moneda
de referencia).
 Entonces,
•¿Qué representa una Población de datos?
17
 El análisis estadístico de una población o universo de
datos tiene como objetivo final descubrir las características
y propiedades de aquello que generó los datos.
 Por ejemplo, se tiene una población de escolares
(Población física, población humana) y se les mide la altura.
 El conjunto de datos de altura constituye una población o
universo estadístico.
 El análisis de estos datos de altura (Universo estadístico)
sirve para caracterizar y estudiar a la población de
estudiantes (Que no es una Población estadística).
Población real Población estadística
18
 Un instituto dedicado a estudios económicos ha realizado
una encuesta de ingresos en el país.
 El universo de datos generados por la encuesta sirve a los

fines de caracterizar a la población física, a la población real
del país, desde un punto de vista económico.
Salarios (Bs.)
800
1250
950
2150
1780
1340
1500
2100
...
Población real
Población estadística
19
 Un ingeniero controla un proceso industrial, que genera a
diario muchos lotes de un producto (Población de lotes).
 Para cada lote se mide una característica de calidad,

obteniéndose una gran cantidad de resultados numéricos
(Población de datos).
Proceso
Muestra
Producto
Medición
Resultados
Numéricos
20
 A través de esos datos numéricos se puede evaluar el comportamiento
del proceso, que es lo que realmente le interesa.
 Es importante destacar que detrás de un universo o población de datos

se encuentra una población fí sica subyacente, formada por elementos
de la realidad, de la cual, a través de algún tipo de medición, se
obtuvieron los datos numéricos.
 Es esa población física subyacente (Elementos de la realidad, seres

humanos, lotes de material, máquinas, etc.) la que se estudia y
caracteriza por medio del análisis estadístico de los datos obtenidos.
 La población estadística representa una población física o
natural formada por elementos de la realidad, con respecto a
una característica o propiedad de esa población física.
 Al utilizar métodos estadísticos, no confundir la población

física, formada por elementos de la realidad estudiada con la
población o universo de datos generados a partir de la
primera.
 En adelante, cuando se use los términos población o

universo sin otro aditamento se estará refiriendo a
población o universo de datos numéricos (También
llamados observaciones o mediciones o valores).
21
Distribución de Frecuencias
 Una Población o Universo de dat os es un conjunto muy grande de
números.
 Estos números pueden estar en un gran listado o puede ser un conjunto

hipotético.
 Puede imaginars e los números pero no se tienen realmente.
 Una gran tabla de números ordenados al azar prácticament e no muestra

información acerca de la población de datos.
 Suponiendo que se tienen los datos del univers o
• ¿Cómo pueden clasificarse y ordenarse los números

para obtener más información acerca de ese universo
de datos?
 Gráficos Estadísticos
• La información contenida en las tablas de frecuencias resulta más
accesible y fácil de interpretar si se representan por medio de gráficos
estadísticos.
Diagrama de barras Histograma
En él se asocia a cada v alor de la v ariable una Está f ormado por rectángulos, cuy as bases
barra, cuy a longitud es igual o proporcional a su corresponden con los interv alos de clase y sus
f recuencia. áreas son iguales o proporcionales a sus
f recuencias.
22
• Lainformación contenida en las tablas de frecuencias resulta más
estadísticos.
Polígono de frecuencias Diagrama de sectores
Es una línea poligonal que une los vértices Es un gráf ico f ormado por un círculo
superiores de las barras de un diagr ama de div idido en sectores circulares cuy as
barras, o los puntos medios de las bases amplitudes son proporcionales a las
superiores de los rectángulos de un f recuencias de los datos
histograma. representados.
• Lainformación contenida en las tablas de frecuencias resulta más
estadísticos.
Pictogramas Gráfico de líneas
Los pictogramas son gráf icos similares a En este tipo de gráf ico se representan los
los gráf icos de barras, pero empleando un v alores de los datos en dos ejes cartesianos
dibujo en una determinad a escala para ortogonales entre sí.
expresar la unidad de medida de los datos. Se pueden usar para representar: una serie o
Generalmente este dibujo debe cortarse más series
para representar los datos. Se usan para
lograr el interés masiv o del público.
23
 Una forma sería escribir los números desde el menor hasta
el mayor y colocar encima de cada uno tantas cruces como
veces que figure repetido en la población:
Ordenando la Información
Al ordenar datos muy numerosos, es usual
agruparlos en clases o categorías.
Al determinar cuántos pertenecen a cada
clase, se tiene la fre cuencia.
Se Construye así una tabla de datos llamada
tabla de frecuencias.
30 29
26
29 30 31
31
33 32
29 27 29
27 26 28 30 27 x
25
28 32 31 x x
28 32 x x x
30
29 30 31 x x x
31 30 x x x x x x
30 34
33 31 x x x x x x x x
x x x x x x x x x x
24 25 26 27 28 29 30 31 32 33 34 35
24
 …o utilizar cuadrados en vez de cruces:
30 29
26
29
31 30 31
33 32
29 27 29
27 26 28 30 27
32 25
28 31
28 30 32
31
29 31 30 30
30 34
33 31
24 25 26 27 28 29 30 31 32 33 34 35
¿Para qué se construyen las tablas de frecuencias ?

• ORDENAR
• AGRUP AR
• RES UMIR información
24 25 26 27 28 29 30 31 32 33 34 35
25
 El número de veces que aparece repetido cada dato es la
frecuencia de dicho valor.
 Esta representación gráfica se denomina Distribución de

Frecuencias de la población.
 La representación gráfica permite ver información que antes

no aparecía tan evidente.
 Por ejemplo, sin hacer ningún cálculo puede verse donde

está aproximadamente el promedio de la población.
30 29 Promedio
26
29 30 31
31
33 32
29 27 29
27 26 28 30 27
25
28 32 31
28 30 32
29 30 31
31 30
30 34
33 31
24 25 26 27 28 29 30 31 32 33 34 35
26
 También muestra cuales son los valores máximo y mínimo de la
población, es decir, el rango:
31 30
26 29
29
31 30 31
31 33 32
29 27 29
27 26 28 30 27
32 25
28 31
28 30 32
29 31 30 30
30 33 34
24 25 26 27 28 29 30 31 32 33 34 35
Rango
Recorrido o intervalo total
 En la siguiente tabla se presenta el motivo de la

consulta médica, durante una semana.
Motivo Consulta Número de pacientes

Bronquitis 19
Otitis 13
Heridas 7
Fracturas 18
Vacunas 20
27
 Tipos de frecuencias
1. Frecuencia o Frecuencia Absoluta: Es el número de veces que se
presenta un valor o categoría de una variable. Se repres enta por fi.
2. Frecuencia Relativa: La frecuencia relativa se puede expresar en
términos de porcentaje o de proporción y se representa por fr. (Es
la razón entre la frecuencia absoluta y el total de datos)
El formato general de una tabla estadística , llamada también TABLA

DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE FRECUENCIAS es
la siguiente:
Nombre de la variable Frecuencia
Categorías o Frecuencias
Recorrido de la variable Observadas
TOTAL n
Los siguientes datos corresponden a las notas obtenidas por

un curso de 24 alumnos en un trabajo de matemáticas:
3,2 4,2 5,6 6,0 2,8 3,9 4,2 4,2 5,0

5,0 3,9 3,9 3,2 3,2 4,2 5,6 6,0 6,0
3,2 6,0 4,2 5,0 5,6 5,0
Se Orde nan estos datos en una tabla conside rando:
• Nombre de variable : Nota

• Frecuencia Absoluta fi
• Frecuencia re lativa fr
Si el resultado es un decimal, se pueden usar 3 dígitos

después de la coma
28
Tabla de frecuencias de datos agrupados
Nota Frecuencia Frecuencia Frecuencia Relativa

Obtenida Absoluta Relativa Porcentual (%)
2,8
3,2
3,9
4,2
5,0
5,6
6,0
Tabla de frecuencias de datos agrupados
Nota Frecuencia Frecuencia Frecuencia Relativa

Obtenida Absoluta Relativa Porcentual (%)
2,8 1 0,041 4,166
3,2 4 0,166 16,666
3,9 3 0,125 12,500
4,2 5 0,208 20,833
5,0 4 0,166 16,666
5,6 3 0,125 12,500
6,0 4 0,166 16,666
29
 Hasta el momento sólo se ha trabajado con una pequeña cantidad de
datos.
• ¿Cómo se procede si se tiene muchos datos?
 Tabla de Distribución de Frecuencias agrupadas con
intervalos de clase o categorías
 En ocasiones, conviene agrupar los datos en intervalos, esto ayuda a
realizar un mejor análisis.
 Definiciones:
• Rango: Diferencia entre el máximo y el mínimo valor de una variable,
también denominado recorrido o intervalo total.
• Marca de clase: Representante de un intervalo, y corresponde al promedio

entre los extremos de éste.
• Tamaño de un intervalo: Es la fracción entre el valor del rango (intervalo

total) y la cantidad de intervalos que se desea obtener. Se recomienda
tomar como longitud de los intervalos un valor entero que sea mayor o igual
al cuociente obtenido.
 Una manera de caracterizar una población es construir una tabla distribución de
frecuencias o gráfico de frecuencias, siguiendo los siguientes pasos:
1. Se anota el valor máximo y el valor mínimo de la serie de datos que se está estudiando.
2. El número de clases o categorías se obtiene div idiendo la dif erencia del máximo y el mínimo
(rango o interv alo total) entre el tamaño del interv alo de clase (ic) deseado,
 número de clases=Rango/ic
3. El tamaño del interv alo de clase (ic) debe ser tal que no hay a ni excesiv as clases ni muy pocas,
puede usarse la Regla de Sturge.
Rango
Tamaño de ic 
1  3,322 log( N )
Rango, recorrido o intervalo total

Valor Mínimo
Valor Máximo
Tamaño del ic
30
4. También puede decidirse a priori en cuántas clases desean agruparse los datos,
entonces el tamaño del intervalo de clase es:
 Tamaño ic = Rango/número de clases
5. Se cuenta el número de datos que se encuentra dentro de cada intervalo

(frecuencia). Por ejemplo, si en el intervalo i hay ni observaciones, entonces ( ni =
N).
6. Para construir el gráfico, se coloca en el eje de horizontal los intervalos y se levanta

en cada intervalo un rectángulo de altura proporcional al número ni de datos dentro
del mis mo.
Los siguientes datos, expresados en metros, correspondientes

a las estaturas de 80 estudiantes de Cuarto año de Educación
Media.
1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92

1,75 1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77
1,73 1,75 1,78 1,77 1,67 1,83 1,83 1,72 1,71
1,85 1,84 1,93 1,82 1,69 1,70 1,81 1,66 1,76
1,75 1,80 1,79 1,84 1,86 1,80 1,77 1,80 1,76
1,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,75
1,78 1,77 1,74 1,73 1,83 1,76 1,83 1,77 1,75
1,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,76
1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77
31
Estatura Mayor: 1,93 metros
Estatura Me nor: 1,66 metros
Rango: 1,93 metros - 1,66 metros = 0,27 metros = 27 cm.
Se decide formar 6 clases o categorías – Cantidad de
intervalos
Para calcular el tamaño de inte rvalo se divide el Rango
27cm entre 6, obteniendo finalmente 4,5 ~ 5cm
Luego los intervalos de la tabla son:
Frecuencia
Intervalo Marca de Clase
Absoluta
1 ,65 – 1 ,69 n1
1 ,70 – 1 ,74 n2
1 ,75 – 1 ,79 n3
1 ,80 – 1 ,84 n4
1 ,85 – 1 ,89 n5
1 ,90 – 1 ,94 n6
Total N
1,66 1,66 1,67 1,67 1,67 1,7 1,71 1,72 1,72
1,69 1,72 1,73 1,73 1,74 1,75 1,75 1,75 1,76 Marca de
Intervalo Fi Fr
clase
1,72 1,73 1,74 1,75 1,75 1,75 1,76 1,77 1,78
1,65 1,69 1,67 6 0,075
1,74 1,75 1,76 1,76 1,77 1,77 1,77 1,79 1,79
1,70 1,74 1,72 12 0,150
1,76 1,77 1,77 1,77 1,79 1,79 1,8 1,8 1,81 1,75 1,79 1,77 30 0,375
1,76 1,77 1,78 1,79 1,8 1,81 1,82 1,82 1,83 1,80 1,84 1,82 22 0,275
1,85 1,89 1,87 8 0,100
1,77 1,79 1,8 1,83 1,83 1,83 1,83 1,84 1,84 1,90 1,94 1,92 2 0,025
1,81 1,83 1,83 1,84 1,84 1,84 1,85 1,86 1,92 80 1,000
1,84 1,86 1,87 1,87 1,88 1,88 1,88 1,93
Gráfico de Distribución de Frecuencias
35
Frecuencia Absoluta
30
25
20
15
10
5
0
1,65 – 1,69 1,70 – 1,74 1,75 – 1,79 1,80 – 1,84 1,85 – 1,89 1,90 – 1,94
Estatura (m)
32
 Hi stograma de Frecuencias “Peso de varones adultos”:
 Si se hace el área de cualquier rectángulo sobre el intervalo i-ésimo
igual a la frecuencia relativa fr = ni /N, el área total bajo el histograma
será igual a la unidad:
ni  ni  N
Area Total   Ai     1
N N N
0,20
0,18
0,16
Frecuencia Relativa
0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
60 66 72 78 84 90 96
Pe so Kg.
 El Histograma obtenido muestra la distribución de
frecuencias de la población, peso de varones adultos.
 Esta distribución de frecuencias muestra las características

de una población, por ejemplo, si hay resultados que son
mas frecuentes que otros.
 Muestra si los valores están ubicados alrededor de un valor

central, si están muy dispersos o poco dispersos.
 Se observar que fracción de todas las mediciones cae entre

el rango de 70 y 80 Kg. (Zona rayada en el gráfico):
33

0,20
0,18
0,16
Frecuencia Relativa
0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
60 66 72 78 84 90 96
Pe s o Kg.
 Si se elige una persona del grupo y se le pesa, el resultado
es un dato que pertenece a la población de datos
representada en el gráfico.
• Se dice estar extrayendo un dato de la población de datos.

 Pero hay distintas maneras de elegir la persona, es decir,
distintas maneras de realizar la extracción del dato.
 Si el observador se coloca frente al grupo y elige una

persona, se podría seleccionar al más gordo, al más flaco o
al más alto (y por lo tanto pesa más que otros), de acuerdo a
criterios subjetivos que no se pueden evitar.
34
 En cambio, si se escribe los nombres

de todas las personas en una
etiqueta, y se introducen todas las
etiquetas en una caja y luego se
retira una etiqueta, la selección no
estará influida por la del observador
subjetividad.
Juan
 En este caso, se dice que la
extracción es aleatoria.
 Una extracción aleatoria es aquella en que cada miembro
de la población tiene la misma posibilidad de ser elegido.
 Si se realiza una extracción aleatoria de la población

anterior y se obtiene el valor y.
 Entonces:
1. La probabilidad P (y<70) de que y sea menor que 70 Kg. es igual al

área del histograma a la izquierda de 70 Kg.
2. La probabilidad P (y>70) de que y sea mayor que 70 Kg. es igual al

área del histograma a la derecha de 70 Kg.
3. La probabilidad P (y>70, y< 80) de que y sea mayor que 70 Kg.

pero menor que 80 Kg. es igual al área del histograma entre 70 y
80 Kg.
35
No. Dato 1 Dato 2 Dato 3 Dato 4 Dato 5
1 10.7 10.7 10.7 10.7 10.9
 Asignación 1: 2 10.8 10.9 10.8 10.9 10.7
 En una empresa durante 24 3 10.8 10.8 10.8 10.7 10.8

4 10.6 10.7 10.7 10.8 10.7
días se han anotado 5 5 10.7 10.8 10.7 10.9 10.8
observaciones de una variable 6 10.6 10.8 10.8 10.9 10.7
dada, obtener: 7 10.6 10.8 10.7 10.8 10.8
8 10.6 10.8 10.7 10.8 10.7
• Má ximo dato obtenido
9 10.7 10.8 10.9 10.9 10.8
• Menor dato obtenido 10 10.6 10.7 10.6 10.8 10.7
• Rango 11 10.8 10.8 10.9 10.5 10.9
• Dato que más se repite 12 10.9 10.8 10.9 10.7 10.7
• Construir tabla de 13 10.7 10.7 10.8 10.8 10.7
14 10.7 10.7 10.9 10.8 10.6
frecuencias con 7 intervalos.
15 10.8 10.8 10.8 10.8 10.7
• Construir Histograma de 16 10.9 10.8 10.8 10.8 10.9
frecuencias. 17 10.8 10.7 10.9 10.7 10.8
• Cuál es la probabilidad que 18 10.8 10.7 10.6 10.7 10.6
un dato sea mayor a 10,7 19 10.7 10.7 10.9 10.7 10.7
20 10.6 10.6 10.7 10.6 10.7
• Cuál es la probabilidad que
21 10.5 10.0 10.7 10.8 10.8
esté comprendido entre 10,4 22 10.8 10.7 10.8 10.7 10.7
y 10,6 23 10.7 10.6 10.7 10.6 10.7
24 10.7 10.7 10.7 10.6 10.7
 Asignación 2:
• En su lugar de trabajo seleccionar una población física a estudiar.
• Describirla y delimitarla.
• Especificar la poblaciones estadísticas que serán objeto de estudio.
• De esta, seleccione las variables a caracterizar estadísticamente.
• Tipo de variable, valores que toma.
• Datos a rec oger para caracterizar la(s) variable(s) objeto de estudio
• Tipo de datos
• Procedencia de los datos.
• Reglas para su expresión.
• Formas de obtención y manejo.
• Parámetros y estadísticos de interés.
36
Medidas de Tendencia Central
 Las medidas de tendencia central son:
• Promedio aritmético simple - Media
• Promedio geométrico simple
• Promedio armónico simple
• Mediana
• Modo
• Promedio aritmético en distribución de frecuencias
• Mediana en distribución de frecuencias
 Medidas de posición
• Cuartiles
• Percentiles
 La media, mediana y modo describen alrededor de cuáles
valores se agrupan los datos.

 Promedio aritmético simple: n
x1  x 2  x3  .....  x n x
i1
i
X 
n n
 Promedio geométrico simple:

__
X g  n x1. x 2. x 3 ... x n
 Promedio armónico simple:

__
n n
Xh  n
1 1 1 1 1
  ...
x1 x 2 x3 x n  i 1 x i
Dados 3, 2, 3, 6, 4, 5
__ __ __
Calcular X , X g , X h , la mediana y el modo
37
 Promedio aritmético distribución de frecuencias
n
x
i 1
i fi
X n
f
i 1
i
70 66 72 68 70 68 69 68 70 71 75 76
70 69 73 66 70 70 71 65 66 71 69 71 Li Ls xi fi
62 64 63 5
70 73 74 70 70 69 72 74 69 71 73 67
65 67 66 14
67 70 66 64 71 72 63 66 69 72 69 70
68 70 69 43
68 64 73 74 66 72 71 73 71 71 69 65
71 73 72 27
68 67 71 71 67 70 70 72 67 70 68 68
74 76 75 7
70 68 67 64 70 71 68 68 64 68 72 69
N = 96
70 72 76 70 69 71 70 72 69 69 70 75
__
63 * 5  66 * 14  69 * 43  72 * 27  75 * 7 6675
X    69 ,53
96 96
Medidas de posición
 Cuartiles
• Son los valores de la distribución de frecuencias que la dividen en 4
partes iguales.
• Q1 es el primer cuartil:
•25% de las frecuencias se encuentran por debajo de él.
•75% de las frecuencias se encuentran por encima de él.
• Q2 es el segundo cuartil (mediana)
• Q3 es el tercer cuartil:
 p. N 
  f a1 
Q p  Li   4 .ic donde p  1, 2 ó 3
 fi 
 
 
38
Medidas de Dispersión
 Las medidas de dispersión son:
• Rango
• Desviación Media
• Varianza
• Desviación típica o estándar.
 Estas medidas indican qué tan agrupados alrededor de un valor se
encuentran los datos.
 Permiten medir la variabilidad de los datos obtenidos con respecto al
valor central representativo.
 En qué medida se alejan los valores individuales del promedio
 Datos no agrupados o en series simples
 Recorrido, intervalo total o rango:
• Valor mayor – Valor menor
 La desviación media __
x i x
DM 
N
 Varianza __
2  ( xi  x ) 2
S 
N
 La desviación típica o estándar __

( xi  x) 2
S
N
39
 Datos agrupados en distribución de frecuencias
 Recorrido, intervalo total o rango:

• Valor mayor – Valor menor
 La desviación media __
x i  x * fi
DM 
N
 Varianza __
 ( x i  x )2 * f i
2
S 
N
 La desviación típica o estándar __

( xi  x) 2 * f i
S
N
 Desviación típica en Distribución de Frecuencias
70 66 72 68 70 68 69 68 70 71 75 76
70 69 73 66 70 70 71 65 66 71 69 71 __ 63 * 5  66 *14  69 * 43  72 * 27  75 * 7 6675
X   69,53
70 73 74 70 70 69 72 74 69 71 73 67 96 96
67 70 66 64 71 72 63 66 69 72 69 70
68 64 73 74 66 72 71 73 71 71 69 65
68 67 71 71 67 70 70 72 67 70 68 68
70 68 67 64 70 71 68 68 64 68 72 69
70 72 76 70 69 71 70 72 69 69 70 75
Li Ls xi Fi Fr Fa Fra xi.Fi xi-ẋ (xi-ẋ)2 (xi-ẋ)2.Fi

62 65 63,5 5 0,052 5 0,052 315 -6,53 42,64 213,20
65 68 66,5 14 0,146 19 0,198 924 -3,53 12,46 174,45
68 71 69,5 43 0,448 62 0,646 2967 -0,53 0,28 12,08
71 74 72,5 27 0,281 89 0,927 1944 2,47 6,10 164,72
74 76 75,5 7 0,073 96 1,000 525 5,47 29,92 209,45
N= 96 6675 773,91
__
 ( x i  x) 2 * f i 773,91
S   8,06  2,84
N 96
40
Medidas de Tendencia Central y Dispersión
70 66 72 68 70 68 69 68 70 71 75 76
70 69 73 66 70 70 71 65 66 71 69 71 __ 63 * 5  66 *14  69 * 43  72 * 27  75 * 7 6675
X   69,53
70 73 74 70 70 69 72 74 69 71 73 67 96 96
67 70 66 64 71 72 63 66 69 72 69 70
68 64 73 74 66 72 71 73 71 71 69 65
__
68 67 71 71 67 70 70 72 67 70 68 68
( x i  x ) 2 * f i 773 ,91
70 68 67 64 70 71 68 68 64 68 72 69 S   8, 06  2,84
70 72 76 70 69 71 70 72 69 69 70 75 N 96
N 96
Min 63
Max 76
Rango 13
IC 1,63
Solución Excel
No. Clases 7,97
Ẋ 69,61
Md 70
Mo 70
S 2,71
Medidas de Tendencia Central y Dispersión

Asignación 3 :
Los siguientes datos corresponden al peso de 80 personas en kilogramos,
que han sido ordenados. Se requiere:
1. Especificar la población estadística, variable de estudio, su

definición y unidad de medida.
2. Ordenarlos en una tab la de distribución de frecuencias.
3. Cuáles son los valores mínimo y máximo registrados.
4. Qué porcentaje de la población pesa menos de 50 Kg.
5. Cuál es el peso promedio de la población.
6. Cuál es la mediana de la población y el modo.
7. Qué valor separa el 75% superior de la distribución de frecuencias.
8. Cuál es la desviación típica de la pob lación.
41

1 Estadistica PDF

Cargado por

Copyright:

Formatos disponibles

También podría gustarte

1 Estadistica PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

1 Estadistica PDF

Cargado por

Copyright:

Formatos disponibles

Estadística Aplicada

• Tratamiento y análi si s de datos

• Tarea previ a a parci al 1: 15%

• Elconocimiento implica la formulación

• La información de partida, en este caso,

 Por lo que se usa la Estadística como herramienta.

 Sin duda, fueron los romanos, maestros de la organización política,

• Cada cinco años realizaban un censo de la población, cuyos datos de:

 La palabra e stadística comenzó a usarse en el siglo XVIII, en Alemania,

 Hoy la estadística tiene gran importancia, no sólo por que presenta

 La inducción permite formular generalizaciones acerca de la naturaleza

 Al contrario que la deducción la cual conduce a establecer, sobre la

 Se dice que la deducción es un razonamiento a priori, mientras de la

• Esto ayuda a comprobar teorías o determinar las relaciones existentes entre

• En las ciencias sociales, las técnicas estadísticas se usan para predecir el

• En el campo médico, los métodos estadísticos se aplican en pruebas

Todo estudio estadístico debe considerar

Variables Cuantitativas: Relacionadas con

 En la estadística, la información de partida son los datos

 Los datos se obtienen de alguna fuente, se aplican las

 Estas conclusiones sirven de base para tomar

 Manejo de los datos:

 A un conjunto muy grande de datos numéricos para

Universo de Generadores Eléctricos en Venezuela

Pobl ación o Uni verso

 La Estadística trabaja con poblaciones de datos y con

 Los conceptos de población y muestra a veces resultan

 Podría referirse al universo o población

 Pero cuando se habla en términos

• La población de habitantes, es decir, las personas que habit an la

 El técnico toma una pequeña porción, por ejemplo, 100 gramos, lo

 Hasta el momento, la muestra no fue analizada y por lo tanto no se

 Como se tenían 10 toneladas de producto y las muestras son

 Este conjunto de datos numéricos es el universo o población de

 No debe confundirse esta muestra (Desde el punto de vista

 Muchas veces el universo o población de datos a veces no

 El laboratorio enviará sólo 5 resultados, y se tiene una muestra

 Y se piensa en el universo o población que tendría si se

 Muchas veces resulta difícil imaginarse cual es el universo del

 Se cuenta con 5 resultados, es decir

 ¿Cuál es el universo al cual

• Si la máquina continuara trabajando en las mismas condiciones:

 Entonces, encarga una encuesta a una empresa

 Estos datos son una muestra de 20 observaciones del

 Además, esa población de datos es seguramente diferente

•¿Qué representa una Población de datos?

Población real Población estadística

 El universo de datos generados por la encuesta sirve a los

 Para cada lote se mide una característica de calidad,

 Es importante destacar que detrás de un universo o población de datos

 Es esa población física subyacente (Elementos de la realidad, seres

 Al utilizar métodos estadísticos, no confundir la población

 En adelante, cuando se use los términos población o

 Estos números pueden estar en un gran listado o puede ser un conjunto

 Puede imaginars e los números pero no se tienen realmente.

 Una gran tabla de números ordenados al azar prácticament e no muestra

 Suponiendo que se tienen los datos del univers o

• ¿Cómo pueden clasificarse y ordenarse los números