Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apuntes Estadisticas
Apuntes Estadisticas
Apuntes de Estadsticas
ESTADSTICA
INTRODUCCIN
La palabra Estadstica ha sido frecuentemente utilizada para referirse a la informacin
cuantitativa (o numrica). Tambin se ha utilizado para referirse a los mtodos que tratan la
informacin. Sin embargo, cabe hacer notar que existe una diferencia entre lo que se entiende
por mtodo estadstico y dato estadstico (o informacin). En resumen podramos decir que:
La Estadstica es un cuerpo de conceptos y mtodos empleados para recolectar e
interpretar datos referentes a un rea de investigacin particular y para extraer conclusiones en
situaciones en que la incertidumbre y la variabilidad estn presentes
Para ilustrar ms esta situacin podemos considerar por ejemplo:
Cuando un lector tiene pocos hechos numricos, puede utilizar la informacin numrica
en la mxima extensin sin perder mucho tiempo o pensar demasiado en analizar los hechos.
Examinemos la informacin:
Juan tiene 22 aos y Mara tiene 18.
Un lector puede fcilmente interpretar la informacin de muchas maneras diferentes. Por
ejemplo, Juan es un hombre joven de 22 aos de edad, pero es cuatro aos mayor que Mara. Sin
embargo, cuando un lector tiene un gran volumen de hechos numricos, puede encontrar que la
informacin le es de poco valor, puesto que no puede interpretarla toda al mismo tiempo. Note la
siguiente informacin:
Juan tiene 22 aos, Mara tiene 18 aos, Jaime tiene 25 aos, Pedro
tiene 16 aos, y as sucesivamente para 1,000 estudiantes seleccionados
en Swan College en octubre 1, 1966.
Un lector tendra ciertamente dificultad en interpretar inteligentemente la distribucin de
edades.
El gran volumen de informacin numrica origina la necesidad de mtodos sistemticos,
los cuales puedan ser utilizados para organizar, presentar, analizar e interpretar la informacin
efectivamente. De esta manera pueden extraerse conclusiones vlidas y tomarse decisiones
razonables mediante el uso de los mtodos. Los mtodos estadsticos son desarrollados
primeramente para llenar esta necesidad.
DATOS ESTADSTICOS
Informacin cuantitativa o numrica puede encontrarse casi dondequiera: en negocios,
economa y muchas otras reas. Por ejemplo, el precio marcado de un sombrero es mostrado en
un cierto nmero de dlares, la situacin de empleo en una nacin es expresada en un nmero de
personas, la inscripcin en una universidad es registrada mediante un nmero de estudiantes, la
distancia recorrida por un agente de ventas es reportada en nmero de millas y la edad de una
persona es representada por un nmero de aos. Sin embargo, no toda la informacin
cuantitativa es considerada como dato estadstico. La informacin cuantitativa apropiada para
anlisis estadstico debe ser un conjunto (o conjuntos) de nmeros que muestren relaciones
significativas. En otras palabras, los datos estadsticos son nmeros que pueden ser comparados,
analizados e interpretados. Un nmero aislado que no se compara o que no muestra relacin
significativa con otro nmero no es dato estadstico.
En el ejemplo de arriba, la edad de Juan a solas no constituye dato estadstico si no hay
otra disponible para comparacin. Sin embargo, las edades de 1,000 estudiantes son datos
estadsticos, puesto que las edades pueden ser comparadas y analizadas, y los resultados del
anlisis pueden ser interpretados. Tambin las llamadas estadsticas de un paciente tal como
son medidas por un doctor no son datos estadsticos, puesto que cada medida, tal como la
estatura, no muestra relacin significativa con otras medidas, tal como el nmero de pulsaciones
por minuto o la medida de la vista del paciente. Sin embargo, la informacin relativa a las
estaturas de todos los pacientes dentro de un cierto perodo de tiempo si son datos establecidos,
puesto que las estaturas pueden ser comparadas, analizadas e interpretadas de acuerdo con sus
relaciones.
El rea de la cual los datos estadsticos son recopilados es generalmente referida como la
poblacin o universo. Una poblacin puede ser finita o infinita. Una poblacin finita tiene un
nmero limitado de individuos u objetos, mientras que una poblacin infinita tiene un nmero
ilimitado. Por ejemplo, una clase de ingls de 25 estudiantes es una poblacin finita. El nmero
de estudiantes universitarios en los Estados Unidos durante el pasado, presente y futuro, es
ilimitado; por lo tanto, tales estudiantes forman una poblacin infinita.
La tarea de recopilar un conjunto completo de datos de una poblacin finita pequea es
relativamente simple. Si deseamos obtener las edades de 25 estudiantes en la clase de ingls,
podemos simplemente preguntar a cada estudiante su edad; as tenemos un conjunto completo de
datos. Sin embargo, recopilar tales datos de una poblacin finita pero grande, es algunas veces
imposible o imprctico. Recopilar un conjunto completo de datos concernientes a las edades de
todos los estudiantes de las escuelas de los Estados Unidos en octubre 1, 1966, por ejemplo,
puede ser imprctico, aunque es posible, debido al tiempo y costo consumidos. La recopilacin
de datos completos de una poblacin infinita es definitivamente imposible.
A fin de evitar la tarea imposible o imprctica, usualmente se extrae una muestra de
elementos representativos de la poblacin. La muestra es, entonces, utilizada para el estudio
estadstico y los resultados de la muestra son usados como las bases para describir, estimar o
predecir las caractersticas de la poblacin. Supongamos que los 1.000 estudiantes presentados
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
anteriormente son representativos de los estudiantes de Swan College y son seleccionados del
total de 30.000 estudiantes en 1966 (poblacin). El conjunto de datos recopilados concernientes
a las edades de los 1,000 estudiantes es una muestra, y un investigador puede usar estos
resultados para estimar o predecir las edades de todos los estudiantes en la universidad.
MTODOS ESTADSTICOS
De acuerdo con el orden de aplicaciones en un estudio estadstico, los mtodos
estadsticos son divididos en cinco pasos bsicos 1) recopilacin, 2) organizacin, 3)
presentacin, 4) anlisis y 5) interpretacin.
En el ejemplo de arriba, si el encargado de los estudiantes de Swan College desea conocer
el grupo de edad tpico de los estudiantes en la universidad, puede primero, recopilar datos
estadsticos concernientes a las edades de un grupo representativo de estudiantes de la
universidad digamos 1.000 estudiantes de la poblacin de 30.000 estudiantes. (El tamao
apropiado de una muestra se expondr ms adelante). Segundo, puede organizar las edades
recopiladas clasificndolas en diferentes grupos de edad. Tercero, puede presentar los datos
organizados en forma tabular, tal como la que se muestra en la tabla 1.1. Cuarto, puede analizar
las edades presentadas en la tabla para obtener la informacin deseada. Por ejemplo, l puede
encontrar que el grupo de edad tpica de los estudiantes en la universidad es el grupo de edad 18
y menos de 20 puesto que es el que contiene el mayor nmero de estudiantes, o sea 600
estudiantes como se muestra en la tabla. Quinto, el encargado puede interpretar los resultados de
su anlisis de la muestra sealando que las edades tpicas de todos los estudiantes en la
universidad son de 18 a menos de 20 aos.
Estrictamente hablando, no hay lnea de divisin definitiva que separe los cinco pasos
bsicos. Algunos de los mtodos pueden ser usados en ms de un paso. En el ejemplo de arriba,
el mtodo de clasificar los grupos de edad usados en el paso de organizacin est estrechamente
relacionado con los mtodos empleados en el paso de anlisis. Realmente, las clasificaciones de
los grupos de edad son determinadas por la intencin del encargado al obtener el tipo de
informacin de los datos en el anlisis. Sin embargo, la divisin nos da un orden lgico para
estudiar los mtodos estadsticos.
Tabla 1.1.
Edades de 1.000 estudiantes seleccionados en la UTFSM.
Edades
Menos de 18
18 y menos de 20
20 y menos de 22
22 y ms
TOTAL
Fuente: Datos hipotticos.
1.
Nmero de estudiantes
hombres
120
500
100
30
750
Nmero de estudiantes
mujeres
50
100
80
20
250
Total
170
600
180
50
1.000
ESTADSTICA DESCRIPTIVA
La Estadstica interviene en la investigacin a travs de la Experimentacin.
La investigacin contempla una serie de pasos que estn ntimamente relacionados con los
pasos mencionados anteriormente. Como son:
1.
2.
2.
3.
4.
Tabulacin y Descripcin de
Resultados (Anlisis)
5.
Inferencia Estadstica
Recoleccin de datos.
APLICACIN DE LA ESTADSTICA
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
2.1.
AREAS DE APLICACIN
La estadstica, prcticamente se puede utilizar en todas las actividades del ser humano,
donde se presenta con mayor incidencia es en: Economa, Agronoma, Pesquera, Informtica,
Prevencin de Riesgos, Control del Medio Ambiente, Control de Alimentos, Qumica Analtica,
Medicina, etc., en general en todas las reas donde se necesite realizar una investigacin.
2.1.1. Malos usos de la Estadstica
La estadstica es una herramienta cientfica. Su valor depende de cmo uno la utilice
como herramienta. Sin embargo, la estadstica es mal utilizada muy frecuentemente en muchos
lugares. El Norfolk Virginian-Pilot imprimi el siguiente fragmento de diversin en la pgina
principal en marzo 25, 1963: Risas de hoy--- Si el hombre est parado con su pie derecho sobre
un horno encendido y su pie izquierdo en un congelador, algunos estadsticos aseveraran que, en
promedio, l est confortable.
Puesto que los estudiantes a este nivel no estn an familiarizados con los mtodos
estadsticos, el propsito de esta seccin es solamente indicar los malos usos comunes de datos
estadsticos, sin incluir el uso de mtodos estadsticos complicados. Un estudiante debera estar
alerta en relacin con estos malos usos y debera hacer un gran esfuerzo para evitarlos a fin de ser
un verdadero estadstico. Las fuentes de los ejemplos en la siguiente exposicin no son
indicadas, puesto que puede causar dificultades.
a.
Los datos estadsticos son usados como la materia prima para un estudio estadstico.
Cuando los datos son inadecuados, la conclusin extrada del estudio de los datos se vuelve
obviamente invlida. Por ejemplo, supongamos que deseamos encontrar el ingreso familiar
tpico del ao pasado en la ciudad Y de 50,000 familias y tenemos una muestra consistente del
ingreso de solamente tres familias: $ 1 milln, $ 2 millones y no ingreso. Si sumamos el ingreso
de las tres familias y dividimos el total por 3, obtenemos un promedio de $ 1 milln. Entonces,
extraemos una conclusin basada en la muestra de que el ingreso familiar promedio durante el
ao pasado en la ciudad fue de $ 1 milln. Es obvio que la conclusin es falsa, puesto que las
cifras son extremas y el tamao de la muestra es demasiado pequeo; por lo tanto la muestra no
es representativa. Hay muchas otras clases de datos inadecuados. Por ejemplo, algunos datos
son respuestas inexactas de una encuesta, porque las preguntas usadas en la misma son vagas o
engaosas, algunos datos son toscas estimaciones porque no hay disponibles datos exactos o es
demasiado costosa su obtencin, y algunos datos son irrelevantes en un problema dado, porque el
estudio estadstico no est bien planeado.
b.
Sesgo significa que un usuario d los datos perjudicialmente de ms nfasis a los hechos,
los cuales son empleados para mantener su predeterminada posicin u opinin. Los estadsticos
son frecuentemente degradados por lemas tales como Hay tres clases de mentiras: mentiras,
mentiras reprobables y estadstica, y Las cifras no mienten, pero los mentirosos piensas.
Hay dos clases de sesgos: conscientes e inconscientes. Ambos son comunes en el anlisis
estadstico. Hay numerosos ejemplos de sesgos conscientes. Un anunciante frecuentemente usa
la estadstica para probar que su producto es muy superior al producto de su competidor. Un
poltico prefiere usar la estadstica para sostener su punto de vista. Gerentes y lderes de
trabajadores pueden simultneamente situar sus respectivas cifras estadsticas sobre la misma
tabla de trato para mostrar que sus rechazos o peticiones son justificadas.
Es casi imposible que un sesgo inconsciente est completamente ausente en un trabajo
estadstico. En lo que respecta al ser humano, es difcil obtener una actitud completamente
objetiva al abordar un problema, aun cuando un cientfico debera tener una mente abierta. Un
estadstico debera estar enterado del hecho de que su interpretacin de los resultados del anlisis
estadstico est influenciado por su propia experiencia, conocimiento y antecedentes con relacin
al problema dado.
c.
Supuestos falsos
2.2.
Variable:
Dato
Poblacin
Muestra
Censo
Estadstica Es una funcin o frmula que depende de los datos de la muestra (es
variable).
2.3.
Parmetro
Ejemplo
MUESTREO
Una muestra es representativa en la medida que es imagen de la poblacin.
En general, podemos decir que el tamao de una muestra depender principalmente de:
La poblacin
Parmetros a medir.
Existe una gran cantidad de tipos de muestreo. En la prctica los ms utilizados son los
siguientes:
MUESTREO ALEATORIO SIMPLE:
Es un mtodo de seleccin de n unidades extradas de N, de tal manera que cada una de
las posibles muestras tiene la misma probabilidad de ser escogida.
(En la prctica, se enumeran las unidades de 1 a N, y a continuacin se seleccionan n
nmeros aleatorios entre 1 y N, ya sea de tablas o de alguna urna con fichas numeradas).
Ejemplo:
Considere la produccin de TV de una Compaa en un determinado turno, la cual es de
N = 35 televisores. Para efectos de Control de Calidad de una de sus partes, supongamos la
pantalla, se desea extraer una muestra aleatoria simple de tamao n = 5. Si los 35 TV producidos
son numerados del 1 al 35, una posible muestra podra ser 3, 5, 18, 23, 30.
Cuntas muestras posibles hay?
MUESTREO ESTRATIFICADO ALEATORIO:
Se usa cuando la poblacin est agrupada en pocos estratos, cada uno de ellos son muchas
entidades. Este muestreo consiste en sacar una muestra aleatoria simple de cada uno de los
estratos. (Generalmente, de tamao proporcional al estrato).
MUESTREO SISTEMTICO:
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
10
Poblacin
Datos X1,
X2... Xn
2.4.
Recopilar
Organizar
Presentar
Analizar
Descripcin
VARIABLES
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
Conclusin
11
Variables categricas:
Son aquellas que pueden ser representadas a travs de smbolos, letras, palabras, etc. Los
valores que toman se denominan categoras, y los elementos que pertenecen a estas categoras, se
consideran idnticos respecto a la caracterstica que se est midiendo. Ejemplo:
Variable: Profesin:
Valores que pueden tomar la variable:
Programador
Tcnico en Control de Alimentos
Tcnico en Prevencin de Riesgos
Tcnico en Control del Medio Ambiente
Qumico Analtico
Tcnico Mecnico
Etc.
Las variables categricas de dividen en dos tipos: Ordinal y Nominal.
Las Ordinales, son aquellas en que las categoras tienen un orden implcito. Admiten
grados de calidad, es decir, existe una relacin total entre las categoras.
Ejemplo:
Variable: Nivel de estudio de Enseanza Bsica.
Valores que toma la variable:
Primero Bsico
Segundo Bsico
Tercero Bsico
..........
Octavo Bsico
A pesar de que esta variable admite grados de calidad, no es posible cuantificar la
diferencia.
Las nominales, son aquellas donde no existe una relacin de orden.
b.
Variables numricas
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
12
Se
Discretas: son aquellas que toman sus valores en un conjunto finito o infinito numerable.
Ejemplo:
Variable: Nmero de sillas por sala.
Valores que toma la variable: 0, 1, 2, 3, ......n.
Continuas: Son aquellas que toman sus valores en un subconjunto de los nmeros reales,
es decir en un intervalo.
Ejemplo:
Variable: Temperatura de Valparaso en verano.
Valores que toma la variable: entre 5 grados y 30 grados. (5 , 30).
Observacin:
En general para las variables continuas el hombre ha debido inventar una medida para
poder establecer una medicin de ellas:
Ejemplo: El metro, la hora.
2.5.
ORGANIZACIN DE DATOS
Supongamos que para estudiar una variable se han definido K clases C1, C2, ....., Ck.
Observacin: Ci puede ser un nmero, un intervalo o una categora.
Algunos conceptos de inters:
n =n
i =1 i
k
i =1
fi = 1
Observacin:
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
13
Las dos definiciones dadas tienen sentido cuando se trabaja en cualquier escala de
medida.
Los conceptos siguientes pueden definirse slo si las clases Ci pueden ordenarse.
Frecuencia Absoluta Acumulada (Ni).
N i = i =1 ni
j
( j = 1...k )
Note que N 1 = n1 yN k = n
PRESENTACIN DE LA INFORMACIN
Tablas de Frecuencias (Modelo General)
CLASE
C1
C2
.
.
Ck
FRECUENCIA
ABSOLUTA
N1
N2
FRECUENCIA
RELATIVA
f1
f2
FRECUENCIA
ABSOLUTA-ACUM.
N1
N2
FRECUENCIA
RELATIVA ACUM.
F1
F2
Nk
fk
Nk= n
Fk = 1
TOTAL
OBSERVACIONES:
1. Si la variable es nominal las ltimas 2 columnas carecen de sentido.
2. En el caso de variables continuas o variable de tipo discreta, cada clase C1 puede ser
representada por un valor numrico X1 llamado MARCA DE CLASE.
3. Cada tabla de frecuencia, debe contar con un nombre en el cual se especifique la
informacin que contiene.
Ejemplo:
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
14
Sea la variable X, definida como: Marca de bebidas gaseosas preferidas por los alumnos
de la Universidad. Se consider una muestra de tamao n = 20, obtenindose los siguientes
resultados: Sprite 4, Fanta 5, Coca-cola 8, Bilz 0, Pepsi 3.
Luego tenemos que:
Variable X: Marca de bebidas gaseosas preferidas por los alumnos.
Tipo de Variable: Categrica-nominal.
La tabla de frecuencias ser:
Tabla 2.1.
Bebida gaseosa preferida por una muestra de 20 alumnos de la Universidad
I
1
2
3
4
5
MARCA
Sprite
Fanta
Coca Cola
Bilz
Pepsi
ALUMNOS
4
5
8
0
3
fi
0.20
0.25
0.40
0.00
0.15
20
1.00
TOTAL
CALIFICACIN
CONSUMIDORES
fi
Ni
1
2
3
4
5
Muy Bueno
Bueno
Regular
Malo
Muy malo
8
15
10
4
3
0.200
0.375
0.250
0.100
0.075
8
23
33
37
40
40
1.000
Total
Observacin:
Fi
0.200
0.575
0.825
0.925
1.000
15
Debido a que la variable es del tipo categrica nominal, las dos ltimas columnas son
presentadas y tienen sentido, no as en el ejemplo anterior.
Si en alguna ocasin la suma de las frecuencias relativas no es 1, deber ser solamente por
la aproximacin de los decimales de alguna de las fi.
Los datos siguientes representan las respuestas de 30 trabajadores de una empresa, a la
consulta de: Cuntos hijos tienen?
3
1
0
5
1
2
4
0
3
2
1
3
0
3
4
5
2
2
2
1
1
2
4
3
3
7
2
2
2
1
En este caso tenemos que la variable X est dada por: Nmero de hijos por trabajador, y
es de tipo numrica discreta.
La tabla de frecuencia en este caso quedar de la siguiente manera:
Tabla 2.3.
Nmero de hijos por trabajador
I
CALIFICACIN
CONSUMIDORES
1
2
3
4
5
6
7
8
0
1
2
3
4
5
6
7
Total
3
6
9
6
3
2
0
1
40
fi
0.10
0.20
0.30
0.10
0.067
0.000
0.033
Ni
3
9
18
24
27
29
29
30
Fi
0.10
0.30
0.60
0.80
0.90
0.967
0.967
1.000
1.000
40
28
40
52
58
53
27
61
18
45
25
43
64
34
26
37
36
28
30
44
37
42
35
52
16
17
Paso 3 Determinar la amplitud de los intervalos, es decir Ci, i = i, 1, 2...k, como sigue:
C =
R/k
Donde
El valor de C estar dado por la unidad de medida, si no es exacto, siempre se
aproxima el valor superior.
Paso 4 Determinar unidades auxiliares, como generalmente el valor de C es
aproximado hacia arriba, para que todos los intervalos de clase tengan la
misma amplitud, es
necesario agregar una cantidad de p unidades
determinadas por:
P = (C * k) R
18
Ls2 = LI2 + C
LIK = Ls(k-1),
Lsk = Lik + C
Siendo L sk = (M + p + 1u/2 )
Paso 6 Se determina un representante de los intervalos de clase, el cul recibe el
nombre de Marca de Clase, y est dado por el punto medio de cada intervalo,
es decir:
Lmite int erior + Lmite sup erior
Xi =
2
Luego la tabla de frecuencias se forma de la siguiente manera:
I
TOTAL
ni
fi
1
2
.
.
K
C1
C2
n1
n2
f1
f2
Ck
nk
fk
Ni
Fi
X2
N1
N2
F1
F2
X2
X2
Nk= n
Fk= 1
Xk
19
XR
17.5-25.5
25.5-33.5
33.5-41.5
41.5-49.5
49.5-57.5
57.5-65.5
ni
3
5
10
4
3
3
28
fi
0.11
0.18
0.3
0.14
0.11
0.11
1.0
Ni
3
8
18
22
25
28
Fi
0,.11
0.29
0.64
0.78
0.89
1.00
Xi
21.5
29.5
37.5
45.5
53.5
61.5
XA = Intervalos aparentes.
XR = Intervalos reales.
En general no es necesario que una tabla de frecuencias incluya ambos intervalos.
Representacin grfica
Actualmente, se rene con mucha frecuencia al lenguaje visual, se puede apreciar esto en
la prensa, televisin, computacin, etc., esto deja de manifiesto lo importante que es el
comunicarse de esta forma con otras personas. Su importancia radica principalmente en el hecho
que esta comunicacin es masiva, es decir, muchas personas pueden acceder a la informacin a
travs de este medio. La Estadstica utiliza tambin esta tcnica de comunicacin de tal manera
de poder transmitir informacin a un gran nmero de personas, las cuales no necesitan tener
conocimiento de Estadstica.
A continuacin se presentan algunos tipos de grficos utilizados con ms frecuencia.
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
20
Tabla A.
Notas de los 30 alumnos de un curso.
Notas
1
2
3
4
5
6
7
Total
ni
2
5
6
7
5
3
2
30
fi
0.067
0.167
0.200
0.233
0.167
0.100
0.067
1.001 1.0
Ni
2
7
13
20
25
28
30
Fi
0.067
0.234
0.434
0.667
0.834
0.934
1.001
Tabla B
Distancia en metros recorridos por 50 ejemplares de una variedad
de caracoles en un da
CLASE
1
2
3
4
5
6
7
TOTAL
X
7.1 7.7
7.7 - 8.3
8.3 8.9
8.9 9.5
9.5 10.1
10.1 - 10.7
10.7 - 11.3
ni
2
2
6
14
12
10
4
50
fi
0.04
0.04
0.12
0.28
0.24
0.20
0.08
1.00
Ni
2
4
10
24
36
46
50
Fi
0.04
0.08
0.20
0.48
0.72
0.98
1.00
Xi
7.4
8.0
8.6
9.2
9.8
10.4
11.0
21
REPRESENTACIN GRFICA
Generalmente se usa la representacin cartesiana en el plano, con un par de ejes
coordenadas para representar el par (punto, m frecuencia) el cual puede estar acompaado por
barras o unidos por una poligonal para destacar ms las caractersticas de la distribucin.
NOTAS DE ALUMNOS (Tabla A)
8
Tabla A
7
6
Ni
5
4
3
ni
2
1
0
1
Nota (Xi)
ni
4
2
0
1
22
TABLA B
Histograma
Fi
Ni
0,28
14
0,24
12
0,20
10
0,16
0.12
0,08
0,04
2
6,8
7,1
7,7
8,3
8,9
9,5
10,1
10,7
11,3
11,6
XR
10,1
10,7
11,3
11,6
XR
Poligono de Frecuencia
fi
Ni
0,28
14
0,24
12
0,20
10
0,16
0.12
0,08
0,04
2
6,8
7,1
7,7
8,3
8,9
9,5
23
Ni
1,00
52
0,96
48
0,88
44
0,80
40
0,72
36
0,64
32
0,56
28
0,48
24
0,40
20
0,.32
16
0,24
12
0,16
0,08
4
6,8
7,1
7,7
8,3
8,9
9,5
10,1
10,7
11,3
11,6
XR
24
2
AREA PRINCIPAL
HOMBRES
MUJERES
TOTAL DE
ESTUDIANTES
12
6
15
7
8
10
2
60
8
10
2
3
6
5
2
36
20
16
17
10
14
15
4
96
Mecnica
Electricidad
Electrnica
Construccin Civil
Computacin
Qumica
Metalurgia
TOTAL
Metalurgia
Qumica
Computacin
Const. Civil
Serie1
Electrnica
Electricidad
Mecnica
0
10
15
20
25
25
2.
El nmero de aparatos de televisin producidos por la I.R.T. durante los aos 1970, 1971,
1972 y 1973 ha sido el siguiente:
AOS
1970
1971
1972
1973
NMERO DE APARATOS
4.500
6.000
8.500
6.500
1970
1971
1972
1973
= 1.000 unidades.
Pictograma
26
3.
Datos de produccin anual Loren Manufacturing Company por plantas de 1955 a 1965,
son:
AOS
PLANTA A
1955
1956
1957
1958
1959
1960
1961
1962
1963
1964
1965
150
170
200
240
200
250
270
300
280
350
400
(MILES DE UNIDADES
PLANTA B
SUBTOTAL
PLANTA C
190
230
150
210
280
300
230
220
320
280
250
340
400
350
450
480
550
500
520
600
630
650
160
170
200
150
220
100
200
260
200
270
150
500
570
550
600
700
650
700
780
800
900
800
1.000
900
800
700
600
500
400
300
200
100
0
1055
1956
1057
1058
1960
1961
1962
1963
1964
TOTAL
1965
27
Construya el grfico
4.
Algunos indicadores estadsticos de algunos pases del pacto Andino son (CEPAL, 1972).
BOLIVIA
Ingreso por habitante
(US$)
Matrcula Universitaria.
(miles)
Consumo
energa/habitante
(Kw/hab)
% Alfabetismo
COLOMBIA
CHILE
ECUADOR
PERU
VENEZUELA
200
359
645
300
420
627
12
20
70
10
40
34
183
506
1020
102
537
2620
39,8
72,0
88,8
72,0
67,0
85,0
US$
Ingreso
600
por
400
Habitante
US$
200
BOLIVIA
COLOMBIA
CHILE
ECUADOR
PERU
VENEZUELA
miles
Matrcula
60
Universitar
ia
40
Matrcula Universitaria
(Miles)
20
BOLIVIA
COLOMBIA
CHILE
ECUADOR
PERU
VENEZUELA
Kw/ha
b
Consumo
2500
Energa /
Habitante
1500
(Kw/hab)
500
BOLIVIA
COLOMBIA
CHILE
ECUADOR
PERU
VENEZUELA
COLOMBIA
CHILE
ECUADOR
PERU
VENEZUELA
80
%
Alfabe- 60
tismo
40
BOLIVIA
28
5.
PRODUCCIN EN MINAS
(miles de toneladas cortas)
1951/53
1968/70
384
675
62
63
33
204
2.721
5.816
Chile
Per
Mxico
Mundial
14.1
2.3
1.2
11.6
1.1
3.5
Exportaciones
Chile
Per
Mxico
343
49
33
662
7
207
29
CHILE
(343.000)
1968/70
(662.000)
PERU
(49.000)
(7.000)
MXICO
(33.000)
Exportaciones
(207.000)
4.
30
4.1. La idea es resumir los datos en un solo valor, un valor que represente a todo un conjunto
de datos, este tiene que ser un nmero hacia el cual tienen tendencia a concentrarse los datos, o
sea, que es un valor central o de posicin central a cuyo alrededor se distribuyen todos los datos
del conjunto. Los ms comunes son: la mediana, moda, media o promedio, media geomtrica,
etc.
Estas y otras medidas nos sirven para resumir la informacin presentada en cuadros y
poder relacionar y comparar entre s, de una manera sencilla, un conjunto de distribuciones de
frecuencias.
Una vez determinadas las medidas de tendencia central de una distribucin nos interesa
determinar cmo se reparten (dispersan, desvan) los datos a uno y otro lado de la medida central.
O sea, es necesario cuantificar la representatividad de la medida de tendencia para poder
caracterizar la distribucin. Si la dispersin es pequea indica gran uniformidad y la informacin
tiende a concentrarse en torno a la medida central, por el contrario una gran dispersin indica que
los datos estn alejados de ella.
Las salidas de dispersin ms usuales son: desviacin media, desviacin tpica o estndar,
rango, etc.
4.2. Hay que hacer notar que toda variable puede clasificarse en uno de los niveles de
medicin que se darn en orden creciente en cuanto a la riqueza de la informacin y de acuerdo a
ese nivel de calidad se darn sus medidas de tendencia central y de dispersin.
a.
Variable nominal:
La variable induce en la poblacin una subdivisin y la informacin se puede
clasificar en clases, donde cada clase est completamente definida y diferenciada
de las dems.
La recopilacin se reduce a contar el nmero de individuos de la muestra que
pertenecen a cada clase.
Ejemplo
Variable
Clases
b.
=
=
color de ojos
negro, caf, verde, azul, etc.
Variable Ordinal
La variable admite grados de calidad u ordenamiento, esto significa que existe una
relacin de orden entre las clases.
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
31
Ejemplo:
Variable
Clases
c.
=
=
rendimiento acadmico
7, 6, 5, 4, 3...
4.3.
=
=
estatura
[1,20 ; 1,59]
[1,50 ; 1,80]
[1,80 ; 2,10]
La medida de tendencia central que se utiliza en el nivel nominal es la moda o clase modal
(se anota o por Mo).
4.3.1.a.
Modal:
6
30
10
2
2
f
0,12
0,60
0,20
0,04
0,04
32
Clase modal : C2 ; fM =
30
= 0,60
50
V = 1 0,6 = 0,4
La clase modal es representativa.
4.3.2. En el nivel ordinal se definen los fractiles o cuantiles (ellos dividen o fraccionan la
muestra en partes ms o menos iguales) destacndose los cuartiles (dividen en 4 partes),
4.3.2.1.
Cuartil
La clase cuartil de orden k es la primera clase cuya frecuencia relativa acumulada
es mayor o igual a k/4 (o sea, la clase que tiene Fk > k/4).
4.3.2.2.
Decil
La clase decil de orden k es la primera clase cuya frecuencia relativa acumulada es
mayor o igual a k/10.
4.3.2.3.
Percentil
La clase percentil de orden k es la primera clase cuya frecuencia relativa
acumulada es mayor o igual a k/100.
4.3.2.4.
Mediana
a.
La medida tendencia central caracterstica del nivel ordinal es la
MEDIANA ( se abrevia Md).
La clase mediana es la primera clase cuya frecuencia relativa acumulada es mayor
o igual a (es el cuartil de orden 2 o el decil de orden 5 o el percentil de orden
50).
Observacin: La mediana divide a la muestra en dos mitades aproximadamente.
b.
D =
33
n
10
7
14
6
13
f
0,20
0,14
0,28
0,12
0,26
N
10
17
31
37
50
F
0,20
0,34
0,62
0,74
1,00
Clase Modal: C3
Tasa de variacin: V = -0,28 = 0,72 baja representatividad.
Clase mediana: C3 (0,62 > 0,5) (casualmente coincidi con la clase modal)
CLASES
RANGO
C1
1
C2
2
C3
3
C5 (1 > 0,75)
D =
52
= 0,75
5 1
C4
4
C5
5
4.3.3.
Media
4.3.3.1
Donde X =
1 i =k
ni M ci =
n 1=1
i =k
fM
i
ci
i =1
34
en que:
X = media
n = nmero total de datos
ni = frecuencia absoluta de la clase i
fi = frecuencia relativa de la clase i
k = nmero de clases
Mci = marca de clase de la clase i
Nota: para este nivel se definen la moda y la mediana como:
4.3.3.2.
Moda
Mo = L + C
d1
d1 + d 2
donde:
L =
I =
d1 =
nM =
nM =
nM-1 =
nM+1 =
4.3.3.3.
Mediana
Md
= L + C
n / 2 N d 1
nd
donde:
L =
I =
n =
nd =
Nd-1 =
35
4.3.3.4.
Medidas de dispersin
a.
Rango
El rango es un suplemento de la media definida como:
R = dato mayor dato menor.
Ejemplo:
en que:
36
c.
d.
M .D. =
i =1
fi X i x
1
n
i =k
Xi x
i =1
donde:
k =
n =
fi =
ni =
Xi =
e.
nmero de clases
nmero total de datos
frecuencia relativa de la clase i
frecuencia absoluta de la clase i
marca de clase de la clase i
1
n
ik
2
2
n1 (X i ) x
i 1
37
f.
Dispersin relativa
Sirve para comparar dos conjuntos de datos.
coeficiente
de var iacin
V MD
MD
Md
V DQ
D.Q.
coeficiente de desviacon cuartica
Md
ni
Xi ni
Xi2ni
74
80
86
92
98
104
110
2
2
6
14
12
10
4
n = 50
148
160
516
1.288
1.176
1.040
440
4.768
10.952
12.800
44.376
118.496
115.248
108.160
48.400
458.4342
Por lo tanto:
a.
Media
4.768
50
x =
b.
= 95,36
Desviacin estndar
458.432
50
95,36
2 = 9168.64 - 9093.53
2 = 75.11
= 8.67
38
c.
Clase modal: C4
Mo
8
8+2
= 89 + 6
= 93,8
Clase mediana: C5
Md
= 95 +
50
24
2
12
6 = 95,5
d.
64
7 1
= 0,33
MD =
353,32
50
MD =
7,066
95,5
= 7,066
= 0,074
= 101 + 6
3 50 / 4 36
10
= 101,90
Q1 = C1
= 89 + 6
50 / 4 10
14
= 89,07
5,91
= 0,062
95,5
39
e.
P90
= 101 + 6
90 50
36
100
10
RP = 22,4
4.4.
RP =
= 106,4
22,4
95,5
P10 = 84
= 0,235
m3
s3
donde m3
1
n
( X i x )3
x Mo
s
40
b.
Curtosis
La cual est definida por:
m4
2 =
3
s4
Si 2 = 0 da una curva ms puntiaguda que la normal, mientras 2 < 0 da una
curva achatada.
Problemas propuestos
1.
110
116
113
116
118
112
98
115
119
108
114
109
113
110
118
106
121
114
116
118
109
120
104
116
107
103
110
116
113
101
116
108
94
104
116
102
105
116
X, , Mo2, Md
Sesgo
2.
0,738
0,728
0,745
0,733
0,735
0,732
0,735
0,742
0,725
0,738
0,729
0,737
0,736
0,730
0,732
0,737
0,735
0,729
0,731
0,736
0,743
0,736
0,742
0,732
0,735
0,731
0,733
0,739
0,741
0,734
0,740
0,735
0,740
0,730
0,727
0,746
0,726
0,739
0,734
0,727
0,736
0,724
0,728
0,739
0,734
0,735
0,736
0,730
0,737
0,735
0,741
0,733
0,738
0,734
0,732
0,735
0,732
0,735
0,744
0,740
41
3.
4.
AO
AGRCOLAS
NO AGRCOLAS
1850
1860
1870
1880
1890
1900
1910
1920
1930
1940
1950
4.9
6,2
6,9
8,6
9,9
10,9
11,6
11,4
10,5
8,8
6,8
2.8
4,3
6,1
8,8
13,4
18,2
25,8
31,0
38,4
42,9
52,2
ng
n
s
es la
Ai
Bj
fij = 1
i =1 i =1
B1
n11
n21
|
ni1
|
nr1
B2
n12
n22
|
ni2
|
nr2
Total
n.1
n.2
-----------
Bj
nIj
nIj
|
nij
|
nrj
-----------
n.j
Bs
n1s
n2s
|
nis
|
nrs
TOTAL
n1.
n2.
n.s
ni.
nr.
42
ij
j =1
contingencia de frecuencias).
ni corresponde al nmero de elementos de la muestra que pertenecen a la
clase Ai segn X independiente de la modalidad Bj a la que estn asociados.
5.
AO
AGUA CADA
1957
1958
1959
1960
1961
1962
1963
1964
1965
1966
1967
309
336
320
194
261
227
446
187
414
364
173
j =1
frecuencias).
nij corresponde al nmero de elementos de la muestra que pertenecen a la clase Bj segn Y
independientemente de la modalidad Ai a la que estn asociados.
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
5.1.
43
De la variable estadstica X
ni .
j = I , ....... s
n
(conjunto de variables relativas a las clases Ai considerndolas independiente de
las Bj).
fi
ii)
De la variable Y
5.2.
n j.
j = I , ....... s
n
(conjunto de variables relativas a las clases Bj considerndolas independiente de
las Ai).
fi
DISTRIBUCIN CONDICIONAL
La distribucin condicional consiste en estudiar las frecuencias asociadas a las clases de
una variable cuando nos restringimos a los elementos de una clase dada segn la otra
variable, esto es estudiar el comportamiento de una variable dado un valor fijo de la otra.
5.3.
f ij
f. j
nij
n. j
i = 1, ....... r
El conjunto {f1/j, f2/j, .......fr/j} constituye la distribucin condicional del carcter X dada la
clase Bj de Y (es decir, la distribucin de frecuencias segn X cuando tomamos slo los
elementos pertenecientes a la clase Bj segn Y).
Anlogamente podemos definir distribucin condicional de Y dado X (Y(C))
f j /i
f ij
f .i .
nij
ni .
j = 1, ....... s
44
5.4.
INDEPENDENCIA DE VARIABLES
Decimos que una variable estadstica Y es independiente de X si las frecuencias
condicionales de Y/X son todas iguales, es decir, no depende de la clase X condicionante.
Y es independiente de X fj/1 = fj/2 = ..... = fj=r
Vj = 1, .......s
y esto es
n1 j
n2 j
n1
n2
= ...... =
n rj
nr
n1 j + n 2 j + ..... + n rj
n1 + n 2 + .... + n r
nij
n
fi
OBSERVACIN:
Y es independiente de x la frecuencia conjunta es igual al producto de las frecuencias
marginales.
fij = (fi) (fj) = fi
. f.
X
DEFINICIN:
X e Y no son independientes entre s, se dice que existe relacin o ligazn entre ellos. De
modo que el conocimiento de una de las variables presente alguna informacin respecto a
la otra.
Nuestro objetivo es medir de alguna forma porcentual esta relacin existente y poder
adems describir de que forma (lineal, exponencial, potencial, etc.) existe.
5.5.
45
Ejemplo:
Se toma una muestra de 5 individuos y encuestamos
X = sueldo
Y = cargas familiares
X
10
8
22
30
50
Media 24
Y
1
1
3
3
4
2.4
x i- x
-14
-16
-2
6
26
yi-y
-1,4
-1,4
0.6
0.6
1.6
(xi-x)(yi-y)
19.6
22.4
-1.2
3.6
41.6
17.2
cov( x, y ) =
(x
x )( y i y )
i =1
46
cov( x, y )
, en que s( x )
s ( x ) s( y )
V ( x)
s( y ) =
V ( y)
-1 < r < 1
en que se tiene:
Correlacin positiva = asociacin favorable
Correlacin negativa = asociacin impulsiva
Se entiende que r es de fcil interpretacin.
Correlacin
Negativa
Positiva
Alta
Media
Baja
Nula
Baja
Media
Alta
0,1
0,5
0,3
0,3
0,5
2.
3.
4.
47
Si graficamos las observaciones (xi, yi) tendremos situaciones como las siguientes,
reflejadas en el valor de r:
y
r=1
r = -1
r = 0.001
r = 0,6
r = 0.2
r = -0.7
48
6.
CURVAS DE REGRESIN
y2
y1
x1
x2
x3
...
xr
xi
-----------------------------------
eij
y(xi) -----------------------
yi = y(xi)+ eij
xi
y se determina con la condicin
r
Minimizar
f ij
eij2
i =1 j =1
Ejemplo
49
6.1.
REGRESIN LINEAL
La nube de puntos presenta forma alineada. Suponemos y(x) = ax+b. Entonces:
yj = axi + b + eij
e2ij = (yj axi b)2
Ahora minimizamos:
A =
f
i =1
eij2
ij
(y
j =1
i= j
j =1
axi b )
dA
= 0
db
r
dA
= 2
da
i =1
j =1
r
dA
= 2
db
i =1
j =1
f ij (y j axi b )xi = 0
f ij (y j axi b ) = 0
ij
xi y j xy
V (x )
b = y ax
Se puede demostrar que la ecuacin antes obtenida:
y = ax + b se puede poner como
a =
n xy ( x )( y )
b =
( y )( x 2 ) ( x )( xy )
n x 2 ( x )
n x 2 ( x )
50
Nota:
Si se puede redefinir los valores de X tales que x = 0, la expresin se reduce a:
a =
6.2.
xy
x
b =
Si (x) = ax2+bx+c. Entonces debemos minimizar A = (yj-a xi2 bxi c)2 y sus
ecuaciones normales se dan de:
A
A
A
= 0
= 0
= 0
a
b
c
2.
3.
65
68
63
66
67
68
64
65
68
69
62
66
70
68
66
65
68
71
67
67
69
68
71
70
51
X2
XY
Y2
65
63
67
64
68
62
70
66
68
67
69
71
68
66
68
65
69
66
68
65
71
67
68
70
4225
3969
4489
4096
4624
3844
4900
4356
4624
4489
4761
5041
4420
4158
4556
4160
4692
4092
4760
4290
4828
4489
4692
4970
4624
4356
4624
4225
4761
4356
4624
4225
5041
4489
4624
4900
X = 800
Y = 811
X2 = 53,418
Xy = 54,107
Y2 = 54,849
As
x =
800
12
y =
811
= 67,58
12
x =
53418
12
= 66,67
As s(x) = 2,57
54849
12
Vy =
As (y) = 3,42
y xy
54107
12
= 4508.92
52
Por lo tanto:
r =
r =
4508,92 4505,56
8,79
= 0,38
=
b =
=
484
= 0,476
1016
= 35.825
El nmero de bacterias en un cultivo por unidad de tiempo est dado por la tabla
N
t
3
1
7
2
21
3
62
4
180
5
500
6
53
2.
1.4
7400
1.8
7500
2.3
7600
3.0
7500
4.0
7200
2
1
2
0
0
3
1
3
1
0
4
0
1
2
1
5
0
1
3
2
6
0
0
1
1
54
CAPTULO II
TEORA DE PROBABILIDADES
Antes de estudiar teora de probabilidades que nos dar el soporte terico para el resto del curso,
debemos analizar algunos mtodos de conteo, que nos permitan conocer el nmero de maneras
que un suceso pueda ocurrir.
2.1.
COMBINATORIA
Las reglas bsicas para estos mtodos de enumeracin son:
Regla del y
Si se tiene dos sucesos independientes A y B, A puede ocurrir de m maneras y B de n
maneras, entonces A y B puede ocurrir de m x n maneras.
Regla del o
Si se tienen dos sucesos A y B excluyentes o disjuntos. Entonces A B puede ocurrir de
m + n maneras.
Ejemplo 1
Se quiere viajar de Santiago a Concepcin y lo podemos hacer en bus o avin. Si en
avin podemos escoger entre 3 aerolneas y en bus entre 6 empresas entonces pueden
viajar de 6 + 3 maneras.
Ejemplo 2
Se quiere viajar de Valparaso y Santiago y de ah a Concepcin. Si podemos viajar de
Valparaso a Santiago de 4 maneras y de Santiago a Concepcin de 3 maneras. Entonces
por cada forma escogida en el primer tramo tengo 3 para continuar, como son 4 estas
alternativas para el primero, da 4 x 3 = 12 formas de viaje completo.
55
Ejemplo 3
Cuntas placas patentes se pueden emitir que puedan tres letras y tres dgitos?
25
25
25
10
10
10
13 simples.
Como cada partido tiene 3 posibilidades, en total se tiene 313 formas.
Con 1 doble
Adems de marcar una cruz por partido, se debe escoger uno de los 13 y ah se
disponen de 2 casilleros libres.
Respuesta:
313 x 2 x 13
Ejemplo 5
Se dispone de una bandera blanca, un a azul y una roja. cuntas seales se pueden hacer
izando banderas en un mstil?
Si se iza solo una
:
3
Si se izan dos
:
3x2=6
Si se izan las tres
:
3x2x1=6
Como se pueden izar 1 2 3 da 15 seales.
Como se puede apreciar la naturaleza de los problemas planteados es variada, por lo
tanto, trataremos de clasificarlos de acuerdo a dos pautas:
1.
2.
Se puede o no repetir
Importa o no el orden en que se encuentran.
2.1.1. Arreglos
Se llama arreglos o variaciones de k en n si disponemos de n objetos y escogemos k de
ellos importando el orden.
Como el 1 lo escogemos de n maneras, el 2 de (n-1), el 3 de (n-2), etc., nos da que los
arreglos sin repeticin son:
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
56
n!
(n k )!
Ejemplo 6
Si se dispone de 8 libros. De cuantas maneras puedo escoger 3 para ponerlos en un
estante?
A38
8!
= 876 = 336 maneras
5!
= nk
Ejemplo 7
Si dispongo de banderas rojas, blancas y azules. Cuntas seales puedo hacer al izar 3
banderas?
A33
= 33 = 27
2.1.2. Permutaciones
Si el nmero k coincide con n, o sea, se toman todos, se convierte en cuntas maneras se
pueden arreglar u objetos? esto recibe el nombre de permutaciones de n objetos.
Pn = n!
Ejemplo 8
De cuntas maneras se pueden ordenas 4 libros?
P4 = 4! = 1 2 3 4 = 24 maneras.
57
Ejemplo 9
Si se dispone de 4 libros, pero se quiere que dos queden juntos.
Tomemos esos 2 como uno slo y da P3 = 3-1 = 6, pero se pueden poner de dos formas
AB o BA, as.
Respuesta = 6 2 = 12 maneras.
Si se toma la diferencia 24 12 = 12 da el nmero de maneras que estn separados.
2.1.3. Combinaciones
Si se dispone de n objetos y se quiere escoger k de ellos, sin importar el orden se llama
combinaciones de k entre n.
Se puede calcular tomando como si importase el orden Akn y dividiendo por el nmero de
veces que cada uno est repetido k!, as
C kn
n!
= (nk )
( n k )! k!
Ejemplo 10
Se dispone de 10 personas. Cuntos tros de personas diferentes se pueden formar?
C 310
10!
10 9 8
=
7!3!
1 2 3
= 120
Ejemplo 11
Existe un grupo de 4 hombres y 3 mujeres. Cuntos tros se pueden formar de modo que
haya al menos una mujer?
con 1 mujer
C13C 24
4 3
= 18
1 2
= 3
Con 2 mujeres
C 23C14
Con 3 mujeres
C33
= 3
4 = 12
= 1
Total = 18 + 12 + 1 = 31.
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
2.2.
58
TEORA DE PROBABILIDADES
Si se quiere estudiar una caracterstica X de una poblacin, X recibe el nombre de variable
aleatoria y todos los posibles valores que ella puede tomar se llama espacio muestral M.
Un subconjunto de M recibe el nombre de suceso.
Ejemplo:.
Se lanza un dado
X = nmero que resulta del dado.
M = {1, 2, 3, 4, 5, 6}
Un suceso S podra ser ser par o sea S = {2,4,6,}
Nos interesa definir la probabilidad que un suceso dado S suceda, o sea definir a cada
suceso un nmero que est dado en porcentaje, es decir, entre 0 y 1, lo haremos de la
siguiente manera:
Definicin:
La probabilidad p, ser una funcin p : {sucesos} R.
tales que:
1)
2)
3)
Consecuencias:
a)
b)
c)
p () = 0
p (Ac) = 1 p(A)
donde Ac es el complemento de A
P (AB) = p(A) + p(B) p(AB)
59
1
6
Si se toma un suceso S = {x1 , x2 , ... xk}, entonces p(s) = p (x1) + p(x2) + ... * p(xk) =
k
p + p ... + p = , lo que nos lleva a la siguiente definicin
n
Definicin
p(S) =
de casos favorables
N de casos totales
Ejemplo 2:
Sacar suma 7 con dos dados:
Cada dado puede caer de 6 maneas, por lo tanto los dos dados pueden caer de 36 maneras,
mientras que 7 se puede obtener como: 16, 25, 34, 43, 52, 61, o sea
p (7 ) =
6
=
36
1
6
Ejemplo 3:
Probabilidad de al sacar 2 cartas sean dos ases.
60
p ( AA) =
4
3
52
51
Ejemplo 4
Si se dispone de mquinas nuevas y usadas, elctricas y manuales en una oficina dadas
por la tabla:
N
20
4.
24
E
M
U
10
15
25
30
19
49
30
49
24
Nueva : p(NE) =
49
Elctrica : p(E) =
20
49
61
p( A B)
p( B)
Definicin: P (A/B) =
Ejemplo 5
En el caso de las mquinas del ejemplo 4. Calcule Cul es la probabilidad que sea nueva
una mquina si se sabe que es elctrica?
p (Nueva/Elctrica =
20 / 49
30 / 49
d=
p (nueva
y elctrica
p (elctrica)
20
30
2
3
p( A B)
p ( B)
p( A) p( B)
p( B)
p( A)
B1
B2
B3
AA
B4
B2
p(A) = p(A B1) + p(A B2) + ... + p(A Bn) usando la frmula anterior.
p(A) = p(B1) p(A/B1) + p(B2) p(A/B2) + ... + p(Bn) p(A/Bn)
Ingeniera de Ejecucin en Control e Instrumentacin Industrial
62
Ejemplo 6
Una fbrica tiene tres plantas de produccin, una en Arica que produce el 30% de la
produccin y muestra un 5% de productos defectuosos. Santiago que produce el 50% con
3% de defectuosos y Valparaso con el resto y un 2% de defectuosos. Si se toma un
artculo producido al azar Cul es la probabilidad que sea defectuoso?
B1 = Arica
B2 = Santiago
B3 = Valparaso
Def: defectuoso
A = Ser defectuoso
p(def) = p(Arica p(def)/Arica + p(Santiago) p(def/Santiago) + p(Valparaso)
p/def/Valparaso)
= 0,3 0,05 + 0,5 3 0,03 + 0,2 0,02
= 0,015 + 0,015 + 0,004 = 0,034
2.2.4. Probabilidad de Causas. Bayes
La pregunta es ahora al revs, si se sabe que algo pas Cul es la probabilidad de alguna
causa?
O sea:
p ( Bi A)
p ( A)
p ( Bi / A) =
p ( A / Bi d ) p ( Bi )
p( A)
Ejemplo 7
En el ejemplo 6 anterior si un artculo fue defectuoso Cul es la probabilidad de que haya
sido producido en Arica?
p ( A / Def ) =
0,05 0,3
=
0,034
15
34
63
EJERCICIOS
1.
Cul es la probabilidad de obtener una figura y un as, al sacar dos cartas de un naipe?
(21 real).
2.
3.
4.
Un agricultor planta 3 tipos de manzanas. El 40% son del tipo A y produce un 85% de
exportacin, 30% son del tipo B y el 90% son de exportacin, el resto es del tipo C y el
80% es de exportacin. De su produccin que porcentaje es de3 exportacin? Si una
manzana es de exportacin Cul es la probabilidad que sea del tipo B?
5.
En una ciudad se venden 1000 diarios A, 2000 B y 5000 C. Si de los lectores de A el 25%
fuma, el 50% de los B y el 10% de los de C. Si suponemos que cada persona lee un solo
diario
a) Qu porcentaje de los lectores fuman?
b) Si una persona no fuma Cul es la probabilidad que lea B?
c) De los lectores de B el 25% bebe alcohol y el 15% bebe y fuma Cul es la
probabilidad que un lector de B no beba ni fume?
2.3.
VARIABLES ALEATORIAS
Dependiendo del problema a estudiar definimos una variable aleatoria X y su
correspondiente espacio muestral M. Si M es un conjunto finito o numerable se dice que
la variable y el espacio muestral es discreto, si M es un intervalo de nmeros reales se
dice que son continuos.
En el caso que la variable sea discreta llamaremos funcin de probabilidad a:
p : MR
64
tales que:
x M
a) (X) > 0
b)
p ( x) = 1
xM
Definicin
Si X es continua, llamaremos funcin de densidad a la funcin
F:M R
tales que
x M
a) f (x) > 0
b)
f ( x)dx = 1
En este caso
b
P (a < x < b) =
f ( x)dx
Geomtricas
Un experimento tiene probabilidad p de xito, se debe repetir el experimento hasta tener
xito.
X = N de experiencias necesarias hasta tener xito.
M = {1,2,3,43...}
p (x = k) = (l-p)k-1 p
b)
65
Binomial
La probabilidad de tener xito en una experiencia es p. Si realizamos n experiencias
independientes, Cul es la probabilidad de tener un N dado de xitos?
X = N de xitos entre los n
M = {0,1,2... n}
p(x = k) = (nk) pk (l-p)n-k
c)
Hipergeomtrica
Se disponen de N objetos, de ellos r son de una cierta clase A y el resto (N-r) no lo son.
Si tomamos n de ellos Cul es la probabilidad que k sean del tipo A?
X = N de objetos del tipo A
M = {0,1,2... n}
p( x = k ) =
( )( )
( )
r
k
N r
nk
N
n
Observacin:
A veces ocurre que por ser los nmeros grandes es muy difcil calcular estos coeficientes
binomiales y como para estos valores no son muy diferentes las probabilidades calculadas
por binomial e hipergeomtrica se aproxima la 2 por la primera.