Está en la página 1de 188

UNIVERSIDAD AUTÓNOMA CHAPINGO

CENTRO REGIONAL UNIVERSITARIO ORIENTE

TRABAJO FINAL ESTADÍSTICA


MATERIA: FUNDAMENTOS DE ESTADÍSTICA

PROFESOR: JOSÉ ANTONIO TORRES RIVERA

ALUMNO: ARAN YUSEC TORRES VAZQUEZ

FECHA: 20 de Julio de 2021


INTRODUCCION
Se presenta el analisis completo de un conjunto de datos de borregas en dos estados; Borregas katahdin cargadas y Borregas k
donde se analiza comenzando desde la organización y manejo de datos de manera basica para adentrar a los detalles estadisti
como presentacion del trabajo final del curso "Fundamentos de Estadística"

N. Arete S. Peso (Kg) Borregas Bacias o Arras N. Arete S. Peso (Kg) Borregas cargadas
34054 34 34055 36.5
34053 34.5 34056 51
34052 36 34057 44
34051 37 34058 39.6
34050 35 34059 54
34049 31 34060 55.5
34048 27 34061 43
34047 37 34062 45.5
34046 33.5 34063 43.5
34045 34.5 34064 44
34044 35.5 34065 49
34043 30 34066 50.5
34042 36.5 34067 52
34041 34 34068 46.5
34040 37 34069 38.5
34039 38 34070 39
34038 40.5 34071 41.5
34037 40 34072 43.5
34036 34.5 34073 51
34035 36 34074 52.5
34034 35 34075 54
34033 35.5 34076 58.5
34032 36 34077 54.5
34031 37 34078 53
34030 33.5 34079 56
34029 34.5 34080 42.5
34028 31 34081 49
34027 37 34082 41.5
34026 39.5 34083 51
34025 42 34084 49.5
34024 35.5 34085 44
34023 35 34086 44.5
34022 37 34087 47
34021 38.5 34088 48.5
34020 30 34089 45.6
34019 40 34090 46
34018 35.5 34091 39.5
34017 33 34092 43
34016 34.5 34093 45
34015 37.5 34094 50.5
34014 38 34095 43.5
34013 33 34096 49
34012 34 34097 47.5
34011 43.5 34098 40
34010 31 34099 50
34009 36 34100 44.5
34008 35.5 34101 48.5
34007 33.5 34102 47.5
34006 37.5 34103 43
34005 39 34104 42
s katahdin cargadas y Borregas katahdin vacias en una borreguera local "Tezonapa Borreguera"
adentrar a los detalles estadisticos mas complejos
DATO, PARÁMETRO, ESTADÍSTICO
Descripciones
Dato: Es una representación simbólica de un atributo o variable cuantitativa o cualitativa. Los datos describen hechos empírico

Parametro: Valor representativode una poblacion. Un parámetro tiene una enorme utilidad en estadística. En primer lugar, sir

Estadistico: Valor representativo de una muestra.

N. Arete S. Borregas Bacias o Arras N. Arete S.


Peso (Kg) Longitud (m) Color (Blanco, Café, Sardo) Edad (años)
34054 34 1.2 Blanco 1 34055
34053 34.5 1.3 Café 1.5 34056
34052 36 1.2 Sardo 1 34057
34051 37 1.1 Blanco 1 34058
34050 35 1 Blanco 1 34059
34049 31 1 Café 1 34060
34048 27 1 Blanco 1.5 34061
34047 37 1.2 Café 2 34062
34046 33.5 1.2 Sardo 2 34063
34045 34.5 1.2 Café 1.5 34064
34044 35.5 1.2 Blanco 1.5 34065
34043 30 1 Blanco 2 34066
34042 36.5 1.1 Café 2 34067
34041 34 1.1 Sardo 1.5 34068
34040 37 1.1 Café 1.5 34069
34039 38 1.1 Sardo 1.5 34070
34038 40.5 1.2 Café 1 34071
34037 40 1.2 Sardo 1 34072
34036 34.5 1.1 Sardo 1 34073
34035 36 1 Sardo 1.5 34074
34034 35 1 Sardo 2 34075
34033 35.5 1.2 Blanco 1.5 34076
34032 36 1.1 Blanco 1.5 34077
34031 37 1.2 Blanco 1.5 34078
34030 33.5 1.1 Café 1 34079
34029 34.5 1 Blanco 2 34080
34028 31 1 Sardo 2 34081
34027 37 1.1 Café 2 34082
34026 39.5 1.2 Sardo 1.5 34083
34025 42 1.2 Sardo 1.5 34084
34024 35.5 1.2 Sardo 1.5 34085
34023 35 1.1 Sardo 1.5 34086
34022 37 1.2 Blanco 1.5 34087
34021 38.5 1.2 Blanco 1 34088
34020 30 1.1 Blanco 1 34089
34019 40 1.2 Café 2 34090
34018 35.5 1.2 Blanco 1.5 34091
34017 33 1 Blanco 1.5 34092
34016 34.5 1 Café 2 34093
34015 37.5 1 Café 2 34094
34014 38 1.2 Sardo 1 34095
34013 33 1.1 Sardo 1 34096
34012 34 1.1 Blanco 1 34097
34011 43.5 1.3 Café 1.5 34098
34010 31 1.2 Sardo 1.5 34099
34009 36 1.1 Café 1.5 34100
34008 35.5 1.2 Café 1.5 34101
34007 33.5 1.1 Café 1.5 34102
34006 37.5 1.3 Café 1 34103
34005 39 1.2 Café 1 34104
PROMEDIO I 35.6 1.132 1.45
PROMEDIO T 41.192 1.164 1.505
-Parámetros Edad: 1.505, Peso: 41.192, Longitud: 1.164, Color: Blanco, Café, Sardo
atos describen hechos empíricos, sucesos y entidades.

estadística. En primer lugar, sirve para conocer atributos de una distribución de datos. Por ejemplo, la media aritmética o la desviación típ

Borregas cargadas
Peso (Kg) Longitud (m) Color (Blanco, Café, Sardo) Edad (años)
36.5 1.1 Sardo 2
51 1.1 Sardo 1.5
44 1.2 Blanco 2
39.6 1.1 Blanco 2
54 1.3 Blanco 1.5
55.5 1.3 Café 1.5
43 1.2 Blanco 1.5
45.5 1.2 Café 2
43.5 1.2 Sardo 1.5
44 1.1 Café 1.5
49 1.3 Blanco 2
50.5 1.3 Blanco 2
52 1.3 Café 1.5
46.5 1.2 Sardo 1
38.5 1.1 Café 1.5
39 1.1 Sardo 1
41.5 1 Sardo 1
43.5 1.2 Sardo 1
51 1.2 Sardo 2
52.5 1.3 Blanco 1.5
54 1.2 Blanco 1.5
58.5 1.3 Blanco 2
54.5 1.3 Café 2
53 1.3 Blanco 2
56 1.3 Café 1
42.5 1.2 Sardo 1
49 1.2 Café 1
41.5 1.1 Blanco 1
51 1.3 Blanco 1.5
49.5 1.2 Café 2
44 1.2 Sardo 2
44.5 1.1 Café 2
47 1.2 Sardo 1.5
48.5 1.2 Sardo 1.5
45.6 1.2 Café 2
46 1.2 Sardo 1
39.5 1.2 Café 1.5
43 1.1 Blanco 1
45 1.1 Blanco 1
50.5 1.2 Café 1.5
43.5 1.1 Sardo 2
49 1.1 Sardo 2
47.5 1.1 Blanco 2
40 1.2 Blanco 1.5
50 1.2 Sardo 1.5
44.5 1.2 Café 2
48.5 1.3 Café 1
47.5 1.3 Café 1.5
43 1.2 Blanco 2
42 1.2 Café 1
46.784 1.196 1.56
media aritmética o la desviación típica de estos. En probabilidad permite conocer las llamadas funciones de distribución. En una recta de r
e distribución. En una recta de regresión nos indica valores numéricos asociados a dicha recta y que la hacen única.
UNIVERSO, POBLACIÓN, MUESTRA, INDIVIDUO
Definición:

Universo: Es el todo que abraza el conjunto entre el sistema y su entorno.

Poblaciòn: es un conjunto finito o infinito de personas, animales o cosas que presentan características comunes, sobre los cua

Muestra: una muestra no es más que una parte de la población que sirve para representarla. La muestra debe obtenerse de la

Individuo: se denomina cada uno de los elementos que componen una población, es decir, el conjunto de todos los elementos

Población
Individuos Individuos
N. Arete S. Borregas Bacias o Arras N. Arete S.
Peso (Kg) Longitud (m) Color (Blanco, Café, Sardo) Edad (años) Peso (Kg)
34054 34 1.2 Blanco 1 34055 36.5
34053 34.5 1.3 Café 1.5 34056 51
34052 36 1.2 Sardo 1 34057 44
34051 37 1.1 Blanco 1 34058 39.6
34050 35 1 Blanco 1 34059 54
34049 31 1 Café 1 34060 55.5
34048 27 1 Blanco 1.5 34061 43
34047 37 1.2 Café 2 34062 45.5
34046 33.5 1.2 Sardo 2 34063 43.5
34045 34.5 1.2 Café 1.5 34064 44
34044 35.5 1.2 Blanco 1.5 34065 49
34043 30 1 Blanco 2 34066 50.5
34042 36.5 1.1 Café 2 34067 52
34041 34 1.1 Sardo 1.5 34068 46.5
34040 37 1.1 Café 1.5 34069 38.5
34039 38 1.1 Sardo 1.5 34070 39
34038 40.5 1.2 Café 1 34071 41.5
34037 40 1.2 Sardo 1 34072 43.5
34036 34.5 1.1 Sardo 1 34073 51
34035 36 1 Sardo 1.5 34074 52.5
34034 35 1 Sardo 2 34075 54
34033 35.5 1.2 Blanco 1.5 34076 58.5
34032 36 1.1 Blanco 1.5 34077 54.5
34031 37 1.2 Blanco 1.5 34078 53
34030 33.5 1.1 Café 1 34079 56
34029 34.5 1 Blanco 2 34080 42.5
34028 31 1 Sardo 2 34081 49
34027 37 1.1 Café 2 34082 41.5
34026 39.5 1.2 Sardo 1.5 34083 51
34025 42 1.2 Sardo 1.5 34084 49.5
34024 35.5 1.2 Sardo 1.5 34085 44
34023 35 1.1 Sardo 1.5 34086 44.5
34022 37 1.2 Blanco 1.5 34087 47
34021 38.5 1.2 Blanco 1 34088 48.5
34020 30 1.1 Blanco 1 34089 45.6
34019 40 1.2 Café 2 34090 46
34018 35.5 1.2 Blanco 1.5 34091 39.5
34017 33 1 Blanco 1.5 34092 43
34016 34.5 1 Café 2 34093 45
34015 37.5 1 Café 2 34094 50.5
34014 38 1.2 Sardo 1 34095 43.5
34013 33 1.1 Sardo 1 34096 49
34012 34 1.1 Blanco 1 34097 47.5
34011 43.5 1.3 Café 1.5 34098 40
34010 31 1.2 Sardo 1.5 34099 50
34009 36 1.1 Café 1.5 34100 44.5
34008 35.5 1.2 Café 1.5 34101 48.5
34007 33.5 1.1 Café 1.5 34102 47.5
34006 37.5 1.3 Café 1 34103 43
34005 39 1.2 Café 1 34104 42
PROMEDIO I 35.6 1.132 1.45 46.784
PROMEDIO T 41.192 1.164 1.505
as comunes, sobre los cuales se quiere efectuar un estudio determinado.

estra debe obtenerse de la población que se desea estudiar.

to de todos los elementos que es sometido a una medición estadística.

Universo

Muestra
Borregas cargadas Nombre Edad
Longitud (m) Color (Blanco, Café, Sardo) Edad (años) (n=5) (años)
1.1 Sardo 2 X1=34054 1
1.1 Sardo 1.5 X2=34053 1.5
1.2 Blanco 2 Individuos X3=34052 1
1.1 Blanco 2 X4=34055 2
1.3 Blanco 1.5 X5=34056 1.5
1.3 Café 1.5 PROMEDIO (Ῡ 1.4
1.2 Blanco 1.5
1.2 Café 2 ENCUENTRA LOS SIGUIENTES CONCEP
1.2 Sardo 1.5 -Población (Universo)
1.1 Café 1.5 -Tamaño de la población
1.3 Blanco 2 -Muestra representativa
1.3 Blanco 2 -Tamaño de la muestra
1.3 Café 1.5 -Variables
1.2 Sardo 1 -Constante
1.1 Café 1.5 -Dominio de las variables
1.1 Sardo 1 -Datos
1 Sardo 1 -Parámetros
1.2 Sardo 1 -Estadísticos
1.2 Sardo 2 -Rama de la estadística utilizada
1.3 Blanco 1.5
1.2 Blanco 1.5
1.3 Blanco 2
1.3 Café 2
1.3 Blanco 2
1.3 Café 1
1.2 Sardo 1
1.2 Café 1
1.1 Blanco 1
1.3 Blanco 1.5
1.2 Café 2
1.2 Sardo 2
1.1 Café 2
1.2 Sardo 1.5
1.2 Sardo 1.5
1.2 Café 2
1.2 Sardo 1
1.2 Café 1.5
1.1 Blanco 1
1.1 Blanco 1
1.2 Café 1.5
1.1 Sardo 2
1.1 Sardo 2
1.1 Blanco 2
1.2 Blanco 1.5
1.2 Sardo 1.5
1.2 Café 2
1.3 Café 1
1.3 Café 1.5
1.2 Blanco 2
1.2 Café 1
1.196 1.56
Muestra
Peso Longitud Color
(kg) (m) Blanco, Café, Sardo
34 1.2 Blanco
34.5 1.3 Café
36 1.2 Sardo
36.5 1.1 Sardo
51 1.1 Sardo
38.4 1.18

OS SIGUIENTES CONCEPTOS Y ARGUMENTA:


Tezonapa Borreguera
100
X1-X5
5
Edad, Peso, Longitud, Color

Edad(1-1.5), Peso (27-58.5), Longitud (1-1.3), Color (Blanco, Café, Sardo)


(100.….Borregas)
Edad: 1.505, Peso: 41.192, Longitud: 1.164, Color: Blanco, Café, Sardo
Edad: 1.4, Peso: 38.4, Longitud: 1.18, Color: Blanco, Café, Sardo
tadística utilizada Descriptiva
VARIABLE y CONSTANTE
Definiciòn:

Variable: es una característica o cualidad de un individuo que está propensa a adquirir diferentes valores. Estos valores, a su v

Ejemplo en mis datos: Edad, Peso, Longitud, Color

Variable cuantitativa: Se pueden medir (Númericas).

Ejemplo en mis datos: Edad, Peso, Longitud

Variable cualitativa: De caracteristicas se categorizan tipos, no son medibles.

Ejemplo en mis datos: Color

Constante: Caracteristica de un conjunto de datos en un espacio determinado que no cambia.

Ejemplo: Para este conjunto de datos se está trabajando con borregas cargadas y borregas vacias, por lo tanto la constante es
tes valores. Estos valores, a su vez, se caracterizan por poder medirse.

ias, por lo tanto la constante es que todos los individuos son "Borregas"
ESCALA
Definiciòn: Serie de elementos de la misma especie ordenados por alguna de sus características.

Escala Ordinal: Conjunto de datos formados por orden jerárquico.

Ejemplo en mis datos: El número de Arete SINIIGA es importante que valla en orden, porque este ya te indica ciertas caracteri

Escala Nominal: El orden jerárquico no importa.

Ejemplo en mis datos: El color del pelo del animal, realmente no representa una superioridad en mis datos, porque todas son
ste ya te indica ciertas caracteristicas del animal, como su edad, un aproximado de cuanto pesa y lo mismo para su longitud.

en mis datos, porque todas son borregas raza Katahdin.


o para su longitud.
MANEJO DE DATOS: Organización, Mínimo, Máximo, Minimorum, Maximorum, Rango
Definiciòn:

Organización: La organización hace referencia al arreglo de los datos en un formato lógico para su interpretación. Un ejemplo

Ejemplo en mis datos: si se quisiera ordenar el peso en orden decreciente de las borregas vacias por etapas de 5 para conocer
Nombre Edad Peso Longitud Color
(n=5) (años) (kg) (m) Blanco, Café, Sardo
X1=34054 1 34 1.2 Blanco
X2=34053 1.5 34.5 1.3 Café
X3=34052 1 36 1.2 Sardo
X4=34055 2 36.5 1.1 Sardo
X5=34056 1.5 51 1.1 Sardo
PROMEDIO (Ῡ 1.4 38.4 1.18
Minimo: El mínimo es el valor de datos más pequeño en la muestra. Utilice el mínimo para identificar un posible valor atípico

Ejemplo en mis datos: Para el peso (kg) en borregas es 27

Maximo: El máximo es el valor de datos más grande en la muestra. Utilice el máximo para identificar un posible valor atípico o

Ejemplo en mis datos: Para el peso (kg) en borregas es 58.5

Minimorum: Es el menor valor posible de un conjunto de datos en un periodo.

Ejemplo en mis datos: en la primera seccion de prueba donde se toman 5 borregas para ser pesadas, el minimorum es 34

Maximorum: Es el mayor valor posible de un conjunto de datos en un periodo.

Ejemplo en mis datos: en la primera seccion de prueba donde se toman 5 borregas para ser pesadas, el maximorum es 51

Rango: es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de una población o muestra estadístic

Ejemplo en mis datos: Para el peso (kg) en borregas es 31.5

Ejemplo en mis datos: Para el peso (kg) en la muestra de borregas es 17


a su interpretación. Un ejemplo útil puede ser en orden creciente o decreciente.

as por etapas de 5 para conocer cuales ya cumplen el peso para poder cubrirse nuevamente.

ntificar un posible valor atípico o un error de entrada de datos.

ntificar un posible valor atípico o un error de entrada de datos.

esadas, el minimorum es 34

esadas, el maximorum es 51

población o muestra estadística.


TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
Definiciòn: son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocu

B. Vacias B. Cargadas Mayor-Menor Clase Intervalos f¡


Peso= 34 42 58.5 1 [27,32] 6
34.5 36.5 56 2 [32,37] 27
36 51 55.5 3 [37,42] 23
37 44 54.5 4 [42,47] 20
35 39.6 54 5 [47,52] 15
31 54 54 6 [52,57] 8
27 55.5 53 7 [57,62] 1
37 43 52.5 Total 100
33.5 45.5 52
34.5 43.5 51
35.5 44 51 Conclusiones: En la clase 2 se encuentra el mayor porcen
30 49 51 Tambien se denota que el 94% de las borreg
36.5 50.5 50.5
34 52 50.5
37 46.5 50
38 38.5 49.5
40.5 39 49
40 41.5 49
34.5 43.5 49
36 51 48.5
35 52.5 48.5
35.5 54 47.5
36 58.5 47.5
37 54.5 47
33.5 53 46.5
34.5 56 46
31 42.5 45.6
37 49 45.5
39.5 41.5 45
42 51 44.5
35.5 49.5 44.5
35 44 44
37 44.5 44
38.5 47 44
30 48.5 43.5
40 45.6 43.5
35.5 46 43.5
33 39.5 43.5
34.5 43 43
37.5 45 43
38 50.5 43
33 43.5 42.5
34 49 42
43.5 47.5 42
31 40 41.5
36 50 41.5
35.5 44.5 40.5
33.5 48.5 40
37.5 47.5 40
39 43 40
39.6
39.5
39.5
39
39
38.5
38.5
38
38
37.5
37.5
37
37
37
37
37
37
36.5
36.5
36
36
36
36
35.5
35.5
35.5
35.5
35.5
35
35
35
34.5
34.5
34.5
34.5
34.5
34
34
34
33.5
33.5
33.5
33
33
31
31
31
30
30
27
se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtenc

p¡ F¡ P¡ n. Intervalos = (𝑅𝑎𝑚𝑔𝑜=
6 6 6 58.5−27=31.5)/(1+3𝑙𝑜𝑔5
27 33 33 8.5) = 4.5 = 5
23 56 56
20 76 76
15 91 91
8 99 99
1 100 100
100

e encuentra el mayor porcentaje (27%) donde indica que 27 borregas pesan entre 32 y 37 kg.
nota que el 94% de las borregas pesan arriba de 32 kg lo cual es un indicador de que se debe trabajar para incrementar ese minimo.
recuencias es facilitar la obtención de la información que contienen los datos.

incrementar ese minimo.


MEDIA ARITMÉTICA SIMPLE
Definición: Se calcula sumando los datos de interés y dividiendo entre el total de datos.

Ventajas: Utiliza todos los datos de la población. Se puede calcular con los datos en bruto. Es el punto de equilibrio de

Desventajas: La media aritmética es muy sensible a datos atípicos (extremos). Solo sirve para datos númericos.

Fórmula: x̅= (𝑥1+𝑥2+𝑥3+𝑥4…


+𝑥𝑛)/𝑛= Σ𝑥𝑖/𝑛
Ejemplo: El siguiente cuadro muestra la longitud en borregas katahdin de "Tezonapa Borreguera" tomadas por muestr
Nombre Edad Peso Longitud Color
(n=5) (años) (kg) (m) Blanco, Café, Sardo
X1=34054 1 34 1.2 Blanco
X2=34053 1.5 34.5 1.3 Café
X3=34052 1 36 1.2 Sardo
X4=34055 2 36.5 1.1 Sardo
X5=34056 1.5 51 1.1 Sardo
PROMEDIO (Ῡ) 1.4 38.4 1.18

Método manual: (𝑋 ) ̅= (1.2+1.3+1.2+1.1+1.1 )/5= 5.9/5=1.8

Métodos con Excel: Longitud


(m)
1.2
1.3
1.2
1.1
1.1
𝑋̅ 1.18
Conclusiónes: Se demuestra que en promedio la longitud de los animales es de 1.18m, lo cual representa una calidad respetab
Es el punto de equilibrio de la distribución, por lo tanto representa a todos los datos.

os númericos.

guera" tomadas por muestreos aleatorios.

resenta una calidad respetable, debido a que la maxima longitud en esta raza es de 1.3m.
MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
Definición: Para obtener la Media aritmética en datos agrupados en intervalos se debe: a) Multiplicar la marca de clase por s

Ventajas: Si los datos X1 , X2 , X3 , … Xn están agrupados con frecuencias f1 , f2 , f3 … fn , es preferible utilizar la Media Arit
Desventajas: Solo sirve para datos númericos. Solo sirve para datos agrupados.

Fórmula: 𝑋 ̅= (𝒇_𝟏 𝑿_𝟏+𝒇_𝟐 𝑿_𝟐+𝒇_𝟑 𝑿_𝟑+


…+𝒇_𝑵 𝑿_𝑁)/(𝒇_𝟏+𝒇_𝟐+𝒇_𝟑+…
+𝒇_𝑵 )=(∑▒ 〖𝒇 _𝒊 𝑿_𝒊
〗 )/(∑▒𝒇_𝒊 )
Ejemplo: Clase Intervalos f¡ p¡ F¡ P¡
1 27 6 6 6 6
2 37 27 27 33 33
3 42 23 23 56 56
4 47 20 20 76 76
5 52 15 15 91 91
6 57 8 8 99 99
7 62 1 1 100 100
Total 100 100

Método manual: (𝑋 ) ̅=
((27)(6)+(37)(27)+(42)(23)+(47)(20)+(52)(15)+(57)(8)+(62)(1))/(6+2
+15+8+1) = 4,365/100=43.65
Xifi 4365
Métodos con Excel: 43.65 N 100

Conclusiónes: Cuando son muchos datos, pero estan agrupados en este tipo de tabla, es mas facil calcular la media aritmetica
ultiplicar la marca de clase por su frecuencia absoluta en cada intervalo, luego dividir la suma obtenida por el total de datos. b) Sumar cad

s preferible utilizar la Media Aritmética para Datos Agrupados.

57)(8)+(62)(1))/(6+27+23+20

acil calcular la media aritmetica de esta forma.


r el total de datos. b) Sumar cada variable y dividir esta suma por el total de datos.
MEDIA ARITMÉTICA EN TABLAS DE FRECUENCIA
Definición: Es la suma del producto de los valores de la variable por sus frecuencias absolutas divido por el tamaño de la pob

Ventajas: Cuando los datos se encuentran ordenados en intervalos con frecuencias, es preferente utilizar la media aritmética

Desventajas: Solo sirve en datos numericos. Solo sirve en datos agrupados en tablas de frecuencia.
𝑿 ̅=(∑▒ 〖𝒇 _𝒊
Fórmula: 𝑽_𝒊
〗 )/(∑▒𝒇_𝒊 )=

Ejemplo: Clase Intervalos f¡ p¡ F¡ P¡


1 [27,32] 6 6 6 6
2 [32,37] 27 27 33 33
3 [37,42] 23 23 56 56
4 [42,47] 20 20 76 76
5 [47,52] 15 15 91 91
6 [52,57] 8 8 99 99
7 [57,62] 1 1 100 100
Total 100 100

Método manual: 𝑋 ̅=((29.5)(6)+(34.5)(27)+(39. 5)(23)+(44.5)(20)+(49.5)(15)+(54.5)(8


" )/(6+27+23+20+15+8+1)=4,145/100=41.45
Xifi 4145
Métodos con Excel: 41.45 N 100

Conclusiónes: Cuando son muchos datos, pero estan agrupados en tabla de frecuencias, es mas facil calcular la media aritmeti
s divido por el tamaño de la población.

nte utilizar la media aritmética en tablas de frecuencia.

)+(49.5)(15)+(54.5)(8)+(59.5)(1)"
45

as facil calcular la media aritmetica de esta forma.


MEDIANA
Definición: La mediana es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a ma

Ventajas: Se puede calcular para datos ordinales. Es única y no varía con la escala. No se ve afectada por datos atípicos.
Desventajas: No utiliza todos los datos.
Posición de la
Fórmula: Cuando el total de datos analizados es numero impar:
Me=(𝑵+𝟏)/𝟐

Ejemplo: Para el caso de la longitud (m), peso (kg), edad (años) en "Tezonapa Borreguera".

Método manual: Como para cada variable (longitud, peso edad) el total de datos son 100, por lo tanto se deben identificar do

(1.2+1.1)/
Longitud= 2=1.15𝑚

Peso= (39+36.5)/2=37.75𝐾𝑔

Edad= (1+1.1)/2=1.05
𝐴ñ𝑜𝑠

Longitud Peso Edad


1.2 39 1
Métodos con Excel: 1.1 36.5 1.1
Me 1.15 37.75 1.05

Conclusiónes: Es muy util utilizar la media, mas sin embargo no se utilizan todos los datos, solo se toma el o los dos datos cent
están ordenados de menor a mayor. Es la media de los dos valores centrales.

afectada por datos atípicos.

Me=(𝒏𝑪𝒆𝒏𝒕𝒓𝒂𝒍+𝒏𝑪𝒆
Cuando el total de datos analizados es numero par:
𝒏𝒕𝒓𝒂𝒍)/𝟐

lo tanto se deben identificar dos cifras que se encuentren en la mitad de los datos desagrupados y dividirse entre 2.

o se toma el o los dos datos centrales como indicador.


MODA
Definiciòn: La moda de un conjunto de datos ordenados es el valor que se presenta con mayor frecuencia.

Ventajas: Cuando lo hay siempre es un valor observable. Si hay varias modas indica heterogeneidad en los datos. Se puede ca

Desventajas: Puede no haber moda y cuando la hay puede no ser única. Puede tener cualquier valor dentro del conjunto de d

Ejemplo: Para el caso de la longitud (m), peso (kg), edad (años) de los datos presentados.

B. Vacias B. Cargadas B. Vacias B. Cargadas


Longitud= 1.2 1.1 1.2 Peso= 34 42
1.3 1.1 34.5 36.5
1.2 1.2 36 51
1.1 1.1 37 44
1 1.3 35 39.6
1 1.3 31 54
1 1.2 27 55.5
1.2 1.2 37 43
1.2 1.2 33.5 45.5
1.2 1.1 34.5 43.5
1.2 1.3 35.5 44
1 1.3 30 49
1.1 1.3 36.5 50.5
1.1 1.2 34 52
1.1 1.1 37 46.5
1.1 1.1 38 38.5
1.2 1 40.5 39
1.2 1.2 40 41.5
1.1 1.2 34.5 43.5
1 1.3 36 51
1 1.2 35 52.5
1.2 1.3 35.5 54
1.1 1.3 36 58.5
1.2 1.3 37 54.5
1.1 1.3 33.5 53
1 1.2 34.5 56
1 1.2 31 42.5
1.1 1.1 37 49
1.2 1.3 39.5 41.5
1.2 1.2 42 51
1.2 1.2 35.5 49.5
1.1 1.1 35 44
1.2 1.2 37 44.5
1.2 1.2 38.5 47
1.1 1.2 30 48.5
1.2 1.2 40 45.6
1.2 1.2 35.5 46
1 1.1 33 39.5
1 1.1 34.5 43
1 1.2 37.5 45
1.2 1.1 38 50.5
1.1 1.1 33 43.5
1.1 1.1 34 49
1.3 1.2 43.5 47.5
1.2 1.2 31 40
1.1 1.2 36 50
1.2 1.3 35.5 44.5
1.1 1.3 33.5 48.5
1.3 1.2 37.5 47.5
1.2 1.2 39 43
r frecuencia.

eidad en los datos. Se puede calcular con datos nominales. No varía por cambios de origen ni de escala.

r valor dentro del conjunto de datos.

B. Vacias B. Cargadas
37 Edad= 1 2 1.5
1.5 1.5
1 2
1 2
1 1.5
1 1.5
1.5 1.5
2 2
2 1.5
1.5 1.5
1.5 2
2 2
2 1.5
1.5 1
1.5 1.5
1.5 1
1 1
1 1
1 2
1.5 1.5
2 1.5
1.5 2
1.5 2
1.5 2
1 1
2 1
2 1
2 1
1.5 1.5
1.5 2
1.5 2
1.5 2
1.5 1.5
1 1.5
1 2
2 1
1.5 1.5
1.5 1
2 1
2 1.5
1 2
1 2
1 2
1.5 1.5
1.5 1.5
1.5 2
1.5 1
1.5 1.5
1 2
1 1
MEDIA PONDERADA
Definición: es un tipo de media que otorga diferentes pesos a los distintos valores sobre los que se calcula. Se utiliza cuando lo

Ventajas: La media ponderada toma en cuenta la importancia relativa de cada uno de los datos de la población, dándoles un m

Desventajas: No es util cuando los datos representan la misma impotancia.

Fórmula: ¯("Xp" )="w x +w x +…+w x


1 1 2 2 n n

" /"w +w +…+w "


1 2 n

=(∑▒𝑊𝑖𝑋𝑖)/(∑▒𝑊𝑖)

Ejemplo: Se vendieron 3 borregas para consumo, dos se vendieron a un precio y la ultima se vendio al doble del precio, pe

¯𝑋
Método manual: 𝑝=((1)(37)+(1)(40)+(2)(44))/(1+1+2)=165/4=41
.25
SUMATORIA 165
Métodos con Excel: N 4 41.25

Conclusiónes: Se concluye la media ponderada del peso que se vendio (41.25 kg), lo cual representa un peso calidad.
e se calcula. Se utiliza cuando los datos no son de igual importancia dentro del conjunto.

s de la población, dándoles un mayor o menor peso en su cálculo.

se vendio al doble del precio, pesaron 37 kg, 40kg y 44kg.

senta un peso calidad.


MEDIA GEOMÉTRICA
Definición: es un tipo de media que se calcula como la raíz del producto de un conjunto de números estrictamente positivos.

Ventajas: Considera todos los valores de la distribución. Es menos sensible que la media aritmética a los valores extremos.

Desventajas: Es de significado estadístico menos intuitivo que la media aritmética. Su calculo es mas complejo.

Fórmula: G= √(𝑁&"X1X2X3…XN " )

Ejemplo: Si el crecimiento de las ventas en un negocio fue en los tres último años de 20%, 19% y 23%. Calcular la media an

Método manual: G= √(3&(20)(19)


(23) )=√(3&8,740)=20.59%
20
19 N 3
Métodos con Excel: 23 Media Geo. 20.60

Conclusiónes: Medialmente se puede denotar una corriente de crecimiento bastante buenas en las ventas de los u
meros estrictamente positivos.

ética a los valores extremos.

es mas complejo.

19% y 23%. Calcular la media anual.

nte buenas en las ventas de los ultimos 3 años con un + 20.6 %.


MEDIA ARMÓNICA
Definición: es igual al número de elementos de un grupo de cifras entre la suma de los inversos de cada una de estas cifras.

Ventajas: Se emplea para promediar variaciones con respecto al tiempo tales como productividades, tiempos, rendimiento
Desventajas: Es sensible a los valores extremos. No es recomendable emplearla en distribuciones muy asimétricas.

𝐻=1/(1/𝑁
Fórmula:
∑▒1/𝑋_𝐽
)=𝑁/(∑▒1/𝑋)

Ejemplo: Durante tres años consecutivos el precio del kg de borrego en pie fue de $50, $49 y $51. Cuál fue el precio prome

𝐻=3,000/
Método manual: (1,000/50+1,000/49+1,000/51)=3,000/60
=50

Métodos con Excel: 50 49 51 N 3000 50


20 20.4 19.6 SUMATORIA = 60

Conclusiónes: El precio sin duda se mantuvo sin tanta varianza, lo cual la empresa se adentró a vender producto y en el caso d
s de cada una de estas cifras.

tividades, tiempos, rendimientos, cambios, etc.


nes muy asimétricas.

9 y $51. Cuál fue el precio promedio (Media Armónica) en esos tres años si se compraron 1,000 borregas por año.?

a vender producto y en el caso de que se vallan aumentando las ventas; la media armónica nos permite observar ese cambio.
servar ese cambio.
MEDIA CUADRÁTICA
Definición: La media cuadrática o Raíz Cuadrada Media (RCM) de un conjunto de números X1 , X2, X3 , ….., XN es igual a la ra

Ventajas: Se emplea principalmente en problemas de física e ingeniería. Cuando el interés es que el signo de los números n
Desventajas: El proceso es bastante engorroso. Muchas veces tiene mucha desviación por las variaciones de la variable discre

RCM=√((𝑋) ̅ )=
Fórmula:
√((∑▒ 〖𝑋𝑗 ^2
Ejemplo: 〗 )/𝑁)
Cuando se tiene un peso exacto de calidad en borregas el cual es 46 kg. Se quiere conocer por muestras cual es la
Arete Kg Kg2 Error Xj2
34053 47 2209 1 1
34038 46.5 2162.25 0.5 0.25
34060 46 2116 0 0
34057 45.6 2079.36 -0.5 0.25
34044 38.5 1482.25 -7.5 56.25
SUMATORIA 223.6 10048.86 57.75
N 5 5 5 5 5

RCM=√(( 〖 (1) 〗 ^2+ 〖 (.5) 〗 ^2+


Método manual:
〖 (0) 〗 ^2+ 〖 (−0.5) 〗 ^2+
〖 (−7.5) 〗 ^2)/5)=√(57.75/5)=3.39
Métodos con Excel: RCM 3.39852909

Conclusiónes: La media cuadratica de los errores en los animales da un valor de 3.399, lo que indica que hay errores minimos,

La borrega 34044 representa el error mayor y se encuentra por debajo del peso calidad, por lo tanto se debe trab
1 , X2, X3 , ….., XN es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos:

es que el signo de los números no afecte el promedio. Cuando se quiere eliminar el efecto de errores.
variaciones de la variable discreta.

conocer por muestras cual es la borrega que pesa menos (encontrar el error) y trabajar sobre eso para mejorar la engorda.

〗 ^2+

5)=3.39
ndica que hay errores minimos, ya sea por que algunas borregas pesen mas o menos del peso optimo.

alidad, por lo tanto se debe trabajar con ella para que alcance el peso requerido.
mero de datos:

ejorar la engorda.
MEDIA PODADA
Definición: Una media podada de una muestra es la media empírica de la muestra, quitándole un cierto porcentaje de sus valo
Es una combinación entre la media aritmética y la mediana, en la que se excluyen una cantidad de datos extremo

Ventajas: Es un estimador útil porque es menos sensible a valores atípicos que el promedio. Da como resultado un razonab
Desventajas: Solo es útil cuando la distribución subyacente es simétrica.

Fórmula: a) se orden los datos. b) Se eliminan el mínimo y el máximo (u otra cantidad o porcentaje) de los datos ordenado

Ejemplo: Se requiere mediar el peso de las ultimas 5 borregas en venta, para estimar la ganancia.
Peso (Kg) Peso (Kg)
37 36
36 35
35 34.5
34.5
34

𝑋̅
Método manual:
(36+35+34.5)/3=105.5/3=
35.167
Matriz Porcentaje
36 10%
Métodos con Excel: 35 MEDIA ACO. 35.1666667
34.5
Conclusiónes: La media multiplicada por el costo del kg de borrego en pie menos la inversión, nos arroja la ganacia de las ultim
un cierto porcentaje de sus valores extremos.
una cantidad de datos extremos, por lo que es menos sensible a datos atípicos del promedio.

Da como resultado un razonable estimador de la tendencia central o promedio para numerosos modelos estadísticos.

entaje) de los datos ordenados. c) Con los datos restantes se calcula la media aritmética.d) El valor resultante es la media podada.

os arroja la ganacia de las ultimas borregas en venta.


stadísticos.

nte es la media podada.


MEDIA WINSORIZADA
Definición: Es un índice de tendencia central resistente a las desviaciones de los datos extremos de la distribución. Una vez or
de valores extremos se sustituyen por el valor inmediatamente anterior o posterior y se calcula la media de todo
Ventajas: Facilita el cálculo por la reducción de datos.
Desventajas: No se toman en cuenta todos los datos. Solo es útil con datos ordenados de forma decreciente o creciente.

Fórmula: a) Se elimina el 25% superior y el 25% inferior de los datos ordenados. b) Se reemplazan los datos eliminados por el m
c) El valor resultante es la media winsorizada.

Ejemplo: Mediar la edad de 40 borregas, debido a que los datos son repetitivos.
2 2 2 2 2 2 2
2 1.5 1.5 1.5 1.5 1.5 1.5
Edad(años)
1.5 1.5 1.5 1.5 1.5 1.5 1.5
1 1 1 1 1 1 1

2 1.5 1.5 1.5 1.5 1.5 1.5


1.5 1.5 1.5 1.5 1.5 1.5 1.5

𝑋 ̅=(2+1.5+1.5+1.5+1.5+1.5+1.5+1.5+1.5+1.5+1.5+1.5+1.5+1.5+1.5+1.5+
Método manual:

Conclusiónes: Se conoce que es un ganado jóven.


s de la distribución. Una vez ordenados los datos, un determinado porcentaje
or y se calcula la media de todos los valores.

a decreciente o creciente.

zan los datos eliminados por el menor y el mayor valor no eliminados. b) Se calcula la media aritmética de todos los datos.

2 2 2
1.5 1.5 1.5
1.5 1.5 1
1 1 1

1.5 1.5 1.5


1.5 1.5 1

1.5+1.5+1.5+1.5+1.5+1.5+1.5+1.5+1)/40=30/40=0.75
odos los datos.
VARIANZA
Definición: Es la suma de los cuadrados de las desviaciones de las observaciones con respecto a su media. Describen la disperc
Desventajas: si la varianza es pequena, nos indica que la media aritmetica es representativa del conjunto de datos./ si la varia

𝑆^2=(∑▒ 〖 (𝑋_
Formula: 𝑖−■8(−@𝑋))^2
〗 )/𝑁
Ejemplo: Determinar la varianza de las edades de 5 borregas de muestra.

Edad
(años)
1
1.5
1
2
1.5
𝑋̅ 1.4
N 5

Metodo manual: 𝑆^2=( 〖 (1−1.4) 〗 ^2+ 〖 (1.5−1.4) 〗 ^2+ 〖 (1−1.4) 〗 ^2+


〖 (2−1.4) 〗 ^2+ 〖 (1.5−1.4) 〗 ^2)/5=0.7/5=0.4

Metodo en excel: Desviacion E. 0.41833001


su media. Describen la disperción de los datos numericos respecto de un valor promedio.
conjunto de datos./ si la varianza es grande nos indica que media aritmetica no es confiable ya que los datos estan retirados.
tos estan retirados.
DESVIACIÓN ESTÁNDAR

Definición: También llamada desviación típica, es la raíz cuadrada del promedio de las desviaciones respecto de la media aritm

Ventajas: a) Se expresa en las unidades originales.


b) Utiliza todos los datos.
c) Es útil para comparar la variabilidad de dos conjuntos.

Desventajas: b) Se ve afectada por la presencia de valores atípicos.


a) es dificil de calcular

S=√(𝑆^2 )=√((Σ 〖 (𝑋_𝑖−𝑋 ̅) 〗 ^2)/𝑁)


Fórmula:

Ejemplo: Calcula la desviacion estandar del peso de 5 borregas tomadas de una muestra al azar.
Peso (Kg)
37 Media arit. 35.3
36
35
34.5
34
𝑆=√(( 〖 (37−35.3) 〗 ^2+ 〖 (36−35.3) 〗 ^2+…+ 〖 (34−35.3) 〗 ^2)/5)=√(5.8/5)=√1.16=1.07
Metodo manual:

Método con Excel: S=DESVESTPA(B16:B20) 1.077

Conclusiones: Se muestra la diferencia de un conjunto de datos con relación a su media.


nes respecto de la media aritmética.

5)=√(5.8/5)=√1.16=1.07
COEFICIENTE DE VARIACIÓN

Definición: Es la división de la desviación estándar entre su media aritmética.

Ventajas: a) Es independiente de las unidades de medición de los datos.


b) Es útil para comparar la variabilidad entre conjuntos de datos.

Desventajas: No es útil cuando la media es cercana a cero.

Fórmula: CV=𝑆/𝑋 ̅
̅
Ejemplo: Calcular el coeficiente de variacion del peso de 5 borregas tomadas de una muestra al azar.
Peso (Kg) Media arit. 35.3
37 S= 1.077
36
35
34.5
34

Método manual: 𝐶𝑉=1.07/35.3=0.03

Método con Excel: 0.03

Conclusiones: Se muestra que en promedio la diferencia entre los datos es de 3% de su media.


DESVIACIÓN MEDIA

Definición: Es el promedio del valor absoluto con respecto de la media aritmética.

Ventajas:
a) Es fácil de calcular y de interpretar.
b) Se utilizan toda los datos o información.
Desventajas:
a) El cálculo puede ser laborioso cuando el tamaño del conjunto de datos es grande.
b) Como utiliza valores absolutos, su tratamiento algebraico se dificulta para quienes no están familiarizados.
c) Carece de las ventajas teóricas de otras medidas de dispersión.

Fórmula: DM=(∑▒ 〖 |
𝑋_𝑖−𝑋 ̅| 〗 )/𝑁
Ejemplo: Calcular la desviación media del peso de 5 borregas tomadas de una muestra al azar.
Peso (Kg) Media arit. 35.3
37
36
35
34.5
34

𝐷𝑀=(|37−35.3|+|36−35.3|+|35−35.3|+|34.5−35.3|+|34−35.3|)/5=4.8/5=0.96
Método manual:

Metodo con Excel: DM= DESVPROM(CELDAS)


DM= 0.96

Conclusiones: En promedio los datos se separan de la media un 9.6%.


miliarizados.

35.3|)/5=4.8/5=0.96
RANGO SEMIINTERCUARTIL

Definición: •El rango semiintercuartil (=desviación cuartil) es el promedio de la diferencia del tercer cuartil menos el prime

Ventajas: a) Se facilita el calculo si los datos estan ordenados acendentemente o desendentemente.

Desventajas: a) No se utilizan todos los datos.

Fórmula: 𝑄=(𝑄_3−𝑄_1)/2

Ejemplo: El peso de 40 borregas con el menor peso (Kg).

Peso (Kg)
𝑄_3=
37.5 Metodo manual: 𝑄=(36−33.5)/2=
(36+36)/2=36
37.5
𝑄_2=
37
(35+34.5)/2=34.7
37 5
𝑄_1=
37
(33.5+33.5)/2=33.
37
5
37
37 Metodo con Excel: Q3= 36
36.5 Q2= 34.75
36 Q1= 33.5
36 Q= 1.25
36
36
35.5 Conclusiones: los valores estan seperados 1.25 Kg con respecto a la media.
35.5
35.5
35.5
35.5
35
35
35
34.5
34.5
34.5
34.5
34.5
34
34
34
33.5
33.5
33.5
33
33
31
31
31
30
30
27
Total 40
tercer cuartil menos el primer cuartil de los datos.

𝑄=(36−33.5)/2=2.5/2=1.25

respecto a la media.
COEFICIENTE DE VARIACION CUARTIL

Definición: •El coeficiente de variación cuartil (=coeficiente cuartil de dispersión relativa es una medida que combina la me
Reduce el efecto de valores extremos y tener una medida independiente de las unidades.

Ventajas: a) Se facilita el calculo si los datos estan ordenados acendentemente o desendentemente.


b) es util para conjunto de datos con valores extremos.

Desventajas: a) No se utilizan todos los datos.

𝑉_𝑄=(𝑄_3−𝑄_1
Fórmula: )/(𝑄_3+𝑄_1 )

Ejemplo: El peso de 40 borregas con el menor peso (Kg).


Peso (Kg)
𝑄_3=
37.5 Metodo manual:
(36+36)/2=36 𝑄=(36−33.5)/(36+
37.5
𝑄_2=
37
37
(35+34.5)/2=34.7
5
𝑄_1=
37
37 (33.5+33.5)/2=33.
37
5
37 Metodo con Excel: Q3= 36
36.5 Q2= 34.75
36 Q1= 33.5
36 Q= 0.036
36
36
35.5 Conclusiones: Los datos típicos difieren 4% de su media.
35.5
35.5
35.5
35.5
35
35
35
34.5
34.5
34.5
34.5
34.5
34
34
34
33.5
33.5
33.5
33
33
31
31
31
30
30
27
Total 40
medida que combina la media podada con el coeficiente de variación.

𝑄=(36−33.5)/(36+33.5)=2.5/69.5=0.03
CONJUNTO UNIVERSAL

Definición: Es el conjunto de todos los elementos de una población o universo, de acuerdo a un cierto problema o definición.
Ejemplo: U = {34054, 34053, 34052, 34051, 34050…}
U = {x|x es una borrega}

Igualdad de conjuntos:

Definición: Dos conjuntos A y B son iguales si y sólo si tienen los mismos elementos. Escribimos A=B, en caso contrario A≠B.
Ejemplo: A = {Café, Blanco, Sardos} A=C
B = {Café, Blanco} B≠A
C = {Café, Blanco, Sardos} B≠C

Subconjunto propio
Definición: Sean A y B dos conjuntos, si todo elemento de A es también elemento de B, diremos que A es un subconjunto pr
Para indicar que un elemento no pertenece a un conjunto cualquiera se utiliza el símbolo ∉, que quiere decir “no
Ejemplo: U = {Café, Blanco, Sardos} AϵB
A = {Blanco} BϵU
B = {Café, Blanco, Sardos} Café, Sardos ∉ A

Conjunto vacío
Definición: Es el conjunto que no contiene elementos, se representa con el símbolo 𝜑
A = {x|x es una borrega color negro}
A = {}
A= 𝜑
ierto problema o definición.

=B, en caso contrario A≠B.

s que A es un subconjunto propio de B. Se representa con el símbolo ϵ, que quiere decir “es un elemento propio de”.
mbolo ∉, que quiere decir “no es un elemento de”.
UNIÓN DE CONJUNTOS

Definición: El conjunto que está integrado por los elementos que pertenecen a A, a B o a ambos, es la unión de A con B. Se rep

Ejemplo: U=Borregas vacias. A={x|x es una borrega que pesa d


A´={x|x es una borrega Café, Blan
34052 A´´={x|x es una borrega que tiene

34054 34051

34050
34049
34047

Uniones: AᴗA´= {34054, 34053, 34051, 34050, 34049, 34047}


AᴗA´´= {34054,34053, 34050, 34049, 34047}
AᴗU= {34054, 34053, 34052, 34051, 34050, 34049, 34047}
os, es la unión de A con B. Se representa con el símbolo ᴗ.

={x|x es una borrega que pesa de 30-35kg.}


´={x|x es una borrega Café, Blanco}
´´={x|x es una borrega que tiene mas de 1 año de edad}

N. Arete S. Borregas Bacias o Arras


Peso (Kg) Longitud (m) Color (Blanco, Café, Sardo) Edad (años)
34054 34 1.2 Blanco 1
34053 34.5 1.3 Café 1.5
34052 36 1.2 Sardo 1
34051 37 1.1 Blanco 1
34050 35 1 Blanco 1
34049 31 1 Café 1
34047 37 1.2 Café 2
INTERSECCIÓN DE CONJUNTOS

Definición: Sean A y B dos conjuntos. El conjunto que está integrado por los elementes que pertenecen a ambos, es la in

Ejemplo: U=Borregas vacias.

34052
34054 34051

34050
34049
34053

34047

Intersecciones: A∩A´= {34054, 34053, 34050, 34049}


A∩A´´= {34053}
A∩U= {34054, 34053, 34050, 34049}
pertenecen a ambos, es la intersección de A y B. Se representa con el símbolo ∩.

A={x|x es una borrega que pesa de 30-35kg.}


A´={x|x es una borrega Café, Blanco}
A´´={x|x es una borrega que tiene mas de 1 año de edad}

N. Arete S. Borregas Bacias o Arras


Peso (Kg) Longitud (m) Color (Blanco, Café, Sardo) Edad (años)
34054 34 1.2 Blanco 1
34053 34.5 1.3 Café 1.5
34052 36 1.2 Sardo 1
34051 37 1.1 Blanco 1
34050 35 1 Blanco 1
34049 31 1 Café 1
34047 37 1.2 Café 2
CONJUNTOS AJENOS MUTUAMENTE EXCLUYENTES

Definición: Sean A y B dos conjuntos, diremos que son ajenos si: A∩B =𝜑

Ejemplo: U=Borregas vacias. A={x|x es una borrega color café}


B={x|x es una borrega color blan
C={x|x es una borrega color sardo
34053 34054
34049 34051
34047 34050 N. Arete S.
34052
34054
34053
34052
34051
34050
34049
C. Ajenos: A∩B∩C =𝜑 34047
={x|x es una borrega color café}
={x|x es una borrega color blanco}
={x|x es una borrega color sardo}

Borregas Bacias o Arras


Color (Blanco, Café, Sardo)
Blanco
Café
Sardo
Blanco
Blanco
Café
Café
DIFERENCIACIÓN

Definición: La diferencia entre dos conjuntos A y B es otro conjunto que se representa A – B y se forma con los elementos q

Ejemplo:
N. Arete S. Borregas Bacias o Arras U={x|x es borregas vacias}
Peso (Kg) Longitud (m) Color (Blanco, Café, Sardo) Edad (años) A={x|x Blancos}
34054 34 1.2 Blanco 1 B={x|x tienen una longitud
34053 34.5 1.3 Café 1.5 C={x|x pesan 37kg}
34052 36 1.2 Sardo 1
34051 37 1.1 Blanco 1 A-B={34051,34050} = que s
34050 35 1 Blanco 1 C-A={34047} = que pesen 3
34049 31 1 Café 1 B-C={34054,34052} = que m
34047 37 1.2 Café 2
orma con los elementos que pertenecen al conjunto A, y no pertenecen al conjunto B.

={x|x es borregas vacias}


={x|x Blancos}
={x|x tienen una longitud de 1.2}
={x|x pesan 37kg}

-B={34051,34050} = que sean blancas, pero no tengan una longitud de 1.2.


-A={34047} = que pesen 37kg, pero no sean blancas.
-C={34054,34052} = que midan 1.2 de longitud, pero no pesen 37kg.
COMPLEMENTO DE UN CONJUNTO

Definición: Sea A un conjunto y U su conjunto universal el complemento de A (notación: AC) es el conjunto integrado por los e

Ejemplo:
N. Arete S. Borregas Bacias o Arras U={x|x es borregas vacias}
Peso (Kg) Longitud (m) Color (Blanco, Café, Sardo) Edad (años) Conjunto A ={x|x es el peso de
34054 34 1.2 Blanco 1 Conjunto B = {x|x es la longitu
34053 34.5 1.3 Café 1.5 Conjunto C = {x|x es el color d
34052 36 1.2 Sardo 1
34051 37 1.1 Blanco 1 Ac= {34,34.5,36,37,35,31,37,B
34050 35 1 Blanco 1 Bc= {1.2,1.3,1.2,1.1,1,1,1.2,Bla
34049 31 1 Café 1
34047 37 1.2 Café 2
conjunto integrado por los elementos de U que no pertenecen a A.

={x|x es borregas vacias}


onjunto A ={x|x es el peso de la borrega}
onjunto B = {x|x es la longitud de la borrega}
onjunto C = {x|x es el color de la borrega}

c= {34,34.5,36,37,35,31,37,Blanco, Café, Sardo} Peso y color de la borrega


c= {1.2,1.3,1.2,1.1,1,1,1.2,Blanco, Café, Sardo} Longitud y color de la borrega
MODELO
Definicion: Es una abstracción esquemática o conceptual del mundo real.
Ejemplo:
Modelo de los aretes de borrego, tiene caractristicas que lo haces unico.
El modelo de ganancias basado en la produccion de borregos.

Abstraccion del mundo real:


Definicion: Capacidad del ser humano para entender una situación excluyendo detalles y solo viéndola a alto nivel.
Esta propiedad permite distinguir a un objeto de los demás, observando sus características y comportamientos esenciales.
Con la abstracción se destaca lo importante y se ignora lo irrelevante, o sea, hay ocultamiento de información.
Ejemplo:
Al ver el número del arete del animal solo vemos una cantidad, pero existe mas informacion oculta como su peso etc.
o viéndola a alto nivel.
omportamientos esenciales.
de información.

culta como su peso etc.


TIPOS DE MODELO
Definición: En la descripción, explicación o prediccióncientífica de la realidad se pueden utilizar varios tipos de lenguajes, llam

Lenguaje escrito:
Definicion: El lenguaje escrito es una invención, en el sentido de que debe ser enseñada, a diferencia del lenguaje hablado o
Ejemplo: Cualquier medio impreso

Modelos icónicos:
Definición: Es una representación física de algunos objetos, ya sea en forma idealizada o en escala distinta.
Ejemplo: Ela etiquete que se le da a un borrego es un icono de que se trata de un animal de ganado.

Modelos analógicos
Definicion: Un modelo análogo es una representación material de un objeto o un proceso para entender mejor su origen, fo
Ejemplo: Los planos de una granja

Modelos topologicos
Definición: En general, un modelo de datos topológico administra relaciones espaciales representando objetos espaciales (e
Ejemplo: El mapa de una hacienda

Modelos matematicos
Definicion: Un modelo matemático es una representación simplificada, a través de ecuaciones, funciones o fórmulas matem
Ejemplo: Diagramas de Venn Tablas de dispercion
ar varios tipos de lenguajes, llamados modelos:

ferencia del lenguaje hablado o de la lengua de signos, que son aprendidos espontáneamente por exposición, especialmente en la infanci

escala distinta.

ra entender mejor su origen, formación o funcionamiento

esentando objetos espaciales (entidades de punto, línea y área) como un gráfico subyacente de primitivas topológicas: nodos, caras y bord

es, funciones o fórmulas matemáticas, de un fenómeno


ón, especialmente en la infancia.

topológicas: nodos, caras y bordes.


DESCRIPCIÓN
Definición: Discurso oral o escrito en el que se explica cómo es una cosa, una persona o un lugar para ofrecer una imagen o
Ejemplo: Un borrego de pelo blanco en mediana edad.

Modelo descriptivo
Definición: Permite una comprensión del equipo y de sus resultados desde una perspectiva global e intrínseca
Ejemplo: Censo del ganado

Modelo explicativo
Definición: Como un principio explicativo de la realidad observable, como la expresión matemática más breve y exacta que d
Ejemplo:

Modelo probalilistico
Definición: Modelo probabilístico o estadístico es la forma que pueden tomar un conjunto de datos obtenidos de muestreos
Ejemplo:
ugar para ofrecer una imagen o una idea completa de ellos.

lobal e intrínseca

mática más breve y exacta que describe lo que hasta la fecha se conoce de un determinado .

e datos obtenidos de muestreos de datos con comportamiento que se supone aleatorio.


MODELO DETERMINÍSTICO
Definicion: Un modelo determinísticoes aquel donde las mismas entradas producirán siempre las mismas salidas.
Ejemplo: El modelo de negocio de la produccion de borregos

Modelo no deterministico
Definicion: Un modelo no determinísticoes aquel donde no se pueden predecir las salidas.
Ejemplo: Predecir el peso de todos los borregos producidos.
e las mismas salidas.
TIPOS DE CONOCIMIENTO
Definicion: Todos los TIPOS DE CONOCIMIENTO son semejantes en cuanto a que dependen de la evidencia(=dato), sólo difie
Empirico: Se aprende atraves de la experiencia.
Cientifico: Conocimiento sostematico verifivable.
Filosofico: Es un continuo cuestionar sobre sí y sobre la realidad.
Teologico: El relativo a Dios, que se acepta como acto de fe (los datos son una revelación divina).
Directo: El que se percibe a través de los sentidos
Indirecto: Conjunto de creencias, convicciones y juicios que tenemos sobre la realidad, y que pueden ser verdaderos o falso

Experimentación:
Definicion: Es el proceso mediante el cual hacemos una observación que proporciona datos.
Ejemplo: Escoger un borrego al azar y esperar que este pese 46kg

Experimento determinístico:
Definicion: Es aquel que se puede predecir con certeza absoluta antes de su realización.Como consecuencia se tiene siempre
Ejemplo: Tomar un borrego al azar y esperar que este tenga cuatro patas.

Experimento no determinístico
Definicion: Es aquel que no se puede predecir o asegurar con certeza absoluta antes de su realización. Por lo tanto, da lugar
Ejemplo: Escoger un borrego al azar y esperar que este pese 46kg
de la evidencia(=dato), sólo difieren entre sí en cuanto al objeto con el que trabajan y en la forma en que lo hacen.

e pueden ser verdaderos o falsos.

o consecuencia se tiene siempre el mismo resultado.Los experimentos cuyos resultados pueden anticiparse no son de interés para la estad

alización. Por lo tanto, da lugar a varios resultados posibles sin que se pueda asegurar cuál de ello se presentará. Es decir, está sujeto al az
e no son de interés para la estadística.

entará. Es decir, está sujeto al azar.


¿QUÉ RELACIÓN HAY ENTRE LA PROBABILIDADY LA TEORIA DE CONJUNTOS?
Ejercicio: ¿Cuál es la probabilidad de encontrar una borrega de 1.5 años o mas o que pese mas de 36 kg?

Ejemplo:
N. Arete S. Borregas Bacias o Arras U={x|x es borregas vacias}
Peso (Kg) Longitud (m) Color (BlancoEdad (años) Conjunto A ={x|x es el peso de la
34054 34 1.2 Blanco 1 Conjunto B = {x|x es la longitud d
34053 34.5 1.3 Café 1.5 Conjunto C = {x|x es el color de la
34052 36 1.2 Sardo 1
34051 37 1.1 Blanco 1 Ac= {34,34.5,36,37,35,31,37,Blan
34050 35 1 Blanco 1 Bc= {1.2,1.3,1.2,1.1,1,1,1.2,Blanc
34049 31 1 Café 1
34047 37 1.2 Café 2

Respuesta:
Dos borregos tienen una edad de mas de un año y medio y dos mas pesan mas de 36 kg, sin embargo uno de ellos es el mismo
mas de 36 kg?

={x|x es borregas vacias}


onjunto A ={x|x es el peso de la borrega}
onjunto B = {x|x es la longitud de la borrega}
onjunto C = {x|x es el color de la borrega}

c= {34,34.5,36,37,35,31,37,Blanco, Café, Sardo} Peso y color de la borrega


c= {1.2,1.3,1.2,1.1,1,1,1.2,Blanco, Café, Sardo} Longitud y color de la borrega

mbargo uno de ellos es el mismo= 2+2=4-1=3


EXPERIMENTO
Definicion: Cualquier proceso de observación o medida de un fenómeno aleatorio es un experimento
Ejemplo: Pesar a una borrega

Resultado
Definicion: Los efectos posibles del experimentose llaman resultados
Ejemplo: 43kg, 36kg, 21kg

Espacio muestral
Definicion: Al conjunto de todos los posibles resultados de un experimento se conoce como espacio muestral(M=S=U).
Ejemplo: S={43kg,36kg,21kg}

a) Experimento
1.Se tiene un total control del proceso.
2.Se puede repetir indefinidamente, siempre en las mismas condiciones.
3.Antes de realizarlo, no se puede predecir el resultado que se va a obtener.
4.El resultado que se obtenga, (E=evento), pertenece a un conjunto conocido previamente de resultados posibles (espacio mu
ejemplo: Obtener la estatura de un borrego al azar

b)Acontecimiento
1.Aunque se puede programar su realización, NO se tieneun control total del proceso.
2.A veces se puede repetir pero no en las mismas condiciones.
3.A veces se puede manipular algo el proceso pero NO se puede predecir el resultado que se va a obtener.
Ejemplo: El dia que dara a luz una borrega cargada

c)Situacion
1.NO sé puede programar su realización, NO se tiene control del proceso, es algo que ocurre.
2.No sé puede repetir.
3.Se puede NO conocer el resultado a obtener.
Ejemplo: El fallecimiento inesperado de una borrega
espacio muestral(M=S=U).

resultados posibles (espacio muestral).

a a obtener.
ESPACIO MUESTRAL DISCRETO
Definicion: Espacio integrado por un número finito (o infinito pero numerable) de elementos.
Ejemplo: Se realiza un censo sobre la edad de las borregas.
Espacio muestral:
S={1,2,3}

Espacio muestral continuo


Definicion: Espacio que contiene a todos los elementos en uno o varios segmentos de la línea real.
Ejemplo: Se realiza un censo sobre el peso de las borregas de un establo.
Espacio muestral:
Los resultados posibles son: M={e|e>0}

Evento
Definicion: Es un subconjunto de un espacio muestral.Se representa con la letra E.
Ejemplo: Ejemplo:
N. Arete S. Borregas Bacias o Arras U={x|x es borregas vacias}
Peso (Kg) Longitud (m) Color (BlancoEdad (años) Conjunto E1 ={x|x es el peso de l
34054 34 1.2 Blanco 1 Conjunto E2 = {x|x es la longitud
34053 34.5 1.3 Café 1.5 Conjunto E3 = {x|x es el color de
34052 36 1.2 Sardo 1
34051 37 1.1 Blanco 1
34050 35 1 Blanco 1
34049 31 1 Café 1
34047 37 1.2 Café 2
={x|x es borregas vacias}
onjunto E1 ={x|x es el peso de la borrega}
onjunto E2 = {x|x es la longitud de la borrega}
onjunto E3 = {x|x es el color de la borrega}
PROBABILIDAD
Definicion: La probabilidad de que un evento pueda ocurrir se le llama éxito, se denota p.Por el contrario, la probabilidad de
Ejemplo:
Ejercicio: ¿Cuál es la probabilidad de encontrar una borrega de 1.5 años o mas o que pese mas de 36 kg?

Ejemplo:
N. Arete S. Borregas Bacias o Arras
Peso (Kg) Longitud (m) Color (BlancoEdad (años)
34054 34 1.2 Blanco 1
34053 34.5 1.3 Café 1.5
34052 36 1.2 Sardo 1
34051 37 1.1 Blanco 1
34050 35 1 Blanco 1
34049 31 1 Café 1
34047 37 1.2 Café 2

Respuesta:
Dos borregos tienen una edad de mas de un año y medio y dos mas pesan mas de 36 kg, sin embargo uno de ello

Probabilidad: 42.85%
el contrario, la probabilidad de que el evento no ocurra se le llama fracaso, se denota q.

s o que pese mas de 36 kg?

U={x|x es borregas vacias}


Conjunto A ={x|x es el peso de la borrega}
Conjunto B = {x|x es la longitud de la borrega}
Conjunto C = {x|x es el color de la borrega}

Ac= {34,34.5,36,37,35,31,37,Blanco, Café, Sardo} Peso y color de la borrega


Bc= {1.2,1.3,1.2,1.1,1,1,1.2,Blanco, Café, Sardo} Longitud y color de la borrega

e 36 kg, sin embargo uno de ellos es el mismo= 2+2=4-1=3


EVENTO SIMPLE
Defincion: Es cada resultado individual de un experimento aleatorio. Es un subconjunto del espacio muestral que contiene u
Ejemplo: Seleecionar a una borrega y que esta pese 36kg M={si,no} E={si,no}

Evento compuesto
Definición: Aquel que se compone de dos o más resultados de un experimento aleatorio.
Ejemplo: se seleccionas dos borregas y esperamos que pesen 36 kg M={si,si},{si,no},{no,si},{no,no}

Cardinalidad
Definición: La cardinalidadde un conjuntose representa con el símbolo n( )=y corresponde al número de elementos que conti
Ejemplo: Seleecionar a una borrega y que esta pese 36kg M={si,no} E={si,no}

Evento seguro
Definicion: Es aquel que contiene todos los posibles resultados del experimento aleatorio; es decir coincide con el espacio m
Ejemplo: Seleccionar una borrega que sea mamifero M={si} E{si}

Evento imposible
Definicion: Es aquel que carece de resultados.Es equivalente al conjunto vacío.
Ejemplo: Seleccionar una borrega que sea oviparo M={}

Evento complementario
Definicion: Es aquel que contiene todos los resultados que no tiene el evento del cual es complemento.
Ejemplo: Las borregas que no pesan 36 kg

Eventos mutuamente excluyentes


Definicion: Dos eventos son mutuamente excluyentes si no pueden ocurrir en formasimultánea, esto es, si y sólo si su inters
ejemplo: Cuando una borrega da a luz y se quiere saber cuantas crias tendra o si estran vivas
espacio muestral que contiene un único elemento.

},{no,si},{no,no}

número de elementos que contiene el conjunto.


n(M)=2

decir coincide con el espacio muestral

nea, esto es, si y sólo si su intersección es vacía.


TÉCNICAS DE CONTEO
Definición: Las técnicas de conteo son aquellas usadas para enumerar eventos difíciles de cuantificar.
Objetivo: Aplicar las técnicas de conteo, así como determinar el tamaño del espacio muestrala fin de valorar la ocurrencia
Ejemplo: ¿Cuál es la posible edad de las borregas?
N. Arete S. Borregas Bacias o Arras S={1,1.5,2}
Peso (Kg) Longitud (m) Color (BlancoEdad (años) n(S)=3
34054 34 1.2 Blanco 1
34053 34.5 1.3 Café 1.5
34052 36 1.2 Sardo 1
34051 37 1.1 Blanco 1
34050 35 1 Blanco 1
34049 31 1 Café 1
34047 37 1.2 Café 2

Conclusión: Cuando se trata de enumerar a todos los resultados posibles de un fenómeno aleatorio con fines de hacer cálculo
rala fin de valorar la ocurrencia de un evento.

atorio con fines de hacer cálculos probabilísticos, el problema puede ser muy sencillo o muy laborioso, llegando a extremos que la enume
gando a extremos que la enumeración es prácticamente imposible.El procedimiento de enumeración, además de ser impráctico, puede se
más de ser impráctico, puede ser voluminoso y altamente sujeto a errores.
TÉCNICAS DE CONTEO
Defincion: Las técnicas de conteoson aquellas usadas para enumerar eventos difíciles de cuantificar.
Podemos encontrar:
Mediante una lista sistemática.

Mediante árbol de probabilidades.

Mediante principios fundamentales del conteo.

Principio de multiplicación.

Principio de adición.

Factorial.

Permutaciones.

Combinaciones.
LISTA SISTEMÁTICA
Definición: La lista sistematicamente sistematico es un tipo de muestreo probabilístico donde se hace una selección aleatori
Ejemplo:
Supongamos que se escoge al azar a un borrego y se pretende determinar su sexo.
Sexo
Hembra Macho

S={m,h} n(s)=2
e se hace una selección aleatoria del primer elemento para la muestra, y luego se seleccionan los elementos posteriores utilizando interva
os posteriores utilizando intervalos fijos o sistemáticos hasta alcanzar el tamaño de la muestra deseado.
DENDROGRAMA
Definición: Un dendrograma es un tipo de representación gráfica o diagrama de datos en forma de árbol que organiza los da
Ejemplo: Supongamos que se eligue al azar dos borregas para conocer su sexo

Borrega 1

Hembra

S={mm,mh,hm,ff} n(S)=4

Consideracion:
Para calcular la probabilidad de un resultado se multiplican las probabilidades a lo largo de la ruta que lleva a dicho resultado.
ma de árbol que organiza los datos en subcategorías que se van dividiendo en otros hasta llegar al nivel de detalle deseado.

Borrega 2

Macho Macho Hembra

uta que lleva a dicho resultado.


detalle deseado.
PRINCIPIO DE MULTIPLICACIÓN
Definición: Si un evento A puede ocurrir de m formas distintas y un evento B también puede ocurrir de n formas distintas, P(
Ejemplo: Se debe realizar un pedido de 30 borregos y 20 borregas, se desea conocer cuantas posibles posibles combinacio

Total= (30)(20) 600


ocurrir de n formas distintas, P(A y B), tal que hay m x n formas de que ambos eventos puedan ocurrir.
as posibles posibles combinaciones hay
PRINCIPIO FUNDAMENTAL DE ADICIÓN
Definición: Si un evento A puede ocurrir de m formas distintas y un evento B también puede ocurrir de n formas distintas, pe
Ejemplo: Si se requiere escoger un borrego para un concurso del condado y se tiene dos camadas una de 23 borregos y la

AUB=(23)+(15)=38
ocurrir de n formas distintas, pero ambos eventos son mutuamente excluyentes, P(A ó B), tal que hay m + n formas de que ocurra un even
madas una de 23 borregos y la segunda de 15 borregos ¿Cuantas opciones hay par escoger?
n formas de que ocurra un evento combinado.
PRINCIPIO FUNDAMENTAL DE CONTEO.
Definición: Si un evento A puede ocurrir de n 1 maneras, y una vez que este ha ocurrido, otro evento B puede ocurrir de n 2
Ejemplo: Si se requieren escoger 3 borregos para consursos diferentes, sabiendo que el total de borregos es 38 ¿Cuántas f

(n1)(n2)(n3)=(38)(37)(36)=50616
o evento B puede ocurrir de n 2 maneras diferentes, entonces el número total de formas diferentes en que ambos eventos pueden ocurrir
al de borregos es 38 ¿Cuántas formas existen de organizarse?
ambos eventos pueden ocurrir en el orden indicado, es igual a n1 x n2.
FACTORIAL
Definicion: El factorial de un número entero positivo es el producto de todos los números naturales anteriores o iguales a él
Formula:

N!=(n*n-1*n....)
Ejemplo: Se requiere acomodar a 8 borregos en diferentes lugares del establo ¿Cuántas formas hay de acomodarlos?

8*7*6*5*4*3*2*1=40320

Ventajas:

Es relativamente fácil saber el número total de arreglos posibles.


Desventajas:
No sabemos cuáles son esos arreglos.
turales anteriores o iguales a él. Se escribe n!, y se lee “nfactorial ”.

rmas hay de acomodarlos?


PERMUTANCIÓN
Definicion: Se llama permutación, a las formas distintas en las que se puede ordenar todo o parte de un conjunto de elemen
Formula:
𝑃𝑛=𝑛!
Ejemplo: Las distinatas formas de acomodar a 3 borregos en un establo.

Pn=3*2*1=6
A,B,C
S= B,C,A
C,A,B
C,B,A
B,A,C
A,C,B
parte de un conjunto de elementos.
PERMUTACIONES TOMANDO LOS ELEMENTOS EN GRUPOS
Definicion: El número de arreglos de n objetos distintos tomados en grupos de k a la vez, donde k ≤ n, está dada por:
Formula:
𝑝𝑘=𝑛!/(𝑛−𝑘)!

Ejemplo: Se requiere organizar a un grupo de 12 boregos en dos establos diferentes ¿Cuántos arrelgos existen?

𝑝𝑘=𝑛!/(𝑛−𝑘)!=12!/(12−2)!=12𝑥11𝑥10𝑥9𝑥8𝑥7𝑥6𝑥5𝑥4𝑥3𝑥2𝑥1
nde k ≤ n, está dada por:

tos arrelgos existen?

𝑥7𝑥6𝑥5𝑥4𝑥3𝑥2𝑥1/10𝑥9𝑥8𝑥7𝑥6𝑥5𝑥4𝑥3𝑥2𝑥1=479001600/3628800=13
00/3628800=132
PERMUTACIONES CIRCULARES
Uso: Se utiliza cuando los elementos se encuentran ordenados de manera circular.
formula:
𝑝𝑐𝑖𝑟=(𝑛−1)!

Ejemplo: La forma de acomodar a 6 borregos en un establo de reodeo circular.


𝑝𝑐𝑖𝑟=(𝑛−1)!=(6-1)!=5!=120
PERMUTACIONES DONDE NO TODOS LOS ELEMENTOS SON DIFERENTES
Uso: Se utiliza cuando algunos elementos del conjunto son idénticos.
Formula:

𝑃𝑛1𝑛2=𝑛!/𝑛1!𝑛2!

Ejemplo: El numero de etiqueta de un borrego tiene 4 digitos los cuales son 2,233 ¿Cuántas combinaciones existen?

𝑃𝑛1𝑛2=𝑛!/𝑛1!𝑛2!=4!/((2)(2))=24/4=6
as combinaciones existen?
COMBINACIONES
Definicion: Se le llama combinación de los n elementos de un conjunto, a la selección no ordenada de k elementos del conju
Fomula:

𝐶𝑘 𝑛!/(𝑛−𝑘)!(𝑘)!

Ejemplo:
Si se tiene 12 borregos y se requieren poner en 3 establos diferentes. ¿Cuántas comobinaciones posibles existen?

𝐶𝑘 𝑛!/(𝑛−𝑘)!(𝑘)!=12!/(12−3)!(3)!
=479001600/2177280=220
enada de k elementos del conjunto.

es posibles existen?
VARIABLE ALEATORIA
Definicion: Una variable aleatoria es una variable que toma valores de acuerdo con los resultados de un fenómeno aleatorio
Ejemplo: Si X representa el rendimiento que tendrán los borregos de una granja el año pasado, entonces X es una variable

X= kilos de carne de borrego. XN=n


X1=1kg
Variables aleatorias y su clasificacion
Discreta
Definición: Una variable aleatoriaes discreta, si puede tomar un número finito o infinito pero enumerablede valores.
Ejemplo: X representa la edad de los borregos. 1 año 2 años n años

Continua
Definición: Una variable aleatoriaes continua, si puede tomar cualquier valor dentro de un intervalo de valores.
Ejemplo: X representa los kilogramos que pesa un borrego. 3.2kg 5.5kg n kg
ados de un fenómeno aleatorio.
ado, entonces X es una variable aleatoria, porque no se puede asegurar con certeza y puede tomar cualquier valor posible.

enumerablede valores.

tervalo de valores.
ier valor posible.
EL CONCEPTO DE DISTRIBUCIÓN DE PROBABILIDAD
Definción: Debido a que existen diferencias en la presentación de conceptos cuando la variable aleatoria es discreta y cuand

Variables aleatorias discretas


Definción: Sabemos que una variable aleatoria discreta (= discontinua) es aquella en la que existe una distancia bien definid
Ejemplo: •Uniforme•Binomial•Geométrica•Hipergeométrica•Multinomial•Poisson

Variables aleatorias continuas


Definción: Por otro lado en las variables aleatorias continuas pueden tomarse valores infinitos dentro de un cierto intervalo
Ejemplo: •Uniforme•Exponencial•Normal
ble aleatoria es discreta y cuando es continua, se presentarán por separado estos dos casos.

existe una distancia bien definida entre dos de los valores consecutivos que asume; y dichos valores son numerables.

os dentro de un cierto intervalo.


PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA
Definción: La distribución de probabilidades una representación teórica de los posibles resultados de un experimento aleato
Consideraciones:
Para representar la distribución de probabilidad existen diferentes tipos de modelos (tablas, gráficas, fórmulas). Estos permite
Cuando el número de valores que puede tomar la variable aleatoria es muy grande, es más práctico describir su comportamie
Cuando la probabilidad asociada a cada uno de los valores de la variable aleatoria puede ser organizada como un listado de las

Ejemplo:
Consideremos el posible sexo de un borrrego.
El espacio muestral es S={Hembra, Macho}
Si estamos interesados en que sea de sexo masculino, la variable aleatoria X puede tomar los valores:
X=0 no es masculino X=1 Es masculino

La distribución de probabilidad de la variable aleatoria X es:

Columna1 Columna2 Columna3 Columna4


P(X=xi) Elemento muestral P(xi)
P(X=0) (h) 1 1/2=50%
P(X=1) (m) 1 1/2=50%
Suma 2 100%
tados de un experimento aleatorio.

áficas, fórmulas). Estos permiten describir el comportamiento de variables aleatorias y hacer inferencias teórica de sus resultados.
áctico describir su comportamiento probabilístico mediante una fórmula.
rganizada como un listado de las probabilidades de todos los resultados posibles de un experimento se le llama distribución de probabilida
eórica de sus resultados.

ama distribución de probabilidad.


REGLA DE LAPLACE
Definicion: La probabilidad de que algo ocurra se puede medir de 0 a 1, donde 0 es un evento imposible y 1 es un evento seg
Formula:

𝑃(𝐴)=(𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠)/(𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠)=

Requisitos para una distribución de probabilidad discreta:


Que las probabilidades de cada uno de los eventos simples sea mayor o igual a cero pero menor que uno: 0 ≤ P(X) ≤ 1.Que la s
Una distribución de probabilidad también se puede presentar gráficamente. Son todos los resultados posibles de algún experi
Ejemplo:
Del ejemplo anterior se puede obtener la siguiente grafica.

Chart Title
Series1
2.5

1.5

0.5

0
P (X =0 ) (f) P (X =1 ) (m ) Suma
o imposible y 1 es un evento seguro.Si todos los resultados de un espacio muestralS son igualmente probables, y A es un evento en ese es

𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠)=(𝑛(𝐴))/(𝑛(𝑆))

or que uno: 0 ≤ P(X) ≤ 1.Que la suma de las probabilidades de todos los posibles valores obtenidos en el espacio muestral sea igual a 1.
ultados posibles de algún experimento y la probabilidad relacionada con cada uno de esos resultados.
bles, y A es un evento en ese espacio muestral, entonces la probabilidad teórica del evento A esta dada por:

pacio muestral sea igual a 1.


DISTRIBUCIÓN DE PROBABILIDAD BINOMINAL PUNTUAL(BERNOULLI)
Definición: Es el caso de experimentos cuyo espacio muestral está integrado sólo por dos resultados posibles, denominados
Caracteristicas:
a)El espacio muestral(M) solamente contiene dos resultados posibles denominados éxito (E) y fracaso (F), esto es: 𝑴= 𝑬𝒙𝒊𝒕𝒐, 𝑭
b)La probabilidad de que ocurra el evento {E}es p(0≤p≤1), por lo que: 𝑷𝑬= 𝒑𝑷𝑭= 𝟏− 𝒑= 𝒒
Si se define la variable aleatoria X sobre el espacio muestral M, entonces: X(E) = 1y X(F) = 0Es decir: 𝑷𝑿= 𝟏= 𝒑𝟏∗( 𝟏− 𝒑) 𝟏− 𝟏𝑷𝑿= 𝟎

Ejemplo:
Supongamos que en un rebaño de 13 borregos, 4 son superiores.
Los resultados posibles se registran como éxito (E) si el borrego que selecciono es superior y como fracaso (F) si no lo es.
Resultados:
La probabilidad que un Borrego sea superior:
P(X=1)=(4/13)¹*(1-4/13)¹-¹=4/13*1=4/13=0.3076

La probabilidad de que un Borrego no sea superior:

P(X=0)=(4/13)^0*(1-4/13)^(1-0)=9/13*1=9/13=9/13=0.6923
ultados posibles, denominados éxito(E) y fracaso(F), considerados mutuamente excluyentes.

fracaso (F), esto es: 𝑴= 𝑬𝒙𝒊𝒕𝒐, 𝑭𝒓𝒂𝒄𝒂𝒔𝒐ó 𝑴= 𝑬, 𝑭

ecir: 𝑷𝑿= 𝟏= 𝒑𝟏∗( 𝟏− 𝒑) 𝟏− 𝟏𝑷𝑿= 𝟎= 𝒑𝟎∗( 𝟏− 𝒑) 𝟏− 𝟎

omo fracaso (F) si no lo es.


DISTRIBUCION DISCRETA BINOMIAL
Definición:
Cuando los resultados de un experimento se dividen en dos categorías, éxito y fracaso (el prefijo bisignifica dos).
Es la que maneja la distribución de la probabilidad de obtener cierta cantidad de éxitos al realizar una cantidad de experiment
Propiedades:
1.El espacio muestral contiene n ensayos idénticos.
2.Las observaciones posibles se pueden obtener mediante dos diferentes métodos de muestreo:
a)Se puede considerar que cada observación se ha seleccionado de una población infinita sin reposición
b)O de una población finita con reposición.
3.Cada observación se puede clasificar en una de dos categorías conocidas como éxito Eo fracaso F, las cuales son mutuamen
4.Las probabilidades de éxito p y de fracaso q = 1 –pen un ensayo se mantienen constantes, durante los nensayos.
5.El resultado de cualquier observación es independiente del resultado de cualquier otra observación.
Formula:
La probabilidad de que el evento E=éxito ocurra x veces y el evento F=fracaso ocurra (n -x)veces en n ensayosindependientes e

𝑃(𝑥,𝑛,𝑝)=(■8(𝑛@𝑥)) 𝑝^𝑥 𝑞^(𝑛−𝑥)

p= Probabilidad de éxito en cualquier ensayo.


q= Probabilidad de fracaso en cualquier ensayo.
x= Número de éxitos deseados.
n= Número de ensayos efectuados.
Ejemplo:

Supongamos que se escogen a 4 borregos al azar y estamos interesados en el que este sea macho.
¿Cuál es el espacio muestral del experimento?
n= Número de ensayos efectuados:= 4
p= Probabilidad de éxito en cualquier ensayo:= ½ = 0.5
q= Probabilidad de fracaso en cualquier ensayo:= 1 –p = 1 –0.5 = 0.5
bisignifica dos).
r una cantidad de experimentos con probabilidad de éxito constante y con repeticiones del experimento independientes.

o F, las cuales son mutuamente excluyentes es decir E ∩ F = 0.


ante los nensayos.

en n ensayosindependientes está dado por la fórmula binomial:


ndependientes.
PROBABILIDAD DE UNA VARIABLE ALEATORIA CONTINUA
Definición:
Una distribución continua describe las probabilidades de los posibles valores de una variable aleatoria continua. ... Por lo tanto
Consideraciones:
La primera dificultad para representar la distribución de probabilidades que la variable puede tomar un número i
De manera que la única manera de caracterizarla es mediante fórmulas.
No obstante el resultado se puede representar mediante tablas de frecuenciae histogramas.

Ejemplo: De 100 BORREGAS DE ESTABLO.


Histograma
30
Clase Intervalos f¡ p¡
1 [27,32] 6 0.06 25
2 [32,37] 27 0.27
20
3 [37,42] 23 0.23
4 [42,47] 20 0.2 15
5 [47,52] 15 0.15
10
6 [52,57] 8 0.08
7 [57,62] 1 0.01 5
Total 100 1
0
[27,32] [32,37] [37,42] [42,47] [47
1 2 3 4

f¡ p¡
SE CUMPLEN LAS PROPIEDADES:
El área total de los rectángulos = 1.00
El área total de un rectángulo es la frecuencia relativa de la clase que tiene como base.
leatoria continua. ... Por lo tanto, solo los rangos de valores pueden tener una probabilidad diferente de cero. La probabilidad de que una

riable puede tomar un número infinito de valores.

stogramas.

Histograma
0.3

0.25

0.2

0.15

0.1

0.05

0
32,37] [37,42] [42,47] [47,52] [52,57] [57,62]
2 3 4 5 6 7

f¡ p¡
ero. La probabilidad de que una variable aleatoria continua equivalga a algún valor siempre es cero.
DISTRIBUCION NORMAL
Esta distribución de variables aleatorias de tipo continuo tiene gran importancia porque:
a)Es un modelo adecuado para gran diversidad de situaciones del mundo real.
b)Por su sobresaliente papel en la teoría estadística.
La gráfica de la distribución es:
a)En forma de campana y simétrica.
b)Los valores numéricos que se presentan con mayor frecuencia se concentran alrededor del valor esperado de X: E(X).
alor esperado de X: E(X).
VALOR ESPERADO Y VARIANZA PARA UNA DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL PUNTUAL
El valor esperado = esperanza matemática = media poblacional = media aritmética representa la idea de valor medio de los re

Ejemplo:
Supongamos que en un rebaño de 13 borregos 4 son superiores.
Los resultados posibles se registran como éxito (E) si el borrego que selecciono es superior y como fracaso (F) si no lo es.

E(x)=µX=p=4/13=0.3076
E(x²)=𝝈²=p*(1-p)=4/13*(1-4/13)=4/13*9/13=36/169=0.2130

DS(x)=√("𝝈²" )=√0.2130=0.4615

CONCLUSION: El valor esperado o media poblacional de seleccionar un borrego superior es de 0.3076 ±0.4615puntos.
la idea de valor medio de los resultados de un experimento aleatorio.

omo fracaso (F) si no lo es.

169=0.2130

0.3076 ±0.4615puntos.
VALOR ESPERADO Y VARIANZA PARA UNA DISTRIBUCIÓN DE PROBABILIDAD UNIFORME DISCRETA
El valor esperado = esperanza matemática = media poblacional = media aritmética representa la idea de valor medio de los re
Ejemplo:
Supongamos que en un rebaño de 13 borregos 4 son superiores.
Los resultados posibles se registran como éxito (E) si el borrego que selecciono es superior y como fracaso (F) si no lo es.
Resultados:

=µX=(∑▒𝑥𝑖)/𝑘=(1+2+3+4+5+6+7+8+9+10+11+12+13)/13=91/13

E(x)=µX=(𝑛+1)/2=(13+1)/2=14/2=7

▒ 〖 (𝑥𝑖−"µ)" ² 〗 )/𝑘=((1−7)^2+…(13−7)²)/13=14.1666

Var(x)="µ=" (𝑛²+1)/12=170/12=14.1666

DS(x)=√("𝝈²" )=√("14.1666 " )=3.7638


la idea de valor medio de los resultados de un experimento aleatorio.

omo fracaso (F) si no lo es.

2+13)/13=91/13=7
DISTRIBUCIÓN DE PROBABILIDAD UNIFORME CONTINUA
Definición:
Es un homólogo de la distribución de probabilidad uniforme discretaque ya vimos.
Es cuando la variable aleatoria X asume valores con iguales probabilidades de ocurrir.

Se representa como:

𝐹𝑥(𝑋)=𝑓(𝑥)={█(1/(𝜃2−𝜃1);𝜃1≤𝑥≥𝜃2@&0, 𝑑𝑒 𝑜𝑡𝑟𝑎 𝑓𝑜𝑟𝑚𝑎)┤

Donde:
f = función de probabilidadθ1y θ2= dos números reales cualquiera tales que θ1< θ2.

Ejemplo:
Sea X una variable aleatoria distribuida uniformemente en el intervalo [-4, 7]. Es decir 𝑿~ ∪[−4,7].
𝐹𝑥(𝑋)=𝑓(𝑥)={█(1/(7−−4);1/11;𝑥∈[−2,3]@&0, 𝑑𝑒 𝑜𝑡𝑟𝑎 𝑓𝑜𝑟𝑚𝑎)┤
𝑓𝑜𝑟𝑚𝑎)┤

𝑟𝑎 𝑓𝑜𝑟𝑚𝑎)┤
DESCRIPCIÓN SIMULTÁNEA DE DOS CONJUNTOS DE DATOS
OBJETIVO:
Explicar algunos elementos básicos del ajuste de modelos lineales, la asociación de datos y las formas de su aplicaciónpara res
Uso:
Una situación frecuente en la investigación científica y tecnológica es la DESCRIPCIÓN SIMULTÁNEA DE DOS CONJUNTOS DE D
Ejemplo:
El siguiente cuadro muestra la longitud en borregas katahdin de "Tezonapa Borreguera" tomadas por muestreos
Nombre Edad Peso Longitud Color
(n=5) (años) (kg) (m) Blanco, Café, Sardo
X1=34054 1 34 1.2 Blanco
X2=34053 1.5 34.5 1.3 Café
X3=34052 1 36 1.2 Sardo
X4=34055 2 36.5 1.1 Sardo
X5=34056 1.5 51 1.1 Sardo
PROMEDIO (Ῡ 1.4 38.4 1.18
Consideraciones:
Puede haber interés en LA RELACION Sin y Con
interés en LA RELACION Antes y Después
formas de su aplicaciónpara resolver diversos problemas.

ÁNEA DE DOS CONJUNTOS DE DATOS.

guera" tomadas por muestreos aleatorios.


METODOS PARA DESCRIBIR
METODOS TABULARES:
La presentación mediante Tablas (cuadros) sobresale por su sencillez y claridad.
Permite visualizar fácilmente las características de los datos.
Ejemplo:
Edad Peso Longitud Color
(n=5) (años) (kg) (m) Blanco, Café, Sardo
X1=34054 1 34 1.2 Blanco
X2=34053 1.5 34.5 1.3 Café
X3=34052 1 36 1.2 Sardo
X4=34055 2 36.5 1.1 Sardo
X5=34056 1.5 51 1.1 Sardo
PROMEDIO (Ῡ 1.4 38.4 1.18

MÉTODOS GRÁFICOS PARA REPRESENTAR CONJUNTOS DE DATOS


Es un metodo un poco mas complicado de realizar pero sinduda es mas agradable a la vista.
Ejemplo: De 100 BORREGAS DE ESTABLO.
Histograma
30
Clase Intervalos f¡ p¡
1 [27,32] 6 0.06 25
2 [32,37] 27 0.27
20
3 [37,42] 23 0.23
4 [42,47] 20 0.2 15
5 [47,52] 15 0.15
10
6 [52,57] 8 0.08
7 [57,62] 1 0.01 5
Total 100 1
0
[27,32] [32,37] [37,42] [42,47] [47
1 2 3 4

f¡ p¡

MÉTODOS DE FORMULAS PARA REPRESENTAR CONJUNTOS DE DATOS


Es aun mas dificil de elaborar ya que se precede de un fundamento matematico.
Ejemplo:
Distribución de probabilidad uniforme continua
Definición:
Es un homólogo de la distribución de probabilidad uniforme discreta que ya vimos.
Es cuando la variable aleatoria X asume valores con iguales probabilidades de ocurrir.

Se representa como:

𝐹𝑥(𝑋)=𝑓(𝑥)={█(1/(𝜃2−𝜃1);𝜃1≤𝑥≥𝜃2@&0, 𝑑𝑒 𝑜𝑡𝑟𝑎 𝑓𝑜𝑟𝑚𝑎)┤


Histograma
0.3

0.25

0.2

0.15

0.1

0.05

0
32,37] [37,42] [42,47] [47,52] [52,57] [57,62]
2 3 4 5 6 7

f¡ p¡

𝑓𝑜𝑟𝑚𝑎)┤
COVARIANZA
Definición:
La covarianzaes una medida de la variación simultánea de dos conjuntosde datos.
Se diferencia de la varianza en que ésta es una medida para un solo conjuntode datos.
La covarianzaes el promedio de los productos de las desviaciones para cada pareja de puntos de datos.

Fórmula de covarianza:

𝐶𝑂𝑉(𝑋,𝑌)=𝑆𝑥𝑦 𝑆𝑥𝑦=(∑▒ 〖 (𝑋𝑖−𝑋)(𝑌𝑖−𝑌) 〗 )/(𝑛−1)

Donde:

n Si son muchos datos (N>30)


n-1 Si son pocos datos (N<30)Mejor aproximación

Ejemplo: Se quiere deducir que tan relaciones estan el peso y la longitud del animal 𝑆𝑥𝑦=(−1.4
Edad Peso Longitud (Xi-X) (Yi-Y) (Xi-X)(Yi-Y)
(n=5) (años) (kg) X (m) Y
X1=34054 1 34 1.2 -4.4 0.02 -0.088
X2=34053 1.5 34.5 1.3 -3.9 0.12 -0.468
X3=34052 1 36 1.2 -2.4 0.02 -0.048
X4=34055 2 36.5 1.1 -1.9 -0.08 0.152
X5=34056 1.5 51 1.1 12.6 -0.08 -1.008
PROMEDIO (Ῡ 1.4 38.4 1.18
Sumatoria 0 0 -1.46

Metodo excel:

-0.365 Covarianza para pocos datos


-0.292 Covarianza muchos datos
) 〗 )/(𝑛−1)

𝑆𝑥𝑦=(−1.46)/(5−1)=(−1.46)/4=−0.365

𝑆𝑥𝑦=(−1.46)/5=−0.292
REGLA DE DECISIÓN:
Cuando la SXY= 0 significa que X y Y son estadísticamente independientes.
Cuando los valores de X crecen y también los valores de Y crecen, entonces la SXY es positiva y significa que ambos conjuntos
Cuando los valores de X crecen pero los valores de Y disminuyen o viceversa, entonces la SXY es negativa y significa que ambo

Ejemplo: Se quiere deducir que tan relaciones estan el peso y la longitud del animal 𝑆𝑥𝑦=(−1.4
Edad Peso Longitud (Xi-X) (Yi-Y) (Xi-X)(Yi-Y)
(n=5) (años) (kg) X (m) Y
X1=34054 1 34 1.2 -4.4 0.02 -0.088
X2=34053 1.5 34.5 1.3 -3.9 0.12 -0.468
X3=34052 1 36 1.2 -2.4 0.02 -0.048
X4=34055 2 36.5 1.1 -1.9 -0.08 0.152
X5=34056 1.5 51 1.1 12.6 -0.08 -1.008
PROMEDIO (Ῡ 1.4 38.4 1.18
Sumatoria 0 0 -1.46

Metodo excel:

-0.365 Covarianza para pocos datos


-0.292 Covarianza muchos datos

Significado:
Cuando los valores de X crecen pero los valores de Y disminuyen o viceversa, entonces la SXY es negativa y significa que ambo

Desventaja:
Su valor depende de las unidades en que se miden las variables de interés [utiliza la varianza (S2)].

Peso
1.35

1.3

1.25

1.2
Longitud

1.15

1.1

1.05

1
32 34 36 38 40 42 44 46 48 50 52
significa que ambos conjuntos de datos están estadísticamente relacionados
s negativa y significa que ambos conjuntos de datos están estadísticamente relacionados.

𝑆𝑥𝑦=(−1.46)/(5−1)=(−1.46)/4=−0.365

𝑆𝑥𝑦=(−1.46)/5=−0.292

s negativa y significa que ambos conjuntos de datos están estadísticamente relacionados.


CORRELACIÓN
ANALISIS DE CORRELACION:
Es el grupo de técnicas estadísticas para medir la “fuerza” de la relación(correlación) entre dos variables.
DIAGRAMA DE DISPERSION (gráfica de puntos=nube=XY):
Es la gráfica que describe la relaciónentre las dos variables de interés.
A la línea resultante se le conoce como curva de aproximación(en Excel como línea de tendencia)
Al problema de hallar la ecuación de la curva que se ajuste al conjunto de datos se le conoce como ajuste de curvas.
COEFICIENTE DE CORRELACION (r):
Es el índice que mide y al mismo tiempo describe la relación lineal entre las dos variables aleatorias de interés.
Requiere datos cuantitativos discretos.
Puede tomar valores entre -1.0 y +1.0
Valores de -1.0 o +1.0 indican correlación fuerte y perfecta.
Valores cercanos a 0.0 indican correlación débil.
Valores negativos indican una relación inversa.
Valores positivos indican una relación directa.
Formula del coeficiente de correlacion:

(𝑌𝑖−𝑌) 〗 )/𝑁)/((√((∑▒ 〖 (𝑋𝑖−𝑋)^2 〗 )/𝑁))(√((∑▒ 〖 (𝑌𝑖−𝑌)^2 〗

Donde:

N si son muchos datos


n-1 si son pocos datos
Ejemplo:
Se quiere deducir que tan relaciones estan el peso y la longitud del animal
Edad Peso Longitud (Xi-X) (Yi-Y) (Xi-X)(Yi-Y) (Xi-X)(Yi-Y)
(n=5) (años) (kg) X (m) Y
X1=34054 1 34 1.2 -4.4 0.02 -0.088 -0.00176
X2=34053 1.5 34.5 1.3 -3.9 0.12 -0.468 -0.05616
X3=34052 1 36 1.2 -2.4 0.02 -0.048 -0.00096
X4=34055 2 36.5 1.1 -1.9 -0.08 0.152 -0.01216
X5=34056 1.5 51 1.1 12.6 -0.08 -1.008 0.08064
PROMEDIO (Ῡ 1.4 38.4 1.18
Sumatoria 0 0 -1.46 0.0096

Metodo de excel:

-0.61283981 Coeficiente de correlacion para pocos datos


Significado :
Significa que ambos conjuntos están estadísticamente relacionados.
Que la relación es negativa
Que las variables tienden a crecer simultáneamente (correlación inversa).
Que la medida (fuerza de correlación) es de 61.28%

Grafica:

Peso
1.35

1.3

1.25

1.2
Longitud

1.15

1.1

1.05

1
32 34 36 38 40 42 44 46 48 50 52
omo ajuste de curvas.

orias de interés.

▒ 〖 (𝑌𝑖−𝑌)^2 〗 )/𝑁))

(Xi-X)^2 (Yi-Y)^2
𝑟_𝑋𝑦=((−1.46)/5)/((√(202.7/5))(√(0.028/5)))=−0.6128
19.36 0.0004
15.21 0.0144
5.76 0.0004
3.61 0.0064
158.76 0.0064

202.7 0.028
5)))=−0.6128
CORRELACION DIRECTA (=positiva)
Cuando al aumentaruna de las variables la otra también aumenta.
CORRELACION INVERSA (=negativa)
Cuando al aumentaruna de las variables la otra también disminuye.
CORRELACION NULA (=cero)
Cuando no hay dependencia de ningún tipo entre las variables.
FUERZA DE CORRELACION
Correlación positiva fuerteFUERZA DE CORRELACION
Cuanto más cerca están los puntos de la recta.
Correlación positiva débil
Cuanto más alejados están los puntos de la recta.

Ejemplo: Interpretacion:

Se define como correlacion inver

Peso
1.35

1.3

1.25

1.2
Longitud

1.15

1.1

1.05

1
32 34 36 38 40 42 44 46 48 50 52
nterpretacion:

e define como correlacion inversa debil.


REGRESIÓN
Uso:
La regresión, al igual que la covarianzay la correlación, sirve para conocer la relación que hay entre dos conjuntos de datos.
Definicion:
El análisis de regresión permite estudiar la influencia de una o más variables llamadas independientessobre otra que llamamo
Variable dependiente:
Es la variable que se pronostica o estima. Es la variable a predecir.
Variable independiente:
Es la variable que proporciona la base para la estimación. Es la variable predictora.

La relación entre variables depende del interés de cómo se quiera utilizar


1)Interesa la relación per se.
Es decir, solamente para saber si existe relación entre X=altura y Y=peso y qué tan fuerte es esa relación.
2) Interesa la relación para predecir.
Es decir, establecer la relación entre X y Y, de manera que conociendo una variable (altura)se pueda estimar la otra (peso).

En este segundo caso, donde interesa la relación para predecir, se trata de ir más allá de medir el grado de relación entre varia
Se trata de investigar la naturaleza de la relación y construir modelos que la describan, con el propósito de predecir el compor
A esto se le conoce como Técnicas de regresión y el análisis que resulta de aplicarlas Análisis de regresión.

ALTERNATIVA:
Creando una ecuación de estimación, mediante análisis de regresión, esto es, una formula matemática que relacione variables
Ecuacion:

"Ŷ = a + b(X)"
ntre dos conjuntos de datos.

dientessobre otra que llamamos dependiente.

pueda estimar la otra (peso).

el grado de relación entre variables.


propósito de predecir el comportamiento de una de ellas a partir de los valores de la otra.
e regresión.

emática que relacione variables conocidas con la variable desconocida.


SUPUESTOS FUNDAMENTALES DE LA REGRESION LINEAL
a)Los valores de la variable independiente X son fijos, medidos sin error.
b)La variable Y es aleatoria.
c)Para cada valor de X, existe un grupo de valores de Y que tienen una distribución normal.
d)Las medias de estas distribuciones normales de valores de Y deben estar sobre la recta de regresión.
e)Las desviaciones estándarde estas distribuciones normales son iguales.
f)Los valores de Y son estadísticamente independientes. Es decir, que en la selección de una muestra, los valores elegidos de Y

REGRESION
El coeficiente de determinación (r2)es el cuadrado del coeficiente de correlación (r).
Toma valores de 0 a +1.
El coeficiente de determinación (r2)expresa la proporción de la variación total en la variable dependiente Yque se debe a la va
Nota:
No confundir r2 con el coeficiente de correlación (r), cuyos valores pueden ser:-1 ≤ rXY≤ +1
uestra, los valores elegidos de Y para un valor particular de X no depende de los valores de Y para otro valor de X.

ependiente Yque se debe a la variación en la variable independiente X.


EL PROPÓSITO DEL ANÁLISIS DE REGRESIÓN:
Es determinar la ecuación de regresión:Ŷ = βo+ β1X ó Ŷ = a + bX
Procedimiento:
a)Enumerar los datos por pares para cada observación.
b)Dibujar un diagrama de dispersión para visualizar la relación.
c)Determinar la ecuación de regresión.

Ejemplo:
Selecciona cinco estudiantes y complementa la tabla.
Se quiere deducir que tan relaciones estan el peso y la longitud del animal
Edad Peso Longitud (Xi-X) (Yi-Y) (Xi-X)(Yi-Y) (Xi-X)(Yi-Y)
(n=5) (años) (kg) X (m) Y
X1=34054 1 34 1.2 -4.4 0.02 -0.088 -0.00176
X2=34053 1.5 34.5 1.3 -3.9 0.12 -0.468 -0.05616
X3=34052 1 36 1.2 -2.4 0.02 -0.048 -0.00096
X4=34055 2 36.5 1.1 -1.9 -0.08 0.152 -0.01216
X5=34056 1.5 51 1.1 12.6 -0.08 -1.008 0.08064
PROMEDIO (Ῡ 1.4 38.4 1.18
Sumatoria 0 0 -1.46 0.0096
Resolucion: A)Ordenar los datos por pares Edad X Estatura Y
(años) (cm)
34 1.2 r=
34.5 1.3 Sxy=
36 1.2 r^2=
36.5 1.1 Sx=
51 1.1 Sy=

B) Diagrama:

Peso
1.35

1.3

1.25

1.2
Longitud

1.15

1.1

1.05
𝑟_𝑋𝑦=((−1.
1
32 34 36 38 40 42 44 46 48 50 52
(Xi-X)^2 (Yi-Y)^2

19.36 0.0004
15.21 0.0144
5.76 0.0004
3.61 0.0064
158.76 0.0064

202.7 0.028
Metodo de excel:

-0.61283981 Correlacion
-0.365 Covarianza
0.37557263 Coeficiente de correlacion al cuadrado.
7.11863751 Desviacion
0.083666 Desviacion

Calculos manuales:

𝑆𝑥𝑦=(−1.46)/(5−1)=(−1.46)/4=−0.365

𝑆𝑥𝑦=(−1.46)/5=−0.292

𝑟_𝑋𝑦=((−1.46)/5)/((√(202.7/5))(√(0.028/5)))=−0.6128
𝑟^2=0.3755
−0.6128
DETERMINAR LA ECUACIÓN DE REGRESIÓN
Se usa el principio de mínimos cuadrados para obtener a y b:

𝑦 )−(∑▒ 〖𝑥 )(∑▒𝑦) 〗〗 )/(𝑛(∑▒𝑥^2 )−(∑▒𝑥^2 ) )

𝑎=(∑▒𝑦)/𝑛−𝑏 (∑▒𝑥)/𝑛

Solucion:
Selecciona cinco estudiantes y complementa la tabla.
Edad Peso Longitud (x)(y) (Xi-X) (Yi-Y) (Xi-X)(Yi-Y)
(n=5) (años) (kg) X (m) Y
X1=34054 1 34 1.2 40.8 -4.4 0.02 -0.088
X2=34053 1.5 34.5 1.3 44.85 -3.9 0.12 -0.468
X3=34052 1 36 1.2 43.2 -2.4 0.02 -0.048
X4=34055 2 36.5 1.1 40.15 -1.9 -0.08 0.152
X5=34056 1.5 51 1.1 56.1 12.6 -0.08 -1.008
PROMEDIO (Ῡ 1.4 38.4 1.18
Sumatoria 225.1 0 0 -1.46

Aplicando el principio de minimos cuadrados para obtener a y b

𝑏=(5(225.1)−(38.4)(1.18))/(5(7575.5)−(7575.5) )=0.03564

𝑎=1.18/5−(0.03564) 38.4/5=−0.0377

𝑌=𝑎+𝑏(𝑥)
𝑌=−0.0377+0.03564(𝑥)
Ejemplo de estimacion:
Estimar la longitud de un borrego que pesa 40 kg.

𝑌=−0.0377+0.03564(40)=1.3879𝑘𝑔
Conclusion:

La ecuación de Regresión Lineal estimada muestra que existe relación entre las variables peso (X) y su longitud (Y) de los borr
Esta relación se ha estimado en una rxy= -0.6128, que indica una moderada relación negativa (61.28%).
Además, si consideramos el coeficiente de determinación r² = 0.3755 podemos indicar que el 37.55% de las variaciones que oc
Cómo interpretas la siguiente resta 1 –0.3755 = 0.6245

Consideracion:
Regresion simple como en el caso anterior donde existen dos variables por loq ue solo existe un cuadrado de coeficiente de
Regresion multiple como su nombre lo dice posee mas variables con las cuales se crean mas coeficientes de relacion por cad
(Xi-X)^2 (Yi-Y)^2 x^2

19.36 0.0004 1156


15.21 0.0144 1190.25
5.76 0.0004 1296
3.61 0.0064 1332.25
158.76 0.0064 2601

202.7 0.028 7575.5

(X) y su longitud (Y) de los borregos.


37.55% de las variaciones que ocurren son por la relacion de las variedades en peso y longitud.

un cuadrado de coeficiente de correlacion.


coeficientes de relacion por cada par y combinacion de variables.

También podría gustarte