Está en la página 1de 29

Apunte Estadı́stica

Eduardo Valenzuela Domı́nguez

28 de agosto 2021

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 1 / 29


Introducción:

Realidad versus Modelo


Modelos Determinı́sticos
Modelos no-Determinı́sticos

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 2 / 29


Definición

Estadı́stica: Mezcla entre ciencia y arte que entrega herramientas para


modelar fenómenos no-deterministicos
Toma de decisiones bajo Incertidumbre

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 3 / 29


Algunas aplicaciones:
Ingenierı́a
Compañı́as de Seguros
Estudios de Mercado
Control de Calidad
Instrumentos Financieros
Medicina

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 4 / 29


Algunos Términos

Población: Colección completa de todas los individuos de interes para


el investigador.
Parámetro: Valor que caracteriza un aspecto de la población.
Muestra: Subconjunto de la población y que es representativa de esta.
Estadistico: Medida descriptiva de la muestra que se utiliza para
estimar al respectivo parámetro poblacional.
Variable: Caracteristica de la población que se analiza en el estudio
estadistico.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 5 / 29


Técnicas de Muestreo

Muestreo Aleatorio simple: Procedimiento mediante el cuál todas las


muestras de un determinado tamaño, poseen la misma ”chance” de
ser extraidas.
Muestreo Aleatorio Estratificado: Esquema de muestreo que primero
particiona a la población en diversos ”estratos” y posteriormente
extrae una mustra aleatoria simple en cada uno de ellos.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 6 / 29


Muestreo

Error muestral: Diferencia entre el valor del parámetro poblacional y


el producido por el estadistico o estadigrafo basado en una muestra.
Sesgo muestral: Tendencia a favorecer la selección de determinados
individuos de la población.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 7 / 29


Muestreo
Población vs Muestra
Muestreo implica Error muestral
Acotar la probabilidad de cometer errores
Estadistica
Descriptiva
Inferencial

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 8 / 29


Tipos de Variables

Variables cualitativas: Caracteristica que representa una cualidad de


los individuos poblacionales.
Variables cuantitativas: Caracteristica que corresponde a una
magnitud asociada a laos individuos de la población, hay discretas y
continuas.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 9 / 29


Niveles de Medición

Escala nominal: Nombres o clases que se utilizan para organizar los


datos en categorias separadas y distintas.
Escala ordinal: Mediciones que jerarquizan los datos en categorias,
ordenadas en virtud de un determinado criterio.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 10 / 29


Niveles de Medición

Escala de intervalos: Mediciones respecto de una escala numerica en


la cual la diferencia entre valores tiene interpretación y la ubicación
del cero es arbitrario.
Escala de proporciones: Mediciones respecto de una escala numerica
en la cual tanto la diferencia como los cuocientes tienen
interpretación y la ubicación del cero es absoluto.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 11 / 29


Estadı́stica Descriptiva

Proporciona procedimientos que permiten organizar, procesar y presentar


los datos muestrales con el fin de extraer información relevante que este
contenida en ellos.
La descripción del comportamiento muestral, se suele separar en tres
categorias:
Representacions tabulares.
Representaciones gráficas.
Representaciones mediante estadı́grafos o estdı́sticos.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 12 / 29


Agrupación en clases
Si los datos muestrales son:
u1 , u2 , u3 , . . . , un

Los agruparemos en k clases:

A1 , A2 , . . . , Ak

Para n datos muestrales, se suele usar la regla de “Sturges”:

k = [3, 3 · log10 (n)] + 1

Ejemplo: Para n = 1.000, usar:

k = [3, 3 · log10 (1.000)] + 1 = [3, 3 · 3] + 1 = [9, 9] + 1 = 9 + 1 = 10

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 13 / 29


Observaciones y Preguntas

Las clases deben ser excluyentes y todo elemento muestral debe


pertenecer a una y solo una de ellas.
¿Existen clases que concentren mas datos?.
¿Se presenta un comportamiento uniforme?.
¿Se visualiza mas de un punto de concentración?.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 14 / 29


Construcción de clases

Si los datos muestrales estan medidos por lo menos al nivel de intervalos y


si los representamos por:
u1 , u2 , . . . , un
entonces la amplitud de las clases es de:

max (ui ) − min (ui ) RM


c= =
k k
Se denomina “Rango muestral” al valor RM = max (ui ) − min (ui )

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 15 / 29


Construcción de clases

Con esto, se determinan los limites superior e inferior de cada clase:

clase limites relaci ón


A1 [a1 → b1 [ b 1 = a1 + c
A2 [a2 → b2 [ b 2 = a2 + c
.. .. ..
. . .
Ak [ak → bk ] bk = ak + c

en donde a1 = min (ui ), bj = aj + c y ak+1 = bk

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 16 / 29


Ejemplo

Consideremos la muestra de n = 50 datos siguiente:


68 72 50 70 65 83 77 78 80 93
71 74 60 84 72 84 73 81 84 92
77 57 70 59 85 74 78 79 91 102 numero de clases:
83 67 66 75 79 82 93 90 101 80
79 69 76 94 71 97 95 83 86 69
k = [3, 3 log10 (50)] + 1 = [3, 3 · 1, 699] + 1 = [5, 6] + 1 = 5 + 1 = 6

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 17 / 29


Continuación Ejemplo

min (ui ) = 50 y max (ui ) = 102, por lo que c = 102−50


6 = 8, 7
redondeando, tomaremos c = 9, con lo que las clases quedan:

clase limites marca de clase


A1 [50 → 59[ 54, 5
A2 [59 → 68[ 63, 5
A3 [68 → 77[ 72, 5
A4 [77 → 86[ 81, 5
A5 [86 → 95[ 90, 5
A6 [95 → 104] 99, 5

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 18 / 29


Gráfico de Tallo y Hoja

Una forma alternativa de visualizar los datos, es mediante el gráfico de


tallo y hoja:

La coma decimal esta un digito a


la derecha de los dos puntos:

5 : 079
6 : 0567899
7 : 001122344567788999
8 : 001233344456
9 : 01233457
10 : 12

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 19 / 29


Distribuciones de Frecuencias

Para descubrir como se “reparten” los datos entre las clases,


consideraremos las frecuencias
Frecuencia absoluta: Es el número de observaciones muestrales que
caen en cada clase: ni , para i = 1, . . . , k.
Frecuencia relativa: Es la proporción de datos con respecto a toda la
muestra que pertenecen a cada clase: fi , para i = 1, . . . , k.
ni
Se tiene que: fi = n

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 20 / 29


Distribuciones de Frecuencias

Frecuencia absoluta acumulada: Es la suma acumulada de las


frecuencias
P absolutas hasta cada clase: Ni , para i = 1, . . . , k. con
Ni = ij=1 nj , para i = 1, . . . , k
Frecuencia relativa acumulada: Es la suma acumulada de las
fercuencias relativas hasta cada clase: Fi , para i = 1, . . . , k. con
Fi = ij=1 fj , para i = 1, . . . , k
P

Ni
Se tiene que: Fi = n

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 21 / 29


Ejemplo

clase limites ni Ni fi Fi fi /c
A1 [50 → 59[ 2 2 0, 04 0, 04 0, 0044
A2 [59 → 68[ 5 7 0, 10 0, 14 0, 0111
A3 [68 → 77[ 14 21 0, 28 0, 42 0, 0311
A4 [77 → 86[ 18 39 0, 36 0, 78 0, 0400
A5 [86 → 95[ 7 46 0, 14 0, 92 0, 0156
A6 [95 → 104] 4 50 0, 08 1, 00 0, 0089
total 50 1, 00

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 22 / 29


Representaciones Gráficas

Otra forma de representar la información muestral, es mediante gráficos


Histograma: Se grafican las frecuencias con respecto a las diversas clases.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 23 / 29


Histogram of x
15
Frequency

10
5
0

50 60 70 80 90 100

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 24 / 29


Histogram of x
0.04
0.03
Density

0.02
0.01
0.00

50 60 70 80 90 100

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 25 / 29


Poligono de frecuencias: Representa las frecuencias en las marcas de clases
unidas por segmentos de rectas.
Distribucion de frecuencias acumuladas: Aqui se representan las
frecuencias acumuladas hasta cada clase.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 26 / 29


Ojiva: Poligonal que une las frecuencias acumulativas en cada clase.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 27 / 29


Gráfico de barras: Las frecuencias se representan por barras proporcionales
a ellas. Gráficos circulares: Las frecuencias se muestran como sectores
circulares.

Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 28 / 29


Eduardo Valenzuela Domı́nguez Apunte Estadı́stica 28 de agosto 2021 29 / 29

También podría gustarte