Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadstica
Profesor: Carlos Gonzlez Lavado
Universidad de Aconcagua
www.isuac.com
www.cgonzalez.cl
Estadstica
La estadstica es una ciencia con
base matemtica referente a la
recoleccin, anlisis e
interpretacin de datos, que busca
explicar condiciones regulares en
fenmenos de tipo aleatorio.
Estadstica descriptiva
La estadstica descriptiva, que se dedica a
los mtodos de recoleccin, descripcin,
visualizacin y resumen de datos originados
a partir de los fenmenos en estudio.
Los datos pueden ser resumidos numrica o
grficamente. Ejemplos bsicos de
parmetros estadsticos son: la media y la
desviacin estndar. Algunos ejemplos
grficos son: histograma, pirmide
poblacional, clsters, etc.
Inferencia estadstica
La inferencia estadstica, que se dedica
a la generacin de los modelos,
inferencias y predicciones asociadas a
los fenmenos en cuestin teniendo en
cuenta la aleatoriedad de las
observaciones. Se usa para modelar
patrones en los datos y extraer
inferencias acerca de la poblacin bajo
estudio.
Inferencia estadstica
Estas inferencias pueden tomar la forma de
respuestas a preguntas si/no (prueba de
hiptesis), estimaciones de caractersticas
numricas (estimacin), pronsticos de
futuras observaciones, descripciones de
asociacin (correlacin) o modelamiento
de relaciones entre variables (anlisis de
regresin). Otras tcnicas de
modelamiento incluyen anova, series de
tiempo y minera de datos.
Estadstica
El propsito de la estadstica.
El anlisis estadstico se usa para
manipular, resumir e investigar
datos con el fin de obtener
informacin til en la toma de
decisiones
Estadstica
La estadstica encuentra en los grficos,
una herramienta indispensable para
ayudar a entender, interpretar y
comunicar sus conclusiones.
Grficos
En ste estudio, solo veremos algunos de
Millones
200
150
100
50
0
1860
70
80
90
1900
10
20
Aos
30
40
50
60
70
80
Grficos
La misma informacin puede representarse
200
150
100
50
0
1860
70
80
90
1900
10
20
Aos
30
40
50
60
70
80
Grficos
Datos de produccin de una regin
Ao
Tn trigo
Tn maz
Total
Porcentual trigo
hipottica:
75
200
75
275
73 %
76
185
90
275
67 %
77
225
100
325
69 %
78
250
85
335
75 %
79
240
80
320
75 %
80
195
100
295
66 %
81
210
110
320
66 %
82
225
105
330
68 %
Grficos
Grfico de trazos
250
200
150
Trigo
Tn
Maiz
100
50
0
75
76
77
78
79
Aos
80
81
82
Grficos
Grfico de Barras
300
250
200
Trigo
Tn 150
Maiz
100
50
0
75
76
77
78
79
Aos
80
81
82
Grficos
Grfico de Barras Porcentuales
120
100
80
Maiz
Tn 60
Trigo
40
20
0
75
76
77
78
79
Aos
80
81
82
Grficos
Grfico de barras horizontales
81
79
Aos
Trigo
77
75
0
50
100
150
Tn
200
250
300
Grficos
Grfico circular abierto.
praderas
34%
bosques
12%
areas urbanas
desiertos
bosques
desiertos
10%
huertas
10%
areas urbanas
6%
areas sem bradas
28%
praderas
huertas
areas sem bradas
Recogida de Datos
Tipos de Datos.
Una variable es un elemento de inters que
puede tomar muchos valores numricos
diferentes.
Una constante tiene un valor numrico fijo.
Una variable Cuantitativa es aquella cuyo
valores se pueden expresar en cantidades
numricas, como medidas o recuentos.
Una variable cualitativa no es cuantitativa y
solo puede clasificarse, pero no medirse
Recogida de Datos
Escalas numricas de medida
1.Nominal
2.Ordinal
3.Intervalos
4.Razn
Recogida de Datos
Datos nominales:
Los datos medidos en una escala nominal
representan el nivel ms bajo de la
jerarqua y consisten en categoras en las
que se registran el nmero de
observaciones. Estas categoras no tienen
un orden lgico ni una relacin especifica.
Se dice que las categoras son
mutuamente excluyentes puesto que un
individuo, objeto o medida pueden incluirse
slo en una de ellas.
Recogida de Datos
Datos ordinales:
Muchos conjuntos de datos estn
compuestos por categoras cualitativas en
las que hay una progresin u orden. Este
tipo de datos se conoce como ordinales.
Los datos medidos en una escala ordinal
contienen ms informacin que los
medidos en una escala nominal, debido a
que las categoras estn ordenadas: los
valores en una categora son mayores o
menores que los valores en otras
categoras.
Recogida de Datos
Datos de intervalo:
Los siguientes dos tipos de esquema de
clasificacin manejan datos cuantitativos. El
primer tipo, las escala de intervalos, se
produce cuando se toman medidas
numricas sobre algunos elementos y se
pueden determinar con exactitud los
intervalos entre esas medidas. La escala de
intervalo es una forma de medida ms
completa que la escala ordinal o nominal, ya
que permite discernir no solo que valor
observado es el ms grande, si no tambin
por cunto.
Recogida de Datos
Datos de razn:
Por el contrario, los datos medidos en una
escala de razn tienen un punto cero fijo
o no arbitrario. La escala de este tipo de
datos utiliza intervalos definidos con
precisin, igual que los datos de escala de
intervalos, pero tienen un punto cero
tambin fijo. Los datos medidos con una
escala de razn constituyen el nivel ms
alto de la medida.
Tecnicas de Recogida de
Datos
Existen varias tcnicas como:
Grupos de inters.
Telfono.
Cuestionarios por correo.
De puerta a puerta.
Abordaje en Centros Comerciales.
Registros.
Observacin.
Entrevista.
Experimento.
Tcnicas de Recogida de
Datos
Tcnica de
recogida de datos
Ventajas
Desventaja
Grupo de inters
Buena tcnica
preliminar
Muestra pequea
No se pueden
proyectar los
resultados
Deben hacerse
preguntas sencillas
La entrevista debe ser
breve
Cuestionarios por
correo
Tasas bajas de
respuesta
Se emplea mucho
tiempo
Tcnicas de Recogida de
Datos
Tcnica de
recogida de datos
Ventajas
Desventaja
De puerta en puerta
Se emplea mucho
tiempo
Costosa
Abordaje en un centro
comercial
No se pueden
proyectar los
resultados
La entrevista debe ser
breve
Entrevistas personales
Costosa
Se emplea mucho
tiempo
Se obtienen muestras
pequeas
Poblaciones y muestras
Poblacin
En los estudios estadsticos es crucial
identificar la poblacin (el grupo sujetos u
objetos sometidos a estudio)
Una poblacin es el conjunto completo de
individuos o elementos de inters
Un censo es un intento de medir todos los
elementos de una poblacin de inters.
Poblaciones y muestras
Muestra
Una muestra es un subconjunto seleccionado
de la poblacin.
En la mayor parte de las investigaciones
estadsticas, los censos son bastantes
costosos y difciles, o incluso imposibles.
Bajo las anteriores condiciones es necesario
seleccionar una muestra que es un
subconjunto de la poblacin elegida para el
anlisis.
Caractersticas
Estadificas
apropiadas
Nominal
Clasificacin nica
Moda
Ordinal
Jerarquizacin o
calificacin
Mediana, percentiles
Intervalo
Diferencia conocida
entre dos puntos
cualesquiera
Media, Desviacin
estndar
Razn
Diferencia conocida
entre dos puntos
cualesquiera cero
nico o verdadero
Media, Desviacin
estndar
Resumen muestreo
Mtodo
Procedimiento
Aleatorios
Simple
Sistemtico
Estratificado
Por
Conglomerados
No Aleatorios
Subjetivo
Por conveniencia
Por Cuota
Presentacin de datos
Distribuciones de frecuencia.
El concepto de distribucin es importante
en estadstica . Este termino es utilizado
para representar un conjunto, arreglo o
grupo de valores numricos.
Una distribucin de frecuencias es una lista
de clases o categoras de datos junto con el
numero de valores que caen dentro de
cada una.
Presentacin de datos
Pasos para la construccin de una distribucin de
frecuencias
1. Determinar el numero de clases, por lo general entre
5 y 15
2. Determinar el tamao de cada clase. Para ell se
averigua la diferencia entre el valor ms grande en el
conjunto de datos y el ms pequeo, y se divide entre
el nmero de clases que se quiere
3. Determinar el punto inicial de la primera clase
4. Contar el nmero de valores que ocurren en cada
clase
5. Preparar una tabla de la distribucin, utilizando los
recuentos y/o los porcentajes (frecuencias relativas)
Nota: Estos pasos deben considerarse slo como normas empiricas
y no como un proceso riguroso para construir una distribucin de
frecuancias.
Presentacin de datos
Frecuencias relativas
Las frecuencias relativas, o porcentajes, para
una distribucin de frecuencias se calculan
dividiendo la frecuencia real entre el
nmero total de objetos clasificados.
Frecuencias acumuladas
La distribucin de frecuencias acumuladas
muestra el numero total de ocurrencias que
son menores o mayores que ciertos valores
clave.
Presentacin de datos
Diagramas y grficas
Las distribuciones de frecuencias constituyen
un mtodo ideal para representar los
aspectos esenciales de un conjunto de datos
en trminos entendibles y concisos. Aun as,
los dibujos pueden ser ms efectivos para
desplegar grandes conjuntos de datos.
Los diagramas y graficas mas sencillos en su
construccin estn diseados para datos
nominales u ordinales. Como los datos
constituyen categoras, las clases son obvias
y es fcil describirlas en una grfica.
Presentacin de datos
Diagrama de Pastel
(torta)
Es una forma efectiva de
desplegar los
porcentajes en que se
dividen los datos. Este
tipo de diagrama es
particularmente til si
se quiere hacer
hincapi en los
tamaos relativos de
las componentes de
los datos.
Presentacin de datos
250
200
Millones
Diagrama de barras
El diagrama de barras es
otro mtodo habitual de
presentar en forma
grfica datos con escala
nominal u ordinal. Cada
barra representa la
frecuencia de una
categora. La altura de la
barra es proporcional al
nmero de elementos en
esa categora. En
general, las barras se
ponen en posicin
vertical con la base en el
eje horizontal de la
grfica.
150
100
50
0
1860
70
80
90
1900
10
20
Aos
30
40
50
60
70
80
Presentacin de datos
El diagrama de pareto
Es un caso especial del
diagrama de barras,
que se usa con
frecuencia en control
de calidad. Este tipo
de diagrama consiste
en barras que
describen las
componentes de una
lnea de produccin o
de montaje.
Presentacin de datos
Histograma
Este tipo de grficos es
utilizado para la
representacin grafica
de los datos con escala
de intervalos o de
razn. Las categoras
se dibujan a lo largo
del eje horizontal y los
valores van en el eje
vertical. Se parece a
un diagrama de barras
slo que no hay
espacio entre las
barras.
Presentacin de datos
Polgono de frecuencias
El polgono de frecuencias
es otro mtodo usual de
presentar grficamente
datos con escalas de
intervalos o de razn.
Para construir el
polgono de frecuencias
se marcan las
frecuencias sobre el eje
vertical y los valores de
la variable que se est
midiendo sobre el eje
horizontal, como el
histograma.
Presentacin de datos
Ojiva
Se usa para determinar
cuantas observaciones
hay mayores o menor
que un valor
determinado en una
distribucin. Una ojiva
menor que indica
cuantos elementos de
la distribucin tienen
un valor menor que el
limite superior de
cada clase.
Estadstica descriptiva
PROMEDIO, es una palabra genrica, es
Estadstica descriptiva
Media x
Estadstica descriptiva
Nota
Cualquier caracterstica medible de una
Estadstica descriptiva
La mediana de un conjunto de datos es el
Estadstica descriptiva
La moda de un conjunto de datos es el valor
que ocurre ms veces, es decir, el de
mayor frecuencia. La MODA puede no
existir, e incluso, puede no ser nica.
Estadstica descriptiva
Distribucin simtrica y sesgada
Estadstica descriptiva
La Media Ponderada asigna ms peso a algunos
valores de los datos que otros.
Estadstica descriptiva
MEDIA ARITMTICA PONDERADA