Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos, Estadstica
Descriptiva, Pruebas de Hiptesis
Tema 1:
Conceptos
CIENCIA
INVESTIGACION
REALIDAD
METODO CIENTIFICO
Mtodo
cientfico
Interpretacin /
conclusin
Observacin
Pregunta / Inquietud
Experimento /
Investigacin
Hiptesis / posible
explicacin
Premisas / lmites
referenciales
PRINCIPIO DE LA INVESTIGACIN
VER EN LA
REALIDAD
LO QUE OTROS
NO HAN VISTO
CUERPO DE CONOCIMIENTOS
REALIDAD
FASE III
FASE I
FASE IV
FASE V
CUERPO DE CONOCIMIENTOS
TEORAS
MODELOS
PROBLEMA
HIPTESIS
DISEO
INFERENCIA
ANLISIS
DE DATOS
REALIDAD
HECHOS
FENMENOS
EXPERIENCIA
FASE II
DATOS
EVALUACIN
COMUNICACIN
Disear
experimento
Obtener
conclusiones
Recoger datos
y analizarlos
Definicin de Estadstica
Es un conjunto de teoras y mtodos que
han sido desarrollados para tratar la
recopilacin, organizacin, presentacin,
anlisis, interpretacin y descripciones de
datos muestrales con el fin de extraer
conclusiones tiles de ellos.
Definicin de
Estadstica Descriptiva
Es la parte de la Estadstica que se
ocupa de la recopilacin de datos y el
tratamiento y anlisis de los mismos.
Definicin de
Estadstica Inferencial
Es la parte de la Estadstica que trata de
inducir o inferir, a travs de la muestra
obtenida, que ley, distribucin o modelo
sigue la poblacin de la cual se ha extrado
aquella
Conceptos claves
Muestra: es parte de una poblacin de objetos, personas,
empresas o cosas, que es representativa del total de elementos que
conforman el universo.
Poblacin: es la totalidad de las posibles observaciones o
medidas que se estn considerando en alguna investigacin, de
cuyo conjunto se toma una muestra.
Parmetro: es una medida que describe alguna caracterstica de
la poblacin.
Estadgrafo o estadstico: es una medida que describe alguna
caracterstica de la muestra.
Conceptos claves
Tema 2:
Estadgrafos Bsicos
Posicin
Dividen un conjunto ordenado de datos en grupos
con la misma cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles, quintiles...
Forma
Asimetra
Apuntamiento o curtosis
Dispersin o Variabilidad
Indican la mayor o menor concentracin de los datos
con respecto a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza
La media aritmtica
[=promedio(rango)]
La media aritmtica de una variable se define como la suma
ponderada de los valores de la variable por sus frecuencias relativas
y lo denotaremos por
x
y se calcula mediante las expresiones, segn el caso:
Para TDNA
TF
TI
xi
xi ni
ci ni
x
i 1 n
i 1 n
i 1 n
xi representa el valor de la variable; ci representa la marca de clase.
La mediana
[=mediana(rango)]
La mediana de un conjunto de nmeros ordenados en magnitud es o el valor
central o la media de los dos valores centrales.
n 1
X
2
Altura mediana
La moda
[=moda(rango)]
La moda
Estadgrafos de Posicin
Se define el cuantil de orden como un valor de la variable por debajo del cual
se encuentra una frecuencia acumulada
Cuantil de orden
[=percentil(rango;k)]
Los cuantiles son generalizaciones de la mediana.
Los cuartiles dividen a los datos en cuatro partes iguales,
los deciles en diez, los quintiles en cinco, los percentiles en
cien.
r
C r n
k
k
3
Q3 42
4
4
31,5
Primer quintil
Segundo quintil
Tercer quintil
Cuarto quintil
Tercer decil
= Percentil 30 = Cuantil 0,30
Quinto decil
= Percentil 50 = Cuantil 0,50 = mediana
Sptimo decil = Percentil 70 = Cuantil 0,70
La mediana es el percentil 50
El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda
el 85%
Ejemplo
50%
% 25% %
%
5
25 2
25
100
90
80
70
Estadsticos
PESO
Percentiles
25
50
75
60
60,00
70,00
80,00
50
40
Medidas de variabilidad
Rango, Rango Intercuartlico,
Desviacin Media, Varianza,
Desviacin Estndar y Coeficiente
de Variacin
Algunos datos han sido adaptados de
Pedro Juan Rodrguez Esquerdo
Departamento de Matemticas
UPR Ro Piedras
Estadgrafos de
Variabilidad o dispersin
Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de
conocimiento. Las notas seran las mismas en todos? Seguramente No.
Dormir poco el da de la prueba, el caf estaba con somnfero...
Diferencias individuales en la habilidad para hacer un examen.
Medidas de dispersin
Miden el grado de dispersin (variabilidad) de los
datos, independientemente de su causa.
Amplitud o Rango
Rango intercuartlico
[=max(rango)-min(rango)]
% 25% %
%
5
25 2
25
[=CUARTIL(rango;3)-CUARTIL(rango;1)]
Es la distancia entre el primer y tercer cuartil.
Rango intercuartlico = Q3 Q1 = P75 - P25 = C0.75 C0,25
Parecida al rango, pero eliminando las observaciones ms extremas
inferiores y superiores.
No es tan sensible a valores extremos.
Diferencias de valores
observados a la media muestral
-3.6
4.4
-3.6
-.6
3.4
1
DAM | xi x |
n i 1
| xi x |
DAM
n
i 1
n
Frecuencia
3.6x3.6
Media
Muestral
4.4x4.4
.6x.6
1
3.4x3.4
3.6x3.6
0
1
Area observada
More
Varianza
[=var(rango)]
4.4(4.4) = 57.2
rea promedio = 57.2 / 4 = 14.3
En general: 2
1 n
(x x)
n 1
i 1
( xi x )
s
n 1
i 1
2
Grados de libertad
Por qu calculamos la varianza dividiendo por n - 1,
en lugar de dividir por n?
Como la suma de las desviaciones es 0, la ltima
desviacin es una combinacin lineal de las n - 1
desviaciones restantes.
Por lo tanto, no estamos calculando el promedio de n
nmeros independientes (los desvos). Solo n -1 de
las desviaciones al cuadrado pueden variar
libremente y por ello, promediamos la suma de los
desvos al cuadrado dividiendo por n -1.
Al numero n -1 se lo denomina grados de libertad
de la varianza o de la desviacin tpica.
Desviacin estndar
[=desvest(rango)]
s s
As s = 3.78
Desviacin estndar
S 14.3 aos
2=
S
S=3.78 aos
Tema 3:
Introduccin a Pruebas de
Hiptesis
Contrastes Paramtricos
Las pruebas de hiptesis hacen inferencias respecto a
los parmetros de la poblacin, como la media.
Las pruebas paramtricas utilizan la estadstica
paramtrica de muestras que provinieron de la
poblacin que se est probando.
Para formular estas pruebas, se hacen suposiciones
restrictivas sobre las poblaciones de las que se extraen
las muestras, por ejemplo, que las muestras son grandes
o que provienen de poblaciones normalmente
distribuidas. Pero las poblaciones no siempre son
normales.
Contrastes No Paramtricos
Pero las poblaciones no siempre son normales.
Se han desarrollado tcnicas tiles que no hacen
suposiciones restrictivas respecto a la forma de las
distribuciones de las poblaciones. stas se conocen
como pruebas sin distribucin, o pruebas no
paramtricas.
Hiptesis Nula
Hiptesis Alternativa
Estadstico de Prueba
Regin de Rechazo
Nivel de significancia
HIPTESIS DE
TRABAJO
Se definen:
medida de
discrepancia con una
distribucin de
probabilidad conocida
HIPTESIS
ESTADSTICAS
datos de la muestra
Regla de
decisin(nivel de
significacin )
Valor crtico o
tabulado
H1
SI
NO
Se extraen conclusiones
Hiptesis Nula
Corresponde a la hiptesis que ser objeto de la
maquinaria estadstica. Es la afirmacin que se
quiere contrastar.
Usamos la notacin Ho para sealarla.
Hiptesis Alternativa
Corresponde a la posibilidad alternativa, que
sugiere el investigador, en caso de que la hiptesis
nula sea falsa
Usamos la notacin H1 para sealarla.
Identificacin de hiptesis
Hiptesis nula Ho
La que contrastamos
Hiptesis Alternativa H1
Niega a H0
, ,
, ,
Nivel de significacin:
Nmero pequeo: 1% , 5%
Fijado de antemano por el investigador
Es la probabilidad de rechazar H0
cuando es cierta
=5%
Reg. Crit.
=2.5%
Reg. Crit.
No rechazo
H0
=2.5%
Unilateral
Unilateral
:0.05 y
Bilateral
tc:
2.086
Unilateral
tc:
1.725
tc:
2.086
Unilateral
tc:
1.725
La distribucin normal
PUNTUACIONES ESTNDAR
Un esfuerzo para interpretar y comparar el desempeo
de un individuo en dos o ms variables es difcil cuando
las distribuciones de los datos tienen medias y
desviaciones estndar diferentes. Este problema se
puede evitar transformando los datos de modo que
todas las variables tengan medias idnticas y las
mismas
desviaciones
estndar,
es
decir,
"estandarizando" los parmetros de las distribuciones
(transformando valores brutos en valores estndar).
PUNTUACIONES ESTNDAR
=0
Se define una variable
= 1.
Zx
: 5.8
: 6.1
: 5.6
Ciencias
5.6
Matemtica
5.8
Lenguaje
6.1
x
Zx
MATEMTICA
LENGUAJE
CIENCIAS
: 0.20
: -0.14
: 0.54
Lenguaje
-0.14
Matemtica
0.20
Ciencias
0.54
x
T x 50 10
T= 50+10z
: 82
: 53
: 65
10
20
30
40
50
60
Carmen
53
70
Cristina
65
80
90
Mnica
82
100
= 60 puntos
= 12 puntos
x
T x 50 10
: x= 82 ; media= 60 y ds= 12
82 60
T 82 50 10 12 68.33
Carmen
: x= 53 ; media= 60 y ds= 12
53 60
T 53 50 10 12 44.16
Cristina
: x= 65 ; media= 60 y ds= 12
65 60
T 65 50 10 12 54.16
: 68.33
: 44.16
: 54.16
Carmen
44.16
Cristina
54.16
Mnica
68.33
Cmo
zx =
x -
1 68 %
2 95 %
3 99 %
68%
95%
-3
-2
-1
99%
0
z
1
Ejemplo:
Supongamos que se calcul el valor z y el
resultado es 1.91.
CuI es eI rea bajo la curva normal entre
y x?
1.00
.3413
0.49
.1879
Ejercicios:
Los ingresos mensuales de un profesor
tienen una distribucin aproximadamente
normal con una media de $400.000 y una
desviacin estndar de $100.000.
Cul es el valor z para un ingreso X de
$500.000?
Y para uno de $300.000?
Utilizando la frmula:
Zx
Para X = $500.000:
Para X = $300.000:
500.000 400.000
100.000
300.000 400.000
100.000
= 1.00
= -1.00
400.000
300.000
500.000
.3413
|
|
|
400.000
500.000
El rea bajo Ia curva normal entre y x que corresponde a un valor z de 1.00 es:
0.3413
X
Z
.4821
|
|
|
-2.10
190.000
400.000
El rea bajo Ia curva normal entre y x que corresponde a un valor z de -2.10 es:
0.4821
0.5
0.5
.5000
|
|
|
.4821
| .0179 |
|
|
|
|
-2.10
190.000
400.000
.5000
.4929
400.000
|
|
|
| .0071 |
|
|
|
|
2.45
645.000
|
| .2881
|
.3686
|
|
.6567
|
|
|
|
|
|
|
|
|
400.000
1.12
-0.80
320.000
512.000
.3686
|
.0793
|
|
|
| .2893 |
|
|
|
|
|
|
|
|
400.000
0.20
1.12
420.000 512.000
.4772
|
|
|
|
|
|
|
|
-2.00
200.000
.1915
|
|
.2857 |
|
|
|
400.000
-0.50
350.000