Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GROHMANN
FACULTAD DE CIENCIAS
ESTADISTICA Y PROBABILIDAD
• - recopilar
• -organizar ( clasificar o agrupar)
• -presentar y
• - analizar
Datos con el fin de describirlos o de realizar generalizaciones validas que
permita la toma de decisiones.
DDGGDDDDDDDDDDDIVISSSSSJJJDDDDDDJDDDDDDDIONSS
• DIVISION:
• ESTADISTICA DESCRIPTIVA.- Es el conjunto de métodos estadísticos que
se encarga de la recolección, clasificación y la descripción de datos , para
su interpretación análisis y toma de decisiones.
INFERENCIA ESTADISTICA .- Es el conjunto de métodos y técnicas que
permiten inducir, a partir de la información empírica proporcionada por
una muestra, el comportamiento de una población con un riesgo de error
medible en términos de probabilidad.
inferencia Análisis
Relacional
Muestra
‾ x-,med,mod
• ESTRUCTURA Y TIPOS DE DATOS ESTADISTICOS
• Ejemplos:
• El puntaje obtenido en un examen ( )
• Número de aulas de un colegio ( )
• Cantidad de alumnos aprobados en un examen ( )
• Cantidad de libros defectuosos en una biblioteca.( )
• El tiempo que dura una prueba de examen ( )
• Peso o estatura de un estudiante ( )
• Temperatura ambiental promedio etc. ( )
• Sin embargo existen variables que el valor observado
expresa un cierto orden o jerarquía. Se le denomina
Variable Ordinal. Tiene la característica de que el valor
obtenido indica un orden o jerarquía, permitiendo indicar
una posición relativa de los distintos elementos
clasificados.
•Rendimiento académico de un estudiante : Bueno,
Regular, Malo.
•Grado de dificultad de una examen: fácil o difícil .
• Orden de meritos de un docente en la Universidad
•Grado de desarrollo de un Centro Educativo
•Etc.
PRACTICA CALIFICADA
NOMBRES Y APELLIDOS……………………………………………………
1.- Clasifique las variables que aparecen a continuación identifique el tipo que le corresponde
según la forma de expresar sus valores y la escala en que originalmente clasificaría un grupo de
unidades de observación.
1. Numero de Hijos
2. Gestión Publica
3. Nivel de ingresos
4. Concentración de un contaminante
5. Género
6. Estatura del recién nacido
7. Porcentaje de días trabajados
8. Ciclos de la maestría
9. Velocidad de un vehículo
10. Dificultad de un examen
11. Peso del oxigeno
12. Gravedad de un accidente
13. Clasificación de las Regiones
14. Temperatura ambiental
15. Niveles de ansiedad
16. Edad en su último cumpleaños
17. Profesión de una persona
18. Temperaturas registradas en un observatorio cada hora
DESARROLLO
• MATRIZ DE LOS DATOS
• Cuando se realiza un estudio sobre un conjunto finito “n”
sujetos, objetos, cosas, individuos, entidades etc.,
normalmente existe una variada gama de características y
que se expresan en los términos vistos anteriores,
digamos entonces de manera genérica, que determinan
“p” variables”.
• Lo anterior permite construir lo que se llama “Base de
Datos”, que de manera muy general podemos decir que es
un arreglo tipo matricial que tiene “n” filas y “p”
columnas.
Individuos Var.X1 Var.X2 Var.X3 Var.X4 …….. Var.xp
1
2
3
4
.
.
.
.
n
• El propósito de la matriz de datos es presentar los datos
de la manera “más depurada posible” para proceder al
procesamiento de los datos y obtener información.
• La primera preocupación es entonces aprender a
estructurar una base de datos, utilizando un software
para su posterior procesamiento.
• Utilizaremos un software estadístico llamado “SPSS”. Es
una versión para ambiente Windows 98 – 2000 y XP. SIM
• Los datos se ingresan en una planilla, muy similar a la
denominada planilla EXCEL.
• Construiremos una pequeña base de datos, con
antecedentes de persona.
CONSTRUCCION DE UNA BASE DEDATOS
20
15
TEMPERATURA
10
0
1 2 3 4 5 6 7
DIAS
GRAFICO: LINEAL
TEMPERATURA SEMANAL
16
14
TEMPERATURA
12
10
8
6
4
0 2 4 6 8
DIAS
GRAFICO DE BARRAS VERTICALES
TEMPERATURA SEMANAL
16
12
TEMPERATURA
0
1 3 5 7
2 4
DIAS
6
GRAFICO DE BARRAS HORIZONTALES
TEMPERATURA SEMANAL
1
2
3
DIAS
4
5
6
7
0 4 8 12 16
TEMPERATURA
GRAFICO DE PARTES COMPONENTES
RENDIMIENTO ACADEMICO
17.18%
71.78% APRO
11.04% RET
17.18% DESAP
11.04%
71.78%
CAUSAS DEL BAJO RENDIMEINTO
ACADEMICO
CAUSAS CANTIDAD
Económicas 180
Bibliografía 40
Conocimiento 50
Docente 30
Sicológicas 12
Drogas 6
Otros 2
TOTAL 32 0
GRAFICO DE PARETO
RENDIMIENTO ACDEMICO
400
300
frequency
200
100
0
eco doc bibl conc Other
GRAFICO DE PARETO
400
99.38 100.00
93.75 97.50
300 84.38
71.88
CANTIDAD
200 56.25
100
0
eco bibl sic otros
doc conc dro
II. PROCESAMIENTO ESTADISTICO DE DATOS
• n1 n2 µ n3 nk
2.1.2. MEDIA O PROMEDIO ARITMÉTICO
Es una estadística que localiza el “ centro “ de la distribución en base a su
centro de gravedad y se obtiene a partir de la siguientes fórmulas :
2. Si yi = a ± b xi → y = a ±b X¯
x i pi
w i 1
k
p
i 1
i
Ejemplo 2 :
Se desea determinar el promedio ponderado de los estudiantes del primer ciclo de la
Escuela de Ing. Civil teniendo en cuenta los cursos y créditos
SOLUCION
Xi = Nota pi = Creditos
x i pi
w i 1
k
= 228/15 = 15.2
p
i 1
i
2.1.4 MEDIA GEOMÉTRICA .- Esta media corresponde al valor que tomaría la
variable si se calculase la media aritmética de los logaritmos de los datos
en lugar de los valores directos .
n
LogX i
g=
Inv Log
i 1
n
o g= n x1x 2 ........x n
Este estadígrafo se utiliza principalmente en estudios de Economía ,
tales como distribución de ingresos, cálculo de índice de precio, tasas
de interés ,en estudios de crecimiento de población . En términos
generales donde los valores de las variables representan tasas o
porcentajes de variación relativos al comportamiento de carácter
exponencial.
Ejemplo
k
ni xi
X = i 1
n
Se denomina media global de la muestra particionada.
Ejemplo1.
Si a una sección de estudiantes se divide en tres grupos de practica A,B,C de 10,16,14
estudiantes, si su rendimiento académico de cada grupo es 15,14 y 12 respectivamente .
Cuál será el rendimiento global de toda la sección.
SOLUCION
k
ni xi 15 10 14 16 12 14 542
i 1 = 13,55
n 40 40
1.1.7 MEDIANA: Es una medida de tendencia central que divide a la información en dos partes
iguales 50% a cada lado. Sean x1 , x 2 , x 3 ………Xn una muestra en orden creciente o
decreciente de magnitud. Entonces la mediana se define de la siguiente manera:
SOLUCIÓN
Como la cantidad de datos es impar entonces la mediana será el valor central una vez
ordenado los datos: 11, 13, 14, 15,17 luego la med=14
• 1.1..8 MODA : Esta medida se conoce
también con el nombre de Promedio
Industrial. Está
representado por el valor o cantidad que más
se repite o tiene una mayor frecuencia
• La distribución de datos puede ser modal
• bimodal o multimodal
1.2 MEDIDAS DE VARIABILIDAD :
Estas medidas están orientadas a cuantificar el grado o magnitud de cómo los datos se
dispersan entorno a una medida de tendencia central . Generalmente en torno a la media
aritmética . Mucha dispersión es señal de poca uniformidad u homogeneidad en los datos.
Por el contrario poca dispersión , es señal de homogeneidad en los datos.
1.2.1 RANGO: Es una mediada de variabilidad que se obtiene de la diferencia entre el mayor
valor de la variable y el menor valor.
R = X máximo - X mínimo
2
Se utiliza, entre otras aplicaciones para construir intervalos de confiabilidad
en torno a los cuales ocilará un parámentro de una población en estudio Si
la forma de la curva es una campana entonces el 68,27% de las veces la
medición estará en el intervalo es decir :
x
x 2
CV = 100
X
VARIANZA GLOBAL:
Si una muestra de tamaño n se particiona en K submuestras de
tamaño s n₁ , n ₂, n₃…….nk tales que
k
ni n
i 1
x1 , x2 , x3 ,........xk son las medias ,
2
k k
i in ( S 2
X 2
i )
i 1
n X
S x 2 i 1 i 1
n n
•
•
• CAPITULO II