Está en la página 1de 39

UNIVERSIDAD NACIONAL JORGE BASADRE

GROHMANN
FACULTAD DE CIENCIAS

ESTADISTICA Y PROBABILIDAD

TEMA: VARIABLES ,GRAFICOS Y MEDIDAS ESTADISTICAS

Dr. PELAYO DELGADO TELLO


DEFINICION DE ESTADISTICA
Es la ciencia aplicada que nos proporciona un conjunto de métodos , técnicas
o procedimientos para:

• - recopilar
• -organizar ( clasificar o agrupar)
• -presentar y
• - analizar
Datos con el fin de describirlos o de realizar generalizaciones validas que
permita la toma de decisiones.
DDGGDDDDDDDDDDDIVISSSSSJJJDDDDDDJDDDDDDDIONSS
• DIVISION:
• ESTADISTICA DESCRIPTIVA.- Es el conjunto de métodos estadísticos que
se encarga de la recolección, clasificación y la descripción de datos , para
su interpretación análisis y toma de decisiones.
INFERENCIA ESTADISTICA .- Es el conjunto de métodos y técnicas que
permiten inducir, a partir de la información empírica proporcionada por
una muestra, el comportamiento de una población con un riesgo de error
medible en términos de probabilidad.

I.- INFORMACION ESTADISTICA


• I.1.- DATO

• Es toda información cualitativa o cuantitativa acerca de una característica


de un conjunto de entes materiales o inmateriales.
La fuente de obtención de datos:
• Las Estadísticas Vitales de los Países (Registro Civil).
• Boletines de los distintos Ministerios de los Países.
• Institutos Nacionales de Estadísticas.
• Encuestas - Entrevistas.
• Registro de importación y exportación de productos alimenticios
• Reservas nacionales , balanza de pagos
• Investigaciones diseñadas con un propósito específico.
• Todas las posibilidades de búsqueda ofrecida hoy por internet, etc.
FORMAS DE OBTENER INFORMACION:
a) mediante una urna
b) mediante una tómbola
c) mediante números aleatorios
• 1.2.- POBLACIÓN
• Conjunto de datos, observaciones o medidas en un
determinado universo del cual se desea estudiar una
característica en particular y se denota por “ N ”. El
número de elementos de la población.
• Ejem.
• El rendimiento académico de los estudiantes de la UCV
• La estatura de los trabajadores de la Zona de Educación
• El número de votantes a favor de un candidato.
• etc.
• 1.3.- MUESTRA
• Cualquier subconjunto representativo de la
población, requiere que las unidades o
elementos sean seleccionados al azar.
• se denotará por “n” el número de elementos
de la muestra
• 1.4.- ESTIMADOR
• Es una estadística que se obtiene a partir de
los datos muestrales ,describe alguna
característica de la muestra, constituye una
estimación de un parámetro, y se representa
por letras minúsculas.
• 1.5.- PARÁMETRO
• Es un número que describe alguna característica de
toda la población y para determinar su valor es
necesario utilizar la información poblacional
completa se representa por letras griegas o letras
mayúsculas del idioma español. σ, P, µ, σ2 , S, S2 etc.
Población
µ, σ, σ2

inferencia Análisis
Relacional

Muestra
‾ x-,med,mod
• ESTRUCTURA Y TIPOS DE DATOS ESTADISTICOS

• DATOS CUALITATIVOS O ATRIBUTOS


• Son aquellos susceptibles de ser expresados por
una cualidad o atributo.
• Ejemplos:
• El lugar de procedencia de un estudiante
• El estado civil de una persona
• Alumnos aprobados y no aprobados
DATOS CUANTITATIVO

• Son aquellos susceptibles de ser expresados por una


cantidad (variables), los cuales a su vez pueden ser
DISCRETOS Y CONTINUOS.

• Ejemplos:
• El puntaje obtenido en un examen ( )
• Número de aulas de un colegio ( )
• Cantidad de alumnos aprobados en un examen ( )
• Cantidad de libros defectuosos en una biblioteca.( )
• El tiempo que dura una prueba de examen ( )
• Peso o estatura de un estudiante ( )
• Temperatura ambiental promedio etc. ( )
• Sin embargo existen variables que el valor observado
expresa un cierto orden o jerarquía. Se le denomina
Variable Ordinal. Tiene la característica de que el valor
obtenido indica un orden o jerarquía, permitiendo indicar
una posición relativa de los distintos elementos
clasificados.
•Rendimiento académico de un estudiante : Bueno,
Regular, Malo.
•Grado de dificultad de una examen: fácil o difícil .
• Orden de meritos de un docente en la Universidad
•Grado de desarrollo de un Centro Educativo
•Etc.
PRACTICA CALIFICADA
NOMBRES Y APELLIDOS……………………………………………………
1.- Clasifique las variables que aparecen a continuación identifique el tipo que le corresponde
según la forma de expresar sus valores y la escala en que originalmente clasificaría un grupo de
unidades de observación.
1. Numero de Hijos
2. Gestión Publica
3. Nivel de ingresos
4. Concentración de un contaminante
5. Género
6. Estatura del recién nacido
7. Porcentaje de días trabajados
8. Ciclos de la maestría
9. Velocidad de un vehículo
10. Dificultad de un examen
11. Peso del oxigeno
12. Gravedad de un accidente
13. Clasificación de las Regiones
14. Temperatura ambiental
15. Niveles de ansiedad
16. Edad en su último cumpleaños
17. Profesión de una persona
18. Temperaturas registradas en un observatorio cada hora

19. Cotización de las acciones de FedEx

20. Tiempo de descarga de un archivo.

DESARROLLO
• MATRIZ DE LOS DATOS
• Cuando se realiza un estudio sobre un conjunto finito “n”
sujetos, objetos, cosas, individuos, entidades etc.,
normalmente existe una variada gama de características y
que se expresan en los términos vistos anteriores,
digamos entonces de manera genérica, que determinan
“p” variables”.
• Lo anterior permite construir lo que se llama “Base de
Datos”, que de manera muy general podemos decir que es
un arreglo tipo matricial que tiene “n” filas y “p”
columnas.
Individuos Var.X1 Var.X2 Var.X3 Var.X4 …….. Var.xp

1
2
3
4
.
.
.
.
n
• El propósito de la matriz de datos es presentar los datos
de la manera “más depurada posible” para proceder al
procesamiento de los datos y obtener información.
• La primera preocupación es entonces aprender a
estructurar una base de datos, utilizando un software
para su posterior procesamiento.
• Utilizaremos un software estadístico llamado “SPSS”. Es
una versión para ambiente Windows 98 – 2000 y XP. SIM
• Los datos se ingresan en una planilla, muy similar a la
denominada planilla EXCEL.
• Construiremos una pequeña base de datos, con
antecedentes de persona.
CONSTRUCCION DE UNA BASE DEDATOS

• Considere una planilla de sueldos de una


institución publica :
• Código
• Nombres y apellidos
• Remuneración
• Edad
• Mes
• SEXO
GRAFICO : NUBE DE PUNTOS
TEMPERATURA SEMANAL

20

15
TEMPERATURA

10

0
1 2 3 4 5 6 7
DIAS
GRAFICO: LINEAL

TEMPERATURA SEMANAL
16
14
TEMPERATURA

12
10
8
6
4
0 2 4 6 8
DIAS
GRAFICO DE BARRAS VERTICALES

TEMPERATURA SEMANAL
16

12
TEMPERATURA

0
1 3 5 7
2 4
DIAS
6
GRAFICO DE BARRAS HORIZONTALES

TEMPERATURA SEMANAL

1
2
3
DIAS

4
5
6
7

0 4 8 12 16
TEMPERATURA
GRAFICO DE PARTES COMPONENTES

DEFICIEN BUENAS OPTIMAS


5 CLASIFICACIÓN
23 1 SEGÚN NOTAS
458 22 3
406 18 5
4 28 7
357
CANTIDAD
26 2 OPTIMAS
30
25 OPTIMA BUENAS
20
DEFICIEN
15 BUENA
10
5
0
DEFIC
1 2 3 4 5
GRAFICO CIRCULAR

RENDIMIENTO ACADEMICO

17.18%
71.78% APRO
11.04% RET
17.18% DESAP
11.04%

71.78%
CAUSAS DEL BAJO RENDIMEINTO
ACADEMICO

CAUSAS CANTIDAD
Económicas 180
Bibliografía 40
Conocimiento 50
Docente 30
Sicológicas 12
Drogas 6
Otros 2
TOTAL 32 0
GRAFICO DE PARETO

RENDIMIENTO ACDEMICO

400

300
frequency

200

100

0
eco doc bibl conc Other
GRAFICO DE PARETO

RENDIMIENTO ACADEMICO 2002

400
99.38 100.00
93.75 97.50
300 84.38
71.88
CANTIDAD

200 56.25

100

0
eco bibl sic otros
doc conc dro
II. PROCESAMIENTO ESTADISTICO DE DATOS

• 2.1.1 MEDIDAS DE TENDENCIACENTRAL


Son aquellos estimadores cuyos valores tienden a ubicarse en la PARTE
CENTRAL del recorrido o rango de una variable, es decir más o menos la mitad
• del intervalo definido entre el valor mínimo y el valor máximo .

• n1 n2 µ n3 nk
2.1.2. MEDIA O PROMEDIO ARITMÉTICO
Es una estadística que localiza el “ centro “ de la distribución en base a su
centro de gravedad y se obtiene a partir de la siguientes fórmulas :

PARA DATOS ORIGINALES.- Sean x1 , x 2 , x 3 ………Xn las variables


matemáticas que representen los datos muestrales
n
xi
x
i 1 n
PROPIEDADAES:
N
1.
(X
I 1
i  x)  0

2. Si yi = a ± b xi → y = a ±b X¯

2.1.3. MEDIA PONDERADA : sean p1 , P2 , P 2 ......P k


Los pesos asociados a las variables x1 , x 2 , ......., xk , respectivamente. Entonces:
k

x i pi
w i 1
k

p
i 1
i
Ejemplo 2 :
Se desea determinar el promedio ponderado de los estudiantes del primer ciclo de la
Escuela de Ing. Civil teniendo en cuenta los cursos y créditos

TEORIA PRACTICA CREDITOS NOTA


ASIGNATURA
Matemáticas 3 2 4 14
Física 2 2 3 16
Estadística 3 2 4 18
Dibujo Técnico 3 2 4 12

SOLUCION
Xi = Nota pi = Creditos

x i pi
w i 1
k
= 228/15 = 15.2

p
i 1
i
2.1.4 MEDIA GEOMÉTRICA .- Esta media corresponde al valor que tomaría la
variable si se calculase la media aritmética de los logaritmos de los datos
en lugar de los valores directos .
 n
  LogX i 

g=
Inv Log
 i 1

 n



o g= n x1x 2 ........x n

 

Este estadígrafo se utiliza principalmente en estudios de Economía ,
tales como distribución de ingresos, cálculo de índice de precio, tasas
de interés ,en estudios de crecimiento de población . En términos
generales donde los valores de las variables representan tasas o
porcentajes de variación relativos al comportamiento de carácter
exponencial.
Ejemplo

Las tasas de interés de tres bonos son 5%, 7% y 4%.


La media geométrica es = 5.192.
Por ejemplo, la media geométrica de la serie de números 34, 27, 45, 55,22, 34
(seis valores) es

MEDIA O PROMEDIO ARMONICO


n
Ma  n 1
( )
i 1 xi
EJEMPLO Calcular la media armónica de la tasa de interés de 3 bonos del
ejemplo anterior :
3
Ma   5.06
1/ 5  1/ 7  1/ 4
2.1.6 MEDIA GLOBAL : Sí una muestra de tamaño n se particiona
en k submuestras y x x x 1
,
, …….. 2 n

son las medias de las k submuestras de tamaños n1 , n2 …..n


respectivamente Entonces:

k
 ni xi
X = i 1
n
Se denomina media global de la muestra particionada.

Ejemplo1.
Si a una sección de estudiantes se divide en tres grupos de practica A,B,C de 10,16,14
estudiantes, si su rendimiento académico de cada grupo es 15,14 y 12 respectivamente .
Cuál será el rendimiento global de toda la sección.
SOLUCION

k
 ni xi 15  10  14  16  12  14 542
i 1 =   13,55
n 40 40
1.1.7 MEDIANA: Es una medida de tendencia central que divide a la información en dos partes
iguales 50% a cada lado. Sean x1 , x 2 , x 3 ………Xn una muestra en orden creciente o
decreciente de magnitud. Entonces la mediana se define de la siguiente manera:

xn1 /2 impar


med = 2
 
 xn   x n 1
 2
 par
 2

En el caso que la cantidad de datos sea un número impar , la mediana se obtiene ubicando
el valor que esta en el centro.
En el caso de que la cantidad de datos sea un número par, la mediana se obtiene como el
promedio de los dos valores centrales.
Ejemplo 3:
Las notas de 5 maestrantes fueron 11, 15, 17, 14, 13. Encontrar la la mediana de
dichas notas:

SOLUCIÓN
Como la cantidad de datos es impar entonces la mediana será el valor central una vez
ordenado los datos: 11, 13, 14, 15,17 luego la med=14
• 1.1..8 MODA : Esta medida se conoce
también con el nombre de Promedio
Industrial. Está
representado por el valor o cantidad que más
se repite o tiene una mayor frecuencia
• La distribución de datos puede ser modal
• bimodal o multimodal
1.2 MEDIDAS DE VARIABILIDAD :

Estas medidas están orientadas a cuantificar el grado o magnitud de cómo los datos se
dispersan entorno a una medida de tendencia central . Generalmente en torno a la media
aritmética . Mucha dispersión es señal de poca uniformidad u homogeneidad en los datos.
Por el contrario poca dispersión , es señal de homogeneidad en los datos.

1.2.1 RANGO: Es una mediada de variabilidad que se obtiene de la diferencia entre el mayor
valor de la variable y el menor valor.
R = X máximo - X mínimo

1.2.3 VARIANZA: Es el promedio aritmético de los desvíos cuadráticos de los valores de la


variable respecto del promedio aritmético
n
 ( xi  x )2 N
s 2= i 1 ;σ2 =  ( xi  x)2
n 1 i 1
N
1.2.3 DESVIACION ESTANDAR: Es la raíz cuadrada de la varianza

tiene una gran importancia pues es la cuantificación de la precisión de la


de la medición de la variable.

  2
Se utiliza, entre otras aplicaciones para construir intervalos de confiabilidad
en torno a los cuales ocilará un parámentro de una población en estudio Si
la forma de la curva es una campana entonces el 68,27% de las veces la
medición estará en el intervalo es decir :

x 

y con las característica de la curva tipo campana, el intervalo

x  2

Contendrá el 95% de los valores de la variable


1.2.4 ERROR ESTANDAR . Es la desviación estándar dividida por la
raíz cuadrada del número de datos.

e.e 
n
1.2.5.DESVIACION MEDIA . Es una mediad de variabilidad que no está
incorporado en las rutinas de cálculo de Statgraphics. Su algoritmo de
calculo es :
n
 xi  x
DM = i 1
n

Podemos definirla como el promedio aritmético de los valores absolutos


de las desviaciones de los valores de la variable respecto del promedio
aritmético .
2.1.7 COEFICIENTE DE VARIACIÓN .-
Es la dispersión relativa de una variable, en relación con su promedio
aritmético. Tiene la propiedad de ser adimensional. Por lo tanto sirve para
comparar el menor o mayor grado de homogeneidad de una variable
respecto a otra.

CV =  100
X
VARIANZA GLOBAL:
Si una muestra de tamaño n se particiona en K submuestras de
tamaño s n₁ , n ₂, n₃…….nk tales que
k
 ni n
i 1
x1 , x2 , x3 ,........xk son las medias ,

s12 , s 2 2 ,..............s 2 son las varianzas de las k submuestras respectivamente. entonces :

2
k  k 
 i in ( S 2
 X 2
i ) 
  i 1 
n X
S x 2  i 1   i 1 
n  n 
 
 


• CAPITULO II

También podría gustarte