Está en la página 1de 37

TERMINOS COMUNES

USADOS EN ESTADISTICA

Mg. Humberto Mattos Núñez.


ESTADISTICA: Ciencia que comprende el conjunto de
métodos y procedimientos para obtener, describir e interpretar
conjuntos de datos.

ESTADISTICAS: Colección sistemática de datos referentes


a un determinado fenómeno.

ESTADISTICO: Persona que practica el estudio de la


Estadística, analiza estadísticas,

ESTADIGRAFOS: Medidas estadísticas que permiten


cuantificar una característica de un conjunto de datos.

DATO : Resultado de una observación, entrevista o


recopilación en general.
INFORMACION: Resultado de los datos
procesados de acuerdo a ciertos objetivos. No
hay información sin datos.
UNIVERSO: Conjunto que debe estar bien
determinado tanto en su contenido como en su
extensión.

Ejemplo : alumnos de Ingeniería de sistemas


de la UNT matriculados en año académico
2018-I.
POBLACION: Es un universo, pero cuyo contenido
debe ser la totalidad de datos correspondientes a otro
universo de objetos con interés de estudio de una o más
características.
Ejemplo: del universo del ejemplo anterior podemos obtener muchas
poblaciones, para lo cual solo es necesario fijar la variables que nos permitan
obtener los datos correspondientes a sus miembros.
Así por ejemplo:
- Edad, en meses, de las computadoras instaladas en el centro de computo de la
Escuela Profesional de Ingeniería de Sistemas - UNT en el año de 2018
(Población unidimensional).
- Calificativos y lugar de procedencia de los alumnos de de la Escuela
Profesional de Ingeniería de Sistemas - UNT. Matriculados en el año de 2018-I
(Población Bidimensional

UNIDAD DE ANALISIS: Objeto o elemento que es estudiado en una


población, sobre el cual se va a obtener datos.

MUESTRA: Parte o subconjunto de un universo, constituida por


elementos seleccionados deliberadamente, con el objeto de investigar las
propiedades de su población.
 
PARAMETRO: Medida de resumen de una población. Una población puede
tener muchas características y por tanto muchos parámetros. Las medidas de
resumen de una muestra se denominan estadígrafos.
 
VARIABLE
Definición .- Característica observable que puede tomar diferentes valores,
atribuible a cada unidad de análisis. Es posible su registro ya sea mediante
un numeral o un atributo.

Clasificación de Variables

A. SEGUN LA NATURALEZA DE LA VARIABLE


a) VARIABLES CUALITATIVAS O ESTADISTICAS DE
ATRIBUTOS

Expresan una cualidad, característica o atributo y sus


datos se expresan mediante una palabra.
Por ejemplo : Profesión, color de la laptop, actividad
económica, estado civil, nivel de instrucción, sabor, lenguaje de
programacion, capacidad memoria RAM, etc.
b) VARIABLES CUANTITATIVAS
El valor de la variable se expresa por una cantidad y los datos resultan
de la operación de contar, medir o pesar.
Por ejemplo : Peso, estatura, número de bits, producción de minerales,
tiempo de demora de un sistema informatico, etc.
Las variables cuantitativas pueden ser: discretas y contínuas.
b.1) Variable Discreta
Aquella que puede tomar ciertos valores en el intervalo
considerado y no admiten valores intermedios. Generalmente se trata de números
enteros y positivos.
Ejemplos : Número de sistemas empleados por empresa, número de hijos por
trabajador, número de computadoras por Area, etc.
 
b.2) Variable Continua
Aquella que puede tomar cualquier valor en el intervalo
considerado, por lo tanto se expresa por cualquier número real.
Ejemplos :Ingresos monetarios, peso, estatura, capacidad, tiempo de
servicio, etc.
B. SEGUN EL ORDEN DE LAS OBSERVACIONES

a) DATOS ATEMPORALES O NO ORDINALES


Cuando en una serie estadística no importa el orden en que se presentan las
observaciones.
Por ejemplo : Para estudiar el tiempo requerido para realizar un tramite en cierto
sistema, no importa la fecha de la creación o aplicación, o el orden en que aparecen
sus correspondientes registros.

b) SERIES CRONOLOGICAS, DE TIEMPO O HISTORICAS


Cuando en una serie estadística es preciso conservar el orden de los
datos obtenidos. Es de gran importancia estudiar las variaciones que se
presentan en los datos, a medida que transcurre el tiempo.
Por ejemplo : Volúmen de produción de pc, producción de sistemas
informáticos, importaciones de accesorios de computadoras, etc.

C. SEGUN EL NUMERO DE
VARIABLES
 
a) ESTADISTICAS UNIDIMENSIONALES
Son las estadísticas donde interesa una sola variable. Por ejemplo :
Empleados de la empresa Ingeniería de Sistema A.M. clasificados por estatura,
trabajadores de AXXON Consulting por nivel de estudios de postgrado, etc.

b) ESTADISTICAS MULTIDIMENSIONALES
Cuando se considera simultáneamente dos o más variables que tengan
alguna relación, entre las cuales es posible una variable dependiente y otras
independientes.
Por ejemplo : Alumnos de la escuela de Ingeniería de Sistemas edad, sexo y peso

Escalas de Medición

3.3.1. Definición .- Al observar valores o características, desarrollamos un


proceso de medición, existiendo por tanto diferentes niveles de precisión en la
medición de dichas características
Clasificación .-
 
Existen diferentes niveles de precisión en la medición de una variable.
He aquí una clasificación de las Escalas (Niveles) de Medición más comúnmente
usadas, cuyas características es indispensable comprender. Estas escalas se
denominan: Nominal, Ordinal, de Intervalo y de Proporción

A. ESCALA NOMINAL

En esta escala lo único que puede decirse de una observación es a cuál de


un cierto número de categorías o clases pertenece.
Por ejemplo observaciones de una variable donde hay las categorías
éxito y fracaso.
B. ESCALA ORDINAL
Las observaciones se pueden ordenar de menor a mayor

ejemplos: jerarquías eclesiásticas y militares; en general, cuando se


desea medir actitudes en los seres humanos
C. ESCALA DE INTERVALO
En esta escala, las observaciones pueden ordenarse y además
puede definirse una unidad de distancia (si bien arbitraria) entre ellas; para esto
es indispensable que exista un cero en la escala, pero este cero no corresponde a
una característica física de las unidades medidas y también es arbitrario.

Ejemplo: la temperatura. En este caso, tanto el cero como la unidad de distancia


(un grado) son arbitrarios, como puede verificarse comparando los sistemas
Fahrenheit y Celcius. oF= 1.8 oC + 32 , oC = (0.5556 F - 32)/1.8

D. ESCALA DE PROPORCION

En esta escala las observaciones pueden ordenarse y existen un cero y una


unidad de distancia que son inherentes al sistema, es decir, que no son
arbitrarios. Ejemplos de características medidas en esta escala son el peso de un
trabajador, la producción de programas informaticos por mes de una empresa de
sistemas, etc.
LABORATORIO Nº 1.1

1. Utilice sus conocimientos para completar las siguientes frases:


a) En muchas investigaciones de Estadística se recolecta información de una
__________________ y no de la _________________ entera.

b) Si se forma categorías para investigar una población, las categorias deben ser
________________________

c) Por razones de costo y tiempo que se gastaría en encuestar todos los elementos
de una __________________ se recurre al .

d) Para obtener una _______________ aleatoria de la población, cada elemento


debe tener oportunidad de ser ________________ .

e) Las muestras aleatorias se toman para obtener datos representativos de la


__________________, se utilizan para emitir juicios sobre valores de la misma.
 
2. En los siguientes casos, señale con A las series constituidas por datos
cualitativos y con una C las cuantitativas.
a) Distribución de importaciones por país de origen ( )
b) Distribución de alumnos de Ing. De Sistemas por estatura y peso ( )
c) Distribución de obreros por sueldo ( )
d) Distribución de militares por grado ( )
e) Distribución de pc´s por mes de fabricación ( )
f) Distribución de fallecimiento de empleados por edades ( )
g) Distribución de trabajadores, por nº de hermanos ( )
h) Distribución de barcos entrados al Callao, por tonelaje bruto ( )
i) Distribución de docentes universitarios, por categorías ( )
j) Distribución de pc´s por tiempo de funcionamiento ( )
k) Distribución de Ing. De Sistemas por lugar de formacion profesional
( )
3. En los siguientes casos, señale con c a las variables continuas y con d las
variables discretas.
a) Número de participantes en un congreso de estudiantes de Sistemas ( )
b) Presión de vapor del agua ( )
c) Precio de la energía electrica ( )
d) Número de errores en subprogramas de un sistema ( )
e) Monto de los cheques girados diariamente por una empresa ( )
f) Número de pc´s instaladas en un centro de computo ( )
g) Temperatura y humedad diaria de Trujillo ( )
h) Tiempo de duracion de una bateria para laptops ( )
i) Velocidad de lectura de una lectora de cd ( )
 
4. En las siguientes estadísticas, clasifique según el número de variables :
a) Ingreso bruto, ingreso neto y el porcentaje de impuestos pagados en una muestra de
14 declaraciones de impuestos de cierta empresa …………………………………….
b) Ganancias de empresas por inventario y los impuestos sobre estas ganancias para
2000 – 2017 ………………………………………
c) Temperatura promedio diaria durante los meses de invierno y el consumo de
energía electrica en el laboratorio de computo de Ing. Sistemas- UNT
……………………………………..
d) Volúmen de ventas, en unidades, precio unitario y gasto de propaganda realizados
por la empresa Ingeniería de Sistema A.M. ………………………………….
e) Número de clientes de cierto laboratorio de calidad……………………………..….
f) Marca y país de procedencia de los laptops vendidos durante el año 2017 en el
Perú……………………………………………….
g) Producción anual de cemento, cantidad de materia prima, temperatura promedio de
producción y cantidad de aditivos utilizados……………………………….
5. En las líneas punteadas, escriba el nombre de la escala de medición que mejor
corresponde a cada variable.
a) Grados escolares (o militares) .…………..........
b) Capacidad de almacenaje de cierta memoria ........…………...
c) Color de carcasa para usb
........…………...
d) Temperatura de producción
........…………...
e) Nivel de protección de cierto antivirus
.......…..……......
f) Densidad de aceite para engranaje de focopiadora ........…………...

g) Puntajes estándar en los test de inteligencia ........…………...


h) Número de virus alojados en un disco duro ………………….
i) Tiempo de copiado de un archivo de usb a HD …………………..
OBTENCION DE DATOS
Los datos necesarios para confeccionar estadísticas provienen de varias fuentes :
recopilación esporádica o habitual, censos, encuestas, experimentos, etc.
 
Estos datos contribuyen la masa estadística .
 
Los datos pueden haberse obtenido en dos formas fundamentales

a) Censo .- Es la enumeración completa de los elementos o


unidades estadísticas que forman la masa y se registran sus
características.
 
b) Encuesta por Muestreo .- De un Universo formado por el total
de unidades, se selecciona un cierto número de ellas, lo que
constituye una muestra, en la que se consideran las características que
interesan. Se trata de una encuesta por muestreo.
PRESENTACION DE DATOS MEDIANTE CUADROS
 
 
Definición .- El cuadro estadístico es el arreglo ordenado de filas y columnas de datos o
características relacionadas con el objeto de ofrecer información estadística de fácil
lectura, comparación e interpretación.
 
Partes Principales de un Cuadro Estadístico
Las partes esenciales de todo cuadro estadístico son :
 
1. Número del cuadro : Código de identificación para ubicar el cuadro en un
documento. El número se anota junto a la palabra "Tabla". Por ejemplo: Tabla 2.5 indica
que es el quinto cuadro del capítulo dos.
 
2. Título : En el que se destaca el objeto del cuadro (qué, cómo, dónde y cuándo). La
redacción del título debe ser breve, claro y completo tal que se pueda deducir que tipo de
información contiene el cuadro

3. Encabezamiento : Indica las variables, sus categorías o un periodo de tiempo.


Se ubica en la parte superior del cuerpo del cuadro
4. Cuerpo : Parte que contiene la información.
 
5. Nota de pie : tiene por objeto aclarar ciertos términos o siglas que se utilizan en el
cuadro.
 
6. Fuente : Indicación al pie del cuadro que sirve para nombrar la publicación,
entidad, estudio de donde se obtuvieron los datos utilizados en la construcción del
cuadro

7. Elaboración : Indicación que se coloca debajo de la fuente, sirve para


mencionar el responsable que elaboró el cuadro estadístico final. Indica la
responsabilidad de la publicación del cuadro.
CONSTRUCCION DE TABLAS DE FRECUENCIAS
 
Las tablas de frecuencias o de distribución de frecuencias son tablas de trabajo
estadístico, que presentan la distribución de un conjunto de elementos agrupados o
clasificados en las diferentes categorías de la variable.
Existen dos tipos de tablas de frecuencias, según la naturaleza de la variable:
Cuantitativa (discreta o contínua) y cualitativa.
 
TABLAS DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS
 
Realizada la recopilación de datos, denotaremos la variable por X, y los datos
originales por: X1, X2 , ... , Xn donde Xi representa la i-ésima observación de la
variable (i=1,2,..., n).
 
En toda tabla de distribución, se identifican los siguientes elementos :
1) Valor de la Variable o Intervalo de Clase Se representa por Xi a los puntos y por
Li-1-Li a los intervalos de clase que resultan de la clasificación de la variable.
:: •Frecuencia Relativa : Se representa por hi con (i= 1,2,...,m), y está dado por :

fi
. hi 
n
donde n : número de observaciones.
.
Se expresa como un porcentaje total de la muestra.

:
2) Frecuencia Absoluta : Es el número de veces que se repite un determinado
valor de la variable; en el caso de intervalos es el número de observaciones
comprendidos en dicho intervalo

4) Frecuencia Absoluta Acumulada : Se representa por Fj (j=1,2,...,m).


Es el número de observaciones menores o iguales que un determinado valor de la variable.
Equivale a la suma de las frecuencias absolutas desde f1 hasta fj (j es un número entero menor que m). Es decir :

F j  f 1  f 2  f 3  . . . f n
j

Fj  
i1
fi
: Tablas de Frecuencias de variable Discreta
 
: Como se vió anteriormente, variable discreta es aquella cuyo valor se expresa
sólo por números enteros positivos. .
La confección del cuadro con la distribución de frecuencias se aclarará
con un ejemplo.
 
Ejemplo 1.- En una encuesta de empresas de sistemas e informatica, se ha
obtenido la siguiente información respecto al número de computadoras que se
malogran en un periodo de 1 año, en 21 empresas de sistemas e informática en el
Perú, Enero de 2018.
Aquí los tres elementos básicos serán.
Población o muestra : 21 Empresas de sistemas e informatica
(n=21)
Variable: X= número de computadoras que se malogran en un periodo de 1 año
por Empresa
Datos: Xi (i=1,2,...,21) que indican que habrán 21 datos cuyos valores son :
X1 = 3 X2 = 1 X3 = 2 X4 = 0 X5 = 3 X6 = 2
X7 = 1 X8 = 1 X9 = 3 X10 = 3 X11= 2 X12 = 4
X13 = 2 X14 = 2 X15 = 0 X16 = 2 X17 = 1 X18 = 3
X19 = 4 X20 = 2 X21 = 3.
Para la construcción de la tabla de frecuencias, primero se clasifican los
distintos valores de Xi y luego se tabula; veamos :
 
i) La clasificación : primero se ubican el mayor y menor valor de Xi
Xmín = 0 y Xmáx = 4 ,
o sea, los valores de la variable van de 0 a 4 que al final da la serie :

 
Es decir, hay empresas de sistemas e informatica con 0 computadoras malogradas
durante el año 2014, con 1, 2, 3 ó 4 computadoras malogradas durante el año 2014.
Luego , la variable original Xi tiene cinco valores diferentes; que los
denotaremos por Yi, resultando:
Y1 = 0 ; Y2 = 1 ; Y3 = 3 ; Y4 = 4 ; Y5 = 5
ii) La tabulación : consiste en determinar cuantas veces se repite cada valor de
Yi, es decir cuantas empresas de sistemas e informatica hay en cada una de las
cinco categorías.
Luego tenemos como resultado el siguiente cuadro:
 
Yi Tabulación
1 //
2 ////
3 ///////
4 //////
5 //
TABLA Nº 1 : Distribución de 21 Empresas de Sistemas e
Informática del Perú según el número de computadoras
malogradas durante el año 2017. .

N° computadoras N° DE EMPRESAS % DE EMPRESAS Nº ACUMULADO DE % ACUMULADO DE


malogradas EMPRESAS EMPRESAS
fi hi
Yi Fj Hj

Y1 =0 f1 = 2 h1 = 0.095 F1 = 2 H1 = 0.095
Y2 =1 f2 = 4 h2 = 0.190 F2 = 6 H2 = 0.286
Y3 =2 f3 = 7 h3 = 0.333 F3 = 13 H3 = 0.619
Y4 =3 f4 = 6 h4 = 0.285 F4 = 19 H4 = 0.904
Y5 =4 f5 = 2 h5 = 0.095 F5 = 21 H5 = 1.000

TOTAL n = 21 1.000 ---- ----


Interpretaciones:
f3=7 Existen 7 empresas de sistemas e informatica del Perú que tienen 2
computadoras malogradas durante el año 2017.
H4=0.285 El 28.5% de empresas de sistemas e informatica del Perú tienen 3
computadoras malogradas durante el año 2017.
F3=13 Existen 13 empresas de sistemas e informatica del Perú que tienen hasta
3 computadoras malogradas durante el año 2017.
H2=0.286 El 28.6% de empresas de sistemas e informatica del Perú tienen
hasta 1 computadora malograda durante el año 2017.
Ejercicio: Se tiene información referente al número de horas/hombre utilizados para la construcción de un Diseño web
Dominio y Hosting, por cierta Compañía de Ingeniería de Sistema. Se tiene como referencia a 36 paginas web y cada dato
representa el tiempo de horas/hombre que se utilizó para su construcción.

25 27 20 28 24 25 25 26 20 26 22 22

20 27 26 27 25 27 27 26 25 21 20 24

22 22 23 23 23 22 29 28 21 25 26 25
Tablas de Frecuencia de Variable Continua
 
Como se vió anteriormente, una variable contínua es aquella que puede
tomar cualquier valor del conjunto de los números racionales.

Reglas generales para formar distribuciones de frecuencias


 
1. Hallar el rango (R) o recorrido, que es la diferencia entre el máximo valor
y el mínimo valor de la variable. Luego,
 
R = Xmáx - Xmín

2. Seleccionar el número de intervalos de clase (m)

Se podría determinar el número de intervalos mediante la fórmula propuesta


por H. A. Sturges:
 
m = 1 + 3.322 log n
3. Determinar la amplitud (c) de cada intervalo

Rango R
c  
n  d e in t e r v a lo s m

. En muchos casos será necesario ampliar ligeramente el rango, de modo que "c" sea un valor exacto y con el menor número de decimales
Nunca . se reduce la amplitud del rango.
Por ejemplo : Si Xmáx = 41 y Xmín = 20
R = 41 - 20 = 21
Si seleccionamos 6 intervalos tenemos :
21
c   3 .5
6

redondeando resulta c = 4
nuevo rango = 4 x 6 = 24
El exceso de 3 que tenemos en este caso se distribuye entre el Xmáx y el Xmín ; así podemos agregar 2 al límite superior
y quitar 1 al límite inferior; es decir :
Xmáx = 41 +2 = 43 , Xmín = 21 - 1 = 19 ,

4. Formar los intervalos de clase; definidos los intervalos cada uno de ellos se denota
por :
Li-1 : Límite inferior = Y'i-1
Li : Límite superior = Y'i
El punto medio de cada intervalo se llama marca de clase (Yi)
5. Fijar los límites reales de cada clase,

En nuestro caso, denominaremos el intervalo como (Li-1 - Li] que significa que
es "abierto por la izquierda" y "cerrado por la derecha".

6. La tabulación , definidos los intervalos de clase, se distribuyen los elementos


en cada uno de los intervalos,

Ejemplo 2: Un ingeniero de Sistemas de la Empresa OXXON Consulting,


cuenta con las utilidades mensuales desde hace cuatro años. El dispone de las
estadísticas de las utilidades (en miles de dólares) producidas por la empresa
OXXON Consulting desde su inaguración.
30 50 70 102 55 55 75 107 10 70
41 55 15 75 46 15 80 36 78 21
85 41 84 20 90 55 46 25 95 60
51 35 100 88 28 40 105 93 33 40
110 55 19 45 95 59 24 25
Agrupar los datos en una tabla de frecuencia
Solución :
Variable X : utilidad monetaria (miles de dolares)
De acuerdo con las reglas para formar distribuciones de frecuencias se tiene :
1º Determinar el rango.
R = Xmáx - Xmín
R = 110 - 10
R = 100
2º Seleccionar al nº de intervalos de clase.
Si aplicamos :
m = 1 + 3,322 log n
m = 1 + 3,322 log 48
m = 6.58 = 7
3º Determinar la amplitud de cada intervalo.

Rango R
c  
n  d e in t e r v a lo s m
100
c   1 4 .2 8 5  1 5
7
Entonces el nuevo rango es : (15)(7) = 105
Luego Xmáx = 110 + 3 = 113
Xmín = 10 - 2 = 8
4º Formar los intervalos de clase y tabulación
(Y'i-1 - Y'i] Yi Tabulacion

-----------------------------------------------------------
8 - 23 15.5 = (8+23)/2//////
23 - 38 30.5 = (23+38)/2 ////////
38 - 53 45.5 = “ /////////
53 - 68 60.5 = “ ///////
68 - 83 75.5 = “ //////
83 - 98 90.5 = “ ///////
98 - 113 105.5 = “ /////
------------------------------------------------------------
TABLA 2 : Distribución de los 48 meses de funcionamiento de la empresa AXXON Consulting según su utilidad mensual (Miles
de dólares). Diciembre del 2017
Fuente : Dpto de Contabilidad Empresa AXXON Consul

Utilidad Nº de Meses % de Meses Nº de Meses % de Meses


(miles de dólares)   fi hi % Acumulados Acumulados
Yi Fj Hj%
(Y'i-1-Y'i]
8 - 23 15.5 6 12.50 6 12.50
23 - 38 30.5 8 16.67 14 29.17
38 - 53 45.5 9 18.75 23 47.92
53 - 68 60.5 7 14.58 30 62.50
68 - 83 75.5 6 12.50 36 75.00
83 - 98 90.5 7 14.58 43 89.58
98 - 113 105.5 5 10.42 48 100.00
TOTAL   48 100.00    
de buen funcionamiento. Para ver si estos sistemas creados estan dentro de la especificación, se tomaron al azar 36 sistemas creados por la emp

.9 14.0

Interpretación :
f2 = 8 : En 8 meses la utilidad en promedio por la empresa AXXON Consulting fué
de 30,500 Dólares.
F5 = 36 : En 36 meses (3 años) la empresa AXXON Consulting tuvo una utilidad
menos de 83,000 Dólares.
h4% = 14.58 : Aproximadamente el 15 % de los 4 años, la empresa AXXON
Consulting tuvo una utilidad entre 53,000 y 68,000 Dólares.
H6% = 89.58 :El 89.58% de los meses de funcionamiento de la empresa AXXON
Consulting tuvo una utilidad menor a 98,000 Dólares.
ejercicio: Un sistema informático creado por cierta empresa de ingenieria de sistema,
tiene la especificación de que su funcionamiento dure como mínimo 14 meses de buen
funcionamiento. Para ver si estos sistemas creados estan dentro de la especificación, se
tomaron al azar 36 sistemas creados por la empresa y se pasaron a dar una revisión de su
performance durante su aplicación. Los datos representan los meses (en fraccion) de buen
funcionamiento hasta que se presento la primera falla.

14.1 14.3 13.8 13.9 14.0 14.0 13.8 14.1 14.1 14.2 14.2 13.7 13.9 14.0 14.4 13.8 13.8
14.1 13.4 13.7 14.0 14.2 13.9 14.0
14.0 14.0 13.8 14.1 14.0 14.2 13.9 14.3 13.8 13.9 13.8 14.2 Agrupar los datos en
una tabla de frecuencias?

También podría gustarte