Está en la página 1de 31

UNIVERSIDAD COLUMBIA DEL PARAGUAY

Ingeniera Informtica

Estadstica Leticia Bravard

Walter Gabriel Ortiz Medina Curso 3ro Seccin "N"

Asuncin Paraguay 2013

Trabajo Practico de Estadstica


Problemas Propuestos

Introduccin

Hoy en da vivimos en un mundo repleto de informacin, es decir, de datos, y no cabe duda que para interpretarlos correctamente es fundamental el conocimiento de la estadstica, que podra definirse como el arte de obtener conclusiones a partir de datos. En este trabajo iremos resolviendo una serie de problemas bsicos de estadstica enfocados especialmente al sector de la informtica con el propsito de entender como de una simple muestra de informacin medible se pueden obtener otras, ordenarlas, clasificarlas, y hasta obtener datos estadsticos de la misma, para su estudio y comparacin.

Objetivos

1. Utilizar con propiedad el vocabulario y los smbolos de la estadstica. 2. Organizar y representar grficamente datos estadsticos 3. Identificar las medidas de centralizacin y dispersin 4. Realizar clculos de probabilidades de distribuciones de probabilidad ms conocidas 5. Aplicar la tcnica adecuada al estudio cuantitativo de muestras poblacionales. 6. Elaborar conclusiones validas de una muestra poblacional y tomar decisiones lgicas, basadas en anlisis previos.

Estadstica EJERCICIO 1

1) Cul es definicin de la Estadstica? Ciencia que deriva de las matemticas, que comprende un conjunto de tcnicas mediante las cuales se recogen, organizan e interpretan datos numricos para obtener conclusiones.

a) Cmo se subdivide la Estadstica? Habla de cada una La estadstica se subdivide en dos reas: Estadstica descriptiva o deductiva: es la parte de la estadstica que trata de la reduccin, recopilacin o descripcin de una serie de datos correspondientes a una poblacin o una muestra Estadstica inductiva o diferencial: es la parte de la estadstica que partiendo de una muestra llega a conclusiones validas sobre la poblacin de la que pertenecen.

b) Cul es la diferencia entre la media y la mediana? La media es el valor promedio de un conjunto de nmeros, mientras que la mediana de un conjunto de nmeros es el valor que se encuentra en el medio, ordenndolos de menor a mayor, en el caso de que la cantidad de nmeros sea impar se toma los dos del medio y se calcula el promedio para hallar la mediana.

EJERCICIO 2

Se realiz un estudio sobre la cantidad de peticiones que realizan los servidor de base de datos de las instituciones pblicas de la ciudad de Asuncin entre las 15 y 18 hs . Entresaca: La poblacin: Es el conjunto de todos los servidores de base de datos de las instituciones pblicas de la ciudad de Asuncin La muestra: todos los servidores de base de datos de las instituciones pblicas de la ciudad de asuncin entre las 15 y 18 hs El individuo: un servidor de base de datos de una institucin pblica de la ciudad de asuncin entre las 15 y 18 hs.

EJERCICIO 3

Se obtuvo una muestra del costo de consumo elctrico (en $) por hora de 20 servidores de correo con ms de 1 ao de trabajo. Los costos obtenidos fueron: 9 11 12 13 17 21 21 23 24 25 25 26 26 29 30 30 30 35 36 42

Determina:
1) Poblacin: El conjunto de 20 servidores de correo 2) Muestra: 20 servidores de correo con ms de 1 ao de trabajo 3) Individuo: un servidor de correo con ms de 1 ao de trabajo

Identifica la variable y el tipo de variable.


1) Variable: costo de consumo en ($) 2) Tipo de variable: cuantitativa continua

a) Construye una tabla de frecuencias de 5 intervalos de clase. Intervalo de clase 9-15 16-22 23-29 30-36 37-43 Total 4 3 7 5 1 N= 20 4 7 14 19 20 12 19 26 33 40 48 57 182 165 40 492 F fac X f.x

Calcula la media, la mediana y la moda. Interpreta los resultados. Media


.

492 20

= 24,6 $

Mediana
2

20 2

la fac que contiene a 10 es 14 esta en el intervalo 3

Li = 23 = + Moda la frecuencia absoluta mayor 7 est en el intervalo 3


2

. = 23 +

20 7 2

. 7 = 26 $

D1 = 7 - 3 = 4 D2 = 7 5 = 2 + Decil 3. Interpreta el resultado


. 10 1 1+2

. = 23 +

4 4+2

. 7 = 27,66 $

3.20 10

=6

la fac que contiene a 6 es 7 est en el intervalo 2

Li = 16 3 = +
. 10

. = 16 +

3.20 4 10

. 7 = 20,66 $

EJERCICIO 4

4) Se tiene una muestra sobre el tipo se servicio que brindan 30 equipos informticos de la Universidad Columbia, tomados al azar: S C V C S S C S C S V C V D D V S D D C C D C S D D S S S S

Dnde: S= server

C= cluster V=virtual D=desktop

a) Construye la tabla de frecuencias. Intervalo de clase Tipos Equipos Servers Clusters Virtual Desktops 11 8 4 7 N = 30 0,366 0,266 0,133 0,233 0,998 36,6% 26,6% 13,3% 23,3% 131.76 95.76 47.88 83.88 Frecuencia Absoluta (f) Frecuencia Relativa (fr) Frecuencia Porcentual Grados

Haz un grfico circular.

Servicos
Servers 83,88 47,88 95,76 131,76 Clusters Virtual Desktops

Calcula la media, la mediana y la moda. i) No tiene media ii) No tiene mediana iii) La moda es Servers

10

EJERCICIO 5

Se desea investigar el ancho de banda que consume cada computador de una empresa de call center durante un mes, teniendo en cuenta los que operan entra la media noche y las 6 de la maana. Determina: a) La poblacin: Es el conjunto de todos los computadores de una empresa de call center b) La muestra: computadores de una empresa de call center que operan entre la media noche y las 6 de la maana durante un mes c) Individuo: Un computador de una empresa de call center que opera entre la media noche y las 6 de la maana durante un mes. d) La variable y el tipo de variable: variable : ancho de banda Tipo: Cuantitativa Continua

11

EJERCICIO 6

Identifica a que escala corresponden las siguientes variables: Nominal, Ordinal o proporcional

a) Tipo de piel: nominal b) Vacunas: nominal c) Horas de viaje: proporcional d) Color de cabello: nominal e) Lista de alumnos por apellido: nominal EJERCICIO 7

Se mira la marca a 23 computadores y se obtiene: 5 HP, 6 DELL, 7 SAMNSUNG, 5 TOSHIBA Escribe la tabla de distribucin de frecuencias. Variables Marca HP Dell Samsung Toshiba Frecuencia Absoluta (f) 5 6 7 5 N = 23 Frecuencia Relativa (fr) 0,217 0,260 0,304 0,217 0,998 Frecuencia Porcentual 21,7 26 30,4 21,7 78,12 93,6 109,44 78,12 Grados

12

Representa grficamente los datos. Grfico de barras verticales.

8 6 4 2 0 hp dell

Marcas

cantidad total

samsung

toshiba

Grfico circular.

Marcas
5 5 6 Hp dell Samsung toshiba

13

EJERCICIO 8

Dada la siguiente distribucin, de espacio de disco duro utilizado , en Megabytes, tomado de 42 computadoras al azar, realiza los siguientes ejercicios 52 58 61 63 64 64 67 69 70 70 73 75 75 76 78 78 80 81 81 82 83 83 85 85 88 88 88 89 90 92 94 95 96 96 97 98 98 100 100 105 108 109

Construye una tabla de frecuencias, utilizando intervalos de 10 Mb comenzndola con 50 Mb Rango = 109 - 52 = 57 =

10 =

57

= 6 F Fac X

Intervalo de Clase 50-59 60-69 70-79 80-89 90-99 100-109

2 6 8 12 9 5 42

2 8 16 28 37 42

54,5 64,5 74,5 84,5 94,5 104,5

14

Construye un histograma

Porcentaje Espacio Discos


14 12 10 8 6 4 2 0 54,5 64,5 74,5 84,5

Frecuencia

Frecuencia 94,5 104,5

Espacio Disponible

Calcula el cuartil 2
. 4

2.42 4

= 21 la fac que contiene a 21 es 28 esta en el intervalo 4

Li = 80 3 = +
. 10

. = 80 +

2.42 16 4

12

. 10 = 84,1 Mb

El 50 % de los discos tienen un espacio como mximo de 84,1 Mb Calcula el percentil 85


. 100

85.42 100

= 35,7la fac que contiene a 35,7 es 37 esta en el intervalo 5

Li = 90
. 10 85.42 28 100

3 = +

. = 90 +

. 10 = 98,5 Mb

El 85 % de los discos tienen un espacio como mximo de 98,5 Mb

15

EJERCICIO 9

La velocidad de transmisin mxima de 6 servidores es : 15, 15, 17, 16, 18, 17 Gbits/s. Halla ordenados: 15, 15, 16, 17, 17, 18 La mediana:
16+17 2

= 16,5 Gbs

La media:
15+15+16+17+17+18 6

= 16,3 Gbs

La moda: bimodal: 15 y 17 Gbs EJERCICIO 10

Un encargado de compras ha obtenido muestras de batera para notebooks. Ha probado la duracin en minutos de la muestra con los siguientes resultados Duracin en horas Frecuencia Absoluta f Marca de Clase Frecuencia Acumulada fac 70-80 80-90 90-100 100-110 110-120 Total 6 18 26 8 2 N = 60 74,5 84,5 94,5 104,5 114,5 6 24 50 58 60 447 1521 2457 836 229 5490 x.f

16

Media
.

5490 5609

= 91,5 hs

Mediana
2

60 2

= 30 La fac que contiene a 29,5 es 49 esta en el intervalo 3

Li = 90
2

= +

. = 90 +

60 24 2

26

. 10 = 92,3 hs

EJERCICIO 11 La tabla siguiente registra el numero de errores de ortografa detectados por diferentes aplicaciones procesadoras de texto Variable (n de errores) xi Frecuencia (n de alumnos)f 1 2 3 4 5 6 7 8 Total 2 4 5 10 8 5 5 1 40 2 6 11 21 29 34 39 40 2 8 15 40 40 30 35 8 178 3 2 1 0 1 2 3 4 6 8 5 0 8 10 15 4 56 2 16 35 160 200 180 245 64 902 Fac xi.fi . 2 .

17

Calcula: La media 1.2 + 2.4 + 3.5 + 4.10 + 5.8 + 6.5 + 7.5 + 8.1 178 = = 4.45 40 40 La desviacin media
.

= 56/40 = 1,4

La varianza
x 2 .

(x 2 ) =

902 40

(19,8025) = 2.74

EJERCICIO 12

Se tiene una muestra aleatoria de 100 paquetes de discos para controlar su peso, con el resultado expresado en la tabla. Peso (gramos) 960-970 970-980 980-990 990-1000 1000-1010 1010-1020 Total 8 10 25 30 18 9 100 965 975 985 995 1005 1015 7720 9750 24625 29850 18090 9135 99170 208 160 150 120 252 216 1106 7449800 9506250 24255625 29700750 1818450 9272025 98364900 F x f.x . 2 .

18

La desviacin media media =


.

99170 100

= 991,7 gr

DM =

1106 100

=11,06 gr

La varianza
x 2 .

(x 2 ) =

98265755 100

(983468,89) = 180,11

La desviacin tpica
x 2 .

(x 2 ) = 180,11 = 13,42

EJERCICIO 13

El puntaje benchmark obtenido en % por 60 servidores en una prueba es: 2 3 6 7 14 14 16 16 17 20 20 21 22 23 25 25 26 30 30 32 33 36 36 39 40 40 41 45 45 50 55 60 60 61 65 65 66 69 69 71 71 72 73 73 77 78 78 79 79 80 80 85 86 86 89 95 95 96 97 99

19

a) Construye con estos datos una tabla de distribucin de frecuencias, con intervalos de amplitud 10 Porcentaje 2-11 12-21 22-31 32-41 42-51 52-61 62-71 72-81 82-91 92-101 Total F 4 8 7 8 3 4 7 10 4 5 60 fac 4 12 19 27 30 34 41 51 55 60 x 6,5 16,5 26,5 36,5 45,5 56,5 66,5 76,5 86,5 96,5 f.x 26 132 185 292 139,5 226 465,5 765 346 482,5 3060 2 . 169 2178 4915,75 10658 6486,75 12769 30955,75 58522,5 29929 46561,25 203145

b) Construye un histograma

Histograma
12 10 8 6 4 2 0 6,5 16,5 26,5 36,5 45,5 56,5 Clase 66,5 76,5 86,5 96,5 Frecuencia

Frecuencia

20

c) Determina la moda, la mediana y la media aritmtica


. 2

3060 60

= 51 %

60 2

= 30 La fac que contiene a 30 es 30 est en el intervalo 5

Mediana: = + Moda: = +
D1 1 + 2
2

. = 42 +

60 27 2

. 10 = 52 %

. = 72 +

3 3+6

. 10 = 75,33 %

d) Calcula la desviacin estndar de estos datos agrupados La varianza


x 2 .

(x 2 ) =

203145 60

(2601) = 784,75

La desviacin tpica
x 2 .

(x 2 ) = 784,75 = 28,01

21

Calcula el decil 6 y el percentil 82. Interpreta los resultados Decil 6 . 6.60 = = 36 10 10 6 = +


. 10

. = 62 +

6.60 34 10

. 10 = 64,85 %

El 60 % de los servidores tuvo un puntaje como mximo de 64,85 % Percentil 82


. 10

82.60 100

= 49,2
. 100 82.60 41 100

82 = +

. = 72 +

10

. 10 = 80,2 %

El 82 % de los servidores tuvo un puntaje como mximo de 80,2 %

22

EJERCICIO 14 El consumo de energa elctrica (en watts) de 90 ups's a lo largo de un da esta tabulado en la siguiente tabla de frecuencias

Consumo 0-10 10-20 20-30 30-40 40-50 50-60 60-70 Total

Das 8 10 10 14 21 16 9 88

fac 8 18 28 42 63 79 88

x 4,5 14,5 24,5 34,5 44,5 54,5 64,5

f.x 36 145 245 483 934,5 872 508,5 3296

2 . 162 2102,5 6002,5 16663,5 41585,25 47524 37442,25 151482

a) Representa el histograma y el polgono de frecuencias acumuladas

Consumos
25 20 Frecuencia 15 10 Frecuencia 5 0 4,5 14,5 24,5 34,5 44,5 54,5 64,5

Consumo

23

Consumos
25 20 15 10 5 0 4,5 14,5 24,5 34,5 44,5 54,5 64,5 Serie 1

b) Calcula la media y la varianza de la distribucin Media:


.

3296 88

= 37,45 litros

Varianza:
x 2 .

(x 2 ) =

151482 88

(1402) = 319,3

c) Calcula la mediana y la moda Mediana:


2

88 2

= 44 La fac que contiene a 44 est en el intervalo 5 = +


2

. = 40 +

88 42 2

21

. 10 = 40,95 wats

Moda:

= +

D1 1 + 2

. = 40 +

7 7+5

. 10 = 45,83 watts

24

Calcula el primer cuartil y el tercer cuartil de la distribucin Cuartil 1:


. 4

1.88 4

= 22
. 4 1.88 18 4

1 = +

. = 20 +

10

. 10 = 24 watts

El 25 % del consumo de energa de los equipos es como mximo 24 watts Cuartil 3:


. 4

3.88 4

= 66
. 4 3.88 63 4

3 = +

. = 50 +

16

. 10 = 51,87 watts

El 75$ % del consumo de energa de los equipos es como mximo 51,87 watts EJERCICIO 15

Las edades de un grupo de desarrolladores son 4 8 9 10 12 13 13 14 15 15 16 17 19 20 22 23 23 23 24 25 25 26 26 26 27 27 27 28 29 30 32 32 32 33 35 39

a) Construye una tabla de frecuencias de amplitud 5: r = 39 - 4 = 35 c = r/n n = 35/5 = 7

25

Intervalo de Clase (edades) 4-8 9-13 14-18 19-23 24-28 29-33 34-38 39-43

f.x

2 .

2 5 5 6 10 6 1 1 36

6 11 16 21 26 31 36 41

12 55 80 126 260 186 36 41 796

72 605 1280 2646 6760 5766 1296 1681 20106

b) Dibuja el histograma

Edades
12 10 Frecuencia 8 6 4 2 0 6 11 16 21 Edades 26 31 36 Frecuencia

26

Calcula la media, la varianza, y la desviacin tpica de los datos. Media:


.

796 36

= 22,11

Varianza:
x 2 .

(x 2 ) =

20106 36

488,85 = 69,65 aos

Desviacin Tpica:
x 2 .

(x 2 ) = 69,65 = 8,34

EJERCICIO 16

Un software despleg el histrico de los tiempos de bsqueda del antivirus (en horas): 3,9; 2,0; 5,0; 5,9; 6,2. Determina: El rango : 6,2 - 2,0 = 4,2 hs Desviacin total Varianza =
x 2 .

(x 2 ) =
x 2 .

101,46 5

(17,64) = 2,652 hs

Desviacin =

(x 2 ) =

2,652 = 1,62 hs

27

Desviacin media

Media = DM =

3,9 + 2 + 3 + 5,9 + 6,2 5 .

= 4,2 hs =1,4 hs

3,94,2 + 2 4,2 + 5 4,2 + 5,94,2 + 6,24,2 5

EJERCICIO 17 Los 212 nmeros aleatorios arrojados por un software fueron los que se muestras en la tabla de distribucin de frecuencias Puntaje 350-400 400-450 450-500 500-550 550-600 600-650 650-700 700-750 750-800 800-850 Total f 4 6 9 20 31 80 42 10 8 2 212 x 374,5 424,5 474,5 524,5 574,5 624,5 674,5 724,5 774,5 824,5 x.f 1498 2547 4270,5 10490 17809,5 49960 28329 7245 6196 1649 126151 2 . 561001 1081201,5 2026352,25 5502005 10231557,75 31200020 19107910,5 5249002,5 4798802 1359600,5 81117453 . 882,2 1023,3 1084,95 1411 637,05 2356 3336,9 1294,5 1435,6 458,9 13920,4

Determina la: Media aritmtica


.

126151 212

= 595,05

28

Varianza
x 2 .

(x 2 ) =

81117453 212

354,08 = 382,27

Desviacin Media
.

13920 ,4 212

= 65,66

Desviacin tpica
x 2 .

(x 2 ) =

382,27 = 19,55

EJERCICIO 18

En un octavo ao se organiz la informacin referida al nmero de hermanos de cada alumno del curso. Contesta 1- Cuntos alumnos contestaron la encuesta? Todos los Alumnos de un octavo ao. 2- Cual es hermanos en ese curso?

EJERCICIO 19

Dado los datos: 7, 9, 5, 10, 9, 13, 11, 9, 10. Calcula la varianza y la desviacin tpica

29

Media
7+9+5+10+9+13+11+9+10 9

= 9,2

Varianza
x 2 .

(x 2 ) =

92 .3 + 72 .1 + 52 .1 + 10 2 .2 + 13 2 .1 +(112 .1) 9

9,22 = 5,02

Desviacin
x 2 .

(x 2 ) =

5,02 = 2,24 hs

30

Conclusin

En este trabajo se ha presentado la forma en la que se representa la informacin a partir de una muestra, y cules son los procesos y clculos que se realiza para obtener las medidas de las cuales luego se obtienen conclusiones e interpretaciones. Tambin cuales son los procesos para identificar y clasificar esas medidas y transmitir los resultados de forma grafica, a fin de poder estudiarlos y utilizar esa informacin para el fin deseado.

31

Bibliografia

BASICA

Caballero, Wilfredo. INTRODUCCION A LA ESTADISTICA. Serie: Libros y Materiales


Educativos N 28. San Jose, Costa Rica. 1975.

Johnson, Robert. ESTADISTICA ELEMENTAL. Grupo Editorial Iberoamericana. Mxico. 1990.

Kazmier,

Leonard

Diaz

Mata,

Alfredo.

ESTADISTICA

APLICADA

LA

ADMINISTRACION Y LA ECONOMIA. SERIE de compendios Schaum. Mxico. 1993

COMPLEMENTARIA
Britton, Jack R. - Bello, Ignacio. MATEMATICAS CONTEMPORANEAS. Harla Harper y Row Interamericana Gilbert, Norma. Ph. D. ESTADISTICA. Nueva Editorial Interamericana.

Spiegel, Murray R. Ph. D TEORIA Y PROBLEMAS DE ESTADISTICA. Serie de


compendios Schaum.