Está en la página 1de 10

ESTADISTICA DESCRIPTIVA Y

PROBABILIDADES
DEFINICIONES BASICA Y ORGANIZACION DE DATOS

BIOESTADISTICA
ÁREA DE ESTADISTICA
DEPARTAMENTO DE CIENCIAS EXACTAS - ESPE
Semana # 1

Contenido
Título Definiciones Básicas y Organización de datos
Duración 90 minutos
Información general Definiciones y conceptos básicos – Organización de datos
estadísticos.
Objetivo Elaborar ejemplos de definiciones básicas

1.1 Conceptos y definiciones

Estadística es la ciencia que se encarga de recolectar, organizar, presentar, analizar e


interpretar datos con el propósito de ayudar a una toma de decisiones más efectiva.
Las técnicas estadísticas se usan ampliamente por personas en áreas de comercialización,
contabilidad, control de calidad, consumidores, deportes, administración de hospitales,
educación, política, medicina, etcétera...

Tipos de estadística:
Estadística descriptiva: métodos para organizar, resumir y presentar datos de manera
informativa.
EJEMPLO 1: un sondeo de opinión encontró que 49% de las personas en una encuesta
sabían el nombre del primer libro en la Biblia. La estadística “49” describe el número de
cada 100 personas que saben la respuesta.
EJEMPLO 2: según un estudio realizado, los dueños de lavadoras de ropa Whirlpool
reportaron 9 problemas por cada 100 máquinas durante 1995. La estadística “9” describe
el número de problemas por cada 100 máquinas.

Estadística inferencial: una decisión, estimación, predicción o generalización sobre una


población, con base en una muestra.

1
Semana # 1

EJEMPLO 1: las cadenas de TV monitorean la popularidad de sus programas contratando


a empresas de investigación Nielsen y otras organizaciones para muestrear las preferencias
de televidentes.
EJEMPLO 2: el departamento de contabilidad de una empresa elegirá una muestra de
facturas para verificar la exactitud de todas las facturas de la compañía.
EJEMPLO 3: los médicos estudian características de una muestra de pacientes para llegar
a conclusiones respecto de una población.

Población: es un conjunto de todos los posibles individuos, objetos o medidas de interés.


Toda medida respecto de la población se denomina parámetro poblacional.
Muestra: es una porción, o parte, de la población de interés. Toda medida respecto de la
muestra se denomina estadístico muestral.

Tipos de variables:
Variable cualitativa o de atributos: la característica o variable que se estudia no es
numérica.
EJEMPLOS: sexo, afiliación religiosa, tipo de automóvil que se posee, lugar de nacimiento,
color de los ojos.

Variable cuantitativa: la variable se puede registrar numéricamente.


EJEMPLO: saldo en una cuenta de cheques, minutos que faltan para que termine la clase,
número de niños en una familia.

Las variables cuantitativas se pueden clasificar como discretas o continuas.


Variables discretas: sólo pueden adquirir ciertos valores y casi siempre hay “brechas”
entre esos valores.
EJEMPLO: el número de habitaciones en una casa (1,2, 3, ..., etc.).

Variables continuas: pueden tomar cualquier valor dentro de un intervalo específico.


EJEMPLO: el tiempo que toma volar de Quito a Nueva York.

2
Semana # 1

DATOS

Cualitativos o de atributos Cuantitativos o numéricos


(marca de auto que posee)

discretos continuos
(número de hijos) (tiempo para resolver el examen)

Fuentes de datos estadísticos


Los problemas de investigación suelen requerir datos publicados. Se pueden encontrar
estadísticas relacionadas en artículos publicados, revistas y periódicos.
No todos los temas disponen de datos publicados. En esos casos, la información deberá
recolectarse y analizarse.
Una manera de recolectar datos es mediante encuestas.

Niveles de medición de variables:


Nivel nominal: los datos sólo se pueden clasificar en categorías, no se pueden ordenar.
ELEMPLOS: color de los ojos, sexo, afiliación religiosa.
Nivel ordinal: involucra datos que se pueden ordenar, pero no es posible determinar las
diferencias entre los valores de los datos o no tienen significad o.
EJEMPLO: en una prueba de sabor de 4 refrescos, el A se clasificó como número 1, el B como
número 2, el C como 3 y el D como número 4.
Nivel de intervalo: similar al nivel ordinal, con la propiedad adicional de que se pueden
determinar cantidades significativas de las diferencias entre los valores. El punto cero es
referencial.
EJEMPLO: temperatura en la escala de grados Centígrados.
Nivel de razón: el nivel de intervalo con un punto cero es natural. Las diferencias y razones
son significativas para este nivel de medición.
EJEMPLOS: dinero que ganan, estatura de los jugadores de futbol.

3
Semana # 1

1.2 Distribución de frecuencias

Distribución de frecuencias: agrupamiento de datos en categorías que muestran el número de


observaciones en cada categoría mutuamente excluyente.

Pasos para elaborar una distribución de frecuencias


Paso 1: Defina el número de clases. El objetivo consiste en emplear suficientes agrupamientos
o clases, de manera tal que se perciba la forma de la distribución. Aquí se necesita criterio.
Paso 2: Determine el intervalo o ancho de clase. El intervalo o ancho de clase debería ser el
mismo para todas las clases. Todas las clases juntas deben cubrir por lo menos la distancia del
valor más bajo al más alto de los datos.
Paso 3: Establezca los límites de cada clase. Este paso es importante para que sea posible
incluir cada observación en una sola categoría. Esto significa que debe evitar la superposición
de límites de clase confusos.
Paso 4: Cuente el número de elementos de cada clase

Marca de clase (punto medio): punto que divide a la clase en dos partes iguales. Es el
promedio entre los límites superior e inferior de la clase.
Intervalo de clase: para una distribución de frecuencias que tiene clases del mismo tamaño, el
intervalo de clase se obtiene restando el límite inferior de una clase del límite inferior de la
siguiente.

EJEMPLO 1
Dr. Núñez es el director de la escuela de administración y desea determinar cuántas horas
semanales estudian los alumnos en ella. Selecciona una muestra aleatoria de 30 estudiantes y
determina el número de horas por semana que estudia cada uno: 15.0, 23.7, 19.7, 15.4, 18.3,
23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1,
15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.

Organice los datos en una distribución de frecuencias.


Considere organizar los datos en 6 clases mutuamente excluyentes, por ejemplo (8-12 y 13-17,
etc.) Las marcas de clase son 10 y 15. El intervalo de clase es 5 (13 - 8).

4
Semana # 1

Horas de estudio Frecuencia ( f)


8-12 1
13-17 12
18-22 10
23-27 5

28-32 1
33-37 1

Sugerencias para elaborar una distribución de frecuencias:


• Use el intervalo de clase calculado sugerido para construir la distribución de
frecuencias.
Nota: este es un intervalo de clase sugerido; si el intervalo de clase calculado es 97,
puede ser mejor usar 100.
• Cuente el número de valores en cada clase
Frecuencia relativa:

Horas de estudio Frecuencia, f Frecuencia relativa


8-12 1 1/30=0.0333

13-17 12 12/30=0.400

18-22 10 10/30=0.333

23-27 5 5/30=0.1667

28-32 1 1/30=0.0333

33-37 1 1/30=0.0333

TOTAL 30 30/30=1

5
Semana # 1

Diagrama de tallo y hoja: técnica estadística para representar un conjunto de datos. Cada
valor numérico se divide en dos partes: los dígitos principales son el tallo y el dígito siguiente
es la hoja.
Nota: una ventaja de la representación de tallo y hoja comparado con la distribución de
frecuencias es que no se pierde la identidad de cada observación.

EJEMPLO 2

Cesar logró las siguientes calificaciones durante el semestre: 86, 79, 92, 84, 69, 88, 91, 83, 96,
78, 82, 85. Construya una representación de tallo y hoja para los datos.

tallo hoja

6 9
7 89
8 234568
9 126

1.3 Gráficos estadísticos

Las tres formas de gráficas más usadas son histogramas, polígonos de frecuencia y
distribuciones de frecuencias acumuladas (ojiva).
Histograma: gráfica donde las clases se marcan en el eje horizontal y las frecuencias de clase
en el eje vertical. Las frecuencias de clase se representan por las alturas de las barras y éstas se
trazan adyacentes entre sí.
Un polígono de frecuencias: consiste en segmentos de línea que conectan los puntos formados
por el punto medio de la clase y la frecuencia de clase.
Una distribución de frecuencias acumulada (ojiva): se usa para determinar cuántos o qué
proporción de los valores de los datos es menor o mayor que cierto valor.

6
Semana # 1

Histograma para las horas de estudio

15
Frecuencia

10

0
10 15 20 25 30 35
Horas de estudio

Polígono de frecuencias para las horas de estudio


14
12 12
10 10
FRECUENCIA

8
6
5
4
2
1 1 1
0
10 15 20 25 30 35

HORAS DE ESTUDIO

Distribución de frecuencias acumuladas menor que para las horas de


estudio
35
30
25
Frecuencia

20
15
10
5
0
10 15 20 25 30 35
Horas de estudio

7
Semana # 1

Gráfica de barras: se puede usar para describir cualquier nivel de medición (nominal, ordinal,
de intervalo o de razón).

EJEMPLO 3: construya una gráfica de barras para el número de personas desempleadas por cada 100.000
habitantes de ciertas ciudades en el 2005.

Ciudad Número de desempleados por


100 000 habitantes
Ambato 7300
Riobamba 5400
Loja 6700
Guayaquil 8900
Cuenca 8200
Quito 8900

Numero de desempleados por 100.000


habitantes
10000
9000
8000
Deseempleados

7000
6000
5000
4000
3000
2000
1000
0
Ambato Riobamba Loja Guayaquil Cuenca Quito
Ciudad

8
Semana # 1

Gráfica circular
Una gráfica circular es en especial útil para desplegar una distribución de frecuencias
relativas. Se divide un círculo de manera proporcional a la frecuencia relativa y las rebanadas
representan los diferentes grupos.
EJEMPLO 4: se pidió a una muestra de 200 corredores que indicaran su tipo favorito de
zapatos para correr.

Tipo de zapato # de corredores

Nike 92

Adidas 49

Reebok 37

Asics 13

Otros 9

# de corredores

7% 5%
18% 46%
Nike
Adidas
24%
Reebok
Asics
Otros

También podría gustarte