Está en la página 1de 38

Capítulo 1:

Organización y resumen
de datos
Profesor: Luis Benites
Recomendaciones
• Estudiar con anticipación
• Practicar
Herramientas que usaremos
durante el semestre
• Programa estadístico R (open source).
• Paideia (para dejar consultas, compartirles
material adicional, prácticas y exámenes
pasados).
¿Qué es la Estadística?

Veamos primero algunas


aplicaciones
www.senamhi.gob.pe/?&p=calidad-del-aire
En el deporte

https://www.youtube.com/watch?v=ou-bhZM7eBo
Veamos el caso del fútbol

• ¿Será posible predecir quien va


a ganar un partido?
• ¿Qué factores podrían
intervenir en el resultado?
Estos factores son
- Tipo de césped colocados en un
Tomando en
- Árbitros modelo
consideración
- Hinchada estadístico, que
diversos factores
- Clima permite hacer las
predicciones.
Ahora veamos la aplicación
práctica 

http://previsaoesportiva.com.br/
https://slides.com/luisbenitessanchez/deck-1
¿Qué es la Estadística?
• Es un conjunto de métodos científicos para la
recolección, organización, análisis e
interpretación de datos con la finalidad de
realizar conclusiones y tomar decisiones
válidas.
Ramas de la estadística
Estadística Descriptiva Estadística Inferencial
El objetivo de la estadística Se encarga del análisis de los
descriptiva es resumir las datos con el propósito de
principales características realizar conclusiones válidas
de un conjunto de datos a acerca de la población de
través de tablas, gráficos y donde originalmente se
medidas numéricas. recolectaron estos datos. La
Estadística inferencial esta
basada en la teoría de
probabilidades.
•  
Población
Es un conjunto de elementos sobre
los cuales se desea investigar una o
más características de estos. El
número de elementos que conforman
una población será denotado por la
letra .

Muestra
Es un subconjunto de la población.
El número de elementos que
conforman una muestra será
denotado por la letra . Se dirá que
una muestra es aleatoria si sus
elementos han sido seleccionados
mediante un procedimiento
probabilístico.
Variable
•  el resultado de una
Es •ENAHO
 
medición o una característica Ingreso mensual de un
en los elementos de la
hogar de una región.
población. Una variable suele
ser denotada por una letra, por Nivel socioeconómico de un
ejemplo: , o . hogar de una región.
DEPORTE
Se denominara como dato al Equipos de futbol
valor que toma una variable en Resultado del partido
un elemento de la población.
FARMACIA
Un conjunto de datos de una
variable se suele denotar tipos de medicamento para
como ,…,. la arritmia
Las variables se pueden clasificar en:
• Variables cuantitativas: Si toma valores numéricos con los que se
pueden realizar operaciones aritméticas. Se dividen en
o Discretas: son aquellas variables que toman un número finito o
infinito numerable de valores. Usualmente se consideran
números enteros.
o Continuas: son aquellas variables que pueden asumir cualquier
valor dentro de un intervalo de valores, por lo que toman un
numero no numerable de valores.
• Variables cualitativas: Si toma como valores categorías que
representan alguna clasificación en la población. Si bien estas
puedan representarse por números, estos no admiten operaciones
aritméticas. Las variables cualitativas se denominan:
o Nominales: si no existe orden entre las categorías.
o Ordinales: si existe orden entre las categorías.
Ejemplo
Se realizó una encuesta a 50 empleados del sector de
contabilidad de una empresa transnacional.
La siguiente tabla muestra algunas variables recolectadas
de 10 empleados. Determine la población y el tipo de cada
una de las variables.
Años
Código Grado de Sueldo completos en
instrucción
la empresa
2012115 Superior 2500 5
2010023 Secundaria 950 7
2010145 Superior 3500 7
2008075 Secundaria 850 9
2013023 Superior 2800 4
2014004 Superior 2100 3
2012123 Secundaria 1100 5
2014036 Superior 2600 3
2013154 Secundaria 860 4
2014017 Secundaria 900 3
Ejemplo
•Se  dispone de un conjunto de datos sobre la venta de
propiedades residenciales individuales en Lima desde
2006 hasta 2010. Determine el tipo de cada una de las
variables
• Tamaño del lote en metros cuadrados
• Tipo de acceso por carretera a la propiedad, con
categorías: pavimentada y grava.
• Calidad del material en el exterior, con categorías: 4:
Excelente, 3: Buena, 2: Promedio y 1: Razonable.
• Número de carros que caben en el garaje.
• Precio de venta en dólares
Ejercicios
Tablas o distribuciones de frecuencias
CASO CUALITATIVO
•Si  la variable es cualitativa, será de gran utilidad construir
una tabla de frecuencias. Ella está constituida por una lista
de las posibles categorías de la variable acompañadas por
el número de veces que ocurre cada una de ellas. En
adelante usaremos la siguiente notación:
• : frecuencia o número de veces que ocurre la
categoría .
• : frecuencia relativa o proporción para la categoría ,
calculada como , siendo el numero total de datos.
• : porcentaje de la categoría , dada por: .
Es claro que se cumplen:
La información contenida en la tabla de frecuencias puede
ser representada a través de gráficos como un:
30

Gráfico de barras: a cada 28

categoría se la representa 25

por una barra cuya altura es


20
proporcional a la frecuencia
con que ocurre. En este tipo 15

de gráficos se suele dejar 10 10

un espacio entre las barras


10

para indicar que se esta 5


5 5

presentando información de
una variable cualitativa. 0

S
IL

A
A

A
A

IC

IC
C
IV

IN

TI
G

N
.C

A
LO

O
G

RM

TR
E
IN

EO
.D

A
FO
.G

EC
G

N
IN

.M
.I
IN

G
IN

IN
La información contenida en la tabla de frecuencias puede
ser representada a través de gráficos como un:
Gráfico de sectores
circulares: a cada 17%

categoría se la representa
por un sector del círculo con 9%

ángulo proporcional a la
48%

frecuencia con que ocurre. 9%

17%

ING. CIVIL ING. DE MINAS


ING. GEOLOGICA ING. INFORMATICA
ING. MECATRONICA
Ejemplo
Durante un mes se monitoreo el estado de la calidad del
aire en una ciudad, estos fueron los resultados:

Obtenga su distribución de frecuencias y los gráficos de


barras y de sectores circulares.
Ejemplo
• Es directo obtener la siguiente distribución de frecuencias:
Gráficos
Barras Sectores circulares
Tablas o distribuciones de frecuencias
CASO CUANTITATIVO DISCRETO
•En  este caso la tabla de frecuencias esta constituida por
una lista de las posibles valores que puede tomar la
variable (de preferencia ordenadas) acompañadas por el
número de veces que ocurre cada uno de estos valores.
En este caso asumiremos que la variable tiene valores
distintos y consideraremos la siguiente notación
• : frecuencia o numero de veces que ocurre el valor .
• : frecuencia relativa del valor , calculada como , siendo n
el numero total de datos.
• :porcentaje del valor , calculado como .
Ejemplo
En un cierto distrito durante un mes se registro el número
de accidentes de transito por día, estos fueron los
resultados:

Note que la variable número de accidentes de transito por


da en un distrito puede tomar los siguientes valores: 0, 1,
2, 3 y 4.
Ejemplo
A continuación presentamos la tabla de frecuencias para
este conjunto de datos
La información contenida en la tabla de frecuencias puede
ser representada a través de un:
•  Gráfico de bastones: a
cada valor posible se la
representa por una línea
vertical cuya altura es
proporcional a la
frecuencia con que
ocurre.
Tablas o distribuciones de frecuencias
CASO CUANTITATIVO CONTINUO
•  este caso es necesario agrupar las observaciones en clases.
En
Considerando las clases como intervalos de igual amplitud, podemos
seguir el siguiente procedimiento:
• Establecer el número de clases , usualmente entre 5 y 10 intervalos
aunque ello es subjetivo y depende de la experiencia. Una sugerencia
es seguir la regla de Sturges: , donde se aproxima por exceso.
• Determinar la amplitud de los datos, .
• Determinar el tamaño de la clase, donde, de ser necesario debe de
redondearse por exceso al número de decimales de los datos.
• Usar para construir los intervalos de cada clase. Aquí
consideraremos intervalos cerrados por la derecha y abiertos por la
izquierda, con excepción del primero que es cerrado en ambos lados.
•Se  considera la siguiente notación:
• : Extremo derecho de la clase .
• : Marca de clase o punto medio del intervalo de clase .
• : Frecuencia de la clase .
• : Frecuencia relativa de la clase .
• : Porcentaje de la clase .
• : Frecuencia acumulada de la clase .
• : Frecuencia relativa acumulada de la clase .
• : Porcentaje acumulado de la clase .
Ejemplo
Se registró el consumo de electricidad en kWh de 50
hogares obteniéndose:

Construya una distribución de frecuencias y muestre esta


gráficamente.
Tabla de frecuencias
Histograma con polígono de frecuencias para el
consumo de electricidad en los 50 hogares del
distrito
Histograma: Aquí cada clase
es representada por una barra
cuya altura es proporcional a la
frecuencia con que ocurre.
En este tipo de gráficos no se
debe dejar espacios entre las
barras para indicar que se esta
presentando información de una
variable cuantitativa continua.
Polígono de frecuencias: Es
formada uniendo los puntos
medios altos de cada barra del
histograma.
Ojiva para el consumo de electricidad en los
50 hogares del distrito

Gráfico de frecuencias
acumuladas u ojiva: Utiliza
las frecuencias acumuladas
y los limites superiores de
cada intervalo de clase.
Ejercicios

También podría gustarte