Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Organización y resumen
de datos
Profesor: Luis Benites
Recomendaciones
• Estudiar con anticipación
• Practicar
Herramientas que usaremos
durante el semestre
• Programa estadístico R (open source).
• Paideia (para dejar consultas, compartirles
material adicional, prácticas y exámenes
pasados).
¿Qué es la Estadística?
https://www.youtube.com/watch?v=ou-bhZM7eBo
Veamos el caso del fútbol
http://previsaoesportiva.com.br/
https://slides.com/luisbenitessanchez/deck-1
¿Qué es la Estadística?
• Es un conjunto de métodos científicos para la
recolección, organización, análisis e
interpretación de datos con la finalidad de
realizar conclusiones y tomar decisiones
válidas.
Ramas de la estadística
Estadística Descriptiva Estadística Inferencial
El objetivo de la estadística Se encarga del análisis de los
descriptiva es resumir las datos con el propósito de
principales características realizar conclusiones válidas
de un conjunto de datos a acerca de la población de
través de tablas, gráficos y donde originalmente se
medidas numéricas. recolectaron estos datos. La
Estadística inferencial esta
basada en la teoría de
probabilidades.
•
Población
Es un conjunto de elementos sobre
los cuales se desea investigar una o
más características de estos. El
número de elementos que conforman
una población será denotado por la
letra .
Muestra
Es un subconjunto de la población.
El número de elementos que
conforman una muestra será
denotado por la letra . Se dirá que
una muestra es aleatoria si sus
elementos han sido seleccionados
mediante un procedimiento
probabilístico.
Variable
• el resultado de una
Es •ENAHO
medición o una característica Ingreso mensual de un
en los elementos de la
hogar de una región.
población. Una variable suele
ser denotada por una letra, por Nivel socioeconómico de un
ejemplo: , o . hogar de una región.
DEPORTE
Se denominara como dato al Equipos de futbol
valor que toma una variable en Resultado del partido
un elemento de la población.
FARMACIA
Un conjunto de datos de una
variable se suele denotar tipos de medicamento para
como ,…,. la arritmia
Las variables se pueden clasificar en:
• Variables cuantitativas: Si toma valores numéricos con los que se
pueden realizar operaciones aritméticas. Se dividen en
o Discretas: son aquellas variables que toman un número finito o
infinito numerable de valores. Usualmente se consideran
números enteros.
o Continuas: son aquellas variables que pueden asumir cualquier
valor dentro de un intervalo de valores, por lo que toman un
numero no numerable de valores.
• Variables cualitativas: Si toma como valores categorías que
representan alguna clasificación en la población. Si bien estas
puedan representarse por números, estos no admiten operaciones
aritméticas. Las variables cualitativas se denominan:
o Nominales: si no existe orden entre las categorías.
o Ordinales: si existe orden entre las categorías.
Ejemplo
Se realizó una encuesta a 50 empleados del sector de
contabilidad de una empresa transnacional.
La siguiente tabla muestra algunas variables recolectadas
de 10 empleados. Determine la población y el tipo de cada
una de las variables.
Años
Código Grado de Sueldo completos en
instrucción
la empresa
2012115 Superior 2500 5
2010023 Secundaria 950 7
2010145 Superior 3500 7
2008075 Secundaria 850 9
2013023 Superior 2800 4
2014004 Superior 2100 3
2012123 Secundaria 1100 5
2014036 Superior 2600 3
2013154 Secundaria 860 4
2014017 Secundaria 900 3
Ejemplo
•Se dispone de un conjunto de datos sobre la venta de
propiedades residenciales individuales en Lima desde
2006 hasta 2010. Determine el tipo de cada una de las
variables
• Tamaño del lote en metros cuadrados
• Tipo de acceso por carretera a la propiedad, con
categorías: pavimentada y grava.
• Calidad del material en el exterior, con categorías: 4:
Excelente, 3: Buena, 2: Promedio y 1: Razonable.
• Número de carros que caben en el garaje.
• Precio de venta en dólares
Ejercicios
Tablas o distribuciones de frecuencias
CASO CUALITATIVO
•Si la variable es cualitativa, será de gran utilidad construir
una tabla de frecuencias. Ella está constituida por una lista
de las posibles categorías de la variable acompañadas por
el número de veces que ocurre cada una de ellas. En
adelante usaremos la siguiente notación:
• : frecuencia o número de veces que ocurre la
categoría .
• : frecuencia relativa o proporción para la categoría ,
calculada como , siendo el numero total de datos.
• : porcentaje de la categoría , dada por: .
Es claro que se cumplen:
La información contenida en la tabla de frecuencias puede
ser representada a través de gráficos como un:
30
categoría se la representa 25
presentando información de
una variable cualitativa. 0
S
IL
A
A
A
A
IC
IC
C
IV
IN
TI
G
N
.C
A
LO
O
G
RM
TR
E
IN
EO
.D
A
FO
.G
EC
G
N
IN
.M
.I
IN
G
IN
IN
La información contenida en la tabla de frecuencias puede
ser representada a través de gráficos como un:
Gráfico de sectores
circulares: a cada 17%
categoría se la representa
por un sector del círculo con 9%
ángulo proporcional a la
48%
17%
Gráfico de frecuencias
acumuladas u ojiva: Utiliza
las frecuencias acumuladas
y los limites superiores de
cada intervalo de clase.
Ejercicios