Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(Analizar datos)
Estudio de caso: endoprótesis
Variables
Observaciones
Caso
Unidad de observación
Observaciones, variables y matrices
Indicator Name Long definition
Total population is based on the de facto definition of population, which counts all residents
Population, total
regardless of legal status or citizenship. The values shown are midyear estimates.
GDP per capita is gross domestic product divided by midyear population. GDP is the sum of gross
value added by all resident producers in the economy plus any product taxes and minus any subsidies
GDP per capita (current US$) not included in the value of the products. It is calculated without making deductions for depreciation
of fabricated assets or for depletion and degradation of natural resources. Data are in current U.S.
dollars.
Business extent of disclosure Disclosure index measures the extent to which investors are protected through disclosure of
index (0=less disclosure to ownership and financial information. The index ranges from 0 to 10, with higher values indicating
10=more disclosure) more disclosure.
Ease of doing business rank Ease of doing business ranks economies from 1 to 190, with first place being the best. The ranking of
(1=most business-friendly economies is determined by sorting the aggregate ease of doing business scores. A high ranking (a
regulations) low numerical rank) means that the regulatory environment is conducive to business operation.
The ease of doing business scores benchmark economies with respect to regulatory best practice,
Ease of doing business score (0
showing the proximity to the best regulatory performance on each Doing Business indicator. An
= lowest performance to 100 =
economy’s score is indicated on a scale from 0 to 100, where 0 represents the worst regulatory
best performance)
performance and 100 the best regulatory performance.
Variables
Variables
Numéricas Categóricas
muestra muestra
Graduados cc.
administrativas
No sesgada Sesgada
Estrato 3
Estrato 1
Estrato 5
Agrupa casos similares en cada estrato
Otras formas de muestreo - Cluster
60 33 85 52 65 77 84 65 57 74
71 81 35 50 35 64 74 47 68 54
80 41 61 91 55 73 59 53 45 77
41 78 55 48 69 85 67 39 76 60
94 66 98 66 73 42 65 94 89 88
Distribución de frecuencias. Variables numéricas
Rango de
Frecuencia Proporción %
notas Frecuencia
relativa
30-39 4 0.08 8
40-49 6 0.12 12
50-59 8 0.16 16
30: límite
Intervalos inferior
60-69 12 0.24 24
de clase 39: límite
70-79 9 0.18 18 superior
80-89 7 0.14 14
90-99 4 0.08 8
50 1 100
Distribución de frecuencias. Variables numéricas
Frecuencia Frecuencia
Rango de Frecuencia Frecuencia
absoluta relativa
notas absoluta relativa
acumulada acumulada
30-39 4 4 0.08 0,08
40-49 6 10 0.12 0,20
50-59 8 18 0.16 0,36
60-69 12 30 0.24 0,60
70-79 9 39 0.18 0,78
80-89 7 46 0.14 0,92
90-99 4 50 0.08 1
Intervalos de clase
12 Polígono de
12 frecuencias
10
8 9
Frecuencia 8
6 7
6
4
4 4 Histograma
2
0
30-39 40-49 50-59 60-69 70-79 80-89 90-99
notas
Distribución de frecuencias. Variables categóricas
Número
Tipo de familia Proporción %
(millones)
Pareja casada con hijos 23,3 0,20 20 (40)
Pareja casada sin hijos 33,7 0,29 29 (30)
Mujer viviendo sola 17,4 0,15 15 (11)
Hombre viviendo solo 14,0 0,12 12 (6)
Otros hogares familiares 20,9 0,18 18 (11)
Otros hogares no familiares 7,0 0,06 6 (2)
Total 116,3 1,00 100 (100)
0.3
0.29
0.25
0.2
Frecuencia relativa de 0.2
la estructura del hogar 0.18
0.15
0.15
0.1 0.12
0.05 0.06
0
PAREJA CASADA PAREJA CASADA MUJER VIVIENDO HOMBRE OTROS HOGARES OTROS HOGARES
CON HIJOS SIN HIJOS SOLA VIVIENDO SOLO FAMILIARES NO FAMILIARES
Distribución muestral y poblacional
• Las distribuciones
100 observaciones de frecuencias y los histogramas se usan
100 observaciones tanto
Población
Frecuenciapara datos muestrales como para datos poblacionales
Frecuencia Frecuencia
relativa – Distribución de datos
relativa muestrales relativa
– Distribución poblacional
• A medida que el tamaño de la muestra aumenta, la
proporción muestral en cualquier intervalo se acerca a
los valores verdaderos poblacionales
bajo alto bajo alto bajo alto
Valores de la variable Valores de la variable Valores de la variable
Forma de la distribución. Simétricas
Frecuencia Frecuencia
relativa relativa
Forma de
U
Forma de
campana
Frecuencia Frecuencia
relativa relativa
Sesgada a la Sesgada a la
derecha izquierda
Propiedades
• La media es apropiada solo para variables cuantitativas
• Cada conjunto de datos posee una y solo una media
• Es altamente sensible a valores atípicos ya sea por arriba o por abajo
• Mientras más sesgada es la distribución de una variable, menos
representa el valor típico de la muestra
• Es el punto de balance de los datos sobre una recta numérica
La mediana
Propiedades
• Es apropiada para variables cuantitativas, pero también es válida
para variables categóricas ordinales
• Es el valor que divide a los datos en dos partes iguales
• No es sensible a las distancias de las observaciones desde la mitad, ya
que usa solo las características ordinales de los datos
• No se afecta por valores atípicos
La mediana
Conjunto 1 8 9 10 11 12
Conjunto 2 8 9 10 11 100
Conjunto 3 0 9 10 10 10
Conjunto 4 8 9 10 100 100
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 67 68 69
71 73 73 74 74 76 77 77 78 80
81 84 85 85 88 89 91 94 94 98
La media vs. La mediana
Frecuencia Frecuencia
relativa relativa
media media
mediana mediana
Valores de la variable Valores de la variable
La moda
Propiedades
• Es apropiada para cualquier tipo de datos, p. ej. Preferencias
religiosas (categórica), número de personas (numérica), ranking
(ordinal)
• Una distribución bimonal es aquella en la que dos “montículos”
aparecen, es decir, existen dos modas
• La media, mediana y moda son idénticas para distribuciones
simétricas y unimodales tales como la distribución normal.
La moda