Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Prefacio:
La estadística desarrolla aspectos básicos en la
Estadística Descriptiva, Análisis de Regresión y
Correlación y Números Índice, utilizando para ello
los cálculos e interpretaciones de las Medidas de
Resumen, aplicando el procedimiento pertinente,
según se trate de datos agrupados y no agrupados.
Analizando en forma dependiente y asociación de
variables estadísticas mediante el uso de modelos
lineales y de medidas de asociación en el estudio de
los fenómenos económico-financieros
2
Índice del Contenido
I. PREFACIO 02
30
III. TRABAJO PRÀCTICO
30
IV. FUENTES DE INFORMACIÓN
3
CAPITULO I: FUNDAMENTOS DE LA ESTADÍSTICA
ESTADISTICA
Se define como la rama de las matemáticas que se
ocupa de facilitar la toma de decisiones acertadas
frente a una incertidumbre y por lo tanto, desarrolla
y utiliza técnicas para la recolección cuidadosa,
presentación efectiva y el análisis correcto de la
información numérica. La estadística la podemos
agrupar en dos grandes ramas, la descriptiva o
deductiva y la analítica o inferencia estadística.
En cambio, la Estadística entendida como ciencia
tiene un origen más reciente y el gran desarrollo de la misma ha tenido lugar,
fundamentalmente, a lo largo del siglo XX.
Como ciencia, la Estadística está formada por el conjunto de métodos y técnicas que
permiten la obtención, organización, síntesis, descripción e interpretación de los datos
para la toma de decisiones en ambiente de incertidumbre. Ese objetivo que persigue la
Estadística con la organización y síntesis de los datos tiene su razón de ser en el hecho
de que la misma se preocupa del estudio de los que podemos denominar como
fenómenos de masas. Es decir, la Estadística no está interesada en el estudio de datos
aislados, pues si la información es escasa no tiene sentido plantearse problemas de
organización ni de síntesis. Así, si se estudian los gastos en publicidad de las empresas
de una determinada rama de actividad y se tiene información para solo dos empresas,
entonces, con esos dos datos no ha lugar plantearse si los mismos han de presentarse
mediante una tabla o un gráfico o si deben resumirse mediante un promedio.
4
El primero de ellos da lugar a lo que se conoce como
Estadística Descriptiva. Esta rama es la más antigua de
la Estadística y su objeto es el análisis de los datos
para descubrir o describir las posibles regularidades
que presenten. Paralelamente, aunque con
posterioridad, se desarrolló la Teoría de la
Probabilidad. La unión ambas ha dado lugar a lo que se
conoce como Estadística Matemática o Inferencia
Estadística. El instrumental propio de esta rama es el que nos permite tomar decisiones
en ambiente de incertidumbre.
Se trata de decisiones basadas en la información que suministran los datos y que
permiten generalizar los resultados obtenidos.
LA OBSERVACIÓN ESTADÍSTICA.
En lo anterior se ha intentado dejar claro que la Estadística se dedica al estudio de los
fenómenos de masas. Es decir, la Estadística centra su interés en la observación de
colectivos amplios de entes o elementos, los cuales pueden ser personas o cosas. A
esos colectivos se les denomina en Estadística como Población.
Ahora bien, una vez que se tiene claro que el objeto de la Estadística es la observación
y estudio de las poblaciones, la siguiente cuestión que puede plantearse es cómo ha de
realizarse esa observación. La misma puede ser exhaustiva o parcial.
Las dos formas tienen ventajas e inconvenientes. En el caso de la observación
exhaustiva o total, y si se asume que no hay errores de medida entonces, lo que se
consigue es eliminar la incertidumbre.
Frente a esa ventaja fundamental, la observación exhaustiva tiene un grave
inconveniente: el coste. Se trata tanto de un coste monetario como en tiempo.
Imaginemos la siguiente situación. Un partido político, antes de unas elecciones, quiere
saber cuál es la intención de voto del electorado. Para ello tiene dos opciones.
5
La alternativa al enfoque anterior es la observación parcial.
Esta implica que no se observa a toda la población. Dentro
de esta forma de proceder se pueden distinguir dos
categorías distintas. Por un lado está la subpoblación y por
otro la muestra. Con la primera lo que se hace es observar
a un conjunto de entes o elementos de la población que
guardan entre si una cierta característica y que los
diferencia de los demás. Así, siguiendo con el ejemplo
anterior, los electores que no han votado antes porque en
las elecciones anteriores no tenían la edad mínima exigida
constituyen una subpoblación. Al proceder de esta forma se consigue realizar una
operación estadística en menos tiempo y a menor coste pero, en cambio, la
incertidumbre acerca de la intención de voto del electorado es enorme, pues esa
subpoblación no representa en absoluto a toda la población. Su intención de voto no
tiene por qué coincidir con la de los demás electores.
6
Pero no todo son ventajas en la observación parcial. El principal inconveniente se deriva
precisamente de que la observación no es exhaustiva. En estos casos las
características de la población serán desconocidas, pues aunque la muestra pretenda
representar lo más fielmente posible a la población, nunca dejará de ser eso, una
muestra. Con los datos de la muestra solo podremos conocer las características de
esos valores muéstrales. Concluir que son iguales a las de la población sería poco
menos que una osadía.
VARIABLES Y ATRIBUTOS.
En líneas anteriores, se ha señalado que el objeto de estudio de la Estadística son las
poblaciones y que estas están formadas por entes o elementos. El número total del
mismo determina el tamaño de la población. Para estudiar una población, lo primero que
debe hacerse es observarla de alguna de las formas que ya se ha señalado en las
líneas anteriores. Pero observar una población es equivalente a observar sus
elementos. Ahora bien, esos elementos poseen una serie de características que son las
que realmente se observan. Por ejemplo, el conjunto de todas las empresas industriales
radicadas en el Perú, constituyen una población.
7
Los elementos de esa población son las
empresas. Pero una empresa no se observa
en abstracto. Lo que realmente tiene interés
son las distintas características de esas
empresas, como, por ejemplo, el número de
empleados, el volumen de ventas, los costes
salariales, los gastos en publicidad, los
beneficios de las mismas, la naturaleza de
los productos que fabrican, etc.
A todas estas características de los elementos de una población se les conoce de forma
genérica como caracteres. Estos últimos, según su naturaleza, pueden ser de tipo
cuantitativo o cualitativo. Para el ejemplo anterior, serían caracteres cuantitativos “el
número de empleados”, “el volumen de ventas”, “los costes salariales”, “los gastos en
publicidad”, “los beneficios de las mismas”, etc., mientras que sería cualitativo “la
naturaleza de los productos que fabrican”. Hay que señalar que, en general, cualquier
carácter de tipo cuantitativo se puede ofrecer en términos cualitativos. Así, si el número
de empleados lo agrupamos en intervalos se podría hablar de empresas pequeñas,
medianas y grandes, siendo ahora el carácter “tamaño de la empresa” de naturaleza
cualitativa. De manera similar se podría proceder con los demás.
8
En los casos en los que las variables toman infinitos valores, la práctica habitual
es agruparlos en intervalos, como se muestra en las Tabla 1, para variable
continua.
9
CAPITULO II: ANÁLISIS DE LA VARIABLE
FUENTES ESTADÍSTICAS.
El objetivo de la Estadística es el estudio
de los fenómenos de masas. Pero ello
requiere el manejo de una información
numérica amplia. La cuestión inmediata
que surge es saber adónde se puede
recurrir para encontrar esa información
necesaria y sin la cual el análisis
estadístico no se puede realizar. En
definitiva, se trata es de conocer las fuentes que suministran información de carácter
estadístico. Estas fuentes son susceptibles de clasificarse según distintos criterios.
10
10
Entre las primeras, los principales productores de información estadística son la
Oficina de Estadística de la ONU (UNSTAT) y la Oficina de Estadística de la Unión
Europea (EUROSTAT).
La segunda y tercera de las categorías contempladas conforman el sistema
estadístico nacional, cuya organización responde al esquema de la Figura.
11
11
Entre las mismas cabe destacar las siguientes:
1) forma de la distribución;
2) medidas de posición (valor central o promedios);
3) dispersión;
4) asimetría;
5) curtosis.
12
12
La forma estándar de dar una distribución de frecuencias
con valores no agrupados es la que aparece en la Tabla.
Las frecuencias de esta tabla puede ser unitarias o
mayores que uno. El primer caso tienen poco interés
para la Estadística, pues como ya se indicó el objeto de
la misma era el estudio de colectivos grandes y nunca
las poblaciones con un número de elementos muy
reducido.Junto a las frecuencias absolutas de los valores
de una variable resulta habitual dar, también, lo que se conoce como frecuencias
relativas. Para un valor concreto, la frecuencia relativa, que representaremos por fi, es el
cociente entre la frecuencia absoluta y el número total de observaciones N. Es decir, fi =
ni/N. Estas frecuencias se puede expresar en porcentajes o en tantos por uno. A su vez,
las frecuencias, tanto las absolutas como las relativas, se pueden dar de forma
acumulada. Las frecuencias absolutas acumuladas se representan por Ni y las relativas
acumuladas por Fi.
13
13
Otro problema surge cuando un valor de la
variable coincide exactamente con un extremo
del intervalo, con lo que hay dudas sobre su
inclusión en ese intervalo o el siguiente. Como
solución a este problema es habitual proceder
a definir intervalos abiertos por la izquierda y
cerrados por la derecha, lo que implica que
intervalo definido entre a y b incluye a todos
los valores menores o iguales que b pero mayores que a. En general, una distribución
de frecuencias para una variable continua será como la que se da en la Tabla. A partir
del contenido de esta tabla hay que definir los siguientes conceptos:
a) Amplitud del intervalo. Es la diferencia entre el extremo superior y el inferior. Así para
el intervalo i-ésimo, la amplitud vendría dada por:
ai = Li - Li-1 (2.1)
14
14
CAPÍTULO III: ANÁLISIS GRÁFICO
El tipo de representación gráfica depende en
gran medida de la naturaleza del carácter de los
elementos de la población con el que se esté
trabajando. Así, si se trata de una variable se
recurrirá al diagrama de barras en el caso de
que sea discreta y sus valores no estén
agrupados. Este diagrama se realiza haciendo
uso de un sistema cartesiano en el que sobre el
eje de abscisas se ponen los valores de la variable y sobre el de ordenadas las
frecuencias, tanto absolutas (ni) como relativas (fi).
15
15
Frente a este tipo de gráfico, cuando
la naturaleza de la variable sea
continua, entonces la representación
gráfica más adecuada es el
histograma o también conocido como
histograma de frecuencias. Este tipo
de gráficos podría utilizarse también
en los casos de variables discretas con
valores agrupados, aunque no resulta
aconsejable hacer uso de los
histogramas para variables discretas por los problemas que conlleva asimilar
una variable discreta a otra de tipo continuo.
16
16
Una vez que se han señalado los instrumentos gráficos más habituales en el
análisis de variables, quedan por introducir los correspondientes cuando de lo
que se trata es de atributos. Ahora, las modalidades no tienen la dimensión
numérica de los valores de las variables. Esto hace que haya que pensar en otro tipo
de gráficos. Entre los más utilizados están los diagramas de tarta. En estos casos
lo que se hace es asignarle a cada modalidad del atributo un sector circular
proporcional a su frecuencia. Para aclarar esta idea en la Figura.
PIRÁMIDE DE POBLACIÓN
Otra forma corriente de presentación visual de datos estadísticos es la llamada pirámide
de población. Las pirámides de población se utilizan en la expresión de informaciones
demográficas, económicas o sociales, y en ellas se clasifican comúnmente los datos de
la población del grupo de muestra considerado en diferentes escalas de edad y
diferenciada por sexo.
17
17
PICTOGRAMAS Y CARTOGRAMAS
Para aligerar la presentación de datos estadísticos, con frecuencia se recurre a
imágenes pictóricas representativas del valor de las variables. Dos formas
comunes de expresión gráfica de los datos son:
Los pictogramas, que muestran diagramas figurativos con figuras o
motivos que aluden a la distribución estadística analizada (por ejemplo,
una imagen antropomórfica para indicar tamaños, alturas u otros).
18
18
CAPITULO IV: ETAPA DE ELABORACION DE
DATOS
DISTRIBUCIÓN DE FRECUENCIAS
Las distribuciones de frecuencias son
tablas en que se dispone las
modalidades de la variable por filas. En
las columnas se dispone el número de
ocurrencias por cada valor, porcentajes,
etc. La finalidad de las agrupaciones en
frecuencias es facilitar la obtención de la
información que contienen los datos.
19
19
X: Símbolo genérico de la variable.
f: Frecuencia (también se simboliza como ni).
La distribución de frecuencias de los datos del ejemplo muestra que la actitud
mayoritaria de los individuos del grupo estudiado es indiferente.
La interpretación de los datos ha sido facilitada porque se ha reducido el número
de números a examinar (en vez de los 20 datos originales, la tabla contiene 5
valores de la variable y 5 frecuencias).
20
20
La distribución de frecuencias es:
21
21
Ahora es más sencillo interpretar los datos. Por
ejemplo, podemos apreciar inmediatamente que
el intervalo con mayor número de datos es el 34-
39, o que el 75% de los datos tiene valor inferior
a 46.
Este tipo de tabla es denominado "tabla de datos
agrupados en intervalos".
Elementos básicos de las tablas de intervalos:
Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila
en una distribución de frecuencias
Límites aparentes: Valores mayor y menor del intervalo que son observados en
la tabla. Dependen de la precisión del instrumento de medida. En el ejemplo, los
límites aparentes del intervalo con mayor número de frecuencias son 34 y 39.
Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si
se contara con un instrumento de precisión perfecta. En el intervalo 34-39, estos
límites son 33.5 y 39.5
Punto medio del intervalo (Marca de clase): Suma de los límites divididos por
dos. Mc del intervalo del ejemplo= 36.5
Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto
inferior. En el ejemplo es igual a 6.
xi fi Fi ni Ni
0 1 1 0.02 0.02
1 1 2 0.02 0.04
2 2 4 0.04 0.08
3 3 7 0.06 0.14
4 6 13 0.12 0.26
5 11 24 0.22 0.48
6 12 36 0.24 0.72
7 7 43 0.14 0.86
8 4 47 0.08 0.94
9 2 49 0.04 0.98
10 1 50 0.02 1.00
50 1.00
22
22
DIAGRAMA DE BARRAS
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
65
23
23
REPRESENTACIONESGRÁFICAS
Diagrama de barras
Un diagrama de barras se utiliza para de presentar datos
cualitativos o datos cuantitativos de tipo discreto.
Se representan sobre unos ejes de coordenadas, en el eje de
abscisas se colocan los valores de la variable, y sobre el eje
de ordenadas las frecuencias absolutas o relativas o
acumuladas. Los datos se representan mediante barras de
una altura proporcional a la frecuencia.
Ejemplo
A 6
B 4
AB 1
0 9
20
24
24
POLÍGONOS DE FRECUENCIA
Un polígono de frecuencias se forma uniendo los extremos de las barras mediante
segmentos.
También se puede realizar trazando los puntos que representan las frecuencias y
uniéndolos mediante segmentos.
Ejemplo
Las
temperaturas
en una ciudad
han sufrido
las siguientes
variaciones:
Hora Temperatura
6 7º
9 12°
12 14°
15 11°
18 12°
21 10°
24 8°
25
25
Los datos se representan en un círculo, de modo que el ángulo de
cada sector es proporcional a la frecuencia absoluta correspondiente.
El diagrama circular se construye con la ayuda de un transportador de
ángulos.
Ejemplo
Baloncesto 12 144°
Natación 3 36°
Fútbol 9 108°
Total 30 360°
26
26
POLÍGONO DE FRECUENCIA
Para construir el polígono de frecuencia se toma la marca de clase que coincide
con el punto medio de cada rectángulo.
Ejemplo
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
65
27
27
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS ACUMULADAS
Si se representan las frecuencias acumuladas de una tabla de datos
agrupados se obtiene el histograma de frecuencias acumuladas o su
correspondiente polígono.
Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado,
fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
28
28
29
29
ACTIVIDADES PRÁCTICAS
FUENTES DE INFORMACIÓN
Bibliográficas
Electrónicas:
www.todaslascatedras.com.
www.loelbedon.com
30
30
31
31