Unidad Iii

UNIDAD III
3.1 CONCEPTOS BASICOS DE ESTADISTICA
ESTADISTICA:La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya

sea para ayudar en la resolución de la toma de decisiones o para explicar condiciones regulares o irregulares
de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria ocondicional. Sin embargo estadística
es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la
investigación científica.
Ejemplo: S e t i e n e e l s i g u i e n t e c o n j u n t o d e 2 6 d a t o s :
10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10,
17, 10, 16, 14, 8, 18
Obtener su mediana y moda.
TEORIA DE DECISION:
Estudio formal sobre la toma de decisiones. Los estudios de casos reales, que se sirven de la
inspección y los experimentos, se denominan teoría descriptiva de decisión; los estudios de la
toma de decisiones racionales, que utilizan la lógica y la estadística, se llaman teoría preceptiva
de decisión. Estos estudios se hacen más complicados cuando hay más de un individuo, cuando
los resultados de diversas opciones no se conocen con exactitud y cuando las probabilidades de
los distintos resultados son desconocidas. La teoría de decisión comparte características con la
teoría de juegos, aunque en la teoría de decisión el ‘adversario’ es la realidad en vez de otro
jugador o jugadores.
Al hacer un análisis sobre esta teoría, y mirándola desde el punto de vista de un sistema, se
puede decir que al tomar una decisión sobre un problema en particular, se debe tener en cuenta
los puntos de dificultad que lo componen, para así empezar a estudiarlos uno a uno hasta
obtener una solución que sea acorde a lo que se esta esperando obtener de este, y sino, buscar
otras soluciones que se acomoden a lo deseado.

La teoría de decisión, no solamente se puede ver desde el punto de vista de un sistema, sino en
general, porque esta se utiliza a menudo para tomar decisiones de la vida cotidiana, ya que
muchas personas piensan que la vida es como una de las teorías; La teoría del juego, que para
poder empezarlo y entenderlo hay que saber jugarlo y para eso se deben conocer las reglas de
este, para que no surjan equivocaciones al empezar la partida.
Se puede decir que la Teoría de decisión es una de las ramas que sirve para que al dar un paso,
no se vaya a dar en falso, porque si se conoce de esta no hay el porque de equivocarse.

Ejemplo:
POBLACION:
Elconcepto depobl ación en estadística va más allá de lo que comúnmente se

conoce como tal. Una población se precisa como un conjunto finito o infinito de
personas u objetos que presentancaracterísticas comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando,
acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan unacaracterística
común". Cadenas (1974).
Ejemplo:
Los miembros del Colegio de Ingenieros delEst ado Cojedes.
El tamaño que tiene una población es un factor de suma importancia en el
procesode investigación estadística, y este tamaño vienen dado por el número

de elementos que constituyen la población, según el número de elementos la
población puede ser finita o infinita. Cuando el número de elementos que
integra la población es muy grande, se puede considerar a esta como una
población infinita, por ejemplo; el conjunto de todos los números positivos. Una
población finita es aquella que está formada por un limitado número de
MUESTRA ALEATORIA:
Es una muestra sacada de una población de unidades, de manera que todo elemento
de la población tenga la misma probabilidad de selección y que las unidades diferentes
se seleccionen independientemente.
Muestra aleatoria: muestra elegida independientemente de todas las demás, con la misma
probabilidad que cualquier otra y cuyos elementos están elegidos independientemente unos de
otros y con la misma probabilidad.
Muestra aleatoria
Una muestra aleatoria es una muestra sacada de una población de unidades, de manera que
todo elemento de la población tenga la misma probabilidad de selección y que las unidades
diferentes se seleccionen independientemente.

PARAMETROS ALEATORIOS
Parámetros y estadísticos. Existen medidas para realizar descripciones cuantitativas de los
conjuntos de datos, o poblaciones, y de sus muestras, diferenciándose entre ellas las que se
refieren a las mismas poblaciones y a las muestras.
Para el caso de las poblaciones, las medidas que las describen se denominan parámetros, y
suelen estar representadas con letras griegas (por ejemplo Y Por otro lado, para el caso de
aquellas medidas que describen a una muestra se les llama estadísticos o estimadores, y son
representados por letras de nuestro alfabeto (por ejemplo, x o s).
Parámetro: Una parámetro es una medida usada para describir alguna característica de una
población, tal como una media aritmética, una mediana o una desviación estándar de una
población. Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso de
estimación en inferencia estadística puede ser descrito como le proceso de estimar un parámetro
a partir del estadístico correspondiente, tal como usar una media muestral (un estadístico para
estimar la media de la población (un parámetro). Los símbolos usados para representar los
estadísticos y los parámetros, en éste y los siguientes capítulos, son resumidos en la tabla
siguiente:
DESCRIPCION DE DATOS:
DATOS AGRUPADOS Y NO AGRUPADOS
Distribución de frecuencia para datos no Agrupados:

Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde
el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al
tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia
identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los
valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus
respectivas frecuencias.
Distribución de frecuencia de clase o de datos Agrupados:
Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran

ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios
valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen
normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no
agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior
50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizará la
distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución
cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la
ojiva.
La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor

comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los
mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que
la información obtenida de una investigación sea manejable con mayor facilidad.
FRECUENCIA DE CLASE
La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el
número total de valores de las variables que se encuentran presente en una clase determinada,
de una distribución de frecuencia de clase.
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio

estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.
igualdad
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se
lee suma o sumatoria.
igualdad Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31,
30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor y en la

segunda anotamos la frecuencia absoluta. xi fi
xi fi
27 1
29 6
30 7
31 8
32 3
33 3
34 1
suma 31
FRECUENCIA RELATIVA
La frecuencia relativa es el cociente entre la frecuencia
a b s o l u t a d e u n d e t e r m i n a d o v a l o r y e l n ú m e r o to t a l d e d a t o s .
L a f r e c u e n c i a r e l a t i v a s e p u e d e e x p r e s a r e n t a n t o s po r c i e n t o y
s e r e p r e s e n t a po r n i .
L a s u m a de l a s f r e c u e n ci a s r e l a t i v a s e s i g u a l a 1 .
Ejemplo
D u r a n t e e l m e s de j u l i o , e n un a c i u d a d s e h a n r e g i s t r a d o l a s
s i g u i e n t e s t e m pe r a t u r a s m á x i m a s :
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31,
30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
PUNTO MEDIO
LIMITES
 ¿QUÉ SON LOS LIMITES INFERIORES Y SUPERIORES?
Los límites inferiores y superiores son los valores mínimo y máximo de una distribución. V.g: En un curso de
50 alumnos, se le pidió a un profesor que pesará a todos, los datos obtenidos son los siguientes:
LIMITE SUPERIOR: 98
LIMITE INFERIOR: 38
3.3 MEDIDAS DE TENDECIA CENTRAL
Media aritmética
Artículo principal: Media aritmética
La media aritmética es un promedio estándar que a menudo se denomina "promedio".
La media se confunde a veces con la mediana o moda. La media aritmética es el promedio de un conjunto de
valores, o su distribución; sin embargo, para las distribuciones con sesgo, la media no es necesariamente el
mismo valor que la mediana o que la moda. La media o moda son elementos intuitivos de medir los datos. Es
a veces una forma de medir el sesgo de una distribución tal y como se puede hacer en las
distribuciones exponencial y de Poisson.
Por ejemplo, la media aritmética de 34, 27, 45, 55, 22, 34 (seis valores)
es
[editar]Media aritmética ponderada

Artículo principal: Media ponderada
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado
estudio. En esos casos se puede utilizar una media ponderada. Si X1,X2,...,Xn es un conjunto de datos o media
muestral y w1,w2,...,wn son números reales positivos, llamados "pesos" o factores de ponderación, se define la
media ponderada relativa a esos pesos como:
La media es invariante frente a transformaciones lineales, cambio de origen y escala, de las variables, es decir
si X es una variable aleatoria e Y es otra variable aleatoria que depende linealmente de X, es decir, Y = a·X +
b (donde a representa la magnitud del cambio de escala y bla del cambio de origen) se tiene que:
[editar]Media geométrica
Artículo principal: Media geométrica
La media geométrica es un promedio muy útil en conjuntos de números que son interpretados en orden de su
producto, no de su suma (tal y como ocurre con la media aritmética). Por ejemplo, las velocidades de
crecimiento.
Por ejemplo, la media geométrica de la serie de números 34, 27, 45, 55, 22, 34 (seis valores)
es
Moda
Artículo principal: Moda (estadística)
La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta.5 En cierto sentido la
definición matemática corresponde con la locución "estar de moda", esto es, ser lo que más se lleva.
Su cálculo es extremadamente sencillo, pues sólo necesita un recuento. En variables continuas, expresadas
en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto
de la variable, se recurre a la interpolación.
Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-6-9-5-6-1-5-3-7. El número
que más se repite es 5, entonces la moda es 5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos
que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos se encuentran tres o
más modas, entonces es multimodal. Por último, si todas las variables tienen la misma frecuencia diremos que
no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo
modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide el intervalo modal en dos partes de la
forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:
Siendo ni la frecuencia absoluta del intervalo modal y ni − 1 y ni + 1 las frecuencias absolutas de los intervalos
anterior y posterior, respectivamente, al
Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente
tabla (debajo):
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 8 9 3 4 2
Mediana
Artículo principal: Mediana (estadística)
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que éstos
están ordenados de menor a mayor.7 Por ejemplo, la mediana del número de hijos de un conjunto de trece
familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados
los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:
En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo
que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por
ejemplo, en el caso de doce datos como los anteriores:
Se toma como mediana
Existen métodos de cálculo más rápidos para datos más númerosos (véase el artículo
principal dedicado a este parámetro). Del mismo modo, para valores agrupados en intervalos, se
halla el "intervalo mediano" y, dentro de éste, se obtiene un valor concreto por interpolación
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una
distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy
alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más
homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las
desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es
siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado
(Varianza).
RECORRIDO O RANGO
El recorrido es la diferencia entre los valores mayor y menor de la variable; se
representa por R.
Cuando los datos están agrupados en intervalos, el recorrido es la diferencia entre la

marca de clase del último intervalo y la marca de clase del primero; aunque en
ocasiones se calcula como el extremo superior del último intervalo menos el extremo
inferior del primero.
Esta medida de dispersión es la que menos información ofrece sobre el
comportamiento de los datos alrededor de los valores centrales.
El recorrido tiene el inconveniente de que sólo toma en cuenta los valores extremos.
Así, por ejemplo, el recorrido de los datos 1, 20, 21, 22, 23, 50, es el mismo que el de 1,
2, 3, 4, 50. En ambos casos, R = 50 - 1 = 49.
El recorrido, como la media, no siempre ayuda a distinguir entre dos series diferentes.
Por ejemplo, las series 1, 2, 9, 9, 9, 9; y 5, 5, 5, 5, 6, 13, siendo distintas, tienen el
mismo recorrido y la misma media, R = 8 y = 6,5
DESVIACIÓN MEDIA
Se define la desviación media, D.M., como la media aritmética de las desviaciones, en
valor absoluto, de los datos respecto a la media:
Si los datos tienen frecuencia absoluta n
j ≥ 1, la desviación media será:
Como la suma de todas las desviaciones de los datos de una serie es cero (Σd
= 0);
para evitar que unas desviaciones se neutralicen con otras, se toma su valor absoluto.
La desviación media proporciona información acerca del grado de separación de los
datos respecto de su media.http://sapiens.ya.com/trescomacatorce
Estadística - Medidas de Centratilazión
DESVIACIÓN MEDIANA
Del mismo modo que la desviación media da una medida de la distancia que hay entre
los datos y su media, se puede hablar de desviación mediana como la medida que
indica la distancia entre los datos y su mediana.

La desviación mediana se designa por D.Me.
VARIANZA
La varianza de una serie es la media aritmética de los cuadrados de las desviaciones
de los datos respecto de su media. Se designa por σ
Al elevar las desviaciones al cuadrado se evita, como en la desviación media, el
resultado nulo de la suma de todas las desviaciones de los datos respecto a la media x
PARAMETROS PARA DATOS AGRUPADOS
En el estudio de las distribuciones de datos, la estadistica selecciona un conjunto de los mismos

de forma que sean representativos de todos los de la distribucion.
 Estos datos seleccionados se denominan caracteristicas de la distribucion o parametros

estadisticos.
Distribución de frecuencias es como se denomina en estadística a la agrupación de datos en categorías

mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto significa una de las
cosas más importantes de la matemática, su estadística con la agrupación de datos. La distribución de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada
clase.
TÉCNICAS PARA AGRUPAR DATOS EN CLASES ESTADISTICAS
Cuando los datos a analizar son grandes es usual probar algún tipo de agrupación, a fin de comprender
mejor la forma que tienen estos.
No importa si se trata de datos repetidos o no, para agruparlos se divide el rango en segmentos, y luego se
cuenta la cantidad de valores que se encuentra en cada segmento
Los segmentos se denominan clases, y se especifican señalando el límite inferior (Li) y el límite superior (Ls)
de cada clase.
El número de clases se denota por k
El ancho de clases se denota por h y se calcula mediante Ls - Li
La marca de clase se denota mi y se calcula como el promedio de los límites de la clase, es decir (Ls + Li)/2
Existen múltiples procedimientos para agrupar datos. Uno de los más comunes es:
• Calcular el rango de los datos
• Calcular el número de clases

• Calcular el ancho de clases
• Construir los segmentos
• Calcular las frecuencias
• Presentar una tabla resumen

Unidad Iii

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad Iii

Cargado por

Copyright:

Formatos disponibles

UNIDAD III

3.1 CONCEPTOS BASICOS DE ESTADISTICA

ESTADISTICA:La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya

10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10,

17, 10, 16, 14, 8, 18

inspección y los experimentos, se denominan teoría descriptiva de decisión; los estudios de la

teoría de juegos, aunque en la teoría de decisión el ‘adversario’ es la realidad en vez de otro

otras soluciones que se acomoden a lo deseado.

este, para que no surjan equivocaciones al empezar la partida.

no se vaya a dar en falso, porque si se conoce de esta no hay el porque de equivocarse.

Elconcepto depobl ación en estadística va más allá de lo que comúnmente se

"Una población es un conjunto de todos los elementos que estamos estudiando,

"Una población es un conjunto de elementos que presentan unacaracterística

común". Cadenas (1974).

Los miembros del Colegio de Ingenieros delEst ado Cojedes.

El tamaño que tiene una población es un factor de suma importancia en el

procesode investigación estadística, y este tamaño vienen dado por el número

de la población tenga la misma probabilidad de selección y que las unidades diferentes

otros y con la misma probabilidad.

diferentes se seleccionen independientemente.

DATOS AGRUPADOS Y NO AGRUPADOS

Distribución de frecuencia para datos no Agrupados:

Distribución de frecuencia de clase o de datos Agrupados:

Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran

La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio

Se representa por fi.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor y en la

La frecuencia relativa es el cociente entre la frecuencia

 ¿QUÉ SON LOS LIMITES INFERIORES Y SUPERIORES?

La media aritmética es un promedio estándar que a menudo se denomina "promedio".

La media se confunde a veces con la mediana o moda. La media aritmética es el promedio de un conjunto de

[editar]Media aritmética ponderada

media ponderada relativa a esos pesos como:

Artículo principal: Moda (estadística)

de la variable, se recurre a la interpolación.

que más se repite es 5, entonces la moda es 5.

modal. El intervalo modal es el de mayor frecuencia absoluta.

forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

anterior y posterior, respectivamente, al

Artículo principal: Mediana (estadística)

los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:

ejemplo, en el caso de doce datos como los anteriores:

Se toma como mediana

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una

El recorrido es la diferencia entre los valores mayor y menor de la variable; se

Cuando los datos están agrupados en intervalos, el recorrido es la diferencia entre la

inferior del primero.

Esta medida de dispersión es la que menos información ofrece sobre el

comportamiento de los datos alrededor de los valores centrales.

2, 3, 4, 50. En ambos casos, R = 50 - 1 = 49.

Por ejemplo, las series 1, 2, 9, 9, 9, 9; y 5, 5, 5, 5, 6, 13, siendo distintas, tienen el

mismo recorrido y la misma media, R = 8 y = 6,5

Se define la desviación media, D.M., como la media aritmética de las desviaciones, en

valor absoluto, de los datos respecto a la media:

Si los datos tienen frecuencia absoluta n

j ≥ 1, la desviación media será:

La desviación media proporciona información acerca del grado de separación de los

datos respecto de su media.http://sapiens.ya.com/trescomacatorce

Estadística - Medidas de Centratilazión

indica la distancia entre los datos y su mediana.

La varianza de una serie es la media aritmética de los cuadrados de las desviaciones

de los datos respecto de su media. Se designa por σ