Está en la página 1de 13

UNIDAD III

3.1 CONCEPTOS BASICOS DE ESTADISTICA

ESTADISTICA:La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya


sea para ayudar en la resolución de la toma de decisiones o para explicar condiciones regulares o irregulares
de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria ocondicional. Sin embargo estadística
es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la
investigación científica.

Ejemplo: S e t i e n e e l s i g u i e n t e c o n j u n t o d e 2 6 d a t o s :

10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10,

17, 10, 16, 14, 8, 18

Obtener su mediana y moda.

TEORIA DE DECISION:

Estudio formal sobre la toma de decisiones. Los estudios de casos reales, que se sirven de la

inspección y los experimentos, se denominan teoría descriptiva de decisión; los estudios de la

toma de decisiones racionales, que utilizan la lógica y la estadística, se llaman teoría preceptiva

de decisión. Estos estudios se hacen más complicados cuando hay más de un individuo, cuando

los resultados de diversas opciones no se conocen con exactitud y cuando las probabilidades de

los distintos resultados son desconocidas. La teoría de decisión comparte características con la

teoría de juegos, aunque en la teoría de decisión el ‘adversario’ es la realidad en vez de otro

jugador o jugadores.

Al hacer un análisis sobre esta teoría, y mirándola desde el punto de vista de un sistema, se

puede decir que al tomar una decisión sobre un problema en particular, se debe tener en cuenta

los puntos de dificultad que lo componen, para así empezar a estudiarlos uno a uno hasta

obtener una solución que sea acorde a lo que se esta esperando obtener de este, y sino, buscar

otras soluciones que se acomoden a lo deseado.


La teoría de decisión, no solamente se puede ver desde el punto de vista de un sistema, sino en

general, porque esta se utiliza a menudo para tomar decisiones de la vida cotidiana, ya que

muchas personas piensan que la vida es como una de las teorías; La teoría del juego, que para

poder empezarlo y entenderlo hay que saber jugarlo y para eso se deben conocer las reglas de

este, para que no surjan equivocaciones al empezar la partida.

Se puede decir que la Teoría de decisión es una de las ramas que sirve para que al dar un paso,

no se vaya a dar en falso, porque si se conoce de esta no hay el porque de equivocarse.


Ejemplo:

POBLACION:

Elconcepto depobl ación en estadística va más allá de lo que comúnmente se


conoce como tal. Una población se precisa como un conjunto finito o infinito de
personas u objetos que presentancaracterísticas comunes.

"Una población es un conjunto de todos los elementos que estamos estudiando,

acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).

"Una población es un conjunto de elementos que presentan unacaracterística

común". Cadenas (1974).

Ejemplo:

Los miembros del Colegio de Ingenieros delEst ado Cojedes.

El tamaño que tiene una población es un factor de suma importancia en el

procesode investigación estadística, y este tamaño vienen dado por el número


de elementos que constituyen la población, según el número de elementos la
población puede ser finita o infinita. Cuando el número de elementos que
integra la población es muy grande, se puede considerar a esta como una
población infinita, por ejemplo; el conjunto de todos los números positivos. Una
población finita es aquella que está formada por un limitado número de

MUESTRA ALEATORIA:

Es una muestra sacada de una población de unidades, de manera que todo elemento

de la población tenga la misma probabilidad de selección y que las unidades diferentes

se seleccionen independientemente.

Muestra aleatoria: muestra elegida independientemente de todas las demás, con la misma

probabilidad que cualquier otra y cuyos elementos están elegidos independientemente unos de

otros y con la misma probabilidad.

Muestra aleatoria

Una muestra aleatoria es una muestra sacada de una población de unidades, de manera que

todo elemento de la población tenga la misma probabilidad de selección y que las unidades

diferentes se seleccionen independientemente.


PARAMETROS ALEATORIOS
Parámetros y estadísticos. Existen medidas para realizar descripciones cuantitativas de los
conjuntos de datos, o poblaciones, y de sus muestras, diferenciándose entre ellas las que se
refieren a las mismas poblaciones y a las muestras.

Para el caso de las poblaciones, las medidas que las describen se denominan parámetros, y
suelen estar representadas con letras griegas (por ejemplo Y Por otro lado, para el caso de
aquellas medidas que describen a una muestra se les llama estadísticos o estimadores, y son
representados por letras de nuestro alfabeto (por ejemplo, x o s).

Parámetro: Una parámetro es una medida usada para describir alguna característica de una
población, tal como una media aritmética, una mediana o una desviación estándar de una
población. Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso de
estimación en inferencia estadística puede ser descrito como le proceso de estimar un parámetro
a partir del estadístico correspondiente, tal como usar una media muestral (un estadístico para
estimar la media de la población (un parámetro). Los símbolos usados para representar los
estadísticos y los parámetros, en éste y los siguientes capítulos, son resumidos en la tabla
siguiente:

DESCRIPCION DE DATOS:

DATOS AGRUPADOS Y NO AGRUPADOS

Distribución de frecuencia para datos no Agrupados:


Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde
el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al
tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia
identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los
valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus
respectivas frecuencias.

Distribución de frecuencia de clase o de datos Agrupados:

Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran


ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios
valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen
normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no
agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior
50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizará  la
distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución
cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la
ojiva.

La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor


comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los
mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que
la información obtenida de una investigación sea manejable con mayor facilidad.

FRECUENCIA DE CLASE

La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el
número total de valores de las variables que se encuentran presente en una clase determinada,
de una distribución de frecuencia de clase.

Frecuencia absoluta

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio


estadístico.

Se representa por fi.

La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

igualdad

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se
lee suma o sumatoria.
igualdad Ejemplo

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31,
30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor y en la


segunda anotamos la frecuencia absoluta. xi fi
xi fi
27 1
29 6
30 7
31 8
32 3
33 3
34 1
suma 31

FRECUENCIA RELATIVA

La frecuencia relativa  es el cociente entre la frecuencia

a b s o l u t a   d e u n d e t e r m i n a d o v a l o r y e l   n ú m e r o to t a l d e d a t o s .

L a   f r e c u e n c i a r e l a t i v a   s e p u e d e e x p r e s a r e n t a n t o s po r c i e n t o y

s e r e p r e s e n t a po r   n i .

L a   s u m a   de l a s   f r e c u e n ci a s r e l a t i v a s   e s i g u a l a   1 .

Ejemplo

D u r a n t e e l m e s de j u l i o , e n un a c i u d a d s e h a n r e g i s t r a d o l a s

s i g u i e n t e s t e m pe r a t u r a s m á x i m a s :
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31,

30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

PUNTO MEDIO

LIMITES

 ¿QUÉ SON LOS LIMITES INFERIORES Y SUPERIORES?

Los límites inferiores y superiores son los valores mínimo y máximo de una distribución. V.g: En un curso de
50 alumnos, se le pidió a un profesor que pesará a todos, los datos obtenidos son los siguientes:

LIMITE SUPERIOR: 98

LIMITE INFERIOR: 38
3.3 MEDIDAS DE TENDECIA CENTRAL

Media aritmética
Artículo principal:  Media aritmética

La media aritmética es un promedio estándar que a menudo se denomina "promedio".

La media se confunde a veces con la mediana o moda. La media aritmética es el promedio de un conjunto de

valores, o su distribución; sin embargo, para las distribuciones con sesgo, la media no es necesariamente el

mismo valor que la mediana o que la moda. La media o moda son elementos intuitivos de medir los datos. Es

a veces una forma de medir el sesgo de una distribución tal y como se puede hacer en las

distribuciones exponencial y de Poisson.

Por ejemplo, la media aritmética de 34, 27, 45, 55, 22, 34 (seis valores)

es 

[editar]Media aritmética ponderada


Artículo principal:  Media ponderada

A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado
estudio. En esos casos se puede utilizar una media ponderada. Si X1,X2,...,Xn es un conjunto de datos o media

muestral y w1,w2,...,wn son números reales positivos, llamados "pesos" o factores de ponderación, se define la

media ponderada relativa a esos pesos como:

La media es invariante frente a transformaciones lineales, cambio de origen y escala, de las variables, es decir

si X es una variable aleatoria e Y es otra variable aleatoria que depende linealmente de X, es decir, Y = a·X +

b (donde a representa la magnitud del cambio de escala y bla del cambio de origen) se tiene que:

[editar]Media geométrica
Artículo principal:  Media geométrica

La media geométrica es un promedio muy útil en conjuntos de números que son interpretados en orden de su

producto, no de su suma (tal y como ocurre con la media aritmética). Por ejemplo, las velocidades de

crecimiento.
Por ejemplo, la media geométrica de la serie de números 34, 27, 45, 55, 22, 34 (seis valores)

es 

Moda

Artículo principal:  Moda (estadística)

La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta.5 En cierto sentido la

definición matemática corresponde con la locución "estar de moda", esto es, ser lo que más se lleva.

Su cálculo es extremadamente sencillo, pues sólo necesita un recuento. En variables continuas, expresadas

en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto

de la variable, se recurre a la interpolación.

Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-6-9-5-6-1-5-3-7. El número

que más se repite es 5, entonces la moda es 5.

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos

que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos se encuentran tres o

más modas, entonces es multimodal. Por último, si todas las variables tienen la misma frecuencia diremos que

no hay moda.

Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo

modal. El intervalo modal es el de mayor frecuencia absoluta.

La moda, cuando los datos están agrupados, es un punto que divide el intervalo modal en dos partes de la

forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo ni la frecuencia absoluta del intervalo modal y ni − 1 y ni + 1 las frecuencias absolutas de los intervalos

anterior y posterior, respectivamente, al

Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente

tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 8 9 3 4 2
Mediana

Artículo principal:  Mediana (estadística)

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que éstos

están ordenados de menor a mayor.7 Por ejemplo, la mediana del número de hijos de un conjunto de trece

familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados

los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:

En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo

que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por

ejemplo, en el caso de doce datos como los anteriores:

Se toma como mediana 

Existen métodos de cálculo más rápidos para datos más númerosos (véase el artículo

principal dedicado a este parámetro). Del mismo modo, para valores agrupados en intervalos, se

halla el "intervalo mediano" y, dentro de éste, se obtiene un valor concreto por interpolación

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una

distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy

alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más

homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las

desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es

siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las

desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado

(Varianza).
RECORRIDO O RANGO

El recorrido es la diferencia entre los valores mayor y menor de la variable; se

representa por R.

Cuando los datos están agrupados en intervalos, el recorrido es la diferencia entre la


marca de clase del último intervalo y la marca de clase del primero; aunque en

ocasiones se calcula como el extremo superior del último intervalo menos el extremo

inferior del primero.

Esta medida de dispersión es la que menos información ofrece sobre el

comportamiento de los datos alrededor de los valores centrales.

El recorrido tiene el inconveniente de que sólo toma en cuenta los valores extremos.

Así, por ejemplo, el recorrido de los datos 1, 20, 21, 22, 23, 50, es el mismo que el de 1,

2, 3, 4, 50. En ambos casos, R = 50 - 1 = 49.

El recorrido, como la media, no siempre ayuda a distinguir entre dos series diferentes.

Por ejemplo, las series 1, 2, 9, 9, 9, 9; y 5, 5, 5, 5, 6, 13, siendo distintas, tienen el

mismo recorrido y la misma media, R = 8 y = 6,5

DESVIACIÓN MEDIA

Se define la desviación media, D.M., como la media aritmética de las desviaciones, en

valor absoluto, de los datos respecto a la media:

Si los datos tienen frecuencia absoluta n

j ≥ 1, la desviación media será:

Como la suma de todas las desviaciones de los datos de una serie es cero (Σd

= 0);

para evitar que unas desviaciones se neutralicen con otras, se toma su valor absoluto.

La desviación media proporciona información acerca del grado de separación de los

datos respecto de su media.http://sapiens.ya.com/trescomacatorce

Estadística - Medidas de Centratilazión

DESVIACIÓN MEDIANA

Del mismo modo que la desviación media da una medida de la distancia que hay entre

los datos y su media, se puede hablar de desviación mediana como la medida que

indica la distancia entre los datos y su mediana.


La desviación mediana se designa por D.Me.

VARIANZA

La varianza de una serie es la media aritmética de los cuadrados de las desviaciones

de los datos respecto de su media. Se designa por σ

Al elevar las desviaciones al cuadrado se evita, como en la desviación media, el

resultado nulo de la suma de todas las desviaciones de los datos respecto a la media x

PARAMETROS PARA DATOS AGRUPADOS

En el estudio de las distribuciones de datos, la estadistica selecciona un conjunto de los mismos


de forma que sean representativos de todos los de la distribucion.

 Estos datos seleccionados se denominan caracteristicas de la distribucion o parametros


estadisticos.

Distribución de frecuencias es como se denomina en estadística a la agrupación de datos en categorías


mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto significa una de las
cosas más importantes de la matemática, su estadística con la agrupación de datos. La distribución de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada
clase.

TÉCNICAS PARA AGRUPAR DATOS EN CLASES ESTADISTICAS

Cuando los datos a analizar son grandes es usual probar algún tipo de agrupación, a fin de comprender

mejor la forma que tienen estos.

No importa si se trata de datos repetidos o no, para agruparlos se divide el rango en segmentos, y luego se

cuenta la cantidad de valores que se encuentra en cada segmento

Los segmentos se denominan clases, y se especifican señalando el límite inferior (Li) y el límite superior (Ls)

de cada clase.

El número de clases se denota por k

El ancho de clases se denota por h y se calcula mediante Ls - Li

La marca de clase se denota mi y se calcula como el promedio de los límites de la clase, es decir (Ls + Li)/2

Existen múltiples procedimientos para agrupar datos. Uno de los más comunes es:

• Calcular el rango de los datos

• Calcular el número de clases


• Calcular el ancho de clases

• Construir los segmentos

• Calcular las frecuencias

• Presentar una tabla resumen

También podría gustarte