Está en la página 1de 19

INSTITUTO TECNOLOGICO SUPERIOR DE TEPOSCOLULA

INGENIERIA EN SISTEMAS COMPUTACIONALES

ASIGNATURA: PROBABILIDAD Y ESTADISTICA

CATEDRATICO: M.C. GRACIEL ANDRES ANTONIO

ALUMNO: LOPEZ LPEZ ARIEL JAHIR

SEMESTRE:

SEGUNDO

TRABAJO: APUNTES DE ESTADISTICA UNIDAD I

FECHA: MARZO 14, 2010.

UNIDAD I ESTADSTICA DESCRIPTIVA

1.1 CONCEPTOS BSICOS DE LA ESTADSTICA 1.1.1 DEFINICIN DE LA ESTADSTICA La estadstica es comnmente considerada como una coleccin de hechos expresados en trminos de una relacin sumisa, y que han sido recopilados a partir de otros datos numricos. La estadstica descriptiva es una parte de la estadstica que se dedica a analizar y representar los datos. El concepto de poblacin en estadstica va mas all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. ESTADSTICA: Estudia los mtodos cientficos para recolectar, organizar, resumir y analizar datos, as como para sacar conclusiones validas y tomar decisiones razonables basadas en tal anlisis: (segn Murray Spiegel). ESTADSTICA: es la ciencia que trata de la recoleccin, clasificacin y representacin de los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los fenmenos (Yalen y Readel). 1.1.2 INFERENCIA ESTADSTICA Se basa en las conclusiones a las que se llega por la ciencia experimental basndose en la informacin incompleta (las partes de la poblacin). Es una parte de la estadstica que permite generar modelos probabilsticos a partir de un conjunto de observaciones. Modelo probabilstico: Es una aproximacin al resultado. Modelo Matemtico: Se obtiene con exactitud el resultado. Del conjunto de observaciones se van a analizar, elegir aleatoriamente solo unas cuantas que es lo que se le domina muestra, y a partir de dicha muestra se estima los parmetros del modelo, y se contrastan las hiptesis establecidas.

La utilidad de la inferencia estadstica consiste en que si el modelo se considera adecuado puede usarse para la toma de decisiones o para la realizacin de prevenciones convenientes. Se utilizan variables aleatorias que son (determinadas al azar) variables obtenidos por el azar.

1.1.3 TEORIA DE DECISIN Analizar comparar las acciones o posibles resultados de un conjunto para decidir el mejor resultado. Es un rea interdisciplinaria de estudio relacionada con casi todos los participantes en ramas de la ciencia, ingeniera principalmente la psicologa del consumidor (basados en perspectivas cognitivo conductuales). Concierne a la forma y al estudio del comportamiento y fenmenos psquicos de aquellas que toman las decisiones, as como las condiciones por las que deben ser tomadas las decisiones ptimas. 1.1.4 POBLACION Es un conjunto de todos los elementos para su estudio, de la cual se intenta sacar conclusiones (Levin & Rubin). Es un conjunto de elementos que representan una caracterstica en comn. (CARDENAS). Es el conjunto total de individuos, objetos o medidas que poseen algunas caractersticas comunes observables en un lugar y en un momento determinado. Cuando se vaya a llevar a cabo alguna investigacin debe de tenerse en cuenta algunas caractersticas esenciales al seleccionarse la poblacin bajo estudio.

1.1.5 MUESTRA ALEATORIA Es una muestra sacada de poblacin de unidades de manera que todo el elemento de la poblacin tenga la misma probabilidad de seleccin y que las unidades diferentes se seleccionen independientemente.

Muestra aleatoria: Muestra elegida independientemente de todas las dems, con la misma probabilidad que cualquier otra y cuyos elementos estn elegidos independientemente unos de otros y con la misma probabilidad. 1.1.6 PARAMETRO (VARIABLE) ALEATORIO Se llama variable aleatorio aquella que toma diversos valores o conjuntos de valores con distintas probabilidades. Existen 2 caractersticas importantes de una variable aleatoria, sus valores y las probabilidades asociadas a esos valores. Una tabla, grafico o expresin matemtica que d las probabilidades con que una variable aleatoria toma diferente valores, se llama distribucin de la variable aleatoria. Como vivos anteriormente, la inferencia estadstica se relaciona con las conclusiones que pueden sacar acerca de una poblacin de observacin basndose en una muestra de observaciones. Entonces intervienen las probabilidades en el proceso de la seleccin de la muestra; en este caso se desea saber algo sobre una distribucin con base en una muestra aleatoria de esa distribucin. 1.1.7 ENFOQUE CLASICO En el enfoque clsico los primeros gerentes y autores sobre administracin buscaban el mejor camino, una serie de principios para crear una estructura organizacional que funcionara bien en todas las situaciones. Max Weber, Frederick Taylor y Henri Fayol fueron los principales contribuyentes al llamado enfoque clsico para disear organizaciones. Ellos pensaban que las

organizaciones ms eficientes y eficaces tenan una estructura jerrquica en la cual los miembros de la organizacin y por una serie de regla y reglamentos racionales. Segn Weber, cuando estas organizaciones se haban desarrollado plenamente, se caracterizaban por la especializacin de tareas, los

nombramientos por mritos, la oferta de oportunidades para que sus miembros hicieran carrara, la rutinizacion de actividades y un clima impersonal y racional en la organizacin, Weber lo llamo burocracia.

1.1.8 ENFOQUE BAYESIANO En el enfoque Bayesiano de la Estadstica, la incertidumbre presente en un modelo dado, es representada a travs de una distribucin de probabilidad sobre los posibles valores del parmetro desconocido (tpicamente multidimensional) que define al modelo. El teorema de Bayes, permite entonces incorporar la informacin contenida en un conjunto de datos, produciendo una descripcin conjunta de la incertidumbre sobre los valores de los parmetros del modelo a travs de la distribucin final. Desafortunadamente, la implementacin de las tcnicas Bayesianas

usualmente requiere de un esfuerzo computacional muy alto. La mayor parte de este esfuerzo se concentra en el clculo de ciertas caractersticas de la distribucin final del parmetro de inters (que llamaremos resmenes diferenciales). As, por ejemplo, para pasar de una distribucin conjunta a una coleccin de distribuciones y momentos marginales que sean tiles para hacer inferencias sobre subconjuntos de parmetros, se requiere integrar. En la mayora de los casos los resmenes inferencia les bsicos se reducen a integrales de la forma donde. As, por ejemplo, donde denota a la funcin indicadora del conjunto y denota a la distribucin predictiva de una observacin futura. En la prctica es comn que la dimensin de sea muy grande. Por otro lado, excepto en aplicaciones muy sencillas tanto como pueden llegar a tener formas muy complicadas. En la gran mayora de los problemas las integrales requeridas no pueden resolverse analticamente, por lo que es necesario contar con mtodos numricos eficientes que permitan calcular o aproximar integrales en varias dimensiones. 1.2 DESCRIPCION DE DATOS Al escoger datos relativos a las caractersticas de un grupo de individuos u objetos, sean alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una fbrica. La estadstica descriptiva es una parte de la estadstica que se dedicta a analizar y representar los datos. Esta anlisis es muy bsico, pero fundamental en

todo estudio. Otras ramas de la estadstica se centran en el contraste de hiptesis y su generalizacin a la poblacin. Algunos de las tcnicas empleadas en este primer anlisis de los datos se enumeran ms abajo en el listado de conceptos bsicos. 1.2.1 DATOS AGRUPADOS Y NO AGRUPADOS Cuando la muestra que se ha tomado de la poblacin o proceso que se desean utilizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellas y a esto es lo que llamamos tratamiento de datos no agrupados. Se refiere al hecho de que estn ordenados clasificados y contados los datos (Agrupados). 1.2.2 FRECUENCIA DE CLASE La frecuencia de clase se le domina frecuencia absoluta y se le designa con las letras fi. Es el nmero total de valores de las variables que se encuentran presente en una clase determinada de una distribucin de frecuencia de clase. La frecuencia absoluta es el nmero de veces que aparecen un determinado valor en un estudio estadstico. Frecuencia absoluta: Es el nmero de veces que aparece un determinado valor en un estudio estadstico. Ejemplo: Clase: Tipo de datos que comparten caractersticas semejantes. Clase: Conjunto de datos que pertenecen al mismo grupo o categora. Frecuencia de clase: Permite resumir grandes cantidades de datos o clases o categoras y determina el nmero de individuos (Datos) que pertenecen a la clase llamada frecuencia de clase. 1.2.3 FRECUENCIA RELATIVA Es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. La frecuencia relativa se puede expresar en tantos por cientos y se representa por ni.

Durante el mes de julio en una ciudad se han registrado las siguientes temperaturas mximas: 32,31,28,29,32,32,31,30,31,31,27,28,29,30,32,31,31,30,30,29,29,30,30,31,30,31,3 0,31,34,33,33,29,29. Xi 27 28 29 30 31 32 33 34 fi 1 2 6 7 8 3 3 1 Ni 0.032 0.065 0.144 0.226 0.258 0.047 0.072 0.082

Frecuencia: Numero de elementos comprendidos dentro de un intervalo en una distribucin determinada. La suma de la frecuencia relativa=1 Fr=Fa/N Resulta dividir cada una de las clases de una distribucin de frecuencias de clase entre el nmero total de datos. Ni % = (Fa / N) 100 Se multiplica por 100 se obtiene la Fr porcentual.

DISTRIBUCION DE FRECUENCIA Tabular los datos por clases junto con las correspondientes frecuencias de clases. Clases Infantil Jvenes Adulto Intervalo 0-10 11-20 21-54 EJEMPLO Fa 1 6 33 Fr 0.025 0.15 0.825 ni% 2.5% 15% 82.5%

1.2.4 PUNTO MEDIO El punto medio es el punto que divide a un segmento en dos partes iguales. SEGMENTO: Porcin o parte cortada o separada de una cosa, de un elemento geomtrico o de un todo. El punto medio de un segmento, es nico y equidista de los extremos del segmento. Cumpliendo esta ltima condicin, pertenece a la mediatriz del segmento. La frmula para determinar el punto medio de un segmento en el plano, con coordenadas: (x1, y1) y (x2, y2) es: [(x1+x2)/2] + [(y1+y2)/2] 1.2.5 LIMITES Es un intervalo cerrado de un lmite inferior y un lmite superior de una clase. 1.2.6 HISTOGRAMAS Es la representacin grfica de valores de un estudio estadstico. 1.2.7 HISTOGRAMAS DE FRECUENCIA RELATIVA Consisten en un conjunto de rectngulos con: A) Bases en el eje x horizontal, centro en la marca de clase (punto medio). Clase A 10-18 (10+18) / 2= 14 centro de la marca de clase.

Longitudes iguales a los tamaos de los intervalos de clase. B) reas proporcionales a las frecuencias de clases.

La tabla siguiente muestra una distribucin de frecuencia de los salarios semanales de 65 empleados de la empresa P & R. Determinar de esta tabla: A) Lmite inferior de la sexta Clase. B) Lmite superior de la cuarta Clase. C) La marca de clase (punto medio) de la tercera clase. D) Las fronteras de clase del quinto intervalo. E) La anchura del quinto intervalo de la clase. F) La frecuencia de la tercera clase. G) La frecuencia relativa de la tercera clase. H) El intervalo de la clase con mxima frecuencia que se llama intervalo de la clase moda. Su frecuencia es la frecuencia de la clase mundial. I) El porcentaje de empleados que cobran menos de 280.00 a la semana. J) El porcentaje de empleados que cobran menos de $300.00 pero al menos $260.00 por semana.
SALARIO $250.00-$259.99 EMPLEADOS

$260.00-$269.99

10

$270.00-$279.99

16

$280.00-$289.99

14

$290.00-$299.99

10

$300.00-$309.99

$310.00-$319.99

2 65

TOTAL

SOLUCION: a) $300.00 b) $289.99 c) 274.995 = 270 + 279.99 / 2= 285 d) 289.995 = 290 + 289.99 / 2 y 300+299.99 / 2=299.995 e) 270 279.99 = -9.99 =10 f) 16 g) 0.246 h) 270.00 279.99 i) 52.3% j) 76.92%

1.3 METODOS DE TENDENCIA CENTRAL Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que para tal fin suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetros de tendencia central. Cuando se hace referencia nicamente a la posicin de stos parmetros dentro de la distribucin independiente de que sta est menos centrada, se habla de estas medidas como medidas de posicin. 1.3.1 MEDIDA ARITMETICA, GEOMETRICA Y PONDERADA La media aritmtica es el valor obtenido sumando todas las observaciones y dividiendo el total por el numero de observaciones que hay en el grupo. La medida resume en un valor las caractersticas de una variable teniendo en cuenta todos los casos. Solamente puede utilizarse con variables cuantitativos. La media aritmtica es probablemente uno de los parmetros estadsticos mas extendidos, se le llama tambin Promedio o simplemente Media. Media aritmtica: Es un valor tpico o representativo de un conjunto de datos tales valores suelen situarse hacia el centro del conjunto de datos ordenados por magnitud, los promedios se conocen como medidas de tendencia central.

Se definen varios tipos siendo la ms comn media aritmtica, geomtrica, ponderada. Media aritmtica de un conjunto de n nmeros X1, X2.X3,, Xn se denota se define por: = Media geomtrica: La media geomtrica G de un conjunto de X nmeros positivos es la raz ensima de esos nmeros. Ejemplo: La media aritmtica se denota por: G= Por ejemplo: La media aritmtica de 2, 4, 8 es: G= ( )( )( ) = 4 Media ponderada: Se asocia con los nmeros X1, X2,.., Xn ciertos factores de peso dependientes de la relevancia asignadas a cada nmero.

=
Ejercicio: Si el examen final del curso vale ms, cuenta tres veces ms que una evaluacin parcial, y un estudiante tiene una calificacin final de 85, 70 y 90 en las dos parciales, la media ponderada es: _85 _70 _85 _1=85 _2=140 _3=270

1.3.2 DESVIACION ESTANDAR La desviacin estndar ( ) es una medida de centralizacin o dispersin para

variables de razn y de intervalos, de gran utilidad en la estadstica descriptiva. Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin tpica es una medida que informa de la media de distintas que tiene los datos respecto de su media aritmtica expresada en la misma unidad que la variable. Es la raz cuadrada de la varianza. Es una medida importante de la desviacin de los datos.

Poblacional: ( )

Ejercicio: Juan vende 5 plizas de seguros cuyas respectivas precios son de: $110.00, $145.00, $125.00, $95.00, $150.00 Calcula la media, la varianza y las desviaciones. Solucin: Media=$125.00 1.3.3 MODA La moda es el dato ms repetido, el valor de la variable con mayor frecuencia absoluta. Su clculo es extremadamente sencillo pues solo se necesita un recuento. Es un conjunto de nmeros es el valor que ocurre con mas frecuencia; es decir el valor ms frecuente. La moda no puede existir incluso ser nica en caso de existir. Ejercicio: El nmero de personas en distintas vehculos en una carretera son: 5,7,4,6,9,5,,6,1,5,3,7. El nmero que ms se repite es el 5, entonces la moda es 5. Moda para datos agrupados: = Lmo + [ Lmo=Es el lmite inferior de la clase modal. Da=Es la diferencia entre la frecuencia de la clase modal y la clase que la antecede. Db=Es la diferencia entre la frecuencia de la clase modal y la clase que le sigue C =Es el intervalo de la clase modal. ] (C) Varianza=430 Desviacin=20.73

1.4 MEDIDAS DE DISPERSION Una descripcin ms completa del conjunto de datos puede obtenerse si se miden que tan dispersos estn los datos alrededor del dicho punto central. Indica cuando se desviaran las observaciones alrededor de su medio. Entre estos estn la varianza.

1.4.1 VARIANSA Es el promedio de las desviaciones respecto a si medida elevado al cuadrado. Esto significa que se encuentre la que se encuentra la cantidad por la cual cada observacin se desva de la media, se elevan al cuadrado tales observaciones y se halla la media de tablas desviaciones elevadas al cuadrado. Varianza: Es el promedio de las observaciones respecto a su media elevada al cuadrada. Varianza de la muestra: ( )

Varianza poblacional: ( )

1.4.2 MEDIANA Es llamada algunas veces media posicional, porque queda exactamente a la mitad del conjunto de datos despus de que las observaciones se han colocados en series ordenados. La mitad de las observaciones ser o encima de la mediana, la otra mitad estar por debajo de ella. Si el conjunto de datos tiene un nmero impar de observaciones, la posicin de la mediana es:

La mediana de datos agrupados =

( )

]( )

1.4.3 DESVIACION MEDIA Desviacin media o desviacin promedio de un conjunto de N nmeros (

) esta abreviado por:

|
DM=

Si los datos vienen agrupados en una tabla de frecuencias la expresin de la desviacin media es de:

|
DM=

Determinar la desviacin media de los siguientes nmeros: 9,3,8,8,9,8,9,10 Media= (

1.4.5 RANGO La medida de dispersin ms simple es el rango o recorrido. El rango es simplemente la diferencia entre las observaciones ms altas y ms baja. Su ventaja es que es fcil de calcular y su desventaja es que considera dos de los ciertos de observaciones que hay en un conjunto de datos de las observaciones se ignora. Ejemplo: 2,3,3,5,5,5,8,10,12 12 2 = 10 rango del conjunto.

1.5 PARAMETROS PARA DATOS AGRUPADOS 1.5.1 LA MEDIA Formula:


( )( )

Para datos agrupados.

Para datos no agrupados.

Para datos agrupados. Ejemplo: ( )( ) ( )( ) ( )( ) ( )( )

( )( )

Clase 2 3 5 8 10 12

fi 1 2 3 1 1 1

2 6 5 8 10 12

1.5.2 LA DESVIACION TIPICA Tambin llamado desviacin estndar: Formula: s para datos agrupados.

Varianza=

1.6 DISTRIBUCION DE FRECUENCIA Son las frecuencias que tienen cada clase se le llama distancia numrica. 1.6.2 DISTRIBUCION CATEGORICA Si las distribuciones se hallan agrupadas por alguna cualidad o atributo denominaremos distribucin categrica se refiere en general a toda lista o tabla de datos estadsticos ordenados segn criterio. 1.6.3 DISTRIBUCION ACOMULADA Se usa para determinar cuntos o que porcin de valores es mayor que cierto valor una distribucin de frecuencia acumulada identifica el numero de incluidas al lmite extracto superior de cada clase de la distribucin las frecuencias acumuladas de una clase pueden sumando las frecuencias observada a esa clase a la frecuencia acumulada de esa clase anterior.

1.6.4 DISTRIBUCIN PORCENTUAL Formula:

F% A (frecuencia porcentual acumulada)


( )

1.7 TECNICAS DE AGRUPACION DE DATOS EL director del vuelo P&P requiere informacin respecto a la dispersin de N pasajeros las decisiones que se tomen respecto a la programacin depender de la puntuacin en el transporte de pasajeros es grande se puede necesitar aviones ms grande para evitar el sobrepaso en los das en los que el transporte de pasajeros es ms solicitados en P&P. F 3 7 18 12 8 2 PM 54.5 64.5 74,5 84,5 94.5 104.5 FA 3 10 28 40 48 50

50-59 60-69 70-79 80-89 90-99 100-109

2970.25 4160.25 5550.25 7140.25 8930.25 10920.25

Total

50

1.7.3 FRONTERA DECLASE Son los puntos medios entre lmites de clases adyacentes, los limites de una clase estarn siempre contenidos entre las fronteras de la misma clase y tendr mayor aproximacin que los datos y por lo tanto tambin que los limites. La distancia entre en la frontera inferior y el lmite inferior de una misma clave, al igual que la distancia entre el lmite superior de una misma clase, es igual a la media unidad de aproximacin. 1.7.4 MARCA DE CLASE Tomamos como MC el producto medio de cada intervalo entre dos.

1.7.5 INTTERVALO DE CLASE

Es cada uno de los grupos que formados de los valores de la variable. Tenemos que dividir el recorrido de la variable por el N. de grupos que queremos formar.

1.7.6 DIAGRAMAS DE TALLOS Y ARBOLES

Es una tcnica estadstica para representar un conjunto de datos cada valor numrico se divide en dos partes. El o los dgitos principales forman el tallo y los dgitos secundarios las hojas. Los tallos estn colocados a lo largo del eje vertical y las hojas de cada observacin a lo largo del viaje horizontal. 1.7.7 DIAGRAMA DE ARETO Es una grafica donde se organizan diversas clasificaciones de datos por orden descendientes, de izquierda a derecha por medio de barras sencillas despus de haber reunido los datos para calificar las causas. De modo que se puedan asignar un orden propiedades.

Es una comparacin cuantitativa y ordenada de elementos y/o factores segn su contribucin a un determinado factor. El objetivo es clasificar dichos elementos o factores en dos categoras: Los pocos vitales: Elementos muy importantes en su contribucin. Los muchos triviales: Elementos pocos importantes en ello-

1.7.8 DIAGRAMA DE PUNTOS Resulta de utilidad cuando el conjunto de datos es razonablemente pequeo o hay relativamente pocos datos distintos. Cada dado se representa con un punto encima de la correspondiente localizacin en una escala, horizontal de media. Sirven para representar grficamente tablas en las cuales se considera nicamente una variable y una cantidad asociada a cada valor de la misma.

Tipo de error E B C F D A H I G

Numero de % Numero Numero de % errores de error acumulada

44 39 35 12 8 3 3 2 0

30% 27% 24% 8% 6% 2% 2% 1% 0%

30% 57% 81% 79% 85% 87% 94% 100% 0%

1.8 HISTOGRAMAS Es una representacin grafica de una tabla de frecuencias; ste muestra datos cuantitativos. Los intervalos de clase pueden ser o no ser iguales, estn marcadas sobre el eje horizontal. La frecuencia o frecuencias relativamente son marcadas sobre el eje vertical. 1.8.1 DIAGRAMAS DE BARRAS Es una representacin grafica de una tabla de frecuencias para datos cualitativos. Uno de los ejes de la grafica, representa frecuencia o frecuencias relativas. Las diversas clases de datos son asignados sobre el otro de los ejes. 1.8.2 POLIGONO DE FRECUENCIA Es una forma geomtrica obtenida de segmentos de recta que unen los puntos medios de intervalos de clase adyacentes en un histograma.

1.8.3 POLIGONO DE OJIVA Es una grafica similar al polgono de frecuencia es la Ojiva, pero sta se obtiene de aplicar parcialmente la misma tcnica a una distribucin acumulativa y de igual manera que stas existen las ojivas mayores que y las ojivas menores que. 1.8.4 GRAFICA CIRCULAR Denominamos tambin grafica del pastel o grafica del 100%, se utilizan para muestras porcentajes y proporciones. 1.9 DISTRIBUCION MUESTRAL Consiste en un conjunto de rectngulos: A) Bases en eje x horizontal; entre en las marcas de doble y longitudes iguales a los tamaos de los intervalos de clase.} B) reas proporcionales a las frecuencias de clase. Si los intervalos de clase tienen la misma anchura los a de los rectngulos son procedimientos a las frecuencias de clase y entonces es costumbre firmar altura a las frecuencias de clase.

También podría gustarte