Está en la página 1de 13

PROBABILIDAD de un suceso es el número al que tiende la frecuencia relativa

asociada al suceso a medida que el número de veces que se realiza el experimento crece.

• Un experimento aleatorio se caracteriza porque repetido muchas veces y en
idénticas condiciones el cociente entre el número de veces que aparece un
resultado (suceso) y el número total de veces que se realiza el experimento
tiende a un número fijo. Esta propiedad es conocida como ley de los grandes
números, establecida por Jakob Bernouilli. Tiene el inconveniente de variar la
sucesión de las frecuencias relativas de unas series de realizaciones a otras, si
bien el valor al que se aproximan a medida que el número de realizaciones
aumenta se mantiene estable.

La frecuencia relativa del suceso A:

Propiedades de la frecuencia relativa:

1. 0 fr (A) 1 cualquiera que sea el suceso A.
2. fr( ) = fr(A) + fr(B) si = Ø.
3. fr(E) = 1 fr(Ø) = 0.

Esta definición presenta el inconveniente de tener que realizar el experimento un
gran número de veces y además siempre obtendremos un valor aproximado de la
probabilidad.

EXPERIMENTOS O FENÓMENOS ALEATORIOS son los que pueden dar lugar a
varios resultados, sin que pueda ser previsible enunciar con certeza cuál de éstos va a
ser observado en la realización del experimento.

Si dejamos caer una piedra o la lanzamos, y conocemos las condiciones iniciales de
altura, velocidad, etc., sabremos con seguridad dónde caerá, cuánto tiempo tardará, etc.
Es una experiencia determinista. Si echamos un dado sobre una mesa, ignoramos qué
cara quedará arriba. El resultado depende del azar. Es una experiencia aleatoria.

Dicha tabla adopta la forma del diagrama de árbol del dibujo. P( A ) P( ) P( ) TOTAL P( A ) P( ) 1 En el caso de los sucesos A.TABLAS DE CONTINGENCIA Y DIAGRAMAS DE ÁRBOL. En los problemas de probabilidad y en especial en los de probabilidad condicionada. Sobre las ramas del diagrama de árbol se han anotado las probabilidades condicionadas correspondientes. B y . deducidas de las relaciones análogas a: . dado uno de ellos podemos construir el otro. expresados en frecuencias absolutas. relativas o probabilidades la tabla. resulta interesante y práctico organizar la información en una tabla de contingencia o en un diagrama de árbol. • Conversión de una tabla en diagrama de árbol Las tablas de contingencia están A TOTAL referidas a dos características que presentan cada una dos o más B P( A B ) P( B) P( B ) sucesos. adopta la forma adjunta. . que nos ayudará en la resolución del problema. los datos del problema permiten construir fácilmente uno de ellos y a partir de él podemos construir el otro. Unas veces. a cada uno de los sucesos A y se les ha asociado los sucesos B y . Las tablas de contingencia y los diagramas de árbol están íntimamente relacionados. En éste.

descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). desde la física hasta las ciencias sociales. La Estadística se divide en dos ramas: • La estadística descriptiva.ESTADÍSTICA La estadística es una ciencia con base matemática referente a la recolección. pronósticos de futuras observaciones. Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. La palabra estadísticas también se refiere al resultado de aplicar un algoritmo estadístico a un conjunto de datos. inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. series de tiempo y minería de datos. clusters. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. • La inferencia estadística. etc. que se dedica a la generación de los modelos. y es usada para la toma de decisiones en áreas de negocios e instituciones gubernamentales. análisis e interpretación de datos. estadísticas criminales. Hay también una disciplina llamada estadística matemática. Algunos ejemplos gráficos son: histograma. visualización y resumen de datos originados a partir de los fenómenos en estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis). Otras técnicas de modelamiento incluyen ANOVA. la cual se refiere a las bases teóricas de la materia. descripción. . etc. que se dedica a los métodos de recolección. que busca explicar condiciones regulares en fenómenos de tipo aleatorio. Es transversal a una amplia variedad de disciplinas. como en estadísticas económicas. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de descriptores numéricos son: la media y la desviación estándar. estimaciones de características numéricas (estimación). pirámide poblacional. desde las ciencias de la salud hasta el control de calidad.

que consiste en observar todos y cada uno de los elementos de la población. Ésto por diversas razones. esto ocurre cuando la observación de un elemento supone su destrucción. Llamamos tamaño de la población al número de elementos que la componen. en algunos casos. pues la producción entera desaparecería. es la única manera práctica de observar una población. pero por consideraciones teóricas interesa estudiar poblaciones infinitas. que viene siendo un subconjunto de los datos de la población. La inspección de una población por muestreo es rápida y barata. Para estudiar una población se puede usar: . La Estadística se interesa por el estudio de las poblaciones. POBLACIÓN Y MUESTRA. Estadística Aplicada a la Ingeniería Civil 10 . Ejemplos de poblaciones son: el colectivo de todos los consumidores de un determinado producto. Por ejemplo.Una muestra. o impráctico (y a la vez destructivo) obtener como datos el tiempo en el que se funden las bombillas producidas por una cierta marca realizando la medición de toda la producción. Llamamos tamaño de la muestra al número de elementos que la componen. si por el contrario es infinito. En la práctica las poblaciones son finitas. pero tal subconjunto tiene que contener datos que pueden servir para posteriores generalizaciones de las conclusiones. Por esta razón se considera un subconjunto del total de los casos. es el total hipotético de los datos que se estudian o recopilan.POBLACIÓN Y MUESTRA Algo importante que hay que mencionar es que no siempre se trabaja con todos los datos. el conjunto de tornillos fabricados en un día por una empresa. etc. Además. Si dicho número es finito. que pueden ser desde prácticas hasta por economía. Ante la imposibilidad ocasional de conseguir a la población.Un censo o encuesta exhaustiva. entonces. la población es finita. La población. por ejemplo cuando se intenta estudiar la resistencia de ciertos materiales. la población es infinita. sujetos u objetos que se estudian y que se les obtienen los datos. . entonces se recurre a la muestra. El estudio conduciría a la empresa a la ruina. Una población es el conjunto de todos los elementos que cumplen una o varias propiedades prefijadas. resultaría muy costoso obtener los datos de todos los seres humanos. que es un subconjunto de la población.

Una forma sería escribir los números desde el menor hasta el mayor y colocar encima de cada uno tantas cruces o cuadraditos como veces que figure repetido en la población. podemos imaginar los números pero no los tenemos realmente. que tenemos una cierta población de N = 500 datos. Estos números pueden estar en un gran listado o puede ser un conjunto hipotético. se divide el rango total en subintervalos y se cuenta el número de valores que cae dentro de cada subintervalo. En el caso anterior. Para ello seguimos los pasos siguientes: 1) Tomamos nota del valor máximo y el valor mínimo de la serie de datos que estamos considerando. . La representación gráfica que hemos visto se denomina Distribución de Frecuencias de la población. El número de veces que aparece repetido cada dato es la frecuencia de dicho valor. ¿cómo podemos clasificar y ordenar los números para obtener más información acerca de ese universo de datos?. LA DISTRIBUCIÓN DE FRECUENCIAS Vimos que una Población o Universo de datos es un conjunto muy grande de números. sin hacer ningún cálculo nos damos cuenta donde está aproximadamente el promedio de la población. ahora. Una manera de caracterizar esta población es construir una distribución de frecuencias o gráfico de frecuencias. Cuando los números no son enteros o cuando tenemos un número muy grande de datos. La representación gráfica nos permite ver información que antes no aparecía tan evidente. Suponiendo que disponemos de los datos del universo. es decir. los datos de la población son números enteros. es decir. Por ejemplo. También nos muestra cuales son los valores máximo y mínimo de la población. Una gran tabla de números ordenados al azar prácticamente no nos muestra información acerca de la población de datos. por ejemplo el peso de varones adultos de 40 años. 2) Subdividimos el intervalo entre el máximo y el mínimo en algún número de intervalos (15 ó 20) mas pequeños iguales entre sí. el rango o recorrido. Vamos a suponer.

Si nos paramos frente al grupo y elegimos una persona. En cambio. al más flaco o al más alto (y por lo tanto pesa más que otros). es decir. entre 70 y 80 Kg. Decimos. metemos todas las etiquetas en una caja y luego le pedimos a alguien que retire una etiqueta. si los valores están ubicados alrededor de un valor central. colocamos en el eje de abcisas (Horizontal) los intervalos y levantamos en cada intervalo un rectángulo de altura proporcional al número ni de datos dentro del mismo. que estamos extrayendo un dato de la población de datos. Por ejemplo. estaremos seleccionando al más gordo. el resultado es un dato que pertenece a la población de datos representada en el gráfico. Si elegimos una persona del grupo y la pesamos. Podemos observar que fracción de todas las mediciones cae por ejemplo. 4)Para construir el gráfico. Si hacemos el área del rectángulo levantado sobre el intervalo i-ésimo igual a la frecuencia relativa ni/N. el área total bajo el histograma será igual a la unidad: Obtenemos así un histograma que nos muestra la distribución de frecuencias de la población: Esta distribución de frecuencias nos muestra si hay resultados que son mas frecuentes que otros. si están muy dispersos o poco dispersos. . En este caso. distintas maneras de realizar la extracción del dato. supongamos que en el intervalo i hay ni observaciones (S*ni = N).3) Contamos el número de datos que encontramos dentro de cada intervalo (Frecuencia). si escribimos los nombres de todas las personas en una etiqueta. de acuerdo a criterios subjetivos que no podemos evitar. entonces. Pero hay distintas maneras de elegir la persona. la selección no estará influida por nuestra subjetividad.

o sea que no se pueden expresar mediante un número entero. aquellas que por su naturaleza no admiten un fraccionamiento de la unidad Ejemplos:  Número de hijos en el hogar  .  variable peso. . es decir.. es decir. proposición o algoritmo que puede adquirir o ser sustituido por un valor cualquiera (siempre dentro de su universo). el que tendría sin las restricciones). pero no de medición cuantitativa. Variable Cuantitativa Discretas: son aquellas cuyo conjunto de valores es a lo sumo numerable. … . el universo de la variable pasa a ser un subconjunto de un universo mayor. Los atributos son aquellos caracteres que para su definición precisan de palabras. el nivel de estudios. serán los siguientes: a. Variables Cualitativas (Atributos) o Ordinales: susceptibles de ordenación.decimos que la extracción es aleatoria. Variables Cuantitativas o Cardinales: susceptibles de medición cuantitativa. reflejan generalmente los atributos del fenómeno. TIPOS DE VARIABLES: Los tipos de variables fundamentales. VARIABLE es un elemento de una fórmula.  variable longitud en cm. aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable puede tomar cualquier valor intermedio.Páginas de un libro  Variable Cuantitativa Continua: son aquellas que pueden tomar todos los valores de un intervalo de números reales. por lo menos para este tema. Xn. y/o estar limitados por criterios o condiciones de pertenencia. al universo que les corresponde (en estos casos. y a su vez las podemos clasificar en: Ordenables: aquellas que sugieren una ordenación. (escala de razón). Sus valores pueden representarse siempre por X1. Una extracción aleatoria es aquella en que cada miembro de la población tiene la misma posibilidad de ser elegido. o sea son las que se describen por medio de números y las que a su vez comprenden: i. pueden estar definidos dentro de un rango. no le podemos asignar un número. Ejemplos:  variable temperatura en grados Celsius (escala de intervalos). Los valores que una variable es capaz de recibir. X2. etc. y sólo se pueden asociar a un número entero. es decir. por ejemplo la graduación militar.  variable tiempo ii.

es decir. etc. que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. la representaremos por ni FRECUENCIA RELATIVA: La frecuencia absoluta. • FRECUENCIA ABSOLUTA (n ) de una variable estadística X . FRECUENCIA ABSOLUTA: La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra dicho valor de la variable. por ejemplo en los concursos de belleza se recurre a un sistemade calificación por puntos. pero no establece orden por su naturaleza.. la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N). al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. No Ordenables: aquellas que sólo admiten un ordenamiento alfabético.1 y (fig. siendo el fi para todo el conjunto i. es i i el número de veces que aparece en el estudio este valor . sexo. aumentará el tamaño de la frecuencia absoluta. Para esto es necesario introducir el concepto de frecuencia relativa. Nota: no obstante en muchos casos el tratamiento estadístico hace que a variables discretas las trabajemos como si fuesen continua y viceversa (por ejemplo la edad de las personas –variable continua. por ejemplo el color del cabello. A mayor tamaño de la muestra. estado civil.2). Se presenta en una tabla o nube de puntos en una distribución de frecuencias (ver fig. • FRECUENCIA RELATIVA (f ). . En otros casos las variables cualitativas (atributos) se trabajan como variables cuantitativas. es el cociente entre la frecuencia i absoluta y el tamaño de la muestra (N). Esto hace que no sea una medida útil para poder comparar. La denotaremos por fi Donde N = Tamaño de la muestra.se trabaja en años cumplidos –variable discreta-. es una medida que está influida por el tamaño de la muestra. Es decir.

Esto puede hacerse por medio del siguiente proceso de agrupación de datos. Al número de valores en cada intervalo de clase se le llama frecuencia de clase. Estadística Aplicada a la Ingeniería Civil 18 Ejemplo.Si un valor de una muestra coincide con el punto extremo común de dos intervalos de clases se coloca este valor en el intervalo que se encuentra a la derecha de dicho valor. que estudiaremos a continuación. Para la tabla 2 podemos hacer la siguiente agrupación de los datos: . su división entre el tamaño n de la muestra es la frecuencia relativa de clase. determinado por el menor y el mayor valor de la muestra. Si una muestra consta de demasiados valores numéricamente diferentes. . las gráficas correspondientes.Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi) que presentan esta característica respecto al total de N. . son muy complicadas y quizás confusas. que contenga a todos los valores Subdividimos I en subintervalos que se llaman intervalos de clase. es decir el 100% del conjunto. escogemos un intervalo I . los puntos medios de estos intervalos se denominan marcas de clase. AGRUPACIÓN DE DATOS. . En muchas aplicaciones será posible obedecer las siguientes reglas que son útiles para evitar complicaciones innecesarias en el uso posterior de una muestra agrupada. por lo que nos podría interesar simplificar los datos eliminando detalles innecesarios.Los intervalos de clase se escogerán de manera que las marcas de clase correspondan a números simples.Todos los intervalos deberán tener la misma amplitud. Para una muestra dada.

que dependerán de los métodos de inferencia empleados. ya que los valores originales de la muestra no aparecen explícitamente. . si la inferencia estadística se basa en los datos agrupados. El agrupamiento siempre significará perdida de información y en consecuencia. vemos que hay factores arbitrarios en el proceso de agrupación. pero se perderá más información. se pueden crear problemas de variedad de grados de exactitud. manteniendo las longitudes y el número de los intervalos de clase. Por lo tanto. debemos considerar la posibilidad de usar los datos originales no agrupados. Se observa que la muestra agrupada puede cambiar si cambiamos las marcas de clase. es muy importante que la agrupación de datos sea similar.Cuantas menos clases escojamos. bajo condiciones ordinarias. De hecho si necesitamos comparar una muestra con otra previamente agrupada. si estamos imposibilitados para juzgar los efectos de la agrupación. De este modo. será más simple la muestra agrupada. El agrupamiento debe hacerse de tal manera que sólo se eliminen los detalles que no son esenciales.

.

es/Estadist/ManualCPE02p2.Bibliografía: http://es.com.org/wiki/Estad%C3%ADstica http://www.htm# .wikipedia.matematicasypoesia.

ya sea especialista o no. resulta de suma importancia considerar para así evitar malentendidos. Es un primer acercamiento a la información y. por ser un medio accesible a la mayoría de la población humana. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas. sino que. así como de la obtención de algunos parámetros útiles para la explicación de la información. Sin embargo. lo anterior no quiere decir que carezca de metodología o algo similar. . al contrario. por esa misma razón. La Estadística Descriptiva es la parte que conocemos desde los cursos de educación primaria. no pasa a ser un análisis más profundo de la información. tergiversaciones o errores. que se enseña en los siguientes niveles y que. por lo general. Introducción Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. es la manera de presentar la información ante cualquier lector.