Está en la página 1de 13

PROBABILIDAD de un suceso es el número al que tiende la frecuencia relativa

asociada al suceso a medida que el número de veces que se realiza el experimento crece.

• Un experimento aleatorio se caracteriza porque repetido muchas veces y en


idénticas condiciones el cociente entre el número de veces que aparece un
resultado (suceso) y el número total de veces que se realiza el experimento
tiende a un número fijo. Esta propiedad es conocida como ley de los grandes
números, establecida por Jakob Bernouilli. Tiene el inconveniente de variar la
sucesión de las frecuencias relativas de unas series de realizaciones a otras, si
bien el valor al que se aproximan a medida que el número de realizaciones
aumenta se mantiene estable.

La frecuencia relativa del suceso A:

Propiedades de la frecuencia relativa:

1. 0 fr (A) 1 cualquiera que sea el suceso A.


2. fr( ) = fr(A) + fr(B) si = Ø.
3. fr(E) = 1 fr(Ø) = 0.

Esta definición presenta el inconveniente de tener que realizar el experimento un


gran número de veces y además siempre obtendremos un valor aproximado de la
probabilidad.

EXPERIMENTOS O FENÓMENOS ALEATORIOS son los que pueden dar lugar a


varios resultados, sin que pueda ser previsible enunciar con certeza cuál de éstos va a
ser observado en la realización del experimento.

Si dejamos caer una piedra o la lanzamos, y conocemos las condiciones iniciales de


altura, velocidad, etc., sabremos con seguridad dónde caerá, cuánto tiempo tardará, etc.
Es una experiencia determinista. Si echamos un dado sobre una mesa, ignoramos qué
cara quedará arriba. El resultado depende del azar. Es una experiencia aleatoria.
TABLAS DE CONTINGENCIA Y DIAGRAMAS DE
ÁRBOL.
En los problemas de probabilidad y en especial en los de probabilidad condicionada,
resulta interesante y práctico organizar la información en una tabla de contingencia o en
un diagrama de árbol.
Las tablas de contingencia y los diagramas de árbol están íntimamente relacionados,
dado uno de ellos podemos construir el otro. Unas veces, los datos del problema
permiten construir fácilmente uno de ellos y a partir de él podemos construir el otro, que
nos ayudará en la resolución del problema.

• Conversión de una tabla en diagrama de árbol

Las tablas de contingencia están


A TOTAL
referidas a dos características que
presentan cada una dos o más B P( A B ) P( B) P( B )
sucesos.
P( A ) P( ) P( )
TOTAL P( A ) P( ) 1

En el caso de los sucesos A, , B y , expresados en frecuencias absolutas,


relativas o probabilidades la tabla, adopta la forma adjunta.

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los
sucesos A y se les ha asociado los sucesos B y .

Sobre las ramas del diagrama de árbol se han anotado las probabilidades condicionadas
correspondientes, deducidas de las relaciones análogas a:
ESTADÍSTICA

La estadística es una ciencia con base matemática referente a la recolección, análisis e


interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo
aleatorio. Es transversal a una amplia variedad de disciplinas, desde la física hasta las
ciencias sociales, desde las ciencias de la salud hasta el control de calidad, y es usada
para la toma de decisiones en áreas de negocios e instituciones gubernamentales.

La Estadística se divide en dos ramas:

• La estadística descriptiva, que se dedica a los métodos de


recolección, descripción, visualización y resumen de datos originados
a partir de los fenómenos en estudio. Los datos pueden ser resumidos
numérica o gráficamente. Ejemplos básicos de descriptores
numéricos son: la media y la desviación estándar. Algunos ejemplos
gráficos son: histograma, pirámide poblacional, clusters, etc.
• La inferencia estadística, que se dedica a la generación de los
modelos, inferencias y predicciones asociadas a los fenómenos en
cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se
usa para modelar patrones en los datos y extraer inferencias acerca
de la población bajo estudio. Estas inferencias pueden tomar la forma
de respuestas a preguntas si/no (prueba de hipótesis), estimaciones
de características numéricas (estimación), pronósticos de futuras
observaciones, descripciones de asociación (correlación) o
modelamiento de relaciones entre variables (análisis de regresión).
Otras técnicas de modelamiento incluyen ANOVA, series de tiempo y
minería de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. Hay


también una disciplina llamada estadística matemática, la cual se refiere a las bases
teóricas de la materia. La palabra estadísticas también se refiere al resultado de aplicar
un algoritmo estadístico a un conjunto de datos, como en estadísticas económicas,
estadísticas criminales, etc.
POBLACIÓN Y MUESTRA
Algo importante que hay que mencionar es que no siempre se trabaja con todos los
datos. Ésto por diversas razones, que pueden ser desde prácticas hasta por
economía. Por ejemplo, resultaría muy costoso obtener los datos de todos los seres
humanos, o impráctico (y a la vez destructivo) obtener como datos el tiempo en el
que se funden las bombillas producidas por una cierta marca realizando la medición
de toda la producción. El estudio conduciría a la empresa a la ruina, pues la
producción entera desaparecería.

Por esta razón se considera un subconjunto del total de los casos, sujetos u objetos
que se estudian y que se les obtienen los datos. La población, entonces, es el total
hipotético de los datos que se estudian o recopilan. Ante la imposibilidad ocasional
de conseguir a la población, entonces se recurre a la muestra, que viene siendo un
subconjunto de los datos de la población, pero tal subconjunto tiene que contener
datos que pueden servir para posteriores generalizaciones de las conclusiones.

POBLACIÓN Y MUESTRA.
Una población es el conjunto de todos los elementos que cumplen
una o
varias propiedades prefijadas.
Ejemplos de poblaciones son: el colectivo de todos los consumidores
de
un determinado producto, el conjunto de tornillos fabricados en un día
por una
empresa, etc.
Llamamos tamaño de la población al número de elementos que la
componen.
Si dicho número es finito, la población es finita; si por el contrario es
infinito,
la población es infinita. En la práctica las poblaciones son finitas, pero
por
consideraciones teóricas interesa estudiar poblaciones infinitas.
La Estadística se interesa por el estudio de las poblaciones. Para
estudiar
una población se puede usar:
- Un censo o encuesta exhaustiva, que consiste en observar todos y
cada
uno de los elementos de la población.
Estadística Aplicada a la Ingeniería Civil
10
- Una muestra, que es un subconjunto de la población. Llamamos
tamaño
de la muestra al número de elementos que la componen. La
inspección
de una población por muestreo es rápida y barata. Además, en
algunos
casos, es la única manera práctica de observar una población; esto
ocurre cuando la observación de un elemento supone su destrucción,
por ejemplo cuando se intenta estudiar la resistencia de ciertos
materiales.
LA DISTRIBUCIÓN DE FRECUENCIAS

Vimos que una Población o Universo de datos es un conjunto muy grande de


números. Estos números pueden estar en un gran listado o puede ser un
conjunto hipotético, es decir, podemos imaginar los números pero no los
tenemos realmente. Una gran tabla de números ordenados al azar
prácticamente no nos muestra información acerca de la población de datos.
Suponiendo que disponemos de los datos del universo, ¿cómo podemos
clasificar y ordenar los números para obtener más información acerca de ese
universo de datos?.

Una forma sería escribir los números desde el menor hasta el mayor y colocar
encima de cada uno tantas cruces o cuadraditos como veces que figure
repetido en la población.

El número de veces que aparece repetido cada dato es la frecuencia de dicho


valor. La representación gráfica que hemos visto se denomina Distribución de
Frecuencias de la población.

La representación gráfica nos


permite ver información que
antes no aparecía tan evidente.
Por ejemplo, sin hacer ningún
cálculo nos damos cuenta donde
está aproximadamente el
promedio de la población.

También nos muestra cuales son


los valores máximo y mínimo de
la población, es decir, el rango o
recorrido.

En el caso anterior, los datos de la población son números enteros. Cuando los
números no son enteros o cuando tenemos un número muy grande de datos,
se divide el rango total en subintervalos y se cuenta el número de valores que
cae dentro de cada subintervalo.

Vamos a suponer, ahora, que tenemos una cierta población de N = 500 datos,
por ejemplo el peso de varones adultos de 40 años. Una manera de
caracterizar esta población es construir una distribución de frecuencias o
gráfico de frecuencias. Para ello seguimos los pasos siguientes:

1) Tomamos nota del valor máximo y el valor mínimo de la serie de datos que
estamos considerando.

2) Subdividimos el intervalo entre el máximo y el mínimo en algún número de


intervalos (15 ó 20) mas pequeños iguales entre sí.
3) Contamos el número de datos que encontramos dentro de cada intervalo
(Frecuencia). Por ejemplo, supongamos que en el intervalo i hay ni
observaciones (S*ni = N).

4)Para construir el gráfico, colocamos en el eje de abcisas (Horizontal) los


intervalos y levantamos en cada intervalo un rectángulo de altura proporcional
al número ni de datos dentro del mismo.

Si hacemos el área del rectángulo levantado sobre el intervalo i-ésimo igual a la


frecuencia relativa ni/N, el área total bajo el histograma será igual a la unidad:

Obtenemos así un histograma que nos muestra la distribución de frecuencias


de la población:

Esta distribución de frecuencias nos muestra si hay resultados que son mas
frecuentes que otros; si los valores están ubicados alrededor de un valor
central, si están muy dispersos o poco dispersos. Podemos observar que
fracción de todas las mediciones cae por ejemplo, entre 70 y 80 Kg.

Si elegimos una persona del grupo y la pesamos, el resultado es un dato que


pertenece a la población de datos representada en el gráfico. Decimos,
entonces, que estamos extrayendo un dato de la población de datos. Pero hay
distintas maneras de elegir la persona, es decir, distintas maneras de realizar la
extracción del dato.

Si nos paramos frente al grupo y elegimos una persona, estaremos


seleccionando al más gordo, al más flaco o al más alto (y por lo tanto pesa más
que otros), de acuerdo a criterios subjetivos que no podemos evitar. En cambio,
si escribimos los nombres de todas las personas en una etiqueta, metemos
todas las etiquetas en una caja y luego le pedimos a alguien que retire una
etiqueta, la selección no estará influida por nuestra subjetividad. En este caso,
decimos que la extracción es aleatoria.

Una extracción aleatoria es aquella en que cada miembro de la población tiene


la misma posibilidad de ser elegido.

VARIABLE es un elemento de una fórmula, proposición o algoritmo que puede


adquirir o ser sustituido por un valor cualquiera (siempre dentro de su universo). Los
valores que una variable es capaz de recibir, pueden estar definidos dentro de un rango,
y/o estar limitados por criterios o condiciones de pertenencia, al universo que les
corresponde (en estos casos, el universo de la variable pasa a ser un subconjunto de un
universo mayor, el que tendría sin las restricciones).

TIPOS DE VARIABLES:
Los tipos de variables fundamentales, por lo menos para este tema, serán los
siguientes:
a. Variables Cuantitativas o Cardinales: susceptibles de medición
cuantitativa; o sea son las que se describen por medio de números y las que a
su vez comprenden:
i. Variable Cuantitativa Discretas: son aquellas cuyo conjunto de
valores es a lo sumo numerable. Sus valores pueden representarse
siempre por X1, X2, … , Xn.; y sólo se pueden asociar a un número
entero, es decir, aquellas que por su naturaleza no admiten un
fraccionamiento de la unidad

Ejemplos:
 Número de hijos en el hogar
 .Páginas de un libro
 Variable Cuantitativa Continua: son aquellas que pueden
tomar todos los valores de un intervalo de números reales, o sea que
no se pueden expresar mediante un número entero, es decir,
aquellas que por su naturaleza admiten que entre dos valores
cualesquiera la variable puede tomar cualquier valor intermedio.

Ejemplos:
 variable temperatura en grados Celsius (escala de intervalos).
 variable longitud en cm. (escala de razón).
 variable peso.
 variable tiempo
ii. Variables Cualitativas (Atributos) o Ordinales: susceptibles de
ordenación, pero no de medición cuantitativa, reflejan generalmente
los atributos del fenómeno. Los atributos son aquellos caracteres que
para su definición precisan de palabras, es decir, no le podemos asignar
un número, y a su vez las podemos clasificar en:

Ordenables: aquellas que sugieren una ordenación, por ejemplo


la graduación militar, el nivel de estudios, etc.
No Ordenables: aquellas que sólo admiten un ordenamiento
alfabético, pero no establece orden por su naturaleza,, por ejemplo el
color del cabello, sexo, estado civil, etc.

Nota: no obstante en muchos casos el tratamiento


estadístico hace que a variables discretas las
trabajemos como si fuesen continua y viceversa
(por ejemplo la edad de las personas –variable
continua- se trabaja en años cumplidos –variable
discreta-. En otros casos las variables cualitativas
(atributos) se trabajan como variables
cuantitativas, por ejemplo en los concursos de
belleza se recurre a un sistemade calificación por
puntos.

FRECUENCIA ABSOLUTA:
La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra dicho
valor de la variable, la representaremos por ni

FRECUENCIA RELATIVA:
La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el
tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una
medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que
es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fi

Donde N = Tamaño de la muestra.

• FRECUENCIA ABSOLUTA (n ) de una variable estadística X , es


i i

el número de veces que aparece en el estudio este valor . A mayor tamaño de la


muestra, aumentará el tamaño de la frecuencia absoluta; es decir, la suma total
de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N).

• FRECUENCIA RELATIVA (f ), es el cociente entre la frecuencia


i

absoluta y el tamaño de la muestra (N). Es decir,

siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una
distribución de frecuencias (ver fig.1 y (fig.2).
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por
ciento (pi) que presentan esta característica respecto al total de N, es decir el 100% del
conjunto.

AGRUPACIÓN DE DATOS.
Si una muestra consta de demasiados valores numéricamente
diferentes,
las gráficas correspondientes, que estudiaremos a continuación, son
muy
complicadas y quizás confusas, por lo que nos podría interesar
simplificar los
datos eliminando detalles innecesarios. Esto puede hacerse por
medio del
siguiente proceso de agrupación de datos.
Para una muestra dada, escogemos un intervalo I , determinado por el
menor y el mayor valor de la muestra, que contenga a todos los
valores
Subdividimos I en subintervalos que se llaman intervalos de clase; los
puntos
medios de estos intervalos se denominan marcas de clase. Al número
de valores en
cada intervalo de clase se le llama frecuencia de clase; su división
entre el tamaño n
de la muestra es la frecuencia relativa de clase.
En muchas aplicaciones será posible obedecer las siguientes reglas
que
son útiles para evitar complicaciones innecesarias en el uso posterior
de una
muestra agrupada.
- Todos los intervalos deberán tener la misma amplitud.
- Los intervalos de clase se escogerán de manera que las marcas de
clase
correspondan a números simples.
- Si un valor de una muestra coincide con el punto extremo común de
dos intervalos de clases se coloca este valor en el intervalo que se
encuentra a la derecha de dicho valor.
Estadística Aplicada a la Ingeniería Civil
18
Ejemplo. Para la tabla 2 podemos hacer la siguiente agrupación de los
datos:
Cuantas menos clases escojamos, será más simple la muestra
agrupada,
pero se perderá más información, ya que los valores originales de la
muestra no
aparecen explícitamente. El agrupamiento debe hacerse de tal
manera que sólo se
eliminen los detalles que no son esenciales.
El agrupamiento siempre significará perdida de información y en
consecuencia, si la inferencia estadística se basa en los datos
agrupados, se
pueden crear problemas de variedad de grados de exactitud, que
dependerán de
los métodos de inferencia empleados. Por lo tanto, si estamos
imposibilitados
para juzgar los efectos de la agrupación, bajo condiciones ordinarias,
debemos
considerar la posibilidad de usar los datos originales no agrupados.
Se observa que la muestra agrupada puede cambiar si cambiamos las
marcas de clase, manteniendo las longitudes y el número de los
intervalos de
clase. De este modo, vemos que hay factores arbitrarios en el proceso
de
agrupación. De hecho si necesitamos comparar una muestra con otra
previamente agrupada, es muy importante que la agrupación de
datos sea
similar.
Bibliografía:

http://es.wikipedia.org/wiki/Estad%C3%ADstica

http://www.matematicasypoesia.com.es/Estadist/ManualCPE02p2.htm#
Introducción
Una de las ramas de la Estadística más accesible a la mayoría de la población es la
Descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y
tratamiento mecánico de la información para su presentación por medio de tablas y
de representaciones gráficas, así como de la obtención de algunos parámetros
útiles para la explicación de la información.

La Estadística Descriptiva es la parte que conocemos desde los cursos de educación


primaria, que se enseña en los siguientes niveles y que, por lo general, no pasa a
ser un análisis más profundo de la información. Es un primer acercamiento a la
información y, por esa misma razón, es la manera de presentar la información ante
cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir
que carezca de metodología o algo similar, sino que, al contrario, por ser un medio
accesible a la mayoría de la población humana, resulta de suma importancia
considerar para así evitar malentendidos, tergiversaciones o errores.

También podría gustarte