Está en la página 1de 74

Probabilidad y estadistica

• Un conjunto es una colección de elementos con


características similares, dicha característica
esta bien definida y es representativa de forma
universal.

Conjuntos • Cuando hablamos de conjuntos, es normal usar


letras mayúsculas para llamar al conjunto, y
letras minúsculas para los elementos de ese
conjunto.
• Ejemplos:

• Conjunto de los números pares


A={2,4,6,8,10…}
• Conjunto de las vocales
B={a, e ,i, o, u}

• No representan un conjunto:

• Las personas guapas ¿¿??

• El conjunto de los números muy grandes ¿¿¿ ???


Conjuntos por extensión y comprensión
• Un conjunto se determina por extensión
cuando se enumeran cada uno de sus elementos
• Ejemplo 1:
• El conjunto “A” está compuesto por personas:
Juan, Carlos y Pedro
• A= {Juan, Carlos, Pedro}

• Ejemplo 2:
• El conjunto A está formado por el 5, 8, 4 y 3
• A= { 3, 4, 5, 8}
• Un conjunto se determina por comprensión
cuando se indica la propiedad común que tienen sus
elementos
• Ejemplo 1: El conjunto B está compuesto por todos
los números Naturales mayores que 5.
• B= {x / x є N / x > 5 }

• Ejemplo 2
• B= { x/x є N / x > 0 y x < 30 }
Subconjuntos

• A es un subconjunto propio de B si y sólo si cada elemento de A


está en B, y existe por lo menos un elemento de B que no está en
A.

• {1, 2, 3} es un subconjunto propio de {1, 2, 3, 4} porque el


elemento 4 no está en el primer conjunto.
Operaciones con conjuntos
• •Unión: (símbolo ∪) La unión de dos conjuntos A y B, que se
representa como A ∪ B, es el conjunto de todos los elementos que
pertenecen al menos a uno de los conjuntos A y B.

• Ejemplo:
• A= {1, 2, 3,4,}
• B= {5, 6, 7, 8}
• AUB= {1, 2, 3, 4, 5, 6, 7, 8}
• •Intersección: (símbolo ∩) La intersección de dos
conjuntos A y B es el conjunto A ∩ B de los elementos
comunes a A y B.

• Ejemplo:
• A= {a, b, c, d, e}
• B= {a, e, i, o, u}
• A∩B= {a, e}
• Diferencia: (símbolo \) La diferencia del
conjunto A con B es el conjunto A \ B que resulta de
eliminar de A cualquier elemento que esté en B.
• Complemento: El complemento de un conjunto A es el
conjunto A∁ que contiene todos los elementos que no
pertenecen a A, respecto a un conjunto U que lo contiene.
• Ejemplo
• En una heladería se venden helados de distintos sabores, se quiere
comprar uno que solo tenga dos sabores diferentes, ¿cuántos helados
de sabores diferentes podemos elegir entre los sabores de nata,
vainilla, chocolate, limón y naranja?
• Solución:
• Primero verificamos que estamos ante una Combinación:No se toman
todos los elementos del grupo (se toman solo de dos en
dos) → correcto
• No se repiten elementos (los helados son de dos sabores
diferentes) → correcto
• El orden no importa (un helado de chocolate y vainilla es el mismo que uno de vainilla y
chocolate) → correcto

• Después de comprobar que efectivamente se trata de una combinación, calculamos el número


de helados diferentes:

m = 5 sabores diferentes
n = 2 (helados de dos sabores)
• Un estudiante para aprobar un examen que consta de 10 preguntas
debe contestar ¿De cuantas maneas puede hacer la selección para
aprobar su examen?

• ¿Cuántos números de 4 cifras distintas se pueden formar del 1 al 9?

• Un marino tiene 7 banderas distintas para hacer señales ¿Cuántas


señales distintas puede hacer si coloca 3 banderas para realizar las
distintas señales?

• De una clase de 20 niñas se eligieron 16 para ir a un paseo, ¿Cuántos


posibles grupos de 16 se pueden formar?
Probabilidad

• Es un conjunto de técnicas matemáticas que nos permiten


asignar un número a la posibilidad de que un evento
ocurra.
Teoremas fundamentales del calculo de
probabilidades
¿Qué es la Estadística?

• La Estadística es la rama de las matemáticas que estudia los métodos


de recopilación, organización, descripción y análisis de datos así como
la interpretación de la información, con el objetivo de tomar la
decisión más eficaz ante alguna situación de incertidumbre.
• La estadística descriptiva es el conjunto de métodos estadísticos que
describen y/o caracterizan un grupo de datos.
• Aunque las técnicas de la estadística descriptiva son útiles para
cualquier colección de datos (de hecho surgieron del tratamiento de
información proveniente de censos), en la actualidad estas técnicas se
suelen usar para trabajar con información proveniente de muestras.

• La estadística inferencial busca deducir y sacar conclusiones acerca


de situaciones generales mas allá del conjunto de datos obtenidos.
• Se trata de procedimientos que permiten obtener ciertas
conclusiones acerca de una población con base exclusivamente en la
información proporcionada por una muestra aleatoria representativa.
Población
• La Población es el conjunto de elementos (personas, animales,
plantas u objetos) que tienen ciertas características de interés para un
estudio estadístico. Una población debe definirse en términos de:

• Tipo de elementos que la constituyen.


• Lugar o espacio donde se encuentra.
• Período de tiempo en el que se desarrolla el estudio.
• Se le llama tamaño de la población al número total de individuos que
la componen y en estas notas lo denotaremos por N.

• Una Muestra es cualquier subconjunto de la población seleccionado


para la investigación.
• Una Muestra aleatoria es un subconjunto que ha sido seleccionado
mediante un método azaroso o aleatorio. Para que una muestra
aleatoria sea útil para una investigación, se requiere que sea
representativa de la población.
Variables estadísticas
• Las características de interés en una población o una muestra se
llaman variables. Por ejemplo, son variables estadísticas:

• El tiempo que te lleva trasladarte de tu casa a la escuela.


• El número de palabras que lees por minuto.
• Las carreras que elegirán los estudiantes de tu grupo de sexto
semestre.
• El número de habitantes en el hogar de cada estudiante.
• La última película que vio en el cine cada estudiante de un grupo.
Las variables estadísticas pueden clasificarse de acuerdo a los valores
que toman, en variables cuantitativas y variables cualitativas.

• Variables cuantitativas o numéricas

• Son aquellas variables que toman valores numéricos como resultado


de un proceso de conteo o medición. Por ejemplo:

• Peso de jóvenes mexicanos de 15 a 18 años de edad.
• Cantidad de personas que viven en el hogar de cada estudiante del CCH.
• Edad en años cumplidos de los estudiantes de un grupo.
• Altura de los arbustos de cedro blanco que crecen en la CdMx. Estas variables
se subdividen en
• Cuantitativas discretas

Son resultado de un proceso de conteo. Usualmente toman valores enteros no


negativos.

• Cuantitativas continuas

Son resultado de un proceso de medición. Toman valores en intervalos.

Variables cualitativas o categóricas

Son las variables que toman como valores categorías o nombres que identifican
distintas cualidades o atributos de los elementos de la población o muestra.
Variable Valores Tipo de variables

a) Cantidad de café que sirve una máquina


automática en una descarga si se anuncia que
es de 300 ml.

b) Cantidad de libros que un estudiante


consulta en la biblioteca en un semestre.

c) Carreras que eligen estudiantes de 6°


semestre.

d) Peso del contenido de las cajas de cereal


que indican 800 gr.

e) Tipo de medalla obtenida por los tres


mejores deportistas de una prueba.
• Datos
Son los valores que toma una variable de estudio en cada individuo de
la muestra o de la población. En los ejemplos de variables mencionados
en la parte anterior, se pueden presentar los siguientes datos:

• 26, 28, 32, 35, 25 minutos


• 100, 105, 120, 110 palabras
• Medicina, Veterinaria, Sociología, Filosofía, Actuaría, etcétera
• Los datos estadísticos se obtienen por levantamiento o por
experimentación.

• El levantamiento de datos se puede llevar a cabo aplicando un


cuestionario a través de entrevistas personales, telefónicas o
mediante la web, mecanismos que se aplican cuando la población
está formada por personas. También se puede recurrir a la
observación directa, por ejemplo, tomar los signos vitales de
pacientes o medir el tamaño promedio de las hojas de ciertas plantas.
• Si el levantamiento de información se aplica a todos los elementos de
la población de estudio, se habla de un censo.
• La otra forma de recopilar datos es a través de estudios
experimentales, es decir, cuando el investigador modifica por lo
menos una de las variables del fenómeno en estudio.
Por ejemplo, supongamos que se desea medir los efectos en la piel de
los rayos ultravioleta emitidos por el sol. Se toma una muestra de 100
individuos que serán expuestos al sol durante 15 minutos, 50
individuos usarán un protector solar y la otra mitad no. Éste es un
experimento porque se ha decidido modificar la variable uso de
protector solar y se debe asignar aleatoriamente quiénes formarán
parte de cada grupo.
Datos no agrupados
• Los datos no agrupados son los datos sin procesar, son usualmente el
punto de inicio del análisis, es el conjunto de datos obtenidos en la
recopilación.

• Los datos agrupados se refieren al hecho de que estén ordenados,


clasificados y contados.
Distribución o tabla de frecuencias
• Para agrupar u organizar un conjunto de datos se construye una tabla
llamada tabla de frecuencias o distribución de frecuencias simple.
• El primer paso para organizar los datos consiste en identificar el tipo
de datos que se tienen, los cuales pueden ser cualitativos o
cuantitativos.
• Cuando los datos corresponden a valores cualitativos se clasifican en
varias clases o categorías, que corresponden a las cualidades, valores
o atributos obtenidos de cada elemento,
• Después se efectúa una tabulación, es decir, se realiza un conteo de
los elementos, que pertenece a cada clase o categoría.
• Para llevar un orden y no omitir algún valor, se asigna una columna
para la tabulación y se coloca una marca para cada elemento de la
muestra o población, donde corresponda su categoría. Frecuencia
• Una vez terminada la tabulación, se cuentan los elementos que
contiene cada clase o categoría y se anota el valor en otra columna
que se denomina frecuencia. Así, la frecuencia es el número de
elementos que contiene cada clase o categoría en un conjunto de
datos.
Tipos de Frecuencias
• Frecuencia o frecuencia absoluta: Es el número de veces que se observa cada
uno de ellos en una colección de datos.

• El cociente de la frecuencia entre el total de datos, se llama frecuencia relativa.

• La frecuencia absoluta acumulada hasta un valor xi es la suma de las frecuencias


absolutas de todos los valores menores o iguales a xi, y se representa por Fai.

• La frecuencia relativa acumulada hasta un valor xi es la suma de las frecuencias


relativas de todos los valores menores o iguales a xi, y se representa por Frai.
También se puede calcular dividiendo las frecuencias absolutas acumuladas entre
el total de datos.
Datos agrupados en intervalos
• El número de intervalos o clases depende de la cantidad de datos que
se tengan.


Longitud o amplitud de los intervalos o clases

• Para tener una referencia sobre la longitud de los intervalos, se


requiere calcular el rango de los datos, definido como la diferencia del
mayor menos el menor de los valores que toman.

• Rango = dato máximo – dato mínimo

• El rango se divide entre el número de intervalos para obtener la


longitud sugerida (c).
Representación grafica

• Además de la distribución de frecuencias, resulta conveniente


construir alguna representación gráfica de los datos. De esta manera,
se tiene una imagen que describe visualmente el comportamiento de
los datos.
Gráfica Circular

• Se conoce también como diagrama de pastel o de sectores. Ayuda a


percibir la importancia relativa de cada categoría respecto al total.

• Para determinar el ángulo central de cada sector, se divide 360º de


manera proporcional a la frecuencia absoluta o relativa de cada valor
(usando, por ejemplo, una regla de tres).

• En cada sector circular, se suele escribir la frecuencia relativa dada en


porcentaje.
Gráfica de barras

• En un sistema de ejes coordenados, se localizan en el eje horizontal


los valores de la variable y en el eje vertical, la frecuencia absoluta o
relativa que corresponde a cada valor. Con esa información, se
construyen barras separadas, una para cada valor.
Histograma

• Se usa principalmente para datos agrupados en intervalos. Se trata de


un gráfico de barras en el que la barras se colocan pegadas, una junto
a la otra, pues cada intervalo termina donde empieza el siguiente. Las
alturas de las barras pueden ser las frecuencias absolutas o relativas
• El ancho de los rectángulos corresponde al tamaño de los intervalos.
Las bases de las barras se encuentran centradas en el punto medio
del intervalo, al que llamaremos marca de clase.
Polígono de Frecuencias

• Es un gráfico de líneas que se cierra para formar un polígono trazando


segmentos de recta que lo unen con el eje horizontal.

• Se usan sobre todo en datos que se pueden agrupar en intervalos. Los


vértices tienen como abscisas las marcas de clase o puntos medios de
los intervalos, y como ordenadas las frecuencias correspondientes.
0jiva

• Consiste en una gráfica de líneas en la que la altura de los vértices


corresponde a las frecuencias acumuladas. Por ello, la gráfica es
ascendente. Siempre empieza en el eje horizontal.
• Se usa en datos de cualquier variable que tenga frecuencias
acumuladas.
Medidas de tendencia central

• Se les llaman medidas de tendencia central porque cuando no hay


valores extremos, las cantidades representativas suelen ubicarse por
el centro de los datos.

• Estudiaremos tres medidas de tendencia central: la media aritmética


o promedio, la mediana y la moda
Media aritmética o promedio
• La media aritmética solo puede calcularse cuando la variable es
cuantitativa y se obtiene sumando todos los datos y dividiendo el
resultado entre la cantidad de datos.

• Cuando los datos son elementos de una muestra, la media se


representa por 𝑋ത cuando los datos corresponden a toda la población
se puede denotar por µ
Mediana

• La mediana es un valor que se localiza en el centro de los datos


ordenados (de menor a mayor o de mayor a menor).

• Se Identifica con las letras Mdn. Si los datos corresponden a una


muestra, la mediana se suele denotar por ̃.

• Si la cantidad de datos es impar, la mediana es el dato que se


encuentra en el centro, una vez que los datos han sido ordenados. Si
la cantidad es par, se promedian los dos datos centrales, y la mediana
no necesariamente es uno de los datos.
Moda

• La moda es el valor que más se repite en el conjunto de datos, es


decir, es el dato con mayor frecuencia. Se puede identificar con las
letras Mo y se suele usar el símbolo ̂ para la moda de una muestra.

• Puede haber una moda, varias modas y también puede no haber


ninguna.

También podría gustarte