Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Coahuila
Facultad de Contaduría y
Administración
Licenciatura en Administración de
Empresas Gastronómicas y Turísticas
PORTAFOLIO DE EVIDENCIAS
MATRICULA: 22222945
1
Misión
Formar profesionistas especializados en la toma de decisiones, generando
controles internos e información financiera en forma veraz para los sectores
público y privado, con pertinencia laboral, empresarial y social para coadyuvar en
el desarrollo político, económico y social de la República. Mexicana.
Visión
2
ESTADISTICA DESCRIPTIVA E INDUCTIVA
Estadística Descriptiva.
La estadística descriptiva es la técnica matemática que obtiene, organiza,
presenta y describe un conjunto de datos con el propósito de facilitar el uso,
generalmente con el apoyo de tablas, medidas numéricas o gráficas.
Ejemplo:
Un ejemplo fácil de la estadística descriptiva sería calcular la media de goles en un
partido por un futbolista, en esto tratamos de describir una variable, o sea, el
número de goles que este caso sería mediante el cálculo de una métrica.
Otro ejemplo podría ser calcular en una población la frecuencia del color de ojos
en los individuos, por decirlo así, el 30% de los individuos tienen los ojos verdes, el
60% los tiene marrones y el 10% restante los tiene azules, esto se trataría de una
variable cualitativa ya que describimos la cualidad y frecuencia de estos reflejada
en datos numéricos.
Por último, una heladería dispone una variedad de sabores de helados y quiere
mejorar las ventas, sus dueños logran un estudio donde cuentan la cantidad de
clientes diarios, así, los separa en grupos por sexo y edades, en este estudio se
registra sus sabores preferidos y cuál es la presentación más vendida, por lo tanto,
con los datos adquiridos planifican cuáles serán las compras de helados.
Estadística Inductiva.
Estadística inferencial o estadística inductiva; es la estadística que tiene como
objetivo obtener conclusiones sobre el total de la población a partir de los datos
obtenidos en un subconjunto de esta o grupo de elementos representativos
(muestra).
Ejemplo:
Análisis de mercado. Las empresas a menudo contratan otras empresas
especializadas en marketing para que analicen sus nichos de mercado a través de
diversas herramientas estadísticas y diferenciales, como encuestas y focus
groups, a partir de las cuales deducir qué productos prefiere la gente y en qué
contexto, etc.
3
HISTORIA DE LA ESTADÍSTICA
La estadística es mucho más que sólo números apilados y gráficas bonitas. Es
una ciencia con tanta antigüedad como la escritura, y es por sí misma auxiliar de
todas las ciencias –medicina, ingeniería, sociología, psicología, economía,
etcétera–, así como de los gobiernos, mercados y otras actividades humanas.
Desde los comienzos de la civilización han existido formas sencillas de
estadísticas, pues ya se utilizaban representaciones gráficas y otros símbolos en
pieles, rocas, palos de madera y paredes de cuevas para contar el número de
personas, animales y otras cosas.
Hacia el año 3000 a. de C. los babilonios utilizaban ya pequeñas tablillas de arcilla
para recopilar datos sobre la producción agrícola y los géneros vendidos o
cambiados mediante trueque.
En el antiguo Egipto, los faraones lograron recopilar, alrededor del año 3050 a. de
C., prolijos datos relativos a la población y la riqueza del país; de acuerdo con el
historiador griego Heródoto, dicho registro de la riqueza y la población se hizo con
el propósito de preparar la construcción de las pirámides.
En el antiguo Israel, la Biblia da referencia, en el libro de los Números, de los
datos estadísticos obtenidos en dos recuentos de la población hebrea.
En China ya había registros numéricos similares con anterioridad al año 2000 a.
de C.
Los griegos, hacia el año 594 a. de C., efectuaron censos periódicamente con
fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y
hombres disponibles). La investigación histórica revela que se realizaron 69
censos para calcular los impuestos, determinar los derechos de voto y ponderar la
potencia guerrera.
Pero fueron los romanos, maestros de la organización política, quienes mejor
supieron emplear los recursos de la estadística. Cada cinco años llevaban a cabo
un censo de la térpoblación, y los funcionarios públicos tenían la obligación de
anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos
periódicos del ganado y de las riquezas contenidas en las tierras conquistadas. En
la época del nacimiento de Cristo sucedía uno de estos empadronamientos de la
población bajo la autoridad del Imperio.
4
Francia, más o menos por la misma época, la ley exigía a los clérigos registrar los
bautismos, fallecimientos y matrimonios.
Durante un brote de peste que apareció a fines del siglo XVI, el gobierno inglés
comenzó a publicar estadísticas semanales de los decesos. Esa costumbre
continuó muchos años, y en 1632 los llamados Bills of Mortality (Cuentas de
Mortalidad) ya contenían datos sobre los nacimientos y fallecimientos por sexo.
En 1662, el capitán John Graunt compiló documentos que abarcaban treinta años,
mediante los cuales efectuó predicciones sobre el número de personas que
morirían de diversas enfermedades, así como de las proporciones de nacimientos
de hombres y mujeres que cabía esperar.
Durante el siglo XVII se aportaron indicaciones más concretas sobre los métodos
de observación y análisis cuantitativo y se ampliaron los campos de la inferencia y
la teoría estadística.
El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar
en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en
Breslau. Este investigador se propuso destruir la antigua creencia popular de que
en los años terminados en 7 moría más gente que en los restantes, y para lograrlo
hurgó pacientemente en los archivos parroquiales de la ciudad.
Durante ese mismo siglo y principios del XVIII, matemáticos como Bernoulli,
Maseres, Lagrange y Laplace desarrollaron la teoría de probabilidades. No
obstante, durante cierto tiempo la teoría de las probabilidades limitó su aplicación
a los juegos de azar, y no fue sino hasta el siglo siguiente que comenzó a
aplicarse a los grandes problemas científicos.
Durante el sigo XVIII empieza el auge de la estadística descriptiva en asuntos
sociales y económicos, y es a finales de ese siglo y comienzos del XIX cuando se
comienzan a asentar verdaderamente las bases teóricas de la teoría de
probabilidades con los trabajos de Joseph Louis Lagrange y Pierre Simon de
Laplace, del brillantísimo y ubicuo matemático y astrónomo alemán Carl Friedrich
Gauss, y de Simeón-Denis Poisson.
5
En el periodo de 1800 a 1820 se desarrollaron dos conceptos matemáticos
fundamentales para la teoría estadística: la teoría de los errores de observación,
aportada por Laplace y Gauss, y la teoría de los mínimos cuadrados, realizada por
Laplace, Gauss y Legendre.
A finales del siglo XIX, Sir Francis Galton ideó el método conocido como
correlación, que tenía por objeto medir la influencia relativa de los factores sobre
las variables.
Kurt Pearson. Este último publicó en 1892 el libro The Grammar of Science (La
gramática de la ciencia), un clásico en la filosofía de la ciencia, y fue él quien ideó
el conocido test de Chi -cuadrado.
Ronald Arnold Fisher la figura más influyente de la estadística, su libro Statistical
Methods for Research Workers (Métodos estadísticos para los investigadores),
publicado en 1925, ha sido probablemente el libro de estadística más utilizado a lo
largo de muchos años.
En el siglo XIX, con la generalización del método científico para estudiar todos los
fenómenos de las ciencias naturales y sociales, los investigadores vieron la
necesidad de reducir la información a valores numéricos para evitar la
ambigüedad de las descripciones verbales.
En nuestros días, la estadística se ha convertido en un método efectivo para
describir con exactitud los valores de los datos económicos, políticos, sociales,
psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y
analizar dichos datos.
6
ORDENAMIENTO DE DATOS
¿Qué es el ordenamiento de datos?
La ordenación organiza los datos en orden alfabético o numérico ascendente o
descendente. Por ejemplo, puede ordenar una columna que enumere los valores
de las ventas de un producto en orden descendente para ordenar las ventas del
producto de la más alta a la más baja.
Conceptos básicos
Clase: Es el número de subconjuntos en que se han agrupado los datos. Cada
clase se puede denominar mediante una letra, un número o alguna característica
del subconjunto.
FORMULA
K=1+3.322LonN
k=numero de clase N=total de frecuencia Log=logaritmo N
Limites reales: Consiste en unir el limite superior con el límite inferior inmediato en
la clase
7
INTRODUCCIÓN A LAS TABLAS DE
FRECUENCIAS
¿Qué es una tabla de frecuencias?
Las tablas de distribución de frecuencias se utilizan cuando se recolectan datos,
con ellas se pueden representar los datos de manera que es más fácil analizarlos.
Se pueden elaborar tablas de distribución de frecuencias para datos no agrupados
y para datos agrupados.
Una vez obtenido el número de datos total, conocido con el símbolo de sigma (una
M acostada) sigue la columna de la frecuencia absoluta acumulada (F). Que se
basa en acumular las frecuencias de la columna anterior.
8
DISTRIBUCIÓN DE FRECUENCIA CON DATOS
AGRUPADOS
Tablas de Frecuencia: Las tablas de frecuencia se pueden utilizar en las tiendas
de la esquina, supermercados, empresas nacionales y trasnacionales; así como la
economía
mundial
Conceptos básicos
CLASES
CONCEPTOS DERIVADOS
Limite real: los intervalos de clase son mutuamente excluyentes se obtiene como
el punto entre el límite, superior de una clase y el límite inferior de la
Otra.
Frecuencia acumulada: la frecuencia total de todos los valores menos que el límite
real superior de clase de un intervalo de clase dado.
9
DATOS NO AGRUPADOS
¿QUÉ SON LOS DATOS NO AGRUPADOS?
Los datos no agrupados constituyen del conjunto de datos que no han sido
clasificados y que son presentados en una tabla de datos en forma individual, es
decir que no forman parte de un conjunto.
Son aquellos que no han recibido ningún tratamiento o clasificación luego de ser
recolectados.
Estos se miden con las medidas de tendencia central, las cuales son la media,
mediana y moda.
• LA MEDIA (x): Está determinada por el valor
en promedio de una serie de conjunto de datos numéricos. Se calcula sumando
todos los valores y dividiéndolos entre el valor de n que es el número total de
datos.
• LA MEDIANA(Me): Es el valor encontrado en el centro del conjunto de los datos
luego de haber sido ordenados.
• LA MODA(Mo): es el dato que más se repite o cuya frecuencia es mayor. Para
calcular la moda se deben escribir los números del conjunto y luego escribir el
número o los números que se repiten mayor cantidad de veces.
10
• Se emplea cuando hay un número alto de datos. Estos se agrupan en intervalos
o clases para facilitar su tabulación y análisis. Está indicado para representarlos
en un histograma. Como en el caso anterior, se utiliza tanto para variables
cuantitativas como en variables cualitativas ordinales. Los pasos iniciales para
formar una tabla de frecuencias con datos agrupados están encaminados a
determinar el número de intervalos y definirlos (siempre que no se conozcan de
antemano).
11
HISTOGRAMA
¿QUÉ ES UN HISTOGRAMA?
Un histograma muestra la forma de los valores, o la distribución, de una variable
continua. ya que se miden sobre una escala con muchos valores posibles. Algunos
ejemplos de datos continuos son:
• Edad
• Presión sanguínea
• Peso
• Temperatura
• Velocidad
WILLIAM PLAYFAIR
➢ El ingeniero y economista escocés William Playfair (1759– 1823) es
considerado el padre de los gráficos estadísticos. Fue pionero en el uso del
gráfico de líneas para representar series temporales y fue el creador del
gráfico de barras y del gráfico circular.
➢ En la parte final de su vida, comienza a escribir. Fruto de esta actividad es
The Commercial and Political Atlas (1786) considerado la primera obra de
representación gráfica de datos. Este atlas estadístico utiliza 43 gráficos de
líneas y un gráfico barras. Con posterioridad publicaría The Statistical
Breviary (1801) donde aparecerían por primera vez los gráficos circulares y
los gráficos de tarta.
➢ Más allá de diseñar los gráficos básicos usados hoy en día en cualquier
trabajo estadístico, este ingeniero escocés sentó las bases de la
visualización de datos.
12
SEGUNDO PARCIAL
13
COMBINACION CON Y SIN REPETICION
COMBINACIÓN CON REPETICION
La combinatoria con repetición son los diferentes conjuntos que se pueden formar
con «n» elementos, seleccionados de x en x, permitiendo que estos se puedan
repetir. Cada conjunto se debe diferenciar del anterior en al menos uno de sus
elementos (el orden no importa).
EJEMPLO: Imaginemos que estamos en una bodega que dispone de 7 variedades
de vino. Queremos escoger 3 de sus variedades pudiendo elegir entre tinto,
rosado, blanco, tinto especial, rosado especial, blanco especial y afrutado. Dado
que los sucesos no son mutuamente excluyentes, en nuestra selección podemos
repetir cualquiera de los elementos. Siendo así y poniendo algunos ejemplos
podemos elegir tinto, tinto y rosado especial o rosado, rosado y tinto o blanco,
blanco y rosado.
Por lo tanto, la combinatoria con repetición nos dice cómo formar o agrupar una
cantidad de datos/observaciones finitas, en grupos de una cantidad determinada,
pudiéndose repetir alguno de sus elementos. Esta es la principal diferencia entre
la combinatoria con repetición (se pueden repetir los elementos en cada selección)
y la combinatoria sin repetición (no se puede repetir ningún elemento en cada
selección)
14
Para calcular el numerador tendríamos que calcular la factorial de 15, el cual sería
15*14*13...1 y en el denominador tendríamos la factorial de 6 (6*5*4...*1)
multiplicado por la factorial de 9 (9*8*7...1).
Nuestro resultado sería: 1.307.674.368.000,00/720*362.880 = 5.005
Podemos ver que, aunque las variedades entre las que podemos elegir no son
muy elevadas, al poder repetir los elementos, las combinaciones que se pueden
dar son enormes.
15
INTRODUCCIÓN A LA TEORIA DE LA
PROBABILIDAD
Introducción: Los primeros estudios de probabilidad fueron motivados por la
posibilidad de acierto o fracaso en los juegos de azar. La probabilidad es un
mecanismo por medio del cual pueden estudiarse sucesos aleatorios, es decir,
operaciones cuyo resultado no puede ser predicho de antemano con seguridad.
Por ejemplo, el lanzamiento de una moneda.
La probabilidad puede ser definida como la ocurrencia del evento deseado o casos
exitosos sobre todos los resultados posibles, en un determinado espacio muestral.
La probabilidad mide la mayor o menor posibilidad de que se dé un determinado
resultado (suceso o evento) cuando se realiza un experimento aleatorio (Que
depende del azar o de la suerte), la probabilidad se define como un número o
valor que expresa la frecuencia con que se espera que se repita un evento o
fenómeno en el futuro
¿Qué es un experimento aleatorio? Son aquellos experimentos en los que no se
puede predecir su resultado.
¿Qué es un espacio muestral? El espacio muestral o espacio de muestreo es un
conjunto de todos los resultados posibles individuales de un experimento aleatorio,
esta nos sirve para calcular la frecuencia con que se obtiene los resultados de una
experiencia aleatoria.
¿Qué es un evento o suceso? Uno o varios de los posibles resultados.
Teoría de conjuntos
Es una rama de las matemáticas que estudia las propiedades y relaciones de los
conjuntos, colecciones abstractas de objetos, consideradas como objetos en sí
mismas.
Los conjuntos y sus operaciones más elementales son una herramienta básica en
la formulación de cualquier teoría matemática.
La palabra conjunto denota una colección de elementos relacionados claramente
entre sí, que guardan alguna característica en común. Ya sean números,
personas, figuras, ideas y conceptos.
¿Qué es un conjunto? Un conjunto es la agrupación, clase, o colección de objetos
o en su defecto de elementos que pertenecen y responden a la misma categoría o
grupo de cosas, por eso se los puede agrupar en el mismo conjunto. Entre los
objetos o elementos susceptibles de integrar o conformar un conjunto se cuentan
16
por supuesto cosas físicas, como pueden ser las mesas, sillas y libros, pero
también por entes abstractos como números o letras.
Clases de conjuntos
Conjunto Finito: Es el conjunto al que se le puede determinar su cardinalidad (El
cardinal indica el número o cantidad de elementos de un conjunto, sea esta
cantidad finita o infinita) o puede llegar a contar su último elemento. Ejemplo:
M= ("/x es divisor de 24)
M= (1, 2, 3, 4, 6, 8, 12,24)
Conjunto Infinito: Es el conjunto que, por tener muchísimos elementos, no se le
puede llegar a contar su último elemento. Ejemplo: A= ("/x sea grano de sal)
Conjunto Vacío. Es el conjunto cuya cardinalidad es cero ya que carece de
elementos. El símbolo del conjunto vacío O (). Ejemplo: C= ("/x sea habitantes del
sol)
Conjunto Unitario: Es el conjunto que solo tiene un elemento. Su cardinalidad es
uno (1). Ejemplo: D= {*/x sea vocal de la palabra "pez")
Algebra de conjuntos
Existen unas operaciones básicas que permiten manipular los conjuntos y sus
elementos, similares a las operaciones aritméticas, constituyendo el álgebra de
conjuntos
Unión: La unión de dos conjuntos A y B es el conjunto de todos los elementos que
pertenecen al conjunto A, al conjunto B o a ambos; A U B
Intersección: La intersección de dos conjuntos A y B es el conjunto cuyos
elementos U pertenecen simultáneamente a A y B. Es decir, A B que contiene
todos los elementos comunes de A y B
Diferencia: La diferencia entre dos conjuntos A y B es el conjunto A / B que
contiene todos los elementos de A que no pertenecen a B.
Complemento: Se llama A complemento al conjunto formado por todos los
elementos del universo menos los elementos del conjunto A.
17
Probabilidad clásica.
Probabilidad.
Rama de las matemáticas que estudia los resultados posibles de los fenómenos
aleatorios. Por ejemplo: el lanzamiento de una moneda, el lanzamiento de un
dado, extracción de una carta de un mazo de naipes. Etc. Hay muchas formas de
calcular la probabilidad de un hecho.
Probabilidad clásica.
La probabilidad clásica de un evento es la razón entre el número de casos
(suceso) favorables, y el número total de casos (sucesos) posibles, siempre que
nada obligue a creer que algunos de estos sucesos deben tener preferencia a los
demás, lo que hace que sean igualmente posibles.
Una de las características de un experimento aleatorio es que no se sabe qué
resultado particular se obtendrá al realizarlo. Es decir, si A es un suceso asociado
con un experimento aleatorio, no podemos indicar con certeza si A ocurrirá o no en
una prueba en particular. Por lo tanto, puede ser importante tratar de asociar un
número al suceso A que mida la probabilidad de que el Suceso ocurra. Este
número es el que llamaremos P(A).
La probabilidad de un evento A: P (A), es un NÚMERO, que mide el grado de
certeza en el que un evento A ocurre, y se obtiene con la fórmula conocida como
REGLA DE LAPLACE:
Si un suceso puede ocurrir de N maneras mutuamente excluyentes e igualmente
probables. y m de ellas poseen una característica A.
18
PROBABILIDAD COMPUESTA
La probabilidad compuesta (o regla de multiplicación de probabilidades) se deriva
de la probabilidad condicionada:
La probabilidad de que se den simultáneamente dos sucesos (suceso intersección
de A y B) es igual a la probabilidad a priori del suceso A multiplicada por la
probabilidad del suceso B condicionada al cumplimiento del suceso A.
La fórmula para calcular esta probabilidad compuesta es:
SUCESOS INDEPENDIENTES
Cuando un suceso previo NO afecta al siguiente suceso
Fórmula: P(AMB)=P(A)x (B)
SUCESOS DEPENDIENTES
Cuando un suceso previo afecta al siguiente suceso
• Imaginemos que en el anterior ejemplo NO volvemos a meter la bola al
Formula: P(ANB)=P(A)x(B/A)
19
RELACIONES ENTRE EVENTOS
RELACIONES ENTRE EVENTOS O SUCESOS
Entre los eventos compuestos se pueden establecer distintas relaciones:
20
PROBABILIDAD CONDICIONAL
A la probabilidad de que un suceso A ocurra cuando se sabe que el suceso B
ocurrió.
¿CÓMO SE CALCULA?
EJEMPLO
La siguiente tabla representa a estudiantes del último año de una escuela donde
figura el sexo y si trabaja o no.
21
TERCER PARCIAL
DISTRIBUCIÓN NORMAL
• Es una distribución de probabilidad continua.
• También nombrada distribución de Gauss.
• Modelo probabilístico más importante.
• Sus parámetros son la media y la desviación típica o.
CARACTERÍSTICAS
• Media, moda y mediana coinciden en el máximo de la curva
• El área encerrada bajo la campana y el eje x es igual a la unidad.
• Los puntos de inflexión son los puntos u t o y u- o
22
• Muestra suficientemente grande, la distribución de las medias sigue
aproximadamente una distribución normal.
• El tamaño de la muestra depende de la forma de la distribución original.
• Distribución simétrica -> tamaño pequeño podría producir una aproximación
adecuada.
= Distribución considerablemente asimétrica >- Tamaño de muestra más grande.
• Se aplica independientemente de la forma de la distribución de la población.
Muestras de tamaño n de una población
• No importa la forma de la distribución original de la población, la distribución de
promedios seguirá una distribución normal.
• Útil para probar hipótesis
• Puede demostrar que la muestra representa a una población distinta de la
conocida.
• La comprobación se hace directamente aplicando este teorema
Si la probabilidad de observar que el promedio en estudio es mayor (o menor) es
lo suficientemente baja, entonces se puede rechazar la afirmación (hipótesis nula)
de que la muestra es como las otras.
23
DISTRIBUCIÓN CONTINUA
¿Qué es una distribución continua?
● Una distribución continua describe las probabilidades de los posibles valores de
una variable aleatoria continua. Una variable aleatoria continua es una variable
aleatoria con un conjunto de valores posibles (conocido como el rango) que es
infinito y no se puede contar.
● Las probabilidades de las variables aleatorias continuas (X) se definen como el
área por debajo de la curva de su PDF. Por lo tanto, solo los rangos de valores
pueden tener una probabilidad diferente de cero. La probabilidad de que una
variable aleatoria continua equivalga a algún valor siempre es cero.
Funcion de distribución continúa
Para calcular las probabilidades cuando tenemos una variable aleatoria continua,
utilizamos lo que se llama la función de densidad. Para que una función f(x)sea
una función de densidad de una variable aleatoria continua sobre la recta real,
debe cumplir:
● f(x)≥0, para todo x en un rango [a,b].
● El área bajo la curva y por encima del eje de abscisas es igual a 1.
● El rango [a,b] delimita los valores que la variable puede tomar.
Debido a esto, la probabilidad de que el valor de una variable continua aleatoria X
esté dentro de un intervalo [a,b] es el área bajo la curva dentro de este intervalo:
Esto implica que la probabilidad de que una variable aleatoria tome un valor
concreto es nulo, puesto que, por definición:
24
DISTRIBUCIÓN BERNOULLI
La distribución de Bernoulli es un modelo probabilístico discreto que describe la
probabilidad de obtener un resultado binario (éxito o fracaso) en un solo ensayo o
experimento. Es decir, para cualquier evento aleatorio con dos resultados posibles,
la distribución de Bernoulli describe la probabilidad de que ocurra uno de esos
resultados.
26
describió la distribución de probabilidad para un solo ensayo, que más tarde sería
conocida como la distribución de Bernoulli.
Sin embargo, la distribución de Bernoulli se popularizó y se convirtió en una
herramienta fundamental en la teoría de la probabilidad y la estadística gracias al
trabajo de otros matemáticos posteriores, como Pierre-Simon Laplace y Adolphe
Quetelet, quienes utilizaron la distribución para modelar eventos binarios en una
amplia variedad de disciplinas, desde la física hasta la biología y la economía.
Hoy en día, la distribución de Bernoulli es una de las distribuciones de probabilidad
más fundamentales y ampliamente utilizadas en la estadística y la investigación de
operaciones, y ha sido la base para el desarrollo de otras distribuciones de
probabilidad, como la distribución binomial, la distribución geométrica y la
distribución de Poisson.
27
DISTRIBUCIÓN GEOMÉTRICA
La distribución geométrica tiene un gran parecido con la distribución binomial ya
que también consiste en una serie de ensayos donde pueden ocurrir éxitos o
fracasos. Además, cada ensayo es idéntico e independiente del otro, sin embargo,
no hay un número fijo n de ensayos, sino que el experimento se repite hasta que
se consiga el éxito.
Todo esto explicado quiere decir que:
28
DISTRIBUCIÓN HIPERGEOMETRICA
Es una distribución de probabilidad discreta relacionada con muestreos aleatorios
y sin reemplazo. Suponga que se tiene una población de N elementos de los
cuales, K pertenecen a la categoría A y N - K pertenecen a la categoría B. La
distribución hipergeométrica mide la probabilidad de obtener x (0 ≤ x ≤ K)
elementos de la categoría A en una muestra sin reemplazo de n elementos de la
población original.
29
TERMINOLOGIA DE MUESTREO
Muestreo
El proceso de seleccionar a los participantes de la investigación de una población
objetivo que tienen las características de esa población . En la investigación
cuantitativa, los investigadores están interesados en sacar conclusiones sobre una
población que tiene características comunes que les interesan
Tipos de muestreo
Existen dos tipos de muestreo que son el muestreo aleatorio o probabilístico y el
muestreo no aleatorio o no probabilístico, todos útiles para la selección de
muestras, sin embargo, se escogerán dependiendo con los recursos con que se
cuente y el tipo de investigación a realizar.
Muestra y muestreo
Se denomina muestreo al proceso por el que generamos las muestras. Una
muestra es una parte (un subconjunto) de la población, y se desea que la muestra
sea lo más representativa posible de la población de la que procede.
30
DISTRIBUCIÓN DE MUESTREO
Una distribución de muestral es una distribución de probabilidad de una estadística
obtenida de un mayor número de muestras extraídas de una población específica.
La distribución muestral de una población dada es la distribución de frecuencias
de un rango de resultados diferentes que posiblemente podrían ocurrir para una
estadística de una población.
En estadística, una población es el conjunto completo del que se extrae una
muestra estadística. Una población puede referirse a un grupo completo de
personas, objetos, eventos, visitas al hospital o mediciones.
Saber cuán separada está la media de cada uno de los conjuntos de muestras
entre sí y de la media de la población dará una indicación de qué tan cerca está la
media de la muestra de la media de la población. El error estándar de la
distribución muestral disminuye a medida que aumenta el tamaño de la muestra.
En palabras más simples, supongamos que de una determinada población tomas
todas las muestras posibles de tamaño n y calculas una estadística (por ejemplo,
media) de todas las muestras. Si luego preparas una distribución de probabilidad
de esta estadística, obtendrás una distribución de muestreo.
31
•Donde σ es la desviación estándar de la distribución de la población y σx̄ es la
media de población.
32
ERROR MUESTRAL
En estadística, error muestral o error de estimación es el error que surge a causa
de observar una muestra de la población completa. La estimación de valor de
interés, como la media o el porcentaje, estará generalmente sujeta a una variación
entre una muestra y otra.
Tipos de errores muestrales más comunes: Este tipo de errores no se deben
al hecho de inferir el todo de una parte (como sí ocurre con el error muestral), sino
que se deben a otras causas, ocurridas en el propio diseño o la realización del
trabajo, ya sea en la definición del colectivo a investigar, en la forma de
seleccionar a las personas entrevistadas, en la mala praxis de los entrevistadores,
en la ausencia de control de calidad, etc.
Algunos de estos errores y problemas son:
• Falta de respuesta: Efecto de los rechazos y las ausencias de personas en
el hogar. La muestra final puede estar compuesta por un perfil de persona
muy diferente a la que buscamos si la tasa de rechazo o ausencia es muy
alta.
• Problemas de calidad/veracidad de la información: Tanto por mala praxis
de los entrevistadores como de los entrevistados, que proporcionan
información incorrecta por diferentes motivos (por error, con intencionalidad
maliciosa, por deseabilidad social...).
• Problemas en el procesamiento/tratamiento de la información: Errores
de codificación u otros errores de procesamiento cometidos en el proceso de
trabajo.
• Error de definición del colectivo objeto de estudio: Este inconveniente se
produce cuando el investigador no sabe bien a quién debe preguntar.
Imagínese un producto de alimentación sobre el que deseamos conocer
diversas cuestiones, ¿debemos entrevistar a la persona que hace la compra
o a la persona que la consume dentro del hogar? En función de nuestras
necesidades y objetivos deberíamos optar por una u otra. Si nos
equivocamos, no obtendremos la información precisa.
• Error de marco muestral: Este fallo se comente cuando el investigador, a la
hora de elegir la muestra, apunta a la subpoblación equivocada. Por ejemplo,
seleccionar la muestra a partir de números de móvil sin tener en cuenta que
existen ciertas personas sin teléfono móvil (personas mayores y/o con
problemas de aprendizaje).
• Error de selección: Cuando son los propios entrevistados los que eligen
participar o no en la encuesta; por lo tanto, solo responderán aquellos a los
que les interese el tema tratado.
33
MUESTREO JUICIO Y ALEATORIO
El método de muestreo discrecional (o muestreo por juicio) es un método de
muestreo no probabilístico. Los sujetos se seleccionan a base del conocimiento y
juicio del investigador.
El investigador selecciona a los individuos a través de su criterio profesional.
Puede basarse en la experiencia de otros estudios anteriores o en su
conocimiento sobre la población y el comportamiento de ésta frente a las
características que se estudian.
Ejemplos
• Supongamos que el investigador va a realizar un estudio sobre el nivel de
satisfacción del profesorado de cierta universidad. El estudio se suele realizar
cada dos años, por lo que el responsible del estudio, gracias a su experiencia y
sus antecedentes, sabe perfectamente cual puede ser la mejor muestra para el
estudio.
• A un jefe de estudios le encomiendan un estudio del nivel de satisfacción de los
alumnos con un determinado profesor. El investigador, que conoce a todos los
alumnos de esa clase, decide utilizar el muestreo discrecional seleccionando a los
alumnos que cree que serán los más representativos.
¿Cuándo utilizarlo?
• Este método de muestreo es aconsejable cuando el responsible del estudio
conoce estudios anteriores similares o idénticos y sabe con precisión que la
muestra que utilizaron fue útil para el estudio.
• Si la población es muy reducida y conocida por el investigador.
El muestreo aleatorio es un proceso que permite obtener una muestra sobre una
población, basada en una determinada probabilidad de elección de los individuos
que la conforman.
Con el muestreo aleatorio, por tanto, lo que hacemos es plantear un método de
elección. Un método que tiene en cuenta diferentes probabilidades. Esto lo
diferencia de los métodos no aleatorios en que es la subjetividad del investigador
la que decide la selección de la muestra.
34
Por último, permite utilizar muestras de pequeño tamaño en poblaciones grandes.
Eso sí, hay fórmulas para calcular esas muestras mínimas con poblaciones
conocidas o desconocidas.
35
TERMINOLOGÍA DE REGRESIÓN Y
CORRELACIÓN
36
REGRESIÓN LINEAL Y CORRELACIÓN
¿Qué es la regresión lineal?
La regresión lineal es una técnica de análisis de datos que predice el valor de
datos desconocidos mediante el uso de otro valor de datos relacionado y
conocido. Modela matemáticamente la variable desconocida o dependiente y la
variable conocida o independiente como una ecuación lineal.
Fórmula
Correlación
▪ Medida estadística que expresa hasta qué punto dos variables están
relacionadas linealmente (esto es, cambian conjuntamente a una tasa constante).
Es una herramienta común para describir relaciones simples sin hacer
afirmaciones sobre causa y efecto.
Tipos de correlación
Según cómo sea la relación que hay entre dos variables aleatorias, se distinguen
los siguientes tipos de correlación lineal:
▪ Correlación directa (o correlación positiva): una variable aumenta cuando la otra
también aumenta.
▪ Correlación inversa (o correlación negativa): cuando una variable aumenta la otra
disminuye, y al revés, si una variable disminuye la otra aumenta.
▪ Correlación nula (sin correlación): no existe ninguna relación entre las dos
variables.
Fórmula
37