Está en la página 1de 9

PROBABILIDAD Y ESTADISTICA

ESTADISTICA DESCRIPTIVA
ORIGEN HISTÓRICO

La estadística, tuvo sus inicios en los grandes imperios de la antigüedad, los primeros antecedentes
que se conocen para llevar un registro de sus pertenencias son las tablillas de arcilla utilizadas por los
babilonios 5000 A.C. Más tarde las culturas posteriores a los babilonios realizaban registros de bienes,
soldados, esclavos, etc. Y más tarde la implementación de censos de población.

A mediados del siglo XVII la estadística tuvo un gran desarrollo cuantitativo, ya que, en esa época, los
imperios del viejo continente tenían la necesidad de llevar un buen control administrativo de sus actividades
comerciales y bélicas, entre otras, donde sus registros y operaciones consistían en números.

Posteriormente se inicia el estudio de la probabilidad, que junto con la estadística permite estudiar
problemas donde intervienen fenómenos aleatorios que no se pueden predecir.

En la actualidad la estadística junto con el cálculo de probabilidades tiene una gran aplicación en todas
las actividades que realiza el hombre, tales como: predicciones, censos, control de calidad, etc.

No es posible ubicar exactamente en la historia la aparición de la estadística, sin embargo, se supone


que su desarrollo estuvo ligado con el surgimiento de los diferentes sistemas de numeración y escritura creados
por las civilizaciones antiguas en diferentes épocas y lugares, todo esto permitía el registro y comunicación de
los datos relacionados con diferentes actividades y se hicieron más complejos en el transcurso del tiempo.

Actividad 1
Desarrolla la siguiente actividad y repórtala en tu classroom, con nombre completo y grupo.

¿Qué más puedes contar de la historia de la estadística? (investiga y reporta en


hojas tamaño carta).

Ahora vamos a conocer más sobre estadística y como se emplea en el ámbito académico, social y global.

CONCEPTO DE ESTADÍSTICA
Estadística es un conjunto de técnicas para la colección, manejo, descripción y análisis de información,
de manera que las conclusiones obtenidas de ella tengan un grado de confiabilidad especificado.

CLASIFICACIÓN DE LA ESTADÍSTICA

La estadística para su estudio se divide en dos grandes ramas:

Estadística descriptiva: Es la parte encargada de la recolección, clasificación, ordenamiento, presentación y


descripción de un conjunto de datos (como la edad de una población, altura de los
estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de
describir apropiadamente las diversas características de ese conjunto.

Estadística inferencial: También se le conoce como Estadística Inductiva, y es la parte que se encarga de
estudiar y analizar las medidas descriptivas y en base a esto, sacar conclusiones y
tomar de decisiones con el mayor grado de confiabilidad.

APUNTES REALIZADOS POR: Ing. Citlali Sofía Rincón Ruíz 1


PROBABILIDAD Y ESTADISTICA

Los resultados que se obtienen de la estadística descriptiva, se presentan por lo general en cualquiera
de las tres formas siguientes:

TABULAR. Mediante una tabla, en la cual se encuentran los datos organizados y clasificados del objeto que
se estudia.
MEDIDAS ESTADÍSTICAS. Mediante números, de los cuales se obtienen al aplicar un método o procedimiento
a un conjunto de datos.
GRAFICAS. Mediante un diagrama, en el cual se presentan de una manera objetiva los datos organizados en
una figura ilustrativa.

LOS FENÓMENOS QUE ESTUDIA LA ESTADÍSTICA

Se pueden clasificar en dos grandes grupos:

1.- Fenómenos deterministas: También se les llama fenómenos determinísticos y son aquellos que obedecen
leyes o principios plenamente demostrados, por lo que en este tipo de fenómenos resulta sencillo elaborar
predicciones sobre su concurrencia, desarrollo y efecto final, por ejemplo: los eclipses, una reacción
química, la caída libre de los cuerpos, un tiro parabólico, la germinación de una semilla, etc. Mediante las
observaciones repetidas y las medidas descriptivas de los datos que se obtienen, la estadística permite
obtener y comunicar de una manera más exacta los resultados y conclusiones sobre los fenómenos
deterministas.

2.- Fenómenos aleatorios: Son aquellos que no obedecen a ninguna ley y generalmente pueden tener dos o
más resultados diferentes, mediante su observación repetida y el estudio de sus datos se pueden llegar a
obtener predicciones y tomar decisiones con el más alto grado de confiabilidad, por ejemplo, los juegos de
azar, los terremotos, huracanes, la economía, etc.

POBLACIÓN Y MUESTRA

Para la recolección de datos se ha ideado y desarrollado diferentes métodos que tienen como principal
objetivo hacer que la muestra sea representativa de la población, ya que de esta manera, las conclusiones que
se obtengan del estudio de la muestra se podrán hacer extensivas a toda la población.

Población: Se define como un grupo, colección u ordenamiento de objetos, individuos o medidas


perfectamente definidos. Para la estadística es importante que una población se encuentre bien
definida ya que de esta manera se puede decidir si un objeto pertenece o no a ella. Una población
puede ser finita o infinita.

La población finita: está formada por un número determinado de elementos.


La población infinita: no se tiene determinado el número de elementos en estudio.

Muestra: Es una parte de una población, es fundamental que una muestra sea representativa de la población
de la cual procede, ya que de esta manera los resultados y las conclusiones que se obtengan al
estudiar la muestra se podrán hacer extensivas a toda la población.

APUNTES REALIZADOS POR: Ing. Citlali Sofía Rincón Ruíz 2


PROBABILIDAD Y ESTADISTICA

CLASIFICACIÓN DE LAS VARIABLES

Para el estudio de un proceso estadístico, las variables se clasifican en:

Cualitativas

Variables
Discretas
Cuantitativas
Continuas

Las variables cuantitativas. Son aquellas que se representan a través de un valor numérico, que en
una recopilación de datos se obtiene mediante conteo o medición de las características en estudio. Se clasifican
en discretas y continuas.

Las variables discretas. Son las que están asociadas a un proceso de conteo, es decir que solo
pueden tomar algún valor de una escala de medición, por ejemplo, en un salón de clases puede haber 32 o 33
alumnos, pero nunca 32.4 alumnos.

Las variables continuas. Están asociadas a un proceso de medición y pueden adquirir cualquier valor
en una escala de medición, éste es, que, si tienen dos valores dados, siempre puede existir otro valor
intermedio, por ejemplo, un hombre puede medir 1.71m, otro 1.72m y un tercero un valor comprendido entre
estos, tal como 1.714m.

MÉTODOS DE MUESTREO O SELECCIÓN DE UNA MUESTRA

Los métodos empleados deberán poseer características que nos faciliten alcanzar resultados óptimos.
Entre las propiedades que podemos anotar:
a) Que proporcionen la máxima información contenida en los datos en forma rápida y fácil de visualizar.
b) Que posean sencillez operativa.
c) Que permitan presentar los datos de una manera estética.

Los métodos tabulares y gráficos nos permiten organizar y presentar datos de tal forma que los
aspectos sobresalientes de los mismos son rápida y fácilmente aprehensibles. En ocasiones estos métodos
nos ayudan a establecer hipótesis tentativas sobre la naturaleza del fenómeno que se estudia.

Con la finalidad de que una muestra sea representativa de la población de la cual procede, se han
desarrollado numerosos métodos de muestreo, entre los más relevantes se tienen:

• Muestreo tipo Lotería: Consiste en identificar a cada objeto de la población mediante una etiqueta,
posteriormente las etiquetas se colocan en una urna para mezclarlas y de ahí extraer las etiquetas
correspondientes a los objetos que forman la muestra al azar.

• Muestreo tipo sistemático: Consiste en ordenar a todos los objetos de la población en forma creciente o
decreciente de acuerdo con algunas de sus características y finalmente, del ordenamiento resultante se
extrae a cada enésimo objeto para formar la muestra.

• Muestreo Estratificado: En algunos casos los objetos de una población pueden estar divididos en estratos
naturales o artificiales, generalmente los estratos tienen diferentes números de objetos, por lo tanto, la
muestra representativa requerirá que cada estrato contribuya a la muestra con una cantidad de objetos
proporcional a su tamaño, por ejemplo: Si se trata de muestrear seres humanos.

APUNTES REALIZADOS POR: Ing. Citlali Sofía Rincón Ruíz 3


PROBABILIDAD Y ESTADISTICA

a) Estratos naturales: Podrían ser las zonas geográficas o los grupos étnicos.

b) Estratos artificiales: Podrían ser el nivel cultural o socioeconómico.

Las ventajas de trabajar con muestras son evidentes, en cualquier caso, resultará más sencillo y menos
laborioso el estudiar una muestra en lugar de toda una población.

FUENTES DE INFORMACIÓN.

La estadística puede obtener información a través de los siguientes medios:

1.- La entrevista: Consiste en un encuentro concertado entre dos o más personas para obtener o intercambiar
datos sobre temas concretos.

2.- La encuesta: Consiste en un cuestionario elaborado previamente para la obtención de datos sobre temas
específicos.

3.- El censo: Consiste en un padrón de personas, bienes y actividades que la mayoría de los gobiernos realizan
en forma periódica.

4.- Publicaciones especializadas: Es posible obtener información a través de las memorias o almanaques
que se publican periódicamente por parte de algunas empresas sobre las actividades que se realizaron.

5.- Datos experimentales: Proceden de los laboratorios de investigación de empresas o instituciones


educativas, generalmente se tratan de áreas específicas de tiempo.

6.- Medios de comunicación masiva: Es poco frecuente, pero se podría en algunos casos obtener
información de interés de la tv, radio, periódicos y revistas.

7.- Observación. Consiste en recopilar información mediante la simple observación.

8.- Investigación. Consiste en recopilar información que ya se tiene concentrada o escrita, la cual se puede
obtener en bibliotecas, hemerotecas, mapotecas, videotecas, internet, etc.

Actividad 2
Desarrolla la siguiente actividad y repórtala en tu classroom, con nombre completo y grupo.

Recorta de periódico o revista, tres situaciones de algunos artículos de tu mayor


interés que describan cualquiera de los siguientes medios de información:
Entrevista, censo, test, padrón y encuesta.
(investiga y reporta en hojas tamaño carta).

La estadística descriptiva tiene como objetivo resumir o describir las características importantes de un
conjunto de datos.

Para ello es necesario conocer que la estadística tiene dos ramas de datos; datos no agrupados y datos
agrupados. Y empezaremos con los más sencillos de trabajar, los datos no agrupados.

APUNTES REALIZADOS POR: Ing. Citlali Sofía Rincón Ruíz 4


PROBABILIDAD Y ESTADISTICA

DATOS NO AGRUPADOS

No existen reglas de carácter general para decidir cuándo se debe agrupar a un conjunto de datos o
cuándo es preferible mantenerlos en su forma individual, la mayoría de los autores y de los investigadores
sugieren que hasta aproximadamente 25 ó 30 se deben obtener en forma individual, de esta manera se
conservará el mayor detalle de un grupo poco numeroso de datos.

Actividad 3
Desarrolla la siguiente actividad y repórtala en tu classroom, con nombre completo y grupo.

¿Qué es un dato y su clasificación? (investiga y reporta en hojas tamaño carta).

Ejemplo1:

Los siguientes datos representan el conteo del número de cromosomas encontrados en el núcleo celular de 18
tomas de tejido de la herbácea Claytonica Virgínica sometida a radioactividad para un estudio de ingeniería
genética, de los cuales necesitamos describir características importantes por medio de la estadística
descriptiva.

24,29,28,29,28,31,38,32,28,28,30,28,30,32,30,30,32,31.

Ordenamiento: Es la primera manipulación a la que deberá ser sometido un conjunto de datos, como su
nombre lo indica, consiste en ordenarlos preferentemente de manera creciente.

Ordena de manera creciente los datos mencionados:

__________________________________________________________________________

Para poder describir estos datos necesitamos medirlos, para ello hacemos uso de ciertas medidas que a
continuación veremos.

MEDIDAS ESTADÍSTICAS
Existen tres mediciones que se estudian en la estadística descriptiva:

• Medidas de tendencia central


• Medidas de posición
• Medidas de dispersión

Estas medidas se utilizarán tanto para datos no agrupados como datos agrupados

MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central, también llamadas medidas de posición o medidas de centralización,
indican mediante un valor o atributo la localización central de la distribución de frecuencia.

Debido a que se pueden dar varias interpretaciones a lo que significa valor central de una distribución, se
estudian cinco medidas de tendencia central que son la media, la mediana, la moda, media geométrica, la
media armónica. Cabe aclarar que estas medidas de posición, no son las únicas que existen.

Se denomina de esta manera porque tienden a localizarse en la parte central del ordenamiento, las más
utilizadas son:
APUNTES REALIZADOS POR: Ing. Citlali Sofía Rincón Ruíz 5
PROBABILIDAD Y ESTADISTICA

1.- Media ( x ): También se le conoce como media aritmética o promedio. Es la más usada de las medidas
descriptivas. Tiene la ventaja de ser muy fácil de calcular, además de poseer propiedades teóricas
excelentes desde el punto de vista de la estadística inductiva. Su principal desventaja es que, por
ser el punto de equilibrio de los datos, es muy sensible a la presencia de observaciones extremas.
La mediana resuelve, en gran parte, esa desventaja.

Medición 1: Calcular la media aritmética de los datos de la herbácea Claytonica Virgínica, conforme al
formulario.

𝑋𝑋 = _______________ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶

~
2.- Mediana ( X ) Md: Se define como el valor del dato que divide a la información en dos partes iguales, para
los datos no agrupados se tienen dos criterios:

a) Si se tiene un número impar de datos, entonces existirá un dato que quede en la parte central de todo
el ordenamiento y el valor de la mediana será igual con el valor del dato central.

b) Cuando se tiene un número par de datos, en la parte central del ordenamiento quedará una pareja de
datos y en ese caso el valor de la mediana será igual al promedio de valores de los datos centrales:

24,28,28,28,28,28,29,29,30,30,30,30,31,31,32,32,32,38

𝑋𝑋� = _____________ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶

3.- Moda ( X̂ ) Mo: Se define como el valor del dato que se repite el mayor número de veces, en algunos casos
puede no existir, entonces se dice que la muestra o población no hay moda, en otros casos puede haber
varias modas, entonces se dice que la distribución de datos es bimodal, trimodal, multimodal.

Nota: Algunos autores dicen que cuando existen 4 ó más modas esta medida se declara inexistente.

𝑋𝑋� = _______ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶

4.- Media geométrica (G): En algunos casos esta medida tiene ventajas sobre la media aritmética ya que no
es tan sensible con datos con variables extremos, sin embargo, esto sólo ocurre cuando se obtiene un
gran número de datos, se utiliza básicamente para promediar razones, tasas de cambio y valores que
muestran una progresión geométrica., se obtiene:

𝐺𝐺 = __________ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶

APUNTES REALIZADOS POR: Ing. Citlali Sofía Rincón Ruíz 6


PROBABILIDAD Y ESTADISTICA

5.- Media armónica (H): Esta medida se utiliza preferentemente cuando se trabaja con cantidades que varían
en el tiempo, por ejemplo: velocidades, frecuencias, aceleraciones, etc. Se calcula usando todos los
elementos en un conjunto de valores, se utiliza básicamente para ciertas tasas que pueden ser
expresadas recíprocamente. Sin embargo, es útil en casos especiales para promediar razones. Se
obtiene mediante:

𝐻𝐻 = _____________ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶

MEDIDAS DE POSICIÓN (CUANTILES)

Así como la mediana marca la mitad de valores mayores que ella y la mitad de valores menores que ella,
los cuantiles permiten identificar valores ubicados en diferentes posiciones de un grupo de datos.

1.- Los cuartiles (1°, 2° y 3°): Señalan el valor que está al 25, 50 y 75 % de la totalidad de datos, el segundo
cuartil equivale a la mediana.

2.- Los deciles (del 1° al 9°): Marcan el valor ubicado al 10, 20, …, 80 y 90 % de los datos, el quinto decil
equivale a la mediana.

3.- Los percentiles (del 1° al 99°): Indican el valor que está al 1, 2, …, 98 y 99 % de los datos, el valor del
cincuenta percentil deberá coincidir con el de la mediana. Los deciles 1°, 2°, etc., equivalen a los
percentiles 10°, 20°, etc., y los cuartiles equivalen a los percentiles 25, 50 y 75.

En las fórmulas para obtener los cuantiles se señala entre paréntesis la posición del elemento deseado,
siendo n el número de datos.

n 3n
CUARTILES Q1 = Q2 = mediana Q3 =
4 4

n 2n
DECILES D1 = D2 = D5 = mediana D9 = etc.
10 10

n 34n
PERCENTILES P1 = P34 = P50 = mediana P93 = etc.
100 100
La cantidad que se obtenga se manejará con los siguientes criterios:

a) Cuando resulten fracciones de mitad por ejemplo 3.5, significa que la medida de ubicación se encuentra
entre la tercera y cuarta, por lo tanto el valor será igual al promedio de la tercera y cuarta.

b) Si resultan fracciones diferentes a mitades, el número se redondea al entero más cercano.

Ejercicio. Obtener los cuartiles para los datos del ejemplo 1. n = 18,

n 18
• Para Q1: Q1 = = = 4.5 por lo que la posición 4 y 5 es 28, por tanto el primer cuartil es 28
4 4

• Para Q2: Q2 = mediana = 30 por lo que la posición 9 es 30, por tanto el segundo cuartil es 30

3n (3)(18)
• Para Q3 : Q3 = = = 13.5 por lo que la posición 13 y 14 es 31, por tanto el tercer cuartil es
4 4
31

APUNTES REALIZADOS POR: Ing. Citlali Sofía Rincón Ruíz 7


PROBABILIDAD Y ESTADISTICA

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión, así como las de tendencia central, pueden calcularse tanto para un
conjunto de datos individuales como para una tabla de distribución de frecuencias. Las medidas de dispersión
permiten cuantificar con diferentes criterios el grado de disgregación que tienen los datos de una población o
muestra.

Las más utilizadas son el rango, la desviación cuartil, la desviación media, la varianza y la desviación
estándar.

1.- El rango (R): Es la diferencia entre los valores extremos, el mayor y el menor, en él están distribuidos todos
los demás valores, por eso también se le llama recorrido o longitud. Se usa poco debido a que es muy
influenciable por la presencia de valores extremos de poca frecuencia; se piensa que cuanto mayor es el
rango mayor es la dispersión de los datos, lo cual conduce a apreciaciones falsas.

R = X n − X1

R = __________________

2.- Rango intercuartil (RI): También se le conoce como desviación cuartílica, es el resultado de la diferencia
entre el tercer cuartil Q3 y el primero Q1, geométricamente también representa la longitud de un intervalo
de números reales en donde en la mayoría de los casos están distribuidos los datos más significativos o
de mayor peso. Cuando se quiere eliminar los datos más extremos se utiliza el rango intercuartil, es aquí
donde se deben encontrar los datos más significativos por la poda que se hace.

Rango Intercuartil = RI = Q3 - Q1

RI = __________________

3.-El rango semintercuartil (QD) o desviación cuartil, es la mitad del rango intercuartil y mide la dispersión
con mayor precisión que el rango, sin embargo, presenta las limitaciones siguientes:
a) No toma en consideración todos los valores de la distribución de frecuencias y puede suceder que los
valores menores a Q1 o superiores a Q3 estén muy compactos o muy dispersos, y el valor de Q sería
el mismo.
b) No es posible, conociendo únicamente Q, hacer la ubicación precisa de una observación dentro de la
distribución de frecuencias.
c) Igual que la mediana, no tiene propiedades que permitan su uso en las relaciones matemáticas que
usa la estadística.
Q − Q1
QD = 3
2

4.- Varianza (s2): Es la media aritmética de los cuadrados de desviaciones respecto a la media aritmética. La
varianza sirve de base para calcular la desviación estándar, desviación típica o desviación cuadrática
media que es la más importante de todas las medidas de dispersión, en muchos casos las unidades de la
varianza carecen por completo de sentido físico.

n
∑ ( xi − x ) 2
i =1
Población S2 =
n

𝑆𝑆 2 = __________________

APUNTES REALIZADOS POR: Ing. Citlali Sofía Rincón Ruíz 8


PROBABILIDAD Y ESTADISTICA

5.- Desviación estándar (s): Se calcula como la raíz cuadrada de la varianza, e indica qué tan diferentes
son entre sí los datos que se analizan.

S = S2

𝑆𝑆 = ______________𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶

Con esta última medición termínanos de medir nuestros datos no agrupados, recordando que la primera
medición y la última son las más importantes de en procesos estadístico.

GRAFICAS

Ahora el último paso graficar, para este tipo de datos solo será necesario realizar la clásica grafica de
pastel.

Para esto necesitamos una pequeña tabla donde estarán nuestros datos, sus frecuencias y su porcentaje
de acuerdo al total de datos.

La pregunta clave ¿Qué es la frecuencia? Bueno, La frecuencia es la cantidad de presencias que tienen
el dato; o sea, el dato 28 se presenta cinco veces.

Dato f %
24 1 5.6%
28 5 27.8%
29 2 11.1%
30 4 22.2%
31 2 11.1%
32 3 16.7%
38 1 5.6%
total 18 100%

Actividad 4
Desarrolla la siguiente actividad y repórtala en tu classroom, con nombre completo y grupo.

Dibuja la gráfica de pastel del ejemplo 1 (investiga y reporta en hojas tamaño


carta).

Ahora conoceremos la otra rama DATOS AGRUPADOS, para ello necesitamos agruparlos antes de medirlos,
por lo cual usaremos algunos métodos tabulares.

APUNTES REALIZADOS POR: Ing. Citlali Sofía Rincón Ruíz 9

También podría gustarte