Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN A LA
ESTADÍSTICA
Profesor: Bachilleres
-Dumont José
-Zerpa Hugo
-Betancourt Darwins
Introducción.
Estadística
Población y Muestra
Distribución de Frecuencias
Construcción de una Distribución de Frecuencias
Estadística y Parámetros
Estadísticos muy importantes (media, varianza y desviación típica)
Calculo de media, varianza y desviación típica para datos agrupados y no agrupados
Bibliografía
Conclusión
Introducción
Es una rama de las matemáticas y una herramienta que estudia usos y análisis provenientes
de una muestra representativa de datos, que busca explicar las correlaciones y dependencias de un
fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Además, se usa en áreas de negocios o
instituciones gubernamentales ya que su principal objetivo es describir al conjunto de datos
obtenidos para la toma de decisiones o bien, para realizar generalizaciones sobre las características
Hoy en día, la estadística es una ciencia que se encarga de estudiar una determinada
población por medio de la recolección, recopilación e interpretación de datos. Del mismo modo,
también es considerada una técnica especial apta para el estudio cuantitativo de los fenómenos de
masa o colectivo.
Ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.
Existe también una disciplina llamada estadística matemática, la que se refiere a las bases
teóricas de la materia. La palabra «estadísticas» también se refiere al resultado de aplicar los
logaritmos S estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas
criminales, etc.
Población y Muestra
Población:
Así también las poblaciones pueden ser clasificadas en Reales e Hipotéticas, las reales son
aquellas concretas, que ya existen. Ejemplo: Los aspirantes a un puesto de trabajo, los vendedores
de una empresa. Mientras que las hipotéticas, son las formas imaginables en que se podría
presentar un suceso. Ejemplo: Estimaciones de la población económicamente activa dentro de diez
años.
En toda investigación lo ideal sería contar con observaciones o características de todos los
elementos de nuestro grupo de interés, pero en muchas ocasiones eso sería muy caro y/o muy
tardado o simplemente imposible, es por ello que se toman muestras.
Muestra:
“Es una parte representativa de la población que es seleccionada para ser estudiada, ya que la
población es demasiado grande para ser estudiada en su totalidad” Allen Webster.
Distribución de Frecuencias
Tipos de Frecuencia:
1. Recopilación de datos: Consiste en escribir los datos de la muestra que nos interesa
conocer, sin importar el orden.
2. Ordenamiento de los datos: Consiste en ordenar los datos en forma ascendente o
descendente para facilitar el conteo de datos que correspondan a cada uno de los
intervalos
3. Determinación del número de clases: El número de clases en que se agrupan los datos se
determina con la raíz cuadrada del número de datos cuando este es menor de 200. Para
muestras con 200 o más datos el número de clases se determina con la raíz cúbica del
número de datos.
4. Cálculo del tamaño de clase: Para determinar el tamaño de clase es necesario conocer el
rango de la muestra, que se obtiene con la diferencia entre el dato mayor y el dato menor
de la muestra y se representa con la letra R
5. Elaboración de intervalos: El tamaño de clase indica el número de datos que conforman a
cada intervalo, considerando los valores extremos llamados límites. En cada intervalo
aparece un límite inferior (LI) y un límite superior (LS).Cada intervalo se forma sumando al
límite inferior (LI) un número menos que el tamaño de clase para obtener el límite
superior (LS).En la elaboración de la distribución de frecuencias se debe dejar un renglón
antes de la primera clase y otro después de la última. Si en la elaboración de los intervalos
se observa que algunos datos quedan fuera del número de clases, entonces se debe
agregar una clase más al final, esto no alterará los resultados.
6. Obtención de Frecuencias: La frecuencia de clase se obtiene contando, en la tabla de
datos ordenados, los que correspondan al intervalo de dicha clase.
Estadística y Parámetros
Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por
una gráfica.
Medidas de centralización:
Nos indican en torno a qué valor (centro) se distribuyen los datos. Las medidas de centralización
son:
Medidas de posición
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de
individuos.
Para calcular las medidas de posición es necesario que los datos estén ordenados de menor
a mayor. Las medidas de posición son:
Medidas de dispersión
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la
distribución. Las medidas de dispersión son:
Rango o recorrido: El rango es la diferencia entre el mayor y el menor de los datos de una
distribución estadística.
Desviación media: La desviación media es la media aritmética de los valores absolutos de
las desviaciones respecto a la media.
Varianza: La varianza es la media aritmética del cuadrado de las desviaciones respecto a la
media.
Desviación típica: La desviación típica es la raíz cuadrada de la varianza.
Estadísticos muy importantes
Media: Es una medida de tendencia central que según la Real Academia Española (2001).
Resulta al efectuar una serie determinada de operaciones con un conjunto de números y
que, en determinadas condiciones, puede representar por sí solo a todo el conjunto».
Existen distintos tipos de medias, tales como la media geométrica, la media ponderada y la
media armónica aunque en el lenguaje común, el término se refiere generalmente a la
media aritmética.
Varianza: Es una medida de dispersión definida como la esperanza del cuadrado de la
desviación de dicha variable respecto a su media. Está medida en la unidad de medida de la
variable al cuadrado. Por ejemplo, si la variable mide una distancia en metros, la varianza
se expresa en metros al cuadrado. La desviación estándar es la raíz cuadrada de la varianza,
es una medida de dispersión alternativa expresada en las mismas unidades de los datos de
la variable objeto de estudio. La varianza tiene como valor mínimo 0. Hay que tener en
cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su
uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos
se recomienda el uso de otras medidas de dispersión más robustas.
Desviación típica: es una medida de dispersión para variables de razón (variables
cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la
varianza de la variable. Para conocer con detalle un conjunto de datos, no basta con conocer
las medidas de tendencia central, sino que necesitamos conocer también la desviación que
presentan los datos en su distribución respecto de la media aritmética de dicha distribución,
con objeto de tener una visión de los mismos más acorde con la realidad al momento de
describirlos e interpretarlos para la toma de decisiones.
Media:
Para datos agrupados: Se calcula sumando todos los productos de marca clase con
la frecuencia absoluta respectiva y su resultado dividirlo por el número total de
datos:
La marca clase de una tabla para datos agrupados en intervalos corresponde al promedio
de los extremos de cada intervalo.
Para datos agrupados: Si los datos vienen agrupados en una tabla de frecuencias, la expresión de
la media es:
Ejemplo:
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la
tabla. Calcula la puntuación media.
xi fi xi · fi
[10, 20) 15 1 15
[30,40) 35 10 350
[50, 60 55 8 440
[60,70) 65 4 260
42 1 820
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.
9, 3, 8, 8, 9, 8, 9, 18
Para datos no agrupados: Para calcular la varianza de un conjunto de datos no agrupados se utiliza
la fórmula:
Lo que es equivalente a:
Desviación Típica: La desviación típica se representa por σ.
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes
a las anteriores.
9, 3, 8, 8, 9, 8, 9, 18
Para datos no agrupados: La fórmula para calcular la desviación estándar para datos no agrupados
está dada por la siguiente expresión:
Dónde:
Cualquiera de las fórmulas puede usarse indistintamente, pero en la práctica es común el uso de la
segunda. En ésta, al cociente n – 1 se le denomina corrección de Bessel.
A = {2, 4, 6, 8, 10}
n = 5 x1 = 2 x2 = 4 x3 = 6 x4 = 8 x5 = 10
www.monografias.com
es.wikipedia.org
estadisticaparaadministracion.blogspot.com
www.vitutor.com
www.vae.edu.mx
www.portaleducativo.net
moodle2.unid.edu.mx
Conclusión
La estadística provino desde antes de Cristo en el país de Egipto, Persia, babilonia desde
que Moisés levanto un censo del pueblo y cuando ha avanzado, primer censo en América fue llevado
a cabo por los Incas y como muchos matemáticos, filósofos, teólogos, han experimentado y aplicado
la estadística hasta hoy en día que la seguimos utilizando y aplicando para la sociedad, ya que es un
potente auxiliar de muchas ciencias y actividades humanas: sociología, sicología, geografía humana,
economía, etc.
Los conceptos antes mencionados han sido analizados e investigados de tal manera de
hacer más fácil su comprensión y entendimientos ya que la estadística es la ciencia que trata de
entender, organizar y tomar decisiones que estén de acuerdo con los análisis efectuados