Está en la página 1de 30
) ee GBocer Qpeewes SECRETARIA DE EDUCACION PUBLICA SUBSECRETARIA DE EDUCACION SUPERIOR UNIVERSIDAD ABIERTA Y A DISTANCIA DE MEXICO DIVISION DE CIENCIAS EXACTAS, INGENIERIA Y TECNOLOGIA DF: enfocado a la Delegacién Gustavo A, Madero en el Plantel 1: PRESENTACION DEL PROYECTO TERMINAL PARA OBTENER EL TITULO DE: LICENCIATURA EN MATEMATICAS PRESENTA EL ALUMNO SUSTENTANTE: C. PEDRO DANIEL LARA MALDONADO DIRIGIDA POR: MAT. BEATRIZ CARRASCO TORRES EVALUADA POR: MTRO. CARLOS QUIROZ LIMA ELABORADO EN LA: CIUDAD DE MEXICO, DISTRITO FEDERAL, 2015-2016. CDMX Instituto de Educacién Media Superior del Distrito Federal TT Resumen, El tema de este proyecto se circunscribe a los datos generados por la Direccién Estudiantil ;a través del conducto de la Subdireccién de Administracién Escolar, dentro de la dependencia paraestatal del Instituto de Educacién Media Superior del Distrito Federal; cuyo propésito de esto es hacer predicciones para las tltimas generaciones que comprenden del afio 2013 hasta el afio 2015; por medio de posibles intervalos que puedan ocurrir en la situacién del porcentaje de desercion estudiantil, que se considera especificamente al Plante! | de la delegacién Gustavo A. Madero; cabe mencionar que esto se basa a través de la utilizacion de modelos de ajuste de funciones polinomiales mediante el método regresién por minimos cuadrados en su sustento del coeficiente de determinacién que encuentra una mejor funcion polinomial de ajuste a los datos que se centra en el calculo del error que definen dos numeros aleatorios con distribucién normal en un intervalo abierto con su media y desviacién estandar que ubica una probable representacion muestral minima y maxima en este aspecto y con esto se espera hacer un aporte hacia la investigacién con el fin de que se considere como argumento y poder atender esta problematica. 4.4. Palabras claves: + Analisis © Ajuste + Prediccién 2.lntroducci6n La desercién escolar en esta dependencia paraestatal del /EMS-DF es un grave problema para el desarrollo sustentable de la poblacién esta entidad federativa de la Ciudad de México, , a raz6n de que implica una conducta de riesgo entre sus habitantes, y esto trae como consecuencia gastos presupuestales y pérdidas econémicas a nivel local respecto a las oportunidades de trabajo y esto realmente afecta a nivel familiar, en los ingresos salariales que sustenta una mejor calidad de vida individual y para los parientes en el quehacer cotidiano. El término de Desercién se define regularmente como el abandono de cursos 0 en el plantel que se ha inscrito el estudiante, deja de asistir a clases y de cumplir con las obligaciones establecidas previamente, lo cual tiene efectos sobre los indices de eficiencia terminal del egreso. Es por eso considerar a la Estadistica como una herramienta de apoyo que puede dar respuesta a muchas de las necesidades que la sociedad actual nos plantea, a razén de que su tarea fundamental es la reduccién de datos, con el objetivo de representar la realidad y describirla, predecir su futuro o simplemente conocerla; en nuestros dias se ha convertido en una rama de la matematica efectiva para describir con exactitud los valores de datos fisicos, politicos y sociales que sirve para relacionar y analizar dichos datos, por lo que esto implica que esta herramienta no consiste ya sélo en resumir y tabular los datos, sino mas bien en enfocarse en el proceso de interpretacién de esta informacion Entonces es importante considerar que Pronosticar o dar aproximaciones a futuros eventos ha sido una practica frecuente para los seres humanos. En tiempos remotos estos pronésticos se realizaban mediante métodos un poco ortodoxos. Con el paso del tiempo y gracias a los avances teéricos y tecnolégicos de la ciencia, estas aproximaciones han ido cambiando hasta llegar a metodologias rigurosamente cientificas y bien fundamentadas tedricamente. Con esto decimos que el desarrollo de la Teoria de la Probabilidad ha aumentado el alcance de las aplicaciones de la estadistica a razon de que muchos de los conjuntos de datos se pueden aproximar, con gran exactitud, utilizando modelos probabilisticos; por lo que los resultados de estas pueden utilizar para analizar datos estadisticos. Por lo que la Probabilidad es util para comprobar la fiabilidad de las inferencias estadisticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadistico. Entonces mencionemos que el andlisis del Método de Regresién es una técnica estadistica para investigar y modelar la relacion entre variables, por lo que son numerosas las aplicaciones de esto en cualquier campo, incluyendo en ciencias fisicas, experimentales y sociales y de hecho se puede decir que esta técnica estadistica es la mas usada, por lo que sustenta la fundamentacién del andlisis de los métodos numéricos que se basan de los modelos matematicos para desarrollarlo y efectuario. Por lo que en la actualidad el uso de las Herramientas Matematicas Probabilisticas ha permitido optimizar y determinar los Procesos de los Indicadores de Desemperio en cuestién de considerar la informacién a través de los datos registrados en un plantel determinado por esta dependencia paraestatal sobre la situacién de la Desercién Estudiantil del Sistema Escolarizado cuya causa de este objetivo depende de la relacién de la Cuantificacién de su Ingreso y Egreso por Generacién que se analiza a través del “Modelo Estadistico del Ajuste de Funciones mediante e! Método de Regresién por Minimos Cuadrados” ;cuyo creador fue el matematico aleman Karl Friedrich Gauss en 1795, el cual permite interpretar_geométricamente sus variaciones, en efectuar y determinar la prediccién certera del calculo de la probabilidad como variable de respuesta del pronéstico porcentual de la desercién estudiantil que ocurra en base a la tendencia 2K que ha seguido los datos registrados de estos eventos a lo largo del tiempo y asimismo, se espera hacer un aporte hacia la investigacién de la Estadistica y Probabilidad; cuyo fin se considere a la situacién problematica de este andlisis estadistico cuantitativo como argumento para que las autoridades competentes puedan fundamentarlo como un primer paso para tomar medidas preventivas de atencién y reflexién de la importancia en corto y a largo plazo de cémo puede afectar a esta dependencia paraestatal y buscarle una decisién alternativa a través de la instrumentacién del disefio de estrategias de acciones que pretendan involucrarlos en conocer esta informacion de la situacién de este fenémeno, para que asi con base a esas predicciones realizadas adviertan mejores decisiones que faciliten la viabilidad de reducir su incidencia desertora para que sea orientada como una propuesta al fomento del incremento del egreso estudiantil que conlleva a la dimensién del bienestar en su permanencia en el plantel, ademas de que tengan el beneficio del pase directo asegurado a la Universidad Auténoma de la Ciudad de México-UACM y con esto se llega a su certificacion de la eficacia educativa que trae como posibilidad de que tenga en un futuro una mejor oportunidad y calidad de vida laboral y profesional para que se sientan utiles y productivos para el desarrollo sustentable de la Poblacién Econémicamente Activa de esta entidad federativa de la Ciudad de México. 3.Marco Teérico 3.4, Fundamentos sobre el Ajuste de Funciones polinomiales. Consideremos que la idea clave del proyecto, es que el ajuste de funciones polinomiales sea una técnica para el modelado de datos con una ecuacién y para considerarlo se plantea a través de la siguiente pregunta: 2Cémo decidir qué tipo de funcién polinomial si existe, podria ajustarse a los datos? (Fuente Bibliogréfica: Bittinger, Marvin L., (2002). Una forma simple consiste en examinar una gréfica de los datos llamada como Diagrama de Dispersién que es una grafica de datos de dos variables en la variable independiente esta en el eje horizontal y la variable dependiente en el eje vertical, entonces con esto hacemos el énfasis en definir qué Tipos de Variables vamos a considerar en este modelo: © Variable Dependiente: Es la variable que se predice o se explica. Se representa por y. * Variable Independiente: Es la variable que sirve para predecir o explicar. Se representa por x. Luego con esto se busca un patrén que se parezca a una de las graficas de los tipos de funciones polinomiales que hay, por lo que a continuacién se presenta un Procedimiento que se considera y que la mayoria de las veces funciona para determinar modelos matematicos para este método de regresion a través de un conjunto de datos dado se debe: 1. Representar grdficamente los datos (en la forma de Diagrama de Dispersién) 2. Observar el diagrama de dispersién para determinar si parece ajustarse a una funcién conocida 3. Determinar una funcién que ajuste los datos utilizando los datos de los puntos para derivar las constantes 0 coeficientes a encontrar. Ahora con esto se va a sutilizar el grupo de funciones polinomiales para observar cual funcién, si existe, podria ajustarse a ciertos datos: * Silos datos podrian modelarse mediante una funcion polinomial lineal si la grafica parece una linea recta. © Silos datos podrian modelarse mediante una funcién polinomial cuadratica, si la gréfica sube y luego baja, 0 baja y luego sube, en una forma encorvada que se parezca a una parabola © Silos datos caen, luego aumentan, y vuelven a caer (de modo que no se ajustan a una funcién polinomial lineal o una funcién polinomial cuadratica), pero podrian ajustarse a una funcién polinomial de mayor a 3, es decir a una funcién polinomial cdbica, una funcién polinomial cuartica o una funcién polinomial de grado m con m > 3. 3.2. D jn del Método de Rearesién por Minimos Cuadrados. (Fuente Bibliogréfica: Gerald, (2000)). Es una técnica de analisis numérico enmarcada dentro de la optimizacion matematica, en la que, dados un conjunto de pares ordenados incluyen una variable independiente, variable dependiente que se busca encontrar la funcion continua, que mejor se aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de minimo error cuadratico, por lo que esto coincide con el principio de maxima probabilidad de la estadistica. Entonces decimos que desde un punto de vista estadistico, un requisito implicito para que funcione el método de minimos cuadrados es que los errores de cada medida estén distribuidos de forma aleatoria para determinar el mejor ajuste de una funcion polinomial a través de la consideracién de utilizar como minimo cuatro puntos. Procedimiento del Método de Regresion por Mi os Cuadrados. (Fuente Serigrafica: Marin Salguero, R.(2013)) ‘Supongamos que se conocen datos que consta de n puntos siguientes que se definen como: (x1,¥,), (2,9), ~»(%nJ,) ¥ que el objetivo es hallar una funcion polinomial y = f(x) que se ajuste razonablemente a los datos, por lo que el primer pas6 es decidir qué tipo de funcién probar a través de la inspeccion grafica de los n puntos, por lo que se detalla esto a través de la siguiente gréfica: Gréfica I..: Relacién que determina un éptimo ajuste para encontrar una funcién polinomial Fuente Bibliografica: Chapra (2011) Pero para que no se cometan incertidumbres en su eleccién se considera una Optima decision en este método a través del minimo valor en su coeficiente de determinacién R? que define su procedimiento a efectuar en este andlisis que represente el comportamiento general de los datos de la siguiente manera: R=) bn few? & Aunque esta propuesta no pase por todos y cada uno de los puntos en cuestin, represente el comportamiento de los datos. Consideraciones de la Clasificacién de Modelos en las Funciones jomiales en el Método de Regresion por Minimos Cuadrado: (Fuente Serigrafica: Marin Salguero, R. (2014)) El caso mas usado en la practica es poder ajustar funciones polinomiales, ya que en este caso los parémetros seran funciones de cualquier tipo que son faciles de >T= IS estimar. El modelo a ajustar estaré basado en su generalizacién del ajuste polinomial de grado m que esta dado por: Fy Ag, oy A) = Ag + Ay X + gx? $+ A_Q’X™ (Fuente Bibliogrdfica: Mathews. (2000)) Por medio de esta consideracién se aproxima ahora a un conjunto de datos {@i,yO]%, eon una funcién polinomial algebraica de grado n < m — 1 mediante el procedimiento de minimos cuadrados, por lo que sea definido el polinomio como: Dax r fri) inf + dy aXfo? +o + 4x; +g Para disminuir al minimo el error de minimos cuadrados, es necesario seleccionar las constantes do,a;,...,d, de tal manera que las parciales con respecto a cada una de ellas sean cero y asi para cada j: R So-soor vx 2Sa(Som) +5 wa (ds ") = = kao st Esto nos da n +1 ecuaciones normales en las n +1 incégnitas a; por lo que decimos que: w (Sur) va(Se en i re i a i A = oo Por lo que estas ecuaciones normales tienen solucién unica siempre y cuando las x; sean distintas y en tal caso, la funcién apropiada de minimos cuadrados (probablemente un polinomio de grado n) puede deducirse con los valores de la funcién deducida reemplazando los datos cuando la medida de bondad de ajuste de R? sea suficientemente pequefia, a esto se le denomina “suavizamiento de datos.” y su aplicacién de esto es en encontrar estos parametros: a, 2, ..,dn través de la resolucion de sistemas de ecuaciones normales. Entonces supongamos que queremos ajustar nuestra pareja de datos a través de este modelo de la funcién polinomial generalizada en cuestion de la suma de los errores al cuadrado R? que esta dada por: 6 Rea Ye = dy + a,x 4 yx? $+ ayy X™)P? 7 En este caso polinomial se puede construir el sistema de ecuaciones respectivo para encontrar el valor de estos pardmetros do, },...,.dm. Este sistema de ecuaciones lineales se conoce como las ecuaciones normales y estan dadas por: w(Ss}enQe)eoon(Ser)-Sn it it Pero, sin embargo para hallar la funcién de mejor ajuste, determinaremos los valores 0 coeficientes respectivamente en cada caso de los tipos de funciones Para do, Gy, .., dm donde m > 0. Por lo que se considera este sistema de ecuaciones escribirlos en términos matriciales de la forma Xa = por lo que esto queda como las Ecuaciones normales del ajuste polinomial de grado m que se definen en este caso como: N Da Yat a De Ua Yat Lat | | a Lawn Det Deptt Lae Om Learn Para encontrar la solucién matricial tenemos que multiplicar la ecuacion matricial Xa = y y después podemos calcular su inversa (se multiplicé por la matriz transpuesta para que quede una matriz cuadrada) >T= IS X'Xa = XTy 3. a= (XTX) UxTy Este sistema de ecuaciones lineales simultaneas se puede resolver facilmente usando la famosa regla de Cramer (para polinomios lineales y cuadraticos) y el método de eliminacién Gaussiana (para polinomios al menos tercer grado). Los coeficientes de la matriz los podemos encontrar si acomodamos los datos en una tabla | construida de la siguiente manera: x * af all s xy ay i 1} a | at | af an nw | mm | zt ary 2) a | 2 | @ ae wm | ze ty s| a | 23 | af ae yw | zoe N| aw | ak | at [| ate | | ww Lal Ce? | ot dai" | | Cw | Dew | Daly cary Por lo que a continuacién se mostraran los casos de las funciones polinomiales lineales, cuadraticos, clibicos y cuarticos. Ajuste de la funcién polinomial lineal y = ag + ax Recordemos que una aproximacién por minimos cuadrados consiste en ajustar a una linea recta un conjunto de datos discretos de la forma: (1), O20 YQ)r one OW Iy) Por lo que se inicia en considerar una ecuacién de una linea recta a la cual se relaciona al comportamiento de los datos y el modelo propuesto de esta forma se tiene: y = ay + a,x dénde: ay =es la ordenada al origeny a, =es la pendiente. A aplicar el criterio de que el “mejor” ajuste se cumple cuando se puede minimizar la suma de los cuadrados de los residuos R? , es decir el error entre el modelo y los datos experimentales, se tiene que: Yon = a5 - a1)? : Este criterio tiene la ventaja de proporcionar una linea unica para un conjunto de datos. >T= 1S Para determinar los valores de a, y a, que minimizan la ecuacién se deriva la ecuacién con respecto a cada uno de los coeficientes aR? Fac 2) Oi — aq — arm) = 0 aR? Fe = HZ DY [Or - a9 - xxi] = 0 Al igualar ambas derivadas a cero, se genera un minimo para la suma de los cuadrados de los residuos R? de la siguiente forma: yx -Yieo - Yan @ Soman Yast 0) De la ecuaci6n ... (i) se obtiene y= nag +a; ) x, (iii) 2 2 De la ecuaci6n ... (ii) se obtiene Yer = ao Y xi +a, Yd? Go) Al resolver en forma simultanea las ecuaciones ... (iii) y valores de ay y a; mediante las siguientes ecuaciones: iv) se obtiene los NZX ~ LAI nix - (x? Por lo que construyendo la tabla Il fundamental para el caso lineal que queda de la forma: a «(0),dg = F— AF... (vi) y rofalat fn | am 2 |alaln| an 3 a | 3 we | zs yo fav | ak | ow | eng sree | a | Dat | Eu | Dew Las ecuaciones normales para el caso lineal estan dadas por: [s. £3 ](2]-[24.] Y este sistema de ecuaciones se puede resolver con los métodos habituales (suma y resta, Cramer, sustitucion, etc.) Ajuste de la funcién polinomial cuadré Por lo que construyendo la tabla Ill fundamental para el caso parabélico 0 cuadratico queda de la forma: k x fx |x | xt | y | oxy | xy 1 a | at | at | at [om | am | tn 2 e2 | 2B | ef | et | wm | com | aim 3 ws | 3 | 23 | 23 | ys | zoey | zhu w | ew | oy | | oe | ae |imnae | kee Suma por ai | Ca? | De? | Det i | Dew | Daty nme Pr a;| Dat | at | Det |u| Dew | Dae Las ecuaciones normales para el caso cuadratico estan dadas por: n Yau Lae] [ow Dy La La? Val | a | =| Daw Le Vet Vat | La Cety Y este sistema de ecuaciones se puede resolver con los métodos de Cramer de 3 variables con 3 incégnitas. Por lo que construyendo la tabla IV fundamental para el caso cuibico esta dado pe k x [ei [x ix y [xy | #y | xy 1 a | at | af | at fat af wi fam | atm | atm 2 ve | a} | ap | ad [ae af nm | mn | ain | hn 3 wo | a3 | of | af [oh | of w | ess | ays | ody N ey | ah | ah | ah tek | af yy | ewyw | ckyw | chun Sama por | scat | cat ay, | Seat — sat [sat] sat] |u| scam | Sete | Dat Las ecuaciones normales para el caso cibico estan dadas por el siguiente sistema de 4 variables y 4 ecuaciones N Lu Lat Lai] [ DM Xx Lal Ve Vet | la] _ | Daw cet Lee Let Ve] | we Lay La La Ca Vat | La Leiyi Y en este caso es necesario recurrir al software de la computadora para poder resolver “de manera sencilla” este sistema de ecuaciones. Ajuste di Gax3 + ayxt La construccion de la tabla V fundamental para el caso polinomial cuartico esta dado por: k x[e¥][e[ [| # | x a a | at | at | at | ot | of | at | af 2 la lalalal alas | al a a | ad | ag | ag | af | of | ad | N ew | eh | eh | wh | eh | eh | eh | oh Suma por | 5, | Sa? | De? | Dat | Det | Det] Dei | Cet columna ue | oe] am on a x xy | xy | xy 7 nm |} am | cin | ty aty, = oe tye | ey | tie 3 ye | tayo | z3ye | ziye | xiye N yw | any | ziyw | eign | chow vetumee, | DH | Des | Daty | Date | Date Y las ecuaciones normales en este caso de funcién polinomial cuartica estén dadas por el siguiente sistema de 5 variables y 5 ecuaciones: N Ya Det Ue oa] [oe Du oa Lt La Lae Lal] a Lew Lat Let Lat Lae Lat lle || Dew Lt Lt Let Lat Lal | | Law Let Vet Val Vel Val | Loe Lely Y en este caso es necesario recurrir al software de la computadora para poder resolver “de manera sencilla” este sistema de ecuaciones. 3.5. El error que define al Método de Regresién por Minimos Cuadrados. (Fuente Bibliografica: Smith. (1988)) En el caso practico no es posible encontrar esta funcién polinomial y = f(x) y que satisfaga exactamente todas las relaciones: Yn = fn) Por lo general, uno esta dispuesto a aceptar un “error” (y este error dependera de cada observacién) que se define de la manera siguiente: Fk) = Ye + ex 2K Donde e, es el error de medicién observado en el dato. La pregunta que uno se hace es gcémo poder encontrar "la mejor aproximacién” que pase de los puntos? Para responder esta pregunta, hay que considerar los errores (también llamado como las desviaciones) y estén dados como la diferencia de! valor estimado por el modelo f (x) menos el valor observado yx, es decir: Errores de Medicion & =f (Xx) — Ye Paralsk Normal(0,a(er)) Respectivamente para: * Unntimero totalmente minimo que la media. + Y para un numero totalmente maximo de la desviacion estandar. (Fuente Bibliografica: Monahan. (2008)) Con esto definiremos los probables intervalos de prediccién del porcentaje de la desercién estudiantil para este plantel a considerar con su generacién en i es decir para el porcentaje %: % Desercién Minima < x; < % Desercién Maxima 4. Metodologia y Resultados. Cronograma de Planeacién de este proyecto. Cuya planeacién de este proyecto se ejecuté en las siguientes fechas: de Fecha tentativa de inicio y Nombre de la actividad a me realizar 1 11 al 30 de enero del 2016 Busqueda y discriminacién de la informacion de los datos 2 7 de febrero al 31 de marzo del |EI ajuste de funciones para el 2016 plantel de GAM.|. del IEMS-DF 3 1 al 16 de abril del 2016 EI pronéstico de la desercién por intervalos y conclusiones 4 17 de abril al 31 de mayo del 2016 _| Redaccién del Proyecto Terminal 4.2. Recursos de las Herramientas que se ocuparon en este proyecto En este caso fue necesario recurrir al ordenador para poder resolver "de manera sencilla" este proyecto planteado, por lo que se utilizd los sistemas algebraicos especializados en cémputo cientifico que son: © Wolfram Alpha desde: http://www.wolframalpha.com/ © Matrixcale version slu. desde: https://matrixcale.org/es/siu.html © Ademas de la hoja de calculo de Microsoft Excel 2010 del sistema operativo Windows 7. 2T= 1S Es de especial importancia considerarlo a razon de que se plantea modelos para dar respuesta a ciertas cuestiones fundamentales: (Fuente Bibliogréfica: Valdés Prada, F.(2014)) 1). A partir del conocimiento (0 concepcién) que se tenga del fenémeno de la desercién estudiantil en un plantel en especifico del IEMS-DF, identificar los atributos que lo caracterizan su estudio a través de las generaciones escolares y determinar cudles de ellos se van incorporar en el modelo, en este caso se tomara la relacién del ingreso-egreso de cada generacién en el plantel | de la delegacién Gustavo A. Madero a través de los datos registrados en la base de datos de la Direccién Estudiantil de esta dependencia cuyo dominio se localiza en: ‘hitp://sgie.iems.edu.mx/_con esta consideracién se efectua la siguiente tabla en Excel de la siguiente manera: 7419 20 73 fa 09.59 45 68.35 24 ea. 64.15 128 15 68.51 4 Bs a 2 E aa aime es 2).4Cuéles son las leyes y relaciones en las que estaré basado el modelo? En este trabajo como ya se menciond sera la relacién del ingreso-egreso estudiantil por generacién escolar comprendida en el plantel | de la delegacién Gustavo A. Madero que conforman el IEMS-DF, relacionada con la ley de! ajuste de funciones de los datos presentado enfocada a la modalidad escolarizada. 3). Cual es el papel de! tiempo, la distancia y la geometria en la formulacién del Modelo? A través de los valores observados que nos proporcionan la base de datos de! IEMS-DF en su plantel | de la delegacién Gustavo A. Madero, para poder inferir los valores estimados a pronosticar a través del ajuste de funciones tespectivo cuya distancia de estos valores sera la distancia de la medicién del error a estimar.

También podría gustarte