Programación dinámica

PROGRAMACIÓN DINÁMICA ESPECIALIZACIÓN EN GERENCIA INFORMÁTICA

INTRODUCCIÓN Existe una serie de problemas matemáticos cuya solución se puede dar mediante el empleo de un algoritmo recursivo o mediante la implementación de una resolución por etapas, planteando una serie de sub problemas a partir del problema principal; en ambos casos, la solución puede ser caótica, agrandar el tamaño del problema o simplemente, el método empleado convertirse en impracticable. Esto puede mejorar sustancialmente mediante la Programación Dinámica, PD.

¿QUÉ ES LA PROGRAMACIÓN DIMÁMICA? La Programación Dinámica es una técnica de programación que se emplea típicamente para resolver problemas de optimización en los cuales el problema principal se encuadra en varios subproblemas, solucionando cada uno de ellos y luego ligando las soluciones de una forma óptima, donde la solución final permita resolver y tomar decisiones correctas a problemas actuales y futuros.

¿A QUÉ PROBLEMAS SE APLICA? Esta técnica se aplica sobre problemas que a simple vista necesitan un alto coste computacional (posiblemente exponencial) donde: – Subproblemasoptimales: La solución óptimaa un problema puede ser definida en función de Soluciones óptimas a subproblemas de tamaño menor, generalmente de forma recursiva. – Solapamiento entre subproblemas: Al plantear la solución recursiva, un mismo problema se resuelve más de una vez

¿QUÉ SE LOGRA? La PD utiliza un enfoque ascendente (botton-up) para obtener la solución, primero calcula las soluciones óptimas a problemas de tamaño pequeño. Utilizando dichas soluciones encuentra soluciones a problemas de mayor tamaño. – La idea de la PD es encontrar la solución a los subproblemas y almacenarlos en alguna estructura (diccionario) para utilizarlas posteriormente. – Por tanto, es más eficiente que la fuerza bruta que resuelve el mismo subproblema una y otra vez. -- Evita calcular lo mismo varias veces. Usualmente se utiliza una matriz que se rellena conforme las soluciones a los Subproblemas que son calculados (espacio vs. tiempo).

ELEMENTOS DE LA PROGRAMACIÓN DINÁMICA Los siguientes cuatro elementos conforman la resolución de un problema mediante PD: 1. Principio de Optimalidad de Bellman 2. Definición Recursiva de la solución optimal 3. Enfoque ascendente 4. Búsqueda solución optima

Principio de Optimalidad de BELLMAN “Una secuencia óptima de decisiones que resuelve un problema debe cumplir la propiedad de que cualquier subsecuencia de decisiones debe ser tambien optima respecto al subproblema que resuelve”. Esto es, la solución optima a cualquier instancia no trivial de un problema es una combinación de soluciones óptimas de algunas de las sub-instancias.

CARACTERÍSTICAS DE UN PROBLEMA DE PD Para que un problema pueda ser resuelto con la técnica de programación dinámica, debe cumplir con ciertas características: - Naturaleza secuencial de las decisiones: El problema puede ser dividido en etapas. - Cada etapa tiene un numero de estados asociados a ella. - La decisión óptima de cada etapa depende solo del estado actual y no de las decisiones anteriores. - La decisión tomada en una etapa determina cual será el estado de la etapa siguiente. En síntesis, la política óptima desde un estado s de la etapa k a la etapa final esta constituida por una decisión que transforma s en un estado s’ de la etapa k +1 y por la política óptima desde el estado s’ hasta la etapa final.

RESOLUCIÓN DE UN PROBLEMA DE PD Para resolver un problema de programación dinámica debemos al menos cumplir con: Identificación de etapas, estados y variable de decisión: • Cada etapa debe tener asociado una o mas decisiones (problema de optimización), cuya dependencia de las decisiones anteriores esta dada exclusivamente por las variables de estado. • Cada estado debe contener toda la información relevante para la toma de decisión asociada al período. • Las variables de decisión son aquellas sobre las cuales debemos definir su valor de modo de optimizar el beneficio acumulado y modificar el estado de la próxima etapa.

Descripción de ecuaciones de recurrencia: Nos deben indicar como se acumula la función de beneficios a optimizar (función objetivo) y como varían las funciones de estado de una etapa a otra. Resolución: Debemos optimizar cada subproblema por etapas en función de los resultados de la resolución del subproblema siguiente. Al final obtendremos una solución óptima para el problema.

El problema de las monedas Mi empresa de colectivos • El precio de los boletos puede llegar a cambiar en cualquier momento • En todo momento se puede pagar con cualquier moneda o billete • Tengo que dar el vuelto usando pocas monedas o billetes ¿Vuelto usando pocas monedas? ,[object Object]

Viene alguien y paga con un billete de $50

El vuelto es $50 - $0.80 = $49,20

Si le llego a dar 492 monedas de 10 centavos, no se toma nunca mas mi colectivo,[object Object]

Billetes de 2, 5, 10, 20, 50 y 100 pesosSi el vuelto de $49,20, ¿Cuál es la mejor manera (menos cantidad de billetes y monedas) de dar esa cantidad? ,[object Object],En general, si voy tomando cada vez el billete mas grande que puedo, me da la cantidad mínima

Programación dinámica

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (20)

Similar a Programación dinámica

Similar a Programación dinámica (20)

Último

Último (20)

Programación dinámica