Your SlideShare is downloading. ×
Modelo de señal de entrada
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Modelo de señal de entrada

1,373
views

Published on


0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,373
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Modelamiento y Simulación Digital TEMA 5 Modelamiento de la Entrada de una Simulación
  • 2. Modelado de la Entrada de una Simulación
    • Una de las etapas fundamentales en la construcción de un modelo de simulación consiste en identificar:
    • los valores de los parámetros que configuran la estructura interna del sistema
    • las distribuciones probabilísticas que siguen las variables que representan los fenómenos aleatorios de los sistemas no determinísticos.
  • 3. Etapas del modelado de la entrada Recolección de datos del sistema real Identificación del tipo de distribución que siguen los datos recolectados Determinación de los parámetros de la distribución seleccionada Efectuar tests de bondad de ajuste para determinar si la distribución establecida es realmente una buena aproximación para modelar la variable aleatoria
  • 4. Recolección de datos del sistema real
  • 5. Dificultades en la toma de datos Simulación del funcionamiento de un lavadero automático de ropa Se asigno a dos estudiantes el trabajo de tomar datos par a estimar los tiempo s de arribos y tiempo de secado. Y aquí empezaron los problemas!!! Caso de Estudio: Lavadero
  • 6. ....... Los Problemas
    • La distribución de tiempos entre arribos era heterogénea, es decir, variaba en función del día de la semana y la hora del día.
    • Dado que el lavadero estaba abierto 7 días, 16 horas por día, la cantidad de horas a cubrir era de 112 por semana.
    • El proyecto de simulación completo debía ser realizado en 4 semanas
  • 7.
    • Los pobres estudiantes que estaban cursando 7 materias tenían fuertes restricciones de tiempo que impedían hacer un relevamiento completo de datos.
    • Lo que se hizo fue clasificar las distintas franjas de tiempo y días en función de la tasa de arribos como: altos, medios y bajos.
    • La estimación de las tasas de servicio también presentaron muchas dificultades.
    • Por ejemplo, se observaron que existían muchas combinaciones de tipos de servicios.
  • 8.
    • El caso de servicio más simple estaba dado por los clientes que primero utilizaban una lavadora y luego una secadora. •Pero existían clientes que ocupaban varias lavadoras y secadoras a la vez. •Otro problema importante era que inicialmente los estudiantes habían asumido como independientes entre sí a las tasas de lavado y secado.
  • 9.
    • Sin embargo, en la realidad, la cantidad de secadoras ocupadas en determinado momento dependía de cuantas lavadoras habían sido utilizadas un rato antes.
    • Otro elemento que afectaba a las tasas de servicio tenía que ver con el comportamiento del cliente.
    • • Muchos clientes permanecían en el lavadero durante todo el proceso de lavado y secado, con lo cual, apenas su ropa estaba lista, esta era inmediatamente removida de la máquina quedando el servidor desocupado
  • 10.
    • .•En cambio, otros clientes dejaban las instrucciones al encargado del lavadero y retornaban más tarde a retirar la ropa cuando ya estaba lista.
    • • En estos casos, los tiempos de servicio variaban notablemente, y más aún en los horarios de mayor afluencia de clientes.
  • 11.
    • Por último, otro problema que afectaba notoriamente el desempeño del lavadero tenía que ver con las fallas que se producían en las máquinas.
    • • Esto implicó incorporar el relevamiento de datos de dos tasas más: tiempo entre fallas y tiempo de reparación .
    • • Este tipo de tasas es muy dificil de determinar en períodos cortos de relevamiento.
    • • Además, la tasa de tiempo de reparación era fuertemente dependiente del día . Si una máquina se rompía un viernes, esta estaba fuera de servicio mucho más tiempo que cuando la falla se producía un lunes
  • 12. Pautas para la Recolección de Datos
    • La primera pauta consiste en efectuar una buena planificación de todo el proceso de recolección de datos.
    • Es muy importante antes de asignar recursos humanos y físicos a este proceso, hacer una sesión de pre-observación del funcionamiento del sistema.
  • 13.
    • En este proceso de pre-observación se puede :
    • Analizar que tipos de datos es necesario recopilar
    • Cuales de estos datos pueden obtenerse de registros históricos o a través de procedimientos automáticos . y en que formato está almacenada.
    • En el caso de decidir adquirir información a través de observación directa o mediante encuestas, es necesario diseñar los formularios en donde se volcará dicha información.
  • 14.
    • Analizar los datos a medida que van siendo recolectados .
    • Esto permitirá hacer correcciones a la planificación propuesta, evitando en algunas ocasiones la recolección de datos superfluoso redundantes.
    • • Intentar combinar conjuntos de datos homogeneos.
    • Chequear la existencia de homogeneidad entre datos correspondientes a períodos contiguos de tiempo dentro de un mismo día, o para el mismo período de tiempo en días consecutivos.
  • 15.
    • Los chequeos de homogeneidad pueden comenzar con una simple comparación entre las medias observadas para los datos de los períodos comparados .
    • Si estas coinciden, se puede realizar un análisis estadístico más preciso a fin de determinar la equivalencia o no entre las distribuciones de datos
  • 16.
    • Se debe evitar caer en la censura de datos .
    • O curre cuando el período de observación no contiene completamente la duración de la actividad cuyo tiempo desea estimarse.
    • Este problema ocurre a menudo en el análisis de sistemas con procesos de larga duración.
    • Identificar dependencias entre datos .
    • Esto puede realizarse mediante la construcción de diagramas de dispersión de puntos, los cuales permiten identificar correlaciones entre los datos correspondiente a distintas variables.
  • 17.
    • Identificar la presencia de autocorrelaciones .
    • Una secuencia de observaciones vinculadas a una misma variable puede presentar dependencias entre los elementos de la secuencia. Por ejemplo, la duración del tiempo de servicio del cliente i puede guardar alguna relación con la duración del tiempo de servicio del cliente i+n.
    • No confundir datos de entrada con datos de salida .Se debe ser cuidadoso a la hora de tomar las muestras de datos a fin de no mezclar información de entrada con valores, tales como los tiempos de demora, que constituyen medidas de desempeño del sistema.
  • 18. Identificación del tipo de distribución que siguen los datos recolectados
  • 19. Identificación del Tipo de Distribución
    • S obre la base de los datos recopilados para una variable, es posible determinar que tipo de distribución probabilística se ajusta mejor a los datos mediante la construcción de histogramas.
  • 20.
    • Los histogramas son diagramas que permiten observar la frecuencia con que se repiten los distintos valores obtenidos en una muestra.
  • 21. Construcción de Histogramas
    • Estos gráficos se construyen efectuando los siguientes pasos:
    • Se encuentra el rango de datos=Dato mayor – Dato menor
    • Se determina el numero de clases aproximadamente es igual a raíz cuadrada del numero de datos
    • Longitud de las clases = Rango/clases
  • 22.
    • Se etiqueta el eje de la x, con las clases establecidas
    • Se etiqueta el eje de las y con las cantidades de datos que posee cada clase.
    • Se dibujan las barras de frecuencia para cada clase.
  • 23. Ejemplo Numero de datos=40 Rango de datos Dato Mayor- Dato Menor Rango de datos = 14.33- 6.83=7.5 Longitud de la clase Numero de clases =
  • 24.  
  • 25. Tips para hacer histogramas
    • La forma de un histograma no depende únicamente de los datos sino también del numero de clases que se estén dando
    • El número de clases depende de la cantidad de datos que tiene la muestra.
    • Si la cantidad de datos es pequeña, se emplean 5 clases, nunca menos.
    • Si la cantidad de datos es muy grande, pueden definirse hasta un máximo de 15 clases.
  • 26.
    • C on respecto a la longitud de cada clase, en general se recomienda empezar particionando el rango en intervalos iguales.
    • Una vez construido el primer histograma, en función de la forma visualizada puede decidirse cambiar la longitud de las clases e incluso fusionar algunas clases adyacentes.
  • 27. Determinación de los parámetros de la distribución seleccionada
  • 28. Estimación de los parámetros
    • Una vez que se tiene una hipótesis sobre el tipo de distribución que siguen los datos, es necesario establecer cuales son sus parámetros.
    • Para ello se calcula la media y varianza de la muestra utilizada para construir el histograma.
  • 29.
    • L a media de una muestra X 1 ,X 2 ,...,X n es:
    • y la varianza, S 2 , se calcula como:
  • 30. Estimación de Parámetros
    • Luego, si la distribuci ó n es:
    Normal Exponencial Poisson …… .
  • 31. Efectuar tests de bondad de ajuste para determinar si la distribución establecida es realmente una buena aproximación para modelar la variable aleatoria
  • 32. Test de Bondad de Ajuste
    • La última etapa consiste en aplicar tests e stadísticos que permitan confirmar la d istribuciones observadas para las variables aleatorias.
    • Un procedimiento para testear la hipótesis de que una muestra aleatoria de tamaño n de una variable aleatoria X sigue una distribución específica, es aplicar el test de bondad de ajuste de la Chi-Cuadrado.
    • Este test formaliza la idea intuitiva de comparar el
    • histograma de datos con la forma de la función de densidad de probabilidad o función másica c orrespondiente a la distribución candidata.
  • 33. Test Chi-Cuadrado
    • El test comienza agrupando las n observaciones en k clases. La prueba estadística está dada por la siguiente fórmula:
    donde: Oi es la frecuencia observada en la muestra para la i-ésima clase. Ei es la frecuencia esperada para la i-ésima clase. La frecuencia esperada para cada intervalo Ei es igual a n.pi , siendo pi la probabilidad que teóricamente le corresponde a la clase i según la distribución hipotética.
  • 34. Test Chi-Cuadrado
    • Se puede demostrar que x 0 2 sigue aproximadamente la distribución chi-cuadrado con k-1 grados de libertad
    • Las hipótesis para el test son:
    • H0 : la variable aleatoria X satisface las suposiciones de distribución con los parámetros estimados.
    • H1 : la variable aleatoria X NO satisface las suposiciones de distribución con los parámetros estimados.
  • 35. Test Chi-Cuadrado
    • Para efectuar aceptar o rechazar las hipótesis es necesario determinar el valor crítico de la distribución chi-cuadrado para cierto coeficiente de confianza 1-  .
    • Este valor se obtiene por tabla y se denota:
     La hipótesis nula (H0) es rechazada cuando :
  • 36.
    • Es importante tener en cuenta que las clases definidas para efectuar el test de bondad de ajuste generalmente difieren de las clases empleadas en la construcción del histograma.
  • 37.
    • Para el caso de distribuciones continuas:
    • Se recomienda particionar el rango de la muestra en clases con igual valor esperado .
    • Para el caso de distribuciones discretas:
    • El valor esperado para cada clase no debe ser inferior a 5, si hay clases con valor esperado menor a 5, estas son fusionadas con clases adyacentes.
    Ojo...
  • 38.  
  • 39.  
  • 40. Test de Bondad de Ajuste Problemas
    • Si bien los test de bondad de ajuste proveen una buena guía en la selección de distribuciones para las variables aleatorias, no hay que esclavizarse de los resultados obtenidos por estas pruebas estadísticas.
    • • Es importante saber que estos test están fuertemente influenciados por el tamaño de la muestra.
    • • En general, si la muestra es pequeña estos métodos tienden a rechazar las hipótesis nulas, mientras que si la muestra es muy grande, suelen aceptar todas las hipótesis nulas.
  • 41. Modelado de la Entrada Ejemplo: obtención de la muestra Supongamos que contamos con la siguiente muestra para una variable aleatoria:
  • 42. identificación de distribución Con los datos obtenidos, se construye un histograma en el cual se visualiza una distribución de tipo exponencial .
  • 43. Ejemplo: test de bondad de ajuste
    • H0: la variable aleatoria está distribuida exponencialmente.
    • Con el objeto de llevar adelante los tests de bondad de ajuste con intervalos de igual probabilidad, se deberán determinar los límites de cada rango.
    • Dado que la raíz cuadrada de 50 es 7,07, se recomienda usar 7 u 8 clases. En este caso se ha optado por el uso de 8 clases,cada una con una probabilidad 0,125.
    • Los límites de los rangos se obtienen por medio de inversa de la función acumulada de la distribución.
  • 44. test de bondad de ajuste Rangos Finales 0 a 1,590 1,590 a 3,425 3,425 a 5,595 5,595 a 8,252 8,252 a 11,677 11,677 a 16,503 16,503 a 24,755 24,755 a inf
  • 45. test de bondad de ajuste El siguiente cuadro muestra cómo se ajustan los datos observados a la distribución planteada como hipótesis.
  • 46. Los grados de libertad están dados por k-1 = 8-1 = 7 Se rechaza la hipótesis nula.
  • 47. Modelado de la Entrada sin Datos
    • Lamentablemente hay situaciones donde debemos modelar sistemas para los cuales no hay posibilidad de contar con muestras para sus variables aleatorias.
    • • En estos casos el modelador debe obtener información por otros medios:
    • Reingeniería de datos: consultar estándares de fabricación de las distintas piezas que forman el sistema.
    • Opinión de expertos: consultar a personas familiarizadas con otros sistemas similares al que se está modelando.
    • Analizar limitaciones físicas o convencionales del sistema que ayuden a acotar la duración de tiempos de servicio.
    • Hacer suposiciones basadas en la naturaleza del proceso .

×