La utilización de un recurso determina el tiempo de entrega y el nivel de servicio a los clientes o usuarios, en todos los ambientes de flujo: producción u operaciones, procesos y proyectos. Comprender esto es vital para poder manejar los niveles de servicio acordados
1. Liberando el Potencial Escondido de su Empresa
www.mejoracontinua.biz
La teoría de colas provee una forma de predecir al retraso promedio que se produce cuando el trabajo
se acumula frente a un centro de trabajo. Los cálculos son complejos, pero con suerte podemos ignorar
la matemática y concentrarnos en los elementos principales que esta teoría revela sobre la ocupación de
los centros de trabajo. Primero definamos algunos términos:
jcisneros@mejoracontinua.biz
099 975 3628
Centro de Trabajo y Tiempo de Proceso
Un centro de trabajo es el lugar donde se realiza el trabajo. Para realizar una determinada tarea, se
asume que un centro de trabajo va a necesitar una cantidad fija de tiempo - el tiempo de proceso. En
realidad este supuesto es técnicamente falso, pero tiene algo de utilidad. Si los requerimientos de
trabajo llegan más rápido de lo que pueden ser procesados, una cola se forma y el tiempo de respuesta
crece porque el trabajo tiene que esperar en la cola a que le llegue su turno de ser atendido.
Teoría de Colas
Mientras más ocupado está un centro de trabajo, es más probable que un nuevo trabajo que llega
tendrá que esperar, debido a que hay trabajos más adelante. Una fórmula aproximada que describe esta
relación es:
Tiempo de Repuesta = Tiempo de Proceso /(1 – Utilización)
El verdadero conocimiento viene de entender el gráfico de la función a continuación, observando como
se comporta la utilización desde el 0% al 90%
Dese cuenta que el tiempo de respuesta
comienza en 1x cuando el centro de
trabajo está inactivo. Cuando está
inactivo, el tiempo de respuesta siempre
es igual al tiempo de proceso porque no
hay nada por lo que esperar.
2. Liberando el Potencial Escondido de su Empresa
www.mejoracontinua.biz
El tiempo de respuesta se duplica cuando el centro de trabajo tiene un 50% de utilización. A este punto,
algunas veces los trabajos que llegan encuentran al centro de trabajo inactivo, otras veces lo encuentran
con algunos trabajos en espera, pero el efecto en el trabajo promedio es el doble del tiempo de
respuesta comparado con cuando el centro de trabajo está inactivo. El tiempo de respuesta se duplica a
4x cuando el centro de trabajo está al 75% de utilización y se duplica otra vez a 8x alrededor del 87% de
utilización. Asumiendo que más trabajo sigue llegando al centro de trabajo, el tiempo de respuesta se
dobla a intervalos más cortos 16x a 94% de utilización, 32x al 97% de utilización) de tal manera que la
curva se vuelve casi vertical. Estas duplicaciones son creadas por el hecho de que el centro de trabajo
está ocupado y por lo tanto con frecuencia hay mucho trabajo adelante en la cola.
Mientras más lento sea un centro de trabajo, más bajo deberá ser
el nivel de utilización máxima que se planea para un pico de carga.
El recurso más lento es el que más va a contribuir al incremento en
el tiempo de servicio. Piense al respecto, apenas con 50% de utilización el tiempo de respuesta se
duplica en el recurso más lento de todo el proceso. Si por razones de productividad el jefe insiste en que
la utilización debe llevarse hasta el 90% entonces el tiempo de respuesta promedio es 10x veces el de
inactividad.
Es muy difícil aprovechar el último 15% de cualquier cosa. En la
medida que un centro de trabajo se acerca a una utilización del
100% el tiempo de respuesta se deteriorará tanto para la
transacción promedio que ningún cliente estará satisfecho. El gráfico a continuación representa la
situación tal como el gráfico previo, excepto que este está mostrando la utilización al 99%. Al 85% de
utilización el tiempo de respuesta está cerca de 7x y empeora rápidamente a partir de ahí.
Mientras más se acerca al extremo, más alto es el precio de estar
equivocado. Imagine que su plan demanda de un 90% de un centro
de trabajo en la hora pico de su día pico,
pero por cualquier circunstancia
(Murphy, incremento de la demanda,
etc.) fue necesario un 9% más de
capacidad y llevaron un centro de
trabajo al 99% de la capacidad. En el
plan el tiempo de respuesta promedio
para ese centro de trabajo era de 10X,
pero en vez de eso subió a 100x. ¡Ups!
Esta es la razón por la que hay que
guardar un porcentaje de seguridad
siempre que se planifica la capacidad.
El tiempo de respuesta está limitado por el número que puede
esperar. Matemáticamente, los cálculos de la teoría de colas
predicen que a un 100% de utilización el tiempo de respuesta se
jcisneros@mejoracontinua.biz
099 975 3628
3. Liberando el Potencial Escondido de su Empresa
www.mejoracontinua.biz
volverá casi infinito. Esto es claramente ridículo en el mundo real ya que no hay un número infinito de
usuarios que demanden el servicio.
El máximo tiempo para cualquier centro de servicio o trabajo, está limitado por el número total de
pedidos que llegan. Si, en el peor caso solo puede haber 20 solicitudes de servicio, entonces el máximo
tiempo posible de respuesta es de 20x el tiempo de servicio. Si Ud. es el único proceso que usa el centro
de trabajo, no importa cuánto trabajo le envíe, no habrá incremento causado por una cola producida
por el tiempo de espera porque nunca puede haber alguien delante de Ud.
Recuerde esto es un promedio no el máximo. Si un único centro de
servicio está a l 75% de utilización, entonces el tiempo de repuesta
será 4x el tiempo de servicio. En un momento determinado un
trabajo llega cuando el centro de servicio está inactivo (no hay tiempo de espera) o puede ser que llegue
cuando hay docenas de trabajos delante esperando a ser procesados (enorme tiempo de espera)
Mientras más alta sea la utilización de un centro de trabajo, será más probable que Ud. experimente
tiempo de espera realmente molestos y tenga problemas en cumplir con sus niveles de servicio
acordados. Esto es verdad especialmente si sus niveles de servicio están escritos para especificar que
ninguna transacción tomará más de un tiempo X.
Hay un efecto humano de negación en múltiples centros de
servicio. Si hay múltiples centros de servicio que pueden manejar el
trabajo que llega, entonces, mientras más se eleva la utilización, el
tiempo de respuesta se mantiene más bajo. Eventualmente la curva tiene que virar y cuando lo haga
será más bruscamente y con una mayor pendiente.
Este efecto cobra sentido si piensa en hacer
compras en un supermercado. Si al momento del
checkout, siete cajeras están ocupadas y tres
están disponibles, Ud. irá donde una cajera
disponible. A pesar de que el centro de servicio
está ocupado al 70%, su tiempo de espera con
frecuencia es cero, y el tiempo de respuesta es
igual al tiempo de proceso. La vida es buena
EL momento en el que las 9 cajeras están
ocupadas, el siguiente cliente tendrá cero
tiempo de espera pero el décimo primer cliente
ya tendrá que esperar. Así que cuando se tiene
una batería de centros de trabajo, se puede cargarlos mucho más que cuando se tiene uno solo, pero
hay que estar preparados para agregar capacidad rápidamente o sufrir grandes incrementos en el
tiempo de respuesta. Las Compañías tienen que entender que mantener el nivel de servicio dentro de
los límites tolerables de los clientes es muy importante para las ventas futuras, por lo que
probablemente es mejor invertir ahora que esperar a perder clientes.
jcisneros@mejoracontinua.biz
099 975 3628