Документ обсуждает сети SlowFast для распознавания видео, которые используют два потока: медленный для пространственной информации и быстрый для временной. Влагается в исследования, связанные с классификацией ввода видео, а также проводятся абляционные испытания, чтобы изучить роль каждого потока в модели. Выявляются вычислительные затраты, связанные с медленным и быстрым потоками, при этом подчеркивается эффективность сети в задаче распознавания.