Что даёт индекс, если потом всё равно при селекте надо сортировать?
order by будет быстрее отрабатывать, так как внутри потоков данные будут с диска прочитаны отсортированными.
порядок хранения строк на диске. лучше сжатие если пользователь имеет одинаковые данные в данных находящихся рядом по времени.
фильтрация только event_time при удачном распределении пользователей по временным окнам будет быстрее.