ЧАНК оно должно выбирать, ну по дате там например ограничивать, GROUP BY делать если надо
короче должно делать так чтобы данные для JOIN в память умещались
тогда картина чанк1 из табла1 по дате - там рандомный набор c id1 по id10000 (например) и чанк1 из табла2 по дате и там рандомный набор из id5000 по id15000. Джойном чанки пересеклись в 4321 случае (например), таким образом результирующий чанк оставляет часть данных за бортом?