Я даже не про конкретные ручки, которые покрутить, а про всю теорию того, как CH использует память. Например, он умеет обрабатывать запрос не целиком, а кусками?
да, умеет. Проблема в том что наприм есть кеш индекса и он раздувается до 5ГБ по дефолту, поэтому надо в config.xml <mark_cache_size>1073741824</mark_cache_size> , или например запрос обрабатывает данные кусками по 65к строк и читает пишет через большие буферы, таким образом что select * from limit 1 который стримается, потребует буферов, больше чем 4ГБ.