Всмысле SAMLE 0.1? Я ставил самые разные значения, 0.1, 0.5, 0.001 и всё без толку. В моём случае семплирование стоит по полю auction_id, число всегда разное. Надо было его оборачивать в какой нибудь хеш?
хеш нужен что бы результат был правильный.
например auction_id от 1101 до 300000009 , а хеш от auction_id будет от 0 до maxUInt64
если чтение с диска занимает большую часть запроса и sample где-нибудь 5 полем, то не конечно не поможет семплинг.
т.е. надо делать таблицы специально под запросы которые вы будете делать с семплингом.
например
https://clickhouse.tech/docs/en/getting-started/tutorial/#create-tablesCREATE TABLE tutorial.visits_v1
...
ORDER BY (CounterID, StartDate,
intHash32(UserID), VisitID)
SAMPLE BY intHash32(UserID)
у CounterID маленькая кардинальнасть, у StartDate тоже