Вообще да, надо разбираться вообще со всем процессом получения, обработки и хранения. Недолго и в дата инженера превратиться))
Я уже записался на программу Data Engineer (совместно с Jetbrains). В итоге вместо специальности Data Engineer получил 3 несвязных курса: Python (с ООП и метаклассами, но без pandas, pyspark, pipelines и т.д.), SQL и Git. Очень рекомендую (нет).