что то приблизительно такое(не обещаю что код рабочий, так как не тестил) data = {"train": [], "test": []} for row in dataset: train_len = int(len(row)*ratio) test_len = len(row) - train_len data["train"].extend(row[:train_len]) data["test"].extend(row[test_len:]) но это если б у тебя были в формате dataset = [ [(), (), ()], [(), (), ()], ]