Ранее тут много хвалили seaweedfs. Мы начали активно тестировать кластер и столкнулись с проблемами:
1. Кластер зависает без видимых причин
2. Меняется поведение S3 от версии к версии (например в первоначально развёрнутой версии целевой бакет создавался автоматически, после обновления уже стала требоваться отдельная команда)
3. Компоненты кластера создают большое (3к+) количество соединений между собой по TCP IPv4/IPv6
4. Ошибки в логах, что с ними делать не понятно:
Очень много
httpStatus:500 and JSON:{"error":"unexpected EOF"}
Встречаются реже
httpStatus:400 and JSON:{"error":"read tcp
10.0.2.54:8080-\u003e10.0.1.54:33964: i/o timeout"}
master masterClient failed to receive from
10.0.1.54:9333: rpc error: code = Unavailable desc = transport is closing
panic: raft: Index is beyond end of log: 3 33
goroutine 193 [running]:
github.com/chrislusf/raft.(*Log).getEntriesAfter(0xc0001d2850, 0x21, 0x7d0, 0x0, 0x0, 0x0, 0x0)
#011/home/travis/gopath/pkg/mod/
github.com/chrislusf/raft@v1.0.7/log.go:256 +0x885
github.com/chrislusf/raft.(*Peer).flush(0xc000348680)#011/home/travis/gopath/pkg/mod/
github.com/chrislusf/raft@v1.0.7/peer.go:179 +0xee
github.com/chrislusf/raft.(*Peer).heartbeat(0xc000348680, 0xc000178c00)
#011/home/travis/gopath/pkg/mod/
github.com/chrislusf/raft@v1.0.7/peer.go:167 +0x3a5
github.com/chrislusf/raft.(*Peer).startHeartbeat.func1(0xc000348680, 0xc000178c00)
#011/home/travis/gopath/pkg/mod/
github.com/chrislusf/raft@v1.0.7/peer.go:100 +0x68
created by
github.com/chrislusf/raft.(*Peer).startHeartbeat#011/home/travis/gopath/pkg/mod/
github.com/chrislusf/raft@v1.0.7/peer.go:98 +0x134