У нас тут недавно была задача кластеризации ~100k вирусов, vsearch работал тысячу лет (cd-hit, по идее, столько же). В итоге @Lepidobatrachus_laevis сотворил некоторую магию на min hash.
У нас тут недавно была задача кластеризации ~100k вирусов, vsearch работал тысячу лет (cd-hit, по идее, столько же). В итоге @Lepidobatrachus_laevis сотворил некоторую магию на min hash.