Size: a a a

2019 September 20

AZ

Arthur Zalevsky in Science FYI
Alex Beliavskaia
Спасибо, мне надо 177934 последовательности)
упси
источник

AZ

Arthur Zalevsky in Science FYI
а как ты это делаешь?
источник

O

Orodret in Science FYI
Alex Beliavskaia
Спасибо, мне надо 177934 последовательности)
Эммм... это именно последовательности, а не риды? Оо
источник

O

Orodret in Science FYI
И их прям все надо выравнивать друг с другом?
источник

V

Victor in Science FYI
Alex Beliavskaia
Спасибо, мне надо 177934 последовательности)
7 не лишняя?
источник

AB

Alex Beliavskaia in Science FYI
Arthur Zalevsky
а как ты это делаешь?
Пока никак, я редко делаю выравнивания. В голове есть всякие клусталы и маслы.
источник

AB

Alex Beliavskaia in Science FYI
Orodret
Эммм... это именно последовательности, а не риды? Оо
Это датабаза. И я щас проверила, ее в выровненном виде нетути.
источник

AB

Alex Beliavskaia in Science FYI
Victor
7 не лишняя?
Нет( То есть я ее отфильтрую как-то конечно, но не на порядок
источник

AZ

Arthur Zalevsky in Science FYI
Alex Beliavskaia
Это датабаза. И я щас проверила, ее в выровненном виде нетути.
ну.... у меня для тебя плохие новости... в лоб это плохо работает (ну или я таки не нагуглил более адекватного решения. если найдешь - поделись плз).

вот типа 40к у меня на 40 ядрах шло что-то в районе недели.
источник

MR

Mike Raiko in Science FYI
Я бы уточнил задачу.
источник

AZ

Arthur Zalevsky in Science FYI
а тебе там прям все 180к нужны? или там таки есть повторы? и тебе важна общаяя структура базы и несколько конкретных последовательностей?
источник

AZ

Arthur Zalevsky in Science FYI
Mike Raiko
Я бы уточнил задачу.
++
источник

AB

Alex Beliavskaia in Science FYI
Печаль =D Пойду куплю печенек сисадмину, чтобы пустил на царь-машину)
источник

AB

Alex Beliavskaia in Science FYI
А, впрочем я знаю как сделать жизнь легче. Мне же выравнивания по группам нужны. Спасибо, вы навели меня на способ сократить количество на порядок.
источник

AZ

Arthur Zalevsky in Science FYI
Alex Beliavskaia
А, впрочем я знаю как сделать жизнь легче. Мне же выравнивания по группам нужны. Спасибо, вы навели меня на способ сократить количество на порядок.
вот можно еще этой приблудой предварительно обработать - http://weizhongli-lab.org/cd-hit/ она прям огненно быстро кластеризует.
источник

MR

Mike Raiko in Science FYI
У нас тут недавно была задача кластеризации ~100k вирусов, vsearch работал тысячу лет (cd-hit, по идее, столько же). В итоге @Lepidobatrachus_laevis  сотворил некоторую магию на min hash.
источник

AB

Alex Beliavskaia in Science FYI
Mike Raiko
Я бы уточнил задачу.
Ты не знаешь, как сильва достигла своего выравнивания? Там же огромная база 16С
источник

AB

Alex Beliavskaia in Science FYI
Arthur Zalevsky
вот можно еще этой приблудой предварительно обработать - http://weizhongli-lab.org/cd-hit/ она прям огненно быстро кластеризует.
Выглядит очень полезно, спасибо
источник

DA

Dmitry A in Science FYI
Mike Raiko
У нас тут недавно была задача кластеризации ~100k вирусов, vsearch работал тысячу лет (cd-hit, по идее, столько же). В итоге @Lepidobatrachus_laevis  сотворил некоторую магию на min hash.
нене, там не про выравнивания было.
источник

MR

Mike Raiko in Science FYI
Ну и тут, я подозреваю, не про выравнивание. На 177k у тебя так всё гэпами обрастёт, что никакого сигнала не останется.
источник