Телеграмм чат группы ctodailychat страница 5932

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

ctodailychat

1380 membersпожаловаться на группу

2020 August 18

IV

Igor V in ctodailychat

Сергей Аксёнов

Уважаемые кроты, а кто что использует для хранения и версионирования ML-проектов: моделей, датасетов, вот этого вот всего? Кто что имеет сказать про связку https://dvc.org/ + https://cml.dev/ ?

Data Version Control · DVC

Open-source version control system for Data Science and Machine Learning projects. Git-like experience to organize your data, models, and experiments.

Мы пилим свою платформу, но в своё время активно смотрели в сторону Predictive Model Markup Language

https://en.wikipedia.org/wiki/Predictive_Model_Markup_Language

Predictive Model Markup Language

The Predictive Model Markup Language (PMML) is an XML-based predictive model interchange format conceived by Dr. Robert Lee Grossman, then the director of the National Center for Data Mining at the University of Illinois at Chicago. PMML provides a way for analytic applications to describe and exchange predictive models produced by data mining and machine learning algorithms. It supports common models such as logistic regression and other feedforward neural networks. Version 0.9 was published in 1998. Subsequent versions have been developed by the Data Mining Group.

источник

13:48пожаловаться #1

GA

Gleb Abroskin in ctodailychat

Сергей Аксёнов

Уважаемые кроты, а кто что использует для хранения и версионирования ML-проектов: моделей, датасетов, вот этого вот всего? Кто что имеет сказать про связку https://dvc.org/ + https://cml.dev/ ?

Data Version Control · DVC

Open-source version control system for Data Science and Machine Learning projects. Git-like experience to organize your data, models, and experiments.

зависит от задач, моделей и фреймворков, которые в разработке, где-то и собственный велосипед сойдёт (делали так), где-то будет очень удобно в dvc или аналогах. Например, если все в sklearn, там для всего один интерфейс, все просто сериализовать — вообще 0 проблем руками что-то сделать.

Когда тыкали dvc год назад, было неудобно, что он в основном версионирует датасеты через файлы, а у нас все в базах, копию в виде файлов, мы бы не потянули.

CML пока не пробовали, но выглядит многообещающе

Кроме того, что вы скинули можно на catalyst посмотреть

источник

13:51пожаловаться #2

СА

Сергей Аксёнов... in ctodailychat

Мы пилим свою платформу, но в своё время активно смотрели в сторону Predictive Model Markup Language

https://en.wikipedia.org/wiki/Predictive_Model_Markup_Language

Predictive Model Markup Language

The Predictive Model Markup Language (PMML) is an XML-based predictive model interchange format conceived by Dr. Robert Lee Grossman, then the director of the National Center for Data Mining at the University of Illinois at Chicago. PMML provides a way for analytic applications to describe and exchange predictive models produced by data mining and machine learning algorithms. It supports common models such as logistic regression and other feedforward neural networks. Version 0.9 was published in 1998. Subsequent versions have been developed by the Data Mining Group.

> is an XML-based

источник

13:52пожаловаться #3

СА

Сергей Аксёнов... in ctodailychat

зависит от задач, моделей и фреймворков, которые в разработке, где-то и собственный велосипед сойдёт (делали так), где-то будет очень удобно в dvc или аналогах. Например, если все в sklearn, там для всего один интерфейс, все просто сериализовать — вообще 0 проблем руками что-то сделать.

Когда тыкали dvc год назад, было неудобно, что он в основном версионирует датасеты через файлы, а у нас все в базах, копию в виде файлов, мы бы не потянули.

CML пока не пробовали, но выглядит многообещающе

Кроме того, что вы скинули можно на catalyst посмотреть

У нас питонячьи сервисы на pytorch и tensorflow

источник

13:53пожаловаться #4

IV

Igor V in ctodailychat

Сергей Аксёнов

> is an XML-based

Какая разница как сериализуется, не руками же собирать.

источник

13:54пожаловаться #5

GA

Gleb Abroskin in ctodailychat

Сергей Аксёнов

У нас питонячьи сервисы на pytorch и tensorflow

Как я понимаю, более общий без xml — это https://onnx.ai

источник

13:54пожаловаться #6

GA

Gleb Abroskin in ctodailychat

Как я понимаю, более общий без xml — это https://onnx.ai

Не туда ответил, это было про pmml

источник

13:54пожаловаться #7

СА

Сергей Аксёнов... in ctodailychat

Какая разница как сериализуется, не руками же собирать.

Инстинкт. Если разработчики выбрали XML - с ними что-то не так (они увязли в экосистеме Microsoft, например)

источник

13:55пожаловаться #8

СА

Сергей Аксёнов... in ctodailychat

зависит от задач, моделей и фреймворков, которые в разработке, где-то и собственный велосипед сойдёт (делали так), где-то будет очень удобно в dvc или аналогах. Например, если все в sklearn, там для всего один интерфейс, все просто сериализовать — вообще 0 проблем руками что-то сделать.

Когда тыкали dvc год назад, было неудобно, что он в основном версионирует датасеты через файлы, а у нас все в базах, копию в виде файлов, мы бы не потянули.

CML пока не пробовали, но выглядит многообещающе

Кроме того, что вы скинули можно на catalyst посмотреть

Спасибо!

источник

13:57пожаловаться #9

IV

Igor V in ctodailychat

Сергей Аксёнов

Инстинкт. Если разработчики выбрали XML - с ними что-то не так (они увязли в экосистеме Microsoft, например)

Ну так себе аргумент. Стандарт существует с середины девяностых.

источник

13:59пожаловаться #10

СА

Сергей Аксёнов... in ctodailychat

Ну так себе аргумент. Стандарт существует с середины девяностых.

Именно)

источник

13:59пожаловаться #11

СА

Сергей Аксёнов... in ctodailychat

Нет, я согласен, что это предрассудок, но пару раз он уже спасал меня от блудняка)

источник

14:00пожаловаться #12

GA

Gleb Abroskin in ctodailychat

Сергей Аксёнов

У нас питонячьи сервисы на pytorch и tensorflow

если вы хотите воспроизводимость, по-моему, в это классно и просто умеет catalyst — сохраняет все файлы и окружение и все. Если хочется строить пайплайны (то есть сохранять результаты шагов, чтобы не пересчитывать) для работы с данными, то тут подход dvc будет интереснее, потому что позволяет поделить процесс на этапы и использовать уже обработанные данные, НО это потребует дисциплины от тех, кто пишет модели. Дисциплина заключается в том, что все должно быть разложено по правильным файлам, правильно названо и делать какую-то небольшую часть работы. То есть обучать в jupyter не прокатит больше:)

(год назад писал по этому диплом, могу где-то обладать не последними знаниями. но старался не наврать)

источник

14:04пожаловаться #13

СА

Сергей Аксёнов... in ctodailychat

если вы хотите воспроизводимость, по-моему, в это классно и просто умеет catalyst — сохраняет все файлы и окружение и все. Если хочется строить пайплайны (то есть сохранять результаты шагов, чтобы не пересчитывать) для работы с данными, то тут подход dvc будет интереснее, потому что позволяет поделить процесс на этапы и использовать уже обработанные данные, НО это потребует дисциплины от тех, кто пишет модели. Дисциплина заключается в том, что все должно быть разложено по правильным файлам, правильно названо и делать какую-то небольшую часть работы. То есть обучать в jupyter не прокатит больше:)

(год назад писал по этому диплом, могу где-то обладать не последними знаниями. но старался не наврать)

Спасибо!

источник

14:04пожаловаться #14

IZ

Igor Zinovev in ctodailychat

вопрос к людям, работающим по ИП: есть ли смысл оформлять электронную подпись и проходить эти 10 кругов ада с оформлением или проще 1 раз в год ходить в налоговую ножками и скидывать отчет?

я подпись не получал, сдаю отчеты через тиньков, там они как-то сами генерят подпись и подтверждаешь через смску. Те по факту ничего не ставил дополнительно и не ходил никуда. С эльбой сравнить не могу, но тиньковым удоволетворен

источник

14:06пожаловаться #15

DB

Dmitry Belyaev in ctodailychat

божественно))

источник

14:07пожаловаться #16

SZ

Sergey Zhuk in ctodailychat

я подпись не получал, сдаю отчеты через тиньков, там они как-то сами генерят подпись и подтверждаешь через смску. Те по факту ничего не ставил дополнительно и не ходил никуда. С эльбой сравнить не могу, но тиньковым удоволетворен

Спасибо за совет, но уже поздно, вписался в Эльбу :(

источник

14:08пожаловаться #17

DB

Dmitry Belyaev in ctodailychat

Кто-нибудь пользовался ноутбуками «специально под Линукс»? В интернете увидел нахваливают ноут от System76, но по перформансу сравнений почти нет. Действительно на них лучше работает тот же Ubuntu?

источник

14:09пожаловаться #18

NK

Nikita Kulikov in ctodailychat

Ну, как минимум, он устанавливается, наверно

источник

14:10пожаловаться #19

NK

Nikita Kulikov in ctodailychat

Уже лучше 99% ноутов

источник

14:10пожаловаться #20