Size: a a a

2020 April 21

PV

Peter Vanin in Science FYI
и про них, к сожалению, тоже
источник

AZ

Arthur Zalevsky in Science FYI
Peter Vanin
После произошедшего спора выглядит весьма умно
а где вы увидели спор? это было обычное обсуждение. мы вам выкатили комментарии со стороны потенциальных потребителей продукта. оппонировать, к сожалению,  вам оказалось особо не чем :(
источник

PV

Peter Vanin in Science FYI
не стал, не увидел выгоды
источник

O

Orodret in Science FYI
Alex Beliavskaia
...и как им стать не прогрызя всю мебель в доме
Избавиться от мебели в доме перед началом обучения?
источник

AB

Alex Beliavskaia in Science FYI
Peter Vanin
и про них, к сожалению, тоже
основной контраргумент был, что дата ученые от науки уже ответили на большую часть вопросов
источник

AB

Alex Beliavskaia in Science FYI
Orodret
Избавиться от мебели в доме перед началом обучения?
совмещать программирование и йогу?
источник

O

Orodret in Science FYI
Alex Beliavskaia
совмещать программирование и йогу?
А можно как-то по-другому?
источник

AZ

Arthur Zalevsky in Science FYI
Peter Vanin
После произошедшего спора выглядит весьма умно
один из замечательных поинтов Анны, который она раскрыла в предудщем тексте (еще до того, как ее взяли в Новартис), что как раз большая часть ДС обычно оверкомпликейтед и совершенно не нужны реальному бизнесу. И вот как раз хороший (читай опытный дс), это не тот, кто может суперхардкор навернуть, а тот, который может соотнести сложность и времязатраты на задачу с потенциальной прибылью.  Вот ее старая колонка https://vc.ru/flood/37965-pyat-glavnyh-navykov-horoshego-data-scientist-kotorym-ne-uchat-v-knigah
источник

AZ

Arthur Zalevsky in Science FYI
Alex Beliavskaia
...и как им стать не прогрызя всю мебель в доме
достаточно завести щеночка. он избавит тебя от необходимости грызть мебель! (и сам успешно с этим справится)
источник

O

Orodret in Science FYI
Arthur Zalevsky
один из замечательных поинтов Анны, который она раскрыла в предудщем тексте (еще до того, как ее взяли в Новартис), что как раз большая часть ДС обычно оверкомпликейтед и совершенно не нужны реальному бизнесу. И вот как раз хороший (читай опытный дс), это не тот, кто может суперхардкор навернуть, а тот, который может соотнести сложность и времязатраты на задачу с потенциальной прибылью.  Вот ее старая колонка https://vc.ru/flood/37965-pyat-glavnyh-navykov-horoshego-data-scientist-kotorym-ne-uchat-v-knigah
Зачем думать о трудозатратах, если проект волонтерский?))
источник

PV

Peter Vanin in Science FYI
брр, от выражения "реальный бизнес" коробит
источник

O

Orodret in Science FYI
Arthur Zalevsky
достаточно завести щеночка. он избавит тебя от необходимости грызть мебель! (и сам успешно с этим справится)
Мебель будет сгрызена в два раза быстрее? Хотя по моему опыту, взрослый человек сгрызает мебель эффективнее щенка
источник

AZ

Arthur Zalevsky in Science FYI
Peter Vanin
брр, от выражения "реальный бизнес" коробит
ну, ээээ. вот есть букинг.ком - они реальный бизнес, а которых затраты, зарплаты и тд. а есть 800 волонтеров, которые джаст фор лулз.
источник

AB

Alex Beliavskaia in Science FYI
Orodret
Мебель будет сгрызена в два раза быстрее? Хотя по моему опыту, взрослый человек сгрызает мебель эффективнее щенка
Зато есть противодействие — откладывание кирпичей
источник

AZ

Arthur Zalevsky in Science FYI
можете предложить другую терминологию?
источник

AB

Alex Beliavskaia in Science FYI
Инь и янь дата саенс
источник

PV

Peter Vanin in Science FYI
осознаю почему вышел из обсуждения. еще раз
источник

O

Orodret in Science FYI
Alex Beliavskaia
Зато есть противодействие — откладывание кирпичей
Успеваешь отстроить кирпичную мебель?
источник

Е

Екатерина in Science FYI
Alex Beliavskaia
...и как им стать не прогрызя всю мебель в доме
так вот он какой, секретный ингредиент успеха! :)
источник
2020 April 22

T

Tanya in Science FYI
Вот вы тут выше упоминали про cord-19, у них есть страничка с поиском https://cord-19.apps.allenai.org/ и если что-нибудь наберете в строке поиска, то увидите, что там не только статьи про коронавирус, там разное среди этих 30к статей. Например, такая статья 2007 года https://www.obstetrics-gynaecology-journal.com/article/S1751-7214(07)00055-3/fulltext
- это я pregnancy в поиске вбила, одна из первых ссылок в выдаче.
Там идея в том, чтобы объединить знания по коронавирусу с тем, что уже было известно раньше и увидеть что-то, что никто глазами в этой куче не увидит)
Чем хорош датасет? Например, можно попробовать с помощью классического nlp (или даже просто ключевых слов) офильтровать статьи, где упоминаются данные интересного вам типа, попробовать вытащить контакты corresponding авторов и попросить поделиться данными (индивидуальной массовой рассылкой письма с просьбой, которую можно сделать каким-нибудь скриптом) - а вдруг прокатит и кто-то поделится)
Еще можно попробовать поискать циклические цитирования, если там можно вытащить цитирования - все же пользуются ситуацией и публикуются как не в себя, вдруг там и такие недобросовестные товарищи есть) Можно поискать какие-то противоречия в работах (или работы-аутлайеры) и попробовать дальше разобраться в них, что-то еще интересное придумать.

На kaggle скорее всего большинство блокнотов с ответами на вопросы просто с бессмысленным EDA - потому что задачи слишком общие и там большинство ограничатся решением этих задач «в лоб», да и хороший сторителлинг - это нетривиально (
источник