Кто как обрезает email signature при парсинге reply имейла? @jitbit вот сто процентов у вас эта боль была
сначала юзали ML (разметили несколько тыс писем руками) оказалось говно и ненадежно. Сейчас делаем как gmail - ищем одинаковые части в емейлах от одного и того же юзера, когда накопим побольше таких авторазмеченных писем (миллионы) - включим ML опять
но мы пришли к выводу, что это нихера не работа с текстами, nlp и прочий word2vec, это скорее задача машинного зрения. надо рендерить html в картинку и потом смотреть "находится внизу, отделена пропуском, состоит из коротких строк" и тп.
Ребят, а какие CRM/Helpdesk/etc используют, для ведения клиентов? Хочу, чтобы при регистрации пользователя в ИС, через API создавалась задача в этой CRM, например: позвонить и заанбордить. Чтобы были цепочки стратегий записанные по шагам автоматическии создающие в потоке/очереди действий события по отношению к пользователю.
но мы пришли к выводу, что это нихера не работа с текстами, nlp и прочий word2vec, это скорее задача машинного зрения. надо рендерить html в картинку и потом смотреть "находится внизу, отделена пропуском, состоит из коротких строк" и тп.