Кто-то сталкивался с проблемой установки natasha.markup? Хочу достать именованные сущности из текста (имена, адреса, даты), но при установке пишет, что нет соответствующей версий, удовлетворяющей natasha.markup. Какие для неё требования по версиям?
Привет! Дополз до пары, где ты рассказываешь про w2v и проблемы с аналогиями. Спасибо, очень ценно, только можешь пояснить — какой алгоритм был бейзлайном по сравнению с w2v, когда мы определяем, лучше или хуже бейзлайна он работает?)
То есть тут был читинг в том что они на самом деле подсматривали в ответы. При этом это все равно показывает что арифметические операции не супер важны. А дело только в том повезет или не повезет иметь таргетное слово близко к женщине или королю, или не повезет.
Мне нужно разделять текст в предложения. Я посмотрел наиболее популярные модели: razdel, rusenttokenize. Судя по таблице они имею самую высокую точность, но почему то они ломаются если в тексте новое предложение начать с маленькой буквы ... В интернете, особенно в соц. сетях, люди редко используют заглавные буквы... а обрабатывать эти данные хотелось бы.