Size: a a a

Natural Language Processing

2021 September 08

A

Andrey in Natural Language Processing
он не найдёт числа словами...
источник

A

Andrey in Natural Language Processing
числа прописью кстати natasha умеет. и даты вроде тоже умела
источник

ПП

Павел Приказчиков... in Natural Language Processing
к сожалению нет, или я не тот экстрактор использую
источник

ПП

Павел Приказчиков... in Natural Language Processing
источник

OP

Oleg Polivin in Natural Language Processing
👍👍 спасибо!!
источник

A

Andrey in Natural Language Processing
а, это есть надстройка
https://github.com/SergeyShk/Word-to-Number-Russian
источник

ПП

Павел Приказчиков... in Natural Language Processing
спасибо, попробую
источник

A

Andrey in Natural Language Processing
там выше советовали нечто heideltime, если он все сразу из коробки, лучше его попробовать) не городить код без необходимости.

больше кода- больше багов)
источник

ПП

Павел Приказчиков... in Natural Language Processing
лучший код - ненаписанный код
источник

ПП

Павел Приказчиков... in Natural Language Processing
демо справляется с задачей, попробую развернуть, спасибо!
источник

ВГ

Вадим Гилемзянов... in Natural Language Processing
Коллеги, приветствую!
У кого-либо был опыт отцифровки аудиозаписей общения операторов с клиентом?
То есть привести аудиозапись - в текстовой формат […Клиент, Оператор, Клиент …]
источник

ПП

Павел Приказчиков... in Natural Language Processing
с такой задачей в соседний чат https://t.me/speech_recognition_ru
источник

AG

Andrey Galichin in Natural Language Processing
Здравствуйте!
Скорее всего уже спрашивали и не раз, поэтому заранее извиняюсь, если повторюсь:
Есть аналог этой группы, только по computer vision?
источник

A

Andrey in Natural Language Processing
что-то можно узнать и здесь
opencv_ru
Группы близкой тематики
@ml_ru
https://t.me/opencv_ru
источник
2021 September 09

IS

I Sh in Natural Language Processing
Покажите, как вы инициализируете токенизатор. Из коробки токенизатор ХаггингФэйса обрезает всякие умляуты и прочие надбуквенные штуки. Это сделано для оптимизации под английский язык.

Слова, как в вашем примере должны быть в этом берте. Но, даже, если каких-то слов нет в словаре, вы всегда можете его расширить и добавить свои специфические токены. (Естественно, нужно будет переобучить модельку, чтобы она вам давала нормальные эмбеддинги для добавленных токенов).
источник

D

Dmitry in Natural Language Processing
Коллеги, подскажите почему могут получаться отрицательные значения у вероятности при обучении fastText?
источник

DE

Dani El-Ayyass in Natural Language Processing
Друзья, всем привет!)

Приглашаю вас на мое сегодняшнее выступление в Sberloga с темой по git hooks)
источник

DE

Dani El-Ayyass in Natural Language Processing
🚀 @SBERLOGA
👨‍🔬 Дани Эль-Айясс:  «Git hooks is all you need»
⌚️ Четверг 9 сентября, 19.00 по Москве

Git Hooks — это полезный инструмент в арсенале каждого программиста, который помогает как в автоматизации рутинных вещей, так и решении определенных проблем, возникающих при разработке.

В рамках работы над проектом всегда хочется, чтобы код был читаемым, соответствовал определенным стандартам, работал корректно и не падал на тестах, и для достижения этого, большую роль играют такие вещи, как средства форматирования кода, статические анализаторы, линтеры, запуск тестов, и т.д.

Все это отнимает время, но не тогда, когда есть настроенные Git Hooks!

Ссылка на репозиторий:
https://github.com/dayyass/git_hooks_is_all_you_need

Ссылка на зум будет доступна через  тг чат
https://t.me/sberlogadataclub ближе к началу доклада.

Видео записи докладов доступны на ютуб канале SBERLOGA  
https://www.youtube.com/c/sberloga
источник

A

Arthur in Natural Language Processing
источник

AN

Andrei Nosov in Natural Language Processing
Друзья, а есть ли библиотека на питоне, которая позволяет менять существительное по роду. Например, если нужно сконвертить повара в повариху и обратно. Inflect в pymorphy этого не может.
источник