Size: a a a

Natural Language Processing

2021 July 12

IS

Ivan Stankov in Natural Language Processing
Кто-то запускал это дело для русского языка?
источник

IS

Ivan Stankov in Natural Language Processing
Вроде рабочая штука, но нужно словарь собрать такой, чтобы в нем слова были по частоте отсортированы.
источник

VM

Victor Maslov in Natural Language Processing
потому что гугл транслейт, гугл поиск, гугл мапс и прочие сервисы, которые доступны анонимно -- это одно, а сотня сервисов под общим названием Google Cloud, для использования которых нужно регаться с банковской карточкой -- это другое
есть еще третье как бы посередине -- Google Apps, с интеграциями вокруг Google Docs/Drive
источник

VM

Victor Maslov in Natural Language Processing
первое -- для анонимусов и мышеводов
третье -- для интеграторов уже существующего мелкого бизнеса
второе -- платформа для оригинальных проектов, наиболее надежная, с тарифами, службой поддержки и т.п.

поэтому в первом есть жесткие ограничения и капча
а во втором каждый запрос посчитан, и вместо капчи с тебя просто берут деньги
источник

IS

Ivan Stankov in Natural Language Processing
Понял) спасибо!
источник

VM

Victor Maslov in Natural Language Processing
кстати, товарищи, хочу высказать свое наблюдение про данный чат/канал

чатик тут ващ по большей мере как бы не программистский, а скорее исследовательский, грубо говоря, скачал готовую прогу, конфиг поправил, запустил, работаешь с данными, а не с кодом

но насколько же ваш подход к чату, как инструменту, более практичный, чем в чатах в том же самом телеграме, но на тему, какого-нибудь скажем, языка программирования и/или фреймворка

во всех русскоязычных чатах, которые видел, люди полностью убеждены в том, что они все будущие основатели мультимиллиардного стартапа, и по на ним плачет гугл, и прямо в правилах по традициям телеграма, указан жесткий запрет упоминания других каналов и сайтов, бесплатных ресурсов для обучения, и нужно обязательно покупать какие-нить книги админов или идти на платные курсы опять же админов, которые ради продвижеиня своих сраных сайтов эти все каналы и создают, какими-то по знакомству продвигаемыми ссылками заманивая в них тысячами людей, которые только закончили школу, и теперь они илитные погромисты и чатик их самый тру

а у вас тут люди не умничают, ощущение кринжа не вызывают, все как-то созидательно, классно в общем

меня за несуразицы тогда не высмеяли, и я тут сижу и краем уха черпаю знания о трендах и ключевых словах, и когда в очередной раз нужна будет тема NLP, есть ощущение, что здесь действительно можно будет получить какую-то помощь, а не просто время потратить
источник

DD

David Dale in Natural Language Processing
На сайте нкря есть слова и словные н-граммы с частотами.
источник

IS

Ivan Stankov in Natural Language Processing
О, то что нужно вообще)  минимальная предобработка файлика нужна
источник

MK

Max Kuznetsov in Natural Language Processing
Вообще, странно, что операторы несут отсебятину, уже давно у большинства есть скрипты и шаг влево, шаг вправо - растрел. Хотя если это вторая линия и цель заменить ее роботом, то для пользователей сервиса это печаль 😔
источник

K

Ksenia in Natural Language Processing
источник

B

Banof in Natural Language Processing
🔫 Edward Danield кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@ksioucha, @antiquebalmark, @crocopie, @fl666m4nn, @Nakilon
При поддержке Золота Бородача
источник

I

Ilya in Natural Language Processing
у кого-нибудь есть датасет IEMOCAP, кто мог бы пошарить?)
источник

ИК

Иван Каилов... in Natural Language Processing
Здравствуйте! Я уже писал подобный запрос.
Мне нужен человек который поможет извлечь из огромного текста
ФИО, должности и названия компаний.

Готовы заплатить за работу)
Предыдущие два контакта сказали, что очень заняты и не могут взять проект на работу.
источник

ИК

Иван Каилов... in Natural Language Processing
Мы не программисты поэтому ищем возможность с помощью вас)
источник

Е

Егорка in Natural Language Processing
А не подскажите, какой области текстовые данные?
источник

ИК

Иван Каилов... in Natural Language Processing
Новостные статьи. В текстовом файле
источник

ИК

Иван Каилов... in Natural Language Processing
от 2 000 000 статей
источник

D

Dmitriy in Natural Language Processing
можно посмотреть кусок текса?
источник

МЕ

Максим Ермаков... in Natural Language Processing
Коллеги, посоветуйте по исправлению ошибок: есть тексты со специфичными наименованиями (названия фирм, то есть несловарные слова), в которых пользователи делают ошибки, при том не просто могут заменить букву (орфография; разбили на слова, сравнили расстояние, пофиксили), но и поставить ненужный пробел, да ещё так, что получатся правильные слова. Чем такие кейсы можно ловить/фиксить? Не охота движущимся окном по тексту ездить - наименований много.
источник

NS

Nikolay V. Shmyrev in Natural Language Processing
Iemocap маленький очень толку мало от него. Лучше msp podcast попросить
источник