Size: a a a

Natural Language Processing

2020 November 13

SG

Sergey Gorbunov in Natural Language Processing
Вроде тут хорошо было написано:
источник

SG

Sergey Gorbunov in Natural Language Processing
источник

SG

Sergey Gorbunov in Natural Language Processing
То, как будет написано, от схемы зависит
источник

AC

Anton Cherepkov in Natural Language Processing
https://mishka.travel/blog/index/node/id/3807-novie-pravila-transliteracii-v-zagranpasportah-rf/

исходя из этой статьи, в старых паспортах и новых может быть по-разному написано
источник

YB

Yuri Baburov in Natural Language Processing
Sergey Gorbunov
Вроде тут хорошо было написано:
есть правила, по которым будет по-умолчанию написано dmitrii (правила должны гуглиться), но ты вроде бы можешь попросить поменять на dmitry когда делают паспорт.
источник

DG

Dmitry Gorbatenko in Natural Language Processing
Yuri Baburov
есть правила, по которым будет по-умолчанию написано dmitrii (правила должны гуглиться), но ты вроде бы можешь попросить поменять на dmitry когда делают паспорт.
инфа сотка 🙂
источник
2020 November 14

НМ

Никита Маткин... in Natural Language Processing
Добрый день. Необходимо выгрузить корпус комментариев из региональных сообществ ВК по ключевыми словами. Период: 01.10.2019-01.10.2020.

Ни один парсер ( barkov, targethunter, pepper.ninja) не справляется. Как бы вы решили эту проблему?
источник

MM

Mikhail Mashkovich in Natural Language Processing
Никита Маткин
Добрый день. Необходимо выгрузить корпус комментариев из региональных сообществ ВК по ключевыми словами. Период: 01.10.2019-01.10.2020.

Ни один парсер ( barkov, targethunter, pepper.ninja) не справляется. Как бы вы решили эту проблему?
А в чем проблема собственный написать, API вроде простой, выгрузку особо не ограничивают.
источник

НМ

Никита Маткин... in Natural Language Processing
После ваших слов в первый раз попробовал взаимодействовать с VK API. Вы не знаете, можно ли у метода wall.search задать ограничение по времени поиска и парсить только комментарии?
источник

MM

Mikhail Mashkovich in Natural Language Processing
насколько понимаю, нет, а https://vk.com/dev/newsfeed.search вам не подойдет или надо в конкретных группах искать?
источник

DS

Damir Safix in Natural Language Processing
есть ли какое-нибудь решение для экстракции фактов из текста?
источник

DS

Damir Safix in Natural Language Processing
я нашёл одну для ру
источник

НМ

Никита Маткин... in Natural Language Processing
Mikhail Mashkovich
насколько понимаю, нет, а https://vk.com/dev/newsfeed.search вам не подойдет или надо в конкретных группах искать?
Да, именно в группах. Если ничего не найду, то буду думать в сторону newsfeed
источник

MM

Mikhail Mashkovich in Natural Language Processing
Никита Маткин
Да, именно в группах. Если ничего не найду, то буду думать в сторону newsfeed
Ну можно без ограничения даты, они же идут упорядоченными по дате, ненужные записи пропускать, а к нужным получать комментарии.
источник

НМ

Никита Маткин... in Natural Language Processing
Хорошо, спасибо за помощь. Попробую завтра, потому что достиг лимита
источник

LD

Lednik Dwarf in Natural Language Processing
Подскажите пожалуйста, как обучить catboost на матрице tf-idf? У меня блокнот сразу вылетает
источник

o

oldysty in Natural Language Processing
Lednik Dwarf
Подскажите пожалуйста, как обучить catboost на матрице tf-idf? У меня блокнот сразу вылетает
Не очень уверен, но кажется, что для обучения на разреженной матрице понадобится очень много деревьев. Лучше попробовать линейную модель.
источник

LD

Lednik Dwarf in Natural Language Processing
Спасибо за ответ, но нашел информацию в туториалах)
источник
2020 November 15

JN

Jack New in Natural Language Processing
Добрый день! Посоветуйте пжлс хорошую библиотеку по аугментации текстов на русском. Спасиб.
источник

JN

Jack New in Natural Language Processing
* для учебной задачи по разработке чатбота, ищу сколь-нибудь приемлемый датасет.
источник