Size: a a a

Natural Language Processing

2020 October 25

OS

Oleg Sb in Natural Language Processing
его нужно инициализировать явно https://colab.research.google.com/notebooks/tpu.ipynb
источник

FF

Futorio Franklin in Natural Language Processing
Не уверен, что он так нативно вместо gpu встанет, но попробую
источник

S

Samorazvitie in Natural Language Processing
Dmitry
А какое это имеет отношение к тематике чата?
а тематика не про Processing.org ?
источник

A

Aliaksandr in Natural Language Processing
Alex Konst
Кажется, такого нет. Но не сложно запилить свое решение, обучив на новостях, например.
Нынче в новостных агенствах жертвы ЕГЭ трудятся;)
источник
2020 October 26

D

Dmitry in Natural Language Processing
Samorazvitie
а тематика не про Processing.org ?
Вот совсем нет))
источник

A

Anthony in Natural Language Processing
Привет всем! Я недавно занимаюсь обработко текстов и столкнулся проблемой с извлечением ФИО целиком и отдельных компонентов в библиотеке natasha.  Не находит имена отдельно почти никогда и не находит ФИО с маленькой буквы. Скажите, может, есть уже решения этой проблемы?
источник

SP

Sebastian Pereira in Natural Language Processing
Anthony
Привет всем! Я недавно занимаюсь обработко текстов и столкнулся проблемой с извлечением ФИО целиком и отдельных компонентов в библиотеке natasha.  Не находит имена отдельно почти никогда и не находит ФИО с маленькой буквы. Скажите, может, есть уже решения этой проблемы?
deeppavlov bert ner
источник

AO

Alex Orgish in Natural Language Processing
источник
2020 October 27

MS

Maxym Shyrchenko in Natural Language Processing
Всем привет
Можете подсказать библиотеку для определения языка текста на Python?
источник

AZ

Andrey Zakharov in Natural Language Processing
Maxym Shyrchenko
Всем привет
Можете подсказать библиотеку для определения языка текста на Python?
cld2, cld3, fasttext
источник

EP

Elvis Prestley in Natural Language Processing
Maxym Shyrchenko
Всем привет
Можете подсказать библиотеку для определения языка текста на Python?
langdetect
источник

V

Vic in Natural Language Processing
Кто-то использовал Amazon mechanical turk?
Сколько там стоит заказать создание(написание) туркерами диалогов на заранее заданную тематику? Диалогов нужно 10000, в каждом по 10 реплик.
Просто не шарю есть ли там какие-то средние цены или целиком от сложности задачи зависит(тем более там ранги есть)
источник

V

Vic in Natural Language Processing
Во всех чатах спросил и никто не знает)) ну хоть на Толоке скажите
источник

PV

Peter Vanin in Natural Language Processing
Привет, как вам идея?

habr.com/ru/company/leader-id/blog/521378/
источник

AW

Alex Wortega in Natural Language Processing
Ну хз, хотелось бы потыкать. Звучит как вундервафля
источник

PV

Peter Vanin in Natural Language Processing
Alex Wortega
Ну хз, хотелось бы потыкать. Звучит как вундервафля
Они предоставляют доступ к демкам платный, к слову
источник

PV

Peter Vanin in Natural Language Processing
Хабр потерял уровень технической подготовки и диалога, увы
источник

PV

Peter Vanin in Natural Language Processing
Смотрю со своей колокольни, не с аспекта заучек. Умение и желание мыслить и вчитываться для меня в собеседнике первичнее, и анализируя тексты прихожу к выводу о каком-то крайне поверхностном мышлении, пока не заходит в область каких-то заучных тонкостей. Хотя это и не аспект экспертизы и знания профобластей, но огорчает гораздо сильнее
источник

AT

Andrey Tatarinov in Natural Language Processing
Vic
Во всех чатах спросил и никто не знает)) ну хоть на Толоке скажите
По ощущениям: на толоке народ готов делать задачи за ~$0.01, если они занимают единицы минут, 1-3.

Прикинь сколько времени займет написать диалог.

Но на Толоке надо очень внимательно относиться к контролю качества, есть прямо целые сегменты исполнителей, которые готовы скликать твой бюджет.

Для задачи класса "написать диалог" обязательно настраивать постприемку и выдавать/принимать задачи небольшими пачками, чтобы не получилось, что пул из 10000 заданий заполнен пустыми диалогами.

Агрессивно банить абьюзеров.

Сильно фильтровать по глобальному скору исполнителей.

В идеале сделать свой навык и отдельной подзадачей, на каком-то обучающем/тестовом сете отскорить исполнителей по качеству исполнения, назначить навык, потом работать только с ними.
источник

AT

Andrey Tatarinov in Natural Language Processing
Закладывай бюджет в 3-5 раз больше, чем получается простым умножением, так как наверняка часть сольешь впустую, в рамках самообучения 🙂
источник