Телеграмм чат группы natural_language_processing страница 895

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2186 membersпожаловаться на группу

2020 October 27

V

Vic in Natural Language Processing

Andrey Tatarinov

Закладывай бюджет в 3-5 раз больше, чем получается простым умножением, так как наверняка часть сольешь впустую, в рамках самообучения 🙂

Спасибо. Согласен про умножение) Меня интересует отбор людей, можно ли их заранее отобрать или прям это совсем рандом кто возьмется. А далее вообще думал там разбивка на группы, конечно нельзя давать все диалоги группе из 10 человек, они устанут, надо взять 200 и по ним распределить, тогда субъективно качество лучше будет и они сильнее будут бояться накосячить и перехитрить меня

источник

22:09пожаловаться #1

YN

Yuriy Nazarov in Natural Language Processing

Спасибо. Согласен про умножение) Меня интересует отбор людей, можно ли их заранее отобрать или прям это совсем рандом кто возьмется. А далее вообще думал там разбивка на группы, конечно нельзя давать все диалоги группе из 10 человек, они устанут, надо взять 200 и по ним распределить, тогда субъективно качество лучше будет и они сильнее будут бояться накосячить и перехитрить меня

Можно ещё 2 типа заданий делать: составление диалогов и их оценка.

источник

22:10пожаловаться #2

AT

Andrey Tatarinov in Natural Language Processing

Спасибо. Согласен про умножение) Меня интересует отбор людей, можно ли их заранее отобрать или прям это совсем рандом кто возьмется. А далее вообще думал там разбивка на группы, конечно нельзя давать все диалоги группе из 10 человек, они устанут, надо взять 200 и по ним распределить, тогда субъективно качество лучше будет и они сильнее будут бояться накосячить и перехитрить меня

Есть фильтрация по некому глобальному скору Толоки. Если оставишь верхние 10%, то на задаче будет работать примерно 20-50 человек одномоментно.

источник

22:10пожаловаться #3

AT

Andrey Tatarinov in Natural Language Processing

Есть возможность создать свой навык и выставлять оценку исполнителю по навыку.

Типа делаешь тестовое задание, оцениваешь на его основании исполнителей, выставляешь им оценки.

источник

22:11пожаловаться #4

AT

Andrey Tatarinov in Natural Language Processing

За тестовое тоже, как правило, платишь.

источник

22:12пожаловаться #5

AT

Andrey Tatarinov in Natural Language Processing

Можно не платить при пост-приемке, если не принимаешь. Но исполнитель может оспорить.

источник

22:12пожаловаться #6

AT

Andrey Tatarinov in Natural Language Processing

Приемку лучше делать самому или штатным модератором. Проверку толоки толокой у нас не удавалось хорошо делать.

источник

22:13пожаловаться #7

Q

Qwerty in Natural Language Processing

Andrey Tatarinov

По ощущениям: на толоке народ готов делать задачи за ~$0.01, если они занимают единицы минут, 1-3.

Прикинь сколько времени займет написать диалог.

Но на Толоке надо очень внимательно относиться к контролю качества, есть прямо целые сегменты исполнителей, которые готовы скликать твой бюджет.

Для задачи класса "написать диалог" обязательно настраивать постприемку и выдавать/принимать задачи небольшими пачками, чтобы не получилось, что пул из 10000 заданий заполнен пустыми диалогами.

Агрессивно банить абьюзеров.

Сильно фильтровать по глобальному скору исполнителей.

В идеале сделать свой навык и отдельной подзадачей, на каком-то обучающем/тестовом сете отскорить исполнителей по качеству исполнения, назначить навык, потом работать только с ними.

Не надо так делать.

источник

23:06пожаловаться #8

Q

Qwerty in Natural Language Processing

Спасибо. Согласен про умножение) Меня интересует отбор людей, можно ли их заранее отобрать или прям это совсем рандом кто возьмется. А далее вообще думал там разбивка на группы, конечно нельзя давать все диалоги группе из 10 человек, они устанут, надо взять 200 и по ним распределить, тогда субъективно качество лучше будет и они сильнее будут бояться накосячить и перехитрить меня

Там все элементарно.
Делаете на страницу несколько заданий (например 5, не знаю какие у вас задачи), 1 из 5 заданий - контрольное (с вашим ответом, простое самое).
Если в нем ошибка, значит перед вами бот. Автоматически настраиваем бан таких. Все кто ошибся хотя бы 1 раз сразу вылетают с проекта. Значит они не больше одной страницы сделают.
+ все что с ошибкой важно отправить опять в работу автоматически. Там есть такая опция.

Можно еще попробовать перекрытие например 2/3, но я от него отказался. И по рейтингу выбирайте топ10 сперва. А за 1 цент можете хоть 100 заданий выставить на страницу. Если не будут делать - уменьшать пока не начнут.

Приемку везде автоматическую ставить если чо!

источник

23:10пожаловаться #9

V

Vic in Natural Language Processing

Там все элементарно.
Делаете на страницу несколько заданий (например 5, не знаю какие у вас задачи), 1 из 5 заданий - контрольное (с вашим ответом, простое самое).
Если в нем ошибка, значит перед вами бот. Автоматически настраиваем бан таких. Все кто ошибся хотя бы 1 раз сразу вылетают с проекта. Значит они не больше одной страницы сделают.
+ все что с ошибкой важно отправить опять в работу автоматически. Там есть такая опция.

Можно еще попробовать перекрытие например 2/3, но я от него отказался. И по рейтингу выбирайте топ10 сперва. А за 1 цент можете хоть 100 заданий выставить на страницу. Если не будут делать - уменьшать пока не начнут.

Приемку везде автоматическую ставить если чо!

спасибо, поизучаю

источник

23:17пожаловаться #10

AT

Andrey Tatarinov in Natural Language Processing

Не надо так делать.

Так - это как?

источник

23:22пожаловаться #11

AT

Andrey Tatarinov in Natural Language Processing

По нашему опыту на любых нетривиальных заданиях, если банить за первую ошибку, то не остается никого, вообще.

источник

23:27пожаловаться #12

2020 October 28

SP

Sebastian Pereira in Natural Language Processing

Отказались от Толокои в пользу студентов местного геофака - полетом довольны

источник

09:40пожаловаться #13

SP

Sebastian Pereira in Natural Language Processing

Бюджет тот же, результат лучше, деньги после работы.

источник

09:41пожаловаться #14

SP

Sebastian Pereira in Natural Language Processing

Текст размечают замечательно.

источник

09:41пожаловаться #15

AW

Alex Wortega in Natural Language Processing

https://github.com/google-research/multilingual-t5

google-research/multilingual-t5

Contribute to google-research/multilingual-t5 development by creating an account on GitHub.

источник

10:57пожаловаться #16

A

Ajay in Natural Language Processing

I'm using sutime library inside the map function on an RDD in pyspark but it is giving me some weird error and I've wasted a lot of time searching on this. Can anyone help me over this?

источник

15:19пожаловаться #17

A

Ajay in Natural Language Processing

an issue has been raised here

источник

15:20пожаловаться #18

A

Ajay in Natural Language Processing

.

https://github.com/FraBle/python-sutime/issues/46

PicklingError: Could not serialize object: TypeError: can't pickle _jpype._JMethod objects · Issue #46 · FraBle/python-sutime

I am using Google Colab and trying to use Stanford sutime library inside a function that is being called by pyspark. This function takes a row of a given RDD and then uses the sutime library to ret...

источник

15:20пожаловаться #19

A

Ajay in Natural Language Processing

I think the developers of sutime are already in this group, if I'm not wrong. Hope to hear from them.

источник

15:21пожаловаться #20