Телеграмм чат группы natural_language_processing страница 801

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1886 membersпожаловаться на группу

2020 August 24

М

Марк in Natural Language Processing

тут среди списка есть и тот что я нашел на другой странице.
В общем вопрос какой из инстансов наиболее близок по мощности к видеокарте 1080 с 12гб, кажется это инстанс g4dn.xlarge где 16гб видеопамяти, но не вижу какая видекарта, сравнил на сайте, вроде похожа https://versus.com/ru/nvidia-geforce-gtx-1080-ti-vs-nvidia-tesla-t4

Nvidia GeForce GTX 1080 Ti vs Nvidia Tesla T4: в чем разница?

В чем разница между Nvidia GeForce GTX 1080 Ti и Nvidia Tesla T4? Узнайте какой из них лучше и их общие показатели в рейтинге видеокарта .

В SageMaker Есть возможность добавить свою рукописную модель в качестве Docker контейнера и потом использовать её практически во всех амазоновских сервисах из коробки. Плюс там автоматом мониторинг, версионирование и много плюшек. Но скорее всего это будет значительно дороже простого EC2 инстанса.

https://docs.aws.amazon.com/sagemaker/latest/dg/your-algorithms-inference-code.html

Use Your Own Inference Code with Hosting
Services - Amazon SageMaker

How Amazon SageMaker interacts with a Docker container that runs your own inference code for hosting services.

источник

15:39пожаловаться #1

AK

Alexander Kukushkin in Natural Language Processing

Готовлю большой пост на Хабр про проект Natasha, pdf в приложении. Почитайте, пожалуйста, напишите если заметите какие-то ошибки. Текст во многом дублирует посты на natasha.github.io, но есть новые разделы: про Ipymarkup, про интерфейс библиотеки Natasha, плюс учтены коменты из этого чата, про кривую разметку Nerus https://t.me/natural_language_processing/19552, например

источник

15:56пожаловаться #2

AK

Alexander Kukushkin in Natural Language Processing

Проект_Natasha_Набор_качественных_открытых_инструментов_для_обработки.pdf

источник

15:56пожаловаться #3

SP

Sebastian Pereira in Natural Language Processing

Alexander Kukushkin

Готовлю большой пост на Хабр про проект Natasha, pdf в приложении. Почитайте, пожалуйста, напишите если заметите какие-то ошибки. Текст во многом дублирует посты на natasha.github.io, но есть новые разделы: про Ipymarkup, про интерфейс библиотеки Natasha, плюс учтены коменты из этого чата, про кривую разметку Nerus https://t.me/natural_language_processing/19552, например

Ок, читаю.

источник

16:43пожаловаться #4

A

Arthur in Natural Language Processing

Добрый день!
Каждое слово кодирую с помощью Fast Text: на выходе вектор размера (300,) для каждого слова
вопросы
1) как кодировать цифры в номере телефона (любые числа хорошо бы закодировать)
2)как кодировать незнакомые слова? игнорировать?

1) Зависит от того, как номер телефона разбивается на токены. Для чего вам нужно векторное представление телефонных номеров?
2) FastText умеет строить векторы незнакомых слов, усредняя векторы подслов.

источник

16:46пожаловаться #5

D

Dare in Natural Language Processing

1) Зависит от того, как номер телефона разбивается на токены. Для чего вам нужно векторное представление телефонных номеров?
2) FastText умеет строить векторы незнакомых слов, усредняя векторы подслов.

1) я каждому слову в итоге хочу навесить свой POS, каждому числу номера - B-Number или I-Number в зависимости от позиции в самом номере
2) да, точно, забыла про это, спасибо

источник

16:48пожаловаться #6

JG

Jack Golokhov in Natural Language Processing

Здравствуйте. Есть задача выделить адреса из текста. Причём заранее неизвестно сколько в тексте адресов. В общем случае больше одного. Адреса могут быть заданы с разной степенью детализации. Очевидным (допускаю что не лучшим) решением является посчитать кол-во объектов одного порядка: будь то страны, улицы и т.д. Есть ли в yargy (Наташе) уже что-то похожее на группировку по уровню? Например 0: [страна], 1: [край, область, республика] , 2: [район] и т.д.

источник

16:55пожаловаться #7

KL

Kir L in Natural Language Processing

группировки по-моему нет, надо самому сделать, но так даже интереснее!

источник

16:56пожаловаться #8

A

Arthur in Natural Language Processing

1) я каждому слову в итоге хочу навесить свой POS, каждому числу номера - B-Number или I-Number в зависимости от позиции в самом номере
2) да, точно, забыла про это, спасибо

Как вы разбиваете на "слова" эти четыре номера: 8(800)555 35 35, 8-800-555-35-35, 88005553535 и 8 800 555 35 35?

источник

16:56пожаловаться #9

JG

Jack Golokhov in Natural Language Processing

группировки по-моему нет, надо самому сделать, но так даже интереснее!

Да, сделать несложно. Опасаюсь чего-нибудь забыть. Но понял что придётся рискнуть. Спасибо.

источник

16:57пожаловаться #10

D

Dare in Natural Language Processing

Как вы разбиваете на "слова" эти четыре номера: 8(800)555 35 35, 8-800-555-35-35, 88005553535 и 8 800 555 35 35?

у меня в базе возмоден только такой вариант 88005553535
каждая цифра в итоге размечается B-Number/ I-Number, если бы в базе были бы все остальные варианты, перечисленные вами, я думаю, что все знаки просто игнорировались бы, чистились на каком-то из этапов, потому что на вход и выход нужна последовательность чисел без каких-либо знаков междлу ними)

источник

17:00пожаловаться #11

A

Arthur in Natural Language Processing

Тогда откуда и в каком виде они приходят в fasttext?

источник

17:05пожаловаться #12

V

Vic in Natural Language Processing

В SageMaker Есть возможность добавить свою рукописную модель в качестве Docker контейнера и потом использовать её практически во всех амазоновских сервисах из коробки. Плюс там автоматом мониторинг, версионирование и много плюшек. Но скорее всего это будет значительно дороже простого EC2 инстанса.

https://docs.aws.amazon.com/sagemaker/latest/dg/your-algorithms-inference-code.html

Use Your Own Inference Code with Hosting
Services - Amazon SageMaker

How Amazon SageMaker interacts with a Docker container that runs your own inference code for hosting services.

Спасибо

источник

17:39пожаловаться #13

IP

Igor Panteleev in Natural Language Processing

Всем привет, а никто не встречал датасета по бизнес запросам или бизнес лексике? Например "Выручка по категориям", "Какая рентабельность по моим клиентам" и т.д., может на английском есть что-то такое

или может есть идеи как бы нагенерить такой датасет, не могу сообразить в какую сторону копать

источник

19:07пожаловаться #14

М

Марк in Natural Language Processing

Всем привет, а никто не встречал датасета по бизнес запросам или бизнес лексике? Например "Выручка по категориям", "Какая рентабельность по моим клиентам" и т.д., может на английском есть что-то такое

или может есть идеи как бы нагенерить такой датасет, не могу сообразить в какую сторону копать

Именно вопросы, или любые тексты?

источник

19:10пожаловаться #15

KL

Kir L in Natural Language Processing

Всем привет, а никто не встречал датасета по бизнес запросам или бизнес лексике? Например "Выручка по категориям", "Какая рентабельность по моим клиентам" и т.д., может на английском есть что-то такое

или может есть идеи как бы нагенерить такой датасет, не могу сообразить в какую сторону копать

если не секрет, NL2SQL делаете или что-то попроще?
на вопрос не отвечу, не встречал ( генерировали такое сами в режиме тестирования чат-бота, поделиться не могу, да и там про нефть все было.

источник

19:10пожаловаться #16

IP

Igor Panteleev in Natural Language Processing

Именно вопросы, или любые тексты?

да скорее короткие запросы (1 предложение), нежели тексты

источник

19:11пожаловаться #17

IP

Igor Panteleev in Natural Language Processing

если не секрет, NL2SQL делаете или что-то попроще?
на вопрос не отвечу, не встречал ( генерировали такое сами в режиме тестирования чат-бота, поделиться не могу, да и там про нефть все было.

да именно, пришла в голову такая мысль, решил попробовать поиграться

а сколько человек генерили тестовые данные и сколько по времени примерно это вышло?)

источник

19:12пожаловаться #18

KL

Kir L in Natural Language Processing

да сложно сказать, скорее ~3 человека и часы, может пара десятков часов запросов. Это было растянуто во времени, чат бот получал новые фичи, запускалось тестирование, и так много подходов в течение полугода может. Ну, короче, у нас цели не было собрать лог, он собрался сам.

источник

19:15пожаловаться #19

IP

Igor Panteleev in Natural Language Processing

Понял, спасибо

А как итог, удалось реализовать рабочий вариант такого "переводчика"?

источник

19:17пожаловаться #20