Телеграмм чат группы doorways

Я года три пытался обучить нормальную нейронную сеть, юзал фришный софт, на гитхабе такого добра очень много. Большая сложность качественно обучить . Арендовал серваки с видеокартами на Амазоне потом обучал алгоритмами char rnn , word rnn . Если дать мало текста , типа 1-3 мб то обучит быстро но будет писать водянистую воду, если ее разбавить составными предложениями , то получится норм качество под Гугл . Если взять текста 50-100мб будет обучать долго , минимум 4-6 недель и в деньгах это от 1000 Долл за сервер . Но качество улучшиться и текст будет разнообразный. Если больше 100мб текст и больше слоёв обучения, то обычные серваки не будут работать, будет ошибка нехватка памяти.

источник

12:09пожаловаться #6

CC

Chicago Chicago in Doorways / conference /

Arlye The Husky

Я года три пытался обучить нормальную нейронную сеть, юзал фришный софт, на гитхабе такого добра очень много. Большая сложность качественно обучить . Арендовал серваки с видеокартами на Амазоне потом обучал алгоритмами char rnn , word rnn . Если дать мало текста , типа 1-3 мб то обучит быстро но будет писать водянистую воду, если ее разбавить составными предложениями , то получится норм качество под Гугл . Если взять текста 50-100мб будет обучать долго , минимум 4-6 недель и в деньгах это от 1000 Долл за сервер . Но качество улучшиться и текст будет разнообразный. Если больше 100мб текст и больше слоёв обучения, то обычные серваки не будут работать, будет ошибка нехватка памяти.

Интересный подход. Такого ещё не встречал) Спасибо

источник

12:10пожаловаться #7

MS

Max Smek in Doorways / conference /

Arlye The Husky

Я года три пытался обучить нормальную нейронную сеть, юзал фришный софт, на гитхабе такого добра очень много. Большая сложность качественно обучить . Арендовал серваки с видеокартами на Амазоне потом обучал алгоритмами char rnn , word rnn . Если дать мало текста , типа 1-3 мб то обучит быстро но будет писать водянистую воду, если ее разбавить составными предложениями , то получится норм качество под Гугл . Если взять текста 50-100мб будет обучать долго , минимум 4-6 недель и в деньгах это от 1000 Долл за сервер . Но качество улучшиться и текст будет разнообразный. Если больше 100мб текст и больше слоёв обучения, то обычные серваки не будут работать, будет ошибка нехватка памяти.

https://www.hetzner.com/dedicated-rootserver/ex51-ssd-gpu/configurator у хетзнера сейчас GTX1080 карты сервы сетап бесплатный. , или слабо будет? 94 евро.

источник

12:11пожаловаться #8

AT

Arlye The Husky in Doorways / conference /

Max Smek

https://www.hetzner.com/dedicated-rootserver/ex51-ssd-gpu/configurator у хетзнера сейчас GTX1080 карты сервы сетап бесплатный. , или слабо будет? 94 евро.

Для 5-20 мб текста нормально будет, скажу сразу , будет сложно настроить софт, но ты можешь установить докер , но он может не юзать все ресурсы. Поэтому нужно самому настраивать , на убунту 18 получалось настроить весь софт, на других ОС очень геморойно . Не пытайся обучать на word rnn , слов очень много и не хватает обычно оперативки . Лучше обучать char rnn и текст привести к нижнему регистру, тогда будет маленький сет токенов и качество будет выше

источник

12:15пожаловаться #9

N

Nilson in Doorways / conference /

А проводил ли тесты кто-нибудь? Сравнивая обычный перемещенные сниппеты и спаршенную текстовку, с генерированными текстами.

источник

12:16пожаловаться #10

N

Nilson in Doorways / conference /

Была ли разница для ПС?

источник

12:17пожаловаться #11

AT

Arlye The Husky in Doorways / conference /

Max Smek

https://www.hetzner.com/dedicated-rootserver/ex51-ssd-gpu/configurator у хетзнера сейчас GTX1080 карты сервы сетап бесплатный. , или слабо будет? 94 евро.

Ещё там есть мануалы как не переобучить . Супер важно качественный входящий текст, если будет на входе мусор, то оно будет создавать такой же мусор. В ручную нужно проверять входящий текст

источник

12:17пожаловаться #12

AT

Arlye The Husky in Doorways / conference /

Nilson

Была ли разница для ПС?

Я проверяю так: делаю страницу на нетрастровом домене, на 7-10к символов , потом индексируешь в Гугле без внешних ссылок , потом вводишь уникальные фразы в Гугле , много разных ,штук 5-7. И смотришь выдачу, если твоя страница в жопе , то текст плохой. На нейронаках + составные предложения текст обычно в топе

источник

12:20пожаловаться #13

I

Iosif in Doorways / conference /

профессор ! 👍

источник

13:40пожаловаться #14

V

Vladislav in Doorways / conference /

Ребят привет, сколько сейчас стоит сделать генереный (с уникальными текстами) сайт на тематику сми и кто может заняться?

источник

13:52пожаловаться #15

V

Vladislav in Doorways / conference /

есть кто?

источник

14:03пожаловаться #16

В

Виталий Николаевич... in Doorways / conference /

все есть я не делаю

источник

15:10пожаловаться #17

R#

Reset # Alexey S. in Doorways / conference /

ссылка нерабочая ))))

источник

15:44пожаловаться #18

N

Nilson in Doorways / conference /

А если мы увлекаемся, твоей мамкой))

источник

15:45пожаловаться #19

t

tfhx8 in Doorways / conference /

Arlye The Husky

Я года три пытался обучить нормальную нейронную сеть, юзал фришный софт, на гитхабе такого добра очень много. Большая сложность качественно обучить . Арендовал серваки с видеокартами на Амазоне потом обучал алгоритмами char rnn , word rnn . Если дать мало текста , типа 1-3 мб то обучит быстро но будет писать водянистую воду, если ее разбавить составными предложениями , то получится норм качество под Гугл . Если взять текста 50-100мб будет обучать долго , минимум 4-6 недель и в деньгах это от 1000 Долл за сервер . Но качество улучшиться и текст будет разнообразный. Если больше 100мб текст и больше слоёв обучения, то обычные серваки не будут работать, будет ошибка нехватка памяти.

а когда он обучится тексты можно удалять или они постоянно должны присутствовать?

источник

21:31пожаловаться #20