Телеграмм чат группы doorways

Tensorflow гугловый

Вот эта
https://m.habr.com/ru/post/440564/

17:47пожаловаться #1

AK

Я думаю тут даже не в нейронке дело. А в начальных данных бля нее. То есть тексты должны быть "эталонные". Ну допустим мы надергаем контента по ключам мегабайт на 50. Его в идеале надо вычитать и посмотреть что текст нормальный. 50 мегабайт текста это охренительный объем текста.

17:50пожаловаться #2

A

Я думаю тут даже не в нейронке дело. А в начальных данных бля нее. То есть тексты должны быть "эталонные". Ну допустим мы надергаем контента по ключам мегабайт на 50. Его в идеале надо вычитать и посмотреть что текст нормальный. 50 мегабайт текста это охренительный объем текста.

Ну тогда проще всех классиков литературы взять с эталонным языком.

17:51пожаловаться #3

AK

Ага и на "Война и мир" тексты по микрокредитам генерить ?

17:51пожаловаться #4

AK

Получится эпический пиздец

17:52пожаловаться #5

A

Ага и на "Война и мир" тексты по микрокредитам генерить ?

Кстати, война и мир всего 2мб в fb2. Так что классиков может и не хватить.

17:54пожаловаться #6

AK

В идеале я думаю надо топ3 по всем ключам взять, надергать от туда текстовки и на этом учить. Но текст надо опять же проверять.
Нельзя учить нейронку распознавать котиков по фото коров.

17:56пожаловаться #7

A

В идеале я думаю надо топ3 по всем ключам взять, надергать от туда текстовки и на этом учить. Но текст надо опять же проверять.
Нельзя учить нейронку распознавать котиков по фото коров.

Или нагегерить марковым 100мб текста и скормить это нейронке. Получится нейронка-идиот. Ну, не такая как все.

17:58пожаловаться #8

V

Vladimir in Doorways / conference /

Бесплатный?

19:26пожаловаться #9

V

Vladimir in Doorways / conference /

😟

19:27пожаловаться #10

A

В буквариксе есть анализатор слов. Даешь список фраз, на выходе только уникальные слова. Но вроде это не поможет. Я сам не знаю как в такой ситуации быть, недавно генерил дор и увидел похожую проблему.

20:37пожаловаться #11

A

Есть кто Gsa Ser юзает для получения ссылок? Не могу решить проблему.

20:49пожаловаться #12

AK