Size: a a a

Emacs — русскоговорящее сообщество

2020 April 30

A

Aragaer in Emacs — русскоговорящее сообщество
это я разгребаю датасет толоки и подготавливаю к своей нейросеточке
источник

m

mel kaye in Emacs — русскоговорящее сообщество
много .write + .flush вконце
источник

A

Aragaer in Emacs — русскоговорящее сообщество
ага и еще \n руками
источник

A

Aragaer in Emacs — русскоговорящее сообщество
ну можно конечно
источник

A

Aragaer in Emacs — русскоговорящее сообщество
но у меня это не самое узкое место
источник

m

mel kaye in Emacs — русскоговорящее сообщество
Alex Peresmeshnik
Ну ты прикалуешься? Мне как бы надо было загрузить данные, подсчет - это просто проверка что они вообще целиком загружаются )
есть pd.read_csv
источник

A

Aragaer in Emacs — русскоговорящее сообщество
вот другое дело что парсилка диалога это разгребание html. А вытащенные строчки оттуда реально копируются
источник

AP

Alex Peresmeshnik in Emacs — русскоговорящее сообщество
Dmytro Lispyvnyi '(🌲 🍺)
это нечестно, лол, ты в бидоне тупо читаешь строки по одной
Все честно, в либе построчно считывается
источник

m

mel kaye in Emacs — русскоговорящее сообщество
Aragaer
вот другое дело что парсилка диалога это разгребание html. А вытащенные строчки оттуда реально копируются
можешь оффсеты с длинами вытаскивать
источник

A

Aragaer in Emacs — русскоговорящее сообщество
могу
источник

m

mel kaye in Emacs — русскоговорящее сообщество
неудобно конечно, но что поделать
источник

A

Aragaer in Emacs — русскоговорящее сообщество
и если бы я писал на си, я б так и сделал
источник

m

mel kaye in Emacs — русскоговорящее сообщество
я помню как писал код для диплома и питон уделал оптимизированую многопоточку на с++
источник

m

mel kaye in Emacs — русскоговорящее сообщество
но там был торч
источник

A

Aragaer in Emacs — русскоговорящее сообщество
но в данном случае - не особо надо. Потому что эта парсилка запускается 1 раз, а потом несколько десятков часов обучения нейросетки
источник

m

mel kaye in Emacs — русскоговорящее сообщество
причем на крестах с 100% утилизацией цпу считается ~26 часов, а на торче полторы минуты
источник

A

Aragaer in Emacs — русскоговорящее сообщество
торч небось в гпу ссылает
источник

m

mel kaye in Emacs — русскоговорящее сообщество
потом мой научрук сказал - поднимите параметр S на единицу
источник

m

mel kaye in Emacs — русскоговорящее сообщество
торч охуел пытаясь аллоцировать тензор на 1 тб
источник

m

mel kaye in Emacs — русскоговорящее сообщество
Aragaer
торч небось в гпу ссылает
у меня интеграшка
источник