Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2020 June 05

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
добрый вечер, пробовал кто разворачивать ru_transformers?
источник

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Den
добрый вечер, пробовал кто разворачивать ru_transformers?
вытаскивал оттуда веса для gpt-2
источник

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
как его развернуть в colab? Токенайзера нет
источник

НО

Наталья Онофрийчук... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
можно ipynb с примером?
источник

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Den
как его развернуть в colab? Токенайзера нет
есть жеж
источник

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
я вчера не нашёл, есть какие-то свои левые классы которые ни разу не transformers
источник

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
тобишь не совместимы
источник

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Там только руками надо будет в классе токенайзера поправить один момент
источник

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
уже точно не помню что, но там выскочит ошибка и будет понятно
источник

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
да-да, знаем
AttributeError                            Traceback (most recent call last)
<ipython-input-5-c306f2d8eb6c> in <module>()
    12 sys.path.append("./ru_transformers")
    13
---> 14 from run_generation import sample_sequence
    15 from yt_encoder import YTEncoder
    16

1 frames
/content/ru_transformers/run_generation.py in <genexpr>(.0)
    41 MAX_LENGTH = int(10000)  # Hardcoded max length to avoid infinite loop
    42
---> 43 ALL_MODELS = sum((tuple(conf.pretrained_config_archive_map.keys()) for conf in (GPT2Config, OpenAIGPTConfig, XLNetConfig, TransfoXLConfig)), ())
    44
    45 MODEL_CLASSES = {

AttributeError: type object 'GPT2Config' has no attribute 'pretrained_config_archive_map'
источник

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
вместо этой жёпы должен быть токенайзер совместимый с transformers
YTEncoder.from_pretrained(model_path)
источник

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ну у меня вот это работает в принципе
источник

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
и это просто невероятно сложно залить модель вот сюда https://huggingface.co/models
источник

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Cookie Thief
ну у меня вот это работает в принципе
нет, там должны быть json параметры у токенайзера
источник

RB

Radion Bikmukhamedov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
я зимой дообучал под диалоговую задачу этот gpt2, какие-то костыли заменил на свои, вот тут можно посмотреть что  вышло
https://github.com/RadionBik/ru_transformers

подробнее не отвечу пока, надо повспоминать что там было
источник

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Den
нет, там должны быть json параметры у токенайзера
эм, нет, достаточно папку передать
источник

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
вот я только что запустил
источник

D

Den in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ага и transofrmer скажет что хер тебе, несовместимый токенайзер, нет json файла
источник