Size: a a a

Natural Language Processing

2020 October 06

V

Victoria in Natural Language Processing
Добрый день
Есть задача разметить тексты историй болезни, но возникли сложности с инструментом для разметки. Нам предложили использовать brat (http://brat.nlplab.org/), но есть ощущение, что его возможности не очень совпадают с нашими идеями о том, что нужно размечать.
Где бы взять какой-то обзор рабочих инструментов для разметки? Извините, если вопрос смешной, я только подступаюсь к изучению темы.
Вот в этом https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3756279/ обзоре есть упоминание UMLS (https://www.nlm.nih.gov/research/umls/index.html), но это вроде не совсем инструмент для разметки.
источник

DD

David Dale in Natural Language Processing
Victoria
Добрый день
Есть задача разметить тексты историй болезни, но возникли сложности с инструментом для разметки. Нам предложили использовать brat (http://brat.nlplab.org/), но есть ощущение, что его возможности не очень совпадают с нашими идеями о том, что нужно размечать.
Где бы взять какой-то обзор рабочих инструментов для разметки? Извините, если вопрос смешной, я только подступаюсь к изучению темы.
Вот в этом https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3756279/ обзоре есть упоминание UMLS (https://www.nlm.nih.gov/research/umls/index.html), но это вроде не совсем инструмент для разметки.
А каковы ваши идеи о том, что нужно размечать?
Нужно выделить в тексте сегменты и раздать каждому сегменту по метке, как в задаче NER? Или какая-то более сложная разметка предполагается?
источник

IS

I Sh in Natural Language Processing
Из бесплатных: doccano - самый красивый, label studio - самый многофункциональный
источник

V

Victoria in Natural Language Processing
David Dale
А каковы ваши идеи о том, что нужно размечать?
Нужно выделить в тексте сегменты и раздать каждому сегменту по метке, как в задаче NER? Или какая-то более сложная разметка предполагается?
Есть ряд сведений, которые нужно извлечь. Речь идет о факторах риска ряда заболеваний. Например, данные об артериальном давлении. Есть записи, фиксирующие текущее давление у пациента на момент осмотра - текущее давление (термин с числовой характеристикой - его значением). Есть записи, говорящие о том, какие максимальные цифры давления фиксировал у себя пациент (максимальное давление), есть привычное ему "рабочее" давление.
Это один пример.
Хотелось бы иметь возможность задавать связи тоже, например, когда написано, что одно патологическое состояние является следствие другого.
источник

V

Victoria in Natural Language Processing
I Sh
Из бесплатных: doccano - самый красивый, label studio - самый многофункциональный
Спасибо, изучу! А что значит красивый?
источник

GF

Grigory Frantsuzov in Natural Language Processing
Victoria
Есть ряд сведений, которые нужно извлечь. Речь идет о факторах риска ряда заболеваний. Например, данные об артериальном давлении. Есть записи, фиксирующие текущее давление у пациента на момент осмотра - текущее давление (термин с числовой характеристикой - его значением). Есть записи, говорящие о том, какие максимальные цифры давления фиксировал у себя пациент (максимальное давление), есть привычное ему "рабочее" давление.
Это один пример.
Хотелось бы иметь возможность задавать связи тоже, например, когда написано, что одно патологическое состояние является следствие другого.
А у вас нет доступа к базам данных из организаций работающих с hl7?
источник

IS

I Sh in Natural Language Processing
Victoria
Спасибо, изучу! А что значит красивый?
Красивые большие кнопочки.

А если нужны связи - это как раз label studio.

Но это, кажется, не связи (или я не правильно понял):

Хотелось бы иметь возможность задавать связи тоже, например, когда написано, что одно патологическое состояние является следствие другого.
источник

V

Victoria in Natural Language Processing
Grigory Frantsuzov
А у вас нет доступа к базам данных из организаций работающих с hl7?
У нас нет, хотя какие-то знакомые с HL7 работают. Надо копать в эту сторону?
источник

GF

Grigory Frantsuzov in Natural Language Processing
Victoria
У нас нет, хотя какие-то знакомые с HL7 работают. Надо копать в эту сторону?
Ну оттуда кажется можно выгрузить много размеченных данных, но я последний раз с этим соприкосался лет 5 назад
источник

V

Victoria in Natural Language Processing
I Sh
Красивые большие кнопочки.

А если нужны связи - это как раз label studio.

Но это, кажется, не связи (или я не правильно понял):

Хотелось бы иметь возможность задавать связи тоже, например, когда написано, что одно патологическое состояние является следствие другого.
Label Studio на первый взгляд кажется подходящим, будем изучать подробнее, спасибо! Красивые кнопочки нам не обязательно. :)
источник

V

Victoria in Natural Language Processing
Grigory Frantsuzov
Ну оттуда кажется можно выгрузить много размеченных данных, но я последний раз с этим соприкосался лет 5 назад
это чтобы посмотреть пример разметки? Задача у нас разметить свои данные.
источник

SP

Sebastian Pereira in Natural Language Processing
Коллеги - у меня странный вопрос, вы не встречали как называется описание архитектуры НС, которая работает по рекурсивному принципу: обучается на датасете, потом обученная модель обрабатывает его, добавляются данные, обучается заново и так далее? Я где-то встречал именно термин.
источник

AK

Anton Kolonin in Natural Language Processing
Коллеги, на нашем семинаре на этой неделе - о сознании разговорного ИИ: https://aigents.timepad.ru/event/1412596/
Доклад  Виктора Носко про Разговорный ИИ с сознанием — состоится 8 октября, 18:00-20:00 (время Московское)
источник

DG

Denis Gordeev in Natural Language Processing
Sebastian Pereira
Коллеги - у меня странный вопрос, вы не встречали как называется описание архитектуры НС, которая работает по рекурсивному принципу: обучается на датасете, потом обученная модель обрабатывает его, добавляются данные, обучается заново и так далее? Я где-то встречал именно термин.
видел названия MAMA (Model-Annotate-Model-Annotate) и MATTER cycle  https://let.uvt.nl/general/people/bunt/docs/AnnotationHandbookChapter2.pdf . Мы это у себя так обозвали (http://www.dialog-21.ru/media/5093/gordeevdiplusetal-031.pdf)
источник

E

Elena in Natural Language Processing
Sebastian Pereira
Коллеги - у меня странный вопрос, вы не встречали как называется описание архитектуры НС, которая работает по рекурсивному принципу: обучается на датасете, потом обученная модель обрабатывает его, добавляются данные, обучается заново и так далее? Я где-то встречал именно термин.
Continual Learning?
источник

YB

Yuri Baburov in Natural Language Processing
Sebastian Pereira
Коллеги - у меня странный вопрос, вы не встречали как называется описание архитектуры НС, которая работает по рекурсивному принципу: обучается на датасете, потом обученная модель обрабатывает его, добавляются данные, обучается заново и так далее? Я где-то встречал именно термин.
может, pseudo-labeling , может, active learning. в зависимости от того, кто доразмечает эти данные, модель или человек.
источник

GF

Grigory Frantsuzov in Natural Language Processing
Victoria
это чтобы посмотреть пример разметки? Задача у нас разметить свои данные.
В частности, да
источник

ВГ

Вадим Гилемзянов... in Natural Language Processing
Ребят, классные альтернативы для NER english - кто может подсказать?
источник

AW

Alex Wortega in Natural Language Processing
Вадим Гилемзянов
Ребят, классные альтернативы для NER english - кто может подсказать?
В ner tagger от Стэнфорда
источник

ВГ

Вадим Гилемзянов... in Natural Language Processing
лучше чем Spacy?
источник