Size: a a a

Natural Language Processing

2021 August 15

GP

Grigoriy Polyanitsin in Natural Language Processing
ну вот у них мало синонимов - что ни вобью - нет синонимов
источник

SancheZz Мов in Natural Language Processing
Я гуглил словари и справочники
источник

SancheZz Мов in Natural Language Processing
Но их над потом руками превратить в json
источник

N

Natalia in Natural Language Processing
источник

SancheZz Мов in Natural Language Processing
Да я качал отсюда
источник

GP

Grigoriy Polyanitsin in Natural Language Processing
а как питоновской либы нет? или как вы пользовались \ скачивали оттуда?
источник

SancheZz Мов in Natural Language Processing
источник

SancheZz Мов in Natural Language Processing
Еще это брал
источник

GP

Grigoriy Polyanitsin in Natural Language Processing
а есть возможность отсюда как то синонимы вытащить?
источник

SancheZz Мов in Natural Language Processing
Ручками парсани
источник

SancheZz Мов in Natural Language Processing
Скачай просто
источник

SancheZz Мов in Natural Language Processing
Это ж xml
источник

DD

David Dale in Natural Language Processing
Если хочется сразу питонью либу, то https://github.com/avidale/python-ruwordnet/
источник

SancheZz Мов in Natural Language Processing
+
источник
2021 August 16

MK

Max Kuznetsov in Natural Language Processing
Всем привет! Вопрос а есть ли способ сопоставить спаны и строки в yargy match.fact?

match.fact.spans 
[[138, 157), [161, 163), [164, 166), [167, 171), [172, 180)]

match.fact

Документ(
   нпа=НПА(
       тип='федеральный закон',
       принят=[Принятие(
            принявший_орган=None,
            дата=Date(
                year=1996,
                month=4,
                day=1
            ),
            номер='No 27-ФЗ'
        )]
   ),
   кодекс=None
)
источник

M

Maxim in Natural Language Processing
По-моему можно получить спаны отдельной ветви фактов, что-то типа:
match.fact.нпа.spans

Если обернуть тип НПА в отдельный факт, то можно получить его спаны через match.fact.нпа.тип.spans
источник

MK

Max Kuznetsov in Natural Language Processing
наверное так можно сделать, но спаны мне нужны в основном для визуализации, поэтому расширять факты (а их много) выглядит как overhead
источник

MK

Max Kuznetsov in Natural Language Processing
Я сделал плоским дерево фактов, но порядок не совпадает со спанами, увы. Можно было бы заморочиться с сопоставлением текстов в спанах и фактах, но номализация.
источник

ИГ

Ильнур Гарипов... in Natural Language Processing
насколько я понял в yargy можно получить только спаны фактов-примитивов. То есть фактов, которые не составлены из других фактов.
источник

ИГ

Ильнур Гарипов... in Natural Language Processing
я извлекал спаны примитивов вот так
def extract_subfacts(fact):
   def rec_parse(attributes: Dict, prefix: str, accumulator: OrderedDict):
       for name, value in attributes.items():
           if isinstance(value, Chain):
               accumulator[prefix + name] = {
                   'value': value.as_json,
                   'span': list(value.spans)[0],
               }
           elif isinstance(value, FactResult):
               rec_parse(value.fact.attributes, prefix+name+'-', accumulator)

   d = OrderedDict()
   rec_parse(fact._raw.attributes, '', d)

   return d
источник