Телеграмм чат группы natural_language

match.fact.spans 
[[138, 157), [161, 163), [164, 166), [167, 171), [172, 180)]

match.fact

Документ(
    нпа=НПА(
        тип='федеральный закон',
        принят=[Принятие(
             принявший_орган=None,
             дата=Date(
                 year=1996,
                 month=4,
                 day=1
             ),
             номер='No 27-ФЗ'
         )]
    ),
    кодекс=None
)

источник

17:27пожаловаться #15

Maxim in Natural Language Processing

По-моему можно получить спаны отдельной ветви фактов, что-то типа:
match.fact.нпа.spans

Если обернуть тип НПА в отдельный факт, то можно получить его спаны через match.fact.нпа.тип.spans

источник

18:01пожаловаться #16

Max Kuznetsov in Natural Language Processing

наверное так можно сделать, но спаны мне нужны в основном для визуализации, поэтому расширять факты (а их много) выглядит как overhead

источник

18:07пожаловаться #17

Max Kuznetsov in Natural Language Processing

Я сделал плоским дерево фактов, но порядок не совпадает со спанами, увы. Можно было бы заморочиться с сопоставлением текстов в спанах и фактах, но номализация.

источник

18:10пожаловаться #18

ИГ

Ильнур Гарипов... in Natural Language Processing

насколько я понял в yargy можно получить только спаны фактов-примитивов. То есть фактов, которые не составлены из других фактов.

источник

18:13пожаловаться #19

ИГ

Ильнур Гарипов... in Natural Language Processing

я извлекал спаны примитивов вот так

def extract_subfacts(fact):
    def rec_parse(attributes: Dict, prefix: str, accumulator: OrderedDict):
        for name, value in attributes.items():
            if isinstance(value, Chain):
                accumulator[prefix + name] = {
                    'value': value.as_json,
                    'span': list(value.spans)[0],
                }
            elif isinstance(value, FactResult):
                rec_parse(value.fact.attributes, prefix+name+'-', accumulator)

    d = OrderedDict()
    rec_parse(fact._raw.attributes, '', d)

    return d

источник

18:13пожаловаться #20