Size: a a a

Natural Language Processing

2021 September 05

AK

Anton Kolonin in Natural Language Processing
Ну да, какой есть. Кстати, лично меня Hugginface расстроил - на текущем англоязычном проекте сентимент-анализ на модели Hugginface дает какую-то лабуду, даже по сравнению с собственной N-грамной моделью, собранной на коленке ( описана тут https://blog.singularitynet.io/aigents-sentiment-detection-personal-and-social-relevant-news-be989d73b381 )
источник

TL

Taras Lislisennkis in Natural Language Processing
тоже такое было
источник

V

Vic in Natural Language Processing
там есть модель нелецеприятных высказываний от какого-то русского универа, очень хитрые вариации вылавливает типа расизма, политоты, оскорблений хитрюжных и тп
источник

TL

Taras Lislisennkis in Natural Language Processing
afinn затюнил и получил 97% точность, нейросеть из всех что пробовал лучше всего было ~ 80%
источник

DD

David Dale in Natural Language Processing
Видимо, вы про нашу, Сколтеховскую)
https://huggingface.co/Skoltech/russian-inappropriate-messages
источник

V

Vic in Natural Language Processing
да)
источник

AS

Artem Sergeev in Natural Language Processing
по вашей задаче выше?
источник

TL

Taras Lislisennkis in Natural Language Processing
не, нужно было позитивный/негативный сентимент определять
источник

d

dePuff in Natural Language Processing
И любой кернел с кагла не даст 99% accuracy?
источник

TL

Taras Lislisennkis in Natural Language Processing
что такое кернел с кегла?

Нам нейросети не подошли потому что у нас на самом деле редкая подзадача в сентимент анализе была - нужно было определять, что чувствует человек по его текстовому описанию своих чувств. А данных размеченных было не так много
источник

TL

Taras Lislisennkis in Natural Language Processing
а получилось сделать без нейросетей потому что вариативность на самом деле небольшя - есть ограниченное количество ответов на вопрос "How are you feeling?"
источник

d

dePuff in Natural Language Processing
Изначально подумал, что задача на отличить негативный текст от позитивного.
На это была куча соревнований (в том числе на Kaggle) и если класса только два, а метрика accuracy, то там заоблачная точность у решений..
источник

TL

Taras Lislisennkis in Natural Language Processing
я с сайта papers with code брал + публичные API пробовал. Кэгл почему-то не пришло в голову смотреть. Возможно, вы правы
источник
2021 September 06

B

Banof in Natural Language Processing
🔫 Anna R кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@wadimiusz, @oneonwar, @igorek181998, Vladimir, @RedArmadillo
При поддержке Золота Бородача
источник

AK

Anton Kolonin in Natural Language Processing
Какой "любой", подскажите к примеру?

Вот к примеру, кусочек корпуса, где и Hugggingface и MonkeyLearn дают accuracy ниже плинтуса:

RT @woonomic: Here's the historical BTC wealth per HODLer over time as seen on-chain:  Oct 2009: 1000 BTC May 2011: 100 BTC Jan 2014: 10 BT…
RT @BitcoinMagazine: JUST IN – Rothschild Investment Corp. tripled its #Bitcoin position this July, adding over 100,000 Grayscale shares ht…
The @SECGov Chairman @GaryGensler 'is signaling a pathway for approving a #Bitcoin ETF'. https://t.co/XeK5LCnZuP
Exactly. El Salvador is a third world country. Cash is the dominant form of payment. It takes time to get people comfortable to using currency digitally. Paper money backed by BTC is a layer 2 solution that makes Bitcoin easy to use while the BTC digital infrastructure is built. https://t.co/GV4PxUdCXb
RT @LTCFoundation: Visa has revealed that over $1 billion in #cryptocurrency was spent using its cards in the first half of 2021. If you're…
We recently received board approval to purchase over $500M of crypto on our balance sheet to add to our existing holdings. And we'll be investing 10% of all profit going forward in crypto. I expect this percentage to keep growing over time as the cryptoeconomy matures.
RT @CoinDesk: .@Grayscale files for three more funds to become SEC registered companies as Digital Large Cap Fund passes that hurdle.  @Tan…
RT @fintechfrank: Grayscale links up with banking giant BNY Mellon to prep for bitcoin ETF https://t.co/X61fU6yc2q
RT @markets: The largest Bitcoin fund is ramping up its ETF ambitions through a new agreement with Bank of New York Mellon https://t.co/Ocm
RT @Cointelegraph: What would a day be without a piece of Grayscale news related to crypto? The giant firm is pushing to transform the Gray…
RT @DeItaone: BANK OF AMERICA APPROVES BITCOIN FUTURES TRADING FOR SOME CLIENTS - COINDESK
RT @CoinDesk: Introducing the CoinDesk DeFi Index, the latest addition to #CoinDeskIndexes.   $DFX benchmarks the investable DeFi sector wi…
RT @CoinDesk: .@JPMorgan's retail wealth management clients can now invest in crypto funds.  @realDannyNelson reports  https://t.co/XqoeJ7z
RT @INXLimited: Announcement ????The INX Token, the world's first SEC-registered security token IPO, will be listed on July 28th at 9 am EDT o…
RT @Cointelegraph: Institutional interest in Bitcoin shows no sign of slowing down as the $25B investment firm Wealthfront is letting its c…
The Grayscale crypto fund builds out its ETF team with a new leader and plans 10 more new hires  https://t.co/0ybFye56wf
$100k is a magnet https://t.co/TKObZnOU9Z
источник

AK

Anton Kolonin in Natural Language Processing
Дайте ссылку хотя бы одну каплю из кучи 😊
Мы разбирали ошибки на своих корпусах и есть фунадментальные причины, почему "заоблачные" accuracy могут быть только у на заоверфиттеных моделях (ну или подобранных под модели датасетах).
Причины ошибок перечислены в статье по ссылке https://t.me/natural_language_processing/34971
источник

AK

Anton Kolonin in Natural Language Processing
Нужен ли NLP для AGI и есть ли AGI в GPT-3? Может ли NLP уровня HLAI быть индикатором или критерием AGI? Чего GPT-3 не хватает для NLP уровня HLAI и/или AGI? — Татьяна Шаврина, Татьяна Ландо, Николай Рабчевский, Виктор Носко (модератор Игорь Пивоваров)
https://aigents.timepad.ru/event/1412596/
источник

TL

Taras Lislisennkis in Natural Language Processing
Спасибо, зарегистрировал себя и свою девушку)
источник

d

dePuff in Natural Language Processing
Я задал вопрос, а вы требуете от меня ответа 😅
источник

AK

Anton Kolonin in Natural Language Processing
Понял, попробуем изучить вопрос... Вдруг кто еще посоветует внятные модели для англоязычного сентимента с "заоблачной" accuracy 😉
источник