например в русском корпусе можно вбить слово "друг", отфильтровать произведения по полу автора, датам написания, тематике и т. д., и потом делать анализ как и когда слово использовалось и в каких контекстах и кем
Собрали в базу данных всяких книг, статей, диалогов, переписок, классифицировали, сделали индексы и прочее чтобы искать было удобно, собрали статистику