Size: a a a

2020 July 15

У

Ухудшанский... in MySQL
ну если индекса нет, то каждый апдейт вычитывает ВСЮ таблицу
источник

AS

Alexdandr Shmatko in MySQL
Feed Reader Bot
Select the feed to remove, or
1. Planet MySQL
источник

AS

Alexdandr Shmatko in MySQL
Всем привет 👋
Есть одна не совсем тривиальная задача:
Имеется словарь объём которого 1 ТБ у формате .txt все слова записанные с новой строки, каким образом это все дело перегнать в MySQL, удалить дубли и выгрузить назад в .txt уже уникальные значения?
источник

S

Sasha S. in MySQL
Alexdandr Shmatko
Всем привет 👋
Есть одна не совсем тривиальная задача:
Имеется словарь объём которого 1 ТБ у формате .txt все слова записанные с новой строки, каким образом это все дело перегнать в MySQL, удалить дубли и выгрузить назад в .txt уже уникальные значения?
А цель только в том что бы получить уникальные значения?
источник

МС

Михаил Семочкин... in MySQL
Alexdandr Shmatko
Всем привет 👋
Есть одна не совсем тривиальная задача:
Имеется словарь объём которого 1 ТБ у формате .txt все слова записанные с новой строки, каким образом это все дело перегнать в MySQL, удалить дубли и выгрузить назад в .txt уже уникальные значения?
ОС какая? В линуксе для этого есть готовая утилита uniq
источник

МС

Михаил Семочкин... in MySQL
Михаил Семочкин
ОС какая? В линуксе для этого есть готовая утилита uniq
Судя по Википедии, у нее есть порт и под Windows.
источник

AS

Alexdandr Shmatko in MySQL
Sasha S.
А цель только в том что бы получить уникальные значения?
Цель - держать БД с уникальными значениями
И когда будут новые словари снова загружать их в базу далее удалять дубли выгружать все дальше в тхт
источник

AS

Alexdandr Shmatko in MySQL
Михаил Семочкин
ОС какая? В линуксе для этого есть готовая утилита uniq
Не подходит уже делал так, не обработает такой массив данных
источник

МС

Михаил Семочкин... in MySQL
А много уникальных значений?
источник

ИД

Иван Дорогой... in MySQL
Alexdandr Shmatko
Всем привет 👋
Есть одна не совсем тривиальная задача:
Имеется словарь объём которого 1 ТБ у формате .txt все слова записанные с новой строки, каким образом это все дело перегнать в MySQL, удалить дубли и выгрузить назад в .txt уже уникальные значения?
я делал отдельную таблицу, построчно читал файл, и в таблицу записывал "значение"-"кол-во повторений". файл был тоже огромный, в память целиком не помещался.. это было небыстро ) но операция достаточно редко повторялась
источник

AS

Alexdandr Shmatko in MySQL
Михаил Семочкин
А много уникальных значений?
Уникальных значений 70-80 процентов
источник

МС

Михаил Семочкин... in MySQL
Даже интересно, LOAD DATA IGNORE+ уникальный индекс справятся?
источник

ИД

Иван Дорогой... in MySQL
заминка была в том, что памяти надо было сильно больше, чем весит сам файл, чтобы его целиком прочитать
источник

МС

Михаил Семочкин... in MySQL
Alexdandr Shmatko
Уникальных значений 70-80 процентов
Это не просто слова, а какие-то строки?
источник

AS

Alexdandr Shmatko in MySQL
Да строки разного значения и спецсимволы тоже
источник

AS

Alexdandr Shmatko in MySQL
Михаил Семочкин
Это не просто слова, а какие-то строки?
Да строки разного значения и спецсимволы тоже
источник

DE

Denis Efremov in MySQL
Alexdandr Shmatko
Не подходит уже делал так, не обработает такой массив данных
Разбей на файлы по первым нескольким буквам
источник

DE

Denis Efremov in MySQL
Я так бд для кроссворда парсил
источник

DE

Denis Efremov in MySQL
А сколько строк всего?
источник

AS

Alexdandr Shmatko in MySQL
Denis Efremov
Разбей на файлы по первым нескольким буквам
Ок, только там строки начинаются и с Бук и с цыфр
источник