Всем доброго времени суток.
Есть задача, которая ввела меня в ступор: никак не могу применить теорию к практике.
Есть база данных из двух табличек, в которых содержится информация о ресторанах, поля табличек наполовину одинаковые, наполовину - какие-то особенные характеристики ресторанов для каждой таблицы. В одной таблице могут быть дубликаты ресторанов из другой (если имена совпадают, проверяем, совпадают ли адреса - если да, то, значит, дубликат).
Конечная задача: выполнить кластеризацию карточек ресторанов, удалив дубликаты.
Я не знаю, в какую сторону двигаться и что делать, прошу помощи и совета.