Кластеризация карточек ресторанов.

pigman · 20 апр 2011, 13:19

Всем доброго времени суток.

Есть задача, которая ввела меня в ступор: никак не могу применить теорию к практике.

Есть база данных из двух табличек, в которых содержится информация о ресторанах, поля табличек наполовину одинаковые, наполовину - какие-то особенные характеристики ресторанов для каждой таблицы. В одной таблице могут быть дубликаты ресторанов из другой (если имена совпадают, проверяем, совпадают ли адреса - если да, то, значит, дубликат).

Конечная задача: выполнить кластеризацию карточек ресторанов, удалив дубликаты.

Я не знаю, в какую сторону двигаться и что делать, прошу помощи и совета.

Developing.ru

Кластеризация карточек ресторанов.

Вход • Регистрация