Здравствуйте, Уважаемые программисты!
Хотел бы попросить Вашей помощи в решении задачи. Суть вопроса в следующем:
У меня есть база(15000-20000 ссылок). В этой базе я изначально убираю дубли страниц стандартным методом Excel. После чего необходимо убрать дубли страниц с одним доменным именем. Тоесть, у нас есть сайт: http://google.com/page1 и есть в списке адрес http://google.com/page2 мне необходимо реализовать удаление 2ой страницы и оставить первую. Реализовать это можно, как мне кажется, с помощью поиска по первым 10-12 символам(с учетом [url]http://)[/url]. Но хотелось бы услышать Ваши советы или посмотреть примеры.
В написании макросов практически ноль, посему, к сожалению, не могу реализовать это все посредством макроса
Благодарен за любую помощь!
Поиск по столбцу
Модератор: Naeel Maqsudov
Создайте два дополнительных столбца:
1 столбец с формулой: E3 =ПОИСК("/";C3;8) или другой, для текста C3="http://google.com/page1" будет равно 18 - позиция первого вхождения символа "/" начиная с позиции 8
2 столбец с формулой: =ЛЕВСИМВ(C3;E3), получится значение http://google.com/
А потом удалите повторы уже по столбцу 2
1 столбец с формулой: E3 =ПОИСК("/";C3;8) или другой, для текста C3="http://google.com/page1" будет равно 18 - позиция первого вхождения символа "/" начиная с позиции 8
2 столбец с формулой: =ЛЕВСИМВ(C3;E3), получится значение http://google.com/
А потом удалите повторы уже по столбцу 2
-
- Сообщения: 1
- Зарегистрирован: 29 янв 2013, 23:55
Вы в макросах 0, т.е. макросом решение не предлагать ?