В наши дни никого не удивишь тем, с какой легкостью можно клонировать сайты, мегапорталы и даже сам поисковик Google. Можно скопировать контент, графику, дизайн и даже доменное имя.
Конечно, с последним утверждением я немного погорячилась, ведь не бывает двух одинаковых доменных имен и непосредственно ICANN этого не допустит! Но если подумать, то многим известна методика получения тайп-трафика (ошибка набора), а она как раз построена на регистрации схожих доменов при помощи хитрых подстановок аналогичных символов в имени сайта.
На данный момент эта технология настолько продвинулась вперёд, что было придумано внушительное количество методов однобайтовой замены литер в доменном имени.
Перечислю некоторые из самых популярных трансформаций или замен символов, которые активно используются не только для получения трафика, но и для обхода фильтрации антиспам систем в социальных сетях, поисковиках и даже файрволах (межсетевых брандмауэрах). Среди них можно выделить:
- Добавление — буквы добавляются в конце исходного доменного имени. Самый простой и легко выявляемый способ при беглом взгляде на URL-адрес.
- Бит-сквоттинг/Bitsquatting относится к регистрации доменных имен, отличающихся от настоящего домена всего на 1 бит. Определить подмену при беглом осмотре уже немного сложнее, чем в случае с «дополнением», потому что люди скорее не читают, а угадывают слова на основе первой и последней буквы, а не прочитывают каждую букву последовательно.
- Гомоглифы (homoglyph) — одна из двух или больше графем, знаков или глифов с формами, которые или кажутся идентичными, или не могут быть дифференцированы быстрым визуальным осмотром. Например, русская «а» и английская «a» — гомоглифы.
- Пропуск — определенные буквы просто удаляются из названия домена. Конечно, самый распространенный случай, когда пропускают не первую или последнюю букву в имени домена, а в середине слова, где пропущенный символ значительно сложнее заметить.
- Поддомен — речь идет о точке, вставленной в разные позиции в конкретном доменном имени (например, goo.gl — сервис сокращенных ссылок Google). Здесь речь идет только о том, что для создания эффективного имени сайта достаточно будет убедительно выглядящего субдомена. Подобно «добавлению», этот способ может быть более очевиден пользователю, чем другие трюки.
- Подмена гласных — гласные буквы в конкретном домене меняются на другие гласные. При беглом взгляде на такие домены многие подвержены принципу сканирования названия домена по начальным и последним символам, а не прочитыванию каждой буквы в слове. Если заменяемая гласная будет на первом или последнем месте, то такой вариант, скорее всего, не сработает.
Для автоматизации поиска искомых доменов по выше перечисленным маскам можно использовать следующие инструменты:
- Инструмент командной строки dnstwist от Marcin Ulikowski. Он буквально нафарширован всеми методиками перебора вариаций доменных имен. Для использования dnstwist в вашей системе должен быть установлен интерпретатор языка Python, а также библиотеки ipwhois и GeoIP. После этого вы можете просто запустить в стандартной консоли WIN32 команду «dnstwist.py», указав имя домена, и задать нужные параметры для генерации доменных имен. Полученные результаты можно удобно сохранить в CSV-формате. Наибольшее восхищение вызывает то, что сама программа dnstwist при обнаружении в процессе генерации уже занятых доменов выводит о них подробную информацию: IP-адрес, который соответствует этому домену, его вероятное географическое местоположение. А если указать dnstwist параметр «-w», программа выполнит Whois запросы для каждого активного домена и отобразит дату создания самой записи либо её дату обновления в реестре доменных имен.
- Приятным дополнением к dnstwist является инструмент, вновь консольное приложение URLCrazy от Andrew Horton. URLCrazy дополнительно расширяет возможности перебора к уже перечисленным пунктам ещё интересными вариациями: смещение точки, когда удаляется точка из доменного имени; сингуляризация или плюрализация — метод добавляет или удаляет «s» в конце имени домена; замена гласных — заменяются гласные в доменном имени. Установка этого приложения, как указано на веб-сайте, требует наличия в вашей системе Ruby Rails, что легко решается доступностью этой среды для скачивания в Интернете.
- Этот инструмент рекомендую для тех, кто не любит консольные приложения и больше предпочитает визуальные программные интерфейсы Windows, это программа — Domain Typo Finder, которую можно бесплатно скачать с сайта DomainTools. Она поддерживает почти все методы, основанные на замене букв, транспозиции, повторении и гомоглифах.
После такого затяжного подготовительного этапа давайте перейдём к реализации всей связки. Алгоритм действий прост. Все, кто читал мою статью «Индексация, минуя google webmasters tools», скорей всего, помнят об упомянутом мной процессе передачи доменов от одного регистратора другому, который ещё называется трансфером. В большинстве случаев передача домена занимает от пяти до семи дней. Временной интервал, главным образом, зависит от самого расширения домена. Как бы то ни было, но этого времени вполне предостаточно для составления списка доноров с последующей генерацией доменов с гомоглифами, выбора кандидатов, проверки их на доступность с последующей регистрацией. Сам процесс поиска доноров я опущу, так как он полностью показан в упомянутой мной статье, поэтому перейду сразу к генерации гомоглифов, для этого я воспользуюсь dnstwist. Вот мой подопытный домен, который по данным Whois на трансфере с четырнадцатого сентября 2019 года:
Запускаю стандартное окно консоли Windows 32, где прописываю следующую команду:
C:\Users\...\Desktop\dns\dnstwist.py uaemask.com
Ваше окружение может быть иным, поэтому путь к директории программы сугубо индивидуален, а вот крайние команды указывают на старт самого приложения с точным указанием доменного имени:
На скриншоте можете увидеть, как утилита нашла три тысячи шестьсот тридцать одну вариацию различных подстановок/трансформаций в доменном имени, а далее запущен сам процесс генерации итогового результата. Стоит заметить, если вы желаете сохранить отчётный листинг программы, то лучше сразу генерировать его в CSV-формат, для этого необходимо задать дополнительную команду:
dnstwist.py --format csv uaemask.com> out.csv
В противном случае результат вашего исследования, листинг доменов с гомоглифами, не будет сохранён. У меня доменных имён, именно гомоглифов, получилось не более двух тысяч пятьсот штук, поэтому я при сортировке приоритет отдаю доменам с однобайтовой опечаткой, тут логика проста: в одном и том же слове пользователи гораздо реже допускают более двух ошибок. После того как вы найдёте подходящие вариации доменов, то на следующем шаге эти имена необходимо проверить на доступность у любого доменного провайдера:
uaemɑsk.com – на момент написания статьи данное доменное имя свободно для регистрации и мне предлагают добавить его в корзину за восемь долларов восемьдесят восемь центов.
Оговорюсь сразу, что все сочные домены: Google, Instagram, Facebook и прочие топовые ресурсы буквально просканированы неоднократно, поэтому не стоит на них зря тратить время, но я уверена, в тех вертикалях, в которых вы работаете, непременно будут аппетитные домены-доноры и очень эффектные «однобайтовые клоны». Либо же поступать по моему примеру: я беру в качестве доноров домены на трансфере, далее нахожу гомоглифы, после регистрирую эти релевантные доменные имена. В результате я получаю дополнительные источники тайп-трафика.
Всем удачной охоты на однобайтовые подстановки литер в доменных именах! 🙂
Автор статьи: Alisa.