Proxy FAQ. Все о рекапче, Google и прокси.

Почему требуются прокси при загрузке рекапчи? Другие сервисы их не требуют.

Мы на 100% уверены что Google рано или поздно запустит фильтрацию по IP адресам и все "другие сервисы" перестанут работать. Вам придется срочно искать прокси, переписывать приложение, испытывать натиск недовольных пользователей.

На дату написания этой статьи (30 августа 2016) хэши рекапчи challenge-response могут быть сгенерированы в браузере на localhost. Также хеш сгенерированный на одном IP адресе можно использовать на другом. Но в итоге гугл снимет это послабление так как все больше людей используют это просто решение.

То что мы предлагаем является железобетонным решением которое будет работать вечно. Мы эмулируем домен (полный реферер URL с протоколом http/https), нужный IP, user-agent и прокси. Если гугл поменяет что-либо в своем алгоритме, наши клиенты это даже тупо не заметят.

Поддержка:Другие сервисыAnti-Captcha
User-Agent браузера(minus)(tick)
Кастомные cookies(minus)(tick)
Целевой домен(minus)(tick)
IP адрес(minus)(tick)

Есть еще один важны момент почему нам требуется прокси. Если все запросы к серверу Google делать с одного IP адреса, то после 1000 решений рекапчи IP будет заблокирован и появится вот такое сообщение:
 

Ограничение снимается через некоторое время, видимо лимит действует на определенное количество решений рекапчи за последние 24 часа. Поэтому:

  • Если мы будем решать рекапчу с IP адреса работника, то он сможет решить только лимитированное количество рекапч со своего компьютера. Многие сидят за NAT, используют 1 адрес в интернет-кафе, поэтому этот лимит быстро исчерпается.
  • Если мы будем решать рекапчу со своих серверов, то этот лимит еще быстрее закончится
  • Если мы будем сами искать прокси для вас и решать рекапчу через них, то стоимость услуг возрастет для вас в разы плюс это ненадежное решение по ряду причин.

Я являюсь автором приложения, хочу встроить рекапчу, но мои пользователи не используют прокси.

В этом случае ваше приложение само должно работать как прокси-сервер, данные которого вы будете передавать нам. Важно чтобы ваш прокси-сервер поддерживал как минимум протокол HTTP 1.1.

Да, и что за тема с User-Agent, почему это важно?

Чтобы успешно обходить защиту необходимо полностью воспроизводить поведение браузера, а браузер при работе с сайтом шлет одну и ту же подпись, а не рандомную на каждый запрос. Поэтому мы берем подпись которую вы нам даете и используем. Важно присылать подпись современного браузера, иначе Гугл будет думать что он не сможет отобразить рекапчу и покажет такое сообщение:


Должен ли прокси поддерживать SSL соединения (HTTPS)?

На данный момент нет, но мы проверяем, поддерживает ли ваш прокси SSL, и на этом основании решаем как общаться с серверами гугла. В данный момент гугл без проблем отдает контент рекапчи по обычному http протоколу, но не известно как долго это будет работать.


Другие сервисы решают рекапчу быстрее. Почему так?

Они просят своих работников войти в учетную запись Gmail и решают рекапчи используя эту учетку. Тысячи рекапч разных клиентов на одной учетке. Мы так не делаем так как это несет большие риски.

Например, вы:

  1. Сделали 1000 аккаунтов с 1 Gmail учеткой.
  2. Гугл записал все результирующие хеши
  3. В одно прекрасное утро он пометил все аккаунты сделанные через эту учетную запись как фейковые
  4. Вы лишились 1000 своих аккаунтов и денег

И как мне тогда увеличить скорость своих регистраций с рекапчей?

Попросите вашего кодера сделать что-то вроде предварительного кэширования хешей, помня о том, что каждый хэш действует еще 120 секунд после того как мы его вам передали. Например, можно использовать простую таблицу с полями "hash" и "expiry_date", пополнять ее хеш-решениями в параллельном потоке. 

Либо, если скорость не критична, а важно количество действий за период, просто используйте большее количество потоков.