Скрыть
Поисковые API
Вот тут возникла такая задача - нужен поиск по интернету из программы, естественно через какой-нибудь яндекс или гугл. Запросов будет много, потому нужно найти какой-нибудь API, т.к. запрос к сайту вручную и парсинг результатов рано или поздно заканчивается баном, даже если ставить рандомные таймауты. Если же делать совсем большие таймауты, то не получится сделать нужное количество запросов в день, а их надо делать тысячами. А набирать тысячи проксей и заниматься раскидыванием запросов - совсем не интересно, т.к. надо брать необщедоступные прокси за деньги, но и их тоже умудряются банить (я проверял, лол).
Сходу есть два варианта:
1. Поиск яндекса, через яндекс.XML. Удобно тем, что можно получать сразу по 50 результатов, а это важно. Ограничение на 1000 запросов в день, снятие ограничения при подключении к рекламной сети яндекса. Вот тут загвоздка - рекламная сеть яндекса означает рекламу на странице. А в моём случае никакой страницы нет, будет только веб-админка, анально огороженная от всех. Не на неё же выводить? Как-то некошерно. Владельцы даже денег готовы заплатить, хотя и немного, а яндекс про денежные варианты ничего не пишет.
2. Гугль, великий и ужасный. Меняет свои API раз в день, даже ссылки со своего хелпа не успевает поправить. Его json custom search api выдаёт по 10 результатов максимум. До 100 запросов в день бесплатно, далее по 5 баксов за каждые 1000, до 10000. Больше 10000 - по просьбе, я хз, дают они такое или нет. Из ограничений - только требование API-ключа, что не проблема. Однако ж проблема в том, что, из-за 10 результатов, придётся делать в несколько раз больше запросов (хорошо бы хотя бы 30 результатов получать на запрос). Отчего сильно будет страдать кошелёк.
У нигмы API найдено не было, у рамблера и мейла - аналогично. Bing меня чем-то смущает. Yahoo тоже, хотя можно подумать. Есть ли ещё что-нибудь приятное, вроде яндекса, но без рекламы, пусть и за деньги (только адекватные)?
Кто-нибудь похожую проблему решал?
UPD: увы, нужен таки поиск по русскоязычному контенту, потому малоизвестная дикая западная маргинальщина тоже не подойдёт.
Re:Поисковые API
> Вот тут загвоздка - рекламная сеть яндекса означает рекламу на странице. А в моём случае никакой страницы нет, будет только веб-админка, анально огороженная от всех. Не на неё же выводить? Как-то некошерно.
Как вариант выводить рекламу можно там, где отображаются поисковые результаты, т.е. в самой программе.
Mozilla/5.0 (X11; Linux x86_64; rv:7.0.1) Gecko/20100101 Firefox/7.0.1