anonymous@RULINUX.NET~# | Last login: 2024-11-23 20:50:26 |
Регистрация Вход | Новости | Разметка | Пользователи | Галерея | Форум | Статьи | Неподтвержденное | Трекер | Правила форума | F.A.Q. | Ссылки | Поиск |
Форум - Talks | [RSS] |
Вот тут возникла такая задача - нужен поиск по интернету из программы, естественно через какой-нибудь яндекс или гугл. Запросов будет много, потому нужно найти какой-нибудь API, т.к. запрос к сайту вручную и парсинг результатов рано или поздно заканчивается баном, даже если ставить рандомные таймауты. Если же делать совсем большие таймауты, то не получится сделать нужное количество запросов в день, а их надо делать тысячами. А набирать тысячи проксей и заниматься раскидыванием запросов - совсем не интересно, т.к. надо брать необщедоступные прокси за деньги, но и их тоже умудряются банить (я проверял, лол).
Сходу есть два варианта:
1. Поиск яндекса, через яндекс.XML. Удобно тем, что можно получать сразу по 50 результатов, а это важно. Ограничение на 1000 запросов в день, снятие ограничения при подключении к рекламной сети яндекса. Вот тут загвоздка - рекламная сеть яндекса означает рекламу на странице. А в моём случае никакой страницы нет, будет только веб-админка, анально огороженная от всех. Не на неё же выводить? Как-то некошерно. Владельцы даже денег готовы заплатить, хотя и немного, а яндекс про денежные варианты ничего не пишет.
2. Гугль, великий и ужасный. Меняет свои API раз в день, даже ссылки со своего хелпа не успевает поправить. Его json custom search api выдаёт по 10 результатов максимум. До 100 запросов в день бесплатно, далее по 5 баксов за каждые 1000, до 10000. Больше 10000 - по просьбе, я хз, дают они такое или нет. Из ограничений - только требование API-ключа, что не проблема. Однако ж проблема в том, что, из-за 10 результатов, придётся делать в несколько раз больше запросов (хорошо бы хотя бы 30 результатов получать на запрос). Отчего сильно будет страдать кошелёк.
У нигмы API найдено не было, у рамблера и мейла - аналогично. Bing меня чем-то смущает. Yahoo тоже, хотя можно подумать. Есть ли ещё что-нибудь приятное, вроде яндекса, но без рекламы, пусть и за деньги (только адекватные)?
Кто-нибудь похожую проблему решал?
UPD: увы, нужен таки поиск по русскоязычному контенту, потому малоизвестная дикая западная маргинальщина тоже не подойдёт.
SystemV(*) (2011-10-03 19:53:50)
Отредактировано SystemV по причине "не указана"
Emacs-w3m/1.4.414 w3m/0.5.3
|
|
|
Скрыть
Re:Поисковые API>Как вариант выводить рекламу можно там, где отображаются поисковые результаты, т.е. в самой программе.
|
Скрыть
Re:Поисковые API>Я помочь не могу, но позвольте полюбопытствовать, что же это за анально отгороженная админка которая нуждается в запросах на рускоязычные ресурсы ?
|
Скрыть
Re:Поисковые APIjid: [email protected] пробовал? http://ddg.gg я хз какие там условия, проверь. На русском вроде ищет. |
Скрыть
Re:Поисковые API>jid: [email protected] пробовал? http://ddg.gg я хз какие там условия, проверь. На русском вроде ищет.
|
Скрыть
Re:Поисковые API>jid: [email protected] пробовал?
|
Скрыть
Re:Поисковые APIНе, чего-то этот бот по кускам текста находит не очень хорошо. Как и сам ddg. Видимо он под адекватные человеческие запросы больше заточен. |
Скрыть
Re:Поисковые API> внутри этоу программы надо искать дубликаты некоторых текстов в сети
|
|
|
|
Этот тред читают 1 пользователь: |
Анонимных: 1 Зарегистрированных: 0 |
Re:Поисковые API
> Вот тут загвоздка - рекламная сеть яндекса означает рекламу на странице. А в моём случае никакой страницы нет, будет только веб-админка, анально огороженная от всех. Не на неё же выводить? Как-то некошерно.
Как вариант выводить рекламу можно там, где отображаются поисковые результаты, т.е. в самой программе.
Mozilla/5.0 (X11; Linux x86_64; rv:7.0.1) Gecko/20100101 Firefox/7.0.1