新闻  |   论坛  |   博客  |   在线研讨会
正确使用HTTP代理的方式
laical | 2021-02-03 17:08:26    阅读:170   发布文章

互联网的大数据时代,网络爬虫的工作离不开大数据。在我们使用网络过程中,肯定遇到过访问网站IP受限这种问题。其实不是你的IP出现了问题,而是对方因为目标网站的服务器的限制,限制了多次注册,多次访问,才会限制本地IP。如果想一直访问目标网站,这时候可以利用隧道转发的爬虫代理加强版来上网,隧道转发爬虫代理加强版使用起来非常简单。

当然网上的免费代理IP也同样可以使用,免费代理IP的获取方式非常简单,直接通过网络搜索,然后网络爬虫编程一个程序来筛选可用的IP,免费的代理IP虽然很多,但是也只适合业务较小的用户,对IP质量要求不高的用户,如果是网络爬虫或者是需求量大的用户,公司用户 就免费代理IP完全不行。不仅会影响业务的进展,爬虫效果也不会稳定。

对于大工作量的爬虫来说,效率是第一位的,只有高效率才能在有限的时间里,完成大量的工作。要提高效率,则必须要高质量稳定的代理IP像公司企业对IP需求量大的网络爬虫用户,完全可以使用隧道转发的爬虫代理加强版,来提高业务的进展,加强业务的稳定性,不仅节约了业务时间,也能保证代理的正常运行,满足的大量客户的需求。

<?php    
    namespace App\Console\Commands;    
    use Illuminate\Console\Command;

    class Test16Proxy extends Command
    {
        /**
         * The name and signature of the console command.
         *
         * @var string
         */
        protected $signature = 'test:16proxy';

        /**
         * The console command description.
         *
         * @var string
         */
        protected $description = 'Command description';

        /**
         * Create a new command instance.
         *
         * @return void
         */
        public function __construct()
        {
            parent::__construct();
        }

        /**
         * Execute the console command.
         *
         * @return mixed
         */
        public function handle()
        {
            $client = new \GuzzleHttp\Client();
            // 要访问的目标页面
            $targetUrl = "http://httpbin.org/ip";

            // 代理服务器(产品官网 www.16yun.cn)
            define("PROXY_SERVER", "t.16yun.cn:31111");

            // 代理身份信息
            define("PROXY_USER", "username");
            define("PROXY_PASS", "password");

            $proxyAuth = base64_encode(PROXY_USER . ":" . PROXY_PASS);

            $options = [
                "proxy"  => PROXY_SERVER,
                "headers" => [
                    "Proxy-Authorization" => "Basic " . $proxyAuth
                ]
            ];
            //print_r($options);
            $result = $client->request('GET', $targetUrl, $options);
            var_dump($result->getBody()->getContents());
        }
    }
?>



*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客