পিএইচপি-র মাধ্যমে কোনও ইউআরএল উপস্থিত রয়েছে কিনা তা আমি কীভাবে পরীক্ষা করতে পারি?


188

পিএইচপি-তে কোনও ইউআরএল উপস্থিত রয়েছে কিনা (404 নয়) আমি কীভাবে চেক করব?


উত্তর:


296

এখানে:

$file = 'http://www.domain.com/somefile.jpg';
$file_headers = @get_headers($file);
if(!$file_headers || $file_headers[0] == 'HTTP/1.1 404 Not Found') {
    $exists = false;
}
else {
    $exists = true;
}

থেকে এখানে এবং অধিকার নীচের উপরে পোস্ট, একটি এর কার্ল সমাধান:

function url_exists($url) {
    if (!$fp = curl_init($url)) return false;
    return true;
}

18
আমি ভয় পাচ্ছি যে সিআরএল-ওয়ে এভাবে কাজ করবে না। : এই পরীক্ষা করে দেখুন stackoverflow.com/questions/981954/...
viam0Zah

4
কিছু ওয়েবসাইটের $file_headers[0]ত্রুটি পৃষ্ঠায় আলাদা থাকে। উদাহরণস্বরূপ, youtube.com .com এর ত্রুটি পৃষ্ঠাতে এর মানটি রয়েছে HTTP/1.0 404 Not Found(পার্থক্যটি 1.0 এবং 1.1)। তাহলে কি করব?
কৃষ্ণ রাজ কে

21
সম্ভবত strpos($headers[0], '404 Not Found')
ব্যবহারটি

12
@ মার্ক সম্মত! স্পষ্ট করার জন্য, strpos($headers[0], '404')ভাল!
alexandru.topliceanu

1
@ করিম SS৯ এসএসআরএফ এবং এক্সএসপিএ আক্রমণ থেকে যত্নবান হন
এম

55

পিএইচপি থেকে কোনও ইউআরএল উপস্থিত রয়েছে কিনা তা খুঁজে বের করার সময় মনোযোগ দেওয়ার মতো কয়েকটি জিনিস রয়েছে:

  • ইউআরএল নিজেই বৈধ (একটি স্ট্রিং, খালি নয়, ভাল সিনট্যাক্স), এটি সার্ভারের দিকটি চেক করা দ্রুত।
  • প্রতিক্রিয়ার জন্য অপেক্ষা করতে সময় এবং ব্লক কোড কার্যকর করতে পারে।
  • Get_headers () দ্বারা ফিরে আসা সমস্ত শিরোনাম ভালভাবে তৈরি হয় না।
  • কার্ল ব্যবহার করুন (আপনি যদি পারেন)
  • পুরো শরীর / সামগ্রী আনতে বাধা দিন, তবে কেবল শিরোনামগুলির জন্য অনুরোধ করুন।
  • পুনর্নির্দেশ url বিবেচনা করুন:
    • আপনি কি প্রথম কোডটি ফেরত চান?
    • অথবা সমস্ত পুনঃনির্দেশগুলি অনুসরণ করুন এবং শেষ কোডটি ফেরত দিন?
    • আপনার 200 এর শেষ হতে পারে তবে এটি মেটা ট্যাগ বা জাভাস্ক্রিপ্ট ব্যবহার করে পুনর্নির্দেশ করতে পারে। পরে কী ঘটে তা নির্ধারণ করা শক্ত।

মনে রাখবেন যে আপনি যে কোনও পদ্ধতি ব্যবহার করেন না কেন প্রতিক্রিয়ার জন্য অপেক্ষা করতে সময় লাগে।
সমস্ত কোড সম্ভবত (এবং সম্ভবত) ফলাফল থামিয়ে দেওয়ার বা অনুরোধের সময়সীমা শেষ না হওয়া পর্যন্ত থামিয়ে দিতে পারে।

উদাহরণস্বরূপ: ইউআরএলগুলি অবৈধ বা অ্যাক্সেস অযোগ্য হলে পৃষ্ঠাটি প্রদর্শন করতে নীচের কোডটি দীর্ঘ সময় নিতে পারে:

<?php
$urls = getUrls(); // some function getting say 10 or more external links

foreach($urls as $k=>$url){
  // this could potentially take 0-30 seconds each
  // (more or less depending on connection, target site, timeout settings...)
  if( ! isValidUrl($url) ){
    unset($urls[$k]);
  }
}

echo "yay all done! now show my site";
foreach($urls as $url){
  echo "<a href=\"{$url}\">{$url}</a><br/>";
}

নীচের ফাংশনগুলি সহায়ক হতে পারে, আপনি সম্ভবত আপনার প্রয়োজন অনুসারে এগুলি সংশোধন করতে চান:

    function isValidUrl($url){
        // first do some quick sanity checks:
        if(!$url || !is_string($url)){
            return false;
        }
        // quick check url is roughly a valid http request: ( http://blah/... ) 
        if( ! preg_match('/^http(s)?:\/\/[a-z0-9-]+(\.[a-z0-9-]+)*(:[0-9]+)?(\/.*)?$/i', $url) ){
            return false;
        }
        // the next bit could be slow:
        if(getHttpResponseCode_using_curl($url) != 200){
//      if(getHttpResponseCode_using_getheaders($url) != 200){  // use this one if you cant use curl
            return false;
        }
        // all good!
        return true;
    }

    function getHttpResponseCode_using_curl($url, $followredirects = true){
        // returns int responsecode, or false (if url does not exist or connection timeout occurs)
        // NOTE: could potentially take up to 0-30 seconds , blocking further code execution (more or less depending on connection, target site, and local timeout settings))
        // if $followredirects == false: return the FIRST known httpcode (ignore redirects)
        // if $followredirects == true : return the LAST  known httpcode (when redirected)
        if(! $url || ! is_string($url)){
            return false;
        }
        $ch = @curl_init($url);
        if($ch === false){
            return false;
        }
        @curl_setopt($ch, CURLOPT_HEADER         ,true);    // we want headers
        @curl_setopt($ch, CURLOPT_NOBODY         ,true);    // dont need body
        @curl_setopt($ch, CURLOPT_RETURNTRANSFER ,true);    // catch output (do NOT print!)
        if($followredirects){
            @curl_setopt($ch, CURLOPT_FOLLOWLOCATION ,true);
            @curl_setopt($ch, CURLOPT_MAXREDIRS      ,10);  // fairly random number, but could prevent unwanted endless redirects with followlocation=true
        }else{
            @curl_setopt($ch, CURLOPT_FOLLOWLOCATION ,false);
        }
//      @curl_setopt($ch, CURLOPT_CONNECTTIMEOUT ,5);   // fairly random number (seconds)... but could prevent waiting forever to get a result
//      @curl_setopt($ch, CURLOPT_TIMEOUT        ,6);   // fairly random number (seconds)... but could prevent waiting forever to get a result
//      @curl_setopt($ch, CURLOPT_USERAGENT      ,"Mozilla/5.0 (Windows NT 6.0) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.89 Safari/537.1");   // pretend we're a regular browser
        @curl_exec($ch);
        if(@curl_errno($ch)){   // should be 0
            @curl_close($ch);
            return false;
        }
        $code = @curl_getinfo($ch, CURLINFO_HTTP_CODE); // note: php.net documentation shows this returns a string, but really it returns an int
        @curl_close($ch);
        return $code;
    }

    function getHttpResponseCode_using_getheaders($url, $followredirects = true){
        // returns string responsecode, or false if no responsecode found in headers (or url does not exist)
        // NOTE: could potentially take up to 0-30 seconds , blocking further code execution (more or less depending on connection, target site, and local timeout settings))
        // if $followredirects == false: return the FIRST known httpcode (ignore redirects)
        // if $followredirects == true : return the LAST  known httpcode (when redirected)
        if(! $url || ! is_string($url)){
            return false;
        }
        $headers = @get_headers($url);
        if($headers && is_array($headers)){
            if($followredirects){
                // we want the the last errorcode, reverse array so we start at the end:
                $headers = array_reverse($headers);
            }
            foreach($headers as $hline){
                // search for things like "HTTP/1.1 200 OK" , "HTTP/1.0 200 OK" , "HTTP/1.1 301 PERMANENTLY MOVED" , "HTTP/1.1 400 Not Found" , etc.
                // note that the exact syntax/version/output differs, so there is some string magic involved here
                if(preg_match('/^HTTP\/\S+\s+([1-9][0-9][0-9])\s+.*/', $hline, $matches) ){// "HTTP/*** ### ***"
                    $code = $matches[1];
                    return $code;
                }
            }
            // no HTTP/xxx found in headers:
            return false;
        }
        // no headers :
        return false;
    }

কোনও কারণে getHttpResponseCode_ using_curl () সর্বদা আমার ক্ষেত্রে 200 ফেরত দেয়।
টিডি_নিজবোয়ার

2
কারও যদি একই সমস্যা হয় তবে ডিএনএস-নেমসার্ভারগুলি পরীক্ষা করুন .. কোনও অনুগামী স্ট্যাকওভারফ্লো.com
a

পুনঃনির্দেশগুলি ডিল করার একমাত্র উত্তর হওয়ার জন্য +1। কেবলমাত্র সাফল্যগুলি বাছাই return $codeকরতে পরিবর্তিত হয়েছেif($code == 200){return true;} return false;
বিরল

@ পি কেহান্টার: না। আমার দ্রুত প্রিগ_ম্যাচ রেগেক্স একটি সাধারণ উদাহরণ ছিল এবং সেখানে তালিকাভুক্ত সমস্ত url- এর সাথে মেলে না। এই পরীক্ষার ইউআরএল দেখুন: regex101.com/r/EpyDDc/2 আপনি যদি আরও ভাল চান তবে এটি আপনার লিঙ্কের তালিকাভুক্ত ( mathiasbynens.be/demo/url-regex ) সাথে ডায়গোপারিনি থেকে প্রতিস্থাপন করুন; এটি সবার সাথে মিলছে বলে মনে হচ্ছে, এই টেস্টলিংকটি দেখুন: regex101.com/r/qMQp23/1
মুনলাইট

46
$headers = @get_headers($this->_value);
if(strpos($headers[0],'200')===false)return false;

সুতরাং যে কোনও সময় আপনি কোনও ওয়েবসাইটের সাথে যোগাযোগ করুন এবং 200 এর চেয়ে অন্য কিছু পান ঠিক আছে এটি কাজ করবে


13
কিন্তু যদি এটি পুনর্নির্দেশ হয়? ডোমেনটি এখনও বৈধ, তবে তা রেখে দেওয়া হবে।
এরিক Leroy

4
এক লাইনে উপরে: return strpos(@get_headers($url)[0],'200') === false ? false : true। দরকারী হতে পারে।
দেজভ

PH এটি পিএইচপিতে হ'ল বর্তমান অবজেক্টের একটি রেফারেন্স। রেফারেন্স: php.net/manual/en/language.oop5.basic.php প্রাইমার: পিএইচপি.আর. / টিউটোরিয়ালস / অবজেক্ট-ওরিয়েন্টড- প্রোগ্রামিং- পিএইচপি এইচটিএমএল সম্ভবত সম্ভবত কোড স্নিপেট একটি ক্লাস থেকে নেওয়া হয়েছিল এবং ততক্ষণে ঠিক করা হয়নি ।
মার্ক উইত্তেভিন 21

18

আপনি নির্দিষ্ট সার্ভারগুলিতে কার্ল ব্যবহার করতে পারবেন না আপনি এই কোডটি ব্যবহার করতে পারেন

<?php
$url = 'http://www.example.com';
$array = get_headers($url);
$string = $array[0];
if(strpos($string,"200"))
  {
    echo 'url exists';
  }
  else
  {
    echo 'url does not exist';
  }
?>

এটি 302-303 পুনর্নির্দেশের জন্য বা উদাহরণস্বরূপ 304
টির

8
$url = 'http://google.com';
$not_url = 'stp://google.com';

if (@file_get_contents($url)): echo "Found '$url'!";
else: echo "Can't find '$url'.";
endif;
if (@file_get_contents($not_url)): echo "Found '$not_url!";
else: echo "Can't find '$not_url'.";
endif;

// Found 'http://google.com'!Can't find 'stp://google.com'.

2
অনুমতি-url-fopen বন্ধ করা থাকলে এটি কাজ করবে না। - php.net/manual/en/…
ড্যানিয়েল পল

2
আমি কেবল প্রথম বাইটটি পড়ার পরামর্শ দিচ্ছি ... যদি (@ ফাইল_জেট_কন্টেন্টস ($ ইউআরএল, মিথ্যা, ন্যূন, 0,1))
ড্যানিয়েল ভাল্যান্ড

8
function URLIsValid($URL)
{
    $exists = true;
    $file_headers = @get_headers($URL);
    $InvalidHeaders = array('404', '403', '500');
    foreach($InvalidHeaders as $HeaderVal)
    {
            if(strstr($file_headers[0], $HeaderVal))
            {
                    $exists = false;
                    break;
            }
    }
    return $exists;
}

8

আমি এই ফাংশনটি ব্যবহার করি:

/**
 * @param $url
 * @param array $options
 * @return string
 * @throws Exception
 */
function checkURL($url, array $options = array()) {
    if (empty($url)) {
        throw new Exception('URL is empty');
    }

    // list of HTTP status codes
    $httpStatusCodes = array(
        100 => 'Continue',
        101 => 'Switching Protocols',
        102 => 'Processing',
        200 => 'OK',
        201 => 'Created',
        202 => 'Accepted',
        203 => 'Non-Authoritative Information',
        204 => 'No Content',
        205 => 'Reset Content',
        206 => 'Partial Content',
        207 => 'Multi-Status',
        208 => 'Already Reported',
        226 => 'IM Used',
        300 => 'Multiple Choices',
        301 => 'Moved Permanently',
        302 => 'Found',
        303 => 'See Other',
        304 => 'Not Modified',
        305 => 'Use Proxy',
        306 => 'Switch Proxy',
        307 => 'Temporary Redirect',
        308 => 'Permanent Redirect',
        400 => 'Bad Request',
        401 => 'Unauthorized',
        402 => 'Payment Required',
        403 => 'Forbidden',
        404 => 'Not Found',
        405 => 'Method Not Allowed',
        406 => 'Not Acceptable',
        407 => 'Proxy Authentication Required',
        408 => 'Request Timeout',
        409 => 'Conflict',
        410 => 'Gone',
        411 => 'Length Required',
        412 => 'Precondition Failed',
        413 => 'Payload Too Large',
        414 => 'Request-URI Too Long',
        415 => 'Unsupported Media Type',
        416 => 'Requested Range Not Satisfiable',
        417 => 'Expectation Failed',
        418 => 'I\'m a teapot',
        422 => 'Unprocessable Entity',
        423 => 'Locked',
        424 => 'Failed Dependency',
        425 => 'Unordered Collection',
        426 => 'Upgrade Required',
        428 => 'Precondition Required',
        429 => 'Too Many Requests',
        431 => 'Request Header Fields Too Large',
        449 => 'Retry With',
        450 => 'Blocked by Windows Parental Controls',
        500 => 'Internal Server Error',
        501 => 'Not Implemented',
        502 => 'Bad Gateway',
        503 => 'Service Unavailable',
        504 => 'Gateway Timeout',
        505 => 'HTTP Version Not Supported',
        506 => 'Variant Also Negotiates',
        507 => 'Insufficient Storage',
        508 => 'Loop Detected',
        509 => 'Bandwidth Limit Exceeded',
        510 => 'Not Extended',
        511 => 'Network Authentication Required',
        599 => 'Network Connect Timeout Error'
    );

    $ch = curl_init($url);
    curl_setopt($ch, CURLOPT_NOBODY, true);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);

    if (isset($options['timeout'])) {
        $timeout = (int) $options['timeout'];
        curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
    }

    curl_exec($ch);
    $returnedStatusCode = curl_getinfo($ch, CURLINFO_HTTP_CODE);
    curl_close($ch);

    if (array_key_exists($returnedStatusCode, $httpStatusCodes)) {
        return "URL: '{$url}' - Error code: {$returnedStatusCode} - Definition: {$httpStatusCodes[$returnedStatusCode]}";
    } else {
        return "'{$url}' does not exist";
    }
}

5

করিম's's এর get_headers () সমাধানটি আমার পক্ষে কার্যকর হয়নি কারণ আমি পিনটারেস্টের সাথে পাগলের ফলাফল পেয়েছি।

get_headers(): SSL operation failed with code 1. OpenSSL Error messages: error:14090086:SSL routines:SSL3_GET_SERVER_CERTIFICATE:certificate verify failed

Array
(
    [url] => https://www.pinterest.com/jonathan_parl/
    [exists] => 
)

get_headers(): Failed to enable crypto

Array
(
    [url] => https://www.pinterest.com/jonathan_parl/
    [exists] => 
)

get_headers(https://www.pinterest.com/jonathan_parl/): failed to open stream: operation failed

Array
(
    [url] => https://www.pinterest.com/jonathan_parl/
    [exists] => 
) 

যাইহোক, এই বিকাশকারী দেখায় যে সিআরএল get_headers () এর চেয়ে দ্রুততর:

http://php.net/manual/fr/function.get-headers.php#104723

যেহেতু অনেক লোক কারিম 79৯-কে ঠিক করার জন্য বলেছিল তা হল সিআরএল সমাধান, তাই আমি আজই তৈরি করা সমাধানটি এখানে।

/**
* Send an HTTP request to a the $url and check the header posted back.
*
* @param $url String url to which we must send the request.
* @param $failCodeList Int array list of code for which the page is considered invalid.
*
* @return Boolean
*/
public static function isUrlExists($url, array $failCodeList = array(404)){

    $exists = false;

    if(!StringManager::stringStartWith($url, "http") and !StringManager::stringStartWith($url, "ftp")){

        $url = "https://" . $url;
    }

    if (preg_match(RegularExpression::URL, $url)){

        $handle = curl_init($url);


        curl_setopt($handle, CURLOPT_RETURNTRANSFER, true);

        curl_setopt($handle, CURLOPT_SSL_VERIFYPEER, false);

        curl_setopt($handle, CURLOPT_HEADER, true);

        curl_setopt($handle, CURLOPT_NOBODY, true);

        curl_setopt($handle, CURLOPT_USERAGENT, true);


        $headers = curl_exec($handle);

        curl_close($handle);


        if (empty($failCodeList) or !is_array($failCodeList)){

            $failCodeList = array(404); 
        }

        if (!empty($headers)){

            $exists = true;

            $headers = explode(PHP_EOL, $headers);

            foreach($failCodeList as $code){

                if (is_numeric($code) and strpos($headers[0], strval($code)) !== false){

                    $exists = false;

                    break;  
                }
            }
        }
    }

    return $exists;
}

আমি কার্ল বিকল্পগুলি ব্যাখ্যা করি:

CURLOPT_REmittedTRANSFER : স্ক্রিনে কলিং পৃষ্ঠা প্রদর্শনের পরিবর্তে একটি স্ট্রিং ফিরিয়ে দিন।

CURLOPT_SSL_VERIFYPEER : সিআরএল শংসাপত্রটি চেকআউট করবে না

CURLOPT_HEADER : স্ট্রিংটিতে শিরোলেখ অন্তর্ভুক্ত করুন

CURLOPT_NOBODY : স্ট্রিংটিতে শরীরটি অন্তর্ভুক্ত করবেন না

CURLOPT_USERAGENT : কিছু সাইটের সঠিকভাবে কাজ করতে হবে (উদাহরণস্বরূপ: https://plus.google.com )


অতিরিক্ত দ্রষ্টব্য : এই ফাংশনে আমি অনুরোধটি প্রেরণের আগে ইউআরএলকে বৈধতা দেওয়ার জন্য দিয়েগো পেরিনি'র রেজেক্স ব্যবহার করছি:

const URL = "%^(?:(?:https?|ftp)://)(?:\S+(?::\S*)?@|\d{1,3}(?:\.\d{1,3}){3}|(?:(?:[a-z\d\x{00a1}-\x{ffff}]+-?)*[a-z\d\x{00a1}-\x{ffff}]+)(?:\.(?:[a-z\d\x{00a1}-\x{ffff}]+-?)*[a-z\d\x{00a1}-\x{ffff}]+)*(?:\.[a-z\x{00a1}-\x{ffff}]{2,6}))(?::\d+)?(?:[^\s]*)?$%iu"; //@copyright Diego Perini

অতিরিক্ত নোট 2 : কেবলমাত্র রিটার্ন কোড এবং বার্তাটি বৈধতা নিশ্চিত করার জন্য আমি শিরোনামের স্ট্রিং এবং ব্যবহারকারীর শিরোনাম [0] বিস্ফোরিত করেছি (উদাহরণস্বরূপ: 200, 404, 405, ইত্যাদি)

অতিরিক্ত নোট 3 : কিছু সময় কেবলমাত্র 404 কোডটি যাচাই করা যথেষ্ট নয় (ইউনিট পরীক্ষাটি দেখুন), তাই সমস্ত বিকল্প তালিকা প্রত্যাখ্যান করার জন্য একটি alচ্ছিক $ ফেলকোডলিস্ট প্যারামিটার রয়েছে।

এবং অবশ্যই, আমার কোডিংকে বৈধতা দেওয়ার জন্য এখানে ইউনিট পরীক্ষা (সমস্ত জনপ্রিয় সামাজিক নেটওয়ার্ক সহ) রয়েছে:

public function testIsUrlExists(){

//invalid
$this->assertFalse(ToolManager::isUrlExists("woot"));

$this->assertFalse(ToolManager::isUrlExists("https://www.facebook.com/jonathan.parentlevesque4545646456"));

$this->assertFalse(ToolManager::isUrlExists("https://plus.google.com/+JonathanParentL%C3%A9vesque890800"));

$this->assertFalse(ToolManager::isUrlExists("https://instagram.com/mariloubiz1232132/", array(404, 405)));

$this->assertFalse(ToolManager::isUrlExists("https://www.pinterest.com/jonathan_parl1231/"));

$this->assertFalse(ToolManager::isUrlExists("https://regex101.com/546465465456"));

$this->assertFalse(ToolManager::isUrlExists("https://twitter.com/arcadefire4566546"));

$this->assertFalse(ToolManager::isUrlExists("https://vimeo.com/**($%?%$", array(400, 405)));

$this->assertFalse(ToolManager::isUrlExists("https://www.youtube.com/user/Darkjo666456456456"));


//valid
$this->assertTrue(ToolManager::isUrlExists("www.google.ca"));

$this->assertTrue(ToolManager::isUrlExists("https://www.facebook.com/jonathan.parentlevesque"));

$this->assertTrue(ToolManager::isUrlExists("https://plus.google.com/+JonathanParentL%C3%A9vesque"));

$this->assertTrue(ToolManager::isUrlExists("https://instagram.com/mariloubiz/"));

$this->assertTrue(ToolManager::isUrlExists("https://www.facebook.com/jonathan.parentlevesque"));

$this->assertTrue(ToolManager::isUrlExists("https://www.pinterest.com/"));

$this->assertTrue(ToolManager::isUrlExists("https://regex101.com"));

$this->assertTrue(ToolManager::isUrlExists("https://twitter.com/arcadefire"));

$this->assertTrue(ToolManager::isUrlExists("https://vimeo.com/"));

$this->assertTrue(ToolManager::isUrlExists("https://www.youtube.com/user/Darkjo666"));
}

সবার কাছে দুর্দান্ত সাফল্য,

মন্ট্রিল থেকে জনাথন প্যারেন্ট-লাভেস্ক


4
function urlIsOk($url)
{
    $headers = @get_headers($url);
    $httpStatus = intval(substr($headers[0], 9, 3));
    if ($httpStatus<400)
    {
        return true;
    }
    return false;
}

3

বেশ দ্রুত:

function http_response($url){
    $resURL = curl_init(); 
    curl_setopt($resURL, CURLOPT_URL, $url); 
    curl_setopt($resURL, CURLOPT_BINARYTRANSFER, 1); 
    curl_setopt($resURL, CURLOPT_HEADERFUNCTION, 'curlHeaderCallback'); 
    curl_setopt($resURL, CURLOPT_FAILONERROR, 1); 
    curl_exec ($resURL); 
    $intReturnCode = curl_getinfo($resURL, CURLINFO_HTTP_CODE); 
    curl_close ($resURL); 
    if ($intReturnCode != 200 && $intReturnCode != 302 && $intReturnCode != 304) { return 0; } else return 1;
}

echo 'google:';
echo http_response('http://www.google.com');
echo '/ ogogle:';
echo http_response('http://www.ogogle.com');

উপায় খুব জটিল :) stackoverflow.com/questions/981954/...
জ্যাক

ইউআরএল উপস্থিত থাকলে আমি এই ব্যতিক্রমটি পেয়েছি: CURLOPT_HEADERFUNCTION
safiot

3

উপরের সমস্ত সমাধান + অতিরিক্ত চিনি। (চূড়ান্ত এআইও সমাধান)

/**
 * Check that given URL is valid and exists.
 * @param string $url URL to check
 * @return bool TRUE when valid | FALSE anyway
 */
function urlExists ( $url ) {
    // Remove all illegal characters from a url
    $url = filter_var($url, FILTER_SANITIZE_URL);

    // Validate URI
    if (filter_var($url, FILTER_VALIDATE_URL) === FALSE
        // check only for http/https schemes.
        || !in_array(strtolower(parse_url($url, PHP_URL_SCHEME)), ['http','https'], true )
    ) {
        return false;
    }

    // Check that URL exists
    $file_headers = @get_headers($url);
    return !(!$file_headers || $file_headers[0] === 'HTTP/1.1 404 Not Found');
}

উদাহরণ:

var_dump ( urlExists('http://stackoverflow.com/') );
// Output: true;

3

ইউআরএল অনলাইন বা অফলাইন কিনা তা যাচাই করতে ---

function get_http_response_code($theURL) {
    $headers = @get_headers($theURL);
    return substr($headers[0], 9, 3);
}


2

এখানে এমন একটি সমাধান রয়েছে যা কেবলমাত্র উত্স কোডের প্রথম বাইটটি পড়ে ... যদি ফাইল_জেট_কন্টেন্টগুলি ব্যর্থ হয় তবে মিথ্যা ফিরিয়ে দেওয়া ... এটি চিত্রের মতো দূরবর্তী ফাইলগুলির জন্যও কাজ করবে।

 function urlExists($url)
{
    if (@file_get_contents($url,false,NULL,0,1))
    {
        return true;
    }
    return false;
}

0

সহজ উপায়টি কার্ল (এবং খুব দ্রুত)

<?php
$mylinks="http://site.com/page.html";
$handlerr = curl_init($mylinks);
curl_setopt($handlerr,  CURLOPT_RETURNTRANSFER, TRUE);
$resp = curl_exec($handlerr);
$ht = curl_getinfo($handlerr, CURLINFO_HTTP_CODE);


if ($ht == '404')
     { echo 'OK';}
else { echo 'NO';}

?>

0

কোনও ইউআরএল বৈধ কিনা তা যাচাই করার অন্যান্য উপায় হতে পারে:

<?php

  if (isValidURL("http://www.gimepix.com")) {
      echo "URL is valid...";
  } else {
      echo "URL is not valid...";
  }

  function isValidURL($url) {
      $file_headers = @get_headers($url);
      if (strpos($file_headers[0], "200 OK") > 0) {
         return true;
      } else {
        return false;
      }
  }
?>

0

get_headers () একটি HTTP অনুরোধের প্রতিক্রিয়া হিসাবে সার্ভারের মাধ্যমে প্রেরিত শিরোনামগুলির সাথে একটি অ্যারের ফেরত দেয়।

$image_path = 'https://your-domain.com/assets/img/image.jpg';

$file_headers = @get_headers($image_path);
//Prints the response out in an array
//print_r($file_headers); 

if($file_headers[0] == 'HTTP/1.1 404 Not Found'){
   echo 'Failed because path does not exist.</br>';
}else{
   echo 'It works. Your good to go!</br>';
}

0

সিআরএল এইচটিটিপি কোডটি ফিরিয়ে দিতে পারে আমি মনে করি না যে অতিরিক্ত কোডটি সমস্ত প্রয়োজনীয়?

function urlExists($url=NULL)
    {
        if($url == NULL) return false;
        $ch = curl_init($url);
        curl_setopt($ch, CURLOPT_TIMEOUT, 5);
        curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
        $data = curl_exec($ch);
        $httpcode = curl_getinfo($ch, CURLINFO_HTTP_CODE);
        curl_close($ch); 
        if($httpcode>=200 && $httpcode<300){
            return true;
        } else {
            return false;
        }
    }

0

আপনি যখন 404 এর জন্য শিরোনাম পরীক্ষা করে বিবেচনা করার জন্য একটি বিষয় হ'ল এমন ঘটনাটি যেখানে কোনও সাইট অবিলম্বে 404 জেনারেট করে না।

অনেকগুলি সাইট পিএইচপি / এএসপি (এটি সিটিআর) উত্সে কোনও পৃষ্ঠা উপস্থিত রয়েছে কিনা তা পরীক্ষা করে আপনাকে একটি 404 পৃষ্ঠায় ফরোয়ার্ড করে। এই ক্ষেত্রে শিরোনামটি মূলত উত্পন্ন 404 এর শিরোনাম দ্বারা প্রসারিত হয়। এই ক্ষেত্রে 404 ত্রুটি শিরোনামের প্রথম লাইনে নয়, দশম।

$array = get_headers($url);
$string = $array[0];
print_r($string) // would generate:

Array ( 
[0] => HTTP/1.0 301 Moved Permanently 
[1] => Date: Fri, 09 Nov 2018 16:12:29 GMT 
[2] => Server: Apache/2.4.34 (FreeBSD) LibreSSL/2.7.4 PHP/7.0.31 
[3] => X-Powered-By: PHP/7.0.31 
[4] => Set-Cookie: landing=%2Freed-diffuser-fig-pudding-50; path=/; HttpOnly 
[5] => Location: /reed-diffuser-fig-pudding-50/ 
[6] => Content-Length: 0 
[7] => Connection: close 
[8] => Content-Type: text/html; charset=utf-8 
[9] => HTTP/1.0 404 Not Found 
[10] => Date: Fri, 09 Nov 2018 16:12:29 GMT 
[11] => Server: Apache/2.4.34 (FreeBSD) LibreSSL/2.7.4 PHP/7.0.31 
[12] => X-Powered-By: PHP/7.0.31 
[13] => Set-Cookie: landing=%2Freed-diffuser-fig-pudding-50%2F; path=/; HttpOnly 
[14] => Connection: close 
[15] => Content-Type: text/html; charset=utf-8 
) 

0

আমার সাইটে লিঙ্কগুলি বৈধ কিনা তা দেখতে আমি কয়েকটি পরীক্ষা চালিয়েছি - তৃতীয় পক্ষগুলি যখন তাদের লিঙ্কগুলি পরিবর্তন করবে তখন আমাকে সতর্ক করে দেয়। আমার কোনও সাইটটির সাথে একটি সমস্যা ছিল যার একটি দুর্বল কনফিগার করা শংসাপত্র ছিল যার অর্থ পিএইচপি এর get_headers কাজ করে না।

সুতরাং, আমি পড়লাম যে কার্লটি দ্রুত ছিল এবং সিদ্ধান্ত নিয়েছে। তারপরে আমার লিঙ্কডিনের সাথে একটি সমস্যা ছিল যা আমাকে একটি 999 ত্রুটি দিয়েছে, যা একটি ব্যবহারকারী এজেন্ট হিসাবে পরিণত হয়েছে।

এই পরীক্ষার জন্য শংসাপত্রটি বৈধ না ছিল সেদিকে আমি পাত্তা দিইনি, এবং প্রতিক্রিয়াটি পুনর্নির্দেশিত হয়েছে কিনা তা আমি চিন্তা করি না।

তারপরে আমি কার্লটি ব্যর্থ হ'ল get_headers ব্যবহার যাইহোক ....

একবার দাও ....

/**
 * returns true/false if the $url is present.
 *
 * @param string $url assumes this is a valid url.
 *
 * @return bool
 */
private function url_exists (string $url): bool
{
  $ch = curl_init($url);
  curl_setopt($ch, CURLOPT_URL, $url);
  curl_setopt($ch, CURLOPT_NOBODY, TRUE);             // this does a head request to make it faster.
  curl_setopt($ch, CURLOPT_HEADER, TRUE);             // just the headers
  curl_setopt($ch, CURLOPT_SSL_VERIFYSTATUS, FALSE);  // turn off that pesky ssl stuff - some sys admins can't get it right.
  curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
  // set a real user agent to stop linkedin getting upset.
  curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36');
  curl_exec($ch);
  $http_code = curl_getinfo($ch, CURLINFO_HTTP_CODE);
  if (($http_code >= HTTP_OK && $http_code < HTTP_BAD_REQUEST) || $http_code === 999)
  {
    curl_close($ch);
    return TRUE;
  }
  $error = curl_error($ch); // used for debugging.
  curl_close($ch);
  // just try the get_headers - it might work!
  stream_context_set_default(array('http' => array('method' => 'HEAD')));
  $file_headers = @get_headers($url);
  if ($file_headers)
  {
    $response_code = substr($file_headers[0], 9, 3);
    return $response_code >= 200 && $response_code < 400;
  }
  return FALSE;
}

-2

পুরানো থ্রেডের মতো, তবে .. আমি এটি করি:

$file = 'http://www.google.com';
$file_headers = @get_headers($file);
if ($file_headers) {
    $exists = true;
} else {
    $exists = false;
}

বাছাই .. তবে ঠিক নয়।
হ্যাকডটস্ল্যাশডটকিল

আপনার উত্তর কিভাবে ভাল?
জাহ

@ যা এটি স্পষ্টতই এটি -2 এ নয় @ সারাদিন পর্দার দিকে
তাকানোর
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.