ইউআরএল পথগুলি সংবেদনশীল হওয়া উচিত?


11

আমার ওয়েবসাইটের ইউআরএলগুলি বর্তমানে কেস-সংবেদনশীল। উদাহরণস্বরূপ, নীচের দুটি লিঙ্কই একই পৃষ্ঠাটি দেখায়:

  • http://example.com/about
  • http://example.com/About

যাইহোক, ওয়ার্ডপ্রেস.আর.আরগ ওয়েবসাইটটি একবার দেখে, আমি লক্ষ্য করেছি যে URL গুলি কেস-সংবেদনশীল। উদাহরণস্বরূপ, নীচের দ্বিতীয় লিঙ্কটি একটি 404 ত্রুটি পৃষ্ঠা:

  • http://wordpress.org/about
  • http://wordpress.org/About

আমার চিন্তাভাবনাগুলি হ'ল আমার ওয়েবসাইটের ইউআরএল কেসকে সংবেদনশীল করে তুলবে। সদৃশ বিষয়বস্তু এড়িয়ে যাওয়ার স্পষ্ট সমস্যাটি বাদ দিয়ে, কেস-সংবেদনশীল ইউআরএল থাকার পক্ষে কি কি?

হালনাগাদ

গুগল তাদের নিজস্ব ইউআরএলগুলিতে কেস-সংবেদনশীল URL নীতি পরিচালনা করে বলে মনে হচ্ছে। উদাহরণস্বরূপ, নীচের দ্বিতীয় লিঙ্কটি একটি 404:

  • http://google.com/doodles
  • http://google.com/Doodles

আপডেট 2

আপনার উত্তরের জন্য ধন্যবাদ। আমি গৃহীত উত্তরে উল্লিখিত পরামর্শ নেওয়ার সিদ্ধান্ত নিয়েছি এবং 301 পুনঃনির্দেশগুলি যেখানে প্রয়োজন সেখানে প্রয়োগ করব। যেহেতু আমি ওয়ার্ডপ্রেসের সাথে কাজ করছি, তাই আমার কোড সমাধানটি নীচে দেওয়া হয়েছে (যদি কেউ আগ্রহী হন):

function force_lowercase_urls() {

    if ( is_admin() )
        return;

    if ( preg_match( '/[A-Z]/', $_SERVER['REQUEST_URI'] ) ) {

        wp_redirect( strtolower( $_SERVER['REQUEST_URI'] ), 301 );
        exit();
    }

}
add_action( 'init', 'force_lowercase_urls' );

1
But wouldn't that result in duplicate content? – henrywrightআপনার সাইটটি ক্যানোনিকাল লিঙ্কগুলি সঠিকভাবে ব্যবহার করে এবং আপনার 1 টি পৃষ্ঠা মিলিয়ন উপায়ে অ্যাক্সেস করতে পারে এবং সদৃশ সামগ্রীর জন্য কখনই প্রভাবিত হতে পারে না সেজন্য আপনাকে কখনই সদৃশ লিঙ্কগুলির বিষয়ে চিন্তা করার দরকার নেই।
সাইমন হাইটার

@ বাইবে আপনার যদি একটি পৃষ্ঠা লক্ষ লক্ষ উপায়ে অ্যাক্সেস করে থাকে তবে গুগলবট আপনার সাইটটি ভালভাবে ক্রল করতে সক্ষম হবে না। কয়েকটি পৃষ্ঠা অ্যাক্সেস করা কোনওরকম ক্ষতি হওয়ার সম্ভাবনা নেই।
স্টিফেন অসটারমিলার

উত্তর:


6

ওয়েব কন্টেন্ট পরিবেশন করার জন্য বহুল ব্যবহৃত দুটি অপারেটিং সিস্টেম ফাইল সিস্টেমের ডিফল্টরূপে URL গুলি সংবেদনশীলতার জন্য খুব আলাদা সেটিংস রয়েছে settings আপনার ইউআরএলগুলি কেস সংবেদনশীল কিনা তা সম্ভবত আপনি কোনও ফাংশন ব্যবহার করছেন যা:

আমার মতে, কোনও ডিফল্টই আদর্শ নয়:

  • মূলধন নির্বিশেষে একই বিষয়বস্তু প্রদর্শন করা আপনার ওয়েবসাইটকে ক্রল করা আরও শক্ত করে তোলে। অনুসন্ধান ইঞ্জিনগুলি একাধিক URL এ একই সামগ্রীটিকে সদৃশ সামগ্রী হিসাবে বিবেচনা করে।
  • ভুল মূলধনের জন্য ত্রুটি পৃষ্ঠাগুলি প্রদর্শন করা ব্যবহারকারী বান্ধব নয়। টাইপ করার সময় ব্যবহারকারীরা সাধারণত মূলধনের বিষয়ে সচেতন হন না।

আদর্শ সমাধানটি কেবল তখনই URL টি প্রদর্শিত হবে যখন ইউআরএল সঠিকভাবে মূলধন হয়। ভুল মূলধনের জন্য ব্যবহারকারীর পছন্দসই মূলধনটিতে 301 পুনর্নির্দেশ করা উচিত। এটি সম্পাদন করার কয়েকটি উপায় রয়েছে:


1
আমি অনুভব করি যে এটি ইউনিক্স পরিবেশে আমাদের যে কেস সংবেদনশীলতার পূর্ববর্তী স্ট্যান্ডার্ড থেকে ডস এবং উইন্ডোজ বিচ্যুত তার একটি নিদর্শন।
সূর্য

1
ফাইল সিস্টেমের মানচিত্রের অনুরোধের জন্য অ্যাপাচি কেস-সংবেদনশীল কিনা তা অ্যাপাচি নিজেই নয়, অন্তর্নিহিত ফাইল সিস্টেমের উপর নির্ভরশীল। যদি উইন্ডোজে অ্যাপাচি চালানো হয় তবে অনুরোধ করা /iNdEx.HtMlবা /InDeX.hTmlউভয়ই ফিরে আসবে /index.html( /index.htmlফাইল সিস্টেমে এটি একটি ফিজিকাল ফাইল সরবরাহ করে)।
মিঃ হোয়াইট

1
আসলে, আইআইএসের ক্ষেত্রে এটি একই রকম মনে হবে ।
মিঃ হোয়েট

1
ঠিক আছে, আইআইএস সর্বদা উইন্ডোজে (এএফআইএকে) চালিত হয়, সুতরাং ফাইল সিস্টেমের অনুরোধগুলি সর্বদা ক্ষেত্রে সংবেদনশীল হবে না। তবে, অনেকগুলি সাইট কোনও একরকম ফ্রন্ট কন্ট্রোলারের মাধ্যমে ইউআরএলগুলি রুট (পুনর্লিখন) করবে - এক্ষেত্রে অনুরোধটি সম্ভবত ফাইল সিস্টেমের কোনও ফিজিক্যাল ফাইলে মানচিত্র দেয় না এবং তাই URL সম্ভবত কেস-সংবেদনশীল (যদি না অ্যাপ্লিকেশন নির্দিষ্টভাবে এটি কেস করে তোলে) -সংবেদনশীল) - যা মূলত অ্যাপাচি (উইন্ডোজ চলাকালীন) এর সমান। (?)
মিঃ হোয়েট

2
আমি " ইউআরএলগুলি কেস-সংবেদনশীল কেন? " সম্পর্কিত সাম্প্রতিক / ব্যস্ত প্রশ্ন নিয়ে গবেষণা করতে গিয়ে আমি এখানে আসলে হোঁচট খেয়েছি । দেখে মনে হয় যে "আইআইএস কেস-সংবেদনশীল" এর মত বাক্যাংশগুলি (এটি অন্যান্য থ্রেডে বেশ কয়েকবার উল্লেখ করা হয়েছে) এতটাই বিস্তৃত যে সাধারণ বিশ্বাস বলে মনে হয় যে আইআইএসের ইউআরএলগুলি সর্বদা ক্ষেত্রে সংবেদনশীল না - কমপক্ষে আমি যে ধারণাটি পেয়ে যাচ্ছিলাম তা - যা ছিল এটি মোটেও প্রদর্শিত হবে না।
মিঃহাইট

4

সংরক্ষণাগারভিত লাইভ চ্যাট সেশন থেকে গুগলের অবস্থান এখানে (লিঙ্কটি এখন মারা গেছে):

* ইউআরএলগুলির অসামঞ্জস্য মূলধনটি নকল বিষয়বস্তু সংক্রান্ত সমস্যা এবং পৃষ্ঠা র‌্যাঙ্ককে হ্রাস করতে পারে? উদাহরণস্বরূপ www.site.com/abc বনাম www.site.com/Abc। উইন্ডোজ হোস্টগুলিতে, এটি একই পৃষ্ঠা, তবে ইউনিক্স হোস্টের বিভিন্ন পৃষ্ঠা।

জনমু: হাই জন, বিদ্যমান মানগুলির ভিত্তিতে, ইউআরএলগুলি কেস-সংবেদনশীল, তাই হ্যাঁ, এগুলি পৃথক ইউআরএল হিসাবে দেখা হবে। যেহেতু ইউআরএলগুলিতে থাকা সামগ্রীগুলি একই, আমরা সাধারণত এটি স্বীকৃত করব এবং কেবল তার মধ্যে একটি রাখব। তবে আমরা আপনাকে সুপারিশ করব যে আপনি সমস্ত লিঙ্ক URL এর একটি সংস্করণে রেখে যাওয়ার চেষ্টা করবেন। মনে রাখবেন যে এটি রোবট.এসটিএসটি ফাইলের ক্ষেত্রেও প্রযোজ্য *

আইই টিম প্রস্তাব দেয় যে একটি ফাইল কেসিং কনভেনশন বেছে নেওয়া এবং এটি কঠোরভাবে মেনে চলার কারণ এটি কার্য সম্পাদনকে উন্নতি করতে পারে।


-2

আরএফসি 3986 6.2.2.1 ইউআরআইগুলি কেস-সংবেদনশীল হিসাবে সংজ্ঞায়িত করে, তাই তাদের ওয়ার্ডপ্রেস.অর্গের মতো কেস-সংবেদনশীল করা ভাল ধারণা নয়।


কিন্তু সেই ফলাফলটি সদৃশ সামগ্রী তৈরি করবে না?

প্রকৃতপক্ষে নয়, কারণ অনুসন্ধান ইঞ্জিনগুলিতেও কেস-সংবেদনশীল কাজ করা উচিত।

আমি মনে করি এখনই প্রশ্নটি কীভাবে অনুসন্ধান ইঞ্জিনগুলি উপরের এবং লোয়ার-কেসড ইউআরএলকে সমতুল্য হিসাবে দেখছে তা খুঁজে বের করবেন? উদাহরণস্বরূপ গুগল নিন: google.com/Doodles এবং google.com/doodles

10
এই আরএফসি কেবলমাত্র ইউআরএল এর তিনটি অংশের ক্ষেত্রে সম্বোধন করে। 1 - প্রোটোকল ( http://) - সংবেদনশীল, নিম্ন কেসিকে স্বাভাবিক করুন। 2 - হোস্টের নাম ( example.com) - সংবেদনশীল, ছোট কেসের ক্ষেত্রে স্বাভাবিক করুন। ৩. শতাংশ এনকোডেড অক্ষর ( %3F) - সংবেদনশীল ক্ষেত্রে, আপার কেসকে স্বাভাবিক করুন। বাকি ইউআরএলটি সাধারণত কেস সংবেদনশীল
স্টিফেন অস্টারমিলার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.