কোনও ওয়েব সাইট কোন প্রোগ্রামিংয়ের ভাষা ব্যবহার করে তা জানা সম্ভব?


48

উদাহরণস্বরূপ, stackexchange.comসাইটের মালিক বা গুগলকে ওয়েবসাইটটি বিকাশের বিষয়ে তাদের তথ্য না জিজ্ঞাসা করে, শেষের দিকে কোন ভাষাটি ব্যবহৃত হয় তা জানা সম্ভব?

দেখে মনে হচ্ছে, ওয়েবসাইটটিতে কোনও .extensionবার নেই, উদাহরণস্বরূপ .phpএটি নির্দেশিত করতে পারে যা কোনটিতে বিকাশ হয়েছে PHPতবে এক্সটেনশন ছাড়াই কীভাবে আমি তা জানতে পারি?


43
এটি লক্ষ করা উচিত যে ইউআরএল দ্বারা একটি অনুরোধ করা ফাইলের প্রসারণের জন্য সরাসরি ফাইল সিস্টেমের কোনও ফাইলের মানচিত্রের প্রয়োজন হয় না। .phpসি-তে লিখিত কোনও সিজিআই-স্ক্রিপ্ট বা জাভাতে লিখিত কোনও সার্লেটের মতো কোনও এক্সটেনশানটি খুব সহজেই ম্যাপ করা যায় ।
ম্যাপেল_শ্যাফট

1
@ জিরোইন সম্প্রদায় উইকি আপনার প্রস্তাব অনুসারে ব্যবহার করার কথা নয় । আমি জানি এটি সাধারণত অতীতের মতো অত্যাচারিত হয়েছিল, তবে আসুন ভুলে যাওয়ার চেষ্টা করি ...
ইয়ানিস

6
কড়া কথা বলা অসম্ভব। বেশিরভাগ যে কোনও ভাষাই অন্য ভাষা সম্পূর্ণরূপে অনুকরণ করতে পারে - আপনি যে কোনও "টেল টেল" চিহ্ন সন্ধান করতে পারেন সেগুলি সহ।
এমোরি

2
আমার নিষ্পাপ দৃষ্টিকোণ থেকে, আমি এই তথ্যের প্রয়োগ দেখতে পাচ্ছি না। আপনি এই তথ্য দিয়ে কি করবেন?
তেহনিয়ত

5
এছাড়াও, শোষণের জন্য অরক্ষিত সাইটগুলি সন্ধান করা।
এরিক রেপেন

উত্তর:


82

সূচক আছে। কিছু খুঁজে পাওয়া সহজ, অন্যদের আরও শক্ত।

  • ফাইল এক্সটেনশান: .phpইঙ্গিত দেয় যে সাইটটি পিএইচপিতে লেখা আছে, .aspক্লাসিক এএসপি .aspxনির্দেশ করে, .jspএএসপি.এনইটিটি নির্দেশ করে, জাভা জেএসপিগুলিকে নির্দেশ করে, ...
  • কুকির নাম: JSESSIONIDজাভা সার্ভারগুলিতে একটি বহুল ব্যবহৃত কুকির নাম
  • শিরোনাম: কিছু সিস্টেম তাদের প্রতিক্রিয়াগুলিতে HTTP শিরোনাম যুক্ত করে
  • নির্দিষ্ট HTML সামগ্রী:
    • ধ্রুপালের মতো সিএমএস দ্বারা ব্যবহৃত ধারাবাহিক শ্রেণি-নামকরণের স্কিম সহ প্রচুর ডিভ-মোড়কের মতো নিদর্শন।
    • এইচটিএমএলে মন্তব্যগুলি বা মাথায় ট্যাগগুলি সরাসরি / অপ্রত্যক্ষভাবে সরঞ্জামের ব্যবহার নির্দেশ করে
  • ডিফল্ট ত্রুটি বার্তাগুলি বা ত্রুটি পৃষ্ঠা নকশা (উদাহরণস্বরূপ তাদের 404 দেখতে একটি নকল URL পিং করা)
  • কখনও কখনও মন্তব্য ট্যাগগুলি পৃষ্ঠায় সংস্করণ করার উদ্দেশ্যে স্থাপন করা হয় যা একটি ক্লু সরবরাহ করে
  • ...

কিন্তু ঐ সব সরান / পরিবর্তন / ছদ্ম হতে পারে। কিছু অন্যের চেয়ে পরিবর্তন করা সহজ তবে কোনওটিই 100% নির্ভরযোগ্য নয়।

এই সূচকগুলি পরিবর্তন করার বিভিন্ন কারণ রয়েছে:

  • আপনি অন্তর্নিহিত প্রযুক্তি পরিবর্তন করেছেন তবে আপনার ইউআরএলগুলি পরিবর্তন করতে চান না
  • আপনি যতটা সম্ভব আপনার প্রযুক্তি সম্পর্কে কম তথ্য দিতে চান
  • (পূর্বের সাথে সম্পর্কিত) যখন প্ল্যাটফর্ম-বিস্তৃত দুর্বলতাগুলি সনাক্ত / প্রচারিত হবে তখন আপনি স্ক্রিপ্ট কিডি বাসের প্রথম স্টপ না হয়ে চাইবেন
  • আপনি "ইন" (এমনকি 'যদিও এর অর্থ বর্তমানে এক্সটেনশন-কম REST- স্টাইল URL রয়েছে) দেখতে চাই।
  • ...

11
পিএইচপি সমতুল্য JSESSIONIDহয় PHPSESSID
ইয়ানিস

6
বিশ্লেষণটি করার জন্য সেখানে অনেকগুলি সরঞ্জাম রয়েছে, উদাহরণস্বরূপ wappalyzer.com
ব্যবহারকারী 123444555621

1
একটি জ্যাঙ্গো সাইটে সবেমাত্র ওয়াপ্যালিজার পরীক্ষা করা হয়েছিল - এটি কেবলমাত্র জ্যাকুয়ারি এবং গুগল অ্যানালিটিক্সকে সনাক্ত করেছিল। এবং ইন-হাউস ফ্রেমওয়ার্ক সহ পিএইচপি সাইট, যেখানে এটি কিছুই আবিষ্কার করেনি।
ভের্টেক

আমার নিজের উত্তর যুক্ত করতে খুব পুরাতন। আমি এইচটিএমএল প্যাটার্নগুলিও যুক্ত করব (বিশেষত সিএমএসগুলি ধারাবাহিকভাবে নামযুক্ত ক্লাসগুলির সাথে প্রচুর আবর্জনার মোড়ক যুক্ত করে) এবং প্রচুর (বেশিরভাগ কৃপণ) সরঞ্জামগুলি ঘোষণা করতে চাই যে তারা মেটা ট্যাগগুলিতে ব্যবহৃত হয়েছে (এছাড়াও মন্তব্যগুলি, তবে এটি উল্লেখ করা হয়েছিল)।
এরিক রেপেন

1
@ ওপ, আমি স্বয়ংক্রিয় সিস্টেমে কী ব্যবহার করছে তা চেষ্টা করার এবং সাজানোর প্রথম উপায় হিসাবে অবশ্যই সেশন কুকিজকে লক্ষ্য করব। এটি এমন একটি বিষয় যা কম স্পষ্ট ফ্রেমওয়ার্কগুলি ধারাবাহিকভাবে প্রদর্শিত হতে পারে তবে যেমন বলা হয়েছে, কিছুই 100% নির্ভরযোগ্য নয়।
এরিক রেপেন

8

ঠিক আছে, সেখানে মানব.txt ফাইল রয়েছে যা কোনও বিকাশকারী ডোমেনে রাখতে পারেন যা সাইটের বিকাশ সম্পর্কে কিছু তথ্য দেয়, সম্ভবত এটি কে কাজ করেছে এবং কোন মানক বা সরঞ্জাম ব্যবহার করা হয়েছিল। যদি তারা আপনার কাছে এই ধরণের তথ্য সম্পর্কে জানতে চান তবে তারা তা এখানে রেখে দিতে পারে। তবে অন্য যে কোনও কিছুর মতো এটি isচ্ছিক তাই এটি আপনাকে অবহিত করার গ্যারান্টি দিতে পারে না। পরীক্ষা করে দেখুন humans.text


4

না, ওয়েবমাস্টার প্রকাশ করতে না চাইলে এটি অসম্ভব না হলেও শক্ত হতে পারে। কয়েকটি ফ্রেমওয়ার্কের কয়েকটি বৈশিষ্ট্য রয়েছে তবে সেগুলি লুকানো যেতে পারে।

  • ফাইল এক্সটেনশান: মানকগুলি ব্যবহারের কোনও আসল কারণ নেই এবং বেশিরভাগ আধুনিক এমভিসিগুলি যেভাবেই ইউআরএল রাউটিং ব্যবহার করে। সুতরাং সাইটটি কিছু সময়ের জন্য না থাকলে আপনি সম্ভবত কোনও দেখতে পাচ্ছেন না (যেমন স্ট্যাকেক্সচেঞ্জ .aspxএক্সটেনশন ব্যবহার করে না );

  • সেশন আইডি: উদাহরণস্বরূপ PHPSESSIDপিএইচপি এর জন্য ডিফল্ট, তবে সহজেই ওভাররাইড করা যায় ;

  • ওয়েব সার্ভার এবং স্ক্রিপ্টিং ভাষার সংস্করণ সহ শিরোনাম: বন্ধ বা এমনকি নকল হতে পারে ।

স্টাফ যা লুকানো শক্ত:

  • পিএইচপি সংযোজন করে একই কোয়েরি স্ট্রিং পরিবর্তনশীল জন্য একাধিক মান পরিচালনা []নাম, এইভাবে আপনার মত কিছু দেখতে চাই: ...?var[]=1&var[]=3&...। আফাইক, এটি একমাত্র ওয়েব কাঠামো যা এভাবে পরিচালনা করে।

আপনি কি পিএইচপি কে একটি ওয়েব কাঠামো বলছেন? এটি আরও একটি টুরিং-সম্পূর্ণ ভাষা যা ওয়েব-
স্টাফের

@ ফিফ: অন্য কোনও ভাষায় পার্সিং কোয়েরি স্ট্রিং ওয়েব কাঠামোর অংশ। এমনকি রাসমাস লেয়ার্ডর্ফ পিএইচপিকে একটি ওয়েব কাঠামো হিসাবে বিবেচনা করে। আপনি লেখক ভাল জানেন?
ভের্টেক

প্রাথমিকভাবে তাঁর মনে এটি ছিল তবে আমি মনে করি পিএইচপি আজ আরও অনেক কিছু করতে পারে। নির্ভুলতার জন্য, আমি পিএইচপিটিকে একটি ওয়েব কাঠামো বলব না। সেক্ষেত্রে কেকপিএইচপি, কোডাইনাইটার ইত্যাদি কি? ওয়েব কাঠামোর ওয়েব ফ্রেমওয়ার্ক? :)
সাকিস্ক

1
আমি আপনার বক্তব্য না। পিএইচপি হ'ল এমন একটি ভাষা যা ভাষায় এম্বেড থাকা ওয়েব ফ্রেমওয়ার্কের মূল কার্যকারিতা থাকে। এর মোকাবেলা কর.
ভের্টেক

4

সংক্ষেপে: আপনি ব্যাক-এন্ডে কোন ভাষাটি ব্যবহার করছেন তা লুকিয়ে রাখা সম্ভব । তুচ্ছ উদাহরণ: একটি "হ্যালো ওয়ার্ল্ড" পৃষ্ঠা বিবেচনা করুন; ব্যাক-এন্ডে ফ্রেমওয়ার্ক / ভাষাটি কী ব্যবহৃত হচ্ছে তা নির্ধারণ করা অত্যন্ত কঠিন হবে (ধরে নিই যে সেশন কুকিজগুলি ম্যানুয়ালি সেট করা আছে বা ব্যবহৃত হচ্ছে না এমন মৌলিক জিনিসগুলি ধরে নেওয়া)।

তবে ফ্রেমওয়ার্কের মূল বিষয় হ'ল আপনাকে কার্যকারিতা পুনরায় প্রয়োগ করতে হবে এবং আপনাকে একটি মানসম্মত উপায়ে কাজ করাতে হবে। প্রায় সমস্ত ফ্রেমওয়ার্কগুলিতে তাদের নির্দিষ্ট সামান্য বলার-কাহিনী রয়েছে যা আপনি যদি যথেষ্ট পরিমাণে দেখেন তবে তা এগুলি দেয়। অন্যরা যেমন উল্লেখ করেছে, কনফিগারেশন ব্যবহার করে বা বিভিন্ন মানক বৈশিষ্ট্য পুনরায় প্রয়োগ করে এগুলি আড়াল করার চেষ্টা করা সম্ভব। তবুও, আমি যুক্তি দিয়েছি যে বড় সাইটের জন্য, সমস্ত কিছু পুরোপুরি আড়াল করা অত্যন্ত কঠিন হবে এবং আপনি যদি এটি সম্পাদন করেন তবেও আপনি আপনার কাঠামোর খুব সামান্য ব্যবহার করবেন d

সংক্ষেপে, আমি বলব যে নীচে কী ব্যবহার করা হচ্ছে সে সম্পর্কে খুব ভাল ধারণা পাওয়া প্রায় সর্বদা সম্ভব (কিছু যত্নশীল পরীক্ষা ও উত্থানের সাথে)। ব্যবহৃত কাঠামোটি গোপন করা সম্ভব, তবে দ্রুত বড় সাইটের পক্ষে অনিবার্য হয়ে ওঠে।

পূর্ববর্তী উত্তরগুলির ফ্রেমওয়ার্ক এবং ভাষাগুলির বিভিন্ন টেল-টেলগুলির কয়েকটি ভাল উদাহরণ রয়েছে। আমি যুক্ত করতে চাই যে বিভিন্ন ভিউ ইঞ্জিনগুলির নির্দিষ্ট শ্বেতস্পেস-সম্পর্কিত আচরণ রয়েছে যা তাদের সনাক্ত করতে ব্যবহার করা যেতে পারে। এমভিসি 3 + তে ব্যবহৃত রেজার ইঞ্জিনটিতে কিছুটা নির্দিষ্ট সুনির্দিষ্ট কায়ার্ক রয়েছে যা সন্দেহ সনাক্ত করতে বা কমপক্ষে সন্দেহভাজনদের তালিকা সংকুচিত করতে পারে (আবার, আপনি এটি সাইড-স্টেপ করতে পারেন, তবে, আপনি কি এটি ব্যবহার করছেন?)।


4

আমি জানি না এটি নির্দিষ্টভাবে আপনার প্রশ্নের উত্তর দেয় কিনা তবে একটি সরঞ্জাম রয়েছে যা আমার পক্ষে সত্যিই সহায়ক ছিল: ওয়াপ্পলিজার । এটি একটি ফায়ারফক্স / ক্রোম এক্সটেনশন যা ওয়েবসাইটে ব্যবহৃত প্রযুক্তি উদ্ঘাটন করে। এটি কন্টেন্ট ম্যানেজমেন্ট সিস্টেম, ওয়েব সার্ভার, জাভাস্ক্রিপ্ট ফ্রেমওয়ার্ক, বিশ্লেষণ সরঞ্জাম এবং অন্যান্য অনেকগুলি সনাক্ত করে। আমি জানি আপনি যা খুঁজছেন তা সুনির্দিষ্টভাবে নয় তবে এটি আপনাকে কোনও সাইট কী ব্যবহার করে তার খুব ঘনিষ্ঠ ধারণা দেয়। এটি প্রোগ্রামার্স.স্ট্যাকেক্সেক্সঞ্জ ডটকমের জন্য এটি দেখায়

Wappalyzer


হ্যাঁ, আমি আমার ব্লগটি পরিদর্শন করেছি এবং এটি অ্যাপাচি 2 / পিএইচপি 5.5.9 বলছে, তবে আমি নিশ্চিত যে এটি আপনার নিজের এএসপি.নেট এমভিসি ব্লগটি রোল করেছে, কারণ আমি এটি তৈরি করেছি। কারণ ট্রলিংয়ের কারণে আমি পিএইচপি-তে 'এক্স-পাওয়ার-বাই: এএসপি.এনইটি' রেসপন্স শিরোনাম পরিবর্তন করেছি।
লার্স

1

এমনভাবে কোনও সাইট লেখা সম্ভব, সার্ভার প্রযুক্তি সম্পর্কে কোনও ক্লুটি ক্লায়েন্টের কাছে দৃশ্যমান হবে না।

যাইহোক, যখন কেউ জাভা- জন্য আইসফ্রিজের মতো কিছু ফ্রেমওয়ার্ক ব্যবহার করেন, তখন এটি করা কার্যত অসম্ভব কারণ আপনি নিজের অনুরোধে এরকম কিছু দেখতে পাবেন:

ice.submit.partial=true&ice.session=c4f4jxT36tM_38848488&ice.view=3&ice.focus=&rand=0.322803445

অন্যান্য ফ্রেমওয়ার্কগুলির বেশিরভাগ পৃষ্ঠার বডি বা অনুরোধ / প্রতিক্রিয়াগুলিতে তাদের বৈশিষ্ট্যযুক্ত স্ট্যাম্প রয়েছে। এগুলি, গুগল সন্ধান করুন এবং আপনার কাছে একটি উত্তর থাকবে।

তবে, প্রতিটি ভাষায়, আপনি যদি স্ক্র্যাচ থেকে এইচটিএমএল তৈরি করতে চান (জাভা বিশ্বে উদাহরণটি বেগের টেম্পলেটগুলি হবে) বা খাঁটি AJAX উপায় বেছে নিন, যেখানে সার্ভার কেবল JSON বার্তা ফেরত / গ্রহণ করে এবং ক্লায়েন্ট পুরোপুরি জাভাস্ক্রিপ্টে রয়েছে - একটি শক্ত উপায় , যতক্ষণ না আপনি ছাপানো ব্যতিক্রম ঘটায় যা প্রযুক্তিটির অধীনে প্রকাশ করে।


0

যে সাইটগুলিতে পূর্ণ-বিকাশযুক্ত কাঠামো বা সিএমএস ব্যবহার করা হয় আপনি কখনও কখনও অ্যাডমিন পৃষ্ঠাটি জিজ্ঞাসা করার চেষ্টা করতে পারেন, আপনাকে একটি লগইন বাক্স উপস্থাপন করা হবে এবং এটি কোন ফ্রেমওয়ার্ক থেকে এসেছে তা সনাক্ত করতে পারবেন কারণ বেশিরভাগ লোক অ্যাডমিন টেমপ্লেটটি পুনরায় রাখেন না। উদাহরণস্বরূপ যদি আপনার সাইটটি উদাহরণ.কম হয়, উদাহরণে / অ্যাডমিন/ বা উদাহরণ.com/wp-admin/ (ওয়ার্ডপ্রেস) এ যাওয়ার চেষ্টা করুন।



-5

না, ওয়েব পৃষ্ঠার উত্স কোড দেখে এবং ভাষার অস্তিত্ব অনুসন্ধান করে ওয়েবসাইটগুলিতে ব্যবহৃত ভাষা খুঁজে পাওয়া সম্ভব নয়। উচ্চ সুরক্ষা সরবরাহ করতে ওয়েবসাইট তৈরির জন্য একাধিক ভাষার ব্যবহারের কারণে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.