আমার সাইটটি ক্রল করার জন্য ভাল সরঞ্জাম এবং আমাকে মৃত লিঙ্ক এবং লিঙ্কযুক্ত লিঙ্কগুলি [বন্ধ] খুঁজে পেতে সহায়তা করুন


21

আক্ষরিক সহস্রাধিক পিডিএফ সহ আমার একটি বিশাল বড় লিগ্যাসি সাইট রয়েছে যা কখনও কখনও ডাটাবেসে অ্যাকাউন্ট করে থাকে তবে প্রায়শই কেবল পৃষ্ঠায় লিঙ্ক থাকে এবং সাইটের বেশিরভাগ ডিরেক্টরিতে সঞ্চিত থাকে।

আমি আমার সাইটের সমস্ত লিঙ্কগুলি অনুসরণ করার জন্য একটি পিএইচপি ক্রলার লিখেছি এবং তারপরে আমি এটির সাথে ডিরেক্টরি কাঠামোর ডাম্পের সাথে তুলনা করছি, তবে কি আরও সহজ কিছু আছে?


এছাড়াও ওয়েবমাস্টার্স.স্ট্যাকেক্সচেঞ্জ / প্রশ্নগুলি / 13310/… যিনি বানান-পরীক্ষা সম্পর্কে জিজ্ঞাসা করেন সেগুলিও দেখুন ।
জেমস স্কেম্প

উত্তর:


15

আমি জেনুর লিঙ্ক স্লুথ ব্যবহার করেছি । এটি বেশ ভালভাবে কাজ করে, কেবল নিজের ডস না করার বিষয়ে নিশ্চিত হন!


1
বিকল্পগুলিতে 'অরফান ফাইল' বিকল্পটি পরীক্ষা করুন এবং এটি আপনাকে আপনার সাইটে একটি এফটিপি লগিনের জন্য অনুরোধ করবে।
27 এ পেলস

এই হ্যান্ডেল সাইটগুলিতে কি আপনাকে পৃষ্ঠায় পেতে লগইন করতে হবে?
ডনি ভি।

@ জিম আমি কীভাবে দেখতে পাচ্ছি যে ভাঙা লিঙ্কটি কী পৃষ্ঠায় রয়েছে?
রব

ক্রলটি সম্পূর্ণ হয়ে গেলে একটি প্রতিবেদন আসে যা আপনাকে তথ্য জানাবে। সাইটের আকার এবং ভাঙা লিঙ্কের সংখ্যার উপর নির্ভর করে পার্স করা শক্ত হতে পারে। আমি সাধারণত ক্রল করার আগে রিপোর্টিং বিকল্পগুলি সামঞ্জস্য করি এবং আমি প্রতিবেদনটি একটি পাঠ্য ফাইল (যেহেতু এটি .htm) হিসাবে খোলাম এবং এটিকে আরও পরিচালিত করার জন্য প্রাসঙ্গিক নয় এমন সামগ্রীটি মুছুন। আশাকরি এটা সাহায্য করবে.
প্ল্যান্টেক্সট করুন

6

আপনি যদি উইন্ডোজ 7 ব্যবহার করছেন তবে সেরা সরঞ্জামটি হ'ল আইআইএস 7 এর এসইও টুলকিট 1.0। এটি নিখরচায় এবং আপনি এটি বিনামূল্যে ডাউনলোড করতে পারেন।

সরঞ্জামটি কোনও সাইট স্ক্যান করবে এবং আপনাকে জানাবে যে সমস্ত মৃত লিঙ্কগুলি কোথায় আছে, কোন পৃষ্ঠাগুলি লোড হতে দীর্ঘ সময় নিতে পারে, কোন পৃষ্ঠাগুলিতে শিরোনাম, সদৃশ শিরোনাম, কীওয়ার্ড এবং বর্ণনার জন্য একই রয়েছে এবং কী পৃষ্ঠাগুলি এইচটিএমএল ভঙ্গ করেছে।


1
আমি এটি ব্যক্তিগতভাবে ব্যবহার করেছি এবং এটি স্ক্যানিং এবং অবশ্যই এসইওর জন্য দুর্দান্ত, তবে জেনুতে এফটিপি চেকটি কেবল এটিকেই প্রান্তিক করে তুলছে।
মিঃচ্রিস্টার


1

বড় স্ট্যাটিক সাইটগুলির লিঙ্কচেকিংয়ের জন্য আমি লিঙ্কলিন্টের একটি বড় অনুরাগী , যদি আপনার চারপাশে ইউনিক্স কমান্ড লাইন থাকে (আমি লিনাক্স, ম্যাকোএস এবং ফ্রিবিএসডি ব্যবহার করেছি)। ইনস্টলেশন নির্দেশাবলীর জন্য তাদের সাইট দেখুন। একবার ইনস্টল হয়ে গেলে, আমি ডেকে একটি ফাইল তৈরি করি check.llএবং করি:

linklint @check.ll

আমার চেক.ল ফাইলটি দেখতে কেমন তা এখানে Here

# linklint
-doc .
-delay 0
-http
-htmlonly
-limit 4000
-net
-host www.example.com
-timeout 10

এটি একটি ক্রল করে www.example.comএবং কি ভাঙা, অনুপস্থিত ইত্যাদির জন্য ক্রস-রেফারেন্সড রিপোর্ট সহ HTML ফাইলগুলি তৈরি করে files


1

মাইক্রোসিসের বেশ কয়েকটি পণ্য রয়েছে , বিশেষত তাদের এ 1 সাইটম্যাপ জেনারেটর এবং এ 1 ওয়েবসাইট বিশ্লেষক যা আপনার ওয়েবসাইটকে ক্রল করবে এবং আপনি সম্ভবত এটি সম্পর্কে কল্পনা করতে পারেন এমন সমস্ত কিছু প্রতিবেদন করবে।

এতে ভাঙা লিঙ্কগুলি অন্তর্ভুক্ত রয়েছে তবে আপনার সমস্ত পৃষ্ঠাগুলির একটি সারণী দর্শনও রয়েছে যাতে আপনি অভিন্ন <শিরোনাম> এবং মেটা বিবরণ ট্যাগ, নোফলো লিঙ্কগুলি, ওয়েবপৃষ্ঠাগুলিতে মেটা নয়েন্ডেক্স এবং পুরো রোগের জন্য তুলনা করতে পারেন যা কেবল তীক্ষ্ণ চোখের প্রয়োজন এবং একটি দ্রুত হাত ঠিক করতে।


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.