আর্কাইভ.অর্গ বটকে সঠিকভাবে (ডিস) কীভাবে অনুমতি দেওয়া যায়? বিষয়গুলি কি তখন বদলেছে?

10

আমার একটি ওয়েবসাইট রয়েছে যা আমি বেশিরভাগই অনুসন্ধান ইঞ্জিনগুলির দ্বারা সূচীকরণ করতে চাই না, তবে আমি সংরক্ষণাগার.org এ অনন্তকাল ধরে সংরক্ষণ করতে চাই না want সুতরাং আমার robots.txtসাথে এটি শুরু:

User-agent: *
Disallow: /

আজ, আর্কাইভ.অর্গ অনুযায়ী robots.txtতাদের বটগুলিকে অনুমতি দেওয়ার জন্য আমাকে নিম্নলিখিতগুলিতে যুক্ত করতে হবে :

User-agent: ia_archiver
Disallow:

তবে, কয়েক বছর আগে তারা যা ইঙ্গিত করেছিল আমি তা ইতিমধ্যে করেছি, অন্তত আমি নিম্নলিখিতটি যুক্ত করেছি:

User-agent: archive.org_bot
Disallow:

তারপরে আর একটি উত্স দাবি করছে যে আপনাকে উপরের দুটি Disallowগুলি যোগ করতে হবে , এবং আরও একটি:

User-agent: ia_archiver-web.archive.org 
Disallow:

নোট করুন যে আপনি Disallow: /যদি বটটি আপনার সাইট সংরক্ষণাগারভুক্ত করতে না চান তবে আপনাকে রাখতে হবে ।

আইএ বটের সাথে কি কোনও পরিবর্তন হয়েছে? যদি তাই হয়, কখন?

প্রস্তাবিত উপায় কি? আমি কি কেবল তিনটির জন্য এখনই অনুমতি দেব এবং আশা করি যে IA ভবিষ্যতে আবার তাদের বট নাম পরিবর্তন করবে না?

web-crawlers robots.txt internet-archive

— kqw
সূত্র

আমি কেবল ia_archiver সম্পর্কে অবগত ছিলাম। অন্যরা আমার কাছে অবাক। এর জন্য আপনার কি লিঙ্ক আছে? আমি জিজ্ঞাসা করার কারণটি হ'ল আর্কাইভ.আরগ যাইহোক আমার সাইটে যান এবং আইপি ঠিকানার মাধ্যমে আমাকে সেগুলি ব্লক করতে হয়েছিল। এছাড়াও, আপনি এখানে আপনি উল্লেখ না archive.org করার অনুমতি কিন্তু তারপর অবরুদ্ধ সম্পর্কে কথা বলতে চাই। আমি এই বিষয়ে আরও পরিষ্কার হতে চাই এবং লিঙ্কগুলি আমাদের সকলকে সহায়তা করতে পারে। আগাম ধন্যবাদ!

— ক্লোজটনোক

প্রশ্ন আপডেট করেছেন। আশা করি এটি এখন আরও পরিষ্কার হয়ে গেছে। ছোট সংস্করণ: আমি এই সাইটে সার্চ ইঞ্জিনের বট চাই না, আমি আর্কাইভ.অর্গ বটগুলি চাই ots তবে সম্ভবত আমার প্রশ্নটি বিপরীত হওয়া উচিত যেহেতু বেশিরভাগ লোক সন্ধান করছে?

— kqw

প্রকৃতপক্ষে, আপনি যদি এর মধ্যে কোনও ব্যবহার না করেন তবে আপনি সংরক্ষণাগার.অর্গকে এমন অনুমতি দিয়ে যাচ্ছেন যে আপনি একটি কম্বল স্টেটমেন্ট দিয়ে ব্লক করছেন না।

— ক্লোজটনোক

কেবল "ia_archiver" ব্যবহার করে "ia_archiver-web.archive.org" ব্লক করা উচিত, যাতে পরবর্তীকালে অপ্রয়োজনীয় বলে মনে হয় (এই বটটি মান অনুসরণ করে)।

— মিঃ হোয়েট

আপনি কি অ্যাক্সেস লগগুলিতে আইয়া-আর্কিভার (বা আর্কাইভ.অর্গ_বোট) বট দেখতে পাচ্ছেন?

— মিঃহাইট

9

আপডেট : @ কেভিনফিগান মন্তব্যগুলিতে নোট করায় তাদের ডকুমেন্টেশন পরিবর্তন হয়েছে। নীচের অংশে বর্ণনা করা হয়েছে যে কীভাবে ইন্টারনেট সংরক্ষণাগার অতীতে এটি পরিচালনা করেছিল (কমপক্ষে 2014 এ)।

তাদের প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী কীভাবে আমি আমার সাইটের পৃষ্ঠাগুলি ওয়েব্যাক মেশিন থেকে বাদ দিতে পারি? ওয়েবব্যাক মেশিন থেকে নথিগুলি সরানো বোঝায় , যে নথিগুলি যা তাদের বটকে ডাকা হয় ia_archiver।

সুতরাং এই রেকর্ডটি তাদের বটকে আপনার পুরো সাইটের ক্রল করার অনুমতি দেবে:

User-agent: ia_archiver
Disallow:

— unor
সূত্র

দলগুলির ক্রমের বিষয়টি বিবেচনা করা উচিত নয়। সর্বাধিক নির্দিষ্ট (অর্থাত। দীর্ঘতম) ইউজার এজেন্ট যে মিলগুলি জয়ী হয়। *গ্রুপ মিল কেবলমাত্র যখন অন্য কোন গ্রুপ মিলেছে হয়েছে।

— মিঃহাইট

@ ডাব্লু ৩ ডি: আপনি ঠিক বলেছেন, আমি এই অংশটি সরিয়েছি। তথ্যের জন্য ধন্যবাদ :)

— ২or

1

স্পষ্টতই, সময়ের সাথে এটি পরিবর্তিত হয়েছে। আপনার দেওয়া FAQ পৃষ্ঠায় আমি "ia_archiver" খুঁজে পাচ্ছি না , এবং এই আর্কাইভ.org ব্লগ পৃষ্ঠায় 25 এপ্রিল, 2017 থেকে মার্ক গ্রাহাম বলেছেন: "ia_archiver" ব্যবহারকারী এজেন্ট ইন্টারনেট আর্কাইভ নয়, আলেক্সা ইন্টারনেট ব্যবহার করে।

— কেভিন ফেগান

@ কেভিনফিগান: আপনার বিজ্ঞপ্তির জন্য ধন্যবাদ! নামটি থাকা দস্তাবেজের সংরক্ষণাগারভুক্ত সংস্করণগুলিতে লিঙ্ক করার জন্য আমি আমার উত্তর আপডেট করেছি।

— আনোয়ার

আমি পছন্দ করি তারা কীভাবে উদ্দেশ্যমূলকভাবে জিনিসগুলিকে জটিল করে তোলে যাতে তারা পালাতে পারে!

— আলট্রালিস্ক

5

এখানে 2 টি সমস্যা আছে:

উইল robots.txtআপনার সাইটে অননুমোদিত (অবরোধ করুন) আপনার সাইটটিতে ক্রল থেকে Wayback।
উইল ওয়েব্যাক আপনার সাইটের ক্রল করবে।

পয়েন্ট # 1 এর জন্য:
অন্যরা যেমন বলেছেন, রোবটস টেক্সটের জন্য সঠিক প্রবেশিকাটি হ'ল:

User-agent: ia_archiver
Disallow:

মনে রাখবেন যে রোবট.টিএসটিএসটিতে আপনি যে কোনও পরিবর্তন করেছেন সে সম্পর্কে ওয়েব্যাকের জন্য কিছুক্ষণ (সম্ভবত বেশ ভাল সময়) লাগতে পারে।

robots.txtআপনার সাইটে থাকাটি ওয়েবব্যাকটিকে আপনার সাইটটি ক্রল করার অনুমতি দেবে কিনা তা পরীক্ষা করতে :

এই URL- এ যান: https://archive.org/web/
পৃষ্ঠার শীর্ষে থাকা বাক্সে, আপনার সাইটের কোনও পৃষ্ঠার URL লিখুন এবং "Browse History"বোতামটি টিপুন।
অথবা, "এখনই পৃষ্ঠা সংরক্ষণ করুন" এর নীচে বাক্সে (বর্তমানে ডানদিকে নীচে কাছে) এবং আপনার সাইটে একটি পৃষ্ঠার URL লিখুন এবং "Save Page"বোতামটি টিপুন।

এই মুহুর্তে, আপনার 3 টির মধ্যে 1 টি জিনিস দেখতে হবে:

আপনি একটি ত্রুটি বার্তা দেখতে পাবেন যা ওয়েবেবাক সেই সাইটের পৃষ্ঠাগুলি "robots.txt" এর কারণে অ্যাক্সেস করতে পারে না indic
আপনি আপনার সাইটের পৃষ্ঠার জন্য historicalতিহাসিক সংরক্ষণের পয়েন্টগুলির "ক্যালেন্ডার" দেখতে পাবেন। এই ক্ষেত্রে, আপনি জানেন যে ওয়েব্যাক আপনার সাইট ক্রলিং থেকে অবরুদ্ধ নয়।
অথবা, আপনি এমন একটি বার্তা দেখবেন যা ইঙ্গিত করে যে ওয়েব্যাকের সেই পৃষ্ঠাটির সংরক্ষণাগার নেই এবং ওয়েব্যাকটিতে পৃষ্ঠা যুক্ত করার জন্য একটি লিঙ্কে ক্লিক করার অফার রয়েছে। এই ক্ষেত্রে এছাড়াও, আপনি জানেন যে ওয়েব্যাক আপনার সাইট ক্রলিং থেকে অবরুদ্ধ নয়।

এখন, পয়েন্ট # 2 এর জন্য:

উইল Wayback আপনার সাইট ক্রল?

আপনি ওয়েবেব্যাককে আপনার সাইটটি ক্রল করার অনুমতি দেওয়ার কারণে , এর অর্থ এই নয় যে তারা (কখনও) আপনার সাইটটি ক্রল করবে।

ওয়েব্যাক এফএকিউ অনুসারে (জোর দেওয়া)

আমি কীভাবে আমার সাইটটি ওয়েব্যাক মেশিনে অন্তর্ভুক্ত করব?

আমাদের সংরক্ষণাগারভুক্ত ওয়েব ডেটা আমাদের নিজস্ব ক্রল থেকে বা আলেক্সা ইন্টারনেটের ক্রল থেকে আসে। কোনও প্রতিষ্ঠানেরই এখন "আমার সাইট ক্রল করুন!" জমা দেওয়ার প্রক্রিয়া ইন্টারনেট আর্কাইভের ক্রলগুলি এমন সাইটগুলি খুঁজতে থাকে যা অন্যান্য সাইট থেকে ভালভাবে লিঙ্কযুক্ত । আমরা আপনার ওয়েব সাইটটি সন্ধান করার সর্বোত্তম উপায় হ'ল এটি অনলাইনে ডিরেক্টরিতে অন্তর্ভুক্ত রয়েছে এবং এটি আপনার সাথে অনুরূপ / সম্পর্কিত সাইট লিঙ্ক করেছে তা নিশ্চিত করা।

অ্যালেক্সা ইন্টারনেট ক্রল করার জন্য সাইটগুলি আবিষ্কার করতে নিজস্ব পদ্ধতি ব্যবহার করে। নিখরচায় অ্যালেক্সা সরঞ্জামদণ্ডটি ইনস্টল করা এবং আপনি যে সাইটটি ক্রল করতে চান তা সে সম্পর্কে তারা জানে কিনা তা নিশ্চিত করার জন্য এটি সহায়ক হতে পারে।

সাইটটি কে ক্রল করছে তা নির্বিশেষে আপনার অবশ্যই নিশ্চিত হওয়া উচিত যে আপনার সাইটের 'রোবটস.টি.এস.টি.এস.' বিধি এবং ইন-পৃষ্ঠায় মেটা রোবট নির্দেশিকা ক্রলারদের আপনার সাইট এড়াতে বলবে না।

আপডেট: 09-মে-2017

অন্যরা মন্তব্য / উত্তর রেখে গেছে যে ইঙ্গিত দেয় যে আর্কাইভ.অর্গ আর রোবটস.টেক্সটকে সম্মান করে না। সম্ভবত এটি "ওয়ার্ক-ইন-প্রগ্রেস" এবং অবশেষে এটি হবে তবে আমি এই নতুন আচরণটি এখনও দেখিনি।

এটির জন্য মামলাটি এই নিবন্ধটি থেকে আসে বলে মনে হচ্ছে : রোবটস.টেক্সট: রোবটস.টিএক্সটি একটি সুইসাইড নোট দ্বারা archiveteam.org। যদিও পৃষ্ঠাটিতে "রোবটস.টেক্সট" সম্পর্কে ভাল কিছু বলার দরকার থাকলেও এটি কোথাও উল্লেখ করেনি যে আর্কাইভ.অর্গ আর রোবটস.টিএসটি সম্মান করবে না।

আরও লক্ষ করুন: এই নিবন্ধটি হোস্ট করা হয়েছে archiveteam.org, যা অবশ্যই স্পষ্টভাবে নয় archive.orgএবং আমি নিশ্চিত নই যে archive.orgএবং এর মধ্যে কোনও (অফিসিয়াল) সম্পর্ক আছে archiveteam.org।

আসলে, সংরক্ষণাগার টিম সম্পর্কিত এই পৃষ্ঠাটি এবং (জোর দেওয়া যুক্ত) এর মধ্যে একটি পার্থক্য ঘোষণা করেছে বলে মনে হচ্ছে :archive.org archive.orgarchiveteam.org

২০০৯ সালে গঠিত, আর্কাইভ দলটি ( আর্কাইভ.আর্কাইভ -ইট টিমের সাথে বিভ্রান্ত হওয়ার দরকার নেই ) হ'ল ইতিহাস ও ডিজিটাল heritageতিহ্যের স্বার্থে দ্রুত মারা যাওয়া বা মুছে ফেলা ওয়েবসাইটগুলির অনুলিপিগুলি সংরক্ষণ করার জন্য উত্সর্গীকৃত এক দুর্বৃত্ত আর্কাইভিস্ট সমষ্টি। ...

যাই হোক, আমি এই একটি ব্যবহার করে দেখুন দেওয়ার সিদ্ধান্ত নিয়েছেন, এবং আমি যে খুঁজে পাওয়া যায় নি, এই সময়ে অন্তত Archive.org এখনও robots.txt এর সন্মান:

আমি ইবেতে একটি এলোমেলো আইটেম পেয়েছি: আইটেম #: 131795294232
বিক্রয়কৃত আইটেমগুলি দেখতে ক্লিক করুন:

"বিক্রি হওয়া আইটেম" পৃষ্ঠাটি খোলে: http://offer.ebay.com/ws/eBayISAPI.dll?VideBidsLogin&item=131795294232 লিপটি ক্লিপবোর্ডে অনুলিপি করুন।
এতে যান web.archive.org , এবং ইবে থেকে লিঙ্ক আটকে দিন।
আপনি দেখতে পাবেন যে archive.orgইঙ্গিত দেয় যে "পৃষ্ঠাটি রোবটসটিটিএসটির কারণে প্রদর্শিত হতে পারে না।"

সুতরাং, এই সময়ে, আমি অবিস্মরণীয় রয়েছি, তবে আমি ভুল প্রমাণিত হতে চাই ... সত্য যদি এটি হয় তবে দুর্দান্ত।

— কেভিন ফেগান
সূত্র

— রোবটস.টি.এস.টি.টি.

@ ওওয়ার্টওয়ার্ট - এটি যদি দুর্দান্ত হয় তবে তা দুর্দান্ত হবে (আমি আমার উত্তরের সাথে যোগ করা আপডেটটি দেখুন)। আপনার কি এই সম্পর্কে তথ্যের লিঙ্ক আছে?

— কেভিন ফেগান

অবশ্যই: ব্লগ.আরচিভ.আর.জি.আর / ২০১/0 / ০৪ / ১/ / ০ "কয়েক মাস আগে আমরা মার্কিন সরকার এবং সামরিক ওয়েব সাইটগুলিতে রোবটস.টি.এস.টি. ফাইলগুলি উল্লেখ করা বন্ধ করে দিয়েছি (...) আমরা এখন আরও বিস্তৃতভাবে এটি করতে চাইছি। "

— wortwart

4

আপডেট 2017

সংরক্ষণাগার বট এখন আপনার রোবটস টেক্সট সম্পর্কে চিন্তা করে না।

আপনি যদি সত্যিই এটি অবরুদ্ধ করতে চান তবে তাদের এই পৃষ্ঠা অনুসারে একটি ইমেল প্রেরণ করুন বা htaccess এর মাধ্যমে তাদের আইপি ঠিকানাটি ব্লক করুন।

— Goyllo
সূত্র

2

আমার উত্তর মে 2017 আপডেট দেখুন: কিভাবে সঠিকভাবে (অপ) archive.org বট করার অনুমতি ...? । সংরক্ষণাগার বট সরকারী ওয়েবসাইটগুলি বাদে রোবটস.টি.এস.টি. ফাইলটি সম্পর্কে এখনও যত্নশীল। আপনি উল্লিখিত নিবন্ধটি দেখুন www.archiveteam.org থেকে, যা আর্কাইভ.অর্গের সাথে সম্পর্কিত নয়। --->

— কেভিন ফেগান

---> সেই পৃষ্ঠাটিতে "রোবটস.টিএক্সটিএস" সম্পর্কে ভাল কিছু বলার অপেক্ষা রাখে না, তবে এটি কোথাও উল্লেখ করেনি যে আর্কাইভ.অর্গ আর রোবট.টেক্সটকে সম্মান করবে না। সম্পর্কিত আর্কাইভ.অর্গ নিবন্ধটি হ'ল: রোবটস.টেক্সট অনুসন্ধান ইঞ্জিনগুলির জন্য ওয়েব আর্কাইভগুলির পক্ষে ভাল কাজ করে না । "কয়েক মাস আগে আমরা মার্কিন সরকার এবং সামরিক ওয়েব সাইটগুলিতে রোবটস টেক্সট ফাইলগুলি উল্লেখ করা বন্ধ করেছি (...) আমরা এখন আরও বিস্তৃতভাবে এটি করার চেষ্টা করছি।"

— কেভিন ফেগান

হ্যাঁ. এখন সংরক্ষণাগার অপসারণের অনুরোধগুলি সম্পূর্ণ উপেক্ষা করে।

— আলট্রালিস্ক

3

Robots.txt ia_archiver আপনার বর্ণিত প্রয়োজনীয়তার ("" অনন্তকাল ধরে রাখার জন্য "তবে প্রকাশ্যে নয়) এর জন্য" "/" সহ) প্রবেশের অনুমতি বাতিল করুন fine

আমি কেবলমাত্র একটি দ্রুত পরীক্ষা করেছি, কমপক্ষে গত 10 বছর ধরে এমন একটি সাইটের জন্য ia_archiver এন্ট্রিটিকে অস্বীকার করার বিষয়ে মন্তব্য করে। তারপরে আমি আর্কাইভ.আর / ওয়েবে সাইটটি সন্ধান করেছি এবং এটি 2007, ২০০৮, ২০০৯, ২০১১, ২০১২, ২০১৩, ২০১৪, ২০১,, ২০১,, ২০১ and এবং 2017 সালে সংগ্রহ করা গ্রাবগুলি দেখায়! এর অর্থ এই যে আর্কাইভ.অর্গ এই বছরগুলিতে অন্যরা "আর্কাইভ করবেন না" বিবৃতি হিসাবে কঠোরভাবে সম্মান জানায় না, এটি কেবল সংরক্ষণাগারযুক্ত অনুলিপিগুলিই প্রকাশ করে নি।

— মাইক
সূত্র

2

"ia_archiver" এখন (আব) আলেক্সা ব্যবহার করেছেন, কিছু সূত্র বলেছে: 1 , 2 ।
সংরক্ষণাগার.অর্গ এখন (2018) "রোবটস.টেক্সট" এর মোটেও সম্মান করে না। 3 কেবল মিল / সরকারী পৃষ্ঠাগুলির জন্য নয়, সমস্ত পৃষ্ঠার জন্য। আমার নিজস্ব ব্যক্তিগত ওয়েবসাইটের সাথে অভিজ্ঞ হিসাবে, যা ২০১২ সাল থেকে আইআই-কে বাদ দিয়ে রোবটস টেক্সট করেছে এবং রয়েছে; এবং এখন আমি হঠাৎ জানতে পেরেছিলাম যে এটি ক্রল করা হয়েছে এবং তাদের দ্বারা সারা বছর ধরে সংরক্ষণ করা হয়েছে এবং এখন পুরো ইতিহাসটি দৃশ্যমান। বিশ্বাসঘাতকতার অনুভূতি > :-(

— কার্ল
সূত্র

1

আমি robots.txtপদ্ধতিটি চেষ্টা করেছিলাম এবং এটি কার্যকর হয়নি। সুতরাং আমি ওয়েবসাইটটিতে তাদের ইমেল info@archive.org- এ যোগাযোগ করেছি:

হ্যালো,

আপনি দয়া করে আপনার সংরক্ষণাগার থেকে আমার ব্যক্তিগত ওয়েবসাইট dimitarnestorov.com অপসারণ করতে পারেন?

ধন্যবাদ!

Dimitar

এবং আমি নিম্নলিখিত উত্তর পেয়েছি:

হ্যালো,

ইন্টারনেট সংরক্ষণাগার ওয়েওব্যাক মেশিন (ওয়েব.আরচাইভ.অর্গ) থেকে ওয়েবসাইটগুলি বাদ দিতে পারে, তবে আমরা প্রথমে শ্রদ্ধার সাথে অনুরোধ করছি যে আপনি নীচের যে কোনও একটি দ্বারা ডিমিটারনেস্টোরভ.কম এর সাইটের মালিক বা বিষয়বস্তু লেখক তা নিশ্চিত করতে আমাদের সহায়তা করুন:

(দ্রষ্টব্য: এই বিকল্পগুলির মধ্যে কয়েকটি পূর্ববর্তী ওয়াকব্যাক মেশিনের ক্যাপচারে অবস্থিত সামগ্রী এবং / অথবা আপনার নির্দিষ্ট সময়সীমার সাথে সম্পর্কিত ডকুমেন্টেশন সম্পর্কিত তথ্য হতে পারে))

সাইটের বর্তমান সংস্করণে আপনার অনুরোধ পোস্ট করুন (এবং আমাদের একটি লিঙ্ক প্রেরণ করুন)।

সাইটে অনুরোধ করা প্রধান ইমেল যোগাযোগ থেকে আপনার অনুরোধটি প্রেরণ করুন এবং এটি কোথায় অবস্থিত হতে পারে তা আমাদের দেখান (যদি কেউ উপস্থিত থাকেন)

নিবন্ধকের ইমেল (কোনও WHOIS অনুসন্ধানে যদি সর্বজনীনভাবে দেখতে পাওয়া যায় তবে আপনি আমাদের সাথে লিঙ্ক করতে পারেন) বা ওয়েবমাস্টারের ইমেল সাইটে অনুরোধ করুন।

আপনার ব্যক্তিগত তথ্য (নাম, যোগাযোগের স্থান, নিজের চিত্র) এমনভাবে সাইটের দিকে প্রদর্শিত হয় যেখানে আপনাকে সাইটের মালিক হিসাবে বা আপনার বাদ দেওয়া বিষয়বস্তুর লেখক হিসাবে পরিচয় দেয় - এই উদাহরণে আমরা জিজ্ঞাসা করি একটি বৈধ ফটো আইডি স্ক্যানের মাধ্যমে আপনার পরিচয় যাচাই করতে (সংবেদনশীল তথ্য যেমন জন্ম তারিখ, ঠিকানা, বা ফোন নম্বর redacted করা যেতে পারে)।

ডোমেনের মালিক হিসাবে আপনাকে সম্বোধন করা একটি হোস্টিং সংস্থা বা রেজিস্ট্রার থেকে আমাদের কাছে যোগাযোগ ফরোয়ার্ড।

(দ্রষ্টব্য: কারও নাম / ব্যবহারকারীর নাম এবং / অথবা নিজের মধ্যে সাইট / পৃষ্ঠাগুলি / অ্যাকাউন্টগুলির মধ্যে একটি হাইপারলিঙ্ক / পুনঃনির্দেশের সাধারণ উল্লেখ সাধারণত সংরক্ষণাগার বাদ দেওয়া যথেষ্ট নয়))

যদি এই বিকল্পগুলির কোনওটি আপনার কাছে উপলব্ধ না হয় তবে দয়া করে আমাদের এই ইমেলের উত্তরে জানান।

আপনি আমাদের যতটা সম্ভব সংরক্ষণাগারটি সংরক্ষণ করতে সহায়তা করেন তবে আমরা কৃতজ্ঞ হব। অতএব, দয়া করে কেবলমাত্র নির্দিষ্ট ইউআরএল বা ডিরেক্টরি যা আপনার সম্পর্কে উদ্বিগ্ন তা যদি আমাদের জানা থাকে যাতে আমরা বাকী সংরক্ষণাগারগুলি উপলব্ধ রাখতে পারি।

আপনি জানেন যে, ইন্টারনেট সংরক্ষণাগারটি একটি অলাভজনক ডিজিটাল লাইব্রেরি যা ওয়েব্যাক মেশিনের মাধ্যমে ইন্টারনেটের অবাধে অ্যাক্সেসযোগ্য historicalতিহাসিক রেকর্ড বজায় রাখার চেষ্টা করে। বাণিজ্যিক সংরক্ষণের জন্য সংরক্ষণাগারগুলির উপাদানগুলি ইন্টারনেট সংরক্ষণাগার দ্বারা ব্যবহার করা হয় না।

ইন্টারনেট সংরক্ষণাগার দল

আমি wayback-removal-request.htmlনীচের সামগ্রীটি তৈরি করেছি (এমনকি বৈধ এইচটিএমএল নয়):

<p>Hello,</p>

<p>Can you remove my website from the Wayback Machine?</p>

<p>Thanks!</p>
<p>Dimitar</p>

এটি আপলোড করা হয়েছে এবং তাদের ইমেলটিতে উত্তর দেওয়া হয়েছে যে URL থেকে ওয়েবপৃষ্ঠা পাওয়া গেছে এবং পরে আমি নিম্নলিখিত উত্তরটি পেয়েছি:

হ্যালো,

নীচে আপনার ইমেলের রেফারেন্সযুক্ত সাইট / ইউআরএলটি এখন ওয়েভব্যাক মেশিন থেকে http://www.archive.org এ ছাড়িয়ে দেওয়া হয়েছে (সমস্ত অতীত ক্যাপচারের ক্ষেত্রে):

dimitarnestorov.com

প্রক্রিয়াটির স্বয়ংক্রিয় অংশগুলি তাদের কোর্সটি চালানোর জন্য এবং পরিবর্তনগুলি কার্যকর হওয়ার জন্য দয়া করে একদিন অবধি মঞ্জুর করুন।

ইন্টারনেট সংরক্ষণাগার দল

আমি কয়েক ঘন্টা পরে চেক করলে আমার ওয়েবসাইটটি সরানো হয়েছিল।

— দিমিতর নেস্টোরভ
সূত্র