wayback
ইউআরএলগুলি যেভাবে ফর্ম্যাট করা হয়েছে তা নীচে রয়েছে:
http://$BASEURL/$TIMESTAMP/$TARGET
এখানে BASEURL
সাধারণত হয় http://web.archive.org/web
(আমি প্রায়শই বলি যে আমি যদি নিশ্চিত না তবে এটি কেবলমাত্র বেসেল URL)
TARGET
স্ব বর্ণনামূলক (আপনার ক্ষেত্রে http://nature.com
, বা কিছু অনুরূপ URL)
TIMESTAMP
হয় YYYYmmddHHMMss
যখন ক্যাপচার (ইউটিসি মধ্যে) তৈরি করা হয়েছিল:
YYYY
: বছর
mm
: মাস (2 ডিজিট - 01 থেকে 12)
dd
: মাসের দিন (2 ডিজিট - 01 থেকে 31)
HH
: ঘন্টা (2 ডিজিট - 00 থেকে 23)
MM
: মিনিট (2 ডিজিট - 00 থেকে 59)
ss
: দ্বিতীয় (2 ডিজিট - 00 থেকে 59)
যদি আপনি ক্যাপচারের সময়টির অস্তিত্ব না থাকার জন্য অনুরোধ করেন তবে ওয়েবেব্যাক মেশিনটি ভবিষ্যতে বা অতীতের হোক না কেন সেই URL এর নিকটতম ক্যাপচারে পুনর্নির্দেশ করে।
ইউআরএলগুলির সেট পেতে প্রতিটি দৈনিক ইউআরএল curl -I
(HTTP HEAD
) ব্যবহার করে আপনি সেই বৈশিষ্ট্যটি ব্যবহার করতে পারেন :
BASEURL='http://web.archive.org/web'
TARGET="SET_THIS"
START=1325419200 # Jan 1 2012 12:00:00 UTC (Noon)
END=1356998400 # Tue Jan 1 00:00:00 UTC 2013
if uname -s |grep -q 'Darwin' ; then
DATECMD="date -u '+%Y%m%d%H%M%S' -r "
elif uname -s |grep -q 'Linux'; then
DATECMD="date -u +%Y%m%d%H%M%S -d @"
fi
while [[ $START -lt $END ]]; do
TIMESTAMP=$(${DATECMD}$START)
REDIRECT="$(curl -sI "$BASEURL/$TIMESTAMP/$TARGET" |awk '/^Location/ {print $2}')"
if [[ -z "$REDIRECT" ]]; then
echo "$BASEURL/$TIMESTAMP/$TARGET"
else
echo $REDIRECT
fi
START=$((START + 86400)) # add 24 hours
done
এটি আপনাকে 2012 এর প্রতিটি দিন দুপুরের সবচেয়ে কাছের ইউআরএলগুলি দেয়। কেবলমাত্র সদৃশগুলি সরিয়ে ফেলুন, এবং পৃষ্ঠাগুলি ডাউনলোড করুন।
দ্রষ্টব্য: REDIRECT
ভবিষ্যতে যদি 1 দিনের বেশি ইউআরএল থাকে তবে উপরের স্ক্রিপ্টটি সম্ভবত আরও এগিয়ে যেতে পারে তবে তার জন্য প্রত্যাবর্তিত ইউআরএল ডিকনস্ট্রাক্ট START
করা এবং সঠিক তারিখের মানের সাথে সামঞ্জস্য করা দরকার।