আমি @ ওয়ানকিউইটিফুরের উত্তরে লিঙ্কিত লিপিটির লেখক। যদিও আমি পার্টিতে কিছুটা দেরি করেছি, আপনি যে স্ক্রিপ্টটি ব্যবহার করতে পারেন তার একটি পরিবর্তিত সংস্করণ এখানে।
আমি একটি ক্লিকের সাইট পেয়েছি যা এটিও এটি করার দাবি করে তবে আমি এটি কাজ করতে পারিনি। আপনি প্রথম চেষ্টা করতে চান?
পদক্ষেপ 1: একটি টাম্বলার এপিআই কী পান
প্রোগ্রামিং দৃষ্টিকোণ থেকে, সাইটটি স্ক্র্যাপ করার চেষ্টা করার চেয়ে, API ব্যবহার করা অনেক সহজ। এছাড়াও, টাম্বলার টি এন্ড সিএসগুলি API এর মাধ্যমে না গিয়ে বাল্ক অ্যাক্সেসের উপর আপনার উপর চাপ পড়ে।
আপনার এপিআই কী পেতে:
- আপনি টাম্বলারে লগ ইন করেছেন তা নিশ্চিত করুন
- তাদের OAuth নিবন্ধকরণ পৃষ্ঠায় যান ।
"অ্যাপ্লিকেশন নিবন্ধিত করুন" নির্বাচন করুন এবং নিম্নলিখিত বিবরণগুলি ব্যবহার করুন:
- আবেদনের নাম: আমার সমস্ত আসল পোস্টগুলি সন্ধান করুন
- আবেদনের বর্ণনা: কোনও সাইটে সমস্ত মূল পোস্ট সন্ধান করুন; এটি হ'ল পোস্টগুলি যা ওয়েবলগ নয়
- ডিফল্ট কলব্যাক ইউআরএল: /
এটি আপনাকে প্রথম পৃষ্ঠায় ফিরিয়ে নিয়ে যায়। আপনাকে একটি OAuth গ্রাহক কী দেখানো হবে । এটি অনুলিপি করুন - আমরা শীঘ্রই এটি ব্যবহার করব।
পদক্ষেপ 2: স্ক্রিপ্ট সেট আপ করুন
এটি আমার স্ক্রিপ্টের হালকা পরিবর্তিত সংস্করণ। এটি কোনও পাঠ্য সম্পাদক (যেমন টেক্সটএডিট বা নোটপ্যাড) এ অনুলিপি করুন এবং এটি সংরক্ষণ করুন originals.py
।
HOSTNAME
আপনার ব্লগের ইউআরএল, এবং আপনার API_KEY
পদক্ষেপ 1 এ পুনরুদ্ধার করা OAuth গ্রাহক কী দিয়ে ভেরিয়েবলটি প্রতিস্থাপন করা উচিত ।
#!/usr/bin/env python
import json
try:
from urllib.request import urlopen
except ImportError:
from urllib2 import urlopen
HOSTNAME = "alexwlchan.tumblr.com"
API_KEY = "abcdefg"
BASE_URL = (
"http://api.tumblr.com/v2/blog/{hostname}/"
"posts?api_key={key}&reblog_info=true"
) .format(hostname=HOSTNAME,key=API_KEY)
def api_response(url):
req = urlopen(url)
return json.loads(req.read())
jsonresponse = api_response(BASE_URL)
post_count = jsonresponse["response"]["total_posts"]
for count in range(0, post_count, 20):
jsonresponse = api_response("{url}&offset={count}".format(
url=BASE_URL,
count=count))
for post in jsonresponse["response"]["posts"]:
if "reblogged_from_name" not in post:
print(post["post_url"])
print("All finished!")
পদক্ষেপ 3: স্ক্রিপ্টটি চালান
এটি পাইথন স্ক্রিপ্ট যা পাইথন 2 বা 3 এর জন্য উপযুক্ত you আপনি যদি গুগল করেন তবে আপনার পছন্দসই অপারেটিং সিস্টেমের জন্য পাইথন স্ক্রিপ্টগুলি চালনার জন্য নির্দেশাবলী সন্ধান করতে সক্ষম হওয়া উচিত।
স্ক্রিপ্টটি ইউআরএলগুলির একটি তালিকা মুদ্রণ করবে যেখানে এটি টাম্বলার এপিআই থেকে কোনও রিব্লগ তথ্য পায়নি। আমার (খুব সংক্ষিপ্ত) পরীক্ষায় দেখে মনে হয়েছিল যে মুষ্টিমেয় ইউআরএলগুলি যা সত্যই রিব্লগগুলি ছিল তা বেছে নিয়েছি - কেন এটি ঘটেছে তা জানার জন্য আমি কোনও খোঁড়াখুঁজি করি নি।
আনন্দ কর! :-)