অফলাইনে ব্যবহারের জন্য মিডিয়াউইকি কীভাবে ডাম্প করবেন?


16

আমি সাপ্তাহিক ভিত্তিতে মিডিয়াউইকি সাইটের একটি অফলাইন সংস্করণ তৈরি করতে সক্ষম হতে চাই।

DumpHTML এক্সটেনশন আসলে, আমি কি চায় যেমন সব নিবন্ধ এবং মিডিয়া ফাইল ডাম্প, কিন্তু আমি, সমস্ত নিবন্ধ এটা ডাম্প আছে কোন সূচক দেখতে পাচ্ছি না, তাই আমি ডাম্প মধ্যে নেভিগেট করতে পারবেন না।

মিডিয়াউইকির এক্সএমএল ডাম্প বৈশিষ্ট্যটি পড়ার পরে আমি ভাবছি যে এই ফাইলগুলি দেখার জন্য কোনও প্রোগ্রাম ব্যবহার করা বা সম্ভবত এটি এইচটিএমএল রূপান্তর করা সম্ভব হবে কিনা?

অথবা মিডিয়াউইকি সাইটের কোনও অফলাইন সংস্করণ তৈরি করার অন্যান্য উপায় আছে?


আপনার কি সত্যিই একটি সূচক দরকার? কেবল Main Pageএখান থেকে লিঙ্কগুলি শুরু করুন এবং অনুসরণ করুন।
ইলমারি করোনেন

মিডিয়াউইকি সাইটের স্ট্যাটিক সংস্করণ তৈরি করার জন্য ক্যাম ওয়েবের নির্দেশাবলী এখানে । এগুলি আমার নিজস্ব , যদি তারা কাউকে সহায়তা করে। উভয়ই স্থির ফলাফলের লিঙ্ক দেয় ( আমার এখানে )।
মাইকেল অ্যালান

উত্তর:


8

আপনি একটি ওয়েবক্রোলার সরঞ্জাম ব্যবহার করতে পারেন যা এইচটিএমএল ফাইল হিসাবে সাইটের সংরক্ষণ করবে। সমস্ত লিঙ্ক রূপান্তরিত হবে, যাতে আপনি প্রধান পৃষ্ঠাটি খুলতে, বলতে এবং তারপরে লিঙ্কগুলিতে ক্লিক করতে পারেন এবং সমস্ত সাইটে যেতে পারেন।

এই সরঞ্জামগুলির একটি সংখ্যা উপলব্ধ। আমি উইজেট ব্যবহার করি যা কমান্ড লাইন ভিত্তিক এবং এর হাজার হাজার বিকল্প রয়েছে, তাই খুব বন্ধুত্বপূর্ণ নয়। তবে এটি বেশ শক্তিশালী।

উদাহরণস্বরূপ, কমান্ড লাইনটি আমি নিজের মিডিয়াউইকি সাইটটি ডাম্প করার জন্য ব্যবহার করি। আমি আপনাকে প্রতিটি বিকল্প নিজেরাই ব্যবহারের আগে বোঝার পরামর্শ দিচ্ছি:

"c:\program files\wget\wget" -k -p -r -R '*Special*' -R '*Help*' -E http://example.com/wiki

10

আপনি উইকিমিডিয়া ডাম্প সাইট-pages-articles.xml.bz2 থেকে এটি নিতে এবং উইকিট্যাক্সির মাধ্যমে তাদের প্রক্রিয়া করতে পারেন (উপরের বাম কোণে ডাউনলোড করুন)। উইকিট্যাক্সি আমদানি সরঞ্জামটি ফাইলটির বাইরে একটি (উইকিপিডিয়ায় প্রায় 15 জিবি) ফাইল তৈরি করবে । এই ফাইলটি উইকিট্যাক্সি প্রোগ্রাম দ্বারা নিবন্ধগুলির মাধ্যমে অনুসন্ধান করতে ব্যবহৃত হবে। অভিজ্ঞতাটি ব্রাউজারের অভিজ্ঞতার সাথে খুব মিল।.taxi.bz2

অথবা আপনি কিউইক্স ব্যবহার করতে পারবেন , সেটআপ করার জন্য দ্রুত কারণ এটি ইতিমধ্যে প্রক্রিয়াজাত ডাম্পগুলি ( .zimফাইল) সরবরাহ করে। মন্তব্য যেমন কিউইক্সের জন্য অন্যান্য মিডিয়াউইকি সাইটগুলি গ্রহণ করার জন্য নির্দিষ্ট করা হয়েছে mwoffliner, এটি সবার সাথে কাজ করতে পারে না কারণ তাদের নিজস্ব কাস্টম পার্থক্য থাকতে পারে তবে এটি কেবলমাত্র আমিই এসেছি iant

উইকিমিডিয়া স্টাফগুলি সাথে wgetনেওয়া ভাল অভ্যাস নয়। যদি খুব বেশি লোক এটি করতে পারে তবে এটি অনুরোধ সহ সাইটগুলিকে প্লাবিত করতে পারে।


পরে আপনি যে চিত্রগুলি অফলাইনে চান সেটি ক্ষেত্রে সম্পাদনা করুন:

XOWA প্রকল্প

আপনি যদি উইকিপিডিয়ায় একটি সম্পূর্ণ আয়না চান (চিত্রগুলি সহ) সম্পূর্ণ এইচটিএমএল ফর্ম্যাটিং অক্ষত যা 30 ঘন্টা এপ্রোক্সে ডাউনলোড হবে তবে আপনার ব্যবহার করা উচিত:

ইংলিশ উইকিপিডিয়ায় প্রচুর ডেটা রয়েছে। 20.0+ গিগাবাইট পাঠ্য সহ 13.9+ মিলিয়ন পৃষ্ঠা রয়েছে, পাশাপাশি 3.7+ মিলিয়ন থাম্বনেইল রয়েছে।

XOWA :

আপনার কম্পিউটারে এই সমস্ত সেট আপ করা দ্রুত প্রক্রিয়া হবে না ... আমদানিতে নিজেই পাঠ্য সংস্করণের জন্য 80 গিগাবাইটের ডিস্ক স্থান এবং পাঁচ ঘন্টা প্রক্রিয়াকরণের সময় প্রয়োজন। আপনি যদি চিত্রগুলিও চান তবে সংখ্যাটি 100 গিগাবাইটের ডিস্ক স্থান এবং প্রসেসিংয়ের 30 ঘন্টা পর্যন্ত বৃদ্ধি পায়। যাইহোক, আপনি যখন কাজটি সম্পন্ন করবেন, আপনার কাছে ইঙ্গিত উইকিপিডিয়াটির একটি সম্পূর্ণ, সাম্প্রতিক অনুলিপি চিত্রগুলি রয়েছে যা 128 গিগাবাইট এসডি কার্ডে ফিট করতে পারে।

তবে অফলাইন সংস্করণটি অনলাইন সংস্করণের মতো, ফটো ইত্যাদির অন্তর্ভুক্ত: (আমি নিখরচু নিবন্ধটি সম্পূর্ণ অফলাইনে পরীক্ষা করেছি) এখানে চিত্র বর্ণনা লিখুন


পরে সম্পাদনা করুন যদি উপরের কোনওটি প্রয়োগ না করে:

উইকি যদি উইকিমিডিয়ার অংশ না হয় বা ডাম্প না থাকে তবে গিথুব-এ এমন একটি প্রকল্প রয়েছে যা উইকিটিকে তার এপিআই ব্যবহার করে ডাউনলোড করে:

উইকিটাইম - আমরা উইকিপিডিয়া থেকে ক্ষুদ্রতম উইকিগুলিতে সংরক্ষণ করি


1
একটি কাস্টম মিডিয়াউইকি ইনস্টলেশন ডাম্প করার ক্ষেত্রে, XOWA এটি করতে যথেষ্ট সক্ষম (কিছু সমস্যা থাকতে পারে), নিবন্ধের xowa.org/home/wiki/app/Wiki_types/Wikia.com নিবন্ধটি বেশ কার্যকর। কাস্টম উইকিস সঙ্গে Kiwix এর ব্যবহার এখনো পরীক্ষা করা হয় (এক সঙ্গে উইকি ডাম্প করার প্রয়োজনীয়তা github.com/kiwix/mwoffliner বা প্রথম কিছু অন্যান্য সরঞ্জাম)
এসকালেটরে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.