উইন্ডোজ 10 এ স্পার্ক ইনস্টল করার এবং অজগর থেকে চালানোর জন্য এখানে সাতটি ধাপ রয়েছে:
পদক্ষেপ 1: এই লিঙ্কটি থেকে যেকোন ফোল্ডারে স্পার্ক 2.2.0 টার (টেপ সংরক্ষণাগার) জিজেডিজ ফাইল ডাউনলোড করুন - https://spark.apache.org/downloads.html । এটি আনজিপ করুন এবং আনজিপড ফোল্ডারটি কাঙ্ক্ষিত ফোল্ডার এ অনুলিপি করুন the
স্পার্ক ফোল্ডারে যাওয়ার পথটি সি: \ ব্যবহারকারীদের ডেস্কটপ \ এ \ স্পার্ক হতে দিন
পদক্ষেপ 2: এই লিঙ্কটি থেকে একই ফোল্ডারে এফ থেকে হার্ডওপ ২..3.৩ টার জিজেড ফাইলটি ডাউনলোড করুন - https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.3/hadoop-2.7 .3.tar.gz । এটিকে আনজিপ করুন এবং আনজিপড ফোল্ডারটিকে একই ফোল্ডারে কপি করুন Had ফোল্ডারের নামটির নাম হ্যাডোপ -২...৩.আরটি থেকে হ্যাডুপে নামকরণ করুন। হ্যাডোপ ফোল্ডারে পাথ সি: \ ব্যবহারকারীদের ডেস্কটপ \ এ \ হাদুপ হতে পারে
পদক্ষেপ 3: একটি নতুন নোটপ্যাড পাঠ্য ফাইল তৈরি করুন। এই খালি নোটপ্যাড ফাইলটি winutils.exe হিসাবে সংরক্ষণ করুন (সংরক্ষণ করুন প্রকারের সাথে: সমস্ত ফাইল)। এই ও কেবি winutils.exe ফাইলটি স্পার্কে আপনার বিন ফোল্ডারে অনুলিপি করুন - সি: \ ব্যবহারকারীগণ ডেস্কটপ \ এ \ স্পার্ক \ বিন
পদক্ষেপ 4: এখন, আমাদের সিস্টেমের পরিবেশে এই ফোল্ডারগুলি যুক্ত করতে হবে।
4 এ: একটি সিস্টেম ভেরিয়েবল তৈরি করুন (ব্যবহারকারী ভেরিয়েবল হিসাবে সিস্টেম ভেরিয়েবলের সমস্ত বৈশিষ্ট্য উত্তরাধিকারী হবে না) চলক নাম: স্পার্কহোম পরিবর্তনশীল মান: সি: \ ব্যবহারকারী \ ডেস্কটপ \ এ \ স্পার্ক
পাথ সিস্টেমের পরিবর্তনশীল সন্ধান করুন এবং সম্পাদনা ক্লিক করুন। আপনি একাধিক পাথ দেখতে পাবেন। কোনও পথ মুছে ফেলবেন না। এই পরিবর্তনশীল মানটি যুক্ত করুন - সি: \ ব্যবহারকারী \ ডেস্কটপ \ এ \ স্পার্ক \ বিন
4 বি: একটি সিস্টেম ভেরিয়েবল তৈরি করুন
চলক নাম: HADOOP_Home পরিবর্তনশীল মান: সি: \ ব্যবহারকারী \ ডেস্কটপ \ এ \ হাদুপ
পাথ সিস্টেমের পরিবর্তনশীল সন্ধান করুন এবং সম্পাদনা ক্লিক করুন। এই পরিবর্তনশীল মানটি যুক্ত করুন - সি: \ ব্যবহারকারী \ ডেস্কটপ \ এ \ হাদুপ \ বিন
4 সি: একটি সিস্টেম ভেরিয়েবলের পরিবর্তনশীল নাম তৈরি করুন: জাভা_হোম উইন্ডোগুলিতে জাভা অনুসন্ধান করুন। ডান ক্লিক করুন এবং ওপেন ফাইল অবস্থান ক্লিক করুন। আপনাকে আবার জাভা ফাইলগুলির যে কোনও একটিতে ডান ক্লিক করতে হবে এবং খোলা ফাইলের লোকেশনটিতে ক্লিক করতে হবে। আপনি এই ফোল্ডারের পথটি ব্যবহার করবেন। অথবা আপনি সি: \ প্রোগ্রাম ফাইল \ জাভা সন্ধান করতে পারেন। সিস্টেমে ইনস্টল করা আমার জাভা সংস্করণটি jre1.8.0_131। পরিবর্তনীয় মান: সি: \ প্রোগ্রাম ফাইল \ জাভা \ jre1.8.0_131 \ বিন
পাথ সিস্টেমের পরিবর্তনশীল সন্ধান করুন এবং সম্পাদনা ক্লিক করুন। এই পরিবর্তনশীল মানটি যুক্ত করুন - সি: \ প্রোগ্রাম ফাইল \ জাভা \ jre1.8.0_131 \ বিন
পদক্ষেপ 5: কমান্ড প্রম্পটটি ওপেন করুন এবং আপনার স্পার্ক বিন ফোল্ডারে যান (সিডি সি টাইপ করুন: \ ব্যবহারকারীদের ডেস্কটপ \ এ \ স্পার্ক \ বিন)। স্পার্ক-শেল টাইপ করুন।
C:\Users\Desktop\A\spark\bin>spark-shell
এটি সময় নিতে পারে এবং কিছু সতর্কতা দিতে পারে। শেষ পর্যন্ত, এটি স্পার্ক সংস্করণ ২.২.০ এ স্বাগত জানাবে
পদক্ষেপ:: প্রস্থান টাইপ করুন () বা কমান্ড প্রম্পট পুনরায় চালু করুন এবং আবার স্পার্ক বিন ফোল্ডারে যান go পাইপপার্ক টাইপ করুন:
C:\Users\Desktop\A\spark\bin>pyspark
এটি কিছু সতর্কতা এবং ত্রুটি দেখায় কিন্তু উপেক্ষা করবে। এটা কাজ করে।
পদক্ষেপ 7: আপনার ডাউনলোড সম্পূর্ণ। আপনি যদি পাইথন শেল থেকে সরাসরি স্পার্ক চালাতে চান তবে: আপনার পাইথন ফোল্ডারে স্ক্রিপ্টে যান এবং টাইপ করুন
pip install findspark
কমান্ড প্রম্পটে।
অজগর শেল মধ্যে
import findspark
findspark.init()
প্রয়োজনীয় মডিউলগুলি আমদানি করুন
from pyspark import SparkContext
from pyspark import SparkConf
যদি আপনি ফাইন্ডস্পার্ক আমদানি এবং এটি আরম্ভ করার জন্য পদক্ষেপগুলি এড়িয়ে যেতে চান তবে দয়া করে পাইথন শেলটিতে পাইপার্ক আমদানিতে প্রদত্ত পদ্ধতিটি অনুসরণ করুন