অ্যাপাচি স্পার্ক: পাইথন 3 এর সাথে কীভাবে পিসপার্ক ব্যবহার করবেন


95

আমি জিএইচ ডেভলপমেন্ট মাস্টারের কাছ থেকে স্পার্ক 1.4 তৈরি করেছি এবং বিল্ডটি জরিমানা পেরিয়েছে। তবে আমি যখন একটি bin/pysparkকরি তখন পাইথন ২.7.৯ সংস্করণ পাই। আমি কীভাবে এটি পরিবর্তন করতে পারি?


7
যেভাবে এটি করতে হয় তার জন্য যে কেউ খুঁজছেন: PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pysparkযার ক্ষেত্রে এটি আইপিথন 3 নোটবুক চালায়।
tchakravarty

উত্তর:


145

পরিবেশের পরিবর্তনশীল সেট করুন:

export PYSPARK_PYTHON=python3

আপনি যদি এটি স্থায়ী পরিবর্তন হতে চান তবে এই লাইনটিকে পাইপর্ক স্ক্রিপ্টে যুক্ত করুন।


পরিবেশের ভেরিয়েবলগুলি / etc / প্রোফাইলের অধীনে সম্পাদনা করা যেতে পারে। প্রোফাইল সংরক্ষণের পরে "উত্স / ইত্যাদি / প্রোফাইল" চালানো ভুলবেন না, যাতে পরিবর্তনগুলি তাত্ক্ষণিকভাবে কার্যকর করা যেতে পারে।
ফাইটিসিস্ট

4
স্পষ্টতই, export PYSPARK_PYTHON=python3.5পাইথন 3.5 এর জন্য ব্যবহার করুন
ফাইটিসিস্ট

4
এটা তোলে এটি জুড়তে ভালো $SPARK_HOME/conf/spark-env.shতাই spark-submitপাশাপাশি একই অনুবাদক ব্যবহার করে।
ফ্লো 2 কে

@ ফ্লো 2 কে এটি একটি ভাল ধারণা। Tnx
মোহাম্মদ রাওফনিয়া

32
PYSPARK_PYTHON=python3 
./bin/pyspark

আপনি যদি আইপিথন নোটবুকে চালনা করতে চান তবে লিখুন:

PYSPARK_PYTHON=python3 
PYSPARK_DRIVER_PYTHON=ipython 
PYSPARK_DRIVER_PYTHON_OPTS="notebook" 
./bin/pyspark

যদি python3অ্যাক্সেসযোগ্য না হয় তবে তার পরিবর্তে আপনাকে এটিকে পাথ করতে হবে।

মনে রাখবেন যে বর্তমান ডকুমেন্টেশনের (1.4.1 হিসাবে) পুরানো নির্দেশ রয়েছে। ভাগ্যক্রমে, এটি প্যাচ করা হয়েছে


4
আমি মনে করি আইপিথন নোটবুকের জন্য আপনার আদেশটি সঠিক নয়। এর মতো হওয়া উচিত: পিওয়াইএসপিআরপি_পায়থন = পাইথন 3 পিওয়াইএসপিআর_ড্রাইভারপাইথন = আইপথন ৩ পিওয়াইএসপিআরডিআরআইভিআরপিওথন_ওপিটিস = "নোটবুক" ।/bin/pyspark
স্পাইডারিকো

টার্মিনালে @ ক্রিসনিয়েলসন
পাইওটর মিগডাল

@ ক্রিসনিয়েলস লিনাক্সে বা ওএস এক্স হল একটি টার্মিনাল / কনসোল। এটি কীভাবে উইন্ডোজের অধীনে কাজ করে সে সম্পর্কে আমার ধারণা নেই (যখন উইন্ডোজে, আমি কেবল একটি ডকারের ধারকটিতে স্পার্ক ব্যবহার করি)।
পাইটর মিগডাল

@ স্পাইডাররিকো এগুলি আমার ম্যাকটিতে কাজ করছে বলে মনে হয় না। জুপিটার নোটবুকটি স্পার্কের জন্য কাজ করতে, নিম্নলিখিতটি ব্যবহার করুন। পিওয়াইস্পার্ক_পায়থন = পাইথন ৩ পিওয়াইএসপিআর_ড্রাইভার_পাইথন = জিউটার পিওয়াইএসপিআর_ড্রাইভার_পাইথন_অপটিস = "নোটবুক" ।/bin/pyspark
হংক চ্যান

9

1, প্রোফাইল সম্পাদনা করুন:vim ~/.profile

2, ফাইলটিতে কোড যুক্ত করুন: export PYSPARK_PYTHON=python3

3, কমান্ড কার্যকর করুন: source ~/.profile

4, ./bin/pyspark


4

ফাইলটি দেখুন। শেবাং লাইনটি সম্ভবত সম্ভবত "এনভিনিউ" বাইনারিতে নির্দেশ করা হয়েছে যা প্রথম সামঞ্জস্যপূর্ণ এক্সিকিউটেবলের জন্য পথ সন্ধান করে।

আপনি পাইথনকে পাইথন 3 এ পরিবর্তন করতে পারেন। সরাসরি কোডকৃত পাইথন 3 বাইনারি ব্যবহারের জন্য এনভির পরিবর্তন করুন। অথবা পাইথন 3 দিয়ে বাইনারি সরাসরি চালনা করুন এবং শেবাং লাইনটি বাদ দিন।


4
হ্যাঁ, ফাইলটি অনুসন্ধানে সহায়তা হয়েছে। PYSPARK_PYTHONপরিবেশ পরিবর্তনশীল সেট করা প্রয়োজন ।
tchakravarty

4

জুপিটার নোটবুকের জন্য, spark-env.shকমান্ড লাইন থেকে নীচে প্রদর্শিত ফাইল সম্পাদনা করুন

$ vi $SPARK_HOME/conf/spark-env.sh

ফাইলটির নীচে যান এবং এই লাইনগুলি অনুলিপি করুন

export PYSPARK_PYTHON=python3
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"

তারপরে, নোটবুকে পাইপর্ক শুরু করতে কেবল নিম্নলিখিত কমান্ডটি চালান

$ pyspark
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.