স্পার্কে আইপিথন / জুপিটারের সাথে ইস্যু করুন (অচেনা নাম)


11

আমি বাইরে বেরোনোর ​​আগে এবং কিছু হার্ডওয়্যার দিয়ে একটি ক্লাস্টার গড়ে তুলতে অর্থ ব্যয় করার আগে স্পার্কের সাথে পরীক্ষার জন্য ভিএমগুলির একটি সেট স্থাপনের কাজ করছি। তাত্ক্ষণিক দ্রষ্টব্য: আমি প্রয়োগকৃত মেশিন লার্নিংয়ের ব্যাকগ্রাউন্ড সহ একাডেমিক এবং ডেটা সায়েন্সে কিছুটা ছেড়ে দিয়ে কাজ করি। আমি কম্পিউটিংয়ের জন্য সরঞ্জামগুলি ব্যবহার করি, খুব কমই আমার সেগুলি সেটআপ করা দরকার।

আমি 3 টি ভিএম (1 মাস্টার, 2 ক্রীতদাস) তৈরি করেছি এবং স্পার্কটি সফলভাবে ইনস্টল করেছি। সবকিছু যেমনটি করা উচিত তেমন কাজ করছে বলে মনে হয়। আমার সমস্যা জুপিটার সার্ভার তৈরির মধ্যে রয়েছে যা ক্লাস্টারের কোনও মেশিনে চলছে না এমন ব্রাউজার থেকে সংযুক্ত হতে পারে।

আমি জপিটার নোটবুক সফলভাবে ইনস্টল করেছি ... এবং এটি চলে। আমি স্পার্কের সাথে একটি রিমোট সার্ভারের সাথে সংযোগ স্থাপন করে একটি নতুন আইপিথন প্রোফাইল যুক্ত করেছি ।

এখন সমস্যা

আদেশ

$ ipython --profile=pyspark সূক্ষ্মভাবে চলে এবং এটি স্পার্ক ক্লাস্টারের সাথে সংযুক্ত হয়। যাহোক,

$ ipython notebook --profile=pyspark [<stuff is here>] Unrecognized alias: "profile=pyspark", it will probably have no effect. defaultপ্রোফাইল ডিফল্ট প্রোফাইল নয় pyspark

এর জন্য আমার নোটবুক কনফিগারেশনটি pysparkরয়েছে:

c = get_config() c.NotebookApp.ip = '*' c.NotebookApp.open_browser = False c.NotebookApp.port = 8880 c.NotebookApp.server_extensions.append('ipyparallel.nbextension') c.NotebookApp.password = u'some password is here'


এটি কি হতে পারে যে নিম্নলিখিতগুলি কাজ করবে? $ ipython --profile=pyspark notebook? এটি হতে পারে যে সমস্যাটি কেবল যুক্তিগুলির ক্রম দিয়েই হয়েছিল।
গ্যাবার বকোস

উত্তর:


12

আইপিথন এখন version.০ সংস্করণে চলে গেছে , যার অর্থ আপনি যদি এটি ব্যবহার করে থাকেন তবে এটির কনফিগারেশনটি পড়বে ~/.jupyter, নয় ~/.ipython। আপনাকে একটি নতুন কনফিগারেশন ফাইল তৈরি করতে হবে

jupyter notebook --generate-config

এবং তারপরে ~/.jupyter/jupyter_notebook_config.pyআপনার প্রয়োজন অনুসারে ফলাফল ফাইলটি সম্পাদনা করুন ।

আরও ইনস্টলেশন নির্দেশাবলী এখানে


আমি প্রায়শই ভাবতাম যে তারা আইপথন থেকে জুপিটারকে বিভক্ত করার ক্ষেত্রে আইপথন নোটবুক কমান্ডটি কেন ধরে রেখেছে? কেন এটি সত্যিই বিভ্রান্তিকর হয় ঠিক এই কারণেই। প্রোফাইল মেলে না দেখানোর জন্য আপনাকে এবং কৌ zsh ধন্যবাদ। আইপিথন নোটবুক কমান্ড ব্যবহার করার সময় এবং আইপিথন নোটবুক প্রোফাইলটি ব্যবহার করার সময় তাদের আইপিথন প্রোফাইলটি ব্যবহার করা উচিত almost
AN6U5

4

ধরে নিন আপনার কনফিগার ফাইলটি ~ / .ipython / প্রোফাইল_pyspark / ipython_notebook_config.py, আপনি এখনও এই কনফিগার ফাইলটি ব্যবহার করতে পারেন:

ipython notebook --config='~/.ipython/profile_pyspark/ipython_notebook_config.py'

অথবা

jupyter-notebook --config='~/.ipython/profile_pyspark/ipython_notebook_config.py'

1

সমস্যাটি হ'ল পাইপপার্ক ডিফল্টরূপে ওএস সিস্টে নেই। এটি আমার কনফিগারেশন ফাইল / পাথ / ইত্যাদিতে ম্যানুয়ালি যুক্ত করার ব্যর্থ প্রচেষ্টার পরে আমি ফাইন্ডস্পার্ক নামে এই গিটহাবের সংগ্রহস্থল জুড়ে এসেছি।

https://github.com/minrk/findspark

আমি গিট ক্লোন https://github.com/minrk/findspark.git ব্যবহার করে এই সংগ্রহস্থলটি ক্লোন করেছি

তারপরে ফাইন্ডস্পার্ক মূল থেকে "পাইপ ইনস্টল ফাইন্ডস্পার্ক" চালিয়েছি।

একটি জুপিটার নোটবুক শুরু করেছে, একটি নতুন পাইথন 3 নোটবুক তৈরি করেছে এবং যুক্ত করা হয়েছে

আমদানি ফাইস্পার্ক
আমদানি ওএস সন্ধান
স্পার.কিনেট ()
আমদানি পাইপার্ক এসসি
= পাইপার্ক.স্পার্ককন্টেক্সট ()

Findspark.init () এর আগে, পিএসপার্ক আমদানি করে একটি ত্রুটি নিয়ে ফিরে এসেছিল।

পরীক্ষার জন্য আমি কেবল
এসসি টাইপ করেছি এবং ফিরে এসেছি : pyspark.context.SparkContext এ 0x4526d30

সব এখন আমার জন্য কাজ।


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.