হাদুপ অর্থ হ'ল এইচডিএফএস, ইয়ার্ন, ম্যাপ্রেডুস এবং অন্যান্য অনেকগুলি জিনিস। আপনার অর্থ স্পার্ক বনাম মানচিত্রের ? কারণ স্পার্ক হ্যাডোপ / এর সাথে চলে, যা মূলত এটি।
স্পার্ক ব্যবহারের প্রাথমিক কারণটি গতির জন্য এবং এ থেকে আসে যে এর প্রয়োগের ফলে মানচিত্র বা হ্রাসের পরে সবসময় এইচডিএফএসে ফিরে না থেকে বরং পর্যায়গুলির মধ্যে মেমরিতে ডেটা রাখতে পারে। এই সুবিধাটি পুনরাবৃত্ত গণনাগুলির জন্য খুব উচ্চারণযুক্ত, যার দশক পর্যায় রয়েছে যার প্রত্যেকটিতে একই ডেটা স্পর্শ করা হয়। এখানেই জিনিসগুলি "100x" দ্রুত হতে পারে। সহজ, এক-পাসের ইটিএল-মতো চাকরির জন্য, যার জন্য মানচিত্রের নকশা করা হয়েছিল, এটি সাধারণভাবে দ্রুত হয় না।
স্পার্ক ব্যবহারের আর একটি কারণ হ'ল মানচিত্রের তুলনায় এটি সর্বোত্তম উচ্চ-স্তরের ভাষা is এটি একটি কার্যকরী প্রোগ্রামিং-এর মতো ভিউ সরবরাহ করে যা স্কালাকে নকল করে, যা মানচিত্রের কোড লেখার চেয়ে আরও সুন্দর। (যদিও আপনাকে হয় স্ক্যালাল ব্যবহার করতে হবে, বা স্পার্কের জন্য সামান্য-স্বল্প-বিকাশযুক্ত জাভা বা পাইথন এপিআই গ্রহণ করতে হবে)। ক্রাঞ্চ এবং ক্যাসকেডিং ইতিমধ্যে ম্যাপ্রেডস শীর্ষে অনুরূপ বিমূর্ততা সরবরাহ করে, তবে এটি এখনও এমন একটি জায়গা যেখানে স্পার্কটি দুর্দান্ত।
অবশেষে স্পার্কের এমএল, গ্রাফ বিশ্লেষণ এবং স্ট্রিমিংয়ের জন্য অল্প বয়সে তবে প্রতিশ্রুতিবদ্ধ সাবপ্রজেক্ট রয়েছে যা একটি অনুরূপ, সুসংগত API প্রকাশ করে। ম্যাপ্রেডস সহ, আপনাকে এর জন্য আরও কয়েকটি অন্যান্য প্রকল্পে যেতে হবে (মাহাউট, জিরাফ, ঝড়)। এটি একটি প্যাকেজে রাখা ভাল, যদিও এখনও 'বেকড' হয়নি।
আপনি কেন স্পার্ক ব্যবহার করবেন না? paraphrasing আমিঃ
- স্পার্ক মূলত স্কেল, পোর্ট করা জাভা এপিআই সহ; জাভা-ভিত্তিক বিকাশকারীদের জন্য ম্যাপ্রেইডুস বন্ধুবান্ধব এবং আরও বেশি স্থানীয় হতে পারে
- স্পার্কের চেয়ে এখন সেখানে আরও বেশি মানচিত্রের দক্ষতা রয়েছে
- ডেটা সমান্তরাল, এক-পাস, ETL- এর মতো কাজের জন্য ম্যাপ্রেডিউস ডিজাইন করা হয়েছিল, ম্যাপ্রেডস স্পার্কের সমতুলের তুলনায় হালকা ওজনযুক্ত
- স্পার্ক মোটামুটি পরিপক্ক, এবং এখনই ইয়ার্নও রয়েছে, তবে স্পার্ক-অন-ইয়ার্ন এখনও বেশ নতুন। দু'জন এখনও সর্বোত্তমভাবে সংহত না হতে পারে। উদাহরণস্বরূপ সাম্প্রতিক অবধি আমি মনে করি না যে স্পার্ক কর সংখ্যার ভিত্তিতে ইয়ার্নকে বরাদ্দের জন্য জিজ্ঞাসা করতে পারে? এটি হ'ল: মানচিত্রের বোঝা, পরিচালনা এবং টিউন করা আরও সহজ হতে পারে