অ্যামাজন রেডশিফট কি o 1XTB ডেটার জন্য হ্যাডোপকে প্রতিস্থাপন করবে?


12

হাদুপ এবং এর ইকো-সিস্টেমকে ঘিরে প্রচুর হাইপ রয়েছে। যাইহোক, অনুশীলনে, যেখানে অনেক ডেটা সেট টেরাবাইট সীমার মধ্যে রয়েছে, হ্যাডোপ ক্লাস্টার তৈরির জন্য সময় এবং প্রচেষ্টা ব্যয় করার চেয়ে বড় ডেটা সেট অনুসন্ধানের জন্য অ্যামাজন রেডশিফ্ট ব্যবহার করা কি আরও যুক্তিসঙ্গত নয় ?

এছাড়াও, অ্যামাজন রেডশিফ্ট কীভাবে সেটআপ জটিলতা, ব্যয় এবং পারফরম্যান্সের সাথে হাদুপের সাথে তুলনা করে?


আপনারা কি হ্যাডোপকে বোঝাচ্ছেন বা ইমপালার মতোই রেডশিফ্টের কোনও নির্দিষ্ট অংশের অর্থ?
শন ওউন

আমার প্রশ্নে @ সীনওউইন, আমি অ্যাপাচি হাদুপকে উল্লেখ করছি। যদিও এটি ইম্পালাকে তুলনা করা আকর্ষণীয় হবে।
ত্রিভুজবাদ

উত্তর:


12

tl; dr: এগুলি অনেক দিক থেকে উল্লেখযোগ্যভাবে পৃথক হয়েছে এবং আমি ভাবতে পারি না যে রেডশিফ্ট হাদুপকে প্রতিস্থাপন করবে।

- ফাংশন
আপনি রেডশিফটে এসকিউএল ব্যতীত অন্য কিছু চালাতে পারবেন না। সম্ভবত সবচেয়ে গুরুত্বপূর্ণ, আপনি রেডশিফ্টে কোনও ধরণের কাস্টম ফাংশন পরিচালনা করতে পারবেন না। হ্যাডোপে আপনি অনেকগুলি ভাষা (জাভা, পাইথন, রুবি .. আপনি এটির নাম দিয়ে) ব্যবহার করতে পারেন। উদাহরণস্বরূপ, হ্যাডোপে এনএলপি সহজ, যদিও এটি রেডশিফ্টে কমবেশি অসম্ভব। অর্থাৎ হ্যাডুপে আপনি প্রচুর কাজ করতে পারেন তবে রেডশিফটে নয়। এটি সম্ভবত সবচেয়ে গুরুত্বপূর্ণ পার্থক্য।

-
রেডশিফ্টে পারফরম্যান্স প্রোফাইল কোয়েরি এক্সিকিউশন হডোপের চেয়ে বেশিরভাগ ক্ষেত্রে উল্লেখযোগ্যভাবে বেশি দক্ষ। যাইহোক, এই দক্ষতা সূচক থেকে আসে যা ডেটা লোড লোড করার সময় করা হয় রেডশিফ্টে (আমি indexingএখানে শব্দটি খুব আলগাভাবে ব্যবহার করছি )। অতএব, আপনি যদি একবার আপনার ডেটা লোড করেন এবং একাধিক ক্যুরিয়াস চালিত করেন তবে এটি দুর্দান্ত but

-কাস্ট প্রোফাইল
যা সমাধানে ব্যয় জিততে পারে তা পরিস্থিতিটির (পারফরম্যান্সের মতো) উপর নির্ভর করে, তবে হ্যাডোপ (আরও নির্দিষ্টভাবে অ্যামাজনের ইলাস্টিক ম্যাপ হ্রাস) এর চেয়ে সস্তা করার জন্য আপনার সম্ভবত বেশ কয়েকটি প্রশ্নের প্রয়োজন। উদাহরণস্বরূপ, আপনি যদি ওএলএপ করছেন তবে খুব সম্ভবত রেডশিফ্ট সস্তার বাইরে আসবে। আপনি যদি প্রতিদিন ব্যাচের ইটিএল করেন তবে হ্যাডোপ সস্তার বাইরে আসার সম্ভাবনা বেশি।

এটি বলার পরে, আমরা আমাদের ইটিএলের একটি অংশ প্রতিস্থাপন করেছি যা হাইভে টু রেডশিফ্টে করা হয়েছিল এবং এটি একটি দুর্দান্ত অভিজ্ঞতা ছিল; বেশিরভাগ ক্ষেত্রে উন্নয়নের স্বাচ্ছন্দ্যের জন্য। রেডশিফ্টের ক্যোয়ারী ইঞ্জিন পোস্টগ্র্রেএসকিউএল ভিত্তিক এবং হাইভের তুলনায় খুব পরিপক্ক। এর এসিডি বৈশিষ্ট্যগুলি এটি সম্পর্কে তর্ক করা সহজ করে তোলে এবং দ্রুত প্রতিক্রিয়া সময় আরও পরীক্ষা করার অনুমতি দেয়। এটি থাকার একটি দুর্দান্ত সরঞ্জাম তবে এটি হাদুপকে প্রতিস্থাপন করবে না।

সম্পাদনা : সেটআপ জটিলতার জন্য, আমি এমনকি এও বলতে পারি যে আপনি যদি ডাব্লুএস এর ইএমআর ব্যবহার করেন তবে হ্যাডোপের সাথে এটি আরও সহজ। তাদের সরঞ্জামগুলি এত পরিপক্ক যে আপনার হ্যাডোপ কাজ চালানো হাস্যকর বিষয়। রেডশিফ্টের ক্রিয়াকলাপের আশেপাশে থাকা সরঞ্জামগুলি এবং প্রক্রিয়াগুলি এখনও এটি পরিপক্ক নয়। উদাহরণস্বরূপ, রেডশিফ্ট ট্রিকল লোডিং পরিচালনা করতে পারে না এবং এইভাবে আপনাকে এমন কিছু নিয়ে আসতে হবে যা ঘুরিয়ে দেওয়া লোডে রূপান্তরিত করে, যা আপনার ইটিএলটিতে কিছুটা জটিলতা যুক্ত করতে পারে।


2
easier to develop because of Redshift's maturityএর সাথে বিরোধী Redshift isn't that mature yetতাই আপনার রায় কী?
এম মিম্পেন

@ এম মিম্পেন: আরও নির্দিষ্ট হওয়ার জন্য সম্পাদিত উত্তর
এন্নো শিজিজি

5

অ্যামাজন রেডশিফ্টের জন্য বর্তমান আকারের সীমাটি 128 নোড বা সংক্ষেপিত ডেটার 2 পিবি। সংক্ষিপ্ত হতে পারে যদিও সার্কা 6 পিবি সংক্ষেপিত হতে পারে তবে মাইলেজ সংকোচনের জন্য পরিবর্তিত হয়। আপনার আরও বেশি প্রয়োজন থাকলে আপনি আমাদের সর্বদা জানাতে পারেন। অনুরাগ @ অউজ (আমি অ্যামাজন রেডশিফ্ট এবং অ্যামাজন ইএমআর চালাই)


3

ব্যক্তিগতভাবে, আমি মনে করি না হ্যাডোপ ক্লাস্টার স্থাপন করা এতটা কঠিন, তবে আমি জানি যে আপনি যখন শুরু করেন তখন কখনও কখনও এটি বেদনাদায়ক হয়।

এইচডিএফএস আকারের সীমাবদ্ধতাগুলি একটি টিবি ছাড়িয়ে গেছে (বা আপনি কী বোঝাতে চেয়েছিলেন?) আমি যদি ভুল না করি তবে এটি যোটাবাইট বা অন্য কোনও পরিমাপের স্কেল করে যা আমি এমনকি শব্দটি জানি না। এটি যাই হোক না কেন, এটি সত্যিই বড়।

রেডশিফ্টের মতো সরঞ্জামগুলির স্থান রয়েছে তবে আমি সবসময় বিক্রেতার নির্দিষ্ট সমাধানগুলি নিয়ে চিন্তিত। আমার প্রধান উদ্বেগ সর্বদা "যখন আমি তাদের পরিষেবাতে অসন্তুষ্ট হই তখন আমি কী করব?" - আমি গুগলে যেতে পারি এবং আমার বিশ্লেষণের কাজগুলিকে তাদের দৃষ্টান্তে স্থানান্তর করতে পারি বা আমি হ্যাডুপে যেতে পারি এবং সেই একই কাজটিকে সেই সিস্টেমে স্থানান্তর করতে পারি। যেভাবেই হোক, আমাকে নতুন কিছু শিখতে হবে এবং জিনিসগুলিকে অনুবাদ করার জন্য প্রচুর কাজ করতে হবে।

বলা হচ্ছে, একটি ডেটাসেট আপলোড করতে এবং দ্রুত কাজ করতে সক্ষম হওয়ায় খুব ভাল লাগছে - বিশেষত যদি আমি যা করছি তা যদি একটি সংক্ষিপ্ত জীবনচক্র থাকে। তথ্য সুরক্ষা সমস্যার উত্তর দেওয়ার জন্য অ্যামাজন ভাল কাজ করেছে।

আপনি যদি হ্যাডোপ এড়াতে চান তবে সর্বদা একটি বিকল্প থাকবে। এটি একবার চালিয়ে যাওয়ার সাথে সাথে কাজ করা এতটা কঠিন নয়।


3
আমি ধরে নিয়েছি যে টিবিতে ওপি'র রেফারেন্সটির অর্থ "আপনি হ্যাডোপ কী ব্যবহার করতে পারেন তার ছোট প্রান্তের ডেটার জন্য"। আপনার যদি একাধিক পেটাবাইট বা তার বেশি থাকে তবে রেডশিফ্ট স্পষ্টভাবে উপযুক্ত নয়। (আমি বিশ্বাস করি এটি একশত 16
টিবি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.