আপনার প্রয়োজনীয়তাটি কল্পনা করুন যে আপনার কাছে তিনটি বিশাল টেবিল (কাঠামোগত ডেটা) রয়েছে যার মধ্যে প্রত্যেকটিতে 30 বিলিয়ন সারি রয়েছে (4TB এর মোট আকার) এবং আপনার বহু যুগ্ম ব্যবহারকারী (যা দূরবর্তী ল্যান মেশিনে সমান্তরাল ওএস থ্রেড) এর একটি অংশ পড়তে হবে তাদের SeleLct যেখানে তথ্যগুলি এবং অতি সমকালীন মাধ্যমে ডেটাগুলি একই সময়ে 10,000 টি সমান্তরাল পাঠ করে এবং ব্যবহারকারীদেরকে এই টেবিলগুলিতে 2000 সাম্প্রতিক লেখকের মতো (সমস্ত ডেটা সেন্টার ল্যান নেটওয়ার্ক জুড়ে) অত্যন্ত সমকালীন তথ্য সন্নিবেশ করা (কোনও আপডেট নেই) বলা দরকার say । ব্যবহারকারীরা এই স্টোরেজটি যত দ্রুত সম্ভব পড়তে এবং সন্নিবেশ করতে চান যেখানে প্রতিটি পড়তে এবং লিখতে এমএস থেকে 1 সেকেন্ডের সীমা হয়।
এই জাতীয় চাহিদা পূরণের জন্য আপনি কোন প্রযুক্তিগুলির পরামর্শ দিচ্ছেন? এমন কোনও ডাটা স্টোরেজ বা কী মানের দোকান রয়েছে যা এটি করতে পারে? মেঘ কোনও বিকল্প নয়।
কিছু স্পষ্টতা:
ব্যবহারকারীদের এখনই ডেটা দেখতে হবে না এবং চূড়ান্ত ধারাবাহিকতা গ্রহণযোগ্য। স্টোরেজ যে কোনও চালক সরবরাহ করতে পারে তার মাধ্যমে ডেটা অ্যাক্সেস করে এবং ব্যবহারকারীরা আবার ডেটা সেন্টারের রিমোট মেশিনে কেবল থ্রেড চালায়। প্রশ্নগুলি বেশিরভাগ গ্রুপের মতো নির্বাচন করুন।
ডেটা সারণী বিন্যাসে এবং প্রতিটি সারিতে প্রায় 60 বাইট হয়।
কোনও মেঘ বিকল্প নেই যেখানে আমি ডায়নামোডিবি বা অনুরূপ সমাধানগুলি ব্যবহার করতে পারি না। ডেটা সেন্টারে আমার অভ্যন্তরীণভাবে এটি হোস্ট করতে সক্ষম হতে হবে।
সারণীর সমস্ত ডেটা সর্বদা পড়তে পারে এবং ব্যবহারের ধরণটি অনির্দেশ্য। এখানে যোগদান বা সুপার দীর্ঘ কোয়েরি নেই। কোনও ডিআর প্রয়োজন নেই তবে যুক্তিসঙ্গত এইচএ প্রয়োজন তবে এটি অভিনব হতে হবে না। প্রতিটি পাঠক সারণীর একটি ব্যাচ পাচ্ছেন তার উপর ভিত্তি করে যেখানে ক্লজ এবং সারিগুলি আসলে সম্পর্কিত নয় bat আমরা সম্ভবত প্রতিটি সারির জন্য নির্দিষ্ট দৈর্ঘ্য রাখতে পারি তবে আমি আশা করছি স্টোরেজ স্তরটি এটি সম্পর্কে চিন্তিত হবে।
এছাড়াও, আমার সবচেয়ে বড় উদ্বেগ হ'ল সেই সমস্ত সমকালীন লেখাগুলি যা সমবর্তী পাঠগুলির সাথে ঘটছে।
এ সম্পর্কে আপনার অন্তর্দৃষ্টি অত্যন্ত প্রশংসা করা হয়।
এবং আরও বড় কথা, আমার কাছে সেই তিনটি টেবিল রয়েছে যার সাথে প্রতি 30 বিলিয়ন সারি বিভিন্ন বস্তুর ধরণের থাকে