বিশাল ডেটা স্ট্রিমগুলিতে কাজ করে এমন কি কার্যকরী অ্যালগরিদম রয়েছে এবং তাদের ফলাফলগুলি মোটামুটি ছোট এবং কেউ কোনওভাবে তাদের ফলাফলগুলি মার্জ করে দুটি স্ট্রিমের মিশ্রণের জন্য ফলাফলটি গণনা করতে পারে?
আমি কয়েকটি নাম রাখতে পারি:
- সুস্পষ্ট জিনিস যেমন যোগফল, সর্বনিম্ন, সর্বোচ্চ, গণনা, শীর্ষ-কে ইত্যাদি-
- পৃথক আইটেম গণনা বা কোয়ান্টাইলগুলি গণনা করে হিস্টোগ্রামগুলির জন্য আনুমানিক তথাকথিত "স্কেচ-ভিত্তিক" স্ট্রিম অ্যালগরিদমগুলি
অন্যরা কী আছে?
(আমি আগ্রহী কারণ আমি বিতরণ ব্যবস্থাগুলি পর্যবেক্ষণের জন্য একটি শখের প্রকল্প লিখছি যার দরকারীতা যেমন অ্যালগোরিদমের উপযোগিতা দ্বারা সরাসরি নির্ধারিত হয়)