বিশাল ডেটাসেট থেকে শিখতে পারা যায়?


10

মূলত, বিশাল ডেটাসেটের বিরুদ্ধে শেখার দুটি সাধারণ উপায় রয়েছে (যখন আপনি সময় / স্থানের বিধিনিষেধের মুখোমুখি হন):

  1. প্রতারণা :) - প্রশিক্ষণের জন্য কেবলমাত্র "পরিচালনযোগ্য" সাবসেট ব্যবহার করুন। হ্রাসকারী রিটার্নের আইনের কারণে নির্ভুলতার ক্ষতি নগণ্য হতে পারে - সমস্ত প্রশিক্ষণের ডেটা এতে অন্তর্ভুক্ত করার আগে মডেলের ভবিষ্যদ্বাণীপূর্ণ অভিনয় প্রায়শই দীর্ঘ হয়ে যায়।
  2. সমান্তরাল কম্পিউটিং - সমস্যাটিকে ছোট ছোট ভাগে ভাগ করুন এবং প্রতিটিকে আলাদা মেশিন / প্রসেসরের মাধ্যমে সমাধান করুন। আপনার যদিও অ্যালগরিদমের সমান্তরাল সংস্করণ দরকার তবে ভাল খবরটি হ'ল প্রচলিত অ্যালগোরিদমগুলি স্বাভাবিকভাবেই সমান্তরাল: নিকটতম-প্রতিবেশী, সিদ্ধান্তের গাছ ইত্যাদি are

অন্য পদ্ধতি আছে? প্রতিটি ব্যবহার করার সময় থাম্বের কোনও নিয়ম আছে? প্রতিটি পদ্ধতির ত্রুটিগুলি কী কী?

উত্তর:


10

স্ট্রিম মাইনিং এর একটি উত্তর। একে বলা হয়:


সম্মত হয়েছেন, MOA সরঞ্জামবক্সটি শুরু করার জন্য একটি ভাল জায়গা হবে
tdc

7

একটি মাত্র সাবসেট ব্যবহার না করে আপনি মিনি ব্যাচ শেখার মতো একাধিক সাবসেট ব্যবহার করতে পারেন (যেমন স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভূত)। এইভাবে আপনি আপনার সমস্ত ডেটা ব্যবহার করবেন।


আহা এটি একটি ভাল বিষয় - আমি প্রশ্নটি পরিষ্কার করে দিয়েছি। আপনি যখন সময় / জায়গার সীমাবদ্ধতার মুখোমুখি হন এবং মিনি-ব্যাচ শেখার "সামর্থ্য" না থাকে তখন আমি একটি দৃশ্যে আগ্রহী।
andreister

1

ব্যাগিং বা ব্লেন্ডিংয়ের মতো পোশাক - কোনও ডেটা নষ্ট হয় না, সমস্যা স্বয়ংক্রিয়ভাবে তুচ্ছভাবে সমান্তরাল হয়ে যায় এবং উল্লেখযোগ্য নির্ভুলতা / দৃ acc়তা লাভ হতে পারে ness

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.