মেশিন লার্নিংয়ের প্রসঙ্গে, এর মধ্যে পার্থক্য কী
- অকার্যকর শেখা
- তদারকি শেখা এবং
- আধা তত্ত্বাবধানে শেখা?
এবং দেখার জন্য প্রধান কয়েকটি অ্যালগরিদমিক পদ্ধতির কী কী?
মেশিন লার্নিংয়ের প্রসঙ্গে, এর মধ্যে পার্থক্য কী
এবং দেখার জন্য প্রধান কয়েকটি অ্যালগরিদমিক পদ্ধতির কী কী?
উত্তর:
সাধারণত, মেশিন লার্নিংয়ের সমস্যাগুলি শ্রেণিবিন্যাস, পূর্বাভাস বা মডেলিংয়ের জন্য ফাংশন অনুমানের প্রকরণ বিবেচনা করা যেতে পারে।
ইন তত্ত্বাবধানে থাকা শেখার এক ইনপুট (সঙ্গে সজ্জিত করা হয় , , ...,) এবং আউটপুট ( , , ...,) এবং একটি ফাংশন যে একটি generalizable ফ্যাশন এই আচরণ পরিমাপক খোঁজার সঙ্গে চ্যালেঞ্জ করছে। আউটপুটটি একটি শ্রেণিবদ্ধ লেবেল (শ্রেণিবদ্ধে) বা একটি আসল সংখ্যা (প্রতিরোধের ক্ষেত্রে) হতে পারে - তদারকি শিক্ষায় এগুলি "তদারকি"।
ক্ষেত্রে তত্ত্বাবধান ছাড়াই লার্নিং , বেস ক্ষেত্রে, আপনি ইনপুট পায় , , ..., কিন্তু কেউই লক্ষ্য আউটপুট, কিংবা তার পরিবেশ থেকে পুরষ্কার প্রদান করা হয়। সমস্যা (শ্রেণিবদ্ধ, বা ভবিষ্যদ্বাণী করা) এবং নমুনাযুক্ত স্থানের আপনার পটভূমি জ্ঞানের ভিত্তিতে আপনি বিভিন্ন পদ্ধতি ব্যবহার করতে পারেন: ঘনত্বের অনুমান (পূর্বাভাসের জন্য কিছু অন্তর্নিহিত পিডিএফ অনুমান করা), কে-মানে ক্লাস্টারিং (লেবেলযুক্ত আসল মূল্যবান ডেটা শ্রেণিবদ্ধকরণ), কে- মোড ক্লাস্টারিং (শিরোনামহীন শ্রেণিবদ্ধ ডেটা শ্রেণিবদ্ধকরণ), ইত্যাদি
আধা-তত্ত্বাবধানে শেখার মধ্যে লেবেলযুক্ত এবং লেবেলযুক্ত ডেটা সম্পর্কিত ফাংশন অনুমান জড়িত। এই পদ্ধতির মাধ্যমে এই বিষয়টি প্রেরণা পায় যে লেবেলযুক্ত ডেটা তৈরি করা প্রায়শই ব্যয়বহুল, যদিও লেবেলযুক্ত ডেটা সাধারণত হয় না। এখানে চ্যালেঞ্জটি বেশিরভাগ ক্ষেত্রে এই ফ্যাশনে মিশ্রিত ডেটা কীভাবে আচরণ করা যায় তার প্রযুক্তিগত প্রশ্ন জড়িত। আধা তত্ত্বাবধানে শেখার পদ্ধতি সম্পর্কে আরও তথ্যের জন্য এই আধা-তত্ত্বাবধানে পড়াশুনা সাহিত্য জরিপটি দেখুন।
লার্নিং এই ধরনের ছাড়াও, সেখানে যেমন অন্যদের হয় শক্তিবৃদ্ধি শেখার যেখানে উৎপাদন কর্মের দ্বারা তার পরিবেশের সঙ্গে লার্নিং পদ্ধতি মিথস্ক্রিয়া , । । .. যা পুরষ্কার বা শাস্তি দেয় , , ...
নিরীক্ষণশিক্ষা
প্রশিক্ষণ দেওয়ার জন্য যখন আপনার কাছে কোনও লেবেলযুক্ত ডেটা উপলব্ধ নেই তখন অসমীক্ষিত শেখা is এর উদাহরণগুলি প্রায়শই ক্লাস্টারিং পদ্ধতি।
তত্ত্বাবধানে পড়াশোনা
এক্ষেত্রে আপনার প্রশিক্ষণের ডেটা লেবেলযুক্ত ডেটার বাইরে রয়েছে। আপনি যে সমস্যাটি এখানে সমাধান করেন তা প্রায়শই লেবেল ছাড়াই ডেটা পয়েন্টের জন্য লেবেলগুলির পূর্বাভাস দেয়।
আধা-তত্ত্বাবধানে পড়াশোনা
এই ক্ষেত্রে লেবেলযুক্ত ডেটা এবং লেবেলযুক্ত ডেটা উভয়ই ব্যবহৃত হয়। উদাহরণস্বরূপ এটি গভীর বিশ্বাস নেটওয়ার্কগুলিতে ব্যবহার করা যেতে পারে, যেখানে কিছু স্তর তথ্যের কাঠামো (আনসারভিজড) শিখছে এবং শ্রেণিবিন্যাস তৈরি করার জন্য একটি স্তর ব্যবহৃত হয় (তদারকি করা ডেটা দিয়ে প্রশিক্ষিত)
আমি মনে করি না যে তত্ত্বাবধানে / নিরীক্ষণ করা এটি সম্পর্কে চিন্তা করার সেরা উপায়। বেসিক ডেটা মাইনিংয়ের জন্য, আপনি কী করার চেষ্টা করছেন সে সম্পর্কে ভাবা ভাল। চারটি প্রধান কাজ রয়েছে:
ভবিষ্যদ্বাণী। যদি আপনি একটি আসল সংখ্যার পূর্বাভাস দিচ্ছেন তবে এটিকে বলা হয় রিগ্রেশন। আপনি যদি একটি পুরো সংখ্যা বা শ্রেণীর পূর্বাভাস দিচ্ছেন তবে এটিকে শ্রেণিবিন্যাস বলা হয়।
মডেলিং। মডেলিং ভবিষ্যদ্বাণী হিসাবে একই, কিন্তু মডেল মানুষের দ্বারা বোধগম্য। নিউরাল নেটওয়ার্ক এবং সমর্থন ভেক্টর মেশিন দুর্দান্ত কাজ করে, তবে বোধগম্য মডেল তৈরি করে না [1]। সিদ্ধান্ত গাছ এবং ক্লাসিক লিনিয়ার রিগ্রেশন হ'ল বোঝা সহজ মডেলগুলির উদাহরণ।
আদল। আপনি যদি বৈশিষ্ট্যের প্রাকৃতিক দলগুলি সন্ধান করার চেষ্টা করছেন তবে এটিকে ফ্যাক্টর বিশ্লেষণ বলা হয়। যদি আপনি পর্যবেক্ষণগুলির প্রাকৃতিক গোষ্ঠীগুলি সন্ধান করার চেষ্টা করছেন তবে এটিকে ক্লাস্টারিং বলা হয়।
সংঘ. এটি অনেকটা পারস্পরিক সম্পর্কের মতো, তবে প্রচুর বাইনারি ডেটাসেটের জন্য।
[1] স্পষ্টতই গোল্ডম্যান শ্যাশ ভবিষ্যদ্বাণী করার জন্য প্রচুর সংখ্যক দুর্দান্ত নিউরাল নেটওয়ার্ক তৈরি করেছিলেন, কিন্তু তখন কেউ তাদের বুঝতে পারেনি, তাই তাদের নিউরাল নেটওয়ার্কগুলি ব্যাখ্যা করার জন্য অন্যান্য প্রোগ্রাম লিখতে হয়েছিল।