এই প্রশ্নটি একটি সুস্পষ্ট উত্তর পেতে খুব খোলামেলা হতে পারে, তবে আশা করি না।
মেশিন লার্নিং অ্যালগরিদম, যেমন এসভিএম, জিবিএম, র্যান্ডম ফরেস্ট ইত্যাদি, সাধারণত কিছু ফ্রি প্যারামিটার থাকে যা থাম্ব গাইডেন্সের কিছু নিয়মের বাইরেও প্রতিটি ডেটা সেটে সুর করা দরকার। প্যারামিটারগুলির সেটটি সেরা জেনারেলাইজেশন ত্রুটি প্রদান করে যাতে এটি সাধারণত কোনও ধরণের পুনরায় স্যাম্পলিং কৌশল (বুটস্ট্র্যাপ, সিভি ইত্যাদি) দিয়ে সম্পন্ন হয়।
আমার প্রশ্ন, আপনি কি এখানে খুব দূরে যেতে পারেন? লোকেরা গ্রিড অনুসন্ধানগুলি ততক্ষণে করার বিষয়ে কথা বলে, তবে কেন কেবল এটিকে একটি অপ্টিমাইজেশান সমস্যা হিসাবে বিবেচনা করবে না এবং সর্বোত্তম সম্ভাব্য পরামিতিগুলির মধ্যে ড্রিল করবে না কেন? আমি এই প্রশ্নে এর কয়েকটি যান্ত্রিক সম্পর্কে জিজ্ঞাসা করেছি , তবে এটি তেমন মনোযোগ পাচ্ছে না। হয়তো প্রশ্নটি খারাপভাবে জিজ্ঞাসা করা হয়েছিল, তবে সম্ভবত প্রশ্নটি নিজেই একটি খারাপ পদ্ধতির প্রতিনিধিত্ব করে যা লোকেরা সাধারণত করে না?
আমাকে বিরক্ত করার বিষয়টি নিয়মিতকরণের অভাব। আমি পুনরায় স্যাম্পলিংয়ের মাধ্যমে জানতে পারি যে এই ডেটা সেটের জন্য কোনও জিবিএমে গাছের উত্থানের জন্য সবচেয়ে ভাল সংখ্যক গাছের সংখ্যা 4 টির ইন্টারঅ্যাকশন গভীরতার সাথে 647, তবে আমি কীভাবে নিশ্চিত হতে পারি যে এটি নতুন ডেটার ক্ষেত্রে সত্য হবে (নতুন জনসংখ্যা ধরে নিবেন) প্রশিক্ষণ সেট অনুরূপ)? 'সঙ্কুচিত' - এর (বা আপনি যদি কোনও তথ্যমূলক পূর্বের তথ্য দেবেন না) কোনও যুক্তিসঙ্গত মান না দিয়ে পুনরায় স্যাম্পলিংকে সেরা করার মতো বলে মনে হয়। আমি এই সম্পর্কে কোনও কথা শুনি না, তাই আমি অনুপস্থিত হয়েছি যে আমি এখানে কিছু অনুপস্থিত রয়েছি কিনা।
স্পষ্টতই একটি মডেলের বাইরে থাকা ভবিষ্যদ্বাণীপূর্ণ শক্তির প্রতিটি শেষ বিটকে চেপে ধরার জন্য অনেকগুলি পুনরাবৃত্তি করার সাথে যুক্ত একটি বৃহত গণনা মূলক ব্যয় রয়েছে, সুতরাং স্পষ্টতই এটি এমন কিছু যা আপনার যদি অপটিমাইজেশন এবং প্রতিটি বিট করার সময় / গ্রান্ট পেয়ে থাকে তবে আপনি যা করবেন কর্মক্ষমতা উন্নতি মূল্যবান।