আমি কিছুক্ষণের জন্য মেশিন লার্নিং এবং বায়োইনফরম্যাটিকসে কাজ করছি এবং আজ ডেটা মাইনিংয়ের মূল সাধারণ বিষয়গুলি সম্পর্কে আমার একজন সহকর্মীর সাথে আলাপ হয়েছিল।
আমার সহকর্মী (যিনি একটি মেশিন লার্নিং বিশেষজ্ঞ) বলেছিলেন যে, তাঁর মতে, মেশিন লার্নিংয়ের তর্কযোগ্যভাবে সবচেয়ে গুরুত্বপূর্ণ ব্যবহারিক দিকটি হ'ল কীভাবে বুঝতে হবে যে আপনি নিজের মেশিন লার্নিং মডেলটি প্রশিক্ষণের জন্য পর্যাপ্ত ডেটা সংগ্রহ করেছেন কিনা ।
এই বিবৃতি আমাকে অবাক করেছে, কারণ আমি এই দিকটিকে এতটা গুরুত্ব দেয়নি ...
আমি তখন ইন্টারনেটে আরও তথ্যের সন্ধান করলাম এবং আমি এই পোস্টটি ফাস্টএমএল.কম -এ থাম্বের নিয়ম হিসাবে প্রতিবেদন করে দেখলাম যে বৈশিষ্ট্যগুলি রয়েছে বলে আপনার প্রায় 10 গুণ বেশি ডেটা দৃষ্টান্ত প্রয়োজন ।
দুটি প্রশ্ন:
1 - এই সমস্যাটি কি বিশেষভাবে মেশিন লার্নিংয়ে প্রাসঙ্গিক ?
2 - 10 বার নিয়ম কি কাজ করছে? এই থিমের জন্য অন্য কোনও প্রাসঙ্গিক উত্স আছে?