চমত্কার পরিসংখ্যানের মডেলিং পড়ে: দুটি সংস্কৃতি (ব্রেইম্যান 2001) , আমরা traditionalতিহ্যগত পরিসংখ্যানের মডেলগুলির (যেমন লিনিয়ার রিগ্রেশন) এবং মেশিন লার্নিং অ্যালগরিদমগুলির (যেমন, ব্যাগিং, র্যান্ডম ফরেস্ট, বুস্টেড ট্রি ...) মধ্যে সমস্ত পার্থক্যটি ব্যবহার করতে পারি।
ব্রেইমান ডেটা মডেলগুলির (প্যারামিট্রিক) সমালোচনা করেন কারণ তারা এই ধারণার উপর ভিত্তি করে যে পরিসংখ্যানবিদ দ্বারা নির্ধারিত একটি পরিচিত, প্রথাগত মডেল দ্বারা পর্যবেক্ষণগুলি উত্পাদিত হয়েছে যা প্রকৃতিকে দুর্বলভাবে অনুকরণ করতে পারে। অন্যদিকে, এমএল আলগোসগুলি কোনও আনুষ্ঠানিক মডেল ধরে না এবং ডেটা থেকে ইনপুট এবং আউটপুট ভেরিয়েবলের মধ্যে সমিতি সরাসরি শিখে।
আমি বুঝতে পেরেছিলাম যে ব্যাগিং / আরএফ এবং বুস্টিং, এছাড়াও এক ধরণের প্যারাম্যাট্রিক: উদাহরণস্বরূপ, ntree , RF এ মাতর , শেখার হার , ব্যাগ ভগ্নাংশ , স্টোকাস্টিক গ্রেডিয়েন্টে গাছের জটিলতা বুস্টেড ট্রিগুলি সমস্ত টিউনিংয়ের পরামিতি । আমরা এই পরামিতিগুলির সর্বোত্তম মানগুলি অনুসন্ধান করতে ডেটা ব্যবহার করছি যেহেতু আমরা ডেটা থেকে এই পরামিতিগুলি অনুমান করার চেষ্টা করছি।
তাহলে পার্থক্য কী? আরএফ এবং বুস্টড ট্রিগুলি প্যারাম্যাট্রিক মডেল?