র্যান্ডম ফরেস্ট এবং প্যারামেট্রিক বা নন-প্যারামেট্রিক বুস্ট করছে?


13

চমত্কার পরিসংখ্যানের মডেলিং পড়ে: দুটি সংস্কৃতি (ব্রেইম্যান 2001) , আমরা traditionalতিহ্যগত পরিসংখ্যানের মডেলগুলির (যেমন লিনিয়ার রিগ্রেশন) এবং মেশিন লার্নিং অ্যালগরিদমগুলির (যেমন, ব্যাগিং, র্যান্ডম ফরেস্ট, বুস্টেড ট্রি ...) মধ্যে সমস্ত পার্থক্যটি ব্যবহার করতে পারি।

ব্রেইমান ডেটা মডেলগুলির (প্যারামিট্রিক) সমালোচনা করেন কারণ তারা এই ধারণার উপর ভিত্তি করে যে পরিসংখ্যানবিদ দ্বারা নির্ধারিত একটি পরিচিত, প্রথাগত মডেল দ্বারা পর্যবেক্ষণগুলি উত্পাদিত হয়েছে যা প্রকৃতিকে দুর্বলভাবে অনুকরণ করতে পারে। অন্যদিকে, এমএল আলগোসগুলি কোনও আনুষ্ঠানিক মডেল ধরে না এবং ডেটা থেকে ইনপুট এবং আউটপুট ভেরিয়েবলের মধ্যে সমিতি সরাসরি শিখে।

আমি বুঝতে পেরেছিলাম যে ব্যাগিং / আরএফ এবং বুস্টিং, এছাড়াও এক ধরণের প্যারাম্যাট্রিক: উদাহরণস্বরূপ, ntree , RF এ মাতর , শেখার হার , ব্যাগ ভগ্নাংশ , স্টোকাস্টিক গ্রেডিয়েন্টে গাছের জটিলতা বুস্টেড ট্রিগুলি সমস্ত টিউনিংয়ের পরামিতি । আমরা এই পরামিতিগুলির সর্বোত্তম মানগুলি অনুসন্ধান করতে ডেটা ব্যবহার করছি যেহেতু আমরা ডেটা থেকে এই পরামিতিগুলি অনুমান করার চেষ্টা করছি।

তাহলে পার্থক্য কী? আরএফ এবং বুস্টড ট্রিগুলি প্যারাম্যাট্রিক মডেল?

উত্তর:


12

প্যারামিট্রিকাল মডেলগুলির ডেটা বিতরণ সম্পর্কিত প্যারামিটারগুলি (তাদের infering) বা অনুমান রয়েছে, যেখানে আরএফ, নিউরাল জাল বা বৃক্ষবৃক্ষ গাছগুলি নিজেই অ্যালগরিদমের সাথে সম্পর্কিত রয়েছে, তবে তাদের আপনার ডেটা বিতরণ সম্পর্কে অনুমানের প্রয়োজন নেই বা তাত্ত্বিক বিতরণে আপনার ডেটা শ্রেণিবদ্ধ করা হয়েছে । আসলে প্রায় সমস্ত অ্যালগরিদমে পুনরাবৃত্তি বা অপ্টিমাইজেশনের সাথে সম্পর্কিত মার্জিন মানগুলির মতো প্যারামিটার থাকে।


5
সুতরাং, সংক্ষেপে বলা যেতে পারে: 1) এমএল এবং এমএলটিতে প্যারামিটারিক মডেল উভয়ই পরামিতিগুলি সুরযুক্ত / অনুমান করা হয়, বিউটি 2) এমএল এ, প্যারামিটারগুলি কীভাবে অ্যালগরিদমগুলি ডেটা থেকে শিখবে (ডেটা সম্পর্কে কোনও অনুমান না করে এবং ডাউন স্ট্রিম) ডেটা জেনারেশন), যেখানে প্যারামিট্রিক মডেলগুলির পরামিতি (মডেলগুলি যেগুলি প্রাইরি বলে ধরে নেওয়া হয়) এমন প্রক্রিয়া নিয়ন্ত্রণ করে যা ডেটা তৈরি করেছে বলে ধরে নেওয়া হয় (প্রচলিত অবাস্তব অনুমান যা খুব কমই অনুশীলন করে থাকে)। আপনি কি মনে করেন এটি একটি পর্যাপ্ত সংক্ষিপ্তসার? আপনি কিছু যোগ / পরিবর্তন করতে চান?
এন্টোইন

4
আমি মনে করি ব্রেইমানের কাগজের একটি বাক্য যা সমস্ত কিছুর সংক্ষিপ্ত বিবরণ দেয় তা হল "অ্যালগরিদমিক মডেলিং শিথিল করে ডেটা মডেল থেকে আলগোরিদিমের বৈশিষ্ট্যগুলিতে ফোকাস"।
এন্টোইন

1
আপনি এটির মতো সংক্ষিপ্তসার করতে পারেন তবে .. প্যারামিট্রিক মডেলগুলিকে অবমূল্যায়ন করবেন না here এমন পরিস্থিতি রয়েছে যেখানে প্রচুর সমস্যা সমাধানের জন্য এগুলি প্রয়োজনীয় এবং অনুকূল op এছাড়াও তাদের অনুমানগুলি এতটা অবাস্তব নয়। অনেকগুলি তাত্ত্বিক বিতরণগুলি সাধারণ থেকে দ্বিপদী থেকে লগনরমাল, জ্যামিতিক ইত্যাদির অনেক কিছুর ব্যাখ্যা দেওয়ার জন্য বৈধ one
ডি কাস্ট্রো

4
আমি রাজী. অন্তর্নিহিত শারীরিক প্রক্রিয়াটি সুপরিচিত হলে, প্যারামেট্রিক মডেলগুলি উপযুক্ত। অন্তর্নিহিত প্রক্রিয়া অজানা যখন জ্ঞান আবিষ্কার এবং পূর্বাভাসের জন্য প্যারামেট্রিক মডেলগুলির ব্যবহারের সমালোচনা করছেন ব্রিম্যান
এন্টোইন

1

আমি মনে করি প্যারামিট্রিক এবং নন-প্যারাম্যাট্রিকের মানদণ্ডটি হ'ল: প্যারামিটারগুলির সংখ্যা প্রশিক্ষণের নমুনাগুলির সাথে বৃদ্ধি পায় কিনা। লজিস্টিক রিগ্রেশন এবং এসএমএম-এর জন্য, আপনি যখন বৈশিষ্ট্যগুলি নির্বাচন করেন, আপনি আরও প্রশিক্ষণের ডেটা যুক্ত করে আরও পরামিতি পাবেন না। তবে আরএফ ইত্যাদির জন্য, গাছের সংখ্যা পরিবর্তন না হলেও মডেলের বিশদগুলি (গাছের গভীরতার মতো) পরিবর্তিত হবে।


তবে আরএফ বা বুস্টিংয়ে গাছের গভীরতা বৃদ্ধি পরামিতি যুক্ত করছে না। আপনার এখনও আপনার tree.complexityপ্যারামিটার রয়েছে, আপনি কেবল এটির মান পরিবর্তন করুন। এছাড়াও, আরএফ এবং বনাঞ্চলে গাছের সংখ্যা / ক্রম
এন্টোইন

আমার বিকল্পগুলিতে, যখন গাছের গভীরতা পরিবর্তিত হয়, গাছে আরও কিছু বিভক্ত হয়, সুতরাং আপনার আরও পরামিতি রয়েছে। যখন তথ্য পরিবর্তন হিসাবে আরএফ এবং বুস্টিংয়ে গাছের সংখ্যা পরিবর্তিত হয়, তবে মডেলটি লিনিয়ার মডেল হলে এটি হবে না।
ইউ জাং

1

পরিসংখ্যানগত দিক থেকে, মডেলটি প্যারামিমেট্রিক হয়, যদি প্যারামিটারগুলি ডেটার ভিত্তিতে অবগত হয় বা অনুমান করা হয়। এই অর্থে একটি গাছ ননপ্রেমেট্রিক। অবশ্যই গাছের গভীরতা হল অ্যালগরিদমের একটি প্যারামিটার, তবে এটি সহজাতভাবে ডেটা থেকে প্রাপ্ত নয়, বরং একটি ইনপুট প্যারামিটার যা ব্যবহারকারী দ্বারা সরবরাহ করতে হবে।


সুতরাং, বলুন যে আপনাকে ওএলএস এবং বৃক্ষভিত্তিক মডেলগুলি একটি অ প্রযুক্তিগত দর্শকের কাছে উপস্থাপন করতে হবে, আপনি কি বলতে পারবেন যে প্রাক্তনগুলি প্যারামিমেট্রিক হয় তবে পরেরটি নন প্যারামেট্রিক হয়?
টাঙ্গুয়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.