কোনটি, যদি কোনও, মেশিন লার্নিং অ্যালগরিদমগুলি ব্যাখ্যাযোগ্যতা এবং পূর্বাভাসের মধ্যে একটি ভাল ট্রেড অফ হিসাবে গৃহীত হয়?


9

গ্রেডিয়েন্ট বুস্টিং মেশিন বা নিউরাল নেটওয়ার্কগুলির মতো অ্যালগরিদমগুলিকে বর্ণনা করে মেশিন লার্নিং পাঠ্যগুলি প্রায়শই মন্তব্য করে যে এই মডেলগুলি পূর্বাভাসে ভাল, তবে এটি ব্যাখ্যাযোগ্যতা বা ব্যাখ্যার ক্ষতির মূল্যে আসে। বিপরীতে, একক সিদ্ধান্ত গাছ এবং শাস্ত্রীয় রিগ্রেশন মডেলগুলিকে ব্যাখ্যায় ভাল হিসাবে চিহ্নিত করা হয়, তবে এলোমেলো বন বা এসভিএম এর মতো আরও পরিশীলিত মডেলের তুলনায় একটি (তুলনামূলকভাবে) কম অনুমানের যথার্থতা দেওয়া হয়। মেশিন লার্নিং মডেলগুলি সাধারণত দুজনের মধ্যে একটি ভাল ট্রেড অফের প্রতিনিধিত্ব হিসাবে গৃহীত হয়? অ্যালগরিদমের বৈশিষ্ট্যগুলি গণনা করে এমন কোনও সাহিত্য রয়েছে যা তাদের ব্যাখ্যাযোগ্য হতে দেয়? (এই প্রশ্নটি আগে ক্রস-যাচাইকরণের বিষয়ে জিজ্ঞাসা করা হয়েছিল)

উত্তর:


3

অ্যালগরিদমের বৈশিষ্ট্যগুলি গণনা করে এমন কোনও সাহিত্য রয়েছে যা তাদের ব্যাখ্যাযোগ্য হতে দেয়?

আমি কেবলমাত্র সাহিত্যের বিষয়ে অবগত আছি রিবেরো, সিংহ এবং গেস্টরিনের সাম্প্রতিক কাগজ । তারা প্রথমে একটি একক পূর্বাভাসের ব্যাখ্যাযোগ্যতার সংজ্ঞা দেয়:

"পূর্বাভাসের ব্যাখ্যা দিয়ে", এর অর্থ আমরা পাঠ্য বা চাক্ষুষ নিদর্শনগুলি উপস্থাপন করি যা উদাহরণের উপাদানগুলির মধ্যে সম্পর্কের গুণগত বোঝাপড়া সরবরাহ করে (যেমন পাঠ্যে শব্দগুলি, একটি চিত্রের প্যাচগুলি) এবং মডেলের ভবিষ্যদ্বাণী।

লেখকরা আরও কংক্রিট উদাহরণগুলির জন্য এর অর্থ কী তা আরও বিশদভাবে ব্যাখ্যা করেন এবং তারপরে কোনও মডেলের ব্যাখ্যাযোগ্যতার সংজ্ঞা দেওয়ার জন্য এই ধারণাটি ব্যবহার করুন। তাদের উদ্দেশ্য হ'ল বিদ্যমান পদ্ধতির ব্যাখ্যাযোগ্যতার তুলনা করার পরিবর্তে অপ্রত্যাশিত মডেলগুলিতে কৃত্রিমভাবে ব্যাখ্যাযোগ্যতা যুক্ত করার চেষ্টা এবং স্পষ্ট করে বলা। কাগজটি যে কোনও উপায়ে সহায়ক হতে পারে, কারণ "ব্যাখ্যাযোগ্যতা" ধারণার আশেপাশে আরও সুনির্দিষ্ট পরিভাষা প্রবর্তনের চেষ্টা করা হয়েছে।

মেশিন লার্নিং মডেলগুলি সাধারণত দুজনের মধ্যে একটি ভাল ট্রেড অফের প্রতিনিধিত্ব হিসাবে গৃহীত হয়?

আমি @ উইন্টারের সাথে একমত হই যে (কেবলমাত্র লজিস্টিক নয়) রিগ্রেশন-এর জন্য ইলাস্টিক-নেটকে পূর্বাভাসের যথাযথতা এবং ব্যাখ্যাযোগ্যতার মধ্যে ভাল সমঝোতার উদাহরণ হিসাবে দেখা যেতে পারে।

ভিন্ন ধরণের অ্যাপ্লিকেশন ডোমেনের (সময় সিরিজ) জন্য, অন্য শ্রেণির পদ্ধতিগুলিও একটি ভাল সমঝোতা সরবরাহ করে: বায়েশিয়ান স্ট্রাকচারাল টাইম সিরিজ মডেলিং। এটি শাস্ত্রীয় কাঠামোগত সময় সিরিজের মডেলিং থেকে ব্যাখ্যাযোগ্যতা এবং বায়সিয়ান পদ্ধতির কিছুটা নমনীয়তার উত্তরাধিকার সূত্রে প্রাপ্ত। লজিস্টিক রিগ্রেশন এর অনুরূপ, ব্যাখ্যাটি মডেলিংয়ের জন্য ব্যবহৃত রিগ্রেশন সমীকরণগুলির সাহায্য করে। বিপণন এবং আরও রেফারেন্সে একটি দুর্দান্ত প্রয়োগের জন্য এই কাগজটি দেখুন ।

সবেমাত্র উল্লিখিত বায়েশীয় প্রসঙ্গে সম্পর্কিত, আপনি সম্ভাব্য গ্রাফিকাল মডেলগুলিও দেখতে চাইতে পারেন। তাদের ব্যাখ্যাযোগ্যতা রিগ্রেশন সমীকরণের উপর নির্ভর করে না, তবে মডেলিংয়ের গ্রাফিক্যাল উপায়ে নির্ভর করে; অসাধারণ পর্যালোচনার জন্য কলার এবং ফ্রেডম্যানের "সম্ভাব্য গ্রাফিকাল মডেল: নীতি ও কৌশল" দেখুন see

যদিও আমরা উপরের বাইসিয়ান পদ্ধতিগুলিকে "সাধারণভাবে গৃহীত ভাল বাণিজ্য বন্ধ" হিসাবে উল্লেখ করতে পারি তা নিশ্চিত নই। এগুলির জন্য তারা যথেষ্ট পরিমাণে সুপরিচিত নাও হতে পারে, বিশেষত স্থিতিস্থাপক নেট উদাহরণের সাথে তুলনা করে।


এখন যেহেতু রিবেইরো এট আল-এর লিঙ্কযুক্ত কাগজটি বিবেচনা করার আমার আরও সুযোগ হয়েছিল, আমি বলতে চাই যে বিভাগ 2 'ব্যাখ্যার জন্য কেস'-এ' ব্যাখ্যাযোগ্যতার 'একটি কার্যকর সংজ্ঞা রয়েছে এবং এটি একটি এর গুরুত্বের বাহ্যরেখা দেওয়ানের উপযুক্ত কাজ এবং এর মতো ডেটা সায়েন্স সম্প্রদায়ের মধ্যে ব্যাপকভাবে পড়া দরকার to
রবার্ট ডি গ্রাফ

যদিও আমার প্রশ্নের ভিত্তি সিভিতে গৃহীত হয়নি, @ সান ইস্টার আমাকে এই দরকারী লিঙ্কটি সাহায্য করেছিল: jstage.jst.go.jp/article/bhmk1974/26/1/26_1_29/_ খণ্ড
রবার্ট ডি গ্রাফ

3

মেশিন লার্নিং মডেলগুলি সাধারণত দুজনের মধ্যে একটি ভাল ট্রেড অফের প্রতিনিধিত্ব হিসাবে গৃহীত হয়?

আমি ধরে নিয়েছি যে পূর্বাভাসে ভাল থাকার অর্থ আপনার ওফিটিংয়ের তুলনায় মোটামুটি দৃust় থাকাকালীন ডেটাতে উপস্থিত অলাইনারিটি ফিট করতে সক্ষম হবেন। ব্যাখ্যাযোগ্যতার মধ্যে ট্রেড অফ এবং সেই অরৈখিকতার পূর্বাভাস দিতে সক্ষম হওয়া জিজ্ঞাসা করা ডেটা এবং প্রশ্নের উপর নির্ভর করে। ডেটা সায়েন্সে আসলেই কোনও নিখরচায় দুপুরের খাবার নেই এবং কোনও একক অ্যালগরিদম কোনও উপাত্তের সেট (এবং এটি ব্যাখ্যার জন্য প্রযোজ্য) জন্য সেরা হিসাবে বিবেচিত হতে পারে না।

সাধারণ নিয়মটি হওয়া উচিত যে আপনি যত বেশি অ্যালগরিদম জানেন আপনার পক্ষে এটি তত ভাল as কারণ আপনি আপনার নির্দিষ্ট প্রয়োজনগুলি আরও সহজেই গ্রহণ করতে পারেন।

যদি আমি শ্রেণিবিন্যাস টাস্কের জন্য আমার প্রিয় বাছাই করতে হয় যা আমি প্রায়শই ব্যবসায়িক পরিবেশে ব্যবহার করি তবে আমি লজিস্টিক রিগ্রেশন জন্য ইলাস্টিক-নেট বেছে নেব । প্রক্রিয়া সম্পর্কে দৃ the় ধারণা থাকা সত্ত্বেও যেটি ডেটা উত্পন্ন করে তা বেসিক লজিস্টিক রিগ্রেশন থেকে এর ব্যাখ্যাযোগ্যতা বজায় রাখার জন্য নিয়মিতকরণ পদকে সহজেই ডেটাগুলিতে গ্রহণ করতে পারে।

অ্যালগরিদমের বৈশিষ্ট্যগুলি গণনা করে এমন কোনও সাহিত্য রয়েছে যা তাদের ব্যাখ্যাযোগ্য হতে দেয়?

আমি আপনাকে একটি ভাল লিখিত বই বেছে নেওয়ার পরামর্শ দিচ্ছি যা সাধারণভাবে ব্যবহৃত মেশিন লার্নিং অ্যালগরিদম এবং বিভিন্ন পরিস্থিতিতে বিভিন্ন উপকারিতা এবং কনসকে বর্ণনা করে। এই জাতীয় গ্রন্থটির উদাহরণ হ'ল দ্য এলিমেন্টস অফ স্ট্যাটিস্টিকাল লার্নিং টি। হাস্টি, আর। টিবশিরানী এবং জে ফ্রেডম্যানের দ্বারা


3
টিবিএইচ হ'ল আমার হতাশার সঠিক পাঠ্যটিতে-যা বিভিন্ন মডেলের সাথে সম্পর্কিত হয়ে 'ব্যাখ্যামূলক' শব্দটি বহুবার ব্যবহার করে এবং এক পর্যায়ে বলে ... 'ডেটা মাইনিং অ্যাপ্লিকেশনটির জন্য ব্যাখ্যামূলক মডেল প্রয়োজন। কীভাবে ব্যাখ্যাযোগ্য মডেলটি সনাক্ত করতে হবে - যে প্রশ্নটি উত্সাহিত করেছিল তা সম্পর্কে আমার সন্ধান করতে সক্ষম না করে কেবল ভবিষ্যদ্বাণীগুলি (বিভাগ 10.7) উত্পাদন করা যথেষ্ট নয়। যদিও আমি এইরকম একটি সম্মানিত পাঠের সমালোচনা করতে আগ্রহী ছিলাম। একইভাবে টিআইবিশিরানীর কাগজটি 'ব্যাখ্যামূলক' কী তা না বলে লাসো'কে ​​তার ব্যাখ্যা হিসাবে চিহ্নিত করেছে 'ব্যাখ্যাযোগ্য' lists
রবার্ট ডি গ্রাফ

1

সম্ভাব্যভাবে মিলিয়ে যাওয়াগুলির অযৌক্তিক কার্যকারিতা এবং পূর্বাভাসের বিপরীতে ব্যাখ্যা সম্পর্কিত ব্যবসায়ের বিষয়ে আমার উত্তরটি দেখুন see ন্যূনতম বার্তার দৈর্ঘ্য (এমএমএল, ওয়ালেস 2005) ডেটা সংক্ষেপণের ক্ষেত্রে ব্যাখ্যাটির একটি আনুষ্ঠানিক সংজ্ঞা দেয়, এবং এই প্রত্যাশাটিকে অনুপ্রাণিত করে যে ব্যাখ্যাগুলি সাধারণত অতিরিক্ত ছাড়াই ফিট করে এবং ভাল ব্যাখ্যা ভাল, সাধারণকরণযোগ্য ভবিষ্যদ্বাণী উত্পন্ন করে। তবে এগুলি আনুষ্ঠানিক তত্ত্বের উপরেও স্পর্শ করে যে কীভাবে পোশাকগুলি আরও ভাল ভবিষ্যদ্বাণী করবে - ফলস্বরূপ (সলোমনফ 1964) এ ফিরে যাওয়ার সর্বোত্তম ভবিষ্যদ্বাণী এবং পুরোপুরি বায়েশিয়ান পদ্ধতির অন্তর্নিহিত: উত্তরোত্তর বিতরণকে একীভূত করুন, কেবল গড়ন বাছাই করবেন না, বা মোড

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.