জোড় , আই = 1 , … , এন , সম্পর্কে আইআইডি অনুমানটি প্রায়শই পরিসংখ্যান এবং মেশিন লার্নিংয়ে তৈরি করা হয়। কখনও কখনও একটি ভাল কারণে, কখনও কখনও সুবিধার বাইরে এবং কখনও কখনও কেবল কারণ আমরা সাধারণত এই ধারণাটি করি। সন্তুষ্টিজনকভাবে উত্তর দেওয়ার জন্য যদি ধারণাটি সত্যই প্রয়োজন হয়, এবং এই অনুমানটি না করার ফলে কী পরিণতি হয়, আমি সহজেই একটি বই লেখার সমাপ্তি (যদি আপনি সহজেই এরকম কিছু করে শেষ করেন)। এখানে আমি কী সবচেয়ে গুরুত্বপূর্ণ দিক বলে মনে করি তার একটি সংক্ষিপ্ত ধারণা দেওয়ার চেষ্টা করব।(Xi,yi)i=1,…,N
একটি মৌলিক ধারণা
ধরে নেওয়া যাক আমরা প্রদত্ত এক্স এর সম্ভাব্যতা মডেল শিখতে চাই , যাকে আমরা p ( y ∣ X ) বলি । আমরা এই মডেলটি সম্পর্কে একটি প্রাথমিক ধারণা করি না, তবে আমরা ন্যূনতম ধারণাটি করব যে এইরকম একটি মডেল এর উপস্থিত রয়েছেyXp(y∣X)
- এর শর্তাধীন বিতরণ দেওয়া এক্স আমি হয় পি ( Y আমি | এক্স আমি ) ।yiXip(yi∣Xi)
কি এই ধৃষ্টতা সম্পর্কে টুকুনি যে শর্তাধীন বিতরণ হয় উপর নির্ভর করে আমি শুধুমাত্র মাধ্যমে এক্স আমি । এটি হ'ল মডেলটিকে দরকারী করে তোলে, যেমন পূর্বাভাসের জন্য। ধারণাটি আইড অনুমানের অধীনে অভিন্নভাবে বিতরণ করা অংশের পরিণাম হিসাবে ধারণ করে, তবে এটি দুর্বল কারণ আমরা এক্স আই এর বিষয়ে কোনও অনুমান করি না ।yiiXiXi
নীচে ফোকাসটি বেশিরভাগ স্বাধীনতার ভূমিকাতে থাকবে।
মূর্তিনির্মাণ
এক্স দেওয়া একটি মডেল শেখার জন্য দুটি প্রধান পন্থা রয়েছে । একটি পদ্ধতির বৈষম্যমূলক মডেলিং এবং অন্যটি জেনারেটরি মডেলিং হিসাবে পরিচিত ।yX
- বৈষম্যমূলক মডেলিং : আমরা সরাসরি মডেল করি , যেমন লজিস্টিক রিগ্রেশন মডেল, নিউরাল নেটওয়ার্ক, ট্রি বা একটি এলোমেলো বন। কাজ মডেলিং ধৃষ্টতা সাধারণত হবে Y আমি 's দেওয়া শর্তসাপেক্ষে স্বাধীন এক্স আমি s', যদিও subsampling বা বুটস্ট্র্যাপিং উপর নির্ভর প্রাক্কলন কৌশল IID অধীনে বেশীরভাগ ইন্দ্রিয় বা দুর্বল exchangeability ধৃষ্টতা (নিচে দেখুন) আছে। তবে সাধারণত, বৈষম্যমূলক মডেলিংয়ের জন্য আমাদের এক্স আই এর বিষয়ে বিতরণীয় অনুমান করা দরকার না । p(y∣X)yiXiXi
- জেনারেটরি মডেলিং : আমরা যৌথ বন্টন, , ( এক্স , ওয়াই ) এর মডেলিং করি সাধারণত শর্তাধীন বিতরণ পি ( এক্স ∣ ওয়াই ) এবং প্রান্তিক বিতরণ পি ( y ) এর মডেলিংয়ের মাধ্যমে । তারপরে আমরা কম্পিউটারে p ( y ∣ X ) এর জন্য বয়েসের সূত্র ব্যবহার করি । লিনিয়ার বৈষম্যমূলক বিশ্লেষণ এবং নিষ্পাপ বায়েস পদ্ধতি উদাহরণ। কাজ মডেলিং ধৃষ্টতা সাধারণত IID ধৃষ্টতা হবে।p(X,y)(X,y)p(X∣y)p(y)p(y∣X)
উভয় মডেলিং পদ্ধতির জন্য কর্মরত মডেলিং অনুমানটি শেখার পদ্ধতিগুলি (বা অনুমানকারী) আহরণ বা প্রস্তাব দেওয়ার জন্য ব্যবহৃত হয়। এটি (দণ্ডিত) লগ-সম্ভাবনা সর্বাধিক করে, অভিজ্ঞতাজনিত ঝুঁকি হ্রাস করে বা বায়েশিয়ার পদ্ধতি ব্যবহার করে হতে পারে। এমনকি যদি ওয়ার্কিং মডেলিং অনুমানটি ভুল হয় তবে ফলস্বরূপ পদ্ধতিটি এখনও এর একটি বুদ্ধিমান ফিট সরবরাহ করতে পারে । p(y∣X)
বৈষম্যমূলক মডেলিংয়ের সাথে একত্রে ব্যবহৃত কিছু কৌশল, যেমন ব্যাগিং (বুটস্ট্র্যাপ সমষ্টি), ডেটাসেট থেকে এলোমেলোভাবে নমুনাযুক্ত অনেকগুলি মডেলগুলিতে ফিট করে কাজ করে। আইআইডি অনুমান (বা বিনিময়যোগ্যতা) ব্যতীত পুনরায় মডেল করা ডেটাসেটের মূল ডেটাসেটের অনুরূপ যৌথ বিতরণ হবে না। পুনর্নির্মাণের মাধ্যমে কোনও নির্ভরতা কাঠামো "গোলযোগ" হয়ে গেছে। আমি এ সম্পর্কে গভীরভাবে চিন্তা করে দেখিনি, তবে কেন শেখার পদ্ধতি হিসাবে প্রয়োজনীয় পদ্ধতিটি ভেঙে ফেলতে হবে তা আমি দেখতে পাচ্ছি না । কমপক্ষে কাজের স্বাধীনতা অনুমানের উপর ভিত্তি করে পদ্ধতির জন্য নয়। আমি এখানে ভুল প্রমাণিত হয়েছে খুশি।p(y∣X)
ধারাবাহিকতা এবং ত্রুটির সীমা
সমস্ত শিখন পদ্ধতির একটি কেন্দ্রীয় প্রশ্ন হ'ল তারা এর কাছাকাছি মডেলগুলির ফলাফল করে কিনা । ধারাবাহিকতা এবং ত্রুটির সীমাবদ্ধতার সাথে পরিসংখ্যান এবং মেশিন লার্নিংয়ে রয়েছে একটি বিশাল তাত্ত্বিক সাহিত্য। এই সাহিত্যের একটি প্রধান লক্ষ্য প্রমাণ করতে হবে যে শিখেছি মডেল পাসে হয় পি ( Y | এক্স ) যখন এন বড়। ধারাবাহিকতা একটি গুণগত আশ্বাস, ত্রুটি সীমাবদ্ধতা (আধা-) ঘনিষ্ঠতার স্পষ্ট পরিমাণগত নিয়ন্ত্রণ সরবরাহ করে এবং একত্রীকরণের হার দেয় givep(y∣X)p(y∣X)N
তাত্ত্বিক ফলাফলগুলি সমস্ত ডেটাসেটে পর্যবেক্ষণগুলির যৌথ বন্টন সম্পর্কে অনুমানের উপর নির্ভর করে। প্রায়শই উপরে উল্লিখিত ওয়ার্কিং মডেলিং অনুমানগুলি করা হয় (এটি বৈষম্যমূলক মডেলিংয়ের জন্য শর্তাধীন স্বাধীনতা এবং জেনারেটরি মডেলিংয়ের জন্য আইআইডি)। বৈষম্যমূলক মডেলিংয়ের জন্য, ধারাবাহিকতা এবং ত্রুটির সীমাগুলির জন্য এর কিছু শর্ত পূরণ করতে হবে। শাস্ত্রীয় প্রতিরোধের ক্ষেত্রে এরকম একটি শর্ত হ'ল 1Xiজন্যএন→∞, যেখানেএক্সসারি দিয়ে নকশা ম্যাট্রিক্স উল্লেখ করেএক্স টি আমি । ধারাবাহিকতার জন্য দুর্বল পরিস্থিতি যথেষ্ট হতে পারে। অল্প শিষ্টাচারের ক্ষেত্রে এরকম আরও একটি শর্ত হ'ল সীমাবদ্ধ ইগেনভ্যালু শর্ত, উদাহরণস্বরূপলাসোর জন্য ওরাকল ফলাফল প্রমাণ করতে ব্যবহৃত শর্তগুলিতেদেখুন। কিছু প্রযুক্তিগত বন্টনমূলক অনুমানের সাথে আইআইডি অনুমানটি ইঙ্গিত দেয় যে এই জাতীয় কিছু যথেষ্ট শর্তগুলি বড় সম্ভাবনার সাথে পরিপূর্ণ হয় এবং সুতরাং আইড অনুমানটি বৈষম্যমূলক মডেলিংয়ের জন্য ধারাবাহিকতা এবং ত্রুটির সীমা অর্জনের জন্য যথেষ্ট নয় তবে প্রয়োজনীয় অনুমান হিসাবে প্রমাণিত হতে পারে।1NXTX→ΣN→∞XXTi
মডেলিং পদ্ধতির যে কোনও একটির জন্য স্বাধীনতার কার্যকরী মডেলিং অনুমানটি ভুল হতে পারে। কোনও অংগ -নিয়ম অনুসারে কেউ কোনও অ্যারগডিক প্রক্রিয়া থেকে ডেটা আসে তবে এখনও ধারাবাহিকতা আশা করতে পারে এবং প্রক্রিয়াটি পর্যাপ্ত দ্রুত মেশানো থাকলে কেউ এখনও কিছু ত্রুটির সীমা আশা করতে পারে । এই ধারণাগুলির একটি নির্দিষ্ট গাণিতিক সংজ্ঞা আমাদের মূল প্রশ্ন থেকে অনেক দূরে নিয়ে যাবে। এটি লক্ষ করার জন্য যথেষ্ট যে আইডি অনুমানের পাশাপাশি নির্ভরশীল কাঠামো রয়েছে যার জন্য শেখার পদ্ধতিগুলি অসীমের দিকে ঝোঁক হিসাবে কাজ করে প্রমাণিত হতে পারে।N
যদি নির্ভরতা কাঠামো সম্পর্কে আমাদের আরও বিস্তারিত জ্ঞান থাকে তবে আমরা নির্ভর করতে পারি যে মডেলিংয়ের জন্য ব্যবহৃত স্বতন্ত্রতা অনুমিতিটি নির্ভর করে এমন একটি মডেলের সাথেও যে নির্ভরতা কাঠামোটি ক্যাপচার করে। এটি প্রায়শই সময় সিরিজের জন্য করা হয়। একটি ভাল কাজের মডেল আরও দক্ষ পদ্ধতির ফলস্বরূপ হতে পারে।
মডেল মূল্যায়ন
শেখার পদ্ধতিটি একটি মডেলকে কাছাকাছি রাখার বিষয়টি প্রমাণ করার পরিবর্তে "জ্ঞাত মডেলটি কতটা ভাল" এর একটি (আপেক্ষিক) মূল্যায়ন অর্জন করা অত্যন্ত ব্যবহারিক মূল্য। এই ধরনের মূল্যায়নের স্কোর দুটি বা আরও বেশি শেখা মডেলগুলির সাথে তুলনীয়, তবে তারা শিখানো মডেলটি পি ( y ∣ এক্স ) এর কতটা কাছাকাছি তার একটি নিখুঁত মূল্যায়ন সরবরাহ করবে না । মূল্যায়ন স্কোরের অনুমানগুলি সাধারণত প্রশিক্ষণ এবং একটি পরীক্ষার ডেটাসেটে ডেটাসেট বিভক্তকরণ বা ক্রস-বৈধতা ব্যবহার করে ডেভাসেটের ভিত্তিতে অনুষ্টিতভাবে গণনা করা হয়।p(y∣X)p(y∣X)
ব্যাগিংয়ের মতো, ডেটাসেটের এলোমেলো বিভাজন যে কোনও নির্ভরতা কাঠামোকে "বিশৃঙ্খলা" করবে। যাইহোক, কর্মক্ষম স্বাধীনতা অনুমানের উপর ভিত্তি করে পদ্ধতিগুলির জন্য, মূল্যায়নের অনুমানগুলি যুক্তিসঙ্গত হতে আইডির চেয়ে দুর্বলতা অনুমানগুলি যথেষ্ট হওয়া উচিত, যদিও এই অনুমানগুলির উপর স্ট্যান্ডার্ড ত্রুটিগুলি উপস্থিত হওয়া খুব কঠিন হবে।
[ সম্পাদনা করুন: ভেরিয়েবলগুলির মধ্যে নির্ভরতা আইড অনুমানের অধীনে বিতরণ থেকে পৃথক হওয়া বিদ্যাপীঠিত মডেলের বিতরণের ফলাফল করবে। ক্রস-বৈধকরণের দ্বারা উত্পাদিত অনুমানটি স্পষ্টতই সাধারণীকরণ ত্রুটির সাথে সম্পর্কিত নয়। যদি নির্ভরতা শক্তিশালী হয় তবে এটি সম্ভবত খুব কমই অনুমান করা যায়]]
সংক্ষিপ্তসার (tl; dr)
সর্বোপরি ধৃষ্টতা একটি নির্দিষ্ট শর্তাধীন সম্ভাব্যতা মডেল, নেই বয়সী । সুতরাং এক্স দ্বারা ক্যাপচারিত নয় শর্তাধীন বিতরণে প্রবণতা বা হঠাৎ পরিবর্তন হতে পারে ।p(y∣X)X
যখন একটি মডেল শেখার দেওয়া এক্স , স্বাধীনতা হিসেবে ভূমিকা পালন করেyX
- একটি কার্যকর কাজের মডেলিং অনুমান যা আমাদের শেখার পদ্ধতিগুলি অর্জন করতে সহায়তা করে
- ধারাবাহিকতা প্রমাণ করার জন্য এবং ত্রুটির সীমা সরবরাহ করার জন্য পর্যাপ্ত তবে প্রয়োজনীয় অনুমান নয়
- শেখার জন্য ব্যাগিং এবং মূল্যায়নের জন্য ক্রস-বৈধকরণের মতো এলোমেলো ডেটা বিভাজন কৌশলগুলি ব্যবহার করার জন্য পর্যাপ্ত তবে প্রয়োজনীয় অনুমান নয়।
আইডির বিকল্পগুলি যে পর্যাপ্ত তা হ'ল সংক্ষিপ্তরূপে বুঝতে অপ্রয়োজনীয় এবং কিছুটা গবেষণা বিষয়।