এই প্রশ্নটি আবার পড়ার পরে, আমি আপনাকে নিম্নলিখিত বাউন্ড দিতে পারি:
ধরে নমুনা IID টানা হয়, বিতরণ সংশোধন করা হয়েছে, এবং ক্ষয় দ্বারা বেষ্টিত তারপর সম্ভাব্যতা অন্তত সঙ্গে, 1 - δ ,
ই [ ই ( জ ) ] ≤ ই ( জ ) + + বি √বি1 - δ
ই [ ই( জ ) ] ≤ ই^( জ ) + বি লগ1δ2 মি-----√
যেখানে নমুনা আকার, এবং 1 - δ সুমহান আস্থা থাকে। আবদ্ধ ম্যাকডিয়ারমিডের অসমতার দ্বারা তুচ্ছভাবে ধারণ করে।মি1 - δ
নমুনা আকার, ই [ ই ( জ ) ] সাধারণীকরণ ত্রুটি, এবং ই ( জ ) হাইপোথিসিস জন্য পরীক্ষার ত্রুটি।মিই [ ই( জ ) ]ই^( জ )
দয়া করে কেবল ক্রস বৈধতা ত্রুটি বা পরীক্ষার ত্রুটিটি রিপোর্ট করবেন না , এগুলি সাধারণভাবে অর্থহীন, যেহেতু তারা কেবলমাত্র বিন্দু অনুমান।
রেকর্ডের জন্য পুরাতন পোস্ট:
আমি নিশ্চিত না যে আমি আপনার প্রশ্নটি পুরোপুরি বুঝতে পেরেছি, তবে আমি এটির জন্য একটি ছুরিকাঘাত করব।
প্রথমত, আমি নিশ্চিত নই যে আপনি কীভাবে মডেল নির্বাচনের জন্য পূর্বাভাস ব্যবধানটি সংজ্ঞায়িত করবেন, যেহেতু আমি এটি বুঝতে পারি, ভবিষ্যদ্বাণী অন্তরগুলি কিছু বণ্টনমূলক অনুমান করে। পরিবর্তে, আপনি ঘনত্বের বৈষম্য অর্জন করতে পারেন, যা কিছুটা সম্ভাবনার জন্য মূলত তার বৈকল্পিক দ্বারা একটি এলোমেলো পরিবর্তনশীলকে আবদ্ধ করে তোলে। ঘনত্বের অসমতা বৃদ্ধির জন্য উন্নত তত্ত্ব সহ মেশিন লার্নিংয়ের মাধ্যমে ব্যবহার করা হয়। এক্ষেত্রে আপনি আপনার অভিজ্ঞতাগত ত্রুটি (পরীক্ষার সেটটিতে আপনার ত্রুটি) এবং আরও কিছু জটিলতা শব্দ এবং বৈকল্পিকতার সাথে সম্পর্কিত একটি শব্দ দ্বারা সাধারণকরণ ত্রুটি (সাধারণভাবে আপনার ত্রুটি, আপনি দেখেননি পয়েন্টগুলি) আবদ্ধ করতে চান।
এখন আমার ক্রস বৈধকরণ সম্পর্কে একটি ভুল বোঝাবুঝি দূর করতে হবে যা অত্যন্ত সাধারণ। ক্রস বৈধতা কেবলমাত্র একটি নির্দিষ্ট নমুনা আকারের জন্য একটি মডেলের প্রত্যাশিত ত্রুটির একটি পক্ষপাতহীন অনুমান দেবে। এর প্রমাণটি কেবল ছুটির ওয়ান আউট প্রোটোকলের জন্য কাজ করে। এটি আসলে মোটামুটি দুর্বল, যেহেতু এটি আপনাকে বৈকল্পিক সম্পর্কিত কোনও তথ্য দেয় না। অন্যদিকে, ক্রস বৈধকরণ এমন একটি মডেল ফিরিয়ে দেবে যা কাঠামোগত ঝুঁকি হ্রাসের সমাধানের নিকটে রয়েছে, যা তাত্ত্বিকভাবে সর্বোত্তম সমাধান। আপনি এখানে পরিশিষ্টে প্রমাণটি পেতে পারেন: http://www.cns.nyu.edu/~rabadi/resources/scat-150519.pdf
তাহলে কীভাবে জেনারালাইজেশন সীমাবদ্ধ? (মনে রাখবেন একটি সাধারণীকরণ বাউন্ড একটি নির্দিষ্ট মডেলের সাধারণীকরণ ত্রুটি সম্পর্কে মূলত একটি পূর্বাভাস অন্তর)। ঠিক আছে, এই সীমাগুলি অ্যালগোরিদম নির্দিষ্ট। দুর্ভাগ্যক্রমে একটিমাত্র পাঠ্যপুস্তক রয়েছে যা মেশিন লার্নিংয়ে (বুস্টিং সহ) সাধারণভাবে ব্যবহৃত সমস্ত অ্যালগরিদমের জন্য সীমাবদ্ধ করে। বইটি ফাউন্ডেশনস অফ মেশিন লার্নিং (২০১২) মহরি, রোস্তামিজাদেহ এবং তালওয়ালকার রচনা। বিষয়বস্তুতে আচ্ছন্ন বক্তৃতা স্লাইডগুলির জন্য, আপনি এগুলি মোহরির ওয়েব পৃষ্ঠায় খুঁজে পেতে পারেন: http://www.cs.nyu.edu/~mohri/ML14/
যদিও স্ট্যাটাসটিকাল লার্নিংয়ের উপাদানগুলি একটি গুরুত্বপূর্ণ এবং কিছুটা সহায়ক বই, এটি খুব কঠোর নয় এবং এটি অ্যালগোরিদম সম্পর্কিত অনেকগুলি গুরুত্বপূর্ণ প্রযুক্তিগত বিবরণ বাদ দেয় এবং সাধারণকরণের কোনও সীমা সম্পূর্ণরূপে বাদ দেয়। মেশিন লার্নিংয়ের ফাউন্ডেশনগুলি মেশিন লার্নিংয়ের জন্য সর্বাধিক বিস্তৃত বই (যা ক্ষেত্রের সেরা কয়েকজন লিখেছেন বলে দেখার অর্থ হয়)। তবে পাঠ্যপুস্তকটি উন্নত, তাই কেবল প্রযুক্তিগত বিবরণ থেকে সাবধান থাকুন।
উত্সাহ দেওয়ার জন্য আবদ্ধ সাধারণকরণ এখানে (প্রমাণ সহ) পাওয়া যাবে: http://www.cs.nyu.edu/~mohri/mls/lecture_6.pdf
আমি আশা করি এগুলি আপনার প্রশ্নের উত্তর দেওয়ার জন্য যথেষ্ট পয়েন্টার। আমি একটি সম্পূর্ণ উত্তর দিতে দ্বিধা বোধ করছি কারণ প্রয়োজনীয় সমস্ত বিবরণটি দেখতে প্রায় 50 পৃষ্ঠাগুলি লাগবে, প্রাথমিক আলোচনাটি ছেড়ে দেওয়া ...
শুভকামনা!