এটির সুনিশ্চিত করার একটি উপায় হ'ল "টিঙ্কারিং" এমনকি মডেলকে ফিট করার জন্য আপনি যে সমস্ত কিছু করছেন তা কোড আপ করে রেখেছেন তা নিশ্চিত করা । এইভাবে, আপনি যখন বারবার প্রক্রিয়াটি চালাবেন, ক্রস-বৈধকরণের মাধ্যমে বলুন, আপনি রানগুলির মধ্যে সামঞ্জস্য রেখেছেন। এটি নিশ্চিত করে যে পরিবর্তনের সম্ভাব্য সমস্ত উত্স ক্রস-বৈধকরণ প্রক্রিয়া দ্বারা ক্যাপচার করা হয়েছে।
অন্য অতি গুরুত্বপূর্ণ বিষয় হ'ল উভয় ডেটা সেটে আপনার প্রতিনিধি নমুনা রয়েছে তা নিশ্চিত করা। যদি আপনার ডেটা সেটটি পূর্বাভাস দেওয়ার জন্য যে ধরণের ডেটা ব্যবহার করার প্রত্যাশা করে থাকে সেগুলির প্রতিনিধিত্ব না করে তবে আপনি যা করতে পারেন তা খুব বেশি নেই। সমস্ত মডেলিং এমন একটি অনুমানের উপর নির্ভর করে যে "ইনডাকশন" কাজ করে - আমরা যে জিনিসগুলি পর্যবেক্ষণ করি নি সেগুলি আমরা পর্যবেক্ষণ করা জিনিসগুলির মতো আচরণ করে।
সাধারণ নিয়ম হিসাবে, জটিল মডেল ফিটিং পদ্ধতিগুলি থেকে দূরে থাকুন যতক্ষণ না (i) আপনি কী করছেন তা আপনি জানেন না এবং (ii) আপনি সহজ পদ্ধতিগুলি ব্যবহার করে দেখেছেন এবং দেখেছেন যে সেগুলি কার্যকর হয় না এবং জটিল পদ্ধতিটি কীভাবে সংশোধন করে সহজ পদ্ধতিতে সমস্যা। "সিম্পল" এবং "কমপ্লেক্স" অর্থ ফিটিং করা ব্যক্তিকে "সরল" বা "জটিল" অর্থে বোঝানো হয়। এটি এত গুরুত্বপূর্ণ হওয়ার কারণটি হ'ল এটি আপনাকে ফলাফলগুলিতে একটি "স্নিফ টেস্ট" বলতে চাইলে তা প্রয়োগ করতে দেয়। ফলাফল কি ঠিক দেখাচ্ছে? আপনি যে পদ্ধতিটি বুঝতে পারেন না তার ফলাফলগুলি আপনি "গন্ধ" নিতে পারবেন না।
উল্লেখ্য: এর পরে, আমার উত্তর এর বরং দীর্ঘ অংশ আমার অভিজ্ঞতা, যা হয় উপর ভিত্তি করে তৈরি এলাকা, সঙ্গে পি সম্ভবত বড়। আমি প্রায় নিশ্চিত যে নীচে যা কিছু অনুসরণ করা হবে তা এন ≈ পি বা এন < পি ক্ষেত্রে প্রযোজ্য হবে নাN>>p p N≈p N<p
যখন আপনার একটি বড় নমুনা থাকে, তখন প্রদত্ত পর্যবেক্ষণ ব্যবহার এবং না করার মধ্যে পার্থক্য খুব কম, তবে আপনার মডেলিং খুব "স্থানীয়" না হয়। এটি কারণ প্রদত্ত ডেটা পয়েন্টের প্রভাবটি সাধারণত 1 এর ক্রম । সুতরাং বড় ডেটা সেটগুলিতে, আপনি পরীক্ষার ডেটা সেটটি "হোল্ডিং" থেকে পেয়ে যাবেন সেগুলি মূলত প্রশিক্ষণ ডেটা সেটে এটির ব্যবহার থেকে প্রাপ্ত রেসিডুয়ালগুলির সমান। আপনি এটিকে সাধারণ সর্বনিম্ন স্কোয়ার ব্যবহার করে দেখাতে পারেন। অবশিষ্ট আপনি ব্যতীত থেকে পেতেআমিতম পর্যবেক্ষণ (অর্থাত যদি আমরা পরীক্ষা সেটে পর্যবেক্ষণ করা টেস্ট সেট ত্রুটি হবে) হয়ই টি ই গুলি টন আমি =(1-জআমিআমি)-1ই টি R একটি i n i , কোথায়e t r a i n i1Nietesti=(1−hii)−1etrainietrainiপ্রশিক্ষণ অবশিষ্ট, এবং বড় ধরনের লিভারেজ বা আমি তম ডাটা পয়েন্ট। এখন আমাদের কাছে ∑ i h i i = p রয়েছে , যেখানে p হল রিগ্রেশন-এ ভেরিয়েবলের সংখ্যা। এখন যদি এন > > পি , তাহলে এটি অত্যন্ত কঠিন কোন জ আমি আমি যথেষ্ট বড় পরীক্ষা সেট এবং ট্রেনিং সেট ত্রুটি মধ্যে একটি উপলব্ধিজনক পরিবর্তন আনতে হবে। আমরা একটি সরলীকৃত উদাহরণ নিতে পারি, ধরুন পি = 2 (ইন্টারসেপ্ট এবং 1 ভেরিয়েবল), এন × পিhiii∑ihii=ppN>>phiip=21N×pডিজাইনের ম্যাট্রিক্সটি (প্রশিক্ষণ এবং পরীক্ষার সেট উভয়) এবং লিভারেজটিX
hii=xTi(XTX)−1xi=1Ns2x(1xi)(x2¯¯¯¯¯−x¯¯¯−x¯¯¯1)(1xi)=1+x~2iN
x¯¯¯=N−1∑ixix2¯¯¯¯¯=N−1∑ix2is2x=x2¯¯¯¯¯−x¯¯¯2x~i=xi−x¯¯¯sxxi1N100x~i=5hii=261001−26100=74100100001−26100001%10000x~=5025%
N>>p2hii=xTiEET(XTX)−1EETxiEXTXΛhii=zTiΛ−1zi=∑pj=1z2jiΛjjzi=ETxixi
ketest{k}=(Ik−H{k})−1etrain{k}H{k}=X{k}(XTX)−1XT{k}X{k}N>>p
মূলত, বিআইসি বা এআইসির মতো প্রশিক্ষণ এবং পরীক্ষার ত্রুটির মধ্যে পার্থক্যের জন্য অ্যাকাউন্টে জরিমানার শব্দটি ব্যবহার করার ক্ষেত্রে এগুলি হ্রাস পায়। এটি কার্যকরভাবে পরীক্ষার সেট ব্যবহারের মতো একই ফলাফল অর্জন করে, তবে আপনি সম্ভাব্য দরকারী তথ্য ফেলে দিতে বাধ্য হন না। বিআইসির মাধ্যমে, আপনি মডেলটির পক্ষে প্রমাণগুলি সংশোধন করছেন যা গাণিতিকভাবে দেখাচ্ছে:
p(D|MiI)=p(y1y2…yN|MiI)
নোট করুন যে এই পদ্ধতিতে আমরা কোনও অভ্যন্তরীণ প্যারামিটার অনুমান করতে পারি না - প্রতিটি মডেল অবশ্যই সম্পূর্ণ নির্দিষ্ট করা উচিত বা এর অভ্যন্তরীণ পরামিতিগুলি একত্রিত করা উচিত। তবে, বারবার পণ্যের নিয়ম ব্যবহার করে, এবং তারপরে ফলাফলটির লগ গ্রহণ করে আমরা এই চেহারাটিকে ক্রস বৈধকরণের (কোনও নির্দিষ্ট ক্ষতি ফাংশন ব্যবহার করে) তৈরি করতে পারি:Mi
p(D|MiI)=p(y1|MiI)p(y2…yN|y1MiI)
=p(y1|MiI)p(y2|y1MiI)p(y3…yN|y1y2MiI)
=⋯=∏i=1Np(yi|y1…yi−1MiI)
⟹log[p(D|MiI)]=∑i=1Nlog[p(yi|y1…yi−1MiI)]
এটি ক্রস বৈধকরণের একটি ফর্মের পরামর্শ দেয়, তবে যেখানে প্রশিক্ষণ সেটটি নিয়মিত আপডেট করা হচ্ছে সেখানে পরীক্ষার সেট থেকে এক সময় এক পর্যবেক্ষণ - কালম্যান ফিল্টারের মতো। আমরা বর্তমান প্রশিক্ষণ সেট ব্যবহার করে পরীক্ষা সেট থেকে পরবর্তী পর্যবেক্ষণের পূর্বাভাস দিচ্ছি, শর্তাধীন লগ-সম্ভাবনা ব্যবহার করে পর্যবেক্ষণকৃত মান থেকে বিচ্যুতি পরিমাপ করব এবং তারপরে নতুন পর্যবেক্ষণটি অন্তর্ভুক্ত করার জন্য প্রশিক্ষণ সেটটি আপডেট করব। তবে মনে রাখবেন যে এই পদ্ধতিটি উপলব্ধ সমস্ত ডেটা পুরোপুরি হজম করে, একই সাথে প্রতিটি তদারকিকে "আউট-অফ-স্যাম্পল" কেস হিসাবে পরীক্ষা করা হয় কিনা তা নিশ্চিত করে। এটিও আক্রমণকারী, আপনি "পর্যবেক্ষণ 1" বা "পর্যবেক্ষণ 10" বলুন তাতে কিছু আসে যায় না; ফলাফল একই (গণনাগুলি অন্যের তুলনায় কিছু অনুক্রমের পক্ষে সহজতর হতে পারে)। ক্ষতির ফাংশনটিও "অভিযোজিত" এটি যদি আমরা সংজ্ঞায়িত করি এল আই আমিLi=log[p(yi|y1…yi−1MiI)] , তবে এর তীক্ষ্ণতা উপর নির্ভর করে , কারণ লোকসান ফাংশনটি প্রতিনিয়ত নতুন ডেটা দিয়ে আপডেট হচ্ছে।Lii
আমি পরামর্শ দেব যে এইভাবে ভবিষ্যদ্বাণীপূর্ণ মডেলগুলি মূল্যায়ন করা বেশ ভাল কাজ করবে।