একটি পরিসংখ্যান পদ্ধতির অনুমান কি ?
আমি কোনও পরিসংখ্যানবিদ নই এবং তাই এটি ভুল হতে পারে তবে আমি মনে করি "অনুমান" শব্দটি প্রায়শই বেশ কিছু অনানুষ্ঠানিকভাবে ব্যবহৃত হয় এবং বিভিন্ন বিষয়কে বোঝায়। আমার কাছে, একটি "অনুমান" হ'ল কঠোরভাবে বলতে গেলে এমন কিছু যা কেবলমাত্র একটি তাত্ত্বিক ফলাফল (উপপাদ্য) পেতে পারে।
লোকেরা যখন লিনিয়ার রিগ্রেশন অনুমানের বিষয়ে কথা বলেন ( এখানে গভীরতর আলোচনার জন্য দেখুন) তখন তারা সাধারণত গাউস-মার্কোভ উপপাদ্যকে উল্লেখ করে যা বলে যে অসম্পৃক্ত, সম-বৈকল্পিকতা, শূন্য-গড় ত্রুটিগুলির অনুমানের অধীনে , ওএলএসের অনুমানটি হ'ল ব্লু , অর্থাৎ নিরপেক্ষ এবং এর নূন্যতম বৈকল্পিক রয়েছে। গাউস-মার্কোভের উপপাদ্যের প্রসঙ্গের বাইরে, "রিগ্রেশন অনুমান" এর অর্থ কী হবে তা আমার কাছে পরিষ্কার নয়।
একইভাবে, একটি অনুমান, বলুন, এক-নমুনা টি-পরীক্ষা অনুমানগুলি বোঝায় যার অধীনে স্ট্যাটাস্টিক টি- বিতরণযোগ্য এবং তাই অনুমানটি বৈধ। একে "উপপাদ্য" বলা হয় না, তবে এটি একটি গাণিতিক ফলাফল: যদি n নমুনাগুলি সাধারণত বিতরণ করা হয় তবে t- statistic শিক্ষার্থীর t অনুসরণ করবেটিটিএনটিটি বিতরণকে ডিগ্রি সহ স্বাধীনতা ।n - 1
দণ্ডিত রিগ্রেশন কৌশলগুলির অনুমান
এখন যে কোনো নিয়মিত রিগ্রেশন কৌশল বিবেচনা করুন: শৈলশিরা প্রত্যাবৃত্তি, Lasso, ইলাস্টিক নেট, প্রধান উপাদান রিগ্রেশন, আংশিক লিস্ট স্কোয়ার রিগ্রেশন, ইত্যাদি ইত্যাদি এই পদ্ধতি পুরো পয়েন্ট একটি করা হয় পক্ষপাতদুষ্ট রিগ্রেশন প্যারামিটার অনুমান, এবং প্রত্যাশিত কমাতে প্রত্যাশী পক্ষপাতিত্ব-বৈকল্পিক বাণিজ্য বন্ধ ব্যবহার করে ক্ষতি।
এই সমস্ত পদ্ধতির মধ্যে এক বা একাধিক নিয়মিতকরণ পরামিতি অন্তর্ভুক্ত রয়েছে এবং এগুলির কোনওটিরই এই পরামিতির মানগুলি নির্বাচন করার জন্য একটি নির্দিষ্ট নিয়ম নেই। সর্বোত্তম মানটি সাধারণত কিছু ধরণের ক্রস-বৈধকরণ পদ্ধতির মাধ্যমে পাওয়া যায় তবে ক্রস-বৈধকরণের বিভিন্ন পদ্ধতি রয়েছে এবং তারা কিছুটা আলাদা ফলাফলও অর্জন করতে পারে। তদতিরিক্ত, ক্রস-বৈধতা ছাড়াও থাম্বের কিছু অতিরিক্ত নিয়ম মেনে চলা অস্বাভাবিক নয়। ফলস্বরূপ, প্রকৃত ফলাফল ββ^ এই শাস্তি রিগ্রেশন পদ্ধতি কোনো না আসলে সম্পূর্ণরূপে পদ্ধতি দ্বারা সংজ্ঞায়িত করা হয়, কিন্তু বিশ্লেষক এর পছন্দের উপর নির্ভর করতে পারেন।
সুতরাং আমার কাছে স্পষ্ট নয় সেখানে কিভাবে সম্পর্কে কোনো তাত্ত্বিক optimality বিবৃতি হতে পারে ββ^ , এবং তাই আমি নিশ্চিত নই যেমন শৈলশিরা রিগ্রেশন যেমন শাস্তি পদ্ধতির "অনুমানের" (উপস্থিতি বা উহার অনুপস্থিতি) সম্পর্কে কথা বলা এ সব জ্ঞান করে তোলে যে।
তবে গাণিতিক ফলাফল সম্পর্কে কী বলা যায় যে রিজ রিগ্রেশন সর্বদা ওএলএসকে পরাজিত করে?
λβλ , যা ডেটা সেটটি নির্ভর হতে হবে।
এই ফলাফলটি আসলে কোনও অনুমানের প্রয়োজন হয় না এবং সর্বদা সত্য, তবে এটি দাবি করা অবাক হবে যে রিজ রিগ্রেশনটির কোনও অনুমান নেই।
ঠিক আছে, তবে আমি কীভাবে জানব যে আমি রিজ রিগ্রেশন প্রয়োগ করতে পারি কিনা?
আমি বলব যে আমরা অনুমানের কথা বলতে না পারলেও আমরা সে সম্পর্কে কথা বলতে পারি থাম্বের বিধি । এটি সুপরিচিত যে রিজ রিগ্রেশন প্রাসঙ্গিক পূর্বাভাসকারীদের সাথে একাধিক রিগ্রেশন ক্ষেত্রে সবচেয়ে কার্যকর হতে পারে be এটি সুপরিচিত যে এটি ওএলএসকে প্রায়শই বড় ব্যবধানে ছাড়িয়ে যায়। এটি হিটারোসিসেস্টাস্টিটি, পারস্পরিক সম্পর্কযুক্ত ত্রুটি বা অন্য যে কোনও ক্ষেত্রে এটি ছাড়িয়ে যায়। সুতরাং থাম্বের সহজ নিয়মটি বলে যে আপনার যদি মাল্টিকোল্লাইনারি ডেটা থাকে তবে রিজ রিগ্রেশন এবং ক্রস-বৈধকরণ ভাল ধারণা।
থাম্ব এবং বাণিজ্যের কৌশলগুলি সম্ভবত অন্যান্য দরকারী নিয়ম রয়েছে (যেমন যেমন স্থূল আউটলিয়ারদের সাথে কী করা উচিত)। তবে সেগুলি অনুমান নয়।
পিপি