উত্তর:
প্রথমে, সুস্পষ্ট হয়ে প্রশ্নটিকে একাধিক লিনিয়ার রিগ্রেশন প্রসঙ্গে রাখতে পারি যেখানে আমরা প্যারামিটার ভেক্টর সহ একাধিক বিভিন্ন ভেরিয়েবল (সম্পর্কযুক্ত বা না) একটি প্রতিক্রিয়া ভেরিয়েবল, এবং রিগ্রেশন ফাংশন
যা প্রতিক্রিয়ার ভেরিয়েবলের গড়ের মডেল হতে পারে এর প্রদত্ত পর্যবেক্ষণ । x 1 , … , এক্স পি β = ( β 0 , β 1 , … , β পি ) চ ( এক্স 1 , … , এক্স পি ) = β 0 + β 1 এক্স 1 + … + β পি x পি , এক্স 1 , … , এক্স পি
প্রশ্নটি কীভাবে একটি উপ- শূন্য-শূন্য হতে বেছে নেওয়া যায় এবং বিশেষত ক্রস বৈধকরণের বিপরীতে তাত্পর্যটির একটি তুলনা ।
পরিভাষা সম্পর্কে স্ফটিক পরিষ্কার করার জন্য, তাত্পর্য পরীক্ষাটি একটি সাধারণ ধারণা, যা বিভিন্ন প্রসঙ্গে বিভিন্নভাবে পরিচালিত হয়। উদাহরণস্বরূপ, এটি কোনও পরীক্ষার পরিসংখ্যানের পছন্দের উপর নির্ভর করে। প্রত্যাশিত জেনারেলাইজেশন ত্রুটির অনুমানের জন্য ক্রস বৈধতা সত্যই একটি অ্যালগরিদম , যা গুরুত্বপূর্ণ সাধারণ ধারণা এবং এটি কোনও ক্ষতির ফাংশন বাছাইয়ের উপর নির্ভর করে।
প্রত্যাশিত সাধারণীকরণ ত্রুটি আনুষ্ঠানিকভাবে সংজ্ঞায়িত করতে একটু টেকনিক্যাল, কিন্তু কথায় এটা একটি লাগানো মডেল প্রত্যাশিত ক্ষয় যখন একটি স্বাধীন ডেটা সেট উপর ভবিষ্যদ্বাণী করার জন্য ব্যবহৃত হয়, যেখানে প্রত্যাশা প্রাক্কলন সেইসাথে নিরপেক্ষ ডেটার জন্য ব্যবহৃত ডেটা শেষ হয়ে গেছে পূর্বাভাস জন্য ব্যবহৃত সেট।
যুক্তিসঙ্গত তুলনা করতে কে 0 এর সমান নেওয়া যায় কি না ফোকাস দেওয়া যায় ।
ব্যবহার পরীক্ষা তাত্পর্য আমরা সরাসরি অন্যান্য মডেলের বনাম নাল হাইপোথিসিস অধীনে মডেল "পারফরমেন্স" সঙ্গে সংশ্লিষ্ট করা হয় না, কিন্তু আমরা হয় সঙ্গে সংশ্লিষ্ট দলিল যে নাল ভুল। এটি একটি নিশ্চিতকরণমূলক সেটআপে আমার কাছে সর্বাধিক অর্থবহ হয়ে ওঠে যেখানে মূল উদ্দেশ্যটি একটি প্রাথমিকভাবে নির্দিষ্ট বৈজ্ঞানিক নিশ্চিত করা এবং এটি নথিভুক্ত করা, যা হিসাবে সূত্রবদ্ধ হতে পারে ।
অন্যদিকে প্রত্যাশিত সাধারণীকরণ ত্রুটিটি কেবল প্রত্যাশিত পূর্বাভাস ক্ষতির ক্ষেত্রে গড় "পারফরম্যান্স" নিয়েই উদ্বিগ্ন এবং এই সিদ্ধান্তে পৌঁছানো যে কে পূর্বাভাসের ক্ষেত্রে 0 থেকে আলাদা হতে দেওয়া ভাল , নথিভুক্ত করার চেষ্টা নয় যে 0 থেকে "সত্যিই আলাদা" অর্থ যাই হোক না কেন।
আমি ব্যক্তিগতভাবে এমন কোনও সমস্যায় কখনও কাজ করি নি যেখানে আমার আনুষ্ঠানিকভাবে তাত্পর্য পরীক্ষা করার প্রয়োজন হয়েছিল, তবুও মূল্যবোধগুলি আমার কাজগুলিতে তাদের পথ খুঁজে বের করে এবং পরিবর্তনশীল নির্বাচনের জন্য বুদ্ধিমান গাইড এবং প্রথম ইমপ্রেশন দেয় do আমি যাইহোক, বেশিরভাগ আনুষ্ঠানিক মডেল নির্বাচনের জন্য জেনারালাইজেশন ত্রুটির সাথে মিল রেখে লসোর মতো দণ্ডবিধির পদ্ধতি ব্যবহার করছি এবং আমি ধাপগুলিও গণনা করার জন্য আমার প্রবণতাটি ধীরে ধীরে দমন করার চেষ্টা করছি ।
অনুসন্ধানী বিশ্লেষণের জন্য আমি তাত্পর্য পরীক্ষা এবং মূল্যগুলির পক্ষে কোনও যুক্তি দেখতে পাই না এবং আমি অবশ্যই পরিবর্তনশীল নির্বাচনের জন্য প্রত্যাশিত সাধারণীকরণ ত্রুটির মতো একটি ধারণার উপর দৃষ্টি নিবদ্ধ করার পরামর্শ দেব। অন্যান্য প্রসঙ্গে যেখানে এক একটি ব্যবহারের বিষয়ে বিবেচনা পারে দলিল যে জন্য -value 0 নয়, আমি বলতে হবে এটি প্রায় সবসময় ভালো ধারণা একটি অনুমান প্রতিবেদন করতে হয় এর পরিবর্তে একটি আস্থা ব্যবধান।
কেবলমাত্র তাত্পর্য পরীক্ষা এবং মডেল নির্বাচন সম্পাদন করার জন্য একটি ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে আরও বেশি ব্যবহার করা আপনাকে বিশ্বাস করতে পারে যে আপনি যখন ভবিষ্যতে ভবিষ্যদ্বাণীকারীদের সাথে খুব দৃ model় মডেল রাখেন যখন আপনি বাস্তবে না করেন; আপনি সুযোগের সাথে দৃ strong় সম্পর্ক স্থাপন করতে পারেন এবং আপনি অপ্রয়োজনীয় ভবিষ্যদ্বাণীকারীদের অপসারণ করার সাথে সাথে এই সম্পর্কগুলি আপাতদৃষ্টিতে বাড়ানো যেতে পারে।
নির্বাচনের পদ্ধতি অবশ্যই ফলাফলের সাথে সবচেয়ে শক্তিশালী পারস্পরিক সম্পর্কের সাথে কেবল সেই পরিবর্তনশীল রাখে এবং ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে বাড়ানোর ধরণের সম্ভাবনাটি আপনার কল্পনার চেয়েও বড় হয়ে যায়। এর কারণ এটি হল যে স্ট্যান্ডার্ড ত্রুটিগুলি (এবং এইভাবে পি-মানগুলি) এ বিষয়টি বিবেচনায় রাখতে সামঞ্জস্য করা হয়নি যে চলকগুলি এলোমেলোভাবে মডেলটিতে অন্তর্ভুক্তির জন্য নির্বাচন করা হয়নি এবং সেই সেটটি বেছে নেওয়ার জন্য একাধিক অনুমান পরীক্ষা করা হয়েছিল।
ডেভিড Freedman একটি চতুর কাগজ যেখানে তিনি এই পয়েন্ট নামক প্রমান আছে " টিকা রিগ্রেশন সমীকরণ স্ক্রীনিং উপর ।" বিমূর্ত:
একটি প্রেক্ষাপটে একটি রিগ্রেশন মডেল বিকাশ বিবেচনা করুন যেখানে তাত্ত্বিক তত্ত্ব দুর্বল। চূড়ান্ত ক্ষেত্রে ফোকাস করার জন্য, ধরুন বাস্তবে নির্ভরশীল ভেরিয়েবল এবং ব্যাখ্যামূলক ভেরিয়েবলগুলির মধ্যে কোনও সম্পর্ক নেই। তবুও, যদি অনেকগুলি ব্যাখ্যামূলক ভেরিয়েবল থাকে তবে উচ্চ হবে। যদি ছোট টি স্ট্যাটিস্টিক সহ ব্যাখ্যামূলক ভেরিয়েবলগুলি বাদ দেওয়া হয় এবং সমীকরণটি রিফিট হয় তবে উচ্চ থাকবে এবং সামগ্রিক এফ অত্যন্ত তাৎপর্যপূর্ণ হয়ে উঠবে। এটি সিমুলেশন এবং অ্যাসিপটোটিক গণনা দ্বারা প্রদর্শিত হয়।
এই সমস্যার একটি সম্ভাব্য সমাধান, যেমন আপনি উল্লেখ করেছেন, ক্রস বৈধতার বৈকল্পিক ব্যবহার করছে। আমার মডেলকে বিশ্বাস করার মতো যখন আমার কাছে কোনও ভাল অর্থনৈতিক (আমার গবেষণার ক্ষেত্র) বা পরিসংখ্যানগত কারণ না থাকে তখন উপযুক্ত মডেল নির্বাচন করা এবং অনুমান সম্পাদন করার ক্ষেত্রে এটি আমার পছন্দসই পদ্ধতি approach
অন্যান্য উত্তরদাতারা উল্লেখ করতে পারেন যে এআইসি বা বিআইসির সাহায্যে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ফেলা ছাড়াই ক্রম বৈধকরণের সমকক্ষ equivalent এটি কেবল ভবিষ্যদ্বাণীকারীদের সংখ্যার তুলনায় পর্যবেক্ষণের সংখ্যা হিসাবে কাজ করে। পর্যবেক্ষণের সংখ্যার তুলনায় অনেকগুলি ভেরিয়েবল থাকার প্রসঙ্গে (ফ্রেডম্যান 10 বা তার চেয়ে কম পর্যবেক্ষণে 1 ভেরিয়েবল বলে), এই পদ্ধতিতে নির্বাচন উপরোক্ত আলোচিত দরিদ্র বৈশিষ্ট্যগুলি প্রদর্শন করতে পারে।
শক্তিশালী কম্পিউটারের যুগে, ধাপে ধাপে বাছাইয়ের উপর দিয়ে কোনও মডেল নির্বাচন পদ্ধতি হিসাবে ক্রস বৈধতা ব্যবহার না করার কোনও কারণ আমি দেখতে পাচ্ছি না।