তাৎপর্য পরীক্ষা বা ক্রস বৈধতা?


20

পারস্পরিক সম্পর্কযুক্ত ভেরিয়েবলগুলি নির্বাচনের জন্য দুটি সাধারণ পন্থা হ'ল তাত্পর্য পরীক্ষা এবং ক্রস বৈধতা। প্রতিটি সমস্যার সমাধান করার জন্য কী চেষ্টা করে এবং আমি কখন অন্যটির চেয়ে বেশি পছন্দ করব?

উত্তর:


22

প্রথমে, সুস্পষ্ট হয়ে প্রশ্নটিকে একাধিক লিনিয়ার রিগ্রেশন প্রসঙ্গে রাখতে পারি যেখানে আমরা প্যারামিটার ভেক্টর সহ একাধিক বিভিন্ন ভেরিয়েবল (সম্পর্কযুক্ত বা না) একটি প্রতিক্রিয়া ভেরিয়েবল, এবং রিগ্রেশন ফাংশন যা প্রতিক্রিয়ার ভেরিয়েবলের গড়ের মডেল হতে পারে এর প্রদত্ত পর্যবেক্ষণ । x 1 , , এক্স পি β = ( β 0 , β 1 , , β পি ) ( এক্স 1 , , এক্স পি ) = β 0 + β 1 এক্স 1 + + β পি x পি , এক্স 1 , , এক্স পিyx1,,xpβ=(β0,β1,...,βপি)

(এক্স1,...,এক্সপি)=β0+ +β1এক্স1+ +...+ +βপিএক্সপি,
এক্স1,...,এক্সপি

প্রশ্নটি কীভাবে একটি উপ- শূন্য-শূন্য হতে বেছে নেওয়া যায় এবং বিশেষত ক্রস বৈধকরণের বিপরীতে তাত্পর্যটির একটি তুলনা ।βআমি

পরিভাষা সম্পর্কে স্ফটিক পরিষ্কার করার জন্য, তাত্পর্য পরীক্ষাটি একটি সাধারণ ধারণা, যা বিভিন্ন প্রসঙ্গে বিভিন্নভাবে পরিচালিত হয়। উদাহরণস্বরূপ, এটি কোনও পরীক্ষার পরিসংখ্যানের পছন্দের উপর নির্ভর করে। প্রত্যাশিত জেনারেলাইজেশন ত্রুটির অনুমানের জন্য ক্রস বৈধতা সত্যই একটি অ্যালগরিদম , যা গুরুত্বপূর্ণ সাধারণ ধারণা এবং এটি কোনও ক্ষতির ফাংশন বাছাইয়ের উপর নির্ভর করে।

প্রত্যাশিত সাধারণীকরণ ত্রুটি আনুষ্ঠানিকভাবে সংজ্ঞায়িত করতে একটু টেকনিক্যাল, কিন্তু কথায় এটা একটি লাগানো মডেল প্রত্যাশিত ক্ষয় যখন একটি স্বাধীন ডেটা সেট উপর ভবিষ্যদ্বাণী করার জন্য ব্যবহৃত হয়, যেখানে প্রত্যাশা প্রাক্কলন সেইসাথে নিরপেক্ষ ডেটার জন্য ব্যবহৃত ডেটা শেষ হয়ে গেছে পূর্বাভাস জন্য ব্যবহৃত সেট।

যুক্তিসঙ্গত তুলনা করতে কে 0 এর সমান নেওয়া যায় কি না ফোকাস দেওয়া যায় ।β1

  • জন্য তাত্পর্য পরীক্ষামূলক এর নাল হাইপোথিসিস যে প্রধান পদ্ধতি একটি গনা হয় -value, যা সম্ভাব্যতা যে মনোনীত পরীক্ষা পরিসংখ্যাত আমাদের তথ্য সেট পরিলক্ষিত চেয়ে বড় নাল হাইপোথিসিস অধীনে , যে, যখন ধরে যে । ব্যাখ্যাটি হ'ল একটি ছোট মূল্য হ'ল নাল অনুমানের বিরুদ্ধে প্রমাণ। "ছোট" অর্থ একটি নিখুঁত অর্থে যেমন বিখ্যাত 0.05 বা 0.01 তাত্পর্য স্তরগুলির অর্থের জন্য সাধারণত ব্যবহৃত নিয়ম রয়েছে।β1=0পিβ1=0পি
  • জন্য প্রত্যাশিত সাধারণীকরণ ত্রুটি আমরা গনা, সম্ভবত ক্রস বৈধতা, ভাবনাটি হলো এই যে অধীনে প্রত্যাশিত সাধারণীকরণ ত্রুটির একটি অনুমান ব্যবহার । এই পরিমাণটি আমাদের জানায় যে আমরা যে পদ্ধতিটি ব্যবহার করি তার দ্বারা মডেলগুলি কতটা ভালভাবে ফিট করে এবং , স্বাধীন ডেটাতে ভবিষ্যদ্বাণী করার জন্য ব্যবহৃত হলে গড় সঞ্চালিত হবে । একটি বৃহত প্রত্যাশিত জেনারেলাইজেশন ত্রুটিটি খারাপ, তবে এটির কতটুকু খারাপ হওয়া দরকার তা সম্পর্কে তার নিখুঁত মানটির কোনও নিয়ম নেই। আমাদের সেই মডেলটির প্রত্যাশিত সাধারণীকরণ ত্রুটিটি অনুমান করতে হবে যেখানে 0 থেকে আলাদা হতে দেওয়া হয় এবং তারপরে আমরা দুটি আনুমানিক ত্রুটি তুলনা করতে পারি। যেটি সবচেয়ে ছোট তা আমাদের চয়ন করা মডেলের সাথে সামঞ্জস্য করে। β1=0β1=0β1

ব্যবহার পরীক্ষা তাত্পর্য আমরা সরাসরি অন্যান্য মডেলের বনাম নাল হাইপোথিসিস অধীনে মডেল "পারফরমেন্স" সঙ্গে সংশ্লিষ্ট করা হয় না, কিন্তু আমরা হয় সঙ্গে সংশ্লিষ্ট দলিল যে নাল ভুল। এটি একটি নিশ্চিতকরণমূলক সেটআপে আমার কাছে সর্বাধিক অর্থবহ হয়ে ওঠে যেখানে মূল উদ্দেশ্যটি একটি প্রাথমিকভাবে নির্দিষ্ট বৈজ্ঞানিক নিশ্চিত করা এবং এটি নথিভুক্ত করা, যা হিসাবে সূত্রবদ্ধ হতে পারে ।β10

অন্যদিকে প্রত্যাশিত সাধারণীকরণ ত্রুটিটি কেবল প্রত্যাশিত পূর্বাভাস ক্ষতির ক্ষেত্রে গড় "পারফরম্যান্স" নিয়েই উদ্বিগ্ন এবং এই সিদ্ধান্তে পৌঁছানো যে কে পূর্বাভাসের ক্ষেত্রে 0 থেকে আলাদা হতে দেওয়া ভাল , নথিভুক্ত করার চেষ্টা নয় যে 0 থেকে "সত্যিই আলাদা" অর্থ যাই হোক না কেন।β1β1-

আমি ব্যক্তিগতভাবে এমন কোনও সমস্যায় কখনও কাজ করি নি যেখানে আমার আনুষ্ঠানিকভাবে তাত্পর্য পরীক্ষা করার প্রয়োজন হয়েছিল, তবুও মূল্যবোধগুলি আমার কাজগুলিতে তাদের পথ খুঁজে বের করে এবং পরিবর্তনশীল নির্বাচনের জন্য বুদ্ধিমান গাইড এবং প্রথম ইমপ্রেশন দেয় do আমি যাইহোক, বেশিরভাগ আনুষ্ঠানিক মডেল নির্বাচনের জন্য জেনারালাইজেশন ত্রুটির সাথে মিল রেখে লসোর মতো দণ্ডবিধির পদ্ধতি ব্যবহার করছি এবং আমি ধাপগুলিও গণনা করার জন্য আমার প্রবণতাটি ধীরে ধীরে দমন করার চেষ্টা করছি । পিপি

অনুসন্ধানী বিশ্লেষণের জন্য আমি তাত্পর্য পরীক্ষা এবং মূল্যগুলির পক্ষে কোনও যুক্তি দেখতে পাই না এবং আমি অবশ্যই পরিবর্তনশীল নির্বাচনের জন্য প্রত্যাশিত সাধারণীকরণ ত্রুটির মতো একটি ধারণার উপর দৃষ্টি নিবদ্ধ করার পরামর্শ দেব। অন্যান্য প্রসঙ্গে যেখানে এক একটি ব্যবহারের বিষয়ে বিবেচনা পারে দলিল যে জন্য -value 0 নয়, আমি বলতে হবে এটি প্রায় সবসময় ভালো ধারণা একটি অনুমান প্রতিবেদন করতে হয় এর পরিবর্তে একটি আস্থা ব্যবধান।পিপিβ1β1


17

কেবলমাত্র তাত্পর্য পরীক্ষা এবং মডেল নির্বাচন সম্পাদন করার জন্য একটি ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে আরও বেশি ব্যবহার করা আপনাকে বিশ্বাস করতে পারে যে আপনি যখন ভবিষ্যতে ভবিষ্যদ্বাণীকারীদের সাথে খুব দৃ model় মডেল রাখেন যখন আপনি বাস্তবে না করেন; আপনি সুযোগের সাথে দৃ strong় সম্পর্ক স্থাপন করতে পারেন এবং আপনি অপ্রয়োজনীয় ভবিষ্যদ্বাণীকারীদের অপসারণ করার সাথে সাথে এই সম্পর্কগুলি আপাতদৃষ্টিতে বাড়ানো যেতে পারে।

নির্বাচনের পদ্ধতি অবশ্যই ফলাফলের সাথে সবচেয়ে শক্তিশালী পারস্পরিক সম্পর্কের সাথে কেবল সেই পরিবর্তনশীল রাখে এবং ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে বাড়ানোর ধরণের সম্ভাবনাটি আপনার কল্পনার চেয়েও বড় হয়ে যায়। এর কারণ এটি হল যে স্ট্যান্ডার্ড ত্রুটিগুলি (এবং এইভাবে পি-মানগুলি) এ বিষয়টি বিবেচনায় রাখতে সামঞ্জস্য করা হয়নি যে চলকগুলি এলোমেলোভাবে মডেলটিতে অন্তর্ভুক্তির জন্য নির্বাচন করা হয়নি এবং সেই সেটটি বেছে নেওয়ার জন্য একাধিক অনুমান পরীক্ষা করা হয়েছিল।

ডেভিড Freedman একটি চতুর কাগজ যেখানে তিনি এই পয়েন্ট নামক প্রমান আছে " টিকা রিগ্রেশন সমীকরণ স্ক্রীনিং উপর ।" বিমূর্ত:

একটি প্রেক্ষাপটে একটি রিগ্রেশন মডেল বিকাশ বিবেচনা করুন যেখানে তাত্ত্বিক তত্ত্ব দুর্বল। চূড়ান্ত ক্ষেত্রে ফোকাস করার জন্য, ধরুন বাস্তবে নির্ভরশীল ভেরিয়েবল এবং ব্যাখ্যামূলক ভেরিয়েবলগুলির মধ্যে কোনও সম্পর্ক নেই। তবুও, যদি অনেকগুলি ব্যাখ্যামূলক ভেরিয়েবল থাকে তবে উচ্চ হবে। যদি ছোট টি স্ট্যাটিস্টিক সহ ব্যাখ্যামূলক ভেরিয়েবলগুলি বাদ দেওয়া হয় এবং সমীকরণটি রিফিট হয় তবে উচ্চ থাকবে এবং সামগ্রিক এফ অত্যন্ত তাৎপর্যপূর্ণ হয়ে উঠবে। এটি সিমুলেশন এবং অ্যাসিপটোটিক গণনা দ্বারা প্রদর্শিত হয়।আর2আর2

এই সমস্যার একটি সম্ভাব্য সমাধান, যেমন আপনি উল্লেখ করেছেন, ক্রস বৈধতার বৈকল্পিক ব্যবহার করছে। আমার মডেলকে বিশ্বাস করার মতো যখন আমার কাছে কোনও ভাল অর্থনৈতিক (আমার গবেষণার ক্ষেত্র) বা পরিসংখ্যানগত কারণ না থাকে তখন উপযুক্ত মডেল নির্বাচন করা এবং অনুমান সম্পাদন করার ক্ষেত্রে এটি আমার পছন্দসই পদ্ধতি approach

অন্যান্য উত্তরদাতারা উল্লেখ করতে পারেন যে এআইসি বা বিআইসির সাহায্যে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ফেলা ছাড়াই ক্রম বৈধকরণের সমকক্ষ equivalent এটি কেবল ভবিষ্যদ্বাণীকারীদের সংখ্যার তুলনায় পর্যবেক্ষণের সংখ্যা হিসাবে কাজ করে। পর্যবেক্ষণের সংখ্যার তুলনায় অনেকগুলি ভেরিয়েবল থাকার প্রসঙ্গে (ফ্রেডম্যান 10 বা তার চেয়ে কম পর্যবেক্ষণে 1 ভেরিয়েবল বলে), এই পদ্ধতিতে নির্বাচন উপরোক্ত আলোচিত দরিদ্র বৈশিষ্ট্যগুলি প্রদর্শন করতে পারে।

শক্তিশালী কম্পিউটারের যুগে, ধাপে ধাপে বাছাইয়ের উপর দিয়ে কোনও মডেল নির্বাচন পদ্ধতি হিসাবে ক্রস বৈধতা ব্যবহার না করার কোনও কারণ আমি দেখতে পাচ্ছি না।


আপনি কি এআইসি বা বিআইসি ব্যবহার করে পদক্ষেপের প্রক্রিয়াগুলির জন্য একটি রেফারেন্স দিতে পারবেন যেহেতু ক্রস বৈধকরণের সমকক্ষ ? বৈধতা অতিক্রম করার জন্য আমি এআইসি / বিআইসির সমতুল্যতা সম্পর্কে পড়েছি, তবে ধাপে ধাপে সেটিংয়ে নেই।
রিচার্ড হার্ডি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.