একাধিক রৈখিক প্রতিরোধের জন্য সর্বনিম্ন পর্যবেক্ষণের সংখ্যা


12

আমি একাধিক লিনিয়ার রিগ্রেশন করছি। আমার 21 টি পর্যবেক্ষণ এবং 5 ভেরিয়েবল রয়েছে। আমার উদ্দেশ্যটি কেবল ভেরিয়েবলের মধ্যে সম্পর্ক সন্ধান করা

  1. আমার ডেটা একাধিক রিগ্রেশন করার জন্য যথেষ্ট সেট?
  2. টি-পরীক্ষার ফলাফলটি প্রকাশ করেছে আমার ভেরিয়েবলগুলির মধ্যে 3 টি উল্লেখযোগ্য নয়। উল্লেখযোগ্য ভেরিয়েবলগুলি (বা আমার প্রথম প্রতিরোধের উপসংহারটি পাওয়ার জন্য যথেষ্ট) দিয়ে আবার কি আমার প্রতিরোধের দরকার? আমার পারস্পরিক সম্পর্ক ম্যাট্রিক্স অনুসরণ হিসাবে

           var 1   var 2    var 3   var 4   var 5     Y
    var 1   1.0     0.0       0.0   -0.1    -0.3    -0.2
    var 2   0.0     1.0       0.4    0.3    -0.4    -0.4
    var 3   0.0     0.4       1.0    0.7    -0.7    -0.6
    var 4  -0.1     0.3       0.7    1.0    -0.7    -0.9
    var 5  -0.3    -0.4      -0.7   -0.7    1.0      0.8
    Y      -0.2    -0.4      -0.6   -0.9    0.8      1.0
    

var 1 এবং var 2 হল চলতি চলক এবং var 3 থেকে 5are শ্রেণিবদ্ধ ভেরিয়েবল এবং y হ'ল আমার নির্ভরশীল পরিবর্তনশীল।

এটি উল্লেখযোগ্য পরিবর্তনশীল হিসাবে উল্লেখ করা উচিত যা আমার নির্ভরশীল ভেরিয়েবলের উপর সবচেয়ে প্রভাবশালী কারণ হিসাবে আমার ডেটা সীমাবদ্ধতার কারণে আমার রিগ্রেশন ভেরিয়েবলগুলির মধ্যে নয়। এই গুরুত্বপূর্ণ পরিবর্তনশীল ব্যতীত এখনও রিগ্রেশন করার জন্য কি বোধগম্য?

এখানে আমার আত্মবিশ্বাসের ব্যবধান

    Varibales   Regression Coefficient  Lower 95% C.L.  Upper 95% C.L.
    Intercept   53.61                       38.46        68.76
    var 1       -0.39                      -0.97         0.19
    var 2       -0.01                      -0.03         0.01
    var 3        5.28                      -2.28         12.84
    var 4       -27.65                     -37.04       -18.26
    **var 5      11.52                      0.90         22.15**

উত্তর:


17

থাম্বের সাধারণ নিয়ম (ফ্র্যাঙ্ক হ্যারেলের বই, রিগ্রেশন মডেলিং কৌশলগুলির স্টাফের উপর ভিত্তি করে ) হ'ল যদি আপনি যুক্তিসঙ্গত শক্তির সাথে যুক্তিসঙ্গত আকারের প্রভাবগুলি সনাক্ত করতে সক্ষম হন , তবে আপনার অনুমান অনুসারে 10-20 পর্যবেক্ষণ প্রয়োজন। হ্যারেল পিসিএ-র মতো "মাত্রা হ্রাস" (আপনার সহকর্মীদের সংখ্যা আরও যুক্তিসঙ্গত আকারে নামিয়ে আনার) জন্য প্রচুর বিকল্পগুলি নিয়ে আলোচনা করেছেন তবে সর্বাধিক গুরুত্বপূর্ণ বিষয়টি হচ্ছে ফলাফলের মাত্রা হ্রাস সম্পর্কে কোনও আস্থা রাখতে হলে অবশ্যই করতে হবে প্রতিক্রিয়া পরিবর্তনশীল না তাকিয়ে । আপনি উপরে উল্লেখ হিসাবে কেবলমাত্র উল্লেখযোগ্য পরিবর্তনশীলগুলির সাথে আবারও রিগ্রেশন করা প্রায় প্রতিটি ক্ষেত্রেই খারাপ ধারণা।

তবে, যেহেতু আপনি কোনও ডেটা সেট এবং আপনার আগ্রহী কোভেরিয়েটের একটি সেট আটকে আছেন, তাই আমি মনে করি না যে একাধিক রিগ্রেশন এইভাবে চালানো সহজাত ভুল wrong আমি মনে করি সেরা মডেল থেকে ফলাফলগুলি যেমন হয় তেমনই গ্রহণ করা সবচেয়ে ভাল হবে (কিছু বাস্তব ক্ষেত্রে "বড়" হিসাবে উল্লেখযোগ্য প্রভাবগুলি অনুমান করা হচ্ছে কিনা তা দেখার জন্য বিন্দু অনুমান এবং আত্মবিশ্বাসের অন্তরগুলি দেখতে ভুলবেন না- বিশ্ববোধ, এবং অ-তাত্পর্যপূর্ণ প্রভাবগুলি আসলে উল্লেখযোগ্য প্রভাবগুলির চেয়ে ছোট বলে অনুমান করা হয় কিনা)।

আপনার ক্ষেত্রটি গুরুত্বপূর্ণ বলে বিবেচনা করে এমন ভবিষ্যদ্বাণীকারীকে ছাড়াই বিশ্লেষণ করার কোনও অর্থ হয় কিনা তা সম্পর্কে: আমি জানি না। এটি নির্ভর করে মডেলের উপর নির্ভর করে আপনি কী ধরণের সূচনা তৈরি করতে চান। সংকীর্ণ অর্থে, রিগ্রেশন মডেলটি এখনও সুনির্দিষ্টভাবে সংজ্ঞায়িত হয়েছে ("এই প্রতিক্রিয়ার উপর এই ভবিষ্যদ্বাণীদের প্রান্তিক প্রভাবগুলি কী?") তবে আপনার ক্ষেত্রের কেউ সম্ভবত সঠিকভাবে বলতে পারেন যে বিশ্লেষণটি কেবল অর্থবোধ করে না। এটি যদি আপনাকে জানত যে আপনার নিকট ভবিষ্যদ্বাণীগুলি সুপরিচিত ভবিষ্যদ্বাণী (যাই হোক না কেন) এর সাথে সম্পর্কহীন, বা সেই সুপরিচিত ভবিষ্যদ্বাণী আপনার ডেটার জন্য ধ্রুবক বা প্রায় ধ্রুবক: তবে কমপক্ষে আপনি এটি বলতে পারেন সুপরিচিত ভবিষ্যদ্বাণী ব্যতীত অন্য কোনও কিছুর প্রতিক্রিয়াতে প্রভাব ফেলে।


মন্তব্যের জন্য ধন্যবাদ, তবে আমি বুঝতে পারি না আত্মবিশ্বাসের ব্যবধান যাচাই করার মূল বিষয়টি কী?
উঠেছে

যেহেতু বেন ফ্র্যাঙ্কের পক্ষে জবাব দিয়েছে, আমি বেনের পক্ষে জবাব দেব এবং যদি তাঁর মনে অন্য কিছু থাকে তবে তিনি আমাকে সংশোধন করতে পারবেন। বেন পুরো মডেলটি ব্যবহার করে জাসুতের পরামর্শ দিচ্ছেন। তারপরে কমপক্ষে আপনি জানেন যে আপনি 5 এর সেট থেকে কোনও গুরুত্বপূর্ণ পরিবর্তনশীল ছাড়েন নি The অতিরিক্ত চাপ দেওয়ার সমস্যাটি ভবিষ্যদ্বাণীতে আঘাত করতে পারে তবে কমপক্ষে প্যারামিটারগুলির জন্য আপনার আত্মবিশ্বাসের বিরতি রয়েছে এবং ভবিষ্যদ্বাণীটির জন্য আপনি আত্মবিশ্বাসের অন্তর পেতে পারেন। আমি মনে করি যে যদি আপনার কাছে কোনও কোলাইনারিটি সমস্যা এবং প্যারামিটারগুলির মধ্যে আস্থার
ব্যবধানগুলি থাকে

যদি মডেলটি এখনও স্বতন্ত্র ভেরিয়েবলগুলি অনুপস্থিত থাকে তবে ভবিষ্যদ্বাণীটি ভাল নাও হতে পারে এবং প্রদত্ত ডেটার উপর ভিত্তি করে ভবিষ্যদ্বাণী নির্ভুলতার মূল্যায়ন ভুল হতে পারে। মডেল অপব্যবহার সম্পর্কে উদ্বিগ্ন এবং সর্বদা অবশিষ্টগুলি পরীক্ষা করুন। ফ্র্যাঙ্ক হ্যারেল এই সাইটের একজন সক্রিয় সদস্য। সুতরাং আমি আশা করি যে এই প্রশ্নটি তার দৃষ্টি আকর্ষণ করবে এবং আমরা তখন সরাসরি তাঁর কাছ থেকে শুনতে পারি।
মাইকেল আর চেরনিক

আপনি সর্বদা গুরুত্বপূর্ণ ভেরিয়েবলগুলি অনুপস্থিত থাকতে পারেন এবং আপনি কখনই সত্যই জানতে পারবেন না ... আমি আত্মবিশ্বাসের ব্যবধানগুলি দেখার পরামর্শ দিয়েছিলাম কারণ কেবলমাত্র << এ ভেরিয়েবলটি উল্লেখযোগ্য কিনা তা জানতে চেয়ে অনেক তথ্য হারাচ্ছে। একটি দৃশ্যটি হ'ল আপনার সমস্ত প্যারামিটারগুলিতে প্রায় একই অনুমানের পরিমাণের প্রভাব রয়েছে তবে তাদের অনিশ্চয়তা আলাদা হয় যাতে কিছু তাৎপর্যপূর্ণ হয় এবং অন্যগুলি না হয়। আপনি অবশ্যই এই ক্ষেত্রে সিদ্ধান্ত নিতে চান না যে "ভেরিয়েবল এ এবং বি গুরুত্বপূর্ণ, ভেরিয়েবল সি, ডি এবং ই নয়"। সিআইএস আপনাকে এই তথ্য দেবে। p<0.05
বেন বলকার

আমার মনে হয় যে আলোচনাগুলি পর্যাপ্ত পর্যবেক্ষণের অভাবে এবং আমার ডেটা সেটে সর্বাধিক গুরুত্বপূর্ণ স্বতন্ত্র ভেরিয়েবলের অনুপস্থিতির কারণে আমার অবশ্যই উপসংহারটি পাওয়া উচিত: 1-উল্লেখযোগ্য ভেরিয়েবলগুলি চলকটি নয় যা টি-পরীক্ষায় উত্তীর্ণ হয়েছে। তাত্পর্যপূর্ণ একটি যা টি-পরীক্ষায় উত্তীর্ণ হয় এবং এর আত্মবিশ্বাসের ব্যবধানটি 0 সহ অন্তর্ভুক্ত থাকে না 2 2-অবশিষ্টের স্বাভাবিকতা অবশ্যই পরীক্ষা করা উচিত। 3-পারস্পরিক সম্পর্ক ম্যাট্রিক পরীক্ষা করা আবশ্যক।
উঠেছে

2

সাধারণ প্রশ্নের উত্তর হ'ল এটি অনেকগুলি বিষয়গুলির সাথে নির্ভর করে যা মূলত (1) সংখ্যার কোভারিয়েট (2) অনুমান এবং অবশিষ্টাংশের বৈকল্পিক। একটি ছোট নমুনা দিয়ে আপনার 0 থেকে পার্থক্য সনাক্ত করার মতো ক্ষমতা নেই So সুতরাং আমি রিগ্রেশন প্যারামিটারগুলির আনুমানিক বৈচিত্রটি দেখব। রিগ্রেশন সহ আমার অভিজ্ঞতা থেকে 5 ভেরিয়েবলের সাথে 21 টি পর্যবেক্ষণ ভেরিয়েবলগুলি বিভক্ত করার জন্য পর্যাপ্ত ডেটা নয়। সুতরাং আমি ভেরিয়েবলগুলি ছুঁড়ে ফেলার জন্য এত তাড়াতাড়ি করব না যে তাৎপর্যপূর্ণ বলে মনে হচ্ছে এমনগুলির সাথে খুব বেশি মোহিত হব না। আপনার কাছে আরও অনেক ডেটা না পাওয়া পর্যন্ত অপেক্ষা করা সর্বোত্তম উত্তর। কখনও কখনও এটি বলা সহজ তবে করা কঠিন। আমি ভেরিয়েবলগুলি কীভাবে নির্বাচিত হয় তা দেখার জন্য ধাপে ধাপে ধাপে ধাপে সামনের দিকে এগিয়ে যাওয়া এবং পশ্চাদপটে রিগ্রেশন দেখব। যদি কোভেরিয়েটগুলি অত্যন্ত সংযুক্ত থাকে তবে এটি নির্বাচন করা ভেরিয়েবলের খুব আলাদা সেট দেখায়। মডেল নির্বাচনের পদ্ধতিটিকে বুটস্ট্রেপ করুন যা ডেটা পরিবর্তনের ক্ষেত্রে পরিবর্তনশীল নির্বাচনের সংবেদনশীলতা প্রকাশ করে। আপনি covariates জন্য পারস্পরিক সম্পর্ক ম্যাট্রিক্স গণনা করা উচিত। সম্ভবত ফ্র্যাঙ্ক হ্যারেল এই সম্পর্কে চিমিয়ে উঠবে। তিনি পরিবর্তনশীল নির্বাচনের একজন সত্যিকারের বিশেষজ্ঞ। আমি মনে করি তিনি কমপক্ষে আমার সাথে একমত হবেন যে আপনি কেবল এই 21 ডেটা পয়েন্টের ভিত্তিতে একটি চূড়ান্ত মডেল বাছাই করবেন না।


আপনার পরামর্শের জন্য ধন্যবাদ। আমি আমার পারস্পরিক সম্পর্ক ম্যাট্রিক্স যুক্ত করেছি। আপনি কি মনে করেন এই সম্পর্কের সাথে ম্যাট্রিক্সের সাথে রিগ্রেশন করা যুক্তিসঙ্গত? কেবল জোর দিয়ে বলুন যে আমি আরও ডেটা সংগ্রহ করতে পারি না এবং আমি মডেল বা ভবিষ্যদ্বাণীও করতে চাই না। কেবলমাত্র আমি স্বাধীন ভেরিয়েবল এবং নির্ভরশীল ভেরিয়েবলের মধ্যে যে কোনও সম্ভাব্য সম্পর্ক খুঁজে পেতে চাই।
উঠেছে

পারস্পরিক সম্পর্ক সম্পর্কে কিছু ধারণা দেওয়ার জন্য পারস্পরিক সম্পর্ক মেট্রিক্স রয়েছে। অনুমানগুলির সম্ভবত বৃহত্তর বৈকল্পিকতা থাকবে এবং তাই স্ট্যাটিকাল তাত্পর্য ফোকাস করা উচিত নয়। ইপু কোলিনারিটির জন্য রিগ্রেশন ডায়াগোনস্টিকগুলিতে দেখতে পারে। এটা সাহায্য করতে পারে। তবে আমি ফিটগুলি কীভাবে পরিবর্তিত হয় এবং কোন ভেরিয়েবলগুলির সংমিশ্রণগুলি ভালভাবে কাজ করে এবং খারাপ কাজ করে তা দেখতে বিভিন্ন সাবসেট মডেলের দিকে নজর দেওয়ার পরামর্শ দেব। আমি সত্যই মনে করি ডেটা বুটস্ট্র্যাপিং আপনাকে ভবিষ্যদ্বাণীকারীদের নির্বাচনের স্থায়িত্ব সম্পর্কে কিছু দেখাবে।
মাইকেল আর চেরনিক

1
তবে তথ্যের অভাবে কিছুই তৈরি হবে না। আমি মনে করি আপনি কেবল দেখতে চান যে সেখানে একটি বা দুটি ভেরিয়েবল রয়েছে যা মনে হয় যে মাথাটি কাঁধে দাঁড়িয়ে আছে above তবে আপনি কিছু খুঁজে পেতে পারেন।
মাইকেল আর চেরনিক

আমরা ঠিক কি covariates বলতে কি বোঝাতে চাই? বলুন যে আমাদের কাছে কিছু পূর্বাভাসকারী ভেরিয়েবল , তাহলে কি বলে, একটি পৃথক কোভেরিয়েট হিসাবে গণনা করে? কেমন হয় , , ইত্যাদি যেহেতু এই ভবিষ্যতবক্তা মধ্যে কিছু কোরিলেশন সম্ভবতঃ তাদের আনুমানিক কোফিসিয়েন্টস "মূল্য" স্বাধীনতার চেয়ে কম 1 ডিগ্রী আছে। এবং রিগ্রেশন স্প্লিনস বা অন্যান্য স্থানীয় রিগ্রেশন সম্পর্কে কী বলা যায়: উপাদানগুলির নির্মাণে কেবল পর্যবেক্ষণের একটি উপসেট ব্যবহার করা হয় তার জন্য আমাদের কি অ্যাকাউন্টিং করতে হবে? এবং যদি আমরা ভবিষ্যদ্বাণীকারীদের ওজন প্রয়োগ করতে একটি কার্নেল ব্যবহার করি, তবে এটি কী কার্যকর পর্যবেক্ষণের সংখ্যাটিকে প্রভাবিত করে? xx2x3x4
হতবুদ্ধি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.