সমস্ত ইন্টারঅ্যাকশন শর্তাদি কি রিগ্রেশন মডেলটিতে তাদের স্বতন্ত্র পদগুলির প্রয়োজন?


68

আমি আসলে একটি পান্ডুলিপি পর্যালোচনা করছি যেখানে লেখকরা এআইসির সাথে 5-6 লগিট রিগ্রেশন মডেলগুলির তুলনা করে। যাইহোক, কিছু মডেলের স্বতন্ত্র কোভারিয়েট পদগুলি অন্তর্ভুক্ত না করে ইন্টারঅ্যাকশন শর্তাদি রয়েছে। এটি করার জন্য কি কখনও বুদ্ধি হয়?

উদাহরণস্বরূপ (লগইট মডেলগুলির জন্য সুনির্দিষ্ট নয়):

M1: Y = X1 + X2 + X1*X2
M2: Y = X1 + X2
M3: Y = X1 + X1*X2 (missing X2)
M4: Y = X2 + X1*X2 (missing X1)
M5: Y = X1*X2 (missing X1 & X2)

আমি সবসময় এই ধারণাটির মধ্যে ছিলাম যে আপনার যদি ইন্টারঅ্যাকশন শব্দটি এক্স 1 * এক্স 2 থাকে তবে আপনারও এক্স 1 + এক্স 2 দরকার। সুতরাং, 1 এবং 2 মডেলগুলি সূক্ষ্ম হবে তবে 3-5 মডেলগুলি সমস্যাযুক্ত হবে (এআইসি কম থাকলেও)। এটা কি সঠিক? এটি কোনও নিয়ম বা কোনও গাইডলাইন এর বেশি? কারও কি খুব ভাল রেফারেন্স রয়েছে যা এর পিছনে যুক্তিটি ব্যাখ্যা করে? আমি কেবল নিশ্চিত করতে চাই যে আমি পর্যালোচনায় গুরুত্বপূর্ণ কোনও বিষয়কে ভুলভাবে অভিযুক্ত করে না।

কোন চিন্তা জন্য ধন্যবাদ, ড্যান


8
+1, আমি মনে করি এটি সত্যিই একটি ভাল প্রশ্ন। আপনি একই আগের অঞ্চলটি জুড়ে থাকা এই আগের প্রশ্নটিও দেখতে চাইতে পারেন । উত্তরগুলিও দুর্দান্তভাবে দুর্দান্ত।
গুং

ইতিমধ্যে অনেক ভাল উত্তর। একটি ত্রুটি ঘটেছে Rindskopf দ্বারা কাগজ কিছু ক্ষেত্রে যেখানে আপনি কি উপর না প্রধান প্রভাব প্রয়োজন। (আরো দেখুন এই এক )
পিটার Flom

3
আফাইক: আর এর এলএম () তে, :মিথস্ক্রিয়াগুলির জন্য, যেমন: এ: বি। এবং *উভয় প্রধান প্রভাব এবং মিথস্ক্রিয়া জন্য, তাই A * B = A + B + A: B। সুতরাং যদি (!) কাগজের লেখকরা এই স্বরলিপিটি অনুসরণ করেন, তবে আমি মনে করি না যে কোনও মডেলের কোনও ইমেন প্রভাব অনুপস্থিত?
ঝুবার্ব

এছাড়াও, বর্তমান উত্তরের মতো একই যুক্তি উচ্চতর অর্ডার ইন্টারঅ্যাকশনগুলিতে প্রযোজ্য (যেমন আপনি যদি একটি 3 উপায় অন্তর্ভুক্ত করেন তবে আপনার সমস্ত 2 উপায় ইন্টারঅ্যাকশন প্রয়োজন)
পিটার ফ্লুম

উত্তর:


38

বেশিরভাগ সময় এটি একটি খারাপ ধারণা - মূল কারণটি হ'ল এটি আর মডেলটিকে অবস্থানের শিফটে পরিণত করে না। উদাহরণস্বরূপ, ধরুন আপনার একক ফলাফল এবং দুটি ভবিষ্যদ্বাণী এবং এবং মডেলটি নির্দিষ্ট করেছেন:yixizi

yi=β0+β1xizi+ε

আপনি যদি ভবিষ্যদ্বাণীদেরকে তাদের মাধ্যমে কেন্দ্র করে হয়ে যায়xizi

(xix¯)(ziz¯)=xizixiz¯zix¯+x¯z¯

সুতরাং, আপনি দেখতে পাচ্ছেন যে মূল প্রভাবগুলি আবার মডেলটিতে পুনঃপ্রবর্তিত হয়েছে।

আমি এখানে একটি তাত্ত্বিক যুক্তি দিয়েছি, তবে এটি একটি ব্যবহারিক সমস্যা উপস্থাপন করে। পৃষ্ঠা ১১৪ তে ফ্যারাওয়ে (২০০)) তে উল্লিখিত হিসাবে , স্কেলগুলিতে একটি যুক্তিযুক্ত পরিবর্তনটি যখন মডেলগুলির মূল প্রভাবগুলি বাদ দেয় তখন মডেল অনুমিতিকে পরিবর্তন করে, যখন নিম্ন অর্ডার শর্তাদি অন্তর্ভুক্ত করা হয় তখন এটি ঘটে না। লোকেশন শিফ্টের মতো স্বেচ্ছাসেবী বিষয়গুলি রাখা সাধারণত স্বাভাবিকভাবেই অনাকাঙ্ক্ষিত।

দ্রষ্টব্য: বিশেষ পরিস্থিতিতে থাকতে পারে যেখানে আপনি কেবল ইন্টারঅ্যাকশনটি অন্তর্ভুক্ত করতে চাইবেন, যদি এর কিছু নির্দিষ্ট অর্থ থাকে বা আপনি যদি কেবল পণ্যটি পর্যবেক্ষণ করেন এবং পৃথক ভেরিয়েবল । তবে, সেক্ষেত্রে কেউ ভবিষ্যদ্বাণীকারী সম্পর্কেও ভাবতে পারে এবং মডেলটি নিয়ে এগিয়ে যেতে পারেx i , z i a i = x i z ixizixi,ziai=xizi

yi=α0+α1ai+εi

পরিবর্তে একটি মিথস্ক্রিয়া শব্দ হিসাবে চিন্তা করা ।ai


additive change in scale changes the inference (the t -statistics) for all but the highest order terms when any lower order terms are left out of the modelপূর্বাভাসীদের সংযোজনীয় পরিবর্তন সাধারণত একটি সম্পূর্ণ মডেল এমনকি তাদের মূল প্রভাবের (নিম্ন ক্রমের শর্তাদি) টি পরিবর্তন করে । এটি সামগ্রিকভাবে ফিট (আর ^ 2) যা সংরক্ষিত (তবে কিছু মডেল বাদ দিয়ে কোনও মডেলটিতে অ্যাডেটিভ পরিবর্তনের অধীনে সংরক্ষণ করা হয় না)। আপনি কি বলতে চেয়েছিলেন?
ttnphns

হ্যাঁ, এটি ঠিক @ttnphns - এটি উল্লেখ করার জন্য ধন্যবাদ - আমি এটিকে প্রতিফলিত করতে আমার উত্তরকে কিছুটা পরিবর্তন করেছি।
ম্যাক্রো

28

এখনও অবধি সমস্ত উত্তর খুব বুনিয়াদি বিষয়টিকে মিস করতে পারে বলে মনে হচ্ছে: আপনি যে কার্যকরী ফর্মটি চয়ন করেছেন তা বৈজ্ঞানিকভাবে প্রাসঙ্গিক বৈশিষ্ট্যগুলি ক্যাপচার করার জন্য যথেষ্ট নমনীয় হওয়া উচিত। মডেল 2-5 বৈজ্ঞানিক ন্যায়সঙ্গততা ছাড়াই শর্তে শূন্য সহগ চাপিয়ে দেয়। এমনকি বৈজ্ঞানিকভাবে ন্যায়সঙ্গত হলেও, মডেল 1 আপীল হয়ে যায় কারণ আপনি তাদের শূন্যের চেয়ে শূন্য সহগের জন্যও পরীক্ষা করতে পারেন।

কীটি হ'ল নিষেধাজ্ঞার অর্থ কী। মডেলগুলি 3-5 এড়াতে সাধারণ উপদেশটি হ'ল বেশিরভাগ অ্যাপ্লিকেশনগুলিতে তারা চাপিয়ে দেওয়া অনুমানগুলি বৈজ্ঞানিকভাবে গোঁড়া। মডেল 3 ধরে নেয় এক্স 2 কেবল theাল ডিওয়াই / ডিএক্স 1 কে প্রভাবিত করে তবে স্তরটি নয়। মডেল 4 অনুমান করে এক্স 1 কেবল onlyাল ডিওয়াই / ডিএক্স 2 কে প্রভাবিত করে তবে স্তরটি নয়। এবং মডেল 5 অনুমান করে যে এক্স 1 বা এক্স 2 উভয়ই স্তরটিকে প্রভাবিত করে না, তবে কেবল ডিওয়াই / ডিএক্স 1 বা ডিওয়াই / ডিএক্স 2। বেশিরভাগ অ্যাপ্লিকেশনগুলিতে এই অনুমানগুলি যুক্তিসঙ্গত বলে মনে হয় না। মডেল 2 এছাড়াও একটি শূন্য সহগ চাপায় তবে এখনও কিছু যোগ্যতা রয়েছে। এটি ডেটাতে সর্বোত্তম রৈখিক সংলগ্নতা দেয় যা অনেক ক্ষেত্রে বৈজ্ঞানিক লক্ষ্যকে সন্তুষ্ট করে।


5
(+1) এটি সত্য, তবে মূল পোস্টারটি এমন একটি পরিস্থিতি বর্ণনা করছে যা লেখকরা মডেল নির্বাচন করার চেষ্টা করছেন এবং তাদের প্রার্থীদের কয়েকটি মডেল এমন ছিলেন যা ইন্টারঅ্যাকশন অন্তর্ভুক্ত করেনি - তাই তাদের প্রেরণাটি এআইসি দ্বারা পরিচালিত হয়েছিল বরং কিছু স্থির করে (যা সর্বদা একটি বিপজ্জনক জিনিস, তবে স্পষ্টতই তারা এটি করেছে) by আপনি যখন কিছু স্থিতিশীল দ্বারা পরিচালিত হন, তখন মডেল কাঠামোটি তার দ্বারা নির্ধারিত হওয়া উচিত। তবে, যখন আপনি কোনও পরিসংখ্যানের মাপদণ্ড দ্বারা পরিচালিত হন, তখন মূল প্রভাবগুলি বাদ দেওয়াতে খারাপ বৈশিষ্ট্য থাকতে পারে, যেমনটি আমি আমার উত্তরে উল্লেখ করেছি।
ম্যাক্রো

16

+1 থেকে @ ম্যাক্রো। আমার বুদ্ধিমান ভবিষ্যদ্বাণীকারীরা যখন উদ্বেগ প্রকাশ করে তখন আমার মনে হয় এমন একটি অনুরূপ বিষয়টি আমার সামনে আনতে দাও। এগুলি কোড করে কীভাবে করা যায় তার উপর অনেক কিছুই নির্ভর করতে পারে । উদাহরণস্বরূপ, রেফারেন্স সেল (ওরফে, 'ডামি') কোডিং 0 এবং 1 ব্যবহার করে, অন্যদিকে কোডিং -1, 0 এবং 1 ব্যবহার করে, তারপর দুটি স্তরের দুটি উপাদান সহ একটি সাধারণ কেস বিবেচনা করুনx1x2ব্যবহৃত কোডিং স্কিমের উপর নির্ভর করে [0, 0, 0, 1] বা [1, -1, -1, 1] হতে পারে। আমি বিশ্বাস করি যে কোনও কোডিং স্কিমের সাথে কেবল ইন্টারঅ্যাকশনটি 'তাৎপর্যপূর্ণ' এমন পরিস্থিতি থাকা সম্ভব, তবে অন্যান্য পদক্ষেপটি অন্য স্কিমটি ব্যবহার করে 'পদক্ষেপ'। এটি সূচিত করে যে অর্থবহ অর্থপূর্ণ ব্যাখ্যামূলক সিদ্ধান্তগুলি একটি স্বেচ্ছাসেবী কোডিং সিদ্ধান্তের ভিত্তিতে নেওয়া হবে যা আসলে আপনার সফ্টওয়্যারটি আপনার অজান্তেই আপনাকে তৈরি করেছে। আমি স্বীকার করেছি যে এটি একটি ছোট পয়েন্ট, তবে এটি কেবলমাত্র আরও একটি কারণ যা কেবলমাত্র ইন্টারঅ্যাকশন ধরে রাখা ভাল নয় (এবং অবশ্যই পি-ভ্যালুগুলির উপর ভিত্তি করে ভবিষ্যদ্বাণীকারীদের একটি উপসেট নির্বাচন করা নয়)।


1
শ্রেণীবদ্ধ মূল প্রভাবগুলির জন্য তাত্পর্য পরীক্ষা কোনও কম আক্রমণকারীও নয়। একটি গোষ্ঠী চিকিত্সা কোডিংয়ের অধীনে রেফারেন্স গ্রুপ থেকে উল্লেখযোগ্যভাবে আলাদা হতে পারে তবে কনট্রাস্ট কোডিংয়ের অধীনে "গ্র্যান্ড গড়" প্রভাব থেকে নয়।
সম্ভাব্যতাব্লোগিক

10

যেহেতু আপনি একটি কাগজ পর্যালোচনা করছেন আপনি সম্ভবত পরামর্শ দিতে পারেন যে লেখকরা মডেল শ্রেণিবদ্ধের বিষয়টি নিয়ে আলোচনা করুন এবং সেখান থেকে তাদের প্রস্থানটিকে ন্যায়সঙ্গত করুন।

এখানে কিছু উল্লেখ রয়েছে:

  1. নেলদার জে। প্রতিক্রিয়া-পৃষ্ঠের মডেলগুলিতে পদগুলির নির্বাচন - দুর্বল বংশগত নীতিটি কতটা শক্তিশালী? আমেরিকান পরিসংখ্যানবিদ। 1998; 52: 315-8। http://www.jstor.org/pss/2685433 । অ্যাক্সেস করা হয়েছে 10 জুন 2010।

  2. পিক্সটো জেএল। বহুবর্ষীয় রিগ্রেশন মডেলগুলিতে শ্রেণিবদ্ধ পরিবর্তনশীল নির্বাচন selection আমেরিকান পরিসংখ্যানবিদ। 1987; 41: 311-3। http://www.jstor.org/pss/2684752 । অ্যাক্সেস করা হয়েছে 10 জুন 2010।

  3. পিক্সটো জেএল। বহুভিত্তিক রিগ্রেশন মডেলগুলি সু-সূচিত। আমেরিকান পরিসংখ্যানবিদ। 1990; 44: 26-30। http://www.jstor.org/pss/2684952 । অ্যাক্সেস করা হয়েছে 10 জুন 2010।

আমি সাধারণত শ্রেণিবিন্যাস অনুসরণ করি তবে কিছু পরিস্থিতিতে এটি থেকে বিদায় নিই। উদাহরণস্বরূপ, আপনি যদি বিভিন্ন ভিন্ন গতিতে টায়ার পরিধান বনাম মাইলেজ পরীক্ষা করে দেখেন তবে আপনার মডেলটি দেখতে দেখতে পারে:

পদক্ষেপ গভীরতা = বিরতি + মাইলেজ + মাইলেজ * গতি

তবে গতির একটি প্রধান প্রভাব অন্তর্ভুক্ত করা শারীরিক বোধ তৈরি করবে না কারণ টায়ারটি জানে না যে গতিটি শূন্য মাইল হবে।

(অন্যদিকে, আপনি এখনও একটি গতি প্রভাবের জন্য পরীক্ষা করতে চাইতে পারেন কারণ এটি "ব্রেক-ইন" ইফেক্টগুলি বিভিন্ন গতিতে পৃথক হতে পারে তা বোঝাতে পারে the অন্যদিকে, ব্রেক-ইন পরিচালনা করার আরও একটি ভাল উপায় হ'ল) শূন্যে এবং খুব কম মাইলেজে ডেটা পান এবং তারপরে অ-লিনিয়ারিটির জন্য পরীক্ষা করুন that দ্রষ্টব্য যে ইন্টারসেপ্ট শব্দটি অপসারণকে শ্রেণিবিন্যাস লঙ্ঘনের একটি বিশেষ ক্ষেত্রে হিসাবে বিবেচনা করা যেতে পারে))

কেউ উপরে যা বলেছিল তা আমিও পুনরুক্ত করে বলব কারণ এটি অত্যন্ত গুরুত্বপূর্ণ: লেখকরা তাদের সফ্টওয়্যার ডেটাটিকে কেন্দ্র করে রাখছে কিনা তা নিশ্চিত হওয়া উচিত। সফ্টওয়্যারটি মাইলেজটির পরিবর্তে (মাইলেজ - মাইলেজটির গড়) যদি টায়ার মডেলটি শারীরিকভাবে অযৌক্তিক হয়ে যায়।

একই ধরণের জিনিসগুলি ফার্মাসিউটিক্যাল স্ট্যাবিলিটি স্টাডিতে প্রাসঙ্গিক ("সিক্যুয়ালিয়াল স্টোরেজ ফর স্টিলিটি মডেলস", এমিল এম ফ্রিডম্যান এবং স্যাম সি শাম, এএপিএস ফার্মসসিটেক, খণ্ড। 12, নং 1, মার্চ 2011, ডিওআই: 10.1208 / s12249-010-9558-X)।


1
আপনাকে ধন্যবাদ, এটি একটি দুর্দান্ত উত্তর এবং এটি আমাকে এমন লোকদের কাছে ব্যাখ্যা করতে সহায়তা করবে যারা পরিসংখ্যানগতভাবে জ্ঞান নয়।
9:54

1
+1 আমি আশা করি এসও তে উত্তরগুলি মার্জ করা সম্ভব হয়েছিল। এটি উপরের স্বীকৃত উত্তরের সাথে নিখুঁত উত্তর তৈরি করে।
ঝুবার্ব

9

আমার কাছে একটি বাস্তব ঘটনা রয়েছে যা এটি চিত্রিত করে। ডেটাতে group0-নিয়ন্ত্রণ এবং 1-চিকিত্সার সাথে উপস্থাপন করা ভেরিয়েবলগুলির মধ্যে একটি । অন্যান্য ভবিষ্যদ্বাণী time period0-এর আগে চিকিত্সা এবং 1-চিকিত্সার পরে প্রতিনিধিত্ব করেন। কথোপকথন ছিল চিকিত্সার প্রভাব পরিমাপের আগ্রহের মূল প্যারামিটার, চিকিত্সা গ্রুপে চিকিত্সার পরে পার্থক্য নিয়ন্ত্রণ গ্রুপে পরিমাপিত সময়ের কোনও প্রভাবের উপরে। থেকে প্রধান প্রভাবgroupকোনও চিকিত্সার আগে 2 টি গ্রুপের পার্থক্যটি পরিমাপ করে, তাই এটি সহজে 0 হতে পারে (এলোমেলো পরীক্ষায় এটি 0 হওয়া উচিত, এটি ছিল না)। ২ য় প্রধান প্রভাব নিয়ন্ত্রণ গ্রুপের যেখানে আগে কোনও চিকিত্সা হয়নি সেখানে সময়ের আগে এবং পরে সময়ের পার্থক্যকে পরিমাপ করে, সুতরাং এটিও বোঝায় যে এটি 0 হতে পারে তবে ইন্টারঅ্যাকশন শব্দটি শূন্য নয়। অবশ্যই এটি নির্ভর করে যে কীভাবে কোডগুলি কোড করা হয়েছিল এবং আলাদা কোডিংয়ের অর্থগুলি পরিবর্তিত হবে এবং প্রধান প্রভাবগুলি ছাড়াই মিথস্ক্রিয়াটি বোঝায় কি না। সুতরাং এটি কেবলমাত্র নির্দিষ্ট ক্ষেত্রে প্রধান প্রভাব ছাড়াই মিথস্ক্রিয়াটিকে ফিট করে।


সুতরাং আপনি কি বোঝাতে চেয়েছেন যে এটি সবগুলি আপনার অধ্যয়নের উদ্দেশ্যগুলির উপর নির্ভর করে বা আপনার পরামিতিগুলির উপর নির্ভর করে?
বেন

1
@ বেন, এটি কীভাবে আপনি আপনার ভেরিয়েবলকে প্যারামিটারাইজ করবেন তা উভয়ের উপর নির্ভর করতে পারে (আমার উদাহরণে কোনও পরিবর্তনশীলের জন্য 0/1 থেকে 1/0 স্যুইচিংয়ের অর্থ পরিবর্তিত হবে) এবং আপনি কোন প্রশ্নগুলির উত্তর দেওয়ার চেষ্টা করছেন এবং কোন অনুমানগুলি তৈরি করতে ইচ্ছুক? ।
গ্রেগ স্নো

Y=B0+B1X+B2Z+B3XZ2008+yeardummies
এক্স এবং জেড অবিচ্ছিন্ন পরিবর্তনশীল, জেড নিয়ন্ত্রণ রেটিং rating বছর 2008 অন্যান্য বছরের জন্য 1 এবং 0 স্কোর হয়। সুতরাং এটির মত যদি আমি কেবল ২০০৮ সালের পর্যবেক্ষণগুলি কোনও মিথস্ক্রিয়া ছাড়াই গ্রহণ করি। আমি দুর্বল এবং শক্তিশালী বংশগত নীতি সম্পর্কে পড়েছি, তবে স্পষ্টভাবে বুঝতে পারি নি
বেন

1
@ বেন, উপরোক্ত মডেলটির মাপসই করা অবশ্যই সম্ভব যা মূলত আপনি বলে মনে করেন যে ২০০৮ সালে একটি ইন্টারঅ্যাকশন রয়েছে (বা হতে পারে) তবে অন্য কোনও বছরে নয়। যদি আপনার এটির পক্ষে সমর্থনযোগ্যতা থাকে তবে আমি মনে করি মডেলটি ভাল। তবে এটি একটি অস্বাভাবিক যথেষ্ট অনুমান যে আপনার সম্ভবত কোনও শ্রোতার কাছে এটি ন্যায্যতা প্রমাণ করতে হবে।
গ্রেগ তুষার

অনেক ধন্যবাদ যে সহায়ক ছিল। সাথে ইন্টারঅ্যাকশনটির আউটপুট তুলনা করা ঠিক কি যদিও পুরো সময়ের জন্য এবং মিথস্ক্রিয়াটি কেবলমাত্র ২০০৮ সালের জন্যবি 1 এক্স
B1X
B1X
বেন

7

আমি পিটার সাথে একমত। আমি মনে করি নিয়মটি লোককাহিনী। আমরা কেন এমন পরিস্থিতিটি কল্পনা করতে পারি যেখানে দুটি ভেরিয়েবল কেবল একটি মিথস্ক্রিয়তার কারণে মডেলটিকে প্রভাবিত করে। রসায়নের একটি সাদৃশ্যটি হ'ল দুটি রাসায়নিক সম্পূর্ণ নিজেরাই জড় হয় তবে একসাথে মিশ্রিত হলে বিস্ফোরণ ঘটায়। অদলবদলের মতো গাণিতিক / পরিসংখ্যানগত চমত্কার সত্যিকারের ডেটা সহ একটি বাস্তব সমস্যার সাথে কিছু করার নেই। আমি কেবল মনে করি যে যখন ভেরিয়েবলগুলি বিবেচনা করার জন্য রয়েছে সেখানে যখন আপনি সমস্ত প্রধান প্রভাবগুলি দেখতে যাচ্ছেন এবং সর্বাধিক যদি প্রথম অর্ডার ইন্টারঅ্যাকশন না হয় তবে পরীক্ষা করার একটি ভয়ঙ্কর প্রচুর পরিমাণ আছে। আমরা কেবলমাত্র কয়েকটি মুখ্য ভেরিয়েবলের সাথেও ছোট্ট পরীক্ষায় এমনকি দ্বিতীয় অর্ডার ইন্টারঅ্যাকশনগুলিতে প্রায় কখনও দেখি না। চিন্তাভাবনাটি হ'ল আন্তঃসংযোগের ক্রমটি যত বেশি হবে ততই সম্ভব কারণ এটির প্রকৃত প্রভাব রয়েছে। তো ডন ' t যদি প্রধান প্রভাব না থাকে তবে প্রথম বা দ্বিতীয় অর্ডার ইন্টারঅ্যাকশনগুলি দেখুন। একটি ভাল নিয়ম সম্ভবত ধর্মীয়ভাবে অনুসরণ করা মানে ব্যতিক্রমগুলি উপেক্ষা করা এবং আপনার সমস্যাটি ব্যতিক্রম হতে পারে।


8
পুনরায়: "অদলবদলের মতো গাণিতিক / পরিসংখ্যানগত চমত্কার সত্যিকারের ডেটা সহকারে কোনও সমস্যা নেই" - আপনার ভ্যালুগুলি, এবং সুতরাং আপনার পরিসংখ্যানগত অনুক্রমের সাথে (এবং তাই আপনার " রিয়েল ওয়ার্ল্ড "ভবিষ্যদ্বাণীকারীর গুরুত্ব সম্পর্কে সিদ্ধান্ত), আপনার ভবিষ্যদ্বাণীকারীদের কেন্দ্র করার সিদ্ধান্তের মতো স্বেচ্ছাচারী কিছুতে নির্ভর করতে পারে। p
ম্যাক্রো

1
আমি সম্ভবত ভুল ভুল করে বলেছিলাম যে প্রকৃত বিশ্বে আগ্রাসনের কোনও প্রাসঙ্গিকতা নেই। আমার উদ্দেশ্য হ'ল কিছু গাণিতিক ফলাফল নির্দিষ্ট ব্যবহারিক সমস্যার ক্ষেত্রে প্রাসঙ্গিক নাও হতে পারে। উদাহরণ হিসাবে ন্যূনতম স্কোয়ার অনুমানগুলি স্বাভাবিক ত্রুটি অনুমানের অধীনে সর্বাধিক সম্ভাবনা থাকে এবং গাউস মার্কভের উপপাদ্যটি দুর্বল পরিস্থিতিতে নিরপেক্ষভাবে ন্যূনতম বৈকল্পিক হয়, তবে ডেটাতে বিদেশী থাকাকালীন আমি এটি ব্যবহার করতাম না। একই টোকেনের মাধ্যমে ইনভেরিয়েন্সের মতো কোনও সম্পত্তি কোনও মিথস্ক্রিয়াসকে ছড়িয়ে দেওয়া উচিত যখন এটি বোধ হয় মেডিক্যালি বলে যে এটি মূল প্রভাব ছাড়াই ঘটবে?
মাইকেল চেরনিক

6

[মূল প্রশ্নের এমন একটি অংশের উত্তর দেওয়ার চেষ্টা করা হচ্ছে যা বেশিরভাগ উত্তরে অনাবৃত বলে মনে হচ্ছে: "মডেল নির্বাচনের মানদণ্ড হিসাবে কী এআইসিকে বিশ্বাস করা উচিত?"]

গসপেল হিসাবে নেওয়া উচিত এমন একটি নিয়মের চেয়ে এআইসিকে গাইডলাইন হিসাবে বেশি ব্যবহার করা উচিত।

এআইসির কার্যকারিতা (বা বিআইসি বা মডেল নির্বাচনের জন্য অনুরূপ 'সাধারণ' মাপদণ্ড) শেখার অ্যালগরিদম এবং সমস্যার উপর নির্ভর করে।

এটি এইভাবে চিন্তা করুন: এআইসির সূত্রে জটিলতার (কারণগুলির সংখ্যা) পদটির লক্ষ্য সহজ: মডেলগুলি নির্বাচন করা এড়াতে যা বেশি ফিট। তবে এআইসির সরলতা খুব প্রায়ই সমস্যার আসল জটিলতা ক্যাপচার করতে ব্যর্থ হয়। এ কারণেই অতিরিক্ত-ফিটিং এড়ানোর জন্য অন্যান্য ব্যবহারিক কৌশল রয়েছে: উদাহরণস্বরূপ, ক্রস-বৈধকরণ বা নিয়মিতকরণ শব্দটি যুক্ত করা।

যখন আমি অনলাইন এসজিডি (স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভূত) খুব বিপুল সংখ্যক ইনপুট সহ ডেটা-সেটটিতে লিনিয়ার রিগ্রেশন করতে ব্যবহার করি তখন আমি এআইসিটিকে মডেল মানের ভয়ানক ভবিষ্যদ্বাণী বলে মনে করি কারণ এটি জটিল সংখ্যক সংখ্যক শর্তাবলী সহ জটিল মডেলগুলিকে শাস্তি দেয়। বাস্তব জীবনের অনেকগুলি পরিস্থিতি রয়েছে যেখানে প্রতিটি শব্দটির একটি ক্ষুদ্র প্রভাব রয়েছে, তবে তাদের মধ্যে একটি বড় সংখ্যক ফলাফলের দৃ stat় পরিসংখ্যানগত প্রমাণ দেয়। আরও জটিলতর উচ্চতর হওয়া সত্ত্বেও এআইসি এবং বিআইসির মডেল-নির্বাচনের মানদণ্ডগুলি এই মডেলগুলিকে প্রত্যাখ্যান করবে এবং সহজতরগুলি পছন্দ করবে।

শেষ পর্যন্ত, এটি সাধারণীকরণ ত্রুটি (মোটামুটি: নমুনা সম্পাদনের বাইরে) যা গণনা করা হয়। এআইসি আপনাকে তুলনামূলকভাবে সহজ পরিস্থিতিতে মডেল মানের কিছু ইঙ্গিত দিতে পারে। কেবল সতর্কতা অবলম্বন করুন এবং মনে রাখবেন যে বাস্তব জীবনটি প্রায়শই নয়, সাধারণ সূত্রের চেয়ে জটিল।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.