লিনিয়ার রিগ্রেশন এর জন্য পয়েন্টের সর্বনিম্ন সংখ্যা


16

একটি লিনিয়ার রিগ্রেশন সহ সময়ের সাথে একটি প্রবণতা সন্ধান করার জন্য "যুক্তিসঙ্গত" ন্যূনতম সংখ্যার পর্যবেক্ষণগুলি কী হবে? চতুর্ভুজ মডেল ফিটিং সম্পর্কে কি?

আমি স্বাস্থ্যের অসমতার (এসআইআই, আরআইআই) সংমিশ্রিত সূচকগুলি নিয়ে কাজ করি এবং সমীক্ষার মাত্র 4 টি তরঙ্গ রয়েছে, সুতরাং 4 পয়েন্ট (1997,2001,2004,2008)।

আমি পরিসংখ্যানবিদ নই, তবে আমার স্বজ্ঞাত ছাপ রয়েছে 4 পয়েন্ট পর্যাপ্ত নয়। আপনার কাছে কি কোনও উত্তর, এবং / অথবা রেফারেন্স রয়েছে?

অনেক ধন্যবাদ,

ফ্রাঁসোয়া


4
থাম্বের স্বাভাবিক নিয়ম প্রতিটি স্বতন্ত্র ভেরিয়েবলের জন্য 10 পয়েন্ট।
পিটার ফ্লুম - মনিকা পুনরায়

1
আপনার সূচকগুলি কীভাবে পরিমাপ করা হয়? যদি এগুলিতে পরিবর্তনশীলতার অনুমান অন্তর্ভুক্ত থাকে তবে দুটি যথেষ্ট হতে পারে (একটি টি-টেস্ট বা এর এনালগ ব্যবহার করে)। এখানে প্রয়োগ করা হয় এমন মৌলিক পরিসংখ্যান নীতিটি হ'ল যখন এলোমেলো প্রকরণটি আপনি যা পর্যবেক্ষণ করছেন তার একটি অপ্রত্যাশিত ব্যাখ্যা, তখন আপনার কোনও আপত্তি প্রবণতা অ-র্যান্ডম কারণগুলির জন্য দায়ী করার অধিকার রয়েছে। যখন প্রবণতা শক্তিশালী হয়, খুব অল্প সংখ্যক ডেটা মানই এই সিদ্ধান্তে আসতে পারে, সমস্ত জেনেরিক "থাম্বের নিয়ম" সত্ত্বেও।
whuber

উত্তর:


12

পিয়ার্সের নিয়মিত প্রতি কোভারিয়েটে 10 এর থাম্বের যুক্তিসঙ্গত নিয়ম। প্রতিক্রিয়ার মানগুলিতে শব্দের পরিমাণ নির্বিশেষে একটি সরল রেখা যে কোনও দুটি পয়েন্টের সাথে পুরোপুরি ফিট হতে পারে এবং একটি চতুর্ভুজটি মাত্র 3 পয়েন্টের সাথে পুরোপুরি ফিট হতে পারে। সুতরাং প্রায় কোনও পরিস্থিতিতে স্পষ্টতই বলা উচিত যে 4 পয়েন্ট অপর্যাপ্ত। তবে, বেশিরভাগ নিয়মের থাম্বের মতো এটি প্রতিটি পরিস্থিতি .েকে রাখে না। যেসব ক্ষেত্রে মডেলটিতে শব্দটির শর্ত একটি বৃহত্তর বৈকল্পিক হয় তত ত্রুটির প্রকরণটি ছোট হ'ল একই ক্ষেত্রে এর চেয়ে বেশি নমুনার প্রয়োজন হবে।

প্রয়োজনীয় সংখ্যার নমুনা পয়েন্টগুলি বস্তুর উপর নির্ভর করে। যদি আপনি কেবল অনুসন্ধানের বিশ্লেষণ করে দেখেন যে কোনও মডেল (কোভেরিয়েটে রৈখিক বলুন) অন্যর চেয়ে ভাল দেখাচ্ছে (কোভেরিয়েটের একটি চতুর্ভুজ ফাংশন বলুন) 10 পয়েন্টের চেয়ে কম হতে পারে কি না। তবে আপনি যদি কোভেরিয়েটগুলির জন্য পারস্পরিক সম্পর্ক এবং রিগ্রেশন সহগের খুব সঠিক অনুমান চান তবে আপনার প্রতি কোভারিয়েট 10 এরও বেশি প্রয়োজন হতে পারে। পূর্বাভাসের মানদণ্ডের নির্ভুলতার জন্য সঠিক পরামিতি অনুমানের চেয়ে আরও বেশি নমুনার প্রয়োজন হতে পারে। নোট করুন যে অনুমান এবং পূর্বাভাসের বৈকল্পিকতা সমস্তই মডেলগুলির ত্রুটির শর্তের ভিন্নতা জড়িত।


ভাল পয়েন্টস, মাইকেল; আমি এটি সহজ রাখার চেষ্টা করছিলাম। :-)। মূল প্রশ্নের বিষয় বিবেচনা করে, 10 টিরও কম পয়েন্ট পর্যাপ্ত থাকলে আমি খুব অবাক হব। স্বাস্থ্যের ক্ষেত্রে অসমতার পরিমাপে অনেকগুলি ত্রুটি হওয়ার সম্ভাবনা রয়েছে এবং সময়ের সাথে সম্পর্কগুলি অত্যন্ত রৈখিক হওয়ার সম্ভাবনা কম। আপনি এই সম্পর্কে কোন নিবন্ধ সম্পর্কে জানেন? এটি একটি আকর্ষণীয় বিষয় যা অনেকটা সামনে আসে।
পিটার ফ্লুম - মনিকা পুনরায়

পুনঃটুইট করেছেন আমি থাম্বের পরিসংখ্যানগত নিয়মগুলিতে ভ্যান বেলি'এ বইয়ের দিকে তাকিয়ে দেখব যে তিনি আপনার উল্লেখ মতো কোনও নিয়ম ব্যবহার করেছেন কিনা uses তাঁর বইয়ের সুন্দর জিনিসটি হ'ল তিনি প্রতিটি নিয়মের পিছনে যুক্তি ব্যাখ্যা করেন। আমি আপনার সাথে একমত যে কোওরিয়েটে কমপক্ষে 10 জন নেওয়ার কথাটি খুব ভাল এবং কিছু অনুসন্ধানের ক্ষেত্রে ব্যতীত কম ব্যবহার করা খুব কমই নিরাপদ। আমি যে স্বাস্থ্য বিজ্ঞানগুলিতে কাজ করি শব্দগুলির শব্দটি সর্বদা বৃহত বলে মনে হয় তবে সম্ভবত কিছু শক্তভাবে নিয়ন্ত্রিত পদার্থবিজ্ঞান বা প্রকৌশল পরীক্ষাগুলিতে খুব সুনির্দিষ্ট পরিমাপ হতে পারে এবং তাই ছোট্ট এলোমেলো ত্রুটি হতে পারে।
মাইকেল আর চেরনিক

আমি কেবল ছোট গোলমালের সম্ভাবনাটি নির্দেশ করার চেষ্টা করছিলাম যার ফলে সম্ভাবনাটি দূরবর্তী হলেও 10 টিরও কম পয়েন্টের প্রয়োজন হবে।
মাইকেল আর চেরনিক

আর2

+1, ভাল তথ্য, তবে এটিও উল্লেখযোগ্য যে আপনার যদি অনুমানকারী পক্ষপাতহীন হয় তবে আপনার কাছে একটি স্যাচুরেটেড মডেল থাকতে পারে এবং প্যারামিটারগুলির একটি প্রাক্কলন থাকতে পারে, যদি আপনার কেবল এটিই প্রয়োজন হয়। আপনার পরিবর্তনশীলতার অনুমান করতে হবে বা অনুমান করতে সক্ষম হবে না। যাইহোক, কিছু ক্ষেত্রে যেখানে অনুমান করার জন্য অনেকগুলি প্রভাব রয়েছে এবং ডেটা পাওয়া যথেষ্ট পরিমাণে শক্ত, সেখানে কখনও কখনও স্যাচুরেটেড মডেল ব্যবহার করা হয়। সুতরাং যেমন, এই ক্ষেত্রে, আপনি ফাংশন ডাব্লু / চতুর্ভুজ ডাব্লু / 3 পয়েন্টের একটি অনুমান পেতে পারেন। আমি অগত্যা বলতে চাই না যে এটি একটি ভাল জিনিস, তবে এটি আসল নিম্ন বাউন্ড এবং কারণ।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.