যখন আমাদের প্রয়োজন হয় না তখন কেন আমরা সাধারণত বিতরণ ত্রুটি শর্তাদি (এবং সমকামিতা) লিনিয়ার রিগ্রেশন সম্পর্কে এত যত্ন করি?


52

আমি মনে করি প্রতিবারই আমি যখন কেউ শুনি যে হতাশ হয়ে পড়ে থাকি যে অবশেষ এবং / অথবা বৈষম্যমূলক আচরণের অস্বাভাবিকতা ওএলএস অনুমানকে লঙ্ঘন করে। কোনও ওএলএস মডেলের প্যারামিটারগুলি অনুমান করার জন্য গাউস-মার্কভের উপপাদ্য দ্বারা এই অনুমানগুলির কোনওটিই প্রয়োজন। ওএলএস মডেলের হাইপোথিসিস পরীক্ষায় এটি কীভাবে গুরুত্বপূর্ণ তা আমি দেখতে পাচ্ছি , কারণ এই জিনিসগুলি ধরে নিয়ে টি-টেস্ট, এফ-টেস্ট এবং আরও সাধারণ ওয়াল্ড পরিসংখ্যানের ঝরঝরে সূত্র দেয়।

তবে এগুলি ছাড়া অনুমানের পরীক্ষা করা খুব কঠিন নয়। যদি আমরা কেবল হোমসকেডাস্টিকটি ফেলে রাখি তবে আমরা শক্তিশালী স্ট্যান্ডার্ড ত্রুটিগুলি এবং ক্লাস্টার করা স্ট্যান্ডার্ড ত্রুটিগুলি সহজেই গণনা করতে পারি। আমরা যদি পুরোপুরি স্বাভাবিকতা ফেলে রাখি তবে আমরা বুটস্ট্র্যাপিং ব্যবহার করতে পারি এবং ত্রুটির শর্তাদি, সম্ভাবনা অনুপাত এবং ল্যাঞ্জ্রেঞ্জ গুণক পরীক্ষার জন্য আরেকটি প্যারাম্যাট্রিক স্পেসিফিকেশন প্রদান করতে পারি।

এটি কেবল লজ্জাজনক যে আমরা এটিকে এটি শিখিয়েছি, কারণ আমি দেখছি প্রচুর লোক অনুমান নিয়ে লড়াই করে যাচ্ছেন যে তাদের প্রথম স্থানে দেখা করতে হবে না।

সহজেই যখন আমরা আরও দৃust় কৌশল প্রয়োগ করার ক্ষমতা রাখি তখন কেন আমরা এই অনুমানগুলি এত বেশি চাপ দিয়ে থাকি? আমি কি গুরুত্বপূর্ণ কিছু মিস করছি?


2
শৃঙ্খলাবদ্ধ জিনিস বলে মনে হয়। আমার অভিজ্ঞতায়, চূড়ান্তভাবে, একনোমেট্রিক্স পাঠগুলি প্রায় সর্বদা প্রতিটি অনুমান যা কিনে নেয় তা অন্তর্ভুক্ত করে এবং মনোবিজ্ঞান গ্রন্থগুলি কখনই বিষয়টির বিষয়ে কিছু উল্লেখ করে বলে মনে হয় না।
কনজুগেটপায়ার

12
যদিও ওএলএসকে ন্যূনতম হওয়ার জন্য সমকামিতা প্রয়োজন ity
মোমো

4
আমি মনে করি আপনি ঠিক বলেছেন, এই অনুমানগুলি অযৌক্তিক মনোযোগ পেয়েছে। স্বাভাবিকতা বা শর্তসাপেক্ষ সমকামিতা ব্যর্থতা। অন্তঃসত্ত্বা এবং দুর্বলভাবে নির্দিষ্ট কার্যকরী ফর্ম হিসাবে বেশিরভাগ অনুশীলনকারীদের অনুমানমূলক লক্ষ্যগুলির জন্য ক্ষতিকারক হিসাবে কাছে নয়।
ক্লোজটোক

2
@ ক্লোজটোক এটি একটি খুব ভাল বিষয়। প্রায়শই আমরা রিগ্রেশন মডেলের পরিসংখ্যানগত প্রযুক্তি সম্পর্কে এতটা উদ্বিগ্ন হয়ে পড়েছি যে আমরা বড় চিত্রটি ভুলে যাই ... আমার মডেলটি কি সঠিকভাবে নির্দিষ্ট এবং বহিরাগত হয়? কোনও মডেল তৈরি করার সময় নিজেকে জিজ্ঞাসা করার প্রাথমিক প্রশ্নগুলির মধ্যে একটি হিসাবে এটি পুনরাবৃত্তভাবে জোর দেওয়া উচিত।
জাচারি ব্লুমেনফিল্ড

উত্তর:


25

একনোমেট্রিক্সে আমরা বলব যে অ-স্বাভাবিকতা ক্লাসিকাল নরমাল লিনিয়ার রিগ্রেশন মডেলটির শর্ত লঙ্ঘন করে, অন্যদিকে ভিন্ন ভিন্নতা সিএনএলআর এবং ক্লাসিকাল লিনিয়ার রেগ্রেশন মডেলের উভয় অনুমানকে লঙ্ঘন করে।

তবে যারা "... ওএলএস লঙ্ঘন করে" বলে ন্যায্য: অर्डিনারি লেস্ট -স্কোয়্যারস নামটি গৌস থেকে সরাসরি এসেছে এবং এটি মূলত স্বাভাবিক ত্রুটিগুলি বোঝায় । অন্য কথায় "ওএলএস" হ'ল ন্যূনতম-স্কোয়ার অনুমানের সংক্ষিপ্ত বিবরণ নয় (এটি আরও সাধারণ নীতি এবং পদ্ধতির), তবে সিএনএলআর এর।

ঠিক আছে, এটি ছিল ইতিহাস, পরিভাষা এবং শব্দার্থবিদ্যা। আমি নীচে ওপি-র প্রশ্নের মূল বিষয়টি বুঝতে পেরেছি: "কেন আমরা আদর্শের প্রতি জোর দেওয়া উচিত, যদি আমরা যদি মামলার উপস্থিতি না থাকি তখন সমাধান খুঁজে পাই?" (কারণ CNLR অনুমানের হয় আদর্শ, অর্থে তারা চমৎকার অন্তত-বর্গক্ষেত্র মূল্নির্ধারক বৈশিষ্ট্য "বন্ধ-বালুচর" প্রদান, এবং মধ্যে asymptotic ফলাফল অবলম্বন করার প্রয়োজনীয়তা ছাড়া। এটিও স্মরণে রাখুন যে OLS ঔজ্জ্বল্যের প্রেক্ষাপটে সর্বোচ্চ সম্ভাবনা যখন ত্রুটি স্বাভাবিক হয় )।

আদর্শ হিসাবে, পাঠদান শুরু করার জন্য এটি ভাল জায়গা । আমরা সর্বদা যেকোন প্রকারের বিষয় শেখানোর ক্ষেত্রে এটিই করি: "সাধারণ" পরিস্থিতিগুলি হ'ল "আদর্শ" পরিস্থিতি, প্রকৃত জীবন ও বাস্তব গবেষণায় যে জটিলতাগুলির মুখোমুখি হয় সেগুলি মুক্ত এবং যার জন্য কোনও নির্দিষ্ট সমাধানের অস্তিত্ব নেই

এবং এটিই আমি ওপি'র পোস্টটি সম্পর্কে সমস্যাযুক্ত বলে মনে করি: তিনি দৃ standard় স্ট্যান্ডার্ড ত্রুটি এবং বুটস্ট্র্যাপ সম্পর্কে লিখেছেন যেমন তারা "উচ্চতর বিকল্প", বা আলোচনার অধীনে উল্লিখিত অনুমানের অভাবের বুদ্ধিহীন সমাধান যার জন্য ওপি লিখেছেন

".. জনগণের সাথে সাক্ষাত করতে হবে না এমন বাধ্যবাধকতা"

কেন? কারণ পরিস্থিতি মোকাবিলার কিছু পদ্ধতি রয়েছে, এমন পদ্ধতিগুলির যেগুলির অবশ্যই কিছুটা বৈধতা আছে তবে তারা আদর্শ থেকে দূরে? বুটস্ট্র্যাপ এবং heteroskedasticity-শক্তসমর্থ মান ত্রুটি নয় সমাধান -if তারা প্রকৃতপক্ষে ছিলেন, তারা দৃষ্টান্ত হয়ে দাড়ায় হতো, CLR এবং CNLR ইতিহাস বই পাঠানো। কিন্তু তারা না।

সুতরাং আমরা অনুমানের সেট থেকে শুরু করি যা আমরা সেই প্রাক্কলনকারী বৈশিষ্ট্যগুলির গ্যারান্টি দেয় যেগুলি আমরা গুরুত্বপূর্ণ বলে বিবেচনা করেছি (এটি পছন্দসই হিসাবে মনোনীত বৈশিষ্ট্যগুলি প্রকৃতপক্ষে অবশ্যই হওয়া উচিত কিনা তা অন্য আলোচনা), যাতে আমরা দৃশ্যমান রাখতে পারি যে তাদের কোনও লঙ্ঘন হয়েছে, এই অনুমানগুলির অনুপস্থিতি মোকাবেলায় আমরা যে পদ্ধতিগুলি পেয়েছি তার মাধ্যমে সম্পূর্ণরূপে অফসেট করা যায় না consequences "আমরা সত্যের দিকে আমাদের যাত্রা করতে পারি" - কারণ সহজভাবে, আমরা পারি না, এই ধারণাটি সত্যই বিপজ্জনক, বৈজ্ঞানিকভাবে বলার অপেক্ষা রাখে না।

সুতরাং, তারা কোনও সমস্যার অপূর্ণ সমাধান থেকে যায় , কোনও বিকল্প এবং / অথবা কিছু করার জন্য অবশ্যই সর্বোত্তম উপায় নয়। অতএব, আমাদের প্রথমে সমস্যা-মুক্ত পরিস্থিতিটি শিখতে হবে, তারপরে সম্ভাব্য সমস্যাগুলি দেখানো এবং তারপরে সম্ভাব্য সমাধানগুলি নিয়ে আলোচনা করা উচিত। অন্যথায়, আমরা এই সমাধানগুলি এমন স্থিতিতে উন্নীত করব যা তাদের সত্যিকারের নয়।


হুম, যদি আপনি যা বোঝাতে চেয়েছিলেন তবে আপনি "সম্পূর্ণ প্রমাণিত" চেষ্টা করতে পারেন।
গুং - মনিকা পুনরায়

@ গুং না, না, পদ্ধতিগুলি গাণিতিক দিক থেকে "সম্পূর্ণ প্রমাণিত", তবে তারা আসলে কী সরবরাহ করে (এ্যাসেম্পোটিকস সম্পর্কে এই "সামান্য" বিশদটি আবার, এবং তাদের মান কী) তা নির্বোধ নয়। আপনার সংশোধনটি সঠিক ছিল।
অ্যালেকোস পাপাদোপল্লো

22

যদি আমাদের ক্লাসে সময় থাকে যেখানে আমরা প্রথমে বুটস্ট্র্যাপিং এবং আপনি উল্লিখিত অন্যান্য কৌশলগুলি (তাদের সমস্ত অনুমান, সমস্যাগুলি, ইত্যাদি সহ) আলোচনার জন্য প্রথমে রিগ্রেশন মডেলগুলি উপস্থাপন করি তবে আমি আপনার সাথে একমত হই যে স্বাভাবিকতা সম্পর্কে কথা বলার দরকার নেই এবং সমকামিতা অনুমান। তবে সত্যিকার অর্থে, যখন প্রথমে রিগ্রেশন চালু হয় তখন আমাদের কাছে অন্য সমস্ত বিষয় নিয়ে কথা বলার সময় নেই, তাই আমরা বরং শিক্ষার্থীদের রক্ষণশীল হতে এবং প্রয়োজনীয় জিনিসগুলি যাচাই করে দেখার জন্য চাই এবং একটি পরিসংখ্যানবিদদের সাথে পরামর্শ করবো (বা অন্য কোনও পরিসংখ্যান নেওয়া শ্রেণি বা 2 বা 3, ...) যখন অনুমানগুলি ধরে রাখে না।

আপনি যদি শিক্ষার্থীদের বলেন যে when অনুমানগুলি তখন ... বাদে কিছু যায় আসে না, তবে বেশিরভাগ অংশের অংশ হিসাবে গুরুত্বপূর্ণ হবে না এবং কেবল গুরুত্বপূর্ণ নয় remember

যদি আমাদের অসম বৈকল্পিকতাগুলির সাথে কেস থাকে তবে হ্যাঁ আমরা এখনও কমপক্ষে স্কোয়ার লাইনে ফিট করতে পারি তবে এটি কি এখনও "সেরা" লাইনটি? বা সেই ক্ষেত্রে কীভাবে লাইন ফিট করতে হবে সে সম্পর্কে আরও অভিজ্ঞতার / প্রশিক্ষণের সাথে কারও সাথে পরামর্শ করা ভাল। এমনকি যদি আমরা সর্বনিম্ন স্কোয়ার লাইনে খুশি থাকি, তবে কি আমাদের স্বীকার করা উচিত নয় যে ভবিষ্যদ্বাণীকারীদের বিভিন্ন মানের জন্য বিভিন্ন বৈশিষ্ট্য থাকবে? সুতরাং পরীক্ষাগুলি / অন্তর / ইত্যাদির জন্য আমাদের এটির প্রয়োজন না থাকলেও পরবর্তী ব্যাখ্যাগুলির জন্য অসম বৈকল্পের জন্য পরীক্ষা করা ভাল। যে আমরা ব্যবহার করছি।


আপনার বক্তব্যটি আমি বিশেষভাবে উল্লেখ করেছি যে এখানে একটি উল্লেখযোগ্য সময়ের সীমাবদ্ধতা রয়েছে। আমি আমার প্রতিষ্ঠানে যা দেখি তা হল যখন শিক্ষার্থীরা এই অনুমানগুলি নিয়ে লড়াই করে তারা প্রায়শই প্রয়োজনীয় পরামর্শ গ্রহণ করে না বা করতে পারে না। সুতরাং তারা মানানসই মডেল অনুমানের ভিত্তিতে প্রকল্পগুলি নির্বাচন করা বা অনুমানগুলি লঙ্ঘন করার জন্য শাস্ত্রীয় মডেলটিকে অনুপযুক্তভাবে ব্যবহার করে। আমি যুক্তি দিয়েছি যে আরও শক্তিশালী কৌশলগুলি শেখানোর মাধ্যমে শিক্ষার্থীরা সেখানে পছন্দগুলিতে কম সীমাবদ্ধ থাকবে এবং তারা প্রকৃতপক্ষে উত্সাহী প্রকল্পগুলি অনুসরণ করার ক্ষমতাপ্রাপ্ত হবে।
জাচারি ব্লুমেনফিল্ড

13
পড়ানোর সময় আপনি সর্বদা আদর্শ কেস দিয়ে শুরু করেন, তারপরে সব ধরণের জটিলতায় intoুকুন। পিএইচডি স্তরের একোমেনট্রিক্সে তারা সব ধরণের অদ্ভুত জিনিস শেখায়, তবে সেখানে যেতে সময় লাগে। আমি মনে করি এটি শিক্ষার সমস্যা নয় যে বেশিরভাগ লোক এমএসসি স্তর থেকে কোথাও ট্রেন থেকে উঠে পড়ে। আসলে, আমি দাবি করব যে বড় সমস্যাটি হ'ল অর্ধ-বেকড "ডেটা বিজ্ঞানীরা" দ্বারা কীটপতঙ্গ আক্রান্ত করা, অভিনব আর প্যাকেজগুলি বাম এবং ডান প্রয়োগের পরিসংখ্যানের ভিত্তির প্রায় শূন্য জ্ঞান রয়েছে, তারা কী করছে এবং কোন লড়াইয়ের জন্য তার কোনও ইঙ্গিত নেই। আউটপুট একটি ধারণা তৈরি করুন।
আকসকল

@ আকসাকাল কোথায় আপনি এই বিশাল সংখ্যক অতিরিক্ত আত্মবিশ্বাসী, অযোগ্য যোগ্য বিশ্লেষককে দেখতে পাচ্ছেন? কারণ আমি যা প্রায়শই মুখোমুখি তা প্রায় বিপরীত। লোকেরা প্রথমে অনুধাবন বিশেষজ্ঞের অনুমোদন না দেওয়া হলে তারা যে কৌশলগুলি শিখেছিল সেগুলি চেষ্টা করে দেখতে ভয় পায়। কেবলমাত্র এই সাইটে, আমি নিশ্চিত যে আপনি আরও প্রশ্নবিদ্ধ / গঠনমূলক প্রশ্ন হলে "" আমাকে কি অনুমতি দেওয়া হয়েছে ... "বা" এটি কি বৈধ .... "এর প্রভাব সম্পর্কে অনেক প্রশ্ন দেখেছেন কী হবে যদি .... "
রোল্যান্ডো

18

1) মানুষ খুব কমই কেবল অনুমান করতে চায়। সাধারণত অনুমান - সিআই, পিআই, পরীক্ষা - লক্ষ্য বা এর কমপক্ষে একটি অংশ (এমনকি কখনও কখনও এটি অপেক্ষাকৃত অনানুষ্ঠানিকভাবে সম্পন্ন হলেও)

2) গাউস মার্কভ তত্ত্বের মতো বিষয়গুলি অগত্যা খুব বেশি সহায়তা করে না - যদি বিতরণটি স্বাভাবিকের থেকে যথেষ্ট দূরে থাকে তবে লিনিয়ার এস্টিমেটার খুব বেশি ব্যবহার হয় না। কোনও লিনিয়ার অনুমানকারী খুব ভাল না হলে BLUE পাওয়ার কোনও লাভ নেই।

3) স্যান্ডউইচ অনুমানকারীগুলির মতো জিনিসগুলিতে বিপুল সংখ্যক অন্তর্নিহিত পরামিতি জড়িত। আপনার কাছে প্রচুর ডেটা থাকলে এটি ঠিক আছে তবে অনেক সময় লোকেরা তা না করে।

4) পূর্বাভাস অন্তরগুলি পর্যবেক্ষণে বৈকল্পিকের উপর একটি ভাল হ্যান্ডেল থাকা সহ শর্তাধীন বিতরণ আকারের উপর নির্ভর করে - আপনি খুব সহজেই পিআই দিয়ে বিশদ বিবরণ করতে পারবেন না।

5) বুটস্ট্র্যাপিংয়ের মতো জিনিসগুলি প্রায়শই খুব বড় নমুনাগুলির জন্য কার্যকর। তারা কখনও কখনও ছোট নমুনাগুলিতে লড়াই করে - এমনকি মাঝারি আকারের নমুনাগুলিতেও প্রায়শই আমরা দেখতে পাই যে আসল কভারেজের বৈশিষ্ট্য অ্যাডভার্টাইজডের মতো কিছুই নয়।

যা বলা যায় - কিছু জিনিস হ'ল ধরণের প্যানাসিয়া লোকেরা তাদের পছন্দ করে। এই সমস্ত কিছুরই নিজস্ব স্থান রয়েছে এবং অবশ্যই প্রচুর পরিমাণে মামলা রয়েছে যেখানে (বলুন) স্বাভাবিকতা প্রয়োজন হয় না এবং যেখানে প্রাক্কলন এবং অনুমিতি (পরীক্ষাগুলি এবং সিআই) যথাযথভাবে স্বাভাবিকতা, ধ্রুবক বৈচিত্র্য ইত্যাদির প্রয়োজন ছাড়াই করা যায়।

একটি জিনিস যা প্রায়শই ভুলে যায় বলে মনে হয় তা হল অন্যান্য প্যারাম্যাট্রিক অনুমান যা পরিবর্তে তৈরি করা যেতে পারে। প্রায়শই লোকেরা যথেষ্ট শালীন প্যারামিট্রিক অনুমান করার জন্য একটি পরিস্থিতি সম্পর্কে যথেষ্ট জানেন (উদাহরণস্বরূপ বলুন ... শর্তসাপেক্ষ প্রতিক্রিয়াটি এসডি সহ বেশিরভাগ সমানুপাতিকভাবে ডান স্কু হতে থাকে যার অর্থ আমাদের গামা বা লগমনাল মডেল বলে বিবেচনা করতে পারে); প্রায়শই এটি একইসাথে হেটেরোস্কেস্টাস্টিটি এবং অ-স্বাভাবিকতা উভয়ই মোকাবেলা করতে পারে।

একটি খুব দরকারী সরঞ্জাম সিমুলেশন - এটির সাহায্যে আমরা আমাদের সরঞ্জামগুলির বৈশিষ্ট্যগুলির মতো পরিস্থিতিগুলিতে খুব ভালভাবে পরীক্ষা করতে পারি যেহেতু এটি দেখা যায় যে আমাদের ডেটা তৈরি হয়েছিল এবং তাই সান্ত্বনাজনক জ্ঞানে তাদের ব্যবহার করুন যে তাদের ক্ষেত্রে ভাল বৈশিষ্ট্য রয়েছে ( বা, কখনও কখনও দেখুন যে তারা কাজ করে না তেমনি আমরা আশা করি)।


"জনগণ খুব কমই কেবল অনুমান করতে চায়" - কর্পোরেট ফিনান্স এবং অর্থনীতিতে লোকেরা একটি নির্দিষ্ট ভেরিয়েবলের প্রভাব ছড়িয়ে দেওয়ার জন্য অনেক কিছু অনুমান করে। আমি প্রচুর কাগজপত্র পড়েছি, যেখানে লেখকরা আত্মবিশ্বাসের অন্তরগুলিকেও দেখেন না, তারা অবশ্যই সাধারণ অনুমানের অধীনে তাত্পর্যটি লক্ষ্য করেন।
আকসকল

6
@ আকসাল ভাল, হ্যাঁ, তবে তারা যদি মানক ত্রুটিগুলি, বা টি-ভ্যালু, বা পি-ভ্যালু ইত্যাদির দিকে মনোযোগ দিচ্ছে ... তবে আমার গণনা দ্বারা তারা কেবল অনুমান করতে চায় না। তারা আনুষ্ঠানিকভাবে পরীক্ষা / অন্তরগুলি নির্মাণ করেন বা না করেন, সেই ধরণের অন্যান্য বিষয়গুলির দিকে নজর রাখার জন্য - তবে অনানুষ্ঠানিকভাবে - অর্থবোধক হতে গেলে তাদের প্রথমে অর্থ থাকতে হবে।
Glen_b
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.