কোনও সমস্যা লিনিয়ার রিগ্রেশন-এর জন্য উপযুক্ত Cl


12

আমি মন্টগোমেরি, পেক এবং ভাইনিং দ্বারা লিনিয়ার রিগ্রেশন অ্যানালাইসিসের ভূমিকা ব্যবহার করে লিনিয়ার রিগ্রেশন শিখছি । আমি একটি ডেটা বিশ্লেষণ প্রকল্প চয়ন করতে চাই।

আমার নির্বুদ্ধ ধারণা আছে যে লিনিয়ার রিগ্রেশন কেবল তখনই উপযুক্ত যখন ব্যাখ্যা করা যায় যে ব্যাখ্যামূলক ভেরিয়েবল এবং প্রতিক্রিয়ার ভেরিয়েবলের মধ্যে লিনিয়ার ক্রিয়ামূলক সম্পর্ক রয়েছে বলে সন্দেহ করে। তবে রিয়েল-ওয়ার্ল্ডের অনেকগুলি অ্যাপ্লিকেশনই এই মানদণ্ডটি পূরণ করবে বলে মনে হয় না। তবু লিনিয়ার রিগ্রেশন তাই প্রচলিত।

কোনও প্রকল্পের কোন দিকগুলি অভিজ্ঞ পরিসংখ্যানবিদরা আমার জুতা থাকলে তা নিয়ে ভাবছেন, এমন একটি প্রশ্ন + ডেটা খুঁজছেন যা লিনিয়ার রিগ্রেশন জন্য উপযুক্ত।


3
আমি প্রশংসা করি যে আপনি একটি কৌশল শিখছেন এবং এটি কোথায় কাজ করবে তা জানতে চাই। তবে অভিজ্ঞ পরিসংখ্যানবিদদের (এবং পরিসংখ্যানগত ধারণাযুক্ত বিজ্ঞানীদের) জন্য পরিস্থিতি পুরোপুরি অন্যভাবে রয়েছে: একটি সমস্যা এবং উপাত্ত রয়েছে এবং তারপরে প্রশ্ন হচ্ছে কোন ধরণের মডেল এবং পদ্ধতিগুলি সেরা পছন্দ। আপনি যে লিনিয়ার রিগ্রেশনটি প্রথম দেখতে পেয়েছেন তা কেবল একটি স্বাদ হিসাবে দেখতে পাবেন; অভিজ্ঞতার সাথে লোকেরা পোইসন রিগ্রেশন, লজিট রিগ্রেশন ইত্যাদিতে ঝাঁপিয়ে পড়ে খুশি এবং পরামিতিগুলিতে লিনিয়ারিটি সহজেই আরও সাধারণ কাঠামোর সাথে সংযুক্ত হতে পারে।
নিক কক্স

এবং অবশ্যই সময় সিরিজের এমডেলগুলি যখন পর্যবেক্ষণগুলি সম্ভাব্যভাবে
স্বতঃসংশ্লিষ্ট হয়

3
বাস্তবে রৈখিক মডেলগুলি বাম এবং ডান ব্যবহৃত হয় এমনকি যখন আমরা জানি যে সম্পর্কটি অরেখানের। প্রথম অর্ডারটির সান্নিধ্য হিসাবে লিনিয়ার মডেলটিকে ভাবেন, একধরণের মাল্টিভারিয়েট টেলর প্রসারণ।
আকসকল

উত্তর:


12

আমার নির্বুদ্ধ ধারণা আছে যে লিনিয়ার রিগ্রেশন কেবল তখনই উপযুক্ত যখন ব্যাখ্যা করা যায় যে ব্যাখ্যামূলক ভেরিয়েবল এবং প্রতিক্রিয়ার ভেরিয়েবলের মধ্যে লিনিয়ার ক্রিয়ামূলক সম্পর্ক রয়েছে বলে সন্দেহ করে। তবে রিয়েল-ওয়ার্ল্ডের অনেকগুলি অ্যাপ্লিকেশনই এই মানদণ্ডটি পূরণ করবে বলে মনে হয় না।

এটি "লিনিয়ার রিগ্রেশন" এর মধ্যে "লিনিয়ার" কী তা সঠিক ধারণা নয়।

এটি এবং x এর মধ্যে সম্পর্ক নয় যা লিনিয়ার ফর্ম হিসাবে ধরে নেওয়া হয় (যদিও সমস্ত প্রাথমিক উদাহরণ আপনাকে বিভ্রান্ত করতে পারে)।yx

"লিনিয়ার" বলতে পরামিতিগুলিতে মডেলটিকে রৈখিক হওয়া বোঝায় এবং এবং কিছু এক্স এর মধ্যে অ-লিনিয়ার সম্পর্ক অবশ্যই সেইভাবে মডেল করা যায়।yx

সেখানে একটি একক predictor সঙ্গে একটি উদাহরণ এখানে কিন্তু বক্ররেখা-বেষ্টিত মডেলের আরো প্রায়ই একাধিক রিগ্রেশন, যেখানে একটা predictor (এক্স পরিবর্তনশীল, স্বাধীন পরিবর্তনশীল) এর বিভিন্ন ফাংশন রিগ্রেশনে ঘটতে পারে যেমন লাগানো হয়, এবং এই নমনীয়তা অনেক পারবেন। এর মধ্যে উদাহরণস্বরূপ বহুবর্ষীয় রিগ্রেশন অন্তর্ভুক্ত রয়েছে। এখানে কিছু আলোচনা এবং উদাহরণ দেখুন ।

যাইহোক, আমরা যদি ভবিষ্যদ্বাণীকারীদের বক্র সম্পর্কের সাথে মানানসই রূপান্তরিত করতে পারি তবে এই পরামিতিগুলির মধ্যে রৈখিকতাও সেই রূপান্তরিত ভবিষ্যদ্বাণীগুলির মধ্যে রৈখিকতার সাথে মিল রাখে।

তদতিরিক্ত, অনেকগুলি সমস্যা লিনিয়ার (কমপক্ষে মূল্যবোধের পরিসীমা বিবেচিত) এর কাছাকাছি, বা এতটাই কোলাহলপূর্ণ যে কোনও হালকা বক্ররেখাটি বোধগম্য নয় এবং ক্রমবর্ধমান বা হ্রাস হওয়া সম্পর্কের জন্য বিভিন্ন ধরণের সাধারণ মডেলগুলি করতে পারে - এবং সেক্ষেত্রে একটি রৈখিক পছন্দ উপযুক্ত এবং বোঝার জন্য উভয়ই পর্যাপ্ত এবং সহজতম হতে পারে।

কোনও প্রকল্পের কোন দিকগুলি অভিজ্ঞ পরিসংখ্যানবিদরা আমার জুতা থাকলে তা নিয়ে ভাবছেন, এমন একটি প্রশ্ন + ডেটা খুঁজছেন যা লিনিয়ার রিগ্রেশন জন্য উপযুক্ত।

আমি যখন শিক্ষণের জন্য একটি ভাল উদাহরণ চেষ্টা করার চেষ্টা করছি তখন কেবলমাত্র আমি যখন রিগ্রেশন প্রয়োগ করতে সমস্যাটি খুঁজছি তখনই হতে পারে। প্রকৃতপক্ষে পরিসংখ্যানমূলক কাজ করার অবস্থাতে (এটির ব্যাখ্যা বা শেখানোর চেয়ে) আমি পদ্ধতিটি অনুসারে উপাত্ত বেছে নেওয়ার চেয়ে আগ্রহের (এবং উপাত্তের বৈশিষ্ট্যগুলি) উপযোগী করার জন্য পদ্ধতিটি বেছে নিই।

উদাহরণস্বরূপ কোনও ছুতার কল্পনা করুন। সূত্রধর একটি spokeshave কুড়ান না এবং বল "আমি কি ব্যবহার করতে পারেন এই উপর?"। বরং, ছুতার সমস্যার সমাধান করতে সমস্যা রয়েছে এবং সমস্যার বৈশিষ্ট্যগুলি বিবেচনা করে ("আমি কী তৈরির চেষ্টা করছি?" এবং "আমি কী ধরণের কাঠ ব্যবহার করছি?" এবং এই জাতীয় ...) নির্দিষ্ট সরঞ্জামগুলি হতে পারে অন্যদের তুলনায় আরও প্রাসঙ্গিক। কখনও কখনও উপলব্ধ সরঞ্জামগুলি পছন্দগুলিকে সীমাবদ্ধ করতে বা গাইড করতে পারে (যদি আপনার কাছে মুখপাত্র না থাকে তবে আপনাকে অন্য কোনও কিছু করতে হবে ... অথবা আপনাকে কেবল একটি স্পোকা কিনতে যেতে হবে)।

যাইহোক, ধরে নেওয়া যাক আপনার কাছে পকেট পরিসংখ্যানবিদ আপনাকে সহায়তা করছে এবং আপনি লিনিয়ার রিগ্রেশনকে উপযুক্ত বলে সন্ধান করার চেষ্টা করছেন। তারপরে তারা আপনাকে বিভিন্ন রিগ্রেশন অনুমানগুলি বিবেচনা করার পরামর্শ দিতে পারে এবং যখন তা বিবেচনা করে। আমি কয়েকটি বিষয় উল্লেখ করব।

যদি আপনি কেবল y এবং কিছু অবিবাহিত (সম্ভবত রূপান্তরিত) x এর মধ্যে সম্পর্ক স্থাপন করতে আগ্রহী হন তবে বেশিরভাগ অনুমান আপনার কাছে গুরুত্বপূর্ণ নয় (গাউস-মার্কভের উপপাদ্যটি কিছুটা প্রাসঙ্গিক হতে পারে)। আপনি এমন কেস খুঁজছেন যেখানে আপনি ভাবেন E(y|g(x)) কিছু পরিচিত - জি (এর অর্থ এটি আমরা ধরে রাখি যে সম্পর্কের কার্যকরী রূপটি আমরা জানি) অনুমান করি এটির জন্য মধ্যে প্রায় লিনিয়ার ) । X = x লেখা , আমাদের প্রয়োজন যে E ( y | x )g(x)gx=x কমপক্ষে সত্য।E(y|x)=a+bx

যদি আপনি একাধিক রিগ্রেশন ব্যবহার করতে সক্ষম হন তবে এটি বিশেষত কোনও বড় সমস্যা নয়, যেহেতু কেউ মোটামুটি রিগ্রেশনকে প্রায় সাধারণ সম্পর্কের সাথে মানিয়ে নিতে ব্যবহার করতে পারে (উদাহরণস্বরূপ)।

আমি পরামর্শ দিচ্ছি যে আপনি উত্সাহী রিগ্রেশন নিয়ে সমস্যাগুলি না বুঝতে পারলে সময়ের সাথে সাথে আপনি ডেটা সাফ করুন; ক্রস বিভাগীয় সমস্যা সঙ্গে আটকা।

আপনি যদি কেবল একটি একক সাথে লেনদেন করেন তবে আমি আশা করি যে আপনি ক্লাসিকাল এক্সের চেয়ে ধ্রুবক চান ।xx

আপনি যদি পরিমাপকৃত মানটির উপর প্রত্যাশার কন্ডিশনে আগ্রহী না হন তবে আপনি এ পরিমাপের ত্রুটি রাখতে চাইবেন না ।x

যদি আপনি হাইপোথিসিস টেস্টিং, আত্মবিশ্বাসের ব্যবধান বা ভবিষ্যদ্বাণী অন্তরগুলিতে আগ্রহী হন, তবে স্বাভাবিক প্রতিরোধ অনুমানগুলি আরও বেশি কিছু হতে পারে (তবে এমন বিকল্প রয়েছে যা এই অনুমানগুলি করে না এবং কিছু ক্ষেত্রে কমপক্ষে কিছু অনুমানও নাও করতে পারে যাইহোক বিশেষভাবে গুরুত্বপূর্ণ হতে হবে)।

কমপক্ষে একটি সচেতন হওয়ার চেষ্টা করার একটি বিষয় হ'ল সেই অনুমানগুলি কী যেগুলি আপনি ব্যবহার করছেন এমন আনুপাতিক পদ্ধতিগুলি অর্জন করার ক্ষেত্রে এবং কীভাবে সেগুলি আপনার বিশেষ সমস্যাতে গুরুত্বপূর্ণ হতে পারে (উদাহরণস্বরূপ, সাধারণ অনুমান পরীক্ষা করার সময়, স্বাভাবিকতা একটি অনুমান, তবে বৃহত নমুনায় ধারণাটি গুরুত্বপূর্ণ নাও হতে পারে; অন্যদিকে, ধ্রুবক পরিবর্তনের অনুমান একটি ইস্যুতে আরও বেশি হতে পারে)।

এমন অনেকগুলি পোস্ট রয়েছে যেগুলি রিগ্রেশন অনুমান নিয়ে আলোচনা করে এবং কিছু পোস্ট সেগুলি নিয়ে আলোচনা করা হয় যখন সেগুলি আদৌ তৈরি করার প্রয়োজন হয় এবং কী পরিমাণ তারা বিষয়টি বিবেচনা করতে পারে এবং এমনকি তাদের এ বিবেচনার জন্য কোন আদেশ রয়েছে।


উত্তম উত্তর, তবে আমি মনে করি এটি সম্পূর্ণরূপে প্রশ্নের উত্তর দেয় না। কোনও প্রকল্পের কোন দিকগুলি অভিজ্ঞ পরিসংখ্যানবিদরা আমার জুতা থাকলে তা নিয়ে ভাবছেন, এমন একটি প্রশ্ন + ডেটা খুঁজছেন যা লিনিয়ার রিগ্রেশন জন্য উপযুক্ত reg উত্তরহীন রয়ে গেছে।
দাওয়ানি 33

@ দাওয়ানি 33 আমি অবশ্যই পরে এটিতে আরও যুক্ত করার ইচ্ছা নিয়েছি - টাইপ করার সময় কিছু জিনিস এসেছিল যা আমার মূল উত্তরটি লিখতে বাধা দেয় যা আমার উদ্দেশ্য ছিল; আমার যে বাক্যটি ছিল তা শেষ করার জন্য আমার কেবল সময় ছিল এবং এখন এক-দু'দিনের জন্য ফিরে নাও আসতে পারে। প্রকৃতপক্ষে আমি এতে সমস্ত টাইপগুলি সংশোধন করার জন্য সময়ও পাইনি। (এর মধ্যে আপনার কোনও উত্তর পোস্ট করতে দ্বিধা করা উচিত নয়।) অন্যদিকে, প্রশ্নের ভিত্তিটি ত্রুটিযুক্ত কিনা তা নির্দেশ করে ওপি তাদের মূল উদ্দেশ্যটির চেয়ে বিভিন্ন বিষয় জিজ্ঞাসা করতে আগ্রহী হতে পারে (এটি প্রায়শই ঘটে যখন কেন্দ্রীয়
অনুমান

উদাহরণস্বরূপ, আমি প্রত্যাশা করি যে একটি নতুন প্রশ্ন উঠতে পারে যা হতে পারে "আপনার কাছে কি উদাহরণ আছে?"
গ্লেন_বি -রিনস্টেট মনিকা

@ গ্লেন_বি ধন্যবাদ "লিনিয়ার" পরামিতিগুলিতে মডেলটিকে রৈখিক হওয়া বোঝায় । দুঃখিত যদি আমি ভুল লিখে থাকেন তবে আমার অর্থ অন্যথায় বোঝানো হয়নি। মূলশব্দটি কার্যকরী ছিল ।
cwackers

@ Glen_b তারা আপনাকে বিভিন্ন প্রতিরোধ অনুমান বিবেচনা করার পরামর্শ দিতে পারে । আবারও রাজি। আমি এই সম্পর্কে স্পষ্ট ছিল না, তবে আমার প্রশ্নটি ডোমেন জ্ঞান সম্পর্কে আরও বেশি। আমি ভাবছি যে একজন অভিজ্ঞ পরিসংখ্যানবিদ কী সিস্টেমটিকে এলআর বিশ্লেষণের জন্য বিবেচনা করা হচ্ছে তা সন্ধান করবে, সুতরাং সেখানে রেজিস্ট্রারদের সম্পর্কে আমার নির্বোধ প্রস্তাব যা প্রতিক্রিয়ার সাথে রৈখিক এবং কার্যকরীভাবে সম্পর্কিত এবং যার প্রতিক্রিয়াতে যুগপত সম্পর্ক যুক্ত হয় is
cwackers

4

YYYYYX) আমরা হব. অভিজ্ঞতার বহু বছর ধরে আপনি দেখতে পাবেন যে রক্তচাপের মতো নির্দিষ্ট পরিবর্তনশীলগুলি একটি রৈখিক মডেল এবং অন্যদের (যেমন রক্তের রসায়নের পরিমাপ) ভাল আচরণ করে না।

YY


ভাল আচরণ করার দিকটি নির্দেশ করার জন্য ধন্যবাদ। আমি রেজিস্ট্রারদের পরিবর্তনের কথা ভেবেছি, তবে প্রতিক্রিয়ার পরিবর্তনশীল নয়। যাইহোক, আমি এখন দেখছি কীভাবে অবশিষ্টাংশগুলির বিতরণ পুনরায় আকার দিতে ব্যবহৃত হতে পারে। কিছু ছবি পূরণ করার জন্য ধন্যবাদ। একটি খুব সহায়ক পোস্ট।
cwackers

3

@ গ্লেেন_বি একটি খুব ভাল উত্তর দিয়েছে তবে যেমনটি উল্লেখ করা হয়েছে, শেষ করতে পারেনি।

সুতরাং, আপনার শেষ প্রশ্ন হিসাবে:

একজন অভিজ্ঞ পরিসংখ্যানবিদ, আমার ধারণা, এই প্রশ্নটি করবে না। গ্লেন নোট হিসাবে, সমস্যাটি অন্যান্য সরঞ্জামগুলি ব্যবহার করার জন্য সরঞ্জামগুলি নির্দেশ করে।

যদি আমি লিনিয়ার রিগ্রেশন এর মতো কৌশল শিখতে চাইতাম তবে আমি ইতিমধ্যে কাজ করা উদাহরণগুলি ব্যবহার করতাম - তবে যেগুলির সত্যিকারের ডেটা ছিল, জিনিসগুলি সহজ করার জন্য ডিজাইন করা ডেটা তৈরি হয়নি। যেমন একটি বইউদাহরণ রিগ্রেশন মডেলিংয়ের দিকনির্দেশনা সরবরাহ করতে পারে।

যাইহোক, একটি রিগ্রেশন সমস্যাটি দেখার প্রথম পদক্ষেপের মধ্যে একটি স্থির করে দিচ্ছে যে লিনিয়ার রিগ্রেশন আসলে, উপযুক্ত কিনা।


একজন অভিজ্ঞ পরিসংখ্যানবিদ, আমার ধারণা, এই প্রশ্নটি করবে না। হ্যাঁ, কেন আমি "আমার জুতো" দিয়ে আমার প্রশ্নটি যোগ্যতা অর্জন করেছি। বই সুপারিশের জন্য অনেক ধন্যবাদ। আমি একটি অনুলিপি সন্ধান করব। বেশ কয়েকটি উদাহরণ গল্পের অন্তত অর্ধেক হিসাবে সহায়তা করবে, পাল্টা উদাহরণগুলি অন্য অর্ধেক হিসাবে থাকবে।
cwackers

আহ, উক্তি! চতুর্থ সংস্করণের ২ নম্বর পৃষ্ঠা থেকে: আমরা পাঠকদেরকে এমন প্রশ্নগুলি (তাদের নিজস্ব কাজ, গবেষণা বা আগ্রহের ক্ষেত্রগুলিতে) যা রিগ্রেশন বিশ্লেষণ ব্যবহার করে সম্বোধন করা যেতে পারে সে সম্পর্কে চিন্তাভাবনার জন্য আমন্ত্রণ জানাই।
cwackers

0

অনেক অনুভূতি যে অনুমানগুলি পূরণ করতে হবে তা স্পর্শ করেছে: অবশিষ্টাংশগুলিতে রৈখিকতা, ভবিষ্যদ্বাণীকের সীমা জুড়ে বৈচিত্রের একাত্মতা, কোনও রেগ্রেশন রেখা প্রভাবিত করতে পারে না এমন চূড়ান্ত মান এবং স্বাধীন পর্যবেক্ষণগুলি। বেশিরভাগ রিগ্রেশন প্রোগ্রামগুলির সাথে অবশিষ্ট প্লটগুলি উত্পাদন করা মোটামুটি সহজ এবং কিছু প্যাকেজ কিছু স্বয়ংক্রিয়ভাবে (এসএএস) সরবরাহ করে।

এক ব্যক্তি y এর রূপান্তর সম্পর্কে কথা বলেছেন। এটি কিছু ক্ষেত্রে এটি সাধারণ অনুশীলন, তবে এটি এমন একটি অনুশীলন যা পক্ষপাতদুষ্ট এবং সম্ভবত অ-ব্যাখ্যাযোগ্য ফলাফলের দিকে পরিচালিত করে। আপনি ফলাফলগুলিকে মূল মেট্রিকে ফেরত দেওয়ার চেষ্টা করার সময় পক্ষপাতটি প্রদর্শিত হবে। অন্য ধরণের রিগ্রেশনে স্থানান্তরিত হওয়া আরও ভাল যা একটি রেসিডুয়াল প্যাটার্ন রয়েছে যা অবশিষ্টাংশের বন্টনমূলক অনুমানের সাথে মেলে। শ্রেণিবদ্ধ ডেটা অ্যানালাইসিসে অ্যাগ্রেস্তির পরিচিতির 3 য় অধ্যায়টি দেখুন যেখানে তিনি লিঙ্কগুলির ধারণাটি প্রবর্তন করেছেন। বেশ কয়েকটি রিগ্রেশন পাঠ্যপুস্তকগুলি সাধারণীকরণিত রৈখিক মডেলটিও প্রবর্তন করে।


আমি রূপান্তর সম্পর্কে হতাশাবাদ ভাগ করি না। সর্বোপরি মূল রূপান্তরটি বেশ স্বেচ্ছাচারিতা। যদি আপনি একটি প্রতিসরণ বিতরণ দিয়ে রেশিয়ালগুলিকে রূপান্তর করেন এবং পান, তবে পূর্বাভাসিত মানগুলির ব্যাক-ট্রান্সফর্মটি হ'ল আসল স্কেলের পূর্বাভাস মিডিয়েন। পূর্বাভাস মিডিয়ান বেশ কার্যকর। যদি আপনি মূল স্কেলে পূর্বাভাসের মাধ্যম পেতে চান তবে আপনি গন্ধযুক্ত অনুমানকারীটি ব্যবহার করতে পারেন।
ফ্রাঙ্ক হ্যারেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.