নন-প্যারামেট্রিক রিগ্রেশন কখন ব্যবহার করবেন?


9

আমি নীচের ফর্মটির একটি রিগ্রেশন সমীকরণ ফিট করতে এসএএস-তে প্রোসি জিএলএম ব্যবহার করছি

Y=b0+b1X1+b2X2+b3X3+b4t

ফলাফলযুক্ত রেডসিডুয়ালের কিউকিউ প্লটটি স্বাভাবিকতা থেকে বিচ্যুতি নির্দেশ করে। কোনও রূপান্তর অবশিষ্টাংশগুলিকে স্বাভাবিক করতে কার্যকর নয়।Y

এই মুহুর্তে, আমি নিরাপদে পিআরসি লাউস-এর মতো প্যারাম্যাট্রিক পদ্ধতিতে স্যুইচ করতে পারি।

আমি ইতিমধ্যে PROC আলগা ব্যবহার করেছি এবং ফিটগুলি PROC GLM এর চেয়ে ভাল দেখাচ্ছে। তবে নন-প্যারামেট্রিক রিগ্রেশন সম্পর্কে আমার খুব বেশি জ্ঞান নেই। প্যারামিমেট্রিক রিগ্রেশন-এর চেয়ে অ-প্যারাম্যাট্রিক রিগ্রেশন কখন বেছে নেবে তা আমি জানি না।

কেউ আমাকে এই সাহায্য করতে পারেন?

আমি এগিয়ে গিয়ে আরও একটি প্রশ্ন যুক্ত করব। মডেলটিতে আমার চলকগুলির বর্ণনা নীচে দেওয়া আছে। কখনও কখনও আমি নেতিবাচক পূর্বাভাস ব্যয় পাই। এটা কোন মানে নেই। আমি কীভাবে এই সমস্যাটি সমাধান করতে পারি?

Y=cost of medical careX1=number of injectionsX2=number of surgeriesX3=number of physical therapiest=time

2
আপনি অবশ্যই এটির লগের মডেলিং করে নেতিবাচক ব্যয়ের পূর্বাভাস এড়াতে পারবেন:log(Y)=b0+b1X1+b2X2+b3X3+b4t
ডার্ক হর্স্টন

উত্তর:


10

কিউকিপ্লিটের অবশিষ্টাংশগুলি দেখার আগে, আপনার মডেলের ভবিষ্যদ্বাণীকারীদের বিরুদ্ধে অবশেষে প্লট করে (এবং সম্ভবত আপনার ব্যবহারযোগ্য অন্যান্য ভেরিয়েবলগুলির বিরুদ্ধেও) আপনার গুণমানের মূল্যায়ন করা উচিত। এই প্লটগুলিতে অ-লিনিয়ারিটি দেখা উচিত। যদি ভেরিয়েবল এর প্রভাবটি সত্যিই রৈখিক হয় তবে আপনি বিরুদ্ধে অবশিষ্টাংশের প্লটটি দৃশ্যমান কাঠামো ছাড়াই "অনুভূমিক" হওয়ার প্রত্যাশা করছেন :xx

                                                                   *
*                 *
      *                               *
        *   
                                                  *
--------------------------------------*------------------------------x
   *     
           *

                                     *
       *                                                    *
                                *

এটি, পয়েন্টগুলির একটি এলোমেলো অনুভূমিক "ব্লব", রেখার রেসিড = 0 এর চারপাশে কেন্দ্রীভূত।

যদি প্রভাবটি অ-রৈখিক হয়, আপনি এই প্লটটিতে কিছু বক্রতা দেখতে আশা করছেন। (এবং, দয়া করে, কিউকিপ্লিটগুলি অগ্রাহ্য করুন যতক্ষণ না আপনি উপরের মতো প্লটগুলি ব্যবহার করে অ-রৈখিকতা বাছাই না করে!)

আপনার সম্ভাব্য মিথস্ক্রিয়াগুলি সম্পর্কেও চিন্তা করা উচিত (সাধারণত পণ্য শর্তাদির দ্বারা মডেলিং করা হয়), অর্থাৎ, একটি ভেরিয়েবলের প্রভাব অন্য স্তরের উপর নির্ভর করে, (যদি আপনার তিনটি ভেরিয়েবলের একই সাথে উচ্চ মান থাকে, তবে এটি সম্ভবত কিছুটা কঠিন দেখায় ধৈর্যশীল যদি তাই হয়, মিথস্ক্রিয়া প্রয়োজন হতে পারে)।

আপনি যদি ইন্টারঅ্যাকশন এবং রূপান্তরগুলির জন্য চেষ্টা করার পরে কিছু অ-রৈখিক মডেলের জন্য যান (আপনি চেষ্টা করেছেন log(Cost)?) আপনি কি কিছু বক্স-কক্স-রূপান্তর চেষ্টা করেছেন? যেহেতু আপনার একাধিক রিগ্রেশন রয়েছে, আমি মনে করি না এটি loessআপনার যা প্রয়োজন, আপনার সন্ধান করা উচিত gam(সাধারণীকরণযোগ্য মডেল, এসএএসের এটি হওয়া উচিত, আরে এটি প্যাকেজে রয়েছে mgcv)।


1
মূল্যবান তথ্যের জন্য ধন্যবাদ। আমি লিনিয়ার রিগ্রেশন দিয়ে লগ (ব্যয়) চেষ্টা করেছিলাম, তবে এটি খুব একটা কার্যকর হয়নি। আমি ইন্টারঅ্যাকশন প্রভাবগুলি যুক্ত করব এবং যা ঘটে তা পর্যবেক্ষণ করব। আমি আবার রূপান্তরগুলি নিয়েও পরীক্ষা করবো। আমি আমার উন্নতি এবং অনুসন্ধানের সাথে প্রত্যেককে পোস্ট করব।
Ann

6

একটি লস সর্বদা রিগ্রেশনের চেয়ে ভাল ফিট দেয়, যদি না ডেটা সত্যিকারের লাইনের সাথে থাকে। লস একটি স্থানীয়ভাবে রৈখিক অনুমান যা ডেটার কাছাকাছি যাওয়ার জন্য ডিজাইন করা হয়েছে। এই পদ্ধতিগুলি মূলত অনুসন্ধানমূলক are এবং যদিও ফিটের সীমা ছাড়িয়ে কোনও রৈখিক মডেলকে বহির্ভূত করা বিপজ্জনক, অমিতের ক্ষেত্রে লোপাটের ক্ষেত্রে বেপরোয়া হয়ে উঠবে।

যদি আপনার মডেল আপনাকে নেতিবাচক ব্যয় দেয়, তবে এটি একটি দুর্দান্ত লক্ষণ যে আপনার চলকগুলির ক্ষেত্রে লিনিয়ার রিগ্রেশন উপযুক্ত নয়। আপনি বলেছেন যে আপনি রূপান্তরের চেষ্টা করেছিলেন। আপনি কি ভবিষ্যদ্বাণীকারীদের বিরুদ্ধে লগের লগটি নিয়েছেন?

জিনিসগুলির প্রকৃতিতে, ব্যয় এবং আপনার যে ভেরিয়েবলগুলি উল্লেখ করেছেন তার মধ্যে একটি সহজ সম্পর্ক রয়েছে বলে সম্ভাবনা কম। কখনও কখনও লিনিয়ার রিগ্রেশনটির উদ্দেশ্যটি কেবল এটি প্রমাণ করা যে কোনও ধরণের পারস্পরিক সম্পর্ক বিদ্যমান, এবং সম্ভবত ভবিষ্যদ্বাণীকারীদের একটি বুদ্ধিমান সেট নির্বাচন করা।


1
আপনি যখন উল্লেখ করেছেন যে এটি নেতিবাচক ব্যয়গুলি নির্দেশ করে যে এটি লিনিয়ার রিগ্রেশন উপযুক্ত নাও হতে পারে তখন এটি এতটা অর্থবোধ করে। আমি আমার বিশ্লেষণ চালিয়ে যাব এবং কিছু মিথস্ক্রিয়া যুক্ত করব। ধন্যবাদ.
Ann

3

ব্র্যাভো অবশিষ্টাংশ বিশ্লেষণ করার জন্য। আদর্শ বিশ্লেষককে আপনাকে এগিয়ে রাখে ahead (যদিও মডেলের আপনার বিবরণ ত্রুটি কাঠামোটি বর্ণনা না করার ক্ষেত্রে ঘাটতি রয়েছে)) আপনার এক্স এর ট্রান্সফর্মেশনগুলির পাশাপাশি ওয়াই এর রূপান্তরগুলিও বিবেচনা করা উচিত। আমি বুঝতে পারি যে স্প্লাইন ফিট করে মডেলিংয়ের ক্ষেত্রে এসএএস পিছনে রয়েছে তবে আমি বুঝতে পারি যে সাম্প্রতিক সংস্করণগুলি সেই ক্ষমতাটি দিয়েছে। এক্স পদগুলির জন্য সীমাবদ্ধ কিউবিক স্প্লাইন যুক্ত করার কথা বিবেচনা করুন। রেফারেন্স হিসাবে ফ্র্যাঙ্ক হ্যারেলের লেখা "রিগ্রেশন মডেলিং স্ট্র্যাটেজিগুলি" বীট করা শক্ত। এটির এই পদ্ধতির জন্য শক্ত পরিসংখ্যান যুক্তি রয়েছে। এটি একটি প্যারাম্যাট্রিক পদ্ধতি যা ডেটাতে কাঠামো আবিষ্কারের অনুমতি দেয় যা অন্য বুদ্ধিমানদের হাতছাড়া করতে পারে।


DWin প্রশংসা জন্য ধন্যবাদ। আমি স্নাতক হয়েছি, এবং এটি বিশ্লেষক হিসাবে আমার প্রথম কাজ। কাকতালীয়ভাবে, এই ধরণের বিশ্লেষণ সংস্থাটিতেও নতুন। সুতরাং, আমি কেবল এমন একটি বিশ্লেষণ হাজির করার চেষ্টা করছি যা সম্পূর্ণ বোকা নয়। আমি আপনার পরামর্শ গ্রহণ করব এবং এবং উভয় ভেরিয়েবলের রূপান্তরের চেষ্টা করব । আমি রেফারেন্স দিয়েও যাব। আমি অনলাইনে একটি পিডিএফ সংস্করণ পেয়েছি। আপনার ইনপুট জন্য ধন্যবাদ। YX
এএন

লগকে রূপান্তর করতে এবং আউটপুটগুলিতে স্বজ্ঞাতভাবে রৈখিকভাবে নির্ভর করে এমন কিছু সমস্যা রয়েছে। আপনি মডেল যেখানে ডান হাত মধ্যে ইনজেকশনও এবং ইনজেকশনও হয় বাম হাত, আপনি কেউ একই বাহু সমস্ত ইনজেকশনও থাকার জন্য সম্পূর্ণ ভিন্ন খরচ ভবিষ্যদ্বাণী করা এবং যার যার পাশে অর্ধেক অংশ রয়েছেlog(Y)=b0+b1log(X1)+b2log(X2)X1X2
ডার্ক হর্স্টন

আপনার মন্তব্যটি আমার প্রতিক্রিয়াটির তুলনায় স্পর্শকাতর বলে মনে হয়েছে (এবং যেহেতু হাত দিয়ে ইঞ্জেকশন বিভাজনের বিষয়টি আগে কখনও উল্লেখ করা হয়নি) আমি আশা করি আপনি ভাবেন না যে স্প্লাইন ফাংশনগুলি লগ রূপান্তরের সমতুল্য। ওয়াইয়ের লগ রূপান্তরটি এমন একটি মডেল তৈরি করে যেখানে ব্যয় স্কেলে ফিরে যাওয়ার পরে মডেলটি ভবিষ্যদ্বাণীকারীদের মধ্যে গুণক হয়। এটি মোটামুটি বড় পরিবর্তন এবং যার সমস্যাগুলি আপনি প্রশ্নকর্তাকে যথাযথভাবে বর্ণনা করেননি।
ডুইন

2

আমি মনে করি কেজেটিল আপনাকে কিছু ভাল পরামর্শ দিয়েছে। আমি যুক্ত করব যে অ-স্বাভাবিক অবশিষ্টাংশগুলির অর্থ এই নয় যে আপনাকে লিনিয়ার বা ননলাইনার রিগ্রেশন থেকে ননপ্যারামেট্রিক রিগ্রেশন পর্যন্ত ঝাঁপিয়ে পড়তে হবে। ননপ্যারমেট্রিক রিগ্রেশন এ গিয়ে আপনি একটি কার্যকরী ফর্মের কাঠামো ছেড়ে দেন। ওএলএস প্রতিরোধের শক্তিশালী রিগ্রেশন বিকল্প রয়েছে যা আপনি প্রথমে যেতে পারেন। তারপরে পরবর্তী পদক্ষেপের প্রয়োজন হলে সাধারণ রৈখিক মডেল এবং সাধারণীকরণযোগ্য মডেল। অলসতা আমার দৃষ্টিতে আপনার শেষ অবলম্বন হওয়া উচিত। আমি মনে করি যে আমি তাতে কেজিটিলের সাথে একমত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.