আমি জানি যে লিনিয়ার রিগ্রেশন এ রেসপন্স ভেরিয়েবল অবশ্যই অবিচ্ছিন্ন হতে পারে তবে কেন এটি এমন? আমি অনলাইনে এমন কিছু খুঁজে পাচ্ছি না যা ব্যাখ্যা করে যে আমি কেন প্রতিক্রিয়ার ভেরিয়েবলের জন্য পৃথক ডেটা ব্যবহার করতে পারি না।
আমি জানি যে লিনিয়ার রিগ্রেশন এ রেসপন্স ভেরিয়েবল অবশ্যই অবিচ্ছিন্ন হতে পারে তবে কেন এটি এমন? আমি অনলাইনে এমন কিছু খুঁজে পাচ্ছি না যা ব্যাখ্যা করে যে আমি কেন প্রতিক্রিয়ার ভেরিয়েবলের জন্য পৃথক ডেটা ব্যবহার করতে পারি না।
উত্তর:
আপনার পছন্দের সংখ্যার দুটি কলামে লিনিয়ার রিগ্রেশন ব্যবহার করা থামিয়ে দেওয়ার কিছু নেই। এমন সময় আছে যখন এটি এমনকি যথেষ্ট বুদ্ধিমান পছন্দ হতে পারে।
তবে, আপনি যা বের করবেন তার বৈশিষ্ট্যগুলি অগত্যা কার্যকর হবে না (উদাহরণস্বরূপ আপনি তাদের হতে চান এমন সমস্ত কিছু হবে না)।
সাধারণত রিগ্রেশন সহ আপনি Y এর শর্তাধীন গড় এবং ভবিষ্যদ্বাণীকের মধ্যে কিছুটা ফিট করার চেষ্টা করছেন - অর্থাত্ কিছু আকারের ; তর্কসাপেক্ষে শর্তসাপেক্ষ প্রত্যাশা আচরণ মডেলিং কি 'রিগ্রেশন' হল হয় । [আপনি যখন জি এর জন্য একটি নির্দিষ্ট ফর্ম নেন তখন লিনিয়ার রিগ্রেশন হয় ]
উদাহরণস্বরূপ, বিচক্ষণতার চরম ক্ষেত্রে বিবেচনা করুন, একটি প্রতিক্রিয়া পরিবর্তনশীল যার বন্টন 0 বা 1 হয় এবং যা সম্ভাব্যতার সাথে মান 1 গ্রহণ করে যা কিছু ভবিষ্যদ্বাণীকারী ( ) পরিবর্তনের হিসাবে পরিবর্তিত হয়। এটি হ'ল E ( Y | x ) = P ( Y = 1 | X = x ) ।
আপনি যদি লিনিয়ার রিগ্রেশন মডেলটির সাথে এই ধরণের সম্পর্কের উপযুক্ত হন তবে একটি সংকীর্ণ বিরতি বাদে এটি মানগুলি অসম্ভব বলে পূর্বাভাস দেবে - হয় 0 এর নীচে বা 1 এর উপরে :
প্রকৃতপক্ষে, এটিও দেখতে পাওয়া যায় যে প্রত্যাশা সীমানার কাছে যাওয়ার সাথে সাথে মানগুলি আরও বেশি বার বার সেই সীমানায় মান গ্রহণ করতে পারে, সুতরাং এর প্রকরণটি যদি প্রত্যাশা মাঝের কাছাকাছি থাকে তার চেয়ে কম হয়ে যায় - বৈকল্পিকটি কমতে হবে 0 এ সুতরাং একটি সাধারণ প্রতিরোধের ওজন ভুল হয়ে যায়, শর্তাধীন প্রত্যাশা 0 বা 1 এর নিকটবর্তী অঞ্চলে ডেটা ওজন কমিয়ে দেয়, আপনার যদি a এবং b এর মধ্যে সীমাবদ্ধ পরিবর্তনশীল থাকে তবে বলুন (যেমন প্রতিটি পর্যবেক্ষণ একটি পৃথক গণনা হিসাবে রয়েছে) যে পর্যবেক্ষণের জন্য একটি সম্ভাব্য মোট সম্ভাব্য গণনার বাইরে)
তদতিরিক্ত, আমরা সাধারণত শর্তাধীন মানে উপরের এবং নিম্ন সীমাগুলির প্রতি asympote বোঝাতে আশা করি, যার অর্থ সম্পর্কটি সাধারণত বাঁকানো হবে, সোজা নয়, সুতরাং আমাদের লিনিয়ার রিগ্রেশন সম্ভবত এটি ডেটার সীমার মধ্যেও ভুল হয়ে যায়।
একই ধরণের সমস্যাগুলি ডেটা নিয়ে ঘটে যা কেবলমাত্র একদিকে আবদ্ধ থাকে (উদাহরণস্বরূপ যে গণনাগুলির একটি উচ্চ সীমানা থাকে না) যখন আপনি সেই এক সীমানার কাছাকাছি থাকেন।
এটা সম্ভব (যদি বিরল) বিযুক্ত তথ্য যে হয় প্রান্তে বেষ্টিত না আছে; যদি চলকটি বিভিন্ন মান গ্রহণ করে তবে তারতম্যের মডেলটির বর্ণনা এবং বৈকল্পিকতা যুক্তিসঙ্গত হওয়ায় বিচ্ছিন্নতা অপেক্ষাকৃত সামান্য পরিণতি হতে পারে।
এখানে একটি উদাহরণ রয়েছে যে এটিতে লিনিয়ার রিগ্রেশন ব্যবহার করা সম্পূর্ণ যুক্তিসঙ্গত হবে:
যদিও এক্স-মানগুলির যে কোনও পাতলা স্ট্রিপগুলিতে কেবল কয়েকটি পৃথক ওয়াই-মান পর্যবেক্ষণ হওয়ার সম্ভাবনা রয়েছে (সম্ভবত প্রস্থ 1 এর অন্তর জন্য 10 এর কাছাকাছি), প্রত্যাশাটি ভাল-অনুমান করা যেতে পারে, এমনকি মান ত্রুটি এবং পি- মান এবং আত্মবিশ্বাসের ব্যবধানগুলি এই বিশেষ ক্ষেত্রে কম বেশি যুক্তিসঙ্গত হবে। ভবিষ্যদ্বাণী ব্যবধানগুলি কিছুটা কম ভাল কাজ করার প্রবণতা রাখবে (কারণ সেই ক্ষেত্রে অ-স্বাভাবিকতা আরও বেশি সরাসরি প্রভাব ফেলবে)
-
যদি আপনি হাইপোথিসিস টেস্টগুলি সম্পাদন করতে চান বা আত্মবিশ্বাস বা ভবিষ্যদ্বাণী অন্তরগুলি গণনা করতে চান তবে স্বাভাবিক পদ্ধতিগুলি স্বাভাবিকতার অনুমান করে। কিছু পরিস্থিতিতে, এটি গুরুত্বপূর্ণ হতে পারে। যাইহোক, এটি নির্দিষ্ট ধারণা না করে অনুমান করা সম্ভব।
আমি মন্তব্য করতে পারি না, তাই আমি উত্তর দেব: সাধারণ রৈখিক প্রতিক্রিয়ার মধ্যে প্রতিক্রিয়া পরিবর্তনশীল অবিচ্ছিন্ন হওয়া দরকার না , আপনার অনুমান নয়:
তবে হ'ল:
সাধারণ লিনিয়ার রিগ্রেশনটি বর্গক্ষেত্রের অবশিষ্টাংশের ক্ষুদ্রায়ন থেকে প্রাপ্ত, যা ধারাবাহিক এবং পৃথক পৃথক ভেরিয়েবলের জন্য উপযুক্ত বলে মনে করা হয় (গাউস-মার্কফ তত্ত্বটি দেখুন)। অবশ্যই সাধারণত ব্যবহৃত আত্মবিশ্বাস বা ভবিষ্যদ্বাণী অন্তর এবং হাইপোথিসিস টেস্টগুলি সাধারণ বিতরণ অনুমানের উপর নির্ভর করে যেমন গ্লেন_বি সঠিকভাবে উল্লেখ করেছেন, তবে পরামিতিগুলির ওএলএস অনুমানগুলি তা দেয় না।
অন্যদিকে, সাধারণ রৈখিক মডেলটিতে , প্রতিক্রিয়া পরিবর্তনশীলটি পৃথক / শ্রেণীবদ্ধ (লজিস্টিক রিগ্রেশন) হতে পারে। বা গণনা (পোয়েসন রিগ্রেশন)।
চিহ্ন 999 এবং রিম্যাপের মন্তব্যে ঠিকানা সম্পাদনা করুন।
লিনিয়ার রিগ্রেশন একটি সাধারণ শব্দ যা লোকেরা এটি আলাদাভাবে ব্যবহার করতে পারে। আমাদের এটি পৃথক ভেরিয়েবলে ব্যবহার করতে বাধা দেওয়ার কিছু নেই বা স্বাধীন পরিবর্তনশীল এবং নির্ভরশীল পরিবর্তনশীল লিনিয়ার নয়।
আমরা যদি কিছু না ধরে এবং লিনিয়ার রিগ্রেশন চালাই তবে আমরা ফলাফল পেতে পারি। এবং যদি ফলাফলগুলি আমাদের প্রয়োজনগুলি পূরণ করে তবে পুরো প্রক্রিয়াটি ঠিক আছে। তবে, যেমন গ্লান_বি ড
যদি আপনি হাইপোথিসিস টেস্টগুলি সম্পাদন করতে চান বা আত্মবিশ্বাস বা ভবিষ্যদ্বাণী অন্তরগুলি গণনা করতে চান তবে স্বাভাবিক পদ্ধতিগুলি স্বাভাবিকতার অনুমান করে।
আমার এই উত্তরটি হ'ল কারণ আমি ধরেই নিয়েছি ওপি ক্লাসিক্যাল স্ট্যাটিস্টিক বই থেকে লিনিয়ার রিগ্রেশন জিজ্ঞাসা করছে যেখানে লিনিয়ার রিগ্রেশন শেখানোর সময় আমাদের সাধারণত এই ধারণা থাকে।
তাত্ত্বিক দৃষ্টিভঙ্গি থেকে উপরের উত্তরগুলি সঠিক are যাইহোক, ব্যবহারিক বিবেচনায়, এটি সমস্ত আপনার ডেটার ডোমেন এবং আপনার মডেলের ভবিষ্যদ্বাণীপূর্ণ শক্তির উপর নির্ভর করে।
একটি বাস্তব জীবনের উদাহরণ পুরানো এমডিএস দেউলিয়ার মডেল। এটি গ্রাহক creditণদাতাদের দ্বারা প্রারম্ভিক ঝুঁকিপূর্ণ স্কোরগুলির মধ্যে একটি ছিল যে কোনও .ণগ্রহীতা দেউলিয়া ঘোষণা করার সম্ভাবনাটি পূর্বাভাস দেয়। এই মডেলটি periodণগ্রহীতার creditণ প্রতিবেদন থেকে বিশদ ডেটা এবং ভবিষ্যদ্বাণী সময়কালে দেউলিয়া হওয়ার জন্য একটি বাইনারি 0/1 পতাকা ব্যবহার করে। তারপরে সেই তথ্যটি ... হ্যাঁতে খাওয়ানো হয়েছে .. আপনি এটি অনুমান করেছিলেন।
একটি সমতল পুরাতন লিনিয়ার রিগ্রেশন
আমি একবার এই মডেলটি তৈরি করে এমন একজনের সাথে কথা বলার সুযোগ পেয়েছি। অনুমানের লঙ্ঘন সম্পর্কে আমি তাকে জিজ্ঞাসা করেছি। তিনি ব্যাখ্যা করেছিলেন যে এটি অবশিষ্টাংশ ইত্যাদির অনুমানগুলি পুরোপুরি লঙ্ঘন করেছে যদিও তিনি তার যত্ন নেন নি।
প্রস্থান...
এই 0/1 লিনিয়ার রিগ্রেশন মডেল (যখন স্ট্যান্ডার্ড করা যায় / সহজেই পড়ার স্কোরকে মাপানো হয় এবং উপযুক্ত কাট অফ দিয়ে জোড় করা হয়) ডেটা হোল্ডআউট নমুনার বিরুদ্ধে পরিষ্কারভাবে বৈধতা দেওয়া হয় এবং দেউলিয়ার পক্ষে ভাল / খারাপ বৈষম্যমূলক হিসাবে সম্পাদিত হয়।
মডেলটি বছরের পর বছর ধরে ২ য় ক্রেডিট স্কোর হিসাবে bankণ-রক্ষার জন্য এফিকোর ঝুঁকিপূর্ণ স্কোর (যা +০+ দিনের ক্রেডিট ডিনিকোয়েন্সি পূর্বাভাসের জন্য ডিজাইন করা হয়েছিল) পাশাপাশি রক্ষার জন্য ব্যবহৃত হয়েছিল।