লিনিয়ার রিগ্রেশন অধ্যয়ন কেন?


13

দুটি এলোমেলো ভেরিয়েবল এবং আমরা তাদের "পারস্পরিক সম্পর্ক সহগ" গণনা করতে পারি এই দুটি এলোমেলো ভেরিয়েবলের মধ্যে সেরা ফিটের লাইন তৈরি করতে পারি। আমার প্রশ্ন কেন?η ξη

1) এলোমেলো ভেরিয়েবলগুলি রয়েছে, এবং যা সবচেয়ে খারাপ উপায়ে নির্ভর করে, যেমন এবং এই থাকা সত্ত্বেও । যদি কেউ কেবল রৈখিক প্রতিরোধের পাশাপাশি চিন্তা করে তবে একজন একেবারে একেবারে অন্ধ হয়ে যাবে।η ξ = ( η ) সি = 0ξηξ=(η)=0

2) কেন বিশেষত রৈখিক? এলোমেলো ভেরিয়েবলের মধ্যে থাকা অন্য ধরণের সম্পর্ক থাকতে পারে। অন্য সকলের মধ্যে কেন সে একা?


18
এটি কখনও কখনও নখের মুখোমুখি হওয়ার সময় আপনি কেন স্ক্রু ড্রাইভারের মালিক তা জিজ্ঞাসা করার মতো।
সাইকোরাক্স মনিকাকে

6
আপনিও এই অনুমানটি ধরে নিচ্ছেন যে সেখানে লোক রয়েছে যারা কেবল রৈখিক প্রতিরোধের বিষয়ে চিন্তা করে: "যদি কেউ কেবল রৈখিক প্রতিরোধের পাশাপাশি চিন্তা করেন", "অন্য যে সকলের মধ্যে সে একক কেন "। এটি আমার কাছে খড়ের মতো মনে হয়, অবশ্যই এটি একটি এবং কেবল একটি সরঞ্জাম বা দৃষ্টিভঙ্গির সাথে মেনে চলা হাস্যকর।
ম্যাথু ড্র্যারি

7
লিনিয়ার "নির্দিষ্টভাবে" আসলে ভিত্তি ফাংশনের লিনিয়ার সংমিশ্রণ সম্পর্কে আরও বেশি যা আসলে সাধারণ general
জিওম্যাট

2
@ ম্যাথিউড্রুরি কোনও স্ট্রোম্যান নেই এবং আমি কিছুও ধরে নিচ্ছি না, আমি কেবল পদ্ধতিটিতে একটি দুর্বল বিষয়টি চিত্রিত করার জন্য প্যাথলজিকাল-চরম-পরিস্থিতি ব্যবহার করে একটি প্রশ্ন জিজ্ঞাসা করছি। তুমি কেন ধরে নিচ্ছ যে আমি ধরে নিয়েছি? পরিসংখ্যানবিদদের কাছে রিগ্রেশন একটি খুব বড় বিষয়। এটি সম্পর্কে কী বিশেষ তা এতটুকু অধ্যয়ন করা হয় তা আমি বুঝতে পারি না।
নিকোলাস বাউরবাাকি

8
যারা এই প্রশ্নে কঠোর হচ্ছেন তাদের ক্ষেত্রে: আমি মনে করি আপনি যখন প্রথমবার লিনিয়ার রিগ্রেশন সম্পর্কে শিখেছিলেন এবং "একটি অনুমানের মধ্যে একটি রৈখিক প্রভাব" তখন আপনাকে ভুলে গিয়েছিলাম বলে আমি মনে করি। আপনি নিজেকে ভেবেছিলেন "তবে তার প্রভাব কখনই লিনিয়ার হয় না !"। খুব সম্ভবত, অনেক চিন্তাভাবনা করার পরে , আপনি নিজেকে নিশ্চিত করেছেন যে এটি সত্ত্বেও, লিনিয়ার রিগ্রেশন এখনও বোঝা ও ব্যবহার করা উভয়েরই একটি মৌলিক সরঞ্জাম ছিল। আপনি এই চিন্তাভাবনা শেষ করার আগে এখন নিজেকে পিছনে সেট করুন। আমি মনে করি এটি একটি দুর্দান্ত প্রশ্ন যা প্রত্যেক পরিসংখ্যানের শিক্ষার্থীর উচিত বিবেচনার জন্য ভাল সময় ব্যয় করা।
ক্লিফ এবি

উত্তর:


10

আমি সম্মত হই যে সমস্ত সম্পর্ক নিজেই রৈখিক হয় না তবে বেশিরভাগ সম্পর্কই লৈখিকভাবে প্রায় অনুমান করা যায়। আমরা গণিতে এই জাতীয় অনেকগুলি ক্ষেত্রে যেমন টেলর সিরিজ বা ফুরিয়ার সিরিজ ইত্যাদি দেখেছি The সম্পর্ক। বিশ্ববিদ্যালয়গুলি কেবল 'একাধিক লিনিয়ার রিগ্রেশন মডেল' (সাধারণ রিগ্রেশন মডেলগুলি সহ) সম্বোধনের কারণ হ'ল কারণ এগুলি আরও উন্নত স্তরের মডেলগুলির জন্য বিল্ডিং ব্লক যা লিনিয়ারও।

গাণিতিকভাবে বলতে গেলে, আপনি যতক্ষণ প্রমাণ করতে পারবেন যে একটি নির্দিষ্ট লিনিয়ার আনুমানিকতা হিলবার্ট স্পেসে ঘন, তবে আপনি স্থানটির কোনও ক্রিয়াকলাপ উপস্থাপনের জন্য সান্নিধ্য ব্যবহার করতে সক্ষম হবেন।


2
যথাযথভাবে। অন্য কারও এটি উল্লেখ করা হয়নি, তবে যেমন এই উত্তরটি বলেছে, সাধারণভাবে, আপনি সম্পর্ককে রৈখিক করতে সর্বদা আপনার পরিবর্তনশীলগুলিতে রূপান্তর প্রয়োগ করতে পারেন। তদ্ব্যতীত: ক) লিনিয়ার রিগ্রেশনগুলির জন্য গ্লোবাল ম্যাক্সিমা সন্ধান করা সহজ এবং খ) নিউরাল নেটওয়ার্কগুলি সহ আরও অনেক মডেল আপনি লিনিস্টিক রেগ্রেশনগুলি ভিত্তিক লজিস্টিক রিগ্রেশনগুলি জানেন কিনা তা বুঝতে সহজ।
রিকার্ডো ক্রুজ

7

আপনি যে মডেলটির কথা উল্লেখ করছেন, সাধারণ লিনিয়ার রিগ্রেশন, ওরফে "সেরা ফিটের লাইন" (আমি এখানে মডেল এবং অনুমানের পদ্ধতিটি বিভ্রান্ত করছি) স্বীকৃতভাবে খুব সহজ (নাম হিসাবে বলা হয়েছে)। কেন এটি অধ্যয়ন? আমি অনেক কারণ দেখতে পাচ্ছি। নিম্নলিখিতটিতে আমি ধরে নিয়েছি যে এলোমেলো পরিবর্তনশীলের ধারণাটি কমপক্ষে অনানুষ্ঠানিকভাবে প্রবর্তিত হয়েছে, কারণ আপনি এটি আপনার প্রশ্নে উল্লেখ করেছেন।

  1. পণ্ডিতিপনামূলক: অবশ্যই, আপনার জন্য এটি সুস্পষ্ট যে সীমাবদ্ধ দ্বিতীয় অর্ডার মুহুর্তের সাথে সত্যিকারের মূল্যবান র্যান্ডম ভেরিয়েবলগুলি হিলবার্ট স্থান তৈরি করে। আপনি সম্ভবত সম্ভাবনা তত্ত্বটি অধ্যয়ন করার পরে এটি ইতিমধ্যে সুস্পষ্ট ছিল। তবে পরিসংখ্যান কেবল গণিত শিক্ষার্থীদেরই শেখানো হয় না: এখানে পদার্থবিজ্ঞান থেকে অর্থনীতি, কম্পিউটার বিজ্ঞান, সামাজিক বিজ্ঞান ইত্যাদি বিস্তৃত পাবলিক রয়েছে These এই শিক্ষার্থীরা তাদের পড়াশোনার প্রথম দিকে পরিসংখ্যানের মুখোমুখি হতে পারে। তারা লিনিয়ার বীজগণিত হতে পারে বা নাও হতে পারে, এবং এমনকি প্রথম ক্ষেত্রেও, তারা এটি গণিত কোর্সের আরও বিমূর্ত দৃষ্টিকোণ থেকে দেখেনি। এই শিক্ষার্থীদের জন্য, অন্য একটি এলোমেলো ভেরিয়েবল দ্বারা র্যান্ডম ভেরিয়েবলের প্রায় অনুমানের ধারণাটি এত তাড়াতাড়ি নয়। এমনকি সরল রৈখিক মডেলের প্রাথমিক সম্পত্তি, ত্রুটি এবং ভবিষ্যদ্বাণীকারী অরথোগোনাল এলোমেলো ভেরিয়েবল, কখনও কখনও তাদের জন্য অবাক হয়। আপনি এলোমেলো ভেরিয়েবলের মধ্যে একটি "কোণ" সংজ্ঞায়িত করতে পারেন ("দুষ্টু" বস্তু! সম্ভাব্যতা থেকে পরিমাপযোগ্য স্থানের পরিমাপযোগ্য ফাংশন) আপনার কাছে স্পষ্ট হতে পারে তবে অগত্যা কোনও নতুন ব্যক্তির কাছে এটি প্রয়োজনীয় নয়। সুতরাং, যদি ভেক্টর স্পেসগুলির অধ্যয়নটি ভাল অল 'ইউক্লিডিয়ান বিমানের সাথে শুরু হয়, তবে সরলতমটি দিয়ে পরিসংখ্যানের মডেলগুলির অধ্যয়ন শুরু করা কি বোধগম্য নয়?
  2. পদ্ধতিগত : সাধারণ লিনিয়ার রিগ্রেশন সহ আপনি প্যারামিটার অনুমানের ধারণাটি চালু করতে পারেন এবং এভাবে এর সহজতম ক্ষেত্রে কমপক্ষে স্কোয়ারগুলি, স্ট্যান্ডার্ড ত্রুটিগুলি ইত্যাদি পদ্ধতি। আপনি যদি এটিকে তুচ্ছ মনে করেন তবে মনে রাখবেন যে প্রচুর পেশাদার, যারা তাদের চাকরি / গবেষণায় পরিসংখ্যান ব্যবহার করেন তবে পরিসংখ্যানবিদ নন, তারা ঘন ঘন আস্থাভাজন বিরতি সম্পর্কে গভীরভাবে বিভ্রান্ত হয়ে পড়েছেন! যাইহোক, একবার সহজ কেসটি কভার হয়ে গেলে আপনি একাধিক লিনিয়ার রিগ্রেশনটিতে যেতে পারেন। এটি একবারে আয়ত্ত করা গেলে, তারপরে সমস্ত লিনিয়ার মডেল অনুমানের জন্য উপলব্ধ। অন্য কথায়, আমি যদি মডেল ( দ্বারা, বা LARS ক্ষেত্রে নিয়মিতকরণ প্রয়োজন হয় ইত্যাদি) ফিট করতে পারি তবে আমি পারব ধরণের সমস্ত মডেল ফিট করুনξ = Σ এন আমি = 0 β আমি φ ( η আমি ) + + εξ=β0+ +Σআমি=1এনβআমিηআমি+ +εξ=Σআমি=0এনβআমিφ(ηআমি)+ +ε। এটি মডেলগুলির একটি সত্যই শক্তিশালী শ্রেণি, যা @ ডেয়েউংলিম দ্বারা উল্লিখিত হয়েছে, হিলবার্ট স্পেসের সমস্ত ফাংশনগুলি আনুমানিকভাবে করতে পারে, যদি আপনার বেসড ফাংশনগুলির অসীম সেট থাকে এবং যদি তারা হিলবার্ট স্পেসের মধ্যে ঘন একটি ভেক্টর সাবস্পেস তৈরি করে if ।
  3. ব্যবহারিক : সাধারণ লিনিয়ার রিগ্রেশন এর অসংখ্য সফল অ্যাপ্লিকেশন রয়েছে। Okun আইন অর্থনীতিতে, Hooke আইন , ওম-এর সূত্র এবং চার্লস আইন পদার্থবিদ্যা, রক্ত সিস্টোলিক চাপ এবং ওষুধ বয়স মধ্যে সম্পর্ক ডিগ্রী তারতম্য সঙ্গে (আমার কোন ধারণা যদি এটি একটি নাম আছে আছে!) সহজ রৈখিক রিগ্রেশনের সব উদাহরণ, সঠিকতা.

5

এর আরও কারণ হ'ল সুদৃ way় উপায় রিগ্রেশন আনোভা-র মতো কৌশলগুলির একীভূত চিকিত্সা দেয় । আমার কাছে, আনোভা'র স্বাভাবিক 'প্রাথমিক' চিকিত্সা বেশ অস্পষ্ট মনে হয়, তবুও একটি রিগ্রেশন-ভিত্তিক চিকিত্সা স্ফটিক পরিষ্কার clear আমি সন্দেহ করি যে রিগ্রেশন মডেলগুলি যেভাবে 'প্রাথমিক' চিকিত্সাগুলিতে সুস্পষ্ট এবং অব্যক্ত নয় সেগুলি স্পষ্টভাবে কিছু অনুমান করা যায় তার সাথে অনেক কিছুই করার আছে suspect তদুপরি, পরিসংখ্যানগত সফ্টওয়্যারটিতে পদ্ধতিগুলি প্রয়োগ করার সময় যখন আসে তখন এ জাতীয় একত্রিত দৃষ্টিভঙ্গির দ্বারা প্রদত্ত ধারণাগত স্পষ্টতা একইরকম ব্যবহারিক সুবিধার সাথে আসে।

এই নীতিটি কেবল আনোভাতেই নয়, প্রতিরোধকৃত ঘন স্প্লাইনের মতো সম্প্রসারণগুলিতেও প্রযোজ্য - যা আপনার দ্বিতীয় প্রশ্নটিকে উল্লেখযোগ্যভাবে সম্বোধন করে।


3

লিনিয়ার রিগ্রেশন-এর জনপ্রিয়তা এর ব্যাখ্যাযোগ্যতার একাংশের কারণে - যা অ-প্রযুক্তিগত লোকেরা কেবলমাত্র কিছুটা ব্যাখ্যা দিয়ে প্যারামিটার সহগকে বুঝতে পারে। এটি ব্যবসায়ের পরিস্থিতিতে এক বিশাল মূল্যকে যুক্ত করে, যেখানে আউটপুট বা ভবিষ্যদ্বাণীগুলির শেষ ব্যবহারকারীদের গণিত / পরিসংখ্যানের গভীর উপলব্ধি নাও থাকতে পারে।

হ্যাঁ, এই কৌশলটির সাথে অনুমান এবং সীমাবদ্ধতা রয়েছে (সমস্ত পদ্ধতির মতো), এবং এটি বেশিরভাগ ক্ষেত্রে সেরা ফিট করে না। তবে লিনিয়ার রিগ্রেশন খুব মজবুত, এবং অনুমানগুলি লঙ্ঘন করা হলেও প্রায়শই বেশ ভাল পারফর্ম করতে পারে।

এই কারণগুলির জন্য, এটি অবশ্যই অধ্যয়নযোগ্য।


-2

কিছু কিছু dirctly সম্পর্কিত নাও হতে পারে।

এক্সYবনাম(এক্স,Y)=0এক্সYYএক্স

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.