কীভাবে অন্তর্ভুক্ত করা যায়


9

আমি শব্দ এবং এর বর্গ (প্রেডিকটার ভেরিয়েবল )টিকে একটি রিগ্রেশনে অন্তর্ভুক্ত করতে চাই কারণ আমি ধরে নিই যে কম মানগুলি নির্ভরশীল ভেরিয়েবলের উপর ইতিবাচক প্রভাব ফেলে এবং উচ্চ মানের একটি নেতিবাচক প্রভাব ফেলে। উচ্চতর মান প্রভাব ক্যাপচার করা উচিত নয়। তাই আমি আশা করি যে এর সহগটি ইতিবাচক এবং এর নেতিবাচক হবে। ছাড়াও , আমি অন্যান্য ভবিষ্যদ্বাণী ভেরিয়েবলগুলিও অন্তর্ভুক্ত করি।xx2xx2xx2x

আমি এখানে কিছু পোস্টে পড়েছি যে বহুবিধ প্রতিরোধ এড়াতে এই ক্ষেত্রে ভেরিয়েবলগুলি কেন্দ্র করা ভাল ধারণা। একাধিক রিগ্রেশন পরিচালনা করার সময়, আপনি কখন আপনার পূর্বাভাসক ভেরিয়েবলগুলি কেন্দ্র করবেন এবং কখন সেগুলি মানদণ্ডে আনতে হবে?

  1. আমি কি উভয় ভেরিয়েবলকে আলাদাভাবে কেন্দ্র করতে পারি (মাঝামাঝি সময়ে) বা আমার কেবলমাত্র কেন্দ্র করে নেওয়া উচিত এবং তারপর বর্গক্ষেত্রটি নেওয়া উচিত বা আমি কেবলমাত্র কেন্দ্রে রেখে মূল অন্তর্ভুক্ত করব ?xx2x

  2. একটি গণনা পরিবর্তনশীল হলে এটি কী সমস্যা ?x

এড়ানোর জন্য একটি গণনা পরিবর্তনশীল হচ্ছে, আমি একটি তাত্ত্বিক সংজ্ঞায়িত এলাকায় দ্বারা এটি বিভাজক উদাহরণ 5 বর্গ কিলোমিটার জন্য সম্পর্কে চিন্তা। এটি একটি পয়েন্ট ঘনত্ব গণনার সাথে সামান্য সামান্য হওয়া উচিত।x

তবে আমি আশঙ্কা করছি যে এই পরিস্থিতিতে সহগের চিহ্ন সম্পর্কে আমার প্রাথমিক ধারণাটি আর ধরে রাখবে না, যেমন এবং x² = 4x=2x²=4

x=2/5 km2 = 0.4 km2

তবে x2 চেয়ে ছোট হবে কারণ x2=(2/5)2=0.16


1
আপনার রিগ্রেশন সফ্টওয়্যারটি স্বয়ংক্রিয়ভাবে সংখ্যাসূচক সমস্যার যত্ন নেবে - বিশেষত, এটি অভ্যন্তরীণভাবে আপনার ডেটাটিকে কেন্দ্র করে এবং মানক করার সম্ভাবনা খুব বেশি। কেন্দ্রীকরণ সম্পর্কে আপনার প্রশ্নের উত্তর কীভাবে আপনি সহগের ব্যাখ্যা করতে চান তা নীচে আসে।
হোবার

উত্তর:


4

আপনার প্রশ্নটি আসলে বেশ কয়েকটি সাব-প্রশ্ন নিয়ে গঠিত, যা আমি আমার বোধগম্যতার সাথে সমাধান করার চেষ্টা করব।

  • কোনও রিগ্রেশন-এর উপর নিম্ন ও উচ্চ মানের 'নির্ভরতা কীভাবে আলাদা করা যায়?

এবং বিবেচনা করা এটি করার একটি উপায়, তবে আপনি কি নিশ্চিত যে আপনার পরীক্ষাটি চূড়ান্ত? আপনি কি রিগ্রেশন এর সমস্ত সম্ভাব্য ফলাফলের জন্য দরকারী কিছু উপসংহার করতে সক্ষম হবেন? আমি মনে করি প্রশ্নটি আগেই পরিষ্কারভাবে প্রকাশ করা সহায়তা করতে পারে এবং অনুরূপ এবং সম্পর্কিত প্রশ্ন জিজ্ঞাসা করাও সহায়তা করতে পারে। উদাহরণস্বরূপ, আপনি একটি প্রান্তিক বিবেচনা করতে পারেন যার জন্য রিগ্রেশন opালু আলাদা। এটি মডারেটর ভেরিয়েবলগুলি ব্যবহার করে করা যেতে পারে । যদি বিভিন্ন opালু (একই ইন্টারসেপ্ট আরোপ করার সময়) সামঞ্জস্যপূর্ণ হয় তবে আপনার কোনও পার্থক্য নেই, অন্যথায় আপনি তাদের পার্থক্যের জন্য নিজেকে একটি স্পষ্ট যুক্তি সরবরাহ করেছেন।xx2x

  • আপনার কখন কেন্দ্র এবং স্ট্যান্ডার্ডাইজ করা উচিত?

আমি মনে করি এই প্রশ্নটি প্রথম প্রশ্ন এবং পরীক্ষার সাথে মিশ্রিত করা উচিত নয় এবং আমি বা আশেপাশে কেন্দ্রীভূত হওয়ার ফলে ফলাফলটিকে পক্ষপাতিত্ব করতে পারে। আমি কমপক্ষে প্রথম পর্যায়ে, কেন্দ্র না করার পরামর্শ দেব। মনে রাখবেন আপনি সম্ভবত বহুবিশ্লেষের কারণে মারা যাবেন না, অনেক লেখক যুক্তিযুক্ত যে এটি একটি ছোট নমুনা আকারের সাথে কাজ করার সমতুল্য ( এখানে এবং এখানে )।xx2

  • (ক্রমাগত) ভাসমান-পয়েন্ট ভেরিয়েবলের ক্ষেত্রে পৃথক গণনা ভেরিয়েবলকে রূপান্তরকরণ ফলাফলের ব্যাখ্যা পরিবর্তন করে?

হ্যাঁ এটি হবে, তবে এটি প্রথম 2 পয়েন্টের উপর অনেক বেশি নির্ভর করবে, তাই আমি আপনাকে একবারে একটি জিনিস সম্বোধনের পরামর্শ দিই। আমি এই রূপান্তর ব্যতীত কেন রিগ্রেশনটি কাজ করবে না তার কোনও কারণ আমি দেখতে পাচ্ছি না, তাই আপাতত এটিকে উপেক্ষা করার জন্য আমি আপনাকে পরামর্শ দেব। এও নোট করুন যে কোনও সাধারণ উপাদান দ্বারা বিভাজন করে আপনি যে স্কেলটি এ পরিবর্তন করছেন , কিন্তু এটি দেখার সম্পূর্ণ ভিন্ন উপায় রয়েছে, যেমন আমি উপরে লিখেছি, যাতে এই প্রান্তিকাকে আরও স্পষ্টভাবে বিবেচনা করা হয়।x2=x


আপনার উত্তরের জন্য আপনাকে অনেক ধন্যবাদ, বিশেষত লিঙ্কগুলির জন্য !!!
পিটার

এটি সাহায্য করার জন্য একটি আনন্দের ছিল। =)
পেড্রোফিগেইরা

4

সাধারণ কেন্দ্রীকরণে বহুবিধ লাইনটিটি হ্রাস করতে সহায়তা করতে পারে, তবে "আপনি সম্ভবত মাল্টিকলাইনারিটির দ্বারা মরে যাবেন না" (প্রিরিফিগুইয়ের উত্তর দেখুন)।

সর্বাধিক গুরুত্বপূর্ণ, ইন্টারসেপটি অর্থবহ করার জন্য প্রায়শই কেন্দ্রীকরণের প্রয়োজন হয়। সরল মডেলটিতে , ইন্টারপ্লেটটি এর প্রত্যাশিত ফলাফল হিসাবে সংজ্ঞায়িত করা হয়েছে । যদি শূন্যের একটি মান অর্থবোধক না হয় তবে এটির সংজ্ঞাও নয়। এটি প্রায়শই এর গড়ের চারপাশে পরিবর্তনশীল কেন্দ্র করে কার্যকর হয় ; এই ক্ষেত্রে, predictor ফর্ম হল এবং পথিমধ্যে একটি বিষয়ের উপর যার মানকে জন্য প্রত্যাশিত ফল গড় সমান ।yi=α+βxi+εx=0xx(xix¯)αxix¯

এই ক্ষেত্রে, আপনি আবশ্যক কেন্দ্র বর্গ এবং তারপর। আপনি এবং আলাদাভাবে কেন্দ্র করতে পারবেন না , কারণ আপনি "নতুন" ভেরিয়েবল, উপর ফলাফলটি , সুতরাং আপনাকে অবশ্যই এই নতুন চলকটি বর্গাকার করতে হবে। কেন্দ্রীকরণ বলতে কী বোঝাতে পারে?xxx2(xix¯)x2

আপনি একটি কাউন্ট ভেরিয়েবলকে কেন্দ্র করতে পারেন, যদি এর অর্থটি অর্থবহ হয় তবে আপনি কেবল এটি স্কেল করতে পারেন। উদাহরণস্বরূপ, এবং "2" যদি বেসলাইন হতে পারে তবে আপনি 2: বিয়োগ করতে পারেন । ইন্টারসেপ্ট একটি বিষয়ের প্রত্যাশিত ফলাফল হয়ে যায় যার মান "2" এর সমান, একটি রেফারেন্স মান।x=1,2,3,4,5(xi2)=1,0,1,2,3xi

বিভাজন হিসাবে, কোনও সমস্যা নেই: আপনার আনুমানিক সহগগুলি আরও বড় হবে! গেলম্যান এবং হিল , §4.1, একটি উদাহরণ দেয়: d সিডট

earnings=61000+1300height (in inches)+errorearnings=61000+51height (in millimeters)+errorearnings=61000+81000000height (in miles)+error

এক ইঞ্চি হয় , মিলিমিটার তাই হয় । এক ইঞ্চি হয় , emiles তাই হয় । তবে এই তিনটি সমীকরণ সম্পূর্ণ সমতুল্য।25.4511300/25.41.6e5810000001300/1.6e5



আপনার উত্তর সেরজিও জন্য ধন্যবাদ। এটা সত্যিই আমাকে সাহায্য করেছে। দুর্ভাগ্যক্রমে আমি কেবল একটি উত্তর আমার গৃহীত উত্তর হিসাবে চিহ্নিত করতে পারি।
পিটার

আপনাকে স্বাগতম. এবং চিন্তা করবেন না ;-)
সেরজিও

1

আমি ধরে নিচ্ছি যে এক্স এর কম মানগুলি নির্ভরশীল ভেরিয়েবলের উপর ইতিবাচক প্রভাব ফেলে এবং উচ্চ মানের একটি নেতিবাচক প্রভাব ফেলে।

অন্যের কেন্দ্রীকরণ এবং সহগের ব্যাখ্যা ব্যাখ্যা করার জন্য আমি অন্যদের প্রশংসা করি, আপনি এখানে যা বর্ণনা করেছেন তা কেবল একটি রৈখিক প্রভাব। অন্য কথায়, আপনি যা বর্ণনা করেছেন তা এক্স বর্গ পরীক্ষা করার কোনও প্রয়োজন নির্দেশ করে না ।


আমার দৃষ্টিতে, যদি , (আংশিক) প্রভাব উপর (অথবা, ভাল, উপর ) হল । এই জাতীয় প্রভাবগুলি থাকে, তারা এর স্তরের উপর নির্ভর করে না । মডেল হয়, তাহলে , তারপর আংশিক প্রভাব হয় এবং স্তরের উপর নির্ভর করে । এটি অন্যান্য মডেলগুলিতেও ঘটতে পারে, যেমন লিনিয়ার স্প্লাইন মডেলগুলিতে, তবে সাধারণ রৈখিক (প্রথম ডিগ্রি) মডেলটিতে নয়। আমি কি ভূল? y=β0+β1x1+β2x2+εxiyE[yx]E[yx]/xi=βi xiy=β0+β1x1+β2x2+β3x22+εx2β2+2β3x2x2
সেরজিও

@ রোল্যান্ডো ২: আমরা নিশ্চিত যে আমরা সামটে জিনিসটি নিয়ে কথা বলব কিনা। আমি যদি কেবলমাত্র নিয়মিত পূর্বাভাসকারী পরিবর্তনশীলকে অন্তর্ভুক্ত করি তবে আমি সেই ভবিষ্যদ্বাণীকের পক্ষে একটি অনুমানযুক্ত গুণফল পাবো যা হয় ধনাত্মক বা নেতিবাচক। সহগের উপর ভিত্তি করে আমি বলতে পারি যে এককে এককে যুক্ত করে, y নির্দিষ্ট পরিমাণে বৃদ্ধি বা হ্রাস পাবে। তবে আমি এই উপায়টি খুঁজে বের করতে পারি না যে ছোট মানগুলি আসলে y এর বৃদ্ধি করে, তবে উচ্চতর মানগুলি (একটি নির্দিষ্ট অজানা বিন্দু থেকে) y এর হ্রাস ঘটায়।
পিটার

@ পিটার - আমি বুঝতে পেরেছি এবং আমি আপনাকে আপনার প্রশ্নের "আমি ধরে নিয়েছি" বাক্যটি পড়ার জন্য সম্পাদনা করার পরামর্শ দিচ্ছি: "আমি ধরে নিয়েছি এক্স এর কিছু অঞ্চলে এক্স এর উচ্চতর মান নির্ভরশীল পরিবর্তনশীলের উপর ইতিবাচক প্রভাব ফেলেছে, অন্যদিকে কিছু অঞ্চলে, উচ্চতর মানগুলির একটি নেতিবাচক প্রভাব রয়েছে "
রোল্যান্ডো 2
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.