রিগ্রেশন উদাহরণস্বরূপ সপ্তাহের দিনগুলিতে


11

সঠিক দিকে যেতে আমার একটু সাহায্য দরকার। আমি কোনও পরিসংখ্যান অধ্যয়ন করেছি এবং জার্গনটি পরিবর্তিত হয়েছে বলে মনে হচ্ছে এটি অনেক দিন time

কল্পনা করুন যে আমার কাছে গাড়ী সম্পর্কিত ডেটার একটি সেট রয়েছে

  • এ শহর থেকে বি শহরে ভ্রমণের সময়
  • A শহর থেকে শহর বি দূরত্ব
  • যন্ত্রের আকার
  • ড্রাইভারের জুতার আকার
  • গাড়ী তৈরি এবং মডেল
  • সপ্তাহের দিন

আমি ভ্রমণের সময় পূর্বাভাস দিতে চাই।

আমি কল্পনা করি সময় এবং দূরত্বের মধ্যে একটি দৃlation় সম্পর্ক রয়েছে এবং সম্ভবত ইঞ্জিনের আকারের সাথে দুর্বল একটি (এবং জুতার আকারের সাথেও নেই)। সম্ভবত একাধিক রিগ্রেশন বিশ্লেষণ / আনোভা হল হাতিয়ার tool তবে আমি কীভাবে সপ্তাহের দিনটি অন্তর্ভুক্ত করব, যেহেতু রবিবার = 1, সোমবার = 2 ইত্যাদি হিসাবে কোডিং করা খুব ভুল অনুভব করে?

এক্সেলের রিগ্রেশন সরঞ্জাম ব্যবহার করা, উদাহরণস্বরূপ, আমি কীভাবে ফলাফলগুলি ব্যাখ্যা করব? সম্ভবত আর 1 এর কাছাকাছি থাকলে এটি ভাল (যদিও অনেকগুলি ডাটা আইটেম থাকলে মনে হয় এটি ছোট হলেও এখনও তাৎপর্যপূর্ণ হতে পারে)। তবে কিছু উত্স আর-স্কোয়ারকে উল্লেখ করে যা এসডি বলে মনে হচ্ছে, তাই শূন্যের নিকটে একটি মান ভাল। এটি টি স্ট্যাটাস, পি-মান, এফ এবং সিগনিফিকেন্স এফ প্রদর্শন করে, তারা যাই হোক না কেন। যে কেউ একটি ভাল রেফারেন্স উত্স সুপারিশ করতে পারেন?


2
রেকর্ডের জন্য, এই প্রশ্নগুলি (রিগ্রেশন আউটপুট ব্যাখ্যা করার বিষয়ে) এখানে অন্য থ্রেডে জিজ্ঞাসা করা হয়েছে , তবে প্রশ্নটি এত খারাপভাবে তৈরি করা হয়েছিল যে এটি কোনও ভাল উত্তর সংগ্রহ করতে পারেনি। এটি এমন একটি মৌলিক প্রশ্ন যা "ক্যানোনিকাল" উত্তরটির দাবিদার যা প্রাথমিকভাবে সম্পূর্ণ, পরিষ্কার, এবং ভালভাবে ব্যাখ্যা করা হয়েছে।
হোয়বার

উত্তর:


26

আপনার যা প্রয়োজন তা হ'ল রিগ্রেশন পদ্ধতির একটি দৃ review় পর্যালোচনা। যাইহোক, এই প্রশ্নগুলি পর্যাপ্ত মৌলিক (এটি ভুল উপায়ে গ্রহণ করবেন না) এমনকি মৌলিক পরিসংখ্যানগুলির একটি ভাল সংক্ষিপ্ত বিবরণ সম্ভবত আপনাকে উপকৃত করবে। হাওয়েল একটি খুব জনপ্রিয় পাঠ্যপুস্তক লিখেছেন যা ঘন গণিতের প্রয়োজন ছাড়াই একটি বিস্তৃত ধারণা ভিত্তিক সরবরাহ করে। এটি পড়ার জন্য আপনার সময়টি উপযুক্ত হতে পারে। এখানে সমস্ত উপাদান আবরণ করা সম্ভব নয়। যাইহোক, আমি আপনার নির্দিষ্ট কিছু প্রশ্নে আপনাকে শুরু করার চেষ্টা করতে পারি।

সপ্তাহের প্রথমটি কোডিং স্কিমের মাধ্যমে অন্তর্ভুক্ত থাকে। সর্বাধিক জনপ্রিয় হ'ল 'রেফারেন্স বিভাগ' কোডিং (সাধারণত ডামি কোডিং নামে পরিচিত)। সুনির্দিষ্ট ক্ষেত্রে এবং কলামগুলিতে আপনার ভেরিয়েবলগুলি সহ আপনার ডেটা ম্যাট্রিক্সে উপস্থাপিত হয়েছে তা কল্পনা করতে দিন। এই স্কিমে আপনার যদি 7 টি স্পষ্টতাল ভেরিয়েবল থাকে (উদাহরণস্বরূপ, সপ্তাহের দিনগুলির জন্য) আপনি 6 টি নতুন কলাম যুক্ত করবেন। আপনি একদিন রেফারেন্স বিভাগ হিসাবে বেছে নেবেন, সাধারণত এমনটি যা ডিফল্ট হিসাবে মনে করা হয়। প্রায়শই এটি তত্ত্ব, প্রসঙ্গ বা গবেষণা প্রশ্ন দ্বারা অবহিত করা হয়। আমি সপ্তাহের দিনের জন্য সবচেয়ে ভাল হবে কোন ধারণা নেই, কিন্তু এটি সত্যিই খুব বেশি গুরুত্ব দেয় না, আপনি কেবল কোনও পুরানো বাছাই করতে পারেন। একবার আপনার রেফারেন্স বিভাগটি হয়ে গেলে আপনি অন্যদেরকে আপনার নতুন 6 ভেরিয়েবলের জন্য বরাদ্দ করতে পারেন, তারপরে আপনি কেবল সেই পরিবর্তনশীল প্রতিটি ক্ষেত্রে প্রাপ্ত হন কিনা তা নির্দেশ করে indicate উদাহরণস্বরূপ, বলুন যে আপনি রবিবারটিকে রেফারেন্স বিভাগ হিসাবে বেছে নিয়েছেন, আপনার নতুন কলাম / ভেরিয়েবল সোমবার-শনিবার হবে। সোমবার সংঘটিত প্রতিটি পর্যবেক্ষণকে ক এর সাথে নির্দেশিত করা হবে0 1 01সোমবার কলামে এবং অন্য কোথাও । মঙ্গলবার ইত্যাদি পর্যবেক্ষণেও একই ঘটনা ঘটবে। নোট যে কোন মামলায় পেতে পারেন 2 বা তার বেশি কলামে, এবং যে পর্যবেক্ষণ যে রবিবার (রেফারেন্স বিভাগ) এ স্থান গ্রহণ হবে 'আপনার নতুন ভেরিয়েবলের সব s। আরও অনেকগুলি কোডিং স্কিম সম্ভব রয়েছে এবং লিঙ্কগুলি সেগুলি পরিচয় করিয়ে দেওয়ার জন্য একটি ভাল কাজ করে। নতুন 6 টি ভেরিয়েবলের সমস্তের সাথে নেস্টেড মডেলটি পরীক্ষা করে আপনি যে সপ্তাহের দিনটিকে বিবেচনা করছেন তা পরীক্ষা করে দেখতে পারেন এবং 6 টি অন্তর্ভুক্ত সহ পুরো মডেলটি বাদ দিয়েছিলেন। মনে রাখবেন যে স্ট্যান্ডার্ড আউটপুট সহ রিপোর্ট করা টেস্টগুলি আপনার ব্যবহার করা উচিত নয় , কারণ এগুলি স্বতন্ত্র নয় এবং অভ্যন্তরীণ একাধিক তুলনার সমস্যা রয়েছে। 010

এক্সেল কীভাবে পরিসংখ্যান করে তা আমি দেখে অনেক দিন হয়ে গেছে এবং আমি এটি খুব স্পষ্টরূপে মনে করি না, যাতে অন্য কেউ আপনাকে আরও সাহায্য করতে সক্ষম হতে পারে। এই পৃষ্ঠায় এক্সেলের রিগ্রেশন সম্পর্কিত বৈশিষ্ট্য সম্পর্কে কিছু তথ্য রয়েছে বলে মনে হয় have রিগ্রেশন আউটপুটে সাধারণত পরিসংখ্যান সম্পর্কে রিপোর্ট করা সম্পর্কে আমি আপনাকে আরও কিছু বলতে পারি:

  • এর কাছাকাছি থাকা একটি স্কোর ইঙ্গিত দেয় যে মান প্রতিক্রিয়ার ভেরিয়েবল প্রায় সম্পূর্ণরূপে ভবিষ্যদ্বাণী ভেরিয়েবলের মান দ্বারা নির্ধারিত হতে পারে। স্পষ্টত এই বৃহৎ হবে প্রভাব , কিন্তু এটা নয় একটি অবরোহী স্পষ্ট যে এই "ভাল" - যে একটি সম্পূর্ণরূপে ভিন্ন এবং দার্শনিকভাবে কাঁটা বিষয়। 1r1
  • আপনি একাধিক রিগ্রেশন (যেখানে সাধারণত রিপোর্ট করা হয় না) তা করছেন তবে তারা ' ' বলতে কী বোঝায় তা পরিষ্কার নয় । ' ' লিনিয়ার, দ্বিবিভক্ত সংঘের একটি পরিমাপ , এটি (কেবল) 2 ভেরিয়েবলের মধ্যে সরাসরি-লাইন সম্পর্কের ক্ষেত্রে প্রযোজ্য। তবে আপনার মডেল এবং প্রতিক্রিয়া মানগুলির থেকে পূর্বাভাসিত মানগুলির মধ্যে একটি স্কোর পাওয়া সম্ভব । সেক্ষেত্রে আপনি ২ টি ভেরিয়েবল ব্যবহার করছেন (এবং যদি আপনার মডেলটি যথাযথভাবে নির্দিষ্ট করা থাকে তবে সম্পর্কটি লিনিয়ার হওয়া উচিত)। এই সংস্করণটিকে 'একাধিক স্কোর' বলা হয় তবে এটি সফ্টওয়্যার দ্বারা খুব কম আলোচনা বা রিপোর্ট করা হয়েছে। r r r rrrrrr
  • আর- বর্গক্ষেত্রটি কেবল এর বর্গক্ষেত্র (অর্থাত্ ); এটা না স্ট্যান্ডার্ড ডেভিয়েশন। সম্পর্কটি নয় , আরও নির্ধারিত হওয়ার সাথে সাথে এটি দিকেও ঝুঁকবে । সুতরাং, যদি আপনি মনে করেন একটি পাসে "ভাল" হয়, তাহলে আপনি চিন্তা করা উচিত একটি পাসে "ভাল" বলে। তবে, আপনার জানা উচিত যে একাধিক (এবং একাধিকr × r 1 0rr×r101 R 2 1 r R 2r1R21rR2) একাধিক প্রতিরোধে অত্যন্ত পক্ষপাতদুষ্ট। অর্থাৎ, আপনি আপনার মডেলটিতে যত বেশি ভবিষ্যদ্বাণীকারী যুক্ত করবেন, কোনও সম্পর্ক আছে কিনা তা এই পরিসংখ্যানগুলিতে তত বেশি। সুতরাং আপনি তাদের ব্যাখ্যা সম্পর্কে সতর্ক হওয়া উচিত।
  • কখনও কখনও 'তাত্পর্য' নির্ধারণের জন্য আউটপুট পৃথক ভবিষ্যদ্বাণীকারীদের জন্য স্ট্যাটিস্টিক্স এবং পুরো হিসাবে মডেলটির জন্য একটি স্ট্যাটিস্টিক তালিকাভুক্ত করে। এগুলি এলোমেলো পরিবর্তনশীল যা পরিসংখ্যান পরীক্ষার দ্বারা গণনাযোগ্য এবং যখন স্বাধীনতার ডিগ্রি নির্দিষ্ট করা হয় তখন এর একটি পরিচিত বিতরণ থাকে। tF
  • জ্ঞাত বন্টনের তুলনায় উপলব্ধি করা মানটির (যেটি আপনি খুঁজে পেয়েছেন) তুলনা করে আপনি নাল অনুমানটি সত্য হলে আপনার চেয়ে চরম বা তার চেয়ে চরম হিসাবে কোনও মান খুঁজে পাওয়ার সম্ভাবনাটি নির্ধারণ করতে পারেন । সেই সম্ভাবনা হ'ল মানp
  • -value, যখন আপনি শুধুমাত্র একটি প্যারামিটার পরীক্ষা ব্যবহার করা হয় যেহেতু -value একাধিক পরামিতি পরীক্ষা করতে ব্যবহার করা যেতে পারে (যেমন, আমি সপ্তাহের দিন সংক্রান্ত উপরে আলোচনা)। সঙ্গে যুক্ত -value যে সম্ভাব্যতা অন্তত প্যারামিটার 'উল্লেখযোগ্য' হয়। এ সম্পর্কে ভাবার আর একটি উপায় হ'ল, ' অন্তর্ভুক্ত সমস্ত পরামিতিগুলির সাথে মডেলটি নাল মডেলের চেয়ে প্রতিক্রিয়া পূর্বাভাস দেওয়ার আরও ভাল কাজ করে'।F p F 1 FtFpF1F
  • আমি অনুমান করছি কি আপনি 'তাত্পর্য কল যে ' হল -value মিল খাওয়া বা ছাড়িয়ে করা প্রয়োজন হবে একটি পরীক্ষা, 'উল্লেখযোগ্য' হতে জন্য সম্ভবতঃ .05 স্তরে।এফFF

একটি শেষ পয়েন্ট যা জোর দেওয়ার মতো তা হ'ল এই প্রক্রিয়াটিকে তার প্রসঙ্গ থেকে তালাক দেওয়া যায় না। ডেটা বিশ্লেষণের একটি ভাল কাজ করার জন্য আপনাকে অবশ্যই আপনার পটভূমি জ্ঞান এবং গবেষণার প্রশ্নটি মাথায় রাখতে হবে। আমি রেফারেন্স বিভাগের পছন্দ সম্পর্কিত উপরের এটিকে ইঙ্গিত দিয়েছি। উদাহরণস্বরূপ, আপনি নোট করেন যে জুতার আকার প্রাসঙ্গিক হওয়া উচিত নয়, তবে ফ্লিনস্টোনগুলির ক্ষেত্রে এটি সম্ভবত ছিল! আমি কেবল এই সত্যটি অন্তর্ভুক্ত করতে চাই, কারণ এটি প্রায়শই ভুলে যায় বলে মনে হয়।


5
(+1) এক্সেল আসলে একাধিক রিগ্রেশন করতে পারে এবং এতে একটি কমান্ড রয়েছে যাতে একটি স্ট্যান্ডার্ড সারসংক্ষেপ টেবিল তৈরি করতে সক্ষম হয়। গণনার বিতরণ মূল্যবোধগুলির সাথে veryতিহাসিক প্রবণতাটি (খুব) opড়ু হওয়ার কারণে, স্যামুয়েল জনসনের কুকুরের মতো ক্ষমতাটিও দেখতে হবে : "... একটি কুকুর তার পেছনের পায়ে হাঁটছে। এটি ভালভাবে করা হয় না; তবে আপনি অবাক হয়ে অবাক হন এটা আদৌ সম্পন্ন হয়েছে। "
whuber

3

আপনি প্রচুর প্রশ্ন সহ শেষ করেন যার জন্য "শিক্ষণ" রিগ্রেশন দরকার। আমি বলতে পারি যে উচ্চতর আর ^ 2 ভাল তবে ক্যাভ্যাট রয়েছে। আর ভ্যারিয়েবল যুক্ত করার সাথে আর ^ 2 সর্বদা উপরে চলে যায় যাতে আপনি কৃত্রিমভাবে এটি স্ফীত করতে পারেন। তাত্পর্য পরীক্ষা দেখুন, অবশিষ্ট ডায়াগোনস্টিকস ইত্যাদি দেখুন সপ্তাহের দিন, সোমবার = 1, মঙ্গলবার = 2, ইত্যাদির সাথে সম্মতি জানাতে যাওয়ার উপায় হবে না। আপনি যা চান তা মৌসুমী সূচক ভেরিয়েবল: 0/1 সোমবার, 0/1 মঙ্গলবার, ইত্যাদি ইত্যাদি are

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.