লজিস্টিক রিগ্রেশন বা টি পরীক্ষা?


17

একদল ব্যক্তি একটি প্রশ্নের উত্তর দেয়। উত্তরটি "হ্যাঁ" বা "না" হতে পারে। গবেষক জানতে চান যে বয়স উত্তরগুলির প্রকারের সাথে সম্পর্কিত কিনা।

অ্যাসোসিয়েশনটি একটি লজিস্টিক রিগ্রেশন করে মূল্যায়ন করা হয়েছিল যেখানে বয়স ব্যাখ্যাযোগ্য পরিবর্তনশীল এবং উত্তরের ধরণ (হ্যাঁ, না) নির্ভরশীল পরিবর্তনশীল। যথাক্রমে "হ্যাঁ" এবং "না" জবাব দেওয়া গ্রুপগুলির গড় বয়স গণনা করে এবং উপায়ের সাথে তুলনা করার জন্য একটি টি পরীক্ষা চালিয়ে আলাদাভাবে সম্বোধন করা হয়েছিল ।

উভয় পরীক্ষা বিভিন্ন ব্যক্তির পরামর্শের পরে অনুষ্ঠিত হয়েছিল, এবং তাদের উভয়ই নিশ্চিত নয় যে কোনটি যাওয়ার সঠিক উপায়। গবেষণামূলক প্রশ্নের দৃষ্টিতে এর চেয়ে ভাল পরীক্ষাটি আর কোনটি হবে?

হাইপোথিসিস পরীক্ষার জন্য পি মানগুলি (রিগ্রেশন) এবং তাৎপর্যপূর্ণ (টি পরীক্ষা) ছিল না। নমুনা কম 20 ক্ষেত্রে।


2
আমি নিশ্চিত না যে এটি হ'ল আপনার আসল প্রশ্ন। আপনি যে বিশ্লেষণ সম্পর্কে জিজ্ঞাসা করছেন তা ইতিমধ্যে দুটি চালিয়ে গেছেন। আমি অনুমান করছি যে আপনি যা জানতে চান তা সেই পরীক্ষাগুলির মধ্যে তুলনা বা সম্পর্কের বিষয়ে কিছু, উদাহরণস্বরূপ যা আরও ভাল। এটি ঠিক করতে আপনার প্রশ্নটি সম্পাদনা করুন।
জন

উভয় পরীক্ষা বিভিন্ন ব্যক্তির পরামর্শ অনুসারে সম্পন্ন হয়েছিল এবং এগুলির সঠিক পথটি কিনা এটির কোনোটাই নিশ্চিত নয়। গবেষণামূলক প্রশ্নগুলির বিবেচনায় (প্রতিক্রিয়ার ধরণের সাথে কি বয়স সম্পর্কিত?) যা আরও ভাল পরীক্ষা হবে, বয়স সম্পর্কে প্রতিক্রিয়াটির যৌক্তিক রিগ্রেশন বা একটি টি পরীক্ষার গড় বয়সের সাথে "হ্যাঁ" উত্তর দেওয়া ব্যক্তিদের গড় বয়সের সাথে তুলনা করা হবে "না" জবাব দেওয়া ব্যক্তিদের বয়স?
জেন

উত্তর:


19

উভয় পরীক্ষাই স্পষ্টভাবে বয়স-প্রতিক্রিয়া সম্পর্কের মডেল করে তবে তারা বিভিন্ন উপায়ে তা করে। কোনটি নির্বাচন করতে হবে তার উপর নির্ভর করে আপনি কীভাবে সেই সম্পর্কের মডেল চয়ন করেন। আপনার পছন্দটি অন্তর্নিহিত তত্ত্বের উপর নির্ভর করতে হবে, যদি একটি থাকে; ফলাফল থেকে আপনি কী ধরণের তথ্য বের করতে চান; এবং কীভাবে নমুনাটি নির্বাচিত হয় on এই উত্তরটি ক্রমে এই তিনটি দিক নিয়ে আলোচনা করে।


আমি টি-টেস্ট এবং লজিস্টিক রিগ্রেশন ভাষাটি ব্যবহার করে বর্ণনা করব যা মনে করে আপনি লোকের একটি সংজ্ঞায়িত জনসংখ্যার অধ্যয়ন করছেন এবং নমুনা থেকে এই জনসংখ্যার দিকে সূচনা করতে চান।

যে কোনও ধরণের পরিসংখ্যানগত অনুমানকে সমর্থন করার জন্য আমাদের ধরে নিতে হবে যে নমুনাটি এলোমেলো।

  • একটি টি-পরীক্ষা অনুমান করে যে "না" প্রতিক্রিয়াশীল নমুনায় থাকা লোকেরা জনগণের সমস্ত উত্তরদাতাদের একটি সাধারণ এলোমেলো নমুনা এবং "হ্যাঁ" প্রতিক্রিয়াশীল নমুনায় থাকা লোকেরা সমস্ত হ্যাঁ-উত্তরদাতাদের একটি সাধারণ এলোমেলো নমুনা are জনসংখ্যা.

    একটি টি-পরীক্ষা জনসংখ্যার দুটি গোষ্ঠীর প্রত্যেকের মধ্যে বয়সের বিতরণ সম্পর্কে অতিরিক্ত প্রযুক্তিগত অনুমান করে। সম্ভাব্য সম্ভাবনাগুলি পরিচালনা করতে টি-টেস্টের বিভিন্ন সংস্করণ বিদ্যমান।

  • লজিস্টিক রিগ্রেশন ধরে নেয় যে কোনও নির্দিষ্ট বয়সের সমস্ত লোক জনসংখ্যার সেই বয়সের মানুষের একটি সাধারণ এলোমেলো নমুনা। পৃথক বয়সের গোষ্ঠীগুলি "হ্যাঁ" প্রতিক্রিয়াগুলির বিভিন্ন হার প্রদর্শন করতে পারে। এই হারগুলি, যখন লগ প্রতিক্রিয়া হিসাবে চিহ্নিত করা হয় (সোজা অনুপাতের তুলনায়), বয়সের সাথে রৈখিকভাবে সম্পর্কিত বলে ধরে নেওয়া হয় (বা বয়সের কোনও নির্ধারিত ফাংশন সহ)।

    বয়স এবং প্রতিক্রিয়ার মধ্যে অ-রৈখিক সম্পর্ককে সামঞ্জস্য করার জন্য লজিস্টিক রিগ্রেশন সহজেই বাড়ানো হয়। প্রাথমিক রৈখিক অনুমানের কার্যকারিতা মূল্যায়নের জন্য এ জাতীয় এক্সটেনশন ব্যবহার করা যেতে পারে। এটি বড় ডেটাসেটগুলির সাথে ব্যবহারযোগ্য, যা অ-লিনিয়ারিটিগুলি প্রদর্শন করার জন্য যথেষ্ট বিশদ সরবরাহ করে, তবে ছোট ডেটাসেটগুলির সাথে খুব বেশি ব্যবহারের সম্ভাবনা নেই। থাম্বের একটি সাধারণ নিয়ম - যে রিগ্রেশন মডেলগুলির পরামিতিগুলির চেয়ে দশগুণ বেশি পর্যবেক্ষণ থাকা উচিত - প্রস্তাব দেয় যে আনলাইনারিটি সনাক্ত করার জন্য যথেষ্ট পরিমাণে 20 টিরও বেশি পর্যবেক্ষণের প্রয়োজন (যা লিনিয়ার ফাংশনের বিরতি এবং opeালের পাশাপাশি একটি তৃতীয় প্যারামিটারের প্রয়োজন )।

একটি টি-পরীক্ষা জনসংখ্যায় কোনও উত্তর এবং হ্যাঁ-উত্তরদাতাদের মধ্যে গড় বয়সগুলি পৃথক কিনা তা সনাক্ত করে। একটি লজিস্টিক রিগ্রেশন অনুমান করে যে প্রতিক্রিয়ার হার বয়স অনুসারে পরিবর্তিত হয়। এটি টি-টেস্টের চেয়ে আরও নমনীয় এবং আরও বিস্তারিত তথ্য সরবরাহ করতে সক্ষম। অন্যদিকে, গ্রুপগুলির গড় বয়সীদের মধ্যে পার্থক্য সনাক্ত করার প্রাথমিক উদ্দেশ্যে এটি টি-টেস্টের চেয়ে কম শক্তিশালী হতে থাকে।

পরীক্ষার জুটির পক্ষে তাত্পর্য এবং অ-তাত্পর্যপূর্ণ চারটি সংমিশ্রণ প্রদর্শন করা সম্ভব। এর মধ্যে দুটি সমস্যাযুক্ত:

  • টি-টেস্টটি গুরুত্বপূর্ণ নয় তবে লজিস্টিক রিগ্রেশন ression যখন উভয় পরীক্ষার অনুমানগুলি প্রশংসনীয় হয়, তখন এ জাতীয় ফলাফল কার্যত অসম্ভব, কারণ টি-পরীক্ষাটি লজিস্টিক রিগ্রেশন দ্বারা পোস্ট করা যেমন একটি নির্দিষ্ট সম্পর্ক সনাক্ত করার চেষ্টা করে না। যাইহোক, যখন সেই সম্পর্কটি সবচেয়ে প্রাচীন এবং কনিষ্ঠ বিষয়গুলির সাথে একটি মতামত এবং মধ্যবয়সী বিষয়গুলির সাথে অন্য মতামত ভাগ করে নেওয়ার পক্ষে পর্যাপ্তরূপে অনৈখিক হয়, তখন ননলাইনার সম্পর্কের ক্ষেত্রে লজিস্টিক রিগ্রেশনের সম্প্রসারণ সেই পরিস্থিতি সনাক্ত করে এবং পরিমাণ নির্ধারণ করতে পারে, যা কোনও টি-টেস্ট সনাক্ত করতে পারেনি ।

  • টি-টেস্টটি তাৎপর্যপূর্ণ তবে লজিস্টিক রিগ্রেশন যেমনটি প্রশ্নে আসে না তেমন। এটি প্রায়শই ঘটে থাকে, বিশেষত যখন সেখানে একদল কম বয়স্ক উত্তরদাতা, প্রবীণ উত্তরদাতাদের একটি দল এবং এর মধ্যে খুব কম লোক থাকে। এটি- এবং হ্যাঁ-প্রতিক্রিয়াকারীদের প্রতিক্রিয়া হারের মধ্যে দুর্দান্ত বিচ্ছেদ তৈরি করতে পারে। এটি টি-টেস্টের মাধ্যমে সহজেই সনাক্ত করা যায়। তবে লজিস্টিক রিগ্রেশনটিতে বয়সের সাথে প্রতিক্রিয়া হার আসলে কীভাবে পরিবর্তিত হয় সে সম্পর্কে তুলনামূলকভাবে খুব কম বিশদ তথ্য থাকবে বা অন্যথায় এটি অসম্পূর্ণ তথ্য থাকতে পারে: "সম্পূর্ণ বিচ্ছেদ" এর ক্ষেত্রে যেখানে সমস্ত বয়স্ক ব্যক্তিরা এক উপায়ে এবং সমস্ত যুবককে অন্যভাবে সাড়া দেয় - তবে সেক্ষেত্রে উভয় পরীক্ষারই খুব কম পি-ভ্যালু থাকে।

নোট করুন যে পরীক্ষামূলক নকশা পরীক্ষার কিছু অনুমানকে অবৈধ করতে পারে। উদাহরণস্বরূপ, আপনি যদি কোনও স্তরের নকশায় লোকদের বয়স অনুসারে বাছাই করেন তবে টি-টেস্টের অনুমান (প্রতিটি গ্রুপ বয়সের একটি সাধারণ র্যান্ডম নমুনা প্রতিবিম্বিত করে) প্রশ্নবিদ্ধ হয়ে ওঠে। এই নকশাটি লজিস্টিক রিগ্রেশন নির্ভর করার পরামর্শ দেবে। যদি তার পরিবর্তে আপনার দুটি পুল থাকে, একটি উত্তর-প্রতিক্রিয়াকারী এবং হ্যাঁ-প্রতিক্রিয়াকারীদের মধ্যে একটি এবং তাদের বয়স নির্ধারণের জন্য এলোমেলোভাবে বাছাই করা হয়, তবে লজিস্টিক রিগ্রেশনের নমুনা অনুমানগুলি সন্দেহজনক, যদিও টি-টেস্টের ধারণাগুলি হ'ল। এই নকশাটি টি-টেস্টের কিছু ফর্ম ব্যবহার করার পরামর্শ দিবে।

(দ্বিতীয় নকশাটি এখানে নির্বোধ বলে মনে হতে পারে তবে এমন পরিস্থিতিতে যেখানে "বয়স" এমন কিছু বৈশিষ্ট্য দ্বারা প্রতিস্থাপন করা হয়েছে যা কঠিন, ব্যয়বহুল বা সময় সাপেক্ষে এটি পরিমাপ করা আকর্ষণীয় হতে পারে))


বয়সের চলকটিতে একটি স্প্লাইন ব্যবহার করে কি অ-লৈখিকতা এবং বিচ্ছেদ সংক্রান্ত উদ্বেগগুলির বেশিরভাগ উপশম হবে না? এই বিষয়ে, ক্ষমাপ্রার্থী তবে আমি দেখতে পাচ্ছি না কেন "পুলড" নকশাটি লজিস্টিক রিগ্রেশনটির অনুসন্ধানগুলিকে অকার্যকর করবে । অবশ্যই, এলোমেলো নমুনার অনুমান চলে গেছে তবে আমরা কি এই যত্নটি রাখি যে আমরা এই নকশাটি পছন্দ করি? আপনি কি নির্বাচন পক্ষপাতের ইঙ্গিত দিচ্ছেন? (আপনি যে নকশাটি বর্ণনা করেছেন তা আমার কাছে কেস-কন্ট্রোল অধ্যয়নের মতো মনে হয় তবে আমি ভুল হতে পারি ...) (+১ স্পষ্টতই)
usεr11852 বলেছেন 1: 07

@ usεr11852 আপনার চিন্তাশীল মন্তব্যের জন্য আপনাকে ধন্যবাদ। আপনি যে বিষয়গুলি তুলে ধরেছেন তা পরিষ্কার করার জন্য আমি কিছু প্যাসেজ আবার লিখেছি। যদিও বয়সের ছিটিয়ে থাকা লজিস্টিক রিগ্রেশনে অলাইনারিটির সাথে লড়াই করতে পারে তবে এটি সম্পূর্ণ বিচ্ছিন্ন হওয়ার সম্ভাবনা বাড়িয়ে তুলতে পারে। আপনি "পুলড ডিজাইন" বলতে কী বুঝছেন তা আমি নিশ্চিত নই তবে আমি একটি লজিস্টিক রিগ্রেশন-এর পি-ভ্যালুগুলি ব্যাখ্যা করার প্রচেষ্টা নিয়ে সন্দেহ করব যেখানে সম্ভাব্যতার মডেলটিকে ন্যায়সঙ্গত করা যায় না (যা এলোমেলো নমুনা আমাদের করতে সক্ষম করে)।
whuber

এই জন্য আপনাকে ধন্যবাদ। হ্যাঁ, সম্পূর্ণ বিচ্ছেদ (হ্যাক-ডোনার প্রভাব) সম্পর্কে আপনি যে বক্তব্যটি করেছেন আমি তার সম্পূর্ণ প্রশংসা করি, আমি সেগুলি বিবেচনা করি নি। ঠিক আছে, আমি এখন দুটি পুল সম্পর্কে তার মানে কী তা দেখছি। সেক্ষেত্রে আমাদের একটি সম্মত পর্যবেক্ষণমূলক স্টাডি ধারণাটি থাকবে (আমরা দুটি পুল পর্যবেক্ষণ / সংজ্ঞায়িত করব) সুতরাং আমাদের এটির নিয়ন্ত্রণের
উপায়টি

5

টিএক্সওয়াই

এক্স|ওয়াই=আমি~এন(μআমি,σ2)
ওয়াই~Bernoulli(পি)ওয়াইএক্স=এক্স
পি(ওয়াই=1|এক্স=এক্স)=এক্স|ওয়াই=1(এক্স)পি(ওয়াই=1)Σআমি=01এক্স|ওয়াই=আমি(এক্স)পি(ওয়াই=আমি)=পি-12σ2(এক্স-μ1)2পি-12σ2(এক্স-μ1)2+ +(1-পি)-12σ2(এক্স-μ0)2=11+ +1-পিপি-12σ2(এক্স-μ0)2+ +12σ2(এক্স-μ1)2=logit-1(β0+ +β1এক্স)
এটি হ'ল ইন্টারজিপ এবং opeাল সহ একটি লজিস্টিক রিগ্রেশন মডেল
β0=Lnপি1-পি-12σ2(μ12-μ02)β1=1σ2(μ1-μ0)

সুতরাং এই অর্থে দুটি শর্তাধীন মডেল সামঞ্জস্যপূর্ণ।


3

আরও ভাল পরীক্ষা হ'ল আপনার প্রশ্নকে আরও ভালভাবে সম্বোধন করে। এটির মুখের চেয়ে ভালও নয়। এখানে পার্থক্যগুলি x এবং y এর উপর x রেজিস্ট্রেশন করার সময় পাওয়া যায় এমন সমান এবং বিভিন্ন ফলাফলের কারণগুলি একই রকম। বৈকল্পিকটি যা ভেরিয়েবলকে মডেলের প্রতিক্রিয়াশীল ভেরিয়েবল হিসাবে বিবেচনা করা হচ্ছে তার উপর নির্ভর করে।

আপনার গবেষণা প্রশ্ন মারাত্মক অস্পষ্ট। সম্ভবত আপনি কার্যকারিতার দিক বিবেচনা করলে আপনি কোন বিশ্লেষণটি ব্যবহার করতে চান সে সম্পর্কে কোনও সিদ্ধান্তে আসতে সক্ষম হবেন। বয়স কি মানুষকে "হ্যাঁ" সাড়া দেয় বা "হ্যাঁ" প্রতিক্রিয়া দিচ্ছে মানুষ বৃদ্ধ হওয়ার জন্য? এটি সম্ভবত প্রাক্তন, যার ক্ষেত্রে "হ্যাঁ" এর সম্ভাবনার প্রকরণটি আপনি মডেল করতে চান তাই লজিস্টিক রিগ্রেশনই সেরা পছন্দ।

এটি বলেছিল, আপনার পরীক্ষাগুলির অনুমানগুলি পরীক্ষা করা উচিত। এগুলি অনলাইন উইকিপিডিয়ায় বা তাদের পাঠ্য বইয়ে পাওয়া যাবে। এটি ভালভাবে হতে পারে যে লজিস্টিক রিগ্রেশন না করার আপনার ভাল কারণ রয়েছে এবং যখন এটি ঘটে তখন আপনাকে অন্য একটি প্রশ্ন জিজ্ঞাসা করতে হতে পারে।


1
আপনি কি "লজিস্টিক রিগ্রেশন না করা" বলতে চান?
999
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.