লগ-ট্রান্সফর্মড প্রতিক্রিয়া সহ লিনিয়ার মডেল বনাম লগ লিঙ্ক সহ লিনিয়ার মডেলটি সাধারণ


46

ইন এই কাগজ খেতাবধারী "মধ্যে সাধারণ রৈখিক মডেল প্রয়োগ মেডিক্যাল ডেটা NEWLINENEWLINE" লেখক লিখুন:

একটি সাধারণ রৈখিক মডেলটিতে, প্রতিক্রিয়াটি নিজেই পরিবর্তিত না করে লিংক ফাংশন দ্বারা গড়টি রূপান্তরিত হয়। রূপান্তরের দুটি পদ্ধতি বেশ ভিন্ন ফলাফলের দিকে নিয়ে যেতে পারে; উদাহরণস্বরূপ, লগ-ট্রান্সফর্মড প্রতিক্রিয়াগুলির গড়টি গড় প্রতিক্রিয়ার লগারিদমের মতো নয় । সাধারণভাবে, প্রাক্তন সহজেই কোনও গড় প্রতিক্রিয়াতে রূপান্তরিত হতে পারে না। সুতরাং, গড় রূপান্তরটি প্রায়শই ফলাফলগুলিকে আরও সহজে ব্যাখ্যা করতে দেয়, বিশেষত এর অর্থ পরিমাপকরা পরিমাপকৃত প্রতিক্রিয়াগুলির মতো একই স্কেলে থাকে।

এটি উপস্থিত হয় যে তারা লগ-রূপান্তরিত প্রতিক্রিয়া সহ লিনিয়ার মডেল (এলএম) এর পরিবর্তে লগ লিঙ্কের সাথে জেনারাইজড লিনিয়ার মডেল (জিএলএম) ফিটিংয়ের পরামর্শ দেয়। আমি এই পদ্ধতির সুবিধা বুঝতে পারি না এবং এটি আমার কাছে বেশ অস্বাভাবিক বলে মনে হয় seems

আমার প্রতিক্রিয়া ভেরিয়েবল লগ-সাধারণত বিতরিত দেখায়। সহগের পদগুলির ক্ষেত্রে এবং উভয় পদ্ধতির সাথে তাদের মানগত ত্রুটির ক্ষেত্রে আমি একই রকম ফলাফল পেয়েছি।

তবুও আমি আশ্চর্য হই: যদি কোনও ভেরিয়েবলের লগ-স্বাভাবিক বিতরণ থাকে তবে লগ-ট্রান্সফর্মড ভেরিয়েবলের গড়টি অপরিবর্তিত ভেরিয়েবলের লগের চেয়ে ভাল নয় , কারণ গড়টি একটি সাধারণ বিতরণের প্রাকৃতিক সারাংশ এবং লগ হয় - পরিবর্তনশীল ভেরিয়েবলটি সাধারণত বিতরণ করা হয়, তবে ভেরিয়েবলটি নিজেই হয় না?


3
আমরা যদি একটি লগ-সাধারণ বিতরণ ভেরিয়েবল থাকে তবে আমি আপনার ক্লুটির সাথে একমত। তবে তথ্যের মূল স্কেলের উপর ভিত্তি করে সহজেই বোধগম্য পরিসংখ্যান পাওয়ার জন্য গড়টি "ব্যাক ট্রান্সফর্মড" হওয়া দরকার। এটি নিবন্ধের উপসংহারটি ব্যাখ্যা করতে পারে। এছাড়াও, লগ-রূপান্তরের পরে, আমরা সাধারণত বিতরণ করা ভেরিয়েবলটি পেতে পারি না এবং এই ক্ষেত্রে, আমি জানি না কোন পদ্ধতির ভাল হবে।
soufanom

উত্তর:


46

যদিও এটি প্রদর্শিত হতে পারে যে লগ-ট্রান্সফর্মড ভেরিয়েবলগুলির গড়টি পছন্দনীয় (যেহেতু লগ-সাধারণটি সাধারণত প্যারামিটারাইজড হয়) তবে ব্যবহারিক দৃষ্টিকোণ থেকে, গড়টির লগটি সাধারণত অনেক বেশি কার্যকর।

এটি বিশেষত সত্য যখন আপনার মডেলটি ঠিক সঠিক নয়, এবং জর্জ বক্সকে উদ্ধৃত করার জন্য: "সমস্ত মডেলগুলি ভুল, কিছু কার্যকর হয়"

ধরুন কিছু পরিমাণ লগ সাধারণভাবে বিতরণ করা হয়েছে, রক্তচাপ বলে (আমি কোনও মেডিসিন নই!), এবং আমাদের মধ্যে পুরুষ ও মহিলা দুটি জনসংখ্যা রয়েছে। কেউ অনুমান করতে পারেন যে পুরুষদের তুলনায় মহিলাদের মধ্যে গড় রক্তচাপ বেশি। এটি পুরুষদের তুলনায় মহিলাদের মধ্যে রক্তচাপের গড় রক্তচাপ বেশি কিনা তা জিজ্ঞাসার সাথে ঠিক মিলে যায়। পুরুষের মহিলাদের মধ্যে লগ রক্তচাপের গড় গড় বেশি কিনা তা জিজ্ঞাসা করার মতো নয়

μLn

μ=μLn+ +σLn2/2

σ2=(σLn2-1)2μLn+ +σLn2

স্পষ্টতই, এটি করা বীজগণিতকে মারাত্মক জটিল করে তোলে তবে এটি এখনও কাজ করে এবং একই জিনিসটি বোঝায়।

Ln(μ)σLn2μLn

μLn

এখনও অবধি, আমরা ধরে নিয়েছি যে রক্তচাপ জেনুইনলি লগ-স্বাভাবিক। সত্যিকারের বিতরণগুলি যদি সাধারণভাবে লগ না হয় তবে তথ্যের রূপান্তরটি (সাধারণত) উপরের চেয়ে আরও খারাপ করে দেবে - যেহেতু আমরা আমাদের "মানে" পরামিতিটির অর্থ কী তা আমরা বেশিরভাগই জানতে পারি না। অর্থাৎ আমরা যে দুটি সমীকরণের গড় এবং বৈচিত্রগুলি উপরে দিয়েছি তা সঠিক নয়। এগুলি পিছনে পিছনে রূপান্তর করতে ব্যবহার করার পরে অতিরিক্ত ত্রুটিগুলি প্রবর্তিত হবে।


: আমি এই খুব সহায়ক বলে চিহ্নিত করেছেন christoph-scherber.de/content/PDF%20Files/...
আদিত্য

2
করোন, আমি আপনার উত্তরে দুটি গুরুত্বপূর্ণ বাক্য হাইলাইট করেছি। আমি আশা করি আপনি কিছু মনে করবেন না। আপনি একমত না হলে দয়া করে ফিরে রোল।
স্টেফান

17

বায়োস্টাটিক্স অধ্যয়ন করার সময় আমি যে উন্নত ডেটা বিশ্লেষণ কোর্সটি নিয়েছিলাম তা থেকে আমার দুটি সেন্ট এখানে রয়েছে (যদিও আমার অধ্যাপকের নোট ব্যতীত আমার কোনও রেফারেন্স নেই):

আপনার ডেটাতে আপনাকে লাইনারিটি এবং হিটারোসেসেস্টাস্টিটি (অসম বৈকল্পিকগুলি) বা ঠিক রৈখিকতার ঠিকানা দেওয়ার প্রয়োজন আছে কিনা তা এটিকে ফুটিয়ে তোলে।

তিনি নোট করেছেন যে ডেটা রুপান্তরিত করা কোনও মডেলের লাইনারিটি এবং তারতম্য অনুমান উভয়কেই প্রভাবিত করে। উদাহরণস্বরূপ, যদি আপনার অবশিষ্টাংশগুলি উভয়ের সাথে সমস্যাগুলি প্রদর্শন করে তবে আপনি ডেটাটিকে রূপান্তর করতে বিবেচনা করতে পারেন, যা সম্ভবত উভয়কেই ঠিক করতে পারে। রূপান্তর ত্রুটিগুলি রূপান্তর করে এবং এইভাবে তাদের বৈকল্পিক।

বিপরীতে, লিঙ্ক ফাংশনটি ব্যবহার করা কেবলমাত্র লিনিয়ারিটি অনুমানকে প্রভাবিত করে, বৈকল্পিকতা নয়। লগটি গড় (প্রত্যাশিত মান) থেকে নেওয়া হয়, এবং এইভাবে অবশিষ্টাংশের বৈচিত্র প্রভাবিত হয় না।

সংক্ষেপে, যদি আপনার অ-ধ্রুবক বৈকল্পিকতার কোনও সমস্যা না থাকে তবে তিনি লিঙ্ক ফাংশনটি রূপান্তরকরণের উপর ব্যবহার করার পরামর্শ দেন, কারণ আপনি সেই ক্ষেত্রে আপনার রূপ পরিবর্তন করতে চান না (আপনি ইতিমধ্যে অনুমানটি পূরণ করছেন)।


6
লিঙ্ক ফাংশনটি কেবলমাত্র গড়কে প্রভাবিত করে, লিঙ্ক ফাংশনটি একটি জিএলএমের কেবলমাত্র একটি অংশ। আপনার মন্তব্যগুলি লগ লিঙ্ক সহ গাউসিয়ান গ্ল্যামের পক্ষে কাজ করে। লগ লিঙ্ক সহ একটি গামা জিএলএম লগগুলি গ্রহণ করা এবং সেই লগ স্কেলের উপর একটি ধ্রুবক বৈকল্পিক ফিটিং করার মতো একই বৈকল্পিক-ফাংশন অনুমান (স্কোয়ার্ড বোঝার সাথে আনুপাতিক সমান) থাকবে। জিএলএম কাঠামোর মধ্যে অন্যান্য পরিবারগুলির মধ্যে অন্যান্য বৈকল্পিক কার্য রয়েছে। দুর্ভাগ্যক্রমে জিএলএমগুলির জন্য উইকিপিডিয়া পৃষ্ঠার টেবিলটি বিতরণ পরিবারগুলির জন্য বৈচিত্র্য ফাংশনকে বাদ দেয়।
Glen_b

2
তারা যদিও এখানে কিছু উদাহরণ উল্লেখ না । এখানে গামা
Glen_b

-1

প্রতিক্রিয়া সত্যায়িত যদি প্রতিসম হয় না (সাধারণ হিসাবে বিতরণ করা হয় না) তবে লগ রূপান্তরিত প্রতিক্রিয়া স্বাভাবিক হয় তবে রূপান্তরিত প্রতিক্রিয়ার উপর লিনিয়ার রিগ্রেশন ব্যবহার করা হবে এবং এক্সপোশন সহগ আমাদের জ্যামিতিক গড়ের রেশন দেয়।

যদি প্রতিক্রিয়াটি যথাযথভাবে প্রতিসম হয় (সাধারণ হিসাবে বিতরণ করা হয়) তবে বর্ণনামূলক (এক্স) এবং প্রতিক্রিয়াটির মধ্যে সম্পর্ক লিনিয়ার না হয় তবে লগ প্রত্যাশিত মান এক্স এর লিনিয়ার ফাংশন হয় তবে লগ লিঙ্ক সহ জিএলএম ব্যবহার করা হবে এবং এক্সপোনিটি সহগ আমাদের গাণিতিক গড়ের অনুপাত দেয়


এই উত্তরটি পরিষ্কার নয়। আপনি কি "ভেরিয়েবল" এর চেয়ে "ভেরিয়েবল" বলতে চেয়েছিলেন?
মাইকেল চেরনিক

এটি একটি উত্তরের খণ্ড। এটি কীভাবে প্রশ্নের সাথে সম্পর্কিত এবং এই প্রশ্নের অন্তর্দৃষ্টিটির ভিত্তিতে প্রশ্নের উত্তর আসলে কী তা আপনার স্পষ্ট করে তুলতে হবে।
রিনিব্যাট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.