লিনিয়ার রিগ্রেশন এর মূল উদ্দেশ্য হ'ল একটি রেজিস্ট্রারের সংলগ্ন স্তরের তুলনায় ফলাফলগুলির গড় পার্থক্য অনুমান করা। বিভিন্ন ধরণের মাধ্যম রয়েছে। আমরা পাটিগণিত গড়ের সাথে সর্বাধিক পরিচিত।
AM(X)=(X1+X2+…+Xn)n
এএমটি হ'ল ওএলএস এবং অপরিবর্তিত ভেরিয়েবলগুলি ব্যবহার করে অনুমান করা হয়। জ্যামিতিক গড়টি পৃথক:
GM(X)=(X1×X2×…×Xn)−−−−−−−−−−−−−−−−−√n=exp(AM(log(X))
কার্যত জিএম পার্থক্য একটি গুণগত পার্থক্য: loanণ গ্রহণ করার সময় আপনি সুদের প্রিমিয়ামের X% প্রদান করেন, মেটফর্মিন শুরু করার পরে আপনার হিমোগ্লোবিনের মাত্রা X% হ্রাস পায়, স্প্রিংসের ব্যর্থতার হার প্রস্থের একটি ভগ্নাংশ হিসাবে X% বৃদ্ধি করে। এই সমস্ত ক্ষেত্রে, একটি কাঁচা গড় পার্থক্য কম বোঝা যায়।
লগ রুপান্তরকরণ জ্যামিতিক গড় পার্থক্য অনুমান করে। আপনি যদি কোনও ফলাফল রূপান্তরিত করেন এবং নীচের সূত্রের ব্যবহার করে লিনিয়ার রিগ্রেশনটিতে মডেল করেনlog(y) ~ x
সহগ সংলগ্ন ইউনিটগুলির সাথে তুলনা করে লগ ফলাফলের একটি গড় পার্থক্য । এটি ব্যবহারিকভাবে অকেজো, সুতরাং আমরা প্যারামিটারটি ব্যাখ্যা করি এবং এই মানটিকে জ্যামিতিক গড় পার্থক্য হিসাবে ব্যাখ্যা করি।β1Xeβ1
উদাহরণস্বরূপ, এইচআরটি ভাইরাল লোডের একটি গবেষণায় 10 টি সপ্তাহের এআরটি পরিচালনার পরে, আমরা এর প্রিপোস্ট জ্যামিতিক গড় অনুমান করতে পারি । তার মানে ভাইরাল লোড বেসলাইনে যা ছিল, এটি গড়ে 60০% কম বা ফলো-আপে ০..6 গুণ হ্রাস পেয়েছে। যদি বেসলাইনে লোডটি 10,000 ছিল, আমার মডেলটি ফলোআপে 4,000 হওয়ার পূর্বাভাস দিবে, যদি এটি বেসলাইনে 1,000 হয় তবে আমার মডেলটি অনুমান করে 400 হবে (কাঁচা স্কেলের উপর একটি ছোট পার্থক্য) আনুপাতিকভাবে একই)।eβ1=0.40
এটি অন্যান্য উত্তরের থেকে একটি গুরুত্বপূর্ণ পার্থক্য : লগ-স্কেল সহগকে 100 দ্বারা গুণিত করার কনভেনশনটি ছোট হলে থেকে আসে । যদি সহগ (লগ স্কেলে) 0.05 বলা হয়, তবে এবং ব্যাখ্যাটি হয়: 1 ইউনিট "বৃদ্ধি" এর ফলাফলের ক্ষেত্রে 5% "বৃদ্ধি" । তবে, সহগটি যদি 0.5 হয় তবে এবং আমরা এটি 1 ইউনিট "বৃদ্ধি" এর জন্য 65% "বৃদ্ধি" হিসাবে ব্যাখ্যা করি । এটি একটি 50% বৃদ্ধি নয়।এক্স এক্সপ্রেস ( 0.05 ) ≈ 1.05 এক্স এক্সপ্রেস ( 0.5 ) = 1.65 ওয়াই এক্সlog(x)≈1−xXexp(0.05)≈1.05Xexp(0.5)=1.65YX
ধরুন আমরা একটি predictor রুপান্তর লগ ইন করুন: y ~ log(x, base=2)
। এখানে আমি কাঁচা পার্থক্যের পরিবর্তে গুণক পরিবর্তনে আগ্রহী । আমি এখন 2 ভাগে পৃথকী অংশগ্রহণকারীদের তুলনা করতে আগ্রহী । উদাহরণস্বরূপ, ধরুন, আমি একটি সংযোজনজনিত ঝুঁকি মডেল ব্যবহার করে বিভিন্ন ঘনত্বের রক্ত-বাহিত প্যাথোজেনের সংস্পর্শের পরে সংক্রমণ (হ্যাঁ / না) পরিমাপে আগ্রহী। জৈবিক মডেলটি পরামর্শ দিতে পারে যে ঘনত্বের প্রতিটি দ্বিগুণ হওয়ার জন্য আনুপাতিকভাবে ঝুঁকি বাড়বে। তারপরে, আমি আমার ফলাফলটি রূপান্তর করি না, তবে সংক্রামক পদার্থের দ্বিগুণ ঘনত্বের পার্থক্যের দলগুলিকে তুলনামূলকভাবে তুলনামূলকভাবে ঝুঁকির পার্থক্যের হিসাবে আনুমানিক সহগ হিসাবে ব্যাখ্যা করা হয়।এক্স β 1xXβ1
পরিশেষে, log(y) ~ log(x)
এক্সপোজার স্তরে বহুগুণে পৃথক গোষ্ঠীগুলির তুলনা করে বহুগুণীয় পার্থক্য পাওয়ার জন্য কেবল উভয় সংজ্ঞা প্রয়োগ করা হয়।