বাইনারি ডেটার জন্য সূচক পরিবর্তনশীল: {-1,1} বনাম {0,1}


10

বাইনারি ট্রিটমেন্ট অ্যাসাইনমেন্ট ইন্ডিকেটর দিয়ে পরীক্ষাগুলি / এলোমেলোভাবে নিয়ন্ত্রিত পরীক্ষাগুলির প্রসঙ্গে আমি চিকিত্সা-কোভারিয়েট ইন্টারঅ্যাকশনগুলিতে আগ্রহী ।T

নির্দিষ্ট পদ্ধতি / উৎসের উপর নির্ভর করে, আমি উভয় দেখেছি এবং টি = { 1 , - 1 } চিকিত্সা এবং চিকিত্সা না বিষয়, যথাক্রমে।T={1,0}T={1,1}

সেখানে যখন ব্যবহার করতে চলতি কোনো নিয়ম নেই বা { 1 , - 1 } ?{1,0}{1,1}

কোন উপায়ে ব্যাখ্যা পৃথক হয়?


FWIW ... এই প্রথম লিঙ্কটি বিভিন্ন কোডিং স্কিমগুলির সম্পর্কে মোটামুটি বিস্তৃত সংক্ষিপ্তসার সরবরাহ করে ... ats.ucla.edu/stat/r/library/contrast_coding.htm এই দ্বিতীয় লিঙ্কটি সূচক (ডামি), প্রভাব এবং অরথোগোনাল (বিপরীতে) কোডিং নিয়ে আলোচনা করেছে ... faculty.cas.usf.edu/mbrannick/regression/anova1.html
মাইক হান্টার

উত্তর:


10

সূচক ভেরিয়েবল এবং ইন্টারসেপ্ট উভয়ের অনুমানকারকের ব্যাখ্যা পৃথক। সঙ্গে আসুন শুরু :{1,0}

বলুন আপনার নীচের মডেল রয়েছে

yi=β0+treatmentβ1

কোথায়

treatment={0if placebo1if drug

যে ক্ষেত্রে জন্য নিম্নোক্ত সূত্র দিয়ে শেষ :yi

yi={β0+0β1=β0if placeboβ0+1β1=β0+β1if drug

সুতরাং এর ব্যাখ্যা হ'ল প্লেসবো এবং β এর ব্যাখ্যা ββ0হ'ল প্লেসবো প্রভাব এবং ড্রাগের প্রভাবের মধ্যে পার্থক্য। কার্যত, আপনি ড্রাগটি যে উন্নতি করে তা β 1 কেব্যাখ্যা করতে পারেন।β1β1


এখন দেখা যাক :{1,1}

তারপরে আপনার নীচের মডেলটি (আবার) রয়েছে:

yi=β0+tRএকটিটিমিএনটিβ1

কিন্তু যেখানে

treatment={1if placebo1if drug

যে ক্ষেত্রে জন্য নিম্নোক্ত সূত্র দিয়ে শেষ :yi

yi={β0+1β1=β0β1if placeboβ0+1β1=β0+β1if drug

এখানে ব্যাখ্যাটি হ'ল প্লেসবো এর প্রভাব এবং ড্রাগের প্রভাবের মাধ্যম এবং β 1 এর অর্থ এই দুটি চিকিত্সার পার্থক্য।β0β1


তাহলে আপনি কোনটি ব্যবহার করবেন?

ব্যাখ্যার মধ্যে { 0 , 1 } মূলত একটি বেসলাইন হয়। আপনি কিছু স্ট্যান্ডার্ড চিকিত্সা সেট করেছেন এবং অন্যান্য সমস্ত চিকিত্সা (একাধিক হতে পারে) সেই মান / বেসলাইনের সাথে তুলনা করা হয়। বিশেষত যখন আপনি অন্যান্য সমাহারগুলিতে যুক্ত করা শুরু করেন এটি স্ট্যান্ডার্ড মেডিকেল প্রশ্নের সাথে ব্যাখ্যা করা সহজ থেকে যায়: এই ওষুধাগুলি কীভাবে কোনও প্লাসেবো বা প্রতিষ্ঠিত ওষুধের সাথে তুলনা করতে পারে?β0{0,1}

তবে শেষ পর্যন্ত এটি সমস্ত ব্যাখ্যার বিষয়, যা আমি উপরে ব্যাখ্যা করেছি। সুতরাং আপনার অনুমানগুলি মূল্যায়ন করা উচিত এবং কোন ব্যাখ্যাটি সিদ্ধান্তের অঙ্কনকে সবচেয়ে সোজা করে তোলে তা পরীক্ষা করা উচিত।


6
-1, 1 কোডিংটি ব্যবহার করার সময় ধ্রুবকটি যদি গড় চিকিত্সা করা হয় তবে চিকিত্সা গোষ্ঠীতে উত্তরদাতাদের সংখ্যা নিয়ন্ত্রণ গ্রুপে উত্তরদাতাদের সংখ্যার সমান।
মার্টেন বুইস

@MaartenBuis এটা গড় iff নকশা সুষম হয়, কিন্তু অন্যথায় এটি এখনও দুটি গ্রুপ মানে, যা আমি বোঝানো গড় হয়। আমি এটি প্রতিফলিত করতে শব্দ পরিবর্তন। y
জেএডি

9
সহায়ক। আমি সর্বদা কমপক্ষে দুটি কারণে ডামি (মূল প্রশ্নে!) এর পরিবর্তে সূচক শব্দটি ব্যবহার করার জন্য উত্সাহিত করার চেষ্টা করি । প্রথমত, আমি অনেকগুলি গল্প শুনেছি যার মধ্যে উপস্থাপনাগুলি খুব খারাপভাবে নেমেছিল কারণ "লিঙ্গ ডামি" এর মতো শব্দগুলি কম প্রযুক্তিবিদদের দ্বারা বিতর্কিত বা আক্রমণাত্মক হিসাবে বন্যভাবে ব্যাখ্যা করা হয়েছিল। দ্বিতীয়ত, ডামি শব্দটি পুরো ডিভাইসটিকে কিছুটা ফজ বা ডজর মতো দেখায়, যদিও এটি একটি নিখুঁত পরিষ্কার এবং মার্জিত পদ্ধতি। কিছু ক্ষেত্রগুলিতে জড়িত অনুশীলনগুলি পরিবর্তনের আমার খুব বেশি সম্ভাবনা নেই, তবে এখানে চেষ্টা করছি।
নিক কক্স

সম্মত, এটি আরও পেশাদার মনে হয়। এছাড়াও এটি আসলে কী করছে তার আরও ভাল বিবরণ।
জেএডি

2
আপনি সন্তুষ্ট হন খুশি। এখানে ব্যাখ্যা করার একটি সহজ উপায়: এটি সূচক বলা হয় কারণ এটি নির্দেশ করে!
নিক কক্স

6

লিনিয়ার রিগ্রেশন প্রসঙ্গে, xi{0,1} বাইনারি ভেরিয়েবল কোডিং (কিনা তাদের রিগ্রেশন ডান দিকে বাম দিকে স্থাপন) জন্য আরও স্বাভাবিক (এবং মান) পদ্ধতি। @ জারকো ডাবল্ডাম যেমন ব্যাখ্যা করেছেন, আপনি অবশ্যই অন্য ব্যাখ্যাটি ব্যবহার করতে পারেন এবং সহগের অর্থ আলাদা হবে।

একটি উদাহরণ অন্যান্য উপায় দিতে, আউটপুট ভেরিয়েবল কোডিং মান যখন প্রোগ্রামিং বা গণিত অন্তর্নিহিত আহরিত হয়yi{1,1} সমর্থন ভেক্টর মেশিন । (লাইব্রেরিগুলিতে কল করার সময়, আপনি লাইব্রেরিটি যে ফর্ম্যাটটির প্রত্যাশা করে সেই ফর্ম্যাটে ডেটা পাস করতে চান, এটি সম্ভবত 0, 1 সূত্র।

আপনি যা কিছু করছেন / ব্যবহার করছেন তার জন্য স্বীকৃতিটি চিহ্নিত করার চেষ্টা করুন।


একটি ইন্টারসেপ্ট টার্ম সহ যে কোনও ধরণের লিনিয়ার মডেলের জন্য, দুটি পদ্ধতি একই অর্থে সমান হবে যে এগুলি একটি সাধারণ রৈখিক রূপান্তর দ্বারা সম্পর্কিত। গাণিতিকভাবে, এটা ব্যাপার কিনা আপনি ডাটা ম্যাট্রিক্স ব্যবহার করে না বা তথ্য ম্যাট্রিক্স ~ এক্স = এক্স একটি যেখানে একজন পূর্ণ র্যাঙ্ক হয়। সাধারণ রৈখিক মডেল ক্ষেত্রে, আপনার অনুমান কোফিসিয়েন্টস উভয় ক্ষেত্রেই রৈখিক রূপান্তর দ্বারা সম্পর্কিত করা হবে একটি এবং লাগানো মান Y একই হবে।XX~=XAAAy^


+1 টি, আমি একটি সেটিং যেখানে মনে করতে পারে না ব্যবহার করা হয়েছিল। {1,1}
জেএডি

AdaBoost অন্য একটি উদাহরণ হল যে ব্যবহারসমূহ yi{1,1}
ফ্রান্সিস

5
সাধারণভাবে, আপনি বলতে পারেন যে মূলত শ্রেণিবদ্ধকরণে ব্যবহৃত হয়, কারণ এটি সাইন ফাংশনটি শ্রেণিবদ্ধ করার জন্য একটি সম্ভাব্য উপায় হিসাবে তৈরি করে। {1,1}
জেএডি

@ ম্যাটহেগুন্ন লেখক কোভেরিয়েটস, অর্থাৎ ইনপুটগুলি আউটপুট নয় বলে কথা বলছেন। {-1, 1 the আউটপুটটির জন্য সমর্থন ভেক্টরগুলির জন্য অর্থবোধ করে তবে এটি ইনপুটটির জন্য কোনও বিষয় নয়। এখানে দেখুন: en.wikedia.org/wiki/Support_vector_machine# লাইনার_এসভিএম
ফ্রান্সিসকো আরসিও

@ ফ্রেঞ্চিসকো আরসিও পয়েন্ট নেওয়া হয়েছে; আমি আরও সুনির্দিষ্ট হতে সম্পাদনা করেছি।
ম্যাথিউ গন

2

এটি আরও বিমূর্ত (এবং সম্ভবত অকেজো), তবে আমি লক্ষ করব যে এই দুটি উপস্থাপনা গাণিতিক দিক থেকে আসলে গোষ্ঠী উপস্থাপনা এবং তাদের মধ্যে একটি বিচ্ছিন্নতা রয়েছে।

TT1T2T1T2Z21,01,1ab=1(a+b)ab=abϕ(a)=2a1

pTTTpp=pp+(1p)(1p)t(p)=2p1tt=ttt


এটি চিত্তাকর্ষক, তবে আমি এই মন্তব্য করার পক্ষে যথেষ্ট মনে করি যে {-1, 1} এবং {0, 1 between এর মধ্যে যে কোনও বৈধ চিঠিপত্রের এক হতে হবে: উচ্চ বিদ্যালয়ের গণিতের বাইরে কিছু করার প্রয়োজন নেই। আমরা অগত্যা একই তথ্যের বিষয়ে কথা বলছি, কেবল অন্যভাবে কোডিং করেছি।
নিক কক্স
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.