আপনি কি কখনও বাইনারি ভেরিয়েবল মানক করা উচিত?


25

বৈশিষ্ট্যগুলির সেট সহ আমার একটি ডেটা সেট রয়েছে। তাদের মধ্যে কিছু বাইনারি সক্রিয় বা বরখাস্ত, নিষ্ক্রিয় বা সুপ্ত), এবং প্রকৃত মূল্যবান, যেমন ।(1=0=4564.342

আমি এই ডেটাটি একটি মেশিন লার্নিং অ্যালগরিদমগুলিতে ফিড করতে চাই, তাই আমি সমস্ত আসল-মূল্যবান বৈশিষ্ট্যগুলি স্কোর করি । আমি এগুলিকে আনুমানিক এবং মধ্যে পাই । এখন বাইনারি মান রয়েছে , -scored তাই শূন্য হয়ে এবং বেশী হয়ে ।z32z0.2220.5555

বাইনারি ভেরিয়েবলগুলি এর মতো মানক করা কি কোনও অর্থবোধ করে?

উত্তর:


14

বাইনারি ভেরিয়েবলগুলি মানীকৃত করার কোনও অর্থ হয় না। মানগুলি নির্বিচারে; তারা নিজের মধ্যে এবং নিজের কিছুই বোঝায় না। সংখ্যার স্থায়িত্ব সম্পর্কিত ইস্যুগুলির সাথে 0 এবং 1 এর মতো কিছু মান বাছাই করার পক্ষে যুক্তি থাকতে পারে, তবে এটি।


যদি তারা 0-100 এর মধ্যে ছিল। আমি যেমন বলেছি, সেগুলির অর্থ "মুখ স্বীকৃত" এবং "স্বীকৃত মুখ নয়" এর মতো জিনিসগুলি এবং 0-100 এর অর্থ আত্মবিশ্বাসের স্তর। এটি জেড-স্কোর করার কোনও অর্থ?
সিয়ামি

আপনার 0-100 উদাহরণটি অর্ডিনাল রেটিংয়ের মতো শোনাচ্ছে। কীভাবে ডাব্লু / সেই পরিস্থিতিটি সর্বোত্তমভাবে ডিল করা যায় সে সম্পর্কে একটি বিস্তৃত বিবরণ রয়েছে এবং এটি সিভিতে বেশ খানিকটা আলোচনা হয়েছে। আরও জানতে অর্ডিনাল ট্যাগে অনুসন্ধান করুন ।
গুং - মনিকা পুনরায়

ভাল, সমস্যাটি হ'ল কেবল কয়েকটি ভেরিয়েবল 0-100 are অন্যান্য উদাহরণস্বরূপ -400 - +400
সিয়ামি

ডাব্লু / এ সমস্যা কি? এটি কি সংখ্যার স্থিতিশীলতার সমস্যা?
গুং - মনিকা পুনরায়

সম্ভবত, আপনি কি জেড-স্কোর না করার পরামর্শ দিচ্ছেন?
সিয়ামি

14

মান 0, 1 সহ একটি বাইনারি পরিবর্তনশীল (সাধারণত) (মান - গড়) / এসডি স্কেল করা যায় যা সম্ভবত আপনার জেড-স্কোর।

এর মধ্যে সর্বাধিক সুস্পষ্ট সীমাবদ্ধতা হ'ল আপনি যদি সমস্ত শূন্য বা সমস্ত পেয়ে থাকেন তবে এসডি অন্ধভাবে প্লাগ ইন করার অর্থ জেড-স্কোর অনির্দিষ্ট। মান পর্যন্ত যতটা শূন্যকেও নির্ধারিত করার ক্ষেত্রে একটি মামলা রয়েছে - গড়টি একইভাবে শূন্য। ভেরিয়েবলটি যদি সত্যিই ধ্রুবক হয় তবে অনেক পরিসংখ্যানগত জিনিস খুব বেশি অর্থ বোধ করতে পারে না। আরও সাধারণভাবে, তবে এসডি ছোট হলে স্কোরগুলি অস্থির এবং / বা ভালভাবে নির্ধারিত না হওয়ার ঝুঁকি বেশি থাকে।

আপনার প্রশ্নের আরও ভাল উত্তর দেওয়ার ক্ষেত্রে একটি সমস্যা হ'ল "মেশিন লার্নিং অ্যালগরিদম" আপনি কী বিবেচনা করছেন is দেখে মনে হচ্ছে এটি একটি অ্যালগরিদম যা বেশ কয়েকটি ভেরিয়েবলের জন্য ডেটা একত্রিত করে এবং তাই এটি সাধারণত অনুরূপ আকারগুলিতে সরবরাহ করার জন্য অর্থবোধ করবে।

(লেটার) মূল পোস্টারটি একে একে মন্তব্য যুক্ত করার সাথে সাথে তাদের প্রশ্নটি মোরফিং করছে। আমি এখনও বিবেচনা করি যে (মান - গড়) / এসডিটি বাইনারি ভেরিয়েবলগুলির পক্ষে এতক্ষণ ধরে বোঝায় (অর্থাত্ অযৌক্তিক নয়) যতক্ষণ না এসডি ইতিবাচক থাকে। তবে লজিস্টিক রিগ্রেশনটিকে পরে অ্যাপ্লিকেশন হিসাবে নামকরণ করা হয়েছিল এবং এর জন্য বাইনারি ভেরিয়েবলগুলিকে 0, 1 হিসাবে খাওয়ানো ছাড়া কোনও তাত্ত্বিক বা ব্যবহারিক লাভ (এবং প্রকৃতপক্ষে কিছু সরলতার ক্ষতি) নেই। আপনার সফ্টওয়্যারটি ভালভাবে মোকাবেলা করতে সক্ষম হবে যে; যদি তা না হয় তবে সেই সফ্টওয়্যারটি এমন কোনও প্রোগ্রামের পক্ষে রেখে দিন can শিরোনাম প্রশ্নের পদে: পারি, হ্যাঁ; উচিত, না।


3
সংক্ষিপ্ত উত্তরটি হ'ল এর অর্থ ভিন্ন কিছু নয় এবং আমি 0, 1 কে জেড স্কোরের পরিবর্তনে এই পরিস্থিতিতে যে কোনও কিছুতেই সহায়তা করবে বলে কোনও কারণ দেখছি না। নিজেকে বোঝানোর জন্য, এটি উভয় উপায়ে চেষ্টা করে দেখুন এবং গুরুত্বপূর্ণ কিছু পরিবর্তন হয় না তা দেখুন।
নিক কক্স

3
বিপরীতে, আমি মনে করি বেশিরভাগ লোকেরা এখানে 0, 1 ব্যবহার করবে।
নিক কক্স

1
আপনি যখন লজিস্টিক রিগ্রেশন করছেন, সফ্টওয়্যারটি অবশ্যই অবশ্যই হুডের অধীনে মানিককরণ সম্পাদন করবে (আরও ভাল সংখ্যার বৈশিষ্ট্য অর্জন করতে)। সুতরাং বাইনারি সূচকটি অর্থবহভাবে প্রকাশ করা ভাল ধারণা। এটি মানক করা ভাল বা দরকারী শোনাচ্ছে না।
whuber

1
যে কোনও মেশিন লার্নিং পদ্ধতিতে আপনার বাইনারি পূর্বাভাসকারীদের "মানীকৃত" করা দরকার সন্দেহ হয়।
ফ্র্যাঙ্ক হ্যারেল

2
যেহেতু এটি আপনার নিজস্ব বাস্তবায়ন, তারপরে আর আপনাকে কারও কাছে উদ্দেশ্যমূলক উত্তর দেওয়ার কোনও ভিত্তি নেই! পূর্বে মানীয়করণটি বিবেচনা করে কিনা তা নির্ধারণ করার জন্য আপনার সফ্টওয়্যার কীভাবে ডেটা ব্যবহার করে তা পরীক্ষা করে দেখার দরকার।
হোবার

3

গেমম্যান এবং হিল ( http://www.stat.columbia.edu/~gelman/arm/ ) এর ৪.২ অনুচ্ছেদে দেওয়া হয়েছে যেখানে কিছুটা ভিন্ন উপায়ে প্রমিত করতে এটি কার্যকর হতে পারে তার একটি দুর্দান্ত উদাহরণ । এটি বেশিরভাগ ক্ষেত্রে যখন সহগের ব্যাখ্যাটি আগ্রহী হয় এবং সম্ভবত যখন অনেক পূর্বাভাসক না থাকে।

সেখানে, তারা x - μ x দ্বারা বাইনারি পরিবর্তনশীল (0 এবং 1 এর সমান অনুপাত সহ) মানিক করে স্বাভাবিক পরিবর্তেσ। তারপরে এই স্ট্যান্ডার্ডযুক্ত সহগগুলি0.5ডলারমান গ্রহণ করেএবং তার পরে সহগগুলিx=0এবংx=1 এর মধ্যেসরাসরিতুলনা দেখায়। যদি এরপরিবর্তেby দ্বারামাপানোহয় তবে সহগx এরসম্ভাব্য মানগুলির মধ্যে অর্ধেক পার্থক্যের সাথে সঙ্গতিপূর্ণ।

এক্স-μএক্স2σএক্স,
σ±0.5এক্স=0এক্স=1σএক্স

আমি যে বাইনারি ভেরিয়েবলগুলি দেখছি তা দয়া করে "0 এবং 1 এর সমান অনুপাত সহ" ব্যাখ্যা করুন rarely
নিক কক্স

আমি অনুভব করি না যে অনুপাতটি আসলে কোনও তাত্পর্য তৈরি করবে, তারা উদাহরণটিকে আরও পরিষ্কার করার জন্য এটি ব্যবহার করে।
গোসেটের শিক্ষার্থী

1

আপনি বাইনারি এলোমেলো পরিবর্তনশীল, বা একটি অনুপাত কী মানিক করতে চান?

ওয়াই:এসআরওয়াই{0,1}

এক্স[0,1]এক্সআর+ +


0

লজিস্টিক রিগ্রেশন-এ বাইনারি ভেরিয়েবলগুলি কন্টিনোস ওয়ারগুলির সাথে তাদের সংমিশ্রনের জন্য মানক করা যেতে পারে যখন আপনি তাদের সকলকে এন ~ (0,5) বা কচি ~ (0,5) এর মতো কোনও তথ্যহীন পূর্ববর্তী দিতে চান। মানীকরণ নিম্নলিখিত হিসাবে পরামর্শ দেওয়া হয়: মোট গণনা নিন এবং দিন

1 = 1 এর অনুপাত

0 = 1 - অনুপাত 1 এর।

-----

সম্পাদনা করুন: আসলে আমি মোটেও ঠিক ছিলাম না, এটি মানসম্মতকরণ নয়, তবে 0 তে কেন্দ্রীভূত হওয়া এবং নিম্ন এবং উচ্চতর অবস্থার সাথে 1 দ্বারা পৃথক হওয়া একটি স্থানান্তর নয়, বলতে পারি যে জনসংখ্যা A এর সাথে 30% এবং অন্যান্য 70%, আমরা -0.3 এবং 0.7 মান গ্রহণের জন্য কেন্দ্রিক "সংস্থা এ" ভেরিয়েবল সংজ্ঞায়িত করতে পারি।


এটি একটি মানীকরণ হিসাবে বোঝায় না।
মাইকেল আর চেরনিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.