বৈজ্ঞানিক সাহিত্যে "এক-গরম" এনকোডিং কী বলা হয়?


10

অপারেটরটির নাম কী যা একটি শ্রেণিবদ্ধ ভেক্টর নেয় এবং এক-হট এনকোডিং ব্যবহার করে বাইনারি উপস্থাপনায় রূপান্তরিত করে? আমি ভাবছি যেহেতু আমি একটি বৈজ্ঞানিক কাগজ লিখছি এবং এর জন্য একটি সঠিক নাম প্রয়োজন need


3
ডামি এনকোডিং এর আরেকটি নাম। মেশিন লার্নিংয়ে, সকলেই একটি সহজ প্রকারের ব্যবহার করেন তাই এটি কী তা খুব পরিষ্কার, তবে বিয়োগের সাথে এবং অন্যান্য ধারণার সাথে অন্য ধরণের বিপরীত কোডিং (অন্য নাম) রয়েছে যা পরিসংখ্যানগুলিতে ব্যবহৃত অনুরূপ ভূমিকা পালন করে এবং তাই আপনি কিছুটা সুনির্দিষ্ট হতে পারেন
গিজস

7
পরিসংখ্যান এবং ডেটা বিশ্লেষণে, মেশিন লার্নিংয়ের অনেক আগে, এই ধরণের শ্রেণিবদ্ধ এনকোডিংটি ডামি ভেরিয়েবল ওরফে ইনডিকেটর টাইপ কনট্রাস্ট ভেরিয়েবল হিসাবে পরিচিত ।
ttnphns

উত্তর:


18

পরিসংখ্যানবিদরা ওয়ান-হট এনকোডিংটিকে ডামি কোডিং বলে । অন্যরা যেমন পরামর্শ দিয়েছে ( মন্তব্যে স্কোর্তচি সহ ), এটি সঠিক প্রতিশব্দ নয়, তবে এটি এমন শব্দ যা সাধারণত 0-1 এনকোডযুক্ত শ্রেণীবদ্ধ ভেরিয়েবলের জন্য ব্যবহৃত হত।

আরও দেখুন: নামমাত্র / শ্রেণিবদ্ধ ডেটার জন্য "ডামি ভেরিয়েবল" বনাম "সূচক ভেরিয়েবল"


3
Duh !! বিশ্বাস করতে পারি না আমি ভুলে গেছি। আমি তাদের সূচক হিসাবে উল্লেখ করুন।
টিম অ্যাট্রেইডস

2
আমি মনে করি না "ডামি কোডিং" একটি ভাল প্রতিশব্দ। এটি সাধারণ অর্থে সংখ্যার ভেরিয়েবলের সেট সহ শ্রেণীবদ্ধ ভেরিয়েবলের প্রতিনিধিত্ব করার জন্য বা "রেফারেন্স-লেভেল কোডিং" "এক-গরম এনকোডিং" থেকে পৃথক হিসাবে বোঝাতে ব্যবহৃত হয়, যেমন- হট এনকোডিং বনাম ডামি এনকোডিংয়ের সমস্যাগুলিতে । "লেভেল-মানে কোডিং" (দেখুন রিগ্রেশন মডেলগুলিতে "মিন কোডিং" (ডামি কোডিং এবং এফেক্ট কোডিং এর মতো কিছু আছে কি বলে? ) ওয়ান-হট এনকোডিংকে বোঝায়, তবে সম্ভবত একটি লিনিয়ার মডেল প্রসঙ্গটিও
বোঝায়

2
... সাধারণভাবে ব্যবহারের জন্য।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

3
আমি কখনও প্রতি সে এর সংজ্ঞাটি দেখিনি, তবে আমার কাছে পরিসংখ্যানগুলিতে ডামি ভেরিয়েবলগুলি সর্বদা (এন -1) ভেরিয়েবলের সাথে এন ফ্যাক্টরগুলির কোডিং বোঝায় যেখানে এক-হট এনকোডিং এন ভেরিয়েবলগুলির সাথে এন ফ্যাক্টরকে কোড করে। অনুশীলনে এই পার্থক্যটি অত্যন্ত গুরুত্বপূর্ণ। যদি কেউ রিগ্রেশনের জন্য এক-হট এনকোডিং ব্যবহার করে তবে ভেরিয়েবলের নির্ভরতার কারণে কেউ বাজে কথা বলতে পারে!
meh

2
@aginensky যদিও লোকেরা অবশ্যই তাদের ঠিক কী পরিবর্তনশীল রয়েছে সেদিকে মনোযোগ দিতে হবে, তবে একটি ভাল প্রতিরোধের রুটিন সেই পরিস্থিতিতে বাজে কথা উত্থাপন করবে না: এটি কেবল একজন ভবিষ্যদ্বাণীকে বাদ দেবে এবং আপনাকে তা বলে দেবে।
নিক কক্স

8

এটি আপনার লক্ষ্য দর্শকদের উপর নির্ভর করে।

টিম যেমন বলেছিলেন, পরিসংখ্যানবিদরা এটিকে ডামি কোডিং বলে থাকেন এবং এটি কোনও রিগ্রেশন মডেলের মতো কিছু বর্ণনা করার সময় দেখার আশা করতাম। "দোকানের অবস্থানের জন্য সামঞ্জস্য করার জন্য ডামি কোডেড ভেরিয়েবলগুলি অন্তর্ভুক্ত করা হয়েছিল।" আমি মনে করি একে এক-গরম এনকোডিং বলা এখানে কিছুটা অদ্ভুত লাগবে।

তবে, অন্য টিম যেমন বলেছিলেন, মেশিন লার্নিং সাহিত্যে এক-হট এনকোডিং মোটামুটি সাধারণ। এটি অজ্ঞানভাবে নোডের অস্তিত্বকে বোঝায় (যেমন একটি নিউরাল নেটওয়ার্কের মতো), শারীরিক তারগুলি (কোনও ডিভাইসে) বা কমপক্ষে আমার কাছে।

সাধারণত, আমি অনুমান করি আপনি সূচক ফাংশনগুলির একটি সেট প্রয়োগ করছেন , তবে সম্ভবত এটি প্রমাণের বাইরে খুব আনুষ্ঠানিক।IX


6

শব্দটি এসেছে বৈদ্যুতিন প্রকৌশল থেকে। একটু ভাবুন 1 কে "গরম" বলবে? কেবলমাত্র যারা বিদ্যুতের সাথে কাজ করেন, যেখানে "গরম" বা "লাইভ" মানে তারে বৈদ্যুতিক সম্ভাবনা রয়েছে । "ওয়ান হট" সার্কিট ডিজাইনকে বোঝায় যেখানে একটি তারের বিচ্ছিন্ন বৈদ্যুতিক সিগন্যাল স্তরটি তারের একটি সেটে গরম / ঠান্ডা করে od আমি অনুমান করি যে EE ব্যাকগ্রাউন্ড সহ কিছু মেশিন লার্নিং লোকেরা সাদৃশ্যটি আকর্ষণীয় খুঁজে পেয়েছে।

একনোমেট্রিক্স এবং পরিসংখ্যানগুলিতে আপনি মুখোমুখি হতে পারেন dummyবা indicatorভেরিয়েবলগুলি যা বেশিরভাগ মিল কারণ এগুলি তাদের স্বতন্ত্র সূচকগুলির সাথে পৃথক বিভাগের প্রতিনিধিত্ব করতে ব্যবহৃত হয়। যদিও একটি সূক্ষ্ম পার্থক্য আছে। উদাহরণস্বরূপ, আপনি কে বিভাগে জন্য কে -১ ডামি তৈরি করেন, কারণ বেস বিভাগটি সমস্ত ডামিগুলির সাথে সামঞ্জস্য করে 0 বিপরীতে, আমি মনে করি যে একটি গরম এনকোডিংয়ে আপনার কে আছে, যেখানে বেস বিভাগের নিজস্ব তার থাকবে ( পরিবর্তনশীল)।


5

আমি পরিসংখ্যানগতভাবে প্রশিক্ষিত, এবং সম্প্রতি মেশিন লার্নিং / কমপ্লেক্স সাইটি লিটের "ওয়ান-হট এনকোডিং" শুনেছি। আমি সাধারণত ওয়ান হটেড ম্যাট্রিক্সকে ডিজাইন ম্যাট্রিক্স / ডেটা ম্যাট্রিক্স / ডিজাইন ফ্রেম হিসাবে উল্লেখ করেছি।


আপনার কাছে কি এমন একটি উল্লেখ রয়েছে যা আমি তার জন্য উদ্ধৃত করতে পারি? আমি একটি বৈজ্ঞানিক প্রকাশনা লিখছি এবং কাগজটি এমএল সম্প্রদায়ের নয় বরং আরও বিস্তৃত যেহেতু সমস্ত পাঠকদের জন্য এই পদ্ধতিটি সম্পর্কে পরিষ্কার করতে চাই।
ভঙ্গুর

বলতে পারি না আমি কখনও ক্রিয়াপদ হিসাবে "এক-হটেড" শুনেছি। তবে আমি একইভাবে গাণিতিক / পরিসংখ্যানের দিক থেকে এসেছি। ("এক-হটেড" এ গুগলের ফলাফল আকর্ষণীয় - আমি মেশিন লার্নিংয়ের অর্থ এবং লোকেরা "একটি হট-আপ গাড়ি" সম্পর্কে কথা বলার মিশ্রণ পাই get)
মাইকেল লুগো

3

শারীরিক বিজ্ঞান এবং প্রকৌশল ক্ষেত্রে একে (সাধারণীকরণের) ক্রোনেকার ব-দ্বীপ বলা হয় ।

সর্বাধিক আকারে, ক্রোনকার ডেল্টার বিগল as হিসাবে as হিসাবে সংজ্ঞায়িত যদিও এই তুচ্ছভাবে সাধারণভাবে

δi,j{1ifi=j0else,
δ[condition]{1if[condition]0else.

সুতরাং, " " পড়ার প্রবণতা যা সর্বাধিক বিভাগ যদি প্রসঙ্গ থেকে সুস্পষ্ট হয় তবে লেখকরা " " এ ছাঁটাই করবেন।δicategory

δicategory{1ificategory0else,
δi

ক্রোনেকার ডেল্টা সিগমা / পাই / আইনস্টাইন / ইত্যাদি ক্ষেত্রে সত্যই কার্যকর । স্বরলিপিগুলি শর্তসাপেক্ষে শর্তাদি নির্দিষ্ট করার অনুমতি দেয়।

শুধু সাধারণ প্রোগ্রামিং স্ট্রাকচার এই সম্পর্কযুক্ত, Kronecker ব-দ্বীপ এর condition?1:0, যেখানে ?:হয় শর্তসাপেক্ষ অপারেটর


একটি স্পর্শিনী নোট হিসেবে আমি পুরোনো ফ্যাশন পরিত্যাগ লেখক উত্সাহিত চাই সাধারণ সমতুল্য, পক্ষে । পুরানো-ফ্যাশন স্বরলিপিটির কোনও সুবিধা নেই, তবে সাধারণীকরণের স্বরলিপিটি আরও স্পষ্ট এবং বর্ধনযোগ্য।δi,jδi=j


আমি এখানে লিঙ্কটি দেখতে পাচ্ছি না। একটি গরম ভেরিয়েবলের প্রতিটি রাজ্যের জন্য একটি সেটকে একটি ভেরিয়েবল ডিকোড করে। এই অ্যাপ্লিকেশনটিতে ক্রোনেকার ডেল্টা কীভাবে ব্যবহৃত হয়?
আকসকল

@Aksakal এই পোস্টটি একটি বিভাগ "এনকোডিং একটি উদাহরণ দেয় কোম্পানীর নাম সম্ভাব্য মান সঙ্গে" " ভক্সওয়াগন ", " অ্যাকুরা ", এবং " হন্ডা ", যা তিন হয়ে ঐ মান নাম দ্বারা ভেরিয়েবল, যেখানে @ টিমের উত্তর সেইগুলিকে "ডামি ভেরিয়েবল" বলে। এই Kronecker বদ্বীপ হিসাবে একই জিনিস , , এবং। {0,1}δVWδAcuraδHonda
নাট

@ আকসাকাল আমি সাধারণীকরণের স্বরলিপিটি পছন্দ করি তবে পুরাতন স্বরলিপিটিতে , এটি , ইত্যাদি হবে etc. ।δi,jδCompanyName,VW
নাট

ডামি এটির মতো কাজ করে: আপনার কাছে এবং নামক ভেরিয়েবল রয়েছে । আপনার পর্যবেক্ষণগুলি , সুতরাং আপনি এবং মান পাবেন, হলে উভয়ই শূন্য। দ্রষ্টব্য, এখানে গাড়ী তৈরি নয়, এটি পর্যবেক্ষণের সংখ্যা। আপনি এখনও ক্রোনেকার ডেল্টায় এটি কীভাবে সংযুক্ত করেন তা আমি এখনও দেখতে পাচ্ছি না। বলুন, যদি মূল পরিবর্তনশীল ছিল , তারপর ব-দ্বীপ মত কাজ করবেVWACURAi=1..NVWiACURAiiCARiVWi=δ(CARi,VW)
Aksakal

@ আকসাকাল আপনি যে মানটি " " বলছেন তা হ'ল বা । তাহলে একটি ভক্সওয়াগন হয়, তাহলে এটা হতে চাই ; অন্যথায়, এটি । VWiδVWiδiVWi10
নাট

2

ক্রিস্টোফার বিশপ দ্বারা প্যাটার্ন রিকগনিশন এবং মেশিন লার্নিং - স্কিম শব্দটি ব্যবহার করে ।1K

বইটির একটি উদ্ধৃতি এখানে দেওয়া হয়েছে,

বাইনারি ভেরিয়েবলগুলি এমন দুটি পরিমাণের বর্ণনা করতে ব্যবহার করা যেতে পারে যা দুটি সম্ভাব্য মানগুলির মধ্যে একটি নিতে পারে। তবে প্রায়শই আমরা স্বতন্ত্র ভেরিয়েবলের মুখোমুখি হয়ে থাকি যা সম্ভাব্য পারস্পরিক একচেটিয়া রাজ্যে গ্রহণ করতে পারে । যদিও এই ধরণের ভেরিয়েবলগুলি প্রকাশ করার বিভিন্ন বিকল্প উপায় রয়েছে তবে আমরা শীঘ্রই দেখতে পাব যে একটি বিশেষ সুবিধাজনক উপস্থাপনা হ'ল অফ- স্কিম যেখানে ভেরিয়েবলকে ডাইমেনশনাল ভেক্টর- দ্বারা প্রতিনিধিত্ব করা হয়েছে যার মধ্যে একটি উপাদান সমান , এবং সমস্ত অবশিষ্ট উপাদান সমান । সুতরাং, উদাহরণস্বরূপ যদি আমাদের কাছে একটি ভেরিয়েবল থাকে যা নিতে পারেK1KKxxk10K=6রাজ্যগুলি এবং ভেরিয়েবলের একটি নির্দিষ্ট পর্যবেক্ষণ সেই রাজ্যের সাথে সম্পর্কিত হয় যেখানে , তারপরে be প্রতিনিধিত্ব করবেন,x3=1x

x=(0,0,1,0,0,0)T

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.