হ্যাশিং ট্রিক - আসলে কী ঘটে


12

যখন এমএল অ্যালগরিদম, উদাহরণস্বরূপ ভোপাল ওয়াবিট বা কিছু কম্প্যাক্টরাইজেশন মেশিনগুলি রেট প্রতিযোগিতা ( ক্যাগল ) এর মাধ্যমে ক্লিক করে , বৈশিষ্ট্যগুলি 'হ্যাশড' উল্লেখ করে, তখন মডেলটির প্রকৃত অর্থ কী? আসুন বলি যে এখানে একটি ভেরিয়েবল রয়েছে যা একটি ইন্টারনেট অ্যাডের আইডি উপস্থাপন করে যা '236BG231' এর মতো মান গ্রহণ করে। তারপরে আমি বুঝতে পারি যে এই বৈশিষ্ট্যটি এলোমেলো পূর্ণসংখ্যায় চলে গেছে। তবে, আমার প্রশ্নটি হ'ল:

  • মডেলটিতে এখন পূর্ণসংখ্যা (পূর্ণ সংখ্যার) বা হিসাবে ব্যবহৃত হয়
  • হ্যাশ মানটি কি এখনও শ্রেণীবদ্ধ ভেরিয়েবল এবং এক-হট-এনকোডের মতো আচরণ করা হয়? এইভাবে হ্যাশিং ট্রিকটি কেবল কোনওভাবে বড় ডেটা দিয়ে স্থান বাঁচাতে হবে?

উত্তর:


7

দ্বিতীয় বুলেটটি বৈশিষ্ট্য হ্যাশিংয়ের মান। হ্যাশিং এবং ডেটা স্পার করতে একটি হট এনকোডিং স্থান বাঁচায়। হ্যাশ আলগো নির্ভর করে আপনার বিভিন্ন ধরণের সংঘর্ষ হতে পারে যা এক ধরণের মাত্রিকতা হ্রাস হিসাবে কাজ করে।

এছাড়াও, কেগল বৈশিষ্ট্যটির হ্যাশিংয়ের নির্দিষ্ট ক্ষেত্রে এবং সম্ভাব্য টিউপসগুলি (সাধারণত মাত্র দ্বিতীয় ক্রম তবে কখনও কখনও তৃতীয়) সমস্ত সম্ভাব্য টিউপস গ্রহণ করে বৈশিষ্ট্য সম্প্রসারণ / ইঞ্জিনিয়ারিংয়ের সাথে এক হট এনকোডিং সহায়তা হয় যা সংঘর্ষের সাথে হ্যাশ করা হয় যা স্পষ্টভাবে মিথস্ক্রিয়া তৈরি করে যা প্রায়শই ভবিষ্যদ্বাণীপূর্ণ যদিও পৃথক বৈশিষ্ট্য নেই।

বেশিরভাগ ক্ষেত্রে এই কৌশলটি এলআর-তে বৈশিষ্ট্য নির্বাচন এবং ইলাস্টিক নেট নিয়মিতকরণের সাথে একত্রিত একটি লুকানো স্তর এনএন এর সাথে খুব একই রকম কাজ করে তাই এটি প্রতিযোগিতায় বেশ ভাল অভিনয় করে।


সুতরাং এক-হট-এনকোডিংটি এখনও হ্যাশ মানগুলিতে ব্যবহৃত হয় * যা আপনি বলছেন যে স্থান সংরক্ষণ করে এবং মাত্রা হ্রাস করতে পারে (সংঘর্ষের কারণে)। এটা কি ঠিক?
বি_মিনার

1
একটি হোস্ট এনকোডিং হ্যাশিং বৈশিষ্ট্যগুলির প্রয়োজনীয় অংশ নয় তবে প্রায়শই পাশাপাশি ব্যবহার করা হয় কারণ এটি ভবিষ্যদ্বাণীক শক্তির সাথে বেশ ভালভাবে সহায়তা করে। একটি হট এনকোডিংয়ের কথা ভাবার একটি উপায় হ'ল এন বিযুক্ত মানগুলির একটি সেট থেকে একটি বৈশিষ্ট্যকে সেট এন বাইনারি প্রশ্নগুলিতে রূপান্তরিত করা। বৈশিষ্ট্যটি জে 2 বা 3 কেবলমাত্র এটি 4 নয় বলে জানা আমার পক্ষে গুরুত্বপূর্ণ নয় One এক হট সেই পার্থক্যটিকে নির্দিষ্ট করে তোলে। এটি লিনিয়ার মডেলগুলিতে অনেক সহায়তা করে যেখানে এনসেম্বল অ্যাপ্রোচগুলি (আরএফের মতো) বৈশিষ্ট্যটির ব্রেক পয়েন্টগুলি এই পার্থক্যটি সন্ধান করতে পারে।
cwharland
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.