2018 আপডেট!
আপনি আপনার শ্রেণিবদ্ধ ভেরিয়েবলগুলির জন্য একটি এম্বেডিং (ঘন ভেক্টর) স্থান তৈরি করতে পারেন। আপনারা অনেকে ওয়ার্ড টুভেক এবং ফাস্টটেক্সটের সাথে পরিচিত, যা শব্দকে অর্থবহ ঘন ভেক্টরের জায়গায় এম্বেড করে। এখানে একই ধারণা - আপনার শ্রেণিবদ্ধ ভেরিয়েবলগুলি কোনও অর্থ সহ কোনও ভেক্টরকে মানচিত্র করবে।
থেকে গুও / Berkhahn কাগজ :
সত্তা এম্বেডিং কেবল মেমরির ব্যবহার হ্রাস করে না এবং এক-হট এনকোডিংয়ের সাথে তুলনা করে নিউরাল নেটওয়ার্কগুলির গতি বাড়িয়ে তোলে, তবে আরও গুরুত্বপূর্ণভাবে এম্বেডিং স্পেসে একে অপরের নিকটে অনুরূপ মানগুলি ম্যাপিংয়ের মাধ্যমে এটি শ্রেণিবদ্ধ ভেরিয়েবলের অভ্যন্তরীণ বৈশিষ্ট্যগুলি প্রকাশ করে। আমরা সাম্প্রতিক কাগল প্রতিযোগিতায় এটি সফলভাবে প্রয়োগ করেছি এবং আপেক্ষিক সাধারণ বৈশিষ্ট্য সহ তৃতীয় অবস্থানে পৌঁছাতে সক্ষম হয়েছি।
লেখকরা আবিষ্কার করেছেন যে এইভাবে শ্রেণিবদ্ধ ভেরিয়েবলগুলি উপস্থাপন করা এলোমেলো বন সহ পরীক্ষিত সমস্ত মেশিন লার্নিং অ্যালগরিদমগুলির কার্যকারিতা উন্নত করেছে।
সেরা উদাহরণটি হতে পারে গ্রুপ সম্পর্কিত পিনগুলিতে কৌশলটির প্রয়োগ পিন্টারেস্টের :
ফাস্টাইয়ের লোকেরা বিভাগীয় এম্বেডিংগুলি বাস্তবায়ন করেছে এবং সহযোগী ডেমো নোটবুকের সাথে একটি খুব সুন্দর ব্লগ পোস্ট তৈরি করেছে ।
অতিরিক্ত বিবরণ এবং ব্যাখ্যা
একটি নিউরাল নেট এম্বেডিংগুলি তৈরি করতে ব্যবহৃত হয় অর্থাৎ প্রতিটি শ্রেণিবদ্ধ মানকে ভেক্টর নির্ধারণ করে। একবার আপনার ভেক্টর হয়ে গেলে আপনি সেগুলি সংখ্যার মানগুলি গ্রহণ করে এমন কোনও মডেলগুলিতে ব্যবহার করতে পারেন। ভেক্টরের প্রতিটি উপাদান একটি ইনপুট ভেরিয়েবলে পরিণত হয়। উদাহরণস্বরূপ, আপনি যদি রঙের শ্রেণিবদ্ধ তালিকা এম্বেড করতে 3-ডি ভেক্টর ব্যবহার করেন তবে আপনি এমন কিছু পেতে পারেন: লাল = (0, 1.5, -2.3), নীল = (1, 1, 0) ইত্যাদি আপনি তিনটি ব্যবহার করবেন তিনটি উপাদান অনুসারে আপনার এলোমেলো বনের ইনপুট ভেরিয়েবল। লাল জিনিসগুলির জন্য, সি 1 = 0, সি 2 = 1.5 এবং সি 3 = -2.3। নীল জিনিসগুলির জন্য, সি 1 = 1, সি 2 = 1 এবং সি 3 = 0।
এম্বেডিংগুলি তৈরি করতে আপনার আসলে একটি নিউরাল নেটওয়ার্ক ব্যবহার করার দরকার নেই (যদিও আমি কৌশলটি থেকে দূরে সরে যাওয়ার পরামর্শ দিই না)। আপনি যখন সম্ভব সম্ভব হাত বা অন্য উপায়ে নিজের এম্বেডিংগুলি তৈরি করতে মুক্ত হন। কিছু উদাহরণ:
- আরজিবি ভেক্টরগুলিতে মানচিত্রের রঙ।
- ল্যাট / লম্বা ভেক্টরগুলিতে মানচিত্রের অবস্থান।
- একটি মার্কিন রাজনৈতিক মডেল, বাম / ডান প্রান্তিককরণ, করের বোঝা, ইত্যাদি উপস্থাপন করে কিছু ভেক্টর উপাদানগুলিতে শহরগুলি মানচিত্র করুন